导读:声纹识别作为一种新兴的生物识别技术近年来开始逐渐走向成熟,不仅在中国建设银行等金融机构的多个场景得到应用,也被纳入中国人民银行数字人民币试点的可信身份技术体系。本文从数字人民币的账户安全要求和声纹识别技术的基本特征入手,就声纹技术对数字人民币的安全改进以及声纹支付的应用场景进行了探讨。

舒皓(中国建设银行北京科创支行

向银杉、成舸(北京得意音通技术有限责任公司

郑方(清华大学人工智能研究院听觉智能研究中心

数字人民币是人民银行发行的数字形式的法定货币,由指定运营机构参与运营,以广义账户体系为基础,支持银行账户松耦合功能,与实物人民币等价,具有价值特征和法偿性.数字人民币一方面是数字形式的法定货币;另一方面,数字人民币与纸钞和硬币完全等价,主要定位于现金类支付凭证M0;数字人民币采取中心化管理、双层运营模式;此外,数字人民币是一种零售型央行数字货币,主要用于满足国内零售支付需求;并且,在未来的数字化零售支付体系中,数字人民币和指定运营机构的电子账户资金具有通用性,共同构成现金类支付工具.数字人民币的应用试点呈现出运营体系渐趋完善、试点范围再次扩大、应用场景纵深化发展等特征.

1 数字人民币的特征优势

数字人民币作为中国法定数字货币,以其多样的支付形式体现汇集了实物现金与电子支付工具的优势特点,实现了以国家信用为担保,以储存、交易安全,可控匿名,无壁垒流通等为目标,其主要特征如表1所示.

数字人民币作为未来重要的金融基础设施之一,对发展数字经济和零售支付、降低市场交易成本、提高支付安全性、促进金融稳定等方面起到了重要的作用.

主要特征主要内容低成本中国人民银行不收取运营机构兑换流通费用,运营机构不收取用户兑出兑回服务费兼具账户和价值特征兼容账户、准账户、价值3种方式,可变面额设计,以加密币串形式进行价值转移不计付利息现金属性M0,不计利息支付即结算与银行账户松耦合,使用钱包进行资金转移.实时结算可控匿名“小额匿名、大额依法可追溯”安全性综合数字证书体系、数字签名、安全加密存储等技术.不可重复花费、不可伪造复制可编程性智能合约可编程.支付规则、条件可商定

1.1 有利于进一步降低货币运行成本,提高支付效率

数字人民币的推广使用将加快运营机构及其他商业银行数字化转型步伐,降低业务日常营运成本:一是降低纸币现金管理成本,银行在日常运营过程中会产生大量现钞的运输、存取管理、钞票真伪检验,残损钞票回收以及ATM机具和CDM机的布局、维护等费用支出,占用了大量社会资源;二是提高反洗钱精准度,降低反洗钱的繁琐度;三是从环保的角度,纸币和硬币的回收再利用不可避免地消耗了大量能源与资源,产生一定的环境资源成本.

数字人民币作为法定货币具有法偿性,且具有实时交易、“支付即结算”的特点,可提供更低成本、更快捷、更安全的支付手段.

1.2 有利于提高支付安全性

现有互联网场景下的支付普遍基于银行结算账户的电子支付,虽然发展迅猛,但其覆盖面仍有限,且在客户资金安全、客户信息保护、资金风险防控等方面普遍存在一定问题,部分产品还存在套利问题.与非银行支付机构基于商业信用、企业信用的支付手段不同,央行数字人民币以国家信用为支撑,与纸币和硬币等价,具有无限法偿性.且其不可伪造、可控匿名等特性,可最大限度地保护使用者的隐私和信息安全.

1.3有利于维持货币市场及金融市场稳健发展

数字人民币作为人民银行的负债,可有效维持现有二元账户结构,不会引发商业银行挤兑;在外汇储备管理方面,数字人民币运营商支付的外汇储备由央行管理,同样作为央行的负债,因此既保证了法定数字货币的法律效力,又在一定程度上防范了资金过多和发生挤兑的风险.

此外,数字人民币具有可追踪性,“币”与智能合约的融合应用可实现定向资金使用,提高货币调控的预见性、精准性和有效性.同时通过整合风险数据,可构建智能高效的系统性风险监测、预警和管理模型,在反贪腐、反洗钱、减少欺诈事件等方面也有着巨大的价值.

2 数字人民币的账户安全需求

我国的数字人民币(eCNY)是由中国人民银行发行的数字形式的法定货币,是人民币体系的重要组成部分.它以广义账户体系为基础,采用“账户松耦合设计”,以满足“流通现金”(M0)的使用功能和“可控匿名”的管理要求,其本质是实现“现金的数字化”.

名称概念M0流通中的现金,指银行体系以外各个单位的库存现金和居民的手持现金之和M1M0和可交易用存款M2M1和非交易用存款,包括居民储蓄款+定期存款+其他存款M3M2和其他短期流动资产,包括金融债券+商业票据+大额可转让定期存单等

当前,我国的货币体系已基本实现M1和M2的电子化和数字化,但过去的主流电子支付工具仍无法完全替代M0.无论是刷卡还是扫码支付,用户侧都需要依赖某种终端介质(银行卡或智能手机)以及用户密码.一旦忘带或丢失终端、遗忘或丢失密码,就会导致不便或不安全.

事实上,在过去的金融支付体系中发生的多数“盗刷”现象,很大程度上都是因为“终端持有人”与“账户所有人”并非是同一人导致的.

现金钱包—银行账户—终端持有人≠账户所有人.

不仅如此,基于手机APP的扫码支付方式对老年人不够友好,也早已成为阻碍普惠金融、导致“数字鸿沟”的重要原因之一.可见,要解决好M0的数字化支付问题,非常有必要引入新的技术手段.

3 声纹等生物识别技术的特性分析

生物特征识别技术是基于生物特征的唯一性,实现“人证合一”,从而“自己证明自己”.近年来作为新兴的身份验证手段已得到越来越多的应用.

不过在金融行业,从中国人民银行业已颁布的技术标准体系来看,目前还只有声纹识别这一种生物识别技术有可遵循的现行应用标准.究其原因,主要是指纹、人脸等常见生物特征存在3大问题难以得到有效解决:1)安全风险.这类生物特征较容易被窃取、纂改和伪造,导致相当大的安全隐患.2)用户意愿.这类生物特征无法体现个人意愿,容易导致在用户无感知的情况下“被知情”“被同意”“被支付”的情况出现.3)隐私问题.这类生物特征的不可撤销性强,收集的用户敏感信息(指纹或面部特征)较多,使得个人隐私泄露越来越成为一个社会问题.

学术界通常将生物特征分为2大类:静态生理特征和动态行为特征.而在所有生物特征中,声纹非常特殊,它是一种兼具行为特征特性的生理特征,具有表象变化和本质不变的高度统一.当人说话时的语音数据被采集后,任意取一个时间切片都无法反推得到其身份信息,只有将整个语音段连起来形成连续时间片段,与身份相关的声纹特征才存在并得以显现.正是这种特殊性,使得声纹特征较之其他生物特征更不容易被窃取.

此外,声纹识别还与说话的内容有关.基于这种特性可以设计多种方案,以更好地保障安全和规避隐私.如果说的只是一串随机分配的动态密码(中国人民银行声纹应用标准采取的方案,中国人民银行称之为动态声纹密码),则可使被假冒盗用和隐私泄露的风险降到最低.

4 声纹识别在数字人民币中的应用

在解除终端依赖、提高安全性、降低隐私泄露后,再来看数字人民币对账户安全的特殊要求,分析声纹识别与这些要求的匹配度,进而探讨其应用场景:

1) “账户松耦合”与账户管理场景.

针对公众使用移动支付所付出的隐私成本过高的问题,数字人民币遵循“小额匿名、大额依法可溯”的“可控匿名“原则,换句话说就是“可松可紧”.一方面,大额支付时要求高强度用户身份认证,以保障足够的安全性,规避诈骗、洗钱等金融风险.另一方面,在小额支付时,要求可支持脱离银行账户实现端对端的价值转移,从而实现支付即结算,也就是像现金一样“匿名支付”;此外,还要求可方便偏远地区民众在不持有传统银行账户的情况下开立数字人民币钱包,以利于提高金融服务的覆盖率.

现金钱包A—数字人民币结算系统—现金钱包B.

实际上,由于声纹具有前述动态特性,难以从语音片段反推出声纹特征,因此只需要在声纹采集时不与用户的身份证号等敏感信息直接关联,便可以较好地契合上述“匿名支付”要求.而在大额情况下,声纹特征的唯一性和动态声纹密码的安全性,又能使账户认证强度得到足够的保障.

数字人民币在个人、商户、运营机构、商业银行、发币行之间进行流通时,涉及到非常多的账户管理要求,均可以通过声纹识别来完成,如图1所示:

2) “双离线支付”与交易确权场景.

在有网的情况下,数字人民币“声纹支付”的流程与现有中国建设银行手机银行上“声纹转账”的流程基本无异.当锁定双方账户和输入金额后,用声纹识别(确切说是动态声纹密码)模块取代输入密码/验证码或刷脸等传统技术手段,即可快速完成身份核验后完成支付.

然而,数字人民币的普惠性要求其必须同时满足有网/无网2种情况,以保证在无网条件下或网络不佳的地区,都能顺利完成支付等交易环节.也就是说收、付双方都处于“离线”的情况下也可以完成记账,直到能做安全验证时再完成扣款,即所谓“实时扣款,延时收款”.

目前,数字人民币应用的双离线支付功能主要采用NFC技术来实现.而“声纹识别+声波传输”技术为数字人民币的双离线支付提供了另一种可行方案.它主要由本地声纹识别、声波近场传输、声纹“时空戳”追溯3大模块构成,可确保交易双方在使用硬件钱包的前提下达成“近场支付”.

当用户处在地下室、停车场、边远山区甚至是地理灾害等特殊环境下时,由于网络信号不好或根本就处于无网环境,无法远程连接到银行后台,只能进行脱机交易.此时,只需将声纹识别模块嵌入手机SIM卡芯片,再利用手机之间的声波通信模块完成端到端信号传输.这样在实际场景中,付款人只需对自己的手机说句话就可以完成认证,然后收、付方通过类似手机“碰一碰”的方式完成支付.

具体来说可分为如下3种场景:1)大额支付时的高安全身份核验.当支付额度超过一定限度时(如大宗网购、期货交易等),利用声纹识别可提高实时身份核验的准确性和安全性.2)小额支付时的免密功能开通.当发生高频次小金额支付(如公共出行、水电续费、向小商户付款等)时,可通过声纹识别完成身份核验后开通免密支付功能.3)当在用户之间发生个人转账时,发起方和接收方均可以调用声纹识别功能,实现交易确权,以保障转出主体和接收主体的真实可靠,如图2所示:

3) “信息无障碍”与适老化场景.

目前主流人机交互手段以键盘和触摸屏为代表,即使用户通过了层层认证,由于菜单操作过于复杂,对信息输入的要求过高,老年人仍需花费相当的精力才能顺利完成支付.而数字人民币作为全民通用的数字法币,要求更好地满足“信息无障碍”的需要,特别是针对老年人群的“适老化”需求.

语音作为人和人交流最自然的交互方式,在解决上述问题时具有得天独厚的优势.由于人的身份信息、说话内容信息、说话时的情绪信息等,都蕴含在同一段语音片段中,这就使得将声纹识别、语音识别、情感识别等技术有机融合后,用户只需说“一句话”,就能近乎无感式地实现身份认证、业务指令识别和意图理解等一系列操作,方便快捷又安全,既可满足有障碍人士的需要,更能大大缓解老年人在数字化时代不会用、不敢用电子产品的困境.

针对上述信息无障碍需求,可采用基于声纹识别技术的“一句话(OS4E)”语音模式,这是一种“所说即所得”的交互形式,可用于手机充值、水电费缴纳等日常生活缴费,以及与家人、朋友、商户之间的相互转账(如图3所示)等高频场景.

采用“一句话”语音模式的应用,当用户发起转账、支付、缴费等交易请求时,原有交互流程从验证发起人身份、识别目标账户、输入金额等至少3步缩减为只需1步,交互时长可由至少需数十秒减少为只需几秒钟.不仅可大大提高交互效率、降低使用门槛,而且在保证同等安全级别的前提下,有力提升了用户体验,可谓“无需腾出手,只要动动嘴”.

5 小结

通过本文研究分析可以发现,由于声纹特征自身固有的特性以及人类说话方式的丰富性,使得声纹识别技术与数字人民币的账户安全需求高度契合,可在增强用户体验感的同时保障账户安全,因此是数字人民币应用极具潜力的身份认证手段,应用场景十分广阔.另一方面,未来随着数字人民币试点应用的不断深入展开,对技术通用性的要求将进一步提高,比如在噪音、多人对话等复杂条件下如何确保声纹识别的鲁棒性,将是下一步在技术上要努力探索解决的课题.

作者简介

舒皓,硕士,高级经济师.主要研究方向为金融科技.

向银杉,工程师.主要研究方向为语音和语言技术.

成舸,硕士,工程师.主要研究方向为语音和语言技术.

郑方,教授,博士生导师.主要研究方向为说话人识别、语音识别、自然语言处理.

(本文刊载在《信息安全研究》2022年第8卷第12期,为便于阅读做了适当精简)

声明:本文来自信息安全研究,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。