跨时空“对话”蒙娜丽莎、跨地域“解锁”你的ID身份声纹识别提高应用安全性

　　大多数人都会遇到过忘记密码的尴尬,传统密码存在易丢失、易遗忘且不与用户唯一绑定等缺点。但是,随着科技的发展,生物识别技术替代传统密码识别在今天已经成为身份验证的重要手段。目前较为主流的生物识别技术有人脸识别、指纹识别、虹膜识别、静脉识别、声纹识别五类。我国人工智能界学术泰斗、中国科学院院士张钹教授谈到:现在的图像识别存在局限性,只需要加一点点的干扰,机器就会将一个“炮兵阵地”错误识别为“一群羊”,甚至是任何其他东西,很“脆弱”“很不安全”,从目前来看,各种生物特征里相对比较安全的就是声纹。

　　“声纹+”实现与蒙娜丽莎的完美对话

　　“发展大数据产业,必须从源头开始高度重视个人信息保护。是否有利于个人信息保护,应成为评估新兴技术是否适合大数据构建和应用的关键考量。”国家信息中心首席工程师李新友接受采访时认为,未来,声纹技术将在电子政务方面发挥更大优势。

　　所谓声纹(Voiceprint),就是人的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官——舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以每个人的“声纹”都是唯一的。

　　事实上,声纹技术在远程身份认证中的重要性正变得越来越突出,逐渐应用在社保、金融、公安等领域。日前,我国“声纹+”身份认证云项目落户内蒙古,将为更多百姓带来网络身份认证的安全与便利。“希望通过运用自主可控的声纹认证技术,为当地打造可信安全的个人身份大数据提供重要保障。”相关人士指出,未来2—3年,将是“声纹”发展的关键期,声纹认证将逐渐从内蒙古辐射到宁夏、甘肃、青海、山西等地。

　　也有科学家根据人的面部、身高等数据合成、模拟人的声音的。最近,日本音响研究所的铃木松美提出一个令人惊叹的观点——“蒙娜丽莎”不仅容貌与达芬奇的自画像相似,而且用声纹技术从数量上证实“蒙娜丽莎”的声音与达芬奇一模一样。“人的声音是由振动声带并通过喉咙在口腔或鼻腔共振而发生的,因此,声带的形状或大小以及从喉咙到口腔的容积,成为决定个人声音的主要因素。”科学家们认为,若有容颜的形状或身高的数据,借助语言合成器,就有可能惟妙惟肖地模仿出历史人物的声音。

　　在日本科学家开发出的声音发生器PC-6001MKII系统中,至少要输入十二项数据,包括颧骨的宽度,从眼睛下到鼻尖每隔1厘米的大小以及从其下到下巴每隔1厘米的大小,嘴宽,从两眼间中心到嘴的位置,鼻尖和枕骨部每隔1厘米的大小,身高、年龄、性别等。如果数据不足,也可设定最相近的值补充。不过,这种“标椎的”合成音,剔除了人的个性习惯、方言影响等社会因素,要达到“乱真”的程度恐怕很难。

　　商业价值和社会价值日趋显现

　　“不同人在发同一语音时,会产生有相当差别的声纹,这种差别就体现了个人特征,所以声谱仪可以帮助我们分辨出许多人的语言。有时即使言语很模糊,甚至词不达意,也都可以辨明。”记者从公安部门获悉,声纹已经成为侦破刑事案件的重要手段之一。

　　据大脑机械论专家统计,一分钟内一个人所说词句的完整声纹图含有近200万比特。而普通人大脑里处理信息的速度不超过每秒45比特。换句话说,我们大约只利用了词句声纹图的千分之一,就能懂得其中含义,其余大量多余的声纹不仅能使我们了解交谈者,还能从成千上万的其他人中辨认出他。

　　虽然目前声纹识别还没在智能手机这样的消费级产品中普及,但其实在银行交易和国防安全等领域已经广泛应用。据外媒This is Money报道,巴克莱银行、汇丰银行、哈利法克斯银行等多家英国银行目前都支持声纹识别,在英国有300多万银行客户使用声纹识别系统来登录他们的银行账户。今年4月,汇丰银行宣布自2016年推出声纹识别以来,已经有160万客户使用了1500万次,这套系统还阻止了价值3.3亿英镑的银行诈骗,未来还可能通过声纹帮助警方抓捕那些难以追踪的诈骗者。

　　此外,“声纹”还成为社保领域实现远程身份验证的关键技术。声扬科技CEO李亚桐介绍,去年5月公司为印尼国家公务员保险储蓄基金公司提供了一套解决方案,即通过声纹识别和智能语音技术实现远程身份验证,解决了印尼250万离退休人员的养老金领取难题。这也是在国际范围内,第一次有国家级的社保机构大规模应用声纹识别技术。“这一案例具有典范性,我们可以预测,在不久的将来,声纹识别将会在更多国家的社保领域成功实施。” 业界认为,根据不同的场景进行有针对性的“声纹识别”的开发,将产生巨大的商业价值和社会价值。

　　挑战众多声纹识别的完善之路还长

　　声纹识别作为身份认证领域的新兵,虽然逐渐被人们了解并接受,但从技术发展来看,还存在不少挑战。

　　“声纹识别需要提高抵抗其他因素干扰的能力。” 清华大学语音和语言技术中心主任郑方和清华大学语音和语言技术中心博士程星亮谈到,一方面,发声会随着用户身体状况、年龄的改变而变化,而不同情感、语气、语速情况下的声音也会有变化;另一方面噪声干扰、远程收录也对声纹的“精准识别”带来挑战。此外,声纹识别还需要具备识别、阻止机器伪造声音,还有“超短语音”的识别,也成为当前的技术挑战。

　　为规范和正确引导声纹识别发展,国内已公布多项关于声纹识别的标准。2008年,原信息产业部正式颁布实施了《自动声纹识别(说话人识别)技术规范》,这是我国第一个关于声纹识别的行业标准。2010年12月2日,公安部颁布实施了《安防声纹确认应用算法技术要求和测试方法》。2018年10月9日,中国人民银行正式对外发布《移动金融基于声纹识别的安全应用技术规范》金融行业标准,这是第一个被金融监管部门认可的生物识别标准,为声纹识别技术进入移动金融领域解决了标准难题。央行标准的颁布,为声纹识别技术进入移动金融领域解决了标准难题,金融科技一跃成为声纹识别时下最热门的应用领域之一,2018年也因此成为中国声纹技术的应用“元年”。

　　众多的挑战,预示着声纹识别的完善之路还很长。而相关标准的发布,标志着声纹识别正受到国内各界的认可,并吸引了越来越多的从业者进入此领域。然而技术发展自有其规律,热度之下仍需冷静,有序推进方为正道。相信在标准的正确引导和业界的共同努力下,拥有广阔应用场景的声纹识别未来定能在各个领域开花结果,走进更多普通人的生活。

　　记者王梦然

相关新闻