您好!欢迎来到一线生活-深圳论坛
关注我们
扫码关注官方微信
手机版
手机扫描直接访问

安防创新百人会丨闻声即可识人,虚拟诈骗的克星——声纹识别

0
回复
188
查看
[复制链接]

8780

主题

1万

帖子

2万

积分

论坛元老

Rank: 8Rank: 8

积分
29658
发表于 2022-12-11 13:05:15 | 显示全部楼层 |阅读模式


众所周知,人类经历了三次工业革命,以蒸汽机的出现为代表的第一次工业革命,以电力和内燃机出现为代表第二次工业革命,和以计算机、新型通讯方式为代表的第三次科技革命。在我们现在身处的第三次科技革命中,互联网的出现让人类的生活出现了翻天覆地的变化,而在此基础上扩展出的物联网将是下一个推动社会发展的重要力量,是继通信网之后的另一个万亿级市场。

物联网时代下,人机交互会越来越频繁,但人机交互中机器屏幕能展现出的信息越来越少,原本单一的登录方式需要变得更加多元,因此生物识别成为物联网时代必不可少的技术之一,而语言作为人类沟通最自然的工具,无疑将成为万物互联的时代的又一爆点。

势必可赢科技(SpeakIn)创立于2015年,是一家提供声纹识别与身份安全解决方案的人工智能公司,目前已为国内多个地区的公共安全、金融、社保等机构和企业定制了多种基于声纹识别的身份安全解决方案。

声纹,未来又一通往世界的ID


声纹是什么?SpeakIn的COO易鹏宇告诉亿欧,目前大家可能对语音识别更熟悉,语音识别解决的是“说什么”,而声纹识别解决的是“谁在说”,就像指纹一样,声纹也具有独特性和稳定性,一个成年人无论如何模仿他人的声音和语气,声纹始终不同。虽然现阶段声纹识别普及程度没有指纹识别高,但得随着机器学习和深度神经网络的发展,声纹已经逐渐成为进行身份识别和保障身份安全的“黑科技”。

声纹识别的研究始于20世纪30年代。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。随着研究手段和计算机技术的发展,研究工作逐渐脱离了单纯的人耳听辨,使通过机器自动识别人的声音成为可能。



(声纹识别技术发展史)

与其他几种生物识别相比,声纹识别具有一些“先天优势”。“语言是人类交流最天然的工具,因此声纹的采集非常便捷。”易鹏宇表示,平时自然交谈的内容即可作为数据录入。另外,声纹的收集只需要麦克风,“比如用手机就可以收集声音了” ,因此与其他生物识别相比,声纹识别的设备成本更低,也更方便推广和使用。



(声纹识别于其他生物识别的比较)

另外,声纹具有内容变化的特点,声纹口令可动态变化,即使在其他地方留下声音信息,也难以被复制和盗用。声纹技术识别的是语音中的最小单位——音素,比如一个“八”字就包含了两个音素,“抓住了最基础的元素,即使讲话者下次没有重复录入的口令,我们也能识别出来。” 易鹏宇说道。

在技术层面,声纹识别的准确率是声纹识别最重要的指标之一,SpeakIn在过去的两年中深耕大规模工业级的声纹识别系统,使用目前学术界最前沿、基于深度学习的iVector技术,实现了短自有文本和短数字的高识别率和高抗干扰性,同时极大的提高了声纹提取和验证的速度,在多场景下声纹识别准确率远高于行业平均水平。

“但技术不是唯一的,要想在众多的声纹识别企业中突围,更多地要从应用场景着手。”易鹏宇说。

“搏音”,用声音寻找嫌疑人


声纹能在哪些场景发挥作用?正如指纹识别、虹膜识别等其他生物识别一样,安防也是声纹识别落地的重要领域之一,易鹏宇告诉亿欧。随着技术和互联网的发展,犯罪越来越多地从物理世界转移到虚拟空间,声音作为最天然的交流工具,可以成为案件侦破的突破口,大幅提升办案效率。

随着互联网的发展、通讯工具的普及,越来越多的犯罪从物理空间转移到了虚拟空间,而声音则可以成为侦查虚拟空间案件的突破口。以电信诈骗为例,传统的电信诈骗案件侦破使用人耳加声音频谱图,听辨和分析声音证据需要一周甚至更久的时间,而且培养一个声纹专家需要5到10年的时间,成本十分高。“人反复记忆学习的效率远不如机器高。”易鹏宇说,SpeakIn的声纹识别技术能够辅助执法人员在数小时内听完一个案件,极大地提高了侦破效率。

从N个人中找到目标说话人,即1:N的比对,能够帮助公安快速缩小目标嫌疑人范围,甚至直接锁定嫌疑人,可以广泛地运用在刑侦破案、犯罪跟踪等场景。而确认一段声音是否属于目标说话人,即1:1的比对,也是声纹识别的重要方式,可以帮助公安或法院判断声音是否属于目标嫌疑人,提高办案准确性与效率;另外在社保、金融等场景也可以引入1:1的比对,实现远程的身份验证。



(声纹识别在安防的应用)

找准安防这个落脚点,SpeakIn深耕国家安全领域,为公安提供专属定制的“搏音”声纹综合作战平台及动态布控系统,服务体系包括重点人员的声纹数据库建设、声纹自动识别系统、声纹鉴定等。通过声纹识别和声纹大数据技术进行重点人员监管、反电信诈骗、反恐、刑事案件侦破、身份查询与核验,助力公安有效遏制与打击犯罪,构建和强化安全的社会公众环境。

未来,声纹的应用无处不在


作为一家人工智能企业,SpeakIn十分重视技术的研究,“公司研究人员占三分之二”,团队成员来自香港科技大学、中国科技大学等高等学府,易鹏宇表示,目前的声纹的识别建立在普通话的基础上,未来SpeakIn还会做细分领域的研究,“比如数字、英文、方言等”,为声纹识别开拓更广阔的空间,提高识别准确率。

与其他生物识别一样,声纹识别也存在着弊端,信道是影响声纹识别准确性的一大因素。针对这个问题,SpeakIn已尝试用算法模拟多个信道,实现一次声音采集可以同时覆盖多个信道,提升识别准确性。此外,SpeakIn还研发了智能化声纹采集器和智能化声纹采集平台,可以按照公安机关声纹库建库要求进行智能化、规范化声纹采集,极大地提高声纹采集的质量和效率,解决不同设备和媒介间信道失配的问题。

“所有算法和数据都是分不开的,在这个领域,只有拥有足够的数据,算法才能发挥到最优。” 在建立数据库方面,SpeakIn已经走在路上,目前已逐步建立中青年基于多声道、复杂噪声环境、身体状态及情绪的声纹数据库,儿童、老人的声纹数据库也将逐步建立完成,建成后将成为国内基于人在自然状态下分类特征最全面的声纹数据库。

在研究声纹识别底层技术、基础算法和行业解决方案的同时,SpeakIn也在不断探索更多的垂直场景应用,让声纹融入生活的方方面面。

走到快递柜前再也不需要输入密码,只需要说“取快递”,对应的箱门就会自动打开;在停车场,只需要用声音就可以完成缴费;观看电视时,电视能够根据声音识别出当前用户,从而提供个性化内容……也许用声音通行的日子,就在不远的未来。



近年来,人工智能正快速渗透到安防行业的各个环节,安防也是目前AI公司争战的主战场。紧跟“新科技、新理念、新政策”,亿欧高度重视人工智能在安防行业的应用落地,并推出《安防创新百人会》栏目。

我们将采访100家安防产业链上下游企业,同时,亿欧将于2018年5月25日在北京举办“亿欧GIIS·安防AI创新千人峰会”,本栏目所采访企业也将是大会重要参与方。

如果您有合适的企业推荐,或者想加入“亿欧安防AI创新学习群”(余凯、孙剑、徐立、浦世亮、陈宁等行业大咖都在群里),均可联系亿欧许伟军(微信:15626361732)。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

联系我们

免费联系电话

400-8855-271

客服QQ:2524604571

服务时间:周一到周日8:00-23:30

关注我们
  • 关注官方微信

  • 手机APP