arrarpetahack 发表于 2022-12-11 15:04:46

前沿观察|声纹识别解析

声纹识别是是生物识别技术的一种,指根据待识别语音的声纹特征识别该段语音所对应的说话人的过程。不同于指纹识别和面部识别需要其他硬件的支持,声纹识别只需要用一个麦克风采集声音就可以跨平台执行声纹识别。

https://p3-sign.toutiaoimg.com/pgc-image/5ecd2d98b8504c40986f252f5b6c2dfc~tplv-tt-large.image?x-expires=1986103393&x-signature=dBZnzcqmJ4xdUW%2BA8DStP9eX%2B7c%3D

声纹识别有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是"多选一"问题;而后者用以确认某段语音是否是指定的某个人所说的,是"一对一判别"问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的"训练"或"学习"过程。

与其他生物识别技术相比,声纹识别还有着其他的优势:

1、蕴含声纹特征的语音获取方便、自然;

2、获取语音的成本低廉,使用简单,像麦克风、通讯设备等皆可;

3、适合远程身份确认;

4、声纹辨认和确认的算法复杂度低;

5、配合一些其他措施,如通过语音识别进行内容鉴别等,可以提高准确率;

此外声纹识别的应用范围也非常广泛。

1、特殊环境的登录验证

当在一些特殊情景下,声纹识别登录就成为了为数不多的生物特征选择。

如黑夜中,如果需要进行生物识别,人脸识别会因光线过弱而无效,而虹膜设备因为需要特殊补光而需要特殊设备,指纹识别进行复制及伪造的门槛过低。

2、能识别主人的语音助理

可能很多人都会有一个疑问,那就是如果大家的终端设备都用的是一个语音助理,当在一个屋子的时候,其中有一个人喊了一句Hi 助理,那是不是整个屋子的助理都会有所反应呢?

这个时候声纹识别就发挥了最大的作用,避免了A想用他的助理但是B的语音助理却有所反应的情况,只需要根据提示建立好声纹模型,语音助理就会牢记。

3、越来越安全的移动支付

你使用互联网银行的时候,是否有过那么一丝担忧,手机短信真的安全吗?人脸真的安全吗?密码真的安全吗?

这时声纹识别的优势就体现出来了,如果使用声纹识别,可以把上述验证方式全部结合起来。声纹识别因为其自身的特殊性,是唯一符合密码认证机制的生物特征识别技术,换成通俗易懂的话语来说,就是让你的声音与你的密码无缝结合。再配合上人脸识别,安全性变会大大提高。

不过,纵然有着这么多的优势,但在实际操作中,声纹识别却面临着重大的挑战。

1、如何建立声纹库和特征:从理论上讲,声纹的获取是极其容易的,但这仅仅是针对国家相关机构,如目前声纹库最全的公安。对企业而言,所有的声纹数据都需要他们自行采集,这是一件相当具有难度的任务。另外,在数据不全面的情形之下,声纹特征的提取和建立也就受到了阻碍,从而就难以训练声纹识别的机器学习算法,以提高识别的准确率。

2、如何降低内外环境对于声纹的影响:目前,人们对声纹识别的要求已经不仅仅满足于静态检测,更多的是动态检测。在外部环境中,首先,声音是通过录音设备进行采集的,不同的型号的录音设备对语音都会造成一定程度上的畸变,同时由于背景环境和传输信道等的差异,对语音信息也会造成不同程度的损伤。这些情况的出现为声纹识别增添了不少的问题。比如外部环境的影响,哪怕是如今发展较为完善、已经实现落地的语音识别技术,降噪以及去混响方面也依然是其运行中的一大难题。

此外,在内部环境中对于同一个用户而言,即便采集到的两段语音内容都是相同的,但由于情绪、语速、疲劳程度等原因,语音都会有一些差异性,这些都是声纹识别不得不去解决的困境。
页: [1]
查看完整版本: 前沿观察|声纹识别解析