前沿观察｜声纹识别解析

arrarpetahack 发表于 2022-12-11 15:04:46

声纹识别是是生物识别技术的一种，指根据待识别语音的声纹特征识别该段语音所对应的说话人的过程。不同于指纹识别和面部识别需要其他硬件的支持，声纹识别只需要用一个麦克风采集声音就可以跨平台执行声纹识别。

https://p3-sign.toutiaoimg.com/pgc-image/5ecd2d98b8504c40986f252f5b6c2dfc~tplv-tt-large.image?x-expires=1986103393&x-signature=dBZnzcqmJ4xdUW%2BA8DStP9eX%2B7c%3D

声纹识别有两类，即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的，是"多选一"问题;而后者用以确认某段语音是否是指定的某个人所说的，是"一对一判别"问题。不同的任务和应用会使用不同的声纹识别技术，如缩小刑侦范围时可能需要辨认技术，而银行交易时则需要确认技术。不管是辨认还是确认，都需要先对说话人的声纹进行建模，这就是所谓的"训练"或"学习"过程。

与其他生物识别技术相比，声纹识别还有着其他的优势：

1、蕴含声纹特征的语音获取方便、自然；

2、获取语音的成本低廉，使用简单，像麦克风、通讯设备等皆可；

3、适合远程身份确认；

4、声纹辨认和确认的算法复杂度低；

5、配合一些其他措施，如通过语音识别进行内容鉴别等，可以提高准确率；

此外声纹识别的应用范围也非常广泛。

1、特殊环境的登录验证

当在一些特殊情景下，声纹识别登录就成为了为数不多的生物特征选择。

如黑夜中，如果需要进行生物识别，人脸识别会因光线过弱而无效，而虹膜设备因为需要特殊补光而需要特殊设备，指纹识别进行复制及伪造的门槛过低。

2、能识别主人的语音助理

可能很多人都会有一个疑问，那就是如果大家的终端设备都用的是一个语音助理，当在一个屋子的时候，其中有一个人喊了一句Hi 助理，那是不是整个屋子的助理都会有所反应呢？

这个时候声纹识别就发挥了最大的作用，避免了A想用他的助理但是B的语音助理却有所反应的情况，只需要根据提示建立好声纹模型，语音助理就会牢记。

3、越来越安全的移动支付

你使用互联网银行的时候，是否有过那么一丝担忧，手机短信真的安全吗？人脸真的安全吗？密码真的安全吗？

这时声纹识别的优势就体现出来了，如果使用声纹识别，可以把上述验证方式全部结合起来。声纹识别因为其自身的特殊性，是唯一符合密码认证机制的生物特征识别技术，换成通俗易懂的话语来说，就是让你的声音与你的密码无缝结合。再配合上人脸识别，安全性变会大大提高。

不过，纵然有着这么多的优势，但在实际操作中，声纹识别却面临着重大的挑战。

1、如何建立声纹库和特征：从理论上讲，声纹的获取是极其容易的，但这仅仅是针对国家相关机构，如目前声纹库最全的公安。对企业而言，所有的声纹数据都需要他们自行采集，这是一件相当具有难度的任务。另外，在数据不全面的情形之下，声纹特征的提取和建立也就受到了阻碍，从而就难以训练声纹识别的机器学习算法，以提高识别的准确率。

2、如何降低内外环境对于声纹的影响：目前，人们对声纹识别的要求已经不仅仅满足于静态检测，更多的是动态检测。在外部环境中，首先，声音是通过录音设备进行采集的，不同的型号的录音设备对语音都会造成一定程度上的畸变，同时由于背景环境和传输信道等的差异，对语音信息也会造成不同程度的损伤。这些情况的出现为声纹识别增添了不少的问题。比如外部环境的影响，哪怕是如今发展较为完善、已经实现落地的语音识别技术，降噪以及去混响方面也依然是其运行中的一大难题。

此外，在内部环境中对于同一个用户而言，即便采集到的两段语音内容都是相同的，但由于情绪、语速、疲劳程度等原因，语音都会有一些差异性，这些都是声纹识别不得不去解决的困境。

页: [1]

深圳论坛-深圳本地生活综合社区-来了都是深圳人's Archiver

前沿观察｜声纹识别解析