原理
所謂聲紋(Voiceprint),是用電聲學儀器顯示的攜帶言語信息的聲波頻譜。
人類語言的產生是人體語言中樞與發音器官之間一個複雜的生理物理過程,人在講話時使用的發聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。每個人的語音聲學特徵既有相對穩定性,又有變異性,不是絕對的、一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環境干擾有關。儘管如此,由於每個人的發音器官都不盡相同,因此在一般情況下,人們仍能區別不同的人的聲音或判斷是否是同一人的聲音。
分類
根據不同的套用場景,聲紋識別可分為說話人辨識(SpeakerIdentification,SI)和說話人確認(SpeakerVerification,SV)。SI指的是我們有了一段待測的語音,需要將這段語音與我們已知的一個集合內的一乾說話人進行比對,選取最匹配的那個說話人,是一個1對多的判別問題;SV指的是我們有了一段未知的語音,緊接著判斷這段語音是否來源於這個目標用戶即可,是一個1對1的二分類問題。
套用
在套用上,聲紋識別更大的套用前景在於安防領域,比如刑偵破案、門禁、銀行交易等等。此外,在智慧型家居等領域,為了安全,也為了更好的智慧型體驗,比如在人聲鼎沸的情境中準確識別哪句話是主人下達的命令等,聲紋識別技術也就漸漸受到了重視。
任務
聲紋識別的主要任務包括:語音信號處理、聲紋特徵提取、聲紋建模、聲紋比對、判別決策等。
優點
1、蘊含聲紋特徵的語音獲取方便、自然;
2、獲取語音的成本低廉,使用簡單,像麥克風、通訊設備等皆可;
3、適合遠程身份確認;
4、聲紋辨認和確認的算法複雜度低;
5、配合一些其他措施,如通過語音識別進行內容鑑別等,可以提高準確率。