版權資訊
書 名: 說話人識別模型與方法作 者:吳朝暉
出版社: 清華大學出版社
出版時間: 2009
ISBN: 9787302189688
開本: 16
定價: 53.00 元
內容簡介
說話人識別是根據語音波形中反映說話人生理和行為的特徵的語音參數,自動識別說話人身份的技術。《說話人識別模型與方法》作者結合多年的科研丁作,分5個部分介紹了說話人識別的基本概念、方法以及最新研究進展。第1部分概括介紹說話人識別的主要概念、基本原理、研究歷史與現狀,以及測試語料庫的構建;第2部分介紹作者對特徵提取提出的不同改進方法,包括特徵組合與特徵變換;第3部分是作者提出的新的說話人識別模型,包括支持向量機、動態貝葉斯網路、主成分分析;第4部分介紹作者在基於信息融合的說話人識別上的創新工作;第5部分介紹作者開發的一個軟體平台及其基礎上的兩個具體套用系統,最後是全書總結並展望發展趨勢。
《說話人識別模型與方法》可供信息工程、電子工程、計算機科學與技術、公安、軍事偵察等領域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統、模式識別、生物醫學等學科專業的研究生或高年級本科生的教學參考書。
目錄
第一篇緒論
第1章背景與概述
1.1研究背景及意義
1.1.1說話人識別介紹
1.1.2說話人識別的優勢與套用前景
1.2研究進展與趨勢
1.2.1研究歷史
1.2.2研究現狀
1.2.3發展趨勢
1.2.4存在的問題
1.3本書結構
參考文獻
第2章技術基礎與理論
2.1背景知識
2.2說話人識別系統結構
2.3特徵提取
23.1預處理
2.3.2美爾倒譜特徵
2.3.3線性預測係數
2.3.4Delta特徵和Delta_Dclta特徵的計算
2.3.5聲門特徵
2.4說話人識別模型
2.4.1高斯混合模型
2.4.2隱馬爾可夫模型
2.4.3動態時間規整模型
2.4.4向量量化模型,
2.5得分規整
2.6系統性能評價
2.6.1評價指標
2.6.2性能與用戶規模的關係
2.6.3實際使用要求
2.7小結
參考文獻
第3章說話人識別語料庫
3.1常用語料庫
3.2面向移動互聯環境的說話人識別語料庫(SRMC)
3.2.1SRMC的設計思路
3.2.2SRMC錄音方案
3.2.3SRMC錄音內容
3.2.4SRMC存儲與標註
3.3電話語音庫(PHONE)
3.4多模態說話人識別庫
3.5NOISEX-92資料庫
3.6小結
參考文獻
第二篇特徵提取
第4章說話人特徵分析與最佳化
4.1特徵性能分析
4.1.1階數的影響
4.1.2幀長的影響
4.1.3結論
4.2特徵參數最佳化
4.2.1語音包絡檢測
4.2.2包絡最小長度限制
4.2.3預加重參數選取
4.2.4語音起始點的去除
4.2.5Delta特徵的引入
4.2.6訓練音長度的影響
4.2.7結論
4.3特徵組合
4.3.1單一特徵組合
4.3.2不同特徵組合(小規模用戶)
4.3.3不同特徵組合(中等規模用戶)
4.4二次特徵提取
4.5小結
參考文獻
第5章基於主成分分析(PCA)的說話人特徵變換
5.1高維說話人特徵的缺陷
5.2說話人特徵與PCA變換
5.2.1說話人特徵
5.2.2PCA變換的流程與效果
5.2.3說話人特徵的PCA變換
5.3PCA特徵變換套用於說話人鑑別
5.3.1傳統的說話人鑑別系統
5.3.2基於PCA特徵變換的可行性
5.4局部PCA特徵變換
5.4.1基於局部PCA特徵變換的說話人鑑別系統
5.4.2實驗結果分析
5.4.3結論
5.5全局PCA特徵變換
5.5.1基於全局PCA特徵變換的說話人鑑別系統
5.5.2實驗結果分析
5.5.3結論
5.6基準系統、局部PCA變換與全局PCA變換的比較
5.6.1可擴充性比較
5.6.2識別性能比較
5.7小結
參考文獻
第6章基於線性判別分析(LDA)的說話人特徵變換
6.1LDA變換與PCA變換的聯繫與區別
6.1.1LDA轉換公式與PCA轉換公式
6.1.2LDA變換和PCA變換的原理的比較
6.1.3用LDA對說話人特徵進行變換
6.2LDA特徵變換
6.2.1基於LDA特徵變換的說話人鑑別系統
6.2.2實驗結果分析
6.2.3結論
6.3基準系統、全局PCA變換與LDA變換的比較
6.3.1可擴充性比較
6.3.2識別性能比較
6.4小結
參考文獻
第7章基於軌線模型的說話人特徵時序性發掘
7.1基於段模型的說話人特徵時序性發掘
7.1.1段模型
7.1.2段模型在語音識別中的套用
7.1.3說話人特徵時序性發掘方法
7.1.4時序性發掘實驗
7.2基於TrendedHlMM的文本相關說話人識別
7.2.1TrendedHMM
7.2.2TrendedH1VIM在語音識別中的套用
7.2.3文本相關的說話人識別
7.2.4TrendedHMM與VIV
7.2.5TrendedHMM優缺點
7.3小結
參考文獻
第三篇識別模型
第8章基於支持向量機的識別模型
8.1研究意義
8.2支持向量的區域描述
8.2.1閉集與開集
8.2.2支持向量的區域描述
8.2.3說話人辨認
8.3支持向量機的機率輸出
8.3.1機率
8.3.2支持向量機的機率輸出
8.3.3內嵌支持向量機(SVM)的隱馬爾可夫模型(HMM)
8.3.4支持向量機(SVM)與高斯混合模型((3MM)的混合模型
8.4基於向量量化(VQ)模型的核方法
8.5基於GMM模型的核方法
8.6多SVM混合模型
8.7小結
參考文獻
第9章基於動態貝葉斯網路的識別模型
9.1動態貝葉斯網路
9.1.1表達
9.1.2推導
9.1.3學習
9.1.4結論
9.2基於動態貝葉斯網路(DBN)的說話人識別
9.2.1基於動態貝葉斯網路的識別框架
9.2.2實驗和討論
9.3小結
參考文獻
第10章基於主成分分析分類器的說話人識別
10.1說話人分類常用算法的局限性
10.2主成分分析分類原理
10.2.1主成分分析的遞歸定義
10.2.2主成分分析的分類依據
10.3兩種主成分分析分類器及其決策融合
10.3.1基於主成分子空間的分類器
10.3.2基於截斷誤差子空間的分類器
10.3.3兩種主成分分析分類器的決策融合
10.4主成分分析分類器套用於說話人鑑別
……