自適應矢量量化

自適應矢量量化

自適應矢量量化在語音信號處理中有廣泛的套用 , 矢量量化是一種重要的信號壓縮方法 , 在語音信號處理中起著非常重要的作用。

改進的Kohonen網路及圖像自適應夫量量化

針對圖像矢量量化存在的分塊效應問題,過對Kohonen自組織模型研究,修改了Kohonen的自組織特徵映射(SOFM)算法,設計了兩個DCT離散餘弦變換)域的特徵值 ,用於圖像數據塊的分類。在此基礎上,進步探討了改進的自組織特徵映射(MSOFM)算法在圖像自適應矢量量化中的套用。計算機模擬實驗表明,MSOFM算法有效地減少了分塊效應與SOFM算法相比具有更好的性能。

矢量量化器的碼書設計

自從文獻提出LBG算法來,矢量量化作為一種高效的數據編碼技術已廣泛地用於圖像和語音信號的壓縮。關於矢量量碼書的設計雖已有諸多研究及改進,但仍然有一些關鍵問題正待解決。例如,對具有不同統計特性的圖像信號,系統收發兩端也需要作相應的改變,其結果一方面是增加了圖像送的比特數,另一方面是加大了實時實現的困難,為了解決這個問題,人們把注意力轉向新的碼書設計算法。神經網路的興起,正好為矢量量化器的碼書設計找到了新的途徑。

在眾多的神經網路模型中,Kohonen的自組織特徵映射模型(簡稱SOFM模型)最適合於設計矢量量化碼書,用該模型設計的碼書性能接近LBG算法設計的碼書,且計算量小,抗干擾性好,前者還不象後者那樣收斂特性受初始碼書影響。然而, 這種SOFM算法設計的碼書也未能解決矢量量化編碼存在的一個重要缺陷,即編碼圖像出現方塊效應,特別是當壓縮比較高時,這種現象更為嚴重。為此,對SOFM算法進行了改進,並給出了實驗結果。

用MSOM算法實現的自適應矢量量化

用MSOFM法設計的碼矢為16維的碼書,對128x128的圖像進行矢量量化編碼,在接收端恢復的圖像具有較高的圖像質量,但壓縮比只有16倍,而用MSOFM算法設計的碼矢為64維的碼書, 對128x128的圖像進行矢量量化編碼,雖然具有42倍的高壓縮比(考慮了矢量的歸一化係數所需的比特數),但圖像質量很差。為了解決壓縮比和圖像質量的矛盾,提出自適應矢量量化系統的自適應矢量量化編碼方案。

與LBG算法相比,SOFM算法自適應性強,可以設計出性能最優的碼書,並且Kohonen自組織神經網路具有高度並行計算結構,可以實時或準實時地實現矢量量化編碼。通過對SOF算法的改進,減少了編碼圖像的分塊效應,如果採用提出的自適應矢量量化編碼方案,可以圓滿地解決壓縮比與圖像質量的矛盾。計算機模擬實驗表明,基於MSOFM算法的自適應矢量量化編碼在保證一定圖像質量的情況下,可以獲得較高的數據壓縮比。

模糊聚類在自適應矢量量化碼本訓練中的套用

自適應矢量量化在語音信號處理中有廣泛的套用,提出了一種基於SFCM算法的自適應矢量量化碼本的訓練方法,其特點是通過模糊聚類方法,重新調整訓練樣本與碼字之間的隸屬度,達到最小編碼失真,使碼本更適合新說話人,且計算簡單。方法的實驗結果表明,可以使編碼平均失真下降。

矢量量化的信號壓縮方法

矢量量化是一種重要的信號壓縮方法,在語音信號處理中起著非常重要的作用。矢量量化是對訓練特徵空間的最優劃分,但是對於新的說話人,由於沒有參加訓練,原來的碼本不一定是最優量化碼本,可能具有較大的碼失真。為了減小編碼失真,可以進行說話人自適應。在語音識別系統中,常用的說話人自適應方法有:基於說話人分類的適應方式,基於譜映射的自適應方式,以離散HMM為框架的語音識別系統的自適應等。

實驗結果

在實驗中,用的語音信號樣本集是男生的,有5466幀矢量,碼本是用SFCM算法進行聚類分析得到的。第1個自適應樣本集由沒有參加訓練的男生的總計3200幀矢量組成。自適應前的矢量編碼平均失真和矢量數目與碼字的關係是自適應後訓練樣本集合對新碼本重新編碼的結果,由於進行了碼字修正,從男生矢量集自適應前平均失真、矢量數目與碼本的關係可以看出平均失真下降了,而整個自適應訓練樣本集合的各個子集集合內矢量數目對碼字的分布變化不大。

第2個自適應樣本集由沒有參加訓練的女生的總計3215幀矢量組成。女生矢量集自適應前平均失真、矢量數 目與碼本的關係是自適應前的矢量編碼平均失真和矢量數目與碼字的關係是自適應後訓練樣本集合對新碼本重新編碼的結果,由於進行了碼字修正,從女生矢量集自適應前平均失真、矢量數目與碼本的關係中可以看出平均失真下降了。

將SFCM算法用於碼本的自適應訓練,由於使用模糊隸屬度來重新調整碼字,使得碼字在適用於原特徵基礎上更適合新特徵,使編碼平均失真降低。該方法計算簡單,適用於離散HMM語音識別系統的話者適應。

相關詞條

熱門詞條

聯絡我們