語音編碼技術

在通信系統中,語音編碼是相當重要的,因為在很大程度上,語音編碼決定了接收到的語音質量和系統容量。在移動通信系統中,寬頻是十分寶貴的。低比特率語音編碼提供了解決該問題的一種方法。在編碼器能夠傳送高質量語音的前提下,如果比特率越低,可在一定得寬頻內能傳更多的高質量語音。

簡介

語音編碼為信源編碼,是將模擬語音信號轉變為數位訊號以便在信道中傳輸。語音編碼的目的是在保持一定的算法複雜程度和通信時延的前提下,占用儘可能少的通信容量,傳送儘可能高質量的語音。語音編碼技術又可分為波形編碼、參量編碼和混合編碼三大類。

分類

波形編碼

是對模擬語音波形信號經過取樣、量化、編碼而形成的數字語音技術。為了保證數字語音技術解碼後的高保真度,波形編碼需要較高的編碼速率,一般在16~64kbps,可對各種各樣的模擬語音波形信號進行編碼均可達到很好的效果。它的優點是適用於很寬範圍的語音特性,以及在噪音環境下都能保持穩定。實現所需的技術複雜度很低而費用中等程度,但其所占用的頻帶較寬,多用於有線通信中。波形編碼包括脈衝編碼調製(PCM)、差分脈衝編碼調製(DPCM)、自適應差分脈衝編碼調製(ADPCM)、增量調製(DM)、連續可變斜率增量調製(CVSDM)、自適應變換編碼(ATC)、子帶編碼(SBC)和自適應預測編碼(APC)等。

參量編碼

是基於人類語言的發聲機理,找出表征語音的特徵參量,對特徵參量進行編碼的一種方法。在接收端,根據所收的語音特徵參量信息,恢復出原來的語音。由於參量編碼只需傳送語音特徵參數,可實現低速率的語音編碼,一般在1.2~4.8kbps。線性預測編碼(LPC)及其變形均屬於參量編碼。參量編碼的缺點在於語音質量只能達到中等水平,不能滿足商用語音通信的要求。對此,綜合參量編碼和波形編碼各自的優點,即保持參量編碼的低速率和波形編碼的高質量的長點,又提出了混合編碼方法。

混合編碼

是基於參量編碼和波形編碼發展的一類新的編碼技術。在混合編碼的信號中,既含有若干語音特徵參量又含有部分波形編碼信息,其編碼速率一般在4~16kbps。當編碼速率在8~16kbps範圍時,其語音質量可達商用語音通信標準的要求,因此混合編碼技術在數字移動通信中得到了廣泛套用。混合編碼包括規則脈衝激勵—長時預測—線性預測編碼(RPE-LTP-LPC)、矢量和激勵線性預測編碼(VSELP)和碼激勵線性預測編碼(CELP)等。

相關詞條

熱門詞條

聯絡我們