內容簡介
音頻數位化主要有壓縮與非壓縮兩種方式。較早出現的數字音頻播放機,如CD唱機和DAT錄音機,均採用線性PCM編碼來存儲音樂信號,為非壓縮方式。在高質量要求的音頻工作站和數字錄像機(如DVCPRO)上,現在也採用非壓縮的格式。
我們目前常見的MPEG、Dolby Digital、DTS等則為壓縮方式。壓縮分為有損壓縮和無損壓縮。有損壓縮的目的是提高壓縮率,降低占用系統資源。可以根據實際需要選用不同的採樣速率、樣本分辨力(精度)和數據率。
如今杜比數字作為由FCC為美國選定的ATSC數位電視標準的一部分,為高清晰度電視(HDTV)和標準清晰度電視(SDTV)廣播的標準。MPEG為歐洲數字視頻廣播(DVB)、數字音頻廣播(DAB)和日本廣播電視業的音頻標準。DVD則支持3種主要標準:Dolby digital(杜比數字)、MPEG-2和線性PCM(LPCM)。其他格式,如DTS(Digital Theatre Sound)、SDDS(Sony Dynamic Digital Sound)等為任選格式。
聲音重放技術的發展路程,是沿著單聲(Monophonic)、雙聲道立體聲(Stereophonic)到4通道立體聲,再到環繞立體聲(Stereo surround),現在一般為5.1模式。其根本目的,就是更逼真地再現原聲場。我國電視目前大量採用的單聲道已遠遠跟不上人們生活的需要。如何以量低的數據率,最有效地傳送多聲道、高質量的聲音,是數位化的發展方向。所謂5.1模式,即錄製、解碼和放聲中採用5個聲道:左(L)、中(C)、右(R)、左環繞(LS)、右環繞RS),再加上一個低頻效果通道(LFE),就可以達到真正的立體環繞聲效果——寬闊的場景深度感和總體真實感。5.1模式為ATSC和DVB的標準聲道。
非壓縮編碼
聲音之所以能夠數位化,是因為人耳所能聽到的聲音頻率不是無限寬的,主要在20kHz以下。按照抽樣定理,只有抽樣頻率大於40kHz,才能無失真地重建原始聲音。如CD採用44.1kHz的抽樣頻率,其他則主要採用48kHz或96kHz。
PCM(脈衝編碼調製)是一種將模擬語音信號變換為數位訊號的編碼方式。主要經過3個過程:抽樣、量化和編碼。抽樣過程將連續時間模擬信號變為離散時間、連續幅度的抽樣信號,量化過程將抽樣信號變為離散時間、離散幅度的數位訊號,編碼過程將量化後的信號編碼成為一個二進制碼組輸出。
量化分為線性量化和非線性量化。線性量化在整個量化範圍內,量化間隔均相等。非線性量化採用不等的量化間隔。量化間隔數由編碼的二進制位數決定。例如,CD採用16bit線性量化,則量化間隔數L=65536。位數(n)越多,精度越高,信噪比SNR=6.02n+1.76(dB)也越高。但編碼的二進制位數不是無限制的,需要根據所需的數據率確定。比如:CD可以達到的數據率為2×44.1×16=1411.2Kbit/s。
常用的編碼碼組有3種:自然二進制碼組(NBC)、摺疊二進制碼組(FBC)、格雷二進制碼組(RBC)。國際PCM標準主要使用FBC。
壓縮編碼
PCM雖然為無損壓縮,但由典型的音頻信號表示的信號特性沒有達到最佳,也沒有很好的適應人耳聽覺系統的特定要求。PCM的數據量過高,從而造成存儲和傳輸方面的障礙,因此必須使用相應的技術降低數位訊號源的數據率,又儘可能不對節目造成損傷,這就是壓縮技術。
人耳的聽覺心理有兩個特性:頻率掩蔽和時間掩蔽特性。人耳在安靜的環境中有一個靜聽閾(門限),即對應於人耳能聽到的頻率範圍能被感覺到的最低聲音強度。頻率掩蔽,即當一個單音單元出現時,產生一個新的聽閾曲線(同聽閾),在此頻率附近的頻段內,門限均有不同程度的提高,以中心頻率為最高。時間掩蔽,即當一個強信號出現時,其前後一段時間內,業已存在的弱音可以被掩蔽不被聽見。在聽閾以下的音頻信號不需要編碼。