參數立體聲

參數立體聲

參數立體聲,是傳輸一種描述立體聲圖像的數據,而這種數據是以混合單聲道的邊信息的形式傳送的。

為進一步提高低速率立體聲編碼的性能,提出基於SBR框架的參數立體聲編碼(Parametric Stereo,簡稱PS)。
參數立體聲編碼的基本思想就是傳輸一種描述立體聲圖像的數據,而這種數據是以混合單聲道的邊信息的形式傳送的,這種立體聲邊信息非常簡潔,雖然只占整個比特流很小的一部分,卻可以使整個比特流的單聲道信號獲得最好的品質。
參數立體聲編碼(PS)技術是全境選頻和立體聲環境重建兩種技術的結合,這種結合的技術使揚聲器播放與耳機播放都能獲得很好的立體聲場景,解碼時,立體聲的合成重建空間特性,但並沒有影響整個的譜能量,因此,與單一的核心信號相比,頻譜上並沒有什麼變化。它的另一個優點就是向後兼容性,這樣那些不支持參數立體聲的解碼器仍可以成功地解出單聲道信號,這是因為PS數據存在比特流的擴充數據域內,這樣可以很隨意把它忽略掉,在AAC+SBR上套用參數立體聲的設計目標範圍是18~26 kbit/s,但這種技術可以在任何比特率下套用。
在參數立體聲工具中,有兩種不同的立體聲參數來描述立體聲圖像,即全境(Panorama)參數簡稱Pan和立體聲環境(Stereo ambience)參數簡稱SA,Pan參數包含左右信道不同選頻標準的信息,而sA參數則包含立體聲環境的選頻信息,而這僅用左右信道的能量分布是不能夠描述的。
當考慮到大多數立體聲採用的中一邊(mid—side)表示法時,與中信道相比,迴響通常會過多地在邊信道中被描述,這主要是因為大多數環境變數在合成單聲道後會丟失,sA合成法就是一種將一個合成的版本加入到邊信道中來重新生成丟失的環境變數的方法。
頻域內的分析和綜合可採用SBR系統里的QMF濾波器組,因為不需要額外的時一頻轉換,PS編解碼只需非常小的開銷,SBR系統中的QMF濾波器組是一個64信道複數濾波器組。
sA和Pan參數更新每一個SBR幀,並在幀之間進行線形內插以便得到平滑過渡,雖然sA和Pan被認為是兩個獨立的參數,但SA改良信號的效果會不同程度地受到Pan參數值的影響,在高的Pan值比如左右聲道能量分布很不平衡時,SA的效果會顯得不那么顯著。
PS編碼的技術概念利用mid—side方法更容易描述立體聲信號,left—right與mid.side的轉換關係為:
mid=left+right
side=left-right
如圖5所示,PS數據只在最終端才影響到信號,而且Ps編解碼獨立於現行的用於單聲道的編解碼器。PS編碼只產生少量的數據,這些數據是用來在解碼時重建立體圖像的,這些數據包括sA和Pan參數和一些控制數據塊。AAC+SBR利用MPEG一4音頻數據流結構,Ps數據存放在擴充數據域中,這樣可以確保MPEG一4音頻的向後兼容性,即使一些不支持Ps的解碼器也可以把它當成附加數據而忽略。由於採用熵編碼,Ps的信號傳輸率是動態的,但對於立體聲其比特率的分布很少有(<1%)超過2 kbit/s的。Ps數據流最終由編碼器來選擇,故很容易控制其不超過所要求的最大值,當以24 kbit/s的比特率將Ps套用到AAC十SBR系統中去時,平均的比特率典型分布為:22.8 kbit/s核心數據(AAC+SSR)和1.2 kbit/s用於立體聲的PS數據。
對於純的單聲道信號,Ps數據比特率只有0.05kbit/s,故不會有單聲道信號譜能顯著軟化的事情發生,當然,對於立體聲寬度接近單聲道的立體聲信號,其Ps數據率會低於平均值。
正因為採用了包括PS技術在內的幾種新的高壓縮比技術,HE—AACV2技術可以在128 kb/s的比特率下傳送5.1多頻段音頻信號,而在32 kb/s的比特率下可下載和傳送近CD質量的音頻信號,也可以以24 kb/s的比特率傳送極高質量的立體聲信號,甚至可以以良好的質量傳送混合的低於16 kb/s的單聲道音頻信號。
PS編碼技術是一種將立體聲音頻信號視為單聲道信號加上一小部分描述立體聲影像信息的參數開銷來有效編碼的技術。立體聲輸入信號降混音成單聲道信號,同時根據空間心理聲學特性將立體聲影像信息提取成少量高品質的立體聲參數。單聲道信號可以使用任何傳統的音頻編碼器來編碼,立體聲參數經過量化編碼後作為輔助部分嵌入到單聲道比特流中。在解碼器端,首先將比特流解復用成單聲道信號流和空間立體聲參數流,單聲道信號解碼後藉助立體聲參數來合成重建立體聲信號。

熱門詞條

聯絡我們