提出背景
人的視覺、聽覺等對信號的失真有一定的容忍度。然後人們就用失真函式表示失真程度。用信息率失真函式表示在某種程度的失真情形下信源的熵。
定義及公式
假如某一信源X,輸出樣值為a,經過失真編碼器,輸出Y,樣值為b。對於每一對(a,b),指定一個非負函式d(a,b)為單個符號的失真度或失真函式。
當a=b,d(ab)=0;
當a≠b,d(ab)=α(α>0);
如果a=b,i=1,2,…,n,j=1,2,…,則沒有失真。
如果a≠b,就產生了失真。
失真的大小,用一個量來表示,即失真函式d(a,b),以衡量用b代替a所引起的失真程度。
關於說明
常用失真函式及其適用性
均方誤差失真函式、絕對誤差失真函式和相對誤差失真函式適用於連續信源;誤碼失真適用於離散信源。
失真函式比較
均方誤差失真和絕對誤差失真只與(a–b)有關,而不是分別與a及b有關,在數學處理上比較方便。
相對誤差失真與主觀特性比較匹配,因為主觀感覺往往與客觀量的對數成正比,但在數學處理中就要困難得多。
其實選擇一個合適的、完全與主觀特性匹配的失真函式是非常困難的,更不用說還要易於數學處理。當然不同的信源應有較好的失真函式,所以在實際問題中還可以提出許多其他形式的失真函式。
平均失真度
失真函式d(a,b)是隨機變數,要分析整個信源的失真大小,只能用它的數學期望或統計平均值來表示。失真函式的數學期望稱為平均失真度,可以表示信源壓縮傳輸時平均每個符號所引起的失真的大小。
平均誤差失真是信源統計特性,信道統計特性和失真度的函式,當以上三個量p(a),p(b∕a),p(a,b)給定後,平均失真度就不再是一個隨機量了,而變成一個確定的量。 人們所允許的壓縮失真都是平均意義上的失真。
試驗信道
平均失真由信源分布p(a)、信道的轉移機率p(b∕a)和失真函式d(a,b)決定,若p(a)和d(a,b)已定,則調整p(b∕a)使平均失真度小於或等於D。
D為失真許可的試驗信道。
信息率
在上述允許信道PD中,可以尋找一種信道p(a ∕ b),使給定的信源p(a)經 過此信道傳輸後,互信息I(X;Y)達到最小。該最小的互信息就稱為信息率失真函式R(D)。
失真在傳輸中是不可避免的。 連續信源輸出的信息量為無窮大,不可能實現無失真信源編碼。接收者(信宿)無論是人還是機器設備,都有一定的分辨能力與 靈敏度,超過分辨能力與靈敏度的信息傳送過程是毫無意義的。即使信宿能分辨、能判別,但對通信質量的影響不大,也可以稱它為允許範圍內的失真。 如果R>C,就必須對信源壓縮,使得壓縮後的R*<C,但同時要求引入的失真不能超過規定的限度。 對於給定的信源,在允許失真的條件下信源熵所能壓縮的理論極限值就是率失真函式R(D)。
綜上所述,一般可以對信源輸出的信息進行限失真處理,降低信息率,提高傳輸效率。