歷史
1948年,資訊理論學說的奠基人香農曾經論證:不論是語音或圖像,由於其信號中包含很多的冗餘信息,所以當利用數字方法傳輸或存儲時均可以得到數據的壓縮。在他的理論指導下,圖像編碼已經成為當代信息技術中較活躍的一個分支。經過近半個世紀的努力,圖像編碼技術已從實驗室走入通信和電子領域。
性能度量
模擬圖像信號的數位化和相應的圖像頻帶壓縮技術。模擬圖像信號數位化是對信號在時間上抽樣、幅度上分層並轉換為數碼的過程。這一典型的數位化過程大大增加對傳輸信道容量的要求。因此,在圖像數位化的同時,往往必須進行頻帶壓縮。只有將圖像數位化後對傳輸信道容量的要求降低到接近於、甚至小於圖像模擬傳輸時的數值,圖像的數字傳輸才有可能得到廣泛套用。
性能度量
收信端重建圖像的質量,用相對於原始圖像的失真來衡量。失真的客觀量度,一般用原始圖像樣值與經過圖像編碼後在收信端重建圖像樣值間的均方誤差表示。失真的主觀度量是人的視覺感受,它是對再生圖像質量有決定意義的評價。在研究圖像編碼時,往往同時採用主觀和客觀失真度量。
活動圖像可看成是由平面坐標 i, j以及時間坐標 t決定的三維空間內的亮度分布。同一平面內相鄰像素(亦稱像元)間以及相鄰時間的各幀像素間存在相關性,因而數字圖像信息具有冗餘度。實現圖像編碼的基本途徑是通過對圖像信號樣值去相關來消除信息的冗餘度。這也就是利用圖像信號樣值間的相關性來實現圖像的頻帶壓縮。
圖像編碼的指標由平均每個樣本的編碼比特數來衡量,這一數值的降低取決於編碼方案是否能充分地去掉相關性。由於實際圖像是一個非平穩過程,它的局部統計相關性隨著圖像各局部內容細節及活動量而變化。自適應圖像編碼能夠根據圖像局部統計相關性的變化,自動採用不同的參數甚至在不同的圖像編碼方案間切換,從而做到充分去除圖像每一局部範圍內的相關性。
頻帶壓縮後的圖像信號降低了信息冗餘度,但一旦當信道產生誤碼,傳輸的信息就容易受到破壞。因此,圖像編碼的總性能應該用重建圖像主客觀失真、平均每樣本編碼比特數以及對信道誤碼靈敏度來表示。它們之間往往是相互制約的。
圖像編碼方案
圖像編碼系統的發信端基本上由兩部分組成。首先,對經過高精度模-數變換的原始數字圖像進行去相關處理,去除信息的冗餘度;然後,根據一定的允許失真要求,對去相關後的信號編碼即重新碼化(圖1)。一般用線性預測和正交變換進行去相關處理;與之相對應,圖像編碼方案也分成預測編碼和變換域編碼兩大類。
預測編碼
預測編碼利用線性預測逐個對圖像信息樣本去相關。對某個像素 S0來說,它用鄰近一些像素亮度的加權和(線性組合)┈作為估值,對 S0進行預測(圖2a)。 S0與┈之間的差值 e( u)就是預測誤差。由於相鄰像素與 S0間存在相關性,差值的統計平均能量就變得很小。因此,只需用少量數碼就可以實現差值圖像的傳輸。 圖像預測編碼(差值脈碼調製)主要有三種預測方法。①一維固定預測(一維差值脈碼調製):用圖2a中的 S1或 S2對 S0預測,加權係數固定並且小於1。②二維固定預測(二維差值脈碼調製):當預測估值取 S1和 S2的平均時,稱之為二維平均預測,而當預測估值取┈= S1+ S2- S3時,稱之為二維平面預測。③條件傳輸幀間預測(幀差脈碼調製):用前一幀同一平面位置的像素作為預測估值。對於只有少量活動的圖像(如可視電話),畫面中約有百分之七十以上的幀間差值等於零或很小,因此這些差值可捨棄不傳。由於幀間差值的傳輸以其幅度是否大於某個閾值為條件,又稱為條件傳輸幀間預測。
變換域編碼
用一維、二維或三維正交變換對一維 n、二維 n× n、三維 n× n× n塊中的圖像樣本的集合去相關,得到能量分布比較集中的變換域;在再碼化時,根據變換域中變換係數能量大小分配數碼,就能壓縮頻帶。最常用的正交變換是離散餘弦變換(DCT), n值一般選為8或16。三維正交變換同時去除了三維方向的相關性,它可以壓縮到平均每樣本1比特。圖像編碼可套用於基本靜止圖片的數字傳輸、數位電視電話會議以及數字彩色廣播電視。相應的壓縮目標,即傳輸數碼率範圍,初步定為64千比特/秒、2兆比特/秒、8兆比特/秒和 34兆比特/秒級。雖然壓縮性能較高的圖像編碼方案需要進行複雜的多維數字處理,但隨著數字大規模積體電路的集成度和工作速度的提高,以及大容量傳輸信道的實現,數字圖像傳輸必將逐步從實驗方案進入實用階段。