背景
隨著計算機技術和網路通信技術的飛速發展,實時可視化通信、多媒體通信、網路電視、視頻監控等業務越來越受到大家的關注。這樣,圖像壓縮技術就成為目前急需解決的問題。
圖像通常來源於真實世界,格式種類繁多。一般情況下,圖像格式可以分為兩類:
(1)點陣圖檔案:包括GIF格式,BMP格式,PCX格式,PNG格式,JPEG格式等;
(2)矢量圖檔案:包括WMF,EPS檔案格式等。點陣圖檔案是以像素點為單位描述圖像,而矢量圖檔案顧名思義以矢量為單位描述圖像。
圖像處理,是指將一幅圖像變為另外一幅經過修改的圖像,是一個圖像到圖像的過程。一般圖像處理技術分為兩類:模擬方式與數字方式。如今普遍採用數字圖像處理,包括以下內容:圖像復原、圖像壓縮、圖像重建、模式識別等。圖像壓縮的首要目的就是壓縮數據量,提高有效性。
圖像壓縮是圖像存儲、處理和傳輸的基礎,它是用儘可能少的數據來進行圖像的存儲和傳輸。圖像數據是可以被壓縮的,支持這一理論的依據,允許圖像編碼有一定的失真;圖像數據的冗餘性。大多數情況下,並不要求經壓縮後的圖像和原圖完全相同,而允許有少量失真,只要這些失真不被人眼察覺就可以接受。這給壓縮比的提高提供了有利的條件,可允許的失真愈多,可實現的壓縮效率就愈高。因為圖像數據具有可壓縮性,有大量的所謂統計性質的多餘度,從而產生生理視覺上的多餘度,去掉這部分圖像數據並不影響視覺上的圖像質量,甚至去掉一些圖像細節對於實際圖像的質量也無致命的影響。正因為如此,可以在允許保真度的條件下壓縮待存儲的圖像數據,大大節約存儲空間,而且在圖像傳輸時也大大減少信道容量。光碟技術和數據壓縮技術的發展為各種形態的大量數據傳輸提供了技術保證,CPU性能的不斷提高也為數據壓縮提供了有利條件。
研究現狀
圖像壓縮技術分為靜態壓縮和動態壓縮。JPEG是第一個數字圖像壓縮的國際標準,JPEG(Joint PhotographicExperts Group,聯合圖像專家小組)包含兩種基本壓縮方法:
(1)有損壓縮,它是以自適應離散餘弦變換DCT為基礎的壓縮方法。所謂有損壓縮,就是壓縮後圖像的某些信息會丟失。
(2)無損壓縮。由於其壓縮比有一定的極限,所以目前已不是研究熱點,它是以差分脈衝編碼調製DPCM為基礎的壓縮方法。圖像編碼的一般過程見圖1。
一般過程
數據壓縮的過程口1如圖l所示,數據壓縮一般有編碼和解碼兩個過程,信源數據經過源編碼器的壓縮編碼,被減少到存儲設備與傳輸介質所能支持的水平。通道編碼器是把壓縮位流翻譯成一種既適合於存儲又適合於傳輸的信號。由通道解碼器和源解碼器構成的解碼子系統執行通道編碼和源編碼的逆過程,以重新構造圖像。
方法
針對多媒體數據冗餘類型的不同,相應地有不同的壓縮方法。根據解碼後數據與原始數據是否完全一致進行分類,壓縮方法可被分為無損壓縮和有損壓縮。在此基礎上根據編碼原理進行分類,大致有:預測編碼、變換編碼、統計編碼以及其他一些編碼。其中統計編碼是無損編碼,其他編碼方法基本是有損編碼。
無損壓縮和有損壓縮
1) 無損壓縮:也叫無失真壓縮,是指解壓還原後的數據同原始的數據完全一樣。這種壓縮的特點是壓縮比較小。
2) 有損壓縮:也叫有失真壓縮,這種壓縮使得壓縮後部分信息丟失,即還原的數據與原始數據存在誤差。它的特點是壓縮比大,而且壓縮比是可調節的,可從幾倍到幾百倍。
常用圖像數據編碼方法
1. 預測編碼
預測編碼是根據離散信號之間存在著一定的相關性,利用前面的一個或多個信號對下一信號進行預測,然後對實際值和預測值的差進行編碼。預測編碼分為幀內預測和幀間預測兩種類型。
1) 幀內預測:幀內預測編碼反映了同一幀圖像內,相鄰像素之間的空間相關性較強,因而任何一個像素的亮度值,均可由它相鄰的已被編碼的像素的編碼值來進行預測。幀內預測編碼包括差分脈衝編碼調製和自適應差分脈衝編碼調製。
2 )幀間預測:在 MPEG 壓縮標準中採用了幀間預測編碼,這是由於運動圖像各幀之間有很強的時間相關性。例如在電視圖像傳送中,相鄰幀的時間間隔只有1/30 s,大多數像素的亮度信號在幀間的變化是不大的,利用幀間預測編碼技術就可減少幀序列內圖像信號的冗餘。
2. 變換編碼( Transform Coding )
變換編碼先對信號進行某種函式變換,從信號的一種表示空間變換到信號的另一種表示空間,,然後在變換後的域上,對變換後的信號進行編碼,變換編碼過程如圖 2 所示。
3. 統計編碼
統計編碼主要針對無記憶信源,根據信息碼字出現機率的分布特徵而進行壓縮編碼,尋找機率與碼字長度間的最優匹配,其又可分為定長碼和變長碼。
4. 其他編碼
1) 矢量量化編碼;
2) 子帶編碼;
3) 分形編碼。
發展趨勢
從國際數據壓縮技術的發展尤其是MPEG的發展可以看出,基於內容的圖像壓縮編碼方法是未來編碼的發展趨勢。它不僅能滿足進一步獲得更大的圖像數據壓縮比的要求,而且能夠實現人機對話的功能。另外,任意形狀物體的模型建立的關鍵問題還沒有解決,這嚴重影響其套用的廣泛性。因此,視頻編碼將朝著多模式和跨模式的方向發展。
通過元數據進行編碼也是今後編碼的發展方向。元數據是指詳細的描述音/視頻信息的基本元素,利用元數據來描述音視頻對象的同時也就完成了編碼,因為此時編碼的對象是圖像的一種描述而不再是圖像本身。從另一個角度來說,進一步提高壓縮比,提高碼流的附屬功能(碼流內容的可訪問性、抗誤碼能力、可伸縮性等)也將是未來的編碼的兩個發展方向。
R個數的一組看作K維矢量,然後以這些矢量為單元進行量化編碼,該方法對聲音和圖像數據特別有效。