圖像處理系統的功能包括:增強、編碼、壓縮、復原與重構。
圖像增強
圖像增強系統所執行操作的結果是使人們覺得處理後的圖像質量更好。如對比度增強、亮度放縮、邊緣銳化等。
圖像增強可分成兩大類:頻率域法和空間域法。
前者把圖像看成一種二維信號,對其進行基於二維傅立葉變換的信號增強。採用低通濾波(即只讓低頻信號通過)法,可去掉圖中的噪聲;採用高通濾波法,則可增強邊緣等高頻信號,使模糊的圖片變得清晰。
後者空間域法中具有代表性的算法有局部求平均值法和中值濾波(取局部鄰域中的中間像素值)法等,它們可用於去除或減弱噪聲。
方法:
圖像增強的方法是通過一定手段對原圖像附加一些信息或變換數據,有選擇地突出圖像中感興趣的特徵或者抑制(掩蓋)圖像中某些不需要的特徵,使圖像與視覺回響特性相匹配。
在圖像增強過程中,不分析圖像降質的原因,處理後的圖像不一定逼近原始圖像。圖像增強技術根據增強處理過程所在的空間不同,可分為基於空域的算法和基於頻域的算法兩大類。
空域法是對圖像中的像素點進行操作,用公式描述如下:
g(x,y)=f(x,y)*h(x,y)
其中是f(x,y)是原圖像;h(x,y)為空間轉換函式;g(x,y)表示進行處理後的圖像。
基於空域的算法處理時直接對圖像灰度級做運算,基於頻域的算法是在圖像的某種變換域內對圖像的變換係數值進行某種修正,是一種間接增強的算法。
基於空域的算法分為點運算算法和鄰域去噪算法。
點運算算法即灰度級校正、灰度變換和直方圖修正等,目的或使圖像成像均勻,或擴大圖像動態範圍,擴展對比度。
鄰域增強算法分為圖像平滑和銳化兩種。
平滑一般用於消除圖像噪聲,但是也容易引起邊緣的模糊。常用算法有均值濾波、中值濾波。銳化的目的在於突出物體的邊緣輪廓,便於目標識別。常用算法有梯度法、運算元、高通濾波、掩模匹配法、統計差值法等。
圖像編碼
編碼使研究圖像信息的表達方式,使其更經濟與有效,這包括量化方法、冗餘消除。編碼還可能包括研究圖像信息的表達方式,使其在傳輸或存儲圖像中出現錯誤時仍具有魯棒性。
圖像編碼系統的發信端基本上由兩部分組成。首先,對經過高精度模-數變換的原始數字圖像進行去相關處理,去除信息的冗餘度;然後,根據一定的允許失真要求,對去相關後的信號編碼即重新碼化。一般用線性預測和正交變換進行去相關處理;與之相對應,圖像編碼方案也分成預測編碼和變換域編碼兩大類。
預測編碼
預測編碼利用線性預測逐個對圖像信息樣本去相關。對某個像素 S0來說,它用鄰近一些像素亮度的加權和(線性組合)┈作為估值,對 S0進行預測。 S0與┈之間的差值 e( u)就是預測誤差。由於相鄰像素與 S0間存在相關性,差值的統計平均能量就變得很小。因此,只需用少量數碼就可以實現差值圖像的傳輸。
圖像預測編碼(差值脈碼調製)主要有三種預測方法。①一維固定預測(一維差值脈碼調製):用圖2a中的 S1或 S2對 S0預測,加權係數固定並且小於1。②二維固定預測(二維差值脈碼調製):當預測估值取 S1和 S2的平均時,稱之為二維平均預測,而當預測估值取┈= S1+ S2- S3時,稱之為二維平面預測。③條件傳輸幀間預測(幀差脈碼調製):用前一幀同一平面位置的像素作為預測估值。對於只有少量活動的圖像(如可視電話),畫面中約有百分之七十以上的幀間差值等於零或很小,因此這些差值可捨棄不傳。由於幀間差值的傳輸以其幅度是否大於某個閾值為條件,又稱為條件傳輸幀間預測。
變換域編碼
用一維、二維或三維正交變換對一維 n、二維 n× n、三維 n× n× n塊中的圖像樣本的集合去相關,得到能量分布比較集中的變換域;在再碼化時,根據變換域中變換係數能量大小分配數碼,就能壓縮頻帶。最常用的正交變換是離散餘弦變換(DCT), n值一般選為8或16。三維正交變換同時去除了三維方向的相關性,它可以壓縮到平均每樣本1比特。圖像編碼可套用於基本靜止圖片的數字傳輸、數位電視電話會議以及數字彩色廣播電視。相應的壓縮目標,即傳輸數碼率範圍,初步定為64千比特/秒、2兆比特/秒、8兆比特/秒和 34兆比特/秒級。雖然壓縮性能較高的圖像編碼方案需要進行複雜的多維數字處理,但隨著數字大規模積體電路的集成度和工作速度的提高,以及大容量傳輸信道的實現,數字圖像傳輸必將逐步從實驗方案進入實用階段。
圖像壓縮
目的在於減少存儲與傳輸圖像的比特數量。
圖像數據之所以能被壓縮,就是因為數據中存在著冗餘。圖像數據的冗餘主要表現為:圖像中相鄰像素間的相關性引起的空間冗餘;圖像序列中不同幀之間存在相關性引起的時間冗餘;不同彩色平面或頻譜帶的相關性引起的頻譜冗餘。數據壓縮的目的就是通過去除這些數據冗餘來減少表示數據所需的比特數。由於圖像數據量的龐大,在存儲、傳輸、處理時非常困難,因此圖像數據的壓縮就顯得非常重要。
資訊時代帶來了“信息爆炸”,使數據量大增,因此,無論傳輸或存儲都需要對數據進行有效的壓縮。在遙感技術中,各種航天探測器採用壓縮編碼技術,將獲取的巨大信息送回地面。
圖像壓縮是數據壓縮技術在數字圖像上的套用,它的目的是減少圖像數據中的冗餘信息從而用更加高效的格式存儲和傳輸數據。
圖像復原
對圖像中的錯誤進行修改。如添加一個確定性的模糊操作,隨機噪聲等。
圖像復原技術主要是針對成像過程中的“退化”而提出來的,而成像過程中的“退化”現象主要指成像系統受到各種因素的影響,諸如成像系統的散焦、設備與物體間存在相對運動或者是器材的固有缺陷等,導致圖像的質量不能夠達到理想要求。圖像的復原和圖像的增強存在類似的地方,它也是為了提高圖像的整體質量。但是與圖像復原技術相比,圖像增強技術重在對比度的拉伸,其主要的目的在於根據觀看者得喜好來對圖像進行處理,提供給觀看者樂於接受的圖像,而圖像復原技術則是通過去模糊函式去除圖像中的模糊部分,還原圖像的本真。其主要採用的方式是同採用退化圖像的某種所謂的先驗知識來對已退化圖像進行修復或者是重建,就復原過程來看可以將之視為圖像退化的一個逆向過程。圖像的復原,首先要對圖像退化的整個過程加以適當的估計,在此基礎上建立近似的退化數學模型,之後還需要對模型進行適當的修正,以對退化過程出現的失真進行補償,以保證復原之後所得到的圖像趨近於原始圖像,實現圖像的最最佳化。但是在圖像退化模糊的過程中,噪聲與干擾同時存在,這給圖像的復原帶來了諸多的不確定性。
圖像重構
指若干局部圖像重構成一幅完整圖像的過程。
投影重建
利用X射線、超音波透過被遮擋物體(如人體內臟、地下礦體)的透視投影圖,計算恢復物體的斷層圖。利用斷層圖或直接從物體的二維透視投影圖重建物體的形狀。這種重建技術是通過某種射線的照射,射線在穿過組織時吸收不同,引起在成像面上投射強度的不同,反演求得組織內部分布的圖像。X光CT技術就是套用了這種重建,為醫學診斷提供了手段。投影重建還用於地礦探測,在探測井中,用超音波源發射超聲,用相關的儀器接收不同地層和礦體反射的超聲。按照超音波在媒質的透射率和反射規律,用有關技術得到的透射投影圖進行分析計算,即可恢復重建埋在地下的礦體形狀。
明暗恢復形狀
單張照片不含圖像中的深度信息,利用物體表面對光照的反射模型可以對圖像灰度數據進行分析計算恢復物體的形狀。
物體的成像是由於光源的分布、物體表面的形狀、反射特性,以及觀察者(照相機、攝像機)相對於物體的幾何位置等因素確定。用計算機圖形學方法可以生成不同觀察角度時的圖像。在計算機輔助設計中得到套用,可以演示設計物體從不同角度觀察的外形,如房屋建築、機械零件、服裝造型等。反過來的處理,則可以通過圖像中各個像素明暗程度,並且根據經驗假設光源的分布,物體表面的反射性質以及攝像時幾何位置,計算物體的三維形狀。這種重建方法計算複雜,計算量也相當大,目前主要用於遙感圖像中的地形重建中。
立體視覺重建
用兩個照相機(或攝像機)在左右兩邊對同一景物攝下兩幅照片(或攝像圖像),利用雙目成像的立體視覺模型恢復物體的形狀,提取物體的三維信息,也稱三維圖像重建。這種方法是對人類視覺的模仿。先從兩幅圖像提取出物體的邊沿線條、角點等特徵。物體的同一邊沿和角點由於立體視差在兩幅圖中的位置略有不同,經匹配處理找出兩幅圖中的對應線和對應點,經幾何坐標換算得到物體的形狀。主要套用於工業自動化和機器人領域,也用於地圖測繪。
雷射測距重建
套用掃描雷射對物體測距,獲得物體的三維數據,經過坐標換算,恢復物體的三維形狀數據。雷射測距的特點是準確。一種方法是固定雷射源,讓物體轉動,並作升降,就可以錄取物體在各個剖面的三維數據,重建物體在各個方向上的圖像。另一種方法是雷射源在一個錐形區域進行前視掃描.獲得前方物體的三維數據。這種方法在行走機器人中得到套用,可以發現前方障礙,計算出障礙的區域,繞道行走。圖像重建在通信領域也得到重要的套用,例如,利用圖像重建技術獲得非常直觀的無線電場強的三維空間分布圖像;通過極高壓縮比的人臉圖像傳輸用圖像重建技術可在接收端恢復原始人臉圖像。