基本簡介
數字圖像處理技術是一個跨學科的領域。隨著計算機科學技術的不斷發展,圖像處理和分析逐漸形成了自己的科學體系,新的處理方法層出不窮,儘管其發展歷史不長,但卻引起各方面人士的廣泛關注。首先,視覺是人類最重要的感知手段,圖像又是視覺的基礎,因此,數字圖像成為心理學、生理學、計算機科學等諸多領域內的學者們研究視覺感知的有效工具。其次,圖像處理在軍事、遙感、氣象等大型套用中有不斷增長的需求。
1998年以來,人工神經網路識別技術已經引起了廣泛的關注,並且套用於圖像分割。基於神經網路的分割方法的基本思想是通過訓練多層感知機來得到線性決策函式,然後用決策函式對像素進行分類來達到分割的目的。這種方法需要大量的訓練數據。神經網路存在巨量的連線,容易引入空間信息,能較好地解決圖像中的噪聲和不均勻問題。選擇何種網路結構是這種方法要解決的主要問題。
圖像分割是圖像識別和計算機視覺至關重要的預處理。沒有正確的分割就不可能有正確的識別。但是,進行分割僅有的依據是圖像中像素的亮度及顏色,由計算機自動處理分割時,將會遇到各種困難。例如,光照不均勻、噪聲的影響、圖像中存在不清晰的部分,以及陰影等,常常發生分割錯誤。因此圖像分割是需要進一步研究的技術。人們希望引入一些人為的知識導向和人工智慧的方法,用於糾正某些分割中的錯誤,是很有前途的方法,但是這又增加了解決問題的複雜性。
在通信領域中,圖像分割技術對可視電話等活動圖像的傳輸很重要,需要把圖像中活動部分與靜止的背景分開,還要把活動部分中位移量不同的區域分開,對不同運動量的區域用不同的編碼傳輸,以降低傳輸所需的碼率。
分割方法
閾值分割
灰度閾值分割法是一種最常用的並行區域技術,它是圖像分割中套用數量最多的一類。閾值分割方法實際上是輸入圖像f到輸出圖像g的如下變換:
其中,T為閾值,對於物體的圖像元素g(i,j)=1,對於背景的圖像元素g(i,j)=0。
由此可見,閾值分割算法的關鍵是確定閾值,如果能確定一個合適的閾值就可準確地將圖像分割開來。閾值確定後,將閾值與像素點的灰度值逐個進行比較,而且像素分割可對各像素並行地進行,分割的結果直接給出圖像區域。
閾值分割的優點是計算簡單、運算效率較高、速度快。在重視運算效率的套用場合(如用於硬體實現),它得到了廣泛套用。
人們發展了各種各樣的閾值處理技術,包括全局閾值、自適應閾值、最佳閾值等等。
全局閾值是指整幅圖像使用同一個閾值做分割處理,適用於背景和前景有明顯對比的圖像。它是根據整幅圖像確定的:T=T(f)。但是這種方法只考慮像素本身的灰度值,一般不考慮空間特徵,因而對噪聲很敏感。常用的全局閾值選取方法有利用圖像灰度直方圖的峰谷法、最小誤差法、最大類間方差法、最大熵自動閾值法以及其它一些方法。
在許多情況下,物體和背景的對比度在圖像中的各處不是一樣的,這時很難用一個統一的閾值將物體與背景分開。這時可以根據圖像的局部特徵分別採用不同的閾值進行分割。實際處理時,需要按照具體問題將圖像分成若干子區域分別選擇閾值,或者動態地根據一定的鄰域範圍選擇每點處的閾值,進行圖像分割。這時的閾值為自適應閾值。
閾值的選擇需要根據具體問題來確定,一般通過實驗來確定。對於給定的圖像,可以通過分析直方圖的方法確定最佳的閾值,例如當直方圖明顯呈現雙峰情況時,可以選擇兩個峰值的中點作為最佳閾值。
區域分割
區域生長和分裂合併法是兩種典型的串列區域技術,其分割過程後續步驟的處理要根據前面步驟的結果進行判斷而確定。
區域生長
區域生長的基本思想是將具有相似性質的像素集合起來構成區域。具體先對每個需要分割的區域找一個種子像素作為生長的起點,然後
區域生長需要選擇一組能正確代表所需區域的種子像素,確定在生長過程中的相似性準則,制定讓生長停止的條件或準則。相似性準則可以是灰度級、彩色、紋理、梯度等特性。選取的種子像素可以是單個像素,也可以是包含若干個像素的小區域。大部分區域生長準則使用圖像的局部性質。生長準則可根據不同原則制定,而使用不同的生長準則會影響區域生長的過程。圖2腦部圖像和區域生長法分割的結果區域生長法的優點是計算簡單,對於較均勻的連通目標有較好的分割效果。它的缺點是需要人為確定種子點,對噪聲敏感,可能導致區域內有空洞。另外,它是一種串列算法,當目標較大時,分割速度較慢,因此在設計算法時,要儘量提高效率。
分裂合併
區域生長是從某個或者某些像素點出發,最後得到整個區域,進而實現目標提取。分裂合併差不多是區域生長的逆過程:從整個圖像出發,不斷分裂得到各個子區域,然後再把前景區域合併,實現目標提取。分裂合併的假設是對於一幅圖像,前景區域由一些相互連通的像素組成的,因此,如果把一幅圖像分裂到像素級,那么就可以判定該像素是否為前景像素。當所有像素點或者子區域完成判斷以後,把前景區域或者像素合併就可得到前景目標。
在這類方法中,最常用的方法是四叉樹分解法(如圖3所示)。設R代表整個正方形圖像區域,P代表邏輯謂詞。基本分裂合併算法步驟如下:圖3四叉樹分割後的圖像(1)對任一個區域,如果H(Ri)=FALSE就將其分裂成不重疊的四等份;
(2)對相鄰的兩個區域Ri和Rj,它們也可以大小不同(即不在同一層),如果條件H(Ri∪Rj)=TRUE滿足,就將它們合併起來。
(3)如果進一步的分裂或合併都不可能,則結束。
分裂合併法的關鍵是分裂合併準則的設計。這種方法對複雜圖像的分割效果較好,但算法較複雜,計算量大,分裂還可能破壞區域的邊界。
邊緣分割
圖像分割的一種重要途徑是通過邊緣檢測,即檢測灰度級或者結構具有突變的地方,表明一個區域的終結,也是另一個區域開始的地方。這種不連續性稱為邊緣。不同的圖像灰度不同,邊界處一般有明顯的邊緣,利用此特徵可以分割圖像。
圖像中邊緣處像素的灰度值不連續,這種不連續性可通過求導數來檢測到。對於階躍狀邊緣,其位置對應一階導數的極值點,對應二階導數的過零點(零交叉點)。因此常用微分運算元進行邊緣檢測。常用的一階微分運算元有Roberts運算元、Prewitt運算元和Sobel運算元,二階微分運算元有Laplace運算元和Kirsh運算元等。在實際中各種微分運算元常用小區域模板來表示,微分運算是利用模板和圖像卷積來實現。這些運算元對噪聲敏感,只適合於噪聲較小不太複雜的圖像。
由於邊緣和噪聲都是灰度不連續點,在頻域均為高頻分量,直接採用微分運算難以克服噪聲的影響。因此用微分運算元檢測邊緣前要對圖像進行平滑濾波。LoG運算元和Canny運算元是具有平滑功能的二階和一階微分運算元,邊緣檢測效果較好,如圖4所示。其中loG運算元是採用Laplacian運算元求高斯函式的二階導數,Canny運算元是高斯函式的一階導數,它在噪聲抑制和邊緣檢測之間取得了較好的平衡。
直方圖法
與其他圖像分割方法相比,基於直方圖的方法是非常有效的圖像分割方法,因為他們通常只需要一個通過像素。在這種方法中,直方圖是從圖像中的像素的計算,並在直方圖的波峰和波谷是用於定點陣圖像中的簇。顏色和強度可以作為衡量。
這種技術的一種改進是遞歸套用直方圖求法的集群中的形象以分成更小的簇。重複此操作,使用更小的簇直到沒有更多的集群的形成。
基於直方圖的方法也能很快適應於多個幀,同時保持他們的單通效率。直方圖可以在多個幀被考慮的時候採取多種方式。同樣的方法是採取一個框架可以套用到多個,和之後的結果合併,山峰和山谷在以前很難識別,但現在更容易區分。直方圖也可以套用於每一個像素的基礎上,將得到的信息被用來確定的像素點的位置最常見的顏色。這種方法部分基於主動對象和一個靜態的環境,導致在不同類型的視頻分割提供跟蹤。
特定理論
圖像分割至今尚無通用的自身理論。隨著各學科許多新理論和新方法的提出,出現了許多與一些特定理論、方法相結合的圖像分割方法。
聚類分析
特徵空間聚類法進行圖像分割是將圖像空間中的像素用對應的特徵空間點表示,根據它們在特徵空間的聚集對特徵空間進行分割,然後將它們映射回原圖像空間,得到分割結果。其中,K均值、模糊C均值聚類(FCM)算法是最常用的聚類算法。K均值算法先選K個初始類均值,然後將每個像素歸入均值離它最近的類並計算新的類均值。疊代執行前面的步驟直到新舊類均值之差小於某一閾值。模糊C均值算法是在模糊數學基礎上對K均值算法的推廣,是通過最最佳化一個模糊目標函式實現聚類,它不像K均值聚類那樣認為每個點只能屬於某一類,而是賦予每個點一個對各類的隸屬度,用隸屬度更好地描述邊緣像素亦此亦彼的特點,適合處理事物內在的不確定性。利用模糊C均值(FCM)非監督模糊聚類標定的特點進行圖像分割,可以減少人為的干預,且較適合圖像中存在不確定性和模糊性的特點。
FCM算法對初始參數極為敏感,有時需要人工干預參數的初始化以接近全局最優解,提高分割速度。另外,傳統FCM算法沒有考慮空間信息,對噪聲和灰度不均勻敏感。
模糊理論
模糊集理論具有描述事物不確定性的能力,適合於圖像分割問題。1998年以來,出現了許多模糊分割技術,在圖像分割中的套用日益廣泛。模糊技術在圖像分割中套用的一個顯著特點就是它能和現有的許多圖像分割方法相結合,形成一系列的集成模糊分割技術,例如模糊聚類、模糊閾值、模糊邊緣檢測技術等。
模糊閾值技術利用不同的S型隸屬函式來定義模糊目標,通過最佳化過程最後選擇一個具有最小不確定性的S函式。用該函式增強目標及屬於該目標的像素之間的關係,這樣得到的S型函式的交叉點為閾值分割需要的閾值,這種方法的困難在於隸屬函式的選擇。基於模糊集合和邏輯的分割方法是以模糊數學為基礎,利用隸屬圖像中由於信息不全面、不準確、含糊、矛盾等造成的不確定性問題。該方法在醫學圖像分析中有廣泛的套用,如薛景浩等人提出的一種新的基於圖像間模糊散度的閾值化算法以及它在多閾值選擇中的推廣算法,採用了模糊集合分別表達分割前後的圖像,通過最小模糊散度準則來實現圖像分割中最優閾值的自動提取。該算法針對圖像閾值化分割的要求構造了一種新的模糊隸屬度函式,克服了傳統S函式頻寬對分割效果的影響,有很好的通用性和有效性,方案能夠快速正確地實現分割,且不需事先認定分割類數。實驗結果令人滿意。
基因編碼
把圖像背景和目標像素用不同的基因編碼表示,通過區域性的劃分,把圖像背景和目標分離出來,具有處理速度快的優點,但算法實現起來比較難。
小波變換
小波變換是2002年來得到了廣泛套用的數學工具,它在時域和頻域都具有良好的局部化性質,而且小波變換具有多尺度特性,能夠在不同尺度上對信號進行分析,因此在圖像處理和分析等許多方面得到套用。
小波變換的分割方法
基於小波變換的閾值圖像分割方法的基本思想是首先由二進小波變換將圖像的直方圖分解為不同層次的小波係數,然後依據給定的分割準則和小波係數選擇閾值門限,最後利用閾值標出圖像分割的區域。整個分割過程是從粗到細,有尺度變化來控制,即起始分割由粗略的L2(R)子空間上投影的直方圖來實現,如果分割不理想,則利用直方圖在精細的子空間上的小波係數逐步細化圖像分割。分割算法的計算饋與圖像尺寸大小呈線性變化。
套用領域
1.機器視覺
2.人臉識別
3.指紋識別
4.交通控制系統
5.在衛星圖像中定位物體(道路、森林等)
6.行人檢測
7.醫學影像,包括:腫瘤和其他病理的定位、組織體積的測量、計算機引導的手術、診斷治療方案的定製、解剖學結構的研究等
總結展望
對圖像分割算法的研究已有幾十年的歷史,藉助各種理論至今已提出了上千種各種類型的分割算法。儘管人們在圖像分割方面做了許多研究工作。但由於尚無通用分割理論,因此現已提出的分割算法大都是針對具體問題的,並沒有一種適合於所有圖像的通用的分割算法。但是可以看出,圖像分割方法正朝著更快速、更精確的方向發展,通過各種新理論和新技術結合將不斷取得突破和進展。