簡介
對象圖像分割是指對研究對象的圖像數據進行圖像分割。不同的領域,圖像的內容是不同,所以要採用圖像分割方法一般是不同。但主要目的是相同的即採用有關圖像分割方法分割出圖像重要的區域特徵,用於分析。很多領域都屬於對象圖像分割,例如遙感氣象服務, 醫學影像分析, 軍事研究領域、 交通圖像分析、 圖像壓縮、 圖像檢索等。
圖像分割
圖像分割即將圖像分成具有各自特性的同質區域並提取出感興趣目標物體的技術和過程,它是圖像處理到圖像分析的關鍵步驟,是圖像處理和機器人視覺領域的基本問題之一。圖論是套用數學的一個分支, 主要以圖為研究對象, 與圖像之間有很好的映射關係, 近年來使用圖論中許多成熟的理論和數學工具進行圖像分割已成為圖像分割領域研究的熱點。其主要思想是將待分割圖像映射為加權圖, 圖像的像素構成圖的頂點集, 其特徵信息(灰度、 顏色等)對應每個頂點的屬性, 像素之間的相鄰關係對應圖的邊集, 邊的權值對應像素之間的相似性或差異性。將圖像映射為圖後, 圖像分割過程可以看作是根據像素的特徵信息, 對每一個像素分配標記的過程,相同特性的像素具有相同的標記, 不同特性的像素具有不同的標記。圖像分割的結果是圖像上子區域的集合(這些子區域的全體覆蓋了整個圖像),或是從圖像中提取的輪廓線的集合(例如邊緣檢測)。一個子區域中的每個像素在某種特性的度量下或是由計算得出的特性都是相似的,例如顏色、亮度、紋理。鄰接區域在某種特性的度量下有很大的不同 。
對象圖像分割兩種策略
1) 根據圖像灰度值的相似性或同質性將圖像劃分為區域,目標物體通過部分區域的合併產生,例如閾值法、 聚類法、區域分離以及區域融合等。
2) 根據圖像灰度值的不連續性和突變性尋找目標物體或其輪廓的位置,根據該位置進行空間上的延伸,即通過檢測圖像的特徵點、線、面進行圖像分割,例如邊緣檢測法。
聚類方法
K-均值聚類法是一種將圖像分割成K個聚類的疊代技術。基本算法如下:
首先從n個數據對象任意選擇 k 個對象作為初始聚類中心;
對於所剩下其它對象,則根據它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;
然後再計算每個所獲新聚類的聚類中心(該聚類中所有對象的均值);
重複第2和3步驟,直至收斂(聚類不再發生變化)。
這裡,距離指像素與聚類中心之間絕對偏差或偏差的平方。偏差通常用像素顏色、亮度、紋理、位置,或它們的加權組合。K值可以手動選取、隨機選取、或其它方式得到。此算法保證收斂,但它可能不會返回最佳的解決方案。該解決方案的質量取決於最初的一組集群和K值。
基於區域的圖像分割方法
基於區域的分割方法是以直接尋找區域為基礎的分割技術,具體算法有區域生長和區域分離與合併算法 。基於區域提取方法有兩種基本形式 :一種是區域生長,從單個像素出發,逐步合併以形成所需要的分割區域 ;另一種是從全局出發,逐步切割至所需的分割區域 。在實際中使用的通常是這兩種基本形式的結合 。該類算法對某些複雜物體定義的複雜場景的分割或者對某些自然景物的分割等類似先驗知識不足的圖像分割 ,效果較理想 。
基於邊緣的圖像分割方法
基於邊緣檢測的分割方法試圖通過檢測不同區域的邊緣來解決問題,通常不同的區域之間的邊緣上灰度值的變化往往比較大,這是邊緣檢測方法得以實現的主要假設之一。它的基本思想是先檢測圖像中的邊緣點,再按一定策略連線成輪廓,從而構成分割區域。其難點在於邊緣檢測時抗噪性和檢測精度的矛盾,若提高檢測精度則噪聲產生的偽邊緣會導致不合理的輪廓;若提高抗噪性則會產生輪廓漏檢和位置偏差。邊緣與區域相結合的圖像分割方法。邊緣檢測能夠獲得灰度值的局部變化強度,而區域分割能夠檢測特徵的相似性與均勻性 。邊緣與區域相結合分割的主要思想是結合二者的優點,通過邊緣點的限制,避免區域的過分割;同時,通過區域分割補充漏檢的邊緣,使輪廓更加完整 。
基於圖論的圖像分割方法
基於圖論的圖像分割技術是近年來國際上圖像分割領域的一個新的研究熱點。該方法將圖像映射為帶權無向圖,把像素視作節點,利用最小剪下準則得到圖像的最佳分割。該方法本質上將圖像分割問題轉化為最最佳化問題,是一種點對聚類方法,對數據聚類也具有很好的套用前景。目前,基於圖論的圖像分割方法的研究主要集中在以下幾個方面:( 1)最優剪下準則的設計;( 2)譜方法用於分割;( 3)快速算法的設計等。 基於圖論的圖像分割方法的基本原理如下:令 G=( V, E)表示一個無向圖 , 其中節點 v i ∈ V 表示圖像像素, 邊( v i ,v j ) ∈ E 連線節點v i 和 v j 。每條邊有一個相應的非負權重 w( v i ,v j ),表示相鄰節點 v i 和 v j 的不相似度。在圖像分割中,邊的權重表示兩個像素間的不相似性度量,如灰度、顏色 、運動 、位置或其它局部分布的差別。
基於神經網路的圖像分割方法
20 世紀 80 年代後期,受到人工智慧發展的影響 ,出現了基於神經網路的的圖像分割技術 。利用神經網路進行圖像分割,其基本思想是用訓練樣本集對神經網路進行訓練以確定節點間的連線權值,再用訓練好的神經網路對新輸入的圖像數據進行分割。由於神經網路具有可並行計算、自學習等和便於硬體實現等特性,所以它比傳統方法有更大的潛力,其理論及套用探討引起了學術界學者的重視,並提出了基於各種神經網路模型的圖像分割方法。根據相應類型的圖像,可以選用Hopfield 神經網路 、BP 神經網路 、振子神經網路 、細胞神經網路、機率自適應神經網路、自組織神經網路、脈衝耦合神經網路、徑向基神經網路和 Kohonen 神經網路等。其中 ,基於脈衝耦合神經網路( Pulse Coupled Neural Network ,PCNN) 的圖像分割方法成為近年來的關注熱點。
圖像語義分割方法
聚類方法可以將圖像分割成大小均勻、緊湊度合適的超像素塊,為後續的處理任務提供基礎。但在實際場景的圖片中,一些物體的結構比較複雜,內部差異性較大,僅利用像素點的顏色、亮度、紋理等較低層次的內容信息不足以生成好的分割效果,容易產生錯誤的分割 。因此 ,需要更多地結合圖像提供的中高層內容信息輔助圖像分割,稱為圖像語義分割 。語義分割的概念最早由 Ohta 等人於 1978 年提出,其定義為:為圖像中每個像素分配一個預先定義的表示其語義目標類別的標籤。語義分割的方法分為兩種: 一種是自頂向下 (top-down) 的方法,即,使用物體形狀模型在待分割圖像中做匹配搜尋,由於每種物體的形狀可變性非常大,這種方法的效果和適應性不佳;另一種是自底向上 (bottom-up) 的方法,這類方法無需物體形狀的先驗知識,首先從圖中生成區域假設 (region hypotheses) 或候選區域 (region candidates),然後對候選區域進行分類打分並預測。這種方法的主要問題是缺乏能夠生成高質量候選區域的算法,因此最初採用在物體檢測中的滑動視窗方法生成候選區域 , 這種方法相當費時費力,而且無法描述不規則形狀的物。2010 年 ,Carreira 等人提出的 CPMC(constrained parametric min-cuts) 算法能夠在圖像中生成高質量的候選區域。使自底向上的方法得到了長足的發展 。
發展趨勢
進一步提高算法的性能
現有的多數圖像分割算法只能針對某一類圖像或者已經進行初步分類的圖像庫,其效率不高 ,也不具有通用性。為此,可以通過多種特徵的融合( 原始灰度特徵 、梯度特徵 、幾何空間特徵 、變換特徵和統計特徵等)和多種分割方法的結合兩個方面來提高現有算法的效率和通用性。
新理論與新方法的研究
新的分割方法的研究主要以自動、精確、快速、自適應和魯棒性等幾個方向作為研究目標 . 隨著圖像分割研究不斷深入,圖像分割方法將向更快速、更精確的方向發展,圖像分割方法的研究需要與新理論 、新工具和新技術結合起來才能有所突破和創新 。
面向專門領域的套用
目前,隨著圖像分割在醫學、遙感、電子商務、專利檢索和建築設計等領域得到了廣泛套用 ,人們不斷尋找新的理論和方法來提高圖像分割的效果。隨著不同學科研究人員對圖像分割的日益關注,新的理論和方法會不斷套用到更多領域中去。