種類
基於分布統計的描述運算元
基於分布統計的描述運算元使用直方圖表現圖像的不同外觀或形狀特點下面,下面為幾種套用比較廣泛的基於分布統計的描述運算元。
1.SIFT描述運算元:可以用來描述任意的歸一化後的圖像區域,是一個3D梯度位置方向直方圖,位置被量化到4×4局部柵格,梯度角度分為8個方向,運算元為4×4×8=128維。
2.GLOH (Gradient location-orientation histogram)描述運算元:GLOH是SIFT描述子的一種延伸,為了增強其魯棒性和獨立性。以對數極坐標在半徑方向建立三個帶(6,11,15)和8個角度方向,形成17個位置帶,中心帶在半徑方向不分塊。梯度方向量化為16個帶,形成272維矢量,並利用PCA降維。
3.Shape context描述運算元:與SIFT描述運算元相似,但是基於邊緣 Shape context是一個邊緣點位置和方向的3D直方圖,以對數極坐標在半徑方向建立三個帶(6,11,15)和4個角度方向,生成36維描述子。
4.Geometric histogram描述運算元:在一個區域內描述邊緣分布直方圖。
5.PCA-SIFT描述運算元:以特徵點周圍39×39像素塊形成3024維矢量,用PCA降維36維。
6.Spin image描述運算元:是一個量化像素位置和強度的直方圖 ,在5個圓環中計算10個強度帶,生成50維運算元。
7.Steerable filters and differential invariants:是使用與高斯卷積後的導數。
基於矩的描述運算元
針對於一幅圖像,我們把像素的坐標看成是一個二維隨機變數(X,Y),那么一幅灰度圖像可以用二維灰度密度函式來表示,因此可以用矩來描述灰度圖像的特徵。矩和不變矩是一種常用的局部圖像運算元。矩特徵主要表征了圖像區域的幾何特徵,又稱為幾何矩, 由於其具有旋轉、平移、尺度等特性的不變特徵,所以又稱其為不變矩。它是一處高度濃縮的圖像特徵。
基於濾波器的描述運算元
Koenderink 和 VanDoorn 提出利用"local jet"建模人類視覺系統的感應域,後來該描述方法被Schmid和Mohr用來描述圖像區域。該描述算法基本思想是通過對待描述圖像區域與高斯函式的各階導數實施卷積運算而得到待描述區域的量化表示。
Schaffalitzky和Zisserman利用複數濾波器進行圖像表示。該描述子首先對待描述圖像區域進行變換,以達到對光照和仿射具備一定的不變性,然後,在處理後的局部圖像區域上使用濾波器組濾波。除了上面提到的各濾波器,還有其他很多基於濾波器的圖像區域內容表示方法,如Schaffalitzky和Zisserman提出了複數濾波器圖像區域描述子。這些特徵對圖像內容的幾何形變以及一維仿射變換,都具有很好的魯棒性。
微分運算元
一階微分邊緣運算元,經典運算元比如:Roberts(羅伯特)、Prewitt(普魯伊特)、Sobel(索貝爾),Canny(坎尼)等,二階微分邊緣運算元,LOG邊緣檢測運算元。
1.Sobel運算元
其主要用於邊緣檢測,在技術上它是以離散型的差分運算元,用來運算圖像亮度函式的梯度的近似值,缺點是Sobel運算元並沒有將圖像的主題與背景嚴格地區分開來,換言之就是Sobel運算元並沒有基於圖像灰度進行處理,由於Sobel運算元並沒有嚴格地模擬人的視覺生理特徵,所以提取的圖像輪廓有時並不能令人滿意,算法具體實現很簡單,就是3*3的兩個不同方向上的模板運算,這裡不再寫出。
2.Robert運算元
根據任一相互垂直方向上的差分都用來估計梯度,Robert運算元採用對角方向相鄰像素之差
3.Prewitt運算元
該運算元與Sobel運算元類似,只是權值有所變化,但兩者實現起來功能還是有差距的,據經驗得知Sobel要比Prewitt更能準確檢測圖像邊緣。
4.Canny運算元
該運算元功能比前面幾種都要好,但是它實現起來較為麻煩,Canny運算元是一個具有濾波,增強,檢測的多階段的最佳化運算元,在進行處理前,Canny運算元先利用高斯平滑濾波器來平滑圖像以除去噪聲,Canny分割算法採用一階偏導的有限差分來計算梯度幅值和方向,在處理過程中,Canny運算元還將經過一個非極大值抑制的過程,最後Canny運算元還採用兩個閾值來連線邊緣。
5.Laplacian運算元
拉普拉斯運算元是一種二階微分運算元,若只考慮邊緣點的位置而不考慮周圍的灰度差時可用該運算元進行檢測。對於階躍狀邊緣,其二階導數在邊緣點出現零交叉,並且邊緣點兩旁的像素的二階導數異號。
6.LoG運算元
也就是 Laplace of Gaussian function(高斯拉普拉斯函式)。常用於數字圖像的邊緣提取和二值化。LoG 運算元源於D.Marr計算視覺理論中提出的邊緣提取思想, 即首先對原始圖像進行最佳平滑處理, 最大程度地抑制噪聲, 再對平滑後的圖像求取邊緣。
發展現狀及趨勢
局部圖像處理運算元的提取通常是作為計算機視覺與數字圖像處理中許多問題的第一步,例如圖像分類、圖像檢索、寬基線匹配等,提取特徵的優劣直接影響任務的最終性能。因此,局部特徵提取方法具有重要的研究價值。然而,圖像經常發生尺度、平移、旋轉、光照、視角以及模糊等變化,特別是在實際套用場景中,圖像不可避免的會存在較大噪聲干擾、複雜背景和較大的目標姿態變化。這就給圖像局部特徵提取問題帶來了更大的挑戰。因此,局部圖像運算元研究仍然具有重要的理論意義和套用價值,值得研究者繼續關注。