分層圖像表示

分層圖像表示,顧名思義,是分層來表示圖像,使用一些分層數據結構來表示圖像,其目的是提高處理速度。金字塔和四叉樹是兩種典型的圖像的分層數據結構。

背景

計算機視覺在本質上式計算代價十分昂貴的,僅考慮所需處理的巨大數據就會得出這個結論。因為我們想要實現視頻或互動性的系統,所以期望得到非常快的回響。一種方法是使用並行計算機(強力)。不幸的是,很多計算機視覺問題都很難在多處理機間分配計算負擔,或者根本無法分解。分層數據結構使得使用一些特殊算法成為可能,這些算法在相對小的數據量的基礎上決定處理策略。它們使用知識而不是強力來減輕計算負擔,並提高處理速度,只對圖像的實質部分才在最精細的解析度上工作。

金字塔和四叉樹是兩種典型的圖像的分層數據結構。

金字塔

金字塔屬於最簡單的分層數據結構,主要存在有兩種結構:M型金字塔(M-pyramids,矩陣型金字塔)和T型金字塔(T-pyramids,樹型金字塔)。

M型金字塔

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

M型金字塔是一個圖像序列 ,其中, 是具有與原圖像同樣的解析度和元素的圖像, 是 降低一半解析度得到的圖像。當創建金字時,通常只考慮維數時2的冪的方陣,這時, 則僅對應於一個像素。

當需要對圖像的不同解析度同時進行處理時,可採用M型金字塔。解析度每降低一層,數據量則減少4倍,因而處理速度差不多也提高4倍。

T型金字塔

通常同時使用幾個解析度比僅使用M型金字塔中的一個圖像要優越。對於這類算法,一般更喜歡用T型金字塔,樹狀結構。

分層圖像表示 分層圖像表示

設是原始圖像的大小(最高解析度),T型金字塔計算如下:

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

1)一個結點集合,使得級別 ;

分層圖像表示 分層圖像表示

2)一個映射 F,定義在金字塔的結點之間,

分層圖像表示 分層圖像表示

其中,div表示整除

分層圖像表示 分層圖像表示

3)一個函式 V ,將金字塔的結點P映射到Z,其中,Z是對應於亮度級別數的所有數的子集合,例如, 。

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

對於給定的k,T型金字塔的結點對應於M型金字塔的一些圖像點,結點集合的每個元素對應M型金字塔的一個矩陣,稱k 為金字塔的層數。對於給定的k ,圖像構成金字塔第 k 層的一個圖像。F是父親映射,在T型金字塔中,除了根(0,0,0)之外的所有結點都有定義。除了葉子結點外,T型金字塔的每個結點都有4個子結點;葉子結點是第L層的結點,對應於圖像的單個像素。

分層圖像表示 分層圖像表示

T型金字塔單個結點的數值由函式V定義。葉子結點的值就是原始圖像在最高解析度下的圖像函式的值(亮度),圖像的尺度是。樹的其他層結點的數值或者四個子結點的算術平方根,或者由粗採樣定義的值,意味著使用的是一個子結點的值(比如,左上)

圖1 T型金字塔 圖1 T型金字塔

M型金字塔存儲所有圖像矩陣所需要的像素的個數為:

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

其中,N 是原始矩陣(最高解析度的圖像),通常是2的冪。

T 型金字塔夫人存儲表示與M型金字塔相似。樹的弧不必存儲,這是因為由於其結構的規範性,樹的子結點和父結點的地址都很容易計算出來。

四叉樹

四叉樹是對T型金字塔的改進,除葉子結點外,每個結點由4個子結點。與T型金字塔相似,在每個層次圖像被分解為4個象限,但無須在所有層次上保留結點。如果父節點有4個具有相同值(亮度)的子結點,則無須保留這些子結點。對於具有大的均勻區域的圖像來說,這種表示比較節省。

圖2    四叉樹的內部結構 圖2 四叉樹的內部結構

用四叉樹來表示圖像的優點是,對於圖像相加、物體面積計算和統計矩計算存在簡單的算法。四叉樹和金字塔分層表示的主要缺點是,它們依賴於物體的位置、方向和相對大小。兩個僅有微小差別的相似圖像可能會具有非常不同的金字塔或四叉樹表示。甚至,當兩個圖像描述的是完全相同而只是略微移動了的景物時,也可能產生完全不同的表示。

這些缺點在使用規範的形狀四叉樹時可以避免,這時我們並不給整個圖像建立四叉樹,而是給一個個物體建立四叉樹。這種表示要用到物體的幾何特徵包括質心和主軸,首先得到每個物體的質心和主軸,然後找到中心在質心而邊平行於主軸的最小外接矩形。最後將這個矩形(子圖象)用四叉樹來表示。用規範的形狀四叉樹和若干附加的數據項(質心的坐標、主軸的角度)表示的物體具有平移、旋轉和尺度不變性。

四叉樹已有廣泛的用途,特別是在地理信息系統領域,與其在三維空間中的推廣“八叉樹”一起,在迭層數據的分層表示方面已被證明是十分有用的。

其它金字塔結構

金字塔結構使用非常廣泛,有幾個擴展和修正。

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

一個簡單的M型金字塔是一個圖像序列,其中, 是 的2×2縮影。定義“縮影視窗”的概念,對於 的每個單元c ,它的縮影視窗 是它在 中的孩子的集合。在這裡,一個單元 c 是圖像 在相應金字塔解析度層次下任何單獨的元素。如果圖像的創建方式使得所有的內部單元都具有相同數目的鄰居,而且,它們具有相同數目的孩子,那么這樣的金字塔就是規範的。

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

可以用縮影視窗和“縮影因子”來建立規範金字塔的分類標準,縮影因子定義了層間的圖像區域的降低比率:

分層圖像表示 分層圖像表示
分層圖像表示 分層圖像表示

在最簡單的情況下,縮影視窗是2×2的且互不重疊,此時。若選擇讓縮影視窗有重疊,縮影因子就會降低。表征規範金字塔的符號是(“縮影視窗”)/(“縮影因子”)

相關詞條

熱門詞條

聯絡我們