運動分割

運動分割

運動分割是指在序列特徵多種運動中,標記出與每一獨立運動相關聯的像素,並對這些像素按照各自所屬的媒體對象進行聚類,其主要目的是從靜止背景之中提取出作為前景的運動物體。基於二維運動估計的運動分割是處理該問題的最常用的方法之一。

相關概念

簡介

運動分割是指在序列特徵多種運動中,標記出與每一獨立運動相關聯的像素,並對這些像素按照各自所屬的媒體對象進行聚類,其主要目的是從靜止背景之中提取出作為前景的運動物體。基於二維運動估計的運動分割是處理該問題的最常用的方法之一。這是因為大部分真實的圖像序列都包含有多種運動或多個運動物體,而由各種運動導出的光流場通常表現出非連續性

目前,對於運動分割算法的研究主要集中在變化檢測模板或靜態圖像的邊緣檢測與運動估計的結合等方法。

基於圖像時空梯度信息,結合靜態圖像的“分水嶺(watershed)”算法,提出了一種運動序列的自動分割方法;在對全局動動估計的基礎上,提出了基於變化檢測模板的方法和基於邊緣檢測的運動分割算法,該方法要求作為前景的運動目標必須具有豐富的紋理特徵。套用Bayes理論的最大後驗機率方法也是研究運動圖像分割問題的方法之一。還有一種光流估計與運動分割的同時處理算法。

背景問題

campus 視頻序列的運動分割效果 campus 視頻序列的運動分割效果

運動分割的難點在於對背景的判斷,包括消除噪聲運動區域、運動目標的陰影以及納入背景的物體3種假象前景。

對於背景的自適應問題,國內外學者作了大量的研究,總結國內外的研究成果,目前比較通用的方法可以分成3大類:混合高斯方法,非參數統計方法和最大可能性像素值的方法。限制前2種方法使用的最大問題是資源占用大,包括記憶體和處理器占用,越是精確的統計,越是需要更多的記憶體空間和處理器時間。最大可能性像素值方法運算速度快,但難以確定觀察時間,因為並不是觀察時間越長效果就越好,背景值往往與最近出現的觀察值更接近。

運動前景還可能包括目標的陰影,在實際套用中,考慮到速度的要求,大部分系統都不對陰影進行檢測,這都是建立在光線比較均勻分布的假設基礎上,但實際上陰影所造成的誤差往往會導致後續操作的錯誤。

運動分割方法

長程背景更新

背景往往不是靜止的,存在一些噪聲運動區域,特別是監控室外場景時,會遇到一些干擾運動物體,例如隨風擺動的樹木、閃爍的顯示器等。可進一步將檢測出的前景劃分為目標、陰影和鬼影(ghosts),鬼影即當背景發生變化時,由於背景更新不能消除該改變,從而導致一直誤認為是前景目標。當背景中的噪聲區域面積較大時,很難通過後面數學形態學進行處理,而建立複雜的模型估計每個像素值的分布會耗費大量的計算時間。實際上在一般場景中,大部分背景區域的像素點分布都遵從單高斯分布。綜合考慮以上問題,採用一種兩次背景更新的方法,背景更新屬於長時間操作(一般在150幀以上),用於檢測噪聲運動區域和鬼影,並通過像素值平均獲得長程背景。

短程背景更新

如果只採用長程背景更新,則背景像素的更新不能及時反映背景的變化,會導致檢測的誤差。當一個周期長程背景操作完成,噪聲運動區域以外的像素可以看作遵從單高斯分布,利用IIR濾波器方法對背景進行短程更新,即對每個像素的均值和方差進行更新。

陰影消除

利用像素的強度值(Intensityvalue)變化已經可以找到大部分陰影區域,但同時會將真實目標區域中的某些與背景顏色相近的區域也誤識為陰影。受到基於HSI顏色空間消除陰影算法的啟發,使用顏色向量與強度值相結合的方法來消除陰影,由於從RGB空間轉換成HSI運算量較大,因此不適合實時套用,應採用歸一化的RGB顏色空間。i=(R+G+B)/3為強度值,r=R/(R+G+B),g=G/(R+G+B),b=B/(R+G+B)為歸一化顏色值。

投影分割

由於場景中可能會出現多個目標,需要對各個目標所處的區域(通常是外界矩形)進行劃分,通常採用連通域標記的方法,如W系統。簡單起見採用一種基於投影的分割方法,可以取得較好的效果,同時投影所獲得信息還可以用於後面的目標輪廓分析。該方法進行3次投影,第1次對X軸進行投影,計算出X坐標範圍後,再在該範圍內對Y軸進行第2次投影,獲取連通區域的Y坐標範圍,此時再對該區域進行X軸投影,獲得連通區域的X坐標範圍,最終計算出連通區域的外接矩形坐標值。

人體運動分割

意義

人體運動包含著豐富而細緻的自然信息,現已廣泛套用於影視、動畫製作,以及各種體育運動項目的訓練、運動康復等相關領域。在人體運動捕獲的過程中,需要把人體運動的時間序列分割成有意義的動作單元以用於有特定語義的運動片段,進而對人體運動進行編排合成、識別及檢索等。

人體運動時間序列分割是十分重要又有意義的工作。人體運動序列是高維時間序列,通過分割可以在更高層次上描述時間序列,並使時間序列得到簡化,進而為時間序列建立索引、聚類和分類提供支持。另外,人體運動的合成需要不同的分割單元,合成的效果需要考慮合成後動作的連貫性,連貫性越好合成的效果越佳,人體運動的合成也需要對人體運動時間序列進行分割。

方法

目前,人們已提出許多人體運動時間序列分割方法,它們以不同的角度去研究人體運動的本質。例

如,考慮到不同的運動片段在時空上屬於不同的類,以聚類算法來揭示其運動本質;但此方法由於

時間序列本身具有時序性且往往不等長,因而分割效果並不好。還可用動態規整核拓展核Kmeans聚類算法得到聚類最佳化函式,並利用坐標下降法求解分割點,這種方法對分割起到了很好的效果;但由於坐標下降法對下降方向有所限制,故不能沿最優方向進行尋優,導致算法在疊代過程中收斂緩慢甚至不收斂。Barbic等從機率分布的角度入手,假設不同類服從不同的高斯分布,得到解決該問題的高斯混合模型,為了提高算法的效率,採用主成分分析對原始運動數據進行降維預處理,再用EM算法估計高斯混合模型所需要的參數;同時提出了基於PCA本徵維數的分割算法,考慮動作的變化必然導致數據本徵維數的變化來判定運動時間序列的分割點,但PCA等線性算法對非線性的人體運動數據很難奏效;他們還提出了基於機率主成分分析的分割方法。此外,採用聚類的方法對運動序列進行分割;但聚類的分割方法破壞了原序列的時序性,同時數值相似的幀不一定有時序的相似性。Sakamoto等利用SOM建立姿態空間,抽取動作單元開始及結束的姿態尋找分割點;但該方法不能反映人體運動的動力學特徵,無法處理速度不同的動作片段。

關鍵

對人體運動序列進行分割的關鍵是尋找不同動作之間的分割特徵。分割點的尋找是一個複雜的問題,同樣的運動序列在不同的環境背景下可能會得到不同的分割結果。

相關詞條

熱門詞條

聯絡我們