基於模型方法
基於模型的方法通常利用物體的幾何關係或者物體的特徵點來估計。
其基本思想是利用某種幾何模型或結構來表示物體的結構和形狀,並通過提取某些物體特徵,在模型和圖像之間建立起對應關係,然後通過幾何或者其它方法實現物體空間姿態的估計。這裡所使用的模型既可能是簡單的幾何形體,如平面、圓柱,也可能是某種幾何結構,也可能是通過雷射掃描或其它方法獲得的三維模型。
基於模型的姿態估計方法是通過比對真實圖像和合成圖像,進行相似度計算更新物體姿態。目前基於模型的方法為了避免在全局狀態空間中進行最佳化搜尋,一般都將最佳化問題先降解成多個局部特徵的匹配問題,非常依賴於局部特徵的準確檢測。當噪聲較大無法提取準確的局部特徵的時候,該方法的魯棒性受到很大影響。
基於學習方法
基於學習的方法藉助於機器學習(machine learning)方法,從事先獲取的不同姿態下的訓練樣本中學習二維觀測與三維姿態之間的對應關係,並將學習得到的決策規則或回歸函式套用於樣本,所得結果作為對樣本的姿態估計。
基於學習的方法一般採用全局觀測特徵,不需檢測或識別物體的局部特徵,具有較好的魯棒性。其缺點是由於無法獲取在高維空間中進行連續估計所需要的密集採樣,因此無法保證姿態估計的精度與連續性。
基於學習的姿態估計方法源於姿態識別方法的思想。姿態識別需要預先定義多個姿態類別,每個類別包含了一定的姿態範圍;然後為每個姿態類別標註若干訓練樣本,通過模式分類的方法訓練姿態分類器以實現姿態識別。
這一類方法並不需要對物體進行建模,一般通過圖像的全局特徵進行匹配分析,可以有效的避免局部特徵方法在複雜姿態和遮擋關係情況下出現的特徵匹配歧義性問題。然而姿態識別方法只能將姿態劃分到事先定義的幾個姿態類別中,並不能對姿態進行連續的精確的估計。
基於學習的方法一般採用全局觀測特徵,可以保證算法具有較好的魯棒性。然而這一類方法的姿態估計精度很大程度依賴於訓練的充分程度。要想比較精確地得到二維觀測與三維姿態之間的對應關係,就必須獲取足夠密集的樣本來學習決策規則和回歸函式。而一般來說所需要樣本的數量是隨狀態空間的維度指數級增加的,對於高維狀態空間,事實上不可能獲取進行精確估計所需要的密集採樣。因此,無法得到密集採樣而難以保證估計的精度與連續性,是基於學習的姿態估計方法無法克服的根本困難。
姿態估計輸出
和姿態識別等典型的模式分類問題不同的是,姿態估計輸出的是一個高維的姿態向量,而不是某個類別的類標。因此這一類方法需要學習的是一個從高維觀測向量到高維姿態向量的映射,目前這在機器學習領域中還是一個非常困難的問題。