對象檢測

對象檢測

對象檢測是指利用圖像處理與模式識別等領域的理論和方法,檢測出圖像中存在的目標對象,確定這些目標對象的語義類別,並標定出目標對象在圖像中的位置。對象檢測是對象識別的前提。只有檢測到對象才能對對象進行識別。

定義

在計算機視覺研究領域,對象檢測一般可以分為圖形對象檢測和視頻對象檢測,利用圖像處理與模式識別等領域的理論和方法,從圖像或視頻中分離出有一定意義的實體——對象,如人、物體等。在對象檢測中有一類通用的對象檢測方法, 似物性度量(Objectness measure), 利用矩形框將圖像中所有可能存在的對象區域定位出來並給出這個視窗內包含對象的機率。例如,通過貝葉斯框架將多種圖像信息進行融合, 定量地計算出每個視窗包含對象的機率 。

圖像目標類別

圖像目標類別檢測技術,又稱類別級目標檢測(category-level object detection)或 目 標 檢 測(object detection),旨在利用圖像處理與模式識別等領域的理論和方法,檢測出圖像中存在的目標對象,確定這些目標對象的語義類別,並標定出目標對象在圖像中的位置。目標對象的位置一般使用邊界框進行標定。根據目標對象的可形變能力, 目標可以分為兩類:(1)結構類,例如瓶子、建築、人體、馬等,它們具有接近的形狀和大小。(2)非結構類,例如天空、草地、雲朵等,這類對象沒有固定的形狀和大小。

對象分類

圖像目標類別檢測是目標分類的一個子問題。目標分類可以分為3個層級:

(1) 圖像級,即確定圖像中是否有相關的目標對象,如圖像分類[、圖像注釋技術。

(2)區域級,即確定圖像中某個區域含有某類目標,即本文所述的圖像目標類別檢測。

(3)像素級,即確定圖像中各像素歸屬於哪類目標對象。像素級分割也分為類別級目標分割和語義分割兩類。類別級目標分割與語義分割的主要區別是,語義分割要求將圖像中的所有目標包括背景都分割出來並確定其類別,而目標分割僅需要分割感興趣的目標並分類。

目標類別檢測不僅對現實場景中目標類別識別起決定性作用,而且也是眾多高層的視覺處理和分析任務的重要預處理步驟,例如活動檢測、事件檢測、全場景內容理解等。此外,目標類別檢測是大量現實套用的支持技術,例如智慧型視頻監控、機器人導航、基於內容的圖像檢索、基於圖像的繪製技術、圖像編輯和增強現實技術。目標類別檢測在計算機視覺和現實套用中的重要意義,促使大量研究者對該項技術進行研究。

步驟

目標類別檢測主要分為以下 3個步驟:

(1)列舉出圖像中所有可能的區域。

(2)決定各個區域是否含有預先設定的目標類別。

(3)整體上評估各個區域的反映,得到最終的檢測結果。

目標類別檢測的關鍵步驟就是在給定區域R,如何確R中是否有與預先定義的類別相關的目標對象。不同類別的特徵模型則通常在人工標記的數據上進行訓練獲得。因此,對區域R的歸類事實上就是一個有監督分類的過程。

對象定位策略

定位策略是指在目標區域中搜尋與學習到的目標外觀模型匹配的區域的一種策略。也就是說,通過訓練所得的外觀模型為c,搜尋的區域R,定位的過程即是搜尋匹配得分S (c , R) 的局部最大值或全局最大值的過程。目前較為常見的方法有滑動視窗、投票機制、通過分割進行定位 3類。

滑動視窗模型主要是在輸入圖像中尋找所有可能包含目標對象的子視窗,通過子視窗與訓練得到外觀模型進行匹配,從而得到該子視窗定位區域的類別。典型的子視窗搜尋策略證明了這種定位策略的有效性,但是這類算法有兩個重要的問題有待解決:首先,計運算元視窗的效率較低;其次,獲得的子視窗中包含有其他目標對象或者背景信息對匹配的影響,因此獲得子視窗的準確度有待提高。根據人類視覺系統的特徵,人類在識別一個物體之前總是預先確定這個物體的位置,因此類物體區域採樣(object proposal)受到研究者廣泛關注。類物體區域採樣主要根據目標對象往往具有明確的邊界,與其周圍的區域具有一定的外觀差別,並且往往屬於圖像中的顯著區域這些特徵,不區分類別地對可能存在目標對象的位置進行估計,也就是對傳統的滑動視窗進行排序,獲得較有可能是目標區域的視窗,為下一步的分類與識別奠定基礎。類物體區域採樣的主要研究目標是能夠獲得高的檢測率、儘可能少的採樣數、較高的效率和對不同類目標的普適性。

投票機制不同於滑動視窗模型,這類模型主要設計用於基於部分的外觀模型。基於部分的外觀模型主要包含兩個部分,即一組局部區域和它們之間的拓撲關係。S (c , R) 則等於這些區域的匹配得分和拓撲結構的匹配得分的總和。一般情況下投票機制可總結為以下兩步:首先,在輸入圖像中獲得與外觀模型中各個局部區域的最佳匹配區域,最大化這些局部區域的匹配得分;然後,採用拓撲評價方法獲得最佳的拓撲匹配。因此投票機制事實上是一個貪心算法 。

通過 分割進行定位建立在圖像成功的自動分割基礎上,成功的圖像分割本身就是完美的定位。但是目前圖像分割是一件十分耗時、非常複雜的過程,而且很難將單個目標對象完整地分割出來。目前主要的處理方法是在過分割的基礎上,構建機率圖模型,進行其他複雜的分類操作。

相關詞條

熱門詞條

聯絡我們