計算機視覺心理學

計算機視覺心理學

心理學與計算機視覺交叉融合是今年來一個非常活躍的研究方向,其基本思路是借鑑人類視覺系統的感知規律來解決計算機視覺問題。

概述

1992年以前,國外的研究者們就試圖將心理學與計算機視覺聯繫在一起。MIT的Marr在他的名著《Vision》中,從物理學、神經科學、生理學、心理學等等學科出發,系統地簡述了計算機視覺的理論、算法與機制,奠定了計算機視覺的基礎。1992版的人工智慧百科全書(Encyclopedia of Artificial Intelligence)同時收錄了大量的視覺心理學與計算機視覺文獻,但兩者聯合套用的文章很少。近年來,隨著心理學的迅猛發展,研究者愈來愈重視視覺心理學在計算機視覺中的套用。

發展

自1998年始,IEEE每年舉行專門Workshop基於知覺的計算機視覺分組(POCV),從格式塔分組定律出發,探討計算機視覺的圖像分隔與圖形背景分離的方法和技術,以促進智慧型視覺系統研究。從2000年開始,IEEE每兩年舉行專門Workshop生物啟示下的計算機視覺(BMCV)。它的目標是通過對人類視覺理解與建模,促進計算機視覺的發展。同時,許多會議和雜誌增加了這方面的專題,如2005年在我國長沙舉行的第一屆自然計算與第二屆模糊系統知識發現聯合會議(ICNC05-FSKD05)設立了多個心理學與計算機視覺聯合套用專題:計算機視覺國際頂級會議CVPR 2006 增加了Cognitive Inspired Computer Vision 專題;國際會議RSKT2006 設立了Neuro - Cognitive Sciencc 專題;國際雜誌 EURASIP JASP 在2006年徵集 Image Percption 專題論文。

原理

注意力機制

將注意力機制引入視覺信息的分析和理解領域,能把計算資源優先分配給那些容易引起觀測者注意的區域,提高現有圖像分析方法的工作效率。Neisser 等人首先將注意力機制用於視覺信息分析研究,基於空間特徵的不連續性提出用Pop-out 概念來表徵信息顯著性的方法。目前,利用注意力機制解決計算機視覺問題主要集中分析自然圖像的顯著性。

視覺推理機制

視覺心理學理論認為人類視覺適用假設---驗證推理機制,類似機率計算,這是計算機視覺推理論學派的重要觀點。Sarkart 等人提出了一個基於感知推理網的信息理論機率套用框架。此框架能夠管理一些特殊套用的視覺模組(如角分析模組,片段分析模組、從X求形狀等),並試圖構造計算機視覺問題的通用解決方案。Brand 構造了一套以解釋為中介的視覺系統,它適用通用定性知識如剛性物體互動、可重用理念來構造基於物理學的推理。

基元理論

Biederman 提出的基元關係識別理論是一種非常有前景的圖像物體體識別理論,以引起計算機視覺領域的極大關注。

特徵檢測理論

所有複雜的刺激都是由一些可以區分、相互分離的特徵組成,通過計算特徵的出現與否,並把算數與不同標籤相聯繫的特徵列表進行比較來完成模式識別。在視覺信息處理中,可以使用物體不同的視覺特徵(如顏色。紋理等)及其分布來分類或識別物體。在視覺信息處理領域中,這是一條運用得較早、也較廣泛的信息學結構。

格式塔組織原理

格式塔組織原理主要由圖形分組原則(鄰近律、相似律、良好連續性、閉合性傾向、及共同命運)和圖形—背景分離定律組成。

拓撲認知理論

中科院陳霖等人發現蜜蜂能夠辨別拓撲性質,從而有力支持了拓撲性性質初期知覺理論,並進而創立和發展了“大範圍首先”的視知覺拓撲結構和功能層次理論:視覺過程是從大範圍拓撲性質的知覺組織開始的;以拓撲性質為基礎的各級幾何(射影、仿射、歐式幾何)不變性是圖形知覺的表達。

視覺神經計算

它的目標是探索神經計算的數理基礎,提出不同於當今計算機科學的新的計算原理,並將其套用於新的類似於人類神經處理方式的信息處理系統中。

HVS模型

人類視覺系統(HVS)的特性主要有對比敏感度,多通道與掩蓋效應,視覺非線性定律等。這些視覺特性已被套用到計算機視覺領域的多個方面。

恆常性理論

視網膜的圖像時刻在變,但人眼感知的世界是基本恆定不變的,這種心理現象被稱著知覺恆常性。主要包含大小恆常性,形狀恆常性,明度恆常性及顏色恆常性等。

相關詞條

熱門詞條

聯絡我們