簡介
用圖樣分析一般利用數學模型並結合圖像處理的技術來分析底層特徵和上層結構,從而提取具有一定智慧型性的信息。
模式識別和人工智慧方法對物景進行分析、描述、分類和解釋的技術,又稱景物分析或圖像理解。20世紀60年代以來,在圖像分析方面已有許多研究成果,從針對具體問題和套用的圖樣分析技術逐漸向建立一般理論的方向發展。圖樣分析同圖像處理、計算機圖形學等研究內容密切相關,而且相互交叉重疊。但圖像處理主要研究圖像傳輸、存儲、增強和復原;計算機圖形學主要研究點、線、面和體的表示方法以及視覺信息的顯示方法;圖像分析則著重於構造圖像的描述方法,更多地是用符號表示各種圖像,而不是對圖像本身進行運算,並利用各種有關知識進行推理。圖像分析與關於人的視覺的研究也有密切關係,對人的視覺機制中的某些可辨認模組的研究可促進計算機視覺能力的提高(見機器視覺)。
比較
圖樣分析(image analysis)和圖像處理(image processing)關係密切,兩者有一定程度的交叉,但是又有所不同。圖像處理側重於信號處理方面的研究,比如圖像對比度的調節、圖像編碼、去噪以及各種濾波的研究。但是圖像分析更側重點在於研究圖像的內容,包括但不局限於使用圖像處理的各種技術,它更傾向於對圖像內容的分析、解釋和識別。因而,圖像分析和計算機科學領域中的模式識別、計算機視覺關係更密切一些。
圖樣分析一般利用數學模型並結合圖像處理的技術來分析底層特徵和上層結構,從而提取具有一定智慧型性的信息。
分析過程
如圖為一個分級的圖像分析過程的
圖像分析基本上有四個過程。
①感測器輸入:把實際物景轉換為適合計算機處理的表達形式,對於三維物景也是把它轉換成二維平面圖像進行處理和分析(見圖像表示)。
②分割:從物景圖像中分解出物體和它的組成部分(見圖像分割)。組成部分又由圖像基元構成。把物景分解成這樣一種分級構造,需要套用關於物景中對象的知識。一般可以把分割看成是一個決策過程,它的算法可分為像點技術和區域技術兩類。像點技術是用閾值方法對各個像點進行分類,例如通過像點灰度和閾值的比較求出文字圖像中的筆劃。區域技術是利用紋理、局部地區灰度對比度等特徵檢出邊界、線條、區域等,並用區域生長、合併、分解等技術求出圖像的各個組成成分。此外,為了進一步考察圖像整體在分割中的作用,還研究出鬆弛技術等方法。
③識別:對圖像中分割出來的物體給以相應的名稱,如自然物景中的道路、橋樑、建築物或工業自動裝配線上的各種機器零件等。一般可以根據形狀和灰度信息用決策理論和結構方法進行分類,也可以構造一系列已知物體的圖像模型,把要識別的對象與各個圖像模型進行匹配和比較。
④解釋:用啟發式方法或人機互動技術結合識別方法建立物景的分級構造,說明物景中有些什麼物體,物體之間存在什麼關係。在三維物景的情況下,可以利用物景的各種已知信息和物景中各個對象相互間的制約關係的知識。例如,從二維圖像中的灰度陰影、紋理變化、表面輪廓線形狀等推斷出三維物景的表面走向;也可根據測距資料,或從幾個不同角度的二維圖像進行景深的計算,得出三維物景的描述和解釋。
研究領域
圖像分析研究的領域一般包括:
基於內容的圖像檢索(CBIR-Content Based Image Retrieval)
人臉識別(face recognition)
表情識別(emotion recognition)
光學字元識別(OCR-Optical Character Recognition)
手寫體識別(handwriting recognition)
醫學圖像分析(biomedical image analysis)
視頻對象提取(video object extraction)
套用
針對具體對象的圖樣分析技術,已經套用在工業、檢測、遙感、計算機、軍事等技術中。
①工業自動化方面:如機器手抓取物體,自動操縱線焊機和切削刀具,與製造超大規模積體電路有關的工藝如引線焊接、片子對準和封裝,對於油井現場或地震資料的大量數據進行監測和篩選,對自動裝配和修理提供視覺反饋。
②檢測方面:有檢查印刷電路板上的尖角、短路和聯接不良,檢驗鑄件中的雜質和裂縫,篩選醫學圖像和斷層圖像,常規篩選工廠產品。
③遙感方面:有製圖學、交通監控、資源管理、礦物勘探。
④計算機套用方面:有信息系統管理,檔案閱讀機,建築和機械工程的計算機輔助設計。
⑤軍事方面:有跟蹤運動物體、自動導航、目標搜尋和測距等。
發展趨勢
雖然圖樣分析的研究已經取得不少成果,並在許多領域的具體對象上得到實際套用,但是在建立共同的理論基礎方面還存在很多問題,有待進一步解決。例如圖像的精確表示形式,在不同解析度水平上表示表面信息,建立表示的分級構造,利用和確定表面顏色和狀態信息,對運動狀態的感知過程,從光學流中獲取信息的方法,在視覺感知中套用有關專門信息的方法等。