概述
圖像識別技術可能是以圖像的主要特徵為基礎的。每個圖像都有它的特徵,如字母A有個尖,P有個圈、而Y的中心有個銳角等。對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特徵上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特徵轉到另一個特徵上。由此可見,在圖像識別過程中,知覺機制必須排除輸入的多餘信息,抽出關鍵的信息。同時,在大腦里必定有一個負責整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
在人類圖像識別系統中,對複雜圖像的識別往往要通過不同層次的信息加工才能實現。對於熟悉的圖形,由於掌握了它的主要特徵,就會把它當作一個單元來識別,而不再注意它的細節了。這種由孤立的單元材料組成的整體單位叫做組塊,每一個組塊是同時被感知的。在文字材料的識別中,人們不僅可以把一個漢字的筆劃或偏旁等單元組成一個組塊,而且能把經常在一起出現的字或詞組成組塊單位來加以識別。
技術發展
圖像識別技術是人工智慧的一個重要領域。為了編制模擬人類圖像識別活動的電腦程式,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認為,識別某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫模板。當前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。例如有一個字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A就被識別了。圖像識別中的模式識別(PatternRecognition),是一種從大量信息和數據出發,在專家經驗和已有認識的基礎上,利用計算機和數學推理的方法對形狀、模式、曲線、數字、字元格式和圖形自動完成識別、評價的過程。模式識別包括兩個階段,即學習階段和實現階段,前者是對樣本進行特徵選擇,尋找分類的規律,後者是根據分類規律對未知樣本集進行分類和識別。這個模式識別的模板匹配模型簡單明了,也容易得到實際套用。但這種模型強調圖像必須與腦中的模板完全符合才能加以識別,而事實上人不僅能識別與腦中的模板完全一致的圖像,也能識別與模板不完全一致的圖像。例如,人們不僅能識別某一個具體的字母A,也能識別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時,人能識別的圖像是大量的,如果所識別的每一個圖像在腦中都有一個相應的模板,也是不可能的。
為了解決模板匹配模型存在的問題,格式塔心理學家又提出了一個原型匹配模型。這種模型認為,在長時記憶中存儲的並不是所要識別的無數個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。如果能找到一個相似的原型,這個圖像也就被識別了。這種模型從神經上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對一些不規則的,但某些方面與原型相似的圖像的識別。但是,這種模型沒有說明人是怎樣對相似的刺激進行辨別和加工的,它也難以在電腦程式中得到實現。因此又有人提出了一個更複雜的模型,即“泛魔”識別模型。
基本過程
n信息的獲取:是通過感測器,將光或聲音等信息轉化為電信息。信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。
n預處理:包括A\D,二值化,圖象的平滑,變換,增強,恢復,濾波等, 主要指圖象處理。
n特徵抽取和選擇:在模式識別中,需要進行特徵的抽取和選擇,例如,一幅64x64的圖象可以得到4096個數據,這種在測量空間的原始數據通過變換獲得在特徵空間最能反映分類本質的特徵。這就是特徵提取和選擇的過程。
n分類器設計:分類器設計的主要功能是通過訓練確定判決規則,使按此類判決規則分類時,錯誤率最低。
n分類決策:在特徵空間中對被識別對象進行分類。
舉例
人臉識別過程
人臉識別系統主要包括四個組成部分,分別為:人臉圖像採集及檢測、人臉圖像預處理、人臉圖像特徵提取以及匹配與識別。
車牌識別過程
車牌預處理
字元分割
歸一化處理
細化處理
字元特徵提取
神經網路訓練
1.車牌預處理
2.字元分割
3.歸一化處理
4.細化處理
5.字元特徵提取
6.神經網路訓練
套用
圖像識別技術是立體視覺、運動分析、數據融合等實用技術的基礎,在導航、地圖與地形配準、自然資源分析、天氣預報、環境監測、生理病變研究等許多領域重要的套用價值:
1)遙感圖像識別:航空遙感和衛星遙感圖像通常用圖像識別技術進行加工以便提取有用的信息。該技術目前主要用於地形地質探查,森林、水利、海洋、農業等資源調查,災害預測,環境污染監測,氣象衛星雲圖處理以及地面軍事目標識別等。
2)通訊領域的套用:包括圖像傳輸、電視電話、電視會議等。
3)軍事、公安刑偵等領域的套用:圖像識別技術在軍事、公安刑偵方面的套用很廣泛,例如軍事目標的偵察、制導和警戒系統;自動滅火器的控制及反偽裝;公安部門的現場照片、指紋、手跡、印章、人像等的處理和辨識;歷史文字和圖片檔案的修復和管理等等。
4)生物醫學圖像識別:圖像識別在現代醫學中的套用非常廣泛,它具有直觀、無創傷、安全方便等特點。在臨床診斷和病理研究中廣泛藉助圖像識別技術,例如CT(Computed Tomography)技術等。
5)機器視覺領域的套用:作為智慧型機器人的重要感覺器官,機器視覺主要進行3D圖像的理解和識別,該技術也是目前研究的熱門課題之一。機器視覺的套用領域也十分廣泛,例如用於軍事偵察、危險環境的自主機器人,郵政、醫院和家庭服務的智慧型機器人。此外機器視覺還可用於工業生產中的工件識別和定位,太空機器人的自動操作等。