自動模式識別

自動模式識別

模式識別(Pattern recognition),就是通過計算機用數學技術方法來研究模式的自動處理和判讀。自動模式識別是指無需依靠運行人員人為觀察與分析把具體的樣本歸類到某一個模式,而是用機器進行自動進行模式識別。一般通過有關算法使機器具有自動識別能力。

研究內容

模式識別研究主要集中在兩方面,一是研究生物體(包括人)是如何感知對象的,屬於認識科學的範疇,二是在給定的任務下,如何用計算機實現模式識別的理論和方法。自動模式識別簡單來說是指無需人為干擾,機器能自動把具體的樣本歸類到某一個模式,自動模式識別技術是人工智慧技術重要組成部分。現在自動模式識別主要是套用機器學習中有關方法實現。

模式

當人們看到某物或現象時,人們首先會收集該物體或現象的所有信息,然後將其行為特徵與頭腦中己有的相關信息相比較,如果找到一個相同或相似的匹配,人們就可以將該物體或現象識別出來。因此,某物體或現象的相關信息,如空間信息、時間信息等,就構成了該物體或現象的模式。廣義的說,存在於時間和空間中可觀察的事物,如果可以區別它們是否相同或相似,都可以稱之為模式。 Watanable 定義模式“與混沌相對立,是一個可以命名的模糊定義的實體”。比如,一個模式可以是指紋圖像、手寫草字、人臉、或語言符號等。“廣義的說,存在於時間和空間中可觀察的事物,如果我們可以區別他們是否相同或相似,都可以稱之為模式”。

步驟

數據獲取

數據獲取是指利用各種感測器把被研究對象的各種信息轉換為計算機可以接受的數值或符號(串)集合。 習慣上,稱這種數值或符號(串)所組成的空間為模式空間。 這一步的關鍵是感測器的選取。 為了從這些數字或符號(串)中抽取出對識別有效的信息,必須進行數據處理,包括數字濾波和特徵提取。

數據處理

數據處理是為了消除輸入數據或信息中的噪聲,排除不相干的信號,只留下與被研究對象的性質和採用的識別方法密切相關的特徵(如表征物體的形狀、周長、面積等等)。 舉例來說,在進行指紋識別時,指紋掃描設備每次輸出的指紋圖像會隨著圖像的對比度、亮度或背景等的不同而不同,有時可能還會產生變形, 而人們感興趣的僅僅是圖像中的指紋線、指紋分叉點、端點等,而不需要指紋的其它部分或背景。因此,需要採用合適的濾波算法,如基於塊方圖的方向濾波、二值濾波等,過濾掉指紋圖像中這些不必要的部分。

特徵提取

特徵提取是指從濾波數據中衍生出有用的信息,從許多特徵中尋找出最有效的特徵, 以降低後續處理過程的難度。我們對濾波後的這些特徵進行必要的計算後,通過特徵選擇和提取形成模式的特徵空間。 人類很容易獲取的特徵,對於機器來說就很難獲取了,特徵選擇和提取是模式識別的一個關鍵問題。 一般情況下,候選特徵種類越多,得到的結果應該越好。 但是,由此可能會引發維數災害,即特徵維數過高,計算機難以求解。 因此,數據處理階段的關鍵是濾波算法和特徵提取方法的選取。 不同的套用場合,採用的濾波算法和特徵提取方法以及提取出來的特徵也會不同。

分類決策或模型匹配

基於數據處理生成的模式特徵空間,人們就可以進行模式識別的最後一部分:模式分類或模型匹配。 該階段最後輸出的可能是對象所屬的類型,也可能是模型資料庫中與對象最相似的模式編號。 模式分類或描述通常是基於己經得到分類或描述的模式集合而進行的。 人們稱這個模式集合為訓練集,由此產生的學習策略稱為監督學習。 學習也可以是非監督性學習,在此意義下產生的系統不需要提供模式類的先驗知識,而是基於模式的統計規律或模式的相似性學習判斷模式的類別。 模式分類或模式匹配的方法有很多,主要是基於以下思想設計的:

成員表:即模板匹配。 基於該思想,分類系統中會預先存儲屬於同一模式類的模式集,然後將輸入的未知模式與系統中己有的模式相比較,具有相同或相似匹配的模式類即為該未知模式的所屬類型。

一般特徵:這裡模式的一般特徵被存儲在一個分類系統中,當有一個未知模式進入該系統時,系統會將其一般特徵與系統中現有類的一般特徵相比較,並將其歸入到與其有相似特徵的類中。

聚類:文中筆者用實數向量來表示目標類的模式,這樣,利用其聚類特性,可以輕易地將未知模式進行分類。 如果目標向量在幾何位置上相距很遠, 就容易確定未知模式的類別。 但是如果目標向量相距較近,或甚至有重疊,人們就需要採用比較複雜的算法來確定未知模式的類別。 最小距離分類法就是一個基於聚類概念的簡單算法。 該算法通過計算未知模式與希望的己知模式集之間的距離,來決定哪一個己知模式與該未知模式最近,並最終將該未知模式歸入到與其相距最短的己知模式類中。 該算法對於目標向量在幾何位置上相距很遠的模式分類很有效。

方法

統計模式識別

統計模式識別方法是受數學中的決策理論啟發而產生的一種識別方法。 其基本思想是將特徵提取階段得到的特徵向量定義在一個特徵空間中,這個空間包含了所有的特徵矢量。 不同的特徵向量,或者說不同類別的對象,都對應於此空間中的一點。 在分類階段,則利用統計決策的原理對特徵空間進行劃分,從而達到識別不同特徵對象的目的。 統計識別中套用的統計決策分類理論相對比較成熟,研究的重點是特徵提取 。

統計模式識別方法適用於在給定的有限數量樣本集,已知研究對象統計模型或已知判別函式類條件下,根據一定的準則通過學習算法能夠把 d 維特徵空間劃分為 c 個區域,每一個區域與每一類別相對應,模式識別系統在進行工作時只要判斷被識別的對象落入哪一個區域,就能確定出它所屬的類別。

句法結構模式識別

句法識別是對統計識別方法的補充。 統計方法用數值來描述圖像的特徵, 句法方法則是用符號來描述圖像特徵的。它模仿了語言學中句法的層次結構, 採用分層描述的方法,把複雜圖像分解為單層或多層的簡單子圖像,主要突出了識別對象的結構信息。 圖像識別是從統計方法發展起來的,而句法方法擴大了識別的能力, 使其不僅限於對象物的分類,而且還用於景物的分析與物體結構的識別。句法結構模式識別主要用於文字識別、遙感圖形的識別與分析、紋理圖像的分析中。 該方法的特點是識別方便,能夠反映模式的結構特徵,能夠描述模式的性質,對圖像畸變的抗干擾能力較強。 如何選擇機緣是本方法的一個關鍵問題,尤其是當存在干擾及噪聲時,抽取基元更困難,且易失誤 。

模糊模式識別

模糊模式識別的理論基礎是模糊數學。 它根據人辨識事物的思維邏輯,吸取人腦的識別特點,將計算機中常用的二值邏輯轉向連續邏輯。 模糊識別的結果是用被識別對象隸屬於某一類別的程度即隸屬度來表示的,一個對象可以在某種程度上屬於某一類別,而在另一種程度上屬於另一類別。 一般常規識別方法則要求一個對象只能屬於某一類別。 基於模糊集理論的識別方法有 : 最大隸屬原則識別法、擇近原則識別法和模糊聚類法。

伴隨著各門學科,尤其是人文、社會學科及其他“軟科學”的不斷發展,數學化、定量化的趨勢也開始在這些領域中顯現。 模糊模式識別不再簡單局限於自然科學的套用,同時也被套用到社會科學,特別是經濟管理學科方面。

人工神經網路模式識別

人工神經網路的研究起源於對生物神經系統的研究。 它將若干處理單元(即神經元)通過一定的互連模型連結成一個網路,這個網路通過一定的機制可以模仿人的神經系統的動作過程,以達到識別分類的目的。 人工神經網路區別於其他識別方法的最大特點是它對待識別的對象不要求有太多的分析與了解,具有一定的智慧型化處理的特點。 神經網路側重於模擬和實現人認知過程中的感知覺過程、 形象思維、分散式記憶、自學習和自組織過程,與符號處理是一種互補的關係。 但神經網路具有大規模並行、分散式存儲和處理、自組織、自適應和自學習的能力,特別適用於處理需要同時考慮許多因索和條件的、不精確和模糊的信息處理問題。

相關詞條

熱門詞條

聯絡我們