簡介
識別信息指利用計算機技術對信息進行處理、分析和理解,以識別各種不同類型的目標和對像。在人工智慧領域,識別信息主要目的是使讓計算機自動處理有關信息,並能理解和識別。用於識別信息的技術一般有機器學習、統計學、深度學習、心理學,信號處理等。
信息
信息是對現實世界事物存在方式或運動狀態的反映。具體地說,信息是一種已經被加工為特定形式的數據,這種數據形式對接收者來說是有意義的,而且對當前和將來的決策具有明顯的或實際的價值。信息有如下一些重要特徵:信息傳遞需要物質載體,信息的獲取和傳遞要消耗能量。信息是可以感知的。不同的信息源有不同的感知方式(如感覺器官、儀器或感測器等)。信息是可以存儲、壓縮、加工、傳遞、共享、擴散、再生和增值的 。
“數據”是將現實世界中的各種信息記錄下來的、可以識別的符號,是信息的載體,是信息的具體表示形式。可用多種不同的數據形式來表示一種同樣的信息,而信息不隨它的數據形式不同而改變。數據的表現形式多種多樣,不僅有我們熟知的數字和文字,還可以有圖形、圖像、聲音等形式。
信息與數據是密切相關聯的,信息是各種數據所包括的意義,數據則是載荷信息的物理符號。因此,在許多場合下,對它們不做嚴格區分,可互換使用。例如,通常所說的“信息處理”與“數據處理”等就具有同義性。
識別信息的類別
圖像識別
圖像識別是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。圖像識別的基本過程如下:
信息的獲取:是通過感測器,將光或聲音等信息轉化為電信息。信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。
預處理:包括A\D,二值化,圖象的平滑,變換,增強,恢復,濾波等,主要指圖象處理。
特徵抽取和選擇:在模式識別中,需要進行特徵的抽取和選擇,例如,一幅64x64的圖象可以得到4096個數據,這種在測量空間的原始數據通過變換獲得在特徵空間最能反映分類本質的特徵。這就是特徵提取和選擇的過程。
分類器設計:分類器設計的主要功能是通過訓練確定判決規則,使按此類判決規則分類時,錯誤率最低。
分類決策:在特徵空間中對被識別對象進行分類 。
語音識別
語音識別(speech recognition;語音辨識/言語辨別)技術,也被稱為自動語音識別(Automatic Speech Recognition, ASR)、電腦語音識別(英語:Computer Speech Recognition)或是語音轉文本識別(Speech To Text, STT),其目標是以電腦自動將人類的語音內容轉換為相應的文字。與說話人識別及說話人確認不同,後者嘗試識別或確認發出語音的說話人而非其中所包含的辭彙內容。
語音識別技術的套用包括語音撥號、語音導航、室內設備控制、語音文檔檢索、簡單的聽寫數據錄入等。語音識別技術與其他自然語言處理技術如機器翻譯及語音合成技術相結合,可以構建出更加複雜的套用,例如語音到語音的翻譯。語音識別技術所涉及的領域包括:信號處理、模式識別、機率論和資訊理論、發聲機理和聽覺機理、人工智慧等等。
文字識別
文字識別是指利用計算機自動識別字元的技術,是模式識別套用的一個重要領域。人們在生產和生活中,要處理大量的文字、報表和文本。為了減輕人們的勞動,提高處理效率,50年代開始探討一般文字識別方法,並研製出光學字元識別器。60年代出現了採用磁性墨水和特殊字型的實用機器。60年代後期,出現了多種字型和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用於信函分揀的手寫體數字識別機和印刷體英文數字識別機。70年代主要研究文字識別的基本理論和研製高性能的文字識別機,並著重於漢字識別的研究。
文字識別一般包括文字信息的採集、信息的分析與處理、信息的分類判別等幾個部分。
信息採集
將紙面上的文字灰度變換成電信號,輸入到計算機中去。信息採集由文字識別機中的送紙機構和光電變換裝置來實現,有飛點掃描、攝像機、光敏元件和雷射掃描等光電變換裝置。
信息分析和處理
對變換後的電信號消除各種由於印刷質量、紙質(均勻性、污點等)或書寫工具等因素所造成的噪音和干擾,進行大小、偏轉、濃淡、粗細等各種正規化處理。
信息的分類判別
對去掉噪聲並正規化後的文字信息進行分類判別,以輸出識別結果。
文字識別方法基本上分為統計、邏輯判斷和句法三大類。常用的方法有模板匹配法和幾何特徵抽取法。
模板匹配法
將輸入的文字與給定的各類別標準文字(模板)進行相關匹配,計算輸入文字與各模板之間的相似性程度,取相似度最大的類別作為識別結果。這種方法的缺點是當被識別類別數增加時,標準文字模板的數量也隨之增加。這一方面會增加機器的存儲容量,另一方面也會降低識別的正確率,所以這種方式適用於識別固定字型的印刷體文字。這種方法的優點是用整個文字進行相似度計算,所以對文字的缺損、邊緣噪聲等具有較強的適應能力。
幾何特徵抽取法
抽取文字的一些幾何特徵,如文字的端點、分叉點、凹凸部分以及水平、垂直、傾斜等各方向的線段、閉合環路等,根據這些特徵的位置和相互關係進行邏輯組合判斷,獲得識別結果。這種識別方式由於利用結構信息,也適用於手寫體文字那樣變型較大的文字。