光學符號識別

光學符號識別

OCR技術是光學字元識別的縮寫(Optical Character Recognition),是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其他印刷品的文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為可以使用的文本的計算機輸入技術。可套用於銀行票據、大量文字資料等、檔案卷宗、文案的錄入和處理領域。

概述

OCR通過掃描和攝像等光學輸入方式獲取圖像上的文字信息,利用各種模式識別算法分析文字形態特徵,判斷出文字的標準碼,並按通用格式存儲在文本檔案中。所以OCR是一種非常快捷、省力的文字輸入方式,也是在文字數據量大的今天被人們廣泛採用的輸入方法。

OCR技術並非一項新的技術,遠在計算機之前就有了。早在1929年,德國的科學家Tausheck首先提出了OCR的概念。幾年後,美國科學家Handel也提出了利用光學技術對文字進行識別的想法。在20世紀60、70年代,世界各國就開始有OGR的研究,在研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0—9的數字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數字為對象,直至1965—1970年之間開始有一些簡單的產品,如印刷文字的郵政編碼識別系統,用來識別郵件上的郵政編碼,幫助郵局做區域分信的作業。也因此至今郵政編碼一直是各國所倡導的地址書寫方式。

OCR技術主要是研究計算機自動識別文字的技術。OCR系統涉及圖像處理、模式識別、人工智慧、認知心理學等許多領域。

系統構成

一個OCR系統可分為3個部分。

預處理部分

首先把待識別的文本通過掃描設備輸入系統,由硬體、軟體完成數字圖像處理,把待識別文本中的照片、圖形與文字分離開來,並將分離出的文字分割成單個符號圖形供識別部分使用。

識別部分

把分隔出的文字圖形規格化,提取文字的幾何特徵和統計特性,並把特徵送入識別器,得到待識別文字的內碼作為結果。

後處理部分

綜合考慮識別結果以及預處理部分的某些因素,生成具有一定格式的識別結果,然後對整個識別結果進行語言學方面的檢查,糾正誤識成分,從而產生OCR系統對該識別文本的最終結果。

OCR技術的套用

目前印刷體OCR的識別技術已經達到較高水平。OCR產品已由早期的只能識別指定的印刷體數字、英文字母和部分符號,發展成為可以自動進行版面分析、表格識別,實現混合文字、多字型、多字號、橫豎混排識別的強大的計算機信息快速錄入工具。對印刷體漢字的識別率達到98%以上,即使對印刷質量較差的文字,其識別率也達到95%以上,對手寫體漢字的識別率也達到70%以上。

基於傳統OCR技術的掃瞄器因其功能單一、套用及攜帶不方便等諸多弊病,已成為OCR技術廣泛普及套用的主要障礙之一。與此同時,數位相機、攝像機、PDA、拍照手機正在迅速普及,利用這些設備拍攝的自然視覺圖像與掃瞄器輸出的圖像不同,它往往會有焦距變化、角度形變、光線變化、背景變化等多種複雜情況出現,因此需要藉助超越傳統掃瞄器的OCR新技術來實現對這些圖像的識別。目前OCR技術已經迎來了新的套用高潮,例如,可以直接把OCR移植到數字移動產品上,當用戶利用數位相機、數碼攝像機或手機等設備把文章或資料拍下來之後,就可以把這些數字圖像資料傳入計算機,然後再通過OCR識別軟體,變成可供編輯、使用、保存的文本資料。OCR技術與數字移動產品相結合,使OCR的套用領域更加豐富、普及。

相關詞條

熱門詞條

聯絡我們