介紹
也就是OCR (Optical Character Recognition)光學字元辨識核心技術。以「丹青檔案辨識系統 5」為例,加以說明:
「丹青檔案辨識系統 5」採用新型軟體使用介面及簡易操作模式,讓使用者迅速完成檔案辨識和管理,並可切換辨識中英日語檔案。
這套軟體辨識率達95%以上,不僅能自動分析橫排、直排、橫直排及單欄、多欄影像檔案,且可提供「可攜式工作檔」功能,將大量未完成辨識的檔案以檔案夾另外儲存成「工作專案」,方便使用者將檔案內容隨身攜帶使用。
此軟體可將多頁檔案的辨識結果,合併匯出為單頁或多頁的PDF檔,方便檔案數位化分享或管理。此外,還能快速且大量辨識各種來源的檔案影像來源,在Pentium III 667MHz以上的個人電腦環境下,每秒鐘能辨識150箇中文字,且自動分析成可編輯的檔案格式。
「丹青檔案辨識系統 5」
同時支援多頁TIF檔辨識,短時間內即可將大量文書資料輸入電腦,加以與編輯,並依使用者需求,將結果儲存成DOC、XLS、TXT、TIF、RTF或HTML等檔案格式。亦可進一步辨識各種表格影像,將結果儲存成XLS、SLK、CSV等格式,方便使用者在Excel中更彈性地處理和運用檔案。此外國內的清華大學也是這方面的領先單位。