基本信息
人工智慧翻譯--Artificial Intelligent Translation(簡稱為AI-TRANS)信息簡介
人工智慧翻譯分為理論和技術兩個方面。人工智慧翻譯理論是研究人腦進行語言學習和語言翻譯(轉換)的科學。人工智慧翻譯技術是根據人工智慧翻譯理論用計算機技術來實現計算機智慧型翻譯的技術(方法和手段)。人工智慧翻譯理論是在自然語言理解(NLU)、自然語言處理(NLP)、機器翻譯(MT)、翻譯記憶(TM)和基於統計學的機器翻譯(SMT)等理論和技術基礎上,為突破計算機翻譯技術瓶頸、實現高質量機器翻譯而提出的新思維、新理論,是一門新的學科。
人工智慧翻譯的理論基礎是計算機人工智慧理論、語言學理論和計算機翻譯理論。它是計算機人工智慧理論在自然語言理解和自然語言處理方向的深入發展。或者說是將計算機人工智慧理論運用到自然語言理解和自然語言處理領域。
人工智慧翻譯理論的重點是解釋人腦的外語學習、翻譯知識記憶等機理。研究科學的、類似人腦的、適合於計算機的翻譯知識表征方法和存儲模式。
人工智慧翻譯學科的另一個任務是指導計算機翻譯技術如何實現智慧型化,即為計算機智慧型翻譯技術提出可行的發展方向、理論基礎、以及實現思路。
人工智慧翻譯理論將領引計算機翻譯技術向著更新、更高方向發展。
具體地,人工智慧翻譯學科包括人工智慧翻譯理論、人工智慧翻譯技術、智慧型知識庫、基於智慧型知識庫的計算機智慧型翻譯技術、多策略智慧型翻譯技術、線上多策略智慧型翻譯技術等內容。
詳細介紹
智慧型化知識庫經過多年的潛心研究、在大量基礎性的語素收集、以及大量專業資料的實際翻譯工作等基礎上,愛譯科技的研究團隊逐漸形成了一套科學的語言翻譯知識表征理論,並且在研究人腦的知識存儲結構和智慧型翻譯思維的成果上,根據神經網路原理設計了一種高度智慧型化的翻譯知識庫體系結構----博典智慧型翻譯知識庫,簡稱智慧型知識庫。
該部分包括智慧型知識庫介紹,智慧型知識庫的作用,智慧型知識庫的價值,智慧型知識庫共享共建機制。
TM++智慧型技術
TM++起源於TM(TranslationMemory)翻譯記憶技術,但它又超越了傳統的TM技術。它綜合了基於翻譯模板的MT翻譯技術和基於實例的統計翻譯技術;它採用人工智慧的原理,為高質量計算機翻譯提供了一種有效解決方案。
TM++是一種超級人工智慧互動式翻譯存儲技術。利用TM++功能模組,可在最短時間內查找智慧型化知識庫,對要翻譯的句子進行快速分析對比,保證相同和相近的句子永遠不需要翻譯第二遍。而且,通過TM++功能模組,系統還可依據智慧型化的知識庫對要翻譯的句子進行模糊匹配、推理和推測等,從而給出完整準確的譯文。
大家知道,採用TM(翻譯記憶)技術,可以做到“相同的句子永遠不需要翻譯第二篇”。而採用TM++技術,不僅可以做到“相同的句子永遠不需要翻譯第二篇”,還可以做到“相似的句子不再需要翻譯第二篇”。即能做到“舉一反三”。
TM++技術是基於智慧型知識庫體系基礎上,模擬人腦翻譯思維對源語言文本進行翻譯處理以形成高質量目標語言文本的計算機人工智慧翻譯技術。
TM++是基於智慧型知識庫的智慧型翻譯技術,Bodiansoft用戶在使用其互動翻譯的同時,系統會自動學習並在智慧型知識庫保存智慧型化的句式,以便今後準確翻譯類似的句子。
TM++超級智慧型翻譯記憶技術的實現,為用戶減輕了很多的重複性工作,特別是在那些特定行業的重複率高的的用戶,使用TM++技術,將節省近三分之一的翻譯時間。
TM++智慧型翻譯技術分為三個部分:TM++智慧型化學習、TM++智慧型化翻譯處理和TM++智慧型化翻譯標識。
TM++智慧型翻譯技術,基於智慧型知識庫,綜合了先進的機器翻譯技術、人機互動式翻譯技術、翻譯存儲技術和人工智慧翻譯技術。它具有如下幾個特點和優勢:
技術先進,套用領域廣泛;
它不受語種的限制,可廣泛套用於各個語種之間的翻譯;
智慧型知識庫與翻譯軟體相對獨立,又有機聯繫;
智慧型知識庫的積累可由用戶完成,並可實現共建共享;
TM++真正做到了讓電腦模擬人腦的翻譯思維,並且在翻譯的同時自動智慧型化地存儲人的高智力翻譯成果。而且系統還學習和記憶了相關的句型或翻譯模式,因此,翻譯質量可以迅速提高。
TM++針對要翻譯的句子選擇最優的翻譯策略,並能進行綜合、類比、推理、推測和判斷等超級人工智慧處理。
TM++中所採用了幾十項高新智慧型技術,使得它徹底改變了傳統的計算機翻譯技術,將領引計算機翻譯技術從人-機-人模式進入到機-人-機模式並最終進入全自動高質量翻譯階段,從而實現人類跨世紀的夢想。
TM++技術突破了計算機翻譯技術的瓶頸,打開了高質量計算機自動翻譯的廣闊前景,翻開了計算機翻譯歷史新的一頁。
翻譯技術綜述
為了使讀者更全面地了解計算機翻譯技術,本欄目也對現有計算機技術系統地做了個歸類和總結,簡述如下:
機器翻譯(Machine Translation),又稱為自動翻譯,是利用計算機把一種自然源語言轉變為另一種自然目標語言的過程,一般指自然語言之間句子和全文的翻譯。它是自然語言處理(Natural Language Processing)的一個分支,與計算語言學(ComputationalLinguistics )、自然語言理解(Natural Language Understanding) 之間存在著密不可分的關係。
機器翻譯(MT)技術有可分為:
基於規則的機器翻譯(RBMT);
基於統計學的機器翻譯(SMT);
基於實例的機器翻譯(EBMT);
基於模板的機器翻譯(TBMT)。
另外,計算機翻譯技術的另一個重要方向是計算機翻譯記憶技術(TM)。
結合機器翻譯(MT)和翻譯記憶(TM)的多引擎機器翻譯技術也是人們為提高計算機翻譯質量而樂於採用的。
雖然機器自動翻譯質量不夠高,無法採用。但是針對專業翻譯人士,採用了翻譯記憶(TM)和互動式翻譯(IT)的計算機輔助翻譯系統,還是很受歡迎的。
翻譯實用技術
翻譯實用技術,指的是與翻譯相關的輔助技術,包括術語提取、重複率分析統計、格式化翻譯、翻譯知識交換等。
愛譯科技