現代翻譯活動需要技術的支持
翻譯並不僅僅是文字轉換。通常認為,國際性的具有現代特徵的語言服務行業起源於20世紀80年代。從那時起,翻譯服務成為廣義語言服務的一個必要的和重要的環節,包容於語言服務活動之中。語言服務以翻譯為基礎,但是已經超越了翻譯服務的範疇。內容包括技術寫作、翻譯、出版、教育、諮詢、技術開發等多個領域,呈現多語種、規模化、專業化、市場化和全球化特徵。廣義的語言服務中,我們更強調與其他行業的銜接關係和共生關係,在語言服務的目的論中,我們也更重視服務的經濟性與服務對象的商業目標或其他根本性目標的達到與否——比如是否有利於占據目標市場的份額,又比如翻譯成另一種語言後的計算機軟體,是否可以被使用這種語言的人士所理解和掌握——而非簡單的文化交流目的。為完成這些工作,可能需要程式設計師與翻譯工作者的密切配合,不只如此,團隊中還可能會加入商務人士,因為需要讓本地化工作與當地的廣告、市場開拓工作相銜接;加入法律人士,避免國家間法律的衝突及更好的遵從本地法律……。隨著團隊規模的擴大,管理人員必不可少,所謂項目經理(PM,ProjectManager)的地位愈發重要。如此大規模的團隊工作,在今天,離開信息技術的支持是不可想像的。語言服務保質保量的關鍵在於信息技術和管理技術的普及和套用。
翻譯技術的組成和分類
仔細分析在這些活動涉及到的信息技術,包括以下四類:第一類是信息技術的基礎知識和相關工具。範圍包括,計算機基礎知識、例如文字編碼的常識、高效率的文字錄入方法,比如光學字元識別和語音輸入,以及檔案管理、網路技術基礎、印刷與排版,甚至可以包括電子信息出版與信息建構(InformationArchitect,IA)等等。我們也可認為這些是資訊時代的譯員的基礎知識;第二類則是那些特定的可以輔助翻譯過程和翻譯研究的信息輔助技術。大體上包括,語料庫技術、網際網路搜尋引擎、特定的網際網路信息服務、各類電子辭典及電子工具書,以及其他類型的電子輔助工具;第三類,則是我們常聽到的計算機輔助翻譯技術(ComputerAidedTranslationi,CAT),雖然定義各有不同,但大體上包括翻譯記憶,術語管理、機器翻譯以及質量保證這幾類工具。第四類工具,我們認為是團隊翻譯的輔助工具。
翻譯記憶及術語管理類工具,因為理論基礎簡單,所以是商品化開發最成熟的部分。翻譯記憶(TM,TranslationMemory)是什麼可能每家公司及技術開發者都有自己的理解,但是從根本上說,可以最簡單的概括為一句話,那就是“翻譯過的東西讓計算機記住,下次遇到的時候就別再譯了”。這種理解雖不全面,但也是很好的學習起點。術語工具,則是強調對於特定辭彙在譯文中的語義/概念的統一,表現在譯出辭彙的統一上,統一有時候也稱為一致性(Consistency)。
機器翻譯現在已經非常普及,可能多數人都嘗試過Google Translation服務。機器翻譯的效能不能片面誇大,但是也絕不可忽略。目前的全自動機器翻譯譯文,即使毛病多多,也不能直接使用其結果,但是已經可以這么說,對於任何級別的翻譯,無論是初級翻譯到高級翻譯,當他們完成某些特定文體或用途的翻譯工作時,都有其用處。
翻譯質量的保證,除了譯者的責任心,還需要有相應的技術工具支持。從最簡單的拼寫檢查,到格式檢查,甚至與各類自然語言處理工具相結合的文字通順度和譯文語義完整性等等。這些工具也在快速發展,日益進步之中。翻譯工作者們也決不可以忽視。
團隊翻譯的輔助工具,如前所述,現代的語言服務不可能憑藉個人學識單打獨鬥,而是需要組成規模或大或小的團隊集體合作完成。在集體工作中,工作如何分配,工作量如何計量,工作進度如何監控,質量如何保證,團隊集體如何交流,個體知識與團隊集體知識管理,和客戶方的溝通,等等工作,既需要有先進的管理思想,更需要有完善的輔助信息管理系統來支持。通常我們把這些支持團隊翻譯任務的信息系統稱為翻譯管理系統(TranslationManagementSystem,TMS)。
翻譯技術的內涵大抵不出以上範疇,在最近二、三十年來,特別是最近二十年,隨著計算語言學的發展,計算機處理語言的能力(自然語言處理,NaturalLanguageProcessing)的增強,翻譯技術有了顯著的發展和進步。比如術語自動提取技術,一種套用是可以在翻譯前自動尋找文中的特定辭彙並提前翻譯,為團隊翻譯的一致性打下基礎,另一種套用方式則是在翻譯好的文本對中,自動分析原文和譯文,並提取出辭彙/短語翻譯對,留待進一步加工和利用。學習翻譯技術不能不重視計算語言學基礎理論和方法的學習,雖然此項學習任務對文科背景學生相對困難,但卻是未來職業發展潛力的必要保證之一。
翻譯技術的教學實踐
另外,在我們(提供中國大陸第一個計算機輔助翻譯碩士課程的北京大學軟體與微電子學院語言信息工程系)的教學實踐中,以及翻譯生產實踐中,從實用角度考慮,我們有時也採取這種分類形式:純粹的基礎性的、通用性的信息技術教學,我們放入算機技術基礎類課程,把前述第二類工具放入翻譯類課程中學習,把第三類技術中的翻譯記憶和術語管理作為“狹義的計算機輔助翻譯工具”;把其他工具以及第一類信息技術中的與翻譯活動密切相關的技術和工具,例如文字輸入和輸出,拼寫和語法檢查、機器翻譯、翻譯質量(QA)檢查工具等等作為“廣義的計算機輔助翻譯工具”進行教學。第四類團隊翻譯的輔助工具則放入“翻譯行業和翻譯管理”類課程。最細節的也相對瑣細的本地化技術與工具,則開設專門課程,進行深入探討。
總之,翻譯技術已經成為二十一世紀“懂語言、懂文化、懂技術、懂管理”(語言信息工程系的教學目標)的新時代譯員所必須要學習和掌握的東西,也是他們工作中必須依賴的工具,正如過去兩千年文明交流史中的翻譯工作者們的紙、筆和詞典。
翻譯技術研究機構
目前國內翻譯技術研究機構稱為多語工程技術研究中心,是從事多語言信息處理技術研究和科研成果轉化的專門研發機構,是我國語言信息處理技術研發、研發產品推廣、語言服務產業示範的重要基地,代表了國內語言服務技術研發和工程實踐的頂尖水平。註:本詞條的內容大部分來源於俞敬松等作者正在編纂的《信息技術與翻譯實踐》一書的前言部分。