中介成分體系
正文
根據外語-漢語機器翻譯特點建立的一套特殊的句子成分體系。其中各個成分既不是原語成分,也不是譯語成分,而是介於原語和譯語之間的句子成分。中介成分是通過原語語法分析和語義分析並考慮到向譯語的轉換而得出的,它們屬於“深層結構”的範圍。中介成分不僅能表示成分的功能意義,而且還能表示成分的分布關係(成分與成分之間的聯繫,成分在句中的位置)和反映兩種語言的對比差異。中介成分體系不單純是一套標記句子成分的符號,更重要的是進行多種語言對一種語言的翻譯的工具。它還體現了目前中國多數機器翻譯規則系統的編制方法和中國機器翻譯工作者關於句子切分的理論認識以及他們對翻譯技術的處理原則。
中介成分體系和翻譯系統的關係 機器翻譯包括3個過程:分析 (Analysis),轉換(Transformation)和綜合(Synthesis) 。這3個過程可以用3種方法實現:
①A →TS
②AT →S
③A →T →S
利用第 1種方法編制的規則系統,稱為獨立分析相關綜合的系統。獨立分析,就是原語分析只根據原語本身的結構特點進行,不考慮譯語的因素,因此分析的最終結果是原語句子成分;相關綜合,就是根據原語分析所得的成分進行原語向譯語的轉換,並在此基礎上按譯語規範組成譯文。
利用第 2種方法編制的規則系統,稱為相關分析獨立綜合的系統。這裡的相關分析,是指在原語結構分析的基礎上實現原語句子成分向譯語的轉換,同時在轉換過程中要參照譯語規範,因此分析的最終結果是一套中介成分;這裡的獨立綜合,是指只需根據中介成分本身提供的移位信息等組成譯文。
利用第 3種方法編制的規則系統,稱為獨立分析獨立綜合的系統。這種系統的特點是原語分析和譯語綜合都獨立進行,而原語向譯語的轉換則利用一個獨立的轉換程式,或媒介語來實現。
3種類型的系統都可進行一對一的翻譯,其中獨立分析獨立綜合的系統還可進行逆向翻譯。在參與翻譯的語言增多的情況下,第 1種系統適用於“一對多”,第 2種適用於“多對一”,第3種適用於“多對多”。如果把本族語譯成多種外語(例如5種),採用第1種系統比較適當。這時只需研製一套為各語言通用的分析程式(獨立的)和 5套與之相應的綜合程式(相關的)即可。但是,如果目的是把這幾種外語譯成本族語,採用第2種是完全必要的。這時只需編制 5套分析程式(相關的)和 1套綜合程式(獨立的)。如果考慮多對多翻譯,就要依靠第 3種,其轉換部分可通過媒介語來實現。
根據中國目前的具體情況,要將各國的科技文獻翻譯成漢語,採用相關分析獨立綜合系統來進行多對一翻譯是非常有利的。而採用這種系統,必然要有一套符號來標記相關分析的結果。這就是這套中介成分體系的由來。
制定中介成分的原則 一般語法劃分出來的句子成分不能滿足機器翻譯的需要,因為它們只能表示成分的功能意義,而不能表示成分的分布關係並反映兩種語言的對比差異。然而,一個成分如果本身不能表示分布關係,機器便不能得到它在句中與哪個詞發生聯繫和處於什麼位置的任何信息;如果本身不能反映出兩種對比語言的差異,機器便不能在綜合加工時直接得到把原語改造成譯語的任何根據。因此,中國學者結合機器翻譯的特點和要求提出了新的劃分成分的原則。
①邏輯語義原則:同傳統語法中劃分句子成分的原則基本一致。根據這一原則,劃分出6大類句子成分,即主語類 、謂語類、賓語類 、補語類、定語類、狀語類。插入成分和獨立成分是狀語的兩個次類。
②結構層次原則:句子是分層次的。該體系以動詞(謂語)中心論為基礎,認為句中最主要的一層是謂語。謂語是句中最大的聯繫中心,同時也是調整詞序的主軸心。直接與謂語發生關係的成分叫直接成分(簡稱 A成分),與謂語以外任一其他成分發生關係的成分,叫間接成分。而間接成分又根據它的聯繫詞的遠近分作兩種:是前一詞(組)或後一詞(組)的稱為近間接成分(簡稱 B成分),不是前一詞(組)或後一詞(組)的稱為遠間接成分(簡稱C成分)。這樣,上述6大類除定語無A成分外,又可分為A、B、C一些子類。
另外,根據謂語中心論的觀點,非限定動詞(分詞、不定式以及部分動名詞)也是句中較大的聯繫中心(它們可能帶一堆賓語和狀語),同時也是調整詞序過程中比較重要的次軸心。因此,在這個體系中賦予“偏謂語”特徵。“偏謂語”本身可以出現在直接成分層,也可以出現在間接成分層,但它所帶的成分則只能是間接成分。
③對比差異原則:a.根據成分在對比的兩種語言中的位置相同與否,可分為“前置成分”、“原位成分”和“後置成分”。b.根據成分在對比的兩種語言中是否有介詞,可分為“介詞性成分”和“非介詞性成分”。
這套成分體系包括幾十個中介成分。但這只是一個基礎,人們在處理各自的語言時需根據具體情況有所增減,因為任何一對語言都不可能包括所有這些成分,同時也多少存在一些個別現象。這個體系不僅解決了相關分析獨立綜合的問題(即不管翻譯什麼語言,原文分析是什麼樣,而譯文綜合就使用一套),而且為譯文綜合創造了極為有利的條件。例如,機器見到“賓 A”,便可知道它是同謂語發生聯繫的直接成分,沒有移位信息,故可置之不理。又如見到“前介定 B”,便可知道它是一個近間接成分,是介詞短語作定語用,有前移信號,而且要移到前一詞(成分)之前,因為 B成分的聯繫詞是前一詞或後一詞。
中介成分的建立 總括地說,這套成分體系是以結構分析為主要手段以語義分析為輔助手段建立起來的。具體步驟如下:一個句子通過查詞典之後,其中絕大部分詞已經得到詞類標記及其他一些特徵,包括根據詞尾分析得到的特徵。沒有得到詞類標記的多半是同形詞,經過上下文分析,也會得到確定的詞類。下一步便是構成詞組。根據英漢對比研究,可構成 7類詞組,即名詞詞組、動詞詞組 、形容詞詞組 、分詞詞組、不定式詞組、介詞詞組、副詞詞組。這些詞組,通過上述制定中介成分三原則的加工,便可得出中介成分。而介詞在句中起著重要的媒介作用,因此,介詞的外理,對於中介成分的確定是一個關鍵問題。
當語法分析發生困難,不能解決句法歧義現象和得出正確譯文時,要求助於語義分析。例如,We shallhave a symposium on Monday和 We shall have asymposium on mathematics tomorrow這兩句話,結構完全相同,如果單靠語法分析,很難得出on- phrase的不同作用。然而,藉助語義分析,第 1個on- phrase中的Monday為時間名詞,與symposium無語義联系,故可判定為狀語,作“前介狀A”,第2個on-phrase中的mathematics為學科名詞,與 symposium有語義联系,故可判定為定語,作"前介定B"。 又如,The fish was bought by the river 和 The fish wasbought by the cook.兩句話中都有一個由by引起的介詞詞組,並都處於謂語之後,都得“前介狀 A”成分,但前一個by當“在……旁邊”講,而後一個當“由”講,其差別僅在於 river是表示地物的名詞,而cook是有生命的名詞。
參考書目
劉湧泉等著:《中國的機器翻譯》,知識出版社,上海,1984。