簡介
歧義作為一種常見的語言現象,是指一個語言形式具有兩個或多個以上的意義,或在結構上可做兩種或多種的分析,歧義存在語言的各個層面,即辭彙層面、語法層面、語音層面和餘勇層面。模糊翻譯是一種基於模糊邏輯方法的用於處理機器翻譯中語義歧義的方法。主要是為了提高不同語言之間自動機器翻譯的準確性。
模糊邏輯
模糊邏輯是處理部分真實概念的布爾邏輯擴展,或是研究不確定性(特別是模糊性)推理與知識表示的邏輯基礎及其套用的學科。主要包括三個方面:狹義模糊推理、廣義模糊推理與模糊(近似)推理。狹義模糊推理是模糊集理論乃至模糊數學的邏輯基礎;廣義模糊推理為不確定性的處理提供較為完整的邏輯框架;模糊邏輯可套用於智慧型化電器產品的開發與工業過程控制,這些實際套用的理論基礎是模糊推理。
經典邏輯堅持所有事物(陳述)都可以用二元項(0或1,黑或白,是或否)來表達,而模糊邏輯用真實度替代了布爾真值。這些陳述表示實際上接近於日常人們的問題和語意陳述,因為“真實”和結果在多數時候是部分(非二元)的和/或不精確的(不準確的,不清晰的,模糊的)。真實度經常混淆於機率。但是它們在概念上是不一樣的;模糊真值表示在模糊定義的集合中的成員歸屬關係,而不是某事件或條件的可能度(likelihood)。要展示這種區別,考慮下列情節:Bob在有兩個毗鄰的屋子的房子中:廚房和餐廳。在很多情況下,Bob的狀態是在事物“在廚房中”的集合內是完全明確的:他要么“在廚房中”要么“不在廚房中”。但Bob站在門口的時候怎么辦呢?它可被認為是“部分的在廚房中”。量化這個部分陳述產生了一個模糊集合成員關係。比如,只有他的小腳趾在餐廳,我們可以說Bob是0.01“在廚房中”。只要Bob站在了門口,就沒有事件(如拋硬幣)能解決他完全的“在廚房中”或“不在廚房中”。模糊集合是基於集合的模糊定義而不是隨機性。
模糊邏輯允許在包含0和1的它們之間集合成員關係值,同於黑和白之間的灰色,在它的語言形式中,有不精確的概念如"稍微"、"相當"和"非常"。特別是,它允許在集合中的部分成員關係。
機器翻譯
機器翻譯是利用計算機實現從一種自然語言到另一種自然語言的自動翻譯技術。簡單來說,機器翻譯是通過將一個自然語言的字辭取代成另一個自然語言的字辭。藉由使用語料庫的技術,可達成更加複雜的自動翻譯,包含可更佳的處理不同的文法結構、辭彙辨識、慣用語的對應等。機器翻譯方法公認可以分為基於規則的機器翻譯和基於語料庫的數據驅動的機器翻譯。基於規則的機器翻譯由詞典、規則庫以及各類知識庫構成知識源;基於語料庫的數據驅動的機器翻譯以語料套用為核心,進一步分為統計機器翻譯、基於實例的機器翻譯和翻譯記憶。從人為的翻譯來看機器翻譯,翻譯的過程可被細分如下:
•解譯來源文字的文意
•重新編譯此解析後所得的文意至目標語言。
•在這看似簡單的步驟之後其實是複雜的認知操作。要能解譯來源文字的完整意義,一個譯者必須能夠分析與詮釋整段文章的所有特徵,必須能夠深度的了解其文法、語義、語法、成語等等,相當於了解來源語言的文化背景。譯者同時也必須兼備目標語言相同深度的知識。
於是,這對機器翻譯便是一項挑戰,即:要如何設計一個程式使其能夠如同真人一樣的“了解(認知)”一段文字,並且能夠“創造”一段好似真人實際寫作出來的目標語言的文字。