簡介
語言學是社會科學裡最接近自然科學的學科,也是最容易與數學聯繫的學科。如今隨著語言學的發展,特別是計算語言學的發展,數學已經成為語言研究的重要工具和手段。“方法”這本書從語言學的角度來講有關數學問題,特別適合從事語言研究的人閱讀。對從事計算語言學研究的人來說,此書實為難能可貴。其中很多的理論,很多的思路,都有助於我們對一些問題的思考更深入,認識更清楚。本書使我們認識到語言學與數學的結合有著必要性和可能性。語言的形式化需要數學,需要使用數學的方法來分析和描述語言;語言又是一個抽象的符號系統,我們可以用數學思想和數學方法來研究這個特殊的符號系統。
基本定義
主要研究如何對語言的形式結構進行嚴格的數學描述,並據此創立形式化的普遍語法。認為語言擁有一種遞歸機制和生成功能。也就是說有限的語言單位和規則可以生成無限的句子,並用數學的方法將之公式化,創建普遍語法的數學模型。
套用範圍
如何對語言的形式結構進行嚴格的數學描述,並據此創立形式化的普遍語法。。但是代數語言學對語言結構、語言系統、語言本質的研究是不擅長的。
研究領域
代數語言學的研究領域,目前主要包括以下幾個方面:
①建立語言的數學模型,如美國邏輯學家、語言學家N.喬姆斯基、蘇聯數學家О .С.庫拉金娜 、語言學家Y.巴爾-希列爾分別提出了語言的生成性模型 、分析性模型和辨識性模型。
②研究形式語言及其與自動機的關係。喬姆斯基等人發現,一定類型的形式文法是與一定類型的自動機相對應的,文法是語言的生成程式,而相應的自動機則是該語言的識別程式。
③建立自然語言自動處理各種方法的理論。在人機對話研究中提出了擴充轉移網路、語義網路等方法,在機器翻譯研究中提出了從屬分析法、預示分析法、樹形分析法等方法,代數語言學要對這些方法進行理論上的研究。
④研究語音、語法、辭彙、語義中的模糊現象。
⑤研究語言的句法結構與語義解釋之間的關係,如孟德鳩語法等。
研究意義
隨著科學的發展,代數語言學正在不斷地開拓新的研究領域。
代數語言學的研究,對於電腦程式語言也有一定的指導意義,因而這門學科也引起了計算機科學家們廣泛的注意。
研究方法
代數語言學家應把注意力集中在語言本體的研究上。具體地說,形式語言學研究的是句子表層結構與深層結構之間的關係、句子的生成規律以及轉換規則。他們認為,只要找出這些規則,就能把本族語者用以產生所有合乎語法的句子的知識全部顯現出來。
代數語言學家的研究對象是句子,而且只局限於符合語法規則的句子。他們要發現的是造句的內在規律。這種規律不是某種語言所特有,而是所有語言共有的特徵。形式語言學家應以一個高度理想化的語言使用者作為研究對象和衡量結論正確與否的依據。可見,他們注重的不是實際語料,而是內省語料。
語言學專注於語言表層形式的共性,這種共性來源於初始狀態下天賦的語言機制。形式語言學家關心理想化的語言能力和句子的合乎語法性。他們研究語言能力,注重內部語言證據,往往以理想化的句子結構作語料,側重描述“核心部分”,主要表現在:
1.採用形式化的規則來描寫普遍語法。從自然主義的觀點出發,他們認為對心智的研究應像自然科學對實體的研究一樣,建立在高度抽象化的水平上,並通過構擬模型的方法進行。形式化是實現解釋和描寫的精密化、明晰化的有效方法,為各門自然科學所採用,因此也為形式語言學家所借鑑。
2.強調語言描寫的形式化,反映其力圖使語言研究精密化、科學化的努力。形式主義語法理論中的句法自主目的在於分離其他非本質因素的干擾,最大限度地專注於核心問題的研究。將語言能力理想化和採用理想化的語言材料也是基於同樣的考慮 。