計算語言學導論

《計算語言學導論》是2005年10月中國社會科學出版社出版的圖書,作者是翁富良、王野翊。

目錄

第一章計算語言學簡介(1).

第一節計算語言學是一門邊緣科學(1)

第二節計算語言學研究的基本問題(3)

第三節計算語言學研究的基本方法(4)

一、理性主義和經驗主義:計算語言學研究方法的哲學分野(4)

二、計算語言學研究方法(5)

第四節計算語言學的套用(8)

第二章預備知識(10)

第一節離散數學基礎(10)

一、集合及相關的概念(10)

二、圖及相關的概念(11)

三、字元串及相關的概念(12)

四、棧及相關的概念(15)

五、序及相關的概念(15)

第二節機率統計理論基礎(17)

第三節資訊理論基礎(26)

第三章形式語言及自動機(34)

第一節形式語言和自動機的直觀意義(34)

第二節形式語言和自動機的定義(35)

一、形式語言的定義(35)

.二、自動機的定義(39)

第四章語法理論和表示形式(46)

第一節gb理論(46)

第二節辭彙功能語法(49)

第三節廣義詞組結構語法(51)

第四節樹連線語法(53)

第五節鏈語法(55)

第五章語言的識別與分析(57)

第一節有限狀態語法的識別和分析算法(58)

第二節上下文無關語法的識別和分析算法(58)

一、移進—歸約法(58)

二、由底向上的圖表法(64)

三、歐雷算法(69)

四、glr算法(70)

五、鏈語法的識別算法(82)

第三節其他類型的分析器(85)

一、基於原則的分析方法(85)

二、基於歸一的分析方法(87)

第六章計算語義方面的一些工作(91)

第一節語義理論簡介(91)

一、詞的指稱作為意義(91)

二、心理圖象,大腦圖象或思想作為意義(92)

三、說話者的意圖作為意義(92)..

四、過程語義(93)

五、辭彙分解學派(93)

六、條件真理模型(94)

七、情景語義學(94)

八、語義網路(95)

九、模態邏輯(95)

第二節計算語義學的一些代表工作(96)

一、概念依賴理論(96)

二、選擇限制學說(99)

三、指代化解(101)

四、計算語義學的一些其他方面(103)

第七章容錯分析(106)

第一節基於關鍵字或中心詞的方法(106)

第二節省略不識詞的方法(107)

第三節元規則方法(108)

第四節同化法(109)

第八章機率語法(116)

第一節ngram(116)

一、減值法(discounting)(118)

二、刪除插值法(deletedinterpolation)(121)

三、基於詞分類的ngram(122)

第二節隱馬爾柯夫模型(122)

一、馬爾柯夫模型(122)

二、隱馬爾柯夫模型(124)

三、向前算法(126)

四、韋特比算法(130)

五、向前向後算法(132)

第三節機率上下文無關文法(136)

一、向內算法(37)

二、韋特比算法(139)

三、向內向外算法(140)

第九章語言學習(145)

第一節詞分類(145)

第二節詞法學習(148)

一、語法框架(148)

二、辭彙選擇(lexicalselection)(152)

第三節語法學習(155)

一、有限狀態自動機的機器學習(155)

二、語接推導的理論問題(159)

三、貝葉斯推理在語怯推導中的套用(161)

第十章當前計算語言學的研究(166)

第一節統計學機器翻譯(166)

一、ibm統計學機器翻譯(167)

二、參數訓練(168)

三、源語言搜尋(169)

第二節詞類標識(part-of-speechtagging)(170)

一、隱馬爾柯夫模型詞類標識(171)

二、基於規則的詞類標識(172)

第三節歧義化解(disambiguation)(174)

一、基於結構的語法歧義化解(l75)

二、統計學語法歧義化解(177)

三、辭彙歧義化解(lexiicaldisambiguation)(180)

附錄a漢英術語對照(185)

附錄b有關計算語言學的重要期刊和會議(194)

附錄c參考文獻(196)

前言

語言是反映人的思維的最重要的一面鏡子,又是人與人之間交流的最重要的媒介。對語言的研究,是一個經久不衰的古老課題。幾千年來,中外學者從語言與思維、語言與現實的關係等不同角度。在詞源、注釋、分類、語法等各個方面開展了廣泛的研究。近一兩百年來,西方學者在邏輯學、數學和分析哲學方面的成果,大大推動了語言形式他的研究。而隨著計算機科學的發展,建立語言的形式化計算模型成為語言學的重要課題。計算語言學作為以形式化的計算模型來分析、理解和處理語言的科學也就應運而生。而信息革命的展開,更使計算語言學的研究達到了一個空前的程度。.

如果說紙的發明對人類文明的繼承光大有著巨大作用的話。那么語音和語言技術的發展,將對人類各語種之間的交流,各文化體系間的促進與提高至關重要。語言和語音技術為語言文本和會話的檢查、理解、合成、翻譯、重組,提供了有效的自動化工具,使得靠人工進行的信息交流和信息處理能夠逐步地為具有智慧型的語言技術所取代。在信息革命使世界日新月異的今天。計算語言學的發展成為我們是否能夠跟上世界潮流的一個重要因素。這一點應該激起廣大研究人員的高度緊迫感,同時也應該獲得科研基金組織和工商界有識之士的重視,對計算語言學的研究給多長期的大力支持。..

本書的作者希望此書的出版能夠對國內計算語言學的發展起到一定的促進作用。由於篇幅和作者水平的限制,我們不可能面面俱到地覆蓋整個領域。我們在選材時一方面注重本領域的基礎性的經典工作,希望讀者閱讀理解後能夠舉一反三,用於解決實際問題;另一方面我們側重於介紹一些當前國際計算語言學界的研究重心,希望有關的研究人員能夠站在該領域的前沿。

本書的對象是大學計算機專業、數理統計專業及語言學專業的高年級學生或研究生,與計算語言學有關的科研人員,以及其他有興趣的讀者。由於計算語言學的綜合性特點,如有條件,作者建議組織多學科的興趣小組,相互交流,共同提高。

本書第2章第1節、第3章、第4章、第5章、第6章、第7章由翁富良撰寫,第1章、第2章第2、3節、第8章、第9章、第10章由王野翊撰寫。...

序言

計算語言學導論

中國社會科學出版社根據讀者的要求,決定再版《叢書》。再版首先是包括增加《叢書》的書目,從第一版的八種增加到現在的十二種;其次是修訂增補第一版各書的內容,根據不同學科的進展,增加新的章節;最後是借再版的機會改正第一版中的印刷錯誤。.

《叢書》再版,首先得感謝讀者,沒有讀者的熱情支持和鼓勵,再版《叢書》是不可能的。其次是感謝編委,也就是《叢書》的作者們。沒有《叢書》作者們的辛勤勞動和豐碩的研究成果贏得讀者的歡迎,再版《叢書》更是不可能的。另外,特邀編委的熱情支持和幫助、責任編輯以及社科出版社的鼎力相助也是《叢書》得以成功再版的原因之一。在此一併致以衷心的謝意。..

較之第一版,再版增加了《羅曼語句法經典》、《音系與句法的交叉研究》、《音段音系學》和《關聯交際與認知》四種書。如在第一版前言中所指出,《叢書》前八種書主要覆蓋美國語言學系研究生(博士、碩士)的八門必修課。再版時增加的四種書屬於選修課或專題研究的範圍。編委的工作單位有的有了變化,再版時作了相應的改變。特邀編委有的已經退休,再版時還按以前的工作單位列出。

《叢書》再版,錯誤、疏漏仍在所難免,敬請專家學者批評指正。

最後,希望《叢書》的再版能在國內外語言學理論的研究、教學,以及介紹和交流等方面再次起到積極的作用。...

《當代語言學理論叢書》主編

黃正德許德寶

相關詞條

熱門詞條

聯絡我們