內容簡介
作者從事計算語言學研究幾十年,潛心探索出語言符號的七種新特性。《語言與數學》詳細論述了這七種特性與數學的關係,反映了當前國內外語言與數學關係研究方面的最新成果。
《語言與數學》內容豐富,講解深入淺出,文字流暢易讀,可供廣大語言學、教學工作者,以及對語言與數學感興趣的相關人士閱讀。
語言符號的隨機性與統計數學、語言符號的冗餘性與隨機過程、語言符號的離散性與集合論、語言符號的遞歸性與公理化方法、語言符號的層次性與圖論、語言符號的非單元性與複雜特徵的運算、語言符號的模糊性與模糊數學。
作者簡介
馮志偉,1939年生,雲南昆明人,計算語言學家,專門從事語言學和計算機科學的跨學科研究。他先後在北京大學和中國科學技術大學研究生院兩次研究生畢業,獲雙碩士學位。曾師從法國著名數學家、原國際計算語言學委員會主席沃古瓦(B,Vauquois)教授專門研究數理語言學和機器翻譯問題。
作者現為國家教育部語言文字套用研究所研究員、博士生導師,任中國語文現代化學會副會長、中國人工智慧學會理事、國家語言文字工作委員會21世紀語言文字規範(標準)審定委員會委員等職。在國際上,任TELRI(Trans-European Language Resources Infrastructure)(跨歐洲語言資源基礎建設工程學會)的顧問委員會委員,UCL(International Journal of Corpus Ling Linguistics)(語料庫語言學國際雜誌)的編委等職。
他的主要著作有《數理語言學》(上海知識出版社1985年),《機器翻譯研究》(中國對外翻譯出版公司,2004年),《自然語言處理的形式模型》(中國科學技術大學出版社,2009年)等,主要譯著有《自然語言處理綜論》(電子工業出版社,2005年)等,發表論文200餘篇。
目錄
資訊時代語言學研究的基礎——讀《語言與數學》有感
再版前言
緒言——語言學是數學和人文科學之間的橋樑
第一章 語言符號的隨機性與統計數學
第1節 語言符號的隨機性
第2節 字頻和詞頻的統計
第3節 語音統計研究
第4節 方言研究中的統計方法
第5節 計算風格學
第6節 古代語言研究中的統計方法
第二章 隨機過程與語言符號的冗餘性
第1節 語言的使用與馬爾可夫鏈
第2節 語言的熵和語言符號的冗餘性
第三章 語言符號的離散性與集合論
第1節 語言符號的離散性
第2節 語言的集合論模型
第四章 語言符號的遞歸性與公理化方法
第1節 語言符號的遞歸性
第2節 生成語法的公理化方法
第五章 語言符號的層次性
第1節 語言符號的層次性
第2節 樹形圖
第六章 語言符號的非單元性與複雜特徵的運算
第1節 語言符號的非單元性
第2節 複雜特徵的運算
第七章 語言符號的模糊性與模糊數學
第1節 語言符號的模糊性
第2節 模糊數學在語言研究中的套用
附錄:胡耀邦同志鼓勵我研究數理語言學
序言
1989年,當時的北京大學校長丁石孫教授決定出版一套《數學·我們·數學》的叢書,內容包括“數學與經濟”、“數學與軍事”、“數學與教育”、“數學與語言”等許多方面,丁石孫校長委託北京大學數學系馬希文教授找我,希望我寫一本《數學與語言》。我是一個語言學工作者,當時正從事機器翻譯和信息檢索等套用系統的開發研究,接觸到不少語言學中的數學方法問題,對於數學與語言之間關係的問題作過一些思考,因此,我欣然接受了丁石孫教授的這個任務,歷時兩年,寫成了這本《數學與語言》專著,於1991年出版。
在這本專著中,我從數學的角度,對於自然語言的性質進行了深入的思考,明確地指出,除了索緒爾過去提出的語言符號的任意性之外,語言符號還具有另外7個明顯的特性,它們是:語言符號的隨機性、語言符號的冗餘性、語言符號的離散性、語言符號的遞歸性、語言符號的層次性、語言符號的非單元性、語言符號的模糊性。我提出的語言符號的這7個新的特性,顯然補充了索緒爾關於語言符號任意性的思想,使我們對於語言符號的特性有了更加深刻的認識。
我在本書中提出語言符號的這7個新的特性之後,引起了許多語言學家的關注,有的語言學家指出,語言符號的這7個特性,反映了“資訊時代的語言觀”。語言學家劉海濤在本書的書評中指出,語言符號的這7個特性應當成為“資訊時代語言學研究的基礎”,並指出,本書“值得每一位語言工作者研讀”。19年過去了,我提出的語言符號這7個特性的“語言觀”仍然顯得很有生命力,越來越多的事實將會繼續證明這種“語言觀”的正確性。
本書在1991年出版時只印了1400冊,早已銷售一空。不少讀者儘管聽說過此書,但是,踏破鐵鞋無覓處,根本買不到此書。
後記
考前三周
後面的二十幾天是至關重要的複習階段,也是萬事俱備,只欠東風的階段。很多同學的複習過程和模考結果,集中反映出兩點問題:
(1)複習時間很長,花費的精力也不少,尤其基礎不好,或者沒學過某些科目的同學更加明顯。
(2)努力很長時間,但是收效甚微,甚至在模擬考試中有退步現象,更危險的是連30分都不到。
現 在離考試二十幾天,只能找找最大限度提高考試成績方法。(注意:不一定是提高數學能力。)
(1)認真回憶一下,在整個複習時間中,用於做題的時間占的比例,如果少於1/3,說明缺乏動手練習,不能完成知識轉化。
(2)自己是不是只是一直在看書,沒有親身做題,光看不做題,是萬萬不行的。因為缺少獨立方法的訓練,很難達到快速解題的狀態。
(3)自己做題的數量,是不是把課上的基本題目都做了,做完後有沒有體會到這個題目的方法,舉一反三,否則的話,只在就題論題,不能融會貫通。
(4)複習是否遵從由易到難的順序,從最薄弱的地方開始突擊,大家記得“木桶效應”嗎?在此尤為顯著,不從最薄弱的地方突擊,分數會受到很大的制約。
(5)這幾次模考完後是否認真總結分析了嗎?找到錯誤原因了嗎?具體分析如下
1)因為自己根本沒有思路,根本不會做而失分題目占多少比重(最好不能超過7個題目)。
2)自己看到考題覺得比較眼熟的題目,占多少比重?而這些題目自己能做對的又占多少?
3)自己做錯了,但是一看到答案,馬上就能醒悟的題目占多少比重?
(註:這類題目越多,說明你後面提高的潛力很大,即使剛開始得了很低的分數)。
4)因為粗心錯誤,比如看錯題目,解方程出錯,基本運算公式出錯,占多少比重?