人物經歷
劉海濤,1962年生於山西。1979年考入西安冶金建築學院,學習工業自動化專業。1983年畢業分配到某特大型國有企業,從事企業信息化工作,業餘時間研習語言學及套用語言學,曾任教授級高級工程師、企業副總工程師等職。2002年調入中國傳媒大學,從事語言學及套用語言學教學研究工作。2006年獲得語言學及套用語言學專業博士學位,後任中國傳媒大學套用語言學研究所所長,教授,博士生導師。2010年10月至今任浙江大學外語學院特聘教授。
性別: 男;職稱: 教授;
主要研究領域:
計算語言學與計量語言學,配價理論和依存語法,國際語學,語言規劃和語言政策 。
研究方向
語言規劃和語言政策
劉海濤教授在這一方面的主要研究成果及貢獻是:
(1)《計畫語言和語言規劃關係初探》(1996)一文認為,計畫語言研究對語言規劃有重要的意義。計畫語言構建的理論和實踐能為語言規劃中的本體規劃提供有益的經驗,而計畫語言的社會變化過程,又能為語言地位規劃提供寶貴的材料。
(2)《語言規劃和語言政策——從定義變遷看學科發展》(2005),分析了國內外30多種有關語言規劃的定語,認為語言規劃正在經歷這樣的轉變:從工具觀到資源觀的轉變;從結構主義到後現代主義的轉變;從單變數系統到多變數系統的轉變;從實用主義到語言人權的轉變;從語言問題到語言生態的轉變;從單純的語言學領域向社會學、政治學以及其他學科的轉變。
(3)《歐洲聯盟的語言狀況和語言政策》(2006),對歐盟的語言問題進行了較系統的研究,認為語言政策不能僅僅是停留在書面的政策,而應該是能夠解決實際問題的對策。除此之外,劉海濤教授也為國內外專業刊物撰寫了大量的語言規劃和語言政策書評。
國際語語言學
是一個從多角度研究國際語言交流的領域。劉海濤教授在這一領域的主要貢獻有:(1)《國際語學的發展方向》(1999,世界語),將國際語學的發展概括為社會學路向和符號學路向,這種劃分有益於更好地理解這一學科。
(2)《皮欽、克里奧爾和計畫語言》(2001,英語),從社會學和語言學的角度,比較研究了計畫語言和接觸語言的異同,對這些特殊語言的誕生、發展和生存環境進行了較為詳細的研究。
按照國外學者的說法,此文可能是目前這一領域研究最全面、透徹的文章。
(3)《國際語的中立性》(2006,英語),提出語言的中立性是一種設計焦急場景或政治的概念,而不是純粹的語言學概念,並在國際語研究中引入了“去中立性”的新概念。另有多篇文章
探討了國際語學和計算語言學的關係,以及計畫語言研究對語言學的意義和價值。
主要貢獻
計算機語言依存算法;
劉海濤教授在這一方面的主要研究成果和貢獻是:
(1)《結構化語言知識庫在自然語言處理中的套用》(1992),這可能是國內最早探討句法標註語料庫(樹庫)作為自然語言處理知識源的文章。
(2)《自然語言處理中的媒介語問題》(1993),探討了計算語言學和媒介語的關係,將媒介語納入國際語學的研究範疇,提出了媒介語的重要性(經濟型、工具性),從媒介語的類型分析中揭示其應滿足的條件性(規則性、精確性、表達力)。
(3)《維根斯坦語言哲學對計算語義學的影響》(1993),旨在為基於統計和數據的計算語言學套用尋求哲學基礎。
(4)《計算語言學套用中的模組化概念》(1995)把計算語言學套用的開發和研製分為三個層面:理論語言學、計算語言學和計算機科學,這種分類有助於不同知識背景的人更好地融合到計算語言學套用的研究中來。
(5)《依存語法和機器翻譯》(1997),探討了依存語法的一些基本問題,對依存語法在機器翻譯領域的套用做了簡要的介紹和論述。這篇文章目前是國內依存語法領域引用率最高的文獻之一。
(6)《關於自然語言計算機處理的幾點思考》(2001),對語言和智慧型、語言是可以計算的嗎?語義和分解、歧義與知識等計算語言學的基本問題進行了探討。
(7)《計算語言學課程設定和教學》(2005),介紹了中國傳媒大學計算語言學相關課程的設定情況,認為大學和研究生計算語言學課程的設定應該重點關注語言學和計算機科學的交叉部分,即:語言的形式化問題。
(8)《面向樹庫建設的漢語依存句法》(2006,英文),和《漢語依存樹庫的建設和套用》(2007,英文),提出了一種漢語依存句法,討論了如何建設和使用漢語依存樹庫。
(9)《自然語言處理的機率配價模式理論》(2007),提出了一種機率配價模式理論,這種理論更好地解釋統計自然語言處理的一些問題,是對傳統配價理論的擴充和發展。
(10)《基於樹庫和機器學習的漢語依存語法句法分析》(2007),和《影響依存句法分析的因素探討》(2007),分別探討了如何通過修改樹庫標註體系來提高句法分析精度的方法以及影響依存句法分析精度的主要因素。
(11)《依存距離的機率分布》(2007,英語)的研究表明,自然語言的依存距離符合右截尾Zeta分布,隨機語言則沒有這樣的特徵。在三種語言中,自然語言的平均依存距離是最小的。
(12)《漢語句法網路的複雜性研究》(2008,英語),採用複雜網路分析技術研究了由“新聞聯播”和“實話實說”構造的兩個漢語句法網路,兩個網路均為小世界和無尺度網路,但網路特徵有較明顯的差異,這項研究開闢了用複雜網路研究語言(體)的新路子。
(13)《句法網路在語言網路中的作用》(2008,英語),通過比較兩個隨機生成網路和句法網路的複雜網路特徵,研究了句法在語言網路中的作用。按照論文匿名評閱人的說法,這是一個生命科學(語言學和心理學)的重要論題。
(14)《基於依存樹庫的漢語句法計量研究》(2008)指出:漢語的依存距離均值約為2.84,漢語中40%-50%的依存關係不是在相鄰的詞之間形成的;在語言類型方面,漢語是一種支配詞置後略占優勢的混合型語言,一種SV、VO和AdjN語言;漢語支配詞居前的依存距離均值要明顯大於支配詞置後的依存距離均值。