作品目錄
第1章 引論1.1 課題的提出
1.2 面向計算機的語言學研究工作的模式
1.3 開展本課題研究工作的基礎
1.3.1 研究意義
1.3.2 研究難點
1.3.3 國內外研究動態
1.4 本書的結構安排
第2章 漢語的計算機理解
2.1 漢語的特點
2.2 漢語理解中的特殊問題
2.2.1 漢語句子的歧義切分問題
2.2.2 未登錄詞問題
2.2.3 謂語的組成問題
2.2.4 多動詞聯用問題
2.2.5 詞性歧義問題
2.2.6 主語和施事問題
2.2.7 否定詞和語義上的混論
2.2.8 形態變化問題
2.2.9 句子的詞序問題
2.2.10 漢語的特殊模式問題
2.2.11 漢語的歧義結構
2.3 小結
第3章 漢語短語的基本知識
3.1 漢語短語的標註體系
3.2 短語的組成定義
3.3 短語的句法功能分類框架
3.4 小結
第4章 基於規則的漢語短語識別
4.1漢語短語np、vp結構的統計與分析
4.1.1 漢語短語np的統計與分析
4.1.2 漢語短語vp的統計與分析
4.2 漢語短語np、vp識別的定界規則
4.2.1 獲取上下文規則的必要性
4.2.2 名詞短語np定界規則的確定
4.2.3 動詞短語vp定界規則的確定
4.2.4 上下文規則的獲取
4.3 漢語短語np、vp的句法語義分析
4.3.1 漢語短語11p的句法語義分析
4.3.2 漢語短語vp的句法語義分析
4.4 基於規則的漢語短語np、vp的自動識別
4.4.1 識別算法
4.4.2 實驗系統
4.4.3 實驗數據分析
4.5 小結
第5章 基於HMM的名詞短語識別
5.1 相關技術介紹
5.1.1 HMM簡介
5.1.2 層次分析法介紹
5.2 相關資源建設
5.2.1 資源建設方法
5.2.2 資源組成
5.2.3 資源建設
5.3 HMM模型的設計
5.3.1 HMM模型的建立
5.3.2 HMM模型的參數估計
5.3.3 NP識別過程
5.4 模型的實驗與結果分析
5.4.1 系統總體設計框圖
5.4.2 主要模組的算法設計
5.4.3 總體算法流程圖
5.4.4 實驗結果與分析
5.5 小結
第6章 基於SVM的動詞短語識別
6.1 支持向量機介紹
6.1.1 引言
6.1.2 SVM簡介
6.2 現代漢語動詞短語相關知識介紹
6.2.1 動詞短語簡介及其分類
6.2.2 用於VP識別的詞語句法屬性集合的確定
6.2.3 語料選取
6.2.4 動詞短語最佳觀察視窗的確定
6.2.5 動詞短語的分析
6.3 動詞短語特徵提取
6.3.1 靜態特徵提取
6.3.2 動態特徵提取
6.4 動詞短語向量空間模型的建立
6.5 基於SVM的動詞短語識別
6.5.1 構造SVM分類器
6.5.2 基於SVM的動詞短語識別
6.6 實驗模型及結果分析
6.6.1 子語料的形成
6.6.2 基於SVM的動詞短語識別方法實驗系統及結果分析
6.7 小結
第7章 短語結構歧義類型與消解策略分析
7.1 從計算機處理的角度看漢語短語結構歧義
7.2 包含終結符的歧義格式與不包含終結符的歧義格式
7.3 外顯型歧義格式與內含型歧義格式
7.4 真歧義格式、準歧義格式、偽歧義格式
7.5 短語結構歧義的消解策略分析
7.5.1 短語結構歧義的消解策略概述
7.5.2 短語結構歧義的消解方法及舉例
7.6 小結
第8章 關於短語識別的評測問題
8.1 評測在軟體開發中的位置
8.1.1 引言
8.1.2 評測在軟體開發過程中的位置
8.1.3 ISO9126標準
8.2 評測模型的定義
8.2.1 評測中的主要概念——形式和自動化概述
8.2.2 參數化測試台(PTB)
8.3 短語識別的評測框架及部分實現
8.3.1 屬性集
8.3.2 需求
8.3.3 方法
8.3.4 測量
8.3.5 翻譯評測的度量
8.3.6 評測過程
8.3.7 分詞與詞性標註自動評測系統
8.3.8 短語分析評測標準及其度量方式
8.3.9 測試結果提交格式
8.4 小結
第9章 結語
9.1 對本課題研究工作的總結
9.2 規則方法與統計方法的比較
9.3 進一步的研究計畫
附錄1 符號代碼說明
附錄2 《現代漢語語法信息詞典》動詞庫專有項目
附錄3 SMO算法的偽碼
附錄4 現代漢語短語結構歧義格式舉例
附錄5 測試句樣例
參考文獻
後記