圖書信息
書 名: 面向信息檢索的漢語同義詞自動識別作 者:陸勇
出版社: 東南大學出版社
出版時間: 2009年12月
ISBN: 9787564119133
開本: 16開
定價: 25.00 元
內容簡介
《面向信息檢索的漢語同義詞自動識別》是在著者碩士論文和課題研究成果的基礎上寫成。同義詞的識別在知識組織系統構建和互操作、在信息檢索、自動標引、自動文摘、自動分類、機器翻譯、自動問答等自然語言理解領域,起著重要的作用。《面向信息檢索的漢語同義詞自動識別》提出了特徵模式匹配及基於PageRank算法等多種漢語同義詞自動獲取方法,並分析、闡述了漢語同義詞自動挖掘系統的設計和構建。《面向信息檢索的漢語同義詞自動識別》可作為圖書館、信息機構及高等院校師生及相關人員學習、研究的參考書。作者簡介
陸勇,1979年生,江蘇海門人,2001年於南京農業大學信息學專業獲得理學學士學位,2005年於南京農業大學情報學專業獲得管理學碩士學位。現為南京信息工程大學綜合檔案室副主任,助理研究員。主持江蘇省教育廳學位辦專項課題1項。發表專業學術論文12佘篇,EI收錄1篇;獲國家計算機軟體著作權4項;獲江蘇省高校第六屆哲學社會科學研究優秀成果三等獎1項。主要研究方向為信息檢索和智慧型信息處理。圖書目錄
第1章 同義詞的界定及自動識別的必要性1.1 面向信息檢索的同義詞的定義
1.2 同義詞自動識別的套用
1.3 面向信息檢索的同義詞自動識別的必要性
1.4 同義詞發現的途徑和方法
1.5 本書的主要內容
第2章 國外語義相關性和相似度研究進展
2.1 基於英文單詞字面相似度的方法
2.2 基於辭彙同現分析的統計方法
2.3 基於向量空間模型的算法
2.4 基於搜尋引擎的方法
2.5 基於義類詞典的方法
2.6 基於辭彙釋義的方法
2.7 基於語料庫的方法
2.8 基於維基百科的辭彙語義相關度計算方法
第3章 中文同義詞研究述評
3.1 基於中文辭彙字面相似度算法
3.2 基於詞素的語義相似度算法
3.3 基於《同義詞詞林》的語義相似度算法
3.4 基於《知網》的語義相似度算法
3.5 基於向量空間模型的統計方法
3.6 基於信息檢索的方法
3.7 基於本體的語義相似度算法
3.8 綜合方法
第4章 基於語義體系的同義詞自動識別
4.1 《同義詞詞林》簡介
4.2 基於《同義詞詞林》語義體系的相似度算法
4.3 基於語義體系的同義詞識別方法的測評
第5章 基於模式匹配的同義詞自動獲取
5.1 語料的選擇
5.2 概念定義模式
5.3 web同義詞模式
5.4 模式獲取的方法
5.5 模式的類型和表示
5.6 模式歸納和提取的原則
5.7 模式性能評價
5.8 實驗結果
5.9 其他資源(敘詞表)同義詞模式
5.10 模式匹配的特點
5.11 本章小結
第6章 詞間關係推導
6.1 詞間關係的類型
6.2 同義關係
6.3 反義關係
6.4 上、下位關係
6.5 推導規則的表示
6.6 辭彙關係推導
6.7 本章小結
第7章 基於PageRank算法的同義詞自動識別
7.1 PageRank算法介紹
7.2 數據來源和預處理
7.3 漢語分詞和抽詞詞典
7.4 構造辭彙矩陣
7.5 PageRank值計算
7.6 數據測試結果
7.8 本章小結
第8章 面向信息檢索的漢語同義詞自動挖掘系統
8.1 同義詞自動挖掘系統的設計思路
8.2 同義詞自動挖掘系統的流程
8.3 系統總體設計
8.4 實驗結果及分析
8.5 本章小結
附錄
附錄1模式提取的同義詞結果(樣例)
附錄2PageRank算法提取同義詞結果(樣例)
名稱索引
主題索引
後記
圖表目次
圖3—1 語義分類體系示例
圖3—2 《同義詞詞林》語義分類體系
圖3—3 《知網》義原層次結構
圖4—1 《詞林》語義空間
圖4—2 語義距離的計算
圖4—3 最短路徑計算原型示意圖
圖5—1 Google檢索結果片段
圖5—2 電子版《中國分類主題詞表》顯示格式
圖6—1 詞間關係推導流程圖
圖7—1 網頁連結結構圖
圖7—2 辭彙子圖
圖7—3 辭彙矩陣
圖8—1 面向信息檢索的漢語同義詞自動挖掘系統流程
圖8—2 PageR.ank值計算模組流程圖
表1-1 擴展前後的《同義詞詞林》的主要特徵
表4—1 辭彙語義相似度計算結果樣例
表4—2 封閉實驗結果對照表
表4—3 開放實驗結果對照表
表5—1 辭彙定義的特徵詞
表5—2 Web網頁和期刊論文中的同義詞類型
表5—3 不同定義方式所占比例
表5—4 模式匹配方法提取同義詞的結果
表5—5 系統提取同義詞的效率
表5—6 從網頁及期刊論文中提取同義詞的實例
表5—7 從電子版《中國分類主題詞表》中提取同義詞的實例
表6—1 同義詞關係的性質和推導規則
表6—2 同義詞關係推導結果統計
表7—1 Pagerank算法疊代計算結果
……
……