基本信息
出版社: 東南大學出版社; 第1版 (2009年12月1日)
叢書名: 情報檢索語言與智慧型信息處理叢書
正文語種: 簡體中文
開本: 32
ISBN: 7564119136
條形碼: 9787564119133
商品尺寸: 20.8 x 14.6 x 1 cm
商品重量: 159 g
ASIN: B003DIV1W2
內容簡介
《情報檢索語言的兼容轉換》內容簡介:作者通過總結十幾年來在信息管理、計算機套用技術和地理信息系統等領域的工作成果,較為系統地闡述了情報檢索語言兼容轉換的研究意義、技術方法和套用案例,探討了中文文本的關鍵字抽取技術和中圖法知識庫構建技術。全書內容組織以智慧型化、套用化發展趨勢為導向,從傳統方法到機器學習方法,從文獻知識組織到領域信息處理。
作者簡介張雪英,1970年生,四川省仁壽人。南京農業大學信息管理專業文學士和經濟管理專業管理學碩士,南京理工大學計算機套用專業工學博士。2003至2005年德國波恩大學計算機系訪問學者。現為南京師範大學地理科學學院教授,主要從事地理信息的智慧型處琿與套用研究。主持1項國家“863”課題和1項國家自然科學基金,參與10餘項國家“863”課題、國家自然科學基令、國家社會科學基金和國際合作項目。在國內外期刊發表學術論文30餘篇,出版專著1部。
目錄第1章 緒論
1.1 多元信息空間
1.2 情報檢索語言的兼容性
1.3 情報檢索語言的兼容模式
1.3.1 標準化
1.3.2 中介詞典
1.3.3 巨觀詞/微觀詞表
1.3.4 集成詞表
1.4 情報檢索語言的兼容轉換
1.4.1 基本概念
1.4.2 兼容轉換方法
1.4.3 兼容轉換類型
1.5 國內相關研究進展
1.5.1 分類語言一主題語言的兼容轉換
1.5.2 主題語言一主題語言的兼容轉換
1.5.3 自然語言一主題語言的兼容轉換
1.6 小結
第2章 基於集成詞表的敘詞錶轉換
2.1 敘詞表的比較分析
2.2 集成詞表的構建
2.2.1 數據獲取
2.2.2 源數據格式轉換
2.2.3 補充入口詞
2.2.4 數據格式:
2.3 敘詞錶轉換系統
2.3.1 系統結構
2.3.2 轉換模式
2.3.3 系統操作界面
2.4 性能評價
2.5 小結
第3章 基於相似度計算的分類錶轉換
3.1 技術流程
3.2 句法分析處理n
3.3 字面相似度計算模型
3.4 轉換模型和算法
3.5 分類錶轉換系統
3.5.1 數據管理
3.5.2 自動轉換
3.5.3 人工轉換
3.6 實驗評估
3.6.1 實驗數據
3.6.2 評估指標
3.6.3 實驗結果分析
3.7 小結
第4章 基於FLogl的分類表——鋇詞錶轉換
4.1 並行文獻資料庫的構建
4.2 信息的對數量度原理
4.3 最大似然估計法
4.3.1 基本原理
4.3.2 LogL計算
4.4 分類號一主題詞對照資料庫的構建
4.4.1 基於LogL的方法
4.4.2 標準對照庫的生成
4.4.3 基於MARC的方法
4.5 轉換模式
4.5.1 分類號一主題詞的轉換
4.5.2 主題詞一分類號的轉換
4.5.3 系統界面設計
4.6 實驗評估
4.7 小結
第5章 基於粗糙集的情報檢索語言轉換
5.1 經典的語義相似度計算方法
5.2 粗糙集理論
5.3 kst轉換模型
5.4 語義轉換類型
5.4.1 一對一轉換
5.4.2 一對多轉換
5.4.3 多對多轉換
5.4.4 轉換關係整合
5.5 實驗評估
5.6 小結
第6章 基於FN-gram的關鍵字自動抽取
6.1 傳統方法概述
6.2 技術流程
6.3 GF/GL權重法
6.4 關鍵字篩選算法
6.5 性能評價
6.5.1 相似度係數
6.5.2 基於文本分類的方法
6.6 小結
第7章 《中圖法》知識庫的構建及套用
7.1 《中圖法》概況
7.2 《中圖法》知識庫的結構分析
7.3 《中圖法》知識庫的構建技術
7.4 《中圖法》知識庫的套用
7.5 小結
名稱索引
主題索引
後記
圖表目次
圖1-1 多元化信息空間
圖1-2 聯網環境下的信息檢索模式
圖1-3 中介詞典原理示意圖
圖1-4 微觀詞表與巨觀詞表的兼容模式
圖1-5 檢索語言之間的辭彙語義關係
表2-1 《漢表》、《社科表》和《經管表》敘詞款目參照系統
圖2-1 集成詞表的生成
……
隨著計算機、通信和網際網路技術的快速發展,信息檢索麵臨著信息量激增、用戶大眾化和服務創新等多重挑戰。目前,自然語言處理、模糊數學、機器學習等先進技術,已經成功套用於語音識別、電子政務、機器翻譯和工業控制等領域。因此,如何套用人工智慧技術推進信息檢索的智慧型化和大眾化,無疑成為當前信息服務的主要議題。
情報檢索語言是信息檢索的語言保障工具,其兼容性問題成為信息共享和服務的最大障礙。本書較為全面地闡述了情報檢索語言兼容轉換的基本理論和國內外研究進展,討論了多種檢索語言的兼容轉換方法,包括基於集成詞表的敘詞表兼容轉換方法、基於字面相似度的分類兼容轉換方法、基於最大似然法的分類表與敘詞表兼容轉換方法、基於粗糙集的檢索語言兼容方法,提出了基於N.Gram的中文文本關鍵字自動抽取方法,分析了“中圖法”知識庫的構建理論與方法。
本書內容組織獨具匠心,既有詳細的理論基礎,也有具體的方法和系統。從技術角度看,首先討論傳統的方法,逐步過渡到統計方法和機器學習方法。