現代信息檢索-原理、技術與方法

現代信息檢索-原理、技術與方法

本書是對信息檢索領域基本理論、主要技術和套用方法的系統介紹和闡述。全書內容新穎豐富,資料翔實,概念清晰,分析闡述系統深入。本書可作為高等院校信息管理與信息系統專業、計算機科學技術專業、情報學專業、圖書館學專業學生的教材或教學參考書,也可供各類信息中心、情報研究所、圖書館等機構工作人員以及廣大信息用戶學習參考。

基本信息

作者趙丹群
ISBN:10位[7301129262] 13位[9787301129265]
出版社北京大學出版社
出版日期:2008-1-1
定價:¥41.00 元

內容提要

本書是對信息檢索領域基本理論、主要技術和套用方法的系統介紹和闡述。全書共分11章:信息檢索概述;信息檢索的數學模型;信息檢索系統及其構成;文本信息檢索技術與方法;多媒體信息檢索技術與方法;web與網路搜尋引擎;信息檢索評價研究;文本信息處理自動化技術;信息檢索的基本方法與步驟;常用資料庫及國際在線上檢索服務系統;常用網路搜尋引擎服務系統。每章後面都提供了思考與練習題。另外,書後還附有主要參考文獻列表和重要名詞術語索引表。全書內容新穎豐富,資料翔實,概念清晰,分析闡述系統深入。
本書可作為高等院校信息管理與信息系統專業、計算機科學技術專業、情報學專業、圖書館學專業學生的教材或教學參考書,也可供各類信息中心、情報研究所、圖書館等機構工作人員以及廣大信息用戶學習參考。

作者簡介

趙丹群 女,1966年生,管理學博士,北京大學信息管理系副教授。主要從事信息檢索、信息計量學領域的教學和研究工作,主講“信息存儲與檢索”、“算法與數據結構”、“信息計量學”等多門本科與研究生課程,主編、參編相關著作和教材10部,獨立發表學術論文20餘篇。曾多次獲得北京大學優秀教學成果獎勵。

目錄

第一章 信息檢索概述
1.1 信息檢索的基本概念
1.2 信息檢索的基本原理
1.3 信息檢索的研究對象與研究方法
1.3.1 主要研究問題
1.3.2 相關學科及領域
1.4 信息檢索的發展歷史
1.4.1 手工檢索時期
1.4.2 計算機化檢索時期
1.4.3 網路化檢索時期
思考與練習題
第二章 信息檢索的數學模型
2.1 信息檢索系統的形式化表示
2.2 集合論檢索模型
2.2.1 布爾檢索模型
2.2.2 模糊集合模型
2.2.3 擴展布爾模型
2.3 代數論檢索模型
2.3.1 向量空間模型
2.3.2 潛在語義索引模型
2.3.3 神經網路模型
2.4 機率論檢索模型
2.4.1 經典機率模型
2.4.2 基於Bayesian網路的檢索模型
2.5 其他信息檢索模型與數學理論
2.5.1 結構化檢索模型
2.5.2 瀏覽模型
2.5.3 其他新型數學理論
思考與練習題
第三章 信息檢索系統及其構成
第四章 文本信息檢索技術與方法
第五章 多媒體信息檢索技術與方法
第六章 Web與網路搜尋引擎
第七章 信息檢索評價研究
第八章 文本信息處理自動化技術
第九章 信息檢索的基本方法與步驟
第十章 常用資料庫及國際在線上檢索服務系統
第十一章 常用網路搜尋引擎服務系統
主要參考文獻和網路信息源
重要名詞術語索引

書摘

第一章 信息檢索概述
1.1 信息檢索的基本概念
在人類社會的發展過程中,信息檢索(Information Retrieval,簡稱IR)的實踐活動由來已久,但作為一個比較規範、正式的學術術語,它最早由美國學者穆爾斯(C.W.Mooers)在l949年提出並使用。近年來,隨著人類社會信息環境的數位化、網路化進程日益加快,以及各類信息資源的爆炸性增長,“信息檢索”這一學術名詞逐漸變得流行起來,並被越來越多的社會成員所認識、了解和使用。那么,信息檢索概念的準確含義是怎樣的呢?
所謂“信息檢索”,廣義地說,是“信息存儲與檢索”(Information Storage and Retrieval),它是指將信息按照一定的方式組織和存儲起來,並能根據用戶的需要找出其中相關信息的過程。因此,從本質上講,信息檢索是一種有目的和組織化的信息存取活動,其中包括了“存”和“取”兩個基本環節。對於“存”來說,主要指面向來自各種渠道的大量甚至海量信息資源而進行的高度組織化的存儲;對於“取”來說,則要求面向隨機出現的各種用戶信息需求所進行的高度選擇性的查找,並且尤其強調查找的快速與便利。這裡,具體的存儲載體可以選擇卡片、書本、磁帶/磁碟、光碟等;存儲的內容可以是文獻的書目信息、文摘或全文,也可以是圖像、音頻或視頻的數位化信息;而具體的查找途徑因存儲信息類型的不同而不同,較為常見的有文獻的作者、題名、主題或分類號碼,圖像顏色,物體形狀,音樂的節奏或旋律,等等。
作為一種有目的和組織化的信息存取活動,信息檢索中的“存”與“取”之間存在著密不可分的關係。首先,兩者是相互依存的:不存儲無從檢索,不檢索存儲將失去意義;其次,兩者又是互相矛盾和制約的:從存儲的角度看,越簡單越好,但過於簡單的存儲,勢必影響到檢索的質量與效率,即有效的檢索需要以增加存儲的代價作為前提。信息檢索中“存”與“取”之間的這種互動關係在實際檢索系統的開發與設計中,需要給予某種合理化的兼顧與平衡。
在通常情況下,大多數人講到“信息檢索”時,一般只涉及“取”,即主要關注如何從存儲的信息集合中快速獲取各種需要的信息。這時,信息檢索也可以稱為“信息查詢”或“信息查找”(Information Search)。這是對信息檢索概念的一種狹義理解。
……

相關詞條

相關搜尋

熱門詞條

聯絡我們