內容簡介
《搜尋引擎技術》比較系統地介紹了網際網路搜尋引擎的工作原理、信息預處理和查詢過程及其用到的關鍵技術。全書共分7章,從基本工作原理概述開始,到一個小型簡單專題搜尋引擎實現的具體細節,進而詳細討論了歧義欄位自動識別技術和命名實體自動識別技術;最後基於Agent與Multi-Agent技術,闡述了基於Agent的個性化信息檢索系統的實現過程。《搜尋引擎技術》層次分明,由淺入深;既有深入的理論分析,也有大量的實驗數據,具有學習和實用雙重意義。《搜尋引擎技術》可作為高等院校計算機科學與技術、信息管理與信息系統、電子商務等專業的研究生或高年級本科生的教學參考書和技術資料,對廣大從事網路技術、Web站點的管理、數字圖書館、Web挖掘等研究和套用開發的科技人員也有很大的參考價值。
目錄
第1章緒論1.1搜尋引擎的概念
1.2搜尋引擎的分類
1.3搜尋引擎的發展現狀
1.4搜尋引擎的發展趨勢
第2章Web搜尋引擎的工作原理
2.1搜尋引擎的基本要求
2.2爬蟲
2.3預處理
2.4查詢服務
第3章數據預處理
3.1數據源
3.2Web文本信息提取
3.3去噪
3.4分{司
3.5特徵提取
3.6文檔表示
3.7降維
第4章Web信息查詢系統
4.1查詢系統的結構
4.2檢索的定義
4.3查詢系統的實現
第5章自動分詞技術
5.1引言
5.2中文自動分詞方法
5.3自動分詞詞典機制
5.4歧義欄位自動識別技術
5.5命名實體自動識別技術
第6章面向專題的信息蒐集和處理
6.1專題搜尋引擎的構建
6.2專題搜尋引擎的文本自動分類和專題分詞技術
6.3基於向量空間模型的文本聚類
第7章基於Agent的智慧型搜尋引擎技術
7.1Agent與Multi-Agent技術
7.2Agent技術在信息檢索中的套用
7.3Agent實現技術
7.4Agent與智慧型信息檢索
7.5基於Agent的個性化信息檢索系統
參考文獻
哈爾濱工業大學最新圖書之五
哈爾濱工業大學出版社是以出版大學教材、專著為主的學術性出版社。建社以來,始終貫徹黨的出版方針,堅持正確的政治方向,堅持把社會效益放在第一位,本著為高校教學、科研和學科建設服務的宗旨,現已逐步形成了以機械設計製造及自動化、材料科學與工程、航天科學、通信工程、控制等學科為主,自然科學基礎、外語教學、計算機科學、素質教育、科普讀物為輔的出版格局和學科覆蓋較廣、教材比例較大的特色。 |