信息檢索理論方法及問題分析

信息檢索理論方法及問題分析

本書圍繞信息檢索的基本內容,結合當前的研究進展和取得的成果,就信息檢索領域的研究內容、理論方法及存在的問題進行闡述和分析,主要包括信息檢索的基本內容、信息需求表達、檢索模型、文檔索引及檢索性能評價等方面。

前言

隨著資訊時代的不斷深入發展,人類對信息有了新的要求,不僅在信息種類和數量上要求越來越多,而且在信息質量上要求越來越高。人類在對衣食住行等基本需求的追求過程中常常伴隨著相應的信息需求。在對物質需求逐步滿足的基礎上,人類對信息的需求往往超過了對其他物質的需求。同樣,人類自身的發展越來越依賴於對信息的獲取和掌握程度。 資訊時代的特點是誰能以最短的時間獲取最新的、最有價值的信息,誰就能在激烈。

目 錄

第1章

信息檢索及其主要研究內容 1

1.1 信息檢索 3

1.1.1 信息檢索的基本概念 3

1.1.2 信息檢索的研究內容 3

1.1.3 研究現狀和發展趨勢 4

1.1.4 結構化、半結構化和非結構化信息 5

1.2 大數據背景下的信息檢索 6

參考文獻 7

第2章

信息檢索的需求表達 11

2.1 需求表達 13

2.2 需求表達的主要理論方法 13

2.3 需求表達存在的主要問題分析 14

2.4 信息需求域 15

2.4.1 機器信息檢索:用關鍵字匹配近似語義匹配 15

2.4.2 文檔、句子及詞語之間的語義關係 15

2.4.3 信息需求域 18

2.4.4 信息需求域的理論推導 22

2.4.5 信息需求域的子域、近似域 24

2.4.6 查詢請求與信息需求的關係 26

2.4.7 信息需求域的理論意義 29

2.4.8 信息需求域的一種粗糙集解釋 29

2.5 小結與討論 33

參考文獻 34

第3章

信息檢索的檢索模型 37

3.1 信息檢索的主要檢索模型 39

3.2 查詢擴展、相關反饋研究現狀 42

3.3 檢索存在的主要問題分析 43

3.4 信息需求域基礎上的信息檢索 45

3.4.1 信息需求域的結構 45

3.4.2 文檔相似度的定義 50

3.5 檢索模型的發展方向分析 59

參考文獻 60

第4章

文檔索引的建立 67

4.1 附加統計信息的倒排索引 69

4.2 停用詞 71

4.3 詞幹提取 71

4.4 詞形歸併 72

4.5 小結與討論 73

參考文獻 73

第5章

信息檢索系統的評價方法 75

5.1 測試集 77

5.2 無序檢索結果的評價 79

5.3 排序檢索結果的評價 80

5.4 小結與討論 82

參考文獻 82

第6章

偽相關文檔反饋需求域模型信息檢索 85

6.1 偽相關文檔反饋機制 87

6.2 需求域去噪 87

6.3 偽相關文檔反饋機制的模型分析 89

6.3.1 去噪性能分析與實驗 91

6.3.2 去噪參數β的取值分析與實驗 95

6.3.3 參數α的取值分析與實驗 99

6.3.4 偽相關反饋文檔數目及穩定性分析與實驗 101

6.4 偽相關文檔反饋機制下的需求域模型結論 103

6.4.1 需求域模型結論 104

6.4.2 檢索性能對比實驗分析 106

6.5 小結與討論 111

參考文獻 112

本章附錄 112

第7章

用戶相關文檔反饋需求域模型信息檢索 117

7.1 用戶相關文檔反饋機制 119

7.2 用戶相關文檔反饋機制下的模型分析 120

7.2.1 用戶相關文檔反饋下的上界最佳化分析與實驗 121

7.2.2 最佳化參數β的取值分析與實驗 124

7.2.3 參數α的取值分析與實驗 127

7.2.4 相關反饋文檔數目及穩定性的分析與實驗 130

7.3 用戶相關文檔反饋機制下的需求域模型結論 133

7.3.1 需求域模型結論 133

7.3.2 檢索性能對比實驗分析 135

7.4 需求域模型計算性能分析 139

7.5 小結與討論 140

全書參考文獻 143

相關詞條

熱門詞條

聯絡我們