情報檢索理論
正文
對研究情報存儲和檢索的規律性以及情報檢索系統的設計、運行與評價等問題進行研究所得的概念與認識。一般包括 6個研究領域:①情報檢索語言;②情報檢索文檔;③情報檢索策略;④情報檢索效率;⑤情報檢索系統;⑥情報加工自動化。情報檢索語言是情報檢索理論的核心。分為分類檢索語言和主題檢索語言兩大類。兩類語言正在相互滲透融合, 結果產生一系列新型檢索語言。 為了克服相對固定的分類表和詞表同靈活多變的文獻用語之間的矛盾,目前著重研究利用自然語言標引與檢索等問題。
情報檢索文檔的研究內容一般指情報檢索系統中的文檔邏輯結構。檢索文檔組建與檢索策略密切相關。情報檢索策略是實現檢索目標的途徑和方法。它直接影響檢索文檔的結構和檢索效率。傳統的檢索策略理論大都以二值相關性為基礎,這同實際的檢索過程有一定的差距,目前正大力發展以多值相關性為基礎的情報檢索理論體系,並研究各種情報檢索模型,如矢量空間檢索模型、機率檢索模型、模糊檢索模型等。
情報檢索效率的評價是情報檢索理論研究中的一個重要領域。一般以相關文獻的查全率和查準率為評價的主要指標。情報檢索效率的理論研究集中在 4個問題上:①查全率(R)與查準率(P)的數學定義及 R-P關係中的一些特殊點的解釋;②R-P的互逆相關性;③檢索效率的新評價指標;④影響檢索效率的因素及其改進措施。
情報檢索系統的研究內容,涉及到系統的模式、算法、設計原則和運行最佳化。對於大型情報檢索系統要運用系統工程的原理與方法。
情報加工自動化主要包括自動分類、自動標引和自動編制文摘。隨著信息技術和人工智慧技術的發展,情報加工作業將全面實現自動化。
微型機、光碟技術和光纖通信的廣泛套用,將引起情報檢索技術重大的變革。情報檢索系統將實現智慧型化,可識別聲音、圖形和處理自然語言,亦可模仿人腦進行推理判斷和諮詢。相應地,情報檢索理論必將改觀,以研究知識的表述、轉換、組合、推導和利用為中心的理論體系將得到發展。