信息檢索模型

信息檢索模型是表示文檔、查詢及其相關度的模型。

主要分類

主要有四種:布爾模型、向量空間模型、語言模型和機率模型。前三種使用同一框架,認為文檔和查詢是由一組單詞構成的,忽略詞的順序和在句子或文檔中的位置。

特徵

文檔集合的所有辭彙是整個空間,每個文檔表示為該空間上的一個詞向量,每個詞對應一個權值,不同的模型對權值的計算方法不同。查詢亦表示為類似的一個向量。通過對文檔和查詢的表示,計算它們之間的相關度,可找到符合查詢的相關文檔。

相關詞條

熱門詞條

聯絡我們