檢索歷史

檢索歷史是指保存某次登錄後的檢索歷史,並提供選項以編輯、重新運行、保存檢索策略或將檢索策略另外儲存為提醒提示,可分為基於短期歷史和長期歷史兩種方法。

挖掘檢索歷史

挖掘檢索歷史的方法可分為基於短期歷史和長期歷史兩種。短期歷史針對單個的查詢會話(query session)中用戶的反饋來修正查詢模型。這類方法優點是反饋直接針對當前查詢,噪聲較少,缺點是可獲得的信息有限。與之相比,基於長期歷史的方法則以用戶為中心,收集從不同來源獲取的用戶信息,建立長期用戶模型對當前查詢模型進行重構。這類方法優點是無需進行查詢會話劃分,能夠全面刻畫用戶興趣。缺點是長期歷史包含多個主題,存在大量噪聲。從中發現與當前查詢相關的信息,利用這些信息預測用戶的檢索意圖是高效利用長期歷史進行個性化檢索的關鍵。

基於檢索歷史上下文的查詢重構

檢索歷史包含不同的主題,其中多數與當前查詢無關。同時,一篇文章中僅有部分詞語能夠反映其主題,其餘詞語起輔助作用。檢索歷史中與當前查詢無關的詞語形成噪聲,其來源可分為兩類:一類為不相關主題中的詞語,另一類為在各種主題中廣泛存在的起輔助作用的詞語,隨著檢索歷史不斷增加,此類噪聲不斷累積。

以用戶當前查詢為中心,基於相關詞語在檢索歷史上下文中的共現及用戶點擊信息,選擇檢索歷史中與當前查詢最相關的詞語重構查詢模型。

檢索歷史 檢索歷史
檢索歷史 檢索歷史

設當前查詢為Q={ },其中 是查詢關鍵字。在用戶檢索歷史中,每個歷史查詢可對應一組信息,這些信息可用一個元組<查詢輸入,結果集,點擊頁面>來表示,結果集包括返回結果中所有網頁的標題、摘要以及正文連結。查詢模型重構過程如下:

1、將用戶檢索歷史中的網頁摘要進行索引,用當前查詢從中檢索,得到相關的歷史查詢網頁摘要並提取其中的詞語形成候選詞語集。

2、選取候選詞語的一個子集來重構查詢模型,稱該子集中的詞語為擴展詞語。以網頁摘要作為上下文語境,計算每個候選詞語與當前整個查詢的相似度並依此對候選詞語進行排序,選取前k個候選詞語作為擴展詞語。

3、利用得到的擴展詞語重構查詢模型。最後,利用新的查詢模型對初始的檢索結果進行重排序。

檢索歷史 檢索歷史

相關詞條

熱門詞條

聯絡我們