興趣檢索

根據用戶輸入的檢索詞,再結合用戶興趣來進行信息推薦,而不只是簡單的基於檢索詞進行信息推薦,具有更高的查準率。

用戶模型

用戶模型可以有效解決不同用戶對相同檢索關鍵字的不同深度和廣度的要求,而傳統的信息檢索流程在加入用戶模型之後,將變更為帶著用戶興趣查找的過程,同時反饋流程也將針對個體用戶的意見進行,以提供更為準確和友好的檢索服務。用戶模型的建立是基於用戶興趣的信息檢索的基礎和核心,通過用戶模型記錄用戶的興趣所在,挖掘用戶的潛在興趣需求,對用戶興趣進行管理。同時,由於用戶興趣是不斷變化的,所以用戶興趣模型需要根據用戶行為進行不斷更新。

用戶模型作用

1、管理用戶個人信息:對用戶的自身信息和背景信息進行管理,如用戶名、用戶年齡、教育背景、從事職業等,在查詢的過程中,同時考慮用戶的背景信息,有助於更加對口的查找到用戶所需的信息。

2、管理用戶興趣:這是用戶興趣模型的主要作用之一。提取用戶興趣,並對其進行適當描述,對用戶興趣進行管理。當用戶頻繁查詢某個領域或者是某個方面的內容時,用戶模型就會通過預先設定的一些規則將其歸納為用戶的一個興趣,並且根據知識之間的相近、相關等屬性對用戶興趣進行擴展。同時,為了更加準確的反映用戶興趣,需要對用戶興趣進行不斷更新。對於用戶興趣的管理,可以由用戶直接建立和修改來進行,也可通過機器學習等方式進行。

3、管理用戶歷史查詢行為:用戶歷史查詢行為在整個查詢過程中也將成為一個重要參考內容。該功能用於記錄用戶的歷次查詢行為,如查詢請求的描述、限定的要求(如對現實結果的要求)、查詢的時間、查詢的次數等等。用戶可以瀏覽歷史查詢記錄,同時可以修改歷史查詢進行新一輪的查詢。

用戶模型分類

從不同的角度可以對用戶模型進行如下分類:

(1)按照建模的對象劃分,可以分為組用戶模型和單個用戶模型;

(2)按照信息源劃分,可以分為顯式模型和隱式模型;

(3)按照時間尺度劃分,可以分為長期模型和短期模型:

(4)按照更新方式劃分,可以分為靜態模型和動態模型;

(5)按照表現形式劃分,可以分為基於屬性的模型和基於知識的模型等。

興趣檢索 興趣檢索

用戶興趣挖掘

用戶主動提供

可以在系統中設定興趣提交模板,讓用戶選擇一些關鍵字、或者回答一些問題,完成用戶主動設定信息需求,比如:職業、研究方向、興趣領域、喜歡的非專業書籍等;用戶輸入答案後,系統進行目標標識,對其進行聚類,形成用戶的不同興趣方向。但是該方式首先需要用戶花費時間主動參與該項工作,其次用戶需要事先明確並總結自己的信息需求。並且,由於語言表達和分類的模糊性與多樣性,利用這種方式很難真正全面、清楚的表達用戶需求。另外由於用戶的興趣是不斷變化的,不同時期具有不同的興趣,如果用戶沒有將自己變化了的興趣提交給系統,系統就無法獲取用戶新的興趣和需求,也就無法根據用戶的新需求向其提供所需的信息。

跟蹤和分析用戶瀏覽行為

用戶的瀏覽行為,包括用戶在每一個頁面上駐留的時間,對每一個頁面進行的操作(如保存、下載、列印頁面、將頁面加入收藏夾等),以及用戶瀏覽頁面時眼睛的移動、表情的變化等都能較好的反映用戶的興趣。

一般來說,用戶會將其很感興趣或者認為很重要的頁面進行收藏、下載和保存。並且,為了將來的方便訪問和管理,用戶還會對收藏的頁面或者下載保存的資料進行分類整理,以便將來能夠更為快速方便的訪問。但是,相對於用戶瀏覽過的頁面而言,用戶收藏、下載、保存的頁面只是其真正感興趣頁面的一小部分,用戶並不會將全部感興趣的頁面進行收藏、下載、保存。

與用戶收藏、保存、下載的頁面相比,用戶瀏覽的頁面可以更為全面的反映用戶的興趣。而且,用戶瀏覽的頁面可以由系統自動保存,不需要用戶提供任何幫助,可以實現自動用戶建模。但是用戶瀏覽的頁面並不總是其感興趣的,其中可能包含很多無關頁面,因而通過瀏覽頁面構建用戶模型的時候要注意避開噪聲頁面。

用戶瀏覽行為同樣可以反映用戶的興趣所在,比如用戶在某一個頁面上停留的時間較長,可以表明用戶對該頁面較為感興趣,可以通過一種非線性的轉換方法將用戶的瀏覽時間轉化為用戶興趣度,獲取用戶信息。

伺服器端挖掘

用戶的登錄、瀏覽記錄以及用戶的訪問行為都記錄在網際網路中伺服器上的日誌檔案中。通過對分析這些日誌檔案可以獲取用戶已瀏覽過的頁面集合以及瀏覽這些頁面的時間長度,從而可以理解用戶的行為。

代理伺服器日誌可以記錄用戶對所有網站的訪問,因而通過代理伺服器日誌可以全面反映用戶興趣。相比較而言,網站伺服器僅記錄了用戶對網站的訪問,而對於用戶訪問的其它網站信息一無所知,因此通過網站伺服器日誌構建的用戶模型反映用戶在網站中的興趣,不能全面反映用戶興趣。不過對於網站而言,網站伺服器日誌是用戶建模的最佳信息來源,通過伺服器日誌構建用戶模型的實質是通過用戶訪問的頁面和瀏覽行為進行建模。由於伺服器日誌不能記錄用戶對快取在cache中的頁面訪問,因而伺服器日誌不能準確反映用戶的訪問,尤其是用戶的瀏覽行為。

可以通過以下兩種方式來實現從伺服器端獲取用戶的相關信息:一般的訪問模式挖掘和個性化的使用記錄挖掘。一般的訪問模式挖掘通過分析使用記錄來了解用戶的訪問模式和傾向;個性化的使用記錄挖掘則傾向於分析單個用戶的偏好,其目的是根據不同用戶的訪問模式,為每個用戶提供定製的站點。

系統被動學習

被動學習是系統根據用戶興趣向用戶推送從網際網路蒐集來的頁面,系統根據用戶對推送頁面的評價進行分析,從而分析出用戶興趣,系統再根據用戶興趣進行新的信息推薦。

相關詞條

熱門詞條

聯絡我們