基本概念
用戶建模是個性化系統的核心。概括地說,用戶建模是對用戶信息的一種表示,主要包括三個問題:對什麼建模、如何建模、如何維護模型。
用戶興趣建模是一個複雜的過程,既包括用戶相關信息的收集與挖掘,還包括用戶興趣的提取和表示,以及長期興趣、近期興趣、即時興趣的組織與維護?以上各個方面相互聯繫相互作用,共同構成一個完整的用戶建模體系,例如用戶興趣模型採用的表示方法決定了信息收集時必須記錄的信息,同時也決定了長期興趣、近期興趣、即時興趣的組織結構。
建模方法
建模方法包括三個方面:一是如何獲得用戶的有用信息;二是用戶模型的表示方法問題;三是如何將前兩個方面結合起來,從而產生出用戶的模型。
建模是一個過程,包括很多方面,不同套用背景下建模過程也會不同,但一般至少包括以下三個方面:一是用戶行為的模型和表示,並根據該模型記錄用戶具體訪問行為,產生出用戶行為日誌;二是根據用戶的行為模式評價用戶對所訪問的信息項的關注程度;三是根據用戶所訪問的信息內容對用戶的興趣進行提取和量化評價,構建用戶的興趣模型。這信息內容對用戶的興趣進行提取和量化評價,構建用戶的興趣模型。這三個問題密切相關,前一個問題均為解決後一個問題的前提或基礎。
由於用戶信息會發生轉變,因此需要提供一個動態跟蹤機制來捕獲這些變化,從而能分辨出不同興趣之間的差異:用戶興趣模型的變化主要表現在興趣度的衰減和強化兩方面,並由此表現出用戶興趣的遷移。從整個用戶行為歷史來看,每個興趣點被訪問的次數是單調增長的,因此相應的興趣度都在被強化;而衰減的目的是表達一個興趣點如果在最近一段時間內沒有被訪問,則其興趣度應該被降低。
為了正確捕獲用戶的興趣模型,可將用戶興趣可分為三種情況。一是長期興趣,反映了用戶穩定的長期的信息需求,這些興趣會隨著時間推移積累成廣泛的興趣點,這將導致信息推薦發散在多個主題上,從而缺乏針對性;二是近期興趣,反映了用戶最近一個時間段內的信息需求趨勢,基本目標是根據用戶的近期訪問行為,在用戶長期興趣中選擇幾個作為用戶近期的關注焦點,從而克服基於長期興趣進行推薦的問題;三是即時興趣,反映的是用戶在與系統互動過程中的實時信息需求,其可能是某個穩定興趣的體現,也可能是與長短期興趣均無關的臨時性的信息需求。
儘管三種用戶興趣互不相同,但它們之間又有著內在的聯繫:概括地說,即時興趣是近期興趣的累積基礎,而近期興趣是長期興趣的累積基礎;即時興趣和近期興趣能夠反映用戶需求的動態變化,而長期興趣則體現了用戶較為穩定的信息需求。
用戶模型的動態特徵捕獲值得進一步深入研究。目前主要採用的方法是通過近期興趣來建立用戶當前的興趣點,從而捕獲用戶興趣的變化。一般而言,近期興趣和長期興趣在建模過程上是相似的,只是前者將時間限制在某個特定階段內i因此,用戶模型的動態特徵捕獲方法儘管有一定的效果,但其模型基礎並不完善,表現在以下幾個方面:①長期興趣與近期興趣並沒有統一在一個框架之下;②長期興趣與近期興趣之間的關係並不明確;③並未涉及衰減和強化兩方面的機制問題,因此也不能刻畫用戶興趣的遷移模式。
建模技術
用戶手工定製建模
用戶手工定製建模是指用戶模型由用戶自己手工輸入或選擇的用戶建模方法。如用戶自己輸入感興趣的關鍵字列表,或選擇感興趣的欄目等。
但用戶手工定製建模存在著以下幾個方面的不足:
第一,因為建模過程完全依賴於用戶,容易降低用戶使用系統的積極性;用戶不願意參與對系統的訓練,即使用戶知道對系統進行訓練會給自己帶來好處。
第二,用戶難以全面、準確地羅列自己感興趣的欄目或關鍵字,從而導致用戶模型不夠準確;
第三,當用戶興趣發生變化時,用戶必須重新輸入用戶模型;用戶手工定製的用戶模型是靜態的,這與用戶興趣的漸變性不符。
示例用戶建模
示例用戶建模是指由用戶提供與自己興趣相關的示例及其類別屬性來建立用戶模型的建模方法。由於用戶對自己的興趣和偏好等最有發言權,因此由用戶提供的有關自己興趣的示例最能集中、準確地反映用戶的興趣和偏好等特點。
自動用戶建模
自動用戶建模是指根據用戶的瀏覽內容和瀏覽行為自動構建用戶模型,建模過程無須用戶主動提供信息的建模方法。自動用戶建模的主要代表有:卡內基·梅隆大學的WebWatcher,德國國家研究中心的ELFI,麻省理工學院的Letizia等。
自動用戶建模實際上是改進了示例用戶建模方法中的示例獲取途徑,將其轉化為無須用戶標註的自動示例獲取方法。通過對用戶瀏覽頁面的聚類和分類,就能夠得到用戶感興趣的主題,從而實現自動建模。此外,Web日誌挖掘也是一條實現自動用戶建模的途徑。
自動用戶建模雖然存在著容易引入噪聲,不利於構建高質量的用戶模型的缺點,但是,自動用戶建模無需用戶主動提供信息,不會對用戶造成干擾,有利於提高個性化服務的易用性,促進個性化服務的發展。