協作篩選定義
通過對一大群人的喜好進行搜尋,並從中找出和我們品味相近的一小群人。算法會對這些人所偏愛的其他內容進行考查,並將他們組合起來構造出一個經過排名的推薦列表。有許多不同的方法可以幫組我們確定哪些人與自己的品味相近,並將他們的選擇組合成列表。
主要算法歐幾里德距離;
皮爾遜相關度;
Spearman秩相係數關度;
Tanimoto相關度;
套用
協作篩選 (CF) 是 Amazon 等公司極為推崇的一項技巧,它使用評分、單擊和購買等用戶信息為其他站點用戶提供推薦產品。CF 通常用於推薦各種消費品,比如說書籍、音樂和電影。但是,它還在其他應用程式中得到了套用,主要用於幫助多個操作人員通過協作來縮小數據範圍。您可能已經在 Amazon 體驗了 CF 的套用,如圖所示:
CF 應用程式根據用戶和項目歷史向系統的當前用戶提供推薦。生成推薦的 4 種典型方法如下:基於用戶:通過查找相似的用戶來推薦項目。由於用戶的動態特性,這通常難以定量。
基於項目:計算項目之間的相似度並做出推薦。項目通常不會過多更改,因此這通常可以離線完成。
Slope-One:非常快速簡單的基於項目的推薦方法,需要使用用戶的評分信息(而不僅僅是布爾型的首選項)。
基於模型:通過開發一個用戶及評分模型來提供推薦。所有 CF 方法最終都需要計算用戶及其評分項目之間的相似度。可以通過許多方法來計算相似度,並且大多數 CF 系統都允許您插入不同的指標,以便確定最佳結果。