技術原理
推薦引擎是利用特殊的信息過濾(IF,InformationFiltering)技術,將不同的內容(例如電影、音樂、書籍、新聞、圖片、網頁等)推薦給可能感興趣的用戶。
通常情況下,推薦引擎的實現是通過將用戶的個人喜好與特定的參考特徵進行比較,並試圖預測用戶對一些未評分項目的喜好程度。參考特徵的選取可能是從項目本身的信息中提取的,或是基於用戶所在的社會或社團環境。
特點
推薦引擎技術是建立在搜尋引擎技術基礎之上的新的信息傳播方式,它致力於解決搜尋引擎無法深刻了解用戶的問題,致力於解決用戶的個人化信息問題,致力於解決用戶的潛在信息需求的問題,致力解決信息的垂直單向傳播問題,致力於解決還存在於用戶頭腦中的信息如何通過新的模式跟技術結合的問題。
分類
1、基於內容的推薦引擎
它將計算得到並推薦給用戶一些與該用戶已選擇過的項目相似的內容。例如,當你在網上購書時,你總是購買與歷史相關的書籍,那么基於內容的推薦引擎就會給你推薦一些熱門的歷史方面的書籍。
2、基於協同過濾的推薦引擎
它將推薦給用戶一些與該用戶品味相似的其他用戶喜歡的內容。例如,當你在網上買衣服時,基於協同過濾的推薦引擎會根據你的歷史購買記錄或是瀏覽記錄,分析出你的穿衣品位,並找到與你品味相似的一些用戶,將他們瀏覽和購買的衣服推薦給你。
3、基於關聯規則的推薦引擎
它將推薦給用戶一些採用關聯規則發現算法計算出的內容。關聯規則的發現算法有很多,如Apriori、AprioriTid、DHP、FP-tree等。
4、混合推薦引擎
結合以上各種,得到一個更加全面的推薦效果。 比如百分點推薦引擎,在個性化算法的框架基礎之上,引入場景引擎、規則引擎和展示引擎,形成全新的百分點推薦引擎的技術框架,系統通過綜合併利用用戶的興趣偏好、屬性,商品的屬性、內容、分類,以及用戶之間的社交關係等等,挖掘用戶的喜好和需求,主動向用戶推薦其感興趣或者需要的商品。其技術架構如圖所示。
構架條件
第一、商用推薦引擎的強大基礎,完善的dw構架和數據基礎。
在如今的網際網路世界裡面,數據已經成為運作網際網路創新套用的源頭和核心。數據倉庫,數據挖掘已經成為創新數據產品的強大基礎,而推薦引擎則是數據倉庫基礎上的一個拳頭商業套用技術。商業推薦引擎的作用是保障商業網站推出足夠多足夠新的推薦產品,這離不開企業數據倉庫的主題眾多的數據來源和靈活的組織形式。構建這樣的數據倉庫需要花費很長一段時間,投入也是非常之大。
第二、推薦引擎的核心算法實現。現在基於很多權威論文的推薦引擎基礎算法,經過十幾年好多大師和研究人員的努力和不斷改進,理論基礎日益紮實和成熟,也就是關聯規則的實現算法。
結合商業具體套用考慮,推薦引擎不僅要考慮推薦質量的高低,高效率和高靈活和可配置是不可缺少的特點。但在商業網站特別是人氣超旺的電子商務網站,處理的數據量非常巨大,推薦算法的實現引擎需要最佳化最佳化在最佳化,一個好的實現方法和一個好的可以不斷擴展的計算平台是一個高起點的必備要求。
第三、推薦引擎的開放api。
商業推薦引擎不僅僅用來把數據計算出來,在後期必須充分的利用這些高質量的推薦數據,通過推薦引擎的開放API,可以在任何需要調用推薦數據的地方使用這些高質量的推薦數據,實現集中計算,分散使用。企業推薦引擎的數據可以擴展到電子商務網站的任何一個角落,給網際網路客戶貼心的用戶體驗。
常用算法
推薦引擎算法是個性化推薦系統的核心,其直接影響到推薦系統推薦內容的相關性和價值匹配度,常用的推薦引擎算法如下:
1、基於關聯規則的推薦算法(AssociationRule-basedRecommendation)
2、基於內容的推薦算法(Content-basedRecommendation)
內容過濾主要採用自然語言處理、人工智慧、機率統計和機器學習等技術進行過濾。基於內容過濾的系統其優點是簡單、有效。其缺點是特徵提取的能力有限,過分細化,純基於內容的推薦系統不能為客戶發現新的感興趣的資源,只能發現和客戶已有興趣相似的資源。這種方法通常被限制在容易分析內容的商品的推薦,而對於一些較難提取出內容的商品,如音樂CD、電影等就不能產生滿意的推薦效果。
3、協同過濾推薦算法(CollaborativeFilteringRecommendation)
協同過濾是在信息過濾和信息系統中正迅速成為一項很受歡迎的技術。與傳統的基於內容過濾直接分析內容進行推薦不同,協同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,形成系統對該指定用戶對此信息的喜好程度預測。
推薦引擎的套用
推薦引擎在商業上套用的重要性已經在amazon的成功上得到了充分證明,中國國內眾多web2.0,電子商務網站,或者第三方技術公司都在這一塊進行挖寶。2000年以來,推薦引擎也已經成為了網路中一個日益重要的組成部分。在零售業中,以及當人們尋找從餐館到電影的幾乎任何東西時,推薦引擎的作用顯得尤為突出。像亞馬遜和Netflix這樣的巨頭都擁有非常出色的推薦引擎。Netflix還舉辦了一項著名競賽,改進Netflix電影推薦算法的高手可以贏得百萬美元的大獎。
亞馬遜的推薦引擎非常出色,備受推崇。它已經有15年歷史,擁有龐大的資料庫和豐富的資源。至於中國國內,也有一些專業的推薦引擎研發團隊,其中比較專業和知名的有百分點科技公司,據報導說已有五百多家網站套用百分點推薦引擎服務。
推薦引擎在網站是以站內推薦欄為最終體現形式,推薦欄展示的內容都是根據推薦引擎精準分析每個用戶的興趣偏好而智慧型推薦的。不同用戶、不同時間點,每位用戶看到推薦欄內容都是不一樣的,都是最符合其當前興趣偏好和需求的。圖例如下,百分點推薦引擎在購物網站列表頁、商品詳情頁、購物車頁面構建智慧型商品推薦欄。
未來發展
未來,推薦引擎將會朝著更加智慧型化、更加個性化的方向發展。在短期內,搜尋引擎將會越來越多地加入簡單的推薦技術,以處理接近的查詢詞。但從長期來說,而比起搜尋行業和搜尋技術,推薦技術會更加無孔不入。