玩聚貓是什麼?
人們總是希望打開一個網站,上面的文章全都是最好的、最熱的。玩聚貓正在致力於成為這個網站——跳過闡述,直達經典。 玩聚貓引入了富有新意的 社會化二次推薦理念。和一般的內容聚合網站如Google Reader、抓蝦、鮮果等直接抓取內容原始出處不同,玩聚貓算是一種二級抓取,意即在這些已經抓取了內容的聚合網站再次抓取,就是說文章大多來源自主要來源是Google Reader Shared Items和Twitter、delicious和飯否這樣的內容聚合推薦網站。這樣的二次抓取,使得內容更加具有熱度,這些文章都是經過使用內容聚合服務用戶的推薦而來,這些文章更加反應出用戶的喜歡程度,從而保證了這些都是都是大家所喜歡的,也往往是高質量的內容。
玩聚貓是如何工作的?
玩聚貓的數據挖掘工作,是從善用Social Media的群體開始的。這個群體最愛分享新鮮有趣的內容。
1.把一些知名社會化媒體用戶(如新浪微博里的李開復、薛蠻子)作為種子節點,機器從這些節點出發開始自動收集用戶,一層一層疊代遍歷社會化網路,找到足夠多(二十萬以上)的社會化媒體用戶。然後進行實時掃描,匯總分享的連結,加之合適的排名算法,推選出既新鮮又好看的文章。
2.對大量(幾乎所有)國內Social Media網站的"熱點排行"功能進行實時監控,挖掘、整合它們的“營養”。除了能夠直截了當地獲取到更多熱點以外,我們還定義Social Media網站的權重和用戶推薦權重,綜合計算文章的SR,直觀地告訴用戶任何一篇文章的熱度、“營養價值”。例如,就算單單以網站PV來衡量權重,“豆瓣9點”、“鮮果熱文”、“抓蝦熱文”的權重差異也相當大;對於新浪微博上的同一條微博,李開復轉發與我轉發權重也不可能相同。
3.進而,玩聚貓還打算引入了自然語言算法和語義技術,進化到協同過濾和語義過濾的自動化推薦系統。
就這樣,玩聚貓給出了一個閱讀分享解決方案,既能分享有價值的信息,又具有視野發散度,既能減輕信息爆炸,又能考慮到推薦者的權威度。
SR是什麼?
SR是玩聚貓自創的一種排名算法,即Social Rank,是玩聚貓根據一篇文章在各個社交平台的綜合熱度而為之給出的評分。SR的範圍是0至10,沒有任何推薦價值的文章SR為0,異常火爆的文章SR為10。一般而言,當一篇文章的SR不小於3時,玩聚貓認為它是值得一讀的;而當一篇文章的PR達到8時,它顯然不容錯過。