內容簡介
![《集體智慧編程》](/img/3/8e2/cGcq5CM0EzXwITNzUjN2cDM2cDNxMTMyUzMxIjMxADMwAzMxAzL3AzLxIzLt92YucmbvRWdo5Cd0FmLyE2LvoDc0RHa.jpg)
本書是Web開發者、架構師、套用工程師等的絕佳選擇。
作者簡介
TobySegaran是Genstruct公司的軟體開發主管,這家公司涉足計算生物領域,他本人的職責是設計算法,並利用數據挖掘技術來輔助了解藥品機理。TobySegaran還為其他幾家公司和數個開源項目服務,幫助它們從收集到的數據當中分析並發掘價值。除此以外,TobySegaran還建立了幾個目錄
第1章集體智慧導言什麼是集體智慧
什麼是機器學習
機器學習的局限
真實生活中的例子
學習型算法的其他用途
第2章提供推薦
協作型過濾
蒐集偏好
尋找相近的用戶
推薦物品
匹配商品
構建一個基於delici0US的連結推薦系統
基於物品的過濾
使用MovieLens數據集
基於用戶進行過濾還是基於物品進行過濾
練習
第3章發現群組
監督學習和無監督學習
單詞向量
分級聚類
繪製樹狀圖
列聚類
K-均值聚類
針對偏好的聚類
以二維形式展現數據
有關聚類的其他事宜
練習
第4章搜尋與排名
搜尋引擎的組成
一個簡單的爬蟲程式
建立索引
查詢
基於內容的排名
利用外部回指連結
從點擊行為中學習
練習
第5章最佳化
組團旅遊
描述題解
成本函式
隨機搜尋
爬山法
模擬退火算法
遺傳算法
真實的航班搜尋
涉及偏好的最佳化
網路可視化
其他可能的套用場合
練習
第6章文檔過濾
過濾垃圾信息
文檔和單詞
對分類器進行訓練
計算機率
樸素分類器
費舍爾方法
將經過訓練的分類器持久化
過濾部落格訂閱源
……
第7章決策樹建模
第8章構建價格模型
第9章高階分類:核方法與SVM
第10章尋找獨立特徵
第11章智慧型進化
第12章算法總結
附錄A:第三方函式館
附錄B:數學公式
索引
盤點有關算法書籍
算法可以理解為有基本運算及規定的運算順序所構成的完整的解題步驟。或者看成按照要求設計好的有限的確切的計算序列,並且這樣的步驟和序列可以解決一類問題。 |