圖書信息
叢書名: 計算機科學叢書
作 者: (紐西蘭)威滕(Witten,I.H.),(紐西蘭)弗蘭克(Frank,E.) 著,董琳 等譯
出 版 社: 機械工業出版社
出版時間: 2006-7-1
版 次: 1
頁 數: 362
紙 張: 膠版紙
I S B N : 9787111182054
包 裝: 平裝
分類: 圖書 >> 計算機/網路 >> 資料庫 >>數據倉庫與數據挖掘
定價:¥48.00
內容簡介
本書介紹數據挖掘的基本理論與實踐方法。主要內容包括:各種模型(決策樹,關聯規則、線性模型、聚類、貝葉斯網以及神經網路)以及在實踐中的運用,所存任缺陷的分析。安全地清理數據集、建立以及評估模型的預測質量的方法,並且提供了一個公開的數據挖掘工作平台WEKA。Weka系統擁有進行數據挖掘仟務的圖形用戶界面,有助於理解模型,是一個實用並且深受歡迎的工具。
本書邏輯嚴密、內容翔實、極富實踐性,適合作為高等學校本科生或研究生的教材,也可供相關技術人員參考。
作者簡介
Ian H.Witten,紐西蘭懷卡托大學計算機科學系教授,ACM和紐西蘭皇(IFIP)頒發的Namur獎項。他的著作包括《Managing Gigabytes:Compressing and Indexing Documents and Images》、《How to Build a Digital Library》以及眾多的期刊和學會文章。
目錄
出版者的話
專家指導委員會
譯者序
中文版前言
序
前言
第一部分 機器學習工具與技術
第1章 緒論
1.l 數據挖掘和機器學習
l.2 簡單的例子:天氣問題和其他
l.3 套用領域-
1.4 機器學習和統計學
1.5 用於搜尋的概括
l.6 數據挖掘和道德
1.7 補允讀物
第2章 輸入概念、實例和屬性
2.1 概念
2.2 樣本
2.3 屬性
2.4 輸入準備
2.5 補充讀物
第3章 輸出:知識表達
3.1 決策表
3.2 決策樹
3.3 分類規則
3.4 關聯規則
3.5 包含例外的規則
3.6 包含關係的規則
3.7 數值預測樹
3.8 基於實例的表達
3.9 聚類
3.10 補充讀物
第4章 算法基本方法
4.1 推斷基本規則
4.2統計建模
4.3分治法:創建決策樹
4.4 覆蓋算法:建立規則
4.5 挖掘關聯規州
4.6 線性模型
4.7 基於實例的學習
4.8 聚類
4.9 補充讀物
第5章 可信度:評估機器學習結果
5.1 訓練和測試
5.2 預測性能
5.3交叉驗證
5.4 其他估計法
5.5 可信度:評估機器學習結果
5.6 預測機率
5.7 計算成本
5.8 評估數值預測
5.9 最短描述長度原理
5.10 聚類方法中套用MDL原理
5.1l 補充讀物
第6章 實現:真正的機器學習方案
……
第7章 轉換:處理輸入和輸出
第8章 繼續擴展和套用
第9章 Weka簡介
第10章 Explorer界面
第1l章 Knowledge Flow界面
第12章 Experimenter界面
第13章 命令行界面
第14章 嵌入式機器學習
第15章 編寫新學習方案
參考文獻
索引