圖書信息
數據挖掘基礎
作者:劉鵬、張燕、陶建輝、姜才康
定價:48元
印次:1-1
ISBN:9787302502197
出版日期:2018.06.01
印刷日期:2018.06.21
內容簡介
本書介紹了數據挖掘的基本概念,包括數據挖掘的常用算法、常用工具、用途和套用場景及套用狀況, 講述了常用數據挖掘方法,如分類、聚類、關聯規則的概念、思想、典型算法、套用場景等。此外,本書 還從實際套用出發,講解了基於日誌的大數據挖掘技術的原理、工具、套用場景和成功案例。日誌挖掘技 術現在已得到了廣泛的運用。 通過以上內容的學習,讀者將了解數據挖掘的基本概念、思想和算法,並掌握其套用要領。本書可以 作為培養套用型人才的課程教材,也可作為相關開發人員的自學教材和參考手冊。
目錄
第1章數據挖掘概念
1.1數據挖掘概述
1.1.1什麼是數據挖掘
1.1.2數據挖掘常用算法概述
1.1.3數據挖掘常用工具概述
1.2數據探索
1.2.1數據概述
1.2.2數據質量
1.2.3數據預處理
1.3數據挖掘的套用
1.3.1數據挖掘現狀及發展趨勢
1.3.2數據挖掘需要解決的問題
1.3.3數據挖掘的套用場景
1.4作業與練習
參考文獻
第2章分類
2.1分類概述
2.1.1分類的基本概念
2.1.2解決分類問題的一般方法
2.1.3決策樹
案例:Web機器人檢測
2.1.4模型的過分擬合
2.2貝葉斯決策與分類器
2.2.1規則分類器
2.2.2分類中貝葉斯定理的套用
2.2.3分類中樸素貝葉斯的套用
2.3支持向量機
2.3.1最大邊緣超平面
2.3.2線性支持向量機SVM
2.3.3非線性支持向量機SVM
2.4分類在實際場景中的套用案例
案例一:如何解決文章主題關鍵字與搜尋引擎關鍵字帶來的檢索結果差異
案例二:甄別新金融交易方式的欺詐行為
案例三:線上廣告推薦中的分類
2.5作業與練習
參考文獻
第3章聚類
3.1聚類概述
3.1.1聚類的基本概念
3.1.2聚類算法
3.2聚合分析方法
3.2.1歐氏距離
3.2.2聚合過程
3.2.3聚類樹
3.2.4聚合分析方法套用例子
3.3聚類在實際場景中的套用案例
3.4聚類的實現例子
3.5作業與練習
參考文獻
第4章關聯規則
4.1關聯規則概述
4.1.1經典案例導入
4.1.2關聯規則的基本概念和定義
4.1.3關聯規則的分類
4.2關聯規則的挖掘過程
4.2.1知識回顧
4.2.2頻繁項集產生
4.2.3強關聯規則
4.2.4關聯規則評價標準
4.3關聯規則的Apriori算法
4.3.1知識回顧
4.3.2Apriori算法的核心思想
4.3.3Apriori算法描述
4.3.4Apriori算法評價
4.3.5Apriori算法改進
4.4關聯規則的FP-growth算法
4.4.1構建FP樹
4.4.2從FP樹中挖掘頻繁項集
4.5實戰:關聯規則挖掘實例
4.5.1關聯規則挖掘技術在國內外的套用現狀
4.5.2關聯規則套用實例
4.5.3關聯規則在大型超市中套用的步驟
4.6作業與練習
參考文獻
第5章綜合實戰—日誌的挖掘與套用
5.1日誌概念
5.1.1日誌是什麼
5.1.2日誌能做什麼
5.2日誌處理
5.2.1產生日誌
5.2.2傳輸日誌
5.2.3存儲日誌
5.2.4分析日誌
5.2.5日誌規範與標準
5.3日誌分析原理及工具
5.3.1日誌分析原理
5.3.2日誌分析工具
5.3.3日誌分析系統規劃建設
5.4日誌挖掘套用
5.4.1安全運維
5.4.2系統健康分析
5.4.3用戶行為分析
5.4.4業務分析設計
5.5日誌分析挖掘實例
5.6作業與練習
參考文獻
第6章數據挖掘套用案例
6.1電力行業採用聚類方法進行主變油溫分析
6.1.1需求背景及採用的大數據分析方法
6.1.2大數據分析方法的實現過程
6.1.3大數據分析方法的實現結果
6.2銀行信貸評價
6.2.1簡介
6.2.2神經網路模型
6.2.3實證檢驗
6.3指數預測
6.3.1金融時間序列概況
6.3.2小波消噪
6.3.3向量機
6.3.4指數預測
6.4客戶分群的精準智慧型行銷
6.4.1挖掘目標
6.4.2分析方法和過程
6.4.3建模仿真
6.5使用WEKA進行房屋定價
6.6作業與練習
參考文獻
附錄A大數據和人工智慧實驗環境
附錄BHadoop環境要求
附錄C名詞解釋