大數據分析方法

《大數據分析方法》是2017年07月18日中國財富出版社出版的圖書,作者是陸紅。

內容簡介

本書圍繞大數據分析方法,闡述了大數據採集方法,大數據清洗方法,詳細介紹了大數據存儲方法,大數據分散式計算方法,大數據分析模型構建方法, 大數據分析模型最佳化方法。全書提供了大量的案例,對程式進行了詳細的分析和解讀。本書的實用價值較高,對從事大數據分析的科研人員、研發人員具有一定的借鑑參考作用。

圖書目錄

1大數據採集處理方法1

11爬蟲程式設計方案1

12爬蟲程式實現方法5

13數據清洗20

2大數據存儲方法27

21分散式檔案系統存儲大數據27

211HDFS體系結構27

212HDFS數據存儲方式28

213HDFS讀寫方式28

22分散式資料庫存儲大數據32

221Hbase體系結構32

222配置Hbase33

223Hbase表操作38

224訪問Hbase數據資源44

3大數據計算方法50

31分散式計算平台構建方法50

32分散式計算框架構建方法60

33分散式計算程式設計方法63

4大數據分析模型構建方法78

41準備訓練數據78

42機器學習路徑和算法設計方法82

43數據可視化輔助建模方法88

44構建大數據分析模型91

5大數據分析模型檢驗方法108

51回歸診斷108

52交叉驗證113

6大數據分析模型最佳化方法117

61Feature Scaling最佳化法117

62逐步回歸最佳化法118

63PCA主成分分析最佳化方法120

64神經網路最佳化大數據分析模型127

參考文獻151

相關詞條

熱門詞條

聯絡我們