大數據精準挖掘

《大數據精準挖掘》是2014年3月化學工業出版社出版的圖書,作者是吳昱。

基本信息

大數據精準挖掘

作者:吳昱 著

叢書名:中國雲計算套用叢書

出版日期:2014年3月

書號:978-7-122-18992-9

開本:16K 787×1092 1/16

裝幀:平

版次:1版1次

頁數:174頁

內容簡介

本書以新興的大數據時代最實用的技術為支撐,以廣闊的科技視野和紮實的專業功底,全面介紹了大數據時代的由來和背景,闡述了與大數據分析相關的理論和數學模型。特別難能可貴的是,本書從蘊含大數據技術的精準數據挖掘工具入手,結合實際的成功案例,將數據精準挖掘的全過程和詳細步驟,包括結果驗證等方面內容,詳詳細細並非常專業地展現給讀者。本書理論和實踐密切結合,文字流暢,深入淺出,通俗易懂。

通過本書的學習,可以掌握當下大數據所涉及的主要數學分析模組的要點,並比較相互的特點。同時,能夠學會實用的數據挖掘專門技術及經歷數據挖掘的全過程。由於本書所介紹的技術與我國目前大數據運用的領軍行業金融、保險、電信、電子商務等密切相連,故本書有很強的實用性,能達到學以致用、邊學邊用的效果。

本書適合我國IT業的科研機構、相關企業的專業技術人員的學習之用;本書還可以作為政府部門制定大數據發展戰略時的參考。本書也適合全國高等院校的大學生和研究生學習使用;由於本書將理論與具體操作合二為一,故也能作為全國大專院校開設大數據實驗課程的教材。

目錄信息

第1篇基礎篇

第1章大數據時代下的數據挖掘3

11大數據的基礎4

111大數據呈現出了數據的新價值4

112數據採集、存儲與提取技術信息化5

113數據挖掘技術是大數據時代最本質特徵5

12大數據的特點6

121數據規模大6

122數據類型多6

123價值密度低,但總體的數據價值高7

124數據處理有速度要求7

13大數據的作用7

131數據已滲透到社會每個角落8

132數據成為競爭的新元素8

133數據創造新價值9

134大數據地位不斷躍升9

14大數據與數據挖掘10

141數據挖掘技術是大數據時代的靈魂和核心10

142數據挖掘技術涉及多種多類的知識節點10

143選擇最好的數據挖掘工具10

15令人期待的大數據時代11

16本章小結11

第2章大數據與雲計算13

21大數據與雲計算13

211大數據與雲計算關係13

212大數據擴展了雲計算服務類型14

213雲計算數據存儲系統得到推廣14

214追求集成一體化技術14

215大數據和雲計算缺一不可15

22雲計算的定義與特點15

221雲計算的定義15

222雲計算的特點15

23雲計算的基本架構16

231雲計算架構的基本層次16

232雲計算架構的服務層次16

24雲計算的關鍵技術17

241虛擬化技術17

242數據存儲技術19

243資源管理技術19

244雲計算中的編程模型20

245集成一體化技術21

246自動化技術21

25雲計算的商業模式21

251商業模式是雲計算的基石21

252雲計算的市場規模22

253雲計算商業模式分析22

26本章小結23

第2篇理論篇

第3章數據挖掘的主要方法及工具27

31數據挖掘主要方法27

311決策樹分類27

312神經網路33

313Logistic回歸方法37

314聚類分析38

315數據挖掘方法比較39

316分類器的評估與選擇40

32流行數據分析平台及數據挖掘工具介紹46

33本章小結52

第4章Logistic回歸模型53

41多元線性回歸模型53

42Logistic回歸模型55

43Logistic回歸模型的參數估計56

44Logistic回歸模型中回歸係數的意義58

45Logistic回歸模型的擬合優度63

46Logistic回歸係數的顯著性檢驗72

47Logistic回歸模型的預測準確性75

48回歸變數的選擇與逐步回歸77

49本章小結83

第5章數據挖掘建模過程86

51CRISPDM86

52SAS數據挖掘方法論——SEMMA88

53數據挖掘經驗談89

54本章小結89

第3篇套用篇

第6章金融行業套用1——信用評分93

61國內信用卡業務現狀93

62信用評分模型的起源、類別和發展94

63信用評分的步驟95

64實例演示97

641二元變數預測建模98

642圖形版建模輸出講解1——效果評價101

643圖形版建模輸出講解2——評分卡檔案103

65本章小結109

第7章金融行業套用2——信用卡催收評分110

71信用卡催收評分模型背景介紹110

72實例演示112

721圖形版連續變數預測建模112

722圖形版建模輸出114

73本章小結116

第8章保險電銷套用——尋找目標客戶117

81背景介紹117

82案例數據展示及分析118

821業務目標118

822數據展示118

83數據挖掘與分析過程120

831數據預處理120

832造變數122

833生成挖掘表123

834建立回響模型125

835建模結果分析125

84數據挖掘結果的運用129

85本章小結129

第9章電信行業套用——客戶流失預測131

91背景介紹131

92案例數據展示及分析131

921商業理解131

922數據理解132

923數據準備132

93建立打分模型133

94分析建模結果134

95數據挖掘結果的運用136

96本章小結137

第10章商品零售行業套用——購物籃分析138

101某連鎖零售公司的背景介紹138

102購物籃分析的基本內容139

1021同次購買的基本概念139

1022同次購買的關聯規則質量的衡量140

1023購買分析的實現141

1024下次購買的基本概念142

1025下次購買行為預測142

103購物籃分析——MBA工具的使用145

1031MBA工具的用途145

1032MBA工具的使用146

1033MBA工具的輸出146

104本章小結149

第11章實戰項目——交叉銷售150

111背景介紹150

112案例數據展示及分析151

1121數據展示151

1122業務目標及分析要求152

113數據挖掘過程152

1131數據預處理152

1132劃分數據集及生成目標變數153

1133生成衍生變數154

1134生成挖掘表159

114建立打分模型160

115結果分析161

116本章小結162

第12章收益預測163

121背景介紹163

122數據展示163

1221原始數據集展示163

1222數據挖掘表的生成165

123圖形版建模166

1231建模過程166

1232模型輸出166

1233為新數據集打分168

124本章小結170

參考文獻172

相關詞條

熱門詞條

聯絡我們