作者簡介
杜爾森·德倫博士
國際知名的商務分析與數據挖掘專家,經常受邀參加全國乃至國際會議,就數據與文本挖掘、商務情報、決策支持系統、商業分析以及知識管理等話題發表演講。
德倫博士是威廉姆·斯皮爾斯和尼爾·帕特森商務分析榮譽主席、健康系統創新中心的研究主任,俄克拉何馬州立大學斯皮爾斯商學院管理科學與信息系統教授。現已出版多部關於商務分析與數據挖掘方面的著作。
丁曉松(譯者)
北京外國語大學國際商學院管理科學與工程系教授,主要的研究領域包括庫存管理、模糊決策分析、最最佳化算法、供應鏈績效評估等。迄今為止,丁曉松教授已在國內外知名學術期刊發表論文多篇,並出版《大數據供應鏈》等多部譯著和專著。
內容簡介
利用最新的數據挖掘技術,可以提供及時可行的循證決策。本書闡明了目前最佳的實踐經驗,表明如何利用數據挖掘技術揭示背後隱藏的模式和相關性,以此來全方位提升商業表現,作為一位研究員、實踐者和指導者,戴倫博士實現了概念、技巧和套用的最佳平衡與融合。
目錄
第1 章 分析學入門 / 1 /
分析學與分析有區別嗎 / 3 /
數據挖掘該歸何處 / 3 /
分析學何以突然受到追捧 / 4 /
分析學的套用領域 / 6 /
分析學面臨的主要挑戰 / 6 /
分析學的發展歷史 / 8 /
分析學的簡單分類 / 12 /
分析學的前沿技術——以IBM Watson 為例 / 17 /
第2 章 數據挖掘入門 / 25 /
數據挖掘是什麼 / 28 /
哪些不屬於數據挖掘 / 30 /
數據挖掘最常見的套用 / 32 /
數據挖掘能夠發現怎樣的規律 / 36 /
常用的數據挖掘工具 / 41 /
數據挖掘的負面影響:隱私問題 / 46 /
第3 章 數據挖掘過程 / 54 /
資料庫知識獲取過程 / 54 /
跨行業標準化數據挖掘流程 / 56 /
SEMMA / 62 /
數據挖掘六西格瑪方法 / 66 /
哪種方法最好 / 69 /
第4 章 數據與數據挖掘的方法 / 74 /
數據挖掘中的數據屬性 / 74 /
數據挖掘中的數據預處理 / 77 /
數據挖掘方法 / 82 /
預測法 / 83 /
分類法 / 83 /
決策樹 / 91 /
數據挖掘中的聚類分析 / 93 /
K 均值聚類算法 / 97 /
關聯法 / 98 /
Apriori 算法 / 102 /
對數據挖掘的誤解與事實 / 103 /
第5 章 數據挖掘算法 / 112 /
近鄰算法 / 113 /
評估相似性:距離度量 / 114 /
人工神經網路 / 117 /
支持向量機 / 128 /
線性回歸 / 133 /
邏輯回歸 / 138 /
時間序列預測 / 140 /
第6 章 文本分析和情感分析 / 145 /
自然語言處理 / 150 /
文本挖掘套用 / 154 /
文本挖掘的流程 / 159 /
文本挖掘工具 / 171 /
情感分析 / 172 /
第7 章 大數據分析學 / 183 /
大數據從何而來 / 184 /
定義“大數據”的V 們 / 186 /
大數據的關鍵概念 / 190 /
大數據分析處理的商業問題 / 195 /
大數據科技 / 196 /
數據科學家 / 205 /
大數據和流分析法 / 208 /
數據流挖掘 / 210 /
譯者後記 / 213 /