數據分析與數據挖掘實驗指導書

數據分析與數據挖掘實驗指導書

《數據分析與數據挖掘實驗指導書》是2016年國防工業出版社出版的圖書,作者是郝文寧、靳大尉、程愷。

內容簡介

本書是數據分析與數據挖掘課程的實驗指導書,結合大量實例全面闡述了使用 IBM SPSS 系列軟體進行數據分析與挖掘的原理、方法和步驟。緊密配合理論教學, 使學生在有限的實驗課時中,加深對所學知識的理解和掌握。

全書分為兩個部分,第一部分為數據分析實驗,主要介紹如何利用IBM SPSS Statistics 軟體進行統計分析,具體包括描述性統計、參數檢驗、非參數檢驗、相關分析、回歸分析和因子分析等七項實驗科目,第二部分為數據挖掘實驗,主要介紹如何利用IBM SPSS Modeler 軟體進行數據挖掘,具體包括關聯規則挖掘、決策樹分類、人工神經網路分類、貝葉斯方法分類和聚類等七項實驗科目。本書可作為數據工程相關專業本科生教材,也可為從事各領域數據分析和數據挖掘的專業人員提供指導和幫助。

目錄

實驗1IBMSPSSStatistics軟體使用基礎………………………………………………1
1.1實驗目的與要求……………………………………………………………………1
1.2實驗原理……………………………………………………………………………1
1.3實驗內容與步驟……………………………………………………………………1
1.3.1安裝、啟動與退出…………………………………………………………1
1.3.2定義變數…………………………………………………………………3
1.3.3數據的輸入與保存………………………………………………………6
1.3.4數據檔案的編輯與轉換…………………………………………………7
1.4思考題……………………………………………………………………………12
實驗2描述性統計………………………………………………………………………13
2.1實驗目的與要求…………………………………………………………………13
2.2實驗原理…………………………………………………………………………13
2.3實驗內容與步驟…………………………………………………………………14
2.3.1中心、離散趨勢描述實驗………………………………………………14
2.3.2頻數分布分析實驗………………………………………………………18
2.4思考題……………………………………………………………………………24
實驗3參數檢驗…………………………………………………………………………26
3.1實驗目的與要求…………………………………………………………………26

3.2實驗原理…………………………………………………………………………26
3.3實驗內容與步驟…………………………………………………………………28
3.3.1單樣本t檢驗……………………………………………………………28
3.3.2兩獨立樣本t檢驗………………………………………………………29
3.3.3兩配對樣本t檢驗………………………………………………………31
3.3.4單因素完全隨機設計的方差分析SPSS過程…………………………33
3.3.5單因素重複測量設計的方差分析SPSS過程…………………………37
3.3.6多因素完全隨機設計方差分析的SPSS過程…………………………40
3.4思考題……………………………………………………………………………45
實驗4非參數檢驗………………………………………………………………………46
4.1實驗目的與要求…………………………………………………………………46
4.2實驗原理…………………………………………………………………………46
4.3實驗內容與步驟…………………………………………………………………47

4.3.1單樣本二項分布檢驗的SPSS過程……………………………………47
4.3.2相關樣本二項分布檢驗的SPSS過程…………………………………50
4.3.3獨立樣本二項分布檢驗的SPSS過程…………………………………53
4.3.4適合性卡方檢驗的SPSS過程…………………………………………55
4.3.5獨立性卡方檢驗的SPSS過程…………………………………………59
4.3.6符號與符號秩次檢驗的SPSS過程……………………………………62
4.3.7秩和檢驗(曼-惠特尼U檢驗)的SPSS過程…………………………63
4.3.8中位數檢驗的SPSS過程………………………………………………65

4.4思考題……………………………………………………………………………67
實驗5相關分析…………………………………………………………………………69
5.1實驗目的與要求…………………………………………………………………69
5.2實驗原理…………………………………………………………………………69
5.3實驗內容與步驟…………………………………………………………………70
5.3.1二元變數相關分析的SPSS過程………………………………………70
5.3.2肯德爾和諧係數計算的SPSS過程……………………………………72

5.3.3偏相關分析的SPSS過程………………………………………………75
5.4思考題……………………………………………………………………………79
實驗6回歸分析…………………………………………………………………………80
6.1實驗目的與要求…………………………………………………………………80
6.2實驗原理…………………………………………………………………………80
6.3實驗內容與步驟…………………………………………………………………81
6.3.1一元線性回歸分析的SPSS過程………………………………………81
6.3.2多元線性回歸分析的SPSS過程………………………………………84
6.4思考題……………………………………………………………………………89
實驗7因子分析…………………………………………………………………………91
7.1實驗目的與要求…………………………………………………………………91
7.2實驗原理…………………………………………………………………………91
7.3實驗內容與步驟…………………………………………………………………92
7.3.1因子分析的SPSS過程…………………………………………………92
7.3.2因素分析結果的讀取與解釋……………………………………………97
7.4思考題……………………………………………………………………………102
實驗8IBMSPSSModeler軟體使用基礎……………………………………………103
8.1實驗目的與要求…………………………………………………………………103
8.2實驗原理…………………………………………………………………………103
8.2.1IBMSPSSModeler簡介………………………………………………103
8.2.2數據挖掘的CRISP-DM模型………………………………………103
8.2.3Modeler軟體使用的技巧………………………………………………105
8.3實驗內容與步驟…………………………………………………………………107
8.3.1Modeler的啟動和界面布局……………………………………………107
8.3.2完整建模流程的介紹…………………………………………………110
8.4思考題……………………………………………………………………………114
實驗9關聯規則挖掘實驗………………………………………………………………115
9.1實驗目的與要求…………………………………………………………………115
9.2實驗原理…………………………………………………………………………115
9.2.1關聯規則處理數據的兩種形式………………………………………115
9.2.2關聯規則相關概念……………………………………………………116
9.3實驗內容與步驟…………………………………………………………………117
9.3.1Apriori算法套用………………………………………………………117
9.3.2序列關聯套用…………………………………………………………123
9.4思考題……………………………………………………………………………127

實驗10決策樹分類實驗………………………………………………………………128
10.1實驗目的與要求………………………………………………………………128
10.2實驗原理………………………………………………………………………128
10.2.1決策樹分類原理……………………………………………………128
10.2.2決策樹分類常用算法………………………………………………128
10.3實驗內容與步驟………………………………………………………………129
10.3.1導入數據……………………………………………………………129
10.3.2數據認識與處理……………………………………………………130
10.3.3建立模型與評估……………………………………………………134
10.4思考題…………………………………………………………………………136
實驗11支持向量機SVM分類實驗……………………………………………………137
11.1實驗目的與要求………………………………………………………………137
11.2實驗原理………………………………………………………………………137
11.3實驗內容與步驟………………………………………………………………138
11.3.1導入數據……………………………………………………………138
11.3.2建立模型……………………………………………………………139
11.4思考題…………………………………………………………………………143
實驗12人工神經網路分類實驗………………………………………………………144
12.1實驗目的與要求………………………………………………………………144
12.2實驗原理………………………………………………………………………144
12.3實驗內容與步驟………………………………………………………………145
12.3.1導入數據……………………………………………………………145
12.3.2模型建立……………………………………………………………145
12.4思考題…………………………………………………………………………151
實驗13貝葉斯方法分類實驗…………………………………………………………152
13.1實驗目的與要求………………………………………………………………152
13.2實驗原理………………………………………………………………………152
12.2.1貝葉斯定理和樸素貝葉斯…………………………………………152
13.2.2Modeler中的貝葉斯分類器…………………………………………153
13.3實驗內容與步驟………………………………………………………………154
13.3.1數據導入……………………………………………………………154
13.3.2貝葉斯網路建模……………………………………………………155
13.4思考題…………………………………………………………………………159
實驗14K均值與二分法聚類實驗……………………………………………………160
14.1實驗目的與要求………………………………………………………………160
14.2實驗原理………………………………………………………………………160
14.2.1聚類分析……………………………………………………………160
14.2.2K-Means聚類………………………………………………………161

14.2.3兩步聚類……………………………………………………………162
14.3實驗內容與步驟………………………………………………………………162
14.3.1K均值聚類…………………………………………………………162
14.3.2兩步法類……………………………………………………………167
14.4思考題…………………………………………………………………………171
參考文獻……………………………………………………………………………………172

相關詞條

熱門詞條

聯絡我們