胸有成竹:數據分析的SPSS和SAS EG進階(第2版)

本書涉及使用SAS EG做數據分析的主要分析方法。

圖書信息

叢書名 :CDA數據分師系列叢書

作 譯 者:經管之家

出版時間:2016-05 千 字 數:452

版 次:01-01 頁 數:296

開 本:16開

I S B N :9787121285318

內容簡介

本書共5章,涉及使用SAS EG做數據分析的主要分析方法。其中,第1章為數據分析方法概述,第2章至第4章為橫截面數據分析方法。第5章為時間序列分析方法。每章都根據所涉及的知識點的不同,選取了實用的案例,並為讀者準備了相應的思考和練習題。 本書是一本面向商業數據分析初學者的教材,從具體的商業數據分析案例入手,使讀者掌握數據分析的目的、理念、思路與分析步驟。本書力圖淡化技術,對於方法的介紹也儘量避免涉及過多的數學內容,和高等數學相關的內容只線上形回歸和主成分分析這兩節中涉及到,而且都輔以圖形作形象的展現。因此本書的讀者只需要具有高中水平的數學基礎即可。

圖書目錄

第1 章 數據分析方法概述 1

1.1 數據分析概述 .. 2

1.1.1 數據分析過程 2

1.1.2 數據分析的商業驅動 3

1.2 數據分析與挖掘方法分類介紹 . 5

1.2.1 描述性——無監督的學習 . 7

1.2.2 預測性——有監督的學習 .. 10

1.3 數據分析的方法論 . 12

1.3.1 數據挖掘的項目管理方法論:CRISP-DM 13

1.3.2 數據整理與建模的方法論:SEMMA .. 14

1.3.3 SAS EG 和SPSS 任務選單編排與SEMMA 之間的關係. 16

第2 章 描述數據特徵 .. 19

2.1 認識數據類型 20

2.2 單變數描述統計方法 21

2.2.1 分類變數的描述 21

2.2.2 連續變數的描述 22

2.3 創建頻數報表 35

2.4 生成匯總統計量 .. 38

2.5 用匯總表任務生成匯總報表 41

2.6 繪製條形圖 . 46

2.7 繪製地圖 .. 53

2.8 使用SPSS 進行描述統計 .. 55

2.8.1 頻率過程 .. 56

2.8.2 描述過程 .. 57

2.8.3 探索過程 .. 58

2.8.4 P-P 圖與Q-Q 圖 58

2.9 使用SPSS 繪製統計圖形 .. 60

2.9.1 作圖方法 .. 60

2.9.2 餅圖、柱圖與條圖 .. 64

2.9.3 線圖、高低圖和雙軸圖 70

2.9.4 散點圖 73

第3 章 描述性數據分析/挖掘方法 . 75

3.1 客戶細分方法介紹 . 76

3.1.1 客戶細分的意義 76

3.1.2 根據客戶利潤貢獻進行劃分 . 77

3.1.3 根據個人或公司的生命歷程進行劃分 78

3.1.4 根據客戶的產品偏好進行劃分 79

3.1.5 根據客戶交易/消費行為進行劃分 . 80

3.1.6 根據客戶的多維行為屬性細分 81

3.1.7 展現客戶/產品結構的戰略細分 .. 81

3.1.8 客戶細分:綜合運用 . 82

3.2 連續變數間關係探索與變數約減 . 82

3.2.1 多元統計基礎 . 82

3.2.2 多元變數壓縮的思路 . 87

3.2.3 主成分分析 .. 89

3.2.4 因子分析 . 103

3.2.5 對應分析 . 112

3.2.6 最優尺度分析 .. 119

3.2.7 多維尺度分析 .. 124

3.3 聚類分析 133

3.3.1 基本邏輯 . 134

3.3.2 系統聚類 . 135

3.3.3 快速聚類 . 146

3.3.4 兩步聚類 . 155

第4 章 預測性數據分析方法 .. 161

4.1 假設檢驗概念 . 162

4.1.1 統計推斷基本概念 164

4.1.2 變數分布的圖形探索 .. 165

4.1.3 均值的置信區間 . 167

4.1.4 假設檢驗基礎 .. 168

4.1.5 T 檢驗 . 169

4.2 構造對連續變數的預測模型 . 174

4.2.1 方差分析(ANOVA) 174

4.2.2 線性回歸 . 190

4.2.3 線性回歸的模型診斷 .. 203

4.2.4 線性回歸的全流程 211

4.3 構造對二分類變數的預測模型 217

4.3.1 分類變數之間的相關性檢驗 .. 217

4.3.2 邏輯回歸 . 224

第5 章 時間序列 .. 240

5.1 時間序列的趨勢分解法 241

5.1.1 趨勢分解法簡介 . 241

5.2.2 使用SAS EG 進行時間序列趨勢分解 .. 242

5.2.3 使用SPSS 進行時間序列趨勢分解 244

5.2 平穩時間序列(ARMA)模型設定與識別 . 245

5.2.1 平穩時間序列定義 245

5.2.2 平穩時間序列模型建模 . 246

5.2.3 ARMA 的模型設定與識別 .. 247

5.3 非平穩時間序列(ARIMA)模型設定與識別 .. 250

5.4 SAS EG 時間序列建模步驟 .. 252

5.5 SPSS 時間序列建模步驟 . 258

5.5.1 SPSS 構造ARIMA 模型使用的任務選單 .. 258

5.5.2 “定義日期”任務 .. 260

5.5.3 “序列圖”任務 261

5.5.4 “自相關”任務 262

5.5.5 “創建模型”任務 .. 263

5.5.6 “使用模型”任務 .. 267

5.5.7 其他內容 . 267

附錄A 數據說明 .. 271

附錄B CDA 數據分析師致力於最好的數據分析人才建設 .. 278

參考文獻 282

相關詞條

熱門詞條

聯絡我們