數據分析:R語言實戰

數據分析:R語言實戰

《數據分析:R語言實戰》是2014年電子工業出版社出版的圖書。

內容簡介

大數據時代,數據成為決策最為重要的參考之一,數據分析行業邁入了一個全新的階段。R是一款非常優秀的統計分析軟體,本書側重於使用R進行數據的處理、整理和分析,重點講述了R的數據分析流程、算法包的使用以及相關工具的套用,同時結合大量精選的數據分析問題對R軟體進行科學、準確和全面的介紹,以便使讀者能深刻理解R的精髓和靈活、高效的使用技巧。 通過本書,讀者不僅能掌握使用R及相關的算法包來快速解決實際問題,而且能學會從實際問題分析入手,到利用R進行求解,以及對結果進行分析。

前言

前 言 大數據時代,數據成為決策最為重要的參考之一,數據分析隨著大數據概念的普及而日益得到重視,數據分析行業邁入了一個全新的階段。 數據分析的軟體如雨後春筍般地湧現,其中R軟體的發展備受矚目。R是一個免費開源軟體,它提供了首屈一指的統計計算和繪圖功能,尤其是大量的統計分析、數據挖掘方面的算法包,使得它成為一款優秀的、不可多得的數據分析工具軟體。 本書的主要目的是向讀者介紹如何用R進行數據。

基本信息

叢書名 :大數據時代的R語言

作 譯 者:李詩羽 張飛 王正林

出版時間:2014-08

千 字 數:521

版 次:01-01 頁 數:336

開 本:16(185*235)

I S B N :978712123714

目 錄

上篇:數據預處理

第0章 致敬,R! 1

致敬,肩膀! 1

致敬,時代! 3

致敬,人才! 3

致敬,R瑟! 5

第1章 數據分析導引 8

1.1 數據分析概述 8

1.1.1 數據分析的原則 8

1.1.2 數據分析的步驟 9

1.1.3 數據分析的過程 10

1.1.4 數據分析的對象 11

1.2 大數據分析 11

1.2.1 大數據分析的流程 11

1.2.2 大數據分析的基本方面 12

1.2.3 大數據分析的套用 13

1.3 數據分析常用工具 13

1.4 R在數據分析中的優勢 14

第2章 數據的讀取與保存 16

2.1 數據讀取 16

2.1.1 讀取內置數據集 16

2.1.2 讀取文本檔案 17

2.1.3 讀取固定寬度格式的檔案 20

2.1.4 讀取Excel數據 21

2.1.5 讀取資料庫檔案 22

2.1.6 讀取網頁數據 26

2.1.7 讀入R格式的檔案 28

2.1.8 從其他統計軟體讀入數據 28

2.2 數據保存 31

2.2.1 使用函式cat() 31

2.2.2 保存為文本檔案 32

2.2.3 保存R格式檔案 33

2.2.4 保存為其他類型檔案 33

第3章 數據預處理 34

3.1 基本函式 34

3.2 數據修改 38

3.2.1 修改數據標籤 38

3.2.2 行列刪除 38

3.3 缺失值處理 38

3.3.1 判斷缺失數據 39

3.3.2 判斷缺失模式 39

3.3.3 處理缺失數據 41

3.4 數據整理 44

3.4.1 數據合併 44

3.4.2 選取數據的子集 46

3.4.3 數據排序 47

3.5 長寬格式的轉換 48

3.5.1 揉數據函式 48

3.5.2 揉數據的最佳伴侶 49

中篇:基本分析及套用

第4章 數據的圖形描述 54

4.1 R繪圖概述 54

4.2 繪圖區域分割 55

4.2.1 函式par() 55

4.2.2 函式layout() 56

4.2.3 函式split.screen() 57

4.3 二維圖形 58

4.3.1 高級繪圖函式 58

4.3.2 多元數據繪圖 61

4.3.3 低級繪圖函式 63

4.3.4 圖形美化 64

4.3.5 互動式繪圖命令 65

4.4 三維圖形 67

4.5 LATTICE程式包 69

4.6 GGPLOT2程式包 73

4.6.1 快速繪圖 74

4.6.2 分圖層繪圖 76

4.7 圖形保存 84

4.8 綜合實例:數據地圖 84

第5章 數據的描述性分析 88

5.1 R內置的分布 88

5.2 集中趨勢的分析 90

5.2.1 集中趨勢的測度 90

5.2.2 R語言實現 91

5.3 離散趨勢的分析 93

5.3.1 離散趨勢的測度 93

5.3.2 R語言實現 94

5.4 數據的分布分析 95

5.4.1 分布情況的測度 95

5.4.2 R語言實現 96

5.5 圖形分析及R實現 97

5.5.1 直方圖和密度函式圖 97

5.5.2 QQ圖 98

5.5.3 莖葉圖 100

5.5.4 箱線圖 100

5.5.5 經驗分布圖 102

5.6 多組數據分析及R實現 102

5.6.1 多組數據的統計分析 102

5.6.2 多組數據的圖形分析 103

第6章 參數估計及R實現 112

6.1 點估計及R實現 112

6.1.1 矩估計 112

6.1.2 極大似然估計 116

6.2 單正態總體的區間估計 122

6.2.1 均值 的區間估計 122

6.2.2 方差 的區間估計 125

6.3 兩正態總體的區間估計 126

6.3.1 均值差 的區間估計 127

6.3.2 兩方差比 的區間估計 130

6.4 關於比率的區間估計 131

第7章 假設檢驗及R實現 134

7.1 假設檢驗概述 134

7.1.1 理論依據 135

7.1.2 檢驗步驟 135

7.1.3 兩類錯誤 136

7.2 單正態總體的檢驗 137

7.2.1 均值 的檢驗 138

(2) 未知 140

7.2.2 方差 的檢驗 141

7.3 兩正態總體的檢驗 142

7.3.1 均值差 的檢驗 143

7.3.2 成對數據的t檢驗 146

7.3.3 兩總體方差的檢驗 147

7.4 比率的檢驗 148

7.4.1 比率的二項分布檢驗 148

7.4.2 比率的近似檢驗 149

7.5 非參數的檢驗 149

7.5.1 總體分布的 檢驗 150

7.5.2 Kolmogrov-Smirnov檢驗 153

第8章 方差分析及R實現 157

8.1 單因素方差分析及R實現 157

8.1.1 基本假設的檢驗 157

8.1.2 單因素方差分析 160

8.1.3 多重t檢驗 164

8.1.4 Kruskal-Wallis秩和檢驗 166

8.2 雙因素方差分析及R實現 168

8.2.1 無互動作用的分析 169

8.2.2 有互動作用的分析 172

8.3 協方差分析及R實現 176

第9章 回歸分析及R實現 180

9.1 一元線性回歸 180

9.1.1 模型理論 180

9.1.2 顯著性檢驗 181

9.1.3 R語言實現 181

9.2 多元線性回歸 187

9.2.1 模型理論 187

9.2.2 顯著性檢驗 188

9.2.3 R語言實現 189

9.2.4 逐步回歸 192

9.3 回歸診斷及R實現 194

9.3.1 殘差診斷 195

9.3.2 影響分析 198

9.3.3 多重共線性診斷 201

9.4 嶺回歸及R實現 203

9.5 廣義線性模型 206

9.5.1 模型理論 206

9.5.2 R語言實現 207

第10章 主成分分析與因子分析 211

10.1 主成分分析 211

10.1.1 理論基礎 211

10.1.2 R語言實現 215

10.2 因子分析 221

10.2.1 理論模型 221

10.2.2 因子載荷矩陣的估計方法 223

10.2.3 R語言實現 225

第11章 典型相關分析和對應分析 230

11.1 典型相關分析 230

11.1.1 理論基礎 230

11.1.2 典型相關分析的套用 232

11.1.3 R語言實現 233

11.2 對應分析 236

11.2.1 理論基礎 236

11.2.2 對應分析的步驟 237

11.2.3 R語言實現 238

第12章 判別分析和聚類分析 242

12.1 判別分析及R實現 242

12.1.1 距離判別法 243

12.1.2 距離判別法的R實現 244

12.1.3 Fisher判別法 247

12.1.4 Fisher判別法的R實現 248

12.1.5 貝葉斯判別法 251

12.1.6 貝葉斯判別法的R實現 252

12.2 聚類分析及R實現 252

12.2.1 理論概述 253

12.2.2 R實現舉例 254

第13章 時間序列分析及R實現 260

13.1 時間序列的基本分析 260

13.1.1 平穩性與非平穩性 260

13.1.2 R實現的基本步驟 261

13.2 時間序列的分解 262

13.2.1 分解非季節性數據 263

13.2.2 分解季節性數據 265

13.3 指數平滑法預測分析 268

13.3.1 簡單指數平滑法 269

13.3.2 殘差的白噪聲檢驗 272

13.3.3 Holt指數平滑法 275

13.3.4 Winters指數平滑法 277

13.4 ARIMA模型分析 280

13.4.1 基本思想 280

13.4.2 平穩化處理 281

13.4.3 建模 282

13.4.4 模型的參數估計 284

13.4.5 模型預測及檢驗 284

下篇:綜合實例

第14章 R在金融數據分析中的套用 288

14.1 投資組合最最佳化實例 288

14.1.1 概述 288

14.1.2 均值—方差模型 289

14.1.3 模擬退火算法 292

14.2 構造投資組合的有效前沿 298

14.2.1 R中的算法包 298

14.2.2 計算分析 298

14.3 股票聚類分析 301

14.3.1 概述 301

14.3.2 K-means聚類分析 302

14.3.3 層次聚類分析 304

第15章 R在數據預測中的套用 306

15.1 回歸分析預測 306

15.1.1 概述 306

15.1.2 綜合實例 306

15.2 時間序列預測 318

15.2.1 概述 318

15.2.2 綜合實例 318

相關詞條

熱門詞條

聯絡我們