R語言經典實例

R語言經典實例

《R語言經典實例》是2013年出版的一本圖書,該書作者是Paul Teetor。

基本信息

基本信息

原書名:R Cookbook
作者:(美)Paul Teetor 著
ISBN:978-7-111-42021-7
定價:79.00
頁數:423
出版日期:2013年05月02日
譯者:李洪成 朱文佳 沈毅誠 譯

內容簡介

本書涵蓋200多個R語言實用方法,可以幫助讀者快速而有效地使用R進行數據分析。R語言給我們提供了統計分析的一切工具,但是R本身的結構可能有些難於掌握。本書提供的這些面向任務、簡明的R語言方法包含了從基本的分析任務到輸入和輸出、常用統計分析、繪圖、線性回歸等內容,它們可以讓你馬上套用R高效地工作。
每一個R語言方法都專注於一個特定的問題,隨後的討論則對問題的解決方案給出解釋,並闡釋該方法的工作機理。對於R的初級用戶,本書將幫助你步入R的殿堂;對於R的資深用戶,本書將加深你對R的理解並拓展你的視野。通過本書,你可以使你的分析工作順利完成並學習更多R語言知識。

本書主要內容

  • 建立向量,處理變數,以及執行其他基本函式。
  • 數據的輸入和輸出。
  • 處理矩陣、列表、因子和數據框等數據結構。
  • 分析機率、機率分布和隨機變數。
  • 計算統計量和置信區間,進行統計檢驗。
  • 創建各種圖形。
  • 構建線性回歸和方差分析(ANOVA)等統計模型。
  • 探索高級統計技術,如聚類分析等。

作者簡介

Paul Teetor是一位定量分析專家,他曾獲統計學碩士學位和計算機科學碩士學位。他擅長投資管理、證券交易和風險管理等領域的分析與軟體工程。

目錄

前言 1
第1章 R入門和獲得幫助 7
1.1 下載和安裝R軟體 8
1.2 開始運行R軟體 10
1.3 輸入R命令 13
1.4 退出R 15
1.5 中斷R正在運行的程式 16
1.6 查看幫助文檔 17
1.7 獲取函式的幫助文檔 18
1.8 搜尋幫助文檔 20
1.9 查看R軟體包幫助信息 21
1.10 通過網路獲取幫助 23
1.11 尋找相關函式與數據包 26
1.12 查詢郵件列表 27
1.13 向郵件列表提交問題 27
第2章 基礎知識 30
2.1 顯示內容 30
2.2 設定變數 32
2.3 列出所有變數 34
2.4 刪除變數 35
2.5 生成向量 36
2.6 計算基本統計量 37
2.7 生成數列 40
2.8 向量比較 42
2.9 選取向量中的元素 43
2.10 向量的計算 46
2.11 運算符優先權問題 48
2.12 定義函式 50
2.13減少輸入,得到更多命令 52
2.14常見錯誤 54
第3章 R軟體導覽 58
3.1 獲取和設定工作目錄 58
3.2 保存工作空間 59
3.3 查看歷史命令記錄 60
3.4 保存先前命令產生的結果 60
3.5 顯示搜尋路徑 61
3.6 使用R包中的函式 62
3.7 使用R的內置數據集 64
3.8 查看已安裝的R包列表 65
3.9 從CRAN網站安裝R包 67
3.10 設定默認CRAN網站鏡像 69
3.11 隱藏啟動信息 70
3.12 運行腳本 70
3.13 批量運行R代碼 71
3.14 獲取和設定環境變數 74
3.15 找到R的主目錄 75
3.16 R的客戶化 76
第4章 輸入與輸出 80
4.1 使用鍵盤輸入數據 81
4.2 顯示更少的位數(或更多的位數) 82
4.3 將輸出結果重定向到某一檔案 84
4.4 顯示檔案列表 85
4.5 解決無法在Windows中打開檔案的問題 86
4.6 閱讀固定寬度數據記錄 87
4.7 讀取表格數據檔案 88
4.8 讀取CSV檔案 90
4.9 寫入CSV檔案 92
4.10 從網路中讀取表格或CSV格式數據 93
4.11 讀取HTML表格數據 94
4.12 讀取複雜格式數據檔案 96
4.13 讀取MySQL資料庫中的數據 100
4.14 保存和傳送目標 102
第5章 數據結構 104
5.1 對向量添加數據 111
5.2 在向量中插入數據 112
5.3 理解循環規則 113
5.4 構建因子(即分類變數) 115
5.5 將多個向量合併成單個向量以及平行因子 117
5.6 創建列表 118
5.7 根據位置選定列表元素 119
5.8 根據名稱選定列表元素 121
5.9 構建一個名稱/值關聯表 122
5.10 從列表中移除元素 124
5.11 將列錶轉換為向量 125
5.12 從列表中移除取值為空值(即NULL)的元素 126
5.13 使用條件來移除列表元素 127
5.14 矩陣初始化 129
5.15 執行矩陣運算 130
5.16 將描述性名稱賦給矩陣的行和列 131
5.17 從矩陣中選定一行或一列 132
5.18 用列數據初始化數據框 133
5.19 由行數據初始化數據框 134
5.20 添加行至數據框 136
5.21 預分配數據框 137
5.22 根據位置選擇數據框的列 138
5.23 根據列名選定數據框的列 142
5.24 更便捷地選定行和列 143
5.25 修改數據框的列名 145
5.26 編輯數據框 146
5.27 從數據框中移除NA值 148
5.28 根據名稱排除列 149
5.29 合併兩個數據框 150
5.30 根據共有列合併數據框 151
5.31 更便捷地訪問數據框內容 152
5.32 基本數據類型之間的轉換 154
5.33 不同結構化數據類型間的轉換 156
第6章 數據轉換 159
6.1 向量分組 160
6.2 將函式套用於每個列表元素 161
6.3 將函式套用於每行 163
6.4 將函式套用於每列 164
6.5 將函式套用於組數據 166
6.6 將函式套用於行組 168
6.7 將函式套用於平行向量或列表 170
第7章 字元串和日期 172
7.1 獲取字元串長度 174
7.2 連線字元串 175
7.3 提取子串 176
7.4 根據分隔設定分割字元串 176
7.5 替代子串 178
7.6 查看字元串中的特殊字元 179
7.7 生成字元串的所有成對組合 179
7.8 得到當前日期 181
7.9 轉換字元串為日期 181
7.10 轉換日期為字元串 182
7.11 轉化年、月、日為日期 183
7.12 得到儒略日期 185
7.13 提取日期的一部分 185
7.14 創建日期序列 187
第8章 機率 189
8.1 計算組合數 191
8.2 生成組合 192
8.3 生成隨機數 193
8.4 生成可再生的隨機數 194
8.5 生成隨機樣本 196
8.6 生成隨機序列 197
8.7 隨機排列向量 198
8.8 計算離散分布的機率 198
8.9 計算連續分布的機率 200
8.10 轉換機率為分位數 201
8.11 繪製密度函式 203
第9章 統計概論 206
9.1 匯總數據 208
9.2 計算相對頻數 210
9.3 因子制表和列聯表創建 211
9.4 檢驗分類變數獨立性 212
9.5 計算數據集的分位數(和四分位數) 212
9.6 求分位數的逆 213
9.7 數據轉換為z分數 214
9.8 檢驗樣本均值(t檢驗) 215
9.9 均值的置信區間 216
9.10 中位數的置信區間 217
9.11 檢驗樣本比例 218
9.12 比例的置信區間 219
9.13 檢驗正態性 220
9.14 遊程檢驗 222
9.15 比較兩個樣本的均值 223
9.16 比較兩個非參數樣本的位置 225
9.17 檢驗相關係數的顯著性 226
9.18 檢驗組的等比例 228
9.19 組均值間成對比較 229
9.20 檢驗兩樣本的相同分布 230
第10章 圖形 232
10.1 創建散點圖 234
10.2 添加標題和標籤 236
10.3 添加格線 237
10.4 創建多組散點圖 238
10.5 添加圖例 240
10.6 繪製散點圖的回歸線 242
10.7 多變數散點圖的繪製 243
10.8 創建每個因子水平的散點圖 244
10.9 創建條形圖 246
10.10 對條形圖添加置信區間 248
10.11 給條形圖上色 249
10.12 繪製過點x和y的線 251
10.13 改變線的類型、寬度或者顏色 253
10.14 繪製多個數據集 254
10.15 添加垂直線和水平線 256
10.16 創建箱線圖 257
10.17 對每個因子水平創建箱線圖 258
10.18 創建直方圖 259
10.19 對直方圖添加密度估計 261
10.20 創建離散直方圖 262
10.21 創建正態Q-Q圖 264
10.22 創建其他Q-Q圖 265
10.23 用多種顏色繪製變數 266
10.24 繪製函式 269
10.25 圖形間暫停 270
10.26 在一頁中顯示多個圖形 271
10.27 打開另一個圖形視窗 273
10.28 在文檔中繪製圖形 274
10.29 改變圖形參數 275
第11章 線性回歸和方差分析 277
11.1 簡單線性回歸 279
11.2 多元線性回歸 281
11.3 得到回歸統計量 282
11.4 理解回歸的匯總結果 286
11.5 運行無截距的線性回歸 289
11.6 運行有交戶項的線性回歸 290
11.7 選擇最合適的回歸變數 292
11.8 對數據子集回歸 295
11.9 在回歸公式中使用表達式 296
11.10 多項式回歸 298
11.11 轉換數據的回歸 299
11.12 尋找最佳冪變換 301
11.13 回歸係數的置信區間 304
11.14 繪製回歸殘差 304
11.15 診斷線性回歸 306
11.16 識別有影響的觀察值 309
11.17 殘差自相關檢驗 310
11.18 預測新值 311
11.19 建立預測區間 312
11.20 運行單因素方差分析 313
11.21 創建互動關係圖 315
11.22 找到組間均值的不同 316
11.23 執行穩健方差分析 318
11.24 運用方差分析比較模型 320
第12章 有用的方法 323
12.1 查看你的數據 323
12.2 拓寬你的輸出 324
12.3 輸出賦值結果 325
12.4 對行和列求和 325
12.5 按列輸出數據 326
12.6 對數據分級 328
12.7 找到特定值的位置 329
12.8 每隔n個選定一個向量元素 330
12.9 找到成對的最小值或者最大值 331
12.10 生成多個因子的組合 332
12.11 轉換一個數據框 333
12.12 對數據框排序 334
12.13 對兩列排序 335
12.14 移除變數屬性 336
12.15 顯示對象的結構 337
12.16 代碼運行時間 340
12.17 抑制警告和錯誤訊息 341
12.18 從列表中提取函式參數 342
12.19 定義你自己的二元運算符 344
第13章 高級數值分析和統計方法 347
13.1 最小化或者最大化一個單參數函式 347
13.2 最小化或者最大化多參數函式 348
13.3 計算特徵值和特徵向量 350
13.4 主成分分析 351
13.5 簡單正交回歸 352
13.6 數據的聚類 354
13.7 預測二元變數(邏輯回歸) 357
13.8 統計量的自助法 359
13.9 因子分析 361
第14章 時間序列分析 366
14.1 表示時間序列 367
14.2 繪製時序圖 370
14.3 提取最老的觀測值或者最新的觀測值 373
14.4 選取時間序列的子集 374
14.5 合併多個時間序列 376
14.6 缺失時間序列的填充 378
14.7 時間序列的滯後 380
14.8 計算逐次差分 381
14.9 時間序列相關的計算 382
14.10 計算移動平均 383
14.11 在日曆時間範圍內套用函式 384
14.12 套用滾動函式 386
14.13 繪製自相關函式圖 388
14.14 檢驗時間序列的自相關 389
14.15 繪製偏自相關函式 390
14.16 兩個時間序列間的滯後相關性 391
14.17 剔除時間序列的趨勢 393
14.18 擬合ARIMA模型 394
14.19 剔除ARIMA模型中不顯著的係數 397
14.20 對ARIMA模型進行診斷 399
14.21 用ARIMA模型進行預測 400
14.22 均值回歸的檢驗 402
14.23 時間序列的平滑 404

相關詞條

相關搜尋

熱門詞條

聯絡我們