圖書信息
【作者】 [法] Andrie de Vries ,[比利時] Joris Meys
【ISBN】 978-7-115-38764-6
【日期】 2015-05
圖書簡介
本書首先從基本概念入手,介紹向量的計算與R語言向量化函式的強大之處,然後逐步引導讀者邁入R編程的世界,從一個統計分析師的角度,細緻而深入地講解了R語言中的數據提取與數據處理,並在科學而系統的統計分析中套用和實踐。除此之外,本書還系統地介紹了如何使用R語言來繪製各類數據圖表,使讀者可以方便地將數據轉化成可視化元素,豐富數據報表與演示文檔。
本書既適用於眾多領域的數據分析師和數據處理人員,也適用於對R語言編程感興趣的學生和科研工作者。
圖書目錄
第一部分 R You Ready? 1
第 1 章 大視角看R 3
認識R的優勢 4
免費且開源 4
可在任何環境下運行 5
支持擴展 5
擁有一個活躍的社區 5
與其他語言緊密連線 6
R的獨特之處 6
使用向量同時進行多項計算 6
不止是統計 7
無需編譯直接運行 8
第 2 章 R初探 9
使用代碼編輯器 10
探索RGui 10
裝備RStudio 13
開啟第一個R會話 15
Hello World! 16
簡單的數學 16
使用向量 16
存儲並進行數值計算 17
與用戶對話 18
Sourcing a Script 19
探索Workspace 21
操作Workspace的內容 21
保存工作成果 22
提取之前的工作 23
第 3 章 R基礎 24
充分利用函式的強大功能 24
向量函式 25
將參數傳入函式 26
歷史記錄 27
保持代碼的可讀性 28
遵守命名約定 28
更好地組織代碼 31
添加注釋 33
基礎R功能的擴展 33
查找擴展包 33
安裝擴展包 34
載入和卸載擴展包 34
第二部分 開始使用R 37
第 4 章 基本算術 39
數值、無限大與缺失值 39
執行基本的運算 40
使用數學函式 42
計算向量整體的值 45
超越無窮 45
使用向量組織數據 47
探索向量屬性 48
創建向量 50
連線向量 51
重複向量 51
向量值的存取 52
理解R的索引 52
從向量中提取數值 52
修改向量中的值 53
使用邏輯向量 55
值的比較 55
將邏輯向量用作索引 56
邏輯表達式的組合 57
邏輯向量小結 58
使用向量函式增強數學計算 59
使用向量的數學運算 59
參數回收 61
第 5 章 開始讀寫 64
使用字元向量表示文本數據 64
為字元向量賦值 65
創建包含多個元素的字元向量 65
獲取向量的子集 65
為向量中的值命名 67
操作文本 69
字元串理論:連線和分離 69
文本排序 72
查找文本中包含的內容 73
文本替換 76
使用正則表達式 76
使用因子進行分類 79
創建因子 79
轉換因子 80
關於levels 82
數據類型的判別 83
使用有序因子 84
第 6 章 與R的“約會” 86
使用日期 86
用不同格式表示日期 88
添加時間 89
格式化日期和時間 91
執行日期時間操作 91
日期時間的加減 92
日期的比較 92
提取日期元素 93
第 7 章 學習處理高維數據 96
添加第二個維度 96
探索新的維度 96
將向量組合成矩陣 99
使用索引 100
提取矩陣元素的值 101
修改矩陣中的值 103
為矩陣行列命名 104
修改行和列的名稱 104
將名稱作為索引 105
矩陣的計算 106
矩陣的基本運算 106
行列求和 107
矩陣運算 108
添加更多維度 110
創建數組 110
使用維度來提取數據 111
用數據幀組合不同類型的值 112
由矩陣創建數據幀 112
從零創建數據幀 114
命名變數和觀測 115
運算元據幀中的值 116
提取變數、觀測和元素值 117
向數據幀添加觀測 118
向數據幀添加變數 120
將不同類型的對象組合到列表中 122
創建一個列表 122
提取列表中的元素 124
修改列表中的元素 125
理解列表的str()輸出結果 127
幾個原則 128
第三部分 在R中編程 131
第 8 章 函式的樂趣 133
從腳本到函式 133
編寫腳本 133
轉換腳本 134
使用函式 135
簡化代碼 137
巧妙地使用參數 139
添加更多的參數 139
“三點”參數的魔力 140
將函式作為參數 142
處理作用域 144
越界 144
使用內部函式 146
方法分配 148
隱藏在函式背後的“方法” 148
實現自己的通用函式 150
第 9 章 控制邏輯流 153
使用if表達式進行判斷選擇 153
使用if...else表達式實現另一種選擇 155
判斷選擇的向量化 157
分析問題 157
根據邏輯向量進行判斷 158
多重選擇 160
嵌套if...else表達式 160
用switch處理多種選擇 161
循環遍歷 162
構造一個for循環 162
在for循環中進行計算 163
無循環的循環:認識apply家族 165
apply家族的特性 166
先認識3個家族成員 167
針對行列使用apply函式 167
將函式套用到與列表類似的對象上 169
第 10 章 調試代碼 173
應該關注什麼 173
閱讀錯誤和警告信息 174
閱讀錯誤訊息 174
警告訊息的處理 175
開始“捕蟲” 176
logit幾率的計算 176
判斷錯誤的產生 177
檢查函式內部 178
自定義訊息 181
創建錯誤 181
創建警告 182
一些常見的錯誤 182
數據從一開始就是錯的 183
數據格式錯誤 183
第 11 章 獲取幫助 187
在R幫助檔案中檢索信息 187
知道要查找什麼 187
不知道要查找什麼 188
使用R查找線上資料 189
加入R社區 191
使用R郵件列表 191
在Stack Overflow和Stack Exchange上討論R 192
在Twitter上討論R 193
實現最小可復現示例 193
使用隨機值創建樣本數據 193
最小化代碼 195
提供必要的信息 195
第四部分 讓數據說話 197
第 12 章 R的數據輸入輸出 199
使用R獲取數據 199
在R文本編輯器中輸入數據 200
使用剪貼簿複製貼上 201
從CSV讀取數據 202
從Excel讀取數據 205
處理其他數據類型 206
R中的數據導出 207
使用檔案和資料夾 208
理解工作目錄 209
操作檔案 210
第 13 章 操作和處理數據 213
確定最合適的數據結構 213
提取數據子集 215
理解3種子集操作符 215
理解取子集的5種方法 215
提取數據幀的子集 216
在數據中添加計算域 221
數據幀的列運算 221
使用with和within提升代碼可讀性 221
對數據進行分組 222
數據集的組合與合併 224
創建示例數據 225
使用merge( )函式 226
使用查詢表 228
數據排序 230
對向量進行排序 231
對數據幀進行排序 231
使用apply函式遍歷數據 234
使用apply( )函式匯總數組 235
使用lapply( )和sapply( )遍歷列表或數據幀 236
使用tapply( )創建表格型匯總數據 237
了解公式接口 239
規範數據的格式 240
理解數據的長格式和寬格式 241
初識reshape2包 242
將數據轉換成長格式 243
將數據“重鑄”成寬格式 244
第 14 章 數據匯總 247
從正確的數據開始 247
使用因子或數值 248
唯 一值計數 248
準備數據 249
描述連續變數 250
數據的中心 250
描述變化性 251
計算分位數 251
描述分類 252
出現計數 252
計算占比 253
查找中心 254
描述分布 254
繪製直方圖 255
使用頻率和密度 256
描述多個變數 258
完整數據集的匯總 258
繪製子集的分位數 259
記錄相關性 261
使用表格 264
創建雙向表 264
將表格轉換為數據幀 266
邊際與占比 267
第 15 章 偏差和關係測試 269
近距離看分布 269
觀察海狸 270
常態分配的圖形檢驗 270
使用分點陣圖 271
使用更正式的方法檢驗正態性 274
比較兩個樣本 275
差異檢驗 275
比較成對數據 277
檢驗計數和占比 278
檢查占比 278
分析表格 279
提取檢驗結果 281
使用模型 282
方差分析 282
計算差異 284
線性關係建模 287
線性模型估計 289
預測新值 291
第五部分 繪製數據圖 295
第 16 章 使用基本圖形 297
創建不同類型的數據圖 297
數據圖概覽 297
向數據圖添加點和線 298
各種類型的數據圖 302
控制數據圖選項和參數 304
添加標題和坐標軸標籤 304
修改數據圖選項 305
在單頁中繪製多個數據圖 308
將數據圖保存成圖片檔案 309
第 17 章 使用lattice繪製切片圖 311
繪製一張lattice數據圖 312
載入lattice包 312
繪製lattice散點圖 313
添加趨勢線 314
修改數據圖選項 315
添加標題和標籤 316
調整標題和標籤的字號 316
使用主題修改數據圖選項 318
繪製不同類型的數據圖 318
繪製柱狀圖 319
繪製箱型圖 320
繪製分組數據 321
使用高格式數據 321
繪製分組數據 323
添加圖例