內容簡介
自創立以來,R已經成為統計計算和數據分析的一個優秀軟體。該軟體的唾手可得以及範圍廣泛的程式包再加上隨時提供支持的R社區,使R成為幾乎任何一種和統計相關的計算任務的一個極好選擇。然而,很多用戶,
特別是那些有其它程式語言經驗的用戶,並沒有完全利用R的能力。由於R的特性,在其它程式語言中有用的方法在R中可能效率並不高。菲爾·斯佩克特的《R語言數據操作》展示了一系列將數據讀入R並進行高效處理的方法。
除了內置的函式,還包括了可以從CRAN(綜合R檔案網路)下載的大量現成的程式包。展示的所有方法都利用了R的核心特性:對於通常的數據管理任務所提供的向量化運算,高效的下標使用,R函式的正確使用。
最有經驗的R用戶發現,特別是在處理大型數據集時。將R和其它程式結合使用可能會有幫助,尤其是資料庫程式。因此,對於在R中使用資料庫,以及從電子表格和其它程式創建的數據集中提取數據的方法,這些都有
詳細的論述。R中雖然有時會忽略字元操作,在這裡卻作了詳細的論述。使得那些傳統地使用腳本語言解決的問題完全可以用R解決。對於那些有其它程式語言經驗的用戶提供了有效使用程式結構——例如循環——的指南。由於許多統計建模和圖形函式需要數據框形式的數據,全書自始至終都提供了將普通函式的輸出結果轉化為數據框的技術。通過使用各種不同的例子(其數據來源於R或者是輕鬆可得的模擬數據集),《R語言數據操作》可推薦給任何想從運行簡單的例子提高到可以對實際的真實數據提供操作解決方案的R使用者。
編輯推薦
菲爾·斯佩克特的《R語言數據操作》是近年來關於R軟體套用的一部不可多得的好書,本書內容具有綜合性、緊湊性和簡潔性,是R語言數據處理技術的綜合指南,對於統計套用和理論研究都很有幫助。
本書囊括了從各種不同格式的數據檔案讀取數據的技術以及採用適當的R內部數據格式保存數據的技術,對於諸如日期和時間型數據的處理、下標工具的套用、字元型數據的處理以及數據框的套用技術都通過豐富的實際或模擬數據實例作了精彩講解。
作者簡介
作者:(美)菲爾·斯佩克特 譯者:朱鈺、柴文義、張穎
菲爾·斯佩克特
1983年在美國德州農工大學獲得統計學博士學位,1987年至今在美國加州大學伯克利分校從事教研工作。現任該校統計系的應用程式管理員,為統計系副教授,主講統計計算課程。迄今已發表多篇關於統計計算和統計軟體的論文,並著有三本書,其中data Manipulation with R已翻譯成日文出版。
目錄
譯者序
前言
第1章 R中的數據
1.1 模式和類
1.2 R的數據存儲
1.3 模式與類的檢測
1.4 R對象的結構
1.5 對象的轉換
1.6 缺失值
1.7 缺失值的處理
第2章 讀取和寫入數據
2.1 讀取向量和矩陣
2.2 數據框:read.table
2.3 逗號和制表符分隔的輸入檔案
2.4 固定寬度輸入檔案
2.5 從R對象中提取數據
2.6 連線
2.7 讀取大型數據檔案
2.8 生成數據
2.8.1 序列
2.8.2 隨機數
2.9 排列
2.9.1 隨機排列
2.9.2 枚舉所有排列
2.10 序列的處理
2.11 電子表格
2.11.1 基於Windows的RODBC包
2.11.2 gdata程式包(所有平台)
2.12 保存和載入R數據對象
2.13 處理二進制檔案
2.14 將R對象寫入ASCII格式的檔案
2.14.1write函式
2.14.2 write.table函式
2.15 從其它程式中讀取數據
第3章 R與資料庫
3.1 SQL簡介
3.1.1 導航命令
3.1.2 SQL基礎
3.1.3 綜合匯總
3.1.4 兩個資料庫的合併
3.1.5 子查詢
3.1.6 修改資料庫記錄
3.2 ODBC
3.3 使用RODBC包
3.4 DBI包
3.5 訪問MySQL資料庫
3.6 執行查詢
3.7 規範化的表
3.8 將數據讀入MySQL
3.9 更複雜的匯總
第4章 日期
4.1 as.Date
4.2 chron包
4.3 POSIX類
4.4 日期的處理
4.5 時間間隔
4.6 時間序列
第5章 因子
5.1 因子的使用
5.2 數值型因子
5.3 因子的操作
5.4 根據連續變數創建因子
5.5 基於日期和時間的因子
5.6 互動作用
第6章 下標
6.1 下標的基礎知識
6.2 數值型下標
6.3 字元型下標
6.4 邏輯型下標
6.5 矩陣和數組的下標
6.6 矩陣的特殊函式
6.7 列表
6.8 數據框下標
第7章 字元操作
7.1 字元數據的基礎知識
7.2 顯示和連線字元串
7.3 處理分散的字元值
7.4 R中的正則表達式
7.5 正則表達式的基礎知識
7.6 拆分字元值
7.7 在R中使用正則表達式
7.8 替換和標記
第8章 數據匯總
8.1 table函式
8.2 匯總路線圖
8.3 將函式映射到向量或列表
8.4 將函式映射到矩陣或數組
8.5 基於組的函式映射
8.6reshape包
8.7 R中的循環
第9章 重塑數據
9.1 修改數據框中的變數
9.2 變數的重新編碼
9.3 recode函式
9.4 重塑數據框
9.5 reshape包
9.6 合併數據框
9.7 在merge的環境下
索引