內容簡介
如何從數據中挖掘價值?一是要鍛鍊數據思維;二是需要選擇一個便利快捷的工具。R語言在數據分析方面有著靈活、高效的優勢。《R語言:從數據思維到數據實戰》 以R語言為基礎,深度講解從數據思維到實戰的全過程。在章節組織上,本從R語言簡介及優勢入手,再到數據讀取、清洗、描述、建模等數據分析的各個環節,由淺入深逐個講解,是一本實務分析中的“R語言指南”。同時,本書採用大量實際案例輔以說明,既有助於上手分析,也可用於教學使用。
作者簡介
朱雪寧 ,復旦大學大數據學院助理教授。博士畢業於北京大學光華管理學院商務統計系,後於賓州州立大學(PennsylvaniaStateUniversity)從事博士後研究工作。狗熊會創始團隊成員、“R語千尋”專欄負責人;統計之都網站核心成員、編輯部主編。研究上關注社交網路數據分析、高維數據分析等問題。
目 錄
第1章初識R語言
1.1初識R語言
1.2安裝R語言
1.3獲取R幫助文檔
第2章R語言數據操作
2.1R中的數據類型
2.2數據讀入
第3章R語言與統計分析
3.1描述分析及可視化
3.2統計檢驗
3.3回歸分析
3.4代碼規範與文檔撰寫
第4章R語言與非結構化數據分析
4.1文本分析
4.2圖像分析
第5章R語言與機器學習
5.1機器學習概述
5.2數據預處理
5.3模型訓練與調參
5.4模型訓練與集成
第6章R語言爬蟲初介
6.1HTML基礎與R語言解析
6.2XML與XPath表達式以及R爬蟲套用
6.3HTTP協定
6.4AJAX與網頁動態載入
6.5正則表達式與字元串處理函式
6.6R語言爬蟲實戰