發展歷史
R是統計領域廣泛使用的誕生於1980年左右的S語言的一個分支。可以認為R是S語言的一種實現。而S語言是由AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析和作圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業軟體,它基於S語言,並由MathSoft公司的統計科學部進一步完善。後來Auckland大學的Robert Gentleman和Ross Ihaka及其他志願人員開發了一個R系統。由“R開發核心團隊”負責開發。 R是基於S語言的一個GNU項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不作修改的在R環境下運行。 R的語法是來自Scheme。R的使用與S-PLUS有很多類似之處,這兩種語言有一定的兼容性。S-PLUS的使用手冊,只要稍加修改就可作為R的使用手冊。所以有人說:R,是S-PLUS的一個“克隆”。
但是請不要忘了:R是免費的(R is free)。
R語言原始碼託管在github,具體地址可以看參考資料。
。
R語言的下載可以通過cran的鏡像來查找,具體地址可以看參考資料。
R語言有域名為.cn的下載地址,有六個,其中兩個由Datagurn,由中國科學技術大學提供的。
R語言Windows版,其中由兩個下載地點是Datagurn和USTC提供的。具體地址可以看參考資料。
功能
R是一套完整的數據處理、計算和製圖軟體系統。其功能包括:數據存儲和處理系統;數組運算工具(其向量、矩陣運算方面功能尤其強大);完整連貫的統計分析工具;優秀的統計製圖功能;簡便而強大的程式語言:可操縱數據的輸入和輸出,可實現分支、循環,用戶可自定義功能。
與其說R是一種統計軟體,還不如說R是一種數學計算的環境,因為R並不是僅僅提供若干統計程式、使用者只需指定資料庫和若干參數便可進行一個統計分析。R的思想是:它可以提供一些集成的統計工具,但更大量的是它提供各種數學計算、統計計算的函式,從而使使用者能靈活機動的進行數據分析,甚至創造出符合需要的新的統計計算方法。
該語言的語法表面上類似 C,但在語義上是函式設計語言(functional programming language)的變種並且和Lisp以及APL有很強的兼容性。特別的是,它允許在“語言上計算”(computing on the language)。這使得它可以把表達式作為函式的輸入參數,而這種做法對統計模擬和繪圖非常有用。
R是一個免費的自由軟體,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費下載和使用的。在那兒可以下載到R的安裝程式、各種外掛程式和文檔。在R的安裝程式中只包含了8個基礎模組,其他外在模組可以通過CRAN獲得。
R的原始碼可自由下載使用,亦有已編譯的執行檔版本可以下載,可在多種平台下運行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。 R主要是以命令行操作,同時有人開發了幾種圖形用戶界面。
R內建多種統計學及數字分析功能。因為S的血緣,R比其他統計學或數學專用的程式語言有更強的物件導向(面向對象程式設計)功能。
R的另一強項是繪圖功能,製圖具有印刷的素質,也可加入數學符號。
雖然R主要用於統計分析或者開發統計相關的軟體,但也有人用作矩陣計算。其分析速度可媲美GNU Octave甚至商業軟體MATLAB。
R的功能能夠通過由用戶撰寫的套件增強。增加的功能有特殊的統計技術、繪圖功能,以及編程界面和數據輸出/輸入功能。這些軟體包是由R語言、LaTeX、Java及最常用C語言和Fortran撰寫。下載的執行檔版本會連同一批核心功能的軟體包,而根據CRAN紀錄有過千種不同的軟體包。其中有幾款較為常用,例如用於經濟計量、財經分析、人文科學研究以及人工智慧。
R包及其使用
R包介紹
R語言的使用,很大程度上是藉助各種各樣的R包的輔助,從某種程度上講,R包就是針對於R的外掛程式,不同的外掛程式滿足不同的需求,截至2013年3月6日,CRAN已經收錄了各類包4338個。例如用於經濟計量、財經分析、人文科學研究以及人工智慧
。
安裝包
1、通過選擇選單:
程式包->安裝程式包->在彈出的對話框中,選擇你要安裝的包,然後確定。
2、使用命令
install.packages("package_name","dir")
package_name:是指定要安裝的包名,請注意大小寫。
dir:包安裝的路徑。默認情況下是安裝在..\library 資料夾中的。可以通過本參數來進行修改,來選擇安裝的資料夾。
3、本地來安裝
如果你已經下載的相應的包的壓縮檔案,則可以在本地來進行安裝。請注意在windows、unix、macOS作業系統下安裝檔案的後綴名是不一樣的:
1)linux環境編譯運行:tar.gz檔案
2)windows 環境編譯運行 :.zip檔案
3)MacOSg環境編譯運行:.tgz檔案
註:包安裝好後,並不可以直接使用,如果在使用包中相關的函式,必須每次使用前包載入到記憶體中。通過library(package_name)來完成。
載入包
包安裝後,如果要使用包的功能。必須先把包載入到記憶體中(默認情況下,R啟動後默認載入基本包),載入包命令:
Library(“包名”)
Require(“包名”)
查看包的相關信息
1、查看包幫忙
library(help="package_name")
主要內容包括:例如:包名、作者、版本、更新時間、功能描述、開源協定、存儲位置、主要的函式
help(package = "package_name")
主要內容包括:包的內置所有函式,是更為詳細的幫助文檔
2、查看當前環境哪些包載入
find.package() 或者 .path.package()
3、移除包出記憶體
detach()
4、把其它包的數據載入到記憶體中
data(dsname, package="package_name")
5、查看這個包里的包有數據
data( package="package_name")
6、列出所有安裝的包
library()
CRAN
CRAN為Comprehensive R Archive Network(R綜合典藏網)的簡稱。它除了收藏了R的執行檔下載版、原始碼和說明檔案,也收錄了各種用戶撰寫的軟體包。現時,全球有超過一百個CRAN鏡像站。
安裝
以下簡述R FOR WINDOWS的安裝和使用:
下可以找到R的各個版本的安裝程式和
原始碼。點擊進入:Windows (95 and later),再點擊:base,下載SetupR.exe,約18兆,此便是R FOR WINDOWS的安裝程式。雙擊SetupR.exe,按照提示一步步安裝即可。
安裝完成後,程式會創建R程式組並在桌面上創建R主程式的捷徑(也可以在安裝過程中選擇不要創建)。通過捷徑運行R,便可調出R的主視窗。
類似於許多以編程方式為主要工作方式的軟體,R的界面簡單而樸素,只有不多的幾個選單和快捷按鈕。快捷按鈕下面的視窗便是命令輸入視窗,它也是部分運算結果的輸出視窗,有些運算結果則會輸出在新建的視窗中。
主視窗上方的一些文字是剛運行R時出現的一些說明和指引。文字下的:> 符號便是R的命令提示符,在其後可輸出命令;>後的矩形是游標。R一般是採用互動方式工作的,在命令提示符後輸入命令,回車後便會輸出結果。
在R樸素的界面下,是豐富而複雜的運算功能。
語言環境
R是一套由數據操作、計算和圖形展示功能整合而成的套件。包括:有效的數據存儲和處理功能,一套完整的數組(特別是矩陣)計算操作符,擁有完整體系的數據分析工具,為數據分析和顯示提供的強大圖形功能,一套(源自S語言)完善、簡單、有效的程式語言(包括條件、循環、自定義函式、輸入輸出功能)。
在這裡使用"環境"(environment)是為了說明R的定位是一個完善、統一的系統,而非其他數據分析軟體那樣作為一個專門、不靈活的附屬工具。
教程參考
書 名:R數據分析
作者:方匡南 朱建平 姜葉飛編著
出 版 社:電子工業出版社
出版時間:2015-02-01
版次:1
頁數:392
印刷時間:2015-02-01
本: 16開
紙張:膠版紙印
印 次:1
包裝:平裝
《R數據分析:方法與案例詳解(雙色)》是一本R語言和數據分析的入門教材,循序漸進、深入淺出,每個知識點儘量從實際的套用案例出發,以問題為導向,在解決問題中學習統計方法、R語言的基本使用以及編程技巧。
《R數據分析:方法與案例詳解(雙色)》內容涵蓋R數據結構、函式與最佳化、抽樣模擬、統計分析、假設檢驗、回歸分析、統計繪圖和R包製作等內容。
《R數據分析:方法與案例詳解(雙色)》的定位是為業界數據分析人員、經濟管理類、醫學的學生提供方法和程式上的參考,在寫作過程中儘量刪去比較理論的數學原理,這樣能夠幫助讀者輕鬆上手學習。