R語言簡介
R是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件,它是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。
R語言是一個開源的數(shù)據(jù)分析環(huán)境,起初是由數(shù)位統(tǒng)計學(xué)家建立起來,以更好的進(jìn)行統(tǒng)計計算和繪圖,這篇wiki中包含了一些基本情況的介紹。由于R可以通過安裝擴(kuò)展包(Packages)而得到增強,所以其功能已經(jīng)遠(yuǎn)遠(yuǎn)不限于統(tǒng)計分析。
R語言的特點
R作為一種統(tǒng)計分析軟件,是集統(tǒng)計分析與圖形顯示于一體的。它可以運行于UNIX,Windows和Macintosh的操作系統(tǒng)上,而且嵌入了一個非常方便實用的幫助系統(tǒng),相比于其他統(tǒng)計分析軟件,R還有以下特點:1.R是自由軟件。這意味著它是完全免費,開放源代碼的??梢栽谒木W(wǎng)站及其鏡像中下載任何有關(guān)的安裝程序、源代碼、程序包及其源代碼、文檔資料。標(biāo)準(zhǔn)的安裝文件身自身就帶有許多模塊和內(nèi)嵌統(tǒng)計函數(shù),安裝好后可以直接實現(xiàn)許多常用的統(tǒng)計功能。
2.R是一種可編程的語言。作為一個開放的統(tǒng)計編程環(huán)境,語法通俗易懂,很容易學(xué)會和掌握語言的語法。而且學(xué)會之后,我們可以編制自己的函數(shù)來擴(kuò)展現(xiàn)有的語言。這也就是為什么它的更新速度比一般統(tǒng)計軟件,如,SPSS,SAS等快得多。大多數(shù)最新的統(tǒng)計方法和技術(shù)都可以在R中直接得到。
3. 所有R的函數(shù)和數(shù)據(jù)集是保存在程序包里面的。只有當(dāng)一個包被載入時,它的內(nèi)容才可以被訪問。一些常用、基本的程序包已經(jīng)被收入了標(biāo)準(zhǔn)安裝文件中,隨著新的統(tǒng)計分析方法的出現(xiàn),標(biāo)準(zhǔn)安裝文件中所包含的程序包也隨著版本的更新而不斷變化。在另外版安裝文件中,已經(jīng)包含的程序包有:base一R的基礎(chǔ)模塊、mle一極大似然估計模塊、ts一時間序列分析模塊、mva一多元統(tǒng)計分析模塊、survival一生存分析模塊等等。
4.R具有很強的互動性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個窗口進(jìn)行的,輸入語法中如果出現(xiàn)錯誤會馬上在窗口口中得到提示,對以前輸入過的命令有記憶功能,可以隨時再現(xiàn)、編輯修改以滿足用戶的需要。輸出的圖形可以直接保存為JPG,BMP,PNG等圖片格式,還可以直接保存為PDF文件。另外,和其他編程語言和數(shù)據(jù)庫之間有很好的接口。[2] 5.如果加入R的幫助郵件列表一,每天都可能會收到幾十份關(guān)于R的郵件資訊??梢院腿蛞涣鞯慕y(tǒng)計計算方面的專家討論各種問題,可以說是全世界最大、最前沿的統(tǒng)計學(xué)家思維的聚集地。
R是基于S語言的一個GNU項目,所以也可以當(dāng)作S語言的一種實現(xiàn),通常用S語言編寫的代碼都可以不作修改的在R環(huán)境下運行。 R的語法是來自Scheme。R的使用與S-PLUS有很多類似之處,這兩種語言有一定的兼容性。S-PLUS的使用手冊,只要稍加修改就可作為R的使用手冊。所以有人說:R,是S-PLUS的一個“克隆”。但是請不要忘了:R是免費的(R is free)。R語言源代碼托管在github,具體地址可以看參考資料。
R語言的下載可以通過CRAN的鏡像來查找。
R語言有域名為.cn的下載地址,有六個,其中兩個由Datagurn,由中國科學(xué)技術(shù)大學(xué)提供的。R語言Windows版,其中由兩個下載地點是Datagurn和USTC提供的。
R語言基礎(chǔ)入門教程一:
1、學(xué)習(xí)前提
在繼續(xù)學(xué)習(xí)本教程之前,您應(yīng)該基本了解計算機編程術(shù)語。 對任何編程語言的基本理解將幫助您理解R語言編程概念,并在學(xué)習(xí)軌道上快速移動
R語言適用人群
本教程是為期待使用R編程開發(fā)統(tǒng)計軟件的軟件程序員,統(tǒng)計學(xué)家和數(shù)據(jù)挖掘者設(shè)計的。 如果你試圖理解R編程語言作為一個初學(xué)者,本教程將給你足夠的了解語言的幾乎所有的概念,從那里你可以把自己的更高水平的專業(yè)知識。
2 為什么要學(xué)習(xí)R語言
可能你想說,“我已經(jīng)學(xué)會了spss/sas/stata.。。,為什么還要去學(xué)習(xí)R呢?”如下幾方面可能會吸引到你:
R是免費開源軟件:現(xiàn)在很多學(xué)術(shù)期刊都對分析軟件有版權(quán)要求,而免費的分析工具可以使你在這方面不會有什么擔(dān)心。另一方面,如果學(xué)術(shù)界出現(xiàn)一種新的數(shù)據(jù)分析方法,那么要過很長一段時間才會出現(xiàn)在商業(yè)軟件中。但開源軟件的好處就在于,很快就會有人將這種方法編寫成擴(kuò)展包,或者你自己就可以做這件工作。
命令行工作方式:許多人喜歡類似SPSS菜單式的操作,這對于初學(xué)者來說很方便入門,但對于數(shù)據(jù)分析來說,命令行操作會更加的靈活,更容易進(jìn)行編程和自動化處理。而且命令行操作會更容易???,不是嘛,一般人看到你在狂敲一推代碼后得到一個分析結(jié)果,對你投來的目光是會不一樣的。
小巧而精悍:R語言的安裝包更小,大約不到40M,相比其它幾個大家伙它算是非常小巧精悍了。目前R語言非常受到專業(yè)人士歡迎,根據(jù)對數(shù)據(jù)挖掘大賽勝出者的調(diào)查可以發(fā)現(xiàn),他們用的工具基本上都是R語言。此外,從最近幾次R語言大會上可以了解到,咨詢業(yè)、金融業(yè)、醫(yī)藥業(yè)都在大量的使用R語言,包括google/facebook的大公司都在用它。因此,學(xué)習(xí)R語言對你的職業(yè)發(fā)展一定是有幫助的。
3 R語言的下載和GUI界面
R語言安裝包可以在官方網(wǎng)站下載,windows版可直接點擊這個連接
在ubuntu下面安裝R則更容易,在終端里頭運行如下命令即可
sudo apt-get update
sudo apt-get install r-base
此外,學(xué)習(xí)R語言時強烈推薦安裝Rstudio做為R的圖形界面,關(guān)于Rstudio之前的博文有過簡單介紹,點這里可能轉(zhuǎn)到它的官方網(wǎng)站。
4 R語言的學(xué)習(xí)方法
學(xué)習(xí)R并不是一件非常輕松的事情,初學(xué)者需要記住的就是:
親手鍵入代碼并理解其意義
在筆記里記下一些重點或心得(個人推薦Evernote)
堅持練習(xí),對手邊的數(shù)據(jù)進(jìn)行應(yīng)用分析
理解背景知識,細(xì)節(jié)很重要。
5 哪里可以得到參考資料
1.官方網(wǎng)站 http://cran.csdb.cn/index.html (官方文獻(xiàn)集中地)
2.統(tǒng)計之都論壇
3.人大經(jīng)濟(jì)論壇-R子論壇 (免費資料也不少)
4.http://library.nu/ 這是網(wǎng)上電子書最多的地方,其中有一個R語言專門書柜(也就是一個shelves)
5.關(guān)于R語言的教材小結(jié)
6.筆者在verycd上發(fā)的一個書單
7.一個國外著名的R語言群博 http://www.r-bloggers.com/
8.展示R語言的各類繪圖 http://addictedtor.free.fr/graphiques/
本人博客里也有一些關(guān)于R語言的資料:xccds1977.blogspot.com (需FQ)
如果有一些簡單的入門問題,也可以在推特上follow me twitter: @xccds
6 本系列博文的目的
本系列入門的目的是為初學(xué)者提供最簡潔清晰的資料,以迅速入門。所針對的讀者人群是那些正在大學(xué)里學(xué)習(xí)初級統(tǒng)計學(xué)的同學(xué)。本系列計劃包括內(nèi)容有:基本命令,數(shù)據(jù)操作;描述統(tǒng)計和繪圖;重要的R語言函數(shù)計算;統(tǒng)計推斷和估計;非參數(shù)統(tǒng)計方法;方差分析;線性回歸和一般線性模型。
評論