R語言及其簡單應用(適合入門)_第1頁
R語言及其簡單應用(適合入門)_第2頁
R語言及其簡單應用(適合入門)_第3頁
R語言及其簡單應用(適合入門)_第4頁
R語言及其簡單應用(適合入門)_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、楊茂青R R語言語言及其簡單應用及其簡單應用目錄目錄1.R語言簡介2.R的使用教程3 . R 在 情 報 學 中 數(shù) 據(jù)處 理 的 實 戰(zhàn) 操 作R語言簡介R是用于統(tǒng)計分析、繪圖統(tǒng)計分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、自由、免費、源代碼開放免費、源代碼開放的軟件,它是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。R語言的特點:1.R是自由軟件。這意味著它是完全免費,開放源代碼的。可以在它的網(wǎng)站及其鏡像中下載任何有關的安裝程序、源代碼、程序包及其源代碼、文檔資料。2.R是一種可編程的語言。作為一個開放的統(tǒng)計編程環(huán)境,語法通俗易懂。而且學會之后,我們可以編制自己的函數(shù)來擴展現(xiàn)有的語言

2、。這也就是為什么它的更新速度比一般統(tǒng)計軟件,如,SPSS,SAS等快得多。3.所有R的函數(shù)和數(shù)據(jù)集是保存在程序包里面的。4.R具有很強的互動性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個窗口進行的,輸入語法中如果出現(xiàn)錯誤會馬上在窗口口中得到提示,對以前輸入過的命令有記憶功能,可以隨時再現(xiàn)、編輯修改以滿足用戶的需要。5.是專門為統(tǒng)計和數(shù)據(jù)分析開發(fā)的語言。6.同各種OS的兼容性好。7.占用內存小。 R 的 使 用 教 程1.R的安裝與調試 下載網(wǎng)址:下載網(wǎng)址:/ 然后根據(jù)linux、windows、Mac系統(tǒng)等不同進行相應的下載。 安

3、裝安裝R :分為版本(32bit和64bit) ,然后各種下一步即可。Mac OS X和Linux 一樣。 下載和安裝完成后打開界面如下圖所示: 此外,Rstudio是R的集成開發(fā)環(huán)境,用它進行R編程的學習和實踐會更加輕松和方便,可以通過網(wǎng)址:http:/ ,進入下載頁面后會有Desktop和Server兩個版本,下載Desktop版本。下載完成后頁面見右圖。2.包 (1)什么是包? 包是R函數(shù)、數(shù)據(jù)、預編譯代碼以一種定義完善的格式組成的集合。計算機上存儲包的目錄稱為庫(library)。 (2)包的安裝 使用命令install.packages()進行相應包的安裝。例如要安裝可以爬數(shù)據(jù)的包r

4、vest,使用install.packages(“rvest”)就可以進行安裝了。使用命令updata.packages()可以更新已安裝的包。 (3)包的載入 使用library()命令載入相應的包。例如要使用rvest包,執(zhí)行命令library(rvest)即可。安裝和載入rvest包的過程安裝:install.packages”rvest”載入:library(rvest)3.創(chuàng)建數(shù)據(jù)集 (1)創(chuàng)建向量 可用c()來創(chuàng)建。 (2)創(chuàng)建矩陣 使用函數(shù)matrix()創(chuàng)建矩陣。 如右圖,創(chuàng)建一個5*4的矩陣。 (3)創(chuàng)建數(shù)組 使用函數(shù)array()進行創(chuàng)建。 (4)創(chuàng)建數(shù)據(jù)框 使用data.

5、frame()創(chuàng)建。 (5)創(chuàng)建列表 使用函數(shù)list()創(chuàng)建列表。 如右圖所示4.圖形可視化 (1)條形圖 使用函數(shù)barplot()創(chuàng)建圖形,例如barplot(height),其中height表示一個向量或矩陣。 如右圖所示創(chuàng)建過程 (2)餅圖 使用函數(shù)pie()進行創(chuàng)建。 相關代碼如下圖所示。圖形示例如右圖所示。(3)直方圖使用函數(shù)hist()進行創(chuàng)建。 下圖為創(chuàng)建代碼,右圖為圖例 (4)箱線圖 使用函數(shù)boxplot()進行創(chuàng)建。 下圖為代碼,右圖為圖形示例R R 在 情 報 學 中在 情 報 學 中 數(shù) 據(jù)數(shù) 據(jù) 處 理 的處 理 的 實戰(zhàn)操作實戰(zhàn)操作由于最近沒有訓練集在R中處理,

6、情報學中遇到的很多問題與此問題相似,故本文提出的這個問題具有一定的代表性,先從此問題入手。問題: 一組學生參加了數(shù)學、科學和英語考試。為了給所有的學生確定一個單一的成績衡量指標,需要將這些科目的成績組合起來。另外,還想將前20%的學生評定為A,接下來20%的學生評定為B,以此類推。最后,希望按字母順序對學生排序。step1:輸入數(shù)據(jù)R語言導入xlsx代碼如下:step2:數(shù)據(jù)預處理將變量進行標準化step3:通過函數(shù)mean()來計算各行的均值以及獲得綜合得分,并使用cbind()將其添加到花名冊中Step4:函數(shù)quantile()給出學生綜合得分的百分位數(shù)step5:使用邏輯運算符,把score轉為等級(離散型)Step6:使用strsplit()以空格為界把學生姓名拆分為姓氏和名字 Step7:把name分成Firstname和LastName,加入到StuScore中。 Step8:order排序 用以下代碼實現(xiàn):step9:為ScienceScore繪制條形圖 根據(jù)不同的分數(shù)等級,顯示不同的顏色。代碼如右圖,條形圖效果見下頁。 如右圖所示,把ScienceScore分為很好、好、一般

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論