R語言統(tǒng)計分析簡介課件_第1頁
R語言統(tǒng)計分析簡介課件_第2頁
R語言統(tǒng)計分析簡介課件_第3頁
R語言統(tǒng)計分析簡介課件_第4頁
R語言統(tǒng)計分析簡介課件_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

R語言統(tǒng)計分析易楠張青青R語言簡介集數(shù)據(jù)分析與圖形顯示于一體的統(tǒng)計編程軟件。由Auckland大學統(tǒng)計系的RobertGentleman和RossIhaka于1995年創(chuàng)立的。免費下載地址其它統(tǒng)計軟件SAS:世界上最權威的統(tǒng)計軟件,價格昂貴,支持編程,統(tǒng)計學專業(yè)專用軟件SPSS:操作容易、輸出漂亮、功能齊全、價格合理,非統(tǒng)計學專業(yè)首選軟件Eviews:具有強大的多元回歸和時間序列分析功能,計量經(jīng)濟學專業(yè)專用軟件Matlab:功能強大的編程軟件,統(tǒng)計分析功能較少,工程專業(yè)首選軟件Excel:具有簡單的統(tǒng)計分析功能,商務辦公首選軟件通病:&“黑匣子”“傻的可愛”函數(shù)結構function_name(Arguments1,Arguments2=value,…)function_name表示函數(shù)名稱Arguments1表示需輸入的數(shù)值,可能是向量、數(shù)據(jù)框等Arguments2=value表示參數(shù)2的取值,可能是邏輯變量等例:函數(shù)read.table(file,header=F)read.table表示讀入文本數(shù)據(jù)函數(shù)名參數(shù)file表示被讀取的文本文件名“**.txt”header表示數(shù)據(jù)文件第一行是否包含變量名,如果包含則輸入header=F,否則輸入header=TR中的一些基本運算的語句1、變量與賦值使用者可以用“=”或“<-”來將數(shù)值賦予給一個變量。任何英文字母、數(shù)字、“.”都可作為變量名稱。但是第一個字母必須是英文字母。R容許變量名稱中有空格。例如:如果要給變量x賦予數(shù)值9,只需輸入:>x=9或>x<-9>sqrt(x)[1]3>Y=(5*(x+2))-3>y[1]52運算中是不會影響x的數(shù)值,倘若想重新給x賦值,可參考下列例子:>x=sqrt(x)>x[1]3R中的一些基本運算的語句2、向量在統(tǒng)計學中,多數(shù)數(shù)據(jù)都是以一組來表達,即向量的形式。R中,使用者能以向量形式來輸入一組數(shù)字。舉例來說,在一次重復試驗中得出以下10個結果:2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1若想將其以一個向量的形式表示出來,可參考如下:observations=c(2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1)C()表示R中在括號中的數(shù)值是以向量形式輸入的。向量的運算與標量的相同,如:2.54*observations輸出結果為向量中的每一個數(shù)值均乘以2.54,然后再以向量形式輸出利用R,通過定義成向量的形式,我們可以很方便的計算出上述一列數(shù)據(jù)的均質(zhì)和方差,如:Mean(observations)Var(observations)4、矩陣矩陣和向量有點相似,但它是二維的。輸入矩陣如同輸入向量,只需加上它的二維數(shù)據(jù)。矩陣擁有兩個屬性:“二維數(shù)據(jù)”和“行和列的名稱”。例如:A=atrix(c(1:9),nrow=3,ncol=3,byrow=T)[,1][,2][,3][1,]123[2,]456[3,]789上述例子中,自變量“byrow=T”提示R以一行行來排列矩陣。當矩陣的第一行被填滿時,余下的數(shù)字將填補下一行,如此類推,直至完成矩陣。byrow默認值是“F”,因此,若不輸入自變量“byrow=T”,則會被視為以下列方式組成矩陣:[,1][,2][,3][1,]147[2,]258[3,]369>dim(A)函數(shù)dim能顯示矩陣的二維數(shù)據(jù)[1]334、矩陣的合并5、數(shù)據(jù)框矩陣和向量一樣,只能擁有一種數(shù)據(jù)類型,而數(shù)據(jù)框卻能同時擁有多種。若數(shù)據(jù)框內(nèi)同時含有文字,當數(shù)據(jù)框被轉化成矩陣時,所有元素都會被轉化成文字。利用指令as.frame,可將矩陣轉化為數(shù)據(jù)框。例如:數(shù)據(jù)框的引用數(shù)據(jù)框數(shù)據(jù)的調(diào)用用attach命令有興趣的同學可以試著做:高一成績與收入水平的kendall相關系數(shù),并思考為什么不能使用pearson相關系數(shù)分析?相關分析R與SPSS對比R輸出結果SPSS輸出結果回歸分析描述變量之間具體的變動關系,通過控制或給定自變量的數(shù)值來估計或預測因變量可能的數(shù)值。函數(shù)名:lm(formula,data)數(shù)據(jù)文件:earnings.txt程序命令:earnings=read.table("earnings.txt",header=T)lm1=lm(income~industry+service,data=earnings)summary(lm1)回歸分析R與SPSS對比R輸出結果SPSS輸出結果殘差檢驗正態(tài)性檢驗程序命令:shapiro.test(lm1$res)t.test(lm1$res)殘差序列滿足εt~N(0,σ2)序列相關檢驗(D.W.)程序命令:library(car)durbin.watson(lm1)殘差檢驗自相關系數(shù)(ACF)程序命令:acf(lm1$res)偏自相關系數(shù)(PACF)程序命令:pacf(lm1$res)殘差序列滿足0均值、同方差、無自相關,即白噪聲序列判別分析根據(jù)觀察或測量到若干變量值,判斷研究對象屬于哪一類函數(shù)名:lda(x,grouping)數(shù)據(jù)文件名:disc.sav分析方法:距離判別法library(MASS)library(foreign)disc=read.spss("disc.sav",to.data.frame=T)lda1=lda(disc[,-1],disc$GROUP)table(predict(lda1,disc[,-1])$class,disc$GROUP)plot(predict(lda1,disc[,-1])$x,col=as.numeric(disc$GROUP))判別分析R與SPSS對比R輸出結果SPSS輸出結果主成分分析利用降維的思想,把多個指標轉換成較少的幾個互不相關的綜合指標的統(tǒng)計方法函數(shù)名:prcomp(x,

scale=F)

數(shù)據(jù)文件名:company.txt分析方法:從相關矩陣出發(fā)程序命令:company=read.table("company.txt",header=T)prc=prcomp(company[,-1],scale=T)summary(prc)prc$rotationprc$x[,1:2]主成分分析R與SPSS比較R輸出結果SPSS輸出結果因子分析探討存在相關關系的變量之間,是否存在不能直接觀察到但對可觀測變量變化起支配作用的潛在因子的分析方法函數(shù)名:factanal(x,factors,rotation="varimax")數(shù)據(jù)文件名:student.sav分析方法:極大似然法、方差最大正交旋轉、回歸法程序命令:library(foreign)student=read.spss("student.sav",to.data.frame=T)factanal(student,2,rotation="varimax",scores="regression")因子分析R與SPSS對比R使用mle方法估計參數(shù),默認因子旋轉方法為方差最大化R輸出結果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論