R語言統(tǒng)計分析簡介_第1頁
R語言統(tǒng)計分析簡介_第2頁
R語言統(tǒng)計分析簡介_第3頁
R語言統(tǒng)計分析簡介_第4頁
R語言統(tǒng)計分析簡介_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

R語言統(tǒng)計分析易楠張青青R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第1頁!R語言簡介集數(shù)據(jù)分析與圖形顯示于一體的統(tǒng)計編程軟件。由Auckland大學(xué)統(tǒng)計系的RobertGentleman和RossIhaka于1995年創(chuàng)立的。免費下載地址.R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第2頁!其它統(tǒng)計軟件SAS:世界上最權(quán)威的統(tǒng)計軟件,價格昂貴,支持編程,統(tǒng)計學(xué)專業(yè)專用軟件SPSS:操作容易、輸出漂亮、功能齊全、價格合理,非統(tǒng)計學(xué)專業(yè)首選軟件Eviews:具有強(qiáng)大的多元回歸和時間序列分析功能,計量經(jīng)濟(jì)學(xué)專業(yè)專用軟件Matlab:功能強(qiáng)大的編程軟件,統(tǒng)計分析功能較少,工程專業(yè)首選軟件Excel:具有簡單的統(tǒng)計分析功能,商務(wù)辦公首選軟件通病:&“黑匣子”“傻的可愛”R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第3頁!函數(shù)結(jié)構(gòu)function_name(Arguments1,Arguments2=value,…)function_name表示函數(shù)名稱Arguments1表示需輸入的數(shù)值,可能是向量、數(shù)據(jù)框等Arguments2=value表示參數(shù)2的取值,可能是邏輯變量等例:函數(shù)read.table(file,header=F)read.table表示讀入文本數(shù)據(jù)函數(shù)名參數(shù)file表示被讀取的文本文件名“**.txt”header表示數(shù)據(jù)文件行是否包含變量名,如果包含則輸入header=F,否則輸入header=TR語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第4頁!R中的一些基本運(yùn)算的語句2、向量在統(tǒng)計學(xué)中,多數(shù)數(shù)據(jù)都是以一組來表達(dá),即向量的形式。R中,使用者能以向量形式來輸入一組數(shù)字。舉例來說,在一次重復(fù)試驗中得出以下10個結(jié)果:2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1若想將其以一個向量的形式表示出來,可參考如下:observations=c(2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1)C()表示R中在括號中的數(shù)值是以向量形式輸入的。向量的運(yùn)算與標(biāo)量的相同,如:2.54*observations輸出結(jié)果為向量中的每一個數(shù)值均乘以2.54,然后再以向量形式輸出利用R,通過定義成向量的形式,我們可以很方便的計算出上述一列數(shù)據(jù)的均質(zhì)和方差,如:Mean(observations)Var(observations)R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第5頁!4、矩陣矩陣和向量有點相似,但它是二維的。輸入矩陣如同輸入向量,只需加上它的二維數(shù)據(jù)。矩陣擁有兩個屬性:“二維數(shù)據(jù)”和“行和列的名稱”。例如:A=atrix(c(1:9),nrow=3,ncol=3,byrow=T)[,1][,2][,3][1,]123[2,]456[3,]789上述例子中,自變量“byrow=T”提示R以一行行來排列矩陣。當(dāng)矩陣的行被填滿時,余下的數(shù)字將填補(bǔ)下一行,如此類推,直至完成矩陣。byrow默認(rèn)值是“F”,因此,若不輸入自變量“byrow=T”,則會被視為以下列方式組成矩陣:[,1][,2][,3][1,]147[2,]258[3,]369>dim(A)函數(shù)dim能顯示矩陣的二維數(shù)據(jù)[1]33R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第6頁!R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第7頁!4、矩陣的合并R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第8頁!數(shù)據(jù)框的引用數(shù)據(jù)框數(shù)據(jù)的調(diào)用用attach命令R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第9頁!R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第10頁!R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第11頁!有興趣的同學(xué)可以試著做:高一成績與收入水平的kendall相關(guān)系數(shù),并思考為什么不能使用pearson相關(guān)系數(shù)分析?相關(guān)分析R與SPSS對比R輸出結(jié)果SPSS輸出結(jié)果R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第12頁!回歸分析R與SPSS對比R輸出結(jié)果SPSS輸出結(jié)果R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第13頁!殘差檢驗正態(tài)性檢驗程序命令:shapiro.test(lm1$res)t.test(lm1$res)殘差序列滿足εt~N(0,σ2)序列相關(guān)檢驗(D.W.)程序命令:library(car)durbin.watson(lm1)R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第14頁!聚類分析根據(jù)事物本身的特征研究個體分類的方法函數(shù)名:hclust(d,method="ward")數(shù)據(jù)文件名:beer.txt分析方法:歐氏距離、ward法、系統(tǒng)聚類程序命令:beer=read.table("beer.txt",header=T)s(beer)=beer$beernamehclust(dist(beer[,-1]),method="ward")$mergeplot(hclust(dist(beer[,-1]),method="ward"))R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第15頁!判別分析根據(jù)觀察或測量到若干變量值,判斷研究對象屬于哪一類函數(shù)名:lda(x,grouping)數(shù)據(jù)文件名:disc.sav分析方法:距離判別法library(MASS)library(foreign)disc=read.spss("disc.sav",to.data.frame=T)lda1=lda(disc[,-1],disc$GROUP)table(predict(lda1,disc[,-1])$class,disc$GROUP)plot(predict(lda1,disc[,-1])$x,col=as.numeric(disc$GROUP))R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第16頁!主成分分析利用降維的思想,把多個指標(biāo)轉(zhuǎn)換成較少的幾個互不相關(guān)的綜合指標(biāo)的統(tǒng)計方法函數(shù)名:prp(x,

scale=F)

數(shù)據(jù)文件名:pany.txt分析方法:從相關(guān)矩陣出發(fā)程序命令:pany=read.table("pany.txt",header=T)prc=prp(pany[,-1],scale=T)summary(prc)prc$rotationprc$x[,1:2]R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第17頁!因子分析探討存在相關(guān)關(guān)系的變量之間,是否存在不能直接觀察到但對可觀測變量變化起支配作用的潛在因子的分析方法函數(shù)名:factanal(x,factors,rotation="varimax")數(shù)據(jù)文件名:student.sav分析方法:極大似然法、方差最大正交旋轉(zhuǎn)、回歸法程序命令:library(foreign)student=read.spss("student.sav",to.data.frame=T)factanal(student,2,rotation="varimax",scores="regression")R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第18頁!對應(yīng)分析在一個低維度空間中對列聯(lián)表里的兩個名義變量間的關(guān)系進(jìn)行描述函數(shù)名:corresp(xtabs)數(shù)據(jù)文件:caith(在MASS程序包中)程序命令:library(MASS)caithplot(corresp(caith,

nf=2))R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第19頁!R語言特點程序命令完全公開(非黑匣子)計算過程保留在對象中,可隨時調(diào)用有不斷加入的各個方向統(tǒng)計學(xué)家編寫的統(tǒng)計軟件包編程語言極其簡單(歸納為“三個一”)一小內(nèi)時掌握基本運(yùn)算和繪圖語句一天內(nèi)學(xué)會編寫函數(shù)和利用軟件包一年內(nèi)可達(dá)到“登峰造極”的境界現(xiàn)在讓我們開始走進(jìn)R語言的神奇吧!R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第20頁!R中的一些基本運(yùn)算的語句1、變量與賦值使用者可以用“=”或“<-”來將數(shù)值賦予給一個變量。任何英文字母、數(shù)字、“.”都可作為變量名稱。但是個字母必須是英文字母。R容許變量名稱中有空格。例如:如果要給變量x賦予數(shù)值9,只需輸入:>x=9或>x<-9>sqrt(x)[1]3>Y=(5*(x+2))-3>y[1]52運(yùn)算中是不會影響x的數(shù)值,倘若想重新給x賦值,可參考下列例子:>x=sqrt(x)>x[1]3R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第21頁!3、從向量中選取子集Observations[3][1]1Observations[5:7][1]5.94.06.7Observations[-1]表示隱藏第1個元素。Observations[observations>4]R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第22頁!R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第23頁!3、矩陣的特征值與特征向量R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第24頁!5、數(shù)據(jù)框矩陣和向量一樣,只能擁有一種數(shù)據(jù)類型,而數(shù)據(jù)框卻能同時擁有多種。若數(shù)據(jù)框內(nèi)同時含有文字,當(dāng)數(shù)據(jù)框被轉(zhuǎn)化成矩陣時,所有元素都會被轉(zhuǎn)化成文字。利用指令as.frame,可將矩陣轉(zhuǎn)化為數(shù)據(jù)框。例如:R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第25頁!讀寫數(shù)據(jù)文件1、讀純文本文件R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第26頁!R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第27頁!相關(guān)分析研究變量間密切程度的一種常用統(tǒng)計方法相關(guān)系數(shù)是描述變量間線形關(guān)系強(qiáng)弱和方向的統(tǒng)計量函數(shù)名:cor(x,method=c("pearson","kendall","spearman"))數(shù)據(jù)文件:

highschool.sav分析方法:

Pearson程序命令:library(foreign)highschool=read.spss("highschool.sav",to.data.frame=T)colnames(highschool[,1:3])=c(“初三成績”,“高一成績”,“收入水平”,“DIFF”,“IN2”,“IN3”)

命名cor(highschool[,1:2],method="pearson")cor.test(highschool$初三成績,highschool$高一成績,method="pearson")R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第28頁!回歸分析描述變量之間具體的變動關(guān)系,通過控制或給定自變量的數(shù)值來估計或預(yù)測因變量可能的數(shù)值。函數(shù)名:lm(formula,data)數(shù)據(jù)文件:earnings.txt程序命令:earnings=read.table("earnings.txt",header=T)lm1=lm(ine~industry+service,data=earnings)summary(lm1)R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第29頁!殘差檢驗繪制殘差散點圖程序命令:plot(lm1$res,type="b")abline(h=0,lty=2)繪制殘差序列QQ圖程序命令:plot(lm1)R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第30頁!殘差檢驗自相關(guān)系數(shù)(ACF)程序命令:acf(lm1$res)偏自相關(guān)系數(shù)(PACF)程序命令:pacf(lm1$res)殘差序列滿足0均值、同方差、無自相關(guān),即白噪聲序列R語言統(tǒng)計分析簡介共36頁,您現(xiàn)在瀏覽的是第31頁!聚類的凝聚過程聚類分析RR語言統(tǒng)計分析簡介共36頁,您現(xiàn)在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論