R語(yǔ)言統(tǒng)計(jì)分析簡(jiǎn)介課件_第1頁(yè)
R語(yǔ)言統(tǒng)計(jì)分析簡(jiǎn)介課件_第2頁(yè)
R語(yǔ)言統(tǒng)計(jì)分析簡(jiǎn)介課件_第3頁(yè)
R語(yǔ)言統(tǒng)計(jì)分析簡(jiǎn)介課件_第4頁(yè)
R語(yǔ)言統(tǒng)計(jì)分析簡(jiǎn)介課件_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

R語(yǔ)言統(tǒng)計(jì)分析易楠張青青R語(yǔ)言簡(jiǎn)介集數(shù)據(jù)分析與圖形顯示于一體的統(tǒng)計(jì)編程軟件。由Auckland大學(xué)統(tǒng)計(jì)系的RobertGentleman和RossIhaka于1995年創(chuàng)立的。免費(fèi)下載地址其它統(tǒng)計(jì)軟件SAS:世界上最權(quán)威的統(tǒng)計(jì)軟件,價(jià)格昂貴,支持編程,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)專(zhuān)用軟件SPSS:操作容易、輸出漂亮、功能齊全、價(jià)格合理,非統(tǒng)計(jì)學(xué)專(zhuān)業(yè)首選軟件Eviews:具有強(qiáng)大的多元回歸和時(shí)間序列分析功能,計(jì)量經(jīng)濟(jì)學(xué)專(zhuān)業(yè)專(zhuān)用軟件Matlab:功能強(qiáng)大的編程軟件,統(tǒng)計(jì)分析功能較少,工程專(zhuān)業(yè)首選軟件Excel:具有簡(jiǎn)單的統(tǒng)計(jì)分析功能,商務(wù)辦公首選軟件通病:&“黑匣子”“傻的可愛(ài)”函數(shù)結(jié)構(gòu)function_name(Arguments1,Arguments2=value,…)function_name表示函數(shù)名稱(chēng)Arguments1表示需輸入的數(shù)值,可能是向量、數(shù)據(jù)框等Arguments2=value表示參數(shù)2的取值,可能是邏輯變量等例:函數(shù)read.table(file,header=F)read.table表示讀入文本數(shù)據(jù)函數(shù)名參數(shù)file表示被讀取的文本文件名“**.txt”header表示數(shù)據(jù)文件第一行是否包含變量名,如果包含則輸入header=F,否則輸入header=TR中的一些基本運(yùn)算的語(yǔ)句1、變量與賦值使用者可以用“=”或“<-”來(lái)將數(shù)值賦予給一個(gè)變量。任何英文字母、數(shù)字、“.”都可作為變量名稱(chēng)。但是第一個(gè)字母必須是英文字母。R容許變量名稱(chēng)中有空格。例如:如果要給變量x賦予數(shù)值9,只需輸入:>x=9或>x<-9>sqrt(x)[1]3>Y=(5*(x+2))-3>y[1]52運(yùn)算中是不會(huì)影響x的數(shù)值,倘若想重新給x賦值,可參考下列例子:>x=sqrt(x)>x[1]3R中的一些基本運(yùn)算的語(yǔ)句2、向量在統(tǒng)計(jì)學(xué)中,多數(shù)數(shù)據(jù)都是以一組來(lái)表達(dá),即向量的形式。R中,使用者能以向量形式來(lái)輸入一組數(shù)字。舉例來(lái)說(shuō),在一次重復(fù)試驗(yàn)中得出以下10個(gè)結(jié)果:2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1若想將其以一個(gè)向量的形式表示出來(lái),可參考如下:observations=c(2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1)C()表示R中在括號(hào)中的數(shù)值是以向量形式輸入的。向量的運(yùn)算與標(biāo)量的相同,如:2.54*observations輸出結(jié)果為向量中的每一個(gè)數(shù)值均乘以2.54,然后再以向量形式輸出利用R,通過(guò)定義成向量的形式,我們可以很方便的計(jì)算出上述一列數(shù)據(jù)的均質(zhì)和方差,如:Mean(observations)Var(observations)4、矩陣矩陣和向量有點(diǎn)相似,但它是二維的。輸入矩陣如同輸入向量,只需加上它的二維數(shù)據(jù)。矩陣擁有兩個(gè)屬性:“二維數(shù)據(jù)”和“行和列的名稱(chēng)”。例如:A=atrix(c(1:9),nrow=3,ncol=3,byrow=T)[,1][,2][,3][1,]123[2,]456[3,]789上述例子中,自變量“byrow=T”提示R以一行行來(lái)排列矩陣。當(dāng)矩陣的第一行被填滿(mǎn)時(shí),余下的數(shù)字將填補(bǔ)下一行,如此類(lèi)推,直至完成矩陣。byrow默認(rèn)值是“F”,因此,若不輸入自變量“byrow=T”,則會(huì)被視為以下列方式組成矩陣:[,1][,2][,3][1,]147[2,]258[3,]369>dim(A)函數(shù)dim能顯示矩陣的二維數(shù)據(jù)[1]334、矩陣的合并5、數(shù)據(jù)框矩陣和向量一樣,只能擁有一種數(shù)據(jù)類(lèi)型,而數(shù)據(jù)框卻能同時(shí)擁有多種。若數(shù)據(jù)框內(nèi)同時(shí)含有文字,當(dāng)數(shù)據(jù)框被轉(zhuǎn)化成矩陣時(shí),所有元素都會(huì)被轉(zhuǎn)化成文字。利用指令as.frame,可將矩陣轉(zhuǎn)化為數(shù)據(jù)框。例如:數(shù)據(jù)框的引用數(shù)據(jù)框數(shù)據(jù)的調(diào)用用attach命令有興趣的同學(xué)可以試著做:高一成績(jī)與收入水平的kendall相關(guān)系數(shù),并思考為什么不能使用pearson相關(guān)系數(shù)分析?相關(guān)分析R與SPSS對(duì)比R輸出結(jié)果SPSS輸出結(jié)果回歸分析描述變量之間具體的變動(dòng)關(guān)系,通過(guò)控制或給定自變量的數(shù)值來(lái)估計(jì)或預(yù)測(cè)因變量可能的數(shù)值。函數(shù)名:lm(formula,data)數(shù)據(jù)文件:earnings.txt程序命令:earnings=read.table("earnings.txt",header=T)lm1=lm(income~industry+service,data=earnings)summary(lm1)回歸分析R與SPSS對(duì)比R輸出結(jié)果SPSS輸出結(jié)果殘差檢驗(yàn)正態(tài)性檢驗(yàn)程序命令:shapiro.test(lm1$res)t.test(lm1$res)殘差序列滿(mǎn)足εt~N(0,σ2)序列相關(guān)檢驗(yàn)(D.W.)程序命令:library(car)durbin.watson(lm1)殘差檢驗(yàn)自相關(guān)系數(shù)(ACF)程序命令:acf(lm1$res)偏自相關(guān)系數(shù)(PACF)程序命令:pacf(lm1$res)殘差序列滿(mǎn)足0均值、同方差、無(wú)自相關(guān),即白噪聲序列判別分析根據(jù)觀(guān)察或測(cè)量到若干變量值,判斷研究對(duì)象屬于哪一類(lèi)函數(shù)名:lda(x,grouping)數(shù)據(jù)文件名:disc.sav分析方法:距離判別法library(MASS)library(foreign)disc=read.spss("disc.sav",to.data.frame=T)lda1=lda(disc[,-1],disc$GROUP)table(predict(lda1,disc[,-1])$class,disc$GROUP)plot(predict(lda1,disc[,-1])$x,col=as.numeric(disc$GROUP))判別分析R與SPSS對(duì)比R輸出結(jié)果SPSS輸出結(jié)果主成分分析利用降維的思想,把多個(gè)指標(biāo)轉(zhuǎn)換成較少的幾個(gè)互不相關(guān)的綜合指標(biāo)的統(tǒng)計(jì)方法函數(shù)名:prcomp(x,

scale=F)

數(shù)據(jù)文件名:company.txt分析方法:從相關(guān)矩陣出發(fā)程序命令:company=read.table("company.txt",header=T)prc=prcomp(company[,-1],scale=T)summary(prc)prc$rotationprc$x[,1:2]主成分分析R與SPSS比較R輸出結(jié)果SPSS輸出結(jié)果因子分析探討存在相關(guān)關(guān)系的變量之間,是否存在不能直接觀(guān)察到但對(duì)可觀(guān)測(cè)變量變化起支配作用的潛在因子的分析方法函數(shù)名:factanal(x,factors,rotation="varimax")數(shù)據(jù)文件名:student.sav分析方法:極大似然法、方差最大正交旋轉(zhuǎn)、回歸法程序命令:library(foreign)student=read.spss("student.sav",to.data.frame=T)factanal(student,2,rotation="varimax",scores="regression")因子分析R與SPSS對(duì)比R使用mle方法估計(jì)參數(shù),默認(rèn)因子旋轉(zhuǎn)方法為方差最大化R輸出結(jié)果

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論