




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
R語(yǔ)言統(tǒng)計(jì)分析易楠張青青R語(yǔ)言簡(jiǎn)介集數(shù)據(jù)分析與圖形顯示于一體的統(tǒng)計(jì)編程軟件。由Auckland大學(xué)統(tǒng)計(jì)系的RobertGentleman和RossIhaka于1995年創(chuàng)立的。免費(fèi)下載地址其它統(tǒng)計(jì)軟件SAS:世界上最權(quán)威的統(tǒng)計(jì)軟件,價(jià)格昂貴,支持編程,統(tǒng)計(jì)學(xué)專(zhuān)業(yè)專(zhuān)用軟件SPSS:操作容易、輸出漂亮、功能齊全、價(jià)格合理,非統(tǒng)計(jì)學(xué)專(zhuān)業(yè)首選軟件Eviews:具有強(qiáng)大的多元回歸和時(shí)間序列分析功能,計(jì)量經(jīng)濟(jì)學(xué)專(zhuān)業(yè)專(zhuān)用軟件Matlab:功能強(qiáng)大的編程軟件,統(tǒng)計(jì)分析功能較少,工程專(zhuān)業(yè)首選軟件Excel:具有簡(jiǎn)單的統(tǒng)計(jì)分析功能,商務(wù)辦公首選軟件通病:&“黑匣子”“傻的可愛(ài)”函數(shù)結(jié)構(gòu)function_name(Arguments1,Arguments2=value,…)function_name表示函數(shù)名稱(chēng)Arguments1表示需輸入的數(shù)值,可能是向量、數(shù)據(jù)框等Arguments2=value表示參數(shù)2的取值,可能是邏輯變量等例:函數(shù)read.table(file,header=F)read.table表示讀入文本數(shù)據(jù)函數(shù)名參數(shù)file表示被讀取的文本文件名“**.txt”header表示數(shù)據(jù)文件第一行是否包含變量名,如果包含則輸入header=F,否則輸入header=TR中的一些基本運(yùn)算的語(yǔ)句1、變量與賦值使用者可以用“=”或“<-”來(lái)將數(shù)值賦予給一個(gè)變量。任何英文字母、數(shù)字、“.”都可作為變量名稱(chēng)。但是第一個(gè)字母必須是英文字母。R容許變量名稱(chēng)中有空格。例如:如果要給變量x賦予數(shù)值9,只需輸入:>x=9或>x<-9>sqrt(x)[1]3>Y=(5*(x+2))-3>y[1]52運(yùn)算中是不會(huì)影響x的數(shù)值,倘若想重新給x賦值,可參考下列例子:>x=sqrt(x)>x[1]3R中的一些基本運(yùn)算的語(yǔ)句2、向量在統(tǒng)計(jì)學(xué)中,多數(shù)數(shù)據(jù)都是以一組來(lái)表達(dá),即向量的形式。R中,使用者能以向量形式來(lái)輸入一組數(shù)字。舉例來(lái)說(shuō),在一次重復(fù)試驗(yàn)中得出以下10個(gè)結(jié)果:2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1若想將其以一個(gè)向量的形式表示出來(lái),可參考如下:observations=c(2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1)C()表示R中在括號(hào)中的數(shù)值是以向量形式輸入的。向量的運(yùn)算與標(biāo)量的相同,如:2.54*observations輸出結(jié)果為向量中的每一個(gè)數(shù)值均乘以2.54,然后再以向量形式輸出利用R,通過(guò)定義成向量的形式,我們可以很方便的計(jì)算出上述一列數(shù)據(jù)的均質(zhì)和方差,如:Mean(observations)Var(observations)4、矩陣矩陣和向量有點(diǎn)相似,但它是二維的。輸入矩陣如同輸入向量,只需加上它的二維數(shù)據(jù)。矩陣擁有兩個(gè)屬性:“二維數(shù)據(jù)”和“行和列的名稱(chēng)”。例如:A=atrix(c(1:9),nrow=3,ncol=3,byrow=T)[,1][,2][,3][1,]123[2,]456[3,]789上述例子中,自變量“byrow=T”提示R以一行行來(lái)排列矩陣。當(dāng)矩陣的第一行被填滿(mǎn)時(shí),余下的數(shù)字將填補(bǔ)下一行,如此類(lèi)推,直至完成矩陣。byrow默認(rèn)值是“F”,因此,若不輸入自變量“byrow=T”,則會(huì)被視為以下列方式組成矩陣:[,1][,2][,3][1,]147[2,]258[3,]369>dim(A)函數(shù)dim能顯示矩陣的二維數(shù)據(jù)[1]334、矩陣的合并5、數(shù)據(jù)框矩陣和向量一樣,只能擁有一種數(shù)據(jù)類(lèi)型,而數(shù)據(jù)框卻能同時(shí)擁有多種。若數(shù)據(jù)框內(nèi)同時(shí)含有文字,當(dāng)數(shù)據(jù)框被轉(zhuǎn)化成矩陣時(shí),所有元素都會(huì)被轉(zhuǎn)化成文字。利用指令as.frame,可將矩陣轉(zhuǎn)化為數(shù)據(jù)框。例如:數(shù)據(jù)框的引用數(shù)據(jù)框數(shù)據(jù)的調(diào)用用attach命令有興趣的同學(xué)可以試著做:高一成績(jī)與收入水平的kendall相關(guān)系數(shù),并思考為什么不能使用pearson相關(guān)系數(shù)分析?相關(guān)分析R與SPSS對(duì)比R輸出結(jié)果SPSS輸出結(jié)果回歸分析描述變量之間具體的變動(dòng)關(guān)系,通過(guò)控制或給定自變量的數(shù)值來(lái)估計(jì)或預(yù)測(cè)因變量可能的數(shù)值。函數(shù)名:lm(formula,data)數(shù)據(jù)文件:earnings.txt程序命令:earnings=read.table("earnings.txt",header=T)lm1=lm(income~industry+service,data=earnings)summary(lm1)回歸分析R與SPSS對(duì)比R輸出結(jié)果SPSS輸出結(jié)果殘差檢驗(yàn)正態(tài)性檢驗(yàn)程序命令:shapiro.test(lm1$res)t.test(lm1$res)殘差序列滿(mǎn)足εt~N(0,σ2)序列相關(guān)檢驗(yàn)(D.W.)程序命令:library(car)durbin.watson(lm1)殘差檢驗(yàn)自相關(guān)系數(shù)(ACF)程序命令:acf(lm1$res)偏自相關(guān)系數(shù)(PACF)程序命令:pacf(lm1$res)殘差序列滿(mǎn)足0均值、同方差、無(wú)自相關(guān),即白噪聲序列判別分析根據(jù)觀(guān)察或測(cè)量到若干變量值,判斷研究對(duì)象屬于哪一類(lèi)函數(shù)名:lda(x,grouping)數(shù)據(jù)文件名:disc.sav分析方法:距離判別法library(MASS)library(foreign)disc=read.spss("disc.sav",to.data.frame=T)lda1=lda(disc[,-1],disc$GROUP)table(predict(lda1,disc[,-1])$class,disc$GROUP)plot(predict(lda1,disc[,-1])$x,col=as.numeric(disc$GROUP))判別分析R與SPSS對(duì)比R輸出結(jié)果SPSS輸出結(jié)果主成分分析利用降維的思想,把多個(gè)指標(biāo)轉(zhuǎn)換成較少的幾個(gè)互不相關(guān)的綜合指標(biāo)的統(tǒng)計(jì)方法函數(shù)名:prcomp(x,
scale=F)
數(shù)據(jù)文件名:company.txt分析方法:從相關(guān)矩陣出發(fā)程序命令:company=read.table("company.txt",header=T)prc=prcomp(company[,-1],scale=T)summary(prc)prc$rotationprc$x[,1:2]主成分分析R與SPSS比較R輸出結(jié)果SPSS輸出結(jié)果因子分析探討存在相關(guān)關(guān)系的變量之間,是否存在不能直接觀(guān)察到但對(duì)可觀(guān)測(cè)變量變化起支配作用的潛在因子的分析方法函數(shù)名:factanal(x,factors,rotation="varimax")數(shù)據(jù)文件名:student.sav分析方法:極大似然法、方差最大正交旋轉(zhuǎn)、回歸法程序命令:library(foreign)student=read.spss("student.sav",to.data.frame=T)factanal(student,2,rotation="varimax",scores="regression")因子分析R與SPSS對(duì)比R使用mle方法估計(jì)參數(shù),默認(rèn)因子旋轉(zhuǎn)方法為方差最大化R輸出結(jié)果
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)校文化活動(dòng)與教學(xué)結(jié)合方案計(jì)劃
- 建設(shè)共享友愛(ài)社區(qū)的個(gè)人方案計(jì)劃
- 提升人事部門(mén)服務(wù)質(zhì)量計(jì)劃
- 2025年砼空心砌塊(承重型)項(xiàng)目建議書(shū)
- 地理-河南金太陽(yáng)2024-2025學(xué)年高二上學(xué)期第二次月考
- 中國(guó)科考船行業(yè)市場(chǎng)概況、投資熱點(diǎn)及未來(lái)發(fā)展趨勢(shì)分析預(yù)測(cè)報(bào)告(2025版)
- 加強(qiáng)文化產(chǎn)業(yè)發(fā)展指導(dǎo)原則
- 2025年計(jì)算機(jī)數(shù)字信號(hào)處理板卡項(xiàng)目建議書(shū)
- 豪華車(chē)租賃長(zhǎng)租合同
- 企業(yè)文化推廣致辭
- 睪丸扭轉(zhuǎn)的護(hù)理課件
- 小兒(兒童)常見(jiàn)皮疹理論考核試題
- 芯片設(shè)計(jì)基礎(chǔ)知識(shí)題庫(kù)100道及答案(完整版)
- 00015-英語(yǔ)二自學(xué)教程-unit2
- 2024變電站無(wú)人機(jī)巡檢系統(tǒng)規(guī)范第2部分:檢測(cè)規(guī)范
- 北京市《配電室安全管理規(guī)范》(DB11T 527-2021)地方標(biāo)準(zhǔn)
- 三年級(jí)上冊(cè)乘法豎式計(jì)算200道及答案
- 人教版數(shù)學(xué)八年級(jí)下冊(cè)19.1.2《函數(shù)》說(shuō)課稿
- 區(qū)塊鏈技術(shù)指南
- 《高速鐵路行車(chē)組織》課程標(biāo)準(zhǔn)(高職)
- GB/T 44159-2024氣象探測(cè)環(huán)境保護(hù)規(guī)范氣象衛(wèi)星地面站
評(píng)論
0/150
提交評(píng)論