R語(yǔ)言非參數(shù)檢驗(yàn)_第1頁(yè)
R語(yǔ)言非參數(shù)檢驗(yàn)_第2頁(yè)
R語(yǔ)言非參數(shù)檢驗(yàn)_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、R語(yǔ)言卡方檢驗(yàn)皮爾森擬合優(yōu)度塔防檢驗(yàn)。假設(shè)H0:總體具有某分布F備擇假設(shè)H1:總體不具有該分布。我們將數(shù)軸分成若干個(gè)區(qū)間,所抽取的樣本會(huì)分布在這些區(qū)間中。在原假設(shè)成立的條件下,我們便知道每個(gè)區(qū)間包含樣本的個(gè)數(shù)的期望值。用實(shí)際值Ni與期望值Npi可以構(gòu)造統(tǒng)計(jì)量K。皮爾森證明,n趨向于無(wú)窮時(shí),k收斂于m-1的塔防分布。m為我們分組的個(gè)數(shù)。有了這個(gè)分布,我們就可以做假設(shè)檢驗(yàn)。例X某溥密者協(xié)會(huì)為了確定帝場(chǎng)上消費(fèi)者對(duì)土卻黑牌魄酒的算好怯況,隨機(jī)扣/了1000名曲酒愛(ài)好者作為蚌集進(jìn)旨如F透也每個(gè)人得到5品牌的味酒備一瓶,但木標(biāo)明牌子、這j臀牌澹按分別寫(xiě)著4、史C.0、字葉的5張甑片隨機(jī)的順序送給每一個(gè)人,

2、我土I是根搖樣本資料整理符到的各伸品牌啤酒愛(ài)好者的瀕數(shù)分布.戒根據(jù)這些數(shù)據(jù)判崎消帝者對(duì)這日砰品牌啤酒的火好有無(wú)明顯差異?表亂1;,種品牌律酒愛(ài)好者的頻數(shù)雖喜歡的牌子ABCDE人玫X210312170S5223#如果是均勻分布,則沒(méi)有明顯差異。這里組其實(shí)已經(jīng)分好了,直接用。H0:人數(shù)服從均勻分布x<-c(210,312,170,85,223)n<-sum(x);m<-length(x)p<-rep(1/m,m)K<-sum(x-n*p)A2/(n*p);K#計(jì)算出K值1136.49p<-1-pchisq(K,m-1);p#計(jì)算出p值10#拒絕原假設(shè)。在R語(yǔ)言中

3、chisq.test(),可以完成擬合優(yōu)度檢驗(yàn)。默認(rèn)就是檢驗(yàn)是否為均勻分布,如果是其他分布,需要自己分組,并在參數(shù)p中指出。上面題目的解法:chisq.test(x)Chi-squaredtestforgivenprobabilitiesdata:xX-squared=136.49,df=4,p-value<2.2e-16#同樣拒絕原假設(shè)。例,用這個(gè)函數(shù)檢驗(yàn)其他分布。抽取31名學(xué)生的成績(jī),檢驗(yàn)是否為正態(tài)分布。> x<-c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,

4、90,91,91,92,100)A<-table(cut(x,breaks=c(0,69,79,89,100)#對(duì)樣本數(shù)據(jù)進(jìn)行分組。> A(0,69(69,79(79,89(89,10085135p<-pnorm(c(70,80,90,100),mean(x),sd(x)#獲得理論分布的概率值P<-c(p1,p2-p1,p3-p2,1-p3)chisq.test(A,p=p)Chi-squaredtestforgivenprobabilitiesdata:AX-squared=8.334,df=3,p-value=0.03959#檢驗(yàn)結(jié)果不是正態(tài)的。例:大麥雜交后關(guān)于芒

5、性的比例應(yīng)該是無(wú)芒:長(zhǎng)芒:短芒=9:3:4。我們的實(shí)際觀測(cè)值是335:125:160。請(qǐng)問(wèn)觀測(cè)值是否符合預(yù)期?p<-c(9/16,3/16,4/16)x<-c(335,125,160)chisq.test(x,p=p)Chi-squaredtestforgivenprobabilitiesdata:xX-squared=1.362,df=2,p-value=0.5061在分組的時(shí)候要注意,每組的頻數(shù)要大于等于5.如果理論分布依賴于多個(gè)未知參數(shù),只能先由樣本得到參數(shù)的估計(jì)量。然后構(gòu)造統(tǒng)計(jì)量K,此時(shí)K的自由度減少位置參數(shù)的數(shù)量個(gè)。1. R語(yǔ)言ks檢驗(yàn)。R語(yǔ)言中提供了ks.test()函

6、數(shù),理論上可以檢驗(yàn)任何分布。他既能夠做單樣本檢驗(yàn),也能做雙樣本檢驗(yàn)。單樣本例:記錄一臺(tái)設(shè)備無(wú)故障工作時(shí)常,并從小到大排序4205009201380151016501760210023002350。問(wèn)這些時(shí)間是否服從拉姆達(dá)=1/1500的指數(shù)分布?x<-c(420,500,920,1380,1510,1650,1760,2100,2300,2350)ks.test(x,"pexp",1/1500)One-sampleKolmogorov-Smirnovtestdata:xD=0.3015,p-value=0.2654alternativehypothesis:two-s

7、ided雙樣本例:有兩個(gè)分布,分別抽樣了一些數(shù)據(jù),問(wèn)他們是否服從相同的分布。X<-scan()1:0.610.290.060.59-1.73-0.740.51-0.560.3910:1.640.05-0.060.64-0.820.371.771.09-1.2819:2.361.311.05-0.32-0.401.06-2.4726:Read25itemsY<-scan()1:2.201.661.380.200.360.000.961.560.4410:1.50-0.300.662.313.29-0.27-0.370.380.7019:0.52-0.7121:> Read20i

8、temsks.test(X,Y)Two-sampleKolmogorov-Smirnovtest#原假設(shè)為他們的分布相同data:XandY患肺癌未患肺癌或姻GO3292不吸煙3111463431063.R語(yǔ)言列聯(lián)表數(shù)據(jù)獨(dú)立性檢驗(yàn)。chisq.test()同樣可以做列聯(lián)表數(shù)據(jù)獨(dú)立性檢驗(yàn),只要將數(shù)據(jù)寫(xiě)成矩陣的形式就可以了。表示帶不帶連續(xù)矯正。D=0.23,p-value=0.5286alternativehypothesis:two-sidedx<-matrix(c(60,3,32,11),nrow=2)#參數(shù)correct是邏輯變量x,1,21,60322,311chisq.test(x

9、)Pearson'sChi-squaredtestwithYates'continuitycorrectiondata:xX-squared=7.9327,df=1,p-value=0.004855#拒絕假設(shè)認(rèn)為有關(guān)系如果一個(gè)單元格內(nèi)的數(shù)據(jù)小于5那么做pearson檢驗(yàn)是無(wú)效的。此時(shí)應(yīng)該使用Fisher精確檢例M16其醫(yī)叩為財(cái)定乙什免疫球茶白偵防胎兀宮內(nèi)應(yīng)柴HBT的/果,擋齊例HBsAg<44*隨機(jī)分為瓶防注射鮑和時(shí)照狙,結(jié)果盼表5.7所示.問(wèn)兩皴靴蟲(chóng)兒的/;礦患體慝染率有無(wú)星冽?表E兩組新生兒HBV感染率的比較陰性金針感染率(%)慨防注射觸4182218.18對(duì)照如56

10、1145.4592427,27>x<-matrix(c(4,5,18,6),nrow=2),1,21,4182,56>fisher.test(x)Fisher'sExactTestforCountDatadata:xp-value=0.121alternativehypothesis:trueoddsratioisnotequalto195percentconfidenceinterval:0.039741511.76726409#p值大與0.05,區(qū)間估計(jì)包含1,所以認(rèn)為沒(méi)有關(guān)系。sampleestimates:oddsratio0.2791061McNemar檢驗(yàn)

11、。這個(gè)不是相關(guān)性檢驗(yàn)。是配對(duì)卡方檢驗(yàn)。也就是說(shuō),我們是對(duì)一個(gè)樣本做了兩次觀測(cè),本身不是獨(dú)立的樣本而是相關(guān)的樣本,而我們檢驗(yàn)的是變化的強(qiáng)度。H0:頻數(shù)沒(méi)有發(fā)生變化。表1相依配對(duì)計(jì)教資料治療后具有正狀人治療后不具有癥狀k治療前不耳有/S狀A(yù)ab治療函具有蘊(yùn)找A=d用法就不舉例了。單元格內(nèi)數(shù)字不得小于5.n要大于100.4. R語(yǔ)言符號(hào)檢驗(yàn)。當(dāng)我們以中位數(shù)將數(shù)據(jù)分為兩邊,一邊為正,一邊為負(fù),那么樣本出現(xiàn)在兩邊的概率應(yīng)該都為1/2。因此,使用p=0.2的二項(xiàng)檢驗(yàn)就可以做符號(hào)檢驗(yàn)了。例:統(tǒng)計(jì)了66個(gè)城市的生活花費(fèi)指數(shù),北京的生活花費(fèi)指數(shù)為99。請(qǐng)問(wèn)北京是否位于中位數(shù)以上。x<-scan()1:66

12、7578808181828383838312:848585868686868787888823:888888898989899090919134:9191929393969696979910045:10110210310310410410410510610910956:11011011011111311511611711815519267:Read66itemsbinom.test(sum(x>99),length(x),alternative="less")Exactbinomialtestdata:sum(x>99)andlength(x)numberofs

13、uccesses=23,numberoftrials=66,p-value=0.009329alternativehypothesis:trueprobabilityofsuccessislessthan0.595percentconfidenceinterval:0.00000000.4563087sampleestimates:probabilityofsuccess0.3484848#北京位于中位數(shù)下。符號(hào)檢驗(yàn)也可以用來(lái)檢驗(yàn)兩個(gè)總體是否存在明顯差異。要是沒(méi)有差異,那么兩者之差為正的概率為0.5.例亂19用四軒不同的飼卻*豬,其噌重整況如艮5.10示,液分析四料飼畏表5.10:不同飼料弊豬

14、的增重情況時(shí)編號(hào)12345G7891011121314飼料X2534)28232735知2832293U303116飼并V193221192531312G30252SS1252Sy<-c(19,32,21,19,25,31,31,26,30,25,28,31,25,25)x<-c(25,30,28,23,27,35,30,28,32,29,30,30,31,16)binom.test(sum(x<y),length(x)Exactbinomialtestdata:sum(x<y)andlength(x)numberofsuccesses=4,numberoftrials

15、=14,p-value=0.1796alternativehypothesis:trueprobabilityofsuccessisnotequalto0.595percentconfidenceinterval:0.083889320.58103526sampleestimates:probabilityofsuccess0.2857143#無(wú)明顯差異。這個(gè)例子不是很好例泉20某代料店為了解客對(duì)食料的愛(ài)好蜻況,進(jìn)一步改迸他們的工作,對(duì)屈容喜歡咖啡還是喜歡奶茶,或者兩者同樣愛(ài)好進(jìn)行了調(diào)查.該店在某日隨機(jī)地於取了名顧客,謎行了凋亥,頃客喜歡咖啡斐過(guò)都圣用正號(hào)表示,赤歡胡茶廢過(guò)咖啡用角號(hào)表示,冏者

16、同樣愛(ài)好用"表示,現(xiàn)普調(diào)查的結(jié)果列在也&中,淡表5J1:不同顧客的愛(ài)好情況12315G7Ei91()111213再歡咖噂111i011111再歡奶茶11I1題目中標(biāo)識(shí)為0的意思是兩者同樣喜歡。binom.test(3,12,alternative="less”,conf.level=0.9)Exactbinomialtestdata:3and12numberofsuccesses=3,numberoftrials=12,p-value=0.073alternativehypothesis:trueprobabilityofsuccessislessthan0.590

17、percentconfidenceinterval:0.00000000.4752663sampleestimates:5. probabilityofsuccess#p<0.1接受備擇假設(shè)認(rèn)為有差異0.25R語(yǔ)言秩相關(guān)檢驗(yàn)。6. 在R語(yǔ)言中,rank()函數(shù)用來(lái)求秩,如果向量中有相同的數(shù)據(jù),求出的秩可能不合我們的要求,對(duì)數(shù)據(jù)做微調(diào)即可x<-c(1.2,0.8,-3.1,2,1.2)rank(x)13.52.01.05.03.5x<-c(1.2,0.8,-3.1,2,1.2+1e-5)rank(x)132154利用秩可以做相關(guān)性檢驗(yàn)。cor.test(method="

18、;spearman,kendell")R語(yǔ)言wilcoxon檢驗(yàn)。符號(hào)檢驗(yàn)只考慮了符號(hào),沒(méi)有考慮要差異的大小。wilcoxon解決了這個(gè)問(wèn)題。假設(shè),數(shù)據(jù)是連續(xù)分布的,數(shù)據(jù)是關(guān)于中位數(shù)對(duì)稱的。例:某電池廠商生產(chǎn)的電池中位數(shù)為140.現(xiàn)從新生產(chǎn)的電池中抽取20個(gè)測(cè)試。請(qǐng)問(wèn)電池是否合格x<-c(137,140,138.3,139,144.3,139.1,141.7,137.3,133.5,138.2,141.1,139.2,136.5,136.5,135.6,138,140.9,140.6,136.3,134.1)wilcox.test(x,mu=140,alternative=&q

19、uot;less”,exact=F,correct=F,=T)Wilcoxonsignedranktestdata:xV=34,p-value=0.007034alternativehypothesis:truelocationislessthan140wilcox.test()做成對(duì)樣本檢測(cè)。例:在農(nóng)場(chǎng)中選擇了10塊農(nóng)田,將每一塊農(nóng)田分成2小塊,分別用不同的化肥種菜。請(qǐng)問(wèn)化肥會(huì)不會(huì)提高蔬菜產(chǎn)量。x<-c(459,367,303,392,310,342,421,446,430,412)y<-c(414,306,321,443,281,301,353,391,405,390)wilcox.test(x-y,alternative="greater")Wilcoxonsignedranktestdata:x-yV=47,p-value=0.02441alternativehypothesis:truelocationisgreaterthan0#能夠提高產(chǎn)量非配對(duì)雙樣本檢測(cè):例5.26令測(cè)祥10名非缶作與工人g7名鈣作業(yè)工人的血裙伉,如由5.15示-淡用WileoT

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論