版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計復(fù)習(xí)兩個總體參數(shù)檢驗復(fù)習(xí)兩個總體參數(shù)檢驗
設(shè)X~N(
1
1
2),Y~
N(
2
2
2)兩總體X,Y相互獨立,樣本(X1,X2,…,Xn),(Y1,Y2,…,Ym)
樣本值
(x1,x2,…,xn),(y1,y2,…,ym)顯著性水平
兩個正態(tài)總體的假設(shè)檢驗設(shè)X~N(112),
1–
2
=
(
12,
22
已知)關(guān)于均值差
1–
2
的檢驗
1–
2
1–
2
1–
2
<
1–
2>
1–
2
原假設(shè)
H0備擇假設(shè)
H1檢驗統(tǒng)計量及其在H0為真時的分布拒絕域1–2=(12,22已知)關(guān)于均值
1–
2
=
1–
2
1–
2
1–
2
<
1–
2>
1–
2
其中
12,
22未知
12=
22原假設(shè)
H0備擇假設(shè)
H1檢驗統(tǒng)計量及其在H0為真時的分布拒絕域1–2=1–21–2假定甲、乙兩機床截下的長度方差相等,問長度的期望值是否一樣?例8-8從兩臺切斷機所截下的坯料(長度按正態(tài)分布)中,分別抽?。競€和9個產(chǎn)品,測得長度如下(單位:mm):甲:150,145,152,155,148,151,
152,148乙:152,150,148,152,150,150,
148,151,148假定甲、乙兩機床截下的長度方差相等,問長度的期望值是否一樣?設(shè)甲床截下的長度為X;乙床截下的長度為Y,由假定知
21=22=2檢驗假設(shè)
解設(shè)甲床截下的長度為X;乙床截下的長度為Y,由假定知21=非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件對查表得拒絕域為所以應(yīng)接受對查表得拒絕域為所以應(yīng)接受非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件兩樣本位置和尺度檢驗樣本之間相互獨立,為位置參數(shù),稱為尺度參數(shù)。假設(shè)樣本:(X1,X2,…,Xn)~i.i.d.F1
(Y1,Y2,…,Yn)~i.i.d.F2
Brown-Mood中位數(shù)檢驗Moses方法Mood檢驗Mann-Whitney秩和檢驗。
兩樣本位置和尺度檢驗樣本之間相互獨立,為位置參兩個樣本檢驗兩個獨立樣本兩個成對相關(guān)樣本兩個樣本檢驗兩個獨立樣本兩個成對相關(guān)樣本MINITAB非參數(shù)統(tǒng)計界面與功能MINITAB非參數(shù)統(tǒng)計界面與功能兩個獨立樣本檢驗兩個獨立樣本檢驗Brown-Mood中位數(shù)檢驗統(tǒng)計思想:用于檢驗兩個總體抽取的樣本的中位數(shù)是否相同。Brown-Mood中位數(shù)檢驗統(tǒng)計思想:用于檢驗兩個總體抽取Brown-Mood中位數(shù)檢驗原理:在零假設(shè)成立時,如果數(shù)據(jù)有相同中位數(shù),那么混合樣本的中位數(shù)應(yīng)該和混合前的項等。假設(shè)(X1,X2,…,Xn)~i.i.d.F(x),
(Y1,Y2,…,Yn)~i.i.d.F(x-)樣本來自兩個相互獨立總體。Brown-Mood中位數(shù)檢驗原理:在零假設(shè)成立時,如果數(shù)據(jù)首先將兩個樣本混合,找出混合樣本中位數(shù),將X和Y按照在兩側(cè)分類計數(shù),即:
在給定m,n和t的時候,在零假設(shè)成立時,A的分布服從超幾何分布:
當(dāng)A值太大時,考慮拒絕零假設(shè)。
計算和例子HYPGEOMDIST(a,m,a+b,m+n)首先將兩個樣本混合,找出混合樣本中位數(shù),將X和Y按照X樣本Y樣本總和觀測值大于MEA=11B=4A+B=15觀測值大于ME11415總和M=12N=18M+N=30從M+N=30個中抽出A+B=15個,成功A=11個,M=12,N=18例:全國30個省人均GDP,中位數(shù)4690,檢驗沿海省X與非沿海省Y的中位數(shù)是否有差異?X樣本Y樣本總和觀測值大于MEA=11B=4A+B=15觀測P(A=11)=0.000236724拒絕H0,認(rèn)為沿海省與非沿海省的中位數(shù)有顯著差異。P(A=11)=0.000236724拒絕H0,認(rèn)為沿海省與檢驗基本內(nèi)容P-值
檢驗統(tǒng)計量
對于水平,如果p-值小于,那么拒絕零假設(shè)
檢驗基本內(nèi)容P-值檢驗統(tǒng)計量對于水平,如果p-值小于非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件HYPGEOMDIST(2,9,8,16)=0.01958HYPGEOMDIST(1,9,8,16)=0.00699=0.02028拒絕H0,認(rèn)為兩品牌的價格有顯著差異HYPGEOMDIST(2,9,8,16)=0.01958=
大樣本檢驗對于大樣本情況下,可以使用超幾何分布的正態(tài)近似進行檢驗:另外可求得置信區(qū)間:其中c和c’滿足:
大樣本檢驗對于大樣本情況下,可以使用超幾何分布的正態(tài)近似進大樣本卡方分布近似大樣本卡方分布近似省市人均GDP沿海與否
北京630291
天津554731
遼寧312591
上海731241
江蘇396221
浙江422141
福建301231
山東330831
廣東375891
廣西149661
海南171751
貴州88241
河北232390
山西203980
內(nèi)蒙古322140
吉林235140
黑龍江217270
安徽144850
江西147810
河南195930
湖北198600
湖南175210
重慶180250
四川153780
云南125870
西藏138610
陜西182460
甘肅121100
青海173890
寧夏178920
新疆198930中位數(shù)ME=198602008年全國經(jīng)濟數(shù)據(jù)省市人均GDP沿海與否北京630291天津554非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件例:比較兩個企業(yè)的收入X1group111110711001991102110611091108110419911011961971102110711131116111311101981X1group10721082106298210521032110210521042100296210821032104211421142113210821062992例:比較兩個企業(yè)的收入X1group111110711001非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件Datamoodtest;Dog=1,2;Inputn;Doi=1ton;Inputx@@;Output;End;End;Datalines;19111107100991021061091081049910196971071131161131109820107108106981051031101051041009610810310411411411310810699;procnpar1waymediandata=moodtest;classg;varx;run;Datamoodtest;
TheNPAR1WAYProcedureMedianScores(NumberofPointsAboveMedian)forVariablexClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1199.6666679.2564101.5255870.5087722209.3333339.7435901.5255870.466667
Averagescoreswereusedforties.MedianTwo-SampleTestStatistic9.6667Z0.2689One-SidedPr>Z0.3940Two-SidedPr>|Z|0.7880MedianOne-WayAnalysisChi-Square0.0723DF1Pr>Chi-Square0.7880TheNPAR1WAYProcedure
MoodScoresforVariablexClassifiedbyVariableg
SumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1192789.833332406.66667355.433586146.8333332202150.166672533.33333355.433586107.508333Averagescoreswereusedforties.MoodTwo-SampleTestStatistic2789.8333Z1.0780One-SidedPr>Z0.1405Two-SidedPr>|Z|0.2810MoodOne-WayAnalysisChi-Square1.1621DF1Pr>Chi-Square0.2810MoodScoresforVariablexWilcoxon(或稱Mann-Whitney)秩和檢驗。是一種比較兩個獨立總體的均值的非參數(shù)檢驗方法。與參數(shù)統(tǒng)計的T檢驗相對應(yīng)。由Henry.B.Mann和D.R.Whitney1947年提出。(Mann,Whitney和Wilcoxon三人共同設(shè)計的一種檢驗,有時也稱為Wilcoxon秩和檢驗)如果總體服從正態(tài)分布的假設(shè)不成立,或是定序數(shù)據(jù),不能用T檢驗,要用Mann-Whitney檢驗wethinkitisnotgaussian(tocheckot,lookataquantile-quantileplotorperformaShapiro–Wilktest)–otherwise,wewoulduseStudent’sTtest,thatismorepowerful.Wilcoxon(或稱Mann-Whitney)秩和檢驗。Mann-Whitney檢驗的假設(shè)條件1、樣本獨立2、數(shù)據(jù)至少為定序尺度檢驗假設(shè):H0:兩總體相同H1:兩總體不同Mann-Whitney檢驗的假設(shè)條件1、樣本獨立檢驗假兩獨立樣本非參數(shù)檢驗含義:由樣本數(shù)據(jù)推斷兩獨立總體的分布是否存在顯著差異(或兩樣本是否來自同一總體)基本假設(shè):H0:兩總體分布無顯著差異(兩樣本來自同一總體)將兩樣本混合并按升序排序分別計算兩個樣本秩的累計頻數(shù)和累計頻率兩個累計頻率相減.如果差距較小,則認(rèn)為兩總體分布無顯著差異應(yīng)保證有較大的樣本數(shù)(大于40)應(yīng)用舉例–不同工藝產(chǎn)品壽命分布一致嗎?–城鎮(zhèn)和農(nóng)村的存(?。┛罘植家恢聠??兩獨立樣本非參數(shù)檢驗Wilcoxon(Mann-Whitney)秩和檢驗它的原理:假定第一個樣本有m個觀測值,第二個有n個觀測值。把兩個樣本混合之后把這m+n個觀測值升冪排序,記下每個觀測值在混合排序下面的秩。之后分別把兩個樣本所得到的秩相加。記第一個樣本觀測值的秩的和為WX而第二個樣本秩的和為WY。這兩個值可以互相推算,稱為Wilcoxon統(tǒng)計量。Wilcoxon(Mann-Whitney)秩和檢驗它的原該統(tǒng)計量的分布和兩個總體分布無關(guān)。由此分布可以得到p-值。直觀上看,如果WX與WY之中有一個顯著地大,則可以選擇拒絕零假設(shè)。該檢驗需要的唯一假定就是兩個總體的分布有類似的形狀(不一定對稱)。該統(tǒng)計量的分布和兩個總體分布無關(guān)。由此分布可以得到p-值。設(shè)兩個獨立樣本為:第一個的樣本X容量為N1,第二個樣本y容量為N2,在容量為N=N1+N2的混合樣本(第一個和第二個)中,x樣本的秩和為WX,Y樣本的秩和為WY設(shè)兩個獨立樣本為:第一個的樣本X容量為N1,第二個樣本y容量Mann-Whitney秩和檢驗
假設(shè)樣本來自于,來自于并且獨立。假設(shè)檢驗問題:
將兩個樣本混合,在混合樣本中的秩;定義,同樣可定義,稱為Wilcoxon秩和統(tǒng)計量。
Mann-Whitney秩和檢驗假設(shè)樣本W(wǎng)-M-W統(tǒng)計量稱為Man-Whitney統(tǒng)計量:在零假設(shè)情況下,和獨立同分布,并且和Wilcoxon秩和統(tǒng)計量等價。當(dāng)統(tǒng)計量偏小的時候,考慮拒絕零假設(shè)。W-M-W統(tǒng)計量稱為Man-Whitney統(tǒng)計量:在零假設(shè)情例:某高中學(xué)生主要來自A,B校兩個初中生,研究一個問題,是否來自A初中的學(xué)生的總體與來自B初中的學(xué)生的總體在學(xué)術(shù)潛力上是相同的。假設(shè);H0:兩個學(xué)校在學(xué)習(xí)潛力上是相同的,H1:兩個學(xué)校在學(xué)習(xí)潛力上是不相同的從高中生中抽4名在A校上學(xué)的學(xué)生,抽5名在B校上學(xué)的學(xué)生。研究中使用的9名學(xué)生現(xiàn)今的高中班級名次。例:某高中學(xué)生主要來自A,B校兩個初中生,研究一個問題,是否解:N1=4,N2=5,N=N1+N2=9X組Y組A校學(xué)生號班級名次B校學(xué)生號班級名次A18B170A252B2202A3112B3144A421B4175B5146學(xué)生名次RANKA181A4212A2523B1704A31125B31446B51467B41758B22029解:X組Y組A校學(xué)生號班級名次B校學(xué)生號班級名次A18B17學(xué)生名次秩學(xué)生名次秩A181B1704A2523B22029A31125B31446A4212B41758B51467合計1134分開學(xué)校的學(xué)生,計算各校學(xué)生的秩和。學(xué)生名次秩學(xué)生名次秩A181B1704A2523B22029WX=11,WY=34W1=WX-N1*(N1+1)=11-10=1W2=WY-N2*(N2+1)=34-15=29若A校學(xué)生均取到最前(小)名次,XL=N1(N1+1)/2=10若A校學(xué)生均取到最后(高)名次,XU=N2(N2+1)/2==[9*(9+1)-5*(5+1)]/2=(90-30)/2=30如果兩個學(xué)校的學(xué)生學(xué)習(xí)能力相同的話,XL與XU應(yīng)接近平均值(30+10)/2=20查表得到臨界點值,n1=4,n2=5,a=0.05,得到臨界值下限TL=12,上限TU==n1(n1+n2+1)-TL=4*(4+5+1)-12=28A校學(xué)生XL=10<12,所以拒絕原假設(shè),兩校學(xué)生有差異。WX=11,WY=34非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件典型例題13411461104111911241161111218311131129197112317021182101285210721322942典型例題13411461104111911241161111例題解答例題解答Wilcoxon’sUtest
Hereisanothermethodofcomputingthis:Contatenatethetwosamples,rankthemR1=sumoftheranksonthefirstsampleR2=sumoftheranksonthesecondsampleU2=n1*n2+n1(n1+1)/2-R1U1=n1*n2+n2(n2+1)/2-R2U=min(U1,U2)Wilcoxon’sUtestHereisanot大樣本正態(tài)近似大樣本正態(tài)近似Datawmwtest;Dog=1,2;Inputn;Doi=1ton;Inputx@@;Output;End;End;Datalines;12 134 146 104 119 124 161 112 83 113 129 97 1237 70 118 101 85 107 132 94;procnpar1waywilcoxondata=wmwtest;classg;varx;run;Datawmwtest;
TheNPAR1WAYProcedureWilcoxonScores(RankSums)forVariablexClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------112141.0120.011.83216011.7502749.070.011.8321607.000
WilcoxonTwo-SampleTestStatistic49.0000NormalApproximationZ-1.7326One-SidedPr<Z0.0416Two-SidedPr>|Z|0.0832tApproximationOne-SidedPr<Z0.0501Two-SidedPr>|Z|0.1003Zincludesacontinuitycorrectionof0.5.
R程序x1<-c(34, 146, 104, 119, 124, 161, 112, 83, 113, 129, 97, 123)x2<-c(70, 118, 101, 85 ,107, 132, 94)x<-c(x1,x2)xshapiro.test(x)$p.valueshapiro.test(x2)$p.valuewilcox.test(x1,x2)Shapiro–Wilktest,Thistestcheckifarandomvariableisgaussian.
R程序x1<-c(34, 146, 104, 119, 12正態(tài)性檢驗P=0.6779109,說明數(shù)據(jù)呈正態(tài)性。正態(tài)性檢驗P=0.6779109,說明數(shù)據(jù)呈正態(tài)性。Wilcoxonranksumtestdata:x1andx2W=56,p-value=0.2614alternativehypothesis:truelocationshiftisnotequalto0不能拒絕H0.Wilcoxonranksumtest不能拒絕H0.t.test(x1,x2)WelchTwoSamplet-testdata:x1andx2t=0.9143,df=16.731,p-value=0.3735alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:-14.5225636.68923sampleestimates:meanofxmeanofy112.0833101.0000t.test(x1,x2)Mann-Whitney秩和檢驗下面數(shù)據(jù)是地區(qū)1的十個城市和地區(qū)2的15個城市的人均GDP(元)?,F(xiàn)在要想以此作為兩個樣本來檢驗兩個地區(qū)的人均GDP的中位數(shù)m1和m2是否一樣,即雙尾檢驗H0:m1=m2對Ha:m1≠m2。Mann-Whitney秩和檢驗下面數(shù)據(jù)是地區(qū)1的十個城市和由于地區(qū)2的人均GDP的中位數(shù)大于地區(qū)1的中位數(shù),因此也可以做單尾檢驗H0:m1=m2對Ha:m1<m2。地區(qū)1:3223 4526 3836 2781 5982 3216 4710 5628 2303 4618地區(qū)2:5391 3983 4076 5941 4748 4600 6325 4534 5526 5699 7008 5403 6678 5537 5257由SPSS的輸出可以得到下面結(jié)果:由于地區(qū)2的人均GDP的中位數(shù)大于地區(qū)1的中位數(shù),因此也可以32231452613836127811598213216147101562812303146181539123983240762594124748246002632524534255262569927008254032667825537252572322314526138361278115982132161非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件Wilcoxon(Mann-Whitney)秩和檢驗該結(jié)果頭兩行顯示了Mann-Whitney和Wilcoxon統(tǒng)計量的值。另外和我們需要結(jié)果的相關(guān)部分為:對于雙尾檢驗H0:m1=m2對Ha:m1≠m2,p-值為0.016(見“ExactSig.(2-tailed)”);而對于單尾檢驗H0:m1=m2對Ha:m1<m2(見“ExactSig.(1-tailed)”),p-值為0.008。這兩個結(jié)果是精確計算的。Wilcoxon(Mann-Whitney)秩和檢驗該結(jié)果通常在樣本量大的時候利用近似方法得到漸近分布的p-值(見“Asymp.Sig.(2-tailed)”),它只給了雙尾檢驗的近似p-值0.017,和精確值差別不大。注意單尾檢驗的p-值是雙尾檢驗的p-值的一半。這個例子的結(jié)果表明,可以拒絕原假設(shè),即有理由認(rèn)為地區(qū)2的人均GDP的中位數(shù)要高一些。通常在樣本量大的時候利用近似方法得到漸近分布的p-值(見“ASPSS軟件使用說明
選項為Analyze-NonparametricTests-2IndependentSamples。把變量(gdp)選入TestVariable
List;再把用1和2分類的變量area輸入進GroupingVariable,在DefineGroups輸入1和2。在TestType選中Mann-Whitney。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可SPSS軟件使用說明選項為Analyze-Nonparam性質(zhì)和檢驗定理4.2在零假設(shè)下:若,且,時:
在檢驗時,,,其中a,b值由前面定理確定。在水平為拒絕域為:,其中k是使式子成立的最大值。對于打結(jié)的情況需要使用修正的公式。
性質(zhì)和檢驗定理4.2在零假設(shè)下:若亞特蘭大(芝加哥(航班次數(shù)組)組)放棄人數(shù)統(tǒng)一編秩放棄人數(shù)統(tǒng)一編秩1115.513721591483103.5103.541812815115.51610620139272416171182215211492517秩和96.556.5某航空公司的CEO注意到飛離亞特蘭大的飛機放棄預(yù)定座位的旅客人數(shù)在增加,他特別有興趣想知道,是否從亞特蘭大起飛的飛機比從芝加哥起飛的飛機有更多的放棄預(yù)定座位的旅客。獲得一個從亞特蘭大起飛的9次航班和從芝加哥起飛的8次航班上放棄預(yù)定座位的旅客人數(shù)樣本,見表中的第2列和第4列所示。亞特蘭大(芝加哥(航班組)組)放棄人數(shù)統(tǒng)一編秩放棄人數(shù)統(tǒng)一編最小值是8秩值為1,最大值是25秩值為17,有兩個結(jié)值10和11,兩個10平均分享秩值3和4為3.5,兩個11平均分享秩值5和6為5.5。有節(jié)時需要對公式進行修正。結(jié)值的存在將使原方差變小,這里τ為節(jié)的個數(shù)最小值是8秩值為1,最大值是25秩值為17,有兩個結(jié)值10和如果設(shè)定顯著水平0.1,我們知道標(biāo)準(zhǔn)正態(tài)分布在0.1顯著水平時,上臨界值為1.645,下臨界值為-1.645,由于1.445<1.645,所以不能拒絕原假設(shè)。如果設(shè)定顯著水平0.1,我們知道標(biāo)準(zhǔn)正態(tài)分布在0.1顯著水平SAS程序如下:datanoshows;dogroup=1to2;inputn;doi=1ton;inputx@@;output;end;end;datalines;9111510181120242225813141081691721;procnpar1waydata=noshowswilcoxon;classgroup;varx;run;SAS程序如下:1.51.5非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件WALD-WOLFOWITZ檢驗Wald-Wolfowitz檢驗是對游程檢驗的擴展,用于確定兩個總體是否具有相同的分布。H0:兩個總體分布相同H1:兩個總體分布不同假設(shè):兩個樣本獨立WALD-WOLFOWITZ檢驗Wald-Wolfowitz將兩個樣本的值按升序排成一列,不考慮來自哪個總體,用符號表示每一個值來自哪個總體,這樣就構(gòu)成由兩個符號表示的一個序列??梢杂嬎阌纬虃€數(shù)值R。統(tǒng)計思想:若兩個總體分布相同,那么兩種符號的交迭率較高,否則,如果兩個總體的分布不同,符號就會堆積。較小的游程就可能拒絕原假設(shè)H0將兩個樣本的值按升序排成一列,不考慮來自哪個總體,用符號表示例:某光盤公司的老板要檢驗兩個售貨員的效率是否相同,獲得每個售貨員日銷售量的下列樣本數(shù)據(jù)售貨員B售貨員A35174423391350244833292160187516493266
例:某光盤公司的老板要檢驗兩個售貨員的效率是否相同,獲得每個NPARTESTS/W-W=XBYG(12)/MISSINGANALYSIS.拒絕H0NPARTESTS拒絕H01、兩個售貨員無法作為同一天發(fā)生數(shù)據(jù)進行配對2、Wald-Wolfowitz是一個弱的檢驗。兩個樣本獨立1、兩個售貨員無法作為同一天發(fā)生數(shù)據(jù)進行配對例:比較兩種廣告的吸引力,隨機選擇8名顧客記錄他們對廣告一的評分,隨機選擇另外9名顧客展示廣告2,并記錄得分。數(shù)據(jù)如下廣告一廣告一73845375849295104
5例:比較兩個行業(yè)的老板薪水。單位千美元。是否能用統(tǒng)計方法證明哪種廣告好家具造紙175891701201661361681602041119610114798
80例:比較兩種廣告的吸引力,隨機選擇8名顧客記錄他們對廣告一的
柯爾莫哥洛夫-斯米爾諾夫檢驗
KOLMOGOROV-SMIRNOV檢驗即兩個獨立樣本的K-S檢驗(Kolmogorov-SmirnovZ)?;舅枷耄簷z驗兩組樣本是否來自同一總體K-S(aliasKOLMOGOROV-SMIRNOV)testswhetherthedistributionofavariableisthesameintwoindependentsamplesthatarede?nedbyagroupingvariable.兩個獨立樣本的K-S檢驗的基本思想與前面討論的單樣本K-S檢驗的基本思路是一致的,差別在于這里處理的是觀察值的秩,而非觀察值本身。
柯爾莫哥洛夫-斯米爾諾夫檢驗
KOLMOGOROV-SM一,將兩組樣本混合并按升序排序;二,分別計算兩組樣本秩的累計頻數(shù)和每個點上的累計頻率;三,將兩個累計頻率相減,得到差值序列數(shù)據(jù)。兩獨立樣本的K-S檢驗仍然關(guān)注差值序列,系統(tǒng)將自動計算K-SZ統(tǒng)計量,并依據(jù)正態(tài)分布表給出的顯著性。如果顯著性小于或等于用戶心中的顯著性水平α,則拒絕零假設(shè),認(rèn)為樣本來自的兩個獨立總體的分布有顯著差異。K——S檢驗比較兩個樣本的累計頻數(shù)分布曲線一,將兩組樣本混合并按升序排序;K——S檢驗比較兩個樣本的累特點:這個檢驗對兩個樣本的中位數(shù),離散程度,偏度差異較敏感
Thetestissensitivetoanydifferenceinmedian,dispersion,skewness,andsoforth,betweenthetwodistributions.特點:這個檢驗對兩個樣本的中位數(shù),離散程度,偏度差異較敏感非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件售貨員B售貨員A35274433392350244833292160287546493266
比較兩個售貨員的業(yè)績是否存在差異NPARTESTSKENDALL=ALL.NPARTESTS/K-S=XBYG(12)/MISSINGANALYSIS.351441391501481291601751491661272332232242332212282462322售貨員B售貨員A3527443339235024483329非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件dataks;inputxg;datalines;29 135 139 144 148 149 150 160 166 175 121 223 224 227 228 232 233 233 246 2;proc
npar1waydata=ksd;classg;varx;run;dataks;
TheNPAR1WAYProcedureKolmogorov-SmirnovTestforVariablexClassifiedbyVariablegEDFatDeviationfromMeangNMaximumatMaximum--------------------------------------------------1100.100000-1.181693290.8888891.245614Total190.473684MaximumDeviationOccurredatObservation18ValueofxatMaximum=33.0KS0.3939KSa1.7170Kolmogorov-SmirnovTwo-SampleTest(Asymptotic)D=max|F1-F2|0.7889Pr>D0.0055D+=max(F1-F2)0.0000Pr>D+1.0000D-=max(F2-F1)0.7889Pr>D-0.0028
Cramer-vonMisesTestforVariablexClassifiedbyVariablegSummedDeviationgNfromMean-------------------------------------1100.522292290.580324Cramer-vonMisesStatistics(Asymptotic)CM0.058032CMa1.102616KuiperTestforVariablexClassifiedbyVariablegDeviationgNfromMean---------------------------1100.000000290.788889KuiperTwo-SampleTest(Asymptotic)K0.788889Ka1.716960Pr>Ka0.0594
Moses方差檢驗原理及計算過程:不用假定均值相等,設(shè)來自方差為的獨立同分布樣本;來自方差為的獨立同分布樣本。假設(shè)檢驗問題:
莫斯檢驗:即兩個獨立樣本的極端反應(yīng)檢驗(MosesExtremeReaction)。Moses方差檢驗原理及計算過程:莫斯檢驗:基本思想兩獨立樣本的極端反應(yīng)檢驗(MosesExtremeReaction),也是一種檢驗樣本來自的兩總體分布是否存在顯著差異的檢驗,它將一個樣本作為控制樣本,另一個樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本是否存在極端反應(yīng)。如果實驗樣本不存在極端反應(yīng),則認(rèn)為兩獨立總體分布無顯著性差異。相反,如果實驗樣本存在極端反應(yīng),則認(rèn)為兩獨立總體分布存在顯著差異?;舅枷隡oses方差檢驗統(tǒng)計量計算1.將隨機分為組,每組k個觀測,記為;將隨機分為組,每組k個觀測,記為
2.求每組內(nèi)樣本偏差平方和:
Moses方差檢驗統(tǒng)計量計算1.將隨機首先,將兩組樣本混合并按升序排序;然后,找出控制樣本最低秩和最高秩之間包含的觀察個數(shù),稱為跨度。為控制極端值對分析結(jié)果的影響,也可先去掉控制樣本兩個最極端的觀察值后再求跨度,這個跨度稱為截頭跨度。本系統(tǒng)自動計算跨度和截頭跨度后,會依據(jù)分布表給出對應(yīng)的相伴概率值。如果相伴概率值小于或等于用戶心中的顯著性水平α,則拒絕零假設(shè),認(rèn)為樣本來自的兩個獨立總體的分布存在顯著差異。首先,將兩組樣本混合并按升序排序;然后,找出控制樣本最低秩和Moses方差檢驗統(tǒng)計量計算3.將,混合,并求出在混合樣本中對應(yīng)的秩.4.求第1組樣本對應(yīng)的秩和,構(gòu)造Moses統(tǒng)計量:如果值很大,那么就考慮拒絕零假設(shè)。實際檢驗時可以查分布表。
Moses方差檢驗統(tǒng)計量計算3.將,8.24.710.76.37.55.214.66.86.35.69.24.211.965.67.412.88.15.26.54.9
13.5
8.24.710.76.37.55.214.66.86.35各組秩和SY=6,秩和Sx=22S=min(6,22)各組秩和SY=6,秩和Sx=22S=min(6,22)非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件兩個相關(guān)樣本的檢驗兩個相關(guān)樣本的檢驗配對樣本的WILCOXON檢驗對比較配對樣本觀測值的兩個總體用WILCOXON檢驗。對相關(guān)樣本的檢驗用WILCOXON檢驗統(tǒng)計量配對樣本的WILCOXON檢驗對比較配對樣本觀測值的兩個總體例:太陽鏡有紫色和粉紅兩種顏色,相知道銷量是否有差異,16個商店銷售數(shù)據(jù)。紫色粉紅564048701006085702284440354528752607770899010106585906170403326例:太陽鏡有紫色和粉紅兩種顏色,相知道銷量是否有差異,16個非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件例某制造商想要比較兩種不同的生產(chǎn)方法所花費的生產(chǎn)時間是否有差異。隨機地選取了11個工人,每一個工人都分別使用兩種不同的生產(chǎn)方法來完成一項相同的任務(wù),每一個工人開始選用的生產(chǎn)方法是隨機的,即可以先使用生產(chǎn)方法1再使用生產(chǎn)方法2,也可以先用生產(chǎn)方法2再使用生產(chǎn)方法1。這樣,在樣本中的每一個工人都提供了一個配對觀察。數(shù)據(jù)見表所示。任務(wù)完成時間的正差值表示生產(chǎn)方法1需要更多的時間,負(fù)差值表示生產(chǎn)方法2需要更多的時間。例某制造商想要比較兩種不同的生產(chǎn)方法所花費的生產(chǎn)時間是否有工人編號n生產(chǎn)方法M差值D絕對差值秩次R符號秩次RM1M2D=M1-M2|D|-+110.29.50.70.78829.69.8-0.20.22239.28.80.40.43.53.5410.610.10.50.55.55.559.910.3-0.40.43.53.5610.29.30.90.91010710.610.50.10.111810.010.000———911.210.60.60.6771010.710.20.50.55.55.51110.69.80.80.8995.549.5工人編號生產(chǎn)方法M差值D絕對差值秩次符號秩次RM1M2D=Mm1M210.29.59.69.89.28.810.610.19.910.310.29.310.610.5101011.210.610.710.210.69.8兩種方法生產(chǎn)時間比較m1M210.29.59.69.89.28.810.610.非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件符號檢驗sign基本思想兩個相關(guān)樣本的符號檢驗利用正、負(fù)符號個數(shù)的多少進行檢驗。首先,分別將第二組樣本的各個觀察值減去第一組樣本的各個觀察值,差值為正,則記為正號,差值為負(fù),則記為負(fù)號,然后用S+和S-統(tǒng)計正負(fù)的個數(shù)。如果正負(fù)的個數(shù)大致相當(dāng),則兩配對樣本數(shù)據(jù)分布差距較??;若正負(fù)的個數(shù)相差較多,則兩配對樣本數(shù)據(jù)分布差距較大。因為在零假設(shè)前提下,兩個相關(guān)樣本中的S+和S—的分布時概率值為0.5的二項分布,為精確計算,系統(tǒng)自動根據(jù)S+、S—和n計算實際的概率值,如果該概率值小于或等于用戶心中的顯著性水平α,則不能拒絕H0,認(rèn)為樣本來自的兩個配對總體的分布無顯著差異。符號檢驗sign正負(fù)符號檢驗(sign)將樣本2的各樣本值減去樣本1的各樣本值.如果差值為正,則記為正號;如果差值為負(fù),則記為負(fù)號如果正號的個數(shù)與負(fù)號的個數(shù)相當(dāng),則認(rèn)為無顯著變化.否則,認(rèn)為有顯著變化正負(fù)符號檢驗(sign)兩種方法生產(chǎn)時間比較m1M210.29.59.69.89.28.810.610.19.910.310.29.310.610.5101011.210.610.710.210.69.8兩種方法生產(chǎn)時間比較m1M210.29.59.69.89.2麥克尼馬爾檢驗McNemar基本思想麥克尼馬爾變化顯著性檢驗將研究對象自身作為對照者,采用二項分布檢驗,通過研究其“前后”的變化,計算二項分布概率值。如果概率值小于或等于用戶心中的顯著性水平α,則拒絕H0,認(rèn)為樣本來自的兩個配對樣本總體的分布有顯著性差異。麥克尼馬爾檢驗McNemar非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件非參數(shù)統(tǒng)計講義三--兩樣本檢驗ppt課件X<-c(49,21,25,107);dim(X)<-c(2,2)mcnemar.test(X,correct=FALSE)Spss有兩種方法求mcnemar檢驗結(jié)果X<-c(49,21,25,107);dim(X)<0111000101111010111101111110110011111101對兩種飲料的口味評價結(jié)果如下表兩種飲料沒有顯著差異NPARTEST/MCNEMAR=Y1WITHY2(PAIRED)/MISS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專項定制旅游接待協(xié)議樣式(2024年版)版B版
- 專業(yè)游泳館運營勞務(wù)輸出協(xié)議2024
- 2025年度廠房抵押貸款風(fēng)險控制合同范本4篇
- 專業(yè)地面打蠟工程協(xié)議范本一
- 2025年度智能辦公空間租賃合作協(xié)議范本4篇
- 二零二五年度影視基地場地租賃及影視制作合同范本3篇
- 專業(yè)汽油運輸業(yè)務(wù)協(xié)議(2024年版)版B版
- 個人土地使用與承包2024版協(xié)議樣本版
- 2025年度高端商業(yè)區(qū)場地租賃及安全管理服務(wù)合同3篇
- 專業(yè)軟件外部開發(fā)合同樣本2024
- 2025年河北供水有限責(zé)任公司招聘筆試參考題庫含答案解析
- Unit3 Sports and fitness Discovering Useful Structures 說課稿-2024-2025學(xué)年高中英語人教版(2019)必修第一冊
- 農(nóng)發(fā)行案防知識培訓(xùn)課件
- 社區(qū)醫(yī)療抗菌藥物分級管理方案
- NB/T 11536-2024煤礦帶壓開采底板井下注漿加固改造技術(shù)規(guī)范
- 2024年九年級上德育工作總結(jié)
- 中文版gcs electrospeed ii manual apri rev8v00印刷稿修改版
- 新生兒預(yù)防接種護理質(zhì)量考核標(biāo)準(zhǔn)
- 除氧器出水溶解氧不合格的原因有哪些
- 沖擊式機組水輪機安裝概述與流程
- 畢業(yè)論文-水利水電工程質(zhì)量管理
評論
0/150
提交評論