版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
食品實驗設(shè)計第一頁,共七十五頁,編輯于2023年,星期四非參數(shù)檢驗的概念是指在總體不服從正態(tài)分布且分布情況不明時,用來檢驗數(shù)據(jù)資料是否來自同一個總體假設(shè)的一類檢驗方法。由于這些方法一般不涉及總體參數(shù)故得名。這類方法的假定前提比參數(shù)性假設(shè)檢驗方法少的多,也容易滿足,適用于計量信息較弱的資料且計算方法也簡單易行,所以在實際中有廣泛的應用。第二頁,共七十五頁,編輯于2023年,星期四非參數(shù)檢驗的過程1.Chi-Squaretest卡方檢驗2.Binomialtest二項分布檢驗3.Runstest游程檢驗4.1-SampleKolmogorov-Smirnovtest一個樣本柯爾莫哥洛夫-斯米諾夫檢驗5.2independentSamplesTest兩個獨立樣本檢驗6.KindependentSamplesTestK個獨立樣本檢驗7.2relatedSamplesTest兩個相關(guān)樣本檢驗8.KrelatedSamplesTest兩個相關(guān)樣本檢驗第三頁,共七十五頁,編輯于2023年,星期四12.1卡方檢驗Chi-Squaretest
這里介紹的卡方檢驗可以檢驗列聯(lián)表中某一個變量的各個水平是否有同樣比例或者等于你所想象的比例(如5:4:1)實例1:擲骰子300次,變量LMT,1、2、3、4、5、6分別代表六面的六個點,試問這骰子是否均勻。數(shù)據(jù)data12-01(300個cases)。Analyze->NonparametricTests->ChiSquareTestVariable:lmt想要檢驗的變量由于這是一個均勻分布檢測,使用默認選擇(ExpectedValues:Allcategoriesequal作為零假設(shè));比較有用的結(jié)果:sig=.111>0.5,不能拒絕零假設(shè),認為均勻。實例1的數(shù)據(jù)可以組織成:兩個變量(side面和number次數(shù)),6個cases。但在卡方檢驗前要求用number加權(quán)。結(jié)果同。第四頁,共七十五頁,編輯于2023年,星期四補充:卡方檢驗實例實例:心臟病人猝死人數(shù)與日期的關(guān)系,收集168個觀測數(shù)據(jù)。其中用1、2、3、4、5、6、7表示是星期幾死的。而人數(shù)分別為55、23、18、11、26、20、15。推斷心臟病人猝死人數(shù)與日期的關(guān)系是否為2.8:1:1:1:1:1:1。(變量2個:死亡日期和死亡人數(shù),Cases7個)加權(quán):Data->WeightCases:死亡人數(shù)Analyze->NonparametricTests->ChiSquareTestVariable:死亡日期ExpectedValues:2.8:1:1:1:1:1:1
比較有用的結(jié)果:sig=.256>0.5,不能拒絕零假設(shè),認為心臟病人猝死人數(shù)與日期的關(guān)系為2.8:1:1:1:1:1:1。第五頁,共七十五頁,編輯于2023年,星期四12.2二項分布檢驗Binomialtest
二項分布:在現(xiàn)實生活中有很多的取值是兩類的,如人群的男和女、產(chǎn)品的合格和不合格、學生的三好學生和非三好學生、投擲硬幣的正面和反面。這時如果某一類出現(xiàn)的概率是P,則另一類出現(xiàn)的概率就是1-P。這種分布稱為二項分布。實例1:擲一枚比賽用的挑邊器31次,變量tbh,1為出現(xiàn)A面、2為出現(xiàn)A面,試問這挑邊器是否均勻。數(shù)據(jù)data12-03(31個cases)。Analyze->NonparametricTests->BinomialTestVariable:tbh由于這是一個均勻分布檢測,使用默認選擇(TestProportion:0.5);比較有用的結(jié)果:兩組個數(shù)和sig=1.00>0.5,不能拒絕零假設(shè),認為挑邊器是均勻。實例1的數(shù)據(jù)可以組織成:兩個變量(side面和number次數(shù)),2個cases。但在二項分布檢驗前要求用number加權(quán)。結(jié)果同。第六頁,共七十五頁,編輯于2023年,星期四補充:二項分布檢驗實例實例:為驗證某批產(chǎn)品的一等品率是否達到90%,現(xiàn)從該批產(chǎn)品中隨機抽取23個樣品進行檢測,結(jié)果有19個一等品(1-一等品,0-非一等品)。(變量2個:一等品和個數(shù),Cases2個:119和04)加權(quán):Data->WeightCases:個數(shù)Analyze->NonparametricTests->BinomialTestVariable:一等品TestProportion:0.9比較有用的結(jié)果:兩組個數(shù)和sig=.193>0.5,不能拒絕零假設(shè),認為該批產(chǎn)品的一等品率達到了90%。第七頁,共七十五頁,編輯于2023年,星期四12.3游程檢驗Runstest單樣本變量隨機性檢驗是對某變量值出現(xiàn)是否隨機進行檢驗。實例1(同二項分布檢驗)
:擲一枚比賽用的挑邊器31次,變量tbh,1為出現(xiàn)A面、2為出現(xiàn)A面,試問這挑邊器出現(xiàn)AB面是否隨機。數(shù)據(jù)data12-03(31個cases)。Analyze->NonparametricTests->Runs
TestVariable:tbhCutPoint:Custom:2比較有用的結(jié)果:總case數(shù)(31)、游程Run數(shù)(21)、sig=.142>0.5,不能拒絕零假設(shè),認為挑邊器出現(xiàn)AB面是隨機的。第八頁,共七十五頁,編輯于2023年,星期四12.4一個樣本柯爾莫哥洛夫-斯米諾夫檢驗
1-SampleKolmogorov-Smirnovtest單樣本K-S檢驗是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布,適用于探索連續(xù)型隨機變量的分布形態(tài)(判斷定距變量的分布情況):Normal正態(tài)分布、Uniform均勻分布、Poisson泊松分布、Exponential指數(shù)分布。實例
:盧瑟福和蓋革作了一個著名的實驗,他們觀察了長為7.5秒的時間間隔里到達某個計數(shù)器的由某塊放射物資放出的alfa粒子質(zhì)點數(shù),共觀察了2608次。數(shù)據(jù)data12-05(1個變量zd,2608個cases,按0-10排序)。試問這種分布規(guī)律是否服從泊松分布Analyze->NonparametricTests->1-SampleK-STestVariable:zdTestDistribution:Poisson比較有用的結(jié)果:均值(3.8673)、sig=.850>0.5,不能拒絕零假設(shè),認為服從泊松分布。第九頁,共七十五頁,編輯于2023年,星期四12.5兩個獨立樣本檢驗
2independentSamplesTest通過分析兩個樣本數(shù)據(jù),推斷它們的分布是否存在顯著性差異。方法有四種:Mann-WhitneyU:是通過對平均秩的研究來實現(xiàn)推斷的K-SZ:是通過對分布的研究來實現(xiàn)推斷的Mosesextremereactions:一個作為控制樣本,另一個作為實驗樣本W(wǎng)aldWolfwitzRuns:是通過對游程的研究來實現(xiàn)推斷的實例
:甲乙兩種安眠藥服用后的效果。數(shù)據(jù)data12-06(2個變量:組別zb和延長時間ycss,20個cases)。試問這兩種藥物的療效是否有顯著性差異。Analyze->NonparametricTests->2independentSamples
TestVariable:ycssGrouping:zb(1,2)Testtype:四種均選比較有用的結(jié)果:比較四個sig值,有三個sig>.5,不能拒絕零假設(shè)認為療效無顯著性差異。第十頁,共七十五頁,編輯于2023年,星期四12.6多個獨立樣本檢驗
KindependentSamplesTest通過分析多個樣本數(shù)據(jù),推斷它們的分布是否存在顯著性差異。方法有三種:Median:是通過對中位數(shù)的研究來實現(xiàn)推斷的K-W:是通過對推廣的平均秩的研究來實現(xiàn)推斷的J-T:與兩個獨立樣本檢驗的Mann-WhitneyU類似實例
:某車間用四種不同的操作方法檢測產(chǎn)品優(yōu)等品率的實驗數(shù)據(jù)。數(shù)據(jù)data12-07(2個變量:方法ff和優(yōu)等品率ydpl,21個cases)。試問這四種不同的操作方法對產(chǎn)品優(yōu)等品率是否有顯著性差異。Analyze->NonparametricTests->KindependentSamples
TestVariable:ydpl
Grouping:ff(1,4)Testtype:三種均選比較有用的結(jié)果:比較三個sig值,K-W方法的sig=.009<.05,拒絕零假設(shè),認為這四種不同的操作方法對產(chǎn)品優(yōu)等品率是有顯著性差異。其他二個方法的sig>.5,但不用,原因是觀測量太少。第十一頁,共七十五頁,編輯于2023年,星期四12.7兩個相關(guān)樣本檢驗
2relatedSamplesTest同一個被測試者,前后測兩次,彼此相關(guān)。方法有四種。實例
:某校15名男生的長跑鍛煉后晨脈變化數(shù)據(jù)。數(shù)據(jù)data12-08(2個變量:鍛煉前dlq和鍛煉后dlh優(yōu),21個cases)。試問鍛煉前后的晨脈有無顯著性差異。Analyze->NonparametricTests->2relatedSamples
TestPairs:dlq-dlhTesttype:選一種或多種比較有用的結(jié)果:看sig值,sig<.05,拒絕零假設(shè),認為鍛煉前后的晨脈有顯著性的差異。第十二頁,共七十五頁,編輯于2023年,星期四12.8多個相關(guān)樣本檢驗
KrelatedSamplesTest對多個被測試者,多個打分,看打分是否有顯著性差異。方法有三種:CochranQ:要求樣本數(shù)據(jù)為二值的(1-滿意0-不滿意)Friedman:利用秩實現(xiàn)Kendall協(xié)同系數(shù)檢驗:H0:協(xié)同系數(shù)為0(評分標準不相關(guān)的或者是隨機的)實例
:9個顧客對三種款式襯衫的喜愛程度(1-最喜愛2-其次3-不喜愛)。數(shù)據(jù)data12-09(3個變量:款式A,款式B,款式C,27個cases)。試問顧客對三種款式襯衫的喜愛程度是否相同。Analyze->NonparametricTests->krelatedSamples
TestVariables:abcTesttype:選一種或多種比較有用的結(jié)果:看sig值,sig<.05,拒絕零假設(shè),認為顧客對三種款式襯衫的喜愛程度是不相同的。第十三頁,共七十五頁,編輯于2023年,星期四補充:非參數(shù)檢驗以下的講義是吳喜之教授有關(guān)非參數(shù)檢驗的講義,我覺得比書上講得清楚。第十四頁,共七十五頁,編輯于2023年,星期四非參數(shù)檢驗第十五頁,共七十五頁,編輯于2023年,星期四為什么用非參數(shù)方法?
經(jīng)典統(tǒng)計的多數(shù)檢驗都假定了總體的背景分布。但也有些沒有假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)或零假設(shè)下等可能的概率等和數(shù)據(jù)本身的具體總體分布無關(guān)的性質(zhì)進行檢驗。這都稱為非參數(shù)檢驗。第十六頁,共七十五頁,編輯于2023年,星期四為什么用非參數(shù)方法?
這些非參數(shù)檢驗在總體分布未知時有很大的優(yōu)越性。這時如果利用傳統(tǒng)的假定分布已知的檢驗,就會產(chǎn)生錯誤甚至災難。非參數(shù)檢驗總是比傳統(tǒng)檢驗安全。但是在總體分布形式已知時,非參數(shù)檢驗就不如傳統(tǒng)方法效率高。這是因為非參數(shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗無法拒絕。但非參數(shù)統(tǒng)計在總體未知時效率要比傳統(tǒng)方法要高,有時要高很多。是否用非參數(shù)統(tǒng)計方法,要根據(jù)對總體分布的了解程度來確定。
第十七頁,共七十五頁,編輯于2023年,星期四非參數(shù)方法這里介紹一些非參數(shù)檢驗。關(guān)于非參數(shù)方法的確切定義并不很明確。我們就其最廣泛的意義來理解。在計算中,諸如列聯(lián)表分析中的許多問題都有精確方法,MonteCarlo抽樣方法和用于大樣本的漸近方法等選擇。精確方法比較費時間,后兩種要粗糙一些,但要快些。
第十八頁,共七十五頁,編輯于2023年,星期四秩(rank)
非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升序排列之后,每個觀測值的位置。例如我們有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。
第十九頁,共七十五頁,編輯于2023年,星期四秩(rank)
利用秩的大小進行推斷就避免了不知道背景分布的困難。這也是大多數(shù)非參數(shù)檢驗的優(yōu)點。多數(shù)非參數(shù)檢驗明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。
第二十頁,共七十五頁,編輯于2023年,星期四列聯(lián)表問題
我們講過列聯(lián)表的c2檢驗問題(第七章)。這里介紹的檢驗可以檢驗列聯(lián)表中某一個變量的各個水平是否有同樣比例或者等于你所想象的比例。每個檢驗都可以選擇使用精確方法,MonteCarlo抽樣方法或用于大樣本的漸近方法。利用數(shù)據(jù)table7.sav,假定你想知道收入的比例是否是5比4比1(零假設(shè))。而且選擇精確檢驗,你可以得到各種檢驗結(jié)果如下:第二十一頁,共七十五頁,編輯于2023年,星期四列聯(lián)表問題
利用數(shù)據(jù)table7.sav,假定你想知道收入的比例是否是5比4比1(零假設(shè))。而且選擇精確檢驗,你可以得到各種檢驗結(jié)果如下:第二十二頁,共七十五頁,編輯于2023年,星期四列聯(lián)表問題
該結(jié)果除了給出了精確檢驗的p值,表明無論還給出漸近檢驗的p值;兩個都是0.000;這表明零假設(shè)的比例欠妥。輸出還給出了Pearson統(tǒng)計量中的Oi和Ei(分別為下表中的ObservedN和ExpectedN):第二十三頁,共七十五頁,編輯于2023年,星期四列聯(lián)表問題
如果要檢驗變量的各水平是否都相等,從SPSS可以得到對這三個變量的檢驗(對每個變量的零假設(shè)是各水平影響相同)結(jié)果:
SPSS還分別給出對每個變量的Pearson統(tǒng)計量中的Oi和Ei。第二十四頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
用table7.sav數(shù)據(jù)。假定已經(jīng)加權(quán)了(number:權(quán))Analyze-NonparametricTests-ChiSquare。然后選擇想要檢驗的變量(如income),如要檢驗其水平是否相等,則在ExpectedValues選Allcategoriesequal作為零假設(shè)(默認選擇);如要檢驗其水平是否為某比例,則在下面Values輸入你的比例(我們是5比4比1,逐個輸入)作為零假設(shè)。點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。如果選入的變量多于一個,則檢驗的都是水平相等的零假設(shè)。最后OK即可。第二十五頁,共七十五頁,編輯于2023年,星期四
單樣本Kolmogorov-Smirnov檢驗
單樣本的Kolmogorov-Smirnov檢驗(K-S檢驗)是用來檢驗一個數(shù)據(jù)的觀測累積分布是否是已知的理論分布。這些作為零假設(shè)的理論分布在SPSS的選項中有正態(tài)分布(Normal),泊松分布(Poisson),均勻分布(Uniform)和指數(shù)分布(Exponential)。在SPSS軟件中對于是否是正態(tài)分布或均勻分布的檢驗統(tǒng)計量為第二十六頁,共七十五頁,編輯于2023年,星期四數(shù)據(jù)ksdata.sav的K-S檢驗
我們檢驗它是否是正態(tài)分布、均勻分布和指數(shù)分布。輸出結(jié)果分別顯示在下面三個表中:由于sig=.074>.05,不能拒絕正態(tài)分布(Normal)零假設(shè)。第二十七頁,共七十五頁,編輯于2023年,星期四由于sig=.000<.05,拒絕均勻分布(Uniform)零假設(shè)第二十八頁,共七十五頁,編輯于2023年,星期四由于sig=.664>.05,不能拒絕指數(shù)分布(Exponential)零假設(shè)比較三種分布檢驗,認為是該數(shù)據(jù)服從指數(shù)分布第二十九頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用我們的ksdata.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-1SampleK-S。然后把變量(這里是x)選入VariableList。再在下面TestDistribution選中零假設(shè)的分布(Normal、Poisson、Uniform和Exponential)作為零假設(shè)。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可。
第三十頁,共七十五頁,編輯于2023年,星期四關(guān)于隨機性的游程檢驗(runtest)
游程檢驗方法是檢驗一個取兩個值的變量的這兩個值的出現(xiàn)是否是隨機的。假定下面是由0和1組成的一個這種變量的樣本(數(shù)據(jù)run1.sav):0000111111001011100000000其中相同的0(或相同的1)在一起稱為一個游程(單獨的0或1也算)。這個數(shù)據(jù)中有4個0組成的游程和3個1組成的游程。一共是R=7個游程。其中0的個數(shù)為m=15,而1的個數(shù)為n=10。
第三十一頁,共七十五頁,編輯于2023年,星期四關(guān)于隨機性的游程檢驗(runtest)
出現(xiàn)0和1的的這樣一個過程可以看成是參數(shù)為某未知p的Bernoulli試驗。但在給定了m和n之后,在0和1的出現(xiàn)是隨機的零假設(shè)之下,R的條件分布就和這個參數(shù)無關(guān)了。根據(jù)初等概率論,R的分布可以寫成(令N=m+n)第三十二頁,共七十五頁,編輯于2023年,星期四關(guān)于隨機性的游程檢驗(runtest)
于是就可以算出在零假設(shè)下有關(guān)R的概率,以及進行有關(guān)的檢驗了。利用上面公式可進行精確檢驗;也可以利用大樣本的漸近分布和利用MonteCarlo方法進行檢驗。利用上面數(shù)據(jù)的結(jié)果是:第三十三頁,共七十五頁,編輯于2023年,星期四關(guān)于隨機性的游程檢驗(runtest)
當然,游程檢驗并不僅僅用于只取兩個值的變量,它還可以用于某個連續(xù)變量的取值小于某個值及大于該值的個數(shù)(類似于0和1的個數(shù))是否隨機的問題。看下面例子。例(run2.sav):從某裝瓶機出來的30盒化妝品的重量如下(單位克)71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9為了看該裝瓶機是否工作正常,首先需要驗證是否大于和小于中位數(shù)的個數(shù)是否是隨機的(零假設(shè)為這種個數(shù)的出現(xiàn)是隨機的)。
第三十四頁,共七十五頁,編輯于2023年,星期四關(guān)于隨機性的游程檢驗(runtest)
如果把小于中位數(shù)的記為0,否則記為1,上面數(shù)據(jù)變成下面的0-1序列111111110111101000000000000110這就歸為上面的問題。當然這里進行這種變換只是為了易于理解。實際計算時,用不著這種變換,計算機會自動處理這個問題的。直接利用這個數(shù)據(jù),通過SPSS,得到下面游程檢驗結(jié)果的輸出。
第三十五頁,共七十五頁,編輯于2023年,星期四第三十六頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
用run2.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-Runs。然后把變量(這里是length)選入VariableList。再在下面CutPoint選中位數(shù)(Median)。當然,也可以選其他值,如均值(Mean),眾數(shù)(Mode)或任何你愿意的數(shù)目(放在Custom)。注意在對前面的由0和1組成的序列(run1.sav進行隨機性檢驗時,要選均值(為什么?)。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可。第三十七頁,共七十五頁,編輯于2023年,星期四Wilcoxon(Mann-Whitney)秩和檢驗這里介紹常用的Wilcoxon(或稱Mann-Whitney)秩和檢驗。它的原理很簡單,假定第一個樣本有m個觀測值,第二個有n個觀測值。把兩個樣本混合之后把這m+n個觀測值升冪排序,記下每個觀測值在混合排序下面的秩。之后分別把兩個樣本所得到的秩相加。記第一個樣本觀測值的秩的和為WX而第二個樣本秩的和為WY。這兩個值可以互相推算,稱為Wilcoxon統(tǒng)計量。該統(tǒng)計量的分布和兩個總體分布無關(guān)。由此分布可以得到p-值。直觀上看,如果WX與WY之中有一個顯著地大,則可以選擇拒絕零假設(shè)。該檢驗需要的唯一假定就是兩個總體的分布有類似的形狀(不一定對稱)。第三十八頁,共七十五頁,編輯于2023年,星期四Wilcoxon(Mann-Whitney)秩和檢驗下面數(shù)據(jù)(GDP.sav)是地區(qū)1的十個城市和地區(qū)2的15個城市的人均GDP(元)?,F(xiàn)在要想以此作為兩個樣本來檢驗兩個地區(qū)的人均GDP的中位數(shù)m1和m2是否一樣,即雙尾檢驗H0:m1=m2對Ha:m1≠m2。由于地區(qū)2的人均GDP的中位數(shù)大于地區(qū)1的中位數(shù),因此也可以做單尾檢驗H0:m1=m2對Ha:m1<m2。地區(qū)1:3223 4526 3836 2781 5982 3216 4710 5628 2303 4618地區(qū)2:5391 3983 4076 5941 4748 4600 6325 4534 5526 5699 7008 5403 6678 5537 5257由SPSS的輸出可以得到下面結(jié)果:
第三十九頁,共七十五頁,編輯于2023年,星期四第四十頁,共七十五頁,編輯于2023年,星期四Wilcoxon(Mann-Whitney)秩和檢驗該結(jié)果頭兩行顯示了Mann-Whitney和Wilcoxon統(tǒng)計量的值。另外和我們需要結(jié)果的相關(guān)部分為:對于雙尾檢驗H0:m1=m2對Ha:m1≠m2,p-值為0.016(見“ExactSig.(2-tailed)”);而對于單尾檢驗H0:m1=m2對Ha:m1<m2(見“ExactSig.(1-tailed)”),p-值為0.008。這兩個結(jié)果是精確計算的。通常在樣本量大的時候利用近似方法得到漸近分布的p-值(見“Asymp.Sig.(2-tailed)”),它只給了雙尾檢驗的近似p-值0.017,和精確值差別不大。注意單尾檢驗的p-值是雙尾檢驗的p-值的一半。這個例子的結(jié)果表明,可以拒絕原假設(shè),即有理由認為地區(qū)2的人均GDP的中位數(shù)要高一些。第四十一頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用GDP.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-2IndependentSamples。把變量(gdp)選入TestVariable
List;再把用1和2分類的變量area輸入進GroupingVariable,在DefineGroups輸入1和2。在TestType選中Mann-Whitney。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第四十二頁,共七十五頁,編輯于2023年,星期四兩樣本分布的Kolmogorov-Smirnov檢驗
假定有分別來自兩個獨立總體的兩個樣本。要想檢驗它們背后的總體分布相同的零假設(shè),可以進行兩獨立樣本的Kolmogorov-Smirnov檢驗。原理完全和單樣本情況一樣。只不過把檢驗統(tǒng)計量中零假設(shè)的分布換成另一個樣本的經(jīng)驗分布即可。假定兩個樣本的樣本量分別為n1和n2,用S1(X)和S2(X)分別表示兩個樣本的累積經(jīng)驗分布函數(shù)。再記Dj=S1(Xj)-S2(Xj)。近似正態(tài)分布的檢驗統(tǒng)計量為
第四十三頁,共七十五頁,編輯于2023年,星期四計算結(jié)果
twonp.sav:兩種破壞性試驗的持續(xù)時間。根據(jù)這個數(shù)據(jù),n1=30,n2=25。由SPSS輸出,得到
第四十四頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用twonp.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-2IndependentSamples。把變量(duration)選入TestVariableList;再把用1和2分類的變量type輸入到GroupingVariable,在DefineGroups輸入1和2。在TestType選中Kolmogorov-SmirnovZ。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第四十五頁,共七十五頁,編輯于2023年,星期四兩樣本W(wǎng)ald-Wolfowitz游程檢驗
Wald-Wolfowitz游程檢驗(Wald-Wolfowitzrunstest)和Kolmogorov-Smirnov檢驗都是看兩個樣本所代表的總體是否分布類似。但是所采取的方法不一樣。Wald-Wolfowitz游程檢驗把兩個樣本混合之后,按照大小次序排列,一個樣本的觀測值在一起的為一個游程。和單樣本的游程問題類似。可以由游程個數(shù)R看出兩個樣本在排序中是否隨機出現(xiàn)。由twonp.sav數(shù)據(jù),可以得到下面SPSS關(guān)于Wald-Wolfowitz游程檢驗的輸出:
第四十六頁,共七十五頁,編輯于2023年,星期四軟件使用:數(shù)據(jù)和前面一樣,只在TestType選Wald-Wolfowitzruns。
第四十七頁,共七十五頁,編輯于2023年,星期四Kruskal-Wallis關(guān)于多個樣本的秩和檢驗
這個檢驗的目的是看多個總體的位置參數(shù)是否一樣。方法和Wilcoxon-Mann-Whitney檢驗的思想類似。假定有k個總體。先把從這個k個總體來的樣本混合起來排序,記各個總體觀測值的秩之和為Ri,i=1,…,k。顯然如果這些Ri很不相同,就可以認為它們位置參數(shù)相同的零假設(shè)不妥(備選假設(shè)為各個位置參數(shù)不全相等)。第四十八頁,共七十五頁,編輯于2023年,星期四Kruskal-Wallis關(guān)于多個樣本的秩和檢驗
注意這里所說的位置參數(shù)是在下面意義上的qi;由于它在分布函數(shù)Fi(x)中可以和變元x相加成為F(x+qi)的樣子,所以稱qi為位置參數(shù)。形式上,假定這些樣本有連續(xù)分布F1,…,Fk,零假設(shè)為H0:F1=…=Fk,備選假設(shè)為Ha:Fi(x)=F(x+qi),i=1,…,k,這里F為某連續(xù)分布函數(shù),而且這些參數(shù)qi并不相等。Kruskal-Wallis檢驗統(tǒng)計量為
第四十九頁,共七十五頁,編輯于2023年,星期四Kruskal-Wallis關(guān)于多個樣本的秩和檢驗
公式中ni為第i個樣本量,而N為各個樣本量之和(總樣本量)。如果觀測值中有大小一樣的數(shù)值,這個公式會有稍微的變化。這個統(tǒng)計量在位置參數(shù)相同的零假設(shè)下有漸近的自由度為k-1的c2分布。Kruskal-Wallis檢驗僅僅要求各個總體變量有相似形狀的連續(xù)分布。第五十頁,共七十五頁,編輯于2023年,星期四數(shù)據(jù)house.sav:三個區(qū)域房價的數(shù)據(jù)
為了調(diào)查三個地區(qū)的房價是否類似,在每個地區(qū)抽樣,得到三個樣本量分別為20、30、25的房價樣本。利用SPSS軟件,很容易得到下面的檢驗結(jié)果:第五十一頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用house.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-KIndependentSamples。把變量(這里是price)選入TestVariable
List;再把數(shù)據(jù)中用1、2、3來分類的變量group輸入GroupingVariable,在DefineGroups輸入1、2、3。在下面TestType選中Kruskal-WallisH。點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第五十二頁,共七十五頁,編輯于2023年,星期四Jonckheere-Terpstra多樣本的秩檢驗
這個檢驗處理的問題和Kruskal-Wallis檢驗類似,零假設(shè)都是各個總體的位置參數(shù)相同,但這里的備選假設(shè)為各個總體的位置參數(shù)按升冪排列(如為降冪排列,可把總體編號顛倒順序即為升冪排列)。注意這里所說的位置參數(shù)和前面的Kruskal-Wallis檢驗中的位置參數(shù)意義一樣。Jonckheere-Terpstra檢驗先在每兩個樣本所有觀測值對之間比較,計算第i個樣本觀測值中小于第j個樣本觀測值的對子數(shù):第五十三頁,共七十五頁,編輯于2023年,星期四數(shù)據(jù)house.sav:三個區(qū)域房價的數(shù)據(jù)
很容易得到SPSS的Jonckheere-Terpstra檢驗結(jié)果輸出:
第五十四頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用house.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-KIndependentSamples。把變量(這里是price)選入TestVariableList;再把數(shù)據(jù)中用1、2、3來分類的變量group輸入GroupingVariable,在DefineGroups輸入1、2、3。在下面TestType選中Jonckheere-Terpstra。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可
第五十五頁,共七十五頁,編輯于2023年,星期四Brown-Mood中位數(shù)檢驗
在有數(shù)個獨立樣本的情況,希望知道它們的中位數(shù)是否相等。零假設(shè)是這些樣本所代表的總體的中位數(shù)相等。備選假設(shè)是這些中位數(shù)不全相等。假定有k個總體,ni為第i個樣本量;把所有樣本量之和記為N。先把從這個k個總體來的樣本混合起來排序,找出它們的中位數(shù)。再計算每個總體中小于該中位數(shù)的觀測值個數(shù)O1i,i=1,…,k,和每個總體中大于該中位數(shù)的觀測值個數(shù)O2i,i=1,…,k。這樣就形成了一個由元素Oij組成的2×k表。其列總和為ni,i=1,…,k;而兩個行總和為各樣本小于總中位數(shù)的觀測值總和:R1=O11+O12+…+O1k及各樣本大于總中位數(shù)的觀測值總和R2=O21+O22+…+O2k。這顯然是一個列聯(lián)表,可以用Pearsonc2統(tǒng)計量,即第五十六頁,共七十五頁,編輯于2023年,星期四house.sav數(shù)據(jù)這里第五十七頁,共七十五頁,編輯于2023年,星期四第五十八頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用house.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-KIndependentSamples。把變量(這里是price)選入TestVariableList;再把數(shù)據(jù)中用1、2、3來分類的變量group輸入GroupingVariable,在DefineGroups輸入1、2、3。在下面TestType選中Median。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可
第五十九頁,共七十五頁,編輯于2023年,星期四Friedman秩和檢驗
前面討論了兩因子試驗設(shè)計數(shù)據(jù)的方差分析,那里所用的F檢驗需要假定總體的分布為正態(tài)分布。有一種非參數(shù)方差分析方法,稱為Friedman(兩因子)秩和檢驗,或Friedman方差分析。它適用于兩個因子的各種水平的組合都有一個觀測值的情況。第六十頁,共七十五頁,編輯于2023年,星期四Friedman秩和檢驗
假定第一個因子有k個水平(稱為處理,treatment),第二個因子有b個水平(稱為區(qū)組);因此一共有k×b=kb個觀測值。這里之所以稱一個因子為處理,是因為這是我們想要看該因子各水平是否對試驗結(jié)果有顯著的不同(它的各個水平的觀測值也就是本小節(jié)的多個相關(guān)樣本)。而另一個因子稱為區(qū)組,不同的區(qū)組也可能對結(jié)果有影響。下面是一個例子。第六十一頁,共七十五頁,編輯于2023年,星期四數(shù)據(jù)fert.sav這里有三種肥料作為第一個因子(肥料因子)的三個水平;而四種土壤為第二個因子(土壤因子)的四個水平。感興趣于是否這三種肥料對于某作物的產(chǎn)量有區(qū)別。稱肥料因子為處理,而土壤因子為區(qū)組。數(shù)據(jù)在下表中(表中數(shù)字為相應組合的產(chǎn)量,單位公斤)。
肥料種類肥料A肥料B肥料C土壤類型土壤1224668土壤2253648土壤3182120土壤4111319第六十二頁,共七十五頁,編輯于2023年,星期四Friedman秩和檢驗
Friedman秩和檢驗是關(guān)于位置的,和Kruskal-Wallis檢驗類似,形式上,假定這些樣本有連續(xù)分布F1,…,Fk,零假設(shè)為H0:F1=…=Fk,備選假設(shè)為Ha:Fi(x)=F(x+qi),i=1,…,k,這里F為某連續(xù)分布函數(shù),而且這些參數(shù)qi并不相等。雖然這和以前的Kruskal-Wallis檢驗一樣,但是由于區(qū)組的影響,要首先在每一個區(qū)組中計算各個處理的秩;再把每一個處理在各區(qū)組中的秩相加.如果Rij表示在j個區(qū)組中第i個處理的秩。則秩按照處理而求得的和為
第六十三頁,共七十五頁,編輯于2023年,星期四Friedman秩和檢驗
這樣做的目的是在每個區(qū)組內(nèi)比較處理。例如,同個年齡段中比較藥品的療效比不分年齡來比較療效要合理;在同一個部位比較不同的材料要比混合起來比較要合理等等。這里要引進的Friedman統(tǒng)計量定義為第一個式子表明,如果各個處理很不一樣,和的平方就會很大,結(jié)果就顯著。第二個公式是為了計算方便而導出的。它有近似的(有k-1個自由度的)c2分布。
第六十四頁,共七十五頁,編輯于2023年,星期四fert.sav數(shù)據(jù)第六十五頁,共七十五頁,編輯于2023年,星期四SPSS軟件使用說明
使用fert.sav數(shù)據(jù)。選項為Analyze-NonparametricTests-KRelatedSamples。然后把變量(這里是a、b、c)選入TestVariableList。在下面TestType選中Friedman。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第六十六頁,共七十五頁,編輯于2023年,星期四Kendall協(xié)同系數(shù)檢驗在實踐中,常需要按照某些特別的性質(zhì)來多次對一些個體進行評估或排序;比如幾個(m個)評估機構(gòu)對一些(n個)學校進行排序。人們想要知道,這些機構(gòu)的不同結(jié)果是否一致。如果很不一致,則該評估多少有些隨機,意義不大。換句話說,這里想要檢驗的零假設(shè)是:這些對于不同學校的排序是不相關(guān)的或者是隨機的;而備選假設(shè)為:這些對不同學校的排序是正相關(guān)的或者是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年融資服務(wù)機構(gòu)擔保協(xié)議模板
- 2024年汽車維修保養(yǎng)服務(wù)協(xié)議細則
- 2024辣椒種苗供應及培育協(xié)議樣本
- 2024專用消防水池建設(shè)協(xié)議范本
- 2024年專屬個人投資協(xié)議樣本
- 2024年度保安服務(wù)外包協(xié)議樣本
- DB11∕T 1703-2019 口腔綜合治療臺水路消毒技術(shù)規(guī)范
- DB11∕T 1684-2019 城市軌道交通乘客信息系統(tǒng)測試規(guī)范
- 2024商業(yè)用地租賃及盈利共享協(xié)議
- 2024國家物流代理協(xié)議模板規(guī)范
- 當代世界經(jīng)濟與政治教案
- 超寬帶無線通信技術(shù)在無人機領(lǐng)域的應用
- 2024年度醫(yī)院中醫(yī)生殖科帶教計劃課件
- 部編版道德與法治五年級上冊中華民族一家親第一課時課件
- 智能制造系統(tǒng)的優(yōu)化與控制
- 中國銀聯(lián)行業(yè)報告
- 氣浮機使用說明書
- 《中國古代神話》教學課件
- 放射防護管理機構(gòu)
- 企業(yè)事業(yè)部制的決策與執(zhí)行
- 《電子工藝實習》課程中的思政元素:工程倫理與工匠精神的培養(yǎng)
評論
0/150
提交評論