




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第七章第七章SPSS非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)本章內(nèi)容7.1 單樣本的非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)7.2 兩獨(dú)立樣本的非參數(shù)檢驗(yàn)兩獨(dú)立樣本的非參數(shù)檢驗(yàn)7.3 多獨(dú)立樣本的非參數(shù)檢驗(yàn)多獨(dú)立樣本的非參數(shù)檢驗(yàn)7.4 兩配對(duì)樣本的非參數(shù)檢驗(yàn)兩配對(duì)樣本的非參數(shù)檢驗(yàn)7.5 多配對(duì)樣本的非參數(shù)檢驗(yàn)多配對(duì)樣本的非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn):非參數(shù)檢驗(yàn): (1)在總體分布)在總體分布未知未知或知道或知道甚少甚少的情況下,利用的情況下,利用樣本數(shù)據(jù)對(duì)總體樣本數(shù)據(jù)對(duì)總體分布形態(tài)分布形態(tài)等進(jìn)行推斷的方法。等進(jìn)行推斷的方法。 (2)推斷過(guò)程中)推斷過(guò)程中不涉及不涉及有關(guān)總體分布的有關(guān)總體分布的參數(shù)參數(shù)。7.1 單樣本的非參
2、數(shù)檢驗(yàn)1.目的:樣本來(lái)自總體的分布是否與某個(gè)已知的分布目的:樣本來(lái)自總體的分布是否與某個(gè)已知的分布相吻合?相吻合?繪制樣本數(shù)據(jù)的直方圖、繪制樣本數(shù)據(jù)的直方圖、pp圖、圖、QQ圖判斷圖判斷粗略粗略通過(guò)非參數(shù)檢驗(yàn)通過(guò)非參數(shù)檢驗(yàn)精確精確2.單樣本非參數(shù)檢驗(yàn)單樣本非參數(shù)檢驗(yàn)(1)對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷)對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷(2)方法:卡方檢驗(yàn)、二項(xiàng)分布檢驗(yàn)、)方法:卡方檢驗(yàn)、二項(xiàng)分布檢驗(yàn)、K-S檢驗(yàn)、檢驗(yàn)、變量值隨機(jī)性檢驗(yàn)等。變量值隨機(jī)性檢驗(yàn)等。7.1.1總體分布的卡方檢驗(yàn)1、基本思想的理論依據(jù):、基本思想的理論依據(jù): 如果從一個(gè)隨機(jī)變量如果從一個(gè)隨機(jī)變量X中隨機(jī)抽取若干個(gè)觀察中隨機(jī)
3、抽取若干個(gè)觀察樣本,這些觀察樣本落在樣本,這些觀察樣本落在X的的k個(gè)互不相交的子集個(gè)互不相交的子集中的觀察頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)中的觀察頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)k趨于無(wú)窮時(shí)近似服從卡方分布。基于這一思想,趨于無(wú)窮時(shí)近似服從卡方分布?;谶@一思想,對(duì)變量對(duì)變量X總體分布的檢驗(yàn)可從對(duì)各個(gè)觀察頻數(shù)的分總體分布的檢驗(yàn)可從對(duì)各個(gè)觀察頻數(shù)的分析入手。析入手。7.1.1總體分布的卡方檢驗(yàn)1.基本思想基本思想-吻合性檢驗(yàn)吻合性檢驗(yàn) (1)原假設(shè):樣本來(lái)自的總體分布與期望分布)原假設(shè):樣本來(lái)自的總體分布與期望分布無(wú)顯著無(wú)顯著差異。差異。 變量值落入第變量值落入第i個(gè)子集中的理論概率為個(gè)
4、子集中的理論概率為 ,相應(yīng)的期望頻率為,相應(yīng)的期望頻率為 ipinp期望頻數(shù),觀察頻數(shù),子集個(gè)數(shù),eiikiieiiffkkfff0210202) 1()(布無(wú)顯著差異自的總體分布與理論分不拒絕原假設(shè),樣本來(lái)值對(duì)應(yīng)的存在顯著差異的總體分布與理論分布拒絕原假設(shè),樣本來(lái)自值對(duì)應(yīng)的數(shù)分布差距越小觀測(cè)頻數(shù)分布與期望頻值越小數(shù)分布差距越大觀測(cè)頻數(shù)分布與期望頻值越大,2222pp二二.總體分布卡方檢驗(yàn)的應(yīng)用實(shí)例:總體分布卡方檢驗(yàn)的應(yīng)用實(shí)例: SPSS總體分布的卡方檢驗(yàn)對(duì)數(shù)據(jù)存放,需要總體分布的卡方檢驗(yàn)對(duì)數(shù)據(jù)存放,需要定義一個(gè)存放變量值的定義一個(gè)存放變量值的SPSS變量和一個(gè)存放各變變量和一個(gè)存放各變量值觀
5、測(cè)頻數(shù)的變量,并指定該變量為加權(quán)變量。量值觀測(cè)頻數(shù)的變量,并指定該變量為加權(quán)變量。2.實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟Analyze-Nonparametric Tests-Chi-Square(1)選定待檢驗(yàn)的變量到)選定待檢驗(yàn)的變量到Test Variable list(2)在)在Expected Range中確定參與分析的觀測(cè)值的范圍:中確定參與分析的觀測(cè)值的范圍:Get from data:所有觀測(cè)數(shù)據(jù)都參與分析所有觀測(cè)數(shù)據(jù)都參與分析use specified range:只在該取值范圍內(nèi)的觀測(cè)數(shù)據(jù)才參與:只在該取值范圍內(nèi)的觀測(cè)數(shù)據(jù)才參與分析。分析。(3)Expected values給出各理論值給出
6、各理論值A(chǔ)ll categories equal:所有子集的頻數(shù)都相同所有子集的頻數(shù)都相同value:依次輸入值,通過(guò):依次輸入值,通過(guò)add、change、remove進(jìn)行增加、修改和刪除。進(jìn)行增加、修改和刪除。(4)單擊單擊Options按鈕,在按鈕,在Statistics欄中選擇輸出統(tǒng)計(jì)量。欄中選擇輸出統(tǒng)計(jì)量。Descriptive 復(fù)選項(xiàng),指定輸出變量的均值、標(biāo)準(zhǔn)差、最大值、復(fù)選項(xiàng),指定輸出變量的均值、標(biāo)準(zhǔn)差、最大值、最小值、非缺失個(gè)體的數(shù)量。最小值、非缺失個(gè)體的數(shù)量。Quartiles復(fù)選項(xiàng),輸出四分位數(shù)。復(fù)選項(xiàng),輸出四分位數(shù)。(2)Missing Values 欄中選擇對(duì)缺失值的處
7、欄中選擇對(duì)缺失值的處理方式。理方式。Exclude case test-by-test 選項(xiàng),將參與對(duì)選項(xiàng),將參與對(duì)比中的缺失值排除。比中的缺失值排除。Exclude cases listwise 選項(xiàng),剔除任何變量選項(xiàng),剔除任何變量中所有含缺失值的樣品。中所有含缺失值的樣品。3.應(yīng)用案例醫(yī)學(xué)研究表明心臟病人猝死人數(shù)與日期的關(guān)系為:醫(yī)學(xué)研究表明心臟病人猝死人數(shù)與日期的關(guān)系為:一周內(nèi),星期一猝死者較多,其他日子基本相當(dāng),一周內(nèi),星期一猝死者較多,其他日子基本相當(dāng),各天的比例近似為:各天的比例近似為:2.8:1:1:1:1:1:1 根據(jù)根據(jù)“心臟病猝死心臟病猝死”數(shù)據(jù),推斷總體分布是否與理數(shù)據(jù),推
8、斷總體分布是否與理論分布相吻合。論分布相吻合。分析:分析:利用總體分布卡方檢驗(yàn)實(shí)現(xiàn)。利用總體分布卡方檢驗(yàn)實(shí)現(xiàn)。4.應(yīng)用練習(xí)擲一顆六面體擲一顆六面體300次,用數(shù)字型數(shù)據(jù)次,用數(shù)字型數(shù)據(jù)1、2、3、4、5、6分別代表六面的六個(gè)點(diǎn),試問(wèn)這顆六面體分別代表六面的六個(gè)點(diǎn),試問(wèn)這顆六面體是否均勻。是否均勻。1234564349564566417.1.2二項(xiàng)分布檢驗(yàn)在現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值是二值的,例如,在現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分為男性和女性,產(chǎn)品可以分為合格和不人群可以分為男性和女性,產(chǎn)品可以分為合格和不合格,學(xué)生可以分為三好學(xué)生和非三好學(xué)生。通常合格,學(xué)生可以分為三好學(xué)
9、生和非三好學(xué)生。通常將這樣的二值分別用將這樣的二值分別用1和和0表示。如果進(jìn)行表示。如果進(jìn)行n次相同次相同的實(shí)驗(yàn),則出現(xiàn)兩類(的實(shí)驗(yàn),則出現(xiàn)兩類(1或或0)的次數(shù)可以用離散型的次數(shù)可以用離散型隨機(jī)變量來(lái)描述。如果隨機(jī)變量值為隨機(jī)變量來(lái)描述。如果隨機(jī)變量值為1代表成功,代表成功,其概率設(shè)為其概率設(shè)為p,則隨機(jī)變量值為,則隨機(jī)變量值為0的概率的概率q便等于便等于1-p,則成功次數(shù)變量,則成功次數(shù)變量X的分布為二項(xiàng)分布。的分布為二項(xiàng)分布。7.1.2二項(xiàng)分布檢驗(yàn)1.基本思想基本思想(1)通過(guò)樣本數(shù)據(jù)檢驗(yàn)樣本來(lái)自的總體是否服從指定概率)通過(guò)樣本數(shù)據(jù)檢驗(yàn)樣本來(lái)自的總體是否服從指定概率p的二項(xiàng)分布。的二項(xiàng)分
10、布。(2)小樣本)小樣本-精確檢驗(yàn):計(jì)算精確檢驗(yàn):計(jì)算n次試驗(yàn)中某類出現(xiàn)的次數(shù)小次試驗(yàn)中某類出現(xiàn)的次數(shù)小于等于于等于x次的概率:次的概率:大樣本大樣本-近似檢驗(yàn)近似檢驗(yàn)inixiinqpCxXP05 . 025 . 02)1 (5 . 0時(shí)減時(shí)加nxnxpnpnpxZ2.實(shí)現(xiàn)步驟 Analyze-Nonparametric Tests-Binomial(1)選定待檢驗(yàn)的變量到)選定待檢驗(yàn)的變量到Test Variable list(2)define dichotomy中指定如何分類中指定如何分類get from data:檢驗(yàn)變量為二值變量:檢驗(yàn)變量為二值變量cut point:輸入具體數(shù)值,
11、小于等于該值的為第:輸入具體數(shù)值,小于等于該值的為第一組,大于該組的為第二組一組,大于該組的為第二組(3)Test proportion:輸入二項(xiàng)分布的檢驗(yàn):輸入二項(xiàng)分布的檢驗(yàn)概率值概率值3.應(yīng)用案例利用利用“產(chǎn)品合格率產(chǎn)品合格率”數(shù)據(jù),推斷該批產(chǎn)品的一級(jí)品數(shù)據(jù),推斷該批產(chǎn)品的一級(jí)品率是否為率是否為90%。分析:分析: 產(chǎn)品合格與否屬于二值變量,可以通過(guò)二項(xiàng)分布檢產(chǎn)品合格與否屬于二值變量,可以通過(guò)二項(xiàng)分布檢驗(yàn)實(shí)現(xiàn)。驗(yàn)實(shí)現(xiàn)。3.應(yīng)用練習(xí)1.擲一枚硬幣擲一枚硬幣31次,出現(xiàn)正面和反面在上的結(jié)果次,出現(xiàn)正面和反面在上的結(jié)果見(jiàn)下表,試問(wèn)這枚硬幣是否均勻。見(jiàn)下表,試問(wèn)這枚硬幣是否均勻。2.根據(jù)居民儲(chǔ)蓄存
12、款的數(shù)據(jù),分析儲(chǔ)戶對(duì)未來(lái)收入根據(jù)居民儲(chǔ)蓄存款的數(shù)據(jù),分析儲(chǔ)戶對(duì)未來(lái)收入的看法,檢驗(yàn)儲(chǔ)戶總體對(duì)收入持保守或悲觀態(tài)度的的看法,檢驗(yàn)儲(chǔ)戶總體對(duì)收入持保守或悲觀態(tài)度的比例是否與比例是否與0.4有顯著性差異。有顯著性差異。次次12345678910111213141516面面ABABBAAABBABBAAA次次171819202122232425262728293031面面BA BBABBABABBABA7.1.3單樣本K-S檢驗(yàn)1.基本思想基本思想(1)以俄羅斯數(shù)學(xué)家柯?tīng)柲绾退姑字Z夫名字命名)以俄羅斯數(shù)學(xué)家柯?tīng)柲绾退姑字Z夫名字命名(2)利用樣本數(shù)據(jù)推斷樣本來(lái)自的總體是否服從某一理論分布,)利用樣本
13、數(shù)據(jù)推斷樣本來(lái)自的總體是否服從某一理論分布,是一種是一種擬合優(yōu)度擬合優(yōu)度的檢驗(yàn)方法,適用于探索的檢驗(yàn)方法,適用于探索連續(xù)型連續(xù)型隨機(jī)變量的分布隨機(jī)變量的分布(3)步驟)步驟計(jì)算各樣本觀測(cè)值在理論分布中出現(xiàn)的計(jì)算各樣本觀測(cè)值在理論分布中出現(xiàn)的理論累計(jì)概率值理論累計(jì)概率值F(x)計(jì)算各樣本觀測(cè)值的計(jì)算各樣本觀測(cè)值的實(shí)際累計(jì)概率值實(shí)際累計(jì)概率值S(x) 計(jì)算理論累計(jì)概率值與實(shí)際累計(jì)概率值的計(jì)算理論累計(jì)概率值與實(shí)際累計(jì)概率值的差差D(x)計(jì)算差值序列中計(jì)算差值序列中最大絕對(duì)差值最大絕對(duì)差值D)()(max(, )()(max(max(:)()(max(1iiiiiixFxSxFxSDDDxFxSD修正
14、修正為:散值,可對(duì)由于實(shí)際累計(jì)概率為離(4)原假設(shè)成立時(shí):)原假設(shè)成立時(shí):小樣本下:小樣本下:Dkolmogorov分布分布大樣本下:大樣本下: 近似服從近似服從K(x)分布分布SPSS僅給出大樣本下的僅給出大樣本下的 和對(duì)應(yīng)的和對(duì)應(yīng)的p值值(5)決策)決策D統(tǒng)計(jì)量的統(tǒng)計(jì)量的p值值顯著性水平,不拒絕原假設(shè),樣本來(lái)顯著性水平,不拒絕原假設(shè),樣本來(lái)自的總體與指定分布無(wú)顯著差異自的總體與指定分布無(wú)顯著差異DnDn2.實(shí)現(xiàn)步驟Analyze-Nonparametric Tests-1-sample K-S(1)選定待檢驗(yàn)的變量到)選定待檢驗(yàn)的變量到Test Variable list(2)Test d
15、istribution:選擇理論分布選擇理論分布normal:正態(tài)分布正態(tài)分布uniform:均勻分布:均勻分布poisson:泊松分布:泊松分布exponential:指數(shù)分布:指數(shù)分布3.應(yīng)用案例利用利用“兒童身高兒童身高”數(shù)據(jù)分析周歲兒童身高總體是否數(shù)據(jù)分析周歲兒童身高總體是否服從正態(tài)分布。服從正態(tài)分布。分析:分析:可以通過(guò)單樣本可以通過(guò)單樣本K-S檢驗(yàn)實(shí)現(xiàn)。檢驗(yàn)實(shí)現(xiàn)。3.應(yīng)用練習(xí)1、利用存款儲(chǔ)蓄調(diào)查數(shù)據(jù),分析儲(chǔ)戶一次存款金、利用存款儲(chǔ)蓄調(diào)查數(shù)據(jù),分析儲(chǔ)戶一次存款金額的總體是否服從正態(tài)分布,并結(jié)合存款金額的額的總體是否服從正態(tài)分布,并結(jié)合存款金額的pp圖和圖和qq圖來(lái)分析。圖來(lái)分析。7.
16、1.4 變量值隨機(jī)性檢驗(yàn)1.基本思想基本思想(1)通過(guò)對(duì)樣本變量值的分析,實(shí)現(xiàn)對(duì)總體的變量值出)通過(guò)對(duì)樣本變量值的分析,實(shí)現(xiàn)對(duì)總體的變量值出現(xiàn)現(xiàn)是否隨機(jī)是否隨機(jī)進(jìn)行檢驗(yàn)。進(jìn)行檢驗(yàn)。(2)原假設(shè):總體變量值出現(xiàn)是隨機(jī)的。)原假設(shè):總體變量值出現(xiàn)是隨機(jī)的。 檢驗(yàn)依據(jù):游程檢驗(yàn)依據(jù):游程-樣本序列中連續(xù)出現(xiàn)相同的變量值樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)。的次數(shù)。 游程數(shù)太大或太小都表明變量值存在不隨機(jī)的現(xiàn)象游程數(shù)太大或太小都表明變量值存在不隨機(jī)的現(xiàn)象關(guān)于隨機(jī)性的游程檢驗(yàn)關(guān)于隨機(jī)性的游程檢驗(yàn)(run test)游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這兩個(gè)值的出
17、現(xiàn)是否是隨機(jī)的。假定下面是由兩個(gè)值的出現(xiàn)是否是隨機(jī)的。假定下面是由0和和1組成的一個(gè)這種變量的樣本:組成的一個(gè)這種變量的樣本:0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的其中相同的0(或相同的(或相同的1)在一起稱為一個(gè))在一起稱為一個(gè)游程(單獨(dú)的游程(單獨(dú)的0或或1也算)。也算)。這個(gè)數(shù)據(jù)中有這個(gè)數(shù)據(jù)中有4個(gè)個(gè)0組成的游程和組成的游程和3個(gè)個(gè)1組成的組成的游程。一共是游程。一共是R=7個(gè)游程。其中個(gè)游程。其中0的個(gè)數(shù)為的個(gè)數(shù)為m=15,而,而1的個(gè)數(shù)為的個(gè)數(shù)為n=10。 (3)檢驗(yàn)統(tǒng)計(jì)量)檢驗(yàn)統(tǒng)計(jì)量(4)決策:)決策:Z統(tǒng)計(jì)量的
18、統(tǒng)計(jì)量的p值值顯著性水平,不拒絕原假設(shè),變量值的出現(xiàn)是隨機(jī)的。顯著性水平,不拒絕原假設(shè),變量值的出現(xiàn)是隨機(jī)的。的個(gè)數(shù)出現(xiàn)的個(gè)數(shù),出現(xiàn):游程數(shù)01) 1()()2(22212122121212122121nnnnnnnnnnnnnnnnrrZrrrr關(guān)于隨機(jī)性的游程檢驗(yàn)(關(guān)于隨機(jī)性的游程檢驗(yàn)(run testrun test) 例 (run2.sav): 從某裝瓶機(jī)出來(lái)的30盒化妝品的重量如下(單位克) 當(dāng)然,游程檢驗(yàn)并不僅僅用于只取兩個(gè)值的變量,它還可以用于某個(gè)連續(xù)變量的取值小于某個(gè)值及大于該值的個(gè)數(shù)(類似于0和1的個(gè)數(shù))是否隨機(jī)的問(wèn)題??聪旅胬?。71.6 71.0 71.8 70.3 70
19、.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9為了看該裝瓶機(jī)是否工作正常,首先需要驗(yàn)證是否大于和小于中位數(shù)的個(gè)數(shù)是否是隨機(jī)的(零假設(shè)為這種個(gè)數(shù)的出現(xiàn)是隨機(jī)的)。 關(guān)于隨機(jī)性的游程檢驗(yàn)(關(guān)于隨機(jī)性的游程檢驗(yàn)(run testrun test) 如果把小于中位數(shù)的記為0,否則記為1,上面數(shù)據(jù)變成下面的01序列1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0
20、 0 0 0 0 0 1 1 0 這就歸為上面的問(wèn)題。當(dāng)然這里進(jìn)行這種變換只是為了易于理解。實(shí)際計(jì)算時(shí),用不著這種變換,計(jì)算機(jī)會(huì)自動(dòng)處理這個(gè)問(wèn)題的。直接利用這個(gè)數(shù)據(jù),通過(guò)SPSS,得到下面游程檢驗(yàn)結(jié)果的輸出。 2.實(shí)現(xiàn)步驟Analyze-Nonparametric Tests-Runs(1)選定待檢驗(yàn)的變量到)選定待檢驗(yàn)的變量到Test Variable list(2)cut point:計(jì)算游程數(shù)的分界值計(jì)算游程數(shù)的分界值median:樣本中位數(shù)為分界值:樣本中位數(shù)為分界值mode:樣本眾數(shù)為分界值:樣本眾數(shù)為分界值mean:樣本均值為分界值:樣本均值為分界值custom:以用戶輸入的值為分
21、界值,:以用戶輸入的值為分界值,SPSS將將小于該分界值的所有變量作為一組,大于或等于該小于該分界值的所有變量作為一組,大于或等于該分界值的所有變量作為一組,計(jì)算游程。分界值的所有變量作為一組,計(jì)算游程。3.應(yīng)用案例利用利用“電纜數(shù)據(jù)電纜數(shù)據(jù)”推斷耐壓設(shè)備的工作是否正常。推斷耐壓設(shè)備的工作是否正常。分析:分析:若耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的若耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的-則設(shè)備工作正常則設(shè)備工作正常若耐壓數(shù)據(jù)的變動(dòng)不是隨機(jī)的若耐壓數(shù)據(jù)的變動(dòng)不是隨機(jī)的-則設(shè)備工作存在不則設(shè)備工作存在不正常正??梢酝ㄟ^(guò)變量值隨機(jī)性檢驗(yàn)實(shí)現(xiàn)??梢酝ㄟ^(guò)變量值隨機(jī)性檢驗(yàn)實(shí)現(xiàn)。4.應(yīng)用練習(xí)擲硬幣擲硬幣20次得到的實(shí)驗(yàn)數(shù)據(jù),試問(wèn)硬幣實(shí)
22、驗(yàn)是否次得到的實(shí)驗(yàn)數(shù)據(jù),試問(wèn)硬幣實(shí)驗(yàn)是否是隨機(jī)的。是隨機(jī)的。110100011010111001107.2兩獨(dú)立樣本的非參數(shù)檢驗(yàn)(1)獨(dú)立樣本:在一個(gè)總體中隨機(jī)抽樣對(duì)在另一個(gè))獨(dú)立樣本:在一個(gè)總體中隨機(jī)抽樣對(duì)在另一個(gè)總體中隨機(jī)抽樣沒(méi)有影響的情況下所獲得的樣本??傮w中隨機(jī)抽樣沒(méi)有影響的情況下所獲得的樣本。(2)推斷樣本來(lái)自的兩個(gè)總體的)推斷樣本來(lái)自的兩個(gè)總體的分布分布等是否存在等是否存在顯顯著差異著差異。(3)方法:曼)方法:曼-惠特尼惠特尼U檢驗(yàn)、檢驗(yàn)、K-S檢驗(yàn)、檢驗(yàn)、W-W游游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)等。程檢驗(yàn)、極端反應(yīng)檢驗(yàn)等。秩(rank) 非參數(shù)檢驗(yàn)中秩是最常使用的概念。什么是非參數(shù)檢驗(yàn)中
23、秩是最常使用的概念。什么是一個(gè)數(shù)據(jù)的秩呢?一般來(lái)說(shuō),秩就是該數(shù)據(jù)一個(gè)數(shù)據(jù)的秩呢?一般來(lái)說(shuō),秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀測(cè)值的位置。例按照升冪排列之后,每個(gè)觀測(cè)值的位置。例如我們有下面數(shù)據(jù)如我們有下面數(shù)據(jù).Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。 秩(秩(rank) 利用秩的大小進(jìn)行推斷就避免了不知利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法了秩的性質(zhì);但
24、也有一些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。沒(méi)有涉及秩的性質(zhì)。 7.2.1兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)1.基本思想基本思想(1)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體分布無(wú)顯著差)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體分布無(wú)顯著差異。異。(2)通過(guò)兩組樣本)通過(guò)兩組樣本平均秩平均秩的研究實(shí)現(xiàn)推斷的研究實(shí)現(xiàn)推斷 秩秩-變量值排序的變量值排序的名次名次,變量值有幾個(gè),對(duì)應(yīng)的秩便有幾,變量值有幾個(gè),對(duì)應(yīng)的秩便有幾個(gè)。個(gè)。(3)檢驗(yàn)步驟)檢驗(yàn)步驟 將兩組樣本混合并升序排列,得每個(gè)數(shù)據(jù)的秩將兩組樣本混合并升序排列,得每個(gè)數(shù)據(jù)的秩 分別對(duì)樣本分別對(duì)樣本X和和Y的秩求平均,得平均秩的秩求平均,得平均秩 和和 計(jì)算樣本計(jì)算樣本X
25、優(yōu)于樣本優(yōu)于樣本Y秩的個(gè)數(shù)秩的個(gè)數(shù) 和樣本和樣本Y優(yōu)于樣本優(yōu)于樣本X秩的個(gè)數(shù)秩的個(gè)數(shù) 依據(jù)依據(jù) 和和 計(jì)算計(jì)算WilcoxonW統(tǒng)計(jì)量和曼統(tǒng)計(jì)量和曼-惠特尼惠特尼U統(tǒng)計(jì)量。統(tǒng)計(jì)量。iRmXWnYW1U2U1U2UWilcoxonW統(tǒng)計(jì)量:統(tǒng)計(jì)量:曼曼-惠特尼統(tǒng)計(jì)量惠特尼統(tǒng)計(jì)量U為:為:大樣本下,大樣本下,U近似服從正態(tài)分布近似服從正態(tài)分布值本值的為第一個(gè)變量值所在樣,則若,則若,則若WWWilconxonnmWWWilconxonnmWWWilconxonnmXY對(duì)應(yīng)樣本組的樣本個(gè)數(shù),WkWilcoxonWkkWUW) 1(21) 1(12121nmmmmnUZ值進(jìn)行決策統(tǒng)計(jì)量和大樣不下依據(jù)值
26、進(jìn)行決策統(tǒng)計(jì)量和小樣本下依據(jù)ppZU著差異自的兩總體的分布無(wú)顯不拒絕原假設(shè),樣本來(lái)著差異的兩總體的分布存在顯拒絕原假設(shè),樣本來(lái)自,pp7.2.2兩獨(dú)立樣本的K-S檢驗(yàn)1.基本思想基本思想(1)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)與單樣本)與單樣本K-S檢驗(yàn)的基本思路大體一致,差別在于:以檢驗(yàn)的基本思路大體一致,差別在于:以變變量值的秩量值的秩為分析對(duì)象,而非變量值本身。為分析對(duì)象,而非變量值本身。(3)檢驗(yàn)步驟)檢驗(yàn)步驟將兩組樣本混合并按升序排列將兩組樣本混合并按升序排列分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率分別計(jì)算兩組樣
27、本秩的累計(jì)頻數(shù)和累計(jì)頻率計(jì)算兩組累計(jì)頻率的差,得秩的差值序列及計(jì)算兩組累計(jì)頻率的差,得秩的差值序列及D統(tǒng)計(jì)量統(tǒng)計(jì)量,SPSS計(jì)算大樣本下的計(jì)算大樣本下的 和對(duì)應(yīng)的和對(duì)應(yīng)的p值值(3)決策:)決策: :拒絕原假設(shè),兩總體的分布有顯著差異:拒絕原假設(shè),兩總體的分布有顯著差異 :不拒絕原假設(shè),兩總體的分布無(wú)顯著差異:不拒絕原假設(shè),兩總體的分布無(wú)顯著差異 ppDn2.k-s檢驗(yàn)n將兩樣本混合并按升序排序n分別計(jì)算兩個(gè)樣本在相同點(diǎn)上的累計(jì)頻數(shù)和累計(jì)頻率n兩個(gè)累計(jì)頻率相減.n如果差距較小,則認(rèn)為兩總體分布無(wú)顯著差異應(yīng)保證有較大的樣本數(shù)7.2.3兩獨(dú)立樣本的游程檢驗(yàn)1.基本思想基本思想(1)原假設(shè):兩組獨(dú)立
28、樣本來(lái)自的兩總體的分布無(wú)顯著差異。)原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)檢驗(yàn)步驟)檢驗(yàn)步驟將兩組樣本混合并按升序排列,組標(biāo)記值也隨之重新排列將兩組樣本混合并按升序排列,組標(biāo)記值也隨之重新排列計(jì)算計(jì)算組標(biāo)記值序列組標(biāo)記值序列的游程數(shù)的游程數(shù),如果游程數(shù)較大如果游程數(shù)較大,則說(shuō)明是由于兩則說(shuō)明是由于兩類樣本數(shù)據(jù)充分混合的結(jié)果類樣本數(shù)據(jù)充分混合的結(jié)果,即即:認(rèn)為兩總體分布無(wú)顯著差異認(rèn)為兩總體分布無(wú)顯著差異.根據(jù)游程數(shù)計(jì)算根據(jù)游程數(shù)計(jì)算Z統(tǒng)計(jì)量,統(tǒng)計(jì)量,Z統(tǒng)計(jì)量近似服從正態(tài)分布統(tǒng)計(jì)量近似服從正態(tài)分布(3)決策:)決策: :拒絕原假設(shè),兩總體的分布有顯著差異:拒絕原假設(shè),兩總體的分布
29、有顯著差異 :不拒絕原假設(shè),兩總體的分布無(wú)顯著差異:不拒絕原假設(shè),兩總體的分布無(wú)顯著差異pp7.2.4極端反應(yīng)檢驗(yàn)1.基本思想基本思想(1)原假設(shè):兩獨(dú)立樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異。)原假設(shè):兩獨(dú)立樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異。(2)一組樣本為)一組樣本為控制樣本控制樣本,一組樣本為,一組樣本為實(shí)驗(yàn)樣本實(shí)驗(yàn)樣本,看實(shí)驗(yàn)樣本,看實(shí)驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。(3)檢驗(yàn)步驟)檢驗(yàn)步驟兩組樣本混合按升序排列兩組樣本混合按升序排列求控制樣本的最小秩求控制樣本的最小秩 和最大秩和最大秩 計(jì)算跨度計(jì)算跨度 為了消除樣本數(shù)據(jù)中的極端值,計(jì)算跨度前可
30、按比例(通常為了消除樣本數(shù)據(jù)中的極端值,計(jì)算跨度前可按比例(通常5%)去除控制樣本中靠近兩端的樣本值,再求跨度,得截)去除控制樣本中靠近兩端的樣本值,再求跨度,得截頭跨度頭跨度針對(duì)跨度或截頭跨度計(jì)算針對(duì)跨度或截頭跨度計(jì)算H統(tǒng)計(jì)量:統(tǒng)計(jì)量:minQmaxQ1minmaxQQS控制樣本的平均秩的秩,控制樣本在混合樣本中控制樣本的樣本數(shù),QQmQQHimii21)(小樣本下,小樣本下,H服從服從Hollander分布分布,大樣本下,大樣本下,H近似服從正態(tài)分布近似服從正態(tài)分布(4)決策:)決策:H統(tǒng)計(jì)量的統(tǒng)計(jì)量的p值值顯著性水平,不拒絕原假設(shè),兩獨(dú)立樣本來(lái)自顯著性水平,不拒絕原假設(shè),兩獨(dú)立樣本來(lái)自的
31、總體分布不存在顯著差異的總體分布不存在顯著差異7.2.5兩獨(dú)立樣本非參數(shù)檢驗(yàn)的步驟Analyze-Nonparametric Tests-2 independent samples(1)選擇待檢驗(yàn)的變量到)選擇待檢驗(yàn)的變量到Test variable list(2)grouping variable:存放組標(biāo)志的變量,存放組標(biāo)志的變量,并通過(guò)并通過(guò)define groups給出兩組的標(biāo)志值。給出兩組的標(biāo)志值。(3)test type:選擇相應(yīng)的檢驗(yàn)方法選擇相應(yīng)的檢驗(yàn)方法7.2.6兩獨(dú)立樣本非參數(shù)檢驗(yàn)的方法比較不同的分析方法對(duì)同批數(shù)據(jù)的分析不同的分析方法對(duì)同批數(shù)據(jù)的分析,其結(jié)論可能不盡相同。其結(jié)
32、論可能不盡相同。一方面說(shuō)明分析過(guò)程中對(duì)數(shù)據(jù)進(jìn)行反復(fù)探索是極為必要的一方面說(shuō)明分析過(guò)程中對(duì)數(shù)據(jù)進(jìn)行反復(fù)探索是極為必要的,另一方面也注意不同方法本身側(cè)重點(diǎn)的差異性。,另一方面也注意不同方法本身側(cè)重點(diǎn)的差異性。1、曼、曼-惠特尼惠特尼U檢驗(yàn)注重對(duì)分布的中心位置(平均水平)檢驗(yàn)注重對(duì)分布的中心位置(平均水平)作檢驗(yàn),實(shí)際上是檢驗(yàn)作檢驗(yàn),實(shí)際上是檢驗(yàn):兩樣本所對(duì)應(yīng)的總體具有相同的中兩樣本所對(duì)應(yīng)的總體具有相同的中心位置(中位數(shù))。若不能明確兩總體分布的形狀是否相心位置(中位數(shù))。若不能明確兩總體分布的形狀是否相同,則不宜單獨(dú)使用此方法。同,則不宜單獨(dú)使用此方法。2、K-S檢驗(yàn)用于兩總體分布是否存在顯著差異
33、性,對(duì)兩總檢驗(yàn)用于兩總體分布是否存在顯著差異性,對(duì)兩總體的全貌作檢查,即位置和分布形狀的差異性的檢驗(yàn)。體的全貌作檢查,即位置和分布形狀的差異性的檢驗(yàn)。3、游程檢驗(yàn)與、游程檢驗(yàn)與K-S檢驗(yàn)相似,也是對(duì)全貌作檢驗(yàn),但其功檢驗(yàn)相似,也是對(duì)全貌作檢驗(yàn),但其功效不如效不如K-S檢驗(yàn)。檢驗(yàn)。4、極端反應(yīng)檢驗(yàn)注重對(duì)分布范圍(變異程度)作檢驗(yàn),實(shí)、極端反應(yīng)檢驗(yàn)注重對(duì)分布范圍(變異程度)作檢驗(yàn),實(shí)際上是檢驗(yàn)兩樣本所對(duì)應(yīng)的總體具有相同的分布范圍,要際上是檢驗(yàn)兩樣本所對(duì)應(yīng)的總體具有相同的分布范圍,要求樣本足夠大。求樣本足夠大。7.2.7應(yīng)用案例利用利用“使用壽命使用壽命”數(shù)據(jù),判斷兩種工藝下產(chǎn)品的使數(shù)據(jù),判斷兩種工
34、藝下產(chǎn)品的使用壽命的分布是否存在顯著差異,進(jìn)而對(duì)兩個(gè)工藝用壽命的分布是否存在顯著差異,進(jìn)而對(duì)兩個(gè)工藝的優(yōu)劣進(jìn)行判斷。的優(yōu)劣進(jìn)行判斷。分析:分析: 兩個(gè)工藝產(chǎn)品的使用壽命可看作兩獨(dú)立樣本,可以兩個(gè)工藝產(chǎn)品的使用壽命可看作兩獨(dú)立樣本,可以通過(guò)曼通過(guò)曼-惠特尼惠特尼U檢驗(yàn)、檢驗(yàn)、K-S檢驗(yàn)、檢驗(yàn)、W-W游程檢驗(yàn)游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)實(shí)現(xiàn)。、極端反應(yīng)檢驗(yàn)實(shí)現(xiàn)。7.2.8應(yīng)用練習(xí)1、設(shè)有甲、乙兩種安眠藥,考慮比較它們的治療、設(shè)有甲、乙兩種安眠藥,考慮比較它們的治療效果,獨(dú)立觀察效果,獨(dú)立觀察20名患者。名患者。10人服甲藥,令人服甲藥,令10人服乙藥,睡眠延長(zhǎng)的時(shí)數(shù)見(jiàn)下表。試問(wèn)這兩種藥人服乙藥,睡眠延長(zhǎng)
35、的時(shí)數(shù)見(jiàn)下表。試問(wèn)這兩種藥物的療效有無(wú)顯著性差異。物的療效有無(wú)顯著性差異。2、利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶的、利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶的存款金額的分布進(jìn)行比較分析。存款金額的分布進(jìn)行比較分析。服甲藥睡眠延長(zhǎng)時(shí)數(shù)服甲藥睡眠延長(zhǎng)時(shí)數(shù)3.4服乙藥睡眠延長(zhǎng)時(shí)數(shù)服乙藥睡眠延長(zhǎng)時(shí)數(shù)0.7-1.6-0.2-1.2-0.80.02.07.3多獨(dú)立樣本的非參數(shù)檢驗(yàn)1.通過(guò)分析多組獨(dú)立樣本數(shù)據(jù),推斷樣本來(lái)自的多個(gè)通過(guò)分析多組獨(dú)立樣本數(shù)據(jù),推斷樣本來(lái)自的多個(gè)總體的總體的中位數(shù)中位數(shù)或或分布分布是否存在顯著差異。是否存在顯
36、著差異。2.方法:中位數(shù)檢驗(yàn)、方法:中位數(shù)檢驗(yàn)、Kruskal-Wallis檢驗(yàn)、檢驗(yàn)、Jonckheere-Terpstra檢驗(yàn)。檢驗(yàn)。7.3.1中位數(shù)檢驗(yàn)1.基本思想基本思想(1)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著差異。差異。(2)檢驗(yàn)步驟)檢驗(yàn)步驟將多組樣本混合升序排列,求混合樣本的將多組樣本混合升序排列,求混合樣本的中位數(shù)中位數(shù)分別計(jì)算各組樣本中大于和小于中位數(shù)的樣本個(gè)數(shù),形成列分別計(jì)算各組樣本中大于和小于中位數(shù)的樣本個(gè)數(shù),形成列聯(lián)表(聯(lián)表(p230 表表7-13)利用卡方檢驗(yàn)分析各組樣本來(lái)自的總體對(duì)中位數(shù)的分布是否利用卡
37、方檢驗(yàn)分析各組樣本來(lái)自的總體對(duì)中位數(shù)的分布是否一致。一致。)1() 12()(21202nfffrikjeijeijij(3)決策)決策卡方統(tǒng)計(jì)量的卡方統(tǒng)計(jì)量的p值值顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的總體的中位數(shù)不存在顯著差異。樣本來(lái)自的總體的中位數(shù)不存在顯著差異。7.3.2多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)1.基本思想基本思想(1)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異。)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異。(2)是兩獨(dú)立樣本曼)是兩獨(dú)立樣本曼-惠特尼惠特尼U檢驗(yàn)的推廣檢驗(yàn)的推廣(3)檢驗(yàn)步驟)檢驗(yàn)步驟將多組樣
38、本數(shù)據(jù)將多組樣本數(shù)據(jù)混合并升序混合并升序排列,求各變量的秩排列,求各變量的秩考察各組考察各組秩的均值秩的均值是否有顯著差異是否有顯著差異各組秩的差異借助各組秩的差異借助方差分析方差分析:秩的變差分解為:組間差和組內(nèi)差:秩的變差分解為:組間差和組內(nèi)差 a若秩的總變差大部分可由組間差解釋,則各樣本組的總體分布若秩的總變差大部分可由組間差解釋,則各樣本組的總體分布存在顯著差異存在顯著差異 b若秩的總變差大部分不能由組間差解釋,則各樣本組的總體分若秩的總變差大部分不能由組間差解釋,則各樣本組的總體分布無(wú)顯著差異布無(wú)顯著差異構(gòu)造構(gòu)造K-W統(tǒng)計(jì)量統(tǒng)計(jì)量(4)決策:)決策:SPSS自動(dòng)計(jì)算自動(dòng)計(jì)算K-W統(tǒng)計(jì)
39、量和對(duì)應(yīng)的統(tǒng)計(jì)量和對(duì)應(yīng)的p值值 p值值顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布無(wú)顯著差異。的多個(gè)總體分布無(wú)顯著差異??偲骄冉M的平均秩第各樣本組的樣本個(gè)數(shù)總樣本個(gè)數(shù),樣本組數(shù),即可)較大,通常大于秩總平方和的平均秩的組間平方和,21,3)(1()() 1(1222NRinRRnNkkkRRnNNWKiiiiikii7.3.3多獨(dú)立樣本的Jonckheere-Terpstra檢驗(yàn)1.基本思想基本思想(1)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異)原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異(2)J-T統(tǒng)計(jì)量統(tǒng)計(jì)量組樣本的樣
40、本個(gè)數(shù)第樣本組數(shù),統(tǒng)計(jì)量,觀測(cè)的布,其檢驗(yàn)統(tǒng)計(jì)量為:統(tǒng)計(jì)量近似服從正態(tài)分大樣本下,組樣本觀察值的個(gè)數(shù)組樣本觀察值小于第第inkTJJnnNNnNJZTJjiUUTJiikiikiiijjiij72)32()32(4/ )(122122(3)決策:)決策:SPSS自動(dòng)計(jì)算自動(dòng)計(jì)算J-T統(tǒng)計(jì)量,統(tǒng)計(jì)量,Z統(tǒng)計(jì)量和對(duì)應(yīng)的統(tǒng)計(jì)量和對(duì)應(yīng)的p值值 p值值顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總顯著性水平,不拒絕原假設(shè),多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體分布無(wú)顯著差異。體分布無(wú)顯著差異。7.3.4多獨(dú)立樣本非參數(shù)檢驗(yàn)的步驟1.按規(guī)定的格式組織數(shù)據(jù):按規(guī)定的格式組織數(shù)據(jù):設(shè)置設(shè)置兩個(gè)兩個(gè)變量分別存放變量分別
41、存放樣本值樣本值和和組標(biāo)記值組標(biāo)記值2.菜單:菜單:Analyze-Nonparametric Tests-K independent samples(1)選擇待檢驗(yàn)的變量到)選擇待檢驗(yàn)的變量到Test variable list(2)grouping variable:存放組標(biāo)志的變量,并通過(guò)存放組標(biāo)志的變量,并通過(guò)define groups給出標(biāo)志值的取值范圍。給出標(biāo)志值的取值范圍。(3)test type:選擇相應(yīng)的檢驗(yàn)方法選擇相應(yīng)的檢驗(yàn)方法7.3.5 應(yīng)用案例利用利用“多城市兒童身高多城市兒童身高”數(shù)據(jù),對(duì)北京、上海、成數(shù)據(jù),對(duì)北京、上海、成都、廣州四城市的周歲兒童身高進(jìn)行比較分析,推
42、都、廣州四城市的周歲兒童身高進(jìn)行比較分析,推斷四城市周歲兒童身高是否存在顯著差異。斷四城市周歲兒童身高是否存在顯著差異。分析:分析:(1)對(duì)身高分布無(wú)確切把握,涉及多個(gè)獨(dú)立樣本采)對(duì)身高分布無(wú)確切把握,涉及多個(gè)獨(dú)立樣本采采用多獨(dú)立樣非參數(shù)檢驗(yàn)采用多獨(dú)立樣非參數(shù)檢驗(yàn)(2)分別用中位數(shù)檢驗(yàn)、多獨(dú)立樣本的)分別用中位數(shù)檢驗(yàn)、多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)、多獨(dú)立樣本的檢驗(yàn)、多獨(dú)立樣本的Jonckheere-Terpstra檢驗(yàn)實(shí)現(xiàn)。檢驗(yàn)實(shí)現(xiàn)。7.4兩配對(duì)樣本的非參數(shù)檢驗(yàn)1.通過(guò)兩配對(duì)樣本推斷樣本來(lái)自的兩個(gè)總體的分布通過(guò)兩配對(duì)樣本推斷樣本來(lái)自的兩個(gè)總體的分布是否存在顯著差異。是否存在顯著
43、差異。2 . 方 法 :方 法 : M c N e m a r 檢 驗(yàn) 、 符 號(hào) 檢 驗(yàn) 、檢 驗(yàn) 、 符 號(hào) 檢 驗(yàn) 、Wilcoxon符號(hào)秩檢驗(yàn)。符號(hào)秩檢驗(yàn)。7.4.1兩配對(duì)樣本的McNemar檢驗(yàn)1.基本思想基本思想(1) McNemar檢驗(yàn)是一種檢驗(yàn)是一種變化顯著性變化顯著性檢驗(yàn),將研究對(duì)象自身檢驗(yàn),將研究對(duì)象自身作為對(duì)照者檢驗(yàn)其作為對(duì)照者檢驗(yàn)其“前后前后”的變化是否顯著。的變化是否顯著。(2)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。(3)分析的變量是)分析的變量是二值變量二值變量,若不是二值變量,應(yīng)現(xiàn)將數(shù)據(jù)轉(zhuǎn)換,若不是二值變
44、量,應(yīng)現(xiàn)將數(shù)據(jù)轉(zhuǎn)換后再使用。導(dǎo)致該方法的應(yīng)用范圍具有局限性。后再使用。導(dǎo)致該方法的應(yīng)用范圍具有局限性。(4) McNemar檢驗(yàn)采用檢驗(yàn)采用二項(xiàng)分布檢驗(yàn)二項(xiàng)分布檢驗(yàn)方法,小樣本下計(jì)算二方法,小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量。統(tǒng)計(jì)量。(5)SPSS自動(dòng)計(jì)算自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的統(tǒng)計(jì)量和對(duì)應(yīng)的p值值 p值值顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異分布無(wú)顯著差異7.4.2兩配對(duì)樣本的符號(hào)檢驗(yàn)1.基本思想基本思想(1)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差
45、異。)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)利用)利用正負(fù)符號(hào)的個(gè)數(shù)正負(fù)符號(hào)的個(gè)數(shù)實(shí)現(xiàn)檢驗(yàn)。實(shí)現(xiàn)檢驗(yàn)。(3)檢驗(yàn)步驟)檢驗(yàn)步驟分別用第二組樣本的各觀察值減第一組對(duì)應(yīng)樣本觀察值,差值為正記為分別用第二組樣本的各觀察值減第一組對(duì)應(yīng)樣本觀察值,差值為正記為+,差值為負(fù)記為,差值為負(fù)記為-將將+的個(gè)數(shù)與的個(gè)數(shù)與-的個(gè)數(shù)進(jìn)行比較:采用二項(xiàng)分布檢驗(yàn)法,對(duì)的個(gè)數(shù)進(jìn)行比較:采用二項(xiàng)分布檢驗(yàn)法,對(duì)正負(fù)符號(hào)變量正負(fù)符號(hào)變量進(jìn)行單樣本二項(xiàng)分布檢驗(yàn)。進(jìn)行單樣本二項(xiàng)分布檢驗(yàn)。小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量統(tǒng)計(jì)量(4)S
46、PSS自動(dòng)計(jì)算自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的統(tǒng)計(jì)量和對(duì)應(yīng)的p值值 p值值顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異著差異(4)缺陷:缺陷:兩配對(duì)樣本的符號(hào)檢驗(yàn)注重對(duì)兩配對(duì)樣本的符號(hào)檢驗(yàn)注重對(duì)變化方向變化方向的分析,只考慮了數(shù)的分析,只考慮了數(shù)據(jù)變化的性質(zhì),據(jù)變化的性質(zhì),沒(méi)有考慮變化的幅度沒(méi)有考慮變化的幅度,對(duì)數(shù)據(jù)的利用不夠充分。,對(duì)數(shù)據(jù)的利用不夠充分。7.4.3兩配對(duì)樣本W(wǎng)ilcoxon符號(hào)秩檢驗(yàn)1.基本思想基本思想(1)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。)原假設(shè):兩配對(duì)樣本來(lái)自的兩總體的分布無(wú)顯著差異。(2)
47、檢驗(yàn)步驟)檢驗(yàn)步驟分別用第二組樣本的各觀察值減第一組對(duì)應(yīng)樣本觀察值,分別用第二組樣本的各觀察值減第一組對(duì)應(yīng)樣本觀察值,差值為正記為差值為正記為+,差值為負(fù)記為,差值為負(fù)記為-,并保持差值數(shù)據(jù),并保持差值數(shù)據(jù)將差值變量按升序排列,并求差值變量的秩將差值變量按升序排列,并求差值變量的秩分別計(jì)算正號(hào)秩總和分別計(jì)算正號(hào)秩總和 負(fù)號(hào)秩總和負(fù)號(hào)秩總和 統(tǒng)計(jì)量統(tǒng)計(jì)量24) 12)(1(4/ ) 1(),min(nnnnnWZZWWilcoxonWWW統(tǒng)計(jì)量構(gòu)造大樣本下利用符號(hào)秩分布小樣本下檢驗(yàn)統(tǒng)計(jì)量WW(3)決策:)決策:SPSS自動(dòng)計(jì)算自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的統(tǒng)計(jì)量和對(duì)應(yīng)的p值值 p值值顯著性水平,不拒絕
48、原假設(shè),兩配對(duì)樣本來(lái)自的兩總顯著性水平,不拒絕原假設(shè),兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異體分布無(wú)顯著差異7.4.4兩配對(duì)樣本非參數(shù)檢驗(yàn)的步驟1.按規(guī)定的格式組織數(shù)據(jù):按規(guī)定的格式組織數(shù)據(jù):設(shè)置設(shè)置兩個(gè)變量?jī)蓚€(gè)變量分別存放兩組樣本的樣本值分別存放兩組樣本的樣本值2.菜單:菜單:Analyze-Nonparametric Tests-2 related samples(1)選擇待檢驗(yàn)的兩個(gè)配對(duì)變量到)選擇待檢驗(yàn)的兩個(gè)配對(duì)變量到Test pairs list(2)test type:選擇相應(yīng)的檢驗(yàn)方法選擇相應(yīng)的檢驗(yàn)方法7.4.5應(yīng)用案例1.利用利用“統(tǒng)計(jì)學(xué)習(xí)統(tǒng)計(jì)學(xué)習(xí)”數(shù)據(jù),分析學(xué)生在學(xué)習(xí)數(shù)據(jù),分析
49、學(xué)生在學(xué)習(xí)“統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)”課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知程度是否發(fā)生了課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變。顯著改變。分析:分析:(1)統(tǒng)計(jì)學(xué)習(xí)前后,屬于配對(duì)樣本)統(tǒng)計(jì)學(xué)習(xí)前后,屬于配對(duì)樣本(2)認(rèn)知程度屬二值變量)認(rèn)知程度屬二值變量(3)可以采用兩配對(duì)樣本)可以采用兩配對(duì)樣本McNemar檢驗(yàn)檢驗(yàn)2.利用利用“訓(xùn)練成績(jī)訓(xùn)練成績(jī)”數(shù)據(jù),分析新訓(xùn)練方法是否有數(shù)據(jù),分析新訓(xùn)練方法是否有助于提高跳遠(yuǎn)運(yùn)動(dòng)員的成績(jī)。助于提高跳遠(yuǎn)運(yùn)動(dòng)員的成績(jī)。分析:分析: (1)新訓(xùn)練方法使用前后,屬于配對(duì)樣本)新訓(xùn)練方法使用前后,屬于配對(duì)樣本 (2)可采用兩配對(duì)樣本的符號(hào)檢驗(yàn)、兩配對(duì)樣本)可采用兩配對(duì)樣本的
50、符號(hào)檢驗(yàn)、兩配對(duì)樣本W(wǎng)ilcoxon符號(hào)秩檢驗(yàn)實(shí)現(xiàn)。符號(hào)秩檢驗(yàn)實(shí)現(xiàn)。7.5多配對(duì)樣本的非參數(shù)檢驗(yàn)1.通過(guò)多組配對(duì)樣本推斷樣本來(lái)自的多個(gè)總體的通過(guò)多組配對(duì)樣本推斷樣本來(lái)自的多個(gè)總體的中中位數(shù)位數(shù)或或分布分布是否存在顯著差異。是否存在顯著差異。2.方法:方法:Friedman檢驗(yàn)、檢驗(yàn)、Cochran Q檢驗(yàn)、檢驗(yàn)、Kendall協(xié)同系數(shù)檢驗(yàn)。協(xié)同系數(shù)檢驗(yàn)。7.5.1多配對(duì)樣本的Friedman檢驗(yàn)1.基本思想基本思想(1)原假設(shè):多個(gè)配對(duì)樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異。)原假設(shè):多個(gè)配對(duì)樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異。(2)原理)原理利用利用秩秩,通過(guò)類似,通過(guò)類似方差分析方差分析的方法
51、實(shí)現(xiàn)檢驗(yàn)的方法實(shí)現(xiàn)檢驗(yàn)若不同樣本下的秩不存在顯著差異,則秩的組間差在秩的總平若不同樣本下的秩不存在顯著差異,則秩的組間差在秩的總平均變差中占較小的比例。均變差中占較小的比例。(3)檢驗(yàn)步驟)檢驗(yàn)步驟以行為單位將數(shù)據(jù)升序排列,并求各變量在各自行中的秩以行為單位將數(shù)據(jù)升序排列,并求各變量在各自行中的秩分別計(jì)算各組樣本下的秩總和的平均秩分別計(jì)算各組樣本下的秩總和的平均秩計(jì)算計(jì)算Frideman檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量Frideman檢驗(yàn)統(tǒng)計(jì)量與多獨(dú)立樣本的檢驗(yàn)統(tǒng)計(jì)量與多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)中的檢驗(yàn)中的K-W統(tǒng)計(jì)量相似,區(qū)別在于:統(tǒng)計(jì)量相似,區(qū)別在于:K-W統(tǒng)計(jì)量中的秩是全體數(shù)據(jù)排序后得到的,統(tǒng)計(jì)量中的秩是全體數(shù)據(jù)排序后得到的,F(xiàn)rideman檢驗(yàn)統(tǒng)計(jì)量的秩是在檢驗(yàn)統(tǒng)計(jì)量的秩是在各區(qū)組內(nèi)分別獨(dú)立排各區(qū)組內(nèi)分別獨(dú)立排序得到的。序得到的。個(gè)樣本的平均秩第配對(duì)樣本個(gè)數(shù)樣本數(shù),iRknkkRkknFridemanikii) 1()21() 1(12221(4)決策:)決策:SP
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程給排水分包合同
- 有關(guān)工業(yè)品買賣合同集錦10篇-買賣合同8篇
- 事業(yè)單位編外工作人員的合同
- 企業(yè)市場(chǎng)營(yíng)銷策略與技術(shù)文檔
- 倉(cāng)庫(kù)合同租賃協(xié)議
- 弱電智能化勞務(wù)分包合同
- 建筑安裝工程建筑承包協(xié)議書(shū)
- 喂食車租賃合同8篇
- 2025年毫州貨運(yùn)從業(yè)資格證模擬考試題庫(kù)
- 聯(lián)合經(jīng)營(yíng)企業(yè)合同8篇
- 2023對(duì)口升學(xué)計(jì)算機(jī)組裝試卷答案
- 小學(xué)中小學(xué)校園足球人教三年級(jí)全一冊(cè)踢球技術(shù)小學(xué)體育三年級(jí)足球腳內(nèi)側(cè)踢球教案
- 學(xué)校危險(xiǎn)化學(xué)品自查記錄表
- 三菱gx developer用戶操作手冊(cè)
- 家譜樹(shù)形圖模板
- 工程交付培訓(xùn)記錄表
- 髖膝關(guān)節(jié)置換術(shù)后X線評(píng)價(jià)-PPT課件
- 蓋梁抱箍法施工計(jì)算書(shū)蓋梁抱箍法施工方案
- JIS G4305-2021 冷軋不銹鋼板材、薄板材和帶材
- (完整版)涼亭施工方案
- 第一章 - 免疫規(guī)劃信息管理系統(tǒng)
評(píng)論
0/150
提交評(píng)論