信息分析與決策Chapert抽樣與統(tǒng)計推斷非參數(shù)檢驗_第1頁
信息分析與決策Chapert抽樣與統(tǒng)計推斷非參數(shù)檢驗_第2頁
信息分析與決策Chapert抽樣與統(tǒng)計推斷非參數(shù)檢驗_第3頁
信息分析與決策Chapert抽樣與統(tǒng)計推斷非參數(shù)檢驗_第4頁
信息分析與決策Chapert抽樣與統(tǒng)計推斷非參數(shù)檢驗_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四章第四章 樣本數(shù)據(jù)的統(tǒng)計分析樣本數(shù)據(jù)的統(tǒng)計分析非參數(shù)檢驗非參數(shù)檢驗 在數(shù)據(jù)分析過程中,由于多種原因,在數(shù)據(jù)分析過程中,由于多種原因,人們往往無法對總體分布形態(tài)作簡單假人們往往無法對總體分布形態(tài)作簡單假設(shè),但卻希望能從樣本數(shù)據(jù)中獲得盡可設(shè),但卻希望能從樣本數(shù)據(jù)中獲得盡可能多的信息。這種情況下,能多的信息。這種情況下,在總體分布在總體分布未知或知之甚少的情況下,未知或知之甚少的情況下,利用樣本數(shù)利用樣本數(shù)據(jù)據(jù)對總體分布形態(tài)進(jìn)行推斷對總體分布形態(tài)進(jìn)行推斷的方法。的方法。單樣本的參數(shù)檢驗單樣本的參數(shù)檢驗 拿到一批樣本數(shù)據(jù)后,往往希望了解拿到一批樣本數(shù)據(jù)后,往往希望了解樣本來自的總體分布是否與某個已

2、知的樣本來自的總體分布是否與某個已知的理論分布相吻和。理論分布相吻和。SPSS單樣本非參數(shù)檢驗單樣本非參數(shù)檢驗正是對單個總體的分布形態(tài)進(jìn)行推斷的正是對單個總體的分布形態(tài)進(jìn)行推斷的方法方法。主要介紹以下兩種檢驗方法包括:。主要介紹以下兩種檢驗方法包括:u 卡方檢驗卡方檢驗 u K-S檢驗檢驗 卡方檢驗卡方檢驗卡方檢驗卡方檢驗解決以下類似問題:解決以下類似問題:Ex: 醫(yī)學(xué)家研究心臟病人猝死人數(shù)與日期醫(yī)學(xué)家研究心臟病人猝死人數(shù)與日期的關(guān)系時發(fā)現(xiàn),一周之中周一心臟病人的關(guān)系時發(fā)現(xiàn),一周之中周一心臟病人猝死者較多,其他日子則相當(dāng)。每周的猝死者較多,其他日子則相當(dāng)。每周的比例近似為比例近似為2.8:1:

3、1:1:1:1:1?,F(xiàn)收集到心現(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),需要臟病人死亡日期的樣本數(shù)據(jù),需要推斷推斷其總體分布是否與上述理論分布相吻合其總體分布是否與上述理論分布相吻合?卡方檢驗卡方檢驗 卡方檢驗分布推斷卡方檢驗分布推斷總體分布總體分布與與期望期望分布分布或某一或某一理論分布理論分布之間是否存在顯著之間是否存在顯著差異。為吻合性分布檢測,通常差異。為吻合性分布檢測,通常適用于適用于多項分類值總體分布的分析多項分類值總體分布的分析。一般其零。一般其零假設(shè)為:假設(shè)為:H0: 總體分布與理論分布無顯著差異??傮w分布與理論分布無顯著差異??ǚ綑z驗卡方檢驗Ex:為研究心臟病人猝死人數(shù)與日期的:為

4、研究心臟病人猝死人數(shù)與日期的關(guān)系,收集到關(guān)系,收集到168個觀察數(shù)據(jù)。統(tǒng)計樣本個觀察數(shù)據(jù)。統(tǒng)計樣本數(shù)據(jù),周一至周日的的死亡人數(shù)依次數(shù)據(jù),周一至周日的的死亡人數(shù)依次為為:55,23,18,11,26,20,15. 現(xiàn)利用這批數(shù)現(xiàn)利用這批數(shù)據(jù)推斷總體分布是否為理論值據(jù)推斷總體分布是否為理論值2.8:1:1:1:1:1:1。 這類這類問題變量往往問題變量往往 為離為離散數(shù)據(jù)散數(shù)據(jù)??ǚ綑z驗卡方檢驗Data: “(非參數(shù)檢驗非參數(shù)檢驗)心臟病猝死心臟病猝死”Command: AnalyzeNonparametric Tests Chi-Square Expected Values 框中給出各個框中給出

5、各個pi的值。的值。All categories equal 表示所有表示所有pi都相同,都相同,即期望分布為均勻分即期望分布為均勻分布;布;Value框中依次框中依次輸入輸入pi.卡方檢驗卡方檢驗觀察值觀察值按照理論分布,按照理論分布,168人人一周內(nèi)每天死亡的期一周內(nèi)每天死亡的期望頻數(shù)。望頻數(shù)??ǚ浇y(tǒng)計量為卡方統(tǒng)計量為7.757,對,對應(yīng)的概率值為應(yīng)的概率值為0.2560.05, 不能拒絕原不能拒絕原假設(shè)。即總體分布與理假設(shè)。即總體分布與理論分布無顯著差異。論分布無顯著差異??ǚ綑z驗卡方檢驗卡方檢驗的基本理論依據(jù)卡方檢驗的基本理論依據(jù): 如果從一個隨機(jī)變量如果從一個隨機(jī)變量X中隨機(jī)抽取若干

6、中隨機(jī)抽取若干個觀察樣本,這些觀察樣本落在個觀察樣本,這些觀察樣本落在X的的k個互不個互不相交的子集中的觀察頻數(shù)服從一個多項分布,相交的子集中的觀察頻數(shù)服從一個多項分布,這個多項分布當(dāng)這個多項分布當(dāng)k趨于無窮時近似趨于無窮時近似服從卡方分服從卡方分布布。 基于這一思想,對變量基于這一思想,對變量X總體分布的研總體分布的研究就可從究就可從對各個觀察頻數(shù)對各個觀察頻數(shù)的分析入手。的分析入手。卡方檢驗卡方檢驗 觀察頻數(shù)觀察頻數(shù)期望頻數(shù)期望頻數(shù)K-S檢驗檢驗 K-S檢驗檢驗是以俄羅斯科學(xué)家是以俄羅斯科學(xué)家Kolmogorov-Smirnov命名的一種非參數(shù)命名的一種非參數(shù)檢驗方法。該方法利用樣本數(shù)據(jù)推

7、斷樣檢驗方法。該方法利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布,本來自的總體是否服從某一理論分布,適用于探索連續(xù)型隨機(jī)變量的分布。適用于探索連續(xù)型隨機(jī)變量的分布。K-S檢驗檢驗例如,例如,u收集一批周歲兒童身高的樣本數(shù)據(jù),收集一批周歲兒童身高的樣本數(shù)據(jù),利用樣本數(shù)據(jù)推斷周歲兒童總體的身高利用樣本數(shù)據(jù)推斷周歲兒童總體的身高是否是否服從正態(tài)分布服從正態(tài)分布。u 采集收費站過車的流量,推斷是否服采集收費站過車的流量,推斷是否服從從泊松分布泊松分布。K-S 檢驗檢驗零假設(shè)零假設(shè)H0: 總體與指定的理論分布無顯著總體與指定的理論分布無顯著差異。差異。SPSS可以檢測的分布包括:可以檢測的分布包括

8、:K-S 檢檢 驗驗K-S檢驗的基本原理及統(tǒng)計量檢驗的基本原理及統(tǒng)計量u 零假設(shè)前提下,計算各樣本觀測值在零假設(shè)前提下,計算各樣本觀測值在理論分布中出現(xiàn)的理論分布中出現(xiàn)的理論累計概率值理論累計概率值F(x)。u計算樣本觀察值的計算樣本觀察值的實際累計概率值實際累計概率值S(x)u計算實際計算實際累計概率值與理論累計概率累計概率值與理論累計概率值的差值的差D(x).K-S 檢驗檢驗 K-S 檢驗檢驗Ex1:在高速公路某觀測點觀測每分鐘內(nèi)通過:在高速公路某觀測點觀測每分鐘內(nèi)通過的機(jī)動車數(shù)。共做了的機(jī)動車數(shù)。共做了2000余次的觀測。分析余次的觀測。分析高速路上車流的分布。高速路上車流的分布。在在1

9、分鐘內(nèi)分鐘內(nèi)觀察到的觀察到的車數(shù)(輛)車數(shù)(輛)0110觀察到相觀察到相應(yīng)車數(shù)的應(yīng)車數(shù)的次數(shù)次數(shù)(頻次頻次)5319216K-S 檢驗檢驗SPSS的分析:的分析:Data: “CH7非參公路車流非參公路車流”Command: Analyze Noparametric Test 1 Sample k-s K-S 檢驗檢驗分析報告分析報告K-S 檢驗檢驗Ex2: 儲戶存儲戶存(取取)款金額的分布檢驗款金額的分布檢驗利用利用K-S檢驗分析儲戶一次存檢驗分析儲戶一次存(取取)款金額的總款金額的總體是否服從正態(tài)分布。體是否服從正態(tài)分布。Data:“居民儲蓄調(diào)查數(shù)據(jù)居民儲蓄調(diào)查數(shù)據(jù)(存款存款)”Comma

10、nd:Command: Analyze Noparametric Test 1 Sample k-sK-S 檢驗檢驗K-S 的結(jié)果報告的結(jié)果報告不是正不是正態(tài)分布態(tài)分布K-S 檢驗檢驗圖形觀察:借助圖形直觀觀察圖形觀察:借助圖形直觀觀察P-P圖:圖:一種散點圖,可用于觀察樣本數(shù)據(jù)分一種散點圖,可用于觀察樣本數(shù)據(jù)分布與理論或期望數(shù)據(jù)分布之間的關(guān)系。布與理論或期望數(shù)據(jù)分布之間的關(guān)系。Command: GraphsP-PK-S 檢驗檢驗u 橫軸為樣本數(shù)據(jù)實際累計橫軸為樣本數(shù)據(jù)實際累計概率值,縱軸為期望概率值,縱軸為期望(理理論論)累計概率值。累計概率值。u 若數(shù)據(jù)與理論分布一致時,若數(shù)據(jù)與理論分布一

11、致時,各個數(shù)據(jù)點應(yīng)落在中間的各個數(shù)據(jù)點應(yīng)落在中間的對角線上。對角線上。u 該例中,該例中,數(shù)據(jù)分布與理論數(shù)據(jù)分布與理論分布存在較大差距分布存在較大差距。在。在較低的樣本區(qū)域中,實際累計概率明顯小于理較低的樣本區(qū)域中,實際累計概率明顯小于理論累計概率。在較大的樣本值區(qū)間中,實際累論累計概率。在較大的樣本值區(qū)間中,實際累計概率值又明顯大于理論累計概率值。計概率值又明顯大于理論累計概率值。K-S 檢驗檢驗u 橫軸為樣本數(shù)據(jù)實際累計橫軸為樣本數(shù)據(jù)實際累計概率值,縱軸為實際累計概率值,縱軸為實際累計概率與期望累計概率之概率與期望累計概率之差差。u 若數(shù)據(jù)與理論分布一致時,若數(shù)據(jù)與理論分布一致時,圖中各點

12、應(yīng)隨機(jī)分散在圖中各點應(yīng)隨機(jī)分散在0橫線的附近。橫線的附近。u 該例中,該例中,圖中的點有明顯圖中的點有明顯的趨勢性,的趨勢性,因此說明樣本因此說明樣本來自的來自的總體分布與理論分總體分布與理論分布存在顯著差異。布存在顯著差異。兩獨立樣本的非參數(shù)檢驗兩獨立樣本的非參數(shù)檢驗 兩獨立樣本的非參數(shù)檢驗室在兩獨立樣本的非參數(shù)檢驗室在總體分布不了解的情況下,通過對總體分布不了解的情況下,通過對兩組獨立樣本的分析,來推斷樣本兩組獨立樣本的分析,來推斷樣本來自的兩個總體的分布是否存在顯來自的兩個總體的分布是否存在顯著差異的方法。著差異的方法。兩獨立樣本的非參數(shù)檢驗兩獨立樣本的非參數(shù)檢驗Ex: 某工廠用甲乙兩種

13、不同的工藝生產(chǎn)同一種某工廠用甲乙兩種不同的工藝生產(chǎn)同一種產(chǎn)品。如果希望檢驗產(chǎn)品。如果希望檢驗兩種工藝下產(chǎn)品的使用兩種工藝下產(chǎn)品的使用壽命是否存在顯著差異壽命是否存在顯著差異,從兩種工藝生產(chǎn)處,從兩種工藝生產(chǎn)處的產(chǎn)品中隨機(jī)抽樣,得到各自使用壽命的數(shù)的產(chǎn)品中隨機(jī)抽樣,得到各自使用壽命的數(shù)據(jù)。據(jù)。工藝工藝使用壽命樣本值使用壽命樣本值甲甲(1)675,682,692,669,679,630乙乙(2)662,649,672,663,650,651,646,652可采用多種非參數(shù)檢驗的方法檢驗它們的分可采用多種非參數(shù)檢驗的方法檢驗它們的分布是否存在顯著差異,進(jìn)而對兩種工藝的優(yōu)布是否存在顯著差異,進(jìn)而對兩種

14、工藝的優(yōu)劣進(jìn)行評價。劣進(jìn)行評價。Mann-Whitney U檢驗檢驗H0: 兩組獨立樣本來自的總體樣本分布無顯著兩組獨立樣本來自的總體樣本分布無顯著差異。差異。檢驗原理:檢驗原理: 通過對兩組樣本通過對兩組樣本秩秩的研究來實現(xiàn)推斷。將的研究來實現(xiàn)推斷。將兩組樣本放在一起,按樣本觀察值的大小排兩組樣本放在一起,按樣本觀察值的大小排序,每個觀察值就有一個序號,謂之序,每個觀察值就有一個序號,謂之秩秩。將。將第一組樣本的秩相加,記為第一組樣本的秩相加,記為w1. 同樣得到第同樣得到第二組樣本的秩和二組樣本的秩和w2.Mann-Whitney U檢驗檢驗Mann-Whitney U檢驗統(tǒng)計量檢驗統(tǒng)計量

15、n,m分別為兩組樣本的個案數(shù)。在小樣本下,分別為兩組樣本的個案數(shù)。在小樣本下,U統(tǒng)計量服從統(tǒng)計量服從Mann-Whitney分布分布 .依據(jù)依據(jù)U觀測觀測值和概率值值和概率值p, 檢驗假設(shè)。在大樣本下,檢驗假設(shè)。在大樣本下,U統(tǒng)計統(tǒng)計量近似服從正態(tài)分布。量近似服從正態(tài)分布。Wilcoxon秩和檢驗法秩和檢驗法兩組獨立樣本,兩組獨立樣本, n,m分別為兩組樣本的個案數(shù),分別為兩組樣本的個案數(shù),設(shè)設(shè)n m.檢驗原理檢驗原理:累加樣本個數(shù)少的樣本組的樣本的:累加樣本個數(shù)少的樣本組的樣本的秩,記為秩,記為W. 如果兩個總體的分布相同,那么如果兩個總體的分布相同,那么兩個樣本組也能當(dāng)是均勻混合的。即兩個

16、樣本組也能當(dāng)是均勻混合的。即W不能太不能太大,也不能太小。大,也不能太小。W應(yīng)該介于兩個數(shù)字之間應(yīng)該介于兩個數(shù)字之間 W1和和W2 由由n,m, 決定。決定。Wilcoxon給出了給出了W的的概率分布數(shù)值表,依據(jù)進(jìn)行檢驗。概率分布數(shù)值表,依據(jù)進(jìn)行檢驗。Wilcoxon秩和檢驗法秩和檢驗法H0: 兩組獨立樣本來自的總體樣本分布無兩組獨立樣本來自的總體樣本分布無顯著差異。顯著差異。,拒絕,拒絕H0,兩個分布有兩個分布有差異差異.兩個分布相同兩個分布相同兩獨立樣本的非參數(shù)檢驗兩獨立樣本的非參數(shù)檢驗Data:“CH6CH7獨獨立檢驗激勵實驗齊立檢驗激勵實驗齊”Command:AnalyzeNonpar

17、ametric Test2 Independent SampleEx:兩種激勵方法的效果問題:兩種激勵方法的效果問題兩獨立樣本的非參數(shù)檢驗兩獨立樣本的非參數(shù)檢驗結(jié)果分析結(jié)果分析:Ranks統(tǒng)計表輸統(tǒng)計表輸出各組的樣本數(shù),出各組的樣本數(shù),秩和的均值等秩和的均值等Mann-Whiteney U = 12.5,WilcoxonW = 40.5 .兩個統(tǒng)兩個統(tǒng)計量對應(yīng)的計量對應(yīng)的p值均大于值均大于0.05,因此因此兩種激勵方法沒有顯兩種激勵方法沒有顯著差異。著差異。兩配對樣本兩配對樣本的非參數(shù)檢驗的非參數(shù)檢驗 在對總體分布不甚了解的情況下,通過在對總體分布不甚了解的情況下,通過對對兩組配對樣本分析兩組

18、配對樣本分析,推斷兩個總體的分布是,推斷兩個總體的分布是否存在顯著差異的方法。否存在顯著差異的方法。Ex1:檢驗一種新的訓(xùn)練方法是否會對提高運檢驗一種新的訓(xùn)練方法是否會對提高運動員的成績有顯著效果動員的成績有顯著效果。配對樣本為方法使。配對樣本為方法使用前后運動員的最好成績。用前后運動員的最好成績。Ex2:不同廣告形式對商品的銷售是否產(chǎn)生顯不同廣告形式對商品的銷售是否產(chǎn)生顯著影響著影響。配對樣本則為幾種不同商品在廣告。配對樣本則為幾種不同商品在廣告形式下的銷售額。形式下的銷售額。兩配對樣本的非參數(shù)檢驗兩配對樣本的非參數(shù)檢驗配對樣本要求:配對樣本要求:樣本數(shù)一致樣本數(shù)一致,且,且各樣本各樣本值的

19、先后次序是不能隨意更改值的先后次序是不能隨意更改的。的。主要介紹以下兩種檢測方法:主要介紹以下兩種檢測方法:u 符號檢驗符號檢驗 SignuWilcoxon符號秩檢驗符號秩檢驗符號檢驗符號檢驗符號檢驗也成為正負(fù)號個數(shù)檢驗法符號檢驗也成為正負(fù)號個數(shù)檢驗法檢驗原理:利用正負(fù)符號的個數(shù)實現(xiàn)檢驗。檢驗原理:利用正負(fù)符號的個數(shù)實現(xiàn)檢驗。u第二組樣本的觀察值第二組樣本的觀察值-第一組樣本觀察值,第一組樣本觀察值,差值為差值為正記正記“+”,差值為負(fù)記,差值為負(fù)記“-”。u比較比較“+”與與“-”的個數(shù)的個數(shù)u 若個數(shù)相當(dāng),則可認(rèn)為第二組樣本若個數(shù)相當(dāng),則可認(rèn)為第二組樣本大于大于第第一組樣本的個數(shù)與一組樣本

20、的個數(shù)與小于小于第一組樣本的個數(shù)第一組樣本的個數(shù)大大致相當(dāng)致相當(dāng)??傮w上講兩組配對樣本的數(shù)據(jù)分布??傮w上講兩組配對樣本的數(shù)據(jù)分布差距較小,反之差距大。差距較小,反之差距大。符號檢驗符號檢驗u 若采用二項分布檢驗的方法,問題轉(zhuǎn)若采用二項分布檢驗的方法,問題轉(zhuǎn)化單樣本的二項分布檢驗,即化單樣本的二項分布檢驗,即檢驗正檢驗正負(fù)號個數(shù)的分布是否服從負(fù)號個數(shù)的分布是否服從p=0.5的二項的二項分布。分布。u 在在小樣本情況小樣本情況下,計算下,計算二項分布的精二項分布的精確概率確概率。大樣本情況下大樣本情況下 ,采用,采用修正了修正了的的Z統(tǒng)計量統(tǒng)計量,近似正態(tài)分布。,近似正態(tài)分布。符號檢驗符號檢驗Ex

21、: 檢測新的訓(xùn)練方法檢測新的訓(xùn)練方法Data:樣本為跳遠(yuǎn)運動員在訓(xùn)練前后的最好成績:樣本為跳遠(yuǎn)運動員在訓(xùn)練前后的最好成績“非非參數(shù)檢驗(兩配對樣本參數(shù)檢驗(兩配對樣本-訓(xùn)練成績)訓(xùn)練成績)”運動員編號使用方法前使用方法后差的符號15.745.79+26.286.12-35.465.44+46.036.03105.875.93+不參與不參與分析,分析,剔除剔除前后成績的兩配對樣本的符號檢驗計算過程前后成績的兩配對樣本的符號檢驗計算過程符號檢驗符號檢驗Command: AnalyzeNonparametric Test2 Related-Samples Test符號檢驗符號檢驗報告分析:報告分析:

22、小樣本,采用了二項分小樣本,采用了二項分布的檢驗,統(tǒng)計量對應(yīng)布的檢驗,統(tǒng)計量對應(yīng)的概率的概率, 不能拒絕零假設(shè),即不能拒絕零假設(shè),即新新的訓(xùn)練方法沒有顯著效的訓(xùn)練方法沒有顯著效果果。訓(xùn)練后成績降低了的有訓(xùn)練后成績降低了的有2人,成績提高的有人,成績提高的有7人,人,1人保持不變。人保持不變。兩配對樣本的兩配對樣本的Wilcoxon符號秩檢符號秩檢驗驗 配對樣本分布的差異是否顯著也可采用配對樣本分布的差異是否顯著也可采用Wilcoxon 符號秩檢驗方法符號秩檢驗方法運動員編號使用方法前使用方法后絕對差值秩差的符號15.745.790.053+26.286.120.168-35.465.440.0

23、21+46.036.030105.875.930.064+不參與不參與分析,分析,剔除剔除前后成績的兩配對樣本前后成績的兩配對樣本W(wǎng)ilcoxon符號秩檢驗計算過程符號秩檢驗計算過程兩配對樣本的兩配對樣本的Wilcoxon符號秩檢符號秩檢驗驗檢測原理:檢測原理:u 分別計算正號秩總和分別計算正號秩總和W+和符號秩總和和符號秩總和W-u若二者大致相當(dāng)則說明兩組樣本數(shù)據(jù)差的若二者大致相當(dāng)則說明兩組樣本數(shù)據(jù)差的正負(fù)變化程度基本相當(dāng),兩配對總體的分布正負(fù)變化程度基本相當(dāng),兩配對總體的分布無顯著差異。無顯著差異。u小樣本下檢測統(tǒng)計量為小樣本下檢測統(tǒng)計量為服從服從Wilcoxon符合秩分布。大樣本近似服從

24、正態(tài)符合秩分布。大樣本近似服從正態(tài)分布,可利用分布,可利用。Wilcoxon符號秩檢驗符號秩檢驗Ex: 檢測新的訓(xùn)練方法檢測新的訓(xùn)練方法Wilcoxon符號秩檢驗結(jié)果符號秩檢驗結(jié)果負(fù)號秩總和為負(fù)號秩總和為9,正號秩總和為,正號秩總和為36. Z檢驗統(tǒng)計量為檢驗統(tǒng)計量為-1.599,對應(yīng)概率值,對應(yīng)概率值p = 0.11 0.05, 拒絕假設(shè),新的訓(xùn)拒絕假設(shè),新的訓(xùn)練方法無效。練方法無效。多組獨立樣本的總體分布是否相多組獨立樣本的總體分布是否相同的檢驗同的檢驗 多獨立樣本的非參數(shù)檢驗是通過分析多獨立樣本的非參數(shù)檢驗是通過分析多組獨立樣本數(shù)據(jù),推斷樣本來自的多組獨立樣本數(shù)據(jù),推斷樣本來自的多個總體

25、的分布是否存在顯著差異。多個總體的分布是否存在顯著差異。 檢驗思路同兩組獨立樣本總體分布的檢驗思路同兩組獨立樣本總體分布的檢驗。檢驗。SPSS提供的檢驗方法主要有提供的檢驗方法主要有。多組獨立樣本的總體分布是否相多組獨立樣本的總體分布是否相同的檢驗同的檢驗u 中位數(shù)檢驗:中位數(shù)檢驗:通過對多組獨立樣本的分析,通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數(shù)是否存在顯檢驗它們來自的總體的中位數(shù)是否存在顯著差異。統(tǒng)計量為著差異。統(tǒng)計量為 2uKruskal-Wallis 檢驗:檢驗:Mann-Whitney U檢驗檢驗在多個獨立樣本下的推廣。統(tǒng)計量在多個獨立樣本下的推廣。統(tǒng)計量K-W。u Jo

26、nkheer-Terpstra檢驗:檢驗思想同兩獨立檢驗:檢驗思想同兩獨立變量的變量的Mann-Whitney U檢驗,統(tǒng)計量檢驗,統(tǒng)計量J-T.多組獨立樣本的總體分布是否相多組獨立樣本的總體分布是否相同的檢驗同的檢驗Ex:城市周歲兒童身高的比較問題城市周歲兒童身高的比較問題Data: “(非參數(shù)檢驗非參數(shù)檢驗)多獨立樣本多獨立樣本-兒童身高兒童身高”Command:AnalyzeNonparametric TestK Independent Samples多組獨立樣本的總體分布是否相多組獨立樣本的總體分布是否相同的檢驗同的檢驗結(jié)果分析:結(jié)果分析:四組共同的中位四組共同的中位數(shù)位數(shù)位74.多組

27、獨立樣本的總體分布是否相多組獨立樣本的總體分布是否相同的檢驗同的檢驗三種方法的檢測三種方法的檢測結(jié)論一致:結(jié)論一致:四個四個城市周歲兒童身城市周歲兒童身高的分布存在顯高的分布存在顯著差異。著差異。多配對樣本多配對樣本的非參數(shù)檢驗的非參數(shù)檢驗 通過分析通過分析多組配對樣本數(shù)據(jù)多組配對樣本數(shù)據(jù),推斷,推斷多個總體的中位數(shù)或分布是否存在顯著多個總體的中位數(shù)或分布是否存在顯著差異差異。主要的檢驗方法:主要的檢驗方法:Friedman檢驗檢驗,Cochran Q 檢驗,檢驗,Kendall 協(xié)同系數(shù)檢驗協(xié)同系數(shù)檢驗。多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗uFriedman檢驗檢驗 利用秩實現(xiàn)檢驗利

28、用秩實現(xiàn)檢驗。其秩為在。其秩為在各個區(qū)組內(nèi)分別獨立排序得出。統(tǒng)計量為各個區(qū)組內(nèi)分別獨立排序得出。統(tǒng)計量為Friedman. Ex:不同促銷手段對商品銷售的影響不同促銷手段對商品銷售的影響分析:分析不同促銷手段帶來的商品銷售的分析:分析不同促銷手段帶來的商品銷售的影響,可通過分析影響,可通過分析各種促銷形式下各種促銷形式下商品銷售商品銷售額的額的總體分布是否存在顯著差異來推斷總體分布是否存在顯著差異來推斷。多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗Data:“非參數(shù)檢驗(多配對樣本非參數(shù)檢驗(多配對樣本-促銷方式)促銷方式)”Command: Command:AnalyzeNonparamet

29、ric Test K related Samples多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗結(jié)果分析結(jié)果分析三中促銷手段下銷售額三中促銷手段下銷售額的平均秩分別為的平均秩分別為2.1,2.5,1.4. 統(tǒng)計量為統(tǒng)計量為6.2,對應(yīng)概率對應(yīng)概率p=0.0450.05, 因此拒絕因此拒絕H0假設(shè)。認(rèn)為假設(shè)。認(rèn)為不同不同促銷手段的銷售額促銷手段的銷售額數(shù)據(jù)分布存在明顯差異數(shù)據(jù)分布存在明顯差異,第二種形式效果最好第二種形式效果最好。多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗uCochran Q 檢驗檢驗 統(tǒng)計量為統(tǒng)計量為Q。該檢驗。該檢驗方法方法適合二值品質(zhì)型數(shù)據(jù)適合二值品質(zhì)型數(shù)據(jù)的分析。的分析

30、。Ex:收集乘客對多家航空公司是否滿意:收集乘客對多家航空公司是否滿意的數(shù)據(jù),分析航空公司的服務(wù)水平是否的數(shù)據(jù),分析航空公司的服務(wù)水平是否存在顯著差異。存在顯著差異。多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗Data:“非參數(shù)檢驗非參數(shù)檢驗(多配對樣本多配對樣本-航空公司航空公司)”1-滿意,滿意,0-不滿意不滿意Command: Command:AnalyzeNonparametric Test K related Samples多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗 結(jié)果分析結(jié)果分析三家航空公司得到乘三家航空公司得到乘客的客的滿意人數(shù)分別為滿意人數(shù)分別為13,8,2,不滿意人數(shù)為,不滿意人數(shù)為2,7,13.統(tǒng)計量的觀測值統(tǒng)計量的觀測值為為14.0,相應(yīng)的,相應(yīng)的p值為值為0.0010.05,拒絕拒絕H0假假設(shè)設(shè),認(rèn)為三家航空公,認(rèn)為三家航空公司的司的服務(wù)水平有顯著服務(wù)水平有顯著差異。差異。甲公司的服務(wù)甲公司的服務(wù)水平最高。水平最高。多配對樣本的非參數(shù)檢驗多配對樣本的非參數(shù)檢驗u 多配對樣本的多配對樣本的Kendall協(xié)同系數(shù)檢驗協(xié)同系數(shù)檢驗Ex: 有有6名歌手參加比賽,名歌手參加比賽,4名評委進(jìn)行名評委進(jìn)行評判打分?,F(xiàn)在需要根據(jù)表中的數(shù)據(jù)推評判打分?,F(xiàn)在需要根據(jù)表中的數(shù)據(jù)推斷這斷這4個評委的評判標(biāo)準(zhǔn)是否一致個評委的評判標(biāo)準(zhǔn)是否一致。多配對樣本的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論