第九章+非參數(shù)檢驗.ppt_第1頁
第九章+非參數(shù)檢驗.ppt_第2頁
第九章+非參數(shù)檢驗.ppt_第3頁
第九章+非參數(shù)檢驗.ppt_第4頁
第九章+非參數(shù)檢驗.ppt_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第九章 非參數(shù)檢驗,參數(shù)檢驗:是在給定或假定總體的分布形式基礎(chǔ)上,對總體的未知參數(shù)進行估計或者檢驗。它一方面以明確的總體分布為前提;另一方面需要滿足某些總體參數(shù)的假定條件。 非參數(shù)檢驗:是在不符合參數(shù)檢驗的條件下使用的另一類檢驗方法。與參數(shù)統(tǒng)計相比,非參數(shù)檢驗對總體分布不作嚴格假定,特別適用于計量信息較弱的資料,往往依據(jù)數(shù)據(jù)的順序、等級資料即可進行統(tǒng)計推斷。由于這些方法一般不涉及總體參數(shù)故得名。,非參數(shù)檢驗(分布檢驗)所要處理的問題是: (1)兩個總體的分布未知,它們是否相同(用兩組樣本來檢驗); (2)(由一組樣本)猜出總體的分布(假設(shè)),然后用(另一組)樣本檢驗它是否正確。,非參數(shù)檢驗方法

2、,1. 二項分布檢驗(Binomial test) 2. 單樣本K-S檢驗(1-Sample Kolmogorov-Smirnov test) 3.兩獨立樣本檢驗(2 independent Samples Test) 4. 多獨立樣本檢驗(K independent Samples Test) 5.兩相關(guān)樣本檢驗(2 related Samples Test) 6. 多相關(guān)樣本檢驗(K related Samples Test),9.1 二項分布檢驗 Binomial test,二項分布:在現(xiàn)實生活中有很多的取值是兩類的,如人群的男和女、升學與落榜、三好學生和非三好學生、投擲硬幣的正面和反面

3、。這時如果某一類出現(xiàn)的概率是P,則另一類出現(xiàn)的概率就是1-P。這種分布稱為二項分布。 二項分布檢驗:就是根據(jù)收集到的樣本數(shù)據(jù),推斷總體分布是否服從某個指定的二項分布。一般零假設(shè)為: H0:樣本來自某一分布總體或與某分布無顯著差異。 SPSS將自動計算,并給出對應(yīng)的相伴概率值。如果相伴概率值小于或等于用戶的顯著性水平,則應(yīng)拒絕零假設(shè);反之,則接受零假設(shè)。,實例:為驗證某批產(chǎn)品的一等品率是否達到90,現(xiàn)從該批產(chǎn)品中隨機抽取23個樣品進行檢測,結(jié)果有19個一等品(1一等品,0非一等品)。(變量2個:一等品和個數(shù),Cases 2個:1:19 和0:4) Analyze Nonparametric Te

4、sts Binomial Test Variable:一等品 Test Proportion:0.9 比較有用的結(jié)果:兩組個數(shù)和sig=.1930.5,不能拒絕零假設(shè),認為該批產(chǎn)品的一等品率達到了90 。,9.2 單樣本K-S檢驗,單樣本KS檢驗是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布,適用于探索連續(xù)型隨機變量的分布形態(tài)(判斷定距變量的分布情況): Normal正態(tài)分布; Uniform均勻分布; Poisson泊松分布; Exponential指數(shù)分布。,K-S檢驗的統(tǒng)計分析過程,AnalyzeNonparametric Tests1 Sample K-S。 然后把變量選入Variable

5、 List。 再在下面Test Distribution選中零假設(shè)的分布(Normal、Poisson、Uniform和Exponential)作為零假設(shè)。,由于sig=.074.05,接受零假設(shè),由于sig=.000.05,拒絕零假設(shè),9.3 兩獨立樣本非參數(shù)檢驗,兩獨立樣本的非參數(shù)檢驗是在對總體分布不很了解的情況下,通過分析樣本數(shù)據(jù),推斷樣本來自的兩個獨立總體分布是否存在顯著差異。一般用來對兩個獨立樣本的均數(shù)、中位數(shù)、離散趨勢、偏度等進行差異比較檢驗。常用的兩種方法有: Mann-Whitney U檢驗; 兩獨立樣本的K-S檢驗,Wilcoxon (Mann-Whitney)秩和檢驗,Wi

6、lcoxon (或稱Mann-Whitney)秩和檢驗的原理: 假定第一個樣本有m個觀測值,第二個有n個觀測值。把兩個樣本混合之后把這m+n個觀測值升冪排序, 記下每個觀測值在混合排序下面的秩。之后分別把兩個樣本所得到的秩相加。記第一個樣本觀測值的秩的和為WX而第二個樣本秩的和為WY。這兩個值稱為Wilcoxon統(tǒng)計量。 直觀上看,如果WX與WY之中有一個顯著地大,則可以選擇拒絕零假設(shè)。 該檢驗需要的唯一假定就是兩個總體的分布有類似的形狀(不一定對稱)。,秩(rank),非參數(shù)檢驗中秩是最常使用的概念。什么是一個數(shù)據(jù)的秩呢?一般來說,秩就是該數(shù)據(jù)按照升序排列之后,每個觀測值的位置。例如我們有下

7、面數(shù)據(jù),這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。,SPSS統(tǒng)計分析過程,AnalyzeNonparametric Tests2 Independent Samples。 把變量(gdp)選入Test Variable List;再把用1和2分類的變量area輸入進Grouping Variable,在Define Groups輸入1和2。 在Test Type選中MannWhitney。 最后OK即可,兩樣本分布的Kolmogorov-Smirnov檢驗,兩獨立樣本的Kolmogorov-Smirnov檢驗主要推測兩個樣本是否來自具有相同分布的總體。 其基本思想是:首先將兩組樣本數(shù)據(jù)混

8、合并按升序排列,分別計算兩組樣本秩的累計頻率和每個點上的累計頻率;最后將兩個累計頻率相減,得到差值序列數(shù)據(jù)。如果這個差值序列數(shù)據(jù)很大,則零假設(shè)(樣本來自的兩獨立總體均質(zhì)沒有顯著差異)不一定成立。 兩獨立樣本的K-S檢驗適用于大樣本情況。,SPSS統(tǒng)計分析過程,AnalyzeNonparametric Tests2 Independent Samples。 把變量(duration)選入Test Variable List;再把用1和2分類的變量type輸入到Grouping Variable,在Define Groups輸入1和2。 在Test Type選中Kolmogorov-Smirnov

9、 Z。 最后OK即可,9.4 多獨立樣本非參數(shù)檢驗(K independent Samples Test),通過分析多個樣本數(shù)據(jù),推斷它們的分布是否存在顯著性差異。方法有三種: 1、中位數(shù)檢驗(Median):是通過對中位數(shù)的研究來實現(xiàn)推斷的 2、K-W檢驗:是通過對推廣的平均秩的研究來實現(xiàn)推斷的 3、JT:與兩個獨立樣本檢驗的Mann-Whitney U類似,1、中位數(shù)檢驗法,是通過對來自兩個獨立總體的兩個樣本數(shù)據(jù)在聯(lián)合中位數(shù)上、下分布的情況,來推斷兩個樣本是否來自同一個總體的。 其基本思想是假設(shè)兩個樣本來自的總體分布相同,這樣,每個樣本中在聯(lián)合中位數(shù)上下出現(xiàn)的數(shù)據(jù)個數(shù)應(yīng)大體相同。若兩個樣本

10、在中位數(shù)上下出現(xiàn)的數(shù)據(jù)個數(shù)差異較大,則有理由否定兩個樣本來自同一總體的假設(shè)。,檢驗過程 1、將兩個樣本數(shù)據(jù)混合從大到小排列。 2、求混合排列的中位數(shù)。 3、分別找出每一樣本中大于混合中位數(shù)及小 于混合中位數(shù)的數(shù)據(jù)個數(shù),列成四格表。 4、對四格表進行卡方檢驗。若卡方檢驗結(jié)果顯著,則說明兩樣本的集中趨勢(中位數(shù))差異顯著。,SPSS統(tǒng)計分析過程,AnalyzeNonparametric TestsK Independent Samples。 把變量(這里是price)選入Test Variable List;再把數(shù)據(jù)中用1、2、3來分類的變量group輸入Grouping Variable,在De

11、fine Range輸入1、2、3。 在下面Test Type選中Median。 最后OK即可,秩和檢驗法是一種直接將兩樣本的數(shù)據(jù)混在一起排成等級,并用容量較小那個樣本的各數(shù)據(jù)等級之和與臨界值相比較進行差異的顯著性檢驗的方法。 方法和Wilcoxon-Mann-Whitney檢驗的思想類似。,Kruskal-Wallis關(guān)于多個樣本的秩和檢驗,1、把兩個樣本的數(shù)據(jù)混在一起由小到大排成等級,最小的列為1等,其次列為2等,以此類推。當遇到相同數(shù)據(jù)時,用平均等級來表示。 2、計算容量較小的樣本數(shù)據(jù)等級之和,即秩和,用T表示。當兩樣本容量相等時,以較小的秩和為T。 3、將計算的T值與秩和檢驗表中某水平

12、下的界限值相比較,判斷兩樣本差異是否顯著。若T1TT2,則兩樣本差異不顯著,接受原假設(shè);若TT1或TT2,則拒絕原假設(shè)。,Kruskal-Wallis關(guān)于多個樣本的秩和檢驗,SPSS統(tǒng)計分析過程,AnalyzeNonparametric TestsK Independent Samples。 把變量選入Test Variable List;再把數(shù)據(jù)中用1、2、3來分類的變量group輸入Grouping Variable,在Define Groups輸入1、2、3。 在下面Test Type選中Kruskal-Wallis H。 最后OK即可,秩和檢驗的可靠性 數(shù)理統(tǒng)計學家已經(jīng)證明如下結(jié)論:

13、1)在小樣本的情況下,秩和檢驗的精度幾乎與t檢驗一樣。 2)在原始總體為偏態(tài)分布的情況下,秩和檢驗的精度比t檢驗高。 3)在原始總體服從“拋物線型”分布的情況下,秩和檢驗最為不利,其精度沒有t檢驗高。,Kruskal-Wallis關(guān)于多個樣本的秩和檢驗,9.5 兩相關(guān)樣本非參數(shù)檢驗,在對總體分布不很清楚的情況下,兩相關(guān)樣本檢驗(2 related Samples Test)非參數(shù)檢驗一般用于同一研究對象(或兩配對對象)分別給予兩種不同處理的效果比較,以及同一研究對象(或兩配對對象)處理前后的效果比較。前者推斷兩種效果有無差異,后者推斷某種處理是否有效。 McNemar變化顯著性檢驗; Wilc

14、oxon符號平均秩檢驗,符號平均秩檢驗法(Wilcoxon),計算各對數(shù)據(jù)的差數(shù),取其絕對值。 把所有差數(shù)的絕對值由小到大排成等級,稱為秩。絕對值最小的差數(shù)列為1等,其次列為2等,以此類推。當遇到相同差數(shù)時,用平均等級來表示。 計算正差等級之和,用符號T+表示;計算負差等級之和,用負號T表示。T+和T最小者,用符號T表示。等級之和稱為秩和。 將T值與符號秩和檢驗表所列某水平的臨界值相比較,來判斷差異是否顯著。,以三歲幼兒的兩個相關(guān)樣本關(guān)于顏色命名測驗得分進行符號秩和檢驗。,符號平均秩檢驗法(Wilcoxon),統(tǒng)計決斷 T+和T中較小者T越小,正差等級之和與負差等級之和相差“太大”的可能性就越

15、大。如T過小,小于或等于負號秩和檢驗表中的臨界值T0.05時,說明僅由于抽樣誤差所致的可能性很小,兩樣本差異顯著,我們有95%的把握拒絕原假設(shè);如果TT0.05,則差異不顯著,接受原假設(shè)。,SPSS統(tǒng)計分析過程 Analyze Nonparametric Tests 2 related Samples 將配對變量選入Test Pairs: Test type:選一種或多種 單擊“OK”。,9.6 多相關(guān)樣本非參數(shù)檢驗,對多個被測試者,多個打分,看打分是否有顯著性差異。方法有三種: Cochran Q:要求樣本數(shù)據(jù)為二值的(1滿意 0不滿意) Friedman:利用秩實現(xiàn) Kendall協(xié)同系數(shù)

16、檢驗:H0:協(xié)同系數(shù)為0(評分標準不相關(guān)的或者是隨機的),Friedman秩和檢驗,前面討論了兩因子試驗設(shè)計數(shù)據(jù)的方差分析,那里所用的F檢驗需要假定總體的分布為正態(tài)分布。 有一種非參數(shù)方差分析方法,稱為Friedman(兩因子)秩和檢驗,或Friedman方差分析。它適用于兩個因子的各種水平的組合都有一個觀測值的情況。,Friedman秩和檢驗,其實現(xiàn)原理是:首先以樣本為單位,將各個樣本數(shù)據(jù)按照升序排列,求得各個樣本數(shù)據(jù)在各自行中的秩,然后計算各樣本的秩和及平均秩。如果多個配對樣本的分布存在顯著差異,那么數(shù)值普遍大的組,秩和必然偏大;如果各樣本的平均秩大致相當,那么可以認為各組的總體分布沒有顯

17、著差異。,SPSS統(tǒng)計分析過程,AnalyzeNonparametric TestsK Related Samples。 然后把變量(這里是a、b、c)選入Test Variable List。 在下面Test Type選中Friedman。 最后OK即可,Kendall協(xié)同系數(shù)檢驗,在實踐中,常需要按照某些特別的性質(zhì)來多次對一些個體進行評估或排序;比如幾個(m個)評估機構(gòu)對一些(n個)學校進行排序。人們想要知道,這些機構(gòu)的不同結(jié)果是否一致。這就要運用Kendall協(xié)同系數(shù)檢驗。其檢驗假設(shè)是: H0:這些對于不同學校的排序是不相關(guān)的或者是隨機的; H1:這些對不同學校的排序是正相關(guān)的或者是多少

18、一致的。,Kendall協(xié)同系數(shù),下面是4個獨立的環(huán)境研究單位對15個學校排序的結(jié)果每一行為一個評估機構(gòu)對這些學校的排序??瓷先ゲ荒敲匆恢拢ㄒ灿型耆恢碌模?SPSS統(tǒng)計分析過程,AnalyzeNonparametric TestsK Related Samples。 然后把變量(這里是s1、s2、s15 )選入Test Variable List。 在下面Test Type選中Kendalls W 。 最后OK即可,數(shù)據(jù)school.sav,SPSS的Kendall協(xié)同系數(shù)檢驗的輸出,關(guān)于二元響應(yīng)的Cochran檢驗,前面討論了兩因子方差分析問題的Friedman秩和檢驗。但是當觀測值只取諸如0或1兩個可能值時,由于有太多同樣的數(shù)目(只有0和1),排序的意義就很成問題了。 Cochran檢驗就是用來解決這個問題的一個非參數(shù)檢驗。先看一個例子 關(guān)于瓶裝飲用水的調(diào)查。20名顧客對4種瓶裝飲用水進行了認可(記為1)和不認可(記為0)的表態(tài)。 我們感興趣的是這幾種瓶裝水在顧客眼中是否有區(qū)別。這里的零假設(shè)是這些瓶裝水(作為處理)在(作為區(qū)組的)顧客眼中沒有區(qū)別。,下表是數(shù)據(jù),每一行為20個顧客對某一飲料的20個觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論