統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第1頁
統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第2頁
統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第3頁
統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第4頁
統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)_第5頁
已閱讀5頁,還剩85頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)第六章第六章 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)方法的回顧方法的回顧l單個(gè)因素(兩水平)的作用評(píng)價(jià):兩組比較完全隨機(jī)設(shè)計(jì)下的單因素兩組比較匹配設(shè)計(jì)的兩組比較l單個(gè)因素(多水平)的作用評(píng)價(jià):多組比較完全隨機(jī)設(shè)計(jì)下的單因素多水平比較l兩個(gè)因素的分析問題無交互作用、有交互作用統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l單因素兩組比較:t檢驗(yàn)完全隨機(jī)兩組均數(shù)比較的t檢驗(yàn)(獨(dú)立t檢驗(yàn))匹配設(shè)計(jì)下兩組均數(shù)比較的t檢驗(yàn)(匹配t檢驗(yàn))l單因素多組比較:方差分析完全隨機(jī)設(shè)計(jì)下的多組均數(shù)比較統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)局限性局限性lt檢驗(yàn)獨(dú)立t檢驗(yàn)要求:正態(tài)、方差相等(

2、或不相等)、個(gè)體獨(dú)立匹配t檢驗(yàn)要求:差值正態(tài)、個(gè)體獨(dú)立l方差分析單因素多水平比較方差分析要求:正態(tài)、方差相等、個(gè)體獨(dú)立統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)未解決問題未解決問題l兩組性別結(jié)構(gòu)是否相同?l療效用痊愈、顯效、有效、無效四級(jí)分類法進(jìn)行評(píng)價(jià)時(shí),兩組或多組如何比較?l如何檢驗(yàn)樣本數(shù)據(jù)來自的總體服從正態(tài)分布?l總體不是正態(tài)分布,小樣本情況下,如何檢驗(yàn)總體的集中趨勢?l有6名歌手參加比賽,4名評(píng)委進(jìn)行評(píng)判打分,推斷評(píng)委的評(píng)判標(biāo)準(zhǔn)是否一致l統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l參數(shù)檢驗(yàn):樣本被視為從分布族的某個(gè)參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值推斷問題就轉(zhuǎn)化為對(duì)分布族的若干個(gè)

3、未知參數(shù)的估計(jì)問題,用樣本對(duì)這些參數(shù)做出估計(jì)或者進(jìn)行某種形式的假設(shè)檢驗(yàn),這類推斷方法稱為參數(shù)方法。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l非參數(shù)檢驗(yàn)(nonparametric tests)又稱為任意分布檢驗(yàn)(distribution- free test),它不考慮研究對(duì)象總體分布具體形式,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷僅僅依賴于數(shù)據(jù)觀測值的相對(duì)大小(秩)等,而是通過檢驗(yàn)樣本所代表的總體分布形式是否一致來得出統(tǒng)計(jì)結(jié)論。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l非參數(shù)統(tǒng)計(jì)的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);l它被稱為“和分布無關(guān)”(distribution

4、free),是因?yàn)槠渫茢喾椒ê涂傮w分布無關(guān);不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無關(guān) 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l對(duì)總體假定較少,有廣泛的適用性,對(duì)總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。結(jié)果穩(wěn)定性較好。假定較少假定較少不需要對(duì)總體參數(shù)的假定不需要對(duì)總體參數(shù)的假定與參數(shù)結(jié)果接近與參數(shù)結(jié)果接近l針對(duì)幾乎所有類型的數(shù)據(jù)形態(tài)。針對(duì)幾乎所有類型的數(shù)據(jù)形態(tài)。l容易計(jì)算容易計(jì)算在計(jì)算機(jī)盛行之前就已經(jīng)發(fā)展起來。在計(jì)算機(jī)盛行之前就已經(jīng)發(fā)展起來。非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l可能會(huì)浪費(fèi)一些信息可能會(huì)浪費(fèi)一些信息特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型的時(shí)候的時(shí)候l

5、大樣本手算相當(dāng)麻煩大樣本手算相當(dāng)麻煩l一些表不易得到一些表不易得到非參數(shù)檢驗(yàn)的弱點(diǎn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)的特點(diǎn)非參數(shù)檢驗(yàn)的特點(diǎn)非參數(shù)檢驗(yàn)不需要嚴(yán)格假設(shè)條件,因而比參數(shù)檢驗(yàn)有更廣泛的適用面。非參數(shù)檢驗(yàn)幾乎可以處理包括定類數(shù)據(jù)和定序數(shù)據(jù)在內(nèi)的所有類型的數(shù)據(jù),而參數(shù)檢驗(yàn)通常只能用于定量數(shù)據(jù)的分析。在參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)都可以使用的情況下,非參數(shù)檢驗(yàn)的功效(power)要低于參數(shù)檢驗(yàn)方法。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)以下情況下應(yīng)當(dāng)首選非參數(shù)方法以下情況下應(yīng)當(dāng)首選非參數(shù)方法參數(shù)檢驗(yàn)中的假設(shè)條件不滿足,從而無法應(yīng)用。例如總體分布為偏態(tài)或分布形式未知,

6、且樣本為小樣本時(shí)。檢驗(yàn)中涉及的數(shù)據(jù)為定類或定序數(shù)據(jù)。所涉及的問題中并不包含參數(shù),如判斷某樣本是否來自正態(tài)分布等,判斷某樣本是否為隨機(jī)樣本。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)常用的非參數(shù)檢驗(yàn)方法常用的非參數(shù)檢驗(yàn)方法l用于單個(gè)樣本的c2擬合優(yōu)度檢驗(yàn)、K-S擬合優(yōu)度檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)l用于兩個(gè)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)l用于兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)l用于多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)第六章第六章 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)l非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用l單樣本的非參數(shù)檢驗(yàn)l兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)

7、學(xué)非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)lc2擬合優(yōu)度檢驗(yàn)lK-S擬合優(yōu)度檢驗(yàn)l中位數(shù)的符號(hào)檢驗(yàn)分類數(shù)據(jù)檢驗(yàn)分布對(duì)中位數(shù)的推斷統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lc2統(tǒng)計(jì)量用來測定定類變量之間的相關(guān)程度c2統(tǒng)計(jì)量的分布與自由度有關(guān); c2統(tǒng)計(jì)量描述了觀察值與期望值的接近程度eefff202)(c表示期望值頻數(shù)表示觀察值頻數(shù),其中eff002c統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l擬合優(yōu)度檢驗(yàn)(goodness of fit test)用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)的重要內(nèi)容之一;依據(jù)總體分布狀況,計(jì)算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)進(jìn)行對(duì)比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異

8、,從而達(dá)到對(duì)分類變量進(jìn)行分析的目的。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l1912年4月15日,豪華巨輪泰坦尼克號(hào)與冰山相撞沉沒。當(dāng)時(shí)船上共有2208人,其中男性1738人,女性470人。l海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以顯著性水平為0.1檢驗(yàn)存活狀況與性別是否有關(guān)?706. 2) 1 (21 . 0c統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l提出零假設(shè)和備擇假設(shè)H0:觀察頻數(shù)與期望頻數(shù)一致H1:觀察頻數(shù)與期望頻數(shù)不一致l計(jì)算期望頻數(shù) 男性的期望頻數(shù) ,女性為153人l計(jì)量c2統(tǒng)計(jì)量l查表 (自由度為類別數(shù)-1)l做出判斷:決絕原假設(shè),認(rèn)為存活狀況與性別顯著相關(guān)ef5652

9、2081738718220()303eefffc706. 2) 1 (21 . 0c統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l一種飲料的容器材料可以選擇玻璃、塑料或者金屬。l為了比較消費(fèi)者對(duì)包裝材料的偏好,抽樣調(diào)查了120名消費(fèi)者發(fā)現(xiàn),最喜歡玻璃、塑料和金屬容器的分別有55、25和40人。l根據(jù)調(diào)查結(jié)果,能否認(rèn)為消費(fèi)者對(duì)3種材料的偏好程度是無差異的(顯著性水平a=0.05)? 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)分析分析l如果消費(fèi)者對(duì)3種材料的偏好程度是無差異的,也就是說消費(fèi)者對(duì)材料的偏好服從均勻分布,則理論上來說,調(diào)查120名消費(fèi)者,偏好每種材料的人數(shù)應(yīng)該是相等的,也就是40人。l各組觀測到的人數(shù)與理論

10、人數(shù)(期望值)之間的差異應(yīng)該都是由于抽樣的隨機(jī)性造成的,因此不應(yīng)該太大。l如果二者之間的差異特別大,則說明我們所作的假設(shè)(消費(fèi)者對(duì)3種材料的偏好程度是無差異的)很可能不成立。 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l檢驗(yàn)統(tǒng)計(jì)量k是樣本分類的個(gè)數(shù),表示實(shí)際觀察到的頻數(shù),表示理論頻數(shù)。觀察頻數(shù)與期望頻數(shù)越接近,則c2值越小。根據(jù)皮爾遜定理,當(dāng)n充分大時(shí), c2統(tǒng)計(jì)量漸近服從于k-1個(gè)自由度的c2分布。 kiiiiEEO122)(c統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)軟件操作:數(shù)據(jù)錄入軟件操作:數(shù)據(jù)錄入統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)軟件操作:方法設(shè)定軟件操作:方法設(shè)定l選擇“分析”“非參數(shù)檢驗(yàn)”“卡方”,在

11、彈出的對(duì)話框中將“材料”設(shè)定為檢驗(yàn)變量;單擊對(duì)話框中的“精確”,選中彈出對(duì)話框中的“精確”,單擊“繼續(xù)”、“確定” 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)軟件操作:結(jié)果分析(軟件操作:結(jié)果分析(1)觀察數(shù)觀察數(shù) 期望數(shù)期望數(shù)殘差殘差1.005540.015.02.002540.0-15.03.004040.0.0總數(shù)總數(shù)120統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)軟件操作:結(jié)果分析(軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性.004精確顯著性.003點(diǎn)概率.000統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)結(jié)果分析(結(jié)果分析(3)l結(jié)論:計(jì)算出的c2統(tǒng)計(jì)量的值為11.250,自由度為2,相應(yīng)的p值(

12、漸近顯著性)為0.004,小于a=0.05。所以檢驗(yàn)的結(jié)論是拒絕總體中消費(fèi)者對(duì)3種材料的偏好程度無差異的零假設(shè)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)特別說明特別說明l大樣本、每個(gè)單元中的期望頻數(shù)大于等于5時(shí)可以使用c2分布。 l小樣本時(shí)應(yīng)該按照精確方法計(jì)算得到的p值得出結(jié)論。lc2檢驗(yàn)也可以按照同樣的思想對(duì)正態(tài)分布或者任何想象的其他分布進(jìn)行檢驗(yàn),但主要用于對(duì)定性變量的檢驗(yàn)。另外,c2檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布的比較。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)lc2擬合優(yōu)度檢驗(yàn)對(duì)定類變量用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)lK-S擬合優(yōu)度檢驗(yàn)l中位數(shù)的符號(hào)檢驗(yàn)檢驗(yàn)分布統(tǒng)計(jì)學(xué)非參

13、數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l單樣本K-S檢驗(yàn)檢驗(yàn)總體分布是否為理論分布(正態(tài)、Possion、均勻、指數(shù))是以兩位蘇聯(lián)數(shù)學(xué)家Kolmogorov 和 Smirnov 命名的,全稱為Kolmogorov- Smirnov檢驗(yàn)。通過對(duì)兩個(gè)分布差異的分析確定能否認(rèn)為樣本的觀察值來自所設(shè)定的理論分布總體。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l定義 ,顯然若對(duì)每一個(gè)x值來說,如果經(jīng)驗(yàn)分布函數(shù)與特定分布函數(shù)的擬合程度很高,則有理由認(rèn)為樣本數(shù)據(jù)來自具有該理論分布的總體。l檢驗(yàn)統(tǒng)計(jì)量:l根據(jù)檢驗(yàn)統(tǒng)計(jì)量的精確分布或漸進(jìn)分布,可以計(jì)算出假設(shè)檢驗(yàn)的p值,從而得出檢驗(yàn)的結(jié)論。()()niiDF xF xmaxmax( )(

14、)niiDF xF x統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lSPSS K-S檢驗(yàn)中檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lSPSS K-S檢驗(yàn)中p值的計(jì)算統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l有100名兒童每周看電視時(shí)間的數(shù)據(jù)(數(shù)據(jù)文件:電視時(shí)間.sav)。檢驗(yàn)?zāi)芊裾J(rèn)為總體中兒童每周看電視的時(shí)間服從正態(tài)分布(顯著性水平a=0.05)。l這里K-S檢驗(yàn)的零假設(shè)和備擇假設(shè)為:H0:總體中兒童每周看電視的時(shí)間服從正態(tài)分布。H1:總體中兒童每周看電視的時(shí)間不服從正態(tài)分布。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析” “非參數(shù)檢驗(yàn)”“1

15、樣本K-S”,在彈出的對(duì)話框中將“時(shí)間”設(shè)定為檢驗(yàn)變量;檢驗(yàn)分布為默認(rèn)的“常規(guī)”(正態(tài)分布)。單擊 “確定”統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)時(shí)間N100正態(tài)參數(shù)a,b均值27.191標(biāo)準(zhǔn)差8.3728最極端差別絕對(duì)值.096正.096負(fù)-.039Kolmogorov-Smirnov Z.960漸近顯著性(雙側(cè)).315統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l檢驗(yàn)結(jié)論相應(yīng)的p值(漸近顯著性)為0.315。由于0.315大于0.05,所以在5%的顯著性水平下不能拒絕原假設(shè),也就是說根據(jù)樣本數(shù)據(jù)不能認(rèn)為總體分布是非正態(tài)的。注意這里并不能得出總體服從正態(tài)分布的嚴(yán)格結(jié)論。總體服從正態(tài)分布的結(jié)論可能犯第二類錯(cuò)誤

16、(取偽錯(cuò)誤),這個(gè)概率是未知的,在有些情況下可能會(huì)很大。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l特別聲明在K-S檢驗(yàn)中如果使用的是小樣本,則根據(jù)漸進(jìn)分布計(jì)算p值的誤差會(huì)增大。這時(shí)應(yīng)該通過相應(yīng)的設(shè)定要求軟件輸出精確檢驗(yàn)的p值,根據(jù)精確檢驗(yàn)的p值得出檢驗(yàn)結(jié)論。K-S檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布是否一致的檢驗(yàn)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)單樣本的非參數(shù)檢驗(yàn)lc2擬合優(yōu)度檢驗(yàn)對(duì)定類變量用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)lK-S擬合優(yōu)度檢驗(yàn)檢驗(yàn)總體分布形態(tài)l中位數(shù)的符號(hào)檢驗(yàn)對(duì)中位數(shù)的推斷統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l單樣本中位數(shù)的檢驗(yàn)秩符號(hào)檢驗(yàn)Wilcoxon符號(hào)秩檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)

17、計(jì)學(xué)非參數(shù)檢驗(yàn)l秩(rank)是指全部觀察值按某種順序排列的位序;通常是將數(shù)據(jù)按照升冪排列之后,每個(gè)觀測值的位置,秩次在一定程度上反映了等級(jí)的高低。下面一行Ri就是上面一行數(shù)據(jù)Xi的秩。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l數(shù)據(jù)中有相同的數(shù)值,稱為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均值Xi159173178513719Ri758.518.54263105 . 8298統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)A組: 、 、+、+、+、+、+、+、+、+、+、+ - + + + + + + + + + + 1 2 3 4 5 6 7 8 9 10 11 12 1 2 4.5 4.5 4.5 4.5 8.5 8

18、.5 8.5 8.5 11.5 11.5平均秩次平均秩次=(3+6)/2=4.5統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。l多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒有涉及秩的性質(zhì)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l符號(hào)檢驗(yàn)(sign test)在非正態(tài)總體小樣本的情況下,如果要對(duì)總體分布的位置進(jìn)行推斷,由于t檢驗(yàn)不適用,也可使用符號(hào)檢驗(yàn)的方法。在數(shù)據(jù)呈偏態(tài)分布的情況下,我們可能對(duì)總體的中位數(shù)更感興趣,希望對(duì)總體的中位數(shù)作出推斷,這時(shí)可以使用符號(hào)檢驗(yàn)的方法。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l例6.3 在某

19、地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。 (數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?01:5000:5000eeHMHM統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l符號(hào)檢驗(yàn)的基本思想:每個(gè)數(shù)據(jù)都減去零假設(shè)中的中位數(shù),記錄其差值的符號(hào)。計(jì)算正、負(fù)符號(hào)的個(gè)數(shù)(差值為0的不計(jì)算在任何一個(gè)中)當(dāng)原假設(shè)為真時(shí)二者應(yīng)該很接近;若兩者相差太遠(yuǎn),就有理由拒絕原假設(shè)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l檢驗(yàn)統(tǒng)計(jì)量原假設(shè)成立時(shí),檢驗(yàn)統(tǒng)計(jì)量S服從二項(xiàng)分布。根據(jù)二項(xiàng)分布計(jì)算得到p值,從而得出檢驗(yàn)的結(jié)論。當(dāng)正號(hào)和負(fù)號(hào)個(gè)數(shù)之和大于

20、25時(shí),可以按照正態(tài)分布進(jìn)行近似計(jì)算。min()SSS,( ,0.5)SB nnSS(0.5) 2(0,1) 2SnZNn統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l例6.3 在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。 (數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?01:5000:5000eeHMHM統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l在SPSS中打開數(shù)據(jù)文件。為了對(duì)中位數(shù)進(jìn)行檢驗(yàn),先在SPSS中生成一個(gè)新的變量Median,取值為5000:單擊“轉(zhuǎn)換”“計(jì)算變量”,在彈出的對(duì)話框中按照?qǐng)D6-3進(jìn)行設(shè)置,單擊確定。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)

21、非參數(shù)檢驗(yàn)l選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話框中將“Median”和“家庭月收入”設(shè)定檢驗(yàn)的一對(duì)變量;選中“符號(hào)檢驗(yàn)”,取消選擇“Wilcoxon”,單擊 “確定” 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l用正態(tài)分布進(jìn)行近似計(jì)算時(shí),Z統(tǒng)計(jì)量的值為-0.129,雙側(cè)檢驗(yàn)的p值為0.897。由于p值大于0.05,檢驗(yàn)的結(jié)論是不能拒絕原假設(shè),即沒有充分證據(jù)證明中位數(shù)不等于5000。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l特別聲明如果樣本量較小,則需要使用軟件輸出的精確檢驗(yàn)的p值進(jìn)行推斷在小樣本時(shí),如果要求進(jìn)行精確檢驗(yàn),SPSS會(huì)自動(dòng)按照二項(xiàng)分布進(jìn)行概率計(jì)算

22、。 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lWilcoxon符號(hào)秩檢驗(yàn)符號(hào)檢驗(yàn)只用到差值的符號(hào),而對(duì)差值數(shù)值的大小未能考慮,因而失去了部分信息。Wilcoxon符號(hào)秩檢驗(yàn)既考慮差值的符號(hào),又考慮差值的大小,因此在所需的假設(shè)條件滿足時(shí)其功效比符號(hào)檢驗(yàn)高。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lWilcoxon符號(hào)秩檢驗(yàn)計(jì)算差值絕對(duì)值的秩 。將差值絕對(duì)值從小到大排序,其位次就是的秩(rank),等于0值不參與排序。分別計(jì)算出差值序列中正數(shù)的秩和W+以及負(fù)數(shù)的秩和W- 。顯然,如果零假設(shè)成立,W+與W-應(yīng)該比較接近。如果二者過大或過小,則說明零假設(shè)不成立。 將正數(shù)的秩和或者負(fù)數(shù)的秩作為檢驗(yàn)統(tǒng)計(jì)量,根據(jù)其統(tǒng)計(jì)分布

23、計(jì)算p值,從而可以得出檢驗(yàn)的結(jié)論。 前提假設(shè):樣本點(diǎn)來自連續(xù)對(duì)稱總體分布統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lWilcoxon符號(hào)秩檢驗(yàn)計(jì)算 ,將其按照大小排序,得到 的秩;把 的正負(fù)號(hào)加到相應(yīng)的秩上;計(jì)算計(jì)算檢驗(yàn)統(tǒng)計(jì)量做出判斷,W太小時(shí),決絕零假設(shè)01:5000:5000eeHMHMeimx eimx iexm0()ieiixmWrank xm0()ieiixmWrank xm),min(WWW統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)第六章第六章 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)l非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用l單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)、K-S檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)及

24、Wilcoxon符號(hào)秩檢驗(yàn)l兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)兩個(gè)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn) 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l匹配樣本的非參數(shù)檢驗(yàn)如果t檢驗(yàn)的假設(shè)條件不滿足,t檢驗(yàn)就不適用了。符號(hào)檢驗(yàn)和Wilcoxon符號(hào)秩檢驗(yàn)都可以用做替代的檢驗(yàn)方法。 用樣本數(shù)據(jù)中對(duì)應(yīng)的數(shù)值相減得到新的序列 :零假設(shè):差值總體的中位數(shù)=0;備擇假設(shè):差值總體的中位數(shù)0。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l例6.4 從實(shí)施適時(shí)管理(JIT)的企業(yè)中隨機(jī)抽取1

25、0家進(jìn)行效益分析,得到它們在實(shí)施JIT前后三年的平均資產(chǎn)報(bào)酬率(數(shù)據(jù)文件: JIT管理.sav)。在5的顯著性水平下企業(yè)在實(shí)施JIT前后的資產(chǎn)報(bào)酬率是否有顯著差異? 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話框中將“JIT后”和“JIT前”設(shè)定檢驗(yàn)的一對(duì)變量;選中“Wilcoxon”和“符號(hào)檢驗(yàn)”。由于這里樣本量很小,我們要求進(jìn)行精確檢驗(yàn):單擊對(duì)話框中的“精確”,選中彈出對(duì)話框中的“精確”,單擊“繼續(xù)”、“確定” 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l符號(hào)檢驗(yàn)結(jié)果(1)NJIT前 - JI

26、T后 負(fù)差分a7正差分b3結(jié)c0總數(shù)10統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l符號(hào)檢驗(yàn)結(jié)果(2)l結(jié)論:不能拒絕零假設(shè) ,沒有證據(jù)表明小于企業(yè)在實(shí)施JIT前后的資產(chǎn)報(bào)酬率有顯著變化 JIT前 - JIT后精確顯著性(雙側(cè)).344a精確顯著性(單側(cè)).172點(diǎn)概率.117統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lWilcoxon符號(hào)秩檢驗(yàn)結(jié)果(1)N秩均值秩和JIT前 - JIT后負(fù)秩7a4.3630.50正秩3b8.1724.50結(jié)0c總數(shù)10統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)lWilcoxon符號(hào)秩檢驗(yàn)結(jié)果(2)JIT前 - JIT后Z-.307a漸近顯著性(雙側(cè)).759精確顯著性(雙側(cè)).787精確

27、顯著性(單側(cè)).394點(diǎn)概率.020統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)在兩個(gè)獨(dú)立樣本的t檢驗(yàn)不適用時(shí),Wlicoxon秩和檢驗(yàn)可以作為一種替代的非參數(shù)檢驗(yàn)方法使用。這一檢驗(yàn)可以用來對(duì)兩個(gè)總體的中位數(shù)進(jìn)行檢驗(yàn)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l基本原理如果兩個(gè)總體具有相似的分布形狀,并且中位數(shù)相同,那么由m個(gè)x、n個(gè)y組成的m十nN個(gè)觀察值可以被看作來自同一總體的一個(gè)隨機(jī)樣本。將全部x和y從小到大排序確定每個(gè)數(shù)值的秩,然后計(jì)算m個(gè)x的秩的和W x 、n個(gè)y的秩的和W y 。由于抽樣的隨機(jī)性,x、y應(yīng)較均勻地分布在混合排列的樣本中。如果零假設(shè)成立,在樣本量相同

28、的情況下兩個(gè)秩和應(yīng)該比較接近;樣本量不同的情況下平均秩和的平均秩應(yīng)該比較接近。否則就說明兩個(gè)總體的中位數(shù)是不相等的。 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l由于對(duì)稱性,兩個(gè)秩和W x、 W y都可以用作Wilcoxon秩和檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。lSPSS軟件中使用的是平均秩較小的一組的秩和。l統(tǒng)計(jì)量W的統(tǒng)計(jì)分布可以精確推導(dǎo)出來l在樣本量較大時(shí)(m和n都不小于10)可以用正態(tài)分布來進(jìn)行近似。l得到p值之后,再通過比較p值和a的大小得出結(jié)論。 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l相關(guān)說明由于Wilcoxon秩和檢驗(yàn)與Mann和Whitney提出的U檢驗(yàn)完全等價(jià),因此這種方法也被稱為Wlicoxon-Mann

29、-Whitney檢驗(yàn),或者M(jìn)ann-Whitney U檢驗(yàn)。在樣本量較小時(shí),應(yīng)當(dāng)使用精確檢驗(yàn)的結(jié)果嚴(yán)格來說用Wilcoxon秩和檢驗(yàn)對(duì)中位數(shù)進(jìn)行假設(shè)檢驗(yàn),需要假定兩個(gè)總體分布有類似的形狀才能得出可靠的結(jié)論。 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l例6.5 已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和15名研究生的月收入(元) (數(shù)據(jù)文件:本科研究生收入.sav) ,試比較本科生和研究生的收入水平(顯著性水平a=0.05)。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l分析由于收入一般是右偏分布,因此不適合用t檢驗(yàn)進(jìn)行分析。我們用Wilcoxon秩和檢驗(yàn)來比較兩個(gè)總體的中位數(shù)。檢驗(yàn)的零假設(shè)和備擇假設(shè)如下:H0:

30、本科和研究生月收入的中位數(shù)相等;H1:本科和研究生月收入的中位數(shù)不相等。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l在SPSS軟件中打開數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)獨(dú)立樣本”,在彈出的對(duì)話框中將“月收入”設(shè)定為檢驗(yàn)變量,“學(xué)歷”設(shè)定為分組變量,然后單擊“定義組”,按照“學(xué)歷”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”,檢驗(yàn)類型使用默認(rèn)“Mann-Whitney U”,單擊 “確定” 統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l結(jié)果分析:學(xué)歷N秩均值秩和月收入本科2013.55271.00研究生1523.93359.00總數(shù)35統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l根據(jù)精確檢驗(yàn)的p值,在顯著性水平大于0.002時(shí)我

31、們應(yīng)該拒絕原假設(shè),結(jié)論是本科與研究生的收入的中位數(shù)不相等。月收入Mann-Whitney U61.000Wilcoxon W271.000Z-2.967漸近顯著性(雙側(cè)).003精確顯著性2*(單側(cè)顯著性).002a統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)Kruskal-Wallis檢驗(yàn)是Wlicoxon秩和檢驗(yàn)的推廣,用來對(duì)多個(gè)總體的中位數(shù)進(jìn)行比較。在單因素方差分析模型不適用于所研究的問題時(shí),Kruskal-Wallis往往是一種可以替代的非參數(shù)檢驗(yàn)方法。統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)l基本原理Kruskal-Wallis檢驗(yàn)也是根據(jù)秩和來構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的。將所有樣本的數(shù)據(jù)合在一起,從小到大排序得到每個(gè)數(shù)值的秩,然后計(jì)算各樣本的秩和以及平均秩。如果各組沒有顯著性差異,則各組的平均秩應(yīng)該趨于相等;如果各組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論