版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章非參數(shù)檢驗(yàn)第六章非參數(shù)檢驗(yàn)方法的回顧單個(gè)因素(兩水平)的作用評(píng)價(jià):兩組比較完全隨機(jī)設(shè)計(jì)下的單因素兩組比較匹配設(shè)計(jì)的兩組比較單個(gè)因素(多水平)的作用評(píng)價(jià):多組比較完全隨機(jī)設(shè)計(jì)下的單因素多水平比較兩個(gè)因素的分析問(wèn)題無(wú)交互作用、有交互作用方法的回顧單個(gè)因素(兩水平)的作用評(píng)價(jià):兩組比較單因素兩組比較:t檢驗(yàn)完全隨機(jī)兩組均數(shù)比較的t檢驗(yàn)(獨(dú)立t檢驗(yàn))匹配設(shè)計(jì)下兩組均數(shù)比較的t檢驗(yàn)(匹配t檢驗(yàn))單因素多組比較:方差分析完全隨機(jī)設(shè)計(jì)下的多組均數(shù)比較單因素兩組比較:t檢驗(yàn)局限性t檢驗(yàn)獨(dú)立t檢驗(yàn)要求:正態(tài)、方差相等(或不相等)、個(gè)體獨(dú)立匹配t檢驗(yàn)要求:差值正態(tài)、個(gè)體獨(dú)立方差分析單因素多水平比較方差分析要求:正態(tài)、方差相等、個(gè)體獨(dú)立局限性t檢驗(yàn)未解決問(wèn)題兩組性別結(jié)構(gòu)是否相同?療效用痊愈、顯效、有效、無(wú)效四級(jí)分類(lèi)法進(jìn)行評(píng)價(jià)時(shí),兩組或多組如何比較?如何檢驗(yàn)樣本數(shù)據(jù)來(lái)自的總體服從正態(tài)分布?總體不是正態(tài)分布,小樣本情況下,如何檢驗(yàn)總體的集中趨勢(shì)?有6名歌手參加比賽,4名評(píng)委進(jìn)行評(píng)判打分,推斷評(píng)委的評(píng)判標(biāo)準(zhǔn)是否一致……未解決問(wèn)題兩組性別結(jié)構(gòu)是否相同?參數(shù)檢驗(yàn):樣本被視為從分布族的某個(gè)參數(shù)族抽取出來(lái)的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值推斷問(wèn)題就轉(zhuǎn)化為對(duì)分布族的若干個(gè)未知參數(shù)的估計(jì)問(wèn)題,用樣本對(duì)這些參數(shù)做出估計(jì)或者進(jìn)行某種形式的假設(shè)檢驗(yàn),這類(lèi)推斷方法稱(chēng)為參數(shù)方法。參數(shù)檢驗(yàn):非參數(shù)檢驗(yàn)(nonparametrictests)又稱(chēng)為任意分布檢驗(yàn)(distribution-freetest),它不考慮研究對(duì)象總體分布具體形式,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷僅僅依賴(lài)于數(shù)據(jù)觀(guān)測(cè)值的相對(duì)大小(秩)等,而是通過(guò)檢驗(yàn)樣本所代表的總體分布形式是否一致來(lái)得出統(tǒng)計(jì)結(jié)論。非參數(shù)檢驗(yàn)(nonparametrictests)非參數(shù)統(tǒng)計(jì)的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);它被稱(chēng)為“和分布無(wú)關(guān)”(distribution—free),是因?yàn)槠渫茢喾椒ê涂傮w分布無(wú)關(guān);不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無(wú)關(guān).非參數(shù)統(tǒng)計(jì)的名字中的“非參數(shù)(nonparametric)”對(duì)總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。假定較少不需要對(duì)總體參數(shù)的假定與參數(shù)結(jié)果接近針對(duì)幾乎所有類(lèi)型的數(shù)據(jù)形態(tài)。容易計(jì)算在計(jì)算機(jī)盛行之前就已經(jīng)發(fā)展起來(lái)。非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)對(duì)總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。非參數(shù)檢驗(yàn)的可能會(huì)浪費(fèi)一些信息特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型的時(shí)候大樣本手算相當(dāng)麻煩一些表不易得到非參數(shù)檢驗(yàn)的弱點(diǎn)可能會(huì)浪費(fèi)一些信息非參數(shù)檢驗(yàn)的弱點(diǎn)已知總體分布類(lèi)型,對(duì)未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷依賴(lài)于特定分布類(lèi)型,比較的是參數(shù)
參數(shù)檢驗(yàn)(parametrictest)
非參數(shù)檢驗(yàn)(nonparametrictest)對(duì)總體的分布類(lèi)型不作嚴(yán)格要求不受分布類(lèi)型的影響,比較的是總體分布位置
優(yōu)點(diǎn):方法簡(jiǎn)便、易學(xué)易用,易于推廣使用、應(yīng)用范圍廣;可用于參數(shù)檢驗(yàn)難以處理的資料(如等級(jí)資料,或含數(shù)值“>50mg”等
)缺點(diǎn):方法比較粗糙,對(duì)于符合參數(shù)檢驗(yàn)條件者,采用非參數(shù)檢驗(yàn)會(huì)損失部分信息,其檢驗(yàn)效能較低;樣本含量較大時(shí),兩者結(jié)論常相同已知總體分布類(lèi)型,對(duì)未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷依賴(lài)于特定分布類(lèi)型,非參數(shù)檢驗(yàn)的特點(diǎn)非參數(shù)檢驗(yàn)不需要嚴(yán)格假設(shè)條件,因而比參數(shù)檢驗(yàn)有更廣泛的適用面。非參數(shù)檢驗(yàn)幾乎可以處理包括定類(lèi)數(shù)據(jù)和定序數(shù)據(jù)在內(nèi)的所有類(lèi)型的數(shù)據(jù),而參數(shù)檢驗(yàn)通常只能用于定量數(shù)據(jù)的分析。在參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)都可以使用的情況下,非參數(shù)檢驗(yàn)的功效(power)要低于參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)的特點(diǎn)非參數(shù)檢驗(yàn)不需要嚴(yán)格假設(shè)條件,因而比參數(shù)檢驗(yàn)以下情況下應(yīng)當(dāng)首選非參數(shù)方法參數(shù)檢驗(yàn)中的假設(shè)條件不滿(mǎn)足,從而無(wú)法應(yīng)用。例如總體分布為偏態(tài)或分布形式未知,且樣本為小樣本時(shí)。檢驗(yàn)中涉及的數(shù)據(jù)為定類(lèi)或定序數(shù)據(jù)。所涉及的問(wèn)題中并不包含參數(shù),如判斷某樣本是否來(lái)自正態(tài)分布等,判斷某樣本是否為隨機(jī)樣本。以下情況下應(yīng)當(dāng)首選非參數(shù)方法參數(shù)檢驗(yàn)中的假設(shè)條件不滿(mǎn)足,從而常用的非參數(shù)檢驗(yàn)方法用于單個(gè)樣本的c2擬合優(yōu)度檢驗(yàn)、K-S擬合優(yōu)度檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)用于兩個(gè)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)用于兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)用于多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)。常用的非參數(shù)檢驗(yàn)方法用于單個(gè)樣本的c2擬合優(yōu)度檢驗(yàn)、K-S擬第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用單樣本的非參數(shù)檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)K-S擬合優(yōu)度檢驗(yàn)中位數(shù)的符號(hào)檢驗(yàn)分類(lèi)數(shù)據(jù)檢驗(yàn)分布對(duì)中位數(shù)的推斷單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)分類(lèi)數(shù)據(jù)檢驗(yàn)分布對(duì)中位數(shù)的c2統(tǒng)計(jì)量用來(lái)測(cè)定定類(lèi)變量之間的相關(guān)程度c2統(tǒng)計(jì)量的分布與自由度有關(guān);c2統(tǒng)計(jì)量描述了觀(guān)察值與期望值的接近程度c2統(tǒng)計(jì)量擬合優(yōu)度檢驗(yàn)(goodnessoffittest)用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)的重要內(nèi)容之一;依據(jù)總體分布狀況,計(jì)算出分類(lèi)變量中各類(lèi)別的期望頻數(shù),與分布的觀(guān)察頻數(shù)進(jìn)行對(duì)比,判斷期望頻數(shù)與觀(guān)察頻數(shù)是否有顯著差異,從而達(dá)到對(duì)分類(lèi)變量進(jìn)行分析的目的。擬合優(yōu)度檢驗(yàn)(goodnessoffittest)1912年4月15日,豪華巨輪泰坦尼克號(hào)與冰山相撞沉沒(méi)。當(dāng)時(shí)船上共有2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以顯著性水平為0.1檢驗(yàn)存活狀況與性別是否有關(guān)?1912年4月15日,豪華巨輪泰坦尼克號(hào)與冰山相撞沉沒(méi)。當(dāng)時(shí)提出零假設(shè)和備擇假設(shè)H0:觀(guān)察頻數(shù)與期望頻數(shù)一致H1:觀(guān)察頻數(shù)與期望頻數(shù)不一致計(jì)算期望頻數(shù)男性的期望頻數(shù),女性為153人計(jì)量c2統(tǒng)計(jì)量查表(自由度為類(lèi)別數(shù)-1)做出判斷:決絕原假設(shè),認(rèn)為存活狀況與性別顯著相關(guān)提出零假設(shè)和備擇假設(shè)一種飲料的容器材料可以選擇玻璃、塑料或者金屬。為了比較消費(fèi)者對(duì)包裝材料的偏好,抽樣調(diào)查了120名消費(fèi)者發(fā)現(xiàn),最喜歡玻璃、塑料和金屬容器的分別有55、25和40人。根據(jù)調(diào)查結(jié)果,能否認(rèn)為消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的(顯著性水平a=0.05)?一種飲料的容器材料可以選擇玻璃、塑料或者金屬。分析如果消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的,也就是說(shuō)消費(fèi)者對(duì)材料的偏好服從均勻分布,則理論上來(lái)說(shuō),調(diào)查120名消費(fèi)者,偏好每種材料的人數(shù)應(yīng)該是相等的,也就是40人。各組觀(guān)測(cè)到的人數(shù)與理論人數(shù)(期望值)之間的差異應(yīng)該都是由于抽樣的隨機(jī)性造成的,因此不應(yīng)該太大。如果二者之間的差異特別大,則說(shuō)明我們所作的假設(shè)(消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的)很可能不成立。分析如果消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的,也就是說(shuō)消費(fèi)者檢驗(yàn)統(tǒng)計(jì)量k是樣本分類(lèi)的個(gè)數(shù),表示實(shí)際觀(guān)察到的頻數(shù),表示理論頻數(shù)。觀(guān)察頻數(shù)與期望頻數(shù)越接近,則c2值越小。根據(jù)皮爾遜定理,當(dāng)n充分大時(shí),c2統(tǒng)計(jì)量漸近服從于k-1個(gè)自由度的c2分布。檢驗(yàn)統(tǒng)計(jì)量軟件操作:數(shù)據(jù)錄入軟件操作:數(shù)據(jù)錄入軟件操作:方法設(shè)定選擇“分析”“非參數(shù)檢驗(yàn)”“卡方”,在彈出的對(duì)話(huà)框中將“材料”設(shè)定為檢驗(yàn)變量;單擊對(duì)話(huà)框中的“精確…”,選中彈出對(duì)話(huà)框中的“精確”,單擊“繼續(xù)”、“確定”軟件操作:方法設(shè)定選擇“分析”“非參數(shù)檢驗(yàn)”“卡方”,在軟件操作:結(jié)果分析(1)觀(guān)察數(shù)期望數(shù)殘差1.005540.015.02.002540.0-15.03.004040.0.0總數(shù)120軟件操作:結(jié)果分析(1)觀(guān)察數(shù)期望數(shù)殘差1.005540.0軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性.004精確顯著性.003點(diǎn)概率.000軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性結(jié)果分析(3)結(jié)論:計(jì)算出的c2統(tǒng)計(jì)量的值為11.250,自由度為2,相應(yīng)的p值(漸近顯著性)為0.004,小于a=0.05。所以檢驗(yàn)的結(jié)論是拒絕總體中消費(fèi)者對(duì)3種材料的偏好程度無(wú)差異的零假設(shè)。結(jié)果分析(3)結(jié)論:計(jì)算出的c2統(tǒng)計(jì)量的值為11.250,自特別說(shuō)明大樣本、每個(gè)單元中的期望頻數(shù)大于等于5時(shí)可以使用c2分布。小樣本時(shí)應(yīng)該按照精確方法計(jì)算得到的p值得出結(jié)論。c2檢驗(yàn)也可以按照同樣的思想對(duì)正態(tài)分布或者任何想象的其他分布進(jìn)行檢驗(yàn),但主要用于對(duì)定性變量的檢驗(yàn)。另外,c2檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布的比較。特別說(shuō)明大樣本、每個(gè)單元中的期望頻數(shù)大于等于5時(shí)可以使用c2單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)對(duì)定類(lèi)變量用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)K-S擬合優(yōu)度檢驗(yàn)中位數(shù)的符號(hào)檢驗(yàn)檢驗(yàn)分布單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)檢驗(yàn)分布單樣本K-S檢驗(yàn)檢驗(yàn)總體分布是否為理論分布(正態(tài)、Possion、均勻、指數(shù))是以?xún)晌惶K聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov命名的,全稱(chēng)為Kolmogorov-Smirnov檢驗(yàn)。通過(guò)對(duì)兩個(gè)分布差異的分析確定能否認(rèn)為樣本的觀(guān)察值來(lái)自所設(shè)定的理論分布總體。單樣本K-S檢驗(yàn)定義,顯然若對(duì)每一個(gè)x值來(lái)說(shuō),如果經(jīng)驗(yàn)分布函數(shù)與特定分布函數(shù)的擬合程度很高,則有理由認(rèn)為樣本數(shù)據(jù)來(lái)自具有該理論分布的總體。檢驗(yàn)統(tǒng)計(jì)量:根據(jù)檢驗(yàn)統(tǒng)計(jì)量的精確分布或漸進(jìn)分布,可以計(jì)算出假設(shè)檢驗(yàn)的p值,從而得出檢驗(yàn)的結(jié)論。定義SPSSK-S檢驗(yàn)中檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算SPSSK-S檢驗(yàn)中檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算SPSSK-S檢驗(yàn)中p值的計(jì)算SPSSK-S檢驗(yàn)中p值的計(jì)算有100名兒童每周看電視時(shí)間的數(shù)據(jù)(數(shù)據(jù)文件:電視時(shí)間.sav)。檢驗(yàn)?zāi)芊裾J(rèn)為總體中兒童每周看電視的時(shí)間服從正態(tài)分布(顯著性水平a=0.05)。這里K-S檢驗(yàn)的零假設(shè)和備擇假設(shè)為:H0:總體中兒童每周看電視的時(shí)間服從正態(tài)分布。H1:總體中兒童每周看電視的時(shí)間不服從正態(tài)分布。有100名兒童每周看電視時(shí)間的數(shù)據(jù)(數(shù)據(jù)文件:電視時(shí)間.sa統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“1樣本K-S”,在彈出的對(duì)話(huà)框中將“時(shí)間”設(shè)定為檢驗(yàn)變量;檢驗(yàn)分布為默認(rèn)的“常規(guī)”(正態(tài)分布)。單擊“確定”在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)時(shí)間N100正態(tài)參數(shù)a,,b均值27.191標(biāo)準(zhǔn)差8.3728最極端差別絕對(duì)值.096正.096負(fù)-.039Kolmogorov-SmirnovZ.960漸近顯著性(雙側(cè)).315時(shí)間N100正態(tài)參數(shù)a,,b均值27.191標(biāo)準(zhǔn)差8.372檢驗(yàn)結(jié)論相應(yīng)的p值(漸近顯著性)為0.315。由于0.315大于0.05,所以在5%的顯著性水平下不能拒絕原假設(shè),也就是說(shuō)根據(jù)樣本數(shù)據(jù)不能認(rèn)為總體分布是非正態(tài)的。注意這里并不能得出總體服從正態(tài)分布的嚴(yán)格結(jié)論??傮w服從正態(tài)分布的結(jié)論可能犯第二類(lèi)錯(cuò)誤(取偽錯(cuò)誤),這個(gè)概率是未知的,在有些情況下可能會(huì)很大。檢驗(yàn)結(jié)論特別聲明在K-S檢驗(yàn)中如果使用的是小樣本,則根據(jù)漸進(jìn)分布計(jì)算p值的誤差會(huì)增大。這時(shí)應(yīng)該通過(guò)相應(yīng)的設(shè)定要求軟件輸出精確檢驗(yàn)的p值,根據(jù)精確檢驗(yàn)的p值得出檢驗(yàn)結(jié)論。K-S檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布是否一致的檢驗(yàn)。特別聲明單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)對(duì)定類(lèi)變量用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)K-S擬合優(yōu)度檢驗(yàn)檢驗(yàn)總體分布形態(tài)中位數(shù)的符號(hào)檢驗(yàn)對(duì)中位數(shù)的推斷單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)對(duì)中位數(shù)的推斷單樣本中位數(shù)的檢驗(yàn)秩符號(hào)檢驗(yàn)Wilcoxon符號(hào)秩檢驗(yàn)單樣本中位數(shù)的檢驗(yàn)秩(rank)是指全部觀(guān)察值按某種順序排列的位序;通常是將數(shù)據(jù)按照升冪排列之后,每個(gè)觀(guān)測(cè)值的位置,秩次在一定程度上反映了等級(jí)的高低。下面一行Ri就是上面一行數(shù)據(jù)Xi的秩。秩(rank)數(shù)據(jù)中有相同的數(shù)值,稱(chēng)為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均值Xi159173178513719Ri758.518.5426310數(shù)據(jù)中有相同的數(shù)值,稱(chēng)為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均A組:-、、+、+、+、+、++、++、++、++、+++、+++-±++++++++++++++++++
123456789101112
124.54.54.5
4.5
8.58.58.58.5
11.511.5平均秩次=(3+6)/2=4.5A組:-、、+、+、+、+、++、++、++、++、利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參符號(hào)檢驗(yàn)(signtest)在非正態(tài)總體小樣本的情況下,如果要對(duì)總體分布的位置進(jìn)行推斷,由于t檢驗(yàn)不適用,也可使用符號(hào)檢驗(yàn)的方法。在數(shù)據(jù)呈偏態(tài)分布的情況下,我們可能對(duì)總體的中位數(shù)更感興趣,希望對(duì)總體的中位數(shù)作出推斷,這時(shí)可以使用符號(hào)檢驗(yàn)的方法。符號(hào)檢驗(yàn)(signtest)例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件符號(hào)檢驗(yàn)的基本思想:每個(gè)數(shù)據(jù)都減去零假設(shè)中的中位數(shù),記錄其差值的符號(hào)。計(jì)算正、負(fù)符號(hào)的個(gè)數(shù)(差值為0的不計(jì)算在任何一個(gè)中)當(dāng)原假設(shè)為真時(shí)二者應(yīng)該很接近;若兩者相差太遠(yuǎn),就有理由拒絕原假設(shè)。符號(hào)檢驗(yàn)的基本思想:檢驗(yàn)統(tǒng)計(jì)量原假設(shè)成立時(shí),檢驗(yàn)統(tǒng)計(jì)量S服從二項(xiàng)分布。根據(jù)二項(xiàng)分布計(jì)算得到p值,從而得出檢驗(yàn)的結(jié)論。當(dāng)正號(hào)和負(fù)號(hào)個(gè)數(shù)之和大于25時(shí),可以按照正態(tài)分布進(jìn)行近似計(jì)算。檢驗(yàn)統(tǒng)計(jì)量例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件在SPSS中打開(kāi)數(shù)據(jù)文件。為了對(duì)中位數(shù)進(jìn)行檢驗(yàn),先在SPSS中生成一個(gè)新的變量Median,取值為5000:?jiǎn)螕簟稗D(zhuǎn)換”“計(jì)算變量”,在彈出的對(duì)話(huà)框中按照?qǐng)D6-3進(jìn)行設(shè)置,單擊確定。在SPSS中打開(kāi)數(shù)據(jù)文件。為了對(duì)中位數(shù)進(jìn)行檢驗(yàn),先在SPSS選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話(huà)框中將“Median”和“家庭月收入”設(shè)定檢驗(yàn)的一對(duì)變量;選中“符號(hào)檢驗(yàn)”,取消選擇“Wilcoxon”,單擊“確定”
選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話(huà)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件用正態(tài)分布進(jìn)行近似計(jì)算時(shí),Z統(tǒng)計(jì)量的值為-0.129,雙側(cè)檢驗(yàn)的p值為0.897。由于p值大于0.05,檢驗(yàn)的結(jié)論是不能拒絕原假設(shè),即沒(méi)有充分證據(jù)證明中位數(shù)不等于5000。用正態(tài)分布進(jìn)行近似計(jì)算時(shí),Z統(tǒng)計(jì)量的值為-0.129,雙側(cè)檢特別聲明如果樣本量較小,則需要使用軟件輸出的精確檢驗(yàn)的p值進(jìn)行推斷在小樣本時(shí),如果要求進(jìn)行精確檢驗(yàn),SPSS會(huì)自動(dòng)按照二項(xiàng)分布進(jìn)行概率計(jì)算。特別聲明Wilcoxon符號(hào)秩檢驗(yàn)符號(hào)檢驗(yàn)只用到差值的符號(hào),而對(duì)差值數(shù)值的大小未能考慮,因而失去了部分信息。Wilcoxon符號(hào)秩檢驗(yàn)既考慮差值的符號(hào),又考慮差值的大小,因此在所需的假設(shè)條件滿(mǎn)足時(shí)其功效比符號(hào)檢驗(yàn)高。Wilcoxon符號(hào)秩檢驗(yàn)Wilcoxon符號(hào)秩檢驗(yàn)計(jì)算差值絕對(duì)值的秩。將差值絕對(duì)值從小到大排序,其位次就是的秩(rank),等于0值不參與排序。分別計(jì)算出差值序列中正數(shù)的秩和W+以及負(fù)數(shù)的秩和W-。顯然,如果零假設(shè)成立,W+與W-應(yīng)該比較接近。如果二者過(guò)大或過(guò)小,則說(shuō)明零假設(shè)不成立。將正數(shù)的秩和或者負(fù)數(shù)的秩作為檢驗(yàn)統(tǒng)計(jì)量,根據(jù)其統(tǒng)計(jì)分布計(jì)算p值,從而可以得出檢驗(yàn)的結(jié)論。前提假設(shè):樣本點(diǎn)來(lái)自連續(xù)對(duì)稱(chēng)總體分布Wilcoxon符號(hào)秩檢驗(yàn)前提假設(shè):樣本點(diǎn)來(lái)自連續(xù)對(duì)稱(chēng)總體分Wilcoxon符號(hào)秩檢驗(yàn)計(jì)算,將其按照大小排序,得到的秩;把的正負(fù)號(hào)加到相應(yīng)的秩上;計(jì)算計(jì)算檢驗(yàn)統(tǒng)計(jì)量做出判斷,W太小時(shí),決絕零假設(shè)Wilcoxon符號(hào)秩檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)、K-S檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)及Wilcoxon符號(hào)秩檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)兩個(gè)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)匹配樣本的非參數(shù)檢驗(yàn)如果t檢驗(yàn)的假設(shè)條件不滿(mǎn)足,t檢驗(yàn)就不適用了。符號(hào)檢驗(yàn)和Wilcoxon符號(hào)秩檢驗(yàn)都可以用做替代的檢驗(yàn)方法。用樣本數(shù)據(jù)中對(duì)應(yīng)的數(shù)值相減得到新的序列:零假設(shè):差值總體的中位數(shù)=0;備擇假設(shè):差值總體的中位數(shù)≠0。匹配樣本的非參數(shù)檢驗(yàn)例6.4從實(shí)施適時(shí)管理(JIT)的企業(yè)中隨機(jī)抽取10家進(jìn)行效益分析,得到它們?cè)趯?shí)施JIT前后三年的平均資產(chǎn)報(bào)酬率(數(shù)據(jù)文件:JIT管理.sav)。在5%的顯著性水平下企業(yè)在實(shí)施JIT前后的資產(chǎn)報(bào)酬率是否有顯著差異?例6.4從實(shí)施適時(shí)管理(JIT)的企業(yè)中隨機(jī)抽取10家進(jìn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話(huà)框中將“JIT后”和“JIT前”設(shè)定檢驗(yàn)的一對(duì)變量;選中“Wilcoxon”和“符號(hào)檢驗(yàn)”。由于這里樣本量很小,我們要求進(jìn)行精確檢驗(yàn):?jiǎn)螕魧?duì)話(huà)框中的“精確…”,選中彈出對(duì)話(huà)框中的“精確”,單擊“繼續(xù)”、“確定”在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”符號(hào)檢驗(yàn)結(jié)果(1)NJIT前-JIT后負(fù)差分a7正差分b3結(jié)c0總數(shù)10符號(hào)檢驗(yàn)結(jié)果(1)NJIT前-JIT后負(fù)差分a7正差分b符號(hào)檢驗(yàn)結(jié)果(2)結(jié)論:不能拒絕零假設(shè),沒(méi)有證據(jù)表明小于企業(yè)在實(shí)施JIT前后的資產(chǎn)報(bào)酬率有顯著變化JIT前-JIT后精確顯著性(雙側(cè)).344a精確顯著性(單側(cè)).172點(diǎn)概率.117符號(hào)檢驗(yàn)結(jié)果(2)JIT前-JIT后精確顯著性(雙側(cè)).Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(1)N秩均值秩和JIT前-JIT后負(fù)秩7a4.3630.50正秩3b8.1724.50結(jié)0c總數(shù)10Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(1)N秩均值秩和JIT前-Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(2)JIT前-JIT后Z-.307a漸近顯著性(雙側(cè)).759精確顯著性(雙側(cè)).787精確顯著性(單側(cè)).394點(diǎn)概率.020Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(2)JIT前-JIT后Z兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)在兩個(gè)獨(dú)立樣本的t檢驗(yàn)不適用時(shí),Wlicoxon秩和檢驗(yàn)可以作為一種替代的非參數(shù)檢驗(yàn)方法使用。這一檢驗(yàn)可以用來(lái)對(duì)兩個(gè)總體的中位數(shù)進(jìn)行檢驗(yàn)。兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)基本原理如果兩個(gè)總體具有相似的分布形狀,并且中位數(shù)相同,那么由m個(gè)x、n個(gè)y組成的m十n=N個(gè)觀(guān)察值可以被看作來(lái)自同一總體的一個(gè)隨機(jī)樣本。將全部x和y從小到大排序確定每個(gè)數(shù)值的秩,然后計(jì)算m個(gè)x的秩的和Wx、n個(gè)y的秩的和Wy。由于抽樣的隨機(jī)性,x、y應(yīng)較均勻地分布在混合排列的樣本中。如果零假設(shè)成立,在樣本量相同的情況下兩個(gè)秩和應(yīng)該比較接近;樣本量不同的情況下平均秩和的平均秩應(yīng)該比較接近。否則就說(shuō)明兩個(gè)總體的中位數(shù)是不相等的?;驹碛捎趯?duì)稱(chēng)性,兩個(gè)秩和Wx、Wy都可以用作Wilcoxon秩和檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。SPSS軟件中使用的是平均秩較小的一組的秩和。統(tǒng)計(jì)量W的統(tǒng)計(jì)分布可以精確推導(dǎo)出來(lái)在樣本量較大時(shí)(m和n都不小于10)可以用正態(tài)分布來(lái)進(jìn)行近似。得到p值之后,再通過(guò)比較p值和a的大小得出結(jié)論。由于對(duì)稱(chēng)性,兩個(gè)秩和Wx、Wy都可以用作Wilcoxo相關(guān)說(shuō)明由于Wilcoxon秩和檢驗(yàn)與Mann和Whitney提出的U檢驗(yàn)完全等價(jià),因此這種方法也被稱(chēng)為Wlicoxon-Mann-Whitney檢驗(yàn),或者M(jìn)ann-WhitneyU檢驗(yàn)。在樣本量較小時(shí),應(yīng)當(dāng)使用精確檢驗(yàn)的結(jié)果嚴(yán)格來(lái)說(shuō)用Wilcoxon秩和檢驗(yàn)對(duì)中位數(shù)進(jìn)行假設(shè)檢驗(yàn),需要假定兩個(gè)總體分布有類(lèi)似的形狀才能得出可靠的結(jié)論。相關(guān)說(shuō)明例6.5已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和15名研究生的月收入(元)(數(shù)據(jù)文件:本科研究生收入.sav),試比較本科生和研究生的收入水平(顯著性水平a=0.05)。例6.5已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和分析由于收入一般是右偏分布,因此不適合用t檢驗(yàn)進(jìn)行分析。我們用Wilcoxon秩和檢驗(yàn)來(lái)比較兩個(gè)總體的中位數(shù)。檢驗(yàn)的零假設(shè)和備擇假設(shè)如下:H0:本科和研究生月收入的中位數(shù)相等;H1:本科和研究生月收入的中位數(shù)不相等。分析在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)獨(dú)立樣本”,在彈出的對(duì)話(huà)框中將“月收入”設(shè)定為檢驗(yàn)變量,“學(xué)歷”設(shè)定為分組變量,然后單擊“定義組”,按照“學(xué)歷”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”,檢驗(yàn)類(lèi)型使用默認(rèn)“Mann-WhitneyU”,單擊“確定”
在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”結(jié)果分析:學(xué)歷N秩均值秩和月收入本科2013.55271.00研究生1523.93359.00總數(shù)35結(jié)果分析:學(xué)歷N秩均值秩和月收入本科2013.55271.0根據(jù)精確檢驗(yàn)的p值,在顯著性水平大于0.002時(shí)我們應(yīng)該拒絕原假設(shè),結(jié)論是本科與研究生的收入的中位數(shù)不相等。月收入Mann-WhitneyU61.000WilcoxonW271.000Z-2.967漸近顯著性(雙側(cè)).003精確顯著性[2*(單側(cè)顯著性)].002a根據(jù)精確檢驗(yàn)的p值,在顯著性水平大于0.002時(shí)我們應(yīng)該拒絕多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)Kruskal-Wallis檢驗(yàn)是Wlicoxon秩和檢驗(yàn)的推廣,用來(lái)對(duì)多個(gè)總體的中位數(shù)進(jìn)行比較。在單因素方差分析模型不適用于所研究的問(wèn)題時(shí),Kruskal-Wallis往往是一種可以替代的非參數(shù)檢驗(yàn)方法。多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)基本原理Kruskal-Wallis檢驗(yàn)也是根據(jù)秩和來(lái)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的。將所有樣本的數(shù)據(jù)合在一起,從小到大排序得到每個(gè)數(shù)值的秩,然后計(jì)算各樣本的秩和以及平均秩。如果各組沒(méi)有顯著性差異,則各組的平均秩應(yīng)該趨于相等;如果各組的平均秩相差較大,則各組中位數(shù)有顯著性差異的可能性較大?;驹頇z驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量基本原理:當(dāng)樣本組數(shù)k,每組樣本樣本容量ni不是很小時(shí),檢驗(yàn)統(tǒng)計(jì)量H的抽樣分布近似服從自由度為k-1的c2分布。在k=3,n≤5時(shí),用c2分布近似的誤差較大,應(yīng)該使用精確檢驗(yàn)方法如果p值小于顯著性水平a,則拒絕零假設(shè),說(shuō)明k個(gè)總體中位數(shù)之間存在顯著差異基本原理:例5.1用單因素方差分析的方法對(duì)4個(gè)專(zhuān)業(yè)的平均起薪進(jìn)行了比較分析(數(shù)據(jù)文件起薪1.xls)。由于不確定總體是否服從正態(tài)分布,請(qǐng)使用Kruskal-Wallis檢驗(yàn)比較四個(gè)專(zhuān)業(yè)畢業(yè)生的起薪是否有顯著差異。H0:四個(gè)專(zhuān)業(yè)起薪的中位數(shù)都相等;H1:四個(gè)專(zhuān)業(yè)起薪的中位數(shù)不全相等。例5.1用單因素方差分析的方法對(duì)4個(gè)專(zhuān)業(yè)的平均起薪進(jìn)行了比較在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“k個(gè)獨(dú)立樣本”,在彈出的對(duì)話(huà)框中將“起薪”設(shè)定為檢驗(yàn)變量,“專(zhuān)業(yè)”設(shè)定為分組變量,然后單擊“定義組”,按照“專(zhuān)業(yè)”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”,檢驗(yàn)類(lèi)型使用默認(rèn)“Kruskal-WallisH”,單擊“確定”在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”結(jié)果分析(1)專(zhuān)業(yè)N秩均值起薪1617.502617.25369.42465.83總數(shù)24結(jié)果分析(1)專(zhuān)業(yè)N秩均值起薪1617.502617.253結(jié)論:p值為0.006。由于p值很小,所以有理由拒絕原假設(shè),即認(rèn)為這四個(gè)專(zhuān)業(yè)起薪的中位數(shù)不全相等。起薪卡方12.316df3漸近顯著性.006結(jié)論:p值為0.006。由于p值很小,所以有理由拒絕原假設(shè),特別說(shuō)明在樣本量較小時(shí),應(yīng)當(dāng)使用精確檢驗(yàn)的結(jié)果,根據(jù)c2分布進(jìn)行近似會(huì)有較大的誤差。嚴(yán)格來(lái)說(shuō)用Kruskal-Wallis檢驗(yàn)對(duì)多個(gè)總體的中位數(shù)進(jìn)行假設(shè)檢驗(yàn),需要假設(shè)多個(gè)總體分布有類(lèi)似的形狀才能得出可靠的結(jié)論。特別說(shuō)明第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)、K-S檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)及Wilcoxon符號(hào)秩檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)、兩個(gè)獨(dú)立樣本的Wilcoxon秩和檢驗(yàn),多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述小結(jié)非參數(shù)檢驗(yàn)是與總體分布無(wú)關(guān)的檢驗(yàn),檢驗(yàn)中不需要對(duì)總體分布的具體形式作出嚴(yán)格假設(shè),或者只需要很弱的假設(shè)。c2檢驗(yàn)和K-S檢驗(yàn)都可以幫助我們檢驗(yàn)?zāi)芊裾J(rèn)為樣本數(shù)據(jù)來(lái)自某種概率分布。前者一般用于定性數(shù)據(jù),后者用于定量數(shù)據(jù)。符號(hào)檢驗(yàn)和Wilcoxon符號(hào)秩檢驗(yàn)都可以用于單樣本中位數(shù)檢驗(yàn)和兩個(gè)匹配樣本的檢驗(yàn),與正態(tài)分布時(shí)單樣本的t檢驗(yàn)和匹配樣本的t檢驗(yàn)相對(duì)應(yīng)。小結(jié)非參數(shù)檢驗(yàn)是與總體分布無(wú)關(guān)的檢驗(yàn),檢驗(yàn)中不需要對(duì)總體分布小結(jié)Wlicoxon秩和檢驗(yàn)可以用來(lái)檢驗(yàn)兩個(gè)獨(dú)立樣本的中位數(shù)的差異,與正態(tài)分布時(shí)獨(dú)立樣本的t檢驗(yàn)相對(duì)應(yīng)。Kruskal-Wallis檢驗(yàn)是與單因素方差分析相對(duì)應(yīng)的非參數(shù)檢驗(yàn)方法,可以用來(lái)檢驗(yàn)多個(gè)總體中位數(shù)的差異。小樣本時(shí),按照漸進(jìn)方法的計(jì)算結(jié)果誤差會(huì)比較大。這時(shí)應(yīng)該使用精確檢驗(yàn)的方法計(jì)算p值。在一些非參數(shù)檢驗(yàn)中需要有一些關(guān)于總體分布的假設(shè),如連續(xù)對(duì)稱(chēng)分布等,在使用中要注意判斷。小結(jié)Wlicoxon秩和檢驗(yàn)可以用來(lái)檢驗(yàn)兩個(gè)獨(dú)立樣本的中位數(shù)愛(ài)是什么?
一個(gè)精靈坐在碧綠的枝葉間沉思。
風(fēng)兒若有若無(wú)。
一只鳥(niǎo)兒飛過(guò)來(lái),停在枝上,望著遠(yuǎn)處將要成熟的稻田。
精靈取出一束黃澄澄的稻谷問(wèn)道:“你愛(ài)這稻谷嗎?”
“愛(ài)。”
“為什么?”
“它驅(qū)趕我的饑餓?!?/p>
鳥(niǎo)兒啄完稻谷,輕輕梳理著光潤(rùn)的羽毛。
“現(xiàn)在你愛(ài)這稻谷嗎?”精靈又取出一束黃澄澄的稻谷。
鳥(niǎo)兒抬頭望著遠(yuǎn)處的一灣泉水回答:“現(xiàn)在我愛(ài)那一灣泉水,我有點(diǎn)渴了?!?/p>
精靈摘下一片樹(shù)葉,里面盛了一汪泉水。
鳥(niǎo)兒喝完泉水,準(zhǔn)備振翅飛去。
“請(qǐng)?jiān)倩卮鹞乙粋€(gè)問(wèn)題,”精靈伸出指尖,鳥(niǎo)兒停在上面。
“你要去做什么更重要的事嗎?我這里又稻谷也有泉水?!?/p>
“我要去那片開(kāi)著風(fēng)信子的山谷,去看那朵風(fēng)信子?!?/p>
“為什么?它能驅(qū)趕你的饑餓?”
“不能?!?/p>
“它能滋潤(rùn)你的干渴?”
“不能?!睈?ài)是什么?
一個(gè)精靈坐在碧綠的枝葉間沉思。
風(fēng)兒若有若無(wú)。
一只鳥(niǎo)兒飛過(guò)來(lái),停在枝上,望著遠(yuǎn)處將要成熟的稻田。
精靈取出一束黃澄澄的稻谷問(wèn)道:“你愛(ài)這稻谷嗎?”
“愛(ài)?!?/p>
“為什么?”
“它驅(qū)趕我的饑餓?!?/p>
鳥(niǎo)兒啄完稻谷,輕輕梳理著光潤(rùn)的羽毛。
“現(xiàn)在你愛(ài)這稻谷嗎?”精靈又取出一束黃澄澄的稻谷。
鳥(niǎo)兒抬頭望著遠(yuǎn)處的一灣泉水回答:“現(xiàn)在我愛(ài)那一灣泉水,我有點(diǎn)渴了?!?/p>
精靈摘下一片樹(shù)葉,里面盛了一汪泉水。
鳥(niǎo)兒喝完泉水,準(zhǔn)備振翅飛去。
“請(qǐng)?jiān)倩卮鹞乙粋€(gè)問(wèn)題,”精靈伸出指尖,鳥(niǎo)兒停在上面。
“你要去做什么更重要的事嗎?我這里又稻谷也有泉水?!?/p>
“我要去那片開(kāi)著風(fēng)信子的山谷,去看那朵風(fēng)信子?!?/p>
“為什么?它能驅(qū)趕你的饑餓?”
“不能?!?/p>
“它能滋潤(rùn)你的干渴?”
“不能。”愛(ài)是什么?
一個(gè)精靈坐在碧綠的枝葉間沉思。
風(fēng)兒若有若無(wú)。
其實(shí),世上最溫暖的語(yǔ)言,“不是我愛(ài)你,而是在一起?!?/p>
所以懂得才是最美的相遇!只有彼此以誠(chéng)相待,彼此尊重,相互包容,相互懂得,才能走的更遠(yuǎn)。相遇是緣,相守是愛(ài)。緣是多么的妙不可言,而懂得又是多么的難能可貴。否則就會(huì)錯(cuò)過(guò)一時(shí),錯(cuò)過(guò)一世!擇一人深?lèi)?ài),陪一人到老。一路相扶相持,一路心手相牽,一路笑對(duì)風(fēng)雨。在平凡的世界,不求愛(ài)的轟轟烈烈;不求誓言多么美麗;唯愿簡(jiǎn)單的相處,真心地付出,平淡地相守,才不負(fù)最美的人生;不負(fù)善良的自己。人海茫茫,不求人人都能刻骨銘心,但求對(duì)人對(duì)己?jiǎn)栃臒o(wú)愧,無(wú)怨無(wú)悔足矣。大千世界,與萬(wàn)千人中遇見(jiàn),只是相識(shí)的開(kāi)始,只有彼此真心付出,以心交心,以情換情,相知相惜,才能相伴美好的一生,一路同行。然而,生活不僅是詩(shī)和遠(yuǎn)方,更要面對(duì)現(xiàn)實(shí)。如果曾經(jīng)的擁有,不能天長(zhǎng)地久,那么就要學(xué)會(huì)華麗地轉(zhuǎn)身,學(xué)會(huì)忘記。忘記該忘記的人,忘記該忘記的事兒,忘記苦樂(lè)年華的悲喜交集。人有悲歡離合,月有陰晴圓缺。對(duì)于離開(kāi)的人,不必折磨自己脆弱的生命,虛度了美好的朝夕;不必讓心靈痛苦不堪,弄丟了快樂(lè)的自己。擦汗眼淚,告訴自己,日子還得繼續(xù),誰(shuí)都不是誰(shuí)的唯一,相信最美的風(fēng)景一直在路上。人生,就是一場(chǎng)修行。你路過(guò)我,我忘記你;你有情,他無(wú)意。誰(shuí)都希望在正確的時(shí)間遇見(jiàn)對(duì)的人,然而事與愿違時(shí),你越渴望的東西,也許越是無(wú)情無(wú)義地棄你而去。所以美好的愿望,就會(huì)像肥皂泡一樣破滅,只能在錯(cuò)誤的時(shí)間遇到錯(cuò)的人。歲月匆匆像一陣風(fēng),有多少故事留下感動(dòng)。愿曾經(jīng)的相遇,無(wú)論是錦上添花,還是追悔莫及;無(wú)論是青澀年華的懵懂賞識(shí),還是成長(zhǎng)歲月無(wú)法躲避的經(jīng)歷……愿曾經(jīng)的過(guò)往,依然如花芬芳四溢,永遠(yuǎn)無(wú)悔歲月賜予的美好相遇。其實(shí),人生之路的每一段相遇,都是一筆財(cái)富,尤其親情、友情和愛(ài)情。在漫長(zhǎng)的旅途上,他們都會(huì)豐富你的生命,使你的生命更充實(shí),更真實(shí);豐盈你的內(nèi)心,使你的內(nèi)心更慈悲,更善良。所以生活的美好,緣于一顆善良的心,愿我們都能善待自己和他人。一路走來(lái),愿相親相愛(ài)的人,相濡以沫,同甘共苦,百年好合。愿有情有意的人,不離不棄,相惜相守,共度人生的每一個(gè)朝夕……直到老得哪也去不了,依然是彼此手心里的寶,感恩一路有你!其實(shí),世上最溫暖的語(yǔ)言,“不是我愛(ài)你,而是在一起?!?/p>
統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件第六章非參數(shù)檢驗(yàn)第六章非參數(shù)檢驗(yàn)方法的回顧單個(gè)因素(兩水平)的作用評(píng)價(jià):兩組比較完全隨機(jī)設(shè)計(jì)下的單因素兩組比較匹配設(shè)計(jì)的兩組比較單個(gè)因素(多水平)的作用評(píng)價(jià):多組比較完全隨機(jī)設(shè)計(jì)下的單因素多水平比較兩個(gè)因素的分析問(wèn)題無(wú)交互作用、有交互作用方法的回顧單個(gè)因素(兩水平)的作用評(píng)價(jià):兩組比較單因素兩組比較:t檢驗(yàn)完全隨機(jī)兩組均數(shù)比較的t檢驗(yàn)(獨(dú)立t檢驗(yàn))匹配設(shè)計(jì)下兩組均數(shù)比較的t檢驗(yàn)(匹配t檢驗(yàn))單因素多組比較:方差分析完全隨機(jī)設(shè)計(jì)下的多組均數(shù)比較單因素兩組比較:t檢驗(yàn)局限性t檢驗(yàn)獨(dú)立t檢驗(yàn)要求:正態(tài)、方差相等(或不相等)、個(gè)體獨(dú)立匹配t檢驗(yàn)要求:差值正態(tài)、個(gè)體獨(dú)立方差分析單因素多水平比較方差分析要求:正態(tài)、方差相等、個(gè)體獨(dú)立局限性t檢驗(yàn)未解決問(wèn)題兩組性別結(jié)構(gòu)是否相同?療效用痊愈、顯效、有效、無(wú)效四級(jí)分類(lèi)法進(jìn)行評(píng)價(jià)時(shí),兩組或多組如何比較?如何檢驗(yàn)樣本數(shù)據(jù)來(lái)自的總體服從正態(tài)分布?總體不是正態(tài)分布,小樣本情況下,如何檢驗(yàn)總體的集中趨勢(shì)?有6名歌手參加比賽,4名評(píng)委進(jìn)行評(píng)判打分,推斷評(píng)委的評(píng)判標(biāo)準(zhǔn)是否一致……未解決問(wèn)題兩組性別結(jié)構(gòu)是否相同?參數(shù)檢驗(yàn):樣本被視為從分布族的某個(gè)參數(shù)族抽取出來(lái)的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值推斷問(wèn)題就轉(zhuǎn)化為對(duì)分布族的若干個(gè)未知參數(shù)的估計(jì)問(wèn)題,用樣本對(duì)這些參數(shù)做出估計(jì)或者進(jìn)行某種形式的假設(shè)檢驗(yàn),這類(lèi)推斷方法稱(chēng)為參數(shù)方法。參數(shù)檢驗(yàn):非參數(shù)檢驗(yàn)(nonparametrictests)又稱(chēng)為任意分布檢驗(yàn)(distribution-freetest),它不考慮研究對(duì)象總體分布具體形式,也不對(duì)總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷僅僅依賴(lài)于數(shù)據(jù)觀(guān)測(cè)值的相對(duì)大小(秩)等,而是通過(guò)檢驗(yàn)樣本所代表的總體分布形式是否一致來(lái)得出統(tǒng)計(jì)結(jié)論。非參數(shù)檢驗(yàn)(nonparametrictests)非參數(shù)統(tǒng)計(jì)的名字中的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);它被稱(chēng)為“和分布無(wú)關(guān)”(distribution—free),是因?yàn)槠渫茢喾椒ê涂傮w分布無(wú)關(guān);不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無(wú)關(guān).非參數(shù)統(tǒng)計(jì)的名字中的“非參數(shù)(nonparametric)”對(duì)總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。假定較少不需要對(duì)總體參數(shù)的假定與參數(shù)結(jié)果接近針對(duì)幾乎所有類(lèi)型的數(shù)據(jù)形態(tài)。容易計(jì)算在計(jì)算機(jī)盛行之前就已經(jīng)發(fā)展起來(lái)。非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)對(duì)總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。非參數(shù)檢驗(yàn)的可能會(huì)浪費(fèi)一些信息特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型的時(shí)候大樣本手算相當(dāng)麻煩一些表不易得到非參數(shù)檢驗(yàn)的弱點(diǎn)可能會(huì)浪費(fèi)一些信息非參數(shù)檢驗(yàn)的弱點(diǎn)已知總體分布類(lèi)型,對(duì)未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷依賴(lài)于特定分布類(lèi)型,比較的是參數(shù)
參數(shù)檢驗(yàn)(parametrictest)
非參數(shù)檢驗(yàn)(nonparametrictest)對(duì)總體的分布類(lèi)型不作嚴(yán)格要求不受分布類(lèi)型的影響,比較的是總體分布位置
優(yōu)點(diǎn):方法簡(jiǎn)便、易學(xué)易用,易于推廣使用、應(yīng)用范圍廣;可用于參數(shù)檢驗(yàn)難以處理的資料(如等級(jí)資料,或含數(shù)值“>50mg”等
)缺點(diǎn):方法比較粗糙,對(duì)于符合參數(shù)檢驗(yàn)條件者,采用非參數(shù)檢驗(yàn)會(huì)損失部分信息,其檢驗(yàn)效能較低;樣本含量較大時(shí),兩者結(jié)論常相同已知總體分布類(lèi)型,對(duì)未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷依賴(lài)于特定分布類(lèi)型,非參數(shù)檢驗(yàn)的特點(diǎn)非參數(shù)檢驗(yàn)不需要嚴(yán)格假設(shè)條件,因而比參數(shù)檢驗(yàn)有更廣泛的適用面。非參數(shù)檢驗(yàn)幾乎可以處理包括定類(lèi)數(shù)據(jù)和定序數(shù)據(jù)在內(nèi)的所有類(lèi)型的數(shù)據(jù),而參數(shù)檢驗(yàn)通常只能用于定量數(shù)據(jù)的分析。在參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)都可以使用的情況下,非參數(shù)檢驗(yàn)的功效(power)要低于參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)的特點(diǎn)非參數(shù)檢驗(yàn)不需要嚴(yán)格假設(shè)條件,因而比參數(shù)檢驗(yàn)以下情況下應(yīng)當(dāng)首選非參數(shù)方法參數(shù)檢驗(yàn)中的假設(shè)條件不滿(mǎn)足,從而無(wú)法應(yīng)用。例如總體分布為偏態(tài)或分布形式未知,且樣本為小樣本時(shí)。檢驗(yàn)中涉及的數(shù)據(jù)為定類(lèi)或定序數(shù)據(jù)。所涉及的問(wèn)題中并不包含參數(shù),如判斷某樣本是否來(lái)自正態(tài)分布等,判斷某樣本是否為隨機(jī)樣本。以下情況下應(yīng)當(dāng)首選非參數(shù)方法參數(shù)檢驗(yàn)中的假設(shè)條件不滿(mǎn)足,從而常用的非參數(shù)檢驗(yàn)方法用于單個(gè)樣本的c2擬合優(yōu)度檢驗(yàn)、K-S擬合優(yōu)度檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)用于兩個(gè)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)用于兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)用于多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)。常用的非參數(shù)檢驗(yàn)方法用于單個(gè)樣本的c2擬合優(yōu)度檢驗(yàn)、K-S擬第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用單樣本的非參數(shù)檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)K-S擬合優(yōu)度檢驗(yàn)中位數(shù)的符號(hào)檢驗(yàn)分類(lèi)數(shù)據(jù)檢驗(yàn)分布對(duì)中位數(shù)的推斷單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)分類(lèi)數(shù)據(jù)檢驗(yàn)分布對(duì)中位數(shù)的c2統(tǒng)計(jì)量用來(lái)測(cè)定定類(lèi)變量之間的相關(guān)程度c2統(tǒng)計(jì)量的分布與自由度有關(guān);c2統(tǒng)計(jì)量描述了觀(guān)察值與期望值的接近程度c2統(tǒng)計(jì)量擬合優(yōu)度檢驗(yàn)(goodnessoffittest)用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)的重要內(nèi)容之一;依據(jù)總體分布狀況,計(jì)算出分類(lèi)變量中各類(lèi)別的期望頻數(shù),與分布的觀(guān)察頻數(shù)進(jìn)行對(duì)比,判斷期望頻數(shù)與觀(guān)察頻數(shù)是否有顯著差異,從而達(dá)到對(duì)分類(lèi)變量進(jìn)行分析的目的。擬合優(yōu)度檢驗(yàn)(goodnessoffittest)1912年4月15日,豪華巨輪泰坦尼克號(hào)與冰山相撞沉沒(méi)。當(dāng)時(shí)船上共有2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以顯著性水平為0.1檢驗(yàn)存活狀況與性別是否有關(guān)?1912年4月15日,豪華巨輪泰坦尼克號(hào)與冰山相撞沉沒(méi)。當(dāng)時(shí)提出零假設(shè)和備擇假設(shè)H0:觀(guān)察頻數(shù)與期望頻數(shù)一致H1:觀(guān)察頻數(shù)與期望頻數(shù)不一致計(jì)算期望頻數(shù)男性的期望頻數(shù),女性為153人計(jì)量c2統(tǒng)計(jì)量查表(自由度為類(lèi)別數(shù)-1)做出判斷:決絕原假設(shè),認(rèn)為存活狀況與性別顯著相關(guān)提出零假設(shè)和備擇假設(shè)一種飲料的容器材料可以選擇玻璃、塑料或者金屬。為了比較消費(fèi)者對(duì)包裝材料的偏好,抽樣調(diào)查了120名消費(fèi)者發(fā)現(xiàn),最喜歡玻璃、塑料和金屬容器的分別有55、25和40人。根據(jù)調(diào)查結(jié)果,能否認(rèn)為消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的(顯著性水平a=0.05)?一種飲料的容器材料可以選擇玻璃、塑料或者金屬。分析如果消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的,也就是說(shuō)消費(fèi)者對(duì)材料的偏好服從均勻分布,則理論上來(lái)說(shuō),調(diào)查120名消費(fèi)者,偏好每種材料的人數(shù)應(yīng)該是相等的,也就是40人。各組觀(guān)測(cè)到的人數(shù)與理論人數(shù)(期望值)之間的差異應(yīng)該都是由于抽樣的隨機(jī)性造成的,因此不應(yīng)該太大。如果二者之間的差異特別大,則說(shuō)明我們所作的假設(shè)(消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的)很可能不成立。分析如果消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的,也就是說(shuō)消費(fèi)者檢驗(yàn)統(tǒng)計(jì)量k是樣本分類(lèi)的個(gè)數(shù),表示實(shí)際觀(guān)察到的頻數(shù),表示理論頻數(shù)。觀(guān)察頻數(shù)與期望頻數(shù)越接近,則c2值越小。根據(jù)皮爾遜定理,當(dāng)n充分大時(shí),c2統(tǒng)計(jì)量漸近服從于k-1個(gè)自由度的c2分布。檢驗(yàn)統(tǒng)計(jì)量軟件操作:數(shù)據(jù)錄入軟件操作:數(shù)據(jù)錄入軟件操作:方法設(shè)定選擇“分析”“非參數(shù)檢驗(yàn)”“卡方”,在彈出的對(duì)話(huà)框中將“材料”設(shè)定為檢驗(yàn)變量;單擊對(duì)話(huà)框中的“精確…”,選中彈出對(duì)話(huà)框中的“精確”,單擊“繼續(xù)”、“確定”軟件操作:方法設(shè)定選擇“分析”“非參數(shù)檢驗(yàn)”“卡方”,在軟件操作:結(jié)果分析(1)觀(guān)察數(shù)期望數(shù)殘差1.005540.015.02.002540.0-15.03.004040.0.0總數(shù)120軟件操作:結(jié)果分析(1)觀(guān)察數(shù)期望數(shù)殘差1.005540.0軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性.004精確顯著性.003點(diǎn)概率.000軟件操作:結(jié)果分析(2)材料卡方11.250df2漸近顯著性結(jié)果分析(3)結(jié)論:計(jì)算出的c2統(tǒng)計(jì)量的值為11.250,自由度為2,相應(yīng)的p值(漸近顯著性)為0.004,小于a=0.05。所以檢驗(yàn)的結(jié)論是拒絕總體中消費(fèi)者對(duì)3種材料的偏好程度無(wú)差異的零假設(shè)。結(jié)果分析(3)結(jié)論:計(jì)算出的c2統(tǒng)計(jì)量的值為11.250,自特別說(shuō)明大樣本、每個(gè)單元中的期望頻數(shù)大于等于5時(shí)可以使用c2分布。小樣本時(shí)應(yīng)該按照精確方法計(jì)算得到的p值得出結(jié)論。c2檢驗(yàn)也可以按照同樣的思想對(duì)正態(tài)分布或者任何想象的其他分布進(jìn)行檢驗(yàn),但主要用于對(duì)定性變量的檢驗(yàn)。另外,c2檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布的比較。特別說(shuō)明大樣本、每個(gè)單元中的期望頻數(shù)大于等于5時(shí)可以使用c2單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)對(duì)定類(lèi)變量用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)K-S擬合優(yōu)度檢驗(yàn)中位數(shù)的符號(hào)檢驗(yàn)檢驗(yàn)分布單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)檢驗(yàn)分布單樣本K-S檢驗(yàn)檢驗(yàn)總體分布是否為理論分布(正態(tài)、Possion、均勻、指數(shù))是以?xún)晌惶K聯(lián)數(shù)學(xué)家Kolmogorov和Smirnov命名的,全稱(chēng)為Kolmogorov-Smirnov檢驗(yàn)。通過(guò)對(duì)兩個(gè)分布差異的分析確定能否認(rèn)為樣本的觀(guān)察值來(lái)自所設(shè)定的理論分布總體。單樣本K-S檢驗(yàn)定義,顯然若對(duì)每一個(gè)x值來(lái)說(shuō),如果經(jīng)驗(yàn)分布函數(shù)與特定分布函數(shù)的擬合程度很高,則有理由認(rèn)為樣本數(shù)據(jù)來(lái)自具有該理論分布的總體。檢驗(yàn)統(tǒng)計(jì)量:根據(jù)檢驗(yàn)統(tǒng)計(jì)量的精確分布或漸進(jìn)分布,可以計(jì)算出假設(shè)檢驗(yàn)的p值,從而得出檢驗(yàn)的結(jié)論。定義SPSSK-S檢驗(yàn)中檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算SPSSK-S檢驗(yàn)中檢驗(yàn)統(tǒng)計(jì)量Z的計(jì)算SPSSK-S檢驗(yàn)中p值的計(jì)算SPSSK-S檢驗(yàn)中p值的計(jì)算有100名兒童每周看電視時(shí)間的數(shù)據(jù)(數(shù)據(jù)文件:電視時(shí)間.sav)。檢驗(yàn)?zāi)芊裾J(rèn)為總體中兒童每周看電視的時(shí)間服從正態(tài)分布(顯著性水平a=0.05)。這里K-S檢驗(yàn)的零假設(shè)和備擇假設(shè)為:H0:總體中兒童每周看電視的時(shí)間服從正態(tài)分布。H1:總體中兒童每周看電視的時(shí)間不服從正態(tài)分布。有100名兒童每周看電視時(shí)間的數(shù)據(jù)(數(shù)據(jù)文件:電視時(shí)間.sa統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“1樣本K-S”,在彈出的對(duì)話(huà)框中將“時(shí)間”設(shè)定為檢驗(yàn)變量;檢驗(yàn)分布為默認(rèn)的“常規(guī)”(正態(tài)分布)。單擊“確定”在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)時(shí)間N100正態(tài)參數(shù)a,,b均值27.191標(biāo)準(zhǔn)差8.3728最極端差別絕對(duì)值.096正.096負(fù)-.039Kolmogorov-SmirnovZ.960漸近顯著性(雙側(cè)).315時(shí)間N100正態(tài)參數(shù)a,,b均值27.191標(biāo)準(zhǔn)差8.372檢驗(yàn)結(jié)論相應(yīng)的p值(漸近顯著性)為0.315。由于0.315大于0.05,所以在5%的顯著性水平下不能拒絕原假設(shè),也就是說(shuō)根據(jù)樣本數(shù)據(jù)不能認(rèn)為總體分布是非正態(tài)的。注意這里并不能得出總體服從正態(tài)分布的嚴(yán)格結(jié)論??傮w服從正態(tài)分布的結(jié)論可能犯第二類(lèi)錯(cuò)誤(取偽錯(cuò)誤),這個(gè)概率是未知的,在有些情況下可能會(huì)很大。檢驗(yàn)結(jié)論特別聲明在K-S檢驗(yàn)中如果使用的是小樣本,則根據(jù)漸進(jìn)分布計(jì)算p值的誤差會(huì)增大。這時(shí)應(yīng)該通過(guò)相應(yīng)的設(shè)定要求軟件輸出精確檢驗(yàn)的p值,根據(jù)精確檢驗(yàn)的p值得出檢驗(yàn)結(jié)論。K-S檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布是否一致的檢驗(yàn)。特別聲明單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)對(duì)定類(lèi)變量用c2統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)K-S擬合優(yōu)度檢驗(yàn)檢驗(yàn)總體分布形態(tài)中位數(shù)的符號(hào)檢驗(yàn)對(duì)中位數(shù)的推斷單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)對(duì)中位數(shù)的推斷單樣本中位數(shù)的檢驗(yàn)秩符號(hào)檢驗(yàn)Wilcoxon符號(hào)秩檢驗(yàn)單樣本中位數(shù)的檢驗(yàn)秩(rank)是指全部觀(guān)察值按某種順序排列的位序;通常是將數(shù)據(jù)按照升冪排列之后,每個(gè)觀(guān)測(cè)值的位置,秩次在一定程度上反映了等級(jí)的高低。下面一行Ri就是上面一行數(shù)據(jù)Xi的秩。秩(rank)數(shù)據(jù)中有相同的數(shù)值,稱(chēng)為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均值Xi159173178513719Ri758.518.5426310數(shù)據(jù)中有相同的數(shù)值,稱(chēng)為結(jié)。結(jié)中數(shù)字的秩為它們所占位置的平均A組:-、、+、+、+、+、++、++、++、++、+++、+++-±++++++++++++++++++
123456789101112
124.54.54.5
4.5
8.58.58.58.5
11.511.5平均秩次=(3+6)/2=4.5A組:-、、+、+、+、+、++、++、++、++、利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參符號(hào)檢驗(yàn)(signtest)在非正態(tài)總體小樣本的情況下,如果要對(duì)總體分布的位置進(jìn)行推斷,由于t檢驗(yàn)不適用,也可使用符號(hào)檢驗(yàn)的方法。在數(shù)據(jù)呈偏態(tài)分布的情況下,我們可能對(duì)總體的中位數(shù)更感興趣,希望對(duì)總體的中位數(shù)作出推斷,這時(shí)可以使用符號(hào)檢驗(yàn)的方法。符號(hào)檢驗(yàn)(signtest)例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件符號(hào)檢驗(yàn)的基本思想:每個(gè)數(shù)據(jù)都減去零假設(shè)中的中位數(shù),記錄其差值的符號(hào)。計(jì)算正、負(fù)符號(hào)的個(gè)數(shù)(差值為0的不計(jì)算在任何一個(gè)中)當(dāng)原假設(shè)為真時(shí)二者應(yīng)該很接近;若兩者相差太遠(yuǎn),就有理由拒絕原假設(shè)。符號(hào)檢驗(yàn)的基本思想:檢驗(yàn)統(tǒng)計(jì)量原假設(shè)成立時(shí),檢驗(yàn)統(tǒng)計(jì)量S服從二項(xiàng)分布。根據(jù)二項(xiàng)分布計(jì)算得到p值,從而得出檢驗(yàn)的結(jié)論。當(dāng)正號(hào)和負(fù)號(hào)個(gè)數(shù)之和大于25時(shí),可以按照正態(tài)分布進(jìn)行近似計(jì)算。檢驗(yàn)統(tǒng)計(jì)量例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件:家庭月收入.sav)。根據(jù)樣本數(shù)據(jù)能否認(rèn)為總體中家庭月收入的中位數(shù)等于5000元(顯著性水平a=0.05)?例6.3在某地區(qū)隨機(jī)調(diào)查了60個(gè)家庭的月收入。(數(shù)據(jù)文件在SPSS中打開(kāi)數(shù)據(jù)文件。為了對(duì)中位數(shù)進(jìn)行檢驗(yàn),先在SPSS中生成一個(gè)新的變量Median,取值為5000:?jiǎn)螕簟稗D(zhuǎn)換”“計(jì)算變量”,在彈出的對(duì)話(huà)框中按照?qǐng)D6-3進(jìn)行設(shè)置,單擊確定。在SPSS中打開(kāi)數(shù)據(jù)文件。為了對(duì)中位數(shù)進(jìn)行檢驗(yàn),先在SPSS選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話(huà)框中將“Median”和“家庭月收入”設(shè)定檢驗(yàn)的一對(duì)變量;選中“符號(hào)檢驗(yàn)”,取消選擇“Wilcoxon”,單擊“確定”
選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話(huà)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件用正態(tài)分布進(jìn)行近似計(jì)算時(shí),Z統(tǒng)計(jì)量的值為-0.129,雙側(cè)檢驗(yàn)的p值為0.897。由于p值大于0.05,檢驗(yàn)的結(jié)論是不能拒絕原假設(shè),即沒(méi)有充分證據(jù)證明中位數(shù)不等于5000。用正態(tài)分布進(jìn)行近似計(jì)算時(shí),Z統(tǒng)計(jì)量的值為-0.129,雙側(cè)檢特別聲明如果樣本量較小,則需要使用軟件輸出的精確檢驗(yàn)的p值進(jìn)行推斷在小樣本時(shí),如果要求進(jìn)行精確檢驗(yàn),SPSS會(huì)自動(dòng)按照二項(xiàng)分布進(jìn)行概率計(jì)算。特別聲明Wilcoxon符號(hào)秩檢驗(yàn)符號(hào)檢驗(yàn)只用到差值的符號(hào),而對(duì)差值數(shù)值的大小未能考慮,因而失去了部分信息。Wilcoxon符號(hào)秩檢驗(yàn)既考慮差值的符號(hào),又考慮差值的大小,因此在所需的假設(shè)條件滿(mǎn)足時(shí)其功效比符號(hào)檢驗(yàn)高。Wilcoxon符號(hào)秩檢驗(yàn)Wilcoxon符號(hào)秩檢驗(yàn)計(jì)算差值絕對(duì)值的秩。將差值絕對(duì)值從小到大排序,其位次就是的秩(rank),等于0值不參與排序。分別計(jì)算出差值序列中正數(shù)的秩和W+以及負(fù)數(shù)的秩和W-。顯然,如果零假設(shè)成立,W+與W-應(yīng)該比較接近。如果二者過(guò)大或過(guò)小,則說(shuō)明零假設(shè)不成立。將正數(shù)的秩和或者負(fù)數(shù)的秩作為檢驗(yàn)統(tǒng)計(jì)量,根據(jù)其統(tǒng)計(jì)分布計(jì)算p值,從而可以得出檢驗(yàn)的結(jié)論。前提假設(shè):樣本點(diǎn)來(lái)自連續(xù)對(duì)稱(chēng)總體分布Wilcoxon符號(hào)秩檢驗(yàn)前提假設(shè):樣本點(diǎn)來(lái)自連續(xù)對(duì)稱(chēng)總體分Wilcoxon符號(hào)秩檢驗(yàn)計(jì)算,將其按照大小排序,得到的秩;把的正負(fù)號(hào)加到相應(yīng)的秩上;計(jì)算計(jì)算檢驗(yàn)統(tǒng)計(jì)量做出判斷,W太小時(shí),決絕零假設(shè)Wilcoxon符號(hào)秩檢驗(yàn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)、特點(diǎn)及應(yīng)用單樣本的非參數(shù)檢驗(yàn)c2擬合優(yōu)度檢驗(yàn)、K-S檢驗(yàn)、中位數(shù)的符號(hào)檢驗(yàn)及Wilcoxon符號(hào)秩檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)第六章非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)概述兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)兩個(gè)匹配樣本的Wilcoxon符號(hào)秩檢驗(yàn)兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)兩個(gè)樣本和多個(gè)樣本的非參數(shù)檢驗(yàn)匹配樣本的非參數(shù)檢驗(yàn)如果t檢驗(yàn)的假設(shè)條件不滿(mǎn)足,t檢驗(yàn)就不適用了。符號(hào)檢驗(yàn)和Wilcoxon符號(hào)秩檢驗(yàn)都可以用做替代的檢驗(yàn)方法。用樣本數(shù)據(jù)中對(duì)應(yīng)的數(shù)值相減得到新的序列:零假設(shè):差值總體的中位數(shù)=0;備擇假設(shè):差值總體的中位數(shù)≠0。匹配樣本的非參數(shù)檢驗(yàn)例6.4從實(shí)施適時(shí)管理(JIT)的企業(yè)中隨機(jī)抽取10家進(jìn)行效益分析,得到它們?cè)趯?shí)施JIT前后三年的平均資產(chǎn)報(bào)酬率(數(shù)據(jù)文件:JIT管理.sav)。在5%的顯著性水平下企業(yè)在實(shí)施JIT前后的資產(chǎn)報(bào)酬率是否有顯著差異?例6.4從實(shí)施適時(shí)管理(JIT)的企業(yè)中隨機(jī)抽取10家進(jìn)統(tǒng)計(jì)學(xué)非參數(shù)檢驗(yàn)課件在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)相關(guān)樣本”,在彈出的對(duì)話(huà)框中將“JIT后”和“JIT前”設(shè)定檢驗(yàn)的一對(duì)變量;選中“Wilcoxon”和“符號(hào)檢驗(yàn)”。由于這里樣本量很小,我們要求進(jìn)行精確檢驗(yàn):?jiǎn)螕魧?duì)話(huà)框中的“精確…”,選中彈出對(duì)話(huà)框中的“精確”,單擊“繼續(xù)”、“確定”在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”符號(hào)檢驗(yàn)結(jié)果(1)NJIT前-JIT后負(fù)差分a7正差分b3結(jié)c0總數(shù)10符號(hào)檢驗(yàn)結(jié)果(1)NJIT前-JIT后負(fù)差分a7正差分b符號(hào)檢驗(yàn)結(jié)果(2)結(jié)論:不能拒絕零假設(shè),沒(méi)有證據(jù)表明小于企業(yè)在實(shí)施JIT前后的資產(chǎn)報(bào)酬率有顯著變化JIT前-JIT后精確顯著性(雙側(cè)).344a精確顯著性(單側(cè)).172點(diǎn)概率.117符號(hào)檢驗(yàn)結(jié)果(2)JIT前-JIT后精確顯著性(雙側(cè)).Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(1)N秩均值秩和JIT前-JIT后負(fù)秩7a4.3630.50正秩3b8.1724.50結(jié)0c總數(shù)10Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(1)N秩均值秩和JIT前-Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(2)JIT前-JIT后Z-.307a漸近顯著性(雙側(cè)).759精確顯著性(雙側(cè)).787精確顯著性(單側(cè)).394點(diǎn)概率.020Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果(2)JIT前-JIT后Z兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)在兩個(gè)獨(dú)立樣本的t檢驗(yàn)不適用時(shí),Wlicoxon秩和檢驗(yàn)可以作為一種替代的非參數(shù)檢驗(yàn)方法使用。這一檢驗(yàn)可以用來(lái)對(duì)兩個(gè)總體的中位數(shù)進(jìn)行檢驗(yàn)。兩個(gè)獨(dú)立樣本的Wlicoxon秩和檢驗(yàn)基本原理如果兩個(gè)總體具有相似的分布形狀,并且中位數(shù)相同,那么由m個(gè)x、n個(gè)y組成的m十n=N個(gè)觀(guān)察值可以被看作來(lái)自同一總體的一個(gè)隨機(jī)樣本。將全部x和y從小到大排序確定每個(gè)數(shù)值的秩,然后計(jì)算m個(gè)x的秩的和Wx、n個(gè)y的秩的和Wy。由于抽樣的隨機(jī)性,x、y應(yīng)較均勻地分布在混合排列的樣本中。如果零假設(shè)成立,在樣本量相同的情況下兩個(gè)秩和應(yīng)該比較接近;樣本量不同的情況下平均秩和的平均秩應(yīng)該比較接近。否則就說(shuō)明兩個(gè)總體的中位數(shù)是不相等的?;驹碛捎趯?duì)稱(chēng)性,兩個(gè)秩和Wx、Wy都可以用作Wilcoxon秩和檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量。SPSS軟件中使用的是平均秩較小的一組的秩和。統(tǒng)計(jì)量W的統(tǒng)計(jì)分布可以精確推導(dǎo)出來(lái)在樣本量較大時(shí)(m和n都不小于10)可以用正態(tài)分布來(lái)進(jìn)行近似。得到p值之后,再通過(guò)比較p值和a的大小得出結(jié)論。由于對(duì)稱(chēng)性,兩個(gè)秩和Wx、Wy都可以用作Wilcoxo相關(guān)說(shuō)明由于Wilcoxon秩和檢驗(yàn)與Mann和Whitney提出的U檢驗(yàn)完全等價(jià),因此這種方法也被稱(chēng)為Wlicoxon-Mann-Whitney檢驗(yàn),或者M(jìn)ann-WhitneyU檢驗(yàn)。在樣本量較小時(shí),應(yīng)當(dāng)使用精確檢驗(yàn)的結(jié)果嚴(yán)格來(lái)說(shuō)用Wilcoxon秩和檢驗(yàn)對(duì)中位數(shù)進(jìn)行假設(shè)檢驗(yàn),需要假定兩個(gè)總體分布有類(lèi)似的形狀才能得出可靠的結(jié)論。相關(guān)說(shuō)明例6.5已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和15名研究生的月收入(元)(數(shù)據(jù)文件:本科研究生收入.sav),試比較本科生和研究生的收入水平(顯著性水平a=0.05)。例6.5已知某企業(yè)職工的收入調(diào)查中20名本科畢業(yè)生和分析由于收入一般是右偏分布,因此不適合用t檢驗(yàn)進(jìn)行分析。我們用Wilcoxon秩和檢驗(yàn)來(lái)比較兩個(gè)總體的中位數(shù)。檢驗(yàn)的零假設(shè)和備擇假設(shè)如下:H0:本科和研究生月收入的中位數(shù)相等;H1:本科和研究生月收入的中位數(shù)不相等。分析在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“2個(gè)獨(dú)立樣本”,在彈出的對(duì)話(huà)框中將“月收入”設(shè)定為檢驗(yàn)變量,“學(xué)歷”設(shè)定為分組變量,然后單擊“定義組”,按照“學(xué)歷”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”,檢驗(yàn)類(lèi)型使用默認(rèn)“Mann-WhitneyU”,單擊“確定”
在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”結(jié)果分析:學(xué)歷N秩均值秩和月收入本科2013.55271.00研究生1523.93359.00總數(shù)35結(jié)果分析:學(xué)歷N秩均值秩和月收入本科2013.55271.0根據(jù)精確檢驗(yàn)的p值,在顯著性水平大于0.002時(shí)我們應(yīng)該拒絕原假設(shè),結(jié)論是本科與研究生的收入的中位數(shù)不相等。月收入Mann-WhitneyU61.000WilcoxonW271.000Z-2.967漸近顯著性(雙側(cè)).003精確顯著性[2*(單側(cè)顯著性)].002a根據(jù)精確檢驗(yàn)的p值,在顯著性水平大于0.002時(shí)我們應(yīng)該拒絕多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)Kruskal-Wallis檢驗(yàn)是Wlicoxon秩和檢驗(yàn)的推廣,用來(lái)對(duì)多個(gè)總體的中位數(shù)進(jìn)行比較。在單因素方差分析模型不適用于所研究的問(wèn)題時(shí),Kruskal-Wallis往往是一種可以替代的非參數(shù)檢驗(yàn)方法。多個(gè)獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)基本原理Kruskal-Wallis檢驗(yàn)也是根據(jù)秩和來(lái)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的。將所有樣本的數(shù)據(jù)合在一起,從小到大排序得到每個(gè)數(shù)值的秩,然后計(jì)算各樣本的秩和以及平均秩。如果各組沒(méi)有顯著性差異,則各組的平均秩應(yīng)該趨于相等;如果各組的平均秩相差較大,則各組中位數(shù)有顯著性差異的可能性較大?;驹頇z驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量基本原理:當(dāng)樣本組數(shù)k,每組樣本樣本容量ni不是很小時(shí),檢驗(yàn)統(tǒng)計(jì)量H的抽樣分布近似服從自由度為k-1的c2分布。在k=3,n≤5時(shí),用c2分布近似的誤差較大,應(yīng)該使用精確檢驗(yàn)方法如果p值小于顯著性水平a,則拒絕零假設(shè),說(shuō)明k個(gè)總體中位數(shù)之間存在顯著差異基本原理:例5.1用單因素方差分析的方法對(duì)4個(gè)專(zhuān)業(yè)的平均起薪進(jìn)行了比較分析(數(shù)據(jù)文件起薪1.xls)。由于不確定總體是否服從正態(tài)分布,請(qǐng)使用Kruskal-Wallis檢驗(yàn)比較四個(gè)專(zhuān)業(yè)畢業(yè)生的起薪是否有顯著差異。H0:四個(gè)專(zhuān)業(yè)起薪的中位數(shù)都相等;H1:四個(gè)專(zhuān)業(yè)起薪的中位數(shù)不全相等。例5.1用單因素方差分析的方法對(duì)4個(gè)專(zhuān)業(yè)的平均起薪進(jìn)行了比較在SPSS軟件中打開(kāi)數(shù)據(jù)文件,選擇“分析”“非參數(shù)檢驗(yàn)”“k個(gè)獨(dú)立樣本”,在彈出的對(duì)話(huà)框中將“起薪”設(shè)定為檢驗(yàn)變量,“專(zhuān)業(yè)”設(shè)定為分組變量,然后單擊“定義組”,按照“專(zhuān)業(yè)”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電氣成套培訓(xùn)學(xué)習(xí)
- 機(jī)關(guān)干部禮儀培訓(xùn)課件
- 小班世界糧食日活動(dòng)教案
- 遼寧省葫蘆島市長(zhǎng)江衛(wèi)生中等職業(yè)技術(shù)學(xué)校2024-2025學(xué)年高三上學(xué)期11月期中數(shù)學(xué)試題(含答案)
- T-ZFDSA 15-2024 藿香蒸鯽魚(yú)制作標(biāo)準(zhǔn)
- 吳靖收費(fèi)站機(jī)電設(shè)備的維修與管理陳曉斌介紹
- 制藥工程專(zhuān)業(yè)思維單選題100道及答案解析
- 中國(guó)消費(fèi)者和食品商對(duì)轉(zhuǎn)基因食品的態(tài)
- 精神科病史采集分析
- 2024年四川省瀘州市中考英語(yǔ)試題含解析
- 2023-2024學(xué)年北京海淀區(qū)首都師大附中初二(上)期中道法試題及答案
- 2024河南鄭州熱力集團(tuán)限公司招聘公開(kāi)引進(jìn)高層次人才和急需緊缺人才筆試參考題庫(kù)(共500題)答案詳解版
- 英語(yǔ)默寫(xiě)版-高考英語(yǔ)詞匯3500詞
- 空氣源熱泵機(jī)房系統(tǒng)施工安全生產(chǎn)保證措施
- 設(shè)備采購(gòu) 投標(biāo)方案(技術(shù)方案)
- 新蘇教版六年級(jí)上冊(cè)《科學(xué)》全一冊(cè)全部課件(含19課時(shí))
- 公共關(guān)系學(xué)完整教學(xué)課件
- 愛(ài)心媽媽結(jié)對(duì)幫扶記錄表
- 農(nóng)貿(mào)市場(chǎng)建設(shè)項(xiàng)目裝飾工程施工方案
- 八年級(jí)語(yǔ)文上冊(cè)期中文言文默寫(xiě)(含答案)
- 江倉(cāng)六號(hào)井社會(huì)穩(wěn)定風(fēng)險(xiǎn)評(píng)估報(bào)告
評(píng)論
0/150
提交評(píng)論