版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章SPSS的非參數(shù)檢驗(yàn)第1節(jié)單樣本的非參數(shù)檢驗(yàn)第2節(jié)兩獨(dú)立樣本的非參數(shù)檢驗(yàn)第3節(jié)多獨(dú)立樣本的非參數(shù)檢驗(yàn)第4節(jié)兩配對(duì)樣本的非參數(shù)檢驗(yàn)第5節(jié)多配對(duì)樣本的非參數(shù)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)估計(jì)假設(shè)檢驗(yàn)非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)是根據(jù)樣本數(shù)據(jù)推斷總體數(shù)量特征的統(tǒng)計(jì)分析方法推斷統(tǒng)計(jì)通常包括以下兩個(gè)內(nèi)容總體分布已知,根據(jù)樣本數(shù)據(jù)對(duì)總體分布的統(tǒng)計(jì)參數(shù)(如均值、方差)進(jìn)行推斷,此時(shí)采用的推斷方法稱為參數(shù)估計(jì)或者參數(shù)檢驗(yàn)總體分布未知,根據(jù)樣本數(shù)據(jù)對(duì)總體的分布形式進(jìn)行推斷,此時(shí)采用的推斷方法稱為非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)的概念無(wú)需假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測(cè)值的相對(duì)大小(秩)建立檢驗(yàn)統(tǒng)計(jì)量;然后找到在零假設(shè)下這些統(tǒng)計(jì)量的分布;并且看這些統(tǒng)計(jì)量的數(shù)據(jù)是否在零假設(shè)下屬于小概率事件.這種和數(shù)據(jù)本身的具體總體分布無(wú)關(guān)進(jìn)行的檢驗(yàn)都稱為非參數(shù)檢驗(yàn)(nonparametrictesting)由于非參數(shù)檢驗(yàn)方法在推斷過(guò)程中不涉及有關(guān)總體分布的參數(shù),因而得名為“非參數(shù)”檢驗(yàn)非參數(shù)檢驗(yàn)在總體分布的優(yōu)越性非參數(shù)檢驗(yàn)在總體分布未知時(shí)有很大的優(yōu)越性。在分布未知時(shí),還假定總體有諸如正態(tài)分布那樣的分布,在進(jìn)行統(tǒng)計(jì)推斷就可能產(chǎn)生錯(cuò)誤,非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。但在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無(wú)法拒絕。非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高,有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法,要根據(jù)對(duì)總體分布的了解程度來(lái)確定SPSS非參數(shù)檢驗(yàn)在總體分布未知的情況下,利用樣本數(shù)據(jù)對(duì)總體的分布或各總體的分布特征是否有顯著差異進(jìn)行推斷SPSS中的非參數(shù)檢驗(yàn)方法:?jiǎn)螛颖痉菂?shù)檢驗(yàn)兩獨(dú)立樣本的非參數(shù)檢驗(yàn)多獨(dú)立樣本的非參數(shù)檢驗(yàn)兩配對(duì)樣本的非參數(shù)檢驗(yàn)多配對(duì)樣本的非參數(shù)檢驗(yàn)SPSS單樣本非參數(shù)檢驗(yàn)得到一批樣本數(shù)據(jù)以后,往往希望了解樣本來(lái)自的總體的分布是否與某個(gè)已知的理論分布相吻合??梢酝ㄟ^(guò)繪制樣本數(shù)據(jù)的直方圖、P-P圖、Q-Q圖等方法作粗略判斷,還可以利用非參數(shù)檢驗(yàn)的方法實(shí)現(xiàn)。SPSS單樣本非參數(shù)檢驗(yàn)是對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷的方法。包括:總體分布的chi-square檢驗(yàn)二項(xiàng)分布檢驗(yàn)K-S檢驗(yàn)變量值隨機(jī)性檢驗(yàn)等總體分布的卡方(chi-square)檢驗(yàn)?zāi)康模焊鶕?jù)樣本數(shù)據(jù)推斷總體的分布與某個(gè)已知分布(某一理論分布)是否有顯著差異--吻合性檢驗(yàn)通常適用于對(duì)有多項(xiàng)分類值資料的總體分布統(tǒng)計(jì)推斷原假設(shè):樣本來(lái)自的總體分布與期望分布或某一理論分布無(wú)顯著差異總體分布的卡方(chi-square)檢驗(yàn)基本思想如果從一個(gè)隨機(jī)變量X中隨機(jī)抽取若干個(gè)觀察樣本,這些觀察樣本落在X的k個(gè)互不相交的子集中的觀察頻數(shù)服從一個(gè)多項(xiàng)分布,這個(gè)多項(xiàng)分布當(dāng)k趨于無(wú)窮時(shí)近似服從卡方分布?;谶@一思想,對(duì)變量X總體分布的檢驗(yàn)就可從對(duì)各個(gè)觀察頻數(shù)的分析入手在原假設(shè)成立的條件下,如果變量值落在第i子集中的理論概率值為Pi,則相應(yīng)的期望頻數(shù)便為npi。由此計(jì)算出的期望頻數(shù)分布代表了原假設(shè)成立時(shí)的理論分布。為檢驗(yàn)實(shí)際分布是否與理論分布(期望分布)一致,可采用卡方檢驗(yàn)統(tǒng)計(jì)量總體分布的卡方(chi-square)檢驗(yàn)卡方統(tǒng)計(jì)量:Pearson卡方
k為子集個(gè)數(shù);服從k-1個(gè)自由度的卡方分布如果卡方值較大,說(shuō)明觀測(cè)頻數(shù)分布與期望頻數(shù)分布差距較大如果卡方值較小,則說(shuō)明觀測(cè)頻數(shù)分布與期望頻數(shù)分布較接近如果p大于ɑ,不能拒絕H0,認(rèn)為總體分布與已知分布無(wú)顯著差異.反之,則應(yīng)拒絕原假設(shè)總體分布的chi-square檢驗(yàn)基本操作步驟數(shù)據(jù)要求:原始數(shù)據(jù)(1個(gè)變量)或加權(quán)后的頻數(shù)數(shù)據(jù)(2個(gè)變量)菜單:analyze->Nonparametrictest->chisquare待檢驗(yàn)變量待檢驗(yàn)個(gè)案的取值范圍全部樣本用戶自定義:只有在該取值范圍內(nèi)的觀測(cè)數(shù)據(jù)才參與分析指定期望頻數(shù)所有子集頻數(shù)都相同--均勻分布用戶自定義依次輸入例題6.1醫(yī)學(xué)家在研究心臟病人猝死人數(shù)與日期的關(guān)系時(shí)發(fā)現(xiàn):一周之中,星期一心臟病人猝死者比較多,其他日子則基本相當(dāng)。各天的比例近似為2.8:1:1:1:1:1:1?,F(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),推斷其總體分布是否與上述理論分布相吻合。“心臟病猝死.sav”二項(xiàng)分布檢驗(yàn)基本思想在現(xiàn)實(shí)生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分成男性和女性,產(chǎn)品可以分成合格和不合格,投擲硬幣實(shí)驗(yàn)的結(jié)果可以分成出現(xiàn)正面和反面等。通常將這樣的二值分別用1和0表示如果進(jìn)行n次相同的實(shí)驗(yàn),則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機(jī)變量來(lái)描述。如果隨機(jī)變量值為1代表·“成功”,其概率設(shè)為p,則隨機(jī)變量值為0的概率q便等于1-p,則成功次數(shù)變量X的分布為二項(xiàng)分布二項(xiàng)分布檢驗(yàn)SPSS的二項(xiàng)分布檢驗(yàn):通過(guò)樣本數(shù)據(jù)檢驗(yàn)樣本來(lái)自的總體是否服從指定的概率為p的二項(xiàng)分布原假設(shè):樣本來(lái)自的總體與指定的二項(xiàng)分布無(wú)顯著差異二項(xiàng)分布檢驗(yàn)SPSS二項(xiàng)分布檢驗(yàn)在小樣本中采用精確檢驗(yàn)方法大樣本則采用近似檢驗(yàn)方法精確檢驗(yàn)方法:計(jì)算n次試驗(yàn)中某類出現(xiàn)的次數(shù)小于等于x次的概率,即二項(xiàng)分布檢驗(yàn)近似檢驗(yàn)方法采用Z檢驗(yàn)統(tǒng)計(jì)量,在原假設(shè)成立下Z統(tǒng)計(jì)量近似服從正態(tài)分布,其數(shù)學(xué)定義為
式中進(jìn)行了連續(xù)性修正,當(dāng)x小于n/2時(shí)加0.5,當(dāng)x大于n/2時(shí)減0.5SPSS自動(dòng)計(jì)算上述精確概率和近似概率值。如果概率值小于顯著性水平α.則拒絕原假設(shè),認(rèn)為樣本來(lái)自的總體與指定的二項(xiàng)分布有顯著差異;如果概率值大于顯著性水平a,則不能拒絕原假設(shè),認(rèn)為樣本來(lái)自的總體與指定的二項(xiàng)分布無(wú)顯著差異二項(xiàng)分布基本操作步驟選擇菜單:Analyze→NonparametricTests→Binomial待檢驗(yàn)變量指定分類方式檢驗(yàn)變量為二值變量檢驗(yàn)變量不是二值變量輸人具體數(shù)值,小于等于該值的觀察值為第一組,大于該值的觀察值為第二組檢驗(yàn)概率值p例題6.2從某批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測(cè)并得到檢測(cè)結(jié)果數(shù)據(jù)。用1表示一級(jí)品,用0表示非一級(jí)品。根據(jù)抽樣結(jié)果驗(yàn)證該品產(chǎn)品的一級(jí)品率是否為90%。“產(chǎn)品合格率.sav”SPSS單樣本的K-S檢驗(yàn)K-S檢驗(yàn)是以俄羅斯數(shù)學(xué)家柯?tīng)柲绾退姑字Z夫(Kolmogorov-Smirnov)的名字命名的一種非參數(shù)檢驗(yàn)方法利用樣本數(shù)據(jù)推斷樣本來(lái)自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗(yàn)方法適用于探索連續(xù)型隨機(jī)變量的分布正態(tài)分布,Poisson分布,均勻分布和指數(shù)分布例如收集一批周歲兒童身高的樣本數(shù)據(jù),需利用樣本數(shù)據(jù)推斷周歲兒童總體的身高是否服從正態(tài)分布利用收集的住房狀況調(diào)查的樣本數(shù)據(jù),分析家庭人均住房面積是否服從正態(tài)分布SPSS單樣本的K-S檢驗(yàn)基本思路:在原假設(shè)成立的前提下,根據(jù)用戶指定檢驗(yàn)的總體分布,構(gòu)造出一理論的頻數(shù)分布,計(jì)算各樣本觀測(cè)值在理論分布中出現(xiàn)的累計(jì)概率值F(x)計(jì)算各樣本觀測(cè)值的實(shí)際累計(jì)概率值S(x)計(jì)算實(shí)際累計(jì)概率值與理論累計(jì)概率值的差D(x)計(jì)算差值序列中的最大絕對(duì)差值,即實(shí)際累積概率為離散值,因此修正為:如果相差較小,則認(rèn)為樣本所代表的總體符合指定的總體分布SPSS單樣本的K-S檢驗(yàn)在小樣本下,原假設(shè)成立時(shí),D統(tǒng)計(jì)量服從Kolmogorov分布在大樣本下,原假設(shè)成立時(shí),
近似服從K(x)分布:當(dāng)D小于0時(shí),K(x)為0當(dāng)D大于0時(shí),如果樣本總體的分布與理論分布的差異不明顯,那么D不應(yīng)較大。如果D統(tǒng)計(jì)量的概率P值小于顯著性水平α,則應(yīng)拒絕原假設(shè),認(rèn)為樣本來(lái)自的總體與指定的分布有顯著差異。反之。在SPSS中,僅給出大樣本下的和對(duì)應(yīng)的概率p值SPSS的單樣本K-S檢驗(yàn)基本步驟菜單選項(xiàng):analyze->nonparametrictests->1-samplek-s待檢驗(yàn)變量指定檢驗(yàn)的分布名稱:normal:正態(tài)分布uniform:均勻分布possion:泊松分布exponential:指數(shù)分布Exact:精確方法MonteCarlo:MonteCarlo抽樣方法Asymptoticonly:用于大樣本的漸近方法SPSS的單樣本K-S檢驗(yàn)經(jīng)常有人在Kolmogorov-Smirnov檢驗(yàn)中,當(dāng)檢驗(yàn)不能拒絕總體分布為某分布時(shí),來(lái)“接受”或“證明”該樣本來(lái)自該分布。這是錯(cuò)誤的。比如我們有由1、2、3、4、5五個(gè)數(shù)目組成的數(shù)據(jù),我們分別檢驗(yàn)該數(shù)據(jù)是否是正態(tài)分布、均勻分布、Poisson分布或指數(shù)分布。結(jié)果歸納為下表Kolmogorov-Smirnov單樣本分布檢驗(yàn) 零假設(shè)的分布 (漸近雙邊檢驗(yàn)的)p-值 正態(tài)分布 1.000 均勻分布 0.988 Poisson分布 1.000指數(shù)分布 0.806 根據(jù)此表,沒(méi)有足夠證據(jù)來(lái)拒絕任何一個(gè)零假設(shè)。難道我們可以隨意“接受”該總體為其中任一個(gè)分布嗎?
例題6.3收集到21名周歲兒童身高的樣本數(shù)據(jù),分析周歲兒童身高的總體是否服從正態(tài)分布“兒童身高.sav”概率P值大于顯著性水平,因此不能拒絕原假設(shè),可以認(rèn)為周歲兒童身高的總體分布與正態(tài)分布無(wú)顯著差異變量值的隨機(jī)性檢驗(yàn)?zāi)康睦脴颖緮?shù)據(jù)對(duì)總體可能出現(xiàn)的變量值是否隨機(jī)進(jìn)行檢驗(yàn)投硬幣:以1表示出現(xiàn)的是正面,以0表示出現(xiàn)的是反面。在進(jìn)行了若干次投幣后,將會(huì)得到一個(gè)以1、0組成的變量值序列。這時(shí)可能會(huì)分析“硬幣出現(xiàn)正反面是否是隨機(jī)的”這樣的問(wèn)題基本假設(shè):H0:總體可能出現(xiàn)的變量值是隨機(jī)的SPSS的單樣本隨機(jī)性檢驗(yàn)基本方法觀察樣本序列出現(xiàn)了多少游程(run).游程:樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù).一般出現(xiàn)太多或太少的游程表示變量值序列有一定的非隨機(jī)性其中相同的0(或相同的1)在一起稱為一個(gè)游程(單獨(dú)的0或1也算)4個(gè)0組成的游程和3個(gè)1組成的游程。一共是R=7個(gè)游程。其中0的個(gè)數(shù)為m=15,而1的個(gè)數(shù)為n=100000111111001011100000000游程檢驗(yàn)的分布利用游程數(shù)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,把游程出現(xiàn)0和1的的這樣一個(gè)過(guò)程可以看成是參數(shù)為某未知p的Bernoulli試驗(yàn)。但在給定了m和n之后,在0和1的出現(xiàn)是隨機(jī)的零假設(shè)之下,R的條件分布就和這個(gè)參數(shù)無(wú)關(guān)了。根據(jù)初等概率論,R的分布可以寫(xiě)成(令N=m+n)游程檢驗(yàn)的近似分布在大樣本下,游程近似服從正態(tài)分布。R為游程數(shù)SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量,并依據(jù)正態(tài)分布表給出對(duì)應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為變量值的出現(xiàn)不是隨機(jī)的;如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為變量值的出現(xiàn)是隨機(jī)的SPSS的單樣本隨機(jī)性檢驗(yàn)基本操作步驟菜單選項(xiàng):analyze->nonparametrictest->runs待檢驗(yàn)變量指定如何計(jì)算游程:median:以中位數(shù)為界線mode:以眾數(shù)為界線mean:以均值為分界線custom:以用戶指定值為界線小于界線值的為一類;大于等于界線值的為另一類例題6.4為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常,測(cè)試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù)?,F(xiàn)采用游程檢驗(yàn)方法對(duì)這批數(shù)據(jù)進(jìn)行分析。如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的,可認(rèn)為該設(shè)備工作一直正常,否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象。“電纜數(shù)據(jù).sav”SPSS兩獨(dú)立樣本非參數(shù)檢驗(yàn)?zāi)康挠瑟?dú)立樣本數(shù)據(jù)推斷兩總體的分布是否存在顯著差異(或兩樣本是否來(lái)自同一總體)。獨(dú)立樣本:在一個(gè)總體中隨機(jī)抽樣對(duì)在另一個(gè)總體中隨機(jī)抽樣沒(méi)有影響的情況下所獲得的樣本基本假設(shè)H0:兩總體分布無(wú)顯著差異(兩樣本來(lái)自同一總體)數(shù)據(jù)要求樣本數(shù)據(jù)和分組標(biāo)志基本內(nèi)容曼--惠特尼U檢驗(yàn)、K-S檢驗(yàn)、W-W游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)秩(rank)
非參數(shù)檢驗(yàn)中秩是最常使用的概念。秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀測(cè)值的位置或名次。變量值有幾個(gè),對(duì)應(yīng)的秩便有幾個(gè)。例如我們有下面數(shù)據(jù):下面一行(記為Ri)是上面一行數(shù)據(jù)Xi的秩。利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)曼-惠特尼U檢驗(yàn)(Mann-WhitneyU)通過(guò)對(duì)兩組樣本平均秩的研究來(lái)進(jìn)行推斷將兩樣本數(shù)據(jù)混合并按升序排序求出其秩對(duì)兩樣本的秩分別求平均如果兩樣本的平均秩大致相同,則認(rèn)為兩總體分布無(wú)顯著差異。如果兩個(gè)平均秩相差甚遠(yuǎn),則應(yīng)是一組樣本的秩普遍偏小,另一組樣本的秩普遍偏大的結(jié)果,也就是一組樣本的值普遍偏小,另一組樣本的值普遍偏大的結(jié)果。此時(shí)原假設(shè)很可能是不成立的Wilcoxon(Mann-Whitney)秩和檢驗(yàn)曼一惠特尼U檢驗(yàn)常用Wilcoxon(或稱Mann-Whitney)秩和W檢驗(yàn),其原理是假定兩個(gè)個(gè)樣本X和Y分別有m個(gè)和n個(gè)觀測(cè)值。把兩個(gè)樣本混合后把這m+n個(gè)觀測(cè)值升冪排序,記下每個(gè)觀測(cè)值在混合排序下面的秩。之后分別把兩個(gè)樣本所得到的秩相加。記第一個(gè)樣本觀測(cè)值的秩的和為WX而第二個(gè)樣本秩的和為WY。這兩個(gè)值可以互相推算,稱為Wilcoxon統(tǒng)計(jì)量。WilcoxonW為:如果m<n,則WilcoxonW=WY;如果m>n,則WilcoxonW=Wx;曼—惠特尼U統(tǒng)計(jì)量的計(jì)算公式為式中,W值即為WilcoxonW;k為W對(duì)應(yīng)樣本組的樣本量Wilcoxon(Mann-Whitney)秩和檢驗(yàn)在小樣本下,U統(tǒng)計(jì)量服從曼-惠特尼分布。SPSS自動(dòng)計(jì)算出U統(tǒng)計(jì)量的觀測(cè)值和概率P-值。在大樣本下,U統(tǒng)計(jì)量近似服從正態(tài)分布,計(jì)算公式為該統(tǒng)計(jì)量的分布和兩個(gè)總體分布無(wú)關(guān)。由此分布SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量和對(duì)應(yīng)的p-值。直觀上看,如果WX與WY之中有一個(gè)顯著地大,則可以選擇拒絕零假設(shè)。在小樣本下,依據(jù)U統(tǒng)計(jì)量的概率P-值進(jìn)行決策;而在大樣本下,則依據(jù)Z統(tǒng)計(jì)量的概率P-值進(jìn)行決策例題6.5某工廠用甲乙兩種不同的工藝生產(chǎn)同一種產(chǎn)品,如果希望檢驗(yàn)兩種工藝下產(chǎn)品的使用壽命是否存在差異,可以從兩種工藝生產(chǎn)出的產(chǎn)品中隨機(jī)抽樣,得到各自的使用壽命數(shù)據(jù)?!笆褂脡勖?sav”兩獨(dú)立樣本分布的K-S檢驗(yàn)原假設(shè)兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異基本思想與單樣本K-S檢驗(yàn)的基本思想大體一致主要差別:這里是以變量值的秩作為分析對(duì)象,而非變量值本身首先,將兩組樣本混合并按升序排序然后,分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率最后,計(jì)算兩組累計(jì)頻率的差,得到秩的差值序列并得到D統(tǒng)計(jì)量如果差距較小,則認(rèn)為兩總體分布無(wú)顯著差異兩獨(dú)立樣本分布的K-S檢驗(yàn)假定兩個(gè)樣本的樣本量分別為n1和n2,用S1(X)和S2(X)分別表示兩個(gè)樣本的累積經(jīng)驗(yàn)分布函數(shù)。再記Dj=S1(Xj)-S2(Xj)。近似正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量為SPSS中將自動(dòng)計(jì)算在大樣本下的Z的觀測(cè)值和概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩總體的分布有顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為兩總體的分布無(wú)顯著差異兩樣本W(wǎng)ald-Wolfowitz游程檢驗(yàn)不同于單樣本游程檢驗(yàn),兩獨(dú)立樣本的游程檢驗(yàn)用來(lái)檢驗(yàn)兩獨(dú)立樣本來(lái)自的兩總體的分布是否存在顯著差異。原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異。兩獨(dú)立樣本的游程檢驗(yàn)(Wald-Wolfowitzrunstest)和單樣本游程檢驗(yàn)基本思想基本相同。不同的是計(jì)算游程數(shù)的方法。兩獨(dú)立樣本的游程檢驗(yàn)中,游程數(shù)依賴于變量的秩。兩獨(dú)立樣本游程檢驗(yàn)首先,把兩個(gè)樣本混合,按照大小次序排列,對(duì)應(yīng)的組標(biāo)記值也會(huì)隨之重新排列,同樣本的組標(biāo)記值在一起的為一個(gè)游程。然后,計(jì)算分組標(biāo)志序列的游程數(shù)如果兩總體的分布存在較大差距,那么游程數(shù)會(huì)相對(duì)比較少如果游程數(shù)比較大,則應(yīng)是兩組樣本值充分混合的結(jié)果,兩總體的分布不會(huì)存在顯著差異最后,根據(jù)游程數(shù)據(jù)計(jì)算Z統(tǒng)計(jì)量,該統(tǒng)計(jì)量近似服從正態(tài)分布。SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量的觀測(cè)值和對(duì)應(yīng)的概率P_值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩總體的分布存在顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),可以認(rèn)為兩總體的分布無(wú)顯著差異R=6兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)原假設(shè):兩獨(dú)立樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異?;舅枷?將一組樣本作為控制樣本,另一組樣本作為實(shí)驗(yàn)樣本。以控制樣本作為對(duì)照,檢驗(yàn)實(shí)驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。如果實(shí)驗(yàn)樣本沒(méi)有出現(xiàn)極端反應(yīng),則認(rèn)為兩總體的分布無(wú)顯著差異如果實(shí)驗(yàn)樣本存在極端反應(yīng),則認(rèn)為兩總體的分布存在顯著差異兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)分析過(guò)程將兩組樣本混合按升序排序;然后,求出控制樣本的最小秩Qmin和最大秩Qmax,并計(jì)算出跨度(Span)為消除樣本數(shù)據(jù)中極端值對(duì)分析結(jié)果的影響,在計(jì)算跨度之前可按比例(通常為5%)去除控制樣本中部分靠近兩端的樣本值,然后再求跨度,得到截頭跨度如果跨度或截頭跨度較小,則是兩組樣本數(shù)據(jù)無(wú)法充分混合,一組樣本值顯著大于另一組樣本值的結(jié)果,則認(rèn)為相對(duì)控制樣本,實(shí)驗(yàn)樣本出現(xiàn)了極端反應(yīng),樣本來(lái)自的兩總體的分布存在顯著差異如果跨度或截頭跨度較大,則應(yīng)是兩組樣本數(shù)據(jù)充分混合,一組樣本值沒(méi)有顯著大于另一組樣本值的結(jié)果,則認(rèn)為相對(duì)控制樣本,實(shí)驗(yàn)樣本沒(méi)有出現(xiàn)極端反應(yīng),樣本來(lái)自的兩總體的分布沒(méi)有顯著差異極端反應(yīng)檢驗(yàn)統(tǒng)計(jì)量針對(duì)跨度或截頭跨度計(jì)算H檢驗(yàn)統(tǒng)計(jì)量m為控制樣本的樣本量;Qi為控制樣本在混合樣本中的秩;
為控制樣本的平均秩小樣本下,H統(tǒng)計(jì)量服從Hollander分布;大樣本下,H統(tǒng)計(jì)量近似服從正態(tài)分布SPSS將自動(dòng)計(jì)算H統(tǒng)計(jì)量的觀測(cè)值和概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為兩獨(dú)立樣本來(lái)自的兩總體的分布存在顯著差異。反之跨度為:15-6+1=10截頭跨度為:13-8+1=6以樣本1為控制組SPSS兩獨(dú)立樣本非參數(shù)檢驗(yàn)基本操作步驟菜單選項(xiàng):analyze->nonparametrictests->2independentsample例題6.6分析兩種工藝下產(chǎn)品的使用壽命是否存在差異SPSS多獨(dú)立樣本非參數(shù)檢驗(yàn)?zāi)康挠啥嘟M獨(dú)立樣本數(shù)據(jù)推斷多個(gè)總體的分布是否存在顯著差異多組獨(dú)立樣本是指按獨(dú)立抽樣方式獲得的多組樣本基本假設(shè):H0:多個(gè)總體分布無(wú)顯著差異數(shù)據(jù)要求:樣本數(shù)據(jù)和分組標(biāo)志基本內(nèi)容中位數(shù)檢驗(yàn)、Kruskal-Wallis檢驗(yàn)、Jonckheere-Terpstra檢驗(yàn)例題6.7利用“四城市兒童身高”數(shù)據(jù),對(duì)北京、上海、成都、廣州四城市的周歲兒童身高進(jìn)行比較分析,推斷四城市周歲兒童身高是否存在顯著差異中位數(shù)檢驗(yàn)(median)中位數(shù)檢驗(yàn)通過(guò)對(duì)多組獨(dú)立樣本的分析,檢驗(yàn)它們來(lái)自的總體的中位數(shù)是否存在顯著差異。原假設(shè)多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著差異基本思想如果多個(gè)總體的中位數(shù)無(wú)顯著差異,或者說(shuō)多個(gè)總體有共同的中位數(shù),那么這個(gè)共同的中位數(shù)應(yīng)在各樣本組中均處在中間位置上。于是,每組樣本中大于該中位數(shù)與小于該中位數(shù)的樣本量應(yīng)大致相同中位數(shù)檢驗(yàn)(median)基本步驟將多組樣本混合按升序排序,并求出混合樣本的中位數(shù)分別計(jì)算各組樣本中大于和小于上述中位數(shù)的樣本量,形成列聯(lián)表利用卡方檢驗(yàn)方法分析各組樣本來(lái)自的總體對(duì)于上述中位數(shù)的分布是否一致中位數(shù)檢驗(yàn)(median)如果各組中大于(或小于)上述中位數(shù)的樣本比例大致相同,則可以認(rèn)為多組樣本有共同的中位數(shù),它們來(lái)自的總體的中位數(shù)無(wú)顯著差異反之,如果各組中大于(或小于)上述中位數(shù)的樣本比例相差較大,則可以認(rèn)為多組樣本的中位數(shù)不全部相同,它們來(lái)自的總體的中位數(shù)存在顯著差異假定有k個(gè)總體,ni為第i個(gè)樣本量;把所有樣本量之和記為N先把從這個(gè)k個(gè)總體來(lái)的樣本混合起來(lái)排序,找出它們的中位數(shù)計(jì)算每個(gè)總體中小于該中位數(shù)的觀測(cè)值個(gè)數(shù)O1j,j=1,…,k,和每個(gè)總體中大于該中位數(shù)的觀測(cè)值個(gè)數(shù)O2j,j=1,…,k。這樣就形成了一個(gè)由元素Oij組成的2×k表。其列總和為ni,j=1,…,k;而兩個(gè)行總和為各樣本小于總中位數(shù)的觀測(cè)值總和:R1=O11+O12+…+O1k及各樣本大于總中位數(shù)的觀測(cè)值總和R2=O21+O22+…+O2k列聯(lián)表,可以用Pearsonc2統(tǒng)計(jì)量卡方統(tǒng)計(jì)量服從((2-1)X(n-1)個(gè)自由度的卡方分布中位數(shù)檢驗(yàn)的計(jì)算示例對(duì)樣本數(shù)據(jù)混合排序后,得到共同的中位數(shù)為74k-w檢驗(yàn)(推廣的平均秩檢驗(yàn))多獨(dú)立樣本的Kruskal-Wallis檢驗(yàn)的實(shí)質(zhì)是兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)在多個(gè)獨(dú)立樣本下的推廣,用于檢驗(yàn)多個(gè)總體的分布是否存在顯著差異原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異基本思想首先,將多組樣本數(shù)據(jù)混合并按升序排序,求出各變量值的秩;然后,考察各組秩的均值是否存在顯著差異如果各組秩的均值不存在顯著差異,則是多組數(shù)據(jù)充分混合,數(shù)值相差不大的結(jié)果,可以認(rèn)為多個(gè)總體的分布無(wú)顯著差異;如果各組秩的均值存在顯著差異,則是多組數(shù)據(jù)無(wú)法混合,某些組的數(shù)值普遍偏大,另一些組的數(shù)值普遍偏小的結(jié)果,可以認(rèn)為多個(gè)總體的分布有顯著差異Kruskal-Wallis關(guān)于多個(gè)樣本的秩和檢驗(yàn)
目的是檢驗(yàn)多總體位置參數(shù)是否一樣。方法和Wilcoxon-Mann-Whitney檢驗(yàn)的思想類似為研究各組秩的差異,可借鑒方差分析方法總變差=組間差+組內(nèi)差如果各樣本組秩的總變差的大部分可由組間差解釋,則表明各樣本組的總體分布存在顯著差異;反之,如果各樣本組秩的總變差的大部分不能由組間差解釋,則表明各樣本組的總體分布沒(méi)有顯著差異構(gòu)造K-W檢驗(yàn)統(tǒng)計(jì)量Kruskal-Wallis多個(gè)樣本的秩和檢驗(yàn)假定有k個(gè)總體。先把從這個(gè)k個(gè)總體來(lái)的樣本混合起來(lái)排序,記各個(gè)總體觀測(cè)值的秩之和為Ri,i=1,…,k。顯然如果這些Ri很不相同,就可以認(rèn)為它們位置參數(shù)相同的零假設(shè)不妥(備選假設(shè)為各個(gè)位置參數(shù)不全相等)Kruskal-Wallis檢驗(yàn)統(tǒng)計(jì)量公式中表示樣本組數(shù);ni為第i組的樣本量,而N為各個(gè)樣本量之和(總樣本量)。這個(gè)統(tǒng)計(jì)量在位置參數(shù)相同的零假設(shè)下有漸近的自由度為k-1的χ2分布Kruskal-Wallis檢驗(yàn)的計(jì)算示例有一些秩出現(xiàn)了“打結(jié)”。對(duì)此SPSS中通常以平均秩來(lái)處理北京、上海、成都、廣州的平均秩:14.4,8.2,15.8,3.6Jonckheere-Terpstra多樣本的秩檢驗(yàn)Jonckheere-Terpstra檢驗(yàn)先在每?jī)蓚€(gè)樣本所有觀測(cè)值對(duì)之間比較,計(jì)算第i個(gè)樣本觀測(cè)值中小于第j個(gè)樣本觀測(cè)值的對(duì)子數(shù)Uij上式表明,J-T統(tǒng)計(jì)量是所有Uij在i<j組范圍內(nèi)的總和,稱為觀測(cè)的J-T統(tǒng)計(jì)量,在大樣本下近似服從正態(tài)分布J-T統(tǒng)計(jì)量計(jì)算J-T統(tǒng)計(jì)量時(shí)會(huì)涉及樣本標(biāo)記值的大小順序。例如,如果有三組樣本,樣本標(biāo)記值分別為1,2,3,則觀測(cè)的J-T統(tǒng)計(jì)量為:第1組樣本觀察值小于第2組樣本觀察值的個(gè)數(shù)+第1組樣本觀察值小于第3組樣本觀察值的個(gè)數(shù)+第2組樣本觀察值小于第3組樣本觀察值的個(gè)數(shù)除計(jì)算觀測(cè)的J-T統(tǒng)計(jì)量,通常還將計(jì)算所有情況下的J-T統(tǒng)計(jì)量。例如,如果仍有1,2,3三組樣本,除了按照(l,2,3)的順序計(jì)算J-T值,還要按照(1,3,2),(2,1,3),(2.3,1),(3,1,2),(3,2,1)的順序計(jì)算所有的J-T值,并計(jì)算這些J-T值的均值和標(biāo)準(zhǔn)差等如果觀測(cè)的J-T統(tǒng)計(jì)量遠(yuǎn)大于或遠(yuǎn)小于J-T均值,那么可以認(rèn)為,按照樣本標(biāo)記值的升序,樣本數(shù)據(jù)有明顯的上升或下降趨勢(shì),從而能夠判定樣本來(lái)自的多個(gè)總體的分布存在顯著差異檢驗(yàn)統(tǒng)計(jì)量在大樣本下,J-T統(tǒng)計(jì)量近似服從正態(tài)分布式中,J為觀測(cè)的J-T統(tǒng)計(jì)量;k為樣本組數(shù);ni為第i組樣本的樣本量SPSS將自動(dòng)計(jì)算J-T統(tǒng)計(jì)量、Z統(tǒng)計(jì)量和相應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布存在顯著差異;反之,如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),認(rèn)為多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布不存在顯著差異Jonckheere-Terpstra檢驗(yàn)的計(jì)算示例“打結(jié)”的情況計(jì)為0.5,觀測(cè)的J-T值為45.5,所有排列下的J-T平均值為75SPSS軟件使用說(shuō)明
數(shù)據(jù)要求:Analyze-NonparametricTests-KIndependentSamplesSPSS兩配對(duì)樣本非參數(shù)檢驗(yàn)含義由配對(duì)樣本數(shù)據(jù)推斷兩總體分布是否存在顯著差異基本假設(shè)H0:兩配對(duì)樣本來(lái)自的兩總體分布無(wú)顯著差異數(shù)據(jù)要求配對(duì)樣本的樣本量是相同的,且各樣本值的先后次序是不能隨意更改的基本方法McNemar檢驗(yàn)、符號(hào)檢驗(yàn)、Wilcoxon符號(hào)秩檢驗(yàn)舉例要檢驗(yàn)一種新的訓(xùn)練方法是否對(duì)提高跳遠(yuǎn)運(yùn)動(dòng)員的成績(jī)有顯著效果,可以收集一批跳遠(yuǎn)運(yùn)動(dòng)員在使用新訓(xùn)練方法前后的跳遠(yuǎn)最好成績(jī),這樣的兩組樣本便是配對(duì)的分析不同廣告形式是否對(duì)商品的銷售產(chǎn)生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數(shù)據(jù)(其他條件保持基本穩(wěn)定)。這里不同廣告形式下的若干組商品銷售額樣本便是配對(duì)樣本。配對(duì)樣本的樣本量相同,且各樣本值的先后次序不能隨意更改變化顯著性檢驗(yàn)(McNemar)將研究對(duì)象作為自身的對(duì)照者檢驗(yàn)其“前后”的變化是否顯著McNemar檢驗(yàn)是基于列聯(lián)表進(jìn)行分析的關(guān)心的對(duì)象是發(fā)生變化的兩個(gè)單元格中頻數(shù)變化。發(fā)生變化的兩格中,如果頻數(shù)變化相當(dāng),則認(rèn)為無(wú)顯著變化數(shù)據(jù)要求:只能是二分值數(shù)據(jù)分析學(xué)生在學(xué)習(xí)“統(tǒng)計(jì)學(xué)”課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變例題學(xué)習(xí)統(tǒng)計(jì)學(xué)前和學(xué)習(xí)后的樣本是兩組配對(duì)樣本。在學(xué)習(xí)統(tǒng)計(jì)學(xué)課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)識(shí)會(huì)有下列四種情況A,B,C,D分別代表前后兩種狀態(tài)轉(zhuǎn)換的頻數(shù),它們的總和為所有樣本量如果頻數(shù)B和C大致相當(dāng),即態(tài)度從“不重要”到“重要”的人數(shù)與態(tài)度從“重要”到“不重要”的人數(shù)大致相當(dāng),那么可理解為學(xué)習(xí)前后學(xué)生對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知總體上并沒(méi)有發(fā)生顯著的變化如果頻數(shù)B和C相差較大,即態(tài)度從“不重要”到“重要”的人數(shù)與態(tài)度從“重要”到“不重要”的人數(shù)相差較大,那么可理解為學(xué)習(xí)前后學(xué)生對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知總體上發(fā)生了顯著的變化檢驗(yàn)為了研究這個(gè)問(wèn)題,McNemar檢驗(yàn)采用二項(xiàng)分布檢驗(yàn)的方法,計(jì)算表中態(tài)度變化的分布是否服從概率P為0.5的二項(xiàng)分布。在小樣本下計(jì)算二項(xiàng)分布的累計(jì)精確概率,大樣本下采用修正的Z統(tǒng)計(jì)量式,它近似服從正態(tài)分布SPSS將自動(dòng)計(jì)算Z統(tǒng)計(jì)量和相應(yīng)的概率P-值。如果概率P-值小于給定的顯著性水平a,則應(yīng)拒絕原假設(shè),認(rèn)為態(tài)度變化的分布與P為0.5的二項(xiàng)分布存在顯著差異,即兩配對(duì)樣本所來(lái)自的兩總體的分布存在顯著差異;如果概率P-值大于給定的顯著性水平a,則不能拒絕原假設(shè),認(rèn)為態(tài)度變化的分布與p為0.5的二項(xiàng)分布不存在顯著差異,即兩配對(duì)樣本所來(lái)自的兩總體的分布沒(méi)有顯著差異注意:兩配對(duì)樣本的McNemar檢驗(yàn)分析的是二值變量例題兩配對(duì)樣本的符號(hào)檢驗(yàn)?zāi)康模簷z驗(yàn)量配對(duì)樣本所來(lái)自的總體的分布是否存在顯著差異原假
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年家裝裝修合同范文(二篇)
- 描寫(xiě)保護(hù)環(huán)境建議書(shū)范文(12篇)
- 2024年幼兒園小班教師個(gè)人工作總結(jié)例文(二篇)
- 2024年小學(xué)教育科研課題管理制度例文(五篇)
- 2024年圖書(shū)室工作計(jì)劃范例(二篇)
- 2024年商業(yè)地產(chǎn)租賃協(xié)議(三篇)
- 2024年安全管理工作總結(jié)范文(二篇)
- 2024年小學(xué)六年級(jí)教師工作計(jì)劃范本(三篇)
- 2024年幼兒園中班春季工作計(jì)劃樣本(二篇)
- 2024年垃圾運(yùn)輸合同例文(三篇)
- 公共關(guān)系學(xué)-實(shí)訓(xùn)項(xiàng)目1:公關(guān)三要素分析
- 人教版2022年四年級(jí)上冊(cè)數(shù)學(xué)期中考試考點(diǎn)檢查試卷
- 花城版音樂(lè)八年級(jí)下冊(cè)第3單元《生死不離》教案
- GB∕T 8163-2018 輸送流體用無(wú)縫鋼管
- 南京中醫(yī)大《金匱要略》教學(xué)大綱
- 鋼混組合梁施工方案
- 課件《“多元一體”視域下的中國(guó)古代民族關(guān)系》
- 初中班主任三年工作規(guī)劃8篇
- (完整版)《春江花月夜》課件PPT
- 通信用閥控式密封鉛酸蓄電池
- 藍(lán)色卡通班委競(jìng)選主題班會(huì)PPT模板
評(píng)論
0/150
提交評(píng)論