版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
` 卡方檢驗(yàn)8_八、卡方檢驗(yàn)卡方檢驗(yàn)基礎(chǔ)擬合問題-單個(gè)樣本率與總體率的比較相關(guān)問題-兩個(gè)樣本率或構(gòu)成比的比較兩分類變量間關(guān)聯(lián)程度的度量一致性檢驗(yàn)與配對(duì)卡方檢驗(yàn)分層卡方檢驗(yàn)小結(jié)
內(nèi)容提要8_八、卡方檢驗(yàn)
2檢驗(yàn)是以2分布為基礎(chǔ)的一種假設(shè)檢驗(yàn)方法,主要用于分類變量,根據(jù)樣本數(shù)據(jù)推斷總體的分布與期望分布是否有顯著差異,或推斷兩個(gè)分類變量是否相關(guān)或相互獨(dú)立。其原假設(shè)為:
H0:觀察頻數(shù)與期望頻數(shù)沒有差別卡方檢驗(yàn)基礎(chǔ)8_八、卡方檢驗(yàn)
首先假設(shè)H0成立,計(jì)算出2值,它表示觀察值與理論值之間的偏離程度。根據(jù)2分布,2統(tǒng)計(jì)量以及自由度可以確定在H0成立的情況下獲得當(dāng)前統(tǒng)計(jì)量及更極端情況的概率P。如果P很小,說明觀察值和理論值偏離程度太大,應(yīng)當(dāng)拒絕原假設(shè),表示比較資料之間有顯著性差異;否則就不能拒絕原假設(shè),尚不能認(rèn)為樣本所代表的實(shí)際情況與理論假設(shè)有差別??ǚ綑z驗(yàn)基礎(chǔ)
2檢驗(yàn)的基本思想8_八、卡方檢驗(yàn)
2值的計(jì)算:由英國(guó)統(tǒng)計(jì)學(xué)家KarlPearson首次提出,故被稱為Pearson
2??ǚ綑z驗(yàn)基礎(chǔ)8_八、卡方檢驗(yàn)
當(dāng)n比較大時(shí),
2統(tǒng)計(jì)量近似服從k-1個(gè)自由度的2分布。在自由度固定時(shí),每個(gè)2值與一個(gè)概率值(P值)相對(duì)應(yīng),此概率值即為在H0成立的前提下,出現(xiàn)這樣一個(gè)樣本或偏離假設(shè)總體更遠(yuǎn)的樣本的概率。如果P值小于或等于顯著性水準(zhǔn),則拒絕H0,接受H1,即觀察頻數(shù)與期望頻數(shù)不一致。如果P值大于顯著性水準(zhǔn),則不拒絕H0,認(rèn)為觀察頻數(shù)與期望頻數(shù)無顯著性差異。P值越小,說明H0假設(shè)正確的可能性越?。籔值越大,說明H0假設(shè)正確的可能性越大??ǚ綑z驗(yàn)基礎(chǔ)-卡方分布8_八、卡方檢驗(yàn)卡方檢驗(yàn)基礎(chǔ)
利用單樣本均值比較的t檢驗(yàn),可以檢驗(yàn)樣本所在總體的均值與已知值是否存在顯著性差異,即樣本均值與已知值的差異,是由于樣本所在總體的均值和已知值確實(shí)有差別,還是由于隨機(jī)抽樣引起的差異。這是針對(duì)連續(xù)性變量而言,如果是分類變量,就不能使用進(jìn)行均值比較的t檢驗(yàn),而應(yīng)該使用進(jìn)行率比較的卡方檢驗(yàn)。8_八、卡方檢驗(yàn)
檢驗(yàn)?zāi)硞€(gè)連續(xù)變量的分布是否與某種理論分布一致,如是否符合正態(tài)分布,Possion分布等檢驗(yàn)?zāi)硞€(gè)分類變量各類的出現(xiàn)概率是否等于指定概率檢驗(yàn)兩個(gè)分類變量是否相互獨(dú)立,如吸煙是否與呼吸道疾病有關(guān)檢驗(yàn)控制某種或某幾種分類變量因素的作用之后,另兩個(gè)分類變量是否獨(dú)立,如上例控制年齡、性別之后,吸煙是否與呼吸道疾病有關(guān)檢驗(yàn)兩種方法的結(jié)果是否一致,如兩種診斷方法對(duì)同一批人進(jìn)行診斷,其診斷結(jié)果是否一致卡方檢驗(yàn)基礎(chǔ)-用途8_八、卡方檢驗(yàn)
例1某公司經(jīng)營(yíng)多年,形成了一套成熟的企業(yè)文化和管理體系,例如根據(jù)多年的運(yùn)營(yíng)經(jīng)驗(yàn),經(jīng)理層、監(jiān)察員、辦事員三種職務(wù)類別的比例大約在15:5:80為宜,這樣運(yùn)行效率最高。兩年前公司原管理層集體退居二線,新任管理層上任后對(duì)公司進(jìn)行了較大的變動(dòng),有員工擔(dān)心這是否已經(jīng)導(dǎo)致了職務(wù)類別比例的失調(diào),影響到公司的高效運(yùn)行。目前三種職務(wù)的人數(shù)比為84:27:363,如何用數(shù)據(jù)分析來解決此類問題呢?(數(shù)據(jù)見employeedata.sav)擬合問題-樣本率與已知總體率的比較8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較
這是一個(gè)樣本構(gòu)成比與已知總體構(gòu)成比進(jìn)行比較的統(tǒng)計(jì)學(xué)問題,可以用卡方檢驗(yàn)來解決。8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較
注意,此處數(shù)值的排列順序和數(shù)據(jù)文件中各類別的排列順序應(yīng)當(dāng)相同,因?yàn)樗麄兇嬖谝灰粚?duì)應(yīng)的關(guān)系。8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較分析結(jié)果
給出了樣本中三個(gè)職務(wù)級(jí)別的觀察頻數(shù)、期望頻數(shù)以及殘差。8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較分析結(jié)果
此為單樣本
2檢驗(yàn)的結(jié)果,
2值為3.492,P=0.174,故可認(rèn)為觀察頻數(shù)和期望頻數(shù)沒有顯著差別。8_八、卡方檢驗(yàn)
注意:
本例使用的數(shù)據(jù)是原始數(shù)據(jù),一個(gè)案例代表一個(gè)員工的情況。但如果數(shù)據(jù)是頻數(shù)格式,即每一行代表一個(gè)水平,另外用一個(gè)頻數(shù)變量代表該水平的頻數(shù)。此時(shí)在分析時(shí)要首先告訴SPSS具體哪一個(gè)變量是頻數(shù)變量。如何實(shí)現(xiàn)呢?利用數(shù)據(jù)準(zhǔn)備中的WeightCases即可。擬合問題-樣本率與已知總體率的比較8_八、卡方檢驗(yàn)
例2某婦女聯(lián)合會(huì)向工會(huì)提出質(zhì)疑,認(rèn)為該公司在對(duì)女性員工的職位安排上存在歧視,因?yàn)樵摴?16名女性雇員中,只有10人為經(jīng)理,其余206名為辦事員;而258名男性雇員中,74名為經(jīng)理。但是工會(huì)說,男女間職位類別比例的差異,只是一個(gè)隨機(jī)誤差,并不是真的存在性別歧視。哪種說法才是正確的呢?(數(shù)據(jù)見employeedata.sav)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較8_八、卡方檢驗(yàn)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較
這是一個(gè)比較兩個(gè)性別的職位構(gòu)成比是否相同的統(tǒng)計(jì)學(xué)問題,要用Descriptive中的Crosstabs實(shí)現(xiàn),與單個(gè)率的比較不同。8_八、卡方檢驗(yàn)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較
分別指定行列變量到Row(s)和Columns中。8_八、卡方檢驗(yàn)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較8_八、卡方檢驗(yàn)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較8_八、卡方檢驗(yàn)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較分析結(jié)果
可見,性別和職位不獨(dú)立,女性更容易成為辦事員,而男性更容易得到經(jīng)理和監(jiān)察員的職位。8_八、卡方檢驗(yàn)相關(guān)問題-兩個(gè)率或構(gòu)成比的比較
需要注意的是,卡方檢驗(yàn)僅僅告知使用者各類別的構(gòu)成和分布是否相同,本例中的職務(wù)是無序分類變量,監(jiān)察員和辦事員不能比較大小順序,因此可以進(jìn)行卡方檢驗(yàn)。如果為有序分類變量的話,則卡方檢驗(yàn)并不合適,而應(yīng)用秩和檢驗(yàn)。8_八、卡方檢驗(yàn)連續(xù)性校正
2檢驗(yàn):
僅適用于四格表資料,在n>40,所有期望頻數(shù)均大于1,只有1/5單元格的期望頻數(shù)大于1小于5時(shí);Fisher精確概率法:
在樣本含量<40或有格子的期望頻數(shù)<1的列聯(lián)表,應(yīng)該采用該法;似然比
2檢驗(yàn):
當(dāng)n>40,最小期望頻數(shù)>5時(shí),結(jié)論與Pearson
2基本一致;相關(guān)問題-兩個(gè)率或構(gòu)成比的比較
幾種卡方檢驗(yàn)的比較:8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量
卡方檢驗(yàn)可以從定性的角度說明兩個(gè)變量是否存在關(guān)聯(lián),當(dāng)拒絕原假設(shè)時(shí),在統(tǒng)計(jì)上有把握認(rèn)為兩個(gè)變量存在相關(guān)。但接下來的問題是,如果兩變量之間存在相關(guān)性,它們之間的關(guān)聯(lián)程度有多大?針對(duì)不同的變量類型,在SPSS中可以計(jì)算各種各樣的相關(guān)指標(biāo),而且Crosstabs過程也對(duì)此提供了完整的支持,此處只涉及兩分類變量間關(guān)聯(lián)程度的指標(biāo),更系統(tǒng)的相關(guān)程度指標(biāo)見相關(guān)與回歸一章。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量相對(duì)危險(xiǎn)度RR:是一個(gè)概率的比值,指試驗(yàn)組人群反應(yīng)陽(yáng)性概率與對(duì)照組人群反應(yīng)陽(yáng)性概率的比值。數(shù)值為1,表明試驗(yàn)因素與反應(yīng)陽(yáng)性無關(guān)聯(lián);小于1時(shí),表明試驗(yàn)因素導(dǎo)致反應(yīng)陽(yáng)性的發(fā)生率降低;大于1時(shí),表明試驗(yàn)因素導(dǎo)致反應(yīng)陽(yáng)性的發(fā)生率增加。優(yōu)勢(shì)比OR:是一個(gè)比值的比,是反應(yīng)陽(yáng)性人群中試驗(yàn)因素有無的比例與反應(yīng)陰性人群中試驗(yàn)因素有無的比例之比。當(dāng)關(guān)注的事件發(fā)生概率比較小時(shí)(<0.1),優(yōu)勢(shì)比可作為相對(duì)危險(xiǎn)度的近似。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量
例3
某公司實(shí)行數(shù)據(jù)庫(kù)營(yíng)銷,其雜志銷售部每個(gè)月向數(shù)據(jù)庫(kù)中的人們發(fā)送征訂郵件,但是回應(yīng)率極低。經(jīng)研究發(fā)現(xiàn),報(bào)紙訂閱(News)和郵件回應(yīng)Response有相關(guān)性,該部門經(jīng)理想了解報(bào)紙訂閱回應(yīng)者回郵件的概率是非訂閱者的幾倍。數(shù)據(jù)文件見demo.sav。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量
分別指定行列變量到Row(s)和Columns中。8_八、卡方檢驗(yàn)選中可得到RR值兩分類變量間關(guān)聯(lián)程度的度量8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量分析結(jié)果
這就是兩變量的四格表。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量分析結(jié)果
結(jié)果顯示,報(bào)紙訂閱者對(duì)于郵件的回應(yīng)概率是非報(bào)紙訂閱者的1.668倍,或者說無回應(yīng)的概率是非報(bào)紙訂閱者的0.94倍。而OR值為1.774。8_八、卡方檢驗(yàn)在Pearson卡方檢驗(yàn)中,對(duì)行變量和列變量的相關(guān)性作檢驗(yàn),其中行變量和列變量是一個(gè)事物的兩個(gè)不同屬性。在實(shí)際中,還有一種列聯(lián)表,其行變量和列變量反映的是一個(gè)事物的同一屬性的相同水平,只是對(duì)該屬性各水平的區(qū)分方法不同。其特征是:行的數(shù)目和列的數(shù)目總是相同的。如果希望檢驗(yàn)這兩種區(qū)分同一屬性的方法給出的結(jié)果是否一致,則不應(yīng)當(dāng)使用Pearson
2檢驗(yàn),而應(yīng)該采用Kappa一致性檢驗(yàn)對(duì)兩種方法一致程度進(jìn)行評(píng)價(jià)。一致性檢驗(yàn)8_八、卡方檢驗(yàn)
一般認(rèn)為,當(dāng)Kappa≥0.75時(shí),表明兩者一致性較好;
0.75>Kappa≥0.4時(shí),表明一致性一般;
Kappa<0.4時(shí),表明兩者一致性較差。一致性檢驗(yàn)8_八、卡方檢驗(yàn)
例4某實(shí)驗(yàn)室分別用乳膠凝集法和免疫熒光法對(duì)58名可疑系統(tǒng)性紅斑狼瘡患者血清中抗核抗體進(jìn)行測(cè)定,結(jié)果見下表,問兩種方法的檢測(cè)結(jié)果有無差別?(數(shù)據(jù)見McNemar.sav)免疫熒光法
乳膠凝集法
合計(jì)+
-+111223
-23335
合計(jì)134558兩種方法的檢測(cè)結(jié)果配對(duì)卡方檢驗(yàn)8_八、卡方檢驗(yàn)不能忘記哦!配對(duì)卡方檢驗(yàn)8_八、卡方檢驗(yàn)在此選入頻數(shù)變量即可進(jìn)行下一步的分析。配對(duì)卡方檢驗(yàn)8_八、卡方檢驗(yàn)配對(duì)卡方檢驗(yàn)8_八、卡方檢驗(yàn)配對(duì)卡方檢驗(yàn)選中可進(jìn)行配對(duì)卡方檢驗(yàn)8_八、卡方檢驗(yàn)配對(duì)卡方檢驗(yàn)分析結(jié)果8_八、卡方檢驗(yàn)配對(duì)卡方檢驗(yàn)分析結(jié)果
如果在statistics子對(duì)話框中勾選上Kappa復(fù)選框,則有以下結(jié)果:8_八、卡方檢驗(yàn)
注意:
Kappa檢驗(yàn)會(huì)利用列聯(lián)表的全部信息,而McNemar檢驗(yàn)只會(huì)利用非主對(duì)角線單元格上的信息。因此,對(duì)于一致性較好,即絕大多數(shù)數(shù)據(jù)都在主對(duì)角線的大樣本列聯(lián)表,McNemar檢驗(yàn)可能會(huì)失去實(shí)用價(jià)值。配對(duì)卡方檢驗(yàn)8_八、卡方檢驗(yàn)
例5
某零售連鎖店對(duì)3家分店的客戶滿意度進(jìn)行了調(diào)查,現(xiàn)希望分析尋求幫助和性別之間有無聯(lián)系。(數(shù)據(jù)見cmh.sav)分層卡方檢驗(yàn)8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)選入分層變量store8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)進(jìn)行分層卡方檢驗(yàn)8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)
首先給出的是層間差異的檢驗(yàn),結(jié)果顯示,不同分店間,gender與contact的聯(lián)系是相同的。分析結(jié)果8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)
分層卡方檢驗(yàn)結(jié)果,即考慮了分層因素的影響以后,對(duì)gender與contact的檢驗(yàn)結(jié)果,共給出CMH
2檢驗(yàn)和MH
2檢驗(yàn)兩種結(jié)果,前者是后者的改進(jìn),可見P值均小于0.05,即可認(rèn)為性別與求助有關(guān)。分析結(jié)果8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)
結(jié)果顯示,ORMH
值為0.636,表明去除了不同分店的混雜效應(yīng)以后,和女性相比,男性顧客尋求幫助的優(yōu)勢(shì)比為0.636,或者說更不容易尋求幫助。分析結(jié)果8_八、卡方檢驗(yàn)1.卡方檢驗(yàn)是以
2分布為基礎(chǔ)的一種常用假設(shè)檢驗(yàn)方法,常用作計(jì)數(shù)資料的顯著性檢驗(yàn)。其基本思想是:首先假設(shè)觀察頻數(shù)與期望頻數(shù)沒有差別。而統(tǒng)計(jì)量
2值表示觀察值與理論值之間的偏離程度。當(dāng)n比較大時(shí),2統(tǒng)計(jì)量近似服從k-1個(gè)自由度的2分布。在自由度固定時(shí),每個(gè)2值與一個(gè)概率值相對(duì)應(yīng),此概率即為在H0假設(shè)成立的前提下,出現(xiàn)這樣一個(gè)樣本或更大差別樣本的概率。如果P值小于或等于顯著性水準(zhǔn),則應(yīng)拒絕H0,接受H1。小結(jié)8_八、卡方檢驗(yàn)2.關(guān)聯(lián)程度的測(cè)量:卡方檢驗(yàn)從定性的角度分析是否存在相關(guān),而各種關(guān)聯(lián)指標(biāo)從定量的角度分析相關(guān)的程度大小。不同的指標(biāo)適合不同類型的變量。RR值是一個(gè)概率的比值,是指試驗(yàn)組人群反應(yīng)陽(yáng)性概率與對(duì)照組人群反應(yīng)概率的比值。用于反映試驗(yàn)因素與反應(yīng)陽(yáng)性的關(guān)聯(lián)程度。OR值是比值的比。是反應(yīng)陽(yáng)性人群中試驗(yàn)因素有無的比例與反應(yīng)陰性人群中試驗(yàn)因素有無的比例之比。在下列兩個(gè)條件均滿足時(shí),可用于估計(jì)RR值:①所關(guān)注的事件發(fā)生概率比較?。?lt;0.1),②所設(shè)計(jì)的研究是病例對(duì)照研究。小結(jié)8_八、卡方檢驗(yàn)3.Kap
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年湘教新版九年級(jí)生物上冊(cè)月考試卷含答案
- 2025年北師大新版九年級(jí)地理下冊(cè)月考試卷含答案
- 2025年華東師大版九年級(jí)生物上冊(cè)階段測(cè)試試卷含答案
- 2025年冀教版九年級(jí)歷史下冊(cè)階段測(cè)試試卷含答案
- 2025年冀教版選擇性必修1歷史下冊(cè)階段測(cè)試試卷
- 2025年上教版七年級(jí)生物下冊(cè)階段測(cè)試試卷
- 2025年外研版九年級(jí)歷史上冊(cè)月考試卷
- 二零二五版離婚協(xié)議書起草與子女撫養(yǎng)權(quán)維護(hù)服務(wù)合同4篇
- 二零二五版借貸房屋買賣合同糾紛調(diào)解服務(wù)合同4篇
- 二零二五版木結(jié)構(gòu)建筑能耗數(shù)據(jù)采集與分析合同4篇
- 電力系統(tǒng)動(dòng)態(tài)仿真與建模
- 蝦皮shopee新手賣家考試題庫(kù)及答案
- 四川省宜賓市2023-2024學(xué)年八年級(jí)上學(xué)期期末義務(wù)教育階段教學(xué)質(zhì)量監(jiān)測(cè)英語試題
- 價(jià)值醫(yī)療的概念 實(shí)踐及其實(shí)現(xiàn)路徑
- 2024年中國(guó)華能集團(tuán)燃料有限公司招聘筆試參考題庫(kù)含答案解析
- 《紅樓夢(mèng)》中的男性形象解讀
- 安全生產(chǎn)技術(shù)規(guī)范 第49部分:加油站 DB50-T 867.49-2023
- 《三國(guó)演義》中的語言藝術(shù):詩(shī)詞歌賦的應(yīng)用
- 腸外營(yíng)養(yǎng)液的合理配制
- 消防安全教育培訓(xùn)記錄表
- 2023年河南省新鄉(xiāng)市鳳泉區(qū)事業(yè)單位招聘53人高頻考點(diǎn)題庫(kù)(共500題含答案解析)模擬練習(xí)試卷
評(píng)論
0/150
提交評(píng)論