版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
` 卡方檢驗(yàn)8_八、卡方檢驗(yàn)卡方檢驗(yàn)基礎(chǔ)擬合問題-單個樣本率與總體率的比較相關(guān)問題-兩個樣本率或構(gòu)成比的比較兩分類變量間關(guān)聯(lián)程度的度量一致性檢驗(yàn)與配對卡方檢驗(yàn)分層卡方檢驗(yàn)小結(jié)
內(nèi)容提要8_八、卡方檢驗(yàn)
2檢驗(yàn)是以2分布為基礎(chǔ)的一種假設(shè)檢驗(yàn)方法,主要用于分類變量,根據(jù)樣本數(shù)據(jù)推斷總體的分布與期望分布是否有顯著差異,或推斷兩個分類變量是否相關(guān)或相互獨(dú)立。其原假設(shè)為:
H0:觀察頻數(shù)與期望頻數(shù)沒有差別卡方檢驗(yàn)基礎(chǔ)8_八、卡方檢驗(yàn)
首先假設(shè)H0成立,計算出2值,它表示觀察值與理論值之間的偏離程度。根據(jù)2分布,2統(tǒng)計量以及自由度可以確定在H0成立的情況下獲得當(dāng)前統(tǒng)計量及更極端情況的概率P。如果P很小,說明觀察值和理論值偏離程度太大,應(yīng)當(dāng)拒絕原假設(shè),表示比較資料之間有顯著性差異;否則就不能拒絕原假設(shè),尚不能認(rèn)為樣本所代表的實(shí)際情況與理論假設(shè)有差別??ǚ綑z驗(yàn)基礎(chǔ)
2檢驗(yàn)的基本思想8_八、卡方檢驗(yàn)
2值的計算:由英國統(tǒng)計學(xué)家KarlPearson首次提出,故被稱為Pearson
2??ǚ綑z驗(yàn)基礎(chǔ)8_八、卡方檢驗(yàn)
當(dāng)n比較大時,
2統(tǒng)計量近似服從k-1個自由度的2分布。在自由度固定時,每個2值與一個概率值(P值)相對應(yīng),此概率值即為在H0成立的前提下,出現(xiàn)這樣一個樣本或偏離假設(shè)總體更遠(yuǎn)的樣本的概率。如果P值小于或等于顯著性水準(zhǔn),則拒絕H0,接受H1,即觀察頻數(shù)與期望頻數(shù)不一致。如果P值大于顯著性水準(zhǔn),則不拒絕H0,認(rèn)為觀察頻數(shù)與期望頻數(shù)無顯著性差異。P值越小,說明H0假設(shè)正確的可能性越小;P值越大,說明H0假設(shè)正確的可能性越大??ǚ綑z驗(yàn)基礎(chǔ)-卡方分布8_八、卡方檢驗(yàn)卡方檢驗(yàn)基礎(chǔ)
利用單樣本均值比較的t檢驗(yàn),可以檢驗(yàn)樣本所在總體的均值與已知值是否存在顯著性差異,即樣本均值與已知值的差異,是由于樣本所在總體的均值和已知值確實(shí)有差別,還是由于隨機(jī)抽樣引起的差異。這是針對連續(xù)性變量而言,如果是分類變量,就不能使用進(jìn)行均值比較的t檢驗(yàn),而應(yīng)該使用進(jìn)行率比較的卡方檢驗(yàn)。8_八、卡方檢驗(yàn)
檢驗(yàn)?zāi)硞€連續(xù)變量的分布是否與某種理論分布一致,如是否符合正態(tài)分布,Possion分布等檢驗(yàn)?zāi)硞€分類變量各類的出現(xiàn)概率是否等于指定概率檢驗(yàn)兩個分類變量是否相互獨(dú)立,如吸煙是否與呼吸道疾病有關(guān)檢驗(yàn)控制某種或某幾種分類變量因素的作用之后,另兩個分類變量是否獨(dú)立,如上例控制年齡、性別之后,吸煙是否與呼吸道疾病有關(guān)檢驗(yàn)兩種方法的結(jié)果是否一致,如兩種診斷方法對同一批人進(jìn)行診斷,其診斷結(jié)果是否一致卡方檢驗(yàn)基礎(chǔ)-用途8_八、卡方檢驗(yàn)
例1某公司經(jīng)營多年,形成了一套成熟的企業(yè)文化和管理體系,例如根據(jù)多年的運(yùn)營經(jīng)驗(yàn),經(jīng)理層、監(jiān)察員、辦事員三種職務(wù)類別的比例大約在15:5:80為宜,這樣運(yùn)行效率最高。兩年前公司原管理層集體退居二線,新任管理層上任后對公司進(jìn)行了較大的變動,有員工擔(dān)心這是否已經(jīng)導(dǎo)致了職務(wù)類別比例的失調(diào),影響到公司的高效運(yùn)行。目前三種職務(wù)的人數(shù)比為84:27:363,如何用數(shù)據(jù)分析來解決此類問題呢?(數(shù)據(jù)見employeedata.sav)擬合問題-樣本率與已知總體率的比較8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較
這是一個樣本構(gòu)成比與已知總體構(gòu)成比進(jìn)行比較的統(tǒng)計學(xué)問題,可以用卡方檢驗(yàn)來解決。8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較
注意,此處數(shù)值的排列順序和數(shù)據(jù)文件中各類別的排列順序應(yīng)當(dāng)相同,因?yàn)樗麄兇嬖谝灰粚?yīng)的關(guān)系。8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較分析結(jié)果
給出了樣本中三個職務(wù)級別的觀察頻數(shù)、期望頻數(shù)以及殘差。8_八、卡方檢驗(yàn)擬合問題-樣本率與已知總體率的比較分析結(jié)果
此為單樣本
2檢驗(yàn)的結(jié)果,
2值為3.492,P=0.174,故可認(rèn)為觀察頻數(shù)和期望頻數(shù)沒有顯著差別。8_八、卡方檢驗(yàn)
注意:
本例使用的數(shù)據(jù)是原始數(shù)據(jù),一個案例代表一個員工的情況。但如果數(shù)據(jù)是頻數(shù)格式,即每一行代表一個水平,另外用一個頻數(shù)變量代表該水平的頻數(shù)。此時在分析時要首先告訴SPSS具體哪一個變量是頻數(shù)變量。如何實(shí)現(xiàn)呢?利用數(shù)據(jù)準(zhǔn)備中的WeightCases即可。擬合問題-樣本率與已知總體率的比較8_八、卡方檢驗(yàn)
例2某婦女聯(lián)合會向工會提出質(zhì)疑,認(rèn)為該公司在對女性員工的職位安排上存在歧視,因?yàn)樵摴?16名女性雇員中,只有10人為經(jīng)理,其余206名為辦事員;而258名男性雇員中,74名為經(jīng)理。但是工會說,男女間職位類別比例的差異,只是一個隨機(jī)誤差,并不是真的存在性別歧視。哪種說法才是正確的呢?(數(shù)據(jù)見employeedata.sav)相關(guān)問題-兩個率或構(gòu)成比的比較8_八、卡方檢驗(yàn)相關(guān)問題-兩個率或構(gòu)成比的比較
這是一個比較兩個性別的職位構(gòu)成比是否相同的統(tǒng)計學(xué)問題,要用Descriptive中的Crosstabs實(shí)現(xiàn),與單個率的比較不同。8_八、卡方檢驗(yàn)相關(guān)問題-兩個率或構(gòu)成比的比較
分別指定行列變量到Row(s)和Columns中。8_八、卡方檢驗(yàn)相關(guān)問題-兩個率或構(gòu)成比的比較8_八、卡方檢驗(yàn)相關(guān)問題-兩個率或構(gòu)成比的比較8_八、卡方檢驗(yàn)相關(guān)問題-兩個率或構(gòu)成比的比較分析結(jié)果
可見,性別和職位不獨(dú)立,女性更容易成為辦事員,而男性更容易得到經(jīng)理和監(jiān)察員的職位。8_八、卡方檢驗(yàn)相關(guān)問題-兩個率或構(gòu)成比的比較
需要注意的是,卡方檢驗(yàn)僅僅告知使用者各類別的構(gòu)成和分布是否相同,本例中的職務(wù)是無序分類變量,監(jiān)察員和辦事員不能比較大小順序,因此可以進(jìn)行卡方檢驗(yàn)。如果為有序分類變量的話,則卡方檢驗(yàn)并不合適,而應(yīng)用秩和檢驗(yàn)。8_八、卡方檢驗(yàn)連續(xù)性校正
2檢驗(yàn):
僅適用于四格表資料,在n>40,所有期望頻數(shù)均大于1,只有1/5單元格的期望頻數(shù)大于1小于5時;Fisher精確概率法:
在樣本含量<40或有格子的期望頻數(shù)<1的列聯(lián)表,應(yīng)該采用該法;似然比
2檢驗(yàn):
當(dāng)n>40,最小期望頻數(shù)>5時,結(jié)論與Pearson
2基本一致;相關(guān)問題-兩個率或構(gòu)成比的比較
幾種卡方檢驗(yàn)的比較:8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量
卡方檢驗(yàn)可以從定性的角度說明兩個變量是否存在關(guān)聯(lián),當(dāng)拒絕原假設(shè)時,在統(tǒng)計上有把握認(rèn)為兩個變量存在相關(guān)。但接下來的問題是,如果兩變量之間存在相關(guān)性,它們之間的關(guān)聯(lián)程度有多大?針對不同的變量類型,在SPSS中可以計算各種各樣的相關(guān)指標(biāo),而且Crosstabs過程也對此提供了完整的支持,此處只涉及兩分類變量間關(guān)聯(lián)程度的指標(biāo),更系統(tǒng)的相關(guān)程度指標(biāo)見相關(guān)與回歸一章。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量相對危險度RR:是一個概率的比值,指試驗(yàn)組人群反應(yīng)陽性概率與對照組人群反應(yīng)陽性概率的比值。數(shù)值為1,表明試驗(yàn)因素與反應(yīng)陽性無關(guān)聯(lián);小于1時,表明試驗(yàn)因素導(dǎo)致反應(yīng)陽性的發(fā)生率降低;大于1時,表明試驗(yàn)因素導(dǎo)致反應(yīng)陽性的發(fā)生率增加。優(yōu)勢比OR:是一個比值的比,是反應(yīng)陽性人群中試驗(yàn)因素有無的比例與反應(yīng)陰性人群中試驗(yàn)因素有無的比例之比。當(dāng)關(guān)注的事件發(fā)生概率比較小時(<0.1),優(yōu)勢比可作為相對危險度的近似。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量
例3
某公司實(shí)行數(shù)據(jù)庫營銷,其雜志銷售部每個月向數(shù)據(jù)庫中的人們發(fā)送征訂郵件,但是回應(yīng)率極低。經(jīng)研究發(fā)現(xiàn),報紙訂閱(News)和郵件回應(yīng)Response有相關(guān)性,該部門經(jīng)理想了解報紙訂閱回應(yīng)者回郵件的概率是非訂閱者的幾倍。數(shù)據(jù)文件見demo.sav。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量
分別指定行列變量到Row(s)和Columns中。8_八、卡方檢驗(yàn)選中可得到RR值兩分類變量間關(guān)聯(lián)程度的度量8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量分析結(jié)果
這就是兩變量的四格表。8_八、卡方檢驗(yàn)兩分類變量間關(guān)聯(lián)程度的度量分析結(jié)果
結(jié)果顯示,報紙訂閱者對于郵件的回應(yīng)概率是非報紙訂閱者的1.668倍,或者說無回應(yīng)的概率是非報紙訂閱者的0.94倍。而OR值為1.774。8_八、卡方檢驗(yàn)在Pearson卡方檢驗(yàn)中,對行變量和列變量的相關(guān)性作檢驗(yàn),其中行變量和列變量是一個事物的兩個不同屬性。在實(shí)際中,還有一種列聯(lián)表,其行變量和列變量反映的是一個事物的同一屬性的相同水平,只是對該屬性各水平的區(qū)分方法不同。其特征是:行的數(shù)目和列的數(shù)目總是相同的。如果希望檢驗(yàn)這兩種區(qū)分同一屬性的方法給出的結(jié)果是否一致,則不應(yīng)當(dāng)使用Pearson
2檢驗(yàn),而應(yīng)該采用Kappa一致性檢驗(yàn)對兩種方法一致程度進(jìn)行評價。一致性檢驗(yàn)8_八、卡方檢驗(yàn)
一般認(rèn)為,當(dāng)Kappa≥0.75時,表明兩者一致性較好;
0.75>Kappa≥0.4時,表明一致性一般;
Kappa<0.4時,表明兩者一致性較差。一致性檢驗(yàn)8_八、卡方檢驗(yàn)
例4某實(shí)驗(yàn)室分別用乳膠凝集法和免疫熒光法對58名可疑系統(tǒng)性紅斑狼瘡患者血清中抗核抗體進(jìn)行測定,結(jié)果見下表,問兩種方法的檢測結(jié)果有無差別?(數(shù)據(jù)見McNemar.sav)免疫熒光法
乳膠凝集法
合計+
-+111223
-23335
合計134558兩種方法的檢測結(jié)果配對卡方檢驗(yàn)8_八、卡方檢驗(yàn)不能忘記哦!配對卡方檢驗(yàn)8_八、卡方檢驗(yàn)在此選入頻數(shù)變量即可進(jìn)行下一步的分析。配對卡方檢驗(yàn)8_八、卡方檢驗(yàn)配對卡方檢驗(yàn)8_八、卡方檢驗(yàn)配對卡方檢驗(yàn)選中可進(jìn)行配對卡方檢驗(yàn)8_八、卡方檢驗(yàn)配對卡方檢驗(yàn)分析結(jié)果8_八、卡方檢驗(yàn)配對卡方檢驗(yàn)分析結(jié)果
如果在statistics子對話框中勾選上Kappa復(fù)選框,則有以下結(jié)果:8_八、卡方檢驗(yàn)
注意:
Kappa檢驗(yàn)會利用列聯(lián)表的全部信息,而McNemar檢驗(yàn)只會利用非主對角線單元格上的信息。因此,對于一致性較好,即絕大多數(shù)數(shù)據(jù)都在主對角線的大樣本列聯(lián)表,McNemar檢驗(yàn)可能會失去實(shí)用價值。配對卡方檢驗(yàn)8_八、卡方檢驗(yàn)
例5
某零售連鎖店對3家分店的客戶滿意度進(jìn)行了調(diào)查,現(xiàn)希望分析尋求幫助和性別之間有無聯(lián)系。(數(shù)據(jù)見cmh.sav)分層卡方檢驗(yàn)8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)選入分層變量store8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)進(jìn)行分層卡方檢驗(yàn)8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)
首先給出的是層間差異的檢驗(yàn),結(jié)果顯示,不同分店間,gender與contact的聯(lián)系是相同的。分析結(jié)果8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)
分層卡方檢驗(yàn)結(jié)果,即考慮了分層因素的影響以后,對gender與contact的檢驗(yàn)結(jié)果,共給出CMH
2檢驗(yàn)和MH
2檢驗(yàn)兩種結(jié)果,前者是后者的改進(jìn),可見P值均小于0.05,即可認(rèn)為性別與求助有關(guān)。分析結(jié)果8_八、卡方檢驗(yàn)分層卡方檢驗(yàn)
結(jié)果顯示,ORMH
值為0.636,表明去除了不同分店的混雜效應(yīng)以后,和女性相比,男性顧客尋求幫助的優(yōu)勢比為0.636,或者說更不容易尋求幫助。分析結(jié)果8_八、卡方檢驗(yàn)1.卡方檢驗(yàn)是以
2分布為基礎(chǔ)的一種常用假設(shè)檢驗(yàn)方法,常用作計數(shù)資料的顯著性檢驗(yàn)。其基本思想是:首先假設(shè)觀察頻數(shù)與期望頻數(shù)沒有差別。而統(tǒng)計量
2值表示觀察值與理論值之間的偏離程度。當(dāng)n比較大時,2統(tǒng)計量近似服從k-1個自由度的2分布。在自由度固定時,每個2值與一個概率值相對應(yīng),此概率即為在H0假設(shè)成立的前提下,出現(xiàn)這樣一個樣本或更大差別樣本的概率。如果P值小于或等于顯著性水準(zhǔn),則應(yīng)拒絕H0,接受H1。小結(jié)8_八、卡方檢驗(yàn)2.關(guān)聯(lián)程度的測量:卡方檢驗(yàn)從定性的角度分析是否存在相關(guān),而各種關(guān)聯(lián)指標(biāo)從定量的角度分析相關(guān)的程度大小。不同的指標(biāo)適合不同類型的變量。RR值是一個概率的比值,是指試驗(yàn)組人群反應(yīng)陽性概率與對照組人群反應(yīng)概率的比值。用于反映試驗(yàn)因素與反應(yīng)陽性的關(guān)聯(lián)程度。OR值是比值的比。是反應(yīng)陽性人群中試驗(yàn)因素有無的比例與反應(yīng)陰性人群中試驗(yàn)因素有無的比例之比。在下列兩個條件均滿足時,可用于估計RR值:①所關(guān)注的事件發(fā)生概率比較小(<0.1),②所設(shè)計的研究是病例對照研究。小結(jié)8_八、卡方檢驗(yàn)3.Kap
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年標(biāo)準(zhǔn)庭院租賃合同模板版B版
- 代理門市租賃協(xié)議
- 電子廠班車司機(jī)勞動合同
- 水上運(yùn)輸勞務(wù)租賃合同
- 2024年校園教學(xué)樓及運(yùn)動場地租賃合同版
- 2025試驗(yàn)委托合同范文
- 眼鏡驗(yàn)配店裝修施工合同
- 2025企業(yè)流動資金的借貸合同
- 2024年二零二四年度商鋪?zhàn)赓U合同備案及登記協(xié)議書2篇
- 臨時車輛租賃合同-企業(yè)活動
- 2014光伏發(fā)電站功率控制能力檢測技術(shù)規(guī)程
- 第15課 有創(chuàng)意的書(說課稿)2022-2023學(xué)年美術(shù)四年級上冊 人教版
- 2023年上海交通大學(xué)827材料科學(xué)基礎(chǔ)試題
- 信訪面試資料
- 焊接工藝評定轉(zhuǎn)化表
- 《報告文學(xué)研究》(07562)自考考試復(fù)習(xí)題庫(含答案)
- 拼多多運(yùn)營合作合同范本
- 小學(xué)英語-module10 unit2 eat vegetables every day教學(xué)設(shè)計學(xué)情分析教材分析課后反思
- Unit3Timeschange!Period1Startingout教案-高中英語外研版選擇性
- 全國大學(xué)英語四、六級考試缺考申請表
- 美國特朗普-課件
評論
0/150
提交評論