第七章 卡方檢驗2010.10.12_第1頁
第七章 卡方檢驗2010.10.12_第2頁
第七章 卡方檢驗2010.10.12_第3頁
第七章 卡方檢驗2010.10.12_第4頁
第七章 卡方檢驗2010.10.12_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

檢驗

Chi-SquareTest

第七章第二軍醫(yī)大學衛(wèi)生統(tǒng)計學教研室/研究生數(shù)據(jù)處理中心WHO/TDRClinicalDataManagementCenter何倩

目的:推斷兩個總體率或構(gòu)成比之間有無差別多個總體率或構(gòu)成比之間有無差別多個樣本率的多重比較

檢驗統(tǒng)計量:應用:計數(shù)資料3第一節(jié)四格表資料的檢驗

4目的:推斷兩個總體率(構(gòu)成比)是否有差別

要求:兩樣本的兩分類個體數(shù)排列成四格表資料5

(1)

分布是一種連續(xù)型分布:按分布的密度函數(shù)可給出自由度=1,2,3,……的一簇分布曲線(圖7-1)。(2)分布的一個基本性質(zhì)是可加性:如果兩個獨立的隨機變量X1和X2分別服從自由度ν1和ν2的分布,即,那么它們的和(X1+X2

)服從自由度(ν1+ν2

)的分布,即~。

6一、檢驗的基本思想

1.分布7(1)分布是一種連續(xù)型分布:按分布的密度函數(shù)可給出自由度=1,2,3,……的一簇分布曲線(圖7-1)。(2)分布的一個基本性質(zhì)是可加性:如果兩個獨立的隨機變量X1和X2分別服從自由度ν1和ν2的分布,即,那么它們的和(X1+X2

)服從自由度(ν1+ν2

)的分布,即~。2.

2檢驗的基本思想96名對照組104名試驗組200名顱內(nèi)壓增高癥患者2023/10/168觀察有效率99名有效(90.48%)75名有效(83.52%)優(yōu)于?>例7-1假設(shè)檢驗假設(shè)兩組患者來自同一總體推算兩組患者的理論陽性和陰性人數(shù)實際與理論差距由

2值的大小反映以

2值大小判斷假設(shè)是否成立一、2×2列聯(lián)表

2檢驗的基本思想表7-1兩組降低顱內(nèi)壓有效率的比較處理有效無效合計有效率(%)試驗組99510495.20對照組75219678.13合計1742620087.00(90.48)(83.52)(13.52)(12.48)Sample1Sample2Population2023/10/169?

本例資料經(jīng)整理成圖7-2形式,即有兩個處理組,每個處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有四個基本數(shù)據(jù),其余數(shù)據(jù)均由此四個數(shù)據(jù)推算出來的,故稱四格表資料。1011

圖7-2四格表資料的基本形式

基本思想:可通過檢驗的基本公式來理解。12式中,A為實際頻數(shù)(actualfrequency),

T為理論頻數(shù)(theoreticalfrequency)。理論頻數(shù)由下式求得:13式中,TRC為第R行C列的理論頻數(shù)

nR為相應的行合計

nC為相應的列合計

理論頻數(shù)是根據(jù)檢驗假設(shè),且用合并率來估計而定的。如上例,無效假設(shè)是試驗組與對照組降低顱內(nèi)壓的總體有效率相等,均等于合計的有效率87%。那么理論上,試驗組的104例顱內(nèi)壓增高癥患者中有效者應為104(174/200)=90.48,無效者為104(26/200)=13.52;同理,對照組的96例顱內(nèi)壓增高癥患者中有效者應為96(174/200)=83.52,無效者為96(26/200)=12.48。

14

檢驗統(tǒng)計量值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。若檢驗假設(shè)H0:π1=π2成立,四個格子的實際頻數(shù)A與理論頻數(shù)T相差不應該很大,即統(tǒng)計量不應該很大。如果值很大,即相對應的P值很小,若,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對立假設(shè)H1,即π1≠π2。15

由公式(7-1)還可以看出:值的大小還取決于個數(shù)的多少(嚴格地說是自由度ν的大?。?。由于各皆是正值,故自由度ν愈大,值也會愈大;所以只有考慮了自由度ν的影響,值才能正確地反映實際頻數(shù)A和理論頻數(shù)T的吻合程度。檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當中只有一個可以自由取值。16(1)建立檢驗假設(shè),確定檢驗水平。H0:π1=π2即試驗組與對照組降低顱內(nèi)壓的總體有效率相等H1:π1≠π2

即試驗組與對照組降低顱內(nèi)壓的總體有效率不相等α=0.05。173.假設(shè)檢驗步驟(2)求檢驗統(tǒng)計量值1819自由度概率,Pv0.9950.9900.9000.5000.1000.0500.0100.00510.020.452.713.845.027.8820.010.020.211.394.615.999.2110.6030.070.110.582.376.257.8111.3412.8440.210.301.063.367.789.4913.2814.8650.410.551.614.359.2411.0715.0916.75二、四格表資料檢驗的專用公式20組別+--合計甲組aba+b乙組cdc+d合計a+cb+dN

分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計算得的統(tǒng)計量的抽樣分布亦呈離散性質(zhì)。為改善統(tǒng)計量分布的連續(xù)性,則需行連續(xù)性校正。21三、四格表資料檢驗的校正公式

22四格表資料檢驗公式選擇條件:

23

,專用公式;,校正公式;,直接計算概率。

連續(xù)性校正僅用于的四格表資料,當時,一般不作校正。

例7-2

某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷酯治療腦血管疾病的療效,將78例腦血管疾病患者隨機分為兩組,結(jié)果見表7-2。問兩種藥物治療腦血管疾病的有效率是否相等?2425表7-2兩種藥物治療腦血管疾病有效率的比較26

本例,故用四格表資料檢驗的校正公式

,查界值表得。按

檢驗水準不拒絕,尚不能認為兩種藥物治療腦血管疾病的有效率不等。

本資料若不校正時,結(jié)論與之相反。27第二節(jié)配對四格表資料的檢驗

例7-3

某實驗室分別用乳膠凝集法和免疫熒光法對58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進行測定,結(jié)果見表7-3。問兩種方法的檢測結(jié)果有無差別?2930

表7-3兩種方法的檢測結(jié)果

其中,a,d為兩法觀察結(jié)果一致的兩種情況,

b,c為兩法觀察結(jié)果不一致的兩種情況。31檢驗統(tǒng)計量為注意:

本法一般用于樣本含量不太大的資料。因為它僅考慮了兩法結(jié)果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a,d)。所以,當n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對較小時,即便是檢驗結(jié)果有統(tǒng)計學意義,其實際意義往往也不大。3233檢驗步驟:第四節(jié)行×列表資料的檢驗

34行×列表資料①

多個樣本率比較時,有R行2列,稱為R×2表;②

兩個樣本的構(gòu)成比比較時,有2行C列,稱2×C表;③

多個樣本的構(gòu)成比比較,以及雙向無序分類資料關(guān)聯(lián)性檢驗時,有行列,稱為R×C表。35檢驗統(tǒng)計量36一、多個樣本率的比較3738

例7-6

某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見表7-8。問三種療法的有效率有無差別?表7-8三種療法有效率的比較39檢驗步驟:二、樣本構(gòu)成比的比較

例7-7

某醫(yī)師在研究血管緊張素I轉(zhuǎn)化酶(ACE)基因I/D多態(tài)(分3型)與2型糖尿病腎病(DN)的關(guān)系時,將249例2型糖尿病患者按有無糖尿病腎病分為兩組,資料見表7-9。問兩組2型糖尿病患者的ACE基因型總體分布有無差別?41表7-9DN組與無DN組2型糖尿病患者ACE基因型分布的比較

檢驗步驟42三、雙向無序分類資料的關(guān)聯(lián)性檢驗

表中兩個分類變量皆為無序分類變量的行列表資料,又稱為雙向無序表資料。

注意:雙向無序分類資料為兩個或多個樣本,做差別檢驗(例7-7);若為單樣本,做關(guān)聯(lián)性檢驗。

例7-8

測得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?

45表7-10某地5801人的血型

(單樣本,做關(guān)聯(lián)性檢驗)

表7-10資料,可用行×列表資料檢驗來推斷兩個分類變量之間有無關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計算Pearson列聯(lián)系數(shù)C進一步分析關(guān)系的密切程度:46

列聯(lián)系數(shù)C取值范圍在0~1之間。0表示完全獨立;1表示完全相關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。

檢驗步驟4748由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。四、行×列表資料檢驗的注意事項1.行列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論