卡方檢驗(正式)_第1頁
卡方檢驗(正式)_第2頁
卡方檢驗(正式)_第3頁
卡方檢驗(正式)_第4頁
卡方檢驗(正式)_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、華中科技大學公衛(wèi)學院流行病與衛(wèi)生統(tǒng)計系12檢驗Chi-squared test第第7章章蔣紅衛(wèi)蔣紅衛(wèi)Email: JHWCCC21CN.COM23概念回顧概念回顧p在總體率為在總體率為的二項分布總體中做的二項分布總體中做n1和和n2抽抽樣樣,樣本率樣本率p1和和p2與與的差別的差別,稱為稱為率抽樣誤差率抽樣誤差。p在總體率為在總體率為1和和2的不同總體中抽樣,得的不同總體中抽樣,得p1和和p2,在,在n5,可通過率的,可通過率的u檢驗推斷是否檢驗推斷是否1=2。p二項分布的兩個樣本率的檢驗同樣可用二項分布的兩個樣本率的檢驗同樣可用2檢檢驗驗。 u2121ppSpp 4 目的:目的: 推斷兩個總

2、體率或構成比之間有無差別推斷兩個總體率或構成比之間有無差別 多個總體率或構成比之間有無差別多個總體率或構成比之間有無差別 多個樣本率的多重比較多個樣本率的多重比較 兩個分類變量之間有無關聯(lián)性兩個分類變量之間有無關聯(lián)性 頻數(shù)分布擬合優(yōu)度的檢驗。頻數(shù)分布擬合優(yōu)度的檢驗。 檢驗統(tǒng)計量:檢驗統(tǒng)計量:2 應用:應用:計數(shù)資料計數(shù)資料5基本概念基本概念例例1 某院比較異梨醇(試驗組)和氫氯塞嗪某院比較異梨醇(試驗組)和氫氯塞嗪(對照組)降低顱內壓的療效,將(對照組)降低顱內壓的療效,將200名患者名患者隨機分為兩組,試驗組隨機分為兩組,試驗組104例中有效的例中有效的99例例,對對照組照組96例中有效的例

3、中有效的78例例,問兩種藥物對降低顱問兩種藥物對降低顱內壓療效有無差別?內壓療效有無差別?6表表 200名顱內高壓患者治療情況名顱內高壓患者治療情況編號編號年齡年齡性別性別治療組治療組 舒張壓舒張壓體溫體溫療效療效137男A11.2737.5有效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8無效20054男B16.8037.6無效如何整理此類資料?如何整理此類資料?如何分析此類資料?如何分析此類資料?7四格表(四格表(fourfold table)資料的基本形式)資料的基本形式 實際頻數(shù)實際頻數(shù)(actual frequency)是指各分類是指各分

4、類實際發(fā)生或未發(fā)生計數(shù)值,記為實際發(fā)生或未發(fā)生計數(shù)值,記為A。a=99b=5104c=75d=219617426200單元格單元格8NnnTCRRC 理論頻數(shù)理論頻數(shù)(theoretical frequency)是指按是指按某某H0假設計算各分類理論上的發(fā)生或未假設計算各分類理論上的發(fā)生或未發(fā)生計數(shù)值,記為發(fā)生計數(shù)值,記為T。式中,TRC 為第R 行C 列的理論頻數(shù) nR 為相應的行合計 nC 為相應的列合計療法療法有效人數(shù)有效人數(shù)無效人數(shù)無效人數(shù)合計合計有效率有效率試驗組試驗組99(99(90.4890.48) )5(5(13.5213.52) )10410495.295.2對照組對照組75

5、(75(83.5283.52) ) 21(21(12.4812.48) )969678.178.1合計合計174174262620020087.087.09p殘差殘差 設設A代表某個類別的觀察頻數(shù),代表某個類別的觀察頻數(shù),T代表基于代表基于H0計算出的期望頻數(shù),計算出的期望頻數(shù),A與與T之差之差(A-T)被被稱為殘差稱為殘差p殘差可以表示某一個類別觀察值和理論值的殘差可以表示某一個類別觀察值和理論值的偏離程度,但殘差有正有負,相加后會彼此偏離程度,但殘差有正有負,相加后會彼此抵消,總和仍然為抵消,總和仍然為0。為此可以將殘差平方后。為此可以將殘差平方后求和,以表示樣本總的偏離無效假設的程度求和

6、,以表示樣本總的偏離無效假設的程度p類似于方差的計算思想,類似于方差的計算思想,22)()0()(TATAXxi 10Pearson 2檢驗的基本公式檢驗的基本公式p殘差大小是一個相對的概念,殘差大小是一個相對的概念,相對于期望頻數(shù)為相對于期望頻數(shù)為10時,時,20的殘差非常大;可相對于期的殘差非常大;可相對于期望頻數(shù)為望頻數(shù)為1000時時20就很小了。就很小了。因此又將殘差平方除以期望因此又將殘差平方除以期望頻數(shù)再求和,以標準化觀察頻數(shù)再求和,以標準化觀察頻數(shù)與期望頻數(shù)的差別。頻數(shù)與期望頻數(shù)的差別。p卡方統(tǒng)計量,卡方統(tǒng)計量,1900年由英國年由英國統(tǒng)計學家統(tǒng)計學家K. Pearson首次提出

7、。首次提出。Karl Pearson (1857 1936)1)(1()(22 列數(shù)列數(shù)行數(shù)行數(shù) TTA11p從卡方的計算公式可見,當觀察頻數(shù)與期從卡方的計算公式可見,當觀察頻數(shù)與期望頻數(shù)望頻數(shù)完全一致完全一致時,時,卡方值為卡方值為0;p觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小差異越小,卡方值越小卡方值越??;p反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的者之間的差異越大差異越大,卡方值越大卡方值越大。p當然,卡方值的大小也當然,卡方值的大小也和自由度有關和自由度有關p檢驗的自由度取決于可以檢驗的自由度取決于可以自由取

8、值的格子自由取值的格子數(shù)目數(shù)目,而不是樣本含量,而不是樣本含量n。p理論上,在理論上,在n40時下式值與時下式值與2分布近似,分布近似,在理論數(shù)在理論數(shù)5,近似程度較好。,近似程度較好。12l連續(xù)型分布:正態(tài)分布(連續(xù)型分布:正態(tài)分布(Normal distribution),學生氏),學生氏t分布分布(Students t-distribution),F(xiàn)分布分布(F distribution)l另一個同樣重要的分布另一個同樣重要的分布2卡方分布卡方分布(Chi-squared distribution)。l此分布在此分布在1875年,首先由年,首先由F. Helmet所提出,所提出,而且是由

9、正態(tài)分布演變而來的,即標準正態(tài)而且是由正態(tài)分布演變而來的,即標準正態(tài)分布分布Z值之平方而得值之平方而得2分布分布13設設Xi為來自正態(tài)總體的連續(xù)性變量。為來自正態(tài)總體的連續(xù)性變量。 iiXu21222)( iXui212212)(nniiniXui 稱為自由度稱為自由度df=n的卡方值。的卡方值。顯然,卡方分布具有可加性。顯然,卡方分布具有可加性。142/)12/(2222)2/(21)( ef3.847.8112.59P P0.050.05的臨界值的臨界值2分布的概率密度函數(shù)曲線分布的概率密度函數(shù)曲線152220.05,10.05/21.96u當當=1時時,16第二節(jié)22表卡方檢驗17兩組樣

10、本率比較的設計分類:兩組樣本率比較的設計分類:1.兩組兩組(獨立獨立) 樣本率的比較樣本率的比較 組間數(shù)據(jù)是相互獨立組間數(shù)據(jù)是相互獨立,非配對設計。非配對設計。 22表卡方檢驗表卡方檢驗2.配對設計兩組樣本率的比較配對設計兩組樣本率的比較 組間數(shù)據(jù)是相關的,配對設計。組間數(shù)據(jù)是相關的,配對設計。 配對四格表卡方檢驗配對四格表卡方檢驗18兩組(不配對)樣本率的比較兩組(不配對)樣本率的比較1)四格表形式)四格表形式2)四格表不配對資料檢驗的專用公式)四格表不配對資料檢驗的專用公式二者結果等二者結果等價價各組樣各組樣本例數(shù)本例數(shù)是固定是固定的的組別組別陽性數(shù)陽性數(shù)陰性數(shù)陰性數(shù)合計合計率率%甲組甲組

11、a ab ba+ba+b=n=n1 1a/na/n1 1乙組乙組c cd dc+dc+d=n=n2 2c/nc/n2 2合計合計a+ca+cb+db+dN N( (a+ca+c)/N)/N)()()()(dbdccabaNbcad 22 TTA22)( 19例例1(續(xù))(續(xù))2086.122617496104200)7552199(22 H0:1=2 即試驗組與對照組降低顱內壓的即試驗組與對照組降低顱內壓的總體有效率相等總體有效率相等H1:12=0.05。以以=1查附表查附表8的的2界值表得界值表得P 40 ,此時有,此時有 1 T 5時,需計算時,需計算Yates連續(xù)性校正連續(xù)性校正 2值值

12、 T 1,或,或n40時,應改用時,應改用Fisher確切概率確切概率法直接計算概率法直接計算概率24(1) 校正公式的條件:校正公式的條件: 1T5,同時同時N40,用校正公式計算用校正公式計算(2) 連續(xù)校正連續(xù)校正(continuity correction)公式:公式:(3) 當當T1,或或N0.05。按。按=0.05檢驗水準,不拒絕檢驗水準,不拒絕H0,無統(tǒng)計學意,無統(tǒng)計學意義,尚不能認為兩種藥物治療腦血管疾病的義,尚不能認為兩種藥物治療腦血管疾病的有效率不等。有效率不等。 28正方觀點正方觀點: 卡方統(tǒng)計量抽樣分布的連續(xù)性和平滑性得卡方統(tǒng)計量抽樣分布的連續(xù)性和平滑性得到改善,可以降

13、低到改善,可以降低I I類錯誤的概率;類錯誤的概率; 校正結果更接近于校正結果更接近于FisherFisher確切概率法;確切概率法; 校正是有條件的。校正是有條件的。反方觀點反方觀點:經(jīng)連續(xù)性校正后,經(jīng)連續(xù)性校正后,P P值有過分保守之嫌;值有過分保守之嫌;連續(xù)性校正卡方檢驗的連續(xù)性校正卡方檢驗的P P值與值與FisherFisher確切確切概率法的概率法的P P值沒有可比性,這是因為值沒有可比性,這是因為FisherFisher確切概率法建立在四格表確切概率法建立在四格表雙邊固定雙邊固定的假定下,的假定下,而實際資料則是而實際資料則是單邊固定單邊固定的四格表。的四格表。29 就應用而言,無

14、論是否經(jīng)過連續(xù)性校正,就應用而言,無論是否經(jīng)過連續(xù)性校正,若兩種檢驗的結果一致,無須在此問題若兩種檢驗的結果一致,無須在此問題上糾纏。但是,當兩種檢驗結果相互矛上糾纏。但是,當兩種檢驗結果相互矛盾時,如例盾時,如例2,就需要謹慎解釋結果了。,就需要謹慎解釋結果了。 為客觀起見,建議將兩種結論同時報告為客觀起見,建議將兩種結論同時報告出來,以便他人判斷。當然,如果兩種出來,以便他人判斷。當然,如果兩種結論一致,如均為結論一致,如均為有或無統(tǒng)計學意義有或無統(tǒng)計學意義,則只報道非連續(xù)性檢驗的結果即可。則只報道非連續(xù)性檢驗的結果即可。30 配對設計:通常為配對設計:通常為同源配對同源配對。對同一觀察。

15、對同一觀察對象分別用兩種方法處理,觀察其陽性與對象分別用兩種方法處理,觀察其陽性與陰性結果。陰性結果。 基本用途:常用于比較基本用途:常用于比較兩種檢驗方法兩種檢驗方法或或兩兩種培養(yǎng)基種培養(yǎng)基的陽性率是否有差別。的陽性率是否有差別。 數(shù)據(jù)形式:數(shù)據(jù)形式:配對四格表形式配對四格表形式。31例例3 3 某實驗室采用兩種方法對某實驗室采用兩種方法對5858名可疑名可疑紅斑狼瘡患者的血清抗體進行測定,問:紅斑狼瘡患者的血清抗體進行測定,問:兩方法測定結果陽性檢出率是否有差別?兩方法測定結果陽性檢出率是否有差別?測定結果為:陽性、陰性(共測定結果為:陽性、陰性(共116116標本,標本,5858對)對)

16、 方法(方法(X X)乳膠凝集法乳膠凝集法 免疫熒光法免疫熒光法 對子例數(shù)對子例數(shù) 1111 3333 2 2 1212結結果果32 上述配對設計實驗中,就每個對子而言,上述配對設計實驗中,就每個對子而言,兩種處理的結果不外乎有兩種處理的結果不外乎有四種可能四種可能: :兩種檢測方法皆為陽性數(shù)兩種檢測方法皆為陽性數(shù)( (a a) );兩種檢測方法皆為陰性數(shù)兩種檢測方法皆為陰性數(shù)( (d d) );免疫熒光法為陽性,乳膠凝集法為免疫熒光法為陽性,乳膠凝集法為 陰性數(shù)陰性數(shù)( (b b) );乳膠凝集法為陽性,免疫熒光法為乳膠凝集法為陽性,免疫熒光法為 陰性數(shù)陰性數(shù)( (c c) )。其中,其中,

17、a a, , d d 為兩法觀察結果一致的兩種情況,為兩法觀察結果一致的兩種情況, b b, , c c為兩法觀察結果不一致的兩種情況。為兩法觀察結果不一致的兩種情況。33 34 按照配對設計的思路進行分析,則首先應按照配對設計的思路進行分析,則首先應當求出當求出各對的差值各對的差值,然后考察樣本中差值,然后考察樣本中差值的分布是否按照的分布是否按照HH0 0假設的情況假設的情況對稱分布。對稱分布。 按此分析思路,最終可整理出如前所列的按此分析思路,最終可整理出如前所列的配對四格表。配對四格表。 主對角線主對角線上兩種檢驗方法的結論上兩種檢驗方法的結論相同相同,對,對問題的解答問題的解答不會不

18、會有任何貢獻有任何貢獻 斜對角線斜對角線上兩種檢驗方法的結論上兩種檢驗方法的結論不相同不相同,顯示顯示了檢驗方法間的差異了檢驗方法間的差異3536H0:b=c =(12+2)/2=7( (兩法總體兩法總體陽性陽性率相等率相等) )H1:b c (兩方法總體兩方法總體陽性陽性率不等)率不等) =0.05本例本例b+c=12+2=1440,用校正公式,用校正公式本例本例2=5.793.84,P0.05。在。在=0.05水準水準,拒絕,拒絕HH0 0,接受,接受HH1 1,有統(tǒng)計學意義。認為,有統(tǒng)計學意義。認為兩方法的檢測率不同,乳膠凝集法的陽性檢兩方法的檢測率不同,乳膠凝集法的陽性檢測率測率22.

19、41%低于免疫檢測率低于免疫檢測率39.66%。179521212121222 ,.)()(cbcb37McNemarMcNemar檢驗檢驗只會利用非主對角線單元格只會利用非主對角線單元格上上的信息,即它只關心的信息,即它只關心兩者不一致兩者不一致的評價情況,的評價情況,用于比較兩個評價者間存在怎樣的傾向。因此用于比較兩個評價者間存在怎樣的傾向。因此,對于一致性較好的大樣本數(shù)據(jù),對于一致性較好的大樣本數(shù)據(jù),McNemarMcNemar檢驗可能會失去實用價值。檢驗可能會失去實用價值。例如對例如對1 1萬個案例進行一致性評價,萬個案例進行一致性評價,99959995個個都是完全一致的,在主對角線上

20、,另有都是完全一致的,在主對角線上,另有5 5個分個分布在左下的三角區(qū),顯然,此時一致性相當?shù)牟荚谧笙碌娜菂^(qū),顯然,此時一致性相當?shù)暮?。但如果使用好。但如果使用McNemarMcNemar檢驗,此時反而會檢驗,此時反而會得出兩種評價有差異的結論來。得出兩種評價有差異的結論來。1053810539超幾何分布超幾何分布 (非(非 2檢驗檢驗 的范疇)的范疇)40n,或1T, 或P時, 10540例例4 4 某醫(yī)師為研究乙肝免疫球蛋白預防胎兒某醫(yī)師為研究乙肝免疫球蛋白預防胎兒宮內感染宮內感染HBVHBV的效果,將的效果,將3333例例HBsAgHBsAg陽性孕陽性孕婦隨機分為預防注射組和非預防組,

21、結果見表婦隨機分為預防注射組和非預防組,結果見表7-47-4。問兩組新生兒的。問兩組新生兒的HBVHBV總體感染率有無差總體感染率有無差別?別? 1054142 在四格表周邊合計數(shù)固定不變的條件下,在四格表周邊合計數(shù)固定不變的條件下,計算表內計算表內4 4個實際頻數(shù)變動時的各種組合之概個實際頻數(shù)變動時的各種組合之概率率Pi;再按檢驗假設用單側或雙側的累計概;再按檢驗假設用單側或雙側的累計概率率P,依據(jù)所取的檢驗水準,依據(jù)所取的檢驗水準做出推斷。做出推斷。 43 (1) (2) (3) (4) (5) 0 22 1 21 2 20 3 19 4 18 9 2 8 3 7 4 6 5 5 6 ad

22、-bc= -198 ad-bc= -165 ad-bc= -132 ad-bc =-99 ad-bc= -66 (6) (7) (8) (9) (10) 5 17 6 16 7 15 8 14 9 13 4 7 3 8 2 9 1 10 0 11 ad-bc= -33 ad-bc=0 ad-bc=33 ad-bc=66 ad-bc= 99 1 1各組合概率各組合概率Pi的計算的計算 在四格表周邊合計在四格表周邊合計數(shù)不變的條件下,表內數(shù)不變的條件下,表內4 4個實際頻數(shù)個實際頻數(shù) a,b,c,d 變變動的組合數(shù)共有動的組合數(shù)共有“周邊合計中最小數(shù)周邊合計中最小數(shù)+1+1”個。個。如例如例7-4

23、7-4,表內,表內4 4個實際頻數(shù)變動的組合數(shù)共個實際頻數(shù)變動的組合數(shù)共有有9+1=109+1=10個,依次為:個,依次為:44各組合的概率各組合的概率P Pi i服從超幾何分布,其和為服從超幾何分布,其和為1 1。計算公式為計算公式為() ()!()!()! ! ! ! !iabcdacbdPa b c d n!45 2 2累計概率的計算累計概率的計算 ( ( 單、雙側單、雙側檢驗不同檢驗不同) )464748495051例例5 5 某單位研究膽囊腺癌、腺瘤的某單位研究膽囊腺癌、腺瘤的P P5353基基因表達,對同期手術切除的膽囊腺癌、腺因表達,對同期手術切除的膽囊腺癌、腺瘤標本各瘤標本各1

24、010份,用免疫組化法檢測份,用免疫組化法檢測P P5353基基因,資料見表因,資料見表7-67-6。問膽囊腺癌和膽囊腺。問膽囊腺癌和膽囊腺瘤的瘤的P P5353基因表達陽性率有無差別?基因表達陽性率有無差別?52530H:21,1H:21,05. 0 本例本例 a+b+c+d=10,由表,由表7-77-7可看出,四格表內各可看出,四格表內各種組合以種組合以i=4和和i=5的組合為中心呈的組合為中心呈對稱分布對稱分布。 *為現(xiàn)有樣本54(1 1)計算現(xiàn)有樣本的)計算現(xiàn)有樣本的DD* *和和P P* *及各組合下四格表的及各組合下四格表的D Di i。 本例本例DD* *=50=50,P P*

25、*=0.02708978=0.02708978。(2 2)計算滿足)計算滿足DDi i5050條件的各組合下四格表的概率條件的各組合下四格表的概率P Pi i。(3 3)計算同時滿足)計算同時滿足DDi i5050和和P Pi iP P* *條件的四格表的累條件的四格表的累 計概率。本例為計概率。本例為P P7 7和和P P8 8,(4 4)計算雙側累計概率)計算雙側累計概率P P。 P P0.050.05,按,按 =0.05=0.05檢驗水準不拒絕檢驗水準不拒絕H H0 0,尚不,尚不能認為膽囊腺癌與膽囊腺瘤的能認為膽囊腺癌與膽囊腺瘤的P P5353基因表達陽性率不等基因表達陽性率不等。02

26、86. 000154799. 002708978. 087 PP057. 0)(287 PPP5556 確切概率法的原理具有確切概率法的原理具有通用性通用性,對于四格表,對于四格表以外的情況也適用,如行乘列表、配對、配以外的情況也適用,如行乘列表、配對、配伍表格均可伍表格均可 對于較大的行乘列表,確切概率法的對于較大的行乘列表,確切概率法的計算量計算量將很大將很大,有可能超出硬件系統(tǒng)可以支持的范,有可能超出硬件系統(tǒng)可以支持的范圍圍 此時可以采用計算統(tǒng)計學中的此時可以采用計算統(tǒng)計學中的其他統(tǒng)計計算其他統(tǒng)計計算技術技術加以解決,如加以解決,如BootstrapBootstrap方法等方法等57當比

27、較組行或列分類數(shù)當比較組行或列分類數(shù)2 2,稱為行,稱為行列表,即列表,即R RC C表。表。研究者感興趣的問題有研究者感興趣的問題有:( :(2檢驗的目的)檢驗的目的)1.1.多組多組( (獨立樣本獨立樣本) )樣本率樣本率差別有無統(tǒng)計意義差別有無統(tǒng)計意義? ?2.2.兩組兩組( (獨立樣本獨立樣本) )構成比構成比( (分布分布) )有無統(tǒng)計意義有無統(tǒng)計意義? ?3.3.兩個分類變量分布兩個分類變量分布是否獨立是否獨立( (有關聯(lián)有關聯(lián))?)?58自由度自由度=(行數(shù)(行數(shù)-1)(列數(shù)(列數(shù)-1)等價等價)1(22 CRnnAN TTA22)( 59療法療法有效有效無效無效合計合計有效率有

28、效率%物理組物理組199199(186.2186.2)7 720620696.696.6藥物組藥物組164164181818218290.190.1外用組外用組118118262614414481.981.9合計合計481481515153253290.490.4 例例6 6 某醫(yī)師研究物理療法、藥物治療和外用膏藥三某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見下表。種療法治療周圍性面神經(jīng)麻痹的療效,資料見下表。問三種療法的有效率有無差別?問三種療法的有效率有無差別? 表表7-8 7-8 三種療法有效率的比較三種療法有效率的比較60HH0 0: 1 1= =

29、2 2 = = 3 3 =90.4=90.4(三(三組總體組總體有效有效率相等)率相等)HH1 1:三:三組總體率不等或不全等組總體率不等或不全等=0.05=0.052222199726532(.1)21.04206 481206 51144 5122220.05,20.01,221.045.99,21.049.21結論結論: :在在=0.05=0.05水準,拒絕水準,拒絕H0H0,P P0.01,0.01,認為認為三組療法有效率不等或不全等。三組療法有效率不等或不全等。注意注意: :此結果不能得到各兩兩組比較的結論。此結果不能得到各兩兩組比較的結論。21213 )( 04.21)151144

30、26.512067481206199(5322222 21. 904.21,99. 504.2122,01. 0222,05. 02 61二、兩組和多組構成比的比較二、兩組和多組構成比的比較例例7 7 某醫(yī)師在研究血管緊張素某醫(yī)師在研究血管緊張素I I轉化酶轉化酶(ACE)(ACE)基因基因I/DI/D多態(tài)(分多態(tài)(分3 3型)與型)與2 2型糖尿病腎病型糖尿病腎病(DN)(DN)的關系時,將的關系時,將249249例例2 2型糖尿病患者按有無糖尿病腎病分為兩組,型糖尿病患者按有無糖尿病腎病分為兩組,資料見表資料見表7-97-9。問兩組。問兩組2 2型糖尿病患者的型糖尿病患者的ACEACE基因

31、型基因型總體分布有無差別?總體分布有無差別?糖尿病糖尿病ACEACE基因型基因型合計合計DDDDIDIDI I I I有腎病有腎病42(37.8)42(37.8)48(43.3)48(43.3)21(18.9)21(18.9)111111無腎病無腎病30(21.7)30(21.7)75(52.2)75(52.2)36(26.1)36(26.1)138138合計合計72(28.9)72(28.9)120(48.2)120(48.2)57(22.9)57(22.9)249249表表9 9 兩組兩組型糖尿病患者型糖尿病患者ACEACE基因分布比較基因分布比較6263三、雙向無序分類資料的關聯(lián)性檢驗三

32、、雙向無序分類資料的關聯(lián)性檢驗 R RC C表中兩個分類變量皆為無序分類變量的表中兩個分類變量皆為無序分類變量的行行列表資料,又稱為雙向無序列表資料,又稱為雙向無序R RC C表資料。表資料。目的:目的:檢驗兩事物分類檢驗兩事物分類( (行分類和列分類行分類和列分類) )是否是否獨立獨立, ,從而說明兩事物分類是否有關系。從而說明兩事物分類是否有關系。 需要注意的是需要注意的是: :雙向無序分類資料為兩個或多個樣本,做差雙向無序分類資料為兩個或多個樣本,做差別檢驗(例別檢驗(例7 7););若為單樣本,做關聯(lián)性檢驗。若為單樣本,做關聯(lián)性檢驗。64統(tǒng)計分析統(tǒng)計分析:1.1.回答兩事物的分類回答兩

33、事物的分類是否獨立是否獨立( (有關系有關系) ) Pearson 2檢驗檢驗2.2.如有關如有關, ,關系關系密切程度密切程度如何如何, ,度量指標度量指標: : 列聯(lián)系數(shù)列聯(lián)系數(shù)(Contingency coefficient)(Contingency coefficient)列聯(lián)系數(shù)列聯(lián)系數(shù)C C取值范圍在取值范圍在0 01 1之間。愈接近于之間。愈接近于0 0,關系愈不密切;愈接近于關系愈不密切;愈接近于1 1,關系愈密切。,關系愈密切。 )(122 CRnnAN 22 nC65兩事物獨立的兩事物獨立的假定假定: : 行或列各分類的構成比相同行或列各分類的構成比相同, ,或在或在 A

34、A事物不同事物不同水平下水平下,B,B事物不同分類的作用事物不同分類的作用( (構成構成) )相等相等. .高血壓高血壓(B)(B)RHRH血型血型(A)(A)RHRH血型血型(A)(A)+ +- -+ +- -有有50(50)50(50)50(50)50(50)0(50)0(50)100(50)100(50)無無50(50)50(50)50(50)50(50)100(50)100(50)0(50)0(50)合計合計10010010010010010010010066例例 8 8 測得某地測得某地58015801人的人的ABOABO血型和血型和MNMN血型結血型結果如表果如表7-107-10,

35、問兩種血型系統(tǒng)之間是否有關聯(lián)?,問兩種血型系統(tǒng)之間是否有關聯(lián)?表表10 10 某地某地58015801人的血型人的血型 67 H0:兩種血型系統(tǒng)分類無關聯(lián):兩種血型系統(tǒng)分類無關聯(lián) (即(即行或行或列列構成比構成比相等)相等) H1:兩種血型系統(tǒng)分類有關聯(lián):兩種血型系統(tǒng)分類有關聯(lián) (即(即行或行或列列構成比不構成比不等)等) =0.0561314162131268434832145118234315801222 )(.).( 1883016213580116213. C結論結論:兩種血型系統(tǒng)分類有關聯(lián)。列聯(lián)系數(shù)兩種血型系統(tǒng)分類有關聯(lián)。列聯(lián)系數(shù)為為0.1883。兩種血型系統(tǒng)間雖然有關聯(lián)性,。兩種血

36、型系統(tǒng)間雖然有關聯(lián)性,但關系不太密切。但關系不太密切。 68當比較組當比較組k3時,時,2值有統(tǒng)計意義,可分解值有統(tǒng)計意義,可分解多個四格表了解各樣本率兩兩間的差別。多個四格表了解各樣本率兩兩間的差別。要進一步推斷哪兩兩總體率有差別,若直接要進一步推斷哪兩兩總體率有差別,若直接用四格表資料的用四格表資料的 檢驗進行多重比較,將會加檢驗進行多重比較,將會加大犯大犯類錯誤的概率。類錯誤的概率。多重比較的方法:多重比較的方法:2分割法;分割法;ScheffeScheffe可信區(qū)間法;可信區(qū)間法;SNKSNK法。法。69檢驗水準檢驗水準年齡組年齡組 治愈治愈 好轉好轉 無效無效組組1 1組組2 2組組

37、k k年齡組年齡組 治愈治愈 好轉好轉 無效無效組組1 1組組2 2年齡組年齡組 治愈治愈 好轉好轉 無效無效組組1 1組組3 3年齡組年齡組 治愈治愈 好轉好轉 無效無效組組1 1組組k k其目的是保證檢驗假設中其目的是保證檢驗假設中I I型錯誤型錯誤的概率不變。的概率不變。因分析目的不同,主要有兩類多重比較形式:因分析目的不同,主要有兩類多重比較形式:多個實驗組間的兩兩比較多個實驗組間的兩兩比較實驗組與同一個對照組的比較實驗組與同一個對照組的比較檢驗水準檢驗水準70分析目的為分析目的為k k個實驗組間,任意兩個率均進個實驗組間,任意兩個率均進行比較時,須進行行比較時,須進行k(k-1)/2

38、次獨立的四格表次獨立的四格表 檢驗,再加上總的行檢驗,再加上總的行列表資料的列表資料的 檢驗,共檢驗,共 k(k-1)/2+1次檢驗假設。次檢驗假設。故檢驗水準故檢驗水準用下式估計用下式估計0125. 012)13(305. 0,12)1( 本例本例kk71分析目的為各實驗組與同一個對照組的比較分析目的為各實驗組與同一個對照組的比較,而各實驗組間不須比較。,而各實驗組間不須比較。檢驗水準檢驗水準用下式估計用下式估計)1(2 k 722P2P2P6.240.012507.480.006258.210.004176.960.008337.880.005008.490.003587.240.0071

39、48.050.004558.730.003132 P2 P2 P73 例例9 9 對例對例6 6的資料進行兩兩比較,以推斷的資料進行兩兩比較,以推斷是否任兩種療法治療周圍性面神經(jīng)麻痹的有效是否任兩種療法治療周圍性面神經(jīng)麻痹的有效率均有差別?率均有差別?1=2, 即任意兩對比組的總體有效率相等即任意兩對比組的總體有效率相等12,即任意兩對比組的總體有效率不等,即任意兩對比組的總體有效率不等 =0.05 本例為本例為3 3個實驗組間的兩兩比較個實驗組間的兩兩比較 0125. 012)13(305. 0 74拒絕拒絕HH0 0,接收接收HH1 1拒絕拒絕HH0 0,接收接收HH1 1不拒絕不拒絕HH

40、0 075 例例10 10 對例對例6 6資料的藥物治療組為對照組,資料的藥物治療組為對照組,物理療法組與外用膏藥組為試驗組,試分析兩物理療法組與外用膏藥組為試驗組,試分析兩試驗組與對照組的總體有效率有無差別?試驗組與對照組的總體有效率有無差別? T=C, 即各試驗組與對照組的總體有效率即各試驗組與對照組的總體有效率相等相等 TC,即各試驗組與對照組的總體有效率,即各試驗組與對照組的總體有效率不等不等 =0.05 本例為各實驗組與同一對照組的比較本例為各實驗組與同一對照組的比較0125. 0)13(205. 0 76 物理療法組與藥物治療組比較:物理療法組與藥物治療組比較:2=6.76, P0

41、.0125, 按按=0.0125檢驗水準檢驗水準, , 物理療法組與藥物物理療法組與藥物治療組拒絕治療組拒絕H0,H0,接受接受H1H1,可認為物理療法組,可認為物理療法組與藥物治療組的總體有效率有差別;與藥物治療組的總體有效率有差別; 外用膏藥組與藥物治療組不拒絕外用膏藥組與藥物治療組不拒絕H0H0,尚,尚不能認為兩總體有效率有差別。不能認為兩總體有效率有差別。 結合例結合例7 7資料,物理療法的有效率高于藥資料,物理療法的有效率高于藥物治療。物治療。77基本公式基本公式不配對四不配對四格表和校格表和校正公式正公式配對四格配對四格表公式表公式一一 . . 公式公式TTA22)( )()()()(22dbdccabaNbcad )()()()2/(22dbdccabaNNbcad cbcb 22)1( 78p目的目的: : 比較組間率和構比較組間率和構成比的差別成比的差別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論