卡方檢驗解釋(精選干貨)_第1頁
卡方檢驗解釋(精選干貨)_第2頁
卡方檢驗解釋(精選干貨)_第3頁
卡方檢驗解釋(精選干貨)_第4頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、卡方檢驗解釋 2 主講內(nèi)容 第一第一 概述概述基本思想基本思想 第二第二 2 22 2表卡方檢驗表卡方檢驗 第三第三 配對四格表卡方檢驗配對四格表卡方檢驗 第四第四 R RC C表卡方檢驗表卡方檢驗 第五第五 FisherFisher確切概率檢驗確切概率檢驗 第六第六 多個樣本率的多重比較多個樣本率的多重比較 第七有序分組資料的線性趨勢檢驗第七有序分組資料的線性趨勢檢驗 2 3 卡方檢驗概述p136 研究目的:率研究目的:率 or or 構(gòu)成比的假設(shè)檢驗(大樣本率或構(gòu)成比的假設(shè)檢驗(大樣本率或 小樣本率)小樣本率) 資料類型:計數(shù)資料資料類型:計數(shù)資料 基本思想:基本思想: 檢驗中的檢驗中的

2、是希臘字母,稱為是希臘字母,稱為 卡方檢驗,是一種用途較廣的計數(shù)資料的假設(shè)檢驗卡方檢驗,是一種用途較廣的計數(shù)資料的假設(shè)檢驗 方法,屬于非參數(shù)檢驗的范疇,主要是比較兩個及方法,屬于非參數(shù)檢驗的范疇,主要是比較兩個及 兩個以上樣本率兩個以上樣本率( ( 構(gòu)成比)以及兩個分類變量的關(guān)構(gòu)成比)以及兩個分類變量的關(guān) 聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實 際頻數(shù)的吻合程度或擬合優(yōu)度問題。際頻數(shù)的吻合程度或擬合優(yōu)度問題。 2 2 4 檢驗的應(yīng)用 檢驗兩個樣本率之間差別的顯著性; 檢驗多個樣本率或構(gòu)成比之間差別的 顯著性; 檢驗兩個雙向無序分類變量是否存在

3、關(guān)聯(lián); 配對計數(shù)資料的比較。 2 5 一、兩獨(dú)立樣本率檢驗一、兩獨(dú)立樣本率檢驗 (一)(一)兩獨(dú)立樣本率資料的四格表形式 例例7-17-1 為研究腫瘤標(biāo)志物癌胚抗原(為研究腫瘤標(biāo)志物癌胚抗原(CEACEA) 對肺癌的診斷價值,隨機(jī)抽取對肺癌的診斷價值,隨機(jī)抽取7272例確診為肺癌的例確診為肺癌的 患者為肺癌組,患者為肺癌組,114114例接受健康體檢的非肺癌患者例接受健康體檢的非肺癌患者 為對照組。用為對照組。用CEACEA對其進(jìn)行檢測,結(jié)果呈陽性反應(yīng)對其進(jìn)行檢測,結(jié)果呈陽性反應(yīng) 者病例組中者病例組中3333例,對照組中例,對照組中1010例。問兩組人群的例。問兩組人群的 CEACEA陽性率有

4、無差異?陽性率有無差異? 6 表表7-1 CEA對兩組人群的診斷結(jié)果對兩組人群的診斷結(jié)果* * 括號內(nèi)為理論頻數(shù)。 7 本例資料經(jīng)整理成表本例資料經(jīng)整理成表7-17-1形式,即有形式,即有 兩個處理組,每個處理組的例數(shù)由發(fā)生數(shù)和未發(fā)兩個處理組,每個處理組的例數(shù)由發(fā)生數(shù)和未發(fā) 生數(shù)兩部分組成。表內(nèi)有生數(shù)兩部分組成。表內(nèi)有3333、3939、1010、104 104 四個四個 基本數(shù)據(jù),其余數(shù)據(jù)均由此四個數(shù)據(jù)推算出來的,基本數(shù)據(jù),其余數(shù)據(jù)均由此四個數(shù)據(jù)推算出來的, 故稱四格表資料。故稱四格表資料。 (二)(二) 檢驗的基本思想檢驗的基本思想 2 8 處處理理組組 發(fā)發(fā)生生數(shù)數(shù) 未未發(fā)發(fā)生生數(shù)數(shù) 合

5、合計計 甲甲 a b a+b 乙乙 c d c+d 合合 計計 a+c b+d n 表表7-2 四格表資料的基本形式四格表資料的基本形式 9 基本思想:可通過基本思想:可通過 檢驗的基本公式來理解。檢驗的基本公式來理解。 2 2 () , ()(1) A T T 行數(shù)-1 列數(shù) 式中,式中,A為實際頻數(shù)(為實際頻數(shù)(actual frequency),), T為理論頻數(shù)(為理論頻數(shù)(theoretical frequency)。)。 2 10 理論頻數(shù)理論頻數(shù) 是根據(jù)檢驗設(shè)是根據(jù)檢驗設(shè) ,且用合并,且用合并 率率 來估計而定的。來估計而定的。 T 012 :H (72) acac abcdn

6、11 ()() (73) a ab ac TT n 21 ()() (74) c cd ac TT n 11 理論頻數(shù)由下式求得:理論頻數(shù)由下式求得: R C RC n n T n 式中,式中,TRC 為第為第R 行行C 列的理論頻數(shù)列的理論頻數(shù) nR 為相應(yīng)的行合計為相應(yīng)的行合計 nC 為相應(yīng)的列合計為相應(yīng)的列合計 12 檢驗統(tǒng)計量檢驗統(tǒng)計量 值反映了實際頻數(shù)與理值反映了實際頻數(shù)與理 論頻數(shù)的吻合程度。論頻數(shù)的吻合程度。 若檢驗假設(shè)若檢驗假設(shè)H H0 0: :1 1= =2 2成立,四個格子的實際成立,四個格子的實際 頻數(shù)頻數(shù)A A 與理論頻數(shù)與理論頻數(shù)T T 相差不應(yīng)該很大,即統(tǒng)計量相差不

7、應(yīng)該很大,即統(tǒng)計量 不應(yīng)該很大。如果不應(yīng)該很大。如果 值很大,即相對應(yīng)的值很大,即相對應(yīng)的P P 值很小,值很小, 若若 ,則反過來推斷,則反過來推斷A A與與T T相差太大,超出了抽樣相差太大,超出了抽樣 誤差允許的范圍,從而懷疑誤差允許的范圍,從而懷疑H H0 0的正確性,繼而拒絕的正確性,繼而拒絕 H H0 0,接受其對立假設(shè),接受其對立假設(shè)H H1 1,即,即1 12 2 。 。 P 2 2 13 由公式(由公式(7-17-1)還可以看出:)還可以看出: 值的大小還取決值的大小還取決 于于 個數(shù)的多少(嚴(yán)格地說是自由度個數(shù)的多少(嚴(yán)格地說是自由度的大?。?。由于各的大?。?。由于各 皆是正

8、值,故自由度皆是正值,故自由度愈大,愈大, 值也會愈大;所以只有考慮值也會愈大;所以只有考慮 了自由度了自由度的影響,的影響, 值才能正確地反映實際頻數(shù)值才能正確地反映實際頻數(shù)A A和理論頻和理論頻 數(shù)數(shù)T T 的吻合程度。的吻合程度。 檢驗的自由度取決于可以自由取值的格子數(shù)檢驗的自由度取決于可以自由取值的格子數(shù) 目,而不是樣本含量目,而不是樣本含量n n。四格表資料只有兩行兩列,。四格表資料只有兩行兩列, =1=1,即在周邊合計數(shù)固定的情況下,即在周邊合計數(shù)固定的情況下,4 4個基本數(shù)據(jù)個基本數(shù)據(jù) 當(dāng)中只有一個可以自由取值。當(dāng)中只有一個可以自由取值。 2 2 ()A T T 2 ()A T

9、T 2 2 2 14 (1 1) 建立檢驗假設(shè),確定檢驗水平。建立檢驗假設(shè),確定檢驗水平。 H H0 0:1 1= =2 2 H H1 1: :1 12 2 =0.05=0.05。 (三)(三) 假設(shè)檢驗假設(shè)檢驗 15 (2 2)求檢驗統(tǒng)計量值)求檢驗統(tǒng)計量值 11 72 43/18616.6T , 12 72 16.655.4T 21 43 16.626.4T , 22 11426.487.6T。 1) 12)(12( 2 2222 (33 16.6)(3955.4)(1026.4)(10487.6) 16.655.426.487.6 1111 2( )34.32 16.4 16.655.4

10、26.487.6 16 四格表資料檢驗的專用公式四格表資料檢驗的專用公式 2 2 () ()()()() ad bc n a b a c b d c d 2 186(33 104 10 39) 2 34.10 72 43 143 114 17 ( (四四) )四格表資料檢驗的校正公式四格表資料檢驗的校正公式 2 2 (0.5) c A T T 2 2 () 2 ()()()() c n |ad -bc|-n = a+b c+d a+c b+d 18 分布是一連續(xù)型分布,分布是一連續(xù)型分布, 而四格表資料屬離散型分布,由此計而四格表資料屬離散型分布,由此計 算得的算得的 統(tǒng)計量的抽樣分布亦呈離散

11、統(tǒng)計量的抽樣分布亦呈離散 性質(zhì)。為改善性質(zhì)。為改善 統(tǒng)計量分布的連續(xù)性,統(tǒng)計量分布的連續(xù)性, 則進(jìn)行連續(xù)性校正。則進(jìn)行連續(xù)性校正。 2 2 2 19 四格表資料 檢驗公式選擇條件: 40, 5nT 2 ,不校正的理論或?qū)S霉?式; ,校正公式; ,直接計算概率 (Fisher)。 40, 15nT 40 1nT或 連續(xù)性校正僅用于連續(xù)性校正僅用于 的四格表資料,當(dāng)?shù)乃母癖碣Y料,當(dāng) 時,一般不作校正。時,一般不作校正。 2 1 2 20 例例7-2 7-2 將將116116例癲癇患者例癲癇患者 隨機(jī)分為兩組,一組隨機(jī)分為兩組,一組7070例接受常規(guī)加例接受常規(guī)加 高壓氧治療(高壓氧組),另一組高

12、壓氧治療(高壓氧組),另一組4646 例接受常規(guī)治療(常規(guī)組),治療結(jié)例接受常規(guī)治療(常規(guī)組),治療結(jié) 果見表果見表7-37-3。問兩種療法的有效率有無問兩種療法的有效率有無 差別?差別? 21 表7-3 兩種療法治療癲癇的效果 治療結(jié)果 治療方法 有效 無效 合計 有效率(%) 高壓氧組 66(62.8) 4(7.2) 70 94.3 常規(guī)組 38(41.2) 8(4.8) 46 82.6 合 計 104 12 116 89.7 22 012112 :, :, 0.05HH 本例 ,故用四格表 資料 檢驗的校正公式 22 116, 4.8nT但 2 ,查 界值表得 。按 檢驗水準(zhǔn)不拒絕 ,尚

13、不能認(rèn) 為組有效率不等。 1 2 10. 005. 0 P 05. 0 0 H 2 (66 84 38116 2)116 2 2.92 70 46 104 12 c 23 本資料若不校正時,本資料若不校正時, 結(jié)論與之相反。結(jié)論與之相反。 2 4.080.05P, 24 (四)卡方檢驗的連續(xù)性校正問題 s贊成依據(jù)是:這樣做可使卡方統(tǒng)計量抽樣 分布的連續(xù)性和平滑性得到改善,可以降 低I類錯誤的概率,連續(xù)性校正后的卡方檢 驗,其結(jié)果更接近于Fisher確切概率法。不 過,校正也不是無條件的,它只適合于自 由度為1時,樣本含量較小,如n40,或 至少有一個格子的理論頻數(shù)太小,如T5 的情形。 25

14、(四)卡方檢驗的連續(xù)性校正問題 s反對依據(jù)是:經(jīng)連續(xù)性校正后,P值有過分 保守之嫌。此外,F(xiàn)isher確切概率法建立在 四格表雙邊固定的假定下,而實際資料則 是單邊固定的四格表,連續(xù)性校正卡方檢 驗的P值與Fisher確切概率法的P值沒有可 比性。 26 就應(yīng)用而言,無論是否經(jīng)過連續(xù)性校就應(yīng)用而言,無論是否經(jīng)過連續(xù)性校 正,若兩種檢驗的結(jié)果一致,無須在正,若兩種檢驗的結(jié)果一致,無須在 此問題上糾纏。但是,當(dāng)兩種檢驗結(jié)此問題上糾纏。但是,當(dāng)兩種檢驗結(jié) 果相互矛盾時,如例果相互矛盾時,如例7-27-2,就需要謹(jǐn)慎,就需要謹(jǐn)慎 解釋結(jié)果了。解釋結(jié)果了。 為客觀起見,建議將兩種結(jié)論同時報為客觀起見,建

15、議將兩種結(jié)論同時報 告出來,以便他人判斷。當(dāng)然,如果告出來,以便他人判斷。當(dāng)然,如果 兩種結(jié)論一致,如均為或,則只報道兩種結(jié)論一致,如均為或,則只報道 非連續(xù)性檢驗的結(jié)果即可。非連續(xù)性檢驗的結(jié)果即可。 27 第二節(jié)、第二節(jié)、兩相關(guān)樣本率檢驗兩相關(guān)樣本率檢驗 (McNemarMcNemar檢驗)檢驗) 配對四格表資料的配對四格表資料的 檢驗檢驗 2 28 與計量資料推斷兩總體均數(shù)是否與計量資料推斷兩總體均數(shù)是否 有差別有成組設(shè)計和配對設(shè)計一樣,有差別有成組設(shè)計和配對設(shè)計一樣, 計數(shù)資料推斷兩個總體率(構(gòu)成比)計數(shù)資料推斷兩個總體率(構(gòu)成比) 是否有差別也有成組設(shè)計和配對設(shè)計,是否有差別也有成組設(shè)

16、計和配對設(shè)計, 即即四格表資料四格表資料和和配對四格表資料配對四格表資料。 29 例例7-37-3某抗癌新藥的毒理研究中,某抗癌新藥的毒理研究中, 將將7878只大鼠按性別、窩別、體重、年齡等因素配只大鼠按性別、窩別、體重、年齡等因素配 成成3939對,每個對子的兩只大鼠經(jīng)隨機(jī)分配,分別對,每個對子的兩只大鼠經(jīng)隨機(jī)分配,分別 接受甲劑量和乙劑量注射,試驗結(jié)果見表接受甲劑量和乙劑量注射,試驗結(jié)果見表7-47-4。試。試 分析該新藥兩種不同劑量的毒性有無差異。分析該新藥兩種不同劑量的毒性有無差異。 30 表表7-4 某抗癌新藥兩種劑量的毒理實驗結(jié)果某抗癌新藥兩種劑量的毒理實驗結(jié)果 乙劑量 甲劑量

17、死亡() 生存() 合 計 死亡() 6(a) 12(b) 18 生存() 3(c) 18(d) 21 合 計 9 30 39 31 上述配對設(shè)計實驗中,就每個對上述配對設(shè)計實驗中,就每個對 子而言,兩種處理的結(jié)果不外乎有子而言,兩種處理的結(jié)果不外乎有四種可四種可 能能: : 兩只大鼠均死亡(甲兩只大鼠均死亡(甲 乙 乙 ) )數(shù)數(shù)( (a a) ); 兩只均生存(甲兩只均生存(甲 乙 乙 ) )數(shù)數(shù)( (d d) ); 其中一只死亡(甲其中一只死亡(甲 乙 乙 ) )數(shù)數(shù)( (b b) ); 其中一只死亡(甲其中一只死亡(甲 乙 乙 ) )數(shù)數(shù) ( (c c) )。 32 其中,其中,a a

18、, , d d 為兩法觀察結(jié)果一致的兩種情況,為兩法觀察結(jié)果一致的兩種情況, b b, , c c為兩法觀察結(jié)果不一致的兩種情況為兩法觀察結(jié)果不一致的兩種情況。 cb cb 2 2 )( , 1 cb cb c 2 2 ) 1( , 1= 檢驗統(tǒng)計量為檢驗統(tǒng)計量為 33 H0: 總體四格表中甲乙 的對子數(shù)與甲乙的對子數(shù)出現(xiàn)頻率相同 (兩劑量毒性相同) ; H1: 總體四格表中甲乙 的對子數(shù)與甲乙的對子數(shù)出現(xiàn)頻率不同 (兩劑量毒性不同) ; =0.05 已知樣本四格表中,b=12,c=3,因 b+c=15,故將其代入公式 9-13,有 查附表 8, 2 0.025,1 5.02 , 2 0.05

19、,1 3.84 ,得 0.025P0.05,按=0.05 水準(zhǔn)拒絕 H0,接 受 H1,可以認(rèn)為兩種劑量的毒性有差異,甲劑量組的死亡率較高(因 bc) 。 27. 4 312 ) 1321( 2 2 c 34 注意:注意: 本法一般用于樣本含量不太大的資料。因本法一般用于樣本含量不太大的資料。因 為它僅考慮了兩法結(jié)果不一致的兩種情況為它僅考慮了兩法結(jié)果不一致的兩種情況( (b b, , c c) ),而,而 未考慮樣本含量未考慮樣本含量n n和兩法結(jié)果一致的兩種情況和兩法結(jié)果一致的兩種情況( (a a, , d d) )。 所以,當(dāng)所以,當(dāng)n n很大且很大且a a與與d d的數(shù)值很大(即兩法的

20、一致率較的數(shù)值很大(即兩法的一致率較 高),高),b b與與c c的數(shù)值相對較小時,即便是檢驗結(jié)果有統(tǒng)的數(shù)值相對較小時,即便是檢驗結(jié)果有統(tǒng) 計學(xué)意義,其實際意義往往也不大。計學(xué)意義,其實際意義往往也不大。 35 第三節(jié)第三節(jié) R C表 檢驗 2 36 行行列表資料列表資料 多個樣本率比較時,有R行2列,稱為R 2表; 兩個樣本的構(gòu)成比比較時,有2行C列,稱2C表; 多個樣本的構(gòu)成比比較,以及雙向無序分類資料關(guān)聯(lián) 性檢驗時,有行列,稱為R C表。 37 檢驗統(tǒng)計量檢驗統(tǒng)計量 2 2 (1) (1)(1) RC A n n n 行數(shù)列數(shù) 38 一、多個樣本率的比較一、多個樣本率的比較 39 例7-

21、4用A、B、C三種不同方法分別處理新生兒 臍帶,發(fā)生感染的情況見表7-6,試比較3種不同方 法的臍帶感染率有無差異。 表9-6 三種臍帶處理方法的臍帶感染情況 臍帶感染 處理組 感染 未感染 合計 感染率(%) A 76 3143 3219 2.36 B 15 2409 2424 0.62 C 2 762 764 0.26 合計 93 6314 6407 1.45 40 41 二、兩組構(gòu)成比的比較 42 例7-5為研究某種新藥對尿路疼痛的止痛效 果,將有尿路疼痛的患者144例隨機(jī)分為兩組,每組 72例,一組服該新藥(治療組),另一組服安慰劑 (對照組)。兩組患者尿路疼痛的原因見表7-7,問 兩

22、組患者尿路疼痛原因的分布有無差異? 表7-7 兩組患者尿路疼痛原因的分布 尿路疼痛原因 分 組 尿路感染 器械損傷 其它 合計 治療組 34 29 9 72 對照組 29 35 8 72 合 計 63 64 17 144 43 44 2. 求檢驗統(tǒng)計量和自由度。將表 9-7 數(shù)據(jù)代入公式 9-14,有 222222 3429929358 2 144(1)1.02 7263726472 177263726472 17 (21)(31)2 3. 確定 P 值,下結(jié)論。查 2 界值表, 2 0.5,2 1.39 , 2 0.5,2 1.018 ,所以,P0.50, 以 0.05 水準(zhǔn)不拒絕 H0,即

23、尚不能認(rèn)為兩組患者尿路疼痛原因的分布有差異。 45 三、多組構(gòu)成比的比較 46 例例7-67-6 在某項疼痛測量研究中,給160例手術(shù)后疼 痛的患者提供四種疼痛測量量表,即直觀模擬量 表(VAS),數(shù)字評估量表(NRS),詞語描述量 表(VDS),面部表情疼痛量表(FPS),患者首選 的量表以及患者的文化程度見表7-8,問患者首選 疼痛量表與文化程度是否有關(guān)? 47 表7-8 不同文化程度患者首選疼痛量表的類型 首選測痛量表 文化程度 V AS VDS NRS FPS 合計 高中以下 3(3.5) 16(18.7) 18(19.7) 44(39.0) 81 高中 0(1.6) 10(8.6)

24、9(9.0) 18(17.8) 37 高中以上 4(1.8) 11(9.7) 12(10.2) 15(20.2) 42 合計 7 37 39 77 160 48 49 四、 R C表 檢驗的條件 2 50 1行列表中的各格T1,并且1T 5的格子數(shù)不宜超過1/5格子總數(shù), 否則可能產(chǎn)生偏性。處理方法有三種: 增大樣本含量以達(dá)到增大理論頻數(shù) 的目的,屬首選方法,只是有些研究無 法增大樣本含量,如同一批號試劑已用 完等。 51 根據(jù)專業(yè)知識,刪去理論頻數(shù)太小的行或列,或 將理論頻數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列 合并。這樣做會損失信息及損害樣本的隨機(jī)性。 注意注意:不同年齡組可以合并,但不同血

25、型就不能合并。 改用雙向無序RC表的Fisher確切概率法(可用 SAS軟件實現(xiàn))。 52 第四節(jié)、Fisher確切概率檢驗 確切概率檢驗是由Fisher 1934年提出的一種用于兩個 獨(dú)立樣本率比較的方法,故又稱Fisher確切概率法。有 人認(rèn)為,當(dāng)樣本量n和理論頻數(shù)T太小時,如n40而且T 5,或T1,或n20,應(yīng)該用確切概率檢驗。這一觀 點(diǎn)所基于的理論是,當(dāng)樣本量太小時,二項分布的正態(tài) 逼近性較差,因而不宜用基于正態(tài)分布的檢驗。提出上 述條件的另外一種考慮是確切概率法的計算量偏大,但 隨著計算工具的大大改進(jìn),確切概率法的應(yīng)用不一定限 于上述條件。 53 例7-4 某醫(yī)師為研究乙肝免疫球蛋

26、白預(yù)防胎兒宮內(nèi) 感染HBV的效果,將33例HBsAg陽性孕婦隨機(jī)分為預(yù) 防注射組和非預(yù)防組,結(jié)果見表7-4。問兩組新生兒 的HBV總體感染率有無差別? 組別組別陽性陽性陰性陰性合計合計 感染率感染率 (%) 預(yù)防注射預(yù)防注射 組組 4182218.18 非預(yù)防組非預(yù)防組5 61145.45 合計合計9243327.27 54 基本思想 在四格表周邊合計數(shù)固定不變的條件下,計算表內(nèi)4個實際頻數(shù) 變動時的各種組合之概率;再按檢驗假設(shè)用單側(cè)或雙側(cè)的累計概 率,依據(jù)所取的檢驗水準(zhǔn)做出推斷。 55 1各組合概率的計算 在四格表周邊合計數(shù) 不變的條件下,表內(nèi)4個實際頻數(shù),變動的 組合數(shù)共有“周邊合計中最小

27、數(shù)+1”個。如 例7-4,表內(nèi)4個實際頻數(shù)變動的組合數(shù)共有 個,依次為: (1)(2)(3)(4)(5) 022121220319418 9 28 37 46 55 6 (6) (7)(8)(9)(10) 517616715814913 4 73 82 9110011 56 1計算現(xiàn)有樣本四格表的和及各組合下四格表的, 見表7-5。本例、。 2計算滿足條件的各組合下四格表的概率。 3計算同時滿足和條件的四格表的累計概率。本 例 滿足條件,累計概 率為 1234510 PPPPPP、 、 、 、 、 1210. 0 1054321 PPPPPPP s教材批 p143 57 本例,宜用四格表資料的

28、Fisher確切概率法直接計算累計概率。 檢驗步驟為: :,即兩組新生兒HBV的總體感染率相等 :,即兩組新生兒HBV的總體感染率不等 21 21 0 H 1 H 58 i bcadDi i P a b c d四格表組合四格表組合 102292-1980.00000143 212183-1650.00009412 322074-1320.00197656 431965-990.01844785 5*41856-66*0.08762728* 651747-33 7616380 87152933 9814110660.09120390 10913011990.01289752 bcadDii P

29、59 第五節(jié) 多個樣本率間的多重比較 當(dāng)多個樣本率比較的表資料檢驗,推斷結(jié)論為拒絕,接受時,只 能認(rèn)為各總體率之間總的來說有差別,但不能說明任兩個總體率 之間有差別。要進(jìn)一步推斷哪兩兩總體間有差別,若直接用四格 表資料的檢驗進(jìn)行多重比較,將會加大犯類錯誤的概率。 60 1多個實驗組間的兩兩比較 , ,k 為樣本率的個數(shù)。 1 2 + k = 2 )1( 2 kkk 61 2、實驗組與同一個對照組的比較 ) 1(2 k 62 第六節(jié) 雙向無序分類資料的關(guān)聯(lián)性檢驗 例例 7-8 7-8 測得某地測得某地58015801人的人的ABOABO血型和血型和MNMN血型結(jié)果如表,血型結(jié)果如表, 問兩種血型

30、系統(tǒng)之間是否有關(guān)聯(lián)?問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)? ABO血型血型 MN血型血型 合計合計 MNMN O4314909021823 A3884108001598 B4955879502032 A合計合計1451166626845801 63 步驟 1、建立檢驗假設(shè) 2、計算檢驗統(tǒng)計量 3、求出P值,作結(jié)論 注意:若須進(jìn)一步分析關(guān)系的密切程度時,可計算Pearson列聯(lián) 系數(shù) 2 2 C n 64 第七節(jié) 有序分組資料的線性趨勢檢驗 例7-11 某研究者欲研究年齡與冠狀動脈粥樣硬化 等級之間的關(guān)系,將278例尸解資料整理成表7-13, 問年齡與冠狀動脈粥樣硬化等級之間是

31、否存在線性 變化趨勢? 表表7-13 7-13 年齡與冠狀動脈硬化的關(guān)系年齡與冠狀動脈硬化的關(guān)系 年齡年齡( (歲歲) ) (X)(X) 冠狀動脈硬化等級冠狀動脈硬化等級(Y)(Y) 合計合計 + + 2020707022224 42 29898 3030272724249 93 36363 40401616232313137 75959 50509 92020151514145858 合計合計122122898941412626278278 65 步驟 1、建立檢驗假設(shè) 2、計算檢驗統(tǒng)計量 3、求出P值,作結(jié)論 注意:基本思想是: 首先計算表資料的值,然后將總的值分解成線性 回歸分量與偏離線

32、性回歸分量。若兩分量均有統(tǒng) 計學(xué)意義,說明兩個分類變量存在相關(guān)關(guān)系,但 關(guān)系不是簡單的直線關(guān)系;若線性回歸分量有統(tǒng) 計學(xué)意義,偏離線性回歸分量無統(tǒng)計學(xué)意義時, 說明兩個分類變量不僅存在相關(guān)關(guān)系,而且是線 性關(guān)系。 Nonzero Correlation 8 63.3895 .0001 Chi-Square 1 71.4325 .0001 66 data ex7_11; input r c f ; cards; 1 1 70 1 2 22 1 3 4 1 4 2 2 1 27 2 2 24 2 3 9 2 4 3 3 1 16 3 2 23 3 3 13 3 4 7 4 1 9 4 2 20 4

33、 3 15 4 4 14 ; proc freq;proc freq; weight f; weight f; tables r tables r* *c c /cmh1; /cmh1; run;run; 67 注意注意 雙向有序?qū)傩圆煌谋碣Y料 表資料中兩個分類變量皆為有序的, 但屬性不同,如表7-13。對于該類資料,若研究目的為分析不 同年齡組患者療效之間有無差別時,可把它視為單向有序表資料, 選用秩轉(zhuǎn)換的非參數(shù)檢驗;若研究目的為分析兩個有序分類變 量間是否存在相關(guān)關(guān)系,宜用等級相關(guān)分析或Pearson積矩相關(guān) 分析(見第九章);若研究目的為分析兩個有序分類變量間是 否存在線性變化趨勢,宜用本節(jié)所介紹的有序分組資料的線性趨 勢檢驗。 68 summary 1 1、研究目的:率、研究目的:率 or or 構(gòu)成比的假設(shè)檢驗(大樣本率或構(gòu)成比的假設(shè)檢驗(大樣本率或 小樣本率)小樣本率) 2 2、資料類型:計數(shù)資料、資料類型:計數(shù)資料 3 3、基本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論