統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較-文檔資料_第1頁
統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較-文檔資料_第2頁
統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較-文檔資料_第3頁
統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較-文檔資料_第4頁
統(tǒng)計(jì)學(xué)-兩個(gè)率或多個(gè)率的比較-文檔資料_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1浙江大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室浙江大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室李秀央李秀央Email: 率的抽樣誤差與可信區(qū)間率的抽樣誤差與可信區(qū)間 一、率的抽樣誤差與標(biāo)準(zhǔn)誤一、率的抽樣誤差與標(biāo)準(zhǔn)誤 二、總體率的可信區(qū)間二、總體率的可信區(qū)間一、一、 率的抽樣誤差與標(biāo)準(zhǔn)誤率的抽樣誤差與標(biāo)準(zhǔn)誤 樣本率樣本率(p)和總體率和總體率()的差異稱為率的的差異稱為率的抽抽樣誤差樣誤差(sampling error of rate) ,用,用率的標(biāo)率的標(biāo)準(zhǔn)誤準(zhǔn)誤(standard error of rate)度量。)度量。np)1( 如果總體率如果總體率未知,用未知,用樣本率樣本率p估計(jì)估計(jì)nppsp)1( 標(biāo)準(zhǔn)誤的計(jì)

2、算標(biāo)準(zhǔn)誤的計(jì)算二、二、 總體率的可信區(qū)間總體率的可信區(qū)間 總體率的可信區(qū)間總體率的可信區(qū)間 (confidence interval of rate):根據(jù)樣本率推算總體率可能所在的范圍:根據(jù)樣本率推算總體率可能所在的范圍 率的統(tǒng)計(jì)學(xué)推斷率的統(tǒng)計(jì)學(xué)推斷 一、樣本率與總體率比較一、樣本率與總體率比較u u檢驗(yàn)檢驗(yàn) 二、兩個(gè)樣本率的比較二、兩個(gè)樣本率的比較u u檢驗(yàn)檢驗(yàn)一、樣本率與總體率比較的一、樣本率與總體率比較的u u檢驗(yàn)檢驗(yàn)u u檢驗(yàn)的條件:檢驗(yàn)的條件:n p 和n(1- p)均大于5時(shí)例例 55,-地地中中海海貧貧血血基基因因攜攜帶帶率率:山山區(qū)區(qū) p=12/125=0.096, n=12

3、5;本本省省一一般般成成人人0 0=0.076, H0:= =0 0= =0 0. .0 07 76 6 H1:0 0 = =0 0. .0 05 5。 按按= =0 0. .0 05 5 水水準(zhǔn)準(zhǔn),不不拒拒絕絕 H0,即即不不能能認(rèn)認(rèn)為為該該山山區(qū)區(qū)與與本本省省一一般般 成成人人的的-地地中中海海貧貧血血基基因因攜攜帶帶率率有有差差異異。 )1(0000nppup844.0125)076.01(076.0076.0096.0二、兩個(gè)獨(dú)立樣本率比較的二、兩個(gè)獨(dú)立樣本率比較的u u檢驗(yàn)檢驗(yàn)96. 11949. 2)6412041)(1045. 01 (1045. 00313. 01275. 0u

4、表表5-1 兩種療法的心血管病病死率比較兩種療法的心血管病病死率比較療法死亡生存 合計(jì)病死率(%)鹽酸苯乙雙胍26 (X1)178 204(n1) 12.75 (p1)安慰劑 2 (X2) 62 64(n2) 3.13 (p2)合 計(jì) 28240 268 10.45 (pc)2122112121nnpnpnnnXXpc)11)(1 (21212121nnppppSppuccppu u檢驗(yàn)的條件:檢驗(yàn)的條件:n n1 1p p1 1 和和n n1 1( (1- p1- p1 1) )與與n n2 2p p2 2 和和n n2 2( (1- p1- p2 2) )均均 55卡方檢驗(yàn)卡方檢驗(yàn) 2檢驗(yàn)

5、(Chi-square test)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,英國人K . Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法,可用于兩個(gè)或多個(gè)率間的比較,計(jì)數(shù)資料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗(yàn)等等。 本章僅限于介紹兩個(gè)和多個(gè)率或構(gòu)成比比較的2檢驗(yàn)。一、卡方檢驗(yàn)的基本思想一、卡方檢驗(yàn)的基本思想(1)療法療法死亡死亡生存生存 合計(jì)合計(jì)病死率病死率(%)鹽酸苯乙雙胍鹽酸苯乙雙胍26 (a)178 (b) 204(a+b) 12.75 (p1)安慰劑安慰劑 2 (c) 62 (d) 64(c+d) 3.13 (p2)合合 計(jì)計(jì) 28 (a+c.)240(b+d.) 268(a

6、+b+c+d=n) 10.45 (pc)表表5-1 5-1 兩種療法的心血管病病死率的比較兩種療法的心血管病病死率的比較(a+b)pc= (a+b)(a+c.)/ n=nRnC/n =21.3(a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC/n =182.7(c+d)pc= (c+d)(a+c)/ n =nRnC/n =6.7(c+d)(1-pc)= (c+d)(b+d.)/ n =nRnC/n =57.3nnncolumnrowTCR總例數(shù)合計(jì)列合計(jì)行)()(一、卡方檢驗(yàn)的基本思想一、卡方檢驗(yàn)的基本思想(2) 各種情形下,理論與實(shí)際偏離的總和即為卡方值(chi-square

7、 value),它服從自由度為的卡方分布。) 1)(1(,1)()(222CRTTATTA1) 12)(12(82. 4)3 .5717 . 617 .18213 .211(7 . 423 .57)3 .5762(27 . 6)7 . 62(27 .182)7 .182178(23 .21)3 .2126(22v2/) 12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的臨界值的臨界值2分布(分布(chi-square distribution)2檢驗(yàn)的基本公式檢驗(yàn)的基本公式) 1)(1(1)()(222CRTTATTA 上述上述基本公式基本公式由由Pears

8、on提出,因此軟件上常稱這種檢驗(yàn)為Peareson卡方檢驗(yàn),下面將要介紹的其他卡方檢驗(yàn)公式都是在此基礎(chǔ)上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的“行列表”。二、四格表專用公式(二、四格表專用公式(1) 為了不計(jì)算理論頻數(shù)為了不計(jì)算理論頻數(shù)T, 可由可由基本公式基本公式推導(dǎo)出,推導(dǎo)出,直接由直接由各格子的實(shí)際頻數(shù)(各格子的實(shí)際頻數(shù)(a、b、c、d)計(jì)算卡方值的公式:)計(jì)算卡方值的公式:(四格表專用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcb

9、acabaaTTA二、四格表專用公式(二、四格表專用公式(2)021 ,05. 0221021 ,05. 0221 ,05. 0205. 0;84. 3,05. 0;84. 305. 0;84. 31 , 82. 46424028204268)21786226(22HPHPP,即不拒絕則如果即拒絕如果下結(jié)論:2(1) u2 2.194924.82(n40,所有T5時(shí))三、連續(xù)性校正公式(三、連續(xù)性校正公式(1) 2分布是一連續(xù)型分布,而行分布是一連續(xù)型分布,而行列表資料屬離散型分布列表資料屬離散型分布,對(duì)其進(jìn)行校正稱為連續(xù)性校正,對(duì)其進(jìn)行校正稱為連續(xù)性校正(correction for (co

10、rrection for continuity),continuity),又稱又稱YatesYates校正(校正(Yates correctionYates correction)。)。當(dāng)當(dāng)n40,而,而1T5時(shí),用連續(xù)性校正公式時(shí),用連續(xù)性校正公式當(dāng)當(dāng)n40或或T1時(shí),用時(shí),用Fisher精確檢驗(yàn)精確檢驗(yàn)(Fisher exact test )校正公式:校正公式:列表資料),(也適合其它行TTAc22)5 . 0()()()()2/(22dbcadcbannbcadc三、連續(xù)性校正公式(三、連續(xù)性校正公式(2)表 5-2 兩零售點(diǎn)豬肉表層沙門氏菌帶菌情況檢查結(jié)果 沙門氏菌 零售點(diǎn) 陽性 陰性

11、 合計(jì) 帶菌率(%) 甲 2(4.17) 26(23.33) 28 7.14 乙 5(2.33) 9(11.67) 14 35.71 合計(jì) 7 35 42 16.67 1 , 62. 3357142842)24262592(22c1 , 49. 5357142842)26592(22因?yàn)橐驗(yàn)? 1T T5 5,且,且n n4040時(shí),所以應(yīng)用連續(xù)性校正時(shí),所以應(yīng)用連續(xù)性校正2檢驗(yàn)檢驗(yàn)四、配對(duì)四格表資料的四、配對(duì)四格表資料的2檢驗(yàn)檢驗(yàn)配對(duì)四格表資料的配對(duì)四格表資料的2檢驗(yàn)也稱檢驗(yàn)也稱McNemar檢驗(yàn)(檢驗(yàn)(McNemars test) 1,) 1(2402cbcbcb時(shí),需作連續(xù)性校正, 1,

12、27. 4312) 1312(22,4015采用連續(xù)性校正本例cb 1,)(2240ccbcbb時(shí),當(dāng)05. 0;84. 321 ,05. 02PH0:b,c來自同一個(gè)實(shí)驗(yàn)總體(兩種劑量的毒性無差異);H1:b,c來自不同的實(shí)驗(yàn)總體(兩種劑量的毒性有差別);=0.05。五、行列(RC)表資料的2檢驗(yàn)RC表的2檢驗(yàn)通用公式nnnTCR總例數(shù)列合計(jì)行合計(jì)理論頻數(shù)代入基本公式 可推導(dǎo)出: 基本公式 通用公式 ) 1()(2222CRnnAnTTA 自由度=(行數(shù)1) (列數(shù)1) 幾種RC表的檢驗(yàn)假設(shè)H0RC表的計(jì)算舉例RC表2檢驗(yàn)的應(yīng)用注意事項(xiàng) 1. 對(duì)RC表,若較多格子(1/5)的理論頻數(shù)小于5或有一個(gè)格子的理論頻數(shù)小于1,則易犯第一類錯(cuò)誤。出現(xiàn)某些格子中理論頻數(shù)過小時(shí)怎么辦? (1)增大樣本含量(最好!) (2)刪去該格所在的行或列(丟失信息?。?(3)根據(jù)專業(yè)知識(shí)將該格所在行或列與別的行或列合并。(丟失信息!甚至出假象) RC表2檢驗(yàn)的應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論