7.分類(lèi)變量的統(tǒng)計(jì)推_第1頁(yè)
7.分類(lèi)變量的統(tǒng)計(jì)推_第2頁(yè)
7.分類(lèi)變量的統(tǒng)計(jì)推_第3頁(yè)
7.分類(lèi)變量的統(tǒng)計(jì)推_第4頁(yè)
7.分類(lèi)變量的統(tǒng)計(jì)推_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分類(lèi)變量資料的統(tǒng)計(jì)推斷(計(jì)數(shù)資料)DR.2007.11.25 目的要求1、掌握率的抽樣誤差、標(biāo)準(zhǔn)誤及其可信區(qū)間 估計(jì)方法。2、掌握卡方檢驗(yàn)的用途、各種設(shè)計(jì)資料的適 用條件及統(tǒng)計(jì)結(jié)論的推斷。3、熟悉卡方檢驗(yàn)的基本思想、步驟及注意事項(xiàng)。4、了解率的檢驗(yàn)用途及適用條件。2007.11.25提要 : 率的抽樣誤差與率的標(biāo)準(zhǔn)誤; 總體率的估計(jì)和率的u檢驗(yàn); 卡方檢驗(yàn)。2007.11.25一、率的抽樣誤差和總體率的估計(jì) 1. 率的抽樣誤差與標(biāo)準(zhǔn)誤 (sampling error & standard error of rate ) 率的抽樣誤差:由抽樣造成的樣本率與總體率的差別,或樣本率之間的差別。 率的

2、標(biāo)準(zhǔn)誤:表示率的抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。 ( Sp 為p的估計(jì)值, p為 的估計(jì)值 )*公式計(jì)算 : ( 1 - ) p ( 1 - p ) p = ; Sp = n n 2007.11.25(1)正態(tài)近似法:當(dāng)總體率 未知時(shí),若 n p 5 和 n (1p) 5 則總體率 (1- ) 可信區(qū)間為: 總體率95%可信區(qū)間為 p 1.96 sp 總體率99%可信區(qū)間為 p 2.58 sp p u sp = p - u sp p + u sp2. 總體率的區(qū)間估計(jì)2007.11.25例: 某地中學(xué)生就餐方式與乙肝病毒感染情況調(diào)查 就餐方式 調(diào)查人數(shù) 感染人數(shù) 感染率(%) 常在外就餐(A) 89

3、6 6.74 不在外就餐(B) 111 5 4.50合計(jì) 200 11 5.50 p(1 p)Sp = n抽樣誤差:0.0266 = 2.66% 0.0674(1 - 0.0674 )Sp = 89(A):(B): 0.0450 (1 - 0.0450 )Sp = 1110.0197 = 1.97%2007.11.25 例: 某地中學(xué)生就餐方式與乙肝病毒感染情況調(diào)查 就餐方式 調(diào)查人數(shù) 感染人數(shù) 感染率(%) 標(biāo)準(zhǔn)誤 常在外就餐(A) 89 6 6.74 2.66% 不在外就餐(B) 111 5 4.50 1.97%總體率95%可信區(qū)間為 p 1.96 sp總體率99%可信區(qū)間為 p 2.58

4、 sp 總體感染率95%可信區(qū)間:(A): 6.74% 1.962.66% = 1.53% 11.95%(B): 4.50% 1.961.97% = 0.64% 8.36%2007.11.25(2)查表法 當(dāng)樣本含量n較小,如n50(特別是p接近0或1時(shí)),則按二項(xiàng)分布原理確定總體率的可信區(qū)間。 可根據(jù)樣本含量 n 和陽(yáng)性數(shù) X 參照專(zhuān)用統(tǒng)計(jì)學(xué)介紹的二項(xiàng)分布中95%可信限表。P254 附表62. 總體率的區(qū)間估計(jì)2007.11.25二、率的u檢驗(yàn) 1. 樣本率與總體率比較目的:推斷樣本率所代表的總體率 與某總體率 0 是否相等。 | p-0 |u = p | p - 0 | u = 0 (1-

5、 0) /n條件:n0 5 和 n (1 - 0 ) 5公式:2007.11.25例:某地城鎮(zhèn)25歲以上居民高血壓患病率為 11,隨機(jī)抽查該地礦區(qū)25歲以上居民598 人,確診高血壓者有82人。礦區(qū)居民與城鎮(zhèn) 居民高血壓患病率有何不同? 城鎮(zhèn)居民高血壓患病率:0 =11= 0.11 礦區(qū)居民高血壓患病率:p = 82/598 = 0.14 分析目的: 推斷 與 0 是否不同?2007.11.25假設(shè):H0: = 0= 0.11, H1: 0 0.11, 0.05 p - 0u = 0 (1- 0) /n 0.14 - 0.11 0.11(1-0.11)/598= 2.340.01 P 0.05

6、 結(jié)論:礦區(qū)居民高血壓患病率高于城鎮(zhèn)居民。2007.11.25 2. 兩個(gè)樣本率比較目的:推斷兩樣本率分別代表的總體率 1與 2是否相等。 | p1 - p2 |u = S p1-p2 _ 1 1 S p1-p2 = pc (1-pc) ( + ) n1 n2(pc為兩個(gè)樣本率的合并率。)公式:u 檢驗(yàn)的條件:兩樣本率近似正態(tài)分布,n1p1 和n1(1- p1)與n2p2 和n2(1- p2)均 52007.11.25例: 某地5570歲居民體重指數(shù)與糖尿病關(guān)系體重指數(shù) 檢查人數(shù) 糖尿病人數(shù) 患病率25 988 52 5.26 25 682 69 10.11合計(jì) 1670 121 7.25是否

7、體重指數(shù)(BMI)不同糖尿病的患病率不同?BMI 25 : p1= 5.26% 1 BMI 25 : p2=10.11% 2分析目的: 推斷 1與 2 是否不同2007.11.25假設(shè):H0: = , H1: , = 0.05 _ 1 1 S p1-p2 = pc (1-pc) ( + ) n1 n2 | p1 - p2 |u = S p1-p2 0.0725(1-0.0725)(1/988+1/682)=| 0.0526 - 0.1011 |= 3.76P 0.01結(jié)論:BMI 25者糖尿病患病率高于BMI 25者 BMI與糖尿病有關(guān)。2007.11.25小 結(jié) 1樣本率也有抽樣誤差,率的抽

8、樣誤差的大小用p或Sp來(lái)衡量。 2率的分布服從二項(xiàng)分布。當(dāng)n足夠大,和1-均不太小,有n5和n(1-)5時(shí),近似正態(tài)分布。 3總體率的可信區(qū)間是用樣本率估計(jì)總體率的可能范圍。當(dāng)p分布近似正態(tài)分布時(shí),可用正態(tài)近似法估計(jì)率的可信區(qū)間。 4根據(jù)正態(tài)近似原理,可進(jìn)行樣本率與總體率以及兩樣本率比較的u檢驗(yàn)。率的u檢驗(yàn)?zāi)芙鉀Q以下問(wèn)題嗎? 率的反應(yīng)為生與死、陽(yáng)性與陰性、發(fā)生與不發(fā)生等二項(xiàng)分類(lèi)變量,如果二分類(lèi)變量為非正反關(guān)系(如治療A、治療B);反應(yīng)為多分類(lèi),如何進(jìn)行假設(shè)檢驗(yàn)? 率的u檢驗(yàn)要求:n足夠大,且n5和 n(1-)5。如果條件不滿(mǎn)足,如何進(jìn)行假設(shè)檢驗(yàn)? 2(卡方 )檢驗(yàn)可用于兩個(gè)或多個(gè)率間的比較;計(jì)

9、數(shù)資料的關(guān)聯(lián)度分析;擬合優(yōu)度檢驗(yàn)等。 本章僅限于介紹兩個(gè)和多個(gè)率或構(gòu)成比比較的2檢驗(yàn)。1. 2 檢驗(yàn)的用途:2. 2 檢驗(yàn)的基本思想:例8.5: 某抗生素的人群耐藥性情況 用藥史 不敏感 敏感 合計(jì) 耐藥率 曾服該藥 180 215 395 45.57 未服該藥 73 106 179 40.78 合 計(jì) 253 321 574 44.08試問(wèn)兩種人群的耐藥率是否一樣?實(shí)際數(shù) A2007.11.25某抗生素的人群耐藥性情況 用藥史 不敏感 敏感 合計(jì) 耐藥率曾服該藥 180 215 395 45.57未服該藥 73 106 179 40.78 合 計(jì) 253 321 574 44.08假設(shè):兩種

10、人群耐藥率一致為 253/574 44.08 曾服該藥的耐藥人數(shù) T1.1=395253/574=174.1 未服該藥的耐藥人數(shù) T2.1=179253/574=78.9假設(shè):兩種人群敏感率一致為 321/574 55.92 曾服該藥的敏感人數(shù) T1.2=395321/574=220.9 未服該藥的敏感人數(shù) T2.2=179321/574=100.1 T 理論值(nR)(nC)(n) nR nC TRC = n 2007.11.25 T 理論值是根據(jù)無(wú)效假設(shè)(H0)而推論出的理論數(shù)據(jù) nR nC TRC = n 各種設(shè)計(jì)方式的卡方檢驗(yàn)均據(jù)此試計(jì)算2007.11.25 某抗生素的人群耐藥性情況用

11、藥史 不敏感 敏 感 合計(jì) 耐藥率 A T A T 未服該藥 180(174.1) 215(220.9) 395 45.57曾服該藥 73( 78.9) 106(100.1) 179 40.78合計(jì)nR 253 47 104 n 44.08基本公式: (A - T) 2 2 = T nR nC TRC = n A 實(shí)際值 T 理論值 = (行-1)(列-1) =(R-1)(C-1)(nC)2007.11.25 2 值、P 值與統(tǒng)計(jì)結(jié)論 2值 P值 統(tǒng) 計(jì) 結(jié) 論 0.05 接受H0 差異無(wú)統(tǒng)計(jì)學(xué)意義 20.05( ) 0.05 拒絕H0 差異有統(tǒng)計(jì)學(xué)意義 20.01( ) 0.01 拒絕H0

12、差異有高度統(tǒng)計(jì)學(xué)意義2007.11.25 3. 2檢驗(yàn)的種類(lèi) ( 1) 四格表資料的 2檢驗(yàn) ( 2 test for fourfold table) 目的:用于兩個(gè)樣本率或構(gòu)成比的比較,推斷兩個(gè)樣本所代表的總體率(或總體構(gòu)成比)是否相等。 專(zhuān)用公式: ( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d)基本公式: (A - T) 2 2 = T = 12007.11.25檢驗(yàn)假設(shè):H0:12 , H1:12 ,0.05 (A - T) 2 2 = , T 2 (180174.1)2 / 174.1 + (215 220.9)2 / 220.9 + (

13、73 78.0.9)2 / 78.9 + (106 100.1)2 / 100.1 =1.15 = 1 2 0.05 P 結(jié)論:兩種人群的耐藥率無(wú)差別 某抗生素的人群耐藥性情況用藥史 不敏感 敏 感 合計(jì) 耐藥率 A T A T 未服該藥 180(174.1) 215(220.9) 395 45.57曾服該藥 73( 78.9) 106(100.1) 179 40.78合計(jì)nR 253 47 104 n 44.082007.11.25某抗生素的人群耐藥性情況用藥史 不敏感 敏 感 合計(jì) 生存率未服該藥 180 215 395 45.57曾服該藥 73 106 179 40.78合計(jì) 253 3

14、21 574 44.08(a)(b)(c)(d)(a+b)(c+d)(a+c)(b+d)(n) ( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d) 2 = (180106 - 215 73)2 574253 321 395179= 1.15P 0.052007.11.25 四格表 2值的校正當(dāng):1 T 5,而 n 40 時(shí),需計(jì)算校正 2值 ( | A - T | - 0.5 ) 2 2 = , T ( | ad - bc | - n/2 ) 2 n或 2 = (a + b)(c + d)(a + c)(b + d)當(dāng):T 1,或 n 0.05結(jié)論:

15、無(wú)差別2007.11.25穿新舊兩種防護(hù)服工人皮炎患病率比較的四格表種類(lèi) 患皮炎 未患皮炎 合計(jì) 患病率 新 1 14 15 6.7 舊 10 18 28 35.7合計(jì) 11 32 43 25.6(3.84)(11.16)(7.16)(20.84) ( | ad - bc | - n/2 ) 2 n 2 = (a + b)(c + d)(a + c)(b + d)= 2.940.10 P 0.05 ( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d)= 4.33 0.01 P 2 0.025(1) , P 0.025 = 1 按 =0.05水準(zhǔn),拒絕H

16、0,接受H1。認(rèn)為兩組流感發(fā)病率有差別,服藥組流感發(fā)病率低于對(duì)照組。2007.11.25 本例: 第1行1列的T: T11 =23090/410=50.49 第1行2列的T: T12 =230320/410=179.51 第2行1列的T: T21 =18090/410 = 39.51 第2行2列的T: T22 =180320/410=140.49 以推算結(jié)果,可與原四項(xiàng)實(shí)際數(shù)并列成表11-1: 2007.11.25例11.5 表11-1 兩組人群流感發(fā)病率的比較 組別 發(fā)病 未發(fā)病 合計(jì) 發(fā)病率 人數(shù) 人數(shù) (%)服藥組 40(50.49)190(179.51) 230 17.30對(duì)照組 50

17、(39.51)130(140.49) 180 27.78合計(jì) 90 320 410 21.95(nR)(nC)(N)2007.11.25 因?yàn)樯媳砻啃泻兔苛泻嫌?jì)數(shù)都是固定的,所以只要用TRC 式求得其中一項(xiàng)理論數(shù),則其余三項(xiàng)理論數(shù)都可用同行或同列合計(jì)數(shù)相減,直接求出。 T1.1= 50.49 T1.2= 230 50.49 =179.51 T2.1= 90 50.49 =39.51 T2.2= 180 39.51=140.492007.11.25 2 值、P 值與統(tǒng)計(jì)結(jié)論 2值 P值 統(tǒng) 計(jì) 結(jié) 論 0.05 接受H0 差異無(wú)統(tǒng)計(jì)學(xué)意義 20.05( ) 0.05 拒絕H0 差異有統(tǒng)計(jì)學(xué)意義

18、20.01( ) 0.01 拒絕H0 差異有高度統(tǒng)計(jì)學(xué)意義2007.11.25 四格表 2值的校正:只要有一格當(dāng):1 T 5,而 n 40 時(shí),需計(jì)算校正 2值 ( | A - T | - 0.5 ) 2 2 = , T ( | ad - bc | - n/2 ) 2 n或 2 = (a + b)(c + d)(a + c)(b + d)當(dāng):T 1,或 n 0.05結(jié)論:無(wú)差別 如果不采用校正公式,算得的結(jié)果 2 =4.197, 則結(jié)論就相反了。2.812 3.84,2007.11.25基本公式: (A - T) 2 2 = , T = (行-1)(列-1) = (R-1)(C-1) A 2

19、2 = n ( - 1) nR nC(2)行 列表資料的 2 檢驗(yàn) ( 2 test for RC table ) 目的:用于多個(gè)樣本率(或構(gòu)成比)的比較, 推斷樣本所代表的幾個(gè)總體率(或總 體構(gòu)成比)之間有無(wú)差別。專(zhuān)用公式:2007.11.25例11.8 問(wèn)不同季節(jié)呼吸道感染率有無(wú)差別。 該資料歸納如表11-4作行列檢驗(yàn)。 表11-4 不同季節(jié)呼吸道感染率的比較 季節(jié) 感染人數(shù) 未感染人數(shù) 合計(jì) 感染率% 春 12 699 711 1.69 夏 12 666 678 1.77 秋 29 665 694 4.18 冬 35 717 752 4.65 合計(jì) 88 2747 2835 3.10 該

20、表資料由4行2列組成,稱(chēng)24表,可用公式(11.15)檢驗(yàn)。2007.11.25 1建立檢驗(yàn)假設(shè)及確定檢驗(yàn)水準(zhǔn) : H0:四個(gè)季節(jié)呼吸道感染率相同 H1:四個(gè)季節(jié)呼吸道感染率不同或不全 相同。 =0.052.計(jì)算2值: A 2 2 = n ( - 1) nR nC2007.11.252.計(jì)算2值: A2RC 2 = n ( 1) nRnC 122 6992 = 2835( + + 88711 2747 711 7172 + 1) 2747 75 = 17.29352007.11.253確定P值和推斷結(jié)論 v =(4- 1)(2 - 1)= 3 據(jù)此查2值表: 2 0.005(3)= 12.84

21、; 2 = 17.2935 2 0.005(3) P0.005 按=0.05水準(zhǔn),拒絕H0,接受H1。認(rèn)為 四個(gè)季節(jié)呼吸道感染率差別有高度統(tǒng)計(jì)學(xué)意 義。2007.11.25例. 三種方案治療肝炎的療效 組別 有效 無(wú)效 合計(jì) 有效率%西 藥 51 49 100 51.00中藥藥 35 45 80 43.75中西藥 59 15 74 79.73 合計(jì) 145 109 254 57.09假設(shè):H0: 三種藥物的有效率相同 H1: 三種藥物的有效率不同或不全相同 = 0.05 A 2 2 = n ( - 1) nR nC2 =(512/100145+492/100109+152/74109 1) 254= 22.81 =(R1)(C1) =(R-1)(C-1)=(31) (21)= 22007.11.25 當(dāng)推斷結(jié)論為拒絕 H0 時(shí),是認(rèn)為各總體率(或總體構(gòu)成比)不等或不全相等,即只能認(rèn) 為其中至少有兩個(gè)總體率(或總體構(gòu)成比)不 等,而不能確定任意兩個(gè)總體率(或總體構(gòu)成比)不等。應(yīng)作RC表的 2分割檢驗(yàn) 行

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論