版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
分類變量資料的統(tǒng)計(jì)推斷熊偉計(jì)數(shù)資料的統(tǒng)計(jì)推斷第二節(jié)分類變量資料的統(tǒng)計(jì)推斷一.率的抽樣誤差和標(biāo)準(zhǔn)誤率的抽樣誤差:由于隨機(jī)抽樣造成的樣本率和總體率之間以及各樣本率之間存在的差異。率的抽樣誤差用率的標(biāo)準(zhǔn)誤來表示:計(jì)數(shù)資料的統(tǒng)計(jì)推斷二.總體率的估計(jì):一、點(diǎn)值估計(jì):π=p二、區(qū)間估計(jì):按照一定的概率(可信度)估計(jì)總體率(π)所在的范圍(區(qū)間)。1、近似正態(tài)分布法:條件:np且n(1-p)均大于5,此時(shí)樣本率p近似正態(tài)分布,可用正態(tài)分布曲線下的區(qū)間面積規(guī)律來估計(jì)π。公式:計(jì)數(shù)資料的統(tǒng)計(jì)推斷例1:某醫(yī)院用復(fù)方當(dāng)歸注射液靜脈滴注治療腦動(dòng)脈硬化癥188例,其中顯效83例,試估計(jì)復(fù)方當(dāng)歸注射液顯效率的95%和99%的可信區(qū)間。
n=188,p=83/188=0.441595%CI為:99%CI為:計(jì)數(shù)資料的統(tǒng)計(jì)推斷2、查表法:n≤50,p或1-p接近于0或1,np或n(1-p)≮5時(shí),可用查表法。
例:從某校隨機(jī)抽取26名學(xué)生,發(fā)現(xiàn)有4名感染沙眼,試求該校沙眼感染率的95%可信區(qū)間。本例n=26x=4,查附表得其95%CI為(0.04,0.35)。計(jì)數(shù)資料的統(tǒng)計(jì)推斷三.樣本率與總體率比較的u檢驗(yàn):應(yīng)用條件:樣本含量足夠大;樣本率p或者1-p均不太小時(shí),此時(shí)樣本率的分布近似正態(tài)分布樣本率與總體率的比較兩樣本率的比較:計(jì)數(shù)資料的統(tǒng)計(jì)推斷(一)樣本率和總體率的比較計(jì)數(shù)資料的統(tǒng)計(jì)推斷例2:根據(jù)以往經(jīng)驗(yàn),一般胃潰瘍患者有20%發(fā)生胃出血癥狀。現(xiàn)某醫(yī)院觀察65歲以上潰瘍病人304例,有31.6%發(fā)生胃出血癥狀,問老年胃潰瘍患者是否較容易胃出血?計(jì)數(shù)資料的統(tǒng)計(jì)推斷:π=0.2
:π>0.2單側(cè)
,拒絕,接受,差別有統(tǒng)計(jì)學(xué)意義。可認(rèn)為老年人胃潰瘍出血率較一般胃潰瘍患者更易出血。計(jì)數(shù)資料的統(tǒng)計(jì)推斷(二)兩個(gè)率的比較的u檢驗(yàn)計(jì)數(shù)資料的統(tǒng)計(jì)推斷例3:某醫(yī)院觀察65歲以上潰瘍病人100例,有20例發(fā)生胃出血癥狀,觀察20-65歲的胃潰瘍患者100例有12例發(fā)生胃出血癥狀。問老胃潰瘍患者是否較中年患者容易胃出血?
H0:π1=π2
H1:π1≠π2
α單=0.05計(jì)數(shù)資料的統(tǒng)計(jì)推斷本例:n1=100,x1=12,p1=0.12;n2=100,x2=20,p2=0.2合并率查u界值表,得P>0.05,按雙側(cè)α=0.05水平不拒絕H0,差別無統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為老年患者和中年患者的胃潰瘍出血率有差別。計(jì)數(shù)資料的統(tǒng)計(jì)推斷第三節(jié)卡方檢驗(yàn)
χ2檢驗(yàn)(Chi-squaretest),英國人K.Pearson(1857-1936)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法,可用于兩個(gè)或多個(gè)率間的比較構(gòu)成比的比較計(jì)數(shù)資料的關(guān)聯(lián)度分析擬合優(yōu)度檢驗(yàn)等等。
本章僅限于介紹兩個(gè)和多個(gè)率或構(gòu)成比比較的χ2檢驗(yàn)。計(jì)數(shù)資料的統(tǒng)計(jì)推斷一、卡方檢驗(yàn)的基本思想(1)療法死亡生存合計(jì)病死率(%)鹽酸苯乙雙胍26(a)178(b)
204(a+b)
12.75(p1)安慰劑
2(c)
62(d)
64(c+d)
3.13(p2)合計(jì)
28(a+c.)240(b+d.)
268(a+b+c+d=n)
10.45(pc)例1兩種療法的心血管病病死率的比較2×2表或四格表(fourfoldtable)實(shí)際頻數(shù)A(actualfrequency)(a、b、c、d)
理論頻數(shù)T(theoreticalfrequency)(H0:π1=π2=pc):a的理論頻數(shù)=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理論頻數(shù)=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理論頻數(shù)=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理論頻數(shù)=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3計(jì)數(shù)資料的統(tǒng)計(jì)推斷療法死亡生存合計(jì)鹽酸苯乙雙胍26(21.3)178(182.7)204安慰劑2(6.7)62(57.3)
64合計(jì)28240268四格表資料的卡方檢驗(yàn)的自由度為1卡方檢驗(yàn)的自由度的計(jì)算公式:計(jì)數(shù)資料的統(tǒng)計(jì)推斷一、卡方檢驗(yàn)的基本思想(2)
各種情形下,理論與實(shí)際偏離的總和即為卡方值(chi-squarevalue),它服從自由度為ν的卡方分布。
卡方檢驗(yàn)的基本思想:檢驗(yàn)A與T之間的差異,如果A與T之間差異越大,則計(jì)算出來的χ2值就越大,查χ2界值表得出的P值就越小,如果小于了α=0.05,則拒絕H0假設(shè)。計(jì)數(shù)資料的統(tǒng)計(jì)推斷3.847.8112.59P=0.05的臨界值χ2分布(chi-squaredistribution)計(jì)數(shù)資料的統(tǒng)計(jì)推斷χ2檢驗(yàn)的基本公式上述基本公式由Pearson提出,因此軟件上常稱這種檢驗(yàn)為Peareson卡方檢驗(yàn),下面將要介紹的其他卡方檢驗(yàn)公式都是在此基礎(chǔ)上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的“行×列表”。計(jì)數(shù)資料的統(tǒng)計(jì)推斷二、四格表專用公式(1)
為了不計(jì)算理論頻數(shù)T,
可由基本公式推導(dǎo)出,直接由各格子的實(shí)際頻數(shù)(a、b、c、d)計(jì)算卡方值的公式:計(jì)數(shù)資料的統(tǒng)計(jì)推斷二、四格表專用公式(2)
2(1)~u2
=2.19492=4.82(n>40,所有T
5時(shí))療法死亡生存合計(jì)病死率(%)鹽酸苯乙雙胍26(a)178(b)
204(a+b)
12.75(p1)安慰劑
2(c)
62(d)
64(c+d)
3.13(p2)合計(jì)
28(a+c.)240(b+d.)
268(a+b+c+d=n)
10.45(pc)計(jì)數(shù)資料的統(tǒng)計(jì)推斷三、連續(xù)性校正公式(1)
χ2分布是一連續(xù)型分布,而行×列表資料屬離散型分布,對(duì)其進(jìn)行校正稱為連續(xù)性校正(correctionforcontinuity),又稱Yates校正(Yates'correction)。⑴當(dāng)n≥40,而1≤T<5時(shí),用連續(xù)性校正公式⑵當(dāng)n<40或T<1時(shí),用Fisher精確檢驗(yàn)(Fisherexacttest)校正公式:計(jì)數(shù)資料的統(tǒng)計(jì)推斷三、連續(xù)性校正公式(2)因?yàn)?<T<5,且n>40時(shí),所以應(yīng)用連續(xù)性校正χ2檢驗(yàn)計(jì)數(shù)資料的統(tǒng)計(jì)推斷四、配對(duì)四格表資料的χ2檢驗(yàn)例5.某研究室用甲、乙兩種血清學(xué)方法檢查410例確診的鼻咽癌患者,得結(jié)果如下表,問兩種方法的檢出率有無差別?兩種血清學(xué)檢驗(yàn)結(jié)果乙法合計(jì)甲法+-+261(a)110(b)371-8(c)31(d)39合計(jì)269141410計(jì)數(shù)資料的統(tǒng)計(jì)推斷配對(duì)四格表資料的χ2檢驗(yàn)也稱McNemar檢驗(yàn)(McNemar'stest)H0:兩種方法的總體檢查率相同,即B=CH1:兩種方法的總體檢查率不同,即B≠Cα=0.05計(jì)數(shù)資料的統(tǒng)計(jì)推斷配對(duì)四格表資料的χ2檢驗(yàn)公式推導(dǎo)計(jì)數(shù)資料的統(tǒng)計(jì)推斷五、行×列(R×C)表資料的χ2檢驗(yàn)前述四格表,即2×2表,是最簡單的一種R×C表形式。因?yàn)槠浠緮?shù)據(jù)有R行C列,故通稱行×列表或R×C列聯(lián)表(contingencytable),簡稱R×C表。計(jì)數(shù)資料的統(tǒng)計(jì)推斷R×C表的計(jì)算舉例例3.將133名尿路感染患者隨機(jī)分為3組,分別接受甲乙丙三種療法,一個(gè)療程后觀察其療效,結(jié)果如下,問3種療法的尿培養(yǎng)陰轉(zhuǎn)率有無差別。療法陰轉(zhuǎn)人數(shù)陽性人數(shù)合計(jì)陰轉(zhuǎn)率(%)甲30144468.2乙9364520.0丙32124472.7合計(jì)716213353.4計(jì)數(shù)資料的統(tǒng)計(jì)推斷基本公式通用公式R×C表的χ2檢驗(yàn)通用公式代入基本公式可推導(dǎo)出:自由度=(行數(shù)
1)(列數(shù)
1)計(jì)數(shù)資料的統(tǒng)計(jì)推斷R×C表的計(jì)算舉例例3.將133名尿路感染患者隨機(jī)分為3組,分別接受甲乙丙三種療法,一個(gè)療程后觀察其療效,結(jié)果如下,問3種療法的尿培養(yǎng)陰轉(zhuǎn)率有無差別。療法陰轉(zhuǎn)人數(shù)陽性人數(shù)合計(jì)陰轉(zhuǎn)率(%)甲30144468.2乙9364520.0丙32124472.7合計(jì)716213353.4計(jì)數(shù)資料的統(tǒng)計(jì)推斷1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:3種療法的陰轉(zhuǎn)率相同,即π1=π2=π3H1:3種療法的陰轉(zhuǎn)率不全相同,即π1,π2,π3不同或不全相同α=0.052、計(jì)算統(tǒng)計(jì)量3、確定P值,做出統(tǒng)計(jì)推斷查χ2界值表,得P<0.005,按α=0.05水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義,故認(rèn)為3種療法對(duì)尿路感染療效不全相同。計(jì)數(shù)資料的統(tǒng)計(jì)推斷例4.隨機(jī)選擇239例胃、十二指腸疾病患者和187例健康輸血員,其血型分布見下表,問胃、十二指腸疾病患者與健康輸血員血型分布有無差別。分組ABABO合計(jì)胃、十二指腸疾病患者
476620106239健康輸血員
52541962187合計(jì)9912039168426計(jì)數(shù)資料的統(tǒng)計(jì)推斷1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:胃、十二指腸疾病患者與健康輸血員血型分布的構(gòu)成比相同H1:胃、十二指腸疾病患者與健康輸血員血型分布的構(gòu)成比不同α=0.052、計(jì)算統(tǒng)計(jì)量3、確定P值,做出統(tǒng)計(jì)推斷查χ2界值表,得P>0.05,按α=0.05水準(zhǔn),不拒絕H0,差別無統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為胃、十二指腸疾病患者與健康輸血員血型分布的構(gòu)成比不同。計(jì)數(shù)資料的統(tǒng)計(jì)推斷R×C表χ2檢驗(yàn)的應(yīng)用注意事項(xiàng)
1.對(duì)R×C表,若較多格子(1/5)的理論頻數(shù)小于5或有一個(gè)格子的理論頻數(shù)小于1,則易犯第一類錯(cuò)誤。 出現(xiàn)某些格子中理論頻數(shù)過小時(shí)怎么辦?(1)增大樣本含量(最好?。?)刪去該格所在的行或列(丟失信息?。?)根據(jù)專業(yè)知識(shí)將該格所在行或列與別的行或列合并。(丟失信息!甚至出假象)計(jì)數(shù)資料的統(tǒng)計(jì)推斷R×C表χ2檢驗(yàn)的應(yīng)用注意事項(xiàng)2.多組比較時(shí),若效應(yīng)有強(qiáng)弱的等級(jí),如+,++,+++,最好采用后面的非參數(shù)檢驗(yàn)方法。χ2檢驗(yàn)只能反映其構(gòu)成比有無差異,不能比較效應(yīng)的平均水平。
3.行列兩種屬性皆有序時(shí),可考慮趨勢檢驗(yàn)或等級(jí)相關(guān)分析。計(jì)數(shù)資料的統(tǒng)計(jì)推斷4、當(dāng)多個(gè)樣本率(或構(gòu)成比)比較的卡方檢驗(yàn),結(jié)論為拒絕H0假設(shè),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說明它們彼此之間都有差別,或某兩者間有差別。
若想進(jìn)一步了解哪兩者的差別有統(tǒng)計(jì)學(xué)意義,可用χ2分割法。Χ2分割法是利用χ2值的可加性原理,把R×C表分割為若干個(gè)分割表,這些分割表的自由度之和等于原R×C表的自由度,其χ2值之和十分接近原表的χ2值。分割的方法是按最近的原則,把陽性率(或構(gòu)成比)相差不大的樣本分割出來,計(jì)算其χ2值。當(dāng)差別無統(tǒng)計(jì)學(xué)意義時(shí),就把它們合并為一個(gè)樣本,再把它與另一較接近的樣本比較,如此進(jìn)行下去直至結(jié)束。計(jì)數(shù)資料的統(tǒng)計(jì)推斷例3.將133名尿路感染患者隨機(jī)分為3組,分別接受甲乙丙三種療法,一個(gè)療程后觀察其療效,結(jié)果如下,問3種療法的尿培養(yǎng)陰轉(zhuǎn)率有無差別。療法陰轉(zhuǎn)人數(shù)陽性人數(shù)合計(jì)陰轉(zhuǎn)率(%)甲30144468.2乙9364520.0丙32124472.7合計(jì)716213353.4計(jì)數(shù)資料的統(tǒng)計(jì)推斷
對(duì)于例3:3種療法尿路感染患者的陰轉(zhuǎn)率的分析結(jié)果作進(jìn)一步的兩兩比較。由于甲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《凡客發(fā)展現(xiàn)狀》課件
- 2024年江沙區(qū)域產(chǎn)品購銷協(xié)議版B版
- 房屋裝修工程承包合同(2篇)
- 2024年版鐵路客運(yùn)服務(wù)協(xié)議范本一
- 2024實(shí)木家俱定制與家具維護(hù)保養(yǎng)服務(wù)合同2篇
- 2025年瀘州道路運(yùn)輸從業(yè)資格證考哪些項(xiàng)目
- 2025年涼山州駕駛員貨運(yùn)從業(yè)資格證模擬考試題
- 2025年河北道路運(yùn)輸從業(yè)人員從業(yè)資格考試
- 《改善提案》課件
- 2024年建筑土建主體工程分包勞務(wù)協(xié)議樣本版B版
- 四川省公需科目(數(shù)字經(jīng)濟(jì)與驅(qū)動(dòng)發(fā)展)考試題庫及答案
- 智慧醫(yī)療信息化建設(shè)項(xiàng)目技術(shù)標(biāo)準(zhǔn)建設(shè)方案
- 工程建設(shè)監(jiān)理收費(fèi)標(biāo)準(zhǔn)(發(fā)改價(jià)格【2007】670號(hào))
- 摩托車品牌文化營銷與品牌故事的構(gòu)建
- 2024江蘇南京大數(shù)據(jù)集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- FZT 73032-2017 針織牛仔服裝
- 企業(yè)并購與資產(chǎn)重組智慧樹知到期末考試答案2024年
- 貨物包裝承諾函
- 治療用碘131I化鈉膠囊-臨床用藥解讀
- 2024人教版五年級(jí)上冊數(shù)學(xué)期末口算題訓(xùn)練
- 2024外研版初中英語單詞表匯總(七-九年級(jí))中考復(fù)習(xí)必背
評(píng)論
0/150
提交評(píng)論