分類推斷1-第四版預(yù)防衡明莉-PPT幻燈片_第1頁(yè)
分類推斷1-第四版預(yù)防衡明莉-PPT幻燈片_第2頁(yè)
分類推斷1-第四版預(yù)防衡明莉-PPT幻燈片_第3頁(yè)
分類推斷1-第四版預(yù)防衡明莉-PPT幻燈片_第4頁(yè)
分類推斷1-第四版預(yù)防衡明莉-PPT幻燈片_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[學(xué)習(xí)內(nèi)容]第一節(jié)率的抽樣誤差與可信區(qū)間第二節(jié)率的統(tǒng)計(jì)學(xué)推斷一、樣本率與總體率比較的u檢驗(yàn)二、兩個(gè)樣本率比較的u檢驗(yàn)第三節(jié)卡方檢驗(yàn)一、卡方檢驗(yàn)的基本思想二、四格表專用公式三、連續(xù)性校正公式四、配對(duì)四格表資料的χ2檢驗(yàn)五、行×列(R×C)表資料的χ2檢驗(yàn)計(jì)數(shù)資料的統(tǒng)計(jì)學(xué)推斷[學(xué)習(xí)目標(biāo)]熟悉率的抽樣誤差及總體率的估計(jì)熟悉率的u檢驗(yàn)掌握χ2檢驗(yàn)的基本思想掌握四格表資料的適用條件,掌握四格表資料的χ2檢驗(yàn)及校正方法的計(jì)算熟悉行*列表資料獨(dú)立性χ2檢驗(yàn)掌握配對(duì)資料的χ2檢驗(yàn)的計(jì)算熟悉行列表χ2檢驗(yàn)時(shí)的注意事項(xiàng)一、率的抽樣誤差和標(biāo)準(zhǔn)誤從同一個(gè)總體中隨機(jī)抽出觀察數(shù)相等的多個(gè)樣本,樣本率與總體率、各樣本率之間往往會(huì)有差異,這種差異被稱作率的抽樣誤差。率的抽樣誤差用率的標(biāo)準(zhǔn)誤表示。計(jì)算公式例11.2試估計(jì)例11.1兒童齲齒患病率95%置信區(qū)間n=368,大樣本,np=368*62.5%=230>5n(1-p)=368(1-62.5%)=138>5上限:0.625+1.96*0.0252=0.6744下限:0.625-1.96*0.0252=0.57561.樣本率與總體率的比較

u=公式第二節(jié)率的u檢驗(yàn)條件:1.n>502.np>5,且n(1-p)>51.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:π=π0H1:π≠π0α=0.05π0=0.1326一般π農(nóng)村p=0.0935例11.31.n=460>502.np=43>5,且n(1-p)=460-43>5?2.選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出結(jié)論2.47>1.96,P<α,按0.05檢驗(yàn)水準(zhǔn)拒絕H0,差異有統(tǒng)計(jì)學(xué)意義;根據(jù)目前樣本信息,尚不能認(rèn)為農(nóng)村人群和一般人群高血壓患病率相同例,一般健康成人α-地中海貧血基因攜帶率:π0=0.076,某醫(yī)生隨機(jī)抽取山區(qū)健康成人125人,測(cè)得12人有此基因,攜帶率為p=12/125=0.096問:山區(qū)人群和一般人群的攜帶率是否相同?1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:π=π0H1:π≠π0α=0.05(雙側(cè))π0=0.076一般π山區(qū)p=0.0962.確定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出結(jié)論P(yáng)>α,按0.05檢驗(yàn)水準(zhǔn)不拒絕H0,目前尚不能認(rèn)為山區(qū)人群和地中海人群α-地中海貧血基因攜帶率不同2.兩個(gè)樣本率的比較公式條件:1.n1>50,n1p1>5,且n1(1-p1)>52.n2>50,n2p2>5,且n2(1-p2)>5π1男π2女p2=5.66%例11.41.n1=62>50,n1p1=12>5,且n1(1-p1)=50>52.n2=53>50,n2p2=3<5,且n2(1-p2)=50>5p1=19.35%?1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:π1=π2H1:π1≠π2α=0.052.確定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出結(jié)論2.173>1.96,P<0.05,按α=0.05檢驗(yàn)水準(zhǔn)拒絕H0,差異有統(tǒng)計(jì)學(xué)意義;根據(jù)目前樣本信息,目前尚不能認(rèn)為男女HBV感染率相同小結(jié)率的抽樣誤差(率的標(biāo)準(zhǔn)誤)總體率的區(qū)間估計(jì)(注意:如果計(jì)算獲得的可信區(qū)間下限小于0%,上限大于100%,則將下限直接定為0%,上限直接定為100%。)

率的u檢驗(yàn)(大樣本率的u檢驗(yàn))小結(jié)1.樣本率也有抽樣誤差,率的抽樣誤差的大小用σp或Sp來衡量。2.當(dāng)n足夠大,π和1-π均不太小,有nπ≥5和n(1-π)≥5時(shí),的分布近似服從正態(tài)分布。3.總體率的可信區(qū)間是用樣本率估計(jì)總體率的可能范圍。當(dāng)p分布近似正態(tài)分布時(shí),可用正態(tài)近似法估計(jì)率的可信區(qū)間。4.根據(jù)正態(tài)近似原理,可進(jìn)行樣本率與總體率以及兩樣本率比較的u檢驗(yàn)。第三節(jié)

2檢驗(yàn)

2檢驗(yàn)(Chi-squaretest)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,英國(guó)人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計(jì)方法。用途:推斷兩個(gè)(多個(gè))總體率或構(gòu)成比之間有無差別兩個(gè)分類變量之間有無關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗(yàn)(正態(tài)性檢驗(yàn))。四格表資料的

2檢驗(yàn)在2檢驗(yàn)中,最簡(jiǎn)單的是四格表資料的

2檢驗(yàn),什么是四格表資料?凡是兩個(gè)率或構(gòu)成比資料都可以看做四格表資料。目的:推斷兩個(gè)總體率(構(gòu)成比)是否有差別。四格表資料的

2檢驗(yàn)

例11.5為了解某中草藥預(yù)防流感的效果,將410名觀察者隨機(jī)分為兩組,觀察結(jié)果如表11-1,問兩組流感發(fā)病率是否相同?表11-1兩組人群流感發(fā)病率的比較

在表11-1中,4019050130四個(gè)格子的數(shù)據(jù)是整個(gè)表最基本的數(shù)據(jù),其余數(shù)據(jù)都是從這四個(gè)基本數(shù)據(jù)推算出來的,故稱為四格表資料,四格表資料的一般形式見下表

表8-10四格表資料的一般形式

分組發(fā)生數(shù)未發(fā)生數(shù)合計(jì)甲aba+b乙cdc+d合計(jì)a+cb+dn注:此按鈕是配對(duì)鏈接過來的,和本次課內(nèi)容無關(guān)當(dāng)兩個(gè)樣本率不同時(shí),有兩種可能:1.π1=π2,P1,P2的不同是由抽樣誤差造成2.π1≠π2,P1,P2的不同是由本質(zhì)差異造成的π1服藥p1π2未服藥p2?1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:π1=π2H1:π1≠π2

α=0.052.選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量H0成立時(shí),兩組發(fā)病率相同π1=π2=ππ1=a/a+b,π2=c/c+d,π=(a+c)/na的理論頻數(shù):c的理論頻數(shù):同理兩組不發(fā)病的概率為(b+d)/n分組發(fā)生數(shù)未發(fā)生數(shù)合計(jì)甲aba+b乙cdc+d合計(jì)a+cb+dnb的理論頻數(shù):d的理論頻數(shù):式中,TRC為第R行C列的理論頻數(shù)

nR為相應(yīng)的行合計(jì)

nC為相應(yīng)的列合計(jì)綜上所述每個(gè)格子的理論頻數(shù)可由下式求得:檢驗(yàn)統(tǒng)計(jì)量2

=

(A-T)2/T

2=(40-50.490)2/50.49+(190-179.51)2/179.51+(50-39.51)2/39.51+(130-140.49)2/140.49=6.36檢驗(yàn)統(tǒng)計(jì)量

2值表示觀察值與理論值之間的偏離程度,反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度??ǚ街翟酱螅f明實(shí)際頻數(shù)與理論頻數(shù)的差別越大,兩組發(fā)病率不同的可能性越大。若檢驗(yàn)假設(shè)H0:π1=π2成立,四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,理論上可以證明

(A-T)2/T服從

2分布,計(jì)算出

2值后,查表判斷這么大的卡方是否為小概率事件,以判斷零假設(shè)是否成立。如果

2值很大,則其相對(duì)應(yīng)的P值很小,若P<α,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對(duì)立假設(shè)H1,即π1≠π2。檢驗(yàn)統(tǒng)計(jì)量2

=

(A-T)2/T

2=(40-50.490)2/50.49+(190-179.51)2/179.51+(50-39.51)2/39.51+(130-140.49)2/140.49=6.36=(2-1)*(2-1)=1檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,

=1,即在周邊合計(jì)數(shù)固定的情況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值。由公式還可以看出:

2值的大小還取決于(A-T)2/T個(gè)數(shù)的多少(嚴(yán)格地說是自由度ν的大小)。由于各(A-T)2/T皆是正值,故自由度ν愈大,

2值也會(huì)愈大;所以只有考慮了自由度ν的影響,值才能正確地反映實(shí)際頻數(shù)A和理論頻數(shù)T的吻合程度。3.確定P值,作出推斷結(jié)論

2=6.36>

20.05,1=3.84,P<α,按0.05檢驗(yàn)水準(zhǔn)拒絕H0,差異有統(tǒng)計(jì)學(xué)意義;根據(jù)現(xiàn)有資料,尚不能認(rèn)為服藥組的感染率與對(duì)照組相同。

表11.4男女HBV檢測(cè)情況表

分組感染未感染合計(jì)男125062女35053合計(jì)15100115

2檢驗(yàn)流程圖假設(shè)(兩組相同)兩組數(shù)據(jù)合并確定實(shí)際頻數(shù)A,計(jì)算理論頻數(shù)TA-T(A-T)2(A-T)2/T

2=(A-T)2/T即為

2的基本公式四格表專用公式

為了不計(jì)算理論頻數(shù)T,可由基本公式推導(dǎo)出,直接由各格子的實(shí)際頻數(shù)(a、b、c、d)計(jì)算卡方值的公式:四格表檢驗(yàn)專用公式組別陽(yáng)性陰性合計(jì)A組aba+bB組cdc+d合計(jì)a+cb+da+b+c+d組別發(fā)病人數(shù)未發(fā)病人數(shù)合計(jì)用藥組40(50.49)190(179.51)230對(duì)照組50(39.51)130(140.49)180合計(jì)90320410表11-1兩組人群流感發(fā)病率的比較

2分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計(jì)算得的

2統(tǒng)計(jì)量的抽樣分布亦呈離散性質(zhì)。為改善

2統(tǒng)計(jì)量分布的連續(xù)性,則進(jìn)行連續(xù)性校正。四格表資料檢驗(yàn)的校正公式條件:任一格的1≤T<5,且n≥40時(shí),需計(jì)算校正值?;竟?/p>

專用公式

2分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計(jì)算得的

2統(tǒng)計(jì)量的抽樣分布亦呈離散性質(zhì)。為改善

2統(tǒng)計(jì)量分布的連續(xù)性,則進(jìn)行連續(xù)性校正。

四格表資料檢驗(yàn)的校正公式四格表資料

2檢驗(yàn)公式選擇條件:

1.n≥40,T≥5,不校正的理論或?qū)S霉?公式11.7或11.10;2.n≥40,1≤T<5,校正公式,公式11.11或11.12;3.n<40或T<1,直接計(jì)算概率(fisher’s確切概率法)

2連續(xù)性校正僅用于=1的四格表資料,當(dāng)>1時(shí),一般不作校正。例11.6:表11-2穿甲乙兩種隔離服醫(yī)生某種傳染病感染率比較類別感染未感染合計(jì)感染率(%)甲1(3.76)10(7.24)119.09乙13(10.24)17(19.76)3043.33合計(jì)14274134.151.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:π1=π2H1:π1≠π2

α=0.052.選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量本例n=41>40,T最小=11*14/41=3.76<5,應(yīng)選擇校正公式專用公式基本公式

3.確定P值,作出推斷結(jié)論2.821<3.84,P>0.05,按α=0.05檢驗(yàn)水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義;根據(jù)目前樣本信息,尚不能認(rèn)為甲乙兩種隔離服感染率不同。本例若對(duì)

2值不校正,

2=4.197,得P<0.05,結(jié)論正好相反。

與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),即四格表資料和配對(duì)四格表資料。數(shù)值變量配對(duì)的三種形式,同樣適用于分類資料,只是變量的類型是分類變量而不是數(shù)值變量了配對(duì)四格表資料的

2檢驗(yàn)表11-3兩種方法檢測(cè)RF結(jié)果比較ITALAT合計(jì)+-+31(a)12(b)43-1(c)11(d)12合計(jì)322355二、配對(duì)四格表資料的

2檢驗(yàn)例11.7某醫(yī)師對(duì)55例類風(fēng)濕關(guān)節(jié)炎患者,分別采用ITA與LAT法檢測(cè)類風(fēng)濕因子,結(jié)果見表11-3,問兩種方法檢測(cè)效果有無差別?上述實(shí)驗(yàn)設(shè)計(jì)中,就同一個(gè)人的兩份血樣而言,兩種試劑檢測(cè)的結(jié)果不外乎有四種可能:a,b,c,d表配對(duì)四格表資料一般表示方法方法2合計(jì)方法1陽(yáng)性陰性陽(yáng)性aba+b陰性cdc+d合計(jì)a+cb+dn(固定值)檢驗(yàn)步驟1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)

H0:π1=π2H0:B=C(兩種方法的總體檢測(cè)結(jié)果相同)H1:BC(兩種方法的總體檢測(cè)結(jié)果不同)=0.05方法2合計(jì)方法1陽(yáng)性陰性陽(yáng)性aba+b陰性cdc+d合計(jì)a+cb+dn可見,兩種方法陽(yáng)性率的比較只和b、c有關(guān),而與a、d無關(guān),也就是說a格和d格表示兩法差值為0,我們不予考慮。2.選擇檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量若H0成立,合并格子b、c,得兩種方法檢測(cè)不一致的理論頻數(shù),都應(yīng)該是(b+c)/2,由

2檢驗(yàn)基本公式得:

化簡(jiǎn)后得:若b+c≥40,公式為:若b+c<40,需計(jì)算

2校正值:2.確定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出推斷結(jié)論根據(jù)7.69>3.84,P<0.05,按=0.05的檢驗(yàn)水準(zhǔn),拒絕H0,差異有統(tǒng)計(jì)學(xué)意義;根據(jù)現(xiàn)有資料,尚不能認(rèn)為兩種檢測(cè)結(jié)果相同。本例b+c<40,用校正公式計(jì)算得2=7.69有50份痰液標(biāo)本,每份分別接種在甲乙兩種培養(yǎng)基中,觀察結(jié)核桿菌的生長(zhǎng)情況,結(jié)果如下表,試比較兩種培養(yǎng)基的效果。兩種結(jié)核桿菌培養(yǎng)基的培養(yǎng)效果比較

乙培養(yǎng)基

甲培養(yǎng)基+

合計(jì)+23(a)12(b)35

7(c)8(d)15合計(jì)302050某醫(yī)生用兩種療法治療肺癌,出院后隨訪24個(gè)月。甲療法治療46例,乙療法治療58例,結(jié)果見下表問兩種療法治療肺癌病人的兩年生存率是否相同?甲乙兩種療法治療肺癌的2年生存率比較處理生存死亡合計(jì)生存率(%)甲療法22(25.21)24(20.79)4647.83乙療法35(31.79)23(26.21)5860.34合計(jì)574710454.81式中n為總例數(shù),A為每格子的實(shí)際頻數(shù),nR、nC分別為與某格子實(shí)際頻數(shù)(A)同行、同列的合計(jì)數(shù)。

=(R-1)(C-1)基本公式:三、行×列表的

2檢驗(yàn)行×列表(R×C表)的

2檢驗(yàn)主要用于解決多個(gè)樣本率或多個(gè)樣本構(gòu)成比的比較把理論頻數(shù)T的公式代入基本公式,化簡(jiǎn)得(8-4)專用公式:

表11-4不同季節(jié)呼吸道感染率的比較季節(jié)感染未感染合計(jì)感染率(%)春126997111.69夏126666781.77秋296656944.18冬357177524.65合計(jì)88274728353.10一、多個(gè)樣本率的比較

多個(gè)樣本率比較時(shí),有R行2列,稱為R×2表,有2行C列,稱2×C表π1春π2夏p2=1.77%例11.8p1=1.69%π3秋π4冬p3=4.18%p4=4.65%1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:四個(gè)季節(jié)呼吸道感染率相同H1:四個(gè)季節(jié)呼吸道感染率不全相同=0.052.選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量按公式(11-15)計(jì)算得:

2=17.293.確定P值,作出推斷結(jié)論根據(jù)

=3查

2

界值表,得

20.05(3)=7.81,P<0.05,按0.05的檢驗(yàn)水準(zhǔn),拒絕H0,差異有統(tǒng)計(jì)學(xué)意義,根據(jù)現(xiàn)有資料

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論