第十六章 分類變量資料的統(tǒng)計分析_第1頁
第十六章 分類變量資料的統(tǒng)計分析_第2頁
第十六章 分類變量資料的統(tǒng)計分析_第3頁
第十六章 分類變量資料的統(tǒng)計分析_第4頁
第十六章 分類變量資料的統(tǒng)計分析_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學統(tǒng)計學歡迎學習

醫(yī)學統(tǒng)計學

第十六章分類變量的統(tǒng)計分析

主講:黃志碧

第一節(jié)常用的相對數(shù)

對分類變量進行統(tǒng)計描述常采用相對數(shù)。

收集到的分類資料,首先表現(xiàn)為絕對數(shù)。絕對數(shù)說明事物發(fā)生的實際水平,是進行統(tǒng)計分析的基礎(chǔ),但不便于事物進行深入地分析比較。

腫瘤科:住院人數(shù)100人,死亡20人。外科:住院人數(shù)400人,死亡25人。外科死亡危險性比腫瘤科更大?例16-1:腫瘤科:病人數(shù):100人病死人數(shù):20人病死率:20.0%(20/10)。外科:病人數(shù):400人病死人數(shù):25人病死率:6.25%(25/400)

。腫瘤科病死危險性比外科更大!相對數(shù):是兩個有聯(lián)系指標之比,說明事物發(fā)生的相對水平,便于對分類資料進行分析和比較。

常用相對數(shù):率、構(gòu)成比、相對比率(Rate)又稱頻率指標,是指在一定時間內(nèi)發(fā)生某現(xiàn)象的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比。它說明某現(xiàn)象發(fā)生的頻率或強度。

一、率

K為比例基數(shù),可以是百分率(%)、千分率(‰)、萬分率(1/萬)或十萬分率(1/10萬),可根據(jù)習慣或使計算出的率保持一、二位整數(shù)。

人口出生率、死亡率、自然增長率、嬰兒死亡率等采用千分率;腫瘤的死亡率采用十萬分率。習慣用法:

計算率時,注意分母和時間。只有可能發(fā)生某事件的觀察單位才能做分母。時間一般以年為間期,也有月、周等。注意例如:麻疹發(fā)病率=——————————×1000‰某年新發(fā)麻疹病例數(shù)同年麻疹易感兒總數(shù)不應(yīng)該是兒童總數(shù)腫瘤科:病人數(shù):100人病死人數(shù):20人病死率:20.0%(20/10)。外科:病人數(shù):400人病死人數(shù):25人病死率:6.25%(25/400)

。腫瘤科病死危險性比外科更大!構(gòu)成比(Proportion)又稱構(gòu)成指標,說明一事物內(nèi)部各個組成部分所占的比重或分布,常以百分數(shù)表示,又稱百分比。

二、構(gòu)成比構(gòu)成比兩個特點:1)一組構(gòu)成比之和等于100%或1(有助于區(qū)分率和構(gòu)成比);2)某部分構(gòu)成增加或減少,則其它部分構(gòu)成就相應(yīng)減少或增加。

某醫(yī)院2010年與2012年各科病床情況科別2010年2012年病床數(shù)構(gòu)成比病床數(shù)構(gòu)成比內(nèi)科20050.030060.0

外科10025.010020.0

兒科10025.010020.0

合計400100.0500100.0

三、

相對比(Ratio)相對比是A、B兩個有關(guān)指標之比,說明A是B的多少倍或百分之幾。

A與B的性質(zhì)可以相同,也可以不同??梢允墙^對數(shù)也可以是相對數(shù)或平均數(shù)。

CV、性比例、醫(yī)護比、醫(yī)技比、師生比、人口密度(人數(shù)/平方公里)、體重指數(shù)、嬰兒性比例:242/230×100=105.2

例16-3甲乙兩地肺癌死亡率分別為:

23.1/10萬、12.33/10萬,則兩地肺癌死亡率的相對比為23.1/12.33=1.87,

即甲地肺癌死亡率是乙地的1.87倍,RR=1.87。第二節(jié)應(yīng)用相對數(shù)的注意事項

1、計算相對數(shù)的分母不宜過小分母過小則計算所得的相對數(shù)不穩(wěn)定,不可靠,誤解。注意:臨床資料計算率至少有30例2、構(gòu)成比不能代替率(分析時不能以比代率)

在實際應(yīng)用中經(jīng)常出現(xiàn)以構(gòu)成比代替率進行分析的錯誤。有下表資料年齡(歲)0~10~20~30~40~50~60~70~合計沙眼人數(shù)47198330198128803881027%4.619.332.119.312.43.77.80.8100.0

某文章作者根據(jù)上述資料認為,沙眼在20~組的患病率最高,以后隨年齡增大而減少。犯了以比代率的錯誤3、正確計算合計率對觀察單位數(shù)不等的幾個率,不能直接相加求平均率正確的方法:總的發(fā)生數(shù)除以總的觀察單位數(shù)。

某醫(yī)院各科的病死率科別患者數(shù)死亡數(shù)病死率(%)外科150018012.0

內(nèi)科500204.0

傳染科400246.0

合計24002247.3

(12.0+4.0+6.0)/3×100%=7.3%平均率=224/2400×100%=9.3%

決定率(或構(gòu)成比)的因素很多,除所研究的因素外,尚有許多重要的影響因素;兩個或兩個以上的率(構(gòu)成比)相比較時,其他重要的影響因素要相同或相近(即所謂的具有可比性),否則就不能直接對率進行比較。一般的,兩個地方的出生率、死亡率、發(fā)病率,不同級別醫(yī)院某病的治愈率等不能直接比較。

4、注意資料的可比性

率(或構(gòu)成比)的比較是否具有可比性,通常注意以下兩個方面:(1)觀察對象同質(zhì),研究方法相同,觀察時間相等,以及研究對象所處的地區(qū)、民族、職業(yè)、生活條件和習慣要一致;(2)影響率的其它因素在各對比組的內(nèi)部構(gòu)成是否相同。

兩醫(yī)院乳腺癌手術(shù)后的5年生存率(%)腋下淋巴省醫(yī)院市醫(yī)院結(jié)轉(zhuǎn)移病例數(shù)構(gòu)成生存數(shù)生存率病例數(shù)構(gòu)成生存數(shù)生存率

無45

6.0

35

77.7730078.321571.67

有71094.0450

63.388321.74250.60

合計755100.048564.24383100.025767.10

不能直接比較兩院總的生存率(應(yīng)標化后再比)甲乙兩院乳腺癌病人有無淋巴結(jié)轉(zhuǎn)移構(gòu)成比較

醫(yī)院有轉(zhuǎn)移無轉(zhuǎn)移甲醫(yī)院710/755=0.94045/755=0.060乙醫(yī)院83/383=0.2167300/383=0.7833

5、率或構(gòu)成比的比較要做假設(shè)檢驗。即兩組或多組樣本率的比較,要作假設(shè)檢驗再下結(jié)論。

第三節(jié)率的標準化法

甲乙兩醫(yī)院乳腺癌手術(shù)后的5年生存率(%)甲醫(yī)院乙醫(yī)院

病例數(shù)生存數(shù)生存率病例數(shù)生存數(shù)生存率

75548564.24383257

67.10

不直接比較兩院的5年生存率,沒有可比性。

兩醫(yī)院乳腺癌手術(shù)后的5年生存率(%)腋下淋巴省醫(yī)院市醫(yī)院結(jié)轉(zhuǎn)移病例數(shù)構(gòu)成生存數(shù)生存率病例數(shù)構(gòu)成生存數(shù)生存率

無45

6.0

35

77.7730078.321571.67

有71094.0450

63.388321.74250.60

合計755100.048564.24383100.025767.10

不能直接比較兩院總的生存率,應(yīng)標化后再比一、標準化法的意義和基本思想率的標準化:是指在比較兩個或多個總率時,采用一個共同的內(nèi)部構(gòu)成標準,將兩個或多個樣本不同的內(nèi)部構(gòu)成調(diào)整為相同的內(nèi)部構(gòu)成,以消除因內(nèi)部構(gòu)成不同對總率產(chǎn)生的影響,使算得的標準化率具有可比性。采用標準化方法計算得到的率簡稱標化率,又調(diào)整率。

基本思想:采用統(tǒng)一的標準內(nèi)部構(gòu)成(年齡、性別),在相同的內(nèi)部構(gòu)成條件下,計算預期的發(fā)生率(死亡率);

目的:消除因內(nèi)部構(gòu)成不同對總率產(chǎn)生的影響,使標化率具有可比性。

二、標化率的計算

標化率的計算,常用的有直接法和間接法。

(一)直接法計算標化率

當已知被標化組內(nèi)部各小組的率時(即pi),采用直接法。為標準組的人口數(shù)P’代表標準化率,Ni為標準組各個年齡人口數(shù),N為標準組總?cè)丝跀?shù);pi為被標化組各年齡組的發(fā)生率?!芅ipi為預期發(fā)生數(shù);Ni/N為標準組年齡構(gòu)成。注意:不能用N×p求出預期發(fā)生數(shù)。

標準化率的計算步驟1、選擇直接法或間接法2、選擇標準3、計算標化率直接法計算標準化率標準人口選擇方法:(1)擇有代表性的、較穩(wěn)定的、數(shù)量較大的人群,如全世界的、全國的、全省的、本地區(qū)的歷年人口數(shù);(2)選擇相互比較的人群合并做標準;(3)選擇相互比較的人群某一組做標準。

相互比較時,標準要相同。例如,國際間的比較要采用世界通用的標準。已知內(nèi)部各分率,可用直接法

甲乙兩醫(yī)院乳腺癌手術(shù)后的5年生存率(%)腋下淋巴甲醫(yī)院乙醫(yī)院

結(jié)轉(zhuǎn)移病例數(shù)生存數(shù)生存率病例數(shù)生存數(shù)生存率無4535

77.77

300215

71.67

有710450

63.38

8342

50.60

合計75548564.24383257

67.10兩組合并為標準

甲乙兩醫(yī)院乳腺癌手術(shù)后的5年生存率(%)淋巴甲醫(yī)院乙醫(yī)院

結(jié)轉(zhuǎn)移標準人數(shù)原生存率預期生存數(shù)原生存率預期生存數(shù)無345

77.77

268.3

71.67247.26

有793

63.38

502.6

50.60

401.3

合計113864.24770.9

67.10

648.6甲醫(yī)院標化率=——————×100%預期生存總數(shù)標準病人總數(shù)=———×100%770.91138=67.74%乙醫(yī)院標化率=———×100%=56.99%1138648.6甲院標化治愈率=——————×1000‰預期治愈人數(shù)標準人數(shù)=———×100%41305000=82.6%乙院標化治愈率=———×100%=80.0%50004000

(二)、間接法若已知每家醫(yī)院總的治愈人數(shù)及各科的病人數(shù),但不知道各科的治愈率,則采用間接法計算標準化率。

間接法計算標化率方法P為標準組總死亡率(發(fā)生率),Pi為標準組各科的治愈率,r為實際治愈人數(shù)。若Pi為死亡率時,r/ΣniPi為被標化組實際死亡數(shù)與預期死亡數(shù)之比,稱為標準化死亡比,用SMR表示。

若SMR>1,說明被標化組人群死亡率高于標準組;若SMR<1,說明被標化組人群死亡率低于標準組。間接法標化率僅用于被標化人群與標準組比較,兩個間接法標準化率不能直接比較(沒對年齡進行調(diào)整)。

甲醫(yī)院實際治愈人數(shù):1920例;1920/1845=1.04乙醫(yī)院實際治愈人數(shù):2140例;2140/2155=0.993三、應(yīng)用標準化率注意事項1、應(yīng)用直接法計算標準化率時,由于所選定的標準人口不同,算得的標準化率也不同,因此,比較幾個標準化率時,應(yīng)采用同一標準人口;2、當各年齡組的率出現(xiàn)明顯交叉時,宜直接比較各年齡組的發(fā)生率,而不宜用標準化法

甲乙兩廠某工種某病患病率工齡甲廠乙廠

(年)工人數(shù)患者數(shù)患病率(%)工人數(shù)患者數(shù)患病率(%)

<3400123.0

1001

1.0

≥31001010.0

40072

18.0

合計500224.4

5007314.6

<3≥3(工齡)2015105交叉3、兩樣本標準化率的比較應(yīng)作假設(shè)檢驗;4、采用間接法計算所得的標準化率僅能與所選標準比較,兩個間接法標準化率不能互相比較。

5、標化后的標準化率不反映實際水平,只是用于比較的相對水平。第四節(jié)率的抽樣誤差和總體率的估計總體樣本統(tǒng)計推斷抽樣抽樣誤差一、率的抽樣誤差和標準誤

1、率的抽樣誤差

在率的抽樣研究中,由于總體中存在個體變異,所以由抽樣得到的樣本率(P)與總體率()之間存在差異,這種差異稱抽樣誤差。

在抽樣研究中,抽樣誤差是不可避免的,但可以用統(tǒng)計方法計算或估計其大小??傮w均數(shù)=標準差=……2、率的標準誤及其意義:樣本率的標準差稱為率的標準誤,反映樣本率的離散程度,說明率的抽樣誤差大小。標準誤愈大,抽樣誤差愈大;反之,標準誤愈小,抽樣誤差愈小。

率的標準誤計算公式:

........理論值

........估計值

3、樣本率分布形態(tài)(1)當總體率π=0.5時,樣本率p呈正態(tài)分布;(2)當總體率π≠0.5時,樣本率p呈偏態(tài)分布;但只要π不接近0和1,隨著n的增大,p逐漸逼近正態(tài)分布;n=30時,p近似正態(tài)分布。當nπ或np≥5和n(1-π)或n(1-p)≥5時,可以按正態(tài)分布的原理來處理兩項分類資料。例16.5

某醫(yī)院欲了解某種新藥對慢性乙型肝炎的療效,對100名患者進行療效試驗,結(jié)果90名患者有效,試估計該研究率的標準誤。n=100,x=90P=90/100=0.9該研究率的標準誤是3.0%。4、率的標準誤的應(yīng)用(1)表示率的抽樣誤差的大小,說明樣本率的代表性、可靠性。(2)用于總體率的區(qū)間估計;(3)用于率的假設(shè)檢驗(u檢驗)。

二、總體率的估計

估計方法:點值估計、區(qū)間估計點值估計:用樣本率直接估計總體率;區(qū)間估計:按一定的可信度(1-α)估計總體率所在的范圍??傮w率區(qū)間估計有下述兩種方法。(一)正態(tài)近似法

當p不接近0和1時,而n足夠大(n>100),np和n(1-p)均大于5時,按下列方法估計。

95%可信區(qū)間:P±1.96Sp99%可信區(qū)間:P±2.58Sp例16.5

估計該新藥總體有效率95%可信區(qū)間。

n=100,x=90P=90/100=0.9,Sp=0.030.9±1.96×0.03=0.8412~0.9588該藥總體有效率95%可信區(qū)間是:84.12%~95.88%

P±1.96Sp(二)查表法

當n較?。╪<50),特別是P接近0或1時,按二項分布原理估計總體率的可信區(qū)間,由于計算較復雜,可以根據(jù)n和x查附表16-1。例16-6

某社區(qū)抽取40歲以上居民30人進行高血壓檢查,結(jié)果高血壓患者10名,試估計該社區(qū)40歲以上居民高血壓總體患病率95%可信區(qū)間。按n=30,X=10查附表16-1得:17%~53%。如果,用n,(n-x)查表,用100減所得結(jié)果即可。

如n=30,X=23,則按n=30,X=30-23=7查附表16-6,得10%~42%,用100減得:58%~90%。

第五節(jié)率的u檢驗

根據(jù)正態(tài)近似的原理對率進行檢驗。條件是樣本含量n足夠大,P不太大或太小,np和n(1-p)均大于5.(一)樣本率與總體率比較的u檢驗

1、目的:推斷樣本率p所代表的未知的總體率π與已知的總體率π0是否有差異。

2、方法(用正態(tài)近似法u檢驗)應(yīng)用條件:p不能太大(接近1)或太?。ń咏?),且n足夠大(n>100)。例16-7

已知π0=15.0%=0.15,n=150,X=30,P=30/150=0.2

H0:π=π0

,流浪者乙肝陽性率與一般人相同H1:π>π0,流浪者乙肝陽性率高于一般人α=0.05

單側(cè)u0.05=1.645u>u0.05;P<0.05按α=0.05,拒絕H0,接受H1,差別有統(tǒng)計學意義,可以認為流浪者乙肝陽性率高于一般人。二、兩樣本率比較的u檢驗

目的:推斷兩樣本率P1和P2所代表的兩總體率有無差異。

方法:例16-8n1=1281,X1=386,P1=30.13%n2=387,X2=65,P2=16.80%u0.01=2.58u>u0.01=2.58,P<0.01.因為P<0.01,所以按檢驗水準,拒絕H0,接收H1,兩樣本率的差異有統(tǒng)計學意義,工人高血壓患病率高于農(nóng)民。

第六節(jié)X2

檢驗

(卡方檢驗)X2檢驗學習要點●X2檢驗的基本思想●兩個樣本率的比較●配對設(shè)計兩樣本率比較●多個樣本率比較●樣本構(gòu)成比的比較●兩個分類變量間的相關(guān)分析X2檢驗用途1、推斷兩個或兩個以上的總體率或總體構(gòu)成比之間有無差別;2、推斷兩種屬性或兩個變量之間有無關(guān)聯(lián)性;3、頻數(shù)分布的擬合優(yōu)度檢驗。

X2檢驗是用途廣泛的假設(shè)檢驗方法,用途有:

X2檢驗類型

1、四格表資料X2檢驗;

2、配對計數(shù)資料X2檢驗;

3、行×列(R×C)表資料X2檢驗;

4、行×列(R×C)列聯(lián)表X2檢驗。

四格表資料X2檢驗用途:

推斷兩個總體率有無差異。

表16-6AB兩種藥物治療老年性抑郁癥療效比較藥物有效無效合計有效率%A藥19(17.0)11(13.0)3063.33B藥15(17.0)15(13.0)3050.00

合計34266056.67注:括號內(nèi)為理論頻數(shù)例16.9AB兩種藥物治療老年性憂郁癥的療效比較。為何稱為四格表?指哪四格?abcd

有效無效A藥B藥有兩行兩列有4個基本數(shù)據(jù)(a、b、c、d)的表格,稱為四格表。以下資料的a、b、c、d是?組別治療人數(shù)有效人數(shù)有效率(%)治療組20016080.00對照組19014877.89合計39030878.972001601901481604014842(一)、X2

檢驗基本思想

值的計算方法(通用公式):

式中A為實際數(shù),T為理論數(shù),根據(jù)H0的假設(shè)推算出來。

為R行C列的理論數(shù);nR為T所在行合計數(shù);nC為T所在列合計數(shù)。

T值的計算:假設(shè):

則總的有效率34/60×100%=56.67%總的無效率26/60×100%=43.33%

A藥理論有效人數(shù):T11=30×56.67%(30×34/60)=17B藥理論有效人數(shù):T21=30×56.67%(30×34/60)=17

A藥理論無效人數(shù):T12=30×43.33%(30×26/60)=13B藥理論無效人數(shù):T22=30×43.33%(30×26/60)=13

注意:四格表資料求出一個格子的理論數(shù)后,可以用減法推算其他格子的理論數(shù):

T11=17,T12=30-T11=30-17=13T21=34-T11=34-17=17T22=30-T21=30-17=13或

T22=26-T12=26-13=13

從X2值計算公式可以看出,X2檢驗是檢驗實際分布和理論分布的吻合程度。若H0假設(shè)成立,則實際分布(A)和理論分布(T)相差不大,X2值應(yīng)較??;若H0假設(shè)不成立,則實際分布(A)和理論分布(T)相差較大,X2值應(yīng)較大。另外X2值的大小尚與格子數(shù)(自由度)有關(guān),格子數(shù)越多,X2值越大??梢愿鶕?jù)X2分布原理,由X2值確定P值,從而作出推論。

V=(行數(shù)-1)(列數(shù)-1)

X2

檢驗過程

1、建立假設(shè)

H0:π1=π2(AB兩藥有效率相等)H1:π1≠π2(AB兩藥有效率不等)

α=0.05

2、計算X2值(用基本公式計算)

3、查X2界值表(附表16-3)確定P值

按V=1,X2界值表得:

(X20.05,1=3.84,X20.01,1=6.63)X20.25,1=1.32,X20.5,1=0.45X20.25,1>X2>X20.5,1,0.5>P>0.254、推斷結(jié)論

0.5>P>0.25,按α=0.05,不拒絕H0,差異無統(tǒng)計學意義,尚不能認為AB兩種藥物的有效率不同。(二)四格表資料X2檢驗專用公式式中:a、b、c、d為四個實際數(shù),其中a、c為陽性數(shù),b、d為陰性數(shù),n為總例數(shù)。

為省去計算理論數(shù)的麻煩,可用以下公式計算。

(2)用專用公式計算

a=19、b=11、c=15、d=15、n=60(三)四格表資料X2檢驗的校正

1、四格表資料檢驗條件:

(1)當n≥40且所有T≥5,用普通X2檢驗,(2)當n≥40,但1≤T<5時,用校正的X2檢驗;(3)當n<40或T<1時,用四格表確切概率法。(4)若P≈α,或有實際數(shù)為0,改用四格表確切概率法(直接計算概率法);

2、校正公式:

(1)基本公式:

(2)專用公式:

表16-8兩種療法對腦膠質(zhì)瘤療效的比較━━━━━━━━━━━━━━━━━━━━━━━

療法腦功能損傷無腦功能損傷合計損傷率(%)

───────────────────────

手術(shù)22(18.88)6(9.12)2878.57

放療7(10.12)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論