醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法--基礎(chǔ)篇課件_第1頁
醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法--基礎(chǔ)篇課件_第2頁
醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法--基礎(chǔ)篇課件_第3頁
醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法--基礎(chǔ)篇課件_第4頁
醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法--基礎(chǔ)篇課件_第5頁
已閱讀5頁,還剩191頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法——基礎(chǔ)篇醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法——基礎(chǔ)篇1相關(guān)問題一、醫(yī)學(xué)資料類型二、常見醫(yī)學(xué)實(shí)驗(yàn)設(shè)計(jì)類型三、資料的統(tǒng)計(jì)描述和結(jié)果表達(dá)四、常用統(tǒng)計(jì)推斷方法五、多因素分析方法相關(guān)問題一、醫(yī)學(xué)資料類型2一、醫(yī)學(xué)資料類型

1.定量資料(計(jì)量資料)2.定性資料(分類資料)

(1)二項(xiàng)分類(計(jì)數(shù)資料)(2)多項(xiàng)分類無序多分類有序多分類(等級(jí)資料)一、醫(yī)學(xué)資料類型

1.定量資料(計(jì)量資料)31.定量資料★定義:是對每個(gè)觀察對象的觀察指標(biāo)用定量方法測定該項(xiàng)指標(biāo)的數(shù)值大小所得的資料,一般有度量衡單位?!锱e例:

某市某年7歲男孩身高值(120.2cm,118.6cm,121.8cm…)1.定量資料★定義:是對每個(gè)觀察對象的觀察指標(biāo)用定量方法測定42.定性資料★定義:是先將觀察對象的觀察指標(biāo)按性質(zhì)或類別進(jìn)行分組,然后清點(diǎn)各組該觀察指標(biāo)的數(shù)目所得的資料。★舉例:二分類:衛(wèi)生統(tǒng)計(jì)學(xué)教研室教師性別構(gòu)成:男:3人,女:5人2.定性資料★定義:是先將觀察對象的觀察指標(biāo)按性質(zhì)或類別進(jìn)行5無序多分類:某人群血型構(gòu)成:A型:25人;B型:20人AB型:10人;O型:30人有序多分類:臨床化驗(yàn)中,將化驗(yàn)結(jié)果按-(50);+(30);++(20);+++(10);按療效可分為治愈(10);顯效(20);好轉(zhuǎn)(30);無效(15);無序多分類:6

根據(jù)分析的需要,計(jì)量資料、計(jì)數(shù)資料等級(jí)分組資料可以互相轉(zhuǎn)化。例如每個(gè)人的血紅蛋白,原屬計(jì)量資料;若按血紅蛋白正常與異常分為兩組,得出各組的人數(shù),是計(jì)數(shù)資料;若按血紅蛋白含量的多少分為五個(gè)等級(jí):<6(g%)(重度貧血)、6(g%)~(度貧血)、9(g%)~(輕度貧血)12.5(g%)~(血紅蛋白正常)、>16(g%)(血紅蛋白增高),計(jì)算各等級(jí)人數(shù),就是等級(jí)分組資料。根據(jù)分析的需要,計(jì)量資料、計(jì)數(shù)資料7二、常見醫(yī)學(xué)實(shí)驗(yàn)設(shè)計(jì)類型

1.完全隨機(jī)設(shè)計(jì)(成組設(shè)計(jì))2.配對設(shè)計(jì)3.隨機(jī)區(qū)組設(shè)計(jì)(配伍組設(shè)計(jì))4.析因設(shè)計(jì)二、常見醫(yī)學(xué)實(shí)驗(yàn)設(shè)計(jì)類型

1.完全隨機(jī)設(shè)計(jì)(成組設(shè)計(jì))81.完全隨機(jī)設(shè)計(jì)(成組設(shè)計(jì)):

將受試對象完全隨機(jī)地分配到各個(gè)處理組中或分別從不同總體中隨機(jī)抽樣進(jìn)行研究。1.完全隨機(jī)設(shè)計(jì)(成組設(shè)計(jì)):將受試對象完全隨機(jī)92.配對設(shè)計(jì)

將受試對象按某些重要特征相近的原則配成對子,每對中的兩個(gè)個(gè)體隨機(jī)地給予兩種處理,稱為隨機(jī)配對設(shè)計(jì)。(1)配對兩個(gè)受試對象A,B處理。(2)同一受試對象或同一樣本的兩個(gè)部分A,B處理。2.配對設(shè)計(jì)將受試對象按某些重要特征相近的原10(3)同一受試對象處理(實(shí)驗(yàn)或治療)前后比較,如對高血壓患者治療前后、運(yùn)動(dòng)員體育運(yùn)動(dòng)前后的某一生理指標(biāo)進(jìn)行比較,這種配對稱為自身對比(self-contrast)。有爭議:越來越多的學(xué)者認(rèn)為應(yīng)該把(3)當(dāng)做重復(fù)測量設(shè)計(jì)。(3)同一受試對象處理(實(shí)驗(yàn)或治療)前后比較,如對高血壓患者113.隨機(jī)區(qū)組設(shè)計(jì)

又稱配伍設(shè)計(jì),是配對設(shè)計(jì)的擴(kuò)展。先按影響試驗(yàn)結(jié)果的非處理因素(如性別、體重、年齡、職業(yè)、病情、病程等)將受試對象配成區(qū)組,再分別將各區(qū)組內(nèi)的受試對象隨機(jī)分配到各處理或?qū)φ战M。3.隨機(jī)區(qū)組設(shè)計(jì)又稱配伍設(shè)計(jì),是配對設(shè)計(jì)的擴(kuò)展。124.析因設(shè)計(jì)是將每個(gè)因素的所有水平都互相組合,從而對兩個(gè)或多個(gè)處理進(jìn)行評(píng)價(jià),是一種多因素的交叉分組設(shè)計(jì)。它不僅可以作每個(gè)因素各水平間的比較,而且還可以進(jìn)行交互作用的分析。通過比較還能尋求最佳組合。

4.析因設(shè)計(jì)是將每個(gè)因素的所有水平都互相組合,13總實(shí)驗(yàn)數(shù)是各因素水平數(shù)的乘積。如四因素同時(shí)進(jìn)行實(shí)驗(yàn),若每個(gè)因素取2個(gè)水平,實(shí)驗(yàn)總數(shù)為24=16;若3水平,34=81;若4水平,44=256;因此,析因設(shè)計(jì)水平不宜太多,一般取2個(gè)或3個(gè)。總實(shí)驗(yàn)數(shù)是各因素水平數(shù)的乘積。如四因素同時(shí)進(jìn)行實(shí)驗(yàn),若每個(gè)因142×2析因設(shè)計(jì)模式表12×2析因設(shè)計(jì)2×2析因設(shè)計(jì)模式15第一組:一般療法第二組:一般療法+甲藥第三組:一般療法+乙藥第四組:一般療法+甲藥+乙藥甲藥乙藥不用用不用

一組

三組用二組四組甲藥乙藥不用用16三、資料的統(tǒng)計(jì)描述和結(jié)果表達(dá)

三、資料的統(tǒng)計(jì)描述和結(jié)果表達(dá)

171.各指標(biāo)的基本情況定量資料:最小、最大值正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差、非正態(tài)分布:中位數(shù)、四分位數(shù)間距

定性資料:各類頻數(shù)各等級(jí)頻數(shù)1.各指標(biāo)的基本情況定量資料:最小、最大值18正態(tài)分布:均數(shù)()、標(biāo)準(zhǔn)差()、最小、最大值如:平均年齡:40.5歲年齡():40.53.6歲年齡:40.53.6(min~max:34~60)歲(定量資料的表達(dá)1)正態(tài)分布:均數(shù)()、標(biāo)準(zhǔn)差()、(定量資料的表達(dá)19非正態(tài)分布:中位數(shù)、四分位數(shù)間距、最小、最大值病程中位數(shù):M=3.65年病程:M(Q)=3.65(5.12)年

(min~max:2月~12年)

定量資料的表達(dá)2非正態(tài)分布:中位數(shù)、四分位數(shù)間距、定量資料的表達(dá)220例1:例1:21(圖形表達(dá)1)—線圖(圖形表達(dá)1)—線圖22(圖形表達(dá)2)—半對數(shù)線圖(圖形表達(dá)2)—半對數(shù)線圖23例2:例2:24(圖形表達(dá)3)-條圖(圖形表達(dá)3)-條圖25例3:例3:26(圖形表達(dá)4)-百分條圖(圖形表達(dá)4)-百分條圖27例4:例4:28(圖形表達(dá)5)-圓圖(圖形表達(dá)5)-圓圖29例5例530(圖形表達(dá)6)-箱式圖(圖形表達(dá)6)-箱式圖31例6例632(圖形表達(dá)7)-散點(diǎn)圖(圖形表達(dá)7)-散點(diǎn)圖33例7例734(圖形表達(dá)8)-直方圖(圖形表達(dá)8)-直方圖35四、常用統(tǒng)計(jì)推斷方法

1.參數(shù)估計(jì)2.假設(shè)檢驗(yàn)3.完全隨機(jī)設(shè)計(jì)常用假設(shè)檢驗(yàn)方法4.配對設(shè)計(jì)常用假設(shè)檢驗(yàn)方法5.配伍組設(shè)計(jì)常用假設(shè)檢驗(yàn)方法6.析因設(shè)計(jì)常用假設(shè)檢驗(yàn)方法四、常用統(tǒng)計(jì)推斷方法

1.參數(shù)估計(jì)361.數(shù)據(jù)的統(tǒng)計(jì)推斷-參數(shù)估計(jì)參數(shù)估計(jì):估計(jì)值,95%CI(可信區(qū)間)例如:三個(gè)療程后,試驗(yàn)組比對照組平均降低體重6.25kg(95%CI:4.17~8.27kg)。

1.數(shù)據(jù)的統(tǒng)計(jì)推斷-參數(shù)估計(jì)參數(shù)估計(jì):37假設(shè)檢驗(yàn):檢驗(yàn)統(tǒng)計(jì)量,P

值(確切值)例如:用藥一個(gè)療程后,試驗(yàn)組的ESS評(píng)分的增加比對照組平均提高36.5分(95%CI:18.5~54.5),經(jīng)t檢驗(yàn)兩組有統(tǒng)計(jì)學(xué)差異(t=3.26,P=0.0018)。2.數(shù)據(jù)的統(tǒng)計(jì)推斷-假設(shè)檢驗(yàn)假設(shè)檢驗(yàn):2.數(shù)據(jù)的統(tǒng)計(jì)推斷-假設(shè)檢驗(yàn)38假設(shè)檢驗(yàn)方法的選擇依據(jù):

應(yīng)根據(jù)分析目的、設(shè)計(jì)類型、資料類型、樣本含量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。假設(shè)檢驗(yàn)方法的選擇依據(jù):應(yīng)根據(jù)分析目的、設(shè)計(jì)類型、393.完全隨機(jī)設(shè)計(jì)假設(shè)檢驗(yàn)方法3.完全隨機(jī)設(shè)計(jì)假設(shè)檢驗(yàn)方法40

3-1完全隨機(jī)設(shè)計(jì)

——兩組定量資料比較:①若總體服從正態(tài)分布且總體方差齊同,采用成組t檢驗(yàn);②若總體服從正態(tài)分布且總體方差不齊同,采用成組檢驗(yàn);③若總體不服從正態(tài)分布或/和方差不齊,采用兩個(gè)獨(dú)立樣本比較的Wilcoxon秩和檢驗(yàn)3-1完全隨機(jī)設(shè)計(jì)41應(yīng)用條件驗(yàn)證正態(tài)性檢驗(yàn)兩樣本的方差的齊性檢驗(yàn)應(yīng)用條件驗(yàn)證正態(tài)性檢驗(yàn)42正態(tài)性檢驗(yàn)即檢驗(yàn)樣本是否來自正態(tài)總體。正態(tài)性檢驗(yàn)即檢驗(yàn)樣本是否來自正態(tài)總體。43按所取的α水準(zhǔn)做出判斷結(jié)論:(1)若P<,按所取的α水準(zhǔn),拒絕H0,接受H1,可認(rèn)為總體服從正態(tài)分布。(2)若P>

,按所取的α水準(zhǔn),不拒絕H0,則認(rèn)為總體不服從正態(tài)分布。按所取的α水準(zhǔn)做出判斷結(jié)論:44

兩樣本的方差的齊性檢驗(yàn)方差齊性:是指方差相等。適用條件:兩樣本均來自正態(tài)分布總體。

H0:12=22H1:12≠22=0.1

兩樣本的方差的齊性檢驗(yàn)方差齊性:是指方差相等。45按所取的α水準(zhǔn)做出判斷結(jié)論:(1)若P<,按所取的α水準(zhǔn),拒絕H0,接受H1,可認(rèn)為兩總體方差不具有齊性。(2)若P>

,按所取的α水準(zhǔn),不拒絕H0,則認(rèn)為兩總體方差具有齊性。按所取的α水準(zhǔn)做出判斷結(jié)論:46例1:成組t檢驗(yàn)例1:成組t檢驗(yàn)47醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件48醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件49即:即:50例2:成組檢驗(yàn)例2:成組檢驗(yàn)51醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件52醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件533-2完全隨機(jī)設(shè)計(jì)

——多組定量資料比較:①若正態(tài)分布且方差齊同,采用單因素方差分析(one-wayANOVA);②若非正態(tài)分布或/和方差不齊,可進(jìn)行變量變換后采用單因素方差分析或采用完全隨機(jī)設(shè)計(jì)多個(gè)樣本比較的Kruskal-WallisH檢驗(yàn)。3-2完全隨機(jī)設(shè)計(jì)54

某醫(yī)生為了研究一種降血脂新藥的臨床療效,按統(tǒng)一納入標(biāo)準(zhǔn)選擇120名高血脂患者,采用完全隨機(jī)設(shè)計(jì)方法將患者等分為4組,進(jìn)行雙盲試驗(yàn)。6周后測得低密度脂蛋白作為試驗(yàn)結(jié)果(表4-3)。問:4個(gè)處理組患者的低密度脂蛋白含量總體均數(shù)有無差別?例3:單因素方差分析某醫(yī)生為了研究一種降血脂新藥的例3:單因素55醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件56H0:μ1=μ2=μ3=μ4,即4個(gè)試驗(yàn)組的總體均數(shù)相等H1:4個(gè)試驗(yàn)組的總體均數(shù)不全相等α=0.05先進(jìn)行正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn),滿足應(yīng)用條件后,進(jìn)行方差分析先進(jìn)行正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn),滿足應(yīng)用條件后,進(jìn)行方差分57醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件58

多組比較的方差分析方差分析:(ANOVA,Fisher’sFtest)

整體比較(F值,P值)

兩兩比較:(multiplecomparison)

整體比較有差異后進(jìn)行兩兩比較(P值)Tukey,SNK,Dunncan,Dunnett,Scheffe,LSD,Bonferroni,Sidak方差分析:(ANOVA,Fisher’sFtest)593-3完全隨機(jī)設(shè)計(jì)

——兩組定性資料比較:①計(jì)數(shù)資料:采用完全隨機(jī)設(shè)計(jì)2檢驗(yàn),或Fisher確切概率法;②等級(jí)資料:多采用兩個(gè)獨(dú)立樣本比較的Wilcoxon秩和檢驗(yàn)或Ridit分析。3-3完全隨機(jī)設(shè)計(jì)60完全隨機(jī)設(shè)計(jì)四格表資料χ2檢驗(yàn)專用公式:(n≥40且所有的T≥5)

醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件61完全隨機(jī)設(shè)計(jì)四格表資料χ2檢驗(yàn)的校正公式:(n≥40且某一個(gè)理論數(shù)1≤T<5)

完全隨機(jī)設(shè)計(jì)62最小理論頻數(shù)TRC的判斷:R行與C列中,行合計(jì)數(shù)中的最小值與列合計(jì)數(shù)中的最小值所對應(yīng)格子的理論頻數(shù)最小。如本例,第2行與第2列所對應(yīng)的格子理論頻數(shù)最小(4.67)。

最小理論頻數(shù)TRC的判斷:63

某院欲比較異梨醇口服液(試驗(yàn)組)和氫氯噻嗪+地塞米松(對照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機(jī)分為兩組,結(jié)果如下表。問兩組降低顱內(nèi)壓的總體有效率有無差別?

例4:完全隨機(jī)設(shè)計(jì)2檢驗(yàn)

—專用公式(非校正公式)某院欲比較異梨醇口服液(試驗(yàn)組)例4:完全隨機(jī)64

兩組降低顱內(nèi)壓有效率的比較

兩組降低顱內(nèi)壓有效率的比較65

SPSS實(shí)現(xiàn):SPSS實(shí)現(xiàn):66醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件67醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件68醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件69例5:完全隨機(jī)設(shè)計(jì)兩組等級(jí)資料:例5:完全隨機(jī)設(shè)計(jì)兩組等級(jí)資料:70醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件71◆上表中完全隨機(jī)設(shè)計(jì)兩組等級(jí)資料比較多采用兩個(gè)獨(dú)立樣本比較的Wilcoxon秩和檢驗(yàn)或Ridit分析?!羯媳碇型耆S機(jī)設(shè)計(jì)兩組等級(jí)資料比較多采用兩個(gè)獨(dú)立樣本比較的723-4完全隨機(jī)設(shè)計(jì)

——多組定性資料比較:①計(jì)數(shù)資料:采用完全隨機(jī)設(shè)計(jì)2檢驗(yàn),或Fisher確切概率法;②等級(jí)資料:采用多個(gè)獨(dú)立樣本比較的Kruskal-WallisH檢驗(yàn)或Ridit分析。3-4完全隨機(jī)設(shè)計(jì)73例6:完全隨機(jī)設(shè)計(jì)

——行×列表資料2檢驗(yàn)多個(gè)樣本率的比較

某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見下表。問三種療法的有效率有無差別?例6:完全隨機(jī)設(shè)計(jì)

——行×列74三種療法有效率的比較三種療法有效率的比較75H0:π1=π2=π3,即三種療法治療周圍性面神經(jīng)麻痹的有效率相等H1:三種療法治療周圍性面神經(jīng)麻痹的有效率不全相等α=0.05=21.04,=2,查界值表得P<0.005。按α=0.05水準(zhǔn),拒絕H0,接受H1,可認(rèn)為三種療法治療周圍性面神經(jīng)麻痹的有效率有差別。

H0:π1=π2=π3,即三種療法治療周圍性面神經(jīng)麻痹的有76

行×列表資料χ2檢驗(yàn)簡化公式:

行×列表資料χ2檢驗(yàn)簡化公式:77行×列表χ2檢驗(yàn)時(shí)的注意事項(xiàng)1.不宜有1/5以上的理論頻數(shù)小于5或有1個(gè)格子的理論頻數(shù)小于1。解決的辦法有四種:

(1)性質(zhì)相近鄰行或鄰列合并。

(2)增加樣本量。

(3)刪去理論數(shù)太小的行或列。(4)確切概率法

行×列表χ2檢驗(yàn)時(shí)的注意事項(xiàng)782.單向有序行列表(如下頁表所示):(1)效應(yīng)在構(gòu)成比上有無差異:

χ2檢驗(yàn)。(2)效應(yīng)有無差異:秩和檢驗(yàn)或Ridit分析。2.單向有序行列表(如下頁表所示):79療效A組B組C組治愈顯效好轉(zhuǎn)無效合計(jì)療效A組B組C組治愈合計(jì)803.雙向有序且分類屬性不同行列表

(如下頁表)(1)粗略分析兩個(gè)變量有無關(guān)系(用χ2檢驗(yàn))(2)詳細(xì)分析兩個(gè)變量有無相關(guān)關(guān)系及相關(guān)方向(用Spearman等級(jí)相關(guān)分析方法)(3)詳細(xì)分析兩個(gè)變量是否存在線性變化趨勢(用有序分組資料的線性趨勢檢驗(yàn))3.雙向有序且分類屬性不同行列表81眼底動(dòng)脈硬化級(jí)別冠心病診斷結(jié)果正??梢晒谛牟?ⅠⅡⅢ合計(jì)眼底動(dòng)脈冠心病診斷結(jié)果正??梢晒谛牟?合計(jì)824.雙向有序且分類屬性相同行列表一致性檢驗(yàn)(計(jì)算Kappa值)-++++++-++++++合計(jì)-++++++-合計(jì)835.當(dāng)多個(gè)樣本率(或構(gòu)成比)比較的χ2檢驗(yàn),結(jié)論為拒絕檢驗(yàn)假設(shè),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說明它們彼此之間都有差別,或某兩者之間有差別。若想進(jìn)一步了解哪兩者的差別有統(tǒng)計(jì)學(xué)意義,可用χ2檢驗(yàn)多重比較。

5.當(dāng)多個(gè)樣本率(或構(gòu)成比)比較的χ2檢驗(yàn),結(jié)論為拒絕檢驗(yàn)假84例7:完全隨機(jī)設(shè)計(jì)多組等級(jí)資料比較

—采用多個(gè)獨(dú)立樣本比較的Kruskal-WallisH檢驗(yàn)或Ridit分析。

例7:完全隨機(jī)設(shè)計(jì)多組等級(jí)資料比較

—采用多個(gè)獨(dú)立樣本比較的85醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件864.配對設(shè)計(jì)假設(shè)檢驗(yàn)方法4.配對設(shè)計(jì)假設(shè)檢驗(yàn)方法874-1配對設(shè)計(jì)

——定量資料比較:①若差值服從正態(tài)分布,采用配對t檢驗(yàn);②若差值非正態(tài)分布,可進(jìn)行變量變換后采用配對t

檢驗(yàn)或采用配對設(shè)計(jì)Wilcoxon符號(hào)秩檢驗(yàn)4-1配對設(shè)計(jì)88例8:配對t檢驗(yàn)—同源配對例8:配對t檢驗(yàn)—同源配對89醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件90醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件91

H0:μd=0H1:μd≠00.05

醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件92其中

式中d為每對數(shù)據(jù)的差值,為差值的樣本均數(shù),Sd為差值的標(biāo)準(zhǔn)差,為差值樣本均數(shù)的標(biāo)準(zhǔn)誤,n為對子數(shù)。式中d為每對數(shù)據(jù)的差值,93例9:配對t檢驗(yàn)

–異源配對例9:配對t檢驗(yàn)–異源配對94醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件95醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件964-2配對設(shè)計(jì)

——定性資料比較:①計(jì)數(shù)資料:采用配對設(shè)計(jì)2檢驗(yàn)(McNemar’sTest)或配對設(shè)計(jì)Wilcoxon符號(hào)秩檢驗(yàn);②等級(jí)資料:配對設(shè)計(jì)Wilcoxon符號(hào)秩檢驗(yàn)4-2配對設(shè)計(jì)97

某實(shí)驗(yàn)室分別用乳膠凝集法和免疫熒光法對58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進(jìn)行測定,結(jié)果見下表。問兩種方法的檢測結(jié)果有無差別?

例10:配對設(shè)計(jì)2檢驗(yàn)?zāi)硨?shí)驗(yàn)室分別用乳膠凝集法和例10:配對設(shè)計(jì)98兩種方法的檢測結(jié)果

兩種方法的檢測結(jié)果99若兩種處理方法無差別,總體:B=C。因抽樣誤差不可避免,樣本往往b≠c,需進(jìn)行假設(shè)檢驗(yàn)

(McNemartest),檢驗(yàn)統(tǒng)計(jì)量為。若兩種處理方法無差別,總體:B=C。100計(jì)算公式

1.b+c≥40時(shí)

2.b+c<40時(shí)

計(jì)算公式101H0:總體B=CH1:總體B≠Cα=0.05b+c=12+2=14<40。=1,查界值表得P<0.05。按α=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,可以認(rèn)為兩種方法的檢測結(jié)果不同。H0:總體B=C=1,查界值表得P<01025.

隨機(jī)區(qū)組設(shè)計(jì)假設(shè)檢驗(yàn)方法5.隨機(jī)區(qū)組設(shè)計(jì)假設(shè)檢驗(yàn)方法1035.配伍組設(shè)計(jì)

——定量資料比較:①若正態(tài)分布且方差齊同,采用雙向分類的方差分析(two-wayclassificationANOVA);②若非正態(tài)分布或/和方差不齊,可進(jìn)行變量變換后采用雙向分類的方差分析或采用FriedmanM檢驗(yàn)。5.配伍組設(shè)計(jì)104例11:隨機(jī)區(qū)組設(shè)計(jì)方差分析

某研究者采用隨機(jī)區(qū)組設(shè)計(jì)進(jìn)行實(shí)驗(yàn),比較三種抗癌藥物對小白鼠肉瘤抑瘤效果,先將15只染有肉瘤小白鼠按體重大小配成5個(gè)區(qū)組,每個(gè)區(qū)組內(nèi)3只小白鼠隨機(jī)接受三種抗癌藥物,以肉瘤的重量為指標(biāo)。問三種不同藥物的抑瘤效果有無差別?

例11:隨機(jī)區(qū)組設(shè)計(jì)方差分析某研究者采用隨機(jī)區(qū)組設(shè)105醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件106醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件107

SPSS實(shí)現(xiàn):

SPSS實(shí)現(xiàn):108醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件109醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件110醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件111醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件112注意:方差分析的結(jié)果若拒絕H0,接受H1,不能說明各組總體均數(shù)間兩兩都有差別。要分析哪些兩組間有差別,應(yīng)進(jìn)行多個(gè)均數(shù)間的多重比較。注意:113區(qū)組因素應(yīng)是對試驗(yàn)結(jié)果有影響的非處理因素。區(qū)組內(nèi)各試驗(yàn)對象應(yīng)均衡,區(qū)組之間試驗(yàn)對象具有較大的差異為好,這樣利用區(qū)組控制非處理因素的影響,并在方差分析時(shí)將區(qū)組間的變異從組內(nèi)變異中分解出來。區(qū)組因素應(yīng)是對試驗(yàn)結(jié)果有影響的非處理因素。區(qū)組內(nèi)各試驗(yàn)對象應(yīng)114當(dāng)區(qū)組間差別有統(tǒng)計(jì)學(xué)意義時(shí),隨機(jī)區(qū)組設(shè)計(jì)的誤差比完全隨機(jī)設(shè)計(jì)小,試驗(yàn)效率得以提高。當(dāng)區(qū)組間差別有統(tǒng)計(jì)學(xué)意義時(shí),115例12:析因設(shè)計(jì)方差分析例12:析因設(shè)計(jì)方差分析116醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件117醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件118

SPSS實(shí)現(xiàn):SPSS實(shí)現(xiàn):119

120醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件121五、多因素分析方法1.多(元)重線性回歸2.Logistic回歸3.Cox模型五、多因素分析方法1.多(元)重線性回歸1221.多(元)重線性回歸

多重線性回歸(multiplelinearregression)用于分析一個(gè)應(yīng)變量(連續(xù)性變量)和多個(gè)自變量之間的線性關(guān)系.1.多(元)重線性回歸

多重線性回歸(multipleli123多元線性回歸分析一般步驟:(1)根據(jù)樣本數(shù)據(jù)求得模型參數(shù)的估計(jì)值(2)

對回歸方程及各自變量做假設(shè)檢驗(yàn),并對方程的擬和效果及各自變量的作用大小做出評(píng)價(jià)。多元線性回歸分析一般步驟:(2)對回歸方程及各自變量做假設(shè)124

決定系數(shù)R2

說明自變量能夠解釋Y變化的百分比。其值越接近于1,說明模型對數(shù)據(jù)的擬和效果越好.決定系數(shù)R2說明自變量能夠解釋Y變化的百分比。其值125復(fù)相關(guān)系數(shù)可以用來度量應(yīng)變量Y和多個(gè)自變量之間的線性相關(guān)程度.如果只有一個(gè)自變量時(shí),復(fù)相關(guān)系數(shù)可以用來度量應(yīng)變量Y和多個(gè)自變量之間的線性相關(guān)程126標(biāo)準(zhǔn)化回歸系數(shù)由于各變量的測量單位不同,單從各偏回歸系數(shù)的絕對值大小來分析難以得出正確的結(jié)論。數(shù)據(jù)標(biāo)準(zhǔn)化:標(biāo)準(zhǔn)化回歸系數(shù)數(shù)據(jù)標(biāo)準(zhǔn)化:127

數(shù)據(jù)標(biāo)準(zhǔn)化得到的回歸方程稱為標(biāo)準(zhǔn)化回歸方程,相應(yīng)的回歸系數(shù)即為標(biāo)準(zhǔn)化回歸系數(shù)。意義:用來比較各自變量對Y的影響強(qiáng)度,通常在有統(tǒng)計(jì)學(xué)意義前提之下,標(biāo)準(zhǔn)化回歸系數(shù)的絕對值越大說明相應(yīng)自變量對Y的作用越大。數(shù)據(jù)標(biāo)準(zhǔn)化得到的回歸方程稱為標(biāo)準(zhǔn)化回歸方程,相應(yīng)的回歸系128例5-1為了研究影響糖尿病患者糖化血紅蛋白(HbA1c)的主要危險(xiǎn)因素,研究者收集糖尿病患者的糖化血紅蛋白(Y,%)、年齡(X1,歲)、體重指數(shù)(X2,kg/m2)、總膽固醇(X3,mmol/L)、收縮壓(X4,mmHg)和舒張壓(X5,mmHg)等數(shù)據(jù)資料?,F(xiàn)從中隨機(jī)抽取了20例,數(shù)據(jù)見表5-1,試作多元線性回歸分析。例5-1為了研究影響糖尿病患者糖化血紅蛋白(HbA1129

表5-120例糖尿病患者的數(shù)據(jù)資料編號(hào)X1X2X3X4X5Y編號(hào)X1X2X3X4X5Y14932.196.0148867.6115323.437.1161867.526724.772.7151987.4124630.562.9146797.336425.247.0151807.4135925.196.0158807.346624.264.8157877.2147627.265.4124856.956830.283.5136837.3156323.936.7133897.564826.187.6137877.6167424.947.9166827.976626.365.9157917.5175222.825.3149717.384732.075.7157897.7186424.342.5126936.896428.446.1154827.3195425.442.6151836.9107530.656.9137867.7207828.987.2147747.5表5-120例糖尿病患者的數(shù)據(jù)資料編號(hào)X1X2X3130

對以上數(shù)據(jù)通過SPSS軟件計(jì)算,主要結(jié)果如下表:

變異來源SSMSFP回歸1.0790650.215817.320.0015殘差0.41294140.02950總變異1.4920019表5-2回歸方程的方差分析表

對以上數(shù)據(jù)通過SPSS軟件計(jì)算,主要結(jié)果如下表:變異來源131

表5-3

偏回歸系數(shù)估計(jì)結(jié)果自變量偏回歸系數(shù)標(biāo)準(zhǔn)誤t

P

常數(shù)項(xiàng)3.875981.011153.830.0018X1-0.001530.00409-0.370.7146X20.031920.013482.370.0328X30.108340.024514.420.0006X40.008500.003682.310.0366X50.010580.006631.600.1328回歸方程,方程有統(tǒng)計(jì)學(xué)意義。由表5-3可見,自變量X2、X3、X4

按水平有統(tǒng)計(jì)學(xué)義,X1

和X5

無統(tǒng)計(jì)學(xué)意義。表5-3偏回歸系數(shù)估計(jì)結(jié)果自變量偏回歸系數(shù)標(biāo)準(zhǔn)誤tP132例5-227名糖尿病患者的血清總膽固醇(x1)、甘油三酯(x2)、空腹胰島素(x3)、糖化血紅蛋白(x4)、空腹血糖測量值(y)見下頁表,試建立血糖與其他幾項(xiàng)指標(biāo)的多元線性回歸方程。例5-227名糖尿病患者的血清總膽固醇(x1)、甘油三酯133

SPSS實(shí)現(xiàn):SPSS實(shí)現(xiàn):134醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件135醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件136醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件137醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件138醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件139(1)應(yīng)用條件Y-連續(xù)性變量殘差服從正態(tài)分布,方差相同應(yīng)變量的觀測值相互獨(dú)立

(2)樣本含量

多元線性回歸時(shí),應(yīng)該注意樣本含量n與方程中自變量個(gè)數(shù)m的比例,經(jīng)驗(yàn)上n至少應(yīng)是m

的5~20倍。多元線性回歸

(1)應(yīng)用條件多元線性回歸140

(3)定性變量的數(shù)量化二分類定性變量處理方法可以用0或1表示,如(3)定性變量的數(shù)量化141

多分類定性變量處理方法:如果有k

類,則可用k-1個(gè)取值為0或1的啞變量來賦值表達(dá)。如常見血型分為4類,A型(100)B型(010)AB型(001)O型(000)

142

有序變量處理方法:可以按“1、2、3、…”的賦值方法直接引入回歸模型。如果樣本量較大,也可化作啞變量引入回歸模型。

有序變量處理方法:可以按“1、2、3、…”的賦值方法直接引143

(4)多重共線性當(dāng)自變量間存在較強(qiáng)的線性關(guān)系時(shí),會(huì)使多元回歸方程中的參數(shù)估計(jì)不準(zhǔn)確,影響多元線性回歸分析的結(jié)果。(5)關(guān)于變量篩選在自變量較多的情況下,使用逐步回歸分析常能使問題得到簡化,但不要盲目信任逐步回歸得到的結(jié)果,最好結(jié)合所要研究的問題和專業(yè)知識(shí)確定應(yīng)選擇的變量。

(4)多重共線性144OR及95%CI

并說明誰與誰比較!2.影響療效的多因素分析——logistic回歸2.影響療效的多因素分析——logistic回歸145Logistic回歸模型

設(shè)因變量Y是一個(gè)二值變量,取值為:

Y=1出現(xiàn)陽性結(jié)果(發(fā)病、死亡等)

0出現(xiàn)陰性結(jié)果(未發(fā)病、存活等)Logistic回歸模型1出現(xiàn)陽性結(jié)果146記在這m個(gè)自變量作用下陽性結(jié)果發(fā)生的概率為

P=P(Y=1|X1,X2,X3,...,Xm),logistic回歸模型可表示為

常數(shù)項(xiàng)或截距,為回歸系數(shù)。Logisticregressionanalysis

記在這m個(gè)自變量作用下陽性結(jié)果發(fā)生的概率為常數(shù)項(xiàng)或截距,為回147logistic回歸模型還可以表示成如下線性形式等號(hào)左端為陽性結(jié)果與陰性結(jié)果發(fā)生概率之比的自然對數(shù),稱為P

的logit變換,記為logit(P),即logistic回歸模型還可以表示成如下線性形式148醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件149

對于發(fā)病率較低的慢性疾病如心腦血管疾病、惡性腫瘤等,由于P很小,優(yōu)勢比可以作為相對危險(xiǎn)度(RR)的近似估計(jì),即對于發(fā)病率較低的慢性疾病如心腦血管疾病、惡性腫瘤等,150例5-3

研究吸煙(X1)、飲酒(X2)與食道癌(Y)關(guān)系的病例-對照資料,試作logistic回歸分析。表13-2

吸煙與食道癌關(guān)系的病例-對照調(diào)查資料吸煙X1飲酒X2疾病狀態(tài)Y觀察例數(shù)n00163011631014411126500013601010710057110151例5-3研究吸煙(X1)、飲酒(X2)與食道癌(Y)關(guān)系151各變量賦值情況如下:各變量賦值情況如下:152

用SPSS統(tǒng)計(jì)軟件logistic回歸過程可得到如下主要結(jié)果因素

回歸系數(shù)標(biāo)準(zhǔn)誤Waldχ2P值OR值OR值95%可信區(qū)間XbSb下限上限常數(shù)項(xiàng)-0.9100.13644.8700.0000.403吸煙0.8860.15034.8620.0002.4241.8073.253飲酒0.5260.15711.2070.0011.6921.2442.303用SPSS統(tǒng)計(jì)軟件logistic回歸過程可得到如下主要結(jié)153例5-4

26例冠心病病人和28例對照者進(jìn)行病例對照研究

例5-4

26例冠心病病人和28例對照者進(jìn)154例5-4數(shù)據(jù)錄入例5-4數(shù)據(jù)錄入155醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)分析方法-——基礎(chǔ)篇課件156(1)logistic回歸分析的應(yīng)用

logistic回歸分析可以用于流行病學(xué)、臨床試驗(yàn)數(shù)據(jù)分析、藥物或毒物的劑量反應(yīng)和預(yù)測與判別等多個(gè)方面。

logistic回歸應(yīng)用及注意事項(xiàng)

(1)logistic回歸分析的應(yīng)用logistic回157

(2)自變量的取值二分類變量:可以使用0或1編碼無序多分類變量:需要轉(zhuǎn)化為啞變量連續(xù)變量:有三種處理方法(1)直接使用原始觀測值(2)將連續(xù)變量按取值區(qū)間分成若干等級(jí)組,按給分,然后按連續(xù)變量進(jìn)行處理。(3)將連續(xù)變量按不同區(qū)間分成g個(gè)組后,化作g-1個(gè)啞變量處理。(2)自變量的取值158年齡變量離散化處理的賦值方法年齡(歲)X等級(jí)變量G啞變量X1X2X3<40100040~210050~301060~4001年齡變量離散化處理的賦值方法年齡(歲)等級(jí)變量啞變量X1X2159

(3)樣本含量logistic回歸的所有統(tǒng)計(jì)推斷都是建立在大樣本基礎(chǔ)上的,因此其應(yīng)用的一個(gè)基本條件是要求有足夠的樣本含量,實(shí)際中病例和對照的人數(shù)應(yīng)至少各有30~50例,方程中的變量個(gè)數(shù)愈多需要的例數(shù)也就愈大。對于配對資料,一般樣本的匹配組數(shù)應(yīng)為納入方程中的自變量個(gè)數(shù)的20倍以上。(3)樣本含量1603.反應(yīng)療效快慢的多因素分析——

生存分析

生存率或生存曲線

RR及

95%CI

并說明誰與誰比較!3.反應(yīng)療效快慢的多因素分析——生存率或生存曲線161

生存分析(Survivalanalysis)是將研究對象的隨訪結(jié)局和隨訪時(shí)間兩個(gè)因素同時(shí)結(jié)合起來考慮的一種統(tǒng)計(jì)分析方法。(是臨床試驗(yàn)和隊(duì)列研究的一種重要分析手段)

162隨訪資料數(shù)據(jù)特點(diǎn):(1)應(yīng)變量有兩個(gè):

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論