衛(wèi)生統(tǒng)計學(xué)(第五版)第九章方差分析_第1頁
衛(wèi)生統(tǒng)計學(xué)(第五版)第九章方差分析_第2頁
衛(wèi)生統(tǒng)計學(xué)(第五版)第九章方差分析_第3頁
衛(wèi)生統(tǒng)計學(xué)(第五版)第九章方差分析_第4頁
衛(wèi)生統(tǒng)計學(xué)(第五版)第九章方差分析_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章

方差分析(

analysis

of

variation—ANOVA

)要求:理解ANOVA基本思想熟練掌握成組設(shè)計ANOVA的適用條件和計算過程了解配伍設(shè)計、析因設(shè)計、重復(fù)測量資料的ANOVA了解ANOVA的SAS程序和SPSS上機(jī)操作過程引例例9-1

某醫(yī)生研究一種降糖新藥,按完全隨機(jī)設(shè)計將患者分為三組進(jìn)行雙盲試驗。結(jié)果如下,試問三組病人的降糖水平是否一致?高劑量組低劑量組對照組合計5.6-0.612.49.55.70.9Xij

6.012.87.0………9.23.16.0ni

21192060均數(shù)

9.19525.80005.43006.8650方差

17.360518.186712.384318.4176表9-1

三組病人血糖下降值方差分析方差分析

analysis

of

variance

)

,

簡稱ANOVA

,由英國統(tǒng)計學(xué)家R.A.Fisher首先提出??紤]到樣本均數(shù)間的差異,可能由于兩種原因所致,首先可能由于隨機(jī)誤差所致,隨機(jī)誤差中包括兩種成分:個體間的變異和

測量誤差兩部分;其次可能是由于各組所接受的處理不同,引起不同的作

用和效果,導(dǎo)致各處理組之間均數(shù)不同。一般來講,各個體之間各不相同,是繁雜的生物界的特點(diǎn);測量誤差是不可避免的,因此第一種原因肯定存

在。而第二種原因是否存在,這正是假設(shè)檢驗要回答的問題。多組資料均數(shù)比較不宜用兩樣本t檢驗進(jìn)行兩兩比較,否則會增大犯第一類錯誤的概率。計算機(jī)模擬兩兩比較的第一類錯誤表9-2

從已知總體N(10,52)隨機(jī)抽取10個樣本(ni=20)的結(jié)果樣本號1234567891012.6110.859.239.1110.909.249.5510.289.128.75S4.295.443.936.554.834.863.883.895.384.08比較組1與31與61與71與91與10t2.6012.3292.3722.2722.918P0.0130.0250.0230.0290.006實際上犯第一類錯誤的概率為5/45≈0.11>0.05。理論上,45次同時不犯第一類錯誤的概率為(1﹣0.05)45

=0.09944,而犯第一類錯誤的概率為1﹣

(1﹣0.05)45

=0.90055t檢驗兩兩比較的精確性和檢驗的靈敏性低對同一試驗的多個處理進(jìn)行比較時,應(yīng)該有一個統(tǒng)一的試驗誤差的估計值。若用t檢驗法作兩兩比較,由于每次比較需計算一個

,故使得各

次比較誤差的估計不統(tǒng)一,同時沒有充分利用資料所提供的信息而使誤差估計的精確性降低,從而降低檢驗(推斷正確)的靈敏性。如上例試驗有10個處理(因素),每個處理重復(fù)20次,共有200個觀測值。進(jìn)行t檢驗時,每次只能利用兩個處理共40個觀測值估計試驗誤差,誤差自由度為2(20-1)=38;若利用整個試驗的200個觀測值估計試驗誤差,顯然估計的精確性高,且誤

差自由度為10(20-1)=190??梢?,在用t檢法進(jìn)行檢驗時,由于估計誤差的精確性低,誤差自由度小,使檢驗的靈敏性降低。方差分析應(yīng)用條件(詳見第六節(jié))各樣本須是相互獨(dú)立的隨機(jī)樣本各樣本均來自正態(tài)總體相互比較的各樣本所來自的總體方差相等(方差齊性)方差分析應(yīng)用范圍多個樣本均數(shù)(含兩個)間的比較分析兩個或多個因素間的交互作用回歸方程的假設(shè)檢驗方差齊性檢驗方差分析實驗(調(diào)查)設(shè)計類型完全隨機(jī)設(shè)計資料的ANOVA配伍組設(shè)計資料的ANOVA交叉設(shè)計資料的ANOVA拉丁方設(shè)計資料的ANOVA(三因素試驗設(shè)計)析因試驗設(shè)計資料的ANOVA(完全交叉分組設(shè)計)正交試驗設(shè)計資料的ANOVA裂區(qū)試驗設(shè)計資料的ANOVA(多個配伍組與拉丁方試驗組合)可重復(fù)測量資料的ANOVA第一節(jié)完全隨機(jī)設(shè)計資料的ANOVA總變異=

本質(zhì)上的差別

+(組間差異)抽樣誤差(組內(nèi)差異)由于ANOVA是根據(jù)試驗設(shè)計將總變異分成若干部分,因此設(shè)計時考慮的因素越多,變異劃分的越精細(xì),各部分變異的涵義越清晰明確,結(jié)論的解釋也越容易。同時由于變異劃分精細(xì),誤差部分減小,提高了檢驗的靈敏度和結(jié)論的準(zhǔn)確性。方差分析的基本思想是:按造成數(shù)據(jù)變異的來源分解離均差平方和與自由度,然后借助F分布作統(tǒng)計推斷。一、方差分析的基本思想方差分析的基本思想是將所有觀察值之間的變異(稱為總變異)按設(shè)計和需要分解成幾部分。如:完全隨機(jī)設(shè)計資料的ANOVA,將總變異分解為組間變異和組內(nèi)變異兩部分,后者稱為誤差:二、 方差分析資料形式處理組測量值統(tǒng)計量1水平x11x12…

x1j……n1S12水平x21x22…

x2j……n2S2…………

………………k水平xk1xk2…

xkj……nkSkk個處理組的試驗結(jié)果三、完全隨機(jī)設(shè)計及假設(shè)完全隨機(jī)設(shè)計也稱成組設(shè)計,只有一個研究因素。如:在實驗研究中,按完全隨機(jī)化原則將受試對象隨機(jī)分配到多個組(稱水平)中去,然后觀察實驗效應(yīng)。在調(diào)查研究中,按隨機(jī)化原則,抽取不同組(水平)的某個研究因素,比較該因素的效應(yīng)。無論是實驗,還是調(diào)查,研究的目的都是比較不同水平下,各組平均值之間的差別是否有統(tǒng)計學(xué)意義。ANOVA的假設(shè):H0:k組總體均數(shù)相等,即μ1=μ2=…=μk;H1:至少有兩組總體均數(shù)不相等四、變異分解當(dāng)P<α?xí)r,拒絕H0例9-1分析計算查附表3,F(xiàn)0.05(2,57)≈F0.05(2,60)

=3.15P<0.05拒絕H0,認(rèn)為三組血糖下降水平不完全一致。五、方差分析表變異來源SSυMSFP組間176.7612288.3806組內(nèi)909.87235715.96275.537<0.01總1086.633559---查F界值表,得F0.01(2,57)

≈F0.01(2,60)

=4.98<5.537所以P<0.01,在α=0.05水平上拒絕H0,可認(rèn)為不同餐后2小時血糖的總體水平不完全相同。六、幾點(diǎn)說明1.當(dāng)H0被拒絕后,只能表明幾種處理的結(jié)果有差別,但并不表明任何兩種之間有差別,若要深入了解,需作兩兩比較2.當(dāng)k=2時,F(xiàn)=t23.當(dāng)k≥3時,不宜先做兩兩比較的t檢驗,否則會增加犯第一類錯誤的概率,易將無差別的兩均數(shù)錯判為有差別。4.當(dāng)資料提供的是

時,第二節(jié) 隨機(jī)區(qū)組設(shè)計的ANOVA一、隨機(jī)區(qū)組設(shè)計隨機(jī)區(qū)組設(shè)計(randomized

block

design)也稱配伍設(shè)計是配對設(shè)計的推廣,有兩個研究因素,它在醫(yī)學(xué)科研設(shè)計較為常見,例如在實驗研究中,將動物按窩

別配伍,再隨機(jī)分配到各個處理組。它實際上是用分層的思想,事先將全部受試

對象按某種或某些特征分為若干區(qū)組(配伍組因素),使每個區(qū)組內(nèi)研究對象的

特征盡可能相近。再將每個區(qū)組內(nèi)的受試對象隨機(jī)的接受某一水平的處理(處理

因素)。觀察各處理組間的研究效應(yīng)有無統(tǒng)計學(xué)意義。此外,同一受試對象不同時間點(diǎn)上的觀察,或同一樣本給予不同處理的比較也可按配伍設(shè)計進(jìn)行分析。由于區(qū)組內(nèi)的個體特征比較一致,減少了個體間差異對研究結(jié)果的影響,一般而言,較成組設(shè)計更容易檢驗出處理組間的差別,提高了研究效率。二、區(qū)組設(shè)計資料形式區(qū)組編號處理因素123…k1X11X21X31…Xk12X12X22X32…Xk2………………jXijX2jX3j…Xkj………………bX1bX2bX3b…Xkb三、變異分解四、舉例分析例9-2資料見表9-6,試問三種不同方案的效果有無差別?區(qū)組ABC均數(shù)12.212.914.253.123322.322.644.563.173333.153.674.333.7167……………103.422.864.233.5033∑x25.80029.76041.70097.26∑∑x_X2.582.9764.17003.2420_XSi20.27430.15810.16050.6565S2H0:μ1=μ2=μ3H1:至少兩組不等α

=0.05方差分析結(jié)果變異來源SSdfMSFP處理間13.701826.850932.639<0.01區(qū)組間1.557790.17310.825>0.05誤差3.7790180.2099總19.038529區(qū)組劃分原則應(yīng)當(dāng)指出的是,區(qū)組效應(yīng)是否具有統(tǒng)計學(xué)意義是重要的。它表明了區(qū)組劃分是否成功,即是否真正達(dá)到了如下要求:同一區(qū)組內(nèi)各試驗單位很均勻不同區(qū)組間的試驗單位有較大差異區(qū)組效應(yīng)有統(tǒng)計學(xué)意義,表明區(qū)組劃分有一定效果,否則效果不好,甚至有相反的效果。區(qū)組設(shè)計資料若采用成組設(shè)計的ANOVA方法處理,可以發(fā)現(xiàn):SS總和SS組間不變,

SS組間=SS處理,SS組內(nèi)=SS區(qū)組+SS誤差,如果MS區(qū)組<MS誤差,則F成組<F區(qū)組,加上自由度的損失(∵N-k>(k-1)(b-1)),使得研究因素的F值要達(dá)到具有統(tǒng)計學(xué)意義更難,即如果研究因素客觀上確有效應(yīng),則當(dāng)區(qū)組劃分不當(dāng)時,會降低發(fā)現(xiàn)這種效應(yīng)的機(jī)會。可見,并非任何場合劃分區(qū)組都好。若沒有足夠理由顯示不同區(qū)組間差別確有統(tǒng)計學(xué)意義,則寧可不分。用于劃分區(qū)組的因素應(yīng)是對效應(yīng)指標(biāo)沒有影響的非研究因素。第三節(jié) 析因設(shè)計資料的ANOVA例9-3

某研究人員為了了解升白細(xì)胞藥物(A)和純苯(B)對大鼠吞噬指數(shù)的影響,以及兩者同時使用的作用。將20只性別相同、體重相近的大鼠,按A、B兩因素有無分為a1b1、a1b2、a2b1、a2b2四組。其中a1表示使用A藥物;a2表示未使用A藥物;b1表示使用B藥物;b2表示未使用B藥物。試驗結(jié)果見表:a1

a2合計b1b2b1b21.943.801.853.882.253.902.013.84Xij2.034.062.103.962.103.851.923.922.083.842.043.80nij555520Xij均數(shù)2.08003.89001.98403.88002.9585Sij20.01290.01030.00980.00400.9126ni10101010Xi均數(shù)2.98502.93202.03203.8850a1b1+a1b2a2b1+a2b1a1b1+a2b1a1b2+a2b2一、單獨(dú)效應(yīng)、主效應(yīng)和交互效應(yīng)12A因素B因素用(a)不用(a)平均a1-a2用(b1)2.08001.98402.03200.0960

(單)不用(b2)3.89003.88003.88500.0100

(單)平均2.98502.93202.95850.0530(主)b1-b2-1.8100(單)-1.8960

(單)-1.8530(主)單獨(dú)效應(yīng):a1-a2=(0.096,0.0100),b1-b2=(-1.8100,-1.8960);主效應(yīng):a1-a2的均值0.0530,b1-b2

的均值-1.8530;交互效應(yīng):AB=[(a1b1-b2b1)-(a1b2-a2b2)]/2=(0.0960-0.0100)/2=0.0430BA=[(b1a1-b2a1)-(b1a2-b2a2)]/2=[-1.8100-(-1.8960)]/2=0.0430交互作用示意圖二、變異分解SSA

、SSB和SSAB的分解析因設(shè)計的方差分析表變異來源SSDfMSFP(處理)(17.1913)(3)(5.7304)A0.014010.01401.505>0.05B17.1680117.16801846.022<0.01AB0.009310.00931.000>0.05誤差0.1481160.0093總17.3394190.9126析因設(shè)計的假設(shè)檢驗對于因素AH0:給藥與不給藥大鼠吞噬指數(shù)的總體均數(shù)相等H1:給藥與不給藥大鼠吞噬指數(shù)的總體均數(shù)不等對于因素BH0:染毒與不染毒大鼠吞噬指數(shù)的總體均數(shù)相等H1:染毒與不染毒大鼠吞噬指數(shù)的總體均數(shù)不等對于交互作用ABH0:給升白細(xì)胞藥物與否不影響染毒與不染毒大鼠吞噬指數(shù)H1:給升白細(xì)胞藥物與否影響染毒與不染毒大鼠吞噬指數(shù)第四節(jié) 重復(fù)測量資料的ANOVA重復(fù)測量(repeated

measurement

data)是同一受試對象的同一觀察指標(biāo)在不同時間點(diǎn)上進(jìn)行多次測量所得的資料,常用來分析該觀察指標(biāo)在不同時間點(diǎn)

上的變化特點(diǎn)。這類資料在臨床試驗和流行病學(xué)研究中較為常見。例9-4

為研究減肥新藥鹽酸西布曲明片和鹽酸西布曲明膠囊的減肥效果是否不同,以及肥胖患者服藥后不同時間的體重隨時間的變化情況。采用雙盲法將40名患者隨機(jī)分為兩組,一組給予鹽酸西布曲明片+模擬鹽酸西布曲明膠囊(劑型1),另一組給予鹽酸西布曲明膠囊+模擬鹽酸西布曲明片(劑型2

)。服藥觀察24周,分別與0周、8周、16周、24周測定受試對象體重(kg),資料見表9-13。服藥后不同時間點(diǎn)上的體重測量值服藥后測定時間i(周)受試對象劑型k0816241184.482.282.283.021105.0100.897.496.63163.862.061.660.4………………20180.078.076.474.821264.461.461.862.022291.088.487.489.6………………40264.662.664.262.01.重復(fù)測量資料中同一受試對象的數(shù)據(jù)高度相關(guān)測量數(shù)據(jù)的簡單相關(guān)系數(shù)r

(n=20)K=1測定時間測定時間(周)K=2測定時間測定時間(周)816248162400.9890.9710.93900.9890.9440.85080.9860.96680.9610.880160.985160.9582.重復(fù)測量資料中的隨機(jī)性重復(fù)測量資料中的處理因素在受試對象(看成區(qū)組)間為隨機(jī)分配,但受試對象內(nèi)的各時間點(diǎn)是固定的(研究的主要內(nèi)容),不能隨機(jī)分配;隨機(jī)區(qū)組設(shè)計資料中每個區(qū)組內(nèi)的受試對象彼此獨(dú)立,處理只在區(qū)組內(nèi)隨機(jī)分配,同一區(qū)組內(nèi)的受試對象接受的處理各不相同。本節(jié)介紹兩因素重復(fù)測量資料的單變量ANOVA一、變異分解二、重復(fù)測量資料的假設(shè)檢驗對于處理因素KH0:不同劑型(片劑和膠囊)的減肥效果相同H1:不同劑型(片劑和膠囊)的減肥效果不同對于時間因素ⅠH0:服用減肥藥前后不同時間體重的總體均數(shù)全相等H1:服用減肥藥前后不同時間體重的總體均數(shù)不全相等對于交互作用KIH0:藥物劑型K和時間I無交互效應(yīng)H1:藥物劑型K和時間I有交互效應(yīng)兩因素重復(fù)測量資料方差分析表變異來源SSdfMSFP受試對象間13163.981039處理K5.929015.92900.0170.897個體間誤差13158.052038346.2645受試對象內(nèi)904.6500120時間I384.53003128.176728.2130.000交互作用KI2.194030.73130.1610.922個體內(nèi)誤差517.92601144.5432總14068.631015988.4820三、重復(fù)測量資料ANOVA的前提條件進(jìn)行重復(fù)測量資料的方差分析,除需滿足方差分析的一般條件外,還需滿足協(xié)方差陣的球形性或復(fù)合對稱性。若球形對稱性質(zhì)不滿足,則方差分析的F值有偏的,因為她增大了第一類錯誤的概率。球?qū)ΨQ性通常采用Mauchly檢驗來判斷。本例資料的Mauchly檢驗結(jié)果如下:Mauchiy’sχDf球?qū)ΨQ系數(shù)εPGreenhouse-Geisser

Huynh-Feldt0.098585.13350.000

0.4361

0.4573Mauchiy檢驗和對稱系數(shù)εH0:資料滿足球?qū)ΨQH1:資料不滿足球?qū)ΨQP=0.000,拒絕H0資料的球?qū)ΨQ校正用Greenhouse-Geisser(G-G)法或Huynh-Feldt(H-F)法的球?qū)ΨQ系數(shù)ε乘以受試對象內(nèi)各變異的自由度后再查F界值表獲得P值。表9-17為資料校正后的結(jié)果。校正df校正P變異來源DfFPG-GH-FG-GH-F受試對象120時間I328.2130.0001.311.370.0000.000交互作用KI30.1610.9221.311.370.7570.768個體內(nèi)誤差11449.7252.13校正前后的結(jié)果雖有不同,但結(jié)論未變。第五節(jié) 多個樣本均數(shù)間的多重比較探索性研究兩兩間相互比較方法有:SNK法、Bonfferoni

t檢驗、?idák

t檢驗證實性研究如:⑴多個處理組與一個對照組間的比較⑵處理后不同時期與處理前比較方法有:Dunnett-t檢驗、LSD-t檢驗SPSS中完全隨機(jī)設(shè)計多個樣本均數(shù)間比較例9-1為例某醫(yī)生研究一種降糖新藥,按完全隨機(jī)設(shè)計將患者分為三組進(jìn)行雙盲試驗。結(jié)果如下,試問三組病人的降糖水平是否一致?高劑量組低劑量組對照組合計5.6-0.612.49.55.70.9Xij(血糖)6.0…12.8…7.0…9.23.16.0ni21192060均數(shù)9.19525.80005.43006.8650方差17.360518.186712.384318.4176一、LSD-t檢驗完全隨機(jī)設(shè)計時,配伍設(shè)計時,其中A,B為比較組標(biāo)識符least

significant

different-t

test適用于檢驗k組中某一對或某幾對在專業(yè)上有特殊意義的樣本例9-1

LSD法兩兩比較結(jié)果二、SNK-q

test(Student-Newman-Keuls)適用于多個樣本均數(shù)間每兩個均數(shù)的比較完全隨機(jī)設(shè)計時,隨機(jī)區(qū)組設(shè)計時,其中,a為當(dāng)樣本均數(shù)按從大到小排序后,A與B兩組間的組間跨度,q(a,v)為q分布,查附表4。SNK-q界值表(Newman-Keuls法)例9-1

SNK-q法兩兩比較結(jié)果按0.05水平分為兩組9例9-5.

對例9-1資料(完全隨機(jī)設(shè)計)中三種不同時間血糖下降值的效果間兩兩比較。將三個樣本均數(shù)由大到小排列,并編組次:均數(shù)組別組次9.1952高劑量15.8000低劑量25.4300對照組3H0:μ1=

μ3對比組次兩均數(shù)之差aqq0.05q0.01P1,33.765234.2663.404.280.01~0.051,23.395223.7962.833.76<0.012,30.370020.4092.833.76>0.05SNK多個均數(shù)比較的q檢驗三、Dunnett-t

test適用于k-1個試驗組與一個對照組之間的多重比較完全隨機(jī)設(shè)計,隨機(jī)區(qū)組設(shè)計其中:o為對照組標(biāo)識符,D(v1,v2)為D分布,附表5Dunnett-t界值表(雙)例9-1

Dunnett-t

法兩兩比較結(jié)果例9-6.對例9-2資料,問A方案、B方案(均為實驗組)分別于C方案(對照組)比較。對比組均數(shù)差t值PA與C-1.5900-7.760<0.01B與C-1.1940-5.827<0.01四、Bonfferoni法完全隨機(jī)設(shè)計隨機(jī)區(qū)組設(shè)計其中A,B為比較組標(biāo)識符,Bonfferoni

-t

test適用于檢驗K組中兩兩間比較例9-1

Bonfferoni

法兩兩比較結(jié)果9例9-7.對例9-1資料作兩兩比較。Bonfferoni

t檢驗計算表對比組均數(shù)差t值P1與33.76523.0160.002~0.005*1與23.39522.6840.005~0.01*2與30.37000.289>0.50完全隨機(jī)設(shè)計ANOVA的SAS程序do

i=1

to

3;input

n;do

j=1

to

n;input

x

@@

;

output;end;end;data

A;cards;215.7

12.8

4.1

-1.8

-0.1

6.3

12.7

9.8

12.6

2.0

5.6

7.0

7.9

4.3

6.4

7.0

5.4

3.10.9

7.0

3.9

1.6

6.4

3.0

3.9

2.2

1.1

2.7

7.8

6.9

1.5

9.4

3.8

7.5

8.4

12.2

6.05.6

9.5

6.0

8.7

9.2

5.0

3.5

5.8

8.0

15.5 11.8

16.3

11.8

14.6

4.9

8.1

3.8

6.113.2

16.5

9.219-0.62012.4;run;data=A;Proc

anovaclass

i;model

x=i;means

i;means

i/lsd;means

i/snk;means

i/dunnett(‘1’);run;TheANOVAProcedureSourceDFSquaresMean

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論