《方差分析一單向》PPT課件_第1頁
《方差分析一單向》PPT課件_第2頁
《方差分析一單向》PPT課件_第3頁
《方差分析一單向》PPT課件_第4頁
《方差分析一單向》PPT課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

方差分析(一)單向方差分析(one-wayANOVA),方差分析(analysisofvariance,ANOVA)又稱變異數(shù)分析或F檢驗(yàn),適用于對多個平均值進(jìn)行總體的假設(shè)檢驗(yàn),以檢驗(yàn)實(shí)驗(yàn)所得的多個平均值是否來自相同總體。,實(shí)驗(yàn)三要素:,統(tǒng)計模型:,效應(yīng)值=總平均效應(yīng)+處理效應(yīng)+隨機(jī)誤差效應(yīng),效應(yīng)值-總平均效應(yīng)=處理效應(yīng)+隨機(jī)誤差效應(yīng),第一節(jié)方差分析的基本思想,方差分析的基本思想是將出現(xiàn)在所有測量值上的總變異按照其變異的來源分解為多個部分,然后進(jìn)行比較,評價由某種因素所引起的變異是否具有統(tǒng)計學(xué)意義。單向方差分析(onewayanalysisofvariance)是指處理因素只有一個。這個處理因素包含有多個離散的水平,分析在不同處理水平上應(yīng)變量的平均值是否來自相同總體。,例8-1有3種解毒藥:A、B及C,同時設(shè)一個空白對照D,共有4個組。即解毒藥這個處理因素包含有4個水平,或4個處理組,用i表示處理組號,i1,2,3,4分別代表A、B、C、D4個組。受試大白鼠共24只,故動物總數(shù)或樣本含量N=24。按完全隨機(jī)化方法將它們分成等數(shù)的4個組,每組有6只動物。用ni表示第i組受試動物數(shù)(當(dāng)每組受試動物數(shù)相等時用n代替ni)。用j(j=1,2,6)表示每組受試動物號。應(yīng)變量用Yij表示第i組第j號大白鼠的血中膽堿酯酶含量(/ml)。實(shí)驗(yàn)結(jié)果見表8l。,表8-1應(yīng)用不同解毒藥的大白鼠血中膽堿酯酶含量(Yij)(ml),各組平均值為。各組測定值的總和為=111+89480。樣本總平均值為4802420.0。在單向方差分析中,變異來源于兩個方面,一方面是受試對象個體間的變異(稱組內(nèi)變異),另一方面是實(shí)驗(yàn)因素各水平間的變異(稱組間變異)。因此,總變異可按其變異來源進(jìn)行分解。,總變異=處理間變異(組間)+誤差(組內(nèi)),觀察值效應(yīng)=總平均效應(yīng)+處理效應(yīng)+隨機(jī)誤差效應(yīng),總平均,單因素方差分析的基本思想(圖示),一、離均差平方和的分解,個體測定值與總平均值之差可寫為上式等號右邊第一項稱為組內(nèi)離均差,第二項是組平均值與總平均值之差,稱為組間離均差。將等式兩邊平方后求和得到,上式第二行中間的一項又可以寫成下列等式:這是因?yàn)橛兄?。最后得到公式?-1)就是單向方差分析的總離均差平方和分解公式。用文字表達(dá)為:總離均差平方和組間離均差平方和十組內(nèi)離均差平方和SS總SS組間+SS組內(nèi),二、F值與F分布,t檢驗(yàn)是用t值進(jìn)行假設(shè)檢驗(yàn)的,方差分析則用F值進(jìn)行假設(shè)檢驗(yàn)。每種來源的離均差平方和用相應(yīng)的自由度去除,可得到平均的離均差平方和,簡稱均方(meansquare,MS)。各種均方表示為:組間均方:MS組間SS組間v組間SS組間(al)組內(nèi)均方:MS組內(nèi)SS組內(nèi)v組內(nèi)SS組內(nèi)(Na)組內(nèi)均方表示各組內(nèi)均方的平均值,它是隨機(jī)誤差項的方差的綜合估計值。其代表性優(yōu)于每個組的組內(nèi)均方。它的分子和分母分別是各組內(nèi)離均差平方和之和及各組內(nèi)自由度之和。,關(guān)系式為:由于組間均方包含由隨機(jī)誤差及處理因素引起的誤差,故其值比組內(nèi)均方大。理論上的組間均方的期望值可表示為:式中為組內(nèi)均方的期望值E(MS組內(nèi)),i及為分別對應(yīng)于及的期望值。,F值的計算公式為F值的實(shí)際意義表現(xiàn)為如下的比值:,H0:T=0H1:T0,F統(tǒng)計量不可能是負(fù)值,因?yàn)榉肿蛹胺帜付际瞧椒巾?。分子中的SS組間是各組平均值與總平均值之差的加權(quán)平方和。如果各處理組所代表的總體平均值彼此相等,則各組樣本平均值也就彼此接近。其結(jié)果是各組樣本平均值很接近總平均值。反之,如果各處理組所代表的總體平均值差別很大,則相應(yīng)的各組樣本平均值也就彼此差別很大;某些組平均值就明顯不同于總平均值。因此一個大的組間均方MS組間可使F值變大,它提供足夠的把握來拒絕無效假設(shè)。若MS組間很小,則缺乏證據(jù)來拒絕無效假設(shè)。,由于分析數(shù)據(jù)都是來自樣本,故必須考慮資料的變異性。組內(nèi)均方MS組內(nèi)是隨機(jī)誤差方差的估計值,它是衡量樣本資料隨機(jī)變異性大小的指標(biāo)。如果資料的隨機(jī)變異性很大,則MS組內(nèi)也大。若資料的隨機(jī)變異性很小,則MS組內(nèi)也小。當(dāng)MS組間大,而MS組內(nèi)小時,F(xiàn)值就大。當(dāng)MS組間大,MS組內(nèi)也大時,則F值就不一定大。那么F值要多大才能有把握拒絕無效假設(shè)呢?這就要由F統(tǒng)計量的分布來決定了。當(dāng)F統(tǒng)計量達(dá)到一個小的P值水平時,就可以拒絕無效假設(shè)。,t分布只有一個自由度。因?yàn)閮山M比較時,組間自由度恒為l。F分布有兩個自由度,即組間自由度v組間=a-l及組內(nèi)自由度v組內(nèi)=Na,又分別稱為分子自由度v1和分母自由度v2。F分布是一種偏態(tài)分布。它的分布曲線由這兩個自由度來決定。分子自由度v14及分母自由度v210的F分布曲線見圖8l。,F分布的隨機(jī)變量沒有負(fù)值。依據(jù)不同水準(zhǔn)下的F界值表。例如當(dāng)v1=10,v2=30時,0.05的臨界F值F0.05(10,30)2.16,當(dāng)計算出的統(tǒng)計量F值等于或大于臨界值時,就在水準(zhǔn)上拒絕無效假設(shè),否則就不拒絕無效假設(shè)。根據(jù)計算出的F統(tǒng)計量與臨界F值之間的關(guān)系有如下的統(tǒng)計學(xué)推斷規(guī)則:,第二節(jié)方差分析的步驟,方差分析的步驟為:一、整理和描述資料。在第一節(jié)中已經(jīng)介紹了方差分析所用的資料表格式(見表8-l)。按格式整理后,計算出每組的測定值之和、組平均值,測定值平方和以及總平均值等。二、提出檢驗(yàn)假設(shè)及規(guī)定類錯誤概率水準(zhǔn)的大小。H0:1=2=a,各組所代表的總體平均值相等;H1:ih,至少有一個不等式成立。i,hl,2,a。ih。0.05。,離均差平方和的簡化計算公式:,式中C為校正數(shù),三、計算各種離均差平方和、自由度及均方。例一資料用式(8-l)、式(8-2)與式(8-3)計算出的結(jié)果如下:l總離均差平方和SS總10616(480)2241016.0??傋杂啥葀總24l23。2組間離均差平方和組間自由度v14-l3,組間均方MS組間568.33/3=189.443組內(nèi)離均差平方和SS組內(nèi)1016.0568.33447.67。組內(nèi)自由度v2=4(6l)20,組內(nèi)均方MS組內(nèi)447.67/20=22.38,四、計算F值。應(yīng)用式(8-4)計算得F189.44/22.38=8.46將以上計算結(jié)果列于方差分析表中(見表8-2)。五、確定P值并作出統(tǒng)計學(xué)推斷。查附表5:F界值表,得F0.05(3,20)3.10。由于FF0.05(3,20),故有概率P0.05,根據(jù)式(8-5)的推斷規(guī)則拒絕無效假設(shè),接受備擇假設(shè)。處理因素的4個水平中至少有一個組的總體平均值不同于其他各組。從表8-l所示的各值可見,不同解毒藥物的效果是不同的。解毒藥物A和C與空白對照組D相近。B組血中膽堿酯酶含量較其他組為高。,表8-2大白鼠血中膽堿酯酶含量方差分析表,第三節(jié)平均值之間的多重比較,方差分析是對各觀察組的平均值是否來自相同總體進(jìn)行總的檢驗(yàn),不能對各組間的差別作深人分析。這一點(diǎn)卻往往是研究者最關(guān)心的。對于一個實(shí)驗(yàn),如果經(jīng)方差分析后不拒絕無效假設(shè),則表示各組平均值所代表的總體是相等的。分析工作即可終止。但若結(jié)果拒絕了無效假設(shè),則需進(jìn)行平均值之間的多重比較以進(jìn)一步確定哪些組的平均值之間的差別,具有統(tǒng)計學(xué)意義。這時就涉及到累積類錯誤概率的問題。,當(dāng)有a個平均值需作兩兩比較時,比較的次數(shù)共有c=a!/2!(a-2)!。例如當(dāng)a3時c3,a4時c6。當(dāng)比較的次數(shù)越多,在無效假設(shè)為真時,拒絕無效假設(shè)時的累積類錯誤概率也越大。設(shè)每次檢驗(yàn)所用類錯誤的概率水準(zhǔn)為,累積類錯誤的概率為,則在對同一實(shí)驗(yàn)資料進(jìn)行c次檢驗(yàn)時,在樣本彼此獨(dú)立的條件下,根據(jù)概率乘法原理,其累積類錯誤概率與c有下列關(guān)系:例如,設(shè)=0.05,c=6,其累積類錯誤的概率為l-(1-0.05)6=1-(0.95)6=0.26。目前有多種有效控制累積類錯誤概率的多重比較方法,下面介紹常用的Bonferroni法、SNK法和Tukey法。,均數(shù)間多重(兩兩)比較的三種形式及比較的方法:1.各均數(shù)間全部比較(探索性研究)方法:SNK法(q檢驗(yàn))、Bonferroni法、Tukey法等。2.多個實(shí)驗(yàn)(處理)組與一個對照組比較例:ABC三組分別與對照組比較方法:Dunnett檢驗(yàn)3.比較具有專業(yè)意義的組(確定性研究)例:A、B、C、D四組,從專業(yè)意義認(rèn)為只需比較A與C和B與D,其余各組不需比較。方法:LSD法(最小顯著差法leastsignificantdifference),一、Bonferroni法,Bonferroni提出,如果在水準(zhǔn)上進(jìn)行c次假設(shè)檢驗(yàn),當(dāng)無效假設(shè)為真時,至少有一次拒絕無效假設(shè)的累積類錯誤概率不超過ca,即有不等式ca。例如設(shè)0.05,c=3時運(yùn)用概率乘法原理計算出的0.143(30.05)。因此可以重新選擇類錯誤概率水準(zhǔn),以便使累積類錯誤概率0.05。根據(jù)Bonferroni不等式可得到要重新選擇的水準(zhǔn)為(/c)。例如設(shè)定0.05,進(jìn)行3次比較(c=3)時,重新選定的水準(zhǔn)為=(0.05/3)0.016。只有當(dāng)t檢驗(yàn)的類錯誤概率等于或小于0.016時才能拒絕無效假設(shè)。這樣當(dāng)無效假設(shè)為真時,其累積類錯誤概率不超過0.05。,用Bonferroni法進(jìn)行多個平均值之間的兩兩比較時所用的t檢驗(yàn)公式為:式(8-7)的分母Se,為兩平均值之差的標(biāo)準(zhǔn)誤,計算公式為:、及ni、nh分別是兩個比較組的平均值及觀察例數(shù)。例如對例8-1的四個平均值進(jìn)行兩兩比較時,c6。設(shè)累積I類錯誤概率0.10。對用于每次檢驗(yàn)的類錯誤概率水準(zhǔn)進(jìn)行調(diào)整得(0.10/6)0.0167。故采用t(=0.0167/2,v)作為臨界值。但在通用的t分布表中查不到這一概率水準(zhǔn)下的t值,須通過下列公式換算:,式(89)中的v為組內(nèi)均方的自由度。Z是標(biāo)準(zhǔn)正態(tài)分布面積下的橫軸距離取值。本例為/20.0083,Z=2.395,v20,代入上式即得到臨界值為:利用式(8-8)計算t檢驗(yàn)所需的標(biāo)準(zhǔn)誤Se:利用式(8-7)計算各組平均值之間兩兩比較的t值為:,用相同的方法計算出t(A:C)0.072.607,t(A:D)1.352.607;t(B:C)3.402.607;t(B:D)4.832.97;t(C:D)1.432.607。從以上的兩兩比較中可知,只有B組與其他各組間的差別具有統(tǒng)計學(xué)意義,而其他各組間的差別無統(tǒng)計學(xué)意義。這一結(jié)果的累積類錯誤的概率不超過0.10。當(dāng)比較次數(shù)不多時,Bonferroni法的效果較好。但當(dāng)比較次數(shù)較多(例如在10次以上)時,則由于其檢驗(yàn)水準(zhǔn)選擇得過低,結(jié)論偏于保守。,二、SNK法,SNK(student-Newman-Keuls)法又稱q檢驗(yàn),是根據(jù)q值的抽樣分布作出統(tǒng)計推論。仍以例8l為例介紹其檢驗(yàn)過程。1.將各組的平均值按由小到大的順序排列:排列順序(1)(2)(3)(4)平均值28.018.718.514.8原組號BCAD2.計算兩個平均值之間的差值及組間跨度k,見表8-3第(2)、(3)兩列。,表8-3SNK法兩兩比較的計算用表,3.計算兩對比組之差的標(biāo)準(zhǔn)誤S。計算公式為:由于本例中各組例數(shù)相等都為n6,故有對任意兩對比組之差公用的標(biāo)準(zhǔn)誤Se1.9313。4.按下列公式計算統(tǒng)計量q值:按式(8-11)計算的平均值之間兩兩比較的q值見表8-3第(4)列。,5.計算P值并作出統(tǒng)計推斷。按v20,0.05及0.01兩個檢驗(yàn)水準(zhǔn),根據(jù)不同組間跨度k查附表6:q界值表得的q0.05(20,k)及q0.01(20,k)列于表8-3第(5)、(6)兩列。表8-3最后一列列出了概率P??梢娕c其他各組比較,都在0.01水準(zhǔn)上具有統(tǒng)計學(xué)意義。而之間的差異均無統(tǒng)計學(xué)意義。結(jié)論為解毒藥B的效果顯著優(yōu)于其他各組。,三、Tukey法,Tukey法用稱為真正顯著差(honestlysignificantdifference,HSD)的單一值作為判斷標(biāo)準(zhǔn)。該法的計算步驟為:1.計算各組平均值兩兩之間的絕對差值。計算結(jié)果見表8-4第2列。2.根據(jù)檢驗(yàn)水準(zhǔn),觀察總例數(shù)N及比較組數(shù)k,從附表6:q界值表中查出q(k,N-k)的值。本例有k4,N24,N-k20。選取0.05,從附表6得q0.05(4,20)3.96。,3.用下列公式計算HSD值:式(8-12)中的n是比較組的觀察例數(shù)。當(dāng)兩組的觀察例數(shù)相等時用n;當(dāng)兩組的觀察例數(shù)不相等時用例數(shù)較少的ni代替n。本例的HSD=7.65。4.將差值d(i,h)與HSD值進(jìn)行比較。凡d(i:h)HSD者則拒絕無效假設(shè);否則不拒絕無效假設(shè)。本例的比較結(jié)果見表8-4最后一列。檢驗(yàn)結(jié)果表明,B組與A、C、D組之間的差別具有統(tǒng)計學(xué)意義,而A、C、D三組之間的差別無統(tǒng)計學(xué)意義。,表8-4HSD法計算用表,SAS軟件中的方差分析過程:Dataanova;dogroup=1to4;don=1to6;inputy;output;end;end;Cards;23121816281428312324283414241719162281221191415;Procanova;classgroup;modely=group;Meansgroup/snkbontukeydunnettlsd;Meansgroup/hovtest;Run;Quit;,SPSS軟件中單因素方差分析過程:DATALISTFRE/xgroupBegindata23112118116128114128231223224228234214324317319316322384124214194144154Enddata.Onewayxbygroup/STATISTICSDESCRIPTIVESHOMOGENEITY/POSTHOC=SNKTUKEYALPHA(.05).,第四節(jié)方差分析的假定條件和數(shù)據(jù)變換,一、方差分析的假定條件l.觀察值Yij獨(dú)立來自正態(tài)分布的總體如果樣本含量較大,雖然總體分布偏離正態(tài),由于有中心極限定理的保證,方差分析也是適用的。但是如果總體極度地偏離正態(tài)時,則須作數(shù)據(jù)轉(zhuǎn)換,以改善其正態(tài)性。2.方差齊性(homogeneity)只有當(dāng)各組內(nèi)方差在總體上相等時,才能有效地分析各對比組平均值之間的差異。當(dāng)最大方差與最小方差之比值()超過3時,由于增大了類錯誤的概率,就可能影響對方差分析結(jié)果的判斷。如果各對比組的觀察例數(shù)不相等,則其影響程度會更大。,二、方差齊性檢驗(yàn),第五章第五節(jié)介紹了檢驗(yàn)兩個總體方差齊性的方法。這里介紹檢驗(yàn)多個總體方差齊性的方法,并用例81的資料解釋其計算步驟。1.提出檢驗(yàn)假設(shè)。2.計算每一組的中位觀察值mdi中位觀察值mdi是指在第i組內(nèi)所有觀察值按由大到小的順序排列后位置居中的觀察值。如果組內(nèi)觀察例數(shù)是偶數(shù),則mdi取正中間兩個觀察值的平均值。例8-l的各組中位觀察值為:md1(l816)/217,md2(2828)228,md3(17+19)218,md4(l415)214.5。,3.計算各組內(nèi)個體觀察值與中位觀察值之差的絕對值dijdij=|Yij-mdi|(8-13)例如,d11=|2317|=6,d12|1217|5,余類推。用dij作單向方差分析。本例得F0.37,v13和v2=20。查附表6:F界值表得F0.05(3,20)=3.10F,故不拒絕H0,認(rèn)為這些組內(nèi)均方都來自具有相同理論均方的總體。本例用原始測定值Yij計算的各組內(nèi)方差為最大方差與最小方差之比,表明方差基本齊性。,測得的三組大白鼠營養(yǎng)試驗(yàn)中每組12只大鼠尿中氨氮的排出量X(mg/6天),A組:30273535293

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論