數(shù)理統(tǒng)計2015 第8章 單因素方差分析2015_第1頁
數(shù)理統(tǒng)計2015 第8章 單因素方差分析2015_第2頁
數(shù)理統(tǒng)計2015 第8章 單因素方差分析2015_第3頁
數(shù)理統(tǒng)計2015 第8章 單因素方差分析2015_第4頁
數(shù)理統(tǒng)計2015 第8章 單因素方差分析2015_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第8章

單因素方差分析18.1方差分析的基本原理8.2固定效應(yīng)模型8.3隨機(jī)效應(yīng)模型8.4t檢驗(yàn)和one-wayANOVA的關(guān)系

8.5

多重比較8.6

方差分析應(yīng)具備的條件8.7一個one-wayANOVA的完整例子8.8

one-wayANOVA統(tǒng)計在學(xué)術(shù)論文中的表達(dá)28.1方差分析的基本原理8.1.1方差分析的一般概念8.1.2方差分析的直觀理解8.1.3不同處理效應(yīng)與不同模型38.1.1方差分析的一般概念在環(huán)境與生態(tài)學(xué)的研究中,常需要通過抽樣來檢驗(yàn)若干個具有同樣(未知)方差的正態(tài)總體的數(shù)學(xué)期望之間有某些相等關(guān)系。方差分析(analysisofvariance,ANOVA)是一類特定情況下的參數(shù)假設(shè)檢驗(yàn),可同時判斷多組數(shù)據(jù)平均數(shù)之間的差異顯著性,是兩個平均數(shù)差異顯著性檢驗(yàn)(t檢驗(yàn))的一種引申。當(dāng)然,在多組數(shù)據(jù)的平均數(shù)之間做比較時,可以在平均數(shù)的所有對之間做t檢驗(yàn)。但這樣做會提高犯I型錯誤的概率,因而是不可取的。4例如,用一對一比較的方法檢驗(yàn)5個平均數(shù)之間的相等性,共需檢驗(yàn)10對。假設(shè)每一對檢驗(yàn)接受零假設(shè)的概率都是1-0.95,而且這些檢驗(yàn)都是獨(dú)立的,那么10對都接受的概率是(0.95)100.60,1-0.600.40,犯I型錯誤的概率由5%增加到40%。用ANOVA做檢驗(yàn)可防止上述問題的出現(xiàn)。方差分析的方法是1918年英國統(tǒng)計學(xué)家R.Fisher提出的,其基本思想是將數(shù)據(jù)間的變異性分解成組間變異和組內(nèi)變異。組即樣本,不同的組(如接受不同處理)來自不同的總體。方差分析內(nèi)容廣泛,上面講到的情況是方差分析中最簡單的,稱單因素方差分析

(one-wayANOVA),如:5例8.1調(diào)查了5個不同小麥品系的株高,結(jié)果列于表8-1。表8-15個小麥品系株高(cm)調(diào)查結(jié)果株號品系ⅠⅡⅢⅣⅤ164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5和326.5322.0336.5354.0343.0平均數(shù)65.364.467.370.868.6這個例子只出現(xiàn)“品系”這個因素(factor),故稱單因素。共5個品系,稱5個水平(level)。5個品系可認(rèn)為是5個總體,而表中數(shù)據(jù)是從這5個總體抽出的5個樣本。One-wayANOVA解決的問題:通過比較這5個樣本的平均數(shù),推斷這5個總體(5個水平)的平均數(shù)是否存在差異。6例8.2為了探討不同窩的動物出生體重是否存在差異,隨機(jī)選取4窩動物,每窩中均有4只幼仔(表8-2)。表8-24窩動物的出生重/g動物號窩別ⅠⅡⅢⅣ134.733.227.132.9233.326.023.331.4326.228.627.825.7431.632.326.728.0和125.8120.1104.9118.0平均數(shù)31.45030.02526.22529.500One-wayANOVA可解決的問題:通過以上數(shù)據(jù)的分析,判斷不同窩別(不同水平)動物出生重是否存在差異。7以上兩個例子的共同點(diǎn):每個實(shí)驗(yàn)都只有一個因素,該因素有a個處理(treatment),這樣的實(shí)驗(yàn)稱為單因素實(shí)驗(yàn)。從單因素實(shí)驗(yàn)的每一處理所得到的結(jié)果都是一隨機(jī)變量Yi。對于a個處理,各重復(fù)ni次(或者說做ni次觀測)的one-wayANOVA中數(shù)據(jù)的一般化表示見表8-3。8表8-3單因素方差分析的典型數(shù)據(jù)

Y1Y2Y3…Yi…Ya1y11y21y31…yi1…ya12y12y22y32yi2ya23y13y23y33yi3ya3………………jy1jy2jy3jyijyaj………………niy1n1y2n2y3n3yiniyana平均數(shù)

方差分析各水平的重復(fù)數(shù)一般相等(均為n),但也有不等的情況,這時的n為ni。9表中的數(shù)據(jù)yij,表示第i次處理下的第j次觀測值。其中的幾個符號做如下說明:“.”表示對一個下標(biāo)的和,“..”表示對2個下標(biāo)的和,N表示全部觀測值個數(shù),各水平重復(fù)數(shù)均為n時,N=an。108.1.2方差分析的直觀理解從例8.1的敘述可以看出,實(shí)際上方差分析也是一種對平均數(shù)所做的檢驗(yàn)。對平均數(shù)做檢驗(yàn),可以采用兩種不同的方式:一種是檢驗(yàn)兩個平均數(shù)的差是否可用隨機(jī)誤差解釋。如果平均數(shù)的差是由隨機(jī)誤差造成的,那么平均數(shù)之間的差異不顯著,抽出樣本的兩個總體的平均數(shù)相同。另一種檢驗(yàn)方式是檢驗(yàn)幾個樣本平均數(shù)的方差是否足夠大。如果樣本平均數(shù)的方差足夠大,遠(yuǎn)遠(yuǎn)大于由隨機(jī)誤差所產(chǎn)生的方差,說明這幾個樣本平均數(shù)之間的離散程度很高,除了誤差效應(yīng)外,必然還存在不同的處理效應(yīng)。我們便可以推斷,抽出這幾個樣本的總體是不同的,即這些總體的平均數(shù)不同。11在表8-3中,從a個總體中抽出a個樣本,可以得出a個樣本平均數(shù),并可以計算出這a個樣本平均數(shù)的方差。因?yàn)樵摲讲钍菑牟煌瑯颖酒骄鶖?shù)計算得到的,所以又可稱為組間方差。然后將組間方差與隨機(jī)誤差的方差用F檢驗(yàn)做比較,若拒絕零假設(shè),則樣本平均數(shù)的方差是顯著的,它們可能抽自平均數(shù)不同的總體。而一個樣本不同觀測值(重復(fù))之間(組內(nèi))的方差是由隨機(jī)誤差引起的。因此,在方差分析中,隨機(jī)誤差的方差可以由這a個樣本內(nèi)重復(fù)之間的方差獲得。由重復(fù)之間計算得到的方差也可以稱為組內(nèi)方差。用組內(nèi)方差對組間方差做F檢驗(yàn),若F值落在拒絕域內(nèi),則樣本平均數(shù)之間的差異是顯著的,它們抽自總體平均數(shù)不同的a個總體,或者說,樣本間存在不同的處理效應(yīng)。12上面的敘述只是對one-wayANOVA的直觀理解,還有很多更深入的問題如:組內(nèi)方差真的是隨機(jī)誤差的估計嗎?組間方差真的能代表不同處理的效應(yīng)嗎?方差分析包括了a個處理,也就是有a個樣本,這時的組內(nèi)方差又是怎樣計算的?如果one-wayANOVA表明該因素的作用顯著(即平均數(shù)差異顯著),是否代表任何不同水平間都有顯著差異、如何合理分析這些差異?在論文寫作中,如何規(guī)范表達(dá)該類統(tǒng)計結(jié)果?等等??梢哉f,在所有的統(tǒng)計方法中,方差分析是我們環(huán)境與生態(tài)學(xué)研究中使用最多的,而one-wayANOVA又是方差分析中最基礎(chǔ)的。138.1.3不同處理效應(yīng)與不同模型數(shù)學(xué)模型是方差分析的基礎(chǔ)。常用線性統(tǒng)計模型(linearstatisticalmodel)描述one-wayANOVA的每一觀測值。它把觀測值表示為各影響因素效應(yīng)的線性組合。

yij是第i水平(處理)下的第j次觀測值;

是對所有觀測值的一個參數(shù),稱總平均數(shù)(overallmean);i是僅限于對第i次處理的一個參數(shù),也稱第i次處理效應(yīng)(treatmenteffect)。方差分析的目的,就是要檢驗(yàn)處理效應(yīng)的大小和有無。ij是隨機(jī)誤差成分。要求模型中的誤差ij是服從正態(tài)分布N(0,2)的獨(dú)立隨機(jī)變量,并要求各水平的方差均為2。14上述模型中,處理效應(yīng)可能有兩類。第一類處理效應(yīng)稱為固定效應(yīng)(fixedeffect),是由固定因素(fixedfactor)產(chǎn)生的效應(yīng)。若因素的a個水平是經(jīng)過特意選擇的,則該因素稱為固定因素,例如,實(shí)驗(yàn)者人為選定的幾種不同實(shí)驗(yàn)溫度、幾種不同化學(xué)藥物或一種藥物的幾種不同濃度、幾個作物品種、幾種治療方案等。在這些情況中,因素的水平是人為選定的,所檢驗(yàn)的是關(guān)于i的假設(shè),因此溫度、藥物、濃度、品種等稱為固定因素。方差分析所得到的結(jié)論只適合于選定的那幾個水平,

并不能將其結(jié)論擴(kuò)展到未加考慮的其他水平上。處理固定因素所用的模型稱為固定效應(yīng)模型(fixedeffectmodel)或簡單地稱為固定模型(fixedmodel)。15例8.1中的5個小麥品系是特意選擇的,目的是從這5個品系中,選出最優(yōu)者,因而“品系”這個因素屬于固定因素,所使用的模型是固定效應(yīng)模型。第二類處理效應(yīng)稱隨機(jī)效應(yīng)(randomeffect),是由隨機(jī)因素(randomfactor)產(chǎn)生的。若因素的a個水平,是從該因素水平總體中隨機(jī)抽出的樣本,則該因素稱隨機(jī)因素。從隨機(jī)因素a個水平所得的結(jié)論,可推廣到該因素的所有水平。這里i是一個隨機(jī)變量,檢驗(yàn)的是關(guān)于i的變異性的假設(shè)。處理隨機(jī)因素所用的模型稱隨機(jī)效應(yīng)模型(randomeffectmodel)或隨機(jī)模型(randommodel)。例8.2的動物窩別是從所有可能的窩別中隨機(jī)抽出的,目的是考查窩別間出生重是否存在差異,故“窩別”是隨機(jī)因素。16有時固定因素與隨機(jī)因素很難區(qū)分,除上述所講的原則外,還可以從另一個角度考慮:固定因素是指因素的水平可以嚴(yán)格地人為控制,在水平固定之后,它的效應(yīng)值也是固定的。例如,研究3種不同溫度對胰蛋白酶水解產(chǎn)物的影響。因?yàn)闇囟人绞强梢試?yán)格控制的,即每個溫度水平,在各個重復(fù)之間都可以準(zhǔn)確地控制在一個固定值上,所以在重復(fù)該實(shí)驗(yàn)時,水解產(chǎn)物的產(chǎn)量也是固定的。簡單地說:在水平(不同溫度)固定以后,其效應(yīng)值(產(chǎn)量)也是固定的。因此,溫度是固定因素。17隨機(jī)因素的水平不能嚴(yán)格地人為控制,在水平確定之后,它的效應(yīng)值并不固定。例如,在研究農(nóng)家肥不同施用量對作物產(chǎn)量的影響試驗(yàn)中,農(nóng)家肥是因素,不同施用量是該因素的不同水平,作物的產(chǎn)量是它的效應(yīng)值。由于農(nóng)家肥的有效成分很復(fù)雜,不能像控制溫度那樣將農(nóng)家肥的有效成分嚴(yán)格控制在某一個固定值上。在重復(fù)試驗(yàn)時即使施以相同量的農(nóng)家肥,也得不到一個固定的效應(yīng)值。也就是說,在因素的水平(施肥量)固定之后,它的效應(yīng)值(產(chǎn)量)并不固定,因而農(nóng)家肥是一個隨機(jī)因素。188.2固定效應(yīng)模型8.2.1固定效應(yīng)線性統(tǒng)計模型8.2.2平方和與自由度的分解8.2.3均方期望與統(tǒng)計量F8.2.4平方和的簡易計算方法198.2.1固定效應(yīng)線性統(tǒng)計模型在固定模型中,i是處理平均數(shù)i與總平均數(shù)的離差,是個常量,根據(jù)平均數(shù)的性質(zhì)要檢驗(yàn)a個處理效應(yīng)的相等性,就要判斷各i是否都等于0。若各i都等于0,則各處理效應(yīng)間無差異。因此,零假設(shè)為:H0:1=2=...=a=0,相當(dāng)于1=2=...=a若接受H0,則不存在處理效應(yīng),每個觀測值都由總平均數(shù)加上隨機(jī)誤差構(gòu)成。若拒絕H0,則存在處理效應(yīng),每個觀測值由總平均數(shù)、處理效應(yīng)及誤差三部分構(gòu)成。208.2.2平方和與自由度的分解方差分析的基本思想,就是將總的變差(變異)分解為各個分量,再用適當(dāng)方法對各分量進(jìn)行檢驗(yàn)。對單因素實(shí)驗(yàn)可將總平方和(SST,totalsumofsquare,平方和指離均差平方和,后同)作如下分解:對于每個固定的,同一組內(nèi)的離均差之和為0,所以21該式表示度量全部數(shù)據(jù)變差的總平方和,可分解為處理平均數(shù)與總平均數(shù)之間(組間)離差的平方和[SSA,處理平方和(treatmentsumofsquares)或處理間平方和(sumofsquaresamongtreatments)]及處理內(nèi)部觀測值與處理平均數(shù)之間(組內(nèi))離差的平方和[SSE,誤差平方和(errorsumofsquares)或處理內(nèi)平方和(sumofsquareswithintreatments)]兩部分。處理平均數(shù)與總平均之間的離差,度量了處理之間的差異;而處理內(nèi)部觀測值與處理平均數(shù)之間的離差,度量了隨機(jī)誤差的大小。因此22自由度可以做同樣的分割:總自由度dfT=ni-1=N-1;共有a個水平,因而dfA=a-1;誤差項(xiàng)有(ni-1)=N-a自由度,這是因?yàn)槊恳惶幚碛衝i-1自由度,共有a個處理,因而dfE=N-a=dfTdfA。為了估計2,用SSE除以相應(yīng)的自由度得誤差均方(MSE,errormeansquare)。(注意這里不稱方差而稱均方)用SSA除以相應(yīng)的自由度得處理均方(MSA,meansquareamongtreatments)。238.2.3均方期望與統(tǒng)計量F可以證明MSE是2的無偏估計量。24用類似的方法,可以求出MSA的數(shù)學(xué)期望:E(ij)=0,故所有包含ij的乘積項(xiàng)的數(shù)學(xué)期望均為0,于是2526由以上結(jié)果可以看出:誤差均方反映了隨機(jī)因素所造成的方差的大小,它是2的無偏估計量。對于處理項(xiàng)來說,只有當(dāng)零假設(shè)H0:1=2=...=a=0成立時,MSA才是2的無偏估計量。當(dāng)i=0時,項(xiàng)等于0,這時E(MSA)=2。因此,用MSA和MSE比較,就可以反映出i的大小。若MSA與MSE相差不大,就可以認(rèn)為i與0的差異不大。若MSA比MSE超出很多,則認(rèn)為i間差異是顯著的。為此,用F上尾單側(cè)檢驗(yàn)。27當(dāng)F<F時,則可以認(rèn)為MSA與MSE差異不大,產(chǎn)生的變差是由隨機(jī)誤差造成的,近于0,接受零假設(shè),處理平均數(shù)之間差異不顯著。當(dāng)F>F時,MSA顯著高于MSE,項(xiàng)不再為0,拒絕零假設(shè),處理平均數(shù)間差異顯著。以上所述可以歸納成方差分析表(analysisofvariancetable)

表8-4單因素固定效應(yīng)模型方差分析表變差來源平方和自由度均方F均方期望處理間SSAa-1MSA誤差或處理內(nèi)SSEN-aMSE2總和SSTN-1288.2.4平方和的簡易計算方法在實(shí)際計算中:其中的通常稱為校正項(xiàng)(correction),用C表示,則誤差平方和可由下式得29現(xiàn)在用以上各式計算例8.1。在方差分析中,為了簡化計算.同樣可以用編碼法。方差分析的編碼,必須將全部數(shù)據(jù)均減去同一個數(shù)。在例8.1中,每一個yij都減去65,列成表8-5:例8.1數(shù)據(jù)編碼后的簡易計算表序號品系總和IIIIIIIVV1-0.4-0.52.86.84.220.30.31.37.13.23-0.2-0.42.15.04.841.0-1.31.84.13.350.8-1.13.56.02.51.5-3.011.529.018.057.02.259.00132.25841.00324.001308.501.933.429.43174.4668.06277.2830先計算校正項(xiàng)C:再計算31將以上結(jié)果列成方差分析表表8-6不同小麥品系株高方差分析表F4,20,0.05=2.87,F(xiàn)4,20,0.01=4.43,F(xiàn)>F0.01,即P<0.01,拒絕H0,5個不同小麥品系的株高差異極顯著。習(xí)慣用“NS”表示在=0.05水平差異不顯著,“*”為在=0.05水平差異顯著,

“**”為在=0.01水平差異顯著,常稱差異“極顯著”(highlysignificant),“***”為在=0.001水平差異顯著,常稱差異“非常顯著”(extremelysignificant)。變差來源平方和自由度均方F品系間13.74432.9442.23**誤差15.58200.78總和147.3224328.3隨機(jī)效應(yīng)模型8.3.1隨機(jī)效應(yīng)線性統(tǒng)計模型8.3.2均方期望與統(tǒng)計量F338.3.1隨機(jī)效應(yīng)線性統(tǒng)計模型實(shí)驗(yàn)中,若參加實(shí)驗(yàn)的a個水平,是從該因素的水平總體中隨機(jī)抽出的,那么這一因素稱為隨機(jī)因素。其方差分析是通過隨機(jī)選取的a個水平對該因素的水平總體做推斷。要求水平的總體是無限總體,即使不是無限總體,也應(yīng)相當(dāng)大,以至于可以認(rèn)為是無限總體。隨機(jī)效應(yīng)的線性統(tǒng)計模型是:34其中i和ij都是隨機(jī)變量。如果i具有方差2并且獨(dú)立于ij,那么觀測值的方差為:var(yij)=2+2方差2和2稱為方差分量(variancecomponent)。在這個模型中,要求ij為NID(0,2)變量,i為NID(0,2)變量(NID表示獨(dú)立正態(tài)分布),i是獨(dú)立隨機(jī)變量,就意味著在固定效應(yīng)模型中,的假設(shè)在這里不再適用。在隨機(jī)變量效應(yīng)模型中,對單個處理效應(yīng)的檢驗(yàn)是無意義的,所要檢驗(yàn)的是關(guān)于i的變異性的假設(shè),因而H0:2=0,相當(dāng)于1=2=...=a;HA:2>0如果接受H0,則表示處理之間沒有差異;若拒絕H0而接受HA,則表示處理之間存在差異。358.3.2均方期望與統(tǒng)計量F隨機(jī)模型方差的做法仍然是將總平方和分解:自由度做同樣分解:dfT=dfA+dfE

由此可以得出MSA和MSE。MSA的數(shù)學(xué)期望:36在隨機(jī)效應(yīng)模型中,i不同于固定效應(yīng)模型,不再是常量,而是服從N(0,2)的隨機(jī)變量。因而MSA的數(shù)學(xué)期望是由

組成而不是由

組成。同理可證用F上尾單側(cè)檢驗(yàn),則由均方期望可以看出:若H0成立,則分子分母均為2的無偏估計量。但在備擇假設(shè)下,則分子的數(shù)學(xué)期望大于分母的數(shù)學(xué)期望。因而,當(dāng)F>Fa-1,N-a.時拒絕H0。37隨機(jī)效應(yīng)模型方差分析的程序與固定效應(yīng)模型完全一樣,但由于獲得樣本的方式不同,致使所得結(jié)論不同。隨機(jī)效應(yīng)模型適用于水平的總體,而固定模型只適用于所選定的a個水平。下面計算例8.2,并對結(jié)果加以解釋。解:將表8-2中的每一個數(shù)值都減去30,列成表8-7

例8.2數(shù)據(jù)編碼后的簡易計算表4.73.2-2.92.93.3-4.0-6.71.4-3.8-1.4-2.2-4.31.62.3-3.3-2.0總和5.80.1-15.1-2.0-11.233.640.01228.014.00265.6649.9833.4969.0332.86185.3638將以上結(jié)果列成表8-8動物出生重方差分析表F3.12,0.05=3.49,

F<F0.05,所以差異不顯著。通過對4窩動物出生重的調(diào)查,可推斷出不同窩別動物的出生重沒有顯著差異。變差來源平方和自由度均方F窩間58.575319.5251.97NS誤差118.945129.912總和177.5215398.4t檢驗(yàn)和one-wayANOVA的關(guān)系單因素分析,如果僅有2個組,既可用t檢驗(yàn)也可用one-wayANOVA的F檢驗(yàn)。例在A、B兩片林地各隨機(jī)抽取11株某種植物的成年植株測定樹高,得到數(shù)據(jù)如下:林地株數(shù)樹高(cm)合計平均A1157120101137119117104735368118106797B11893082503922573296813861656分別用t檢驗(yàn)和one-wayANOVA的F檢驗(yàn)對兩片林地該樹種高度的差異進(jìn)行檢驗(yàn)。設(shè)A、B兩片林地該樹種高度均服從正態(tài)分布。40解:t檢驗(yàn)應(yīng)先進(jìn)行方差齊性檢驗(yàn)(略)s12=847.2,s12=704.8假設(shè)為:H0:1=2,HA:12計算統(tǒng)計量:t0.05/2(n1+n2-2)=t0.025(20)=2.086,t0.01/2=

t0.005=2.845,故拒絕H0,A、B兩片林地該樹種高度的差異極顯著。41one-wayANOVA的F檢驗(yàn)假設(shè)為:H0:1=2,HA:12計算統(tǒng)計量:從表中得,,從而

SSE=SST-SSA=15520林地樹高(cm)A571201011371191171047353681181067111971103499B89308250392257329681386164154434496168315351513799542方差分析表為故拒絕H0,認(rèn)為A、B兩片林地該樹種高度的差異極顯著。即兩種檢驗(yàn)結(jié)論一致。注意,a=2時,one-wayANOVA的F檢驗(yàn)的臨界值和統(tǒng)計量均為t檢驗(yàn)的平方。變差來源平方和自由度均方或均方和F值臨界值顯著性組間或處理間(A)9245.519245.511.91F0.05(1,20)=4.351F0.01(1,20)=8.096**誤差或組內(nèi)或處理內(nèi)(E)1552020776總和(T)24765.521438.5

多重比較8.5.1最小顯著差數(shù)檢驗(yàn)8.5.2Duncan檢驗(yàn)44假定對一個固定效應(yīng)模型經(jīng)過方差分析后,結(jié)論是拒絕H0,即處理之間存在差異,其含義是至少有兩個平均數(shù)之間存在顯著差異。但這并不是說每對處理之間都存在差異。為了弄清究竟哪些對之間存在顯著差異,哪些對之間無顯著差異,必須在各處理平均數(shù)之間一對一地做比較,這就是多重比較(multiplecomparison)。多重比較的方法很多,這里只介紹LSD法和Duncan法。需要強(qiáng)調(diào)的是,無論采取哪種多重比較法,都必須在進(jìn)行了F檢驗(yàn)、確定在平均數(shù)之間有顯著差異之后再進(jìn)行,如果F檢驗(yàn)的結(jié)果是在平均數(shù)之間不存在顯著差異,則無需進(jìn)行多重比較。458.5.1最小顯著差數(shù)檢驗(yàn)最小顯著差數(shù)檢驗(yàn)(LSDtest,leastsignificantdifferencetest),是為每一對要比較的平均數(shù)計算一個在顯著水平下的最小顯著差數(shù),然后將兩個平均數(shù)的差值與該LSD比較,如果這個值大于LSD,則推斷這一對平均數(shù)差異顯著。它的計算方法簡述如下:對兩組數(shù)據(jù)平均數(shù)差數(shù)的差異顯著性檢驗(yàn),可用成組數(shù)據(jù)t檢驗(yàn),假設(shè)H0:i=j,HA:ij。(雙側(cè))計算統(tǒng)計量46其中,MSE為誤差均方,ni為每一處理的觀測次數(shù),于是t>t0.05(雙側(cè))(課本有誤)時差異顯著,t>t0.01(雙側(cè))時差異極顯著。因此差異顯著時并且可得到當(dāng)時,差異顯著。47稱為最小顯著差數(shù),記為LSD(各水平重復(fù)數(shù)相等時,每對比較時的LSD均相等)。每一對平均數(shù)的差與LSD比較,當(dāng)時否定H0,推斷這兩個平均數(shù)在顯著水平下差異顯著,否則差異不顯著。可以看出,LSD法本質(zhì)上仍然是兩個均數(shù)差異的t檢驗(yàn),與常規(guī)的t檢驗(yàn)不同之處在于用MSE和dfE代替了由兩個樣本算出的合并方差和自由度。488.5.2Duncan多重極差檢驗(yàn)LSD是一種很有用的檢驗(yàn)方法,計算起來很方便,也容易比較,但有難以克服的缺點(diǎn):會加大犯Ⅰ型錯誤的概率。為了克服上述缺點(diǎn),Newman(1930),Tukey(1953)等人都提出過不同的方法。比較普遍用的是Newman-Keuls檢驗(yàn)法和Duncan檢驗(yàn)法。Carmer和Swanson(1973)比較了上述諸法及其他的檢驗(yàn)方法后指出:在確定各平均數(shù)對子之間的差異時,Duncan檢驗(yàn)優(yōu)于Newman-Keuls檢驗(yàn)。因此,在這里只介紹Duncan多重極差檢驗(yàn)(Duncanmultiplerangetest)。49這個方法是在加以內(nèi)兩個平均數(shù)時先按它們“所包含的范圍”計算一個最小顯著極差,一旦兩個樣本平均數(shù)之差大于這個極差,就推斷這兩個平均數(shù)差異顯著。假設(shè)H0:i=j,HA:ij。具體方法如下:首先,將需要比較的a個平均數(shù)由大到小排序。并將每一對之間的差列成表8-9:Duncan檢驗(yàn)中,不同對平均數(shù)的差有不同的臨界值Rk。50其中r(k,df)的值可以從附表9(多重比較中的Duncan表)查出:表的最左邊一列是誤差項(xiàng)自由度df=dfE=N-a,最上一行為k值,表體為r(k,df)。表中的k是相比較的兩個平均數(shù)之間所包含的平均數(shù)的個數(shù)。如兩個要比較的平均數(shù)相鄰時k=2,兩個要比較的平均數(shù)中間隔一個平均數(shù)時k=3,依此類推。因?yàn)槠骄鶖?shù)共有a個,所以需查a-1個r,分別乘以

,得515253先從表8-9的第一行最左邊的一個差開始比較。若,則與差異顯著,否則差異不顯著,依此比較下一個。第一行比較完之后用同樣的方法比較第二行。先從第二行最左邊的一個差開始,在到這個范圍內(nèi)共包含a-1個平均數(shù),因此應(yīng)與比較。若,則差異顯著,否則不顯著……第二行比較完再比較第三行……直到所有平均數(shù)的差均與其相應(yīng)的Rk比較完為止。對于顯著的標(biāo)上“*”,極顯著的標(biāo)上“**”。下面比較例8.1中各平均數(shù)的差數(shù)。首先將各平均數(shù)按次序排列好。54再列成表8-10:臨界值也列成表格。表8-6已經(jīng)給出誤差均方MSE=0.78,n=5,于是55對于k=2,3,4,5,

df=a(n-1)=5(5-1)=20,分別求出r0.05,r0.01和Rk值并列成表8-11:首先用=0.05水平做檢驗(yàn)。與R5比較,=6.4>R5

=1.284

,因此與差異是顯著的。在6.4上打一個“*”。>R4,在5.5上打一個“*”。第一行全都是顯著的。然后比較第二行、第三行。只有與

的差不顯著。對于顯著的差數(shù)再以=0.01的水平做檢驗(yàn)。除之外,全部達(dá)到極顯著,對于極顯著的標(biāo)“**”

。以上全部工作完成之后,便可一眼看出兩兩平均數(shù)之間的差異的顯著程度。568.6

方差分析應(yīng)具備的條件8.6.1方差分析應(yīng)滿足三個條件8.6.2多個方差齊性檢驗(yàn)578.6.1方差分析應(yīng)滿足三個條件第5章我們講過,對于不同的統(tǒng)計假設(shè)有不同的要求條件。例如,做2檢驗(yàn)時要求抽出樣本的總體,一定是一個服從正態(tài)分布的總體。這是因?yàn)?分布是建立在正態(tài)分布基礎(chǔ)之上的,若抽出樣本的總體不是正態(tài)總體,2檢驗(yàn)是無效的。方差分析存在同樣的情況。方差分析是建立在線性統(tǒng)計模型[(8.1)]基礎(chǔ)之上的,因此必須符合線性統(tǒng)計模型的要求。[(8.1)]式58指出,方差分析的每一個觀測值(yij)都是由三部分組成的:

(總平均數(shù)),i(第i次處理效應(yīng))和ij(隨機(jī)誤差)。這三個分量之間的關(guān)系式相加的。其中的隨機(jī)誤差是服從正態(tài)分布N(0,2)的獨(dú)立隨機(jī)變量,各處理的方差均為2。方差分析是在上述模型的基礎(chǔ)上建立起來的,也就是在上述三個條件下建立起來的。因此,只有在滿足上述條件的情況下,所建立起來的方差分析方法才可以使用。以上內(nèi)容歸納如下:59(1)可加性(獨(dú)立性):每組(或水平組合)內(nèi)的個體彼此間是獨(dú)立的。每個處理效應(yīng)與誤差效應(yīng)是可加的,yij=+i+ij。i為處理效應(yīng),ij為誤差效應(yīng)。由于有這一假定,不同的效應(yīng)才能被分解,才能最終判斷處理效應(yīng)是否比誤差效應(yīng)更顯著。(2)正態(tài)性:每組(或水平組合)所代表的總體服從正態(tài)分布。實(shí)驗(yàn)誤差是服從正態(tài)分布N(0,2)的獨(dú)立隨機(jī)變量。因此,被檢驗(yàn)的每一個總體也應(yīng)該是正態(tài)分布的。(3)方差齊性:每組(或水平組合)所代表的正態(tài)總體的方差相等。各處理的誤差方差應(yīng)具備齊性,它們有一個公共的總體方差2。60這些假設(shè)是方差分析的基本假設(shè),如果這些假設(shè)不滿足,檢驗(yàn)統(tǒng)計量F就不服從F分布,F(xiàn)檢驗(yàn)的可靠性就會受到影響。所以在進(jìn)行方差分析前,首先要考察這些假設(shè)能否滿足或近似滿足。以上三個條件中,獨(dú)立性(可加性)是比較容易滿足的,通過合理的實(shí)驗(yàn)設(shè)計來保證,如動物實(shí)驗(yàn)中應(yīng)盡量保證參試個體間沒有親緣關(guān)系等。正態(tài)性和方差齊性兩者相比,方差齊性對分析結(jié)果影響更大。雖然在各處理的樣本含量相等時可以減少不齊性的影響,但不等于沒有影響。因此在做方差分析之前應(yīng)先做多個方差齊性的檢驗(yàn)。只有在具備方差齊性條件下才可做方差分析,否則方差分析的結(jié)果并不可信。618.6.2多個方差齊性(同質(zhì)性)檢驗(yàn)在方差分析的三個條件中以方差齊性這一條件對實(shí)驗(yàn)結(jié)果的影響最大,因此在做方差分析之前,首先要檢驗(yàn)各處理組的方差是否具齊性,即對以下假設(shè)做檢驗(yàn)。H0:12=22=…=a2;HA:至少有兩個i2不相等多個方差齊性(同質(zhì)性)檢驗(yàn)(homogeneitytestforvariance)的方法很多,這里介紹HartleyF檢驗(yàn)、Cochran檢驗(yàn)和Bartlett檢驗(yàn)。62這個方法只適用于所有樣本的含量均相等的情形。假設(shè)H0:12=…=i2=…=a2=2,HA:至少有兩個i2不相等。其中i2為第i個樣本所代表的總體的方差,a為樣本數(shù)。檢驗(yàn)統(tǒng)計量:式中:分別為最大和最小的樣本方差。這個統(tǒng)計量的分布由兩個參數(shù)-樣本數(shù)a和各樣本的自由度df=n-1所決定,Hartley為此專門建立了該分布在顯著性水平=0.05和=0.01時的臨界值表(Hartley方差同質(zhì)性檢驗(yàn)臨界值表,本教材未給出。注意該表和一般的F分布臨界值表不同)。(1)HartleyF檢驗(yàn)

63例設(shè)有3個樣本的方差分別為6.21、5.12和4.34,樣本含量均為20,試對這3個樣本所在總體的方差的同質(zhì)性進(jìn)行檢驗(yàn)(=0.05)。解:H0:12=22=32,HA:至少有兩個方差不相等。Fmax=6.21/4.34=1.43查Hartley方差同質(zhì)性檢驗(yàn)臨界值表F0.05(a=3,df=19)=2.95,F(xiàn)max<F0.05(a=3,df=19),所以接受零假設(shè),認(rèn)為這3個樣本所在總體的方差具有同質(zhì)性。64這個方法適用于當(dāng)某個樣本方差明顯大于其他樣本方差的情形。假設(shè)同HartleyF檢驗(yàn)。檢驗(yàn)統(tǒng)計量:式中:為第i個樣本的方差,a為樣本數(shù)。這個統(tǒng)計量的分布也由兩個參數(shù)-樣本數(shù)a和各樣本的自由度df=n-1(各樣本含量相等)或df=-1(各樣本含量不等但差別不大,是各樣本含量的調(diào)和平均數(shù))所決定,Cochran為此專門建立了該分布在顯著性水平=0.05和=0.01時的臨界值表(Cochran方差同質(zhì)性檢驗(yàn)臨界值表,本教材未給出)。(2)Cochran檢驗(yàn)

65例設(shè)有5個樣本的方差分別為26、51、40、24和28,樣本含量均為10,試對這5個樣本所在總體的方差的同質(zhì)性進(jìn)行檢驗(yàn)(=0.05)。解:H0:12=22=32=42=52,HA:至少有兩個方差不相等。檢驗(yàn)統(tǒng)計量:查Cochran方差同質(zhì)性檢驗(yàn)臨界值表G0.05(a=5,df=9)=0.3286,Gmax<G0.05(a=5,df=9),所以接受零假設(shè),認(rèn)為這5個樣本所在總體的方差具有同質(zhì)性。66多個方差齊性(同質(zhì)性)檢驗(yàn)用的最為廣泛的是Bartlett檢驗(yàn)。Bartlett檢驗(yàn)適用于檢驗(yàn)不同正態(tài)總體的方差的同質(zhì)性,它可用于樣本含量不等的情形。Bartlett檢驗(yàn)的基本原理是:當(dāng)a個隨機(jī)樣本是從獨(dú)立正態(tài)總體中抽取時,可以計算出統(tǒng)計量K2。當(dāng)充分大時(n>3),K2的抽樣分布非常接近于a-1自由度的2分布。已經(jīng)證明,當(dāng)滿足正態(tài)性的假設(shè)時,Baetlett檢驗(yàn)是很敏感的。在正態(tài)性假設(shè)不能滿足時,不能使用Bartlett檢驗(yàn)。

(3)Bartlett檢驗(yàn)

67Bartlett檢驗(yàn)的統(tǒng)計量式中:a=樣本數(shù);dfi=第i個樣本的自由度=ni-1(ni為第i個樣本的含量);;si2=第i個樣本的方差;為平均樣本方差;K2>(a-1)2時拒絕H0。68例用Bartlett檢驗(yàn)對下表中給出的3個樣本所在的正態(tài)總體的方差的同質(zhì)性進(jìn)行檢驗(yàn)(=0.05)。解:H0:12=22=32,HA:至少有兩個方差不相等。檢驗(yàn)統(tǒng)計量:樣本號si2dfi=ni-1dfisi2lgsi2dfilgsi218.00864.000.90317.224824.67523.350.66933.346534.00416.000.60212.4048合計17103.3512.9761K2<(a-1)2=0.05(2)2=5.99,接受H0,即這3個方差是同質(zhì)的。69比較鹽度對某種魚生長的影響,隨機(jī)選取雄性2月齡體重相同且無親緣關(guān)系的20尾該種魚,每尾魚獨(dú)立培養(yǎng),處理鹽度分別為10、15、20、25ppt,每個鹽度5尾魚,其他培養(yǎng)條件相同,培養(yǎng)30天后每尾魚增重數(shù)據(jù)如下:8.7一個one-wayANOVA的完整例子鹽度(ppt)增重(g)合計平均1057375442602505015133941331914529201315132920901825182438221311523y..=600設(shè)同一鹽度下該種魚增重服從正態(tài)分布。就鹽度對該種魚以增重為指標(biāo)的生長影響的差異進(jìn)行檢驗(yàn)。如差異顯著,請分別用LSD法和Duncan法進(jìn)行多重比較。70解:首先進(jìn)行多個方差齊性檢驗(yàn)。H0:12=22=32=42,HA:至少有兩個i2不相等。s12=99.5,s22=154,s32=46,s42=88df=a-1=4-1=3,20.05(3)=7.815,K2<20.05(3),所以接受原假設(shè)12=22=32=42,即具有方差齊性。(注意:如不滿足方差齊性,可試數(shù)據(jù)轉(zhuǎn)換,下一章再介紹)

71再進(jìn)行one-wayANOVA的F檢驗(yàn)。第i種鹽度下的魚增重Yi~N(i,2),i=1,2,3,4。要檢驗(yàn)的統(tǒng)計假設(shè)為:H0:1=2=3=4,HA:至少有兩個i不相等。鹽度(ppt)增重105737544260250128981250015133941331914548214205201315132920901804162025182438221311529972645600225202097072從表中得從而變差來源平方和自由度均方F值臨界值顯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論