第三講方差分析_第1頁
第三講方差分析_第2頁
第三講方差分析_第3頁
第三講方差分析_第4頁
第三講方差分析_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第四講方差分析

兩總體平均數(shù)間的差異顯著性可用t檢驗,但實際中常遇到比較多個總體(處理)平均數(shù)的問題,這時若仍用t檢驗就不適宜了。這是因為:4.1緒言(1)檢驗過程煩瑣例如,一試驗包含5個處理,采用t檢驗法要進行C52=10次兩兩平均數(shù)的差異顯著性檢驗;若有k個處理,則要作q=Ck2=k(k-1)/2次類似的檢驗。(2)無統(tǒng)一的試驗誤差對同一試驗的多個處理進行比較時,應(yīng)該有一個統(tǒng)一的試驗誤差。若用t檢驗作兩兩比較,由于每次比較需計算一個,故使得各次比較誤差不統(tǒng)一,同時沒有充分利用資料信息而使誤差估計的精確性降低,從而降低檢驗的靈敏性。(3)推斷的可靠性低,犯I型錯誤的概率增大

若用t檢驗進行多個處理平均數(shù)間的差異檢驗,會增大犯I型錯誤的概率(1-(1-)q),降低推斷的可靠性。

由于上述原因,多個平均數(shù)的檢驗不宜用t檢驗,須采用方差分析法。

這種方法是將k個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應(yīng)于不同變異來源的平方和及自由度,獲得不同變異來源總體方差的估計值;通過計算總體方差的估計值的適當(dāng)比值,檢驗各樣本所屬總體平均數(shù)是否相等。

“方差分析法是一種在若干能相互比較的資料組中,把產(chǎn)生變異的原因加以區(qū)分開來的方法與技術(shù)”,方差分析實質(zhì)上是關(guān)于觀測值變異原因的數(shù)量分析。

幾個常用術(shù)語:1、試驗指標(biāo)(experimentalresponseorindex)

為衡量試驗結(jié)果的好壞或處理效應(yīng)的高低,在試驗中具體測定的性狀或觀測的項目稱為試驗指標(biāo)。由于試驗?zāi)康牟煌x擇的試驗指標(biāo)也不相同。在畜禽、水產(chǎn)試驗中常用的試驗指標(biāo)有:日增重、產(chǎn)仔數(shù)、產(chǎn)奶量、產(chǎn)蛋率、瘦肉率、某些生理生化和體型指標(biāo)(如血糖含量、體高、體重)等。下一張

主頁

退出

上一張

2、試驗因素(experimentalfactor)

試驗中所研究的影響試驗指標(biāo)的因素叫試驗因素。如研究如何提高豬的日增重時,飼料的配方、豬的品種、飼養(yǎng)方式、環(huán)境溫濕度等都對日增重有影響,均可作為試驗因素來考慮。當(dāng)試驗中考察的因素只有一個時,稱為單因素試驗;若同時研究兩個或兩個以上的因素對試驗指標(biāo)的影響時,則稱為兩因素或多因素試驗。試驗因素常用大寫字母A、B、C、…等表示。下一張

主頁

退出

上一張

3、因素水平(leveloffactor)

試驗因素所處的某種特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平。如比較3個品種奶牛產(chǎn)奶量的高低,這3個品種就是奶牛品種這個試驗因素的3個水平;研究某種飼料中4種不同能量水平對肥育豬瘦肉率的影響,這4種特定的能量水平就是飼料能量這一試驗因素的4個水平。下一張

主頁

退出

上一張

因素水平用代表該因素的字母加添足標(biāo)1,2,…,來表示。如A1、A2、…,B1、B2、…,等。

4、試驗處理(treatment)

事先設(shè)計好的實施在試驗單位上的具體項目叫試驗處理,簡稱處理。在單因素試驗中,實施在試驗單位上的具體項目就是試驗因素的某一水平。例如進行飼料的比較試驗時,實施在試驗單位(某種畜禽)上的具體項目就是喂飼某一種飼料。所以進行單因素試驗時,試驗因素的一個水平就是一個處理。下一張

主頁

退出

上一張

在多因素試驗中,實施在試驗單位上的具體項目是各因素的某一水平組合。例如進行3種飼料和3個品種對豬日增重影響的兩因素試驗,整個試驗共有3×3=9個水平組合,實施在試驗單位(試驗豬)上的具體項目就是某品種與某種飼料的結(jié)合。所以,在多因素試驗時,試驗因素的一個水平組合就是一個處理。下一張

主頁

退出

上一張

5、試驗單位(experimentalunitorplot)

在試驗中能接受不同試驗處理的獨立的試驗載體叫試驗單位。在畜禽、水產(chǎn)試驗中,一只家禽、一頭家畜、一只小白鼠、一尾魚,即一個動物;或幾只家禽、幾頭家畜、幾只小白鼠、幾尾魚,即一組動物都可作為試驗單位。試驗單位往往也是觀測數(shù)據(jù)的單位。

下一張

主頁

退出

上一張

6、重復(fù)(repetitionorreplication)

在試驗中,將一個處理實施在兩個或兩個以上的試驗單位上,稱為處理有重復(fù);一處理實施的試驗單位數(shù)稱為處理的重復(fù)數(shù)。例如,用某種飼料喂4頭豬,就說這個處理(飼料)有4次重復(fù)。試驗設(shè)計三原則:randomization,replication,portionofcontrol下一張

主頁

退出

上一張

4.2方差分析的基本原理4.2.1基本原理為便于理解方差分析的基本原理,先看一個例子。例7.1

小麥品種對比試驗,6個品種,4次重復(fù),單因素完全隨機設(shè)計,得產(chǎn)量(kg/小區(qū))結(jié)果如下表:處理和yi.處理平均處理品種觀察值(重復(fù))1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.0024個小區(qū)的產(chǎn)量有高有低存在差異,稱為變異;處理和yi.處理平均處理品種觀察值(重復(fù))1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.00

各處理平均產(chǎn)量之間也存在差異,看作不同品種間生產(chǎn)能力的差異;

同一品種不同重復(fù)之間的產(chǎn)量也不相同,是由隨機誤差造成的;試驗結(jié)果的總變異是由兩類原因引起:(1)由施加試驗條件的影響引起試驗指標(biāo)的變異,稱處理間(組間)變異;(2)由隨機因素引起的變異,稱處理內(nèi)(組內(nèi))變異。

即:總變異=處理間變異+處理內(nèi)變異

用方差作為衡量各種變異量的尺度。

總方差ST2表示總變異,處理間方差St2表示處理間變異,處理內(nèi)方差Se2表示處理內(nèi)變異(作為誤差)。

把處理方差和誤差方差在一定意義下比較,當(dāng)處理間方差顯著地大于誤差方差時,表明處理因素對試驗指標(biāo)有顯著影響,這就是方差分析解決問題的基本思路。4.2.2方差分析的一般步驟

(1)平方和與自由度的分解

重復(fù)處理12…j…nyi.A1A2…Ai…Ak

y11

y12…y1j

…y1ny21

y22…y1j…y2n……………….

yi1

yi2…yij…yin………………yk1

yk2…ykj…ykny1.y2.…yi.…yk.……

假設(shè)單因素A有k個處理(水平)A1,A2,…,Ak,完全隨機化設(shè)計,每個處理有n次重復(fù),共有nk個觀測值。這類試驗資料的數(shù)據(jù)模式如下表所示。

重復(fù)處理12…j…nyi.A1A2…Ai…Ak

y11

y12…y1j

…y1ny21

y22…y1j…y2n……………….

yi1

yi2…yij…yin………………yk1

yk2…ykj…ykny1.y2.…yi.…yk.……其中:表示第i個處理n個觀察值的和;表示第i個處理的平均數(shù);表示全部觀察值的總和;表示全部觀察值的總平均數(shù)。

平方和分解總平方和是各觀測值yij與總平均數(shù)的離差平方和,記為SST。即其中所以稱為處理間平方和;稱為處理內(nèi)平方和或誤差平方和。易證平方和的計算公式如下:其中,C=y2··/(kn)稱為矯正數(shù)。處理間自由度,DFt=k–1;處理內(nèi)(誤差)自由度,DFe=nk

-k=k(n

-

1)。自由度分解總自由度,DFT=nk

–1;顯然,DFT=

DFt

+DFe計算均方

各部分平方和除以相應(yīng)的自由度便得到總均方、處理間均方和處理內(nèi)均方,分別記為MST

(或ST2)、MSt(或St2)和MSe(或Se2)。即(2)F檢驗

在單因素試驗結(jié)果的方差分析中,記i為第i處理(總體)的期望值(平均值),則假設(shè)為

H0:1=2=…=k,HA:各i不全相等在H0成立的條件下,

當(dāng)F≥F(DFt,DFe)時,否定H0,即認(rèn)為k個處理平均值之間差異顯著。然后進行多重比較;

當(dāng)F<F(DFt,DFe)時,接受H0,即認(rèn)為k個處理平均值之間差異不顯著,計算結(jié)束。列方差分析表:方差來源自由度平方和均方F值F臨界值處理誤差k-1k(n-1)SStSSeMStMSeF=MSt/MSeFα(DFt,DFe)總和nk-1SST

當(dāng)F≥F(DFt,DFe)時,否定H0,即認(rèn)為k個處理平均值之間差異顯著。然后進行多重比較;

當(dāng)F<Fα(DFt,DFe)時,接受H0,即認(rèn)為k個處理平均值之間差異不顯著,計算結(jié)束。對例7.1k=6,n=4處理和yi.處理平均處理品種觀察值(重復(fù))1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.00處理和yi.處理平均處理品種觀察值(重復(fù))1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.00DFT=nk–1=4×6–1=23;DFt=k–1=6-1=5;DFe=DFT

-DFt

=23–5=18MSt=SSt/DFt=1109.33/5=221.87MSe=SSe/DFe=158.50/18=8.81F=MSt/MSe=221.87/8.81=25.18;查F表F0.01(5,18)=4.25

因為F=25.18>F0.01(5,18)=4.25,所以則否定H0,接受HA,這表明不同處理平均值間差異顯著。即6個不同品種的平均產(chǎn)量間差異顯著。方差分析表方差來源自由度平方和均方F值F臨界值品種誤差5181109.33158.50221.878.8125.18**F0.01(5,18)=4.25總和231267.83

表中的F值應(yīng)與相應(yīng)的被檢驗因素齊行。經(jīng)F檢驗差異極顯著,故在F值25.18右上方標(biāo)記“**”(若

=0.05水平顯著,標(biāo)記“*”)。

因為F=25.18>F0.01(5,18)=4.25,所以則否定H0,接受HA,這表明不同處理平均值間差異顯著。即6個不同品種的平均產(chǎn)量間差異顯著。

設(shè)有k個處理,第i個處理有ni次重復(fù),試驗結(jié)果yij表示第i個處理的第j個觀察值(i=1,2,…,k;j=1,2,…,ni)。

N=n1+n2+…+nk為全部試驗數(shù)據(jù)個數(shù),C=y..2/N

為矯正數(shù),則平方和與自由度的計算公式為

重復(fù)數(shù)不等的情況DFT=N–1;DFt=k–1;DFe=DFT

–DFt均方與F值的計算公式不變。

例4.2

在食品衛(wèi)生檢驗中,對4種不同品牌臘肉的酸價進行了隨機抽樣檢測,得結(jié)果如下表,試分析4種不同品牌臘肉的酸價指標(biāo)有無顯著差異?品牌酸價(yij)yi

.

niA1A2A3A41.61.52.01.91.31.01.21.41.71.92.02.52.71.80.91.01.31.11.91.61.51.82.01.72.11.52.52.211.612.69.313.81.4982.1061.3371.977k=4,y..=11.6+12.6+9.3+13.8=47.6,N=28C=47.62/28=80.9200,SST=(1.62+…+2.22)-C=5.8800SSt=(11.62/8+12.62/6+9.32/7+13.82/7)-C=2.8027SSe=SST-SSt=5.8800-2.8027=3.0773DFT=N-1=28-1=27,DFt=k-1=4-1=3,DFe=DFT-DFt=27-3=24F=7.287>4.72,即4種不同品牌臘肉之酸價差異極顯著。方差分析表方差來源DFSSMSFF臨界值品牌間誤差3242.80273.07730.93420.12827.287**F0.01(3,24)=4.72總變異275.8800SST=5.8800,SSt=2.8027,SSe=3.0773MSt=SSt

/DFt=2.8027/3=0.9342,MSe=3.0073

/24=0.1282

4.3線性模型、期望均方與效應(yīng)模型4.3.1線性可加模型、期望均方單因素完全隨機設(shè)計試驗的方差分析模型:

yij=+i+ij,i=1,2,…,k;j=1,2,…,n其中:—總均值;i—第i處理效應(yīng)值,且1+…+k=0;

ij—隨機誤差且獨立同分布N(0,2)?;騳ij=i+ij,i=1,2,…,k;j=1,2,…,n其中:i—第i處理均值;

ij—隨機誤差且獨立同分布N(0,2)

方差分析是在效應(yīng)線性可加,誤差獨立正態(tài)等方差條件下進行的,這些條件稱為方差分析的基本假定。對模型中的參數(shù)進行估計。

分別是i和的無偏估計;其差值ti為i的無偏估計量。

檢驗H0:1=…=k

等價于H0:1=…=k=0對單因素完全隨機設(shè)計的方差分析有SST

=SSt+SSe,其中可以證明:DFt=k–1,因為DFe=k(n

-

1),所以誤差均方及處理均方的數(shù)學(xué)期望:DFt=k–1,因為DFe=k(n

-

1),所以誤差均方及處理均方的數(shù)學(xué)期望:其中稱為效應(yīng)方差。所以MSe是2的無偏估計,MSt是n2+2的無偏估計量.

當(dāng)處理效應(yīng)方差2=0,即各i(i=1,…,k)相等(H0成立)時,MSt與MSe一樣,方差分析是通過MSt

與MSe的比較進行推斷的。在H0成立下,由Cochran定理及第4章得

當(dāng)處理效應(yīng)方差2=0,即各i(i=1,…,k)相等(H0成立)時,MSt與MSe一樣,方差分析是通過MSt

與MSe的比較進行推斷的。在H0成立下,由Cochran定理及第4章得

當(dāng)給定顯著水平,當(dāng)F

F(k-1,nk-k)時,否定H0,即不同處理平均值間差異顯著;否則,則接受H0,即不同處理平均值間差異不顯著。4.3.2效應(yīng)模型固定模型

i為常數(shù)的線性模型。一般栽培試驗?zāi)P蜑楣潭P?。隨機模型

i為隨機變量的線性模型。一般育種試驗?zāi)P蜑殡S機模型?;旌夏P?/p>

對多因素而言,有的因素效應(yīng)是隨機的,有的因素效應(yīng)是固定的,這樣的線性模型是混合模型。

在數(shù)量遺傳學(xué)中把2記作g2

,稱遺傳型方差;而2記作e2,稱為環(huán)境方差,兩者之和p2=g2+e2稱為表現(xiàn)型方差。把g2與p2

的比值

在數(shù)量遺傳學(xué)中把2記作g2

,稱遺傳型方差;而2記作e2,稱為環(huán)境方差,兩者之和p2=g2+e2稱為表現(xiàn)型方差。把g2與p2

的比值稱為遺傳力。稱為遺傳變異系數(shù)。gcv%愈大,選得優(yōu)良遺傳型的潛力愈大。這個指標(biāo)可作為育種工作的參考。4.4處理平均數(shù)間的多重比較

因而須進行兩兩處理平均數(shù)間的比較,以判斷平均數(shù)間的差異顯著性。把多個平均數(shù)兩兩間的相互比較稱為多重比較。

多重比較方法甚多,常用的有:Fisher’s最小顯著差數(shù)(LSD)法、Tukey’s固定極差法和Dunnett’s最小顯著差數(shù)法。F檢驗否定H0,表明總變異主要來源于處理間變異,各處理平均數(shù)間存在顯著差異;但并不意味著每兩兩平均數(shù)間都差異顯著,也不能具體說明哪些有顯著差異,哪些無差異顯著。4.4.1Fisher's最小顯著差數(shù)法

若>LSD時,則處理Ai與Aj的平均值之間在水平上差異顯著;反之,則差異不顯著。最小顯著差數(shù)計算公式為:

基本做法是:在F檢驗顯著的前提下,先計算出顯著水平為的最小顯著差數(shù)LSD,然后將任意兩個處理平均數(shù)的差數(shù)的絕對值與其比較。

按平均數(shù)從大到小自上而下排列出多重比較表,將平均數(shù)多重比較表中兩兩平均數(shù)的差數(shù)與LSD比較,作出統(tǒng)計推斷。對例7.1,MSe=8.81,DFe=18,n=4.多重比較表(LSD法)平均數(shù)處理-33.0-33.5-39.25-40.0-45.0A152.7519.75*19.25*13.5*12.75*7.75*A445.0012.00*11.50*5.75*5.00*A640.007.00*6.50*0.75A239.256.25*5.75*A533.500.50A333.00小于4.41者不顯著;大于4.41者顯著,在差數(shù)的右上方標(biāo)記“*”。4.4.2Tukey法在F檢驗顯著下,計算出顯著水平為的最小顯著差數(shù)TFR

,然后將任意兩個處理平均數(shù)的差數(shù)的絕對值與其比較。

若>TFR

時,則Ai與Aj的平均值之間在水平上差異顯著;反之不顯著。TFR

計算公式為:其中:k—處理數(shù);q

(k,DFe)—查q表。上例,k=6;DFe=18;MSe=8.81;n=4;q0.05(6,18)=4.49.多重比較表(Tukey法)平均數(shù)處理-33.0-33.5-39.25-40.0-45.0A152.7519.75*19.25*13.5*12.75*7.75*A445.0012.00*11.50*5.755.00A640.007.00*6.500.75A239.256.255.75A533.500.50A333.00

品種A1的平均產(chǎn)量與其它5個品種有顯著差異;A4與A5和A3有顯著差異;A6與A3有顯著差異;其它無差異。上例,k=6;DFe=18;MSe=8.81;n=4;q0.05(6,18)=4.49.4.4.3Dunnett's最小顯著差數(shù)法其中:Dt(k-1,DFe)—查附表;

在F檢驗顯著下,計算顯著水平為的最小顯著差數(shù)DLSD,然后將兩個處理平均數(shù)的差數(shù)的絕對值與其比較。該方法主要應(yīng)用于各處理平均值與對照處理平均值之間的比較。如例7.1中A1~A5是國內(nèi)自己培育的,要與國外引進的品種A6進行比較。對例7.1,MSe=8.81,DFe=18,n=4,k=6.對例7.1,MSe=8.81,DFe=18,n=4,k=6.品種A1~A5與對照品種A6的平均產(chǎn)量多重比較表(Dunnett法)比較A1-A612.7512.75*A4-A65.005.00A2-A6-0.750.75A5-A6-6.506.50*A3-A6-7.007.00*A1的平均產(chǎn)量顯著地高于對照品種A6;A5、A3顯著地低于對照品種A6;品種A4和A2的平均產(chǎn)量與品種A6無顯著差異。4.4.4多重比較方法的選擇

上述三種方法,當(dāng)k=2時比較結(jié)果一致。當(dāng)k>2時,LSD法、DLSD法和Tukey法的值從小到大,即LSD法最“松”(易顯著),Tukey法最“嚴(yán)”。具體選擇哪種方法視具體情況而定。注意:當(dāng)處理重復(fù)數(shù)不等時n的估計為式中k為處理數(shù),ni(i=1,…,k)為第i個處理的重復(fù)數(shù)。對例4.2

用LSD法,DFe=24,MSe=0.1282,k=4,N=28處理平均值差值=0.05=0.01A2A4A1A32.101.971.471.330.130.63**0.50*0.77**0.64**0.14

aAaABbBCbC多重比較表(LSD法)

4.4.5多重比較結(jié)果的表示方法

(1)三角形表示法上述方法即為三角形表示法。優(yōu)點:簡便直觀。缺點:占篇幅較大。

(2)標(biāo)記字母法將各處理平均數(shù)由大到小自上而下排列;在最大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論