生物統(tǒng)計學(xué)課件_第1頁
生物統(tǒng)計學(xué)課件_第2頁
生物統(tǒng)計學(xué)課件_第3頁
生物統(tǒng)計學(xué)課件_第4頁
生物統(tǒng)計學(xué)課件_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第五章

方差分析25.1

方差分析的基本原理5.1.1自由度和平方和的分解5.1.2F分布與F測驗3

上章介紹了一個或兩個樣本平均數(shù)的假設(shè)測驗方法。本章將介紹k(k≥3)個樣本平均數(shù)的假設(shè)測驗方法,即方差分析(analysisofvariance)。這種方法的基本特點是:將所有k個樣本的觀察值和平均數(shù)作為一個整體加以考慮,把觀察值總變異的自由度和平方和分解為不同變異來源的自由度和平方和,進而獲得不同變異來源的總體方差估計值。4其中,扣除了各種試驗原因所引起的變異后的剩余變異提供了試驗誤差的無偏估計,作為假設(shè)測驗的依據(jù)。55.1.1自由度和平方和的分解

方差是平方和除以自由度的商。要將一個試驗資料的總變異分解為各個變異來源的相應(yīng)變異,首先必須將總自由度和總平方和分解為各個變異來源的相應(yīng)部分。因此,自由度和平方和的分解是方差分析的第一步。下面我們首先用一個例子來說明這一問題。6[例5.1]以A、B、C、D4種藥劑處理水稻種子,其中A為對照,每處理各得4個苗高觀察值(cm),試分解其自由度和平方和。藥劑苗高觀察值總和Ti平均數(shù)A182120137218B202426229223C101517145614D2827293211629T=336=2171、總變異把表中的全部觀察值作為一個組看待[即把4個處理(4組、每組有4個觀察值)合并成一組,共有24個觀察值],根據(jù)前面講過的計算平方和的公式,可以計算出總變異的平方和和自由度8自由度DFT=nk-1=4×4-1=15。表中的每一個觀察值,即包括有處理的效應(yīng)(不同藥劑對苗高的影響)又受到誤差的影響。其中:稱為矯正數(shù),用C表示。92、誤差效應(yīng)表中處理內(nèi)(組內(nèi))各觀察值之間,若不存在誤差,則各觀察值應(yīng)該相等,由于誤差是客觀存在的,因而處理內(nèi)(組內(nèi))各觀察值之間必然是有差異的,因此,可以用組內(nèi)(處理內(nèi))的差異度量誤差效應(yīng):10藥劑A內(nèi):藥劑B內(nèi):藥劑C內(nèi):藥劑D內(nèi):11從理論上講,這4個誤差平方和除以相應(yīng)的自由度得的誤差均方都可以作為總體誤差方差的無偏估計值。但是,用它們的加權(quán)平均值來估計總體誤差方差,則效果更佳。所以:每個組內(nèi)(處理內(nèi))的自由度為:n-1=4-1=3,12所以誤差的自由度為:DFe=k(n-1)=4(4-1)=123、處理效應(yīng)如果沒有處理效應(yīng),表中各個處理(組)平均數(shù)來度量處理效應(yīng)。從理論上講均應(yīng)該相等,因此可以用13需要注意的是,系樣本平均數(shù)的方差,為了進行正確的F測驗,必須使它們都是估的估值,而則是是的估值。。因而,處理(組間)平方和計同一參數(shù)應(yīng)為:1415本例中平方和:602=504+98自由度:15=3+12因此誤差平方和可以采用簡單的辦法計算SSe=SST-SSt=602-504=98。進而可得均方:16平方和與自由度的分解歸納為下表變異來源DFSSMS處理間(組間)k-1MSt誤差(組內(nèi))k(n-1)MSe總變異kn-1將上述例子推廣到一般,設(shè)有k組數(shù)據(jù),每組皆具n個觀察值,則資料共有nk個觀察值,其數(shù)據(jù)分組如表6.1(P99)。175.1.2F分布與F測驗

一、F分布在一個平均數(shù)為μ、方差為σ2的正態(tài)總體中隨機抽取兩個獨立樣本,分別求得和,將和的比值定義為F:其均方18按上述方法從正態(tài)總體中進行一系列抽樣,就可得到一系列的F值而作成一個F分布。它是具平均數(shù)μF=1和取值區(qū)間為[0,∞]的一組曲線;而某一特定曲線的形狀僅決定于參數(shù)ν1和ν2。

F分布下一定區(qū)間的概率可從已制成的統(tǒng)計表中查出。附表5給出了各種ν1和ν2下右尾概率α=0.05和α=0.0119二、F測驗在方差分析的體系中,F(xiàn)測驗可用于檢測某項變異因素的效應(yīng)或方差是否存在。所以在計算F值時,總是將要測驗的那一項變異因素的均方作分子,而以另一項變異(如誤差項)作分母。時的臨界F值。其值是專供測驗的總體方是否顯著大于的總體方差差而設(shè)計的(H0:對HA:>)。

≤20F測驗需具備的條件:(1)變數(shù)y遵循N(μ,σ2);[例6.3]在例6.1中算得藥劑間均方=168.00,藥劑內(nèi)均方=8.17,具有自由度ν1=3,ν2=12。試測驗藥劑間變異是否顯著大于藥劑內(nèi)變異?假設(shè)H0:對HA:α=0.05和彼此獨立。(2)21查附表5在ν1=3,ν2=12時

F0.05=3.49,F(xiàn)0.01=5.95實得F>F0.01P<0.01測驗計算:22將例6.1和例6.3的分析結(jié)果歸納在一起,列出方差分析表如下:變異來源DFSSMSF顯著F值藥劑處理間3504168.0020.56F0.05=3.49藥劑處理內(nèi)(誤差)12988.17F0.01=5.95總變異15602水稻藥劑處理苗高方差分析表推斷:否定H0:,接受HA:235.2

多重比較5.2.1最小顯著差數(shù)法5.2.2q法5.2.3新復(fù)極差法5.2.4多重比較方法的選擇245.2.1最小顯著差數(shù)法最小顯著差數(shù)法(leastsignificantdifferrence,簡稱LSD法)25[例6.4]試以LSD法測驗各種藥劑處理的苗高平均數(shù)之間的差異顯著性。由附表4,ν=12時,t0.05=2.179,t

0.01=3.055故LSD0.05=2.179×2.02=4.40(cm)

LSD0.01=3.055×2.02=6.17(cm)26處理苗高平均數(shù)差異顯著性0.050.01D29B23A18C14不同藥劑處理水稻苗高平均數(shù)比較(LSD法)abccAABBCC275.2.2q法

q測驗方法是將k個平均數(shù)由大到小排列后,根據(jù)所比較的兩個處理平均數(shù)的差數(shù)是幾個平均數(shù)間的極差分別確定最小顯著極差LSRα值的。28[例6.5]試以q法測驗各種藥劑處理的苗高平均數(shù)之間的差異顯著性。查附表7,得到當DF=12時,p=2,3,4的qα值29LSRα值Pq

0.05q

0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.397.2144.205.506.017.87處理苗高平均數(shù)差異顯著性0.050.01D29aAB23bABA18cBCC14cC不同藥劑處理水稻苗高平均數(shù)比較(q法)305.2.3新復(fù)極差法

新復(fù)極差法,又稱最短顯著極差法(shortestsignificantrange),與q法相似。計算LSRα值查的是SSRα值(附表8)而不是q表。LSRα值PSSR

0.05SSR

0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69315.2.4多重比較方法的選擇1、試驗事先確定比較的標準,凡是與對照相比較,或與預(yù)定要比較的對象比較,一般可選用最小顯著差數(shù)法;2、根據(jù)否定一個正確的H0和接受一個不正確的H0的相對重要性來決定。32方差分析的基本步驟:(1)分解平方和與自由度;(2)F測驗;(3)平均數(shù)的多重比較。335.3

方差分析的線性模型與期望均方5.3.1方差分析的線性數(shù)學(xué)模型5.3.2期望均方345.3.1方差分析的線性數(shù)學(xué)模型

方差分析是建立在一定的線性可加模型的基礎(chǔ)上的。所謂線性可加模型是指總體每一個變量可按其變異的原因分解成若干個線性組成部分,它是方差分析的基礎(chǔ)。35表6.1數(shù)據(jù)的線性模型可表示為:式中,μ為總體平均數(shù),τi為試驗處理效應(yīng),εij為隨機誤差具有N(0,σ2)。36

在以樣本符號表示時,樣本的線性組成為:是μ的無偏估計值,37385.3.2期望均方

在線性可加模型中,由于對τi有不同解釋產(chǎn)生了固定模型(I)和隨機模型(II)。一、固定模型(fixedmodel)

指試驗的各處理都抽自特定的處理總體,其處理效應(yīng)τi=(μi-μ)是一個固定的常量,我們的目的就在于研究τi,所測驗的假設(shè)是H0:τi=0或H0:μi=μ。39一般的栽培和飼養(yǎng)試驗,如肥料試驗、藥效試驗、密度試驗、飼料試驗、品種試驗等均屬于固定模型。[例6.8]以5個水稻品種作大區(qū)比較試驗,每品種作3次取樣,測定其產(chǎn)量,所得數(shù)據(jù)為單向分組資料。本試驗需明確各品種的效應(yīng),故為固定模型,方差分析和期望均方的參數(shù)列入下表:405個水稻品種產(chǎn)量的方差分析與期望均方表變異來源DFSSMS期望均方(EMS):固定模型品種間品種內(nèi)41087.624.021.92.40固定模型的處理效應(yīng)(本例為品種效應(yīng))τi屬于固定效應(yīng),固定效應(yīng)的方差用表示。固定模型的F測驗41二、隨機模型(randommodel)

指試驗中的各處理皆是抽自N(0,)的一組隨機樣本,因而處理效應(yīng)τi是隨機的,它會因試驗的不同而不同;故我們的目的不在于研究τi而在于研究τi的變異度。隨機模型在遺傳、育種和生態(tài)的研究試驗方面有較廣泛的用處。42[例6.9]研究秈粳雜交F5代系間單株干草重的遺傳變異,隨機抽取76個系進行試驗,每系隨機取2個樣品測定干草重(g/株)。因這76個系是隨機抽取的樣本,要從這些樣本來估計F5代系間單株干草重的遺傳變異,故這是隨機模型。其方差分析的結(jié)果如下:變異來源DFMS期望均方(EMS):固定模型系統(tǒng)間系統(tǒng)內(nèi)757672.7917.7743隨機模型的F測驗本例中系統(tǒng)內(nèi)MS估計了σ2,因而;系統(tǒng)間MS估計了因而44這是測驗處理效應(yīng)的變異度,而不是測驗處理效應(yīng)本身。本例F=72.79/17.77=4.09>F0.05,說明單株干草重存在遺傳變異。455.4

單向分組資料的方差分析5.4.1組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析5.4.2組內(nèi)又分亞組的單向分組資料的方差分析465.4.1組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析每組具n個觀察值的k組數(shù)據(jù)的符號表組別觀察值(yij,i=1,2,…,k;j=1,2,…,n)總和平均均方1y11y12…y1j…y1nT12y21y22…y2j…y2nT2:::…:…::::iyi1yi2…yij…yinTi:︰︰…:…::︰︰kyk1yk2…ykj…yknTkT=∑yij=∑y47

變異來源自由度DF平方和SS均方MSF期望均方EMS固定模型隨機模型處理間k-1誤差k(n-1)總變異nk-1組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析48組內(nèi)又分亞組的單向分組資料的方差分析

組別亞組觀察值亞組總和Tij亞組均數(shù)組總和Ti組均數(shù)1…::T12…::T2:…::::i1yi11yi12…yi1kyi1nTi1Ti2yi21yi22…yi2kyi2nTi2:::::::︰︰jyij1yij2…yijk…yijnTij:︰︰︰︰︰︰︰︰myim1yim2︰yimk︰yimnTim:…︰︰l…Ti49

設(shè)一系統(tǒng)分組資料共有l(wèi)組,每組內(nèi)有m個亞組,每一亞組內(nèi)有n個觀察值,則該資料共有l(wèi)mn個觀察值。其觀察值的線性模型為:將該線性模型變型得:50等式的左邊是總效應(yīng),它是由右邊的(1)組間變異;(2)同一組內(nèi)亞組間變異;(3)同一亞組內(nèi)各重復(fù)觀察值間的變異所構(gòu)成。其自由度和平方和的估計如下:1、總變異自由度DFT=lmn-1512、組間(處理間)變異自由度DFt=l-13、同一組內(nèi)亞組間的變異自由度524、亞組內(nèi)變異自由度53二級系統(tǒng)分組資料的方差分析變異來源DFSSMSF期望均方(EMS)混合模型隨機模型組間l-1組內(nèi)亞組間l(m-1)亞組內(nèi)lm(n-1)總變異lmn-154[例6.12]在溫室內(nèi)以4種培養(yǎng)液(l=4)培養(yǎng)某種作物,每種3盆(m=3),每盆4株(n=4),一個月后測定其株高生長量(mm),結(jié)果如下表,試作方差分析。培養(yǎng)液ABCD總和盆號A1A2A3B1B2B3C1C2C3D1D2D3生長量503545505555856570606065553540456045607070558565403040505065908070354585354050455055856570707575盆總和Tij180140175190215220320280280220265290T=2725培養(yǎng)液總和Ti495625880775培養(yǎng)液平均41.352.173.364.655一、自由度和平方和分解總自由度DFT=lmn-1=(4×3×4)-1=47培養(yǎng)液間自由度DFt=l-1=4-1=3培養(yǎng)液內(nèi)盆間自由度DFe1=l(m-1)=4×(3-1)=8盆內(nèi)株間自由度DFe2=lm(n-1)=4×3×(4-1)=365657582、培養(yǎng)液間差異二、F測驗1、盆間差異假設(shè)H0:,求得:F=157.81/89.06=1.77此F值小于ν1=8,ν2=36F0.05=2.22,所以接受H0假設(shè),求得:59推斷:該試驗同一培養(yǎng)液內(nèi)盆間的生長量無顯著差異;而不同培養(yǎng)液間的生長量有極顯著的差異。

F=2375.25/157.81=15.05此F值大于ν1=3,ν2=8F0.01=7.59,故否定,接受。60變異來源DFSSMSFF0.05F0.01培養(yǎng)液間37126.562375.5215.05﹡﹡4.077.59培養(yǎng)液內(nèi)盆間81262.50157.811.772.223.04盆內(nèi)株間363206.2589.06總變異4711595.31方差分析表61三、各培養(yǎng)液平均數(shù)間的比較pSSR0.05SSR0.01LSR0.05LSR0.0123.264.7411.8317.2133.395.0012.3118.1543.475.1412.6018.664種培養(yǎng)液的LSR值(新復(fù)極差測驗)624種培養(yǎng)液植株生長量(mm)的差異顯著性培養(yǎng)液平均生長量差異顯著性0.050.01C73.3aAD64.6aABB52.1bBCA41.3bC635.5

兩向分組資料的方差分析5.5.1組合內(nèi)只有單個觀察值的兩向分組資料的方差分析5.5.2組合內(nèi)有重復(fù)觀察值的兩向分組資料的方差分析645.5.1組合內(nèi)只有單個觀察值的兩向分組資料的方差分析設(shè)有A和B兩個因素,A因素有a個水平,B因素有b個水平,每一處理組合僅有一個觀察值,則全試驗共有ab個觀察值,其資料類型如下表:A因素B因素TiB1B2…BbA1y11y12…y1bT1.A2y21y22…y2bT2.:︰︰︰︰︰︰Aaya1ya2…yabTa.T.jT.1T.2…T.bT..…65觀察值的線性模型為:因此,總變異可分解成A因素效應(yīng)、B因素效應(yīng)和誤差效應(yīng)三個部分。其自由度和平方和的分解如下表:變異來源DFSSMSF混合模型EMS(A固定,B隨機)A因素a-1B因素b-1誤差(a-1)(b-1)總變異ab-166注意:這種類型資料,其誤差項是誤差與互作的混合項。因此只有AB不存在互作時,才能正確估計誤差。另外,為提高試驗的精確性。誤差自由度不能小于12。67[例5.13]采用5種生長素處理豌豆,未處理為對照,待種子發(fā)芽后,分別每盆中移植4株,每組6盆,每盆一個處理,試驗共有4組24盆,并按組排列于溫室中,使同組各盆的環(huán)境條件一致。當務(wù)盆見第一朵花時記錄4株豌豆的總節(jié)間數(shù),結(jié)果見下表,試作方差分析。68處理(A)組(B)總和Ti.平均IIIIIIIV未處理(CK)6062616024360.8赤霉素6565686526365.8動力精6361616024561.3吲哚乙酸硫酸腺嘌呤馬來酸64626167656263626261646525525325063.863.362.5總和T.j375382377375T=150969(1)自由度和平方和的分解70變異來源DFSSMSFF0.05F0.01組間35.451.82<1處理間565.8713.174.562.904.56誤差1543.302.89總變異23114.62方差分析表(2)F測驗組間效應(yīng):假設(shè)F=1.48/2.89<171推斷:組間環(huán)境條件無顯著差異,不同生長素處理有顯著差異。處理間效應(yīng):假設(shè)F=13.17/2.89=4.56(3)處理間比較此例有預(yù)先指定的對照,故用LSD法。72查得ν=15時,t0.05=2.131,t0.01=2.947LSD0.05=1.202×2.131=2.56,LSD0.01=1.202×2.947=3.54處理平均數(shù)與對照的差數(shù)對照(CK)赤霉素動力精吲哚乙酸硫酸腺嘌呤馬來酸60.865.861.363.863.362.5-5.0**0.53.0*2.51.7735.5.2組合內(nèi)有重復(fù)觀察值的兩向分組資料的

方差分析

設(shè)有A、B兩個試驗因素,A因素有a個水平,B因素有b個水平,共有ab個處理組合,每個組合有n個觀察值,則該資料共有abn個觀察值。如果試驗按完全隨機設(shè)計,則其資料類型如下表:74A因素B因素總和Ti..平均B1B2…BbA1y111y121…y1b1T1..y112y122…y1b2︰︰︰︰y11ny12ny1bnTij.T11.T12.T1b.A2y211y221…y2b1T2.y212y222…y2b2︰︰︰︰y21ny22ny2bnTij.T21.T22.T2b.︰︰︰︰︰︰︰Aaya11ya21…yab1Ta.ya12ya22…yab2︰︰︰︰ya1nya2n…yabnTij.Ta1.Ta2.Tab.T.j.T.1.T.2.…T.b.T...75線性模型為:各變異來源的自由度和平方和的估計為:變異來源DFSSMS處理組合ab-1A因素a-1B因素b-1A×B互作(a-1)(b-1)試驗誤差ab(n-1)總變異abn-176[例6.14]施用A1、A2、A33種肥料于B1、B2、B33種土壤,以小麥為指示作物,每處理組合種3盆,得產(chǎn)量結(jié)果(g)如下表,試作方差分析。變異來源MS期望均方(EMS)固定模型隨機模型混合模型(A隨機、B固定)A因素B因素A×B互作試驗誤差期望均方77肥料種類(A)盆土壤種類(B)總和Ti..平均B1(油沙)B2(二合)B3(白僵)A1121.419.617.6169.218.8221.218.816.6320.116.417.5Tij.62.754.851.7A2112.013.013.3118.213.1214.213.714.0312.112.013.9Tij.38.338.741.2A3112.814.212.0122.013.6213.813.614.6313.713.314.0Tij.40.341.140.6總和T.j.141.3134.6133.5T=409.4平均15.715.014.8781、自由度和平方和的分解792、F測驗將上述結(jié)果及自由度錄于方差分析表中,以固定模型作F測驗80變異來源DFSSMSFF0.01處理8202.5825.2227.283.71肥料間2179.3889.6996.656.01土類間23.961.982.136.01

肥料×土類419.244.815.184.58試驗誤差1816.700.928總變異26219.28813、平均數(shù)的比較(1)各處理組合平均數(shù)的比較p23456789SSR0.052.973.123.213.273.323.353.373.39SSR0.014.074.274.384.464.534.594.644.68LSR0.051.651.73

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論