




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、2第六章方差分析第一節(jié)方差分析的基本原理上章介紹了 1個或兩個樣本平均數(shù)的假設(shè)測驗方法。本章將介紹k(k>3)個樣本平均數(shù)的假設(shè)測驗方法,即方差分析(analysis of varianee)。方差分析就是將總變異剖分為各個變異來源 的相應(yīng)部分,從而發(fā)現(xiàn)各變異原因在總變異中相對重要程度的一種統(tǒng)計分析方法。其中,扣除方差了各種試驗原因所引起的變異后的剩余變異提供了試驗誤差的無偏估計,作為假設(shè)測驗的依 據(jù)。因而,方差分析象上章的t測驗一樣也是通過將試驗處理的表面效應(yīng)與其誤差的比較來進 行統(tǒng)計推斷的,只不過這里采用均方來度量試驗處理產(chǎn)生的變異和誤差引起的變異而已。分析是科學的試驗設(shè)計和分析中的
2、一個十分重要的工具。本章將在介紹方差分析基本原理和方法的基礎(chǔ)上進一步介紹數(shù)學模型和基本假定。、自由度和平方和的分解方差是平方和除以自由度的商。 要將一個試驗資料的總變異分解為各個變異來源的相應(yīng)變異,首先必須將總自由度和總平方和分解為各個變異來源的相應(yīng)部分。因此,自由度和平方和的分解是方差分析的第一步。下面先從簡單的類型說起。設(shè)有k組數(shù)據(jù),每組皆具n個觀察值,6.1。則該資料共有nk個觀察值,其數(shù)據(jù)分組如表表6.1 每組具n個觀察值的k組數(shù)據(jù)的符號表組別觀察值(yij , i=1,2,,k; j=1, 2,n)總和平均均方1y11y12y1jy1nT1y12S12y21y22-y2jy2nT2y
3、22S2MMMMMMMMiyi1yi2yijyinTiyi2SiMMMMMMMkyk1yk2ykjyknTkYks2T 乏 yij =Zyy在表6.1中,總變異是nk個觀察值的變異,故其自由度 v=nk -1,而其平方和SST則為: nk_nk(6 1)SS =Z(yij y)2 =Zy2 -C1 1(6 1)中的C稱為矯正數(shù):(6 2)C=(竝工這里,nnk nk可通過總變異的恒等變換來闡明總變異的構(gòu)成。對于第i組的變異,有_2n _2n _2n _ n - -Syij -y) =11 yj -yVi y)N)十皆®$)( Vi y)+2($ y)二 2 2 = 2(yij yi)
4、 +n (yi y)j 4總變異為第1, 2,k組的變異相加,利用上式總變異(6 1)可以剖分為:knokn2k2SSt =送送® y) =SZ(yij-yi) +n Z(yy)即總平方和SSt=組內(nèi)(誤差)平方和SSe+處理平方和組間變異由k個yi的變異引起,故其自由度 V =k-1,組間平方和kkfSS =n無(yi -y)=送/n -C11/組內(nèi)變異為各組內(nèi)觀察值與組平均數(shù)的變異,故每組具有自由度n2Z(yij -yi)2 ;而資料共有k組,故組內(nèi)自由度 v=k(n 1),組內(nèi)平方和1(6 3)SStSS為:(6 4)V = n -1和平方和SSe 為:k n2sS3 =ZZ(
5、yij -%) =sst -SS1 1 因此,得到表6.1類型資料的自由度分解式為:(nk -1) =(k -1) +k(n -1)總自由度DFt=組間自由度DFt+組內(nèi)自由度 求得各變異來源的自由度和平方和后,(6-5)(6DFe-6)總的均方mst2=St組間的均方MSt=St2組內(nèi)均方MSe進而可得n k -1=遼(弘y)2-SZ(yj - Yi)2ZZ( yj -y)2(67)k(n-1)若假定組間平均數(shù)差異不顯著 (或處理無效)時,(6 7)中MSt與MSe是b2的兩個獨立估 值,均方用 MS表示,也用s2表示,兩者可以互換。其中組內(nèi)均方 MSe也稱誤差均方,它是 由多個總體或處理所
6、提供的組內(nèi)變異(或誤差)的平均值。例6.1 以A、B、C、D 4種藥劑處理水稻種子,其中A為對照,每處理各得 4個苗高觀察值(cm),其結(jié)果如表6.2,試分解其自由度和平方和。表6.2 水稻不同藥劑處理的苗高(cm)藥劑苗高觀察值總和Ti平均yiA18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336y =21根據(jù)(6 6)進行總自由度的剖分:總變異自由度 DF T= (n k-1) = (4 x4)-1 = 15藥劑間自由度 DFt=(k-1) =4-1 =3藥劑內(nèi)自由度 DFe=k( n-1) =4x(4-
7、1) =12根據(jù)(6 3)進行總平方和的剖分:T 23362C = = =7056nk 4 x4SS Zyi2 -C =182 +212 +A + 322 -C =602kSSt =-y) -STj2/n-C =(722 +922 +562 +1162)/4 -C =5042 2 2 2SSt =4X(18 -21) +(23 -21) +(14 -21) +(29 -21) =504k n2nk2k2/SSe =ZZ(yij -Vi) =Zyij -ZTi /n =SSt SS =602-504 =981 1 /=182 +212 +202 +132 -722/4 =38=202 +242
8、+262 +222 -922/4 =20=102 +152 +172 +142 -562/4 =262 2 2 2 2 丿=28 +27 +29 +32 -116 /4=14藥劑藥劑藥劑藥劑內(nèi):內(nèi):內(nèi):SSe=ZZ(yij-yi )2=38 +20 +26 +14 =98誤差平方和也可直接計算。進而可得均方:MSt =sTMStMSe =s2以上藥劑內(nèi)均方s2 =8.17系4種藥劑內(nèi)變異的合并均方值,它是表 估計;藥劑間均方 st2 =168.00,則是不同藥劑對苗高效應(yīng)的變異。所以=602/15 =40.13=504/3 =168.00=98/12 =8.176.2資料的試驗誤差、F分布與F
9、測驗分別求得其均方sj在一個平均數(shù)為 卩、方差為CT 2的正態(tài)總體中,隨機抽取兩個獨立樣本, 和s,將S12和s;的比值定義為F:(6 8)F(v V)2/2=& / S2此F值具有S12的自由度V1和s2的自由度V2。如果在給定的 匕和V2下按上述方法從正態(tài)總體中進行一系列抽樣, 就可得到一系列的 F值而作成一個F分布。統(tǒng)計理論的研究證明,F(xiàn)分布乃具有平均數(shù) 4f=1和取值區(qū)間為0,8 的一組曲線;而某一特定曲線的形狀則僅決定 于參數(shù)V1和叫。在*1 = 1或*1=2時,F(xiàn)分布曲線是嚴重傾斜成反向 J型;當V1 > 3時,曲線轉(zhuǎn) 為偏態(tài)(圖6.1)。F分布下一定區(qū)間的概率可從已
10、制成的統(tǒng) 計表查出。附表 5系各種v1和十2下右尾概率 a =0.05和a =0.01時的臨界F值(一尾概率 表)。如查附表 5, w=3,十2=12 時,F(xiàn)0.05 = 3.49 , F0.01 = 5.95 ,即表示如以 V1 =3( n1=4)、 V2 = 12( n2=13)在一正態(tài)總體中進行連續(xù)抽樣, 則所得F值大于3.49的概率僅有5%,而大于 5.95的僅有1%。附表5的數(shù)值設(shè)計是專供測 驗s2的總體方差 切2是否顯著大于s2的總體方 差b;而設(shè)計的(H0: b; W b;對Ha : b; > b;)。這時,F(xiàn) =S12/s;。若所得 F > F 0.05或 F0.0
11、1,則H0發(fā)生的概率小于等于0.05或0.01 ,應(yīng)該在a =0.05或a =0.01水平上否定 H。,接受 的概率大于0.05或0.01,應(yīng)接受H0。F圖6.1 F分布曲線(隨M和口的不同而不同)Ha;若所得 F< Fo.05或F V F0.01,貝U Ho發(fā)生在方差分析的體系中,F(xiàn)測驗可用于檢測某項變異因素的效應(yīng)或方差是否真實存在。所以在計算F值時,總是將要測驗的那一項變異因素的均方作分子,而以另一項變異(例如試驗誤差項)的均方作分母。這個問題與方差分析的模型和各項變異來源的期望均方有關(guān),詳情見后。在此測驗中,如果作分子的均方小于作分母的均方,則F<1 ;此時不必查F表即可確定
12、P>0.05,應(yīng)接受H0。2 2 2F測驗需具備:(1)變數(shù)y遵循正態(tài)分布N (卩,CT),(2) S1和S2彼此獨立兩個條件。當 資料不符合這些條件時,需作適當轉(zhuǎn)換,參見本章第六節(jié)。例6.2測定東方紅3號小麥的蛋白質(zhì)含量 10次,得均方sf =1.621 ;測定農(nóng)大139小麥的蛋白質(zhì)含量5次,得均方S; =0.135。試測驗東方紅3號小麥蛋白質(zhì)含量的變異是否比農(nóng) 大139為大。假設(shè)H0:東方紅小麥總體蛋白質(zhì)含量的變異和農(nóng)大139 一樣,即H0: cr12=cr;,對Ha: crf2> 2。顯著水平取 a =0.05 , V1=9, V2=4 時,F(xiàn)0.05=6.00。測驗計算:F
13、 =1.621/0.135 =12.01 此 F > F0.05,即 P< 0.05。139。以上這種比較兩個事物變異大小的例子,在農(nóng)業(yè)研究中是常常遇到的。例如比較雜種 代和F1代的變異大小,比較兩種處理的草坪凍害程度等等,這些比較皆可應(yīng)用 必須以大均方作分子而計算F值。例6.3 在例6.1算得藥劑間均方St2 = 168.00,藥劑內(nèi)均方s2=8.17 ,V2 = 12。試測驗藥劑間變異是否顯著大于藥劑內(nèi)變異? 假設(shè) H0: cr;=cr2對 Ha: 寸 > 云,顯著水平取 a =0.05 , F0.05 = 3.49。測驗計算:F =168.00/8.1 7 =20.56
14、計算得F=20.56表示處理項的均方為誤差項均方的20.56倍。查附表5F0.05=3.49 , F0.01 =5.95,實得 F > F0.01 > F0.05。F2F測驗,但都具自由度Vi=3,=3, V2=12 時推斷:否定H0,接受Ha,即東方紅3號小麥蛋白質(zhì)含量的變異大于農(nóng)大推斷:否定H0: bt2 = b;,接受Ha: 62 >b訂即藥劑間變異顯著地大于藥劑內(nèi)變異,不同藥劑對水稻苗高是具有不同效應(yīng)的。以上通過例6.1說明了對一組處理的重復(fù)試驗數(shù)據(jù)經(jīng)對總平方和與總自由度的分解估計 出處理間均方和處理內(nèi)均方(誤差均方),并通過F =MSt/MSe測驗處理間所表示出的差
15、異是 否真實(比誤差大),這一方法即為方差分析法。這里所測驗的統(tǒng)計假設(shè)是H0 W或£ =4b =% =4d對Ha :屛或£、4b、卩C和Ad間存在差異(不一定 £、和 4d間均不等,可能部分不等)。例6.1和例6.3的分析結(jié)果可以歸納在一起,列出方差分析 表,如表6.3所示。表6.3水稻藥劑處理苗高方差分析表變異來源DFSSMSF顯著F值藥劑處理間3504168.0020.56 八Fo.O5(3,12) =3.49藥劑處理內(nèi)(誤差)12988.17Fo.O1(3,12) =5.95總15602第二節(jié)多重比較上節(jié)對一組試驗數(shù)據(jù)通過平方和與自由度的分解,將所估計的處理
16、均方與誤差均方作比 較,由F測驗推論處理間有顯著差異,對有些試驗來說方差分析已算告一段落,但對有些試 驗來說,其目的不僅在于了解一組處理間總體上有無實質(zhì)性差異,更在于了解哪些處理間存在真實差異,故需進一步做處理平均數(shù)間的比較。一個試驗中k個處理平均數(shù)間可能有k(k-1)/2個比較,因而這種比較是復(fù)式比較亦稱為多重比較(multiple comparisons)。通過方差分析后進行平均數(shù)間的多重比較,不同于處理間兩兩單獨比較。因為(1)誤差由多個處理內(nèi)的變異合并估計,自由度增大了,因而比較的精確度也增大了;(2)由于F測驗顯著,證實處理間總體上有真實差異后再做兩兩平均數(shù)的比較,不大會像單獨比較時
17、那樣將個別偶然性的差異誤判為真實差異。這種在F測驗基礎(chǔ)上再做的平均數(shù)間多重比較稱為Fisher氏保護下的多重比較(Fisher 'p rotected multi pie comp ariso ns )。顯然在無F測驗保護時,4個處理做兩兩比較,每一比較的顯著水平 a =0.05 , 4個處理間有6個比較,若處理間總體上無差異,每一比較誤判 為有差異的概率為 0.05,貝y 6個比較中至少有1個被誤判的概率為 a '=1 0.95 6 =0.2649。 若處理數(shù)k=10,則a '= 1 -0.95 45 =0.9006,因而盡管單個比較的顯著水平為0.05,但從試驗總體
18、上a(至少有1個誤判的概率)是很大的,這說明通過F測驗作保護是非常必要的。多重比較有多種方法,本節(jié)將介紹常用的三種:最小顯著差數(shù)法、復(fù)極差法(q法)和Duncan氏新復(fù)極差法。、最小顯著差數(shù)法最小顯著差數(shù)法(least significant differenee,簡稱LSD法),LSD法實質(zhì)上是第五章的t測驗。其程序是:在處理間的F測驗為顯著的前提下,計算出顯著水平為a的最小顯著差數(shù)LSDa;任何兩個平均數(shù)的差數(shù)(Vi -Vj),如其絕對值LSDa,即為在a水平上差異顯著;反之,則為在a水平上差異不顯著。這種方法又稱為 F測驗保護下的最小顯著差數(shù)法(Fisher'Protected
19、LSD,或 FPLSD)。已知:t=匸亠,j=1, 2,A, k; i Hj) syi _yj若tl A t。, Vi -yj即為在a水平上顯著。因此,最小顯著差數(shù)為:-9),因此(6 9)中的LSDa=t4idj(6當兩樣本的容量n相等時,Sy =J2Se/n在方差分析中,上式的 S2有了更精確的數(shù)值 MSe (因為此自由度增大)10)(6Sy,占為:Syz =J2MSe/n例6.4 試以LSD法測驗表6.2資料各種藥劑處理的苗高平均數(shù)間的差異顯著性。(2x8.17CCC,、Syi 衛(wèi)=J4 =2.02( cm)4, V = 12 時,t0.05=2.179 , t0.01=3.055LSD
20、0.05=2.179 X 2.02 =4.40( cm) ; LSD0.01=3.055 X 2.02 =6.17( cm)由(例 6.3)計算得 F=20.56 為顯著,MSe=8.17,DFe=12,由附表 故然后將各種藥劑處理的苗高與對照苗高相比,差數(shù)大于4.40 cm為差異顯著;大于6.17 cm為差異極顯著。由表6.2可知:藥劑D與A、D與C、以及B與C處理平均數(shù)差數(shù)分別為11、15和9,大于6.17,說明在0.01水平上差異顯著;藥劑 D與B、B與A處理平均數(shù)差數(shù)分 別為6和5,大于4.40,說明在0.05水平上差異顯著;藥劑 A與C處理平均數(shù)差數(shù)為 4,小 于4.40,差異不顯著
21、。二、q法LSD法的t測驗是根據(jù)兩個樣本平均數(shù)差數(shù)(k=2)的抽樣分布提出的,但是一組處理(k>2)是同時抽取k個樣本的結(jié)果。抽樣理論指出k=2時與k>2,例如k=10時其隨機極差是不同的,隨著k的增大而增大,因而用 k=2時的t測驗有可能夸大了 k=10時最大與最小兩個 樣本平均數(shù)差數(shù)的顯著性?;跇O差的抽樣分布理論Student-Newman-Keul提出了 q測驗或稱復(fù)極差測驗,有時又稱 SNK測驗或NK測驗。q測驗方法是將一組 k個平均數(shù)由大到小排列后, 根據(jù)所比較的兩個處理平均數(shù)的差數(shù)是 幾個平均數(shù)間的極差分別確定最小顯著極差LSR值的。q測驗因是根據(jù)極差抽樣分布原理的,
22、其各個比較都可保證同一個 a顯著水平。其尺度值構(gòu)成為:(6 11)LSRj =qa df, pSESE=jMSe/ n(6 12)式中2< pw k, p是所有比較的平均數(shù)按大到小順序排列所計算出的兩極差范圍內(nèi)所包含的平 均數(shù)個數(shù)(稱為秩次距),SE為平均數(shù)的標準誤, 可見在每一顯著水平下該法有k-1個尺度值。平均數(shù)比較時,尺度值隨秩次距的不同而異。例6.5 試對表6.2資料的各平均數(shù)作q測驗。由6.1資料得:SE =jMSe / n = J8.17/4 =1.4292 "43查附表7 q值表,當DF = 12時,p=2, 3, 4的值,并由(6 11)計算出尺度值LSR, 列
23、于表6.4。Pqo.o5qo.o1LSR0.05lSrd.0123.084.324.406.1833.775.045.397.2144.205.506.017.87表6.4 表6.2資料LSRa值的計算(q測驗)由此可得到:由表6.2可知,當p=2 時,p=3 時,p=4 時,VD=29cm, Vb =23cm, ya = 18cm , yc =14cm。Vd - Vb =6(cm)Va =5( cm)yc =4( cm) yA=11(cm)Yc =9(cm)Vc =15( cm)Vb-Va-Vd-yB-Vd-5 %水平上顯著;5 %水平上顯著; 不顯著。1 %水平上顯著;1 %水平上顯著。1
24、 %水平上顯著。三、新復(fù)極差法不同秩次距P下的最小顯著極差變幅比較大,(shortest significant ranges ,為此,D. B. Duncan(1955)SSR)。該法與q法相似,從表6.4可以發(fā)現(xiàn),提出了新復(fù)極差法,又稱最短顯著極差法其區(qū)別在于計算最小顯著極差LSRa時不是查q表而是查SSR表,所得最小顯著極差值隨著k增大通常比q測驗時的減小。查得 SSR, P后,有LS = SE SSR, p(6 13)此時,在不同秩次距 P下,平均數(shù)間比較的顯著水平按兩兩比較是a ,但按P個秩次距則為保護水平 a ' =1-(1 _a) Pd。例6.6 試對表6.2資料的各平均
25、數(shù)作新復(fù)極差測驗。已知 Yd =29cm, Vb =23cm, Va =18cm, Vc =14cm, MSe=8.17 , SE=1.43(cm) 查附表8,得SSRt值,由(6 13)算得在p=2, 3, 4時的LS甩值(表6.5),即為測驗不 同P時的平均數(shù)間極差顯著性的尺度值。表6.5 表6.2資料LSR值的計算(新復(fù)極差測驗)PSSF0.05SSFF).01LSRo.o5LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69當p=2時,yD- yB=6( cm)5 %水平顯著;yB- y A=5( cm)5 %水平顯著;y
26、A- yC=4( cm)不顯著。當p=3 時,yD- yA=11(cm)1 %水平上顯著;yB - yc=9(cm)1 %水平上顯著。當p=4 時,Yd - yC =15( cm)1 %水平上顯著。結(jié)論:表6.2資料的4個處理的苗高,除處理A與C差異不顯著外,其余處理間均達顯 著差異,本例結(jié)果與上面介紹的q測驗法相同,但q法的LSR要比新復(fù)極差法的LSR大。四、多重比較結(jié)果的表示方法各平均數(shù)經(jīng)多重比較后,應(yīng)以簡潔明了的形式將結(jié)果表示出來。常用的表示方法有:(一)列梯形表法將全部平均數(shù)從大到小順次排列,然后算出各平均數(shù)間的差數(shù)。凡達到a =0.05水平的差“* ”號,凡未達到a =0.056.6
27、。數(shù)在右上角標一個“* ”號,凡達到a =0.01水平的差數(shù)在右上角標兩個 水平的差數(shù)則不予標記。若以列梯形表法表示,則成表處理平均數(shù)(yi)差異y -14Yi -18yi -23D2915*11*6*B239*5*A184C14表6.6 表6.2資料的差異顯著性(新復(fù)極差測驗)該法十分直觀,但占篇幅較大,特別是處理平均數(shù)較多時。因此,在科技論文中少見。(二)劃線法以第將平均數(shù)按大小順序排列,差異不顯著的平均數(shù)用橫線連接起來, 這種方法稱劃線法。下面就是表6.2法)。1個平均數(shù)為標準與以后各平均數(shù)比較,在平均數(shù)下方把依次以第2,,k-1個平均數(shù)為標準按上述方法進行。資料用劃線法標出0.01水平
28、下平均數(shù)差異顯著性結(jié)果(q29cm(D)23cm(B)18cm(A)14cm(C)該法直觀、簡單方便,所占篇幅也較少。(三)標記字母法:首先將全部平均數(shù)從大到小依次排列。然后在最大的平均數(shù)上標上字母a;并將該平均數(shù)與以下各平均數(shù)相比,凡相差不顯著的,都標上字母a,直至某一個與之相差顯著的平均數(shù)則標以字母b(向下過程),再以該標有b的平均數(shù)為標準,與上方各個比它大的平均數(shù)比,凡不 顯著的也一律標以字母 b(向上過程);再以該標有b的最大平均數(shù)為標準, 與以下各未標記的Co平均數(shù)比,凡不顯著的繼續(xù)標以字母 b,直至某一個與之相差顯著的平均數(shù)則標以字母 如此重復(fù)進行下去,直至最小的一個平均數(shù)有了標記
29、字母且與以上平均數(shù)進行了比較為止。這樣各平均數(shù)間,凡有一個相同標記字母的即為差異不顯著,凡沒有相同標記字母的即為差異顯著。在實際應(yīng)用時,往往還需區(qū)分a =0.05水平上顯著和a =0.01水平上顯著。這時可以小寫 字母表示a =0.05顯著水平,大寫字母表示 a =0.01顯著水平。該法在科技論文中常常出現(xiàn)。例6.7試對例6.6測驗結(jié)果作出字母標記。在表6.7上先將各平均數(shù)按大小順序排列,并在yD行上標a。由于與Vb呈顯著差異,6.7 o故Vb上標b。然后以Vb為標準與Ya相比呈顯著差異,故標 C。以Va為標準與Vc比,無顯著 差異,仍標C。同理,可進行4個y在1 %水平上的顯著性測驗,結(jié)果列
30、于表表6.7 表6.2資料的差異顯著性(新復(fù)極差測驗)處 理苗高平均數(shù)(cm)差異顯著性0.050.01D29aAB23bABA18cBCC14cC由表6.7就可清楚地看出,該試驗除 A與C處理無顯著差異外,D與B及A、C處理間 差異顯著性達到 a =0.05水平。處理 B與A、D與B、A與C無極顯著差異;D與A、C,B 與C呈極顯著差異。多重比較方法很多,可閱讀其它參考書籍,以上列舉的是常用的方法。五、多重比較方法的選擇以上介紹三種多重比較方法。方法越多便存在選用何種更好的問題。根據(jù)統(tǒng)計學家的意見每種方法都有依據(jù),也都有不足。這里提供幾點原則供選用時參考:(1)試驗事先確定比較的標準,凡與對
31、照相比較,或與預(yù)定要比較的對象比較,一般可選用最小顯著差數(shù)法;(2)根據(jù)否定一個正確的 Ho和接受一個不正確的 H0的相對重要性來決定。按上述同一資料(表6.2 資料)的測驗計算,可以看到當 k=2時,LSD法,SSR和q測驗的顯著尺度都完全相同,并且 SS%=qa而q =t血,又由于=1,甩弋,所以q與F的關(guān)系是q。k> 3時,三種FPLSD法進行多重比較,不必采方法的顯著尺度不相同,LSD法最低,SSR法次之,q法最高。故LSD測驗在統(tǒng)計推斷時犯第 一類錯誤的概率最大,q測驗最小,而SSR測驗介于兩者之間,因此,對于試驗結(jié)論事關(guān)重大 或有嚴格要求的, 宜用q測驗,q測驗可以不經(jīng)過 F
32、測驗;一般試驗可采用 SSR測驗;也有統(tǒng) 計學家近期認為最小顯著差數(shù)法已由F測驗保護,可以采用用復(fù)雜的極差法測驗。綜上所述,方差分析的基本步驟是:(1)將資料總變異的自由度和平方和分解為各變異原 因的自由度和平方和,并進而算得其均方;(2)計算均方比,作出 F測驗,以明了各變異因素的重要程度;(3)對各平均數(shù)進行多重比較。第三節(jié)方差分析的線性模型與期望均方、方差分析的線性數(shù)學模型方差分析是建立在一定的線性可加模型基礎(chǔ)上的。所謂線性可加模型是指總體每一個變量可以按其變異的原因分解成若干個線性組成部分,它是方差分析的理論依據(jù)。表6.1數(shù)據(jù)的線性模型可表示為:yij=卩 + 山 +別(6 14)上式
33、中,卩為總體平均數(shù),Ti為試驗處理效應(yīng),£ij為隨機誤差具有分布 N(0 , b2)。 (6 14)說明,象表6.1類型的資料,其每一觀測值都由總體平均數(shù)4、處理效應(yīng)Ti和隨機誤差gjj三個部分相加而成。在以樣本符號表示時,樣本的線性組成為:(6 15)yij=y + ti + eij其中,y是卩的無偏估計量,ti是Ti的無偏估計量,se =Seij /( n -1)為其所屬亞總體誤差方i y /差bi22 2 .O! =6 =A =b的無偏估計量。當測驗H0: A1=A2=A=Ak時,假定出二巴二人二和二卩和f =cr2, s; =Zeij2/n -1)可看作是總體CT2的無偏估計
34、量。因而各亞總體 S:k n/合并的SeZeij才K n -1)也是b的無偏估計量。i ij 1/,故k個樣本的平方和是對于ti部分,每一樣本的平方和是nti2 = n(yi -y)2 k 2k22n£ti = n£(yi -y),而處理間方差St為:i iy2 n Zti n S(yi-y)St =k -1k1因為ti =Ti +ei,故St2 =宜估計了 n 遷i i ik-1(k -1 n 丿k-1(6 16),或警?;?qū)憺?(6-17)這一部分,因試驗?zāi)P偷牟煌兴鶇^(qū)別。、期望均方在線性可加模型中,關(guān)于 £部分的假定,由于對 Ti有不同的解釋產(chǎn)生了固定模
35、型(I )和隨機模型(n)。從理論上講,固定模型是指各個處理的平均效應(yīng)Tih -)是固定的一個常量,且滿足Zii =0(或£ ni =0),但常數(shù)未知;隨機模型是指各個處理效應(yīng) Ti不是一個常量,而是從平 均數(shù)為零、方差為 疇的正態(tài)總體中得到的一個隨機變量,即TiN(0, CT ;)。研究中,前者主要是研究并估計處理效應(yīng);后者主要是研究并估計總體變異即方差。例如,若要了解幾個水稻新品種產(chǎn)量或幾種密度、幾種肥料、幾種農(nóng)藥的效應(yīng)等,那么研究對象是處理本身,處理效 應(yīng)T為固定的處理效應(yīng),就是固定模型。換言之,固定模型僅在于供試處理范圍內(nèi)了解處理 間的不同效應(yīng)。如果目的是要對這些處理所屬的總
36、體作出推論,例如研究江淮地區(qū)大豆地方品種的遺傳變異,從該地區(qū)大量地方品種中隨機抽取一部分品種作為代表進行試驗,以便通過這部分供試品種的試驗結(jié)果推論該地區(qū)大豆地方品種的總體情況,這種處理效應(yīng)便是隨機模型的處理效應(yīng)。在隨機模型中,因為各處理僅是所屬總體的隨機變量,故總體方差CT;是重要的研究對象。由上可知,固定模型和隨機模型,在試驗設(shè)計思想和統(tǒng)計推斷上是有明顯不同的。固定模型中所得的結(jié)論僅在于推斷關(guān)于特定的處理;而隨機模型中試驗結(jié)論則將用于推斷處理的總 體。此外,在期望均方和 F測驗方面,固定模型和隨機模型也是有明顯不同的,后面的內(nèi)容 將予以說明。(一) 固定模型(fixed model )例6.
37、8 以5個水稻品種作大區(qū)比較試驗,每品種作 3次取樣,測定其產(chǎn)量,所得數(shù)據(jù) 為單向分組資料。本試驗需明確各品種的效應(yīng), 故為固定模型,其方差分析和期望均方的參數(shù) 估計列于表6.8 。表6.8 5個水稻品種產(chǎn)量的方差分析和期望均方表變異來源DFSSMS期望均方(EMS):固定模型品 種 間487.621.90cr2+nK:2品種內(nèi)(試驗誤差)1024.02.402Cy T2固定模型中t屬于固定效應(yīng),其限制條件為 送Ti =0, (6 77)中為固定效應(yīng)的方差,k 1用號2表示之,因而表 6.8的品種間均方估計了 b2 + nTC;。本例中品種內(nèi) MS估計了 CT2,因而C?2 =2.40 ;品種
38、間 MS估計了 CT2 + n瓷2因而 + ni?2=21.9,應(yīng)2 珂21.90 2.40)/3 =6.50。固定模型的F測驗St2合2 + ni?2F 七=Se0若埼=0,則F值等于1。所以固定模型是測驗假設(shè)H0: Ti =0(i=1 , 2,,k)對Ha: £工0,即測驗H0:氣=卩2 =A =4k。因而,一般比較處理效應(yīng)的試驗都應(yīng)當采用固定模型。(二) 隨機模型(random model )例6.9研究秈粳稻雜交F5代系間單株干草重的遺傳變異,隨機抽取76個系進行試驗,每系隨機取2個樣品測定干草重(g/株)。因這76個系是隨機抽取的樣本,要從這些樣本來估 計F5代系間單株干草
39、重的遺傳變異,故這是隨機模型。其單向分組分析結(jié)果見表6.9。表6.9秈粳雜種F5代干草重的方差分析和期望均方變異來源DFMS期望均方(EMS):隨機模型系 統(tǒng)間7572.792 2c +系統(tǒng)內(nèi)(試驗誤差)7617.772c為隨機效應(yīng)的方差, k -1CT2,因而(?2 =17.77 ;-17.77)/2=27.51。因而表6.9的系統(tǒng)間均方估計了CT2系統(tǒng)間MS估計了 b2 + nb;因而& 隨機模型的F測驗隨機模型中飛是從總體隨機抽出的,服從N(0 , CT;) , (6 ,17)中乙+ ncr;。本例中系統(tǒng)內(nèi) MS估計了2 2+ n&t=72.79 ,浮T =72.79S;
40、t?2 +nc?;F-IHa: b2=0。顯然,這是測 測驗顯著則表示處理間的變 說明CT;是存在的。 暉=25.71測度了系統(tǒng) 凸2代表了環(huán)境條件所致的變異(記s2 少若假設(shè)CT; =0,貝U F=1。因而,隨機模型的假設(shè)為H0: CT2=0對驗處理效應(yīng)的變異度(方差),而不是測驗處理效應(yīng)本身。如果 F 異是顯著的。本例 F =72.79/17.7 7=4.09 > F0.05,,因而可求出遺傳型變異占表型變異的份量,這就是間變異。本例中,浮;(或記為應(yīng)g)代表了系間遺傳型的變異; 作5;)。白g +0;代表了系間的表型變異 數(shù)量遺傳中常用的遺傳率h2,即:(6 18)這是隨機模型方差
41、分析在數(shù)量遺傳學中的應(yīng)用。在本例可求得:27 51h2 = =0.6076 或 60.76%27.51 +17.77即秈粳雜種F5家系間的表型變異中有 60.76 %歸屬于遺傳原因的變異。當試驗因素在2個或2個以上時,可以在固定模型和隨機模型的基礎(chǔ)上產(chǎn)生第三種模型:混合模型(記作模型川)?;旌夏P湍思劝ㄓ泄潭P偷脑囼炓蛩兀?又包括有隨機模型的試驗因素的模型。這類模型凡隨機因素仍用CT 2表示,固定模型用K2表示?;旌夏P椭械钠谕浇M成因包括有不同的成份,應(yīng)選擇恰當?shù)木竭M行F測驗,第13章將作介紹。第四節(jié) 單向分組資料的方差分析如表6.1及6.2所示。所用的試驗設(shè)單向分組資料是指觀察值僅
42、按一個方向分組的資料, 計為完全隨機試驗設(shè)計。、組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析這是在k組處理中,每處理皆含有 n個供試單位的資料如表6.1。在作方差分析時,其任一觀察值的線性模型皆由(6 14)表示,方差分析如表6.10 。表6.10組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析變異 來源自由度DF平方和SS均方MSF-期望均方ems固定模型隨機模型處理間k-12nS(yi -y)MStMSt/MSe2 2CT2 2b +ncyj誤差k(n-1)ZZWj -yj2MSe2C72C7總變異nk-1SWj y)2例6.10作一水稻施肥的盆栽試驗,設(shè)5個處理,A和B系分別施用兩種不同工藝流程
43、的氨水,C施碳酸氫銨,D施尿素,E不施氮肥。每處理 4盆(施肥處理的施肥量每盆皆為 折合純氮1.2克),共5X 4=20盆,隨機放置于同一網(wǎng)室中,其稻谷產(chǎn)量(克/盆)列于表6.11 ,試測驗各處理平均數(shù)的差異顯著性。(1)分析步驟:)自由度和平方和的分解表6.11 水稻施肥盆栽試驗的產(chǎn)量結(jié)果處理觀察值(yij)(克/盆)TViA (氨水1)2430282610827.0B (氨水2)272421269824.5C (碳酸氫銨)3128253011428.5D (尿素)3233332812631.5E (不施)212216218020.052626.3總變異自由度 DFt= nk-1 =5X 4
44、-1=19處理間自由度 DFt=k-1=5-1 =4誤差(處理內(nèi))自由度DFe=k( n-1) =5 X (4-1) =15矯正數(shù) C =T2/nk =5262/(5 I) =13833.8 SSt =2:y2 -C =242 +302 +A + 212 -C =402.2 SS =ZTi7n C =(1082 +982 +A +802) /4 C =301.2 SS =402.2 -301.2 =101.0F測驗將上述結(jié)果錄入表 6.12 ,假設(shè)H。:=AbA =4e , Ha: A、4B、卩e不全相等。為了測驗H。,計算處理間均方對誤差均方的比率,算得F =75.3/6.73 =11.19
45、,查F表當v 1=4,V2 = 15時,F(xiàn)0.01=4.89,現(xiàn)實得F = 11.19 > F0.01,故否定H0,推斷這個試驗的處理平均數(shù)間是 有極顯著差異的。表6.12 表6.11資料的方差分析變異來源DFSSmsFF 0.01F 0.01處理間4301.275.3011.19 *3.064.89處理內(nèi)(試驗誤差)15101.06.73總變異19402.2(3)各處理平均數(shù)的比較算得單個平均數(shù)的標準誤SE 6.73/4 =1.297根據(jù)V = 15,查SSR表得p=2, 3,4,5時的SSF0.05與SSR©值,將SSR值分別乘以SE 值,即得SRa值,列于表6.13。進而
46、進行多重比較(表 6.14)。LSRa值計算表 6.13多重比較時的PSSR.05SSR0.01LSR0.05LSR0.0123.014.173.905.4133.164.374.105.6743.254.504.225.8453.314.584.295.94表 6.14施肥效果的顯著性(SSR測驗)處理平均產(chǎn)量差異顯著性(克/盆)5%1%尿素31.5aA碳酸氫銨28.5abAB氨水127.0beAB氨水224.0eBC不施20.0dC推斷:根據(jù)表6.14多重比較結(jié)果可知, 施用氮肥(A、B、C和D)與不施氮肥有顯著差異, 且施用尿素、碳酸氫銨、氨水1與不施氮肥均有極顯著差異;尿素與碳酸氫銨、
47、碳酸氫銨與氨 水1、氨水1與氨水2處理間均無顯著差異。、組內(nèi)觀察值數(shù)目不等的單向分組資料的方差分析若k個處理中的觀察值數(shù)目不等,分別為n1, n2,,nk,在方差分析時有關(guān)公式因ni不相同而需作相應(yīng)改變。主要區(qū)別點如下:(1)自由度和平方和的分解總變異自由度處理間自由度誤差自由度DFt =送 ni -1DFt =k -1DFZ rij k(6 19)(2)多重比較平均數(shù)的標準誤為:Sst =2(y-y)2 =2y2 -Ckssni (Vi y)2 =2Ti2/ni Cizik mSS, =5:S(yij yj2 =SSr -SSt(6 20)(6GL 1/MSe 丄 MSe、 jlMSe/ 1
48、 丄 1、SE 2(+ )=(+) V2 nAne ¥ 2 nA ne上式的nA和ne系兩個相比較的平均數(shù)的樣本容量。但亦可先算得各(2>i)2 -送n,2門0 =(罰 i)(k1)(6 21)m的平均數(shù)no。-22)然后有:SE=jMSe/noSy,衛(wèi)=J2MSe/no例6.11某病蟲測報站,調(diào)查四種不同類型的水稻田百叢蟲口密度列于表 6.15,試問不同類型稻田的蟲口密度有否顯著差異?(6(6-23)-24)28塊,每塊田所得稻縱卷葉螟的號表6.15不同類型稻田縱卷葉螟的蟲口密度編12345678 iyi"iI1213141515161710214.577n1410
49、111314117312.176m921011121312118010.008IV1211109810127210.297T=327 y =11.68送山=28該資料送ni =7+6+8+7=28 故總變異自由度 DFt= 2 ni-1 =28-1 =27稻田類型間自由度 DFt=k-1 =4-1 =3誤差自由度 DFe= 2 ni-k=28-4 =24求得:2C =(327) /28 =3818.89SSt =122 中132 +A +122 C =4045.00 -3818.89 =226.11SSt =1022 /7 +732 /6 +802 /8 +722 /7 -C =96.13SS
50、e SS, -SSt =129.98列入方差分析表6.16。表6.16 表6.15資料的方差分析變異來源DFSSMSFF0.01稻田類型間396.1332.045.91 *4.72誤差24129.985.42總變異27226.11表6.16所得F = 5.91 > F0.01,因而應(yīng)否定 H0:片=卩2 =卩3二巴,即4塊麥田的蟲口密度 間有極顯著差異。F測驗顯著,再作平均數(shù)間的比較。 需進一步計算n0,并求得SE( LSR測驗)或(LSD測驗)。如在此可有:no28x2SE =J5.42/10=0.736 (頭)s -1.込-ij -y2x5.42T.。41 (頭)嚴2 "
51、2 +62 +82 +72)=10.46 10三、組內(nèi)又分亞組的單向分組資料的方差分析如果每組又分若干個亞組,而每個亞組內(nèi)又有若干個觀察值,則為組內(nèi)分或稱系統(tǒng)分組資料。 系統(tǒng)分組并不限于組內(nèi)僅分亞組,如此一環(huán)套一環(huán)地分下去。這種試驗稱為巢式試驗(n ested如對數(shù)塊土地取土樣分析,每塊地取了若 或調(diào)查某種果樹病害,隨機取若干株,每皆為系統(tǒng)分組資料。以下亞組內(nèi)還可分小單向分組資料, 亞組的單向分組資料, 組,小組內(nèi)還可分小亞組, exp erime nt)。在農(nóng)業(yè)試驗上系統(tǒng)分組資料是常見的。 干樣點,而每一樣點的土樣又作了數(shù)次分析的資料, 株取不同部位枝條,每枝條取若干葉片查其各葉片病斑數(shù)的資料等, 討論二級分組每組觀察值數(shù)目相等的系統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)發(fā)展戰(zhàn)略制定與規(guī)劃實務(wù)
- 農(nóng)業(yè)灌溉水窖管理辦法
- 效率提升:關(guān)鍵指標勝任模型平衡記分卡
- 新質(zhì)生產(chǎn)力推動無償獻血事業(yè)的高質(zhì)量發(fā)展
- 化妝品市場未來發(fā)展趨勢預(yù)測與規(guī)劃
- 供銷職工餐廳管理辦法
- 醫(yī)療資質(zhì)銷售管理辦法
- 土壤污染治理技術(shù)
- 古詩詞賞析教學方案
- 河南酒店采購管理辦法
- 衛(wèi)生室安全管理制度
- 低碳生活綠色環(huán)保演示文稿
- 過盈配合壓入力計算公式
- 第八章-材料工程-倫理問題-全
- 婚前協(xié)議(保護女方利益)
- 奉賢區(qū)教育系統(tǒng)師德師風建設(shè)學習測試附有答案
- 扶貧農(nóng)產(chǎn)品購銷合同協(xié)議(農(nóng)產(chǎn)品購銷合同模板)
- 汽車維修高級工考試試題及參考答案
- GB/T 5782-2016六角頭螺栓
- GB/T 23445-2009聚合物水泥防水涂料
- GB/T 13451.2-1992著色顏料相對著色力和白色顏料相對散射力的測定光度計法
評論
0/150
提交評論