第八章 方差分析_第1頁
第八章 方差分析_第2頁
第八章 方差分析_第3頁
第八章 方差分析_第4頁
第八章 方差分析_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第八章第八章 方差分析方差分析analysis of variance安徽大學(xué)數(shù)學(xué)科學(xué)學(xué)院安徽大學(xué)數(shù)學(xué)科學(xué)學(xué)院 第八章第八章 方差分析方差分析 8.1 方差分析的基本概念方差分析的基本概念 8.2 單因素方差分析單因素方差分析 8.3 多因素方差分析多因素方差分析 8.4案例分析案例分析v 經(jīng)常遇到這樣的問題,有幾種不同的原料,要考查經(jīng)常遇到這樣的問題,有幾種不同的原料,要考查它們對產(chǎn)品質(zhì)量有沒有顯著的影響。某種新藥與其它們對產(chǎn)品質(zhì)量有沒有顯著的影響。某種新藥與其它一些傳統(tǒng)藥物對病人進(jìn)行分組實(shí)驗(yàn)來考查不同的它一些傳統(tǒng)藥物對病人進(jìn)行分組實(shí)驗(yàn)來考查不同的藥物與治愈率有否明顯不同,這里我們考查的對象

2、,藥物與治愈率有否明顯不同,這里我們考查的對象,原料,藥物稱為因素,當(dāng)考查的因素只有一個(gè)時(shí)我原料,藥物稱為因素,當(dāng)考查的因素只有一個(gè)時(shí)我們稱為單因素問題。如果同時(shí)考慮兩個(gè)或更多的因們稱為單因素問題。如果同時(shí)考慮兩個(gè)或更多的因素問題,則稱多因素方差分析(這時(shí)計(jì)算起來很復(fù)素問題,則稱多因素方差分析(這時(shí)計(jì)算起來很復(fù)雜)。雜)。v 例:考查溫度對某一化工廠產(chǎn)品得率的影響,選了例:考查溫度對某一化工廠產(chǎn)品得率的影響,選了五種不同溫度,同一溫度做了三次試驗(yàn),測得結(jié)果五種不同溫度,同一溫度做了三次試驗(yàn),測得結(jié)果如下:如下:n現(xiàn)在分析溫度的變化對得率的影響。從平均得率來看,現(xiàn)在分析溫度的變化對得率的影響。從

3、平均得率來看,好象溫度對得率是有一定的影響,但詳細(xì)觀察一下數(shù)據(jù)就好象溫度對得率是有一定的影響,但詳細(xì)觀察一下數(shù)據(jù)就會(huì)發(fā)現(xiàn)問題,表現(xiàn)在:會(huì)發(fā)現(xiàn)問題,表現(xiàn)在:n同一溫度下得率并不完全一樣,產(chǎn)生這種差異的原因是由同一溫度下得率并不完全一樣,產(chǎn)生這種差異的原因是由于試驗(yàn)過程中各偶然因素的干擾及測量誤差所致,這一類誤于試驗(yàn)過程中各偶然因素的干擾及測量誤差所致,這一類誤差稱為試驗(yàn)誤差,或隨機(jī)誤差。差稱為試驗(yàn)誤差,或隨機(jī)誤差。n兩種溫度的率不同的試驗(yàn)中的傾向有所差別。如兩種溫度的率不同的試驗(yàn)中的傾向有所差別。如65與與70相比,第一產(chǎn)相比,第一產(chǎn)65比比70好,而后二次好,而后二次70比比65好。好。產(chǎn)生這

4、種矛盾現(xiàn)象,顯然也可能是由于隨機(jī)誤差的干擾。由產(chǎn)生這種矛盾現(xiàn)象,顯然也可能是由于隨機(jī)誤差的干擾。由于隨機(jī)誤差的存在,對于不同溫度下的得率的差異自然要提于隨機(jī)誤差的存在,對于不同溫度下的得率的差異自然要提出疑問,這差異是隨機(jī)誤差造成的呢,還是溫度不同的影響。出疑問,這差異是隨機(jī)誤差造成的呢,還是溫度不同的影響。由于溫度的不同而引起得率的差異我們稱為組間誤差或系統(tǒng)由于溫度的不同而引起得率的差異我們稱為組間誤差或系統(tǒng)誤差。誤差。上例全部上例全部15個(gè)數(shù)據(jù)摻差不齊,它們的差異叫總變差。產(chǎn)生個(gè)數(shù)據(jù)摻差不齊,它們的差異叫總變差。產(chǎn)生總變差的原因有兩個(gè)總變差的原因有兩個(gè)1) 隨機(jī)誤差隨機(jī)誤差 2) 系統(tǒng)誤差

5、系統(tǒng)誤差 v由數(shù)據(jù)的總變差中分離出隨機(jī)誤差和系統(tǒng)誤差。由數(shù)據(jù)的總變差中分離出隨機(jī)誤差和系統(tǒng)誤差。v用系統(tǒng)誤差和隨機(jī)誤差在一定條件下進(jìn)行比較,用系統(tǒng)誤差和隨機(jī)誤差在一定條件下進(jìn)行比較,如差異不大則認(rèn)為系統(tǒng)誤差對指標(biāo)的影響不大,如差異不大則認(rèn)為系統(tǒng)誤差對指標(biāo)的影響不大,如系統(tǒng)誤差比隨機(jī)誤差大的多,則說明條件的影如系統(tǒng)誤差比隨機(jī)誤差大的多,則說明條件的影響很大。以上面的例子說明即溫度的變化對得率響很大。以上面的例子說明即溫度的變化對得率的影響很大,因此調(diào)整溫度對產(chǎn)量的影響很大。的影響很大,因此調(diào)整溫度對產(chǎn)量的影響很大。v選擇較好的工藝條件或確定進(jìn)一步的實(shí)驗(yàn)方案選擇較好的工藝條件或確定進(jìn)一步的實(shí)驗(yàn)方案

6、。方差分析解決這類問題的思想方差分析解決這類問題的思想 anova anova 由英國統(tǒng)由英國統(tǒng)計(jì)學(xué)家計(jì)學(xué)家r.a.fisherr.a.fisher首首創(chuàng),為紀(jì)念創(chuàng),為紀(jì)念fisherfisher,以以f f命名,故方差分析命名,故方差分析又稱又稱 f f 檢驗(yàn)檢驗(yàn) (f f testtest)。用于推斷)。用于推斷多多個(gè)總體均數(shù)個(gè)總體均數(shù)有無差異有無差異 幾個(gè)方差分析術(shù)語幾個(gè)方差分析術(shù)語v因素:因素:實(shí)驗(yàn)中的每一個(gè)條件,如上例的溫度便是實(shí)驗(yàn)中的每一個(gè)條件,如上例的溫度便是一個(gè)因素。一個(gè)因素。v水平:水平:因素在實(shí)驗(yàn)中的等級稱為水平,如上例中因素在實(shí)驗(yàn)中的等級稱為水平,如上例中因素溫度分為五個(gè)

7、水平:因素溫度分為五個(gè)水平:6065,70,75,80。如果把因素記為。如果把因素記為a,則相應(yīng)地把水平記為,則相應(yīng)地把水平記為a1,a2,a3,a4,a5.v樣本:樣本:在同樣條件下得到不同的實(shí)驗(yàn)結(jié)果每個(gè)結(jié)在同樣條件下得到不同的實(shí)驗(yàn)結(jié)果每個(gè)結(jié)果稱為樣本。果稱為樣本。 第八章第八章 方差分析方差分析 8.1 方差分析的基本概念方差分析的基本概念 8.2 單因素方差分析單因素方差分析 8.3 多因素方差分析多因素方差分析 8.4案例分析案例分析設(shè)因素設(shè)因素a取了取了m個(gè)水平,每個(gè)水平重復(fù)了個(gè)水平,每個(gè)水平重復(fù)了n次實(shí)驗(yàn)得到次實(shí)驗(yàn)得到mn個(gè)個(gè)樣本,在水平樣本,在水平ai下的第下的第j 次實(shí)驗(yàn)結(jié)果(

8、樣本)次實(shí)驗(yàn)結(jié)果(樣本)xij 可以分解為:可以分解為:ijiijx (8.2.1)為了看出因素各水平影響的大小,將為了看出因素各水平影響的大小,將xij 再進(jìn)行分解再進(jìn)行分解,令令 miim11 (8.2.2)令令1,2,iiaim這里這里 ijn20, i 是水平是水平ai的均值,的均值,1,2,;1,2,ijiijxaimjn顯然顯然ai之間有關(guān)系之間有關(guān)系01 miiaai 表示水平表示水平ai 對實(shí)驗(yàn)結(jié)果產(chǎn)生的影響,它稱做水平對實(shí)驗(yàn)結(jié)果產(chǎn)生的影響,它稱做水平ai 的效應(yīng)。的效應(yīng)。方差分析模型就是建立在以下假定之下:方差分析模型就是建立在以下假定之下:1,2,;1,2,ijiijxai

9、mjn01 miia 20,ijn1)2)3)(一)參數(shù)估計(jì)(一)參數(shù)估計(jì)即通過實(shí)驗(yàn)估計(jì)即通過實(shí)驗(yàn)估計(jì)和和ai,其估計(jì)量記為和,其估計(jì)量記為和和和ai。令。令11niijjn minjijmn111 則則 nniijiijiijjxxaann1111 11mniijijfxan 這里這里nnm取取是是的一個(gè)無偏估計(jì)。的一個(gè)無偏估計(jì)。類似地可以推出類似地可以推出 的無偏估計(jì)是的無偏估計(jì)是xiaia xxaii 此時(shí)方差分析模型可以改寫為:此時(shí)方差分析模型可以改寫為:ijiijlaxx 反映了誤差反映了誤差。由于。由于,均為已知故均為已知故可以通過樣本求得。可以通過樣本求得。ijlij ijxxi

10、a ijl(二)統(tǒng)計(jì)檢驗(yàn)(二)統(tǒng)計(jì)檢驗(yàn)如果因素如果因素a對指標(biāo)有顯著的影響,效應(yīng)對指標(biāo)有顯著的影響,效應(yīng)ai不全部為零,反之不全部為零,反之則全為零。因此我們假設(shè)則全為零。因此我們假設(shè)基本思想是將總變差進(jìn)行分離,即系統(tǒng)誤差和隨機(jī)誤差。基本思想是將總變差進(jìn)行分離,即系統(tǒng)誤差和隨機(jī)誤差。設(shè):設(shè):stotal 總變差,即總變差,即012:mhaaa minjminjiiijijxxxxxxstotal1111222211()2()()mnijiiijiiijxxxxxxxx minjminjiiijxxxx111122aess 注:交叉項(xiàng)在線性假設(shè)下為注:交叉項(xiàng)在線性假設(shè)下為0。這里統(tǒng)計(jì)量。這里統(tǒng)計(jì)

11、量 mimiiiiaanxxns1122 21112mmmiiiiiiinanan minjminjiijiijexxs111122 21(1) ()miiimd 對它們?nèi)∑谕?,利用對它們?nèi)∑谕?,利?有有 0iee 221 manseia 2ee snm 令令aasms11 1eessnm 則有則有 miaianamnnse12222 2 ese如果如果h0:成立,則:成立,則與與之比應(yīng)近于之比應(yīng)近于1,即,即統(tǒng)計(jì)量統(tǒng)計(jì)量f 值應(yīng)值應(yīng)近于近于1。如果因素。如果因素a 對指標(biāo)有顯著的影響對指標(biāo)有顯著的影響,則則 將將顯著的大于顯著的大于1,這就是為什么可以用統(tǒng)計(jì)量,這就是為什么可以用統(tǒng)計(jì)量

12、f來進(jìn)行檢驗(yàn)因素來進(jìn)行檢驗(yàn)因素a 是否顯著的道理。是否顯著的道理。由統(tǒng)計(jì)理論推知,在線性模型假設(shè)下,由統(tǒng)計(jì)理論推知,在線性模型假設(shè)下,服從服從(m-1)個(gè)自個(gè)自由度的由度的分布,分布,服從服從(nm)個(gè)自由的個(gè)自由的分布,且兩者獨(dú)立,從而分布,且兩者獨(dú)立,從而服從以(服從以(m-1),(),(n-m)為自由度的)為自由度的f分布。分布。ases/aefss /as)1(2 m /es2()nm /aefss方差分析表的一般形式為:方差分析表的一般形式為:例例8.2.1 設(shè)五個(gè)不同國家船運(yùn)來港的牛奶,分別抽取六桶,檢驗(yàn)每設(shè)五個(gè)不同國家船運(yùn)來港的牛奶,分別抽取六桶,檢驗(yàn)每桶的細(xì)菌含量,即單因素五水

13、平的實(shí)驗(yàn)數(shù)據(jù)為:桶的細(xì)菌含量,即單因素五水平的實(shí)驗(yàn)數(shù)據(jù)為: 數(shù)據(jù)來自數(shù)據(jù)來自hogg and ledolter (1987) 。問:這五個(gè)國家的牛奶質(zhì)量是否有明顯的差距。問:這五個(gè)國家的牛奶質(zhì)量是否有明顯的差距。24 14 11 7 19 24 14 11 7 19 15 7 9 7 24 15 7 9 7 24 21 12 7 4 19 21 12 7 4 19 27 17 13 7 15 27 17 13 7 15 33 14 12 1233 14 12 12 10 10 23 16 18 1823 16 18 18 20 20 組內(nèi)組內(nèi)組間(國家)組間(國家)單因素方差分析單因素方差分析

14、 one-way analysis of variance (anova) 語法為:語法為:p = anova1(x)p = anova1(x,group)p = anova1(x,group,displayopt)p,table = anova1(.)p,table,stats = anova1(.)這里:這里:x:是二維數(shù)組:是二維數(shù)組group:為分組:為分組p: 為為f統(tǒng)計(jì)量的上側(cè)概率統(tǒng)計(jì)量的上側(cè)概率table:為方差分析表:為方差分析表stats:為:為f統(tǒng)計(jì)量統(tǒng)計(jì)量 displayopt:on|off,是否顯示分析表和是否顯示分析表和box 圖圖 load hogg % 調(diào)牛奶含菌

15、量數(shù)據(jù)調(diào)牛奶含菌量數(shù)據(jù)p,tbl,stats = anova1(hogg) % 進(jìn)行單因素方差分析進(jìn)行單因素方差分析結(jié)果的方差分析表為:結(jié)果的方差分析表為:接受域接受域例例8.2.2 設(shè)單因素有三水平,每個(gè)水平下實(shí)驗(yàn)的次數(shù)不同。設(shè)單因素有三水平,每個(gè)水平下實(shí)驗(yàn)的次數(shù)不同。 因素因素 i ii iii 0.365 0.27 0.305 0.255 0.275 0.250 0.195 0.240 0.225 0.215 0.265 0.185問三水平下的結(jié)果是否有顯著區(qū)別?注意問三水平下的結(jié)果是否有顯著區(qū)別?注意group的使用。的使用。data = 0.365 0.255 0.195 0.215

16、 0.27 0.275 0.24 0.265 . 0.185 0.305 0.25 0.225;group = 1,1,1,1,2,2,2,2,. 2,3,3,3;p = anova1(data, group)p = 0.9338方差分析表為:方差分析表為:結(jié)果表明,沒有顯著性差別。即該因素對實(shí)驗(yàn)沒有影響。結(jié)果表明,沒有顯著性差別。即該因素對實(shí)驗(yàn)沒有影響。 第八章第八章 方差分析方差分析 8.1 方差分析的基本概念方差分析的基本概念 8.2 單因素方差分析單因素方差分析 8.3 多因素方差分析多因素方差分析 8.4案例分析案例分析v 單因素方差分析的基本思想是在試驗(yàn)條件下單因素方差分析的基本思

17、想是在試驗(yàn)條件下,我們將總的誤差平方和我們將總的誤差平方和分離成隨機(jī)誤差分離成隨機(jī)誤差se和系統(tǒng)誤差和系統(tǒng)誤差sa,并將其加工成,并將其加工成f=sa/se統(tǒng)計(jì)量,當(dāng)統(tǒng)計(jì)量,當(dāng)f比比1很多時(shí),則認(rèn)為系統(tǒng)因子即因素對結(jié)果有特別的影響。將這一很多時(shí),則認(rèn)為系統(tǒng)因子即因素對結(jié)果有特別的影響。將這一思想推廣到多因素思想推廣到多因素a1,a2,ap即得多因素方差分析。即得多因素方差分析。v 以三因素以三因素a,b,c為例,我們來推導(dǎo)三因素方差分析的算法,其他為例,我們來推導(dǎo)三因素方差分析的算法,其他多因素方差分析可以同理推廣。對因素水平的某一組合如果實(shí)驗(yàn)次多因素方差分析可以同理推廣。對因素水平的某一組合

18、如果實(shí)驗(yàn)次數(shù)為一次,稱為無重復(fù)實(shí)驗(yàn)。若實(shí)驗(yàn)次數(shù)為多次則稱多因素可重復(fù)數(shù)為一次,稱為無重復(fù)實(shí)驗(yàn)。若實(shí)驗(yàn)次數(shù)為多次則稱多因素可重復(fù)方差分析。這里每一組合的重復(fù)次數(shù)必須一樣。方差分析。這里每一組合的重復(fù)次數(shù)必須一樣。1)無重復(fù)三因素方差分析無重復(fù)三因素方差分析記三個(gè)因素分別為記三個(gè)因素分別為a,b,c,它們的水平數(shù)分別為,它們的水平數(shù)分別為a,b,c,樣,樣本記為:本記為:), 2 , 1;, 2 , 1;, 2 , 1(ckbjaixijk 令令表示實(shí)驗(yàn)數(shù)據(jù)的總體均值,表示實(shí)驗(yàn)數(shù)據(jù)的總體均值,分別表示三分別表示三個(gè)因素各自的效應(yīng),而個(gè)因素各自的效應(yīng),而分別表示因素分別表示因素a,b,c兩兩的混合效

19、應(yīng),則多因素方差分析線性模型可表示為:兩兩的混合效應(yīng),則多因素方差分析線性模型可表示為: ckbjaiaaa,acikbcjkabijaaa,ijkacikbcjkabijckbjaiijkaaaaaax 這里,這里,獨(dú)立同分布。獨(dú)立同分布。),0(2 nijk我們的我們的假設(shè)為:假設(shè)為:0h 00:0acikbcjkabijckbjaiaaaaaah2)可重復(fù)多因素方差分析模型)可重復(fù)多因素方差分析模型在在 l 次重復(fù)實(shí)驗(yàn)的情況下,多因素方差分析線性模型為:次重復(fù)實(shí)驗(yàn)的情況下,多因素方差分析線性模型為: abcabbcacabcijklijkijjkikijkijklxaaaaaaa 000

20、:0abcijkacikbcjkabijckbjaiaaaaaaah一般對一般對r 個(gè)因素(個(gè)因素()的多因素方差分析中)的多因素方差分析中,對于觀察值對于觀察值的線性模型,有的線性模型,有個(gè)各因素主效應(yīng),個(gè)各因素主效應(yīng),個(gè)兩兩不同因素的個(gè)兩兩不同因素的交互效應(yīng),交互效應(yīng),個(gè)(個(gè)(r-1)個(gè)因素的交互效應(yīng)以及隨機(jī)誤差)個(gè)因素的交互效應(yīng)以及隨機(jī)誤差項(xiàng)之和。項(xiàng)之和。平方和分解平方和分解2 rriiix211rc2rc1 rrc ijkacikbcjkabijckbjaiijkaaaaaax2)(min 在假設(shè)之下,可得估計(jì)量。在假設(shè)之下,可得估計(jì)量。 最小二乘估計(jì) aiabjackaabijabc

21、jkaacika.x.ixx. .jxx.xxk . .ijijxxxx. .jkjkxxxx.i kikxxxx 三因素方差分析各影響得估計(jì)量三因素方差分析各影響得估計(jì)量 分離總平方和為分離總平方和為 ijkeacbcabcbaijksssssssxx2.其中其中 為殘差平方和項(xiàng),我們可以得到三因素方差分析表為殘差平方和項(xiàng),我們可以得到三因素方差分析表 es兩因素方差分析兩因素方差分析anova2語法:語法:two-way analysis of variance (anova) p = anova2(x,reps) p = anova2(x,reps,displayopt) p,table

22、 = anova2(.)p,table,stats = anova2(.)這里:這里:x:數(shù)據(jù)矩陣:數(shù)據(jù)矩陣reps:重復(fù)次數(shù):重復(fù)次數(shù)數(shù)據(jù)的結(jié)構(gòu)為:數(shù)據(jù)的結(jié)構(gòu)為:下標(biāo)第一位:下標(biāo)第一位:b因素水平數(shù)因素水平數(shù)下標(biāo)第二位:下標(biāo)第二位:a因素水平數(shù)因素水平數(shù)下標(biāo)第三位:重復(fù)次數(shù)下標(biāo)第三位:重復(fù)次數(shù)本例的數(shù)據(jù)為:本例的數(shù)據(jù)為:3131 33 3533 353333 34 37 34 373434 36 37 36 3736 37 3836 37 383535 37 39 37 393636 39 40 39 403939 38 42 38 4238 41 4438 41 44 a1 a2 a3b1

23、b2b4b3% 兩因素方差分析兩因素方差分析x=load(e:dataanov_2.txt) % 讀入數(shù)據(jù)讀入數(shù)據(jù)p = anova2(x,2) % 求兩因素方差分析求兩因素方差分析結(jié)果分析:結(jié)果分析:a因素有顯著性影響,因素有顯著性影響,b因素有顯著影響。因素有顯著影響。ab的交叉因素則沒有影響。的交叉因素則沒有影響。n-way analysis of variance (anova) p = anovan(x,group) p = anovan(x,group,param1,val1,param2,val2,.)p,table = anovan(.)p,table,stats = anov

24、an(.) p,table,stats,terms = anovan(.) 多因素方差分析多因素方差分析anovan語法語法參數(shù)與參數(shù)的取值如下:參數(shù)與參數(shù)的取值如下:model typesvlinear只計(jì)算主因素的概率;只計(jì)算主因素的概率;vinteraction計(jì)算主因素和所有兩因素的交叉影計(jì)算主因素和所有兩因素的交叉影響的概率;響的概率;vfull計(jì)算所有組合因素的概率;計(jì)算所有組合因素的概率;v整數(shù)整數(shù)1相當(dāng)于相當(dāng)于linear;2相當(dāng)于相當(dāng)于interaction;p相當(dāng)于相當(dāng)于fullv矩陣矩陣相當(dāng)于函數(shù)相當(dāng)于函數(shù)x2fx如:如:010001011只計(jì)算第二、第三因素及其交互的影

25、響。只計(jì)算第二、第三因素及其交互的影響。sstype誤差平方和的計(jì)算方法誤差平方和的計(jì)算方法例例8.2.4 設(shè)三因素各有二水平,每個(gè)水平搭配下實(shí)驗(yàn)一次。設(shè)三因素各有二水平,每個(gè)水平搭配下實(shí)驗(yàn)一次。52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0 實(shí)驗(yàn)數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù) 1 2 1 2 1 2 1 2 a因素因素 1 1 2 2 1 1 2 2 b因素因素 1 1 1 1 2 2 2 2 c因素因素y = 52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0g1 = 1 2 1 2 1 2 1 2; g2 = 1 1 2 2 1 1 2 2; g

26、3 = 1 1 1 1 2 2 2 2; p = anovan(y, g1 g2 g3, model, interaction,. varname,a,b,c)結(jié)果分析:從方差分析表中我們可以看出結(jié)果分析:從方差分析表中我們可以看出a因素對數(shù)據(jù)具有顯著影響,因?yàn)橐蛩貙?shù)據(jù)具有顯著影響,因?yàn)閜=0.03470.05b因素對數(shù)據(jù)具有顯著影響,因?yàn)橐蛩貙?shù)據(jù)具有顯著影響,因?yàn)閜=0.00480.05ab因素對數(shù)據(jù)具有顯著影響,因?yàn)橐蛩貙?shù)據(jù)具有顯著影響,因?yàn)閜=0.0150.05bc因素對數(shù)據(jù)沒有顯著影響,因?yàn)橐蛩貙?shù)據(jù)沒有顯著影響,因?yàn)閜=0.50.05多因素方差分析數(shù)據(jù)統(tǒng)一處理 上面兩因素方差分

27、析的例子中,數(shù)據(jù)文件的準(zhǔn)備相當(dāng)麻煩。我上面兩因素方差分析的例子中,數(shù)據(jù)文件的準(zhǔn)備相當(dāng)麻煩。我們統(tǒng)一將變量們統(tǒng)一將變量x,因素,因素a1,a2,ap看作變量,作為二維數(shù)組看作變量,作為二維數(shù)組的列,這樣方差分析的數(shù)據(jù)為:的列,這樣方差分析的數(shù)據(jù)為:可以整理成數(shù)據(jù)文件名為可以整理成數(shù)據(jù)文件名為anon_2_2.txt,數(shù)據(jù)為:,數(shù)據(jù)為: 31 1 1 33 1 1 33 2 1 34 2 1 35 3 1 37 3 1 34 1 2 36 1 2 36 2 2 37 2 2 37 3 2 38 3 2 35 1 3 36 1 3 37 2 3 39 2 3 39 3 3 40 3 3 39 1 4

28、 38 1 4 38 2 4 41 2 4 42 3 4 44 3 4我們的程序?yàn)椋何覀兊某绦驗(yàn)椋? 利用統(tǒng)一的數(shù)據(jù)格式進(jìn)行多因素方差分析利用統(tǒng)一的數(shù)據(jù)格式進(jìn)行多因素方差分析x=load(e:dataanov_2_2.txt)varnames = a;b;group=x(:,2) x(:,3) % 為因素為因素a和和b的各種搭配的各種搭配anovan(x(:,1),group,2,2,varnames)計(jì)算結(jié)果與前面方法的一致計(jì)算結(jié)果與前面方法的一致例例8.2.5 大數(shù)據(jù)的多因素方差分析,對轎車數(shù)據(jù)大數(shù)據(jù)的多因素方差分析,對轎車數(shù)據(jù)carbig中的每加中的每加侖行駛里數(shù)侖行駛里數(shù)mpg進(jìn)行分析

29、,第一因素為進(jìn)行分析,第一因素為cy14,是四缸與否。第二,是四缸與否。第二因素為產(chǎn)地因素為產(chǎn)地org(歐洲,日本,美國),第三因素為產(chǎn)出時(shí)間(早(歐洲,日本,美國),第三因素為產(chǎn)出時(shí)間(早期、中期、近期)期、中期、近期)load carbigvarnames = origin;4cyl;mfgdate;anovan(mpg,org cyl4 when,3,3,varnames)多元方差分析多元方差分析v 在方差分析中,當(dāng)零假設(shè)被拒絕時(shí)我們可以確定至少有在方差分析中,當(dāng)零假設(shè)被拒絕時(shí)我們可以確定至少有兩個(gè)總體的均值有顯著差異。但要進(jìn)一步檢驗(yàn)?zāi)男┚祪蓚€(gè)總體的均值有顯著差異。但要進(jìn)一步檢驗(yàn)?zāi)男┚?/p>

30、值之間有顯著差異還需要采用多重比較的方法進(jìn)行分析。之間有顯著差異還需要采用多重比較的方法進(jìn)行分析。這在方差分析中稱為這在方差分析中稱為事后檢驗(yàn)事后檢驗(yàn)(posthoctest)。v 多重比較多重比較是對各個(gè)總體均值進(jìn)行的兩兩比較。方法很多,是對各個(gè)總體均值進(jìn)行的兩兩比較。方法很多,如如fisher最小顯著差異(最小顯著差異(leastsignificantdifference,lsd)方法、)方法、tukey的誠實(shí)顯著差異(的誠實(shí)顯著差異(hsd)方法或)方法或bonferroni的方法等。這里我們只介紹最小顯著差異方的方法等。這里我們只介紹最小顯著差異方法。法。用用lsd法進(jìn)行多重比較的步驟

31、法進(jìn)行多重比較的步驟v 1、提出假設(shè)、提出假設(shè) h0: i= j h1: i jv 2、計(jì)算、計(jì)算檢驗(yàn)的統(tǒng)計(jì)量檢驗(yàn)的統(tǒng)計(jì)量v 3a、如果如果或或則拒絕則拒絕h0。v 3b、計(jì)算、計(jì)算的置信區(qū)間:的置信區(qū)間:如果如果0包含在該置信區(qū)間內(nèi)則不能拒絕包含在該置信區(qū)間內(nèi)則不能拒絕h0,否則拒絕,否則拒絕h0。)11(jijinnmsexxt2/tt2/tt jixx )11()(2/jijinnmsetxx失業(yè)保險(xiǎn)的例子失業(yè)保險(xiǎn)的例子v在失業(yè)保險(xiǎn)實(shí)驗(yàn)在失業(yè)保險(xiǎn)實(shí)驗(yàn)中,設(shè)顯著性水中,設(shè)顯著性水平平=0.05,試分,試分析獎(jiǎng)金水平對失析獎(jiǎng)金水平對失業(yè)時(shí)間的影響是業(yè)時(shí)間的影響是否顯著否顯著。不同獎(jiǎng)金水平失業(yè)

32、者的再就業(yè)時(shí)間(天)不同獎(jiǎng)金水平失業(yè)者的再就業(yè)時(shí)間(天)無獎(jiǎng)金無獎(jiǎng)金低獎(jiǎng)金低獎(jiǎng)金中獎(jiǎng)金中獎(jiǎng)金高獎(jiǎng)金高獎(jiǎng)金92869678100108927585939076888877878989797390757183947882828072756878798172v 應(yīng)拒絕零假設(shè),從而得出獎(jiǎng)金水平對再就業(yè)時(shí)間有顯著影應(yīng)拒絕零假設(shè),從而得出獎(jiǎng)金水平對再就業(yè)時(shí)間有顯著影響的結(jié)論。響的結(jié)論。v 根據(jù)第一個(gè)總體和第四個(gè)總體計(jì)算的根據(jù)第一個(gè)總體和第四個(gè)總體計(jì)算的t統(tǒng)計(jì)量統(tǒng)計(jì)量v 利用統(tǒng)計(jì)軟件可以計(jì)算出利用統(tǒng)計(jì)軟件可以計(jì)算出t檢驗(yàn)的臨界值檢驗(yàn)的臨界值由于由于,因此我們有證據(jù)表明因此我們有證據(jù)表明無獎(jiǎng)金組與高獎(jiǎng)金組的再

33、就業(yè)時(shí)間有顯著差異。其他獎(jiǎng)金無獎(jiǎng)金組與高獎(jiǎng)金組的再就業(yè)時(shí)間有顯著差異。其他獎(jiǎng)金水平效應(yīng)之間差異的顯著性也可以用類似的方法計(jì)算。水平效應(yīng)之間差異的顯著性也可以用類似的方法計(jì)算。90. 2)9191(6 .6811.7744.88t037. 2)32(2/t037. 29 . 22/05. 0tt變差來源變差來源ss自由度自由度msfp-值值f臨界值臨界值組間組間624.973208.323.040.04332.90組內(nèi)組內(nèi)2195.333268.60總變差總變差2820.3135v單因素多元方差分析檢驗(yàn)?zāi)匙兞渴欠袷艿狡渌粋€(gè)單因素多元方差分析檢驗(yàn)?zāi)匙兞渴欠袷艿狡渌粋€(gè)或多個(gè)變量的影響,利用該分析過程可以分析因素或多個(gè)變量的影響,利用該分析過程可以分析因素之間的主效應(yīng),也可以分析因素之間的交互效應(yīng)。之間的主效應(yīng),也可以分析因素之間的交互效應(yīng)。vmatlab工具箱中的工具箱中的multcompare函數(shù)實(shí)現(xiàn)多元方差函數(shù)實(shí)現(xiàn)多元方差分析。分析。vc=multcompare(stats)vc=multcom

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論