方差分析 本科畢業(yè)論文_第1頁
方差分析 本科畢業(yè)論文_第2頁
方差分析 本科畢業(yè)論文_第3頁
方差分析 本科畢業(yè)論文_第4頁
方差分析 本科畢業(yè)論文_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、本科學生畢業(yè)論文方差分析作 者 院 (系) 專 業(yè) 年 級 學 號 指導老師 日 期 方差分析 摘 要:方差分析是從觀察變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量.本文根據(jù)不同需要把某變量方差分解為不同的部分,比較它們之間的大小并用檢驗進行顯著性檢驗的方法,并且用excel解決了一些問題.關鍵詞:單因素方差分析;雙因素方差分析;組間方差;組內(nèi)方差;統(tǒng)計量1 方差分析問題的提出假設檢驗主要是檢驗兩總體的均值是否差異顯著,對于多個總體均值是否差異顯著的問題,如果按照每一對總體進行一次檢驗,顯然要花費很多時間,而方差分析能一次性地檢驗多個總體均值是否存在顯著差異.因此,方

2、差分析所提供的處理方法比兩兩比較的處理方法要方便很多. 例1:取一批由同種原料織成的布,用不同的染整工藝進行縮水實驗,以考察不同的染整工藝對布的縮水率有無顯著影響,進而可以尋找出縮水率較小的染整工藝.現(xiàn)有五種不同的工藝,在每一工藝下重復處理四塊布,測得其縮水率數(shù)據(jù)如下表所示,試問五種不同的染整工藝的平均縮水率有無顯著差異?表1 染整工藝縮水率4.36.85.26.56.16.34.24.16.58.38.68.29.38.77.210.19.58.811.48.9例2:在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:是以魚粉為主的飼料是以槐樹粉為主的飼料,是以苜蓿粉為主的飼料.為比較三種飼料

3、的效果,特選24只相似的雛雞隨機均分為三組,每組各喂一種飼料,60天后觀察它們的重量,試驗結果如下所示:表2飼料 雞重/g107310091060100110021012100910281107109299011091090107411221001109310291080102110221032102910482 基本概念指標:衡量試驗條件好壞的變量稱為指標,用y表示,它是一個隨機變量.在例1中,縮水率就是試驗指標. 因子:在試驗中影響指標y的因素稱為因子,它們常用大寫字母、等來表示.在例1中染整工藝對指標縮水率有影響,因此染整工藝就是因子,記為 水平:在試驗中因子所處的狀態(tài)稱為因子的水平,用

4、表示因子的字母加下標來表示,譬如因子的水平用等來表示.在例1中有五種染整工藝,這便是染整工藝這一因子五個水平,分別記為試驗條件(也稱處理):在單因子試驗中,每個水平就是一個處理,在多因子試驗中,每個因子取一個特定的水平,這些特定水平的組合稱其為一個試驗條件,又稱為一個處理.3 基本假定從最簡單的單因子試驗問題著手,介紹在方差分析中所作的假定.假定因子有個水平,記為在水平下指標值的全體便構成一個總體,共有個總體.我們有如下假定:(1)假定第個總體服從正態(tài)分布,其均值為, (2)每一總體的方差相等,記為; (3)從第個總體獲得一個容量為的樣本為,且這個樣本相立. 在上述三個假定下,比較各個總體的均

5、值是否相同的問題,即要檢驗如下假設不全相等,檢驗這一對假設的統(tǒng)計方法便是方差分析.當拒絕時,表示不同水平下的指標的均值有顯著差異,此時稱因子是顯著的,否則稱因子不顯著. 4 統(tǒng)計模型按假定有,因此可以認為觀察值與其均值的差是隨機誤差,從而 有如下數(shù)據(jù)結構式:由及各個相互獨立,可知各相互獨立,且都服從.因此可以給出如下的單因子方差分析統(tǒng)計的模型: 在該模型下檢驗的假設是:,為了推廣到兩因子及多因子方差分析方便起見,引入一般平均與效應的概念,如記各均值的平均為:稱為一般平均,或稱為總平均,又記它表示從水平的均值中除去總均值后特有的貢獻,稱為水平的效應,它可正可負,容易看出,諸受到約束: 這樣一來,

6、統(tǒng)計模型可改寫為, 在該模型下檢驗的假設可以改寫為:5 基本思想5.1 平方和分解眾所周知,各數(shù)據(jù)的差異程度(即波動大?。┛捎盟鼈兊目偲钇椒胶停ê喎Q總平方和)去度量:,其中為自由度.引起數(shù)據(jù)波動的原因不外有如下兩個:(1)由于因子的不同水平引起的,當原假設不真時,各個水平下指標的均值(簡稱水平均值)不同,諸樣本均值間的差異程度可用如下的偏差平方和去度量:這里乘以是為每個水平進行了次試驗.這個平方和稱為組間偏差平方和,又稱為因子偏差平方和,簡稱因子平方和.(2)由于試驗存在隨機誤差,即使在同一水平下獲得的數(shù)據(jù)也會有差異,這是除因子水平外的一切原因引起的,我們將它們歸結為隨機誤差,可以用組內(nèi)偏差

7、平方和(也稱為誤差平方和)表示:由于考慮到交叉乘積項之和為0,故有如下總平方和分解式:5.2 均方(平均偏差平方和)與比偏差平方和q的大小與數(shù)據(jù)個數(shù)(自由度)有關,一般說來,數(shù)據(jù)越多,其偏差平方和越大.為了便于在偏差平方和間進行比較,統(tǒng)計上引入了均方和的概念,它定義為,其意為平均每個自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度.如今要對因子平方和與誤差平方和之間進行比較,用其均方和進行比較更為合理,因為均方和排除了自由度不同產(chǎn)生的干擾.故用作為檢驗的統(tǒng)計量.如果,則認為因子顯著;若,則說明因子不顯著.經(jīng)過簡單推導,可以給出常用的各偏差平方和的計算公式如下:.6 單因子方差分析 設在

8、一個試驗中只考慮一個因子,它有個水平,在每個水平下進行次重復試驗,其結果用表示,常常把數(shù)據(jù)列成如表3的形式:表3水平試驗數(shù)據(jù)和均值待添加的隱藏文字內(nèi)容3例3:某連鎖商業(yè)企業(yè)在同城三個不同的地點開了三家分店,從這三家分店隨機抽了5天的營業(yè)額資料如表4表4第一家分店第二家分店第三家店第一天10714第二天12118第三天9812第四天81310第五天111011試分析這三家分店的平均日營業(yè)額是否相同,從而確定地點因素是否對日均營業(yè)額有影響(),如果把每一個分店的日營業(yè)額看成一個總體,以上問題的實質(zhì)是檢驗這三個總體的均值是否相等:,其中,分別為三分店的平均日營業(yè)額.通過excel,進行單因素方差分析

9、,可以得到兩個統(tǒng)計表,并且得出統(tǒng)計量:表5方差分析:單因素方差分析組觀測數(shù)求和平均方差列 1550102.5列 25499.85.7列 3555115方差分析差異源-value crit組間4066666670.4696970.6362153.885294組內(nèi)52.8124.4總計56.9333333314由上表可得:,樣本的統(tǒng)計量,分析表給出了臨界值是,接受,即沒有充分證據(jù)說明三個分店的地點不同對日均營業(yè)額產(chǎn)生了影響.如果直接從值進行判斷,由于,結論也是接受原假設.6.1 重復數(shù)不等的方差分析例4: 某型號化油器原中小喉管的結構使油耗較大,為節(jié)約能源,設想了兩種改進

10、方案以降低油耗.油耗的多少用比油耗進行度量,現(xiàn)在對用各種結構的中小喉管制造的化油器分別測定其比油耗,數(shù)據(jù)如下.假定每一種結構下的比油耗服從等方差的正態(tài)分布,試問中小喉管的結構對平均比油耗的影響是否顯著.表6水平:原結構11.012.87.68.34.75.59.310.3:改進方案12.84.5-1.50.2:改進方案24.36.11.43.6現(xiàn)在對這些數(shù)據(jù)做方差分析用excel,有下表7表7方差分析:單因素方差分析組觀測數(shù)求和平均方差行1869.58.68757.518393行2461.57.126667行3415.43.853.776667方差分析差異源-valuecrit組間155.64

11、56277.8228111.855070.0011743.805565組內(nèi)85.33875136.564519總計240.984415設,從分布表查得,由于求得的,所以在水平上因子是顯著的,說明不同的中小喉管結構生產(chǎn)化油器的平均比油耗有明顯的差異.6.2 各水平均值與誤差方差的估計當因子是顯著的,我們還可以給出每一水平均值與水平效應的估計,以便找出最好的水平.,它們都是相應參數(shù)的無偏估計,從而第個水平均值的無偏估計為誤差方差的無偏估計: ,可取得的估計為.6.3 多重比較 在單因子方差分析中,若經(jīng)檢驗拒絕原假設,這表明,因子的個水平均值不全相等,但不一定兩兩之間都有差異.故還需進一步去確認哪些

12、水平均值之間確有顯著的差異,哪些水平之間無顯著的差異.這就要進行多重比較.同時比較任意兩個水平均值間有無顯著差異的問題稱為多重比較.這里的關鍵詞是“同時”兩字.若有r(r2)個水平均值,則同時檢驗以下個假設的檢驗就是多重比較的問題:譬如在時,多重比較問題就是要同時檢驗如下三個假設:直接考慮,當為真時,不應過大,過大就應拒絕.因此在同時考慮個假設時,“諸中至少有一個不成立”就構成多重比較的拒絕域,它應有如下形式:這里表示水平下數(shù)據(jù)的平均值,.對于給定的顯著性水平,就要確定這樣的臨界值,使得上述個假設都成立時有. 7 兩因子方差分析如果在一個試驗中需要同時考察兩個因子和,并設因子有個水平,因子有個

13、水平,這時共有個不同的試驗條件,也就是說有個總體.現(xiàn)做如下假設: 每一個總體的分布是正太分布,其均值為,它與因子及的水平有關;其方差相等,都是. 現(xiàn)在我們不僅需要分析因子的不同水平對指標的均值有無顯著的影響,還需要分析因子的不同水平對指標的均值有無顯著的影響,有時還需要回答兩個因子不同水平的搭配對指標的均值有無特殊的影響,這種特殊影響如果存在就稱為因子與間有交互作用,記為或.7.1 無交互作用下的方差分析:設與是可能對試驗結果有影響的兩個因素,相互獨立,無交互作用.設在雙因素各種水平的組合下進行試驗或抽樣,得數(shù)據(jù)如表8:表8因素均值因素均值表中每行均值是在因素的各個水平上試驗結果的平均數(shù);表中

14、每列的均值是在因素的各種水平上試驗的平均數(shù).以上數(shù)據(jù)的離差平方和分解形式為:上式中,表示的是因素的組間方差總和,是因素的組間方差總和,都是由各因素在不同的水平下各自的均值差異引起的;仍是組內(nèi)方差的部分,由隨機誤差產(chǎn)生.各個方差的自由度是:的自由度為,的自由度為,的自由度為,的自由度為.各個方差對應的均方差是:對因素而言,對因素而言,;對隨機誤差項而言,我們得到檢驗因素與影響是否顯著的統(tǒng)計量分別是,.例5:某企業(yè)有三臺不同型號的設備,生產(chǎn)同一種產(chǎn)品,現(xiàn)有五名工人輪流在此三臺設備上操作,記錄下他們的日產(chǎn)量如表所示.試根據(jù)方差分析說明這三臺設備之間和五名工人之間對日產(chǎn)量的影響是否顯著?表9工人1工人

15、2工人3工人4工人5設備a6472638178設備b7566617380設備c7867806971解:檢驗的假設有兩個,第一個假設是針對設備(設為因素)的:h01:三臺設備對日產(chǎn)量沒有顯著影響;:三臺設備對日產(chǎn)量有顯著影響.第二個假設是針對人員(設為因素)的:工人技術對日產(chǎn)量沒有顯著的影響;:工人技術對日產(chǎn)量有顯著影響.將以上數(shù)據(jù)輸入excel表格中,進行“無重復雙因素分析”,輸出的方差分析表如下:方差分析:無重復雙因素分析表10觀測數(shù)求和平均方差設備a535871.665.3設備b53557156.5設備c53657332.5工人1321772.3333354.33333工人2320568.

16、3333310.33333工人3320468109工人4322374.3333337.33333工人5322976.3333322.33333方差分析差異源行10.533325.2666670.092371列161.0667440.266670.706226誤差456.1333857.01667總計627.733314從表中可知:接受,沒有證據(jù)證明三臺設備對日產(chǎn)量有顯著影響;,接受,也沒有證據(jù)證明五名工人的技術對日產(chǎn)量有顯著影響.7.2 有交互作用的方差分析:為了研究兩個因素是否獨立,有無交互作用,我們需要在各個因素水平的組合下,進行重復試驗;因此,有交互作用時,方差分析的數(shù)據(jù)結果不同于無交互

17、作用的情形.設因素與因素每一對水平搭配下重復試驗的次數(shù)都是,得試驗數(shù)據(jù)結構如表11:表11因素因素表中的表示的是在因素水平組合下第次試驗的結果.在此組合下試驗結果的平均值為:進一步記:則我們類似有以下的離差平方和分解形式:式中 ,與無交互作用的雙因素方差分解相比,這里多出了一項,它剛好反映了兩個因素交互作用的結果.離差平方和,和的自由度分別是.我們得到如下的均方差: 則檢驗因素與影響是否顯著的統(tǒng)計量分別是: .檢驗交互影響是否顯著的統(tǒng)計量是:.例6:為了分析光照因素與噪音因素對工人生產(chǎn)有無影響,光照效應與噪音效應應有交互作用,在此兩因素不同的水平組合下做試驗,結果如表12:表12因素因素15

18、15 1719 19 1616 18 2117 17 1715 15 1519 22 2215 17 1618 17 1618 18 1818 20 2015 16 1717 17 17 解: 檢驗的假設有三個: :光照因素對產(chǎn)量沒有顯著影響; :光照因素對產(chǎn)量有顯著影響; :噪音因素對產(chǎn)量沒有顯著影響; :噪音因素對產(chǎn)量有顯著影響;:光照效應與噪音效應沒有交互作用;:光照效應與噪音效應有交互作用.將以上數(shù)據(jù)輸入excel表格中,進行“有重復雙因素分析”,輸出的方差分析表13:表13方差分析:可重復雙因素分析summary總計 觀測數(shù)333312求和47514858204平均15.666671

19、71619.3333317方差1.333333011.3333332.90909 觀測數(shù)333312求和54455148198平均1815171616.5方差30112.27273 觀測數(shù)333312求和55635451223平均18.3333321181718.5833方差6.3333333004.08333總計觀測數(shù)9999求和156159153157平均17.3333317.666671717.44444方差4.257.751.252.777778 方差分析差異源-value樣本28.38889214.194449.4629630.00093列2.08333330.6944440.462

20、9630.71077交互63.83333610.638897.0925930.0002內(nèi)部36241.5總計130.305635接受,沒有充分證據(jù)證明光照對產(chǎn)量有顯著影響;,拒絕,有充分證據(jù)說明噪音對產(chǎn)量有顯著影響;,拒絕,有充分證據(jù)說明光照與噪音存在交互作用并由此對產(chǎn)量產(chǎn)生顯著影響.8 方差齊性檢驗,正態(tài)性檢驗與診斷 以上分析都是基于方差分析中對數(shù)據(jù)的三項假定(正態(tài)性,方差齊性與數(shù)據(jù)間獨立性)成立下進行的.那么這些假定是否滿足?只有試驗是按隨機次序進行的,那么獨立性一般不成問題.下面先討論方差齊性.設第個總體的分布為,從中獲得的樣本是,記樣本方差為,則方差齊性所要檢驗的假設可以表示為:,對此

21、通常采用bartlett檢驗,檢驗統(tǒng)計量為:其中,對給定的顯著性水平,拒絕域為:,該檢驗不管重復數(shù)是否相等均可使用.例7:如在上面的化油器問題中,檢驗三個總體的方差是否相等. 解:本題中所涉及的三個總體對應的樣本方差分別為:由上面可知:在0.05水平上拒絕域為.現(xiàn)在,則 樣本未落在拒絕域中,所以在0.05水平上可以認為所涉及的三個總體的方差相等.下面做正態(tài)性檢驗與診斷.關于數(shù)據(jù)來自正態(tài)分布的檢驗可分兩種情況處理.(1)若各個水平下重復試驗次數(shù)不少于8,可對每水平下的數(shù)據(jù)分別用正態(tài)概率紙作檢驗.注:若把各個水平下的數(shù)據(jù)畫在同一張正態(tài)概率紙上,且每一水平下的點各自呈現(xiàn)在一條直線附近,此時r條直線近

22、似平行,還可以看出它們的方差近似相等.(2)若各個水平下重復試驗次數(shù)少于8,那么可以計算每一數(shù)據(jù)的殘差這時共有個殘差,它們可近似看作來自同一個正態(tài)總體,用此個殘差作正態(tài)概率圖,若個點呈直線狀即可認為正態(tài)性假設成立.注:所謂殘差是指觀察值與擬合值之差,在單因子方差分析中每水平的第個觀察值為,其擬合值(即的估計)是,因此殘差,利用殘差進行判斷的方法稱為診斷.參考文獻1茆詩松,程依明,濮曉龍編著.概率論與數(shù)理統(tǒng)計教程m.高等教育出版社,2004.(7).80120.2王松桂,陳敏,陳立革編著.線性統(tǒng)計模型m.高等教育出版社,1999.(9).5070. 3曾五一主編.統(tǒng)計學概論m.首都經(jīng)貿(mào)大學出版社,2008.(5) .70110. 4周紀薌,茆詩松主編.質(zhì)量管理統(tǒng)計方法m.中國統(tǒng)計出版社,2008.(10). 75120. 5黃良文,曾五一.統(tǒng)計學原理m.中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論