版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章方差分析在上一章的假設(shè)檢驗中,我們研究了一個樣本的平均數(shù)或比例與假設(shè)的總體均值或比例的差異是否顯著的問題。我們也研究了兩個樣本的平均值和比例差異是否顯著的問題。但是如果需要檢驗兩個以上總體的均值是否相等,上一章所介紹的方法就不再適用了。這需要用方差分析的方法來解決。方差分析主要用來檢驗兩個以上樣本的平均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值的總體。方差分析對于比較不同生產(chǎn)工藝或設(shè)備條件下產(chǎn)量、質(zhì)量的差異,分析不同計劃方案效果的好壞和比較不同地區(qū)、不同人員有關(guān)的數(shù)量指標(biāo)差異是否顯著時,是非常有用的。第一節(jié)單因素方差分析一、問題的提出例5-1。為了比較三種不同材料對產(chǎn)品壽命的
2、影響,試驗人員分別對三種不同材料所制造的一組產(chǎn)品的壽命進(jìn)行了測試,所得結(jié)果如表5-1所示(為簡化計算,以各取4個樣本為例)。表5-1:某種材料使用壽命的抽樣統(tǒng)計表材料種類實驗1實驗2實驗3實驗4A 115 116 98 83B103 107 118 116C 73 89 85 97 現(xiàn)要求根據(jù)上述試驗結(jié)果,顯著性水平為的條件下,檢驗所選用的材料對最終產(chǎn)品的使用壽命的影響是否顯著。從統(tǒng)計的角度看,就是要檢驗三種不同的材料所生產(chǎn)的最終產(chǎn)品的使用壽命的均值是否一致。通常,在方差分析中,我們把對試驗結(jié)果發(fā)生影響和起作用的自變量稱為因素。如果方差分析研究的是一個因素對于試驗結(jié)果的影響和作用,就稱為單因素
3、方差分析。在本例中,因素就是可能影響產(chǎn)品使用壽命的材料。因素的不同選擇方案稱之為因素的水平。上例中材料有三種不同的選擇就說因素有三個水平。因素的水平實際上就是因素的取值或者是因素的分組,例如,可以在包裝、質(zhì)量、價格和銷售區(qū)域等方面取不同的值或分為不同的組,就表示因素選了不同的水平。方差分析要檢驗的問題就是當(dāng)因素選不同的水平時,對結(jié)果有無顯著的影響。若無顯著影響,則隨便選擇哪一種材料都無所謂。否則就要選擇最終產(chǎn)品壽命最長的一種材料。一般地,我們假定所檢驗的結(jié)果受某一因素A的影響,它可以取K個不同的水平:1,2,3,K。對于因素的每一個水平i都進(jìn)行n次試驗,結(jié)果分別為,我們把這一組樣本記作,假定,
4、即對于因素的每一個水平,所得到的結(jié)果都服從正態(tài)分布,且方差相等。用統(tǒng)計的語言來表達(dá),要檢驗的假設(shè)就是:不是所有的都相等()由此可見,方差分析是研究一個或多個可分組的變量(稱為自變量)與一個連續(xù)變量(因變量)之間的統(tǒng)計關(guān)系,并測定自變量在取各種不同水平時對因變量的影響和作用的一種統(tǒng)計分析方法。方差分析通過比較和檢驗在因素的不同水平下均值之間是否存在顯著的統(tǒng)計差異的方法來測定因素的不同水平對因變量的影響和作用的差異。二、方差分析的基本原理和步驟方差分析的基本思路是一方面確定因素的不同水平下均值之間的方差,把它作為對由所有試驗數(shù)據(jù)所組成的全部總體的方差的一個估計值。另一方面,再考慮在同一水平下不同試
5、驗數(shù)據(jù)對于這一水平的均值的方差。由此,計算出對由所有試驗數(shù)據(jù)所組成的全部數(shù)據(jù)的總體方差的第二個估計值;最后,比較上述兩個估計值。如果這兩個方差的估計值比較接近就說明因素的不同水平下的均值間的差異并不大,就接受零假設(shè)。否則,就說明因素的不同水平下的均值間的差異比較大,就接受備擇假設(shè)。根據(jù)上述思路我們可以得到方差分析的方法和步驟。1、提出假設(shè)即因素的不同水平對試驗結(jié)果無顯著影響,不是所有的都相等(),即因素的不同水平對試驗結(jié)果有顯著影響。 2、方差分解我們先定義總離差平方和為各樣本觀察值與總均值的離差平方和。記作 SST=其中:是樣本總均值,即=為樣本觀察值總數(shù)。將總離差平方和分解為兩部分: SS
6、T= = =+其中:是第I個樣本的平均值,即=記 SSE=表示同一樣本組內(nèi),由于隨機(jī)因素影響所產(chǎn)生的離差平方和,簡稱為組內(nèi)平方和。記 SSR=表示不同的樣本組之間,由于變異因素的不同水平影響所產(chǎn)生的離差平方和,簡稱為組間平方和。由此可以得到 SST=SSR+SSE對應(yīng)于SST,SSR和SSE的自由度分別為: N-1, K-1, N-K相應(yīng)的自由度之間的關(guān)系也有: N-1=(K-1)+(N-K) 3、F檢驗將SSR和SSE分別除以其自由度,即得各自的均方差:組間均方差MSR=SSR/(K-1)組內(nèi)的均方差MSE=SSE/(N-K)統(tǒng)計上可以證明 E(MSE)= E(MSR)=+由此可見,如果原假
7、設(shè)成立,則E(MSE)= E(MSR)=;否則 E(MSR)>。根據(jù)F分布,如果原假設(shè)成立,那么MSR和MSE均是的無偏估計,因而MSR/MSE就服從自由度為(K-1)和(N-K)的F分布。檢驗統(tǒng)計量如上所述,當(dāng)原假設(shè)成立時,E(MSE)= E(MSR)=。此時MSR較小,F(xiàn)值也較小。反之不成立時,MSR較大,F(xiàn)值也較大。對于給定的顯著性水平查F分布表得到。如果,則原假設(shè)不成立,即K個組的總體均值之間有顯著的差異,就拒絕。若,則原假設(shè)成立,即K個組的總體均值之間沒有顯著的差異,就接受。4、方差分析表上述方差分析的方法可以用一張標(biāo)準(zhǔn)形式的表格來實現(xiàn),這種表格稱為方差分析表。它將方差分析的計
8、算方法以簡潔的形式進(jìn)行總結(jié)。表格分為五列,第一列表示方差的來源,第二列表示方差的離差的平方和,第三列表示自由度,第四列為均方差,第五列為統(tǒng)計檢驗量F。表格又分為三行。第一行是組間的方差SSR和均方差MSR,表示因素的不同水平的影響所產(chǎn)生的方差,其值作為計算統(tǒng)計檢驗量F時的分子;第二行是組內(nèi)方差SSE和均方差MSE,表示隨機(jī)誤差所引起的方差,其值作為計算統(tǒng)計檢驗量F的分母,第三行是檢驗行,表示總的方差SST。由于方差分析表概括了方差分析的中統(tǒng)計量之間的關(guān)系,我們在進(jìn)行方差分析時就可以直接按照方差分析表來逐行,逐列地計算出有關(guān)的統(tǒng)計量,最后得到檢驗量F的值,并把這一F值與查表所得到的一定顯著性水平
9、下的F檢驗的臨界值進(jìn)行比較,以得出接受或拒絕原假設(shè)的結(jié)論。單因素方差分析表方差來源離差平方和自由度均方差統(tǒng)計檢驗量F 組間SSR K-1 MSR 組內(nèi)SSE N-K MSE總方差 SST N-1對于本節(jié)開頭的例5-1,我們可計算得到方差分析表如下:單因素方差分析表方差來源離差平方和自由度均方差統(tǒng)計檢驗量F 不同材料間1304 2 652 4.92同種材料間1192 9 132.4 總方差 2496 11現(xiàn)假設(shè)原問題規(guī)定檢驗的顯著性水平=0.05,查表得到。因為F=4.92>所以拒絕,即我們有95%的把握認(rèn)為三種材料所制造的機(jī)器的壽命有顯著的差異。第二節(jié)雙因素方差分析前面所研究的是試驗結(jié)果
10、僅受一個因素影響的情形。要求檢驗的是當(dāng)因素取不同水平時對結(jié)果所產(chǎn)生的影響是否顯著。但在實踐中,某種試驗結(jié)果往往受到兩個或兩個以上因素的影響。例如,產(chǎn)品的合格率可能與所用的設(shè)備以及操作人員有關(guān),企業(yè)的利潤可能與市場的潛力、產(chǎn)品的式樣和所投入的廣告費用有關(guān)等等有關(guān)。如果我們研究的是兩個因素的不同水平對試驗結(jié)果的影響是否顯著的問題就稱作雙因素方差分析。雙因素方差分析中兩個因素的影響既可能是相互聯(lián)系、相互影響的,也可能是相互獨立的。因此,在分析的方法和步驟上要比單因素時來得復(fù)雜一些。雙因素方差分析的基本思想與單因素方差分析基本相同。首先分別計算出總變差、各個因素的變差以及隨機(jī)誤差的變差。其次根據(jù)各變差
11、相應(yīng)的自由度求出均方差,最后計算出F值并作F檢驗。雙因素方差分析根據(jù)兩個因素相互之間是否有交互影響而分為無交互影響的和有交互影響的兩種情形。我們首先研究兩因素?zé)o交互影響時的情形。一、無交互影響的雙因素方差分析如果某一試驗結(jié)果受到A和B兩個因素的影響。這兩個因素分別可取K和M個水平,則雙因素方差分析實際上就是要比較因素A的K個水平的均值之間是否存在顯著差異,因素B的M個水平的均值之間是否存在顯著差異。目的是要檢驗試驗中這兩個因素所起的作用有多大,是僅僅一個因素在起作用,還是兩個因素起作用或者是兩個因素的作用都不顯著。在假定兩個因素?zé)o交互影響的情形,通常采用不重復(fù)試驗,即對于兩個因素每一種水平的組
12、合只進(jìn)行一次試驗,這樣總共就進(jìn)行K*M次試驗。假定試驗的結(jié)果如表5-3所示。表5-3:雙因素分析的試驗結(jié)果觀察值因素B的水平 1 2 3 m 行總和因素 1 A的 2 水平 k 列總和其中:是因素A為水平I,因素B為水平J時的觀察值,是因素A在i水平下的所有觀察值的總和,是因素B在j水平下的所有觀察值的總和因素A在i水平下的平均值;因素B在j水平下的平均值;是所有觀察值的總和,是所有觀察值的平均值,是所有觀測值的總數(shù)。雙因素的方差分析問題實際上也是一個假設(shè)檢驗問題。對于無交互影響的雙因素方差分析其方法和步驟如下: 1、形成假設(shè)由于兩因素相互獨立,因此可以分別對每一個因素進(jìn)行檢驗。對于因素A:因
13、素A的各個水平的影響無顯著差異:因素A的各種水平的影響有顯著差異對于因素B:因素B的各種水平的影響無顯著差異,因素B的各種水平的影響有顯著差異 2、進(jìn)行離差平方和的分解=上式展開式中三個二倍乘積項均為零。我們令于是就有: SST=SSA+SSB+SSE SST的自由度為(N-1),SSA和SSB的自由度分別為(K-1)和(M-1),而SSE的自由度為(N-1)-(K-1)-(M-1)=N-K-M-1=(K-1)(M-1) 3、編制方差分析表,進(jìn)行F檢驗從方差分解式所得到的SSA、SSB和SSE除以各自的自由度,就得到各自相應(yīng)的均方差,然后與單因素方差分析時一樣,我們可以得到無交互影響時雙因素方
14、差分析表如下:雙因素?zé)o交互影響時的方差分析表方差來源離差平方和自由度均方差統(tǒng)計檢驗量F 因素ASSA K-1 因素BSSB M-1 誤差E SSE (K-1)(M-1) 總方差 SST N-1根據(jù)方差分析表計算得到和以后,根據(jù)問題的顯著性水平,查表得到。于是我們可以分別檢驗因素A和B的影響是否顯著。對于因素A而言,若>,我們就拒絕關(guān)于因素A的原假設(shè),說明因素A對結(jié)果有顯著的影響。否則,就接受原假設(shè),說明因素A對結(jié)果沒有顯著的影響。對于因素B而言,若>,我們就拒絕關(guān)于因素B的原假設(shè),說明因素B對結(jié)果有顯著的影響。否則,就接受原假設(shè),說明因素B對結(jié)果沒有顯著的影響。二、有交互作用的兩因
15、素方差分析前面假定因素A與因素B之間相互獨立,不存在相互影響,但有時兩個因素會產(chǎn)生交互作用,從而使因素A的某些水平與因素B的另一些水平相結(jié)合時對結(jié)果產(chǎn)生更大的影響。對于有交互作用的兩因素之間方差分析的步驟幾乎與前一種情形一樣,不同的是當(dāng)兩因素之間存在交互作用時情形,先要剔除交互作用的影響,因此比較復(fù)雜。同時在有交互作用的影響時對于每一種試驗條件要進(jìn)行多次重復(fù)試驗以便將因素間交互作用的平方和從誤差平方和中分離出來。由于重復(fù)試驗數(shù)據(jù)量就大大增加了。有交互作用的兩因素方差分析的方法和步驟同前面一樣,關(guān)鍵是對總離差平方和進(jìn)行分解時必須考慮兩因素的交互作用。設(shè)因素A有個水平,因素B有個水平,試驗的重復(fù)次
16、數(shù)記作。記為在因素A的第i個水平,因素B的第j個水平下進(jìn)行第k次試驗時的觀察值。記為在因素A的第I個水平,因素B的第j個水平下進(jìn)行各次重復(fù)試驗的所有觀察值的總和。記為在因素A的第I個水平,因素B的第j個水平下進(jìn)行各次重復(fù)試驗的所有觀察值的平均值。記是所有觀察值的平均值,其中:是所有觀測值的總數(shù)。利用上面所引入的符號,我們可以得到有交互作用的兩因素方差分析的步驟如下: 1、形成假設(shè)由于兩因素有交互影響,因此除了分別檢驗兩因素單獨對試驗結(jié)果的影響外,還必須檢驗兩因素交互影響的作用是否顯著。對于因素A:因素A的各個水平的影響無顯著差異,:因素A的各個水平的影響有顯著差異。對于因素B:因素B的各個水平
17、的影響無顯著差異,因素B的各個水平的影響有顯著差異。對于因素AB的交互作用:因素AB的各個水平的交互作用無顯著影響,:因素AB的各個水平的交互作用有顯著影響。 2、進(jìn)行離差平方和的分解有交互作用的兩因素方差分析的這時總離差平方和可以分解為四項:+總離差平方和的自由度為。分別記為因素A的離差平方和,自由度為。為因素B的離差平方和,自由度為。表示隨機(jī)誤差的離差平方和,自由度為。表示因素間交互作用的離差平方和,自由度為。 3、編制方差分析表,進(jìn)行F檢驗從方差分解式所得到的SSA、SSB、SSAB和SSE除以各自的自由度,就得到各自相應(yīng)的均方差,然后我們對因素A、因素B和因素AB的交互作用分別作F檢驗
18、。與前面所討論的情形一樣的,這一過程也可以用表格來表示,就得到無交互影響時雙因素方差分析表如下:有交互影響的雙因素方差分析表方差來源離差平方和自由度均方差統(tǒng)計檢驗量F 因素ASSA因素BSSB交互作用 SSAB誤差E SSE 總方差 SST 與前面所討論過的一樣,根據(jù)方差分析表計算得到、和以后,根據(jù)問題的顯著性水平,查表分別得到、和。于是我們可以分別檢驗因素A和B的影響,以及兩因素的交互作用的影響是否顯著。對于因素A而言,若>,我們就拒絕關(guān)于因素A的原假設(shè),說明因素A對結(jié)果有顯著的影響。否則,就接受原假設(shè),說明因素A對結(jié)果沒有顯著的影響。對于因素B而言,若>,我們就拒絕關(guān)于因素B的原假設(shè),說明因素B對結(jié)果有顯著的影響。否則,就接受原假設(shè),說明因素B對結(jié)果沒有顯著的影響。對于兩因素的交互作用,若>,我們就拒絕關(guān)于兩因素交互作用的原假設(shè),說明因素A和因素B對結(jié)果有顯著交互影響。否則,就接受原假設(shè),說明兩因素對結(jié)果沒有顯著的交互影響。練習(xí)題5-1 把學(xué)生隨機(jī)地分為三組,一組采用程序
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 飛鳥集讀后感范文
- 招生實踐報告
- 心理健康教育工作總結(jié)15篇
- 關(guān)于美德演講稿范文800字(32篇)
- 暑假護(hù)士見習(xí)報告(3篇)
- 浙江省麗水市(2024年-2025年小學(xué)五年級語文)統(tǒng)編版質(zhì)量測試(上學(xué)期)試卷及答案
- 湖北省黃岡市(2024年-2025年小學(xué)五年級語文)人教版質(zhì)量測試((上下)學(xué)期)試卷及答案
- 市政道路路基土方、石方施工規(guī)范征求意見稿
- 上海市市轄區(qū)(2024年-2025年小學(xué)五年級語文)統(tǒng)編版期中考試(上學(xué)期)試卷及答案
- 上海市縣(2024年-2025年小學(xué)五年級語文)統(tǒng)編版開學(xué)考試((上下)學(xué)期)試卷及答案
- 云南小學(xué)地方課程二年級上冊動物王國教學(xué)設(shè)計
- 向拉齊尼巴依卡同志學(xué)習(xí)ppt
- 管轄權(quán)異議申請書電子版下載
- 論文評審意見范文(通用7篇)
- 《當(dāng)代教育心理學(xué)》(第3版)配套題庫考研真題+章節(jié)題庫
- 2011深圳市公務(wù)員錄用考試《行測》真題
- 學(xué)校校園欺凌師生訪談記錄表六篇
- 基因測試題樣本
- 2023年度軍隊文職《教育學(xué)》真題庫(含答案)
- 電氣安全管理程序
- 全國教育期刊雜志社網(wǎng)址投稿郵箱電話地址一覽
評論
0/150
提交評論