版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1第六章方差分析
§6.1單因子方差分析
實(shí)踐例子:美國(guó)的Burke市場(chǎng)調(diào)查公司是一家最富經(jīng)驗(yàn)的市場(chǎng)調(diào)研機(jī)構(gòu)之一。在一次研究中,一家Anon公司要評(píng)價(jià)兒童干谷類食品的潛在的新品種。Anon產(chǎn)品開發(fā)者認(rèn)為可能改善食品味道的四類關(guān)鍵因素為:1.食品中小麥與玉米的比例。2.甜味劑的類型:白糖、蜂蜜或人工制劑。3.果味香料的有無。4.加工時(shí)間的長(zhǎng)短。2用于研究由品嘗得來的數(shù)據(jù)的統(tǒng)計(jì)方法是方差分析。分析結(jié)果如下:*食品成分及甜味劑的類型對(duì)味道影響很大。*果味香精事實(shí)上破壞了食品的味道。*加工時(shí)間對(duì)味道沒有影響。這些信息幫助Anon識(shí)別出了可能產(chǎn)生最佳口味食品的因素。從而在生產(chǎn)方案中起了很大的作用。3在實(shí)際中常會(huì)遇到比較多個(gè)總體均值是否相等的問題。
例如某工廠的原料來自四個(gè)不同地區(qū),那么用不同地區(qū)的原料生產(chǎn)的產(chǎn)品的質(zhì)量是否一致?
再如某工廠有三個(gè)聯(lián)營(yíng)廠,生產(chǎn)同一產(chǎn)品,生產(chǎn)工藝也相同,那么這幾個(gè)聯(lián)營(yíng)廠的產(chǎn)品質(zhì)量是否一致?
4類似問題有許多,今后我們稱所要比較的地區(qū)、聯(lián)營(yíng)廠等為因子,因子所處的狀態(tài)稱為水平,如四個(gè)地區(qū)是地區(qū)這個(gè)因子的四個(gè)水平。我們一般用大寫字母A、B、C等表示因子,用大寫字母加下標(biāo)表示該因子的水平,如A的水平用
等表示。5下面用一個(gè)例子來說明問題的提法。例6.1.1國(guó)民計(jì)算機(jī)公司(NCP)在亞特蘭大、達(dá)拉斯以及西雅圖的工廠生產(chǎn)計(jì)算機(jī)與傳真機(jī)。為確定這些工廠中有多少員工了解全面質(zhì)量管理,從每個(gè)工廠選取了一個(gè)由6名員工組成的隨機(jī)樣本,并對(duì)他們進(jìn)行質(zhì)量意識(shí)考試。18名員工的考分列在下表中。管理者想用這些數(shù)據(jù)來檢驗(yàn)假設(shè):三個(gè)工廠的平均考分相同。6表6.1員工的考分
觀察值亞特蘭大(工廠1)達(dá)拉斯(工廠2)西雅圖(工廠3)
1
85
71
59
2
7575
643
82
73
62
4
7674
69
5
71
69
756
8582
677在本例中我們要比較三個(gè)工廠的考分是否相同,為此把工廠看成一個(gè)因子,記為A,它有三個(gè)工廠,就看成因子A的三個(gè)水平,記。我們將第個(gè)工廠的第個(gè)工人的考分記為在本例中
.由于在每個(gè)工廠選的是隨機(jī)樣本,(工人間的差異控制在最小范圍)因此一個(gè)工廠的工人的不同考分可看成是在一個(gè)工廠的若干次重復(fù)觀察。所以可把一個(gè)工廠的考分看成一個(gè)總體。為比較三個(gè)工廠的平均考分是否相同,相當(dāng)于要比較三個(gè)總體的均值是否一致。為簡(jiǎn)化起見,需要提出若干假定,把所要回答的問題歸結(jié)為一個(gè)統(tǒng)計(jì)問題,然后設(shè)法解決它。86.1.2
單因子方差分析的統(tǒng)計(jì)模型一、假定在單因子試驗(yàn)中,設(shè)因子A有r個(gè)水平,
在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體,并假定:(1)
每一總體均服從正態(tài)分布;(2)
每一總體的方差相同;(3)
從每一總體中抽取的樣本獨(dú)立。9要比較各個(gè)總體的均值是否一致,就是要檢驗(yàn)各總體的均值是否相同,設(shè)第i個(gè)總體的均值為,那么要檢驗(yàn)的假設(shè)為:
(6.1.1)其備擇假設(shè)為:
不全相同。通常
可以省略不寫。10當(dāng)
為真時(shí),A的r個(gè)水平的均值相同,這時(shí)稱因子A的各水平間無顯著差異,簡(jiǎn)稱因子A不顯著;反之,當(dāng)
不真時(shí),各
不全相同,這時(shí)稱因子A的各水平間有顯著差異,簡(jiǎn)稱因子A顯著。用于檢驗(yàn)假設(shè)(6.1.1)的統(tǒng)計(jì)方法稱為方差分析法,其實(shí)質(zhì)是檢驗(yàn)若干個(gè)具有相同方差的正態(tài)總體的均值是否相等的一種統(tǒng)計(jì)方法。若考察的因子只有一個(gè),稱為單因子方差分析。11二、數(shù)據(jù)結(jié)構(gòu)及統(tǒng)計(jì)模型設(shè)從第i個(gè)總體獲得容量為的樣本,
在水平下獲得的與不會(huì)一致,記
稱為隨機(jī)誤差,有
(6.1.2)這是的數(shù)據(jù)結(jié)構(gòu)式。
12稱
為一般平均,其中。稱
為A的第i水平的主效應(yīng),簡(jiǎn)稱為的效應(yīng)。在方差分析中引入一般平均與效應(yīng)的概念顯然有13(6.1.4)從而假設(shè)(6.1.1)可寫成:統(tǒng)計(jì)模型可以改寫成:146.1.3
檢驗(yàn)方法一、誤差來源
試
驗(yàn)數(shù)據(jù)
……
……
……15造成各差異的原因可能有兩個(gè):(1)原假設(shè)
不真,即各水平下總體均值不同;(2)差異是由于隨機(jī)誤差引起的。
記表示水平下的數(shù)據(jù)和,
表示水平下數(shù)據(jù)的平均值,
為所有數(shù)據(jù)的總平均值。
16每一數(shù)據(jù)與總平均的偏差可以分解成兩部分:
(6.1.5)稱為組內(nèi)偏差,僅反映隨機(jī)誤差:
(6.1.6)
稱為組間偏差,除隨機(jī)誤差之外還有第i個(gè)水平的效應(yīng):
(6.1.7)17二、平方和分解稱為總偏差平方和。
稱為誤差偏差平方和
稱為因子A的偏差平方和
18三、檢驗(yàn)統(tǒng)計(jì)量與拒絕域有計(jì)算公式:
可以證明有:19(1)求:利用正態(tài)總體中的結(jié)論(見第一章)有又由分布的可加性知:則有
20(2)求21從而有
22當(dāng)原假設(shè)為真時(shí),各
相等且為0
,則取檢驗(yàn)統(tǒng)計(jì)量為:(6.1.8)比較合理的拒絕域形式為:
對(duì)給定的顯著性水平
,
應(yīng)滿足
23可知當(dāng)為真
表6.1.1單因子方差分析表方差來源平方和自由度均方和
F比
24
例6.1.1的方差分析表方差來源平方和自由度均方和
比值5162258.9.000.0034301528.67
94617
P=0.003<0.05,故拒絕256.1.4
效應(yīng)與誤差方差的估計(jì)
一、點(diǎn)估計(jì)用MLE法求各效應(yīng)與方差的估計(jì)。
26加上約束條件,則MLE為:27
的MLE為,可以證明均為相應(yīng)參數(shù)的無偏估計(jì)。
不是
的無偏估計(jì)
的無偏估計(jì)為
28二、的置信水平為的置信區(qū)間我們來利用樞軸量法構(gòu)造的置信區(qū)間。從的點(diǎn)估計(jì)出發(fā),有
且它們獨(dú)立
29§6.2雙因子方差分析
一、問題對(duì)于雙因子試驗(yàn),試驗(yàn)間差異同樣是(1)由于各因子水平變化所引起;(2)試驗(yàn)誤差(包括未加控制或無法控制的因子的變化)所引起。和單因子試驗(yàn)的情況一樣,在雙因子試驗(yàn)中,方差分析的目的就是將試驗(yàn)誤差所引起的結(jié)果差異與試驗(yàn)條件的改變(即各因子不同的水平變化)所引起的結(jié)果差異區(qū)分開,以便能抓住問題的實(shí)質(zhì);此外,還要將試驗(yàn)結(jié)果的主要因子和次要因子區(qū)分開來,以便集中力量研究幾個(gè)主要因子。301、例子我們考慮與管理類研究生入學(xué)考試(GMAT)有關(guān)的一次研究。GMAT是一種商學(xué)院研究生院用來評(píng)價(jià)申請(qǐng)者攻讀該領(lǐng)域研究生課程能力的標(biāo)準(zhǔn)化考試,其分?jǐn)?shù)在200~800之間,分?jǐn)?shù)越高表明能力越強(qiáng)。為嘗試提高考生在GMAT考試中的分?jǐn)?shù),一所較大的得克薩斯洲的大學(xué)考慮提供下面三種GMAT輔導(dǎo)課程。(1)3小時(shí)的復(fù)習(xí),內(nèi)容覆蓋了GMAT中常考的題型。(2)
1天的課程,內(nèi)容覆蓋了有關(guān)考試材料,還有進(jìn)行一次模擬考試并評(píng)分。(3)10周的強(qiáng)化班,涉及到發(fā)現(xiàn)每個(gè)考生的弱點(diǎn)并建立個(gè)人的改進(jìn)課程。該研究中的一個(gè)因子就是GMAT輔導(dǎo)課程,它有三個(gè)水平:3小時(shí)復(fù)習(xí)、1天的課程和10周強(qiáng)化班。31通常GMAT的考生來自三類院校:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。該試驗(yàn)中第二個(gè)因子就是考生的本科所在的學(xué)院是否影響GMAT分?jǐn)?shù)。有三個(gè)水平:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。這兩個(gè)因子共有種水平組合,在每種水平組合下選取了由兩名考生組成的樣本。數(shù)據(jù)如下表:32表6.2.1
兩因子試驗(yàn)的GMAT分?jǐn)?shù)
因子B:學(xué)院
商學(xué)院工學(xué)院藝術(shù)與科學(xué)學(xué)院
3小時(shí)500540480
因子A:
580160400
輔導(dǎo)課程1天460560420
540620480
10周560600480
600580410
33對(duì)于表6.2.1中的數(shù)據(jù)進(jìn)行方差分析計(jì)算可以回答下面的問題。*因子A的影響:輔導(dǎo)課程對(duì)于GMAT分?jǐn)?shù)的影響是否不同?*因子B的影響:本科學(xué)院對(duì)于考生在GMAT中表現(xiàn)出來的能力方面的影響是否不同?*交互影響(因子A與因子B):是否某些學(xué)院的考生在一種輔導(dǎo)課程中表現(xiàn)不錯(cuò),但其他學(xué)院的考生卻在另一種輔導(dǎo)課程中表現(xiàn)很好。如果交互影響對(duì)于GMAT分?jǐn)?shù)有顯著作用,那么我們可以得出輔導(dǎo)課程的類型的影響依賴于本科學(xué)院的結(jié)論。342、方差分析兩因子方差分析的平方和分解公式如下:
有以下記號(hào):
35表6.2.2
有t個(gè)重復(fù)次數(shù)的兩因子試驗(yàn)的ANOVA表方差來源平方和自由度均方因子A因子B交互作用誤差
總計(jì)
363、計(jì)算與結(jié)論
因子B的第j水平下的樣本均值;采用下面一些記號(hào):─因子A第i水平和因子B的第
j水平下的第k個(gè)觀察值;
所有rst個(gè)觀察值的總樣本平均;因子A第i水平和因子B的第j水平組合下的樣本均值因子A的第i水平下的樣本均值;3738表6.2.3兩因子試驗(yàn)的GMAT研究匯總數(shù)據(jù)
商學(xué)院工學(xué)院藝術(shù)與科學(xué)行合計(jì)因子A平均值3小時(shí)復(fù)習(xí)50058010805404601000480400880
2960
1天的課程46054010005606201180420480900
3080
10周強(qiáng)化班56060011606004801180480410890
3230
列合計(jì)因子B平均值3240336026709270合計(jì)
39表6.2.4兩因子GMAT研究的ANOVA表方差來源平方和自由度均方因子A610023050因子B45300222650交互作用1120042800
誤差1985092206
總計(jì)8245017
40二、數(shù)學(xué)模型因子A有r個(gè)水平,,因子B有s個(gè)水平
,在條件下指標(biāo)值
一般平均水平的(主)效應(yīng)水平的(主)效應(yīng)要檢驗(yàn):一切是否相等。若一切均相等,A,B不顯著;若一切不全相等,則A的水平有差異,B的水平有差異,或二者均有差異。令:41
與之間的關(guān)系如下:①②
效應(yīng)可加模型(無交互作用模型)42均不拒絕一切相等拒絕,不拒絕一切不等,原因,A顯著;拒絕,不拒絕一切不等,原因,B顯著;
均拒絕一切不等。條件下進(jìn)行一次試驗(yàn),結(jié)果,因只進(jìn)行了一次試驗(yàn),故不能考查其交互作用。有如下模型:
43②,與的交互效應(yīng)44有交互作用模型:在條件下進(jìn)行m次(m≥2)試驗(yàn)結(jié)果為45例(收率)一個(gè)因子水平的好壞程度與另一因子水平無關(guān)(此情況稱無交互作用,兩直線平行),一個(gè)因子水平的好壞程度受另一因子水平的制約(此情況稱有交互作用,兩直線不平行)。
B
A低高短5060長(zhǎng)6575(55,80)46三、效應(yīng)可加模型的方差分析
1.數(shù)學(xué)模型47①分析各不同的原因1)不成立,A水平間有差異;2)不成立,B水平間有差異;3)隨機(jī)誤差48②平方和分解總的數(shù)據(jù)波動(dòng):令則總的偏差平方和為因子A的水平不同引起的數(shù)據(jù)波動(dòng):令
因子A的偏差平方和為
因子B的偏差平方和為49
只與誤差有關(guān)50③F比在為真時(shí),,因?yàn)樵跒檎鏁r(shí),在為真時(shí),可證明:且與獨(dú)立51若
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 兒童康復(fù)治療知識(shí)試題及答案
- 自考《00233 稅法》考前強(qiáng)化練習(xí)試題庫(kù)(含答案)
- 2025年河北藝術(shù)職業(yè)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 2025年江漢藝術(shù)職業(yè)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 2025年杭州萬向職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 物業(yè)運(yùn)營(yíng)與維護(hù)管理
- 校企合作三方協(xié)議書
- 養(yǎng)老資料課件
- 2025年外研版2024選擇性必修3歷史下冊(cè)月考試卷
- 2025年冀教版選修四歷史上冊(cè)月考試卷
- 2025江蘇太倉(cāng)水務(wù)集團(tuán)招聘18人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024-2025學(xué)年人教新版高二(上)英語(yǔ)寒假作業(yè)(五)
- 江蘇省泰州市靖江市2024屆九年級(jí)下學(xué)期中考一模數(shù)學(xué)試卷(含答案)
- 沐足店長(zhǎng)合同范例
- 《旅游資料翻譯》課件
- 2024年安徽省中考數(shù)學(xué)試卷含答案
- 2024年湖南省公務(wù)員錄用考試《行測(cè)》真題及答案解析
- 微項(xiàng)目 探討如何利用工業(yè)廢氣中的二氧化碳合成甲醇-2025年高考化學(xué)選擇性必修第一冊(cè)(魯科版)
- 廣東省廣州市黃埔區(qū)2024-2025學(xué)年八年級(jí)物理上學(xué)期教學(xué)質(zhì)量監(jiān)測(cè)試題
- 教科版六年級(jí)科學(xué)下冊(cè) (廚房里的物質(zhì)與變化)教學(xué)課件
- 公務(wù)員面試應(yīng)急應(yīng)變題目大全及解析
評(píng)論
0/150
提交評(píng)論