應(yīng)用統(tǒng)計(jì)課件第六章:方差分析_第1頁(yè)
應(yīng)用統(tǒng)計(jì)課件第六章:方差分析_第2頁(yè)
應(yīng)用統(tǒng)計(jì)課件第六章:方差分析_第3頁(yè)
應(yīng)用統(tǒng)計(jì)課件第六章:方差分析_第4頁(yè)
應(yīng)用統(tǒng)計(jì)課件第六章:方差分析_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第六章方差分析

§6.1單因子方差分析

實(shí)踐例子:美國(guó)的Burke市場(chǎng)調(diào)查公司是一家最富經(jīng)驗(yàn)的市場(chǎng)調(diào)研機(jī)構(gòu)之一。在一次研究中,一家Anon公司要評(píng)價(jià)兒童干谷類食品的潛在的新品種。Anon產(chǎn)品開發(fā)者認(rèn)為可能改善食品味道的四類關(guān)鍵因素為:1.食品中小麥與玉米的比例。2.甜味劑的類型:白糖、蜂蜜或人工制劑。3.果味香料的有無。4.加工時(shí)間的長(zhǎng)短。2用于研究由品嘗得來的數(shù)據(jù)的統(tǒng)計(jì)方法是方差分析。分析結(jié)果如下:*食品成分及甜味劑的類型對(duì)味道影響很大。*果味香精事實(shí)上破壞了食品的味道。*加工時(shí)間對(duì)味道沒有影響。這些信息幫助Anon識(shí)別出了可能產(chǎn)生最佳口味食品的因素。從而在生產(chǎn)方案中起了很大的作用。3在實(shí)際中常會(huì)遇到比較多個(gè)總體均值是否相等的問題。

例如某工廠的原料來自四個(gè)不同地區(qū),那么用不同地區(qū)的原料生產(chǎn)的產(chǎn)品的質(zhì)量是否一致?

再如某工廠有三個(gè)聯(lián)營(yíng)廠,生產(chǎn)同一產(chǎn)品,生產(chǎn)工藝也相同,那么這幾個(gè)聯(lián)營(yíng)廠的產(chǎn)品質(zhì)量是否一致?

4類似問題有許多,今后我們稱所要比較的地區(qū)、聯(lián)營(yíng)廠等為因子,因子所處的狀態(tài)稱為水平,如四個(gè)地區(qū)是地區(qū)這個(gè)因子的四個(gè)水平。我們一般用大寫字母A、B、C等表示因子,用大寫字母加下標(biāo)表示該因子的水平,如A的水平用

等表示。5下面用一個(gè)例子來說明問題的提法。例6.1.1國(guó)民計(jì)算機(jī)公司(NCP)在亞特蘭大、達(dá)拉斯以及西雅圖的工廠生產(chǎn)計(jì)算機(jī)與傳真機(jī)。為確定這些工廠中有多少員工了解全面質(zhì)量管理,從每個(gè)工廠選取了一個(gè)由6名員工組成的隨機(jī)樣本,并對(duì)他們進(jìn)行質(zhì)量意識(shí)考試。18名員工的考分列在下表中。管理者想用這些數(shù)據(jù)來檢驗(yàn)假設(shè):三個(gè)工廠的平均考分相同。6表6.1員工的考分

觀察值亞特蘭大(工廠1)達(dá)拉斯(工廠2)西雅圖(工廠3)

1

85

71

59

2

7575

643

82

73

62

4

7674

69

5

71

69

756

8582

677在本例中我們要比較三個(gè)工廠的考分是否相同,為此把工廠看成一個(gè)因子,記為A,它有三個(gè)工廠,就看成因子A的三個(gè)水平,記。我們將第個(gè)工廠的第個(gè)工人的考分記為在本例中

.由于在每個(gè)工廠選的是隨機(jī)樣本,(工人間的差異控制在最小范圍)因此一個(gè)工廠的工人的不同考分可看成是在一個(gè)工廠的若干次重復(fù)觀察。所以可把一個(gè)工廠的考分看成一個(gè)總體。為比較三個(gè)工廠的平均考分是否相同,相當(dāng)于要比較三個(gè)總體的均值是否一致。為簡(jiǎn)化起見,需要提出若干假定,把所要回答的問題歸結(jié)為一個(gè)統(tǒng)計(jì)問題,然后設(shè)法解決它。86.1.2

單因子方差分析的統(tǒng)計(jì)模型一、假定在單因子試驗(yàn)中,設(shè)因子A有r個(gè)水平,

在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體,并假定:(1)

每一總體均服從正態(tài)分布;(2)

每一總體的方差相同;(3)

從每一總體中抽取的樣本獨(dú)立。9要比較各個(gè)總體的均值是否一致,就是要檢驗(yàn)各總體的均值是否相同,設(shè)第i個(gè)總體的均值為,那么要檢驗(yàn)的假設(shè)為:

(6.1.1)其備擇假設(shè)為:

不全相同。通常

可以省略不寫。10當(dāng)

為真時(shí),A的r個(gè)水平的均值相同,這時(shí)稱因子A的各水平間無顯著差異,簡(jiǎn)稱因子A不顯著;反之,當(dāng)

不真時(shí),各

不全相同,這時(shí)稱因子A的各水平間有顯著差異,簡(jiǎn)稱因子A顯著。用于檢驗(yàn)假設(shè)(6.1.1)的統(tǒng)計(jì)方法稱為方差分析法,其實(shí)質(zhì)是檢驗(yàn)若干個(gè)具有相同方差的正態(tài)總體的均值是否相等的一種統(tǒng)計(jì)方法。若考察的因子只有一個(gè),稱為單因子方差分析。11二、數(shù)據(jù)結(jié)構(gòu)及統(tǒng)計(jì)模型設(shè)從第i個(gè)總體獲得容量為的樣本,

在水平下獲得的與不會(huì)一致,記

稱為隨機(jī)誤差,有

(6.1.2)這是的數(shù)據(jù)結(jié)構(gòu)式。

12稱

為一般平均,其中。稱

為A的第i水平的主效應(yīng),簡(jiǎn)稱為的效應(yīng)。在方差分析中引入一般平均與效應(yīng)的概念顯然有13(6.1.4)從而假設(shè)(6.1.1)可寫成:統(tǒng)計(jì)模型可以改寫成:146.1.3

檢驗(yàn)方法一、誤差來源

驗(yàn)數(shù)據(jù)

……

……

……15造成各差異的原因可能有兩個(gè):(1)原假設(shè)

不真,即各水平下總體均值不同;(2)差異是由于隨機(jī)誤差引起的。

記表示水平下的數(shù)據(jù)和,

表示水平下數(shù)據(jù)的平均值,

為所有數(shù)據(jù)的總平均值。

16每一數(shù)據(jù)與總平均的偏差可以分解成兩部分:

(6.1.5)稱為組內(nèi)偏差,僅反映隨機(jī)誤差:

(6.1.6)

稱為組間偏差,除隨機(jī)誤差之外還有第i個(gè)水平的效應(yīng):

(6.1.7)17二、平方和分解稱為總偏差平方和。

稱為誤差偏差平方和

稱為因子A的偏差平方和

18三、檢驗(yàn)統(tǒng)計(jì)量與拒絕域有計(jì)算公式:

可以證明有:19(1)求:利用正態(tài)總體中的結(jié)論(見第一章)有又由分布的可加性知:則有

20(2)求21從而有

22當(dāng)原假設(shè)為真時(shí),各

相等且為0

,則取檢驗(yàn)統(tǒng)計(jì)量為:(6.1.8)比較合理的拒絕域形式為:

對(duì)給定的顯著性水平

應(yīng)滿足

23可知當(dāng)為真

表6.1.1單因子方差分析表方差來源平方和自由度均方和

F比

24

例6.1.1的方差分析表方差來源平方和自由度均方和

比值5162258.9.000.0034301528.67

94617

P=0.003<0.05,故拒絕256.1.4

效應(yīng)與誤差方差的估計(jì)

一、點(diǎn)估計(jì)用MLE法求各效應(yīng)與方差的估計(jì)。

26加上約束條件,則MLE為:27

的MLE為,可以證明均為相應(yīng)參數(shù)的無偏估計(jì)。

不是

的無偏估計(jì)

的無偏估計(jì)為

28二、的置信水平為的置信區(qū)間我們來利用樞軸量法構(gòu)造的置信區(qū)間。從的點(diǎn)估計(jì)出發(fā),有

且它們獨(dú)立

29§6.2雙因子方差分析

一、問題對(duì)于雙因子試驗(yàn),試驗(yàn)間差異同樣是(1)由于各因子水平變化所引起;(2)試驗(yàn)誤差(包括未加控制或無法控制的因子的變化)所引起。和單因子試驗(yàn)的情況一樣,在雙因子試驗(yàn)中,方差分析的目的就是將試驗(yàn)誤差所引起的結(jié)果差異與試驗(yàn)條件的改變(即各因子不同的水平變化)所引起的結(jié)果差異區(qū)分開,以便能抓住問題的實(shí)質(zhì);此外,還要將試驗(yàn)結(jié)果的主要因子和次要因子區(qū)分開來,以便集中力量研究幾個(gè)主要因子。301、例子我們考慮與管理類研究生入學(xué)考試(GMAT)有關(guān)的一次研究。GMAT是一種商學(xué)院研究生院用來評(píng)價(jià)申請(qǐng)者攻讀該領(lǐng)域研究生課程能力的標(biāo)準(zhǔn)化考試,其分?jǐn)?shù)在200~800之間,分?jǐn)?shù)越高表明能力越強(qiáng)。為嘗試提高考生在GMAT考試中的分?jǐn)?shù),一所較大的得克薩斯洲的大學(xué)考慮提供下面三種GMAT輔導(dǎo)課程。(1)3小時(shí)的復(fù)習(xí),內(nèi)容覆蓋了GMAT中常考的題型。(2)

1天的課程,內(nèi)容覆蓋了有關(guān)考試材料,還有進(jìn)行一次模擬考試并評(píng)分。(3)10周的強(qiáng)化班,涉及到發(fā)現(xiàn)每個(gè)考生的弱點(diǎn)并建立個(gè)人的改進(jìn)課程。該研究中的一個(gè)因子就是GMAT輔導(dǎo)課程,它有三個(gè)水平:3小時(shí)復(fù)習(xí)、1天的課程和10周強(qiáng)化班。31通常GMAT的考生來自三類院校:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。該試驗(yàn)中第二個(gè)因子就是考生的本科所在的學(xué)院是否影響GMAT分?jǐn)?shù)。有三個(gè)水平:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。這兩個(gè)因子共有種水平組合,在每種水平組合下選取了由兩名考生組成的樣本。數(shù)據(jù)如下表:32表6.2.1

兩因子試驗(yàn)的GMAT分?jǐn)?shù)

因子B:學(xué)院

商學(xué)院工學(xué)院藝術(shù)與科學(xué)學(xué)院

3小時(shí)500540480

因子A:

580160400

輔導(dǎo)課程1天460560420

540620480

10周560600480

600580410

33對(duì)于表6.2.1中的數(shù)據(jù)進(jìn)行方差分析計(jì)算可以回答下面的問題。*因子A的影響:輔導(dǎo)課程對(duì)于GMAT分?jǐn)?shù)的影響是否不同?*因子B的影響:本科學(xué)院對(duì)于考生在GMAT中表現(xiàn)出來的能力方面的影響是否不同?*交互影響(因子A與因子B):是否某些學(xué)院的考生在一種輔導(dǎo)課程中表現(xiàn)不錯(cuò),但其他學(xué)院的考生卻在另一種輔導(dǎo)課程中表現(xiàn)很好。如果交互影響對(duì)于GMAT分?jǐn)?shù)有顯著作用,那么我們可以得出輔導(dǎo)課程的類型的影響依賴于本科學(xué)院的結(jié)論。342、方差分析兩因子方差分析的平方和分解公式如下:

有以下記號(hào):

35表6.2.2

有t個(gè)重復(fù)次數(shù)的兩因子試驗(yàn)的ANOVA表方差來源平方和自由度均方因子A因子B交互作用誤差

總計(jì)

363、計(jì)算與結(jié)論

因子B的第j水平下的樣本均值;采用下面一些記號(hào):─因子A第i水平和因子B的第

j水平下的第k個(gè)觀察值;

所有rst個(gè)觀察值的總樣本平均;因子A第i水平和因子B的第j水平組合下的樣本均值因子A的第i水平下的樣本均值;3738表6.2.3兩因子試驗(yàn)的GMAT研究匯總數(shù)據(jù)

商學(xué)院工學(xué)院藝術(shù)與科學(xué)行合計(jì)因子A平均值3小時(shí)復(fù)習(xí)50058010805404601000480400880

2960

1天的課程46054010005606201180420480900

3080

10周強(qiáng)化班56060011606004801180480410890

3230

列合計(jì)因子B平均值3240336026709270合計(jì)

39表6.2.4兩因子GMAT研究的ANOVA表方差來源平方和自由度均方因子A610023050因子B45300222650交互作用1120042800

誤差1985092206

總計(jì)8245017

40二、數(shù)學(xué)模型因子A有r個(gè)水平,,因子B有s個(gè)水平

,在條件下指標(biāo)值

一般平均水平的(主)效應(yīng)水平的(主)效應(yīng)要檢驗(yàn):一切是否相等。若一切均相等,A,B不顯著;若一切不全相等,則A的水平有差異,B的水平有差異,或二者均有差異。令:41

與之間的關(guān)系如下:①②

效應(yīng)可加模型(無交互作用模型)42均不拒絕一切相等拒絕,不拒絕一切不等,原因,A顯著;拒絕,不拒絕一切不等,原因,B顯著;

均拒絕一切不等。條件下進(jìn)行一次試驗(yàn),結(jié)果,因只進(jìn)行了一次試驗(yàn),故不能考查其交互作用。有如下模型:

43②,與的交互效應(yīng)44有交互作用模型:在條件下進(jìn)行m次(m≥2)試驗(yàn)結(jié)果為45例(收率)一個(gè)因子水平的好壞程度與另一因子水平無關(guān)(此情況稱無交互作用,兩直線平行),一個(gè)因子水平的好壞程度受另一因子水平的制約(此情況稱有交互作用,兩直線不平行)。

B

A低高短5060長(zhǎng)6575(55,80)46三、效應(yīng)可加模型的方差分析

1.數(shù)學(xué)模型47①分析各不同的原因1)不成立,A水平間有差異;2)不成立,B水平間有差異;3)隨機(jī)誤差48②平方和分解總的數(shù)據(jù)波動(dòng):令則總的偏差平方和為因子A的水平不同引起的數(shù)據(jù)波動(dòng):令

因子A的偏差平方和為

因子B的偏差平方和為49

只與誤差有關(guān)50③F比在為真時(shí),,因?yàn)樵跒檎鏁r(shí),在為真時(shí),可證明:且與獨(dú)立51若

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論