方差分析原理_第1頁(yè)
方差分析原理_第2頁(yè)
方差分析原理_第3頁(yè)
方差分析原理_第4頁(yè)
方差分析原理_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

方差分析原理

與單因素方差分析方差分析

ANOVA(analysisofvariance)在現(xiàn)實(shí)的生產(chǎn)和經(jīng)營(yíng)管理過(guò)程中,影響產(chǎn)品質(zhì)量、數(shù)量或銷量的因素往往很多,如農(nóng)作物的收獲量受作物品種、肥料種類及數(shù)量等的影響;不同地區(qū)、不同時(shí)期對(duì)某種產(chǎn)品的銷量有影響等等。在眾多因素中,有些因素影響大些,有些則小些?,F(xiàn)實(shí)中常常需要分析哪幾種因素對(duì)生產(chǎn)或銷售起顯著影響,并需知道起顯著作用的因素如何進(jìn)行最優(yōu)組合,可以獲得最理想的效果。方差分析是解決這些問(wèn)題的一種有效方法什么是方差分析高產(chǎn)油菜品種的選取問(wèn)題品種田塊A1A2A3A4A51256244250288206222230027728021232802902303152204298275322279212平均畝產(chǎn)264277.25269.75285.50212.50消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)

行業(yè)觀測(cè)值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在四個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表:消費(fèi)者對(duì)四個(gè)行業(yè)的投訴問(wèn)題方差分析解決的問(wèn)題分析不同品種的畝產(chǎn)(四個(gè)行業(yè)之間的服務(wù)質(zhì)量)是否有顯著差異,實(shí)質(zhì)是判斷“品種”這個(gè)分類型自變量對(duì)“畝產(chǎn)”這個(gè)數(shù)值型因變量是否有顯著影響(“行業(yè)”對(duì)“投訴次數(shù)”)。做出這樣的判斷最終被歸結(jié)為檢驗(yàn)四個(gè)品種的平均畝產(chǎn)量(平均投訴次數(shù))是否相等。如果均值相等,就意味著“品種”對(duì)“畝產(chǎn)”(“行業(yè)”對(duì)“投訴次數(shù)”)沒(méi)有顯著影響?!胺讲罘治觥敝小胺讲睢钡暮x1923年,F(xiàn)isher首先提出了“方差分析”,通常認(rèn)為他是這一方法的創(chuàng)始人“方差分析”所分析的并非是“方差”,而是研究數(shù)據(jù)間的“變異”,是在可比較的群組中,把總的變異按各指定的變異來(lái)源進(jìn)行分解的一種技巧。方差分析檢驗(yàn)的是均值是否相等,而不是方差是否相等方差分析中的有關(guān)術(shù)語(yǔ)試驗(yàn)指標(biāo)(指標(biāo)):y如畝產(chǎn),投訴次數(shù)因子(因素)(factor)影響試驗(yàn)指標(biāo)y的因素A,B,C…如品種,行業(yè)因子的水平(處理)(treatment)因子的不同表現(xiàn)

A1,A2,…,Ar或B1,B2,…,Bs

如五個(gè)不同品種,四個(gè)行業(yè)(零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè))方差分析中的有關(guān)術(shù)語(yǔ)觀測(cè)值在每個(gè)因子水平下得到的樣本數(shù)據(jù)yij水平數(shù):r;s單因子方差分析(one-wayANOVA)只有一個(gè)因子多因子方差分析(MANOVA)兩個(gè)及兩個(gè)以上的個(gè)因子方差分析的基本思想和原理

(圖形分析)零售業(yè)旅游業(yè)航空公司家電制造從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)是有明顯差異的即使是在同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造也被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒(méi)有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理

(圖形分析)僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異也可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源。

方差分析的基本思想和原理比較兩類誤差,以檢驗(yàn)均值是否相等比較的基礎(chǔ)是方差比如果系統(tǒng)誤差顯著地不同于隨機(jī)誤差,則均值就是不相等的;反之,均值就是相等的誤差是由各部分的誤差占總誤差的比例來(lái)測(cè)度的方差分析的基本思想和原理方差分析的基本思想和原理

(兩類誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差

系統(tǒng)誤差(處理誤差)因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理

(兩類方差)數(shù)據(jù)的誤差用平方和(sumofsquares)表示,稱為方差組內(nèi)方差(withingroups)因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機(jī)誤差組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,四個(gè)行業(yè)被投訴次數(shù)之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理

(方差的比較)若不同行業(yè)對(duì)投訴次數(shù)沒(méi)有影響,則組間誤差中只包含隨機(jī)誤差,沒(méi)有系統(tǒng)誤差。這時(shí),組間誤差與組內(nèi)誤差經(jīng)過(guò)平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1若不同行業(yè)對(duì)投訴次數(shù)有影響,在組間誤差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間誤差平均后的數(shù)值就會(huì)大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說(shuō)明不同行業(yè)對(duì)投訴次數(shù)有顯著影響方差分析的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每個(gè)行業(yè)被投訴的次數(shù)必需服從正態(tài)分布各個(gè)總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,四個(gè)行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立方差分析中的基本假定在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近四個(gè)樣本的均值越接近,推斷四個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中基本假定

如果原假設(shè)成立,即H0:m1=m2=m3

=m4四個(gè)行業(yè)被投訴次數(shù)的均值都相等意味著每個(gè)樣本都來(lái)自均值為

、方差為

2的同一正態(tài)總體xf(x)

1

2

3

4

方差分析中基本假定

若備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的四個(gè)樣本分別來(lái)自均值不同的四個(gè)正態(tài)總體

Xf(X)

3

1

2

4

問(wèn)題的一般提法設(shè)因素有r個(gè)水平,每個(gè)水平的均值分別用

1、

2、、r

表示要檢驗(yàn)r個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):H0:

1

2

r

H1:

1,2,,r不全相等設(shè)

1為零售業(yè)被投訴次數(shù)的均值,

2為旅游業(yè)被投訴次數(shù)的均值,

3為航空公司被投訴次數(shù)的均值,

4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:

1

2

3

4

H1:

1,2,3,4

不全相等本節(jié)小結(jié)方差分析采用數(shù)理統(tǒng)計(jì)方法對(duì)所得結(jié)果進(jìn)行分析,以鑒別各種因素對(duì)研究對(duì)象的某些特性值影響大小。方差分析是檢驗(yàn)多個(gè)總體均值是否相等的一種統(tǒng)計(jì)方法。方差分析是通過(guò)對(duì)試驗(yàn)結(jié)果的分析去判斷因子是否顯著的一種統(tǒng)計(jì)方法。方差分析方法是解決具有相同方差的k(k>2)個(gè)正態(tài)總體的均值是否有顯著差異問(wèn)題的有效方法。單因素方差分析單因素方差分析

(one-wayANOVA)解決一個(gè)因子的不同水平的試驗(yàn)結(jié)果之間的差異顯著性問(wèn)題。解決一個(gè)因子的不同水平對(duì)試驗(yàn)結(jié)果的影響程度問(wèn)題。1、模型與假設(shè)的提出考慮因子A取r個(gè)水平,分析這r個(gè)水平對(duì)指標(biāo)y的影響在每個(gè)Ai下,重復(fù)做m次試驗(yàn),i=1,2,…,r一般情況,假定在Ai水平下的指標(biāo)

其中要求yij

的方差σ2是相同的~單因子方差分析數(shù)據(jù)(表)模型

水平重復(fù)

A1

A2…Ai…Ar12…j…m

y11

y21…yi1…yr1

y12

y22…yi2…yr2………………

y1j

y2j…yij

…yrj………………

y1m

y2m…yim

…yrm假設(shè)的提出在單因子方差分析中就是要通過(guò)對(duì)數(shù)據(jù)yij的分析去判斷μ1,μ2,…

μr是否全部相同yij

的數(shù)據(jù)結(jié)構(gòu)形式:

yij

=μi+εij

μi為在Ai水平下yij的平均水平

εij為在第i水平下第j次試驗(yàn)的隨機(jī)誤差,且~即要檢驗(yàn)假設(shè)

H0:μ1=μ2=…=μr

是否成立討論因子A的不同水平對(duì)試驗(yàn)結(jié)果之間差異的影響是否顯著的問(wèn)題假設(shè)的另一種提法ai為因子A的第i水平的效應(yīng):

ai=μi-μ其中:μ為總的平均水平,

yij

的數(shù)據(jù)結(jié)構(gòu)形式:

yij

=μ+ai+εi

jμ為總的平均水平εij為在第i水平下第j次試驗(yàn)的隨機(jī)誤差單因子方差分析數(shù)據(jù)結(jié)構(gòu)模型,且相互獨(dú)立即要檢驗(yàn)假設(shè)

H0:a1=a2=…=ar=0

是否成立討論因子A的不同水平的效應(yīng)是否可以忽略不計(jì)的問(wèn)題2、檢驗(yàn)統(tǒng)計(jì)量的確定yij取值不同主要原因有:一是可能A取不同水平所引起的;二是隨機(jī)誤差引起的。偏差平方和的分解是構(gòu)建適用于方差分析的F

統(tǒng)計(jì)量的重要工具。是區(qū)分系統(tǒng)性誤差(條件誤差)和隨機(jī)誤差(偶然性誤差)的主要方法。偏差平方和的分解數(shù)據(jù)總的差異可用總偏差平方和ST來(lái)表示引入Ai

水平的均值(組平均)

總的偏差平方和分解總偏差平方和ST:因子A偏差平方和

(組間偏差平方和)SA:隨機(jī)偏差平方和(組內(nèi)偏差平方和)Se:

各偏差平方和的含義組內(nèi)偏差平方和Se:反映了同一水平下的試驗(yàn)值與其平均值的偏差平方和反映各總體的樣本均值之間的差異程度是由隨機(jī)因素引起的組間偏差平方和SA:反映了由于因子水平變化所引起的組平均與總平均的偏差平方和反映每個(gè)樣本各觀察值的離散狀況一般是由隨機(jī)因素和系統(tǒng)誤差引起的如果原假設(shè)成立,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間均方與組內(nèi)均方之間差異的大小三個(gè)平方和的作用F統(tǒng)計(jì)量的構(gòu)建由于,且相互獨(dú)立,則:由于,所以在H0為真時(shí),在假設(shè)H0成立時(shí)檢驗(yàn)假設(shè)H0的拒絕域?yàn)槠渲袨轱@著性水平,是自由度為的F分布上側(cè)分位數(shù)。

越小,拒絕H0的把握越大,因子A的顯著性越高。~方差分析表來(lái)源平方和S自由度f(wàn)均方和V(方差)F比顯著性Aer-1n-r***(*)Tn-1判斷說(shuō)明

**:高度顯著F>F0.01*:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論