第3章 方差分析_第1頁(yè)
第3章 方差分析_第2頁(yè)
第3章 方差分析_第3頁(yè)
第3章 方差分析_第4頁(yè)
第3章 方差分析_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3章方差分析

AnalysisofVariance(ANOVA)3.1方差分析簡(jiǎn)介3.2單因素方差分析3.3雙因素方差分析3.1方差分析中的基本概念和假設(shè)22失業(yè)保險(xiǎn)案例:為什么要進(jìn)行方差分析?

為了減小失業(yè)保險(xiǎn)支出、促進(jìn)就業(yè),政府試圖為失業(yè)者提供再就業(yè)獎(jiǎng)勵(lì):如果失業(yè)者可以在限定的時(shí)間內(nèi)重新就業(yè),他將可以獲得一定數(shù)額的獎(jiǎng)金。政策會(huì)有效嗎?

33要研究的問(wèn)題總體1,μ1(獎(jiǎng)金=1)總體2,μ2(獎(jiǎng)金=2)總體3,μ3(獎(jiǎng)金=3)樣本1樣本2樣本3樣本4總體4,μ4(獎(jiǎng)金=4)44各個(gè)總體的均值相等嗎?Xf(X)1

2

3

4

Xf(X)3

1

2

4

55失業(yè)保險(xiǎn)案例:實(shí)驗(yàn)結(jié)果……1=無(wú)獎(jiǎng)金2=低獎(jiǎng)金3=中獎(jiǎng)金4=高獎(jiǎng)金。根據(jù)實(shí)驗(yàn)結(jié)果,可以認(rèn)為各總體的平均失業(yè)時(shí)間相同嗎?66研究方法:兩樣本的t檢驗(yàn)?用t檢驗(yàn)比較兩個(gè)均值:每次只能比較兩個(gè)均值,要解決上述問(wèn)題需要進(jìn)行6次t檢驗(yàn)……在整體檢驗(yàn)中犯第一類錯(cuò)誤的概率顯著增加:

如果在每次t檢驗(yàn)中犯第一類錯(cuò)誤的概率等于5%,則在整體檢驗(yàn)中等于1-(1-0.05)6=0.264977方差分析可以用來(lái)比較多個(gè)均值方差分析(Analysisofvariance,ANOVA)的主要目的是通過(guò)對(duì)方差的比較來(lái)檢驗(yàn)多個(gè)均值之間差異的顯著性。可以看作t檢驗(yàn)的擴(kuò)展,只比較兩個(gè)均值時(shí)與t檢驗(yàn)等價(jià)。20世紀(jì)20年代由英國(guó)統(tǒng)計(jì)學(xué)家R.A.Fisher最早提出的,開(kāi)始應(yīng)用于生物和農(nóng)業(yè)田間試驗(yàn),以后在許多學(xué)科中得到了廣泛應(yīng)用。883.1.1方差分析中的幾個(gè)基本概念因變量:我們實(shí)際測(cè)量的、作為結(jié)果的變量,例如失業(yè)持續(xù)時(shí)間。自變量:作為原因的、把觀測(cè)結(jié)果分成幾個(gè)組以進(jìn)行比較的變量例如獎(jiǎng)金水平。在方差分析中,自變量也被稱為因素(factor)。因素的不同表現(xiàn),即每個(gè)自變量的不同取值稱為因素的水平。993.1.1基本概念方差分析主要用來(lái)研究一個(gè)定量因變量與一個(gè)或多個(gè)定性自變量的關(guān)系只有一個(gè)自變量的方差分析稱為單因素方差分析。研究多個(gè)因素對(duì)因變量的影響的方差分析稱為多因素方差分析,其中最簡(jiǎn)單的情況是雙因素方差分析。1010固定效應(yīng)與隨機(jī)效應(yīng)模型固定效應(yīng)模型:因素的所有水平都是由實(shí)驗(yàn)者審慎安排而不是隨機(jī)選擇的。隨機(jī)效應(yīng)模型:因素的水平是從多個(gè)可能的水平中隨機(jī)選擇的。固定效應(yīng)和隨機(jī)效應(yīng)模型在假設(shè)的設(shè)置和參數(shù)估計(jì)上有所差異,本章研究的都是固定效應(yīng)模型。11113.1.2:方差分析中的基本假設(shè)(1)在各個(gè)總體中因變量都服從正態(tài)分布;(2)在各個(gè)總體中因變量的方差都相等;(3)各個(gè)觀測(cè)值之間是相互獨(dú)立的。1212(1)正態(tài)性的檢驗(yàn)各組數(shù)據(jù)的直方圖峰度系數(shù)、偏度系數(shù)Q-Q圖,K-S檢驗(yàn)*1313(2)等方差性的檢驗(yàn)經(jīng)驗(yàn)方法:計(jì)算各組數(shù)據(jù)的標(biāo)準(zhǔn)差,如果最大值與最小值的比例小于2:1,則可認(rèn)為是同方差的。

最大值和最小值的比例等于1.83<2Levene檢驗(yàn)*獎(jiǎng)金水平均值N標(biāo)準(zhǔn)差188.4496.82285.33911.02382.5698.38477.1196.011414(3)其它說(shuō)明方差分析對(duì)前兩個(gè)假設(shè)條件是穩(wěn)健的,允許一定程度的偏離。獨(dú)立性的假設(shè)條件一般可以通過(guò)對(duì)數(shù)據(jù)搜集過(guò)程的控制來(lái)保證。如果確實(shí)嚴(yán)重偏離了前兩個(gè)假設(shè)條件,則需要先對(duì)數(shù)據(jù)進(jìn)行數(shù)學(xué)變換,也可以使用非參數(shù)的方法來(lái)比較各組的均值。15153.2.單因素方差分析3.2.1單因素方差分析模型3.2.2方差分析的基本原理3.2.3單因素方差分析的步驟16163.2.1單因素方差分析模型單因素方差分析:模型中有一個(gè)自變量

(因素)和一個(gè)因變量。在失業(yè)保險(xiǎn)實(shí)驗(yàn)中假設(shè)張三在高獎(jiǎng)金組,則

張三的失業(yè)時(shí)間

=高獎(jiǎng)金組的平均失業(yè)時(shí)間

+隨機(jī)因素帶來(lái)的影響

=總平均失業(yè)時(shí)間

+高獎(jiǎng)金組平均值與總平均值之差

+隨機(jī)因素帶來(lái)的影響

17173.2.2:總變差(離差平方和)的分解總變差SST=SSA+SSE

因素A導(dǎo)致的變差隨機(jī)因素導(dǎo)致的變差組間離差平方和組內(nèi)離差平方和18183.2.2:組間方差和組內(nèi)方差各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方。計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是SST的自由度為n-1,n為全部觀察值的個(gè)數(shù)SSA的自由度為r-1,其中r為因素水平的個(gè)數(shù)SSE的自由度為n-r19193.2.2:組間方差和組內(nèi)方差組間離差平方和組內(nèi)離差平方和組間方差組內(nèi)方差受因素A和隨機(jī)

因素的影響只受隨機(jī)

因素的影響20203.2.2:方差分析的基本思想組間方差組內(nèi)方差如果因素A的不同水平對(duì)結(jié)果沒(méi)有影響,那么在組間方差中只包含有隨機(jī)誤差,兩個(gè)方差的比值會(huì)接近1如果不同水平對(duì)結(jié)果有影響,組間方差就會(huì)大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在顯著差異,或者說(shuō)因素A對(duì)結(jié)果有顯著影響。F=21211.檢驗(yàn)數(shù)據(jù)是否符合方差分析的假設(shè)條件。2.提出零假設(shè)和備擇假設(shè):零假設(shè):各總體的均值之間沒(méi)有顯著差異,即

備擇假設(shè):至少有兩個(gè)均值不相等,即3.2.3:方差分析的步驟22223.2.3:方差分析的步驟3.根據(jù)樣本計(jì)算F統(tǒng)計(jì)量的值。方差分析表變差來(lái)源離差平方和SS自由度df均方MSF值組間SSAr-1MSAMSA/MSE組內(nèi)SSEn-rMSE總變異SSTn-123233.2.3:方差分析的步驟4.確定決策規(guī)則并根據(jù)實(shí)際值與臨界值的

比較,或者p-值與α的比較得出檢驗(yàn)結(jié)論。

在零假設(shè)成立時(shí)組間方差與組內(nèi)方差的比值服從服從自由度為(r-1,n-r)的F分布臨界值拒絕域p-值α實(shí)際值

F檢驗(yàn)的臨界值和拒絕域

2424SPSS實(shí)例分析【例】用四種飼料喂豬,共19頭分為四組,每一組用一種飼料。一段時(shí)間后稱重,豬體重增加數(shù)據(jù)如下表所示,比較四種飼料對(duì)豬體重增加的作用有無(wú)不同。

飼料A飼料B飼料C飼料D133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6

2525第1步分析:由于考慮的是一個(gè)控制變量(飼料)對(duì)一個(gè)觀測(cè)變量(豬體重)的影響,而且是4種飼料,所以不適宜用獨(dú)立樣本T檢驗(yàn)(僅適用兩組數(shù)據(jù)),應(yīng)采用單因素方差分析。第2步數(shù)據(jù)的組織:數(shù)據(jù)分成兩列,一列是豬的體重,變量名為“weight”,另一變量是飼料品種(變量值分別為1,2,3,4),變量名為“fodder”,輸入數(shù)據(jù)并保存。第3步方差相等的齊性檢驗(yàn):由于方差分析的前提是各個(gè)水平下(這里是不同的飼料folder影響下的體重weight)的總體服從方差相等的正態(tài)分布,且各組方差具有齊性。其中正態(tài)分布的要求并不是很嚴(yán)格,但對(duì)于方差相等的要求是比較嚴(yán)格的,因此必須對(duì)方差相等的前提進(jìn)行檢驗(yàn)。

2626

不同飼料的方差齊性檢驗(yàn)結(jié)果TestofHomogeneityofVariances豬重LeveneStatisticdf1df2Sig..024315.995方差齊性檢驗(yàn)的H0假設(shè)是:方差相等。從上表可看出相伴根據(jù)Sig.=0.995>(0.05)說(shuō)明應(yīng)該接受H0假設(shè)(即方差相等)。故下面就用方差相等的檢驗(yàn)方法。2727

豬重SumofSquaresdfMeanSquareFSig.BetweenGroups20538.69836846.233157.467.000WithinGroups652.1591543.477Total21190.85818幾種飼料的方差檢驗(yàn)(ANOVA)結(jié)果上表是幾種飼料方差分析的結(jié)果,組間(BetweenGroups)平方和(SumofSquares)為20538.698,自由度(df)為3,均方為6846.233;組內(nèi)(WithinGroups)平方和為652.159,自由度為15,均方為43.477;F統(tǒng)計(jì)量為157.467。由于組間比較的相伴概率Sig.(p值)=0.000<0.05,故應(yīng)拒絕H0假設(shè)(四種飼料喂豬效果無(wú)顯著差異),說(shuō)明四種飼料對(duì)養(yǎng)豬的效果有顯著性差異。2828第4步多重比較分析:通過(guò)上面的步驟,只能判斷4種飼料喂豬效果是否有顯著差異。如果想進(jìn)一步了解究竟是哪種飼料與其他組有顯著性的均值差別(即哪種飼料更好)等細(xì)節(jié)問(wèn)題,就需要在多個(gè)樣本均值間進(jìn)行兩兩比較。由于第3步檢驗(yàn)出來(lái)方差具有齊性,故選擇一種方差相等的方法,這里選LSD方法;顯著性水平默認(rèn)取0.05;

2929第5步運(yùn)行主要結(jié)果及分析:

多重比較(MultipleComparisons)結(jié)果豬重LSD(I)飼料品種(J)飼料品種MeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBound12-18.68000*4.17024.000-27.5687-9.79133-56.36000*4.17024.000-65.2487-47.47134-87.41500*4.42321.000-96.8428-77.98722118.68000*4.17024.0009.791327.56873-37.68000*4.17024.000-46.5687-28.79134-68.73500*4.42321.000-78.1628-59.30723156.36000*4.17024.00047.471365.2487237.68000*4.17024.00028.791346.56874-31.05500*4.42321.000-40.4828-21.62724187.41500*4.42321.00077.987296.8428268.73500*4.42321.00059.307278.1628331.05500*4.42321.00021.627240.4828*.Themeandifferenceissignificantatthe0.05level.從整個(gè)表反映出來(lái)四種飼料相互之間均存在顯著性差異,從效果來(lái)看是第4種最好,其次是第3種,第1種最差。3030

均值折線圖上圖為幾種飼料均值的折線圖,可以看出均值分布比較陡峭,均值差異也較大。3131主要內(nèi)容3.1方差分析簡(jiǎn)介3.2單因素方差分析3.3多因素方差分析32323.3.1基本概念及統(tǒng)計(jì)原理基本概念多因素方差分析用來(lái)研究?jī)蓚€(gè)及兩個(gè)以上的控制變量是否對(duì)觀測(cè)變量產(chǎn)生顯著影響。多因素方差分析不僅能夠分析多個(gè)控制因素對(duì)觀測(cè)變量的影響,也能夠分析多個(gè)控制因素的交互作用對(duì)觀測(cè)變量產(chǎn)生影響,進(jìn)而最終找到利于觀測(cè)變量的最優(yōu)組合。多因素方差分析不僅需要分析多個(gè)控制變量獨(dú)立作用對(duì)觀測(cè)變量的影響,還要分析多個(gè)控制變量的交互作用對(duì)觀測(cè)變量的影響,及其他隨機(jī)變量對(duì)結(jié)果的影響。因此,需要將觀測(cè)變量總的離差平方各分解為3個(gè)部分:多個(gè)控制變量單獨(dú)作用引起的離差平方和;多個(gè)控制變量交互作用引起的離差平方和;其他隨機(jī)因素引起的離差平方和。33333.3多因素方差分析(2)統(tǒng)計(jì)原理

以兩個(gè)控制變量為例,多因素方差分析將觀測(cè)變量的總離差平方和分解為:SST=SSA+SSB+SSAB+SSE設(shè)控制變量A有k個(gè)水平,變量B有r個(gè)水平,則SSA的定義為(SSB的定義類似):

其中,為因素A第i個(gè)水平和因素B第j個(gè)水平下的樣本觀測(cè)值個(gè)數(shù),為因素A第i個(gè)水平下觀測(cè)變量的均值。

其中,是因素A、B在水平i、j下的觀測(cè)變量均值。3434在固定效應(yīng)模型中,各F統(tǒng)計(jì)量為:在隨機(jī)效應(yīng)模型中,統(tǒng)計(jì)量不變,其他兩個(gè)F統(tǒng)計(jì)量分別為:35353.3多因素方差分析(3)分析步驟第1步提出零假設(shè):多因素方差分析的零假設(shè)H0是:各控制變量不同水平下觀測(cè)變量各總體均值無(wú)顯著差異,控制變量各效應(yīng)和交互作用效應(yīng)同時(shí)為0,即控制變量和它們的交互作用對(duì)觀測(cè)變量沒(méi)有產(chǎn)生顯著性影響。第2步構(gòu)造檢驗(yàn)統(tǒng)計(jì)量:多因素方差分析采用的是F統(tǒng)計(jì)量,根據(jù)效應(yīng)模型選擇。第3步計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和概率p值:SPSS會(huì)自動(dòng)將相關(guān)數(shù)據(jù)代入各式,計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值的概率p值(也稱相伴概率值Sig.)。第4步給出顯著性水平,作出決策。

3636SPSS實(shí)例分析【例】研究一個(gè)班三組不同性別的同學(xué)(分別接受了三種不同的教學(xué)方法)在數(shù)學(xué)成績(jī)上是否有顯著差異,數(shù)據(jù)如下表。

姓名數(shù)學(xué)組別性別姓名數(shù)學(xué)組別性別張青華990m郭曉艷992m王潔云880f李福利702f吳凌風(fēng)990m羅帆892m劉行890m宋麗君551f馬萌940f辛瑞晶501m單玲玲900m王瀅瀅671f羅超波792m蔡春江671m尹珣562f武佳琪561f張敏892m陳雪吟561m3737第1步分析:需要研究不同教學(xué)方法和不同性別對(duì)數(shù)學(xué)成績(jī)的影響。這是一個(gè)多因素(雙因素)方差分析問(wèn)題。第2步數(shù)據(jù)組織:如上表的變量名組織成4列數(shù)據(jù)。第3步變量設(shè)置:按“分析|一般線性模型|單變量”的步驟打開(kāi)單變量對(duì)話框。并將“數(shù)學(xué)”變量移入因變量框中,將“組別”和“性別”移入固定因子中,如下圖:

3838第4步設(shè)置

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論