統(tǒng)計學(第二版) 費宇第5章方差分析_第1頁
統(tǒng)計學(第二版) 費宇第5章方差分析_第2頁
統(tǒng)計學(第二版) 費宇第5章方差分析_第3頁
統(tǒng)計學(第二版) 費宇第5章方差分析_第4頁
統(tǒng)計學(第二版) 費宇第5章方差分析_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

統(tǒng)計學主編:費宇,石磊第二版第五章方差分析2023/1/5《統(tǒng)計學》第5章方差分析5-3

方差分析是統(tǒng)計檢驗的一種。由英國著名統(tǒng)計學家:R.A.FISHER推導出來的,也叫F檢驗。用于分析試驗數(shù)據(jù)中各個因素對試驗指標值影響顯著程度的一種統(tǒng)計方法。2023/1/5《統(tǒng)計學》第5章方差分析5-4主要內(nèi)容5.1方差分析的思想及基本概念5.2單因素方差分析5.3雙因素方差分析2023/1/5《統(tǒng)計學》第5章方差分析5-55.1方差分析的思想及基本概念

方差分析(analysisofvariance,簡記為ANOVA)的主要思想是將影響指標值的一個或幾個因素取不同的水平,然后建立相應的方差分析模型,由此給出檢驗因素的不同水平對指標值是否有顯著影響的統(tǒng)計分析過程。2023/1/5《統(tǒng)計學》第5章方差分析5-6方差分析的基本概念

因變量(dependentvariable)

:也稱為響應變量(responsevariable)或指標值,它是指在我們在研究問題中最感興趣的測量指標。

因素(factor):也稱為自變量,是指那些可能對指標值產(chǎn)生影響的變量。

水平(level):因素的不同取值也稱為“處理”

(treatment)。2023/1/5《統(tǒng)計學》第5章方差分析5-7方差分析的基本假設方差分析中有3個基本假設假設1:每一個總體都應該服從正態(tài)分布。也就是說,對于因素的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機樣本。假設2:各個總體的方差都相等。也就是說,對于每一個水平下的觀察數(shù)據(jù),是從具有相同方差的正態(tài)總體抽取的。假設3:從每一個總體中抽取的樣本是相互獨立的,即各個觀測值之間是相互獨立的。2023/1/5《統(tǒng)計學》第5章方差分析5-85.2單因素方差分析5.2.1單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

在單因素方差分析中,記因素為,其有個水平,指標值在因素的第水平上等重復的取個數(shù)值,

第個重復觀測值為,

,則數(shù)據(jù)結(jié)構(gòu)可寫為:2023/1/5《統(tǒng)計學》第5章方差分析5-9表5.1單因素方差分析數(shù)據(jù)2023/1/5《統(tǒng)計學》第5章方差分析5-105.2.2單因素方差分析的統(tǒng)計模型

在表5.1中,假設不同水平上觀測數(shù)據(jù)相互獨立,同一水平中,n個重復觀測數(shù)據(jù)也相互獨立,具有常數(shù)方差。描述方差分析的統(tǒng)計模型為:其中,表示因素表示隨機誤差。且

第表示觀測指標值的總平均,水平上的主效應,滿足約束條件。

(5.1),2023/1/5《統(tǒng)計學》第5章方差分析5-11

利用最小二乘估計理論,可以得到模型(5.1)參數(shù)的估計如下:其中為數(shù)據(jù)的總平均,為數(shù)據(jù)表中的行平均。2023/1/5《統(tǒng)計學》第5章方差分析5-125.2.3單因素方差分析檢驗過程和方差分析表因素對試驗結(jié)果的影響,可以表述為

(5.2)對如下假設問題的檢驗,該假設的檢驗可以通過平方和分解得到。2023/1/5《統(tǒng)計學》第5章方差分析5-13總平方和的分解組間平方和總平方和組內(nèi)平方和2023/1/5《統(tǒng)計學》第5章方差分析5-14

總平方和:

所有測量值之間總的變異程度,計算公式自由度2023/1/5《統(tǒng)計學》第5章方差分析5-15

組間平方和:各組均數(shù)與總均數(shù)的差值的平方和,計算公式為自由度2023/1/5《統(tǒng)計學》第5章方差分析5-16

組內(nèi)平方和:用各組內(nèi)各測量值Yij與其所在組的均數(shù)差值的平方和來表示,反映隨機誤差的影響。計算公式為自由度2023/1/5《統(tǒng)計學》第5章方差分析5-17三種“平方和”之間的關系平方和分解:2023/1/5《統(tǒng)計學》第5章方差分析5-18

由于上述幾種平方和的數(shù)值受到樣本量和水平數(shù)的影響,一種更為科學的方法是將各部分平方和除以相應自由度,其比值稱為均方和,簡稱均方(meansquare,MS),即上式中分母的數(shù)值為對應平方和的自由度。2023/1/5《統(tǒng)計學》第5章方差分析5-19

,則拒絕零假設,即認為因素對指標值(或試驗結(jié)果)有顯著影響,否則認統(tǒng)計量的數(shù)值大于對給定置信水平,沒有顯著影響。為因素為了檢驗,定義F統(tǒng)計量2023/1/5《統(tǒng)計學》第5章方差分析5-20α接受域

拒絕域2023/1/5《統(tǒng)計學》第5章方差分析5-21

將上述主要結(jié)果總結(jié)成一個表格,稱為方差分析表,可以直觀反映方差分析的計算及檢驗過程。表5.2單因素方差分析表2023/1/5《統(tǒng)計學》第5章方差分析5-22

【例5.1】(方差分析,數(shù)據(jù)文件example5.0)在0.05的置信水平下,研究例5.0表的試驗中咖啡因用量是否對人體神經(jīng)功能有顯著影響,并說明在那些水平上他們有顯著差異?2023/1/5《統(tǒng)計學》第5章方差分析5-23

解:用SPSS打開數(shù)據(jù)文件,選擇“分析”“比較均值”“單因素方差分析”,將因變量選入到“因變量列表”中,將因素A選入到“因素”中,點擊進入“選項”對話框,在“統(tǒng)計量”下選擇“方差同質(zhì)性檢驗”,最后點擊“繼續(xù)”“確定”,輸出表5.3和表5.4兩個表格。

2023/1/5《統(tǒng)計學》第5章方差分析5-24表5.3咖啡因用量實驗的方差一致性檢驗表5.4咖啡因用量實驗的方差分析表輸出結(jié)果方差齊性檢驗Levene統(tǒng)計量df1df2顯著性.292227.749單因素方差分析平方和df均方F顯著性組間61.400230.7006.181.006組內(nèi)134.100274.967

總數(shù)195.500292023/1/5《統(tǒng)計學》第5章方差分析5-25

表5.3給出了對樣本方差齊性的檢驗,檢驗的p-值(即表中的Sig.)為0.749大于置信水平0.05,因此不能拒絕方差齊性的假設,即認為各水平樣本方式是常數(shù),滿足我們的假設。表5.4給出了單因素方差分析表,說明咖啡因服用量對人體神經(jīng)功能有顯著影響。

2023/1/5《統(tǒng)計學》第5章方差分析5-265.2.4多重比較

1、多個總體的差異性檢驗

事實上表5.1中不同水平的觀測可以看成是來自不同總體的觀測數(shù)據(jù)。假設第個總體有個樣本(對應于表5.1中的第個水平的次重復觀測),

他們?yōu)閬碜缘趥€總體的獨立樣本。2023/1/5《統(tǒng)計學》第5章方差分析5-27多個總體是否存在差異的假設問題可以表述為:

,而該檢驗當統(tǒng)計量的數(shù)值大于

一節(jié)的方差分析法,與(5.2)中的假設是等價的。

因此,利用上其臨界值

時,我們認為

個總體存在顯著差異。2023/1/5《統(tǒng)計學》第5章方差分析5-282、多重比較不拒絕H0,表示拒絕總體均值相等的證據(jù)不足

————>分析終止。拒絕H0,接受H1,表示總體均值不全相等哪兩兩均數(shù)之間相等?哪兩兩均數(shù)之間不等?

————>需要進一步作多重比較。2023/1/5《統(tǒng)計學》第5章方差分析5-29

一種使用比較多的是所有成對假設,形成如下的假設問題:注意到與是等價的。因此

該假設中共有個不同的成對比較。

(5.7)

2023/1/5《統(tǒng)計學》第5章方差分析5-30

多重比較的特點是它同時對多個成對假設進行比較。多種比較的思想有兩種,一是尋找每一個成對假設的檢驗統(tǒng)計量,給出檢驗臨界值,通過比較界定顯著程度;二是使用同時置信區(qū)間(simultaneousconfidenceinterval)的概念。

多重比較有許多種方法,使用比較多的包括Fisher的LSD方法,Turkey方法,Bonferroni方法等。我們下面通過實例來說明在SPSS下如何進行多重比較。2023/1/5《統(tǒng)計學》第5章方差分析5-31

【例5.2】(多重比較,數(shù)據(jù)文example5.0)在0.05的置信水平下,例5.0的試驗中咖啡因用量在那些水平上有顯著差異?2023/1/5《統(tǒng)計學》第5章方差分析5-32

解:用SPSS打開數(shù)據(jù)文件,選擇“分析”表5.5的結(jié)果。

選入到“因變量列表”中,將因素A選入到“因素”中,點擊進入“兩兩比較”,進入后在“假設方差齊性”下選定Turkey,LSD和Bonferroni選項,點擊“繼續(xù)”

“確定”,可以得到“比較均值”“單因素ANOVA”,將因變量2023/1/5《統(tǒng)計學》第5章方差分析5-33表5.5咖啡因用量實驗的多重比輸出結(jié)果多重比較(I)A(J)A均值差

(I-J)標準誤顯著性95%置信區(qū)間下限上限TukeyHSD0100-1.60000.99666.261-4.0711.8711200-3.50000*.99666.004-5.9711-1.028910001.60000.99666.261-.87114.0711200-1.90000.99666.156-4.3711.571120003.50000*.99666.0041.02895.97111001.90000.99666.156-.57114.3711LSD0100-1.60000.99666.120-3.6450.4450200-3.50000*.99666.002-5.5450-1.455010001.60000.99666.120-.44503.6450200-1.90000.99666.067-3.9450.145020003.50000*.99666.0021.45505.54501001.90000.99666.067-.14503.9450Bonferroni0100-1.60000.99666.360-4.1439.9439200-3.50000*.99666.005-6.0439-.956110001.60000.99666.360-.94394.1439200-1.90000.99666.202-4.4439.643920003.50000*.99666.005.95616.04391001.90000.99666.202-.64394.4439*.均值差的顯著性水平為

0.05。2023/1/5《統(tǒng)計學》第5章方差分析5-34

這里我們選用三種方法,輸出結(jié)果給出了基于這三種方法下的多重比較結(jié)果,包括研究統(tǒng)計量及其p-值和95%的同時置信區(qū)間。三種方法的結(jié)果是一致的。從檢驗統(tǒng)計量的p-值可以看出咖啡因劑量在0mg水平與200mg水平上有顯著差異(p-值<0.05),但在0mg水平與100mg水平和100mg水平與200mg水平之間沒有顯著差異。從同時置信區(qū)間也可以發(fā)現(xiàn),成對比較差異顯著時,其對應的同時置信區(qū)間不包含0。此外0mg-200mg與200mg-0mg的比較的檢驗結(jié)果是一致的,但其同時置信區(qū)間的上下限要互換。2023/1/5《統(tǒng)計學》第5章方差分析5-355.3

雙因素方差分析5.3.1雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)

假設除了5.2節(jié)介紹的因素之外,還有一可能對指標產(chǎn)生影響。假設因素有個水平,這樣因素就有組合。假設在每一個水平組合上進行相等重復數(shù)的觀測,稱之為等重復試驗,本節(jié)主要研究等重復試驗數(shù)據(jù)的雙因素方差分析。雙因素方差分析模型的數(shù)據(jù)結(jié)構(gòu)如下:個因素和個水平2023/1/5《統(tǒng)計學》第5章方差分析5-36表5.6雙因素方差分析數(shù)據(jù)2023/1/5《統(tǒng)計學》第5章方差分析5-37其中表示在因素的第個水平和因素的第個水平上進行的第次重復觀測結(jié)果。5.3.2有可加效應的雙因素方差分析1.模型結(jié)構(gòu)

假設不同水平上觀測數(shù)據(jù)相互獨立,同一水平中,n個重復觀測數(shù)據(jù)也相互獨立,具有

2023/1/5《統(tǒng)計學》第5章方差分析5-38常數(shù)方差

效應的情況,此時雙因素方差分析模型表述為:。先考慮可加效應模型,即沒有交互

(5.8)其中,表示觀

測指標值的總平均,

表示因素第水平上的主效應,

表示因素第水平上的主效應,

表示隨機誤差。

且,。2023/1/5《統(tǒng)計學》第5章方差分析5-39

利用最小二乘估計理論,可以得到模型(5.8)中參數(shù)的估計如下:其中2023/1/5《統(tǒng)計學》第5章方差分析5-402.方差分解

對雙因素方差模型,將涉及兩個因素主效應的檢驗。因素的顯著性假設為:

而對因素,顯著性假設為2023/1/5《統(tǒng)計學》第5章方差分析5-41仿單因素方差分析的方法,考察總平方和可分解為:2023/1/5《統(tǒng)計學》第5章方差分析5-42稱為因素A的離差平方和,反映因素A對試驗指標的影響。稱為因素B的離差平方和,反映因素B對試驗指標的影響。2023/1/5《統(tǒng)計學》第5章方差分析5-43消除自由度的影響后,定義均方和如下:上式中分母的數(shù)值為對應平方和的自由度。自由度數(shù)值也滿足分解等式。稱為誤差平方和,反映試驗誤差對試驗指標的影響。2023/1/5《統(tǒng)計學》第5章方差分析5-44為了給出假設問題和的檢驗過程,

定義如下兩個統(tǒng)計量:

(5.12)

(5.13)

2023/1/5《統(tǒng)計學》第5章方差分析5-45可以證明,當成立時,

當成立時,

2023/1/5《統(tǒng)計學》第5章方差分析5-46時,當對給定的檢驗水平,拒絕,即認為因素A對指標值有顯著影響。時,當拒絕,即認為因素B對指標值有顯著影響。F右側(cè)檢驗2023/1/5《統(tǒng)計學》第5章方差分析5-47表5.7有可加效應的雙因素方差分析表2023/1/5《統(tǒng)計學》第5章方差分析5-48

【例5.5】(兩因素可加效應模型,數(shù)據(jù)文件example5.5)有四種品牌(brand)的飲料在四個地區(qū)(district)銷售,在每一個地區(qū)對每一種品牌的飲料銷售量觀測兩次(上半年一次,下半年一次)得到數(shù)據(jù)如表5.7所示。在0.05的置信水平下,問品牌及地區(qū)對飲料的銷售量是否有顯著影響?

2023/1/5《統(tǒng)計學》第5章方差分析5-49表5.8飲料品牌及銷售數(shù)據(jù)2023/1/5《統(tǒng)計學》第5章方差分析5-50解:用SPSS打開數(shù)據(jù)文件,選擇“分析”“一般線性模型”

“單變量”,

將因變量選入到“因變量”中,

將brand和district兩個因素選入到“固定因子”中,

點擊“模型”,然后選擇“設定”(這樣是模型中不包括交互效應),在“構(gòu)建項”中選擇“主效應”,

再把brand和district

出如表5.8的結(jié)果。

選入“模型”,

選擇“在模型中包含截距”,以確定模型中包含常數(shù)項,最后點擊“繼續(xù)”“確定”

,輸

2023/1/5《統(tǒng)計學》第5章方差分析5-51表5.9

飲料品牌及銷售數(shù)據(jù)的方差分析表2023/1/5《統(tǒng)計學》第5章方差分析5-52

在表5.8中,輸出結(jié)果沒有交互效應參數(shù)。從p-值(Sig.)可以看出,在0.05的置信水平下,brand的主效應顯著,但district的主效應不顯著。因此說明如果僅考慮可加模型,品牌對銷售量有顯著影響,但對地區(qū)沒有顯著影響。

2023/1/5《統(tǒng)計學》第5章方差分析5-535.3.3有交互效應的雙因素方差分析

當考慮有交互效應時,雙因素方差分析模型表述為:(5.14)上式中參數(shù)表示交互效應,

它滿足約束條件

,1、模型結(jié)構(gòu)2023/1/5《統(tǒng)計學》第5章方差分析5-54其他參數(shù)的假設與模型(5.8)相同。利用最小二乘估計理論,可以得到模型(5.14)中參數(shù)的估計如下:其中。2023/1/5《統(tǒng)計學》第5章方差分析5-552.方差分解對具有交互效應的雙因素方差模型中效應參數(shù)的檢驗,除5.3.2節(jié)中的和之外,與因素的交互效應顯著性假設表述為:還涉及交互效應的假設檢驗。因素2023/1/5《統(tǒng)計學》第5章方差分析5-56仿單因素方差分析的方法,考察總離差平方和可分解為:

SSA稱為因素A的離差平方和,反映因素A對試驗指標的影響。SSB稱為因素B的離差平方和,反映因素B對試驗指標的影響。SSAB稱為交互作用的離差平方和,反映交互作用A與B對試驗指標的影響。SSE稱為誤差平方和,反映試驗誤差對試驗指標的影響。2023/1/5《統(tǒng)計學》第5章方差分析5-57其中2023/1/5《統(tǒng)計學》第5章方差分析5-58類似的,均方和定義為:上式中分母的數(shù)值為對應平方和的自由度,自由度數(shù)值也滿足分解等式。2023/1/5《統(tǒng)計學》第5章方差分析5-593.檢驗過程

對具有交互效應的雙因素方差分析問題,對參數(shù)的檢驗分為兩個步驟:第一步:首先檢驗交互效應,定義檢驗統(tǒng)計量:2023/1/5《統(tǒng)計學》第5章方差分析5-60對給定的檢驗水平,即認為交互效應顯著。時,拒絕當可以證明,當成立時,

。2023/1/5《統(tǒng)計學》第5章方差分析5-61第二步:如果在第一步中交互效應顯著,定義檢驗和的兩個統(tǒng)計量分別為用類似的方法檢驗因素與因素的主效應是否顯著。2023/1/5《統(tǒng)計學》第5章方差分析5-62如果第一步中交互效應不顯著,則因素與因素的主效應的檢驗采用5.3.1節(jié)中可加效效應模型的方法檢驗主效應。2023/1/5《統(tǒng)計學》第5章方差分析5-63

兩因素方差分析的檢驗過程可以通過雙因素方差分析表反映出來:表5.10

有交互效應的雙因素方差分析表2023/1/5《統(tǒng)計學》第5章方差分析5-64

【例5.6】(兩因素交互效應模型,數(shù)據(jù)文件example5.5)在例5.5的例子中,問品牌和地區(qū)是否存在交互效應?2023/1/5《統(tǒng)計學》第5章方差分析5-65解:用SPSS打開數(shù)據(jù)文件,選擇“分析”“一般線性模型”

“因變量”,

將因變量選入到“因變量”中,

將brand和district兩個因素選入到“固定因子”中,

點擊“模型”,然后選擇“全因子”(或選擇“設定”,在“構(gòu)建項”中選擇“主效應”,

再把brand和district

選入“模型”,再在

“構(gòu)建項”中選擇“交互”,把brand和district選入“模型”,出現(xiàn)brand*district項),選擇“在模型中包含截距”,模型中包含常數(shù)項,最后點擊“繼續(xù)”“確定”

,輸出如表5.10的結(jié)果。

2023/1/5《統(tǒng)計學》第5章方差分析5-66表5.11

飲料品牌、地區(qū)及銷售數(shù)據(jù)的方差分析表

2023/1/5《統(tǒng)計學》第5章方差分析5-67

從表5.10中看出,此時有交互效應項出現(xiàn),其p-值明顯小于0.05,因此交互效應顯著。與例5.5比較看出,在考慮了交互效應之后,brand和district均顯著(無交互效應時,district不顯著),因此我們可以得出結(jié)論:品牌和地區(qū)對飲料銷售量有顯著影響,同時不同品牌在不同地區(qū)的銷售量有顯著差異(即交互效應顯著)。2023/1/5《統(tǒng)計學》第5章方差分析5-68本章主要介紹方差分析的主要原理和方法,包括但因素方差分析和雙因素方法分析。雙因素方差分析分別介紹了可效應模型和交互效應模型的原理和方法。在每一種情況,介紹了方差分析的數(shù)據(jù)結(jié)構(gòu)、統(tǒng)計模型、檢驗統(tǒng)計量和方差分析表。同時通過實例和SPSS軟件的使用,使讀者能將理論和應用有機的結(jié)合起來。本章的主要概念包括主效應、交互效應、因素、指標值、假設、F統(tǒng)計量、多重比較、方差分析表等。重點是F統(tǒng)計量的檢驗原理,方差分析表的含義及如何使用SPSS軟件進行方差分析的計算和解釋。本章小結(jié)2023/1/5《統(tǒng)計學》第5章方差分析5-69

(1)本章我們僅考慮單因素和雙因素的方差分析模型,多因素也可類似處理。但當因素較多時,所有可能的水平組合大幅增大,這樣將會增加試驗的成本。一種通過試驗設計方法,用較少量的數(shù)據(jù)(部分試驗,即不是在每一個水平組合上都做試驗)獲得所需要的效應估計及檢驗結(jié)果的方法稱為析因試驗,它是試驗設計(designofexperiment)的一個重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論