兩因素等重復(fù)試驗下的方差分析_第1頁
兩因素等重復(fù)試驗下的方差分析_第2頁
兩因素等重復(fù)試驗下的方差分析_第3頁
兩因素等重復(fù)試驗下的方差分析_第4頁
兩因素等重復(fù)試驗下的方差分析_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、課時授課計劃課次序號:15 一、課題:§3.2 兩因素等重復(fù)試驗下的方差分析 二、課型:新授課三、目的要求:1.掌握兩因素等重復(fù)實驗下的方差分析理論與方法、模型的建立與顯著性檢驗;2.掌握利用方差分析的SAS過程解決有關(guān)實際問題.四、教學(xué)重點:方差分析方法的基本理論;利用方差分析的SAS過程解決有關(guān)實際應(yīng)用問題.教學(xué)難點:方差分析方法的基本理論;利用方差分析的SAS過程解決有關(guān)實際應(yīng)用問題.五、教學(xué)方法及手段:傳統(tǒng)教學(xué)與上機實驗相結(jié)合六、參考資料:應(yīng)用多元統(tǒng)計分析,高惠璇編,北京大學(xué)出版社,2005;使用統(tǒng)計方法與SAS系統(tǒng),高惠璇編,北京大學(xué)出版社,2001;多元統(tǒng)計分析(二版),

2、何曉群編,中國人民大學(xué)出版社,2008;應(yīng)用回歸分析(二版),何曉群編,中國人民大學(xué)出版社,2007;統(tǒng)計建模與R軟件,薛毅編著,清華大學(xué)出版社,2007.七、作業(yè):3.6 八、授課記錄:授課日期班次九、授課效果分析:復(fù)習(xí) 單因素方差分析1統(tǒng)計模型因變量Y因素,水平,上觀測值 , 2顯著檢驗 或 ,拒絕3置信區(qū)間 置信度的置信區(qū)間, 置信度的置信區(qū)間為個的置信度至少的Bonferroni同時置信區(qū)間§3.2 兩因素等重復(fù)實驗下的方差分析3.2.1 統(tǒng)計模型設(shè)影響Y的因素有兩個,分別記為A和B,其中A有a個不同水平,B有b個水平在因素A和B的各水平下均做c(c>1)次實驗,記為水

3、平組合下第k次實驗的Y的觀測值,則兩因素等重復(fù)試驗下的方差分析數(shù)據(jù)可表示為表3.7的形式表3.7 兩因素等重復(fù)方差分析數(shù)據(jù) 因素B因素A¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼和對于任一水平組合(總體), Y觀測值為, 則各樣本間是相互獨立的樣本觀察值可看成是來自均值為的總體,即 , 令,為水平組合下Y的隨機誤差, 則,這樣,就是其均值與隨機誤差迭加而產(chǎn)生的因此,兩因素重復(fù)試驗下方差分析的統(tǒng)計模型: 為便于統(tǒng)計分析,我們

4、需要對水平組合上的樣本均值作進一步分解,為此引入如下記號:其中為總平均, ,是因素水平與因素水平在單元上所有觀察值的平均,為因素A的水平的效應(yīng),為因素B的水平的效應(yīng)進一步有其中反映了水平組合對Y的效應(yīng)一般情況, 其差稱為與的交互效應(yīng)因此容易驗證: 因此兩因素等重復(fù)下的方差分析模型等價地改寫為如下形式:3.2.2交互效應(yīng)及因素效應(yīng)的顯著性檢驗一偏差平方和分解下面先對Y的觀測的總平方和進行分解:,觀測數(shù)據(jù)的總(偏差)平方和為 其中因素的平方和由于,為的無偏估計,故度量的各水平效應(yīng)的估計量的變化因素的平方和由于,為的無偏估計,故度量的各水平效應(yīng)的估計量的變化交互效應(yīng)的平方和由于,為的無偏估計,故度量

5、和的交互效應(yīng)的估計量的變化誤差平方和度量了來自各總體的觀測值與其樣本均值的差異,反映了誤差的變化 由于且相互獨立,可得分別稱為的自由度,稱為的自由度,為上述四個自由度的和令 因素的均方, 則 因素的均方, 交互效應(yīng)均方,誤差均方, , 為的無偏估計 二假設(shè)檢驗對兩因素的情況,方差分析的主要目的除了考察因素A或B的各水平對因變量Y的影響有無顯著差異外,還要考慮A和B之間是否存在交互作用,因為交互作用的存在會直接影響到對A和B影響檢驗結(jié)果的解釋涉及如下三個檢驗問題: 不全相等 不全相等 檢驗問題也可以改寫成: 利用上述結(jié)果,構(gòu)造適當?shù)慕y(tǒng)計量檢驗上述假設(shè)為的無偏估計,如果假設(shè)成立,取值接近,如果假設(shè)

6、不成立,則有增大的趨勢因此,針對檢驗分別構(gòu)造統(tǒng)計量,分別有 如果,各檢驗統(tǒng)計量的值變大,則拒絕原假設(shè)各檢驗的值分別為 其中為統(tǒng)計量觀測值給定顯著性水平,如(或),則拒絕(或)否則不能拒絕(或)結(jié)果如下:表3.8 兩因素(a×b)等重復(fù)數(shù)c試驗下的方差分析表形式變異來源source離差平方和SS自由度df均方MSF統(tǒng)計量FP值P因素ASSA因素BSSBA×B交互效應(yīng)SSAB誤差SSE總和SST= SSA+ SSB+ SSAB +SSE注意:檢驗步驟:1)先檢驗,如不拒絕,即交互作用不顯著時,再考察和的效應(yīng)的顯著性因為當()全為0時,即與無交互作用,則在的任何水平上 = ,在的

7、各水平上均相等且完全由在水平和的效應(yīng)之差確定,因此,檢驗假設(shè)的結(jié)論真實的反映了僅由的各水平對的影響是否顯著2)如拒絕,交互作用顯著時,通過估計和比較因素和各水平組合(A,B)上的均值考察因素的聯(lián)合影響如果和存在交互作用,則不全為0,對于的兩個水平和在的第個水平上的兩個組合和下均值差為 因此當()不全為0時,除與有關(guān)外,還可能與有關(guān),即處在不同水平,有所不同如圖3.1所示,假設(shè)A與B均有兩個水平和 (a) (b) 圖3.1 有交互效應(yīng)時A的各水平均值在B的不同水平上的差異(a) 在下均值差而認為(即與不全為0),差異主要表現(xiàn)在在水平上的差異;(b) 在下均值差與相反,綜合有,主要表現(xiàn)在在和水平上

8、的差異相互抵消,使得綜合差異為零因此,在有交互效應(yīng)時,尤其是交互效應(yīng)顯著,而因素與的效應(yīng)不顯著時,檢驗每個因素顯著差異實際意義不大,應(yīng)慎重此情況下,要進一步考察各因素對的影響的顯著性,只能將一個因素的各個水平逐個給定,在給定的水平上考察另一因素的各水平均值之間的差異來了解該因素對的影響例3.5 某高校為了了解數(shù)學(xué)專業(yè)和計算機科學(xué)專業(yè)的低年級學(xué)生、高年級學(xué)生及研究生在人文科學(xué)知識方面的差異,從不同專業(yè)和不同年級的學(xué)生中任選四名學(xué)生參加有關(guān)考試,其成績?nèi)绫?.9所示,假設(shè)考試成績服從兩因素的方差分析模型,對其作方差分析表 3.9 人文社科知識的考試成績 級別專業(yè)低年級 高年級 研究生數(shù)學(xué)計算機81

9、 78 79 78 75 80 78 73 82 80 83 8889 82 77 90 79 80 75 78 93 93 86 95解:因變量Y為成績,有兩個因素,記專業(yè)因素為,有兩個水平(數(shù)學(xué)),(計算機);學(xué)生級別為因素,有三個水平(低年級),(高年級),(研究生)因此,利用SAS系統(tǒng)proc anova過程作方差分析,程序及結(jié)果如下:datainputcardsrunprocanovadataclassmodelrunSAS 系統(tǒng) 11:29 Tuesday, October 21, 2008The ANOVA Procedure Class Level Information 因素

10、 水平 因素變量 Class Levels Values 因素變量A majors a=2 a1 a2 因素變量B classes b=3 b1 b2 b3 Number of observations n=abc=24 c=4注:,因素變量為自變量,個數(shù)為自由度p-1=ab-1=5先檢驗,統(tǒng)計量,觀測值,檢驗值 SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 2 The ANOVA Procedure因變量:成績 Dependent Variable: grade表 3.10 考試成績的方差分析結(jié)果 Sum of Source DF Squares Mean S

11、quare F Value Pr > F方差來源 自由度 平方和SS 均方 F值 p值Model(模型) p-1=ab-1=5 =637.0000000 =127.400000 =9.34 0.0002Error(誤差) n-p=ab(c-1)=18 =245.5000000 =13.6388889Corrected Total n-1=abc-123 =882.5000000 R-Square Coeff Var Root MSE grade Mean =0.721813 4.490075 3.693087 =82.25000 Source DF Anova SS Mean Squar

12、e F Value Pr > F方差來源 自由度 平方和SS 均方 F值 p值 專業(yè)A majors =1 =150.000000 =150.000000 =11.00 =0.0038 級別B classes =2 =444.000000 =222.000000 =16.28 <.0001交互majors*classes =2 =43.000000 =21.500000 =1.58 =0.2340檢驗:由結(jié)果知,接受,認為專業(yè)與級別的交互不顯著,即數(shù)學(xué)專業(yè)中各級別學(xué)生人文知識水平的差異與計算機科學(xué)專業(yè)中相應(yīng)級別知識水平差異認為相同檢驗和,檢驗p值分別為=0.0038和=0.0001

13、,拒絕和說明因素A和因素B對成績的影響均顯著,即兩個專業(yè)學(xué)生的人文知識水平是有顯著差異的,不同級別的學(xué)生的人文社科知識水平也有顯著差異例3.6 某計算機修理公司為了解三名修理工對不同類型磁盤驅(qū)動系統(tǒng)修理的工作效率,每位修理工被隨機地指定修理三種類型的磁盤驅(qū)動器系統(tǒng)各5個,其完成修理工作的時間如表3.11所示假設(shè)修理時間服從兩因素方差分析模型,試對此數(shù)據(jù)作方差分析表 3.11 修理工修理三種類型磁盤驅(qū)動系統(tǒng)的時間 類型B修理工AB1 B2 B3A1A2A362 48 63 57 69 57 45 39 54 44 59 53 67 66 8851 57 45 50 39 61 58 70 66

14、51 55 58 50 69 4959 65 55 52 70 58 63 70 53 60 47 56 51 44 50解:因變量Y為修理時間為數(shù)量指標,因素A代表修理工,有三個水平代表三個修理工,因素B,有三個水平,代表三種類型的驅(qū)動系統(tǒng),各修理工修理時間即為Y在各組合水平下的觀測值,利用proc anova過程,程序如下:datainputcardsrunprocanovadataclassmodelmeans repairer type repairer*typerun SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 3 The ANOVA Procedu

15、re Class Level Information Class Levels Values 因素A repairer a=3 a1 a2 a3 因素B type b=3 b1 b2 b3 Number of observations n=45 SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 4 The ANOVA ProcedureDependent Variable: time 即y 表3.12 修理時間的方差分析表 Sum of Source DF Squares Mean Square F Value Pr > F 模型 Model ab-1=8 1

16、268.177778 =158.522222 =3.05 =0.0101 誤差 Error ab(c-1)=36 =1872.400000 =52.011111 總和 Corrected Total abc-1=44 =3140.577778 R-Square Coeff Var Root MSE time Mean 0.403804 12.91936 7.211873 55.82222 Source DF Anova SS Mean Square F Value Pr > FA修理工repairer =2 =24.577778 =12.288889 = 0.24 =0.7908B系統(tǒng)類

17、型type =2 =28.311111 =14.155556 =0.27 =0.7633交互repairer*type 4 =1215.288889 =303.822222 =5.84 =0.0010由此可見,=0.0010<1,拒絕表明修理工A與磁盤驅(qū)動系統(tǒng)B交互效應(yīng)十分顯著,即不同的修理工修理不同的磁盤驅(qū)動系統(tǒng)所花費的時間是顯著不同的單看因素A(修理工),=0.7908>0.05 ,接受說明不同的修理工對修理時間的影響不顯著;因素B(磁盤系統(tǒng))=0.7633>0.05 ,接受說明不同類型的驅(qū)動器對修理時間的影響也不顯著因此,關(guān)于因素A或因素B的效應(yīng)的檢驗結(jié)果并無多大參考價

18、值為進一步了解交互效應(yīng)的本質(zhì),對每一個組合水平上的觀測數(shù)據(jù),求得樣本均值作為每個組合水平上的總體均值的估計,結(jié)果如下: SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 5 The ANOVA Procedure Level of -time- 因素A各水平上的樣本均值 repairer N Mean Std Dev a1 15 55.3333333 9.22470802 a2 15 55.2666667 8.75431866 a3 15 56.8666667 7.79987790因素B各水平上的樣本均值 Level of -time- type N Mean St

19、d Dev b1 15 56.1333333 8.83876742 b2 15 56.6000000 9.17138407 b3 15 54.7333333 7.75026881 表3.13 因素A與B的組合水平上的樣本均值 Level of Level of -time- repairer type N Mean Std Dev a1 b1 5 59.8000000 7.85493475 a1 b2 5 A1中47.8000000最短 7.46324326 a1 b3 5 58.4000000 8.53229160 a2 b1 5 A2中48.4000000最短 6.76756973 a2

20、b2 5 61.2000000 7.32802838 a2 b3 5 56.2000000 8.04363102 a3 b1 5 60.2000000 7.32802838 a3 b2 5 60.8000000 6.30079360 a3 b3 5 A3中49.6000000最短 4.50555213由結(jié)果可見,不同的修理工修理不同的磁盤驅(qū)動系統(tǒng)所花費的時間確有較大差異,修理工修理類型的驅(qū)動器系統(tǒng)所花平均時間最短(47.8000),修理類型的驅(qū)動器系統(tǒng)所花平均時間最短(48.4000),修理類型的驅(qū)動器系統(tǒng)所花平均時間最短(49.6000) 圖3.2 各水平組合上的樣本均值而由于之間的差異不大

21、導(dǎo)致因素A的影響不顯著的檢驗結(jié)果;而由于之間的差異不大導(dǎo)致因素B的影響不顯著的檢驗結(jié)果;因此交互效應(yīng)可能會掩蓋各因素對因變量Y的某些本質(zhì)影響3.2.3無交互效應(yīng)的各因素均值的估計與比較在給定的顯著水平下,當假設(shè)檢驗的結(jié)論是因素A和B之間的交互效應(yīng)不顯著,并且因素A和B至少有一個對Y有顯著影響,可以進一步對影響顯著的因素在其各水平下的均值作出估計,并給出其本身及任意兩個之差的置信區(qū)間一因素A均值的估計和比較1.的無偏估計及區(qū)間估計若A對Y的影響顯著,對A的任一水平,由,所以的無偏估計為 由于 而為的無偏估計 ,且在方差分析模型下可證, 且與相互獨立,從而可得 對給定的顯著性水平,由 可得的置信度

22、為的置信區(qū)間為,2.A的各水平差的區(qū)間估計同理可得的置信度為的置信區(qū)間為, 若有m個作同時比較,則它們的置信度不小于的Bonferroni同時置信區(qū)間為 二因素B均值的估計和比較如因素B對Y的影響顯著,的無偏估計為 的置信度為的置信區(qū)間為 的置信度為的置信區(qū)間為 的置信度不小于的Bonferroni同時置信區(qū)間為 例3.7 (續(xù)例3.5)根據(jù)表3.9的數(shù)據(jù),給出兩專業(yè)之間學(xué)生成績的均值之差和各級別學(xué)生之間成績的均值之差的置信度不小于95%的Bonferroni同時置信區(qū)間解:由例3.5結(jié)果可知,專業(yè)A與學(xué)生級別B之間無顯著的交互作用,因素A和B均對成績影響顯著,因此可進一步通過比較A的各水平均

23、值差異了解各專業(yè)與各級別社科知識的差異;通過比較B的各水平均值差異了解各級別社科知識的差異datainputcardsrunprocanovadataclass /* 因素變量專業(yè)、級別*/model/* 因變量成績,因素變量專業(yè)、級別主效應(yīng)及交互效應(yīng) */means majors classes; /* 計算專業(yè)、級別對應(yīng)的因變量樣本均值和標準差 */means majors classes/bon cldiff alpha0.05/* 因素變量專業(yè)、級別在不同水平上的均值進行Bonferroni同時兩兩比較的t檢驗,顯著性水平0.05,輸出不同水平上的兩兩均值差的置信度不小于1-0.05的

24、置信區(qū)間*/runSAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 12 The ANOVA Procedure Class Level Information Class Levels Values 因素A majors a= 2 a1 a2 因素B classes b=3 b1 b2 b3 Number of observations n=abc=24以下為方差分析表,同3.5例表3.10 SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 13 The ANOVA ProcedureDependent Variable: grade

25、Sum of Source DF Squares Mean Square F Value Pr > F Model 5 637.0000000 127.4000000 9.34 0.0002 Error 18 245.5000000 13.6388889 Corrected Total 23 882.5000000 R-Square Coeff Var Root MSE grade Mean 0.721813 4.490075 3.693087 82.25000 Source DF Anova SS Mean Square F Value Pr > F majors 1 150.0

26、000000 150.0000000 11.00 0.0038 classes 2 444.0000000 222.0000000 16.28 <.0001 majors*classes 2 43.0000000 21.5000000 1.58 0.2340以下對專業(yè)因素A、B樣本均值和標準差 SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 14 The ANOVA Procedure Level of -grade- majors N Mean Std Dev 專業(yè)因素水平 觀測個數(shù) 樣本均值 樣本標準差 a1 12 79.7500000 4.048007

27、37 a2 12 84.7500000 7.08551660 Level of -grade- classes N Mean Std Dev 級別水平 觀測個數(shù) 樣本均值 樣本標準差 b1 8 81.7500000 5.06387768 b2 8 77.2500000 2.60494036 b3 8 87.7500000 5.49675229以下對專業(yè)因素A求均值差的Bonferroni同時置信區(qū)間 SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 15 The ANOVA Procedure Bonferroni (Dunn) t Tests for gradeN

28、OTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than Tukey's for all pairwise comparisons. Alpha 0.05 Error Degrees of Freedom 18 Error Mean Square 13.63889 Critical Value of t 2.10092 m=1 Minimum Significant Difference 3.1676 Compar

29、isons significant at the 0.05 level are indicated by *. Difference Simultaneous majors Between 95% Confidence Comparison Means Limits 樣本均值差 的置信區(qū)間 a2 - a1 5.000 1.832 8.168 * a1 - a2 -5.000 -8.168 -1.832 *對于專業(yè)因素A,由上述結(jié)果求得,由于僅有一個差, 故, 2.10092,的置信度為95%的置信區(qū)間為(-8.168 -1.832)因此認為 ,即數(shù)學(xué)專業(yè)學(xué)生的人文社科知識顯著差于計算機專業(yè)的學(xué)

30、生 類似可得級別因素B求均值差的Bonferroni同時置信區(qū)間SAS 系統(tǒng) 11:29 Tuesday, October 21, 2008 16 The ANOVA Procedure Bonferroni (Dunn) t Tests for gradeNOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than Tukey's for all pairwise comparisons. m=b(b-1)/2=3

31、 Alpha 0.05 Error Degrees of Freedom ab(c-1)=18 Error Mean Square 13.63889 Critical Value of t 2.63914 Minimum Significant Difference 4.8733 Comparisons significant at the 0.05 level are indicated by *. Difference classes Between Simultaneous 95% Comparison Means Confidence Limits b3 - b1 6.000 1.12

32、7 10.873 * 表示顯著差異 b3 - b2 10.500 5.627 15.373 * b1 - b3 -6.000 -10.873 -1.127 * b1 - b2 4.500 -0.373 9.373 b2 - b3 -10.500 -15.373 -5.627 * b2 - b1 -4.500 -9.373 0.373對于級別因素B,由上述結(jié)果求得,共有個均值差,故,均值差的置信度為95%的Bonferroni同時置信區(qū)間分別為:(-0.373 9.373), :(-10.873 -1.127), :(-15.373 -5.627)由結(jié)果可知,故在至少95%的置信度下認為兩個專業(yè)

33、的研究生的人文社科知識強于低年級和高年級學(xué)生認為,即低年級和高年級學(xué)生的人文社科知識無顯著差異 有交互效應(yīng)時因素各水平組合上的均值估計與比較如果因素A與B之間有顯著的交互效應(yīng),這時單獨考慮A或B各水平上均值的差異無多大實際意義可通過直接比較各水平組合上的均值來了解差異對給定的因素B的某個水平(),的無偏估計 對任意 則有 , 可證 對給定的顯著性水平,由可得的置信度為的置信區(qū)間為,可證 m個同時比較,則它們置信度不小于的Bonferroni同時置信區(qū)間為 類似可得,對給定因素A的某個水平,關(guān)于B的各水平均值的估計和成對比較結(jié)果例3.8 (續(xù)3.6)根據(jù)表3.11數(shù)據(jù),試對每一類型的磁盤驅(qū)動系統(tǒng)

34、,給出三名修理工修理時間均值兩兩之差的置信度不小于90%的Bonferroni同時置信區(qū)間解:因變量Y-修理時間,因素A-修理工,有三個水平,因素B-磁盤驅(qū)動系統(tǒng),有三個水平,各水平觀測次數(shù)5,利用proc anova過程,程序見例3.6:表3.12 修理時間的方差分析表(見例3.6) Sum of Source DF Squares Mean Square F Value Pr > F Model 8 1268.177778 158.522222 3.05 0.0101 誤差 Error 36 1872.400000 =52.011111 總和 Corrected Total 44 3140.577778表3.13 因素A與B的組合水平上的樣本均值 Level of Level of -time- repairer type N Mean Std Dev a1 b1 5 59.8000000 7.85493475 a1 b2 5 A1中47.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論