第七章方差分析PPT課件_第1頁
第七章方差分析PPT課件_第2頁
第七章方差分析PPT課件_第3頁
第七章方差分析PPT課件_第4頁
第七章方差分析PPT課件_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1第七章 方差分析第一節(jié)第一節(jié) 方差分析概述方差分析概述第二節(jié)第二節(jié) 單因素方差分析單因素方差分析第三節(jié)第三節(jié) 雙因素方差分析雙因素方差分析第四節(jié)第四節(jié) 試驗設計初步試驗設計初步2第一節(jié) 方差分析概述n一、問題的提出一、問題的提出n請考慮下列問題:n 例1某公司為了研究商品包裝對商品的銷量是否有顯著影響,對產(chǎn)品的裝潢分別采用了甲、乙、丙、丁四種包裝設計。之后,在20個銷售量比較接近的該產(chǎn)品的銷售點進行為期一周的試銷,即每種包裝方式的產(chǎn)品有5個銷售點。如果裝潢這個因素對銷量沒有影響,則這20個銷售點之間一周的平均銷量應該沒有顯著的差異。 3一、問題的提出一、問題的提出n 例例2 2某課程結(jié)束后,

2、學生對該授課教師的教學質(zhì)量進行評估,評估結(jié)果分為優(yōu)、良、中、差四等。教師對學生考試成績的評判和學生對教師的評估是分開進行的,他們互相都不知道對方給自己的打分。有一種說法,認為給教師評為優(yōu)秀的這組學生的考試分數(shù),可能會顯著地高于那些認為教師工作僅是良、中或差學生的分數(shù)。同時認為,對教師工作評價差的學生,其考試的平均分數(shù)可能最低。為對這種說法進行驗證,從對評估的每一個等級中,隨機抽取共26名學生。 4一、問題的提出一、問題的提出n 26名學生考試成績名學生考試成績n 觀察值 i 學生對教師評估等級 優(yōu) 良 中 差 1 2 3 4 5 6 7 8 9 10 85 80 73 76 77 78 80

3、72 79 94 92 70 84 73 76 85 92 79 68 - 90 86 - - 73 91 - - - 75 - - - 81 - - - 64 - - 5方差分析:單因素方差分析方差分析:單因素方差分析SUMMARYSUMMARY組組觀測數(shù)觀測數(shù)求和求和平均平均方差方差列列 1 17 758058082.8571482.8571447.8095247.80952列列 2 2101080180180.180.176.5444476.54444列列 3 35 538938977.877.882.282.2列列 4 44 430330375.7575.7544.2544.25方差分

4、析方差分析差異源差異源SSSSdfdfMSMSF FP-valueP-valueF critF crit組間組間151.8082151.80823 350.6027550.602750.7745460.7745460.5206550.5206553.0491253.049125組內(nèi)組內(nèi)1437.3071437.307222265.3321465.33214總計總計1589.1151589.11525256一、問題的提出一、問題的提出 例3某種作物產(chǎn)量受到選種、施肥、灌溉等三個因素的影響。為了研究這三個因素對作物產(chǎn)量的影響是否有差異,選擇不同的種子、施肥量和灌溉量進行試驗,如果三個因素對作物的影

5、響沒有顯著差異,則各種情況下農(nóng)作物的產(chǎn)量應該是不相上下的。 7分析:n以上三例均是通過樣本均值檢驗總體均值之間是否相等的問題。若按照已學過的假設檢驗方法,例1、中每兩兩進行一次比較,4種包裝法要做6次假設檢驗;至于例3的比較進行起來就更加困難。但是,利用方差分析則可使問題容易解決得多。 8一個具體的實例n某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃、粉色、綠色和無色透明。這四種飲料的營養(yǎng)含量、味道、價格、包裝等可能影響飲料銷量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營規(guī)模相仿的5家超市收集前一期該飲料的銷售量情況,見表:9一個具體的實例n 表7.1 該飲料在五家超市的銷售情況

6、單位:箱 超 市 無 色粉 色橘黃色綠 色 1 2 3 4 5 26.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.810一個具體的實例n分析分析:表中的20個數(shù)據(jù)各不相同,造成這種差異的原因可能有兩方面:n(1)銷售地點的影響銷售地點的影響。表中資料顯示,即使是相同顏色的飲料,在不同超市的銷量也是不同的。但由于這五個超市的地理位置相似,經(jīng)營規(guī)模相仿,故可以把不同地點飲料銷量的差異看成是隨隨機因素的影響機因素的影響。n(2)飲料顏色的影響飲料顏色的影響。在同一超市里,不同顏色的飲料,即使它

7、們的營養(yǎng)成分、味道、價格、包裝等方面等因素都相同,但銷量也不同。這種不同有可能是抽樣的隨機性造成的抽樣的隨機性造成的,也有可能是由也有可能是由于人們對不同顏色的偏好。于人們對不同顏色的偏好。n于是,上述問題就歸結(jié)為一個檢驗的問題,即飲料顏色對銷量是否產(chǎn)生影響?11一個具體的實例n設: 分別為四種顏色飲料的銷量均值。n如果檢驗結(jié)果為 不相等,則意味著不同顏色的飲料來自不同的總體,表明顏色對銷量產(chǎn)生了影響;反之,如果檢驗結(jié)果為 都相等,即均值之間不存在顯著性差異,則可以認為飲料顏色對銷量沒有影響,它們是來自相同的總體。圖示: 1234, 1234, 1234, 12一個具體的實例n 橘黃色 無色

8、粉色 綠色123413一個具體的實例123414二、方差分析的內(nèi)容二、方差分析的內(nèi)容n方差分析(方差分析(Analysis of Variance,簡稱,簡稱ANOVA)是對)是對多個多個總體均值是否相等總體均值是否相等這一假設進行檢驗這一假設進行檢驗。 (見前述具體實例)(見前述具體實例) n術(shù)語:在方差分析中,常常用到兩個術(shù)語術(shù)語:在方差分析中,常常用到兩個術(shù)語。n一個是因素一個是因素。因素是一個。因素是一個獨立的變量獨立的變量,也是,也是方差分析研究的對方差分析研究的對 n 象;象;n 如前述實例中的飲料顏色,前述例如前述實例中的飲料顏色,前述例1中的裝潢等就中的裝潢等就n 是一個因素。

9、是一個因素。n另一個是水平另一個是水平。因素中的內(nèi)容稱為水平因素中的內(nèi)容稱為水平。n 比如飲料的四種不同顏色,裝潢的四種包裝設計就是水平比如飲料的四種不同顏色,裝潢的四種包裝設計就是水平。 15種類:方差分析可分為n單因素分析單因素分析:方差分析只針對一個因素進行的。:方差分析只針對一個因素進行的。n多因素分析多因素分析:如果同時針對多個因素進行分析,就:如果同時針對多個因素進行分析,就稱為多因素分析。在多因素方差分析中,雙因素方稱為多因素分析。在多因素方差分析中,雙因素方差分析是最常見的。差分析是最常見的。n前述例前述例2就是多因素方差分析。就是多因素方差分析。 16 方差分析的假設前提:n

10、在方差分析中,在方差分析中,通常假定通常假定:(:(1)各個水平的觀察數(shù)據(jù)是)各個水平的觀察數(shù)據(jù)是來自于服從來自于服從正態(tài)分布總體正態(tài)分布總體中的隨機樣本,(中的隨機樣本,(2)各個總體)各個總體相相互獨立互獨立,(,(3)且)且方差相同方差相同。n即:若一個因素有即:若一個因素有r個水平,則有個水平,則有r個相互獨立的正態(tài)總體,個相互獨立的正態(tài)總體,它們分別服從它們分別服從N(j j, , ),(),(j=1,2,r),即),即r個個總體均服從相同方差總體均服從相同方差 的正態(tài)分布。的正態(tài)分布。n實際應用中嚴格地滿足是不太現(xiàn)實,實際應用中嚴格地滿足是不太現(xiàn)實, 但一般應近似地符合但一般應近似

11、地符合上述要求。上述要求。 2217三、方差分析的原理三、方差分析的原理 n n方差分析的方差分析的目的目的,是要,是要檢驗各個水平的均值檢驗各個水平的均值u1,u2,u3,ur是否相等是否相等,而,而實現(xiàn)這個實現(xiàn)這個目的的手段是通過方差的比較目的的手段是通過方差的比較。觀察值之間存在。觀察值之間存在著差異,差異的產(chǎn)生來自兩個方面:著差異,差異的產(chǎn)生來自兩個方面: 18差異源:n一方面一方面是由因素中的不同水平造成的是由因素中的不同水平造成的。比如飲料的比如飲料的不同顏色帶來不同的銷售量(當然也可能是由于隨不同顏色帶來不同的銷售量(當然也可能是由于隨機因素造成的),機因素造成的),對此我們可稱

12、為對此我們可稱為系統(tǒng)性差異系統(tǒng)性差異; n另一方面另一方面即使相同的水平,但由于即使相同的水平,但由于抽選樣本的隨機抽選樣本的隨機性而產(chǎn)生的差異性而產(chǎn)生的差異。比如相同顏色的飲料在不同的超比如相同顏色的飲料在不同的超市銷售量也不同市銷售量也不同. 19兩個方面產(chǎn)生的差異可以用兩個方差來計量:兩個方面產(chǎn)生的差異可以用兩個方差來計量: n一個稱為一個稱為水平之間的方差水平之間的方差既包括系統(tǒng)性既包括系統(tǒng)性因素,又包括隨機性因素;因素,又包括隨機性因素;n一個稱為一個稱為水平內(nèi)部的方差水平內(nèi)部的方差僅包括隨機性僅包括隨機性因素。因素。n 20方差分析原理圖示:方差分析原理圖示: 若因素若因素中的不中

13、的不同水平同水平不產(chǎn)生不產(chǎn)生影響影響水平間水平間方差:方差:包括系包括系統(tǒng)性因統(tǒng)性因素和隨素和隨機因素機因素 此時水此時水平間方平間方差同水差同水平內(nèi)方平內(nèi)方差比較差比較接近接近只剩下只剩下隨機因隨機因素素說明因素說明因素對觀測對觀測值不產(chǎn)值不產(chǎn)生影響生影響水平內(nèi)水平內(nèi)方差方差(只有(只有隨機因隨機因素影響素影響)21四、四、F分布分布 n水平間(又稱組間)方差和水平內(nèi)(又稱組內(nèi))水平間(又稱組間)方差和水平內(nèi)(又稱組內(nèi))方差之比是一個統(tǒng)計量。數(shù)理統(tǒng)計證明,這個統(tǒng)方差之比是一個統(tǒng)計量。數(shù)理統(tǒng)計證明,這個統(tǒng)計量服從計量服從F分布。分布。n n F= n 組內(nèi)方差組間方差22F分布有這樣幾個特征:

14、n(1)統(tǒng)計量)統(tǒng)計量F是大于零的正數(shù);是大于零的正數(shù);n(2)F分布曲線為正偏態(tài),它的尾端以橫軸為漸近分布曲線為正偏態(tài),它的尾端以橫軸為漸近線趨于無窮;線趨于無窮;n(3)F分布是一種連續(xù)的概率分布,不同的自由度分布是一種連續(xù)的概率分布,不同的自由度組合有不同的組合有不同的F分布曲線,如教材所示。分布曲線,如教材所示。 23 第二節(jié) 單因素方差分析單因素方差分析n 一、單因素方差分析的步驟一、單因素方差分析的步驟n 通過上面的分析可知,因素中水平的差異必然通過上面的分析可知,因素中水平的差異必然體現(xiàn)在體現(xiàn)在水平均值水平均值的差異上。于是,作為單因素的的差異上。于是,作為單因素的方差分析,其目

15、標是檢驗水平均值方差分析,其目標是檢驗水平均值j是否相等。是否相等。如果相等,則該因素(如果相等,則該因素(如前例中飲料的顏色如前例中飲料的顏色)對)對x不產(chǎn)生影響;反之,就認為該因素對不產(chǎn)生影響;反之,就認為該因素對x存在影響。存在影響。 24 一、單因素方差分析的步驟一、單因素方差分析的步驟(一)建立假設(一)建立假設n以飲料顏色對銷售量的影響為例。以飲料顏色對銷售量的影響為例。n H0: 顏色對銷售量沒有影響顏色對銷售量沒有影響n H1: (不全相等)(不全相等) 顏色對銷售量有影響顏色對銷售量有影響(二)計算水平均值(二)計算水平均值n令令 表示第表示第j中水平的樣本均值,則:中水平的

16、樣本均值,則:n (j=1,2,,r,即共,即共r個水平)個水平)jniijjnxxj1jx12341234,25(二)計算水平均值(二)計算水平均值n式中,xij是第j中水平下的第 i個觀察值,n nj表示第j種水平的觀察值個數(shù)。n計算總均值的一般表達式為計算總均值的一般表達式為:n 或n rxxrjj11rjjjn xxn26(三三)計算離差平方和計算離差平方和 n在單因素方差分析中,離差平方和有三個,它們在單因素方差分析中,離差平方和有三個,它們分別是:分別是:總離差平方和,誤差項離差平方和以及總離差平方和,誤差項離差平方和以及水平項離差平方和水平項離差平方和。n1 1、總離差平方和、總

17、離差平方和。用。用SST表示,表達式:表示,表達式:n n SST=n它反映了離差平方和的總體情況它反映了離差平方和的總體情況。 描述了所有觀描述了所有觀察值的離散程度。察值的離散程度。 27(三三)計算離差平方和計算離差平方和n2 2、誤差項離差平方和(殘差平方和)、誤差項離差平方和(殘差平方和)SSEnSSE= n(i表示第表示第j種水平中觀察值的個數(shù),種水平中觀察值的個數(shù), i=1,2,nj)nSSE反映的是反映的是水平內(nèi)部或組內(nèi)觀察值的離散狀況水平內(nèi)部或組內(nèi)觀察值的離散狀況。反映的是同。反映的是同一水平下,由于隨機因素引起的觀察值之間的差異,故也稱其一水平下,由于隨機因素引起的觀察值之

18、間的差異,故也稱其為組內(nèi)平方和。為組內(nèi)平方和。 rjnijijjxx112)(28 (三三)計算離差平方和計算離差平方和n3、水平項離差平方和水平項離差平方和n為了后面敘述方便,把為了后面敘述方便,把單因素方差分析中的因素稱為單因素方差分析中的因素稱為A。于是,。于是,水平項離差平方和可以用水平項離差平方和可以用SSA 表示。表示。n SSA= =n n它所表現(xiàn)的是它所表現(xiàn)的是組間差異組間差異,其中包括隨機因素和系統(tǒng)因素,其中包括隨機因素和系統(tǒng)因素。反。反映了來自于各總體的樣本均值之間的差異程度,即不同因素映了來自于各總體的樣本均值之間的差異程度,即不同因素水平下觀察值之間的差異。水平下觀察值

19、之間的差異。rjnijjxx112)(rjjjxxn12)(29SST,SSE,SSA三者的聯(lián)系:三者的聯(lián)系: n SST=SSE+SSA n概括概括:樣本中的數(shù)據(jù)之間存在著差異,從總體上反映這種差異樣本中的數(shù)據(jù)之間存在著差異,從總體上反映這種差異的是的是SST,故稱之為總離差平方和。,故稱之為總離差平方和。它有兩部分組成它有兩部分組成:n一部分一部分是是組內(nèi)誤差組內(nèi)誤差SSE,它所反映的是,它所反映的是同一水平同一水平中中樣本數(shù)據(jù)與樣本數(shù)據(jù)與其組平均數(shù)的差異其組平均數(shù)的差異, 這種差別是由抽樣的隨機性引起的,故稱這種差別是由抽樣的隨機性引起的,故稱之為之為誤差項離差平方和誤差項離差平方和。n

20、另一部分另一部分是是組間誤差組間誤差SSA,它所反映的是,它所反映的是各總體各總體樣本平均數(shù)與樣本平均數(shù)與總平均數(shù)的差異總平均數(shù)的差異。造成這種差別的原因既有抽樣的隨機性,也。造成這種差別的原因既有抽樣的隨機性,也可能包含系統(tǒng)因素的影響,故稱之為可能包含系統(tǒng)因素的影響,故稱之為水平項離差平方和水平項離差平方和。 30n如果如果SSA顯著地大于顯著地大于SSE,就說明各組均值,就說明各組均值之間不僅有隨機誤差,還有系統(tǒng)誤差。那之間不僅有隨機誤差,還有系統(tǒng)誤差。那么么SSA比比SSE大多少才表明系統(tǒng)誤差存在呢?大多少才表明系統(tǒng)誤差存在呢?這就需要構(gòu)造這就需要構(gòu)造F統(tǒng)計量,從而需要計算平均統(tǒng)計量,從

21、而需要計算平均平方。平方。31(四)計算平均平方(四)計算平均平方n平均平方,即用離差平方和除以自由度即可得到平均平方,即用離差平方和除以自由度即可得到。n這里的關(guān)鍵是如何確定各離差平方和的自由度這里的關(guān)鍵是如何確定各離差平方和的自由度。n對對SST來說來說,其自由度為,其自由度為n-1,因為它只有一個約,因為它只有一個約束條件,即束條件,即 。n對對SSA來說來說,其自由度為,其自由度為r-1,這里的,這里的r表示水平的表示水平的個數(shù)。個數(shù)。SSA反映的是組間反映的是組間 的差異,它也有一的差異,它也有一個約束條件,即要求:個約束條件,即要求: 0)(xxij)(xxj0)(xxnjj32(

22、四)計算平均平方(四)計算平均平方n對對SSE來說來說,其自由度為,其自由度為n-r,因為對每一個水平而言,都存在,因為對每一個水平而言,都存在一個約束條件,即:一個約束條件,即:n每種水平下其觀察值個數(shù)為每種水平下其觀察值個數(shù)為nj,則各種水平下的自由度為,則各種水平下的自由度為nj-1,總共有總共有r個水平,因此,擁有的自由度個數(shù)為:個水平,因此,擁有的自由度個數(shù)為:n r(nj-1)=n-rn與離差平方和一樣,與離差平方和一樣,SST,SSA,SSE之間的自由度也存在如下之間的自由度也存在如下關(guān)系:關(guān)系:n n-1=(r-1)+(n-r)。0)(1jnijijxx33(四)計算平均平方(

23、四)計算平均平方n這樣,SSA的平均平方的平均平方MSA為為:n MSA=SSA/(r-1) 組間方差 n n SSE的平均平方的平均平方MSE為:為:n MSE=SSE/(n-r) 組內(nèi)方差34(五)計算(五)計算F方差方差 n F=組間方差組間方差/組內(nèi)方差組內(nèi)方差n =MSA/MSE n n = )/() 1/(rnSSErSSA35(六)統(tǒng)計決策統(tǒng)計決策 FF,則接受原假設H0,即因素對觀 察值無影響; FF,則拒絕原假設H0,接受替換假 設H1 ,說明因素對觀察值產(chǎn)生 影響。 36實例 觀察值 i 水 平無色 粉色 橘黃色 綠色1234526.5 31.2 27.9 30.828.7

24、 28.3 25.1 29.625.1 30.8 28.5 32.429.1 27.9 24.2 31.727.2 29.6 26.5 32.8合 計136.6 147.8 132.2 157.3573.9水平均值觀察值個數(shù)總均值127.32x 229.56x 326.44x 431.46x 15n 25n 35n 45n 573.9/20 28.695x72表四種顏色飲料銷量及均值37實例n檢驗過程:檢驗過程:n(1)建立假設:)建立假設:H0:n H1: 不全相等不全相等n(2)計算水平均值及總均值(見表)計算水平均值及總均值(見表)n(3)計算離差平方和)計算離差平方和 n SST=11

25、5.9295n SSA=76.8455n SSE=SST-SSA=30.084n(4)計算計算F統(tǒng)計量統(tǒng)計量n =10.486 n(5)統(tǒng)計決策。由于)統(tǒng)計決策。由于 FF(3,16)=3.24,故拒絕原假設,接,故拒絕原假設,接受備擇假設,即顏色對銷量產(chǎn)生顯著性影響。受備擇假設,即顏色對銷量產(chǎn)生顯著性影響。/(1)/()SSA rFSSE n r76.8455/(4 1)25.615239.084/(20 4)2.44281234, 123438n 接受區(qū)域 拒絕區(qū)域n 3.2439二、關(guān)系強度的測量(略)二、關(guān)系強度的測量(略)n單因素方差分析中,水平項離差平方和(單因素方差分析中,水平項

26、離差平方和(SSA)度量的是)度量的是“因因素素”對觀察值的影響效應。實際上,只要水平項離差平方和對觀察值的影響效應。實際上,只要水平項離差平方和(SSA)不等于)不等于0,就表明,就表明“因素因素”與觀察值兩者之間有關(guān)系與觀察值兩者之間有關(guān)系(只是是否顯著的問題)。當水平項離差平方和(只是是否顯著的問題)。當水平項離差平方和(SSA)比殘)比殘差平方和(差平方和(SSE)大,并且大到一定程度時,就意味著)大,并且大到一定程度時,就意味著“因素因素”和觀察值之間的關(guān)系顯著,且大的越多,二者的關(guān)系就愈強;和觀察值之間的關(guān)系顯著,且大的越多,二者的關(guān)系就愈強;反之,二者的關(guān)系則不顯著,且小的越多,

27、關(guān)系就愈弱。反之,二者的關(guān)系則不顯著,且小的越多,關(guān)系就愈弱。n那么,那么,究竟怎樣度量二者的關(guān)系強弱呢究竟怎樣度量二者的關(guān)系強弱呢?40二、關(guān)系強度的測量n可用水平項離差平方和(可用水平項離差平方和(SSA)占總離差平方和)占總離差平方和(SST)的比率大小來反映。)的比率大小來反映。n將將SSA占占SST的比率記為的比率記為 ,則:,則:n n其其算術(shù)平方根算術(shù)平方根R R可以用來測量可以用來測量“因素因素”與觀察值與觀察值之間的關(guān)系強度。之間的關(guān)系強度。 2R2SSARSST41二、關(guān)系強度的測量n根據(jù)飲料顏色對銷量影響的例子計算得:根據(jù)飲料顏色對銷量影響的例子計算得:n =76.845

28、5/115.9295=0.6627n =66.27%n結(jié)果表明:飲料顏色對銷量的影響效應占總效應結(jié)果表明:飲料顏色對銷量的影響效應占總效應的的66.27%,而殘差效應則占,而殘差效應則占33.73%。即,飲。即,飲料顏色對銷量差異解釋的比率高達料顏色對銷量差異解釋的比率高達66%以上,以上,而其他因素所解釋的比率不足而其他因素所解釋的比率不足34%。2SSARSST42二、關(guān)系強度的測量n根據(jù)這個計算結(jié)果可計算出R=0.814165,這表明飲料顏色與銷量之間有顯著的關(guān)系。n(此問題類似于擬合優(yōu)度中的可決系數(shù))43三、單因素方差分析中的其他問題單因素方差分析中的其他問題n1、進行方差分析所需要的

29、數(shù)據(jù)的結(jié)構(gòu)。、進行方差分析所需要的數(shù)據(jù)的結(jié)構(gòu)。n (見教材p189)n方差分析的因素既可以放在列的位置,也可以放在行的位置,但通常放在列的位置。這樣與計算機中數(shù)據(jù)庫的結(jié)構(gòu)相一致,便于計算機處理。n2、進行方差分析,各個水平下的樣本容量可以、進行方差分析,各個水平下的樣本容量可以相同,也可以不同。相同,也可以不同。 n3、方差分析可以對若干平均值是否相等同時進、方差分析可以對若干平均值是否相等同時進行檢驗(是其特點)行檢驗(是其特點) ,但如果檢驗結(jié)果拒絕原假設,接受替換假設,這僅表明進行檢驗的這幾個均值不全相等。 44四、方差分析中的多重比較n多重比較的目的多重比較的目的,就是通過對總體均值之

30、,就是通過對總體均值之間的間的配對比較配對比較來進一步檢驗到底哪些均值來進一步檢驗到底哪些均值之間存在差異。之間存在差異。n多重比較的方法多重比較的方法,最小顯著差異最小顯著差異方法方法(LSD)(由費希爾提出)(由費希爾提出)n檢驗的具體步驟檢驗的具體步驟:45四、方差分析中的多重比較nLSD檢驗的具體步驟:n(1)提出假設: ,n(2)計算檢驗統(tǒng)計量:n(3)計算LSD值n式中, 的自由度為(n-r),r是因素中水平的個數(shù);n 是第i個樣本和第j個樣本的容量。0i:jH1i:jH ijx x/211ijLSDtMSEnn/2tijnn和46四、方差分析中的多重比較nLSD檢驗的具體步驟:n

31、(4)作出決策。)作出決策。n如果 ,則拒絕 ;n如果 ,則不能拒絕 。n ijxxLSDijxxLSD0H0H47 第三節(jié) 雙因素方差分析雙因素方差分析n一、雙因素方差分析的類型一、雙因素方差分析的類型n雙因方差分析的內(nèi)容,是對影響因素進行檢驗,究竟是一個因雙因方差分析的內(nèi)容,是對影響因素進行檢驗,究竟是一個因素在起作用,還是兩個因素都起作用,或是兩個因素的影響都素在起作用,還是兩個因素都起作用,或是兩個因素的影響都不顯著。不顯著。n 雙因素方差分析有雙因素方差分析有兩種類型兩種類型:n 一個是一個是無交互作用無交互作用的雙因素方差分析的雙因素方差分析,它假設因素,它假設因素A和因素和因素B

32、的效用之間是相互獨立的,不存在相互關(guān)系;的效用之間是相互獨立的,不存在相互關(guān)系;n 另一個是另一個是有交互作用有交互作用的雙因素方差分析的雙因素方差分析,它假設因素,它假設因素A和因和因素素B的結(jié)合會產(chǎn)生出一種新的效用。的結(jié)合會產(chǎn)生出一種新的效用。 在此僅介紹無交互作用的在此僅介紹無交互作用的雙因素方差分析。雙因素方差分析。 48二、數(shù)據(jù)結(jié)構(gòu)二、數(shù)據(jù)結(jié)構(gòu)n 雙因素方差分析數(shù)據(jù)結(jié)構(gòu)雙因素方差分析數(shù)據(jù)結(jié)構(gòu)n 因 素 A(C)n A1 A2 Ar n B1 n 因 B2 n 素 n B n(R) n B k n 11x12xrx1 ix1x21x22xrx22x1kx2kxkrxkxjx1 x2xr

33、xx49對表的說明:n上表中,因素上表中,因素C位于列的位置,共有位于列的位置,共有r個水平;因素個水平;因素R位于行的位于行的位置,共有位置,共有k個水平個水平 。樣本容量為。樣本容量為n=rk。 n每一個觀察值每一個觀察值 看作由列因素的看作由列因素的r個水平和行因素的個水平和行因素的k個水平個水平所組成的所組成的rk個總體中抽取樣本容量為個總體中抽取樣本容量為1的獨立隨機樣本。的獨立隨機樣本。n這這rk個總體的每一個總體均服從正態(tài)分布,且有相同的方差。個總體的每一個總體均服從正態(tài)分布,且有相同的方差。這是進行雙因素方差分析的假設條件這是進行雙因素方差分析的假設條件 。n n 代表因素代表

34、因素C第第j種水平的樣本平均數(shù);種水平的樣本平均數(shù); n 代表因素代表因素R第第i種水平的樣本平均數(shù);種水平的樣本平均數(shù);n 為樣本總平均數(shù)。為樣本總平均數(shù)。 ijxjx ixx50雙因素方差分析離差平方和的表達公式雙因素方差分析離差平方和的表達公式:n雙因素方差分析中,需將總離差平方和雙因素方差分析中,需將總離差平方和SST進行分進行分解,具體分解為三部分。解,具體分解為三部分。nSSC列因素所產(chǎn)生的水平項離差平方和的;列因素所產(chǎn)生的水平項離差平方和的;nSSR行因素所產(chǎn)生的水平項離差平方和的;行因素所產(chǎn)生的水平項離差平方和的;nSSE剩余因素影響產(chǎn)生的誤差平方和,即隨機誤剩余因素影響產(chǎn)生的

35、誤差平方和,即隨機誤差項平方和。差項平方和。n它們的具體表達形式為:它們的具體表達形式為:51雙因素方差分析離差平方和的表達公式:雙因素方差分析離差平方和的表達公式:nSST=nSSC=nSSR=nSSE=SST-SSC-SSR211()krijijxx21j 1()kriixx211()rkjjixx52雙因素方差分析的統(tǒng)計量:n檢驗列因素的統(tǒng)計量:n檢驗行因素的統(tǒng)計量/(1)(1),(1)(1)/(1)(1)CSSCrFF rrkSSErk/(1)(1),(1)(1)/(1)(1)RSSRkFF krkSSErk53雙因素方差分析的步驟:雙因素方差分析的步驟:n(1)提出假設:對兩個因素分

36、別提出假設)提出假設:對兩個因素分別提出假設n行因素:行因素:H0:n H1:n列因素:列因素:n(2)構(gòu)造檢驗統(tǒng)計量)構(gòu)造檢驗統(tǒng)計量n (3)統(tǒng)計決策統(tǒng)計決策12k12,k 112:,rH012:rH/ (1)(1), (1)(1)/ (1)(1)CSSCrFFrrkSSErk/ (1)(1), (1)(1)/ (1)(1)RSSRkFFkrkSSErk54第四節(jié) 試驗設計初步n試驗設計是研究如何科學地安排試驗,使人們能用盡試驗設計是研究如何科學地安排試驗,使人們能用盡可能少的試驗獲得盡可能多的信息??赡苌俚脑囼灚@得盡可能多的信息。n試驗設計可分為如下三種類型試驗設計可分為如下三種類型:n一

37、、完全隨機化設計一、完全隨機化設計n二、隨機化區(qū)組設計二、隨機化區(qū)組設計n三、因子設計三、因子設計55案例案例n一家種業(yè)開發(fā)股份公司研究出三個新的一家種業(yè)開發(fā)股份公司研究出三個新的小麥品種小麥品種(因素因素):品種):品種1、品種、品種2、品種、品種3。公司需要研究不同品種對產(chǎn)量的影響,為此。公司需要研究不同品種對產(chǎn)量的影響,為此需要選擇一些地塊種上不同的品種,以獲得產(chǎn)量數(shù)據(jù),進而分析需要選擇一些地塊種上不同的品種,以獲得產(chǎn)量數(shù)據(jù),進而分析小麥品種對產(chǎn)量的影響是否顯著。小麥品種對產(chǎn)量的影響是否顯著。 這一過程就是試驗設計的過這一過程就是試驗設計的過程。程。n試驗設計可采取兩種方法:試驗設計可采

38、取兩種方法:n1、抽取、抽取3個面積相同的地塊,然后將每個品種隨機指派給其中的個面積相同的地塊,然后將每個品種隨機指派給其中的一地塊;(一地塊;(完全隨機設計完全隨機設計)n2、首先將地塊按照土壤好壞分成若干區(qū)組(假定這里分成、首先將地塊按照土壤好壞分成若干區(qū)組(假定這里分成4個區(qū)個區(qū)組),而組),而每個區(qū)組中有三地塊每個區(qū)組中有三地塊,然后在每個區(qū)組內(nèi)的,然后在每個區(qū)組內(nèi)的3個地塊以個地塊以抽簽的方式抽簽的方式?jīng)Q定所種的品種。(決定所種的品種。(隨機化區(qū)組設計隨機化區(qū)組設計)56第四節(jié) 試驗設計初步n一、完全隨機化設計一、完全隨機化設計n將因素中的將因素中的k種種“水平水平”被隨機地指派給試

39、驗單元的設計,被隨機地指派給試驗單元的設計,稱作完全隨機化設計。稱作完全隨機化設計。n接受接受“水平水平”的對象或?qū)嶓w,被稱為的對象或?qū)嶓w,被稱為試驗單元試驗單元,或稱抽樣單元。,或稱抽樣單元。n完全隨機化設計除了符合完全隨機化設計除了符合“隨機化隨機化”要求外,還必須符合要求外,還必須符合“可可重復性重復性”原則。原則。n所謂所謂“可重復性可重復性”是指在每個實驗條件下,試驗可重復進行。是指在每個實驗條件下,試驗可重復進行。n目的目的是為了獲得因素中每種水平更多的數(shù)據(jù)。是為了獲得因素中每種水平更多的數(shù)據(jù)。57第四節(jié) 試驗設計初步n二、隨機化區(qū)組設計二、隨機化區(qū)組設計n先先按一定規(guī)則將試驗單元

40、劃分為若干按一定規(guī)則將試驗單元劃分為若干同質(zhì)組同質(zhì)組,稱為,稱為“區(qū)組區(qū)組”,然后然后再將因素中的各種再將因素中的各種“水平水平”隨機地指派給各個區(qū)組,這樣隨機地指派給各個區(qū)組,這樣的試驗設計稱為隨機化區(qū)組設計。的試驗設計稱為隨機化區(qū)組設計。n完全隨機化設計看起來似乎很公平,但不同試驗單元有質(zhì)量優(yōu)完全隨機化設計看起來似乎很公平,但不同試驗單元有質(zhì)量優(yōu)劣之別,因此,在隨機指派不同水平時,就有可能造成有的水劣之別,因此,在隨機指派不同水平時,就有可能造成有的水平的試驗單元質(zhì)量好,而有的水平的試驗單元質(zhì)量較差,進而平的試驗單元質(zhì)量好,而有的水平的試驗單元質(zhì)量較差,進而影響試驗結(jié)果的公平性。而隨機化區(qū)

41、組設計考慮到了試驗單元影響試驗結(jié)果的公平性。而隨機化區(qū)組設計考慮到了試驗單元對觀察結(jié)果產(chǎn)生的影響,所以,這種試驗設計比完全隨機化設對觀察結(jié)果產(chǎn)生的影響,所以,這種試驗設計比完全隨機化設計要公平。計要公平。58第四節(jié) 試驗設計初步n三、因子設計三、因子設計n兩個或多個因素的搭配試驗設計,稱為因子設計。59結(jié)構(gòu)差異的顯著性分析結(jié)構(gòu)差異的顯著性分析n 檢驗檢驗 n1、問題的提出:、問題的提出:n統(tǒng)計學中,通常要分析的數(shù)據(jù)大多是針對具有某一計量單位的計量數(shù)統(tǒng)計學中,通常要分析的數(shù)據(jù)大多是針對具有某一計量單位的計量數(shù)據(jù),諸如重量、時間、長度、強度、錢數(shù)等。但市場調(diào)查中,需要分據(jù),諸如重量、時間、長度、強

42、度、錢數(shù)等。但市場調(diào)查中,需要分析的數(shù)據(jù)往往并不是由計量值構(gòu)成,而是由頻數(shù)構(gòu)成的。析的數(shù)據(jù)往往并不是由計量值構(gòu)成,而是由頻數(shù)構(gòu)成的。n例如,(例如,(1)社會學家研究各階層的收入狀況,將人們按收入分為)社會學家研究各階層的收入狀況,將人們按收入分為5個個等級,就產(chǎn)生了與每個收入等級相對應的頻數(shù);等級,就產(chǎn)生了與每個收入等級相對應的頻數(shù);n(2)證券公司希望調(diào)查顧客的投資傾向與職業(yè)之間的關(guān)系,從其客)證券公司希望調(diào)查顧客的投資傾向與職業(yè)之間的關(guān)系,從其客戶中隨機選取戶中隨機選取300人進行調(diào)查,并記錄下他們的職業(yè)和投資的項目人進行調(diào)查,并記錄下他們的職業(yè)和投資的項目(股票,企業(yè)債券,國庫券),從

43、而可得到一個二向分類的頻數(shù)分布;(股票,企業(yè)債券,國庫券),從而可得到一個二向分類的頻數(shù)分布;n(3)某廠商為推銷某種新產(chǎn)品,他們?yōu)殡娨晱V告準備了三種不同的)某廠商為推銷某種新產(chǎn)品,他們?yōu)殡娨晱V告準備了三種不同的畫面內(nèi)容,隨機抽取畫面內(nèi)容,隨機抽取500個觀眾,獲得對這三種不同畫面的喜歡人數(shù),個觀眾,獲得對這三種不同畫面的喜歡人數(shù),等等。等等。260結(jié)構(gòu)差異的顯著性分析結(jié)構(gòu)差異的顯著性分析n以上所舉的例子我們獲取的都是以上所舉的例子我們獲取的都是定性變量定性變量(品質(zhì)標志品質(zhì)標志)的頻數(shù)數(shù)的頻數(shù)數(shù)據(jù)。收集分類數(shù)據(jù)的目的是據(jù)。收集分類數(shù)據(jù)的目的是為了分析在各個類中數(shù)據(jù)的分布為了分析在各個類中數(shù)據(jù)

44、的分布。此時的分析就要使用此時的分析就要使用 檢驗。檢驗。n 檢驗,是一種非參數(shù)檢驗的方法,用來評價次數(shù)分布是否檢驗,是一種非參數(shù)檢驗的方法,用來評價次數(shù)分布是否存在明顯的差異。存在明顯的差異。2261結(jié)構(gòu)差異的顯著性分析結(jié)構(gòu)差異的顯著性分析n2、 檢驗步驟檢驗步驟n第一,第一,提出假設提出假設: 次數(shù)分布結(jié)構(gòu)不存在明顯差異;次數(shù)分布結(jié)構(gòu)不存在明顯差異;n 次數(shù)分布結(jié)構(gòu)存在明顯差異。次數(shù)分布結(jié)構(gòu)存在明顯差異。n第二,第二,計算計算 統(tǒng)計量統(tǒng)計量:n第三,第三,根據(jù)給定的顯著性水平根據(jù)給定的顯著性水平 ,查,查 分布表,確定臨界值分布表,確定臨界值n (其中(其中k表示類型的項數(shù))。表示類型的項數(shù))。n第四,第四,比較并作出結(jié)論比較并作出結(jié)論:如果:如果 ,就拒絕原假設,就拒絕原假設,即接受次數(shù)分布結(jié)構(gòu)有明顯的差異;如果即接受次數(shù)分布結(jié)構(gòu)有明顯的差異;如果 ,就接受,就接受原假設,即次數(shù)分布結(jié)構(gòu)之間無明顯差異。原假設,即次數(shù)分布結(jié)構(gòu)之間無明顯差異。0:H1:H221n -E(n )(n )kiiiiE2(1)k22(1)k22(1)k22262結(jié)構(gòu)差異的顯著性分析結(jié)構(gòu)差異的顯著性分析n3、 檢驗的應用檢驗的應用n【案例】某商場為了研究顧客對三種牌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論