![《應用統(tǒng)計學》第八章_第1頁](http://file4.renrendoc.com/view14/M03/0E/11/wKhkGWb4Ly6AaPKJAAG9MVnnSYk443.jpg)
![《應用統(tǒng)計學》第八章_第2頁](http://file4.renrendoc.com/view14/M03/0E/11/wKhkGWb4Ly6AaPKJAAG9MVnnSYk4432.jpg)
![《應用統(tǒng)計學》第八章_第3頁](http://file4.renrendoc.com/view14/M03/0E/11/wKhkGWb4Ly6AaPKJAAG9MVnnSYk4433.jpg)
![《應用統(tǒng)計學》第八章_第4頁](http://file4.renrendoc.com/view14/M03/0E/11/wKhkGWb4Ly6AaPKJAAG9MVnnSYk4434.jpg)
![《應用統(tǒng)計學》第八章_第5頁](http://file4.renrendoc.com/view14/M03/0E/11/wKhkGWb4Ly6AaPKJAAG9MVnnSYk4435.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第八章方差分析引導案例
哪種促銷方式效果最好?某連鎖超市為了研究不同促銷手段對商品銷售額的影響,選擇了某類日常生活用品,在其下屬的5個門店分別采用某種促銷方式各進行了為期4個月的試驗。試驗前,該類商品在這5個門店的月銷售額基本處于同一水平,試驗結果如表8-1所示。
其中,“通常銷售”是指不采用任何促銷手段,“廣告宣傳”是指沒有價格優(yōu)惠的單純廣告促銷,“買一送一”是指買一件商品送另一件小商品?,F(xiàn)該公司管理部門希望了解的是:不同的促銷方式是否對該類商品銷售額的增長有顯著影響?若有顯著影響,哪種促銷方式效果最好?是否任意兩種促銷方式的效果之間都存在顯著差異?要想解決上述問題,可以借助方差分析及多重比較方法。第一節(jié)方差分析概述第二節(jié)單因素方差分析第三節(jié)雙因素方差分析第一節(jié)方差分析概述第二節(jié)單因素方差分析第三節(jié)雙因素方差分析一、方差分析中的相關術語表面上看,方差分析是檢驗多個總體均值是否相等的統(tǒng)計方法,但本質(zhì)上它所研究的是分類型自變量對數(shù)值型因變量的影響,如變量之間有沒有關系、關系的強度如何等。方差分析就是通過檢驗各總體的均值是否相等,來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。為了更好地理解方差分析,先通過一個例子來說明方差分析的有關概念及方差分析所要解決的問題。在方差分析中,所要檢驗的對象稱為因素或因子;因素的不同表現(xiàn)稱為水平或處理;每個因子水平下得到的樣本數(shù)據(jù)稱為觀測值。例8-1中,“顏色”是要檢驗的對象,稱為因素或因子;黃色、紅色、綠色、白色是“顏色”這一因素的具體表現(xiàn),稱為水平或處理;在每個顏色下得到的樣本數(shù)據(jù)(銷售量)稱為觀測值。由于只涉及一個因素,因此稱為單因素方差分析。單因素方差分析中,只涉及兩個變量:一個是分類型自變量,一個是數(shù)值型因變量。例8-1中,“顏色”是分類型自變量,黃色、紅色、綠色、白色是“顏色”這個自變量的具體取值;“銷售量”是數(shù)值型因變量,不同的銷售量就是因變量的取值。圖形描述(一)怎樣判斷顏色對運動衫的銷售量是否有顯著影響?或者說,顏色與運動衫銷售量之間是否有顯著的關系?我們畫出它們的散點圖,如圖8-1所示,圖中的那條折線是由各顏色銷售量的均值連接而成的。二、方差分析的基本原理從圖8-1可以看出,不同顏色運動衫的銷售量是有差異的,而且即使是同一種顏色,在不同超市的銷售量也是有差異的。其中,紅色運動衫的銷售量最多,綠色運動衫的銷售量最少。如果顏色對銷售量沒有影響,那么各種顏色運動衫的銷售量的均值應該是差不多相同的,在散點圖上也應該比較接近。但通過散點圖,我們還是沒有足夠的證據(jù)去證實各種顏色運動衫的銷售量的差異是否達到了統(tǒng)計學上的顯著水平,所以我們需要一種更精準的方法去推斷,也就是方差分析。誤差分解(二)方差分析認為觀測值之間存在差異,差異產(chǎn)生的來源有兩個方面:一個方面是由因素中不同水平造成的,如運動衫的不同顏色帶來的不同銷售量,我們稱之為系統(tǒng)誤差;另一個方面是由于抽選樣本的隨機性而產(chǎn)生的差異,如相同顏色的運動衫在不同商場的銷售量也不同,我們稱之為隨機誤差。在計算誤差時,我們可以用兩個方差來計量,即組間方差和組內(nèi)方差。組間方差即水平之間的方差,既包括系統(tǒng)誤差,又包括隨機誤差;組內(nèi)方差即水平內(nèi)部的方差,僅包括隨機誤差。如果不同水平對結果沒有影響,如運動衫的顏色對銷售量不產(chǎn)生影響,那么組間方差就只包括隨機誤差,而不包括系統(tǒng)誤差,它與組內(nèi)方差應該近似,兩個方差的比值會接近1。反之,如果不同水平對結果產(chǎn)生影響,組間方差中就不僅包括系統(tǒng)誤差,還包括隨機誤差。這時,組間方差就比組內(nèi)方差大,兩個方差的比值就會顯著地大于1,當這個比值大到某個程度,就可以判斷不同水平之間存在著顯著的差異。因此,方差分析就是通過不同方差的比較,作出拒絕或不拒絕原假設的判斷。第一節(jié)方差分析概述第二節(jié)單因素方差分析第三節(jié)雙因素方差分析一、數(shù)據(jù)結構進行單因素方差分析時,需要得到下面的數(shù)據(jù)結構,如表8-3所示。在單因素方差分析中,用A表示因素,因素的k個水平分別用表示,每個觀測值用(,)表示,即表示第個水平的第個觀測值。其中,從不同水平中所抽取的樣本量可以相等,也可以不相等。二、分析步驟在方差分析中,盡管不知道個總體的均值是否相等,但可以用樣本數(shù)據(jù)來檢驗它們是否相等。原假設描述的是不同類別的觀測值的均值是相等的,因此,檢驗因素的個水平的均值是否相等,需要針對總體提出以下原假設和備擇假設: 自變量對因變量沒有顯著影響不全相等 自變量對因變量有顯著影響式中,為第個總體的均值。如果不拒絕原假設,則沒有證據(jù)表明自變量對因變量有顯著影響。如果拒絕原假設,意味著自變量對因變量有顯著影響;此時,只是表明至少有兩個總體均值不相等,并不意味著所有的均值都不相等。提出假設(一)根據(jù)例8-1提出的假設如下: 顏色對銷售量沒有顯著影響不全相等 顏色對銷售量有顯著影響假定從第j個總體中抽取一個容量為的簡單隨機樣本,令為第j個總體的樣本均值,則有:
(8-1)式中,為第j個總體的樣本量;為第j個總體的第i個觀測值。樣本均值可以用Excel中的AVERAGE函數(shù)計算,將表8-2中的數(shù)據(jù)輸入Excel,如圖8-2所示。B8=AVERAGE(B3:B7),可算出。構造檢驗統(tǒng)計量(二)計算各樣本的均值1總均值是全部觀測值的總和除以觀測值的總個數(shù)。令總均值為,則有:
(8-2)式中,??偩狄部捎肊xcel中的AVERAGE函數(shù)計算,B10=AVERAGE(B3:E7),即。計算全部觀測值的總均值2為構造檢驗統(tǒng)計量,在方差分析中,需要計算三個誤差平方和,即總平方和、組間平方和與組內(nèi)平方和??偲椒胶陀洖镾ST,它是全部觀測值與總平均值的誤差平方和,其計算公式為:
(8-3)SST可用Excel中的DEVSQ函數(shù)實現(xiàn),B11=DEVSQ(B3:E7),即可算出總平方和為=464.95,它反映了全部25個觀測值與總均值之間的差異。組間平方和記為SSA,它是各組平均值與總均值的誤差平方和,反映各樣本均值之間的差異程度,又稱為回歸平方和。其計算公式為:(8-4)計算各種誤差平方和3SSA也稱為自變量效應或因子效應。SSA可以用Excel計算,具體步驟如下:①B12=B9*(B8-$B10)^2;②選中B12,將鼠標放在右下角,出現(xiàn)“+”時,向右拉至E12處;③F12=SUM(B12:E12),可算出SSA=218.95,它反映了自變量(顏色)對因變量(銷售量)的影響,包括了系統(tǒng)誤差和隨機誤差。組內(nèi)平方和記為SSE,它是每個水平或組的各樣本數(shù)據(jù)與其組平均值誤差的平方和,反映了每個樣本各觀測值的離散狀況,因此又稱為殘差平方和。SSE反映了隨機誤差的大小,其計算公式為:(8-5)在圖8-2中,先求出每個顏色的銷售量與其平均數(shù)的誤差平方和,然后將四種顏色的誤差平方和加總,即為組內(nèi)平方和。SSE也稱為殘差效應,可用DEVSQ函數(shù)實現(xiàn),具體步驟如下:①B13=DEVSQ(B3:B7)=85.2;②選中B13,鼠標放在右下角,出現(xiàn)“+”時,向右拉至E13處;③F13=SUM(B13:E13),就求出=246。它反映了除了自變量對因變量的影響之外,其他因素對因變量的總影響。上述三個平方和之間的關系為:
(8-6)即總平方和(SST)=組間平方和(SSA)+組內(nèi)平方和(SSE),從上面的計算結果也可以驗證這一點:??梢?,SST是全部數(shù)據(jù)總誤差程度的度量,它反映了自變量和殘差的共同影響,等于自變量效應加殘差效應。由于誤差平方和的大小與觀測值的多少有關,為了消除觀測值多少對誤差平方和大小的影響,需要將其平均,也就是用各平方和除以它們所對應的自由度,這一結果稱為方差,也稱為均方。三個平方和對應的自由度分別為:SST的自由度為,其中,n為全部觀測值的個數(shù);SSA的自由度為,其中,k為因素水平(總體)的個數(shù);SSE的自由度為。由于要比較的是組間方差和組內(nèi)方差之間的差異,所以通常只計算SSA和SSE的均方,分別計為MSA和MSE,其計算公式為:
(8-7)(8-8)計算統(tǒng)計量4從表8-2可知,,。將上述MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F。當原假設為真時,二者的比值服從分子自由度為、分母自由度為的F分布,即~(8-9)例如,根據(jù)圖8-2,。綜上所述,根據(jù)圖8-2中的數(shù)據(jù)構造的檢驗統(tǒng)計量如圖8-3所示。如果原假設成立,則表明沒有系統(tǒng)誤差,組間方差MSA和組內(nèi)方差MSE的比值差異就不會太大;如果組間方差顯著大于組內(nèi)方差,說明各水平(總體)之間的差異不僅僅是隨機誤差造成的,還有系統(tǒng)誤差??梢?,判斷因素水平是否對其觀測值有顯著影響,實際上也就是比較組間方差與組內(nèi)方差之間差異的大小。那么,它們之間的差異大到何種程度,才表明有系統(tǒng)誤差存在呢?這就需要用檢驗統(tǒng)計量進行判斷,將統(tǒng)計量的值F與給定的顯著性水平a的臨界值進行比較,從而作出對原假設的決策。統(tǒng)計決策(三)根據(jù)給定的顯著性水平a和分子自由度為、分母自由度為,用FINV函數(shù)可以求出相應的臨界值。若,則拒絕,表明之間的差異是顯著的。也就是說,所檢驗的因素(顏色)對觀測值(銷售量)有顯著影響。若,則不拒絕,表明之間的差異不顯著。也就是說,所檢驗的因素(顏色)對觀測值(銷售量)沒有顯著影響。根據(jù)上面的計算結果,用FINV函數(shù)求出臨界值。由于,則拒絕,表明不同顏色的銷售量均值是有顯著差異的,也就是說,顏色對銷售量是有顯著影響的。三、方差分析表上面介紹了方差分析的計算步驟和過程,為了使計算過程更加清晰,通常將上述過程的內(nèi)容列在一張表內(nèi),這就是方差分析表。其一般形式如表8-4所示。四、用Excel工具進行方差分析上述列表進行方差分析的過程對于幫助我們理解方差分析的基本原理是很有幫助的,但實際運用中,我們可以直接利用Excel軟件中的數(shù)據(jù)分析工具實現(xiàn),操作步驟如下:(1)選擇“數(shù)據(jù)”→“數(shù)據(jù)分析”→“方差分析:單因素方差分析”菜單命令,打開“單因素方差分析”對話框,如圖8-4所示。(2)選定輸入?yún)^(qū)域(圖8-2中的輸入?yún)^(qū)域為B3:E7);水平采用系統(tǒng)默認值0.05(也可根據(jù)需要確定);在“輸出選項”中選擇“新工作表組”單選按鈕,然后單擊“確定”按鈕,系統(tǒng)即輸出運行結果,如圖8-5所示。五、關系強度的測量圖8-5的方差分析結果顯示,不同顏色的運動衫銷售量是有顯著差異的,這意味著顏色(自變量)與銷售量(因變量)之間的關系是顯著的。組間平方和度量了自變量對因變量的影響效應,實際上,只要組間平方和不為零,就表明兩個變量之間有關系。當組間平方和比組內(nèi)平方和大,而且大到一定程度,意味著兩個變量之間的關系顯著,大得越多,表明它們之間的關系越強;反之,當組間平方和比組內(nèi)平方和小時,就意味著兩個變量之間的關系不顯著,小得越多,表明它們之間的關系越弱。所以,我們可以用組間平方和(SSA)占總平方和(SST)的比例大小來反映變量之間的關系強度,這一比例記為,即
(8-10)例如,根據(jù)圖8-5中的結果計算得
這表明,顏色(自變量)對銷售量(因變量)的影響效應占總效應的47.0911%,而殘差效應則占了52.9089%。也就是說,顏色對銷售量的差異解釋比例達到47.0911%,而其他因素(殘差變量)所解釋的比例為52.9089%。盡管并不高,但顏色對銷售量的影響已經(jīng)達到了統(tǒng)計上的顯著程度。的平方根可以用來測量自變量與因變量之間的關系強度。例如,根據(jù)上述結果可計算出,這表明顏色與銷售量之間有中等以上的相關關系。六、方差分析中的多重比較通過對例8-1的分析,可得出以下結論:不同顏色的運動衫銷售量的均值不完全相同。但究竟是哪些顏色的銷售量均值之間不相等,還需要進行進一步分析,所使用的方法就是多重比較方法,它是通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異。多重比較方法有許多種,這里介紹由費希爾提出的最小顯著差異方法,縮寫為LSD。采用該方法進行檢驗的具體步驟如下:(1)提出假設:,。(2)計算檢驗統(tǒng)計量:。(3)計算LSD,其公式為:
(8-11)式中,可以通過TINV函數(shù)獲得,為其自由度。MSE為組內(nèi)方差;和分別是第個樣本和第個樣本的樣本量。(4)根據(jù)顯著性水平a作出決策。如果,則拒絕;如果,則不拒絕。第一節(jié)方差分析概述第二節(jié)單因素方差分析第三節(jié)雙因素方差分析一、雙因素方差分析的類型在實際問題的研究中,影響因素可能不止一個。例如,分析影響空調(diào)銷售量的因素時,需要考慮許多因素,包括價格、質(zhì)量、品牌、銷售地區(qū)等。當方差分析中涉及兩個分類型自變量時,稱為雙因素方差分析。如果兩個因素對試驗結果的影響是相互獨立的,分別判斷行因素和列因素對試驗數(shù)據(jù)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復雙因素方差分析。如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結果產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復雙因素方差分析。二、無交互作用的雙因素方差分析數(shù)據(jù)結構(一)在無交互作用的雙因素方差分析中,由于有兩個因素,在獲取數(shù)據(jù)時,需要將一個因素安排在“行”的位置,稱為行因素;另一個因素安排在“列”的位置,稱為列因素。設行因素有k個水平:行1,行2,…,行k;列因素有r個水平:列1,列2,…,列r。行因素和列因素的每一個水平都可以搭配成一個樣本,觀察它們對試驗數(shù)據(jù)的影響,共抽取個觀察數(shù)據(jù),其數(shù)據(jù)結構如表8-5所示。表8-5中,是行因素的第i個水平下各觀察值的平均值,其計算公式為:
(=1,2,…,k)(8-12)是列因素的第j個水平下各觀察值的平均值,其計算公式為:
(=1,2,…,r)(8-13)是全部kr個樣本數(shù)據(jù)的總平均值,其計算公式為:
(8-14)檢驗統(tǒng)計量的構造(二)為了使檢驗統(tǒng)計量的構造過程更加清晰,將其列成方差分析表,其一般形式如表8-6所示。SST為總平方和,是全部樣本觀察值(=1,2,…,;=1,2,…,)與總的樣本平均值的誤差平方和,即
(8-15)其中,分解后的等式右邊第一項是行因素所產(chǎn)生的誤差平方和,記為SSR,即
(8-16)第二項是列因素所產(chǎn)生的誤差平方和,記為SSC,即(8-17)第三項是除行因素和列因素之外的剩余因素影響產(chǎn)生的誤差平方和,稱為隨機誤差平方和,記為SSE,即
(8-18)上述平方和的關系為:
(8-19)在誤差平方和的基礎上,計算方差。也就是將各平方和除以相應的自由度,即為方差或均方。行因素的方差,記為MSR;列因素的方差,記為MSC;隨機誤差項的方差,記為MSE。其計算公式如下:
其計算公式如下:
(8-20)
(8-21)
(8-22)為檢驗行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 昆明2025年云南昆明市生態(tài)環(huán)境局所屬事業(yè)單位引進高層次人才筆試歷年參考題庫附帶答案詳解
- 2025年中國雙人翻轉(zhuǎn)座椅骨架市場調(diào)查研究報告
- 廣西2025年廣西合浦儒艮國家級自然保護區(qū)管理中心招聘筆試歷年參考題庫附帶答案詳解
- 2025至2031年中國鋁合金絲編織管行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國精密交流脈沖焊接機行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國玻璃衛(wèi)浴產(chǎn)品行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國汽車前大燈鏡片行業(yè)投資前景及策略咨詢研究報告
- 惠州2025年廣東惠州龍門縣市容環(huán)境衛(wèi)生事務中心招聘編外環(huán)衛(wèi)工人14人筆試歷年參考題庫附帶答案詳解
- 2025年平移大門驅(qū)動系統(tǒng)項目可行性研究報告
- 2025年合金鋼襯項目可行性研究報告
- 2024-2025年中國專網(wǎng)通信行業(yè)市場前景預測及投資戰(zhàn)略研究報告
- 二零二五年度能源行業(yè)員工勞動合同標準范本3篇
- 培訓課件:律師客戶溝通技巧
- 2025年春新外研版(三起)英語三年級下冊課件 Unit5第1課時Startup
- 2025年春新外研版(三起)英語三年級下冊課件 Unit1第2課時Speedup
- 2024年石柱土家族自治縣中醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 西藏事業(yè)單位c類歷年真題
- 部編版語文小學二年級下冊第一單元集體備課(教材解讀)
- 房屋市政工程生產(chǎn)安全重大事故隱患判定標準(2024版)宣傳畫冊
- (中外歷史綱要下)歷史 第三單元 大單元教學設計與單元評價
- 人民醫(yī)院診斷證明書
評論
0/150
提交評論