假設(shè)檢驗與方差分析實驗指導(dǎo)書_第1頁
假設(shè)檢驗與方差分析實驗指導(dǎo)書_第2頁
假設(shè)檢驗與方差分析實驗指導(dǎo)書_第3頁
假設(shè)檢驗與方差分析實驗指導(dǎo)書_第4頁
假設(shè)檢驗與方差分析實驗指導(dǎo)書_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、實驗四 假設(shè)檢驗實驗?zāi)康模和ㄟ^此實驗熟練掌握如何利用假設(shè)檢驗工具根據(jù)不同條件選擇相應(yīng)檢驗工具進(jìn)行檢驗,有助于學(xué)習(xí)者理解假設(shè)檢驗的過程及結(jié)果實驗要求:能夠運用Excel對總體均值進(jìn)行假設(shè)檢驗,學(xué)會針對實際背景提出原假設(shè)和備擇假設(shè)來檢驗實際問題,并根據(jù)檢驗結(jié)果作出符合統(tǒng)計學(xué)原理和實際情況的判斷和結(jié)論,加深對統(tǒng)計學(xué)方法的廣泛應(yīng)用背景的理解假設(shè)檢驗與區(qū)間估計兩者之間存在密切的關(guān)系,二者用的是同一個樣本、同一個統(tǒng)計量、同一種分布,所以也可以用區(qū)間估計進(jìn)行假設(shè)檢驗,兩者結(jié)論是一致的。在Excel中進(jìn)行假設(shè)檢驗,除可按區(qū)間估計過程用公式和逆函數(shù)計算外,還備有專用的假設(shè)檢驗工具,包括Z檢驗工具、T檢驗工具和F

2、檢驗工具。使用這些工具,可以直接根據(jù)樣本數(shù)據(jù)進(jìn)行計算,一次給出檢驗統(tǒng)計量、單尾和雙尾臨界值以及小于或等于臨界值的概率等所需要的數(shù)值。實驗四主要介紹假設(shè)檢驗工具的使用。一、假設(shè)檢驗的一般過程假設(shè)檢驗主要是根據(jù)計算出的檢驗統(tǒng)計量與相應(yīng)臨界值比較,作出拒絕或接受原假設(shè)的決定。根據(jù)全國汽車經(jīng)銷商協(xié)會報道,舊車的平均銷售價格是10192美元。堪薩斯城某舊車經(jīng)銷處的一名經(jīng)理檢查了近期在該經(jīng)銷處銷售的100輛舊車。結(jié)果樣本平均價格是9300美元,樣本標(biāo)準(zhǔn)差是4500美元。在0.05的顯著性水平下,檢驗H0: H1:。問:假設(shè)檢驗的結(jié)論是什么?這名經(jīng)理接下來可能會采取什么行動?本例由于樣本容量比較大,其均值近

3、似服從正態(tài)分布,總體方差未知,需要用樣本標(biāo)準(zhǔn)差來代替,選擇T統(tǒng)計量進(jìn)行檢驗。T統(tǒng)計量的計算公式如下:單擊任一空單元格,輸入“=(9300-10192)/(4500/SQRT(100)”,回車確認(rèn),得出t統(tǒng)計量為-1.982。單擊另一空單元格,輸入“=TINV(0.025,99)”,回車確認(rèn),得出t分布的右臨界值為2.276。因為,所以不拒絕原假設(shè),認(rèn)為此舊車經(jīng)銷處舊汽車平均銷售價格不小于10192美元。那么接下來這名經(jīng)理會采取什么相應(yīng)行動?(請讀者思考)。本例主要介紹了假設(shè)檢驗的一般過程,利用Excel的公式和函數(shù)求出相應(yīng)的統(tǒng)計量值和臨界值,最后作出結(jié)論。二、假設(shè)檢驗工具的使用接下來介紹如何使

4、用Excel的假設(shè)檢驗工具。使用這一工具應(yīng)該注意二點:第一,由于現(xiàn)實世界和生活中大量的數(shù)據(jù)服從正態(tài)分布,Excel的假設(shè)檢驗工具是按正態(tài)總體設(shè)計的(以下各例未特殊說明,認(rèn)為其服從或近似服從正態(tài)分布);第二,Excel的假設(shè)檢驗工具主要用于檢驗兩總體之間有無顯著差異。具體來講,Z檢驗工具是對方差或標(biāo)準(zhǔn)差已知的兩總體均值進(jìn)行差異性檢驗;T檢驗工具是對方差和標(biāo)準(zhǔn)差未知的兩總體均值進(jìn)行差異性檢驗,其中包括等方差假設(shè)檢驗、異方差假設(shè)檢驗和成對雙樣本檢驗;F檢驗工具是對總體的標(biāo)準(zhǔn)差進(jìn)行檢驗。(一)Z檢驗工具的使用國際航空運輸協(xié)會對商務(wù)旅行者進(jìn)行調(diào)查以確定大西洋兩岸過關(guān)機(jī)場的等級分?jǐn)?shù)。假定:要求50名商務(wù)旅

5、行者組成的隨機(jī)樣本給邁阿密機(jī)場打分,另50名商務(wù)旅行者組成的隨機(jī)樣本給洛杉機(jī)機(jī)場打分,最高等級為10分。兩個樣本數(shù)據(jù)如下:邁阿密機(jī)場得分?jǐn)?shù)據(jù):6468776338104878759584385544484562599848995978310896洛杉機(jī)機(jī)場得分?jǐn)?shù)據(jù):10967879810765735687108478699531896854610983279531035108假定兩總體的等級標(biāo)準(zhǔn)差已知(這里用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差),分別為2.16和2.37。問:在5%的顯著性水平下,邁阿密機(jī)場和洛杉機(jī)機(jī)場的平均等級有無差異?將數(shù)據(jù)分別輸入到Excel表中(A2:A51;B2:B51),在“

6、工具”菜單中選擇“數(shù)據(jù)分析”選項,從其“分析工具”列表中選擇“Z檢驗:雙樣本平均差檢驗”,回車進(jìn)入該工具對話框,如圖4-1所示。圖4-1 Z檢驗工具對話框 在“變量1和變量2”的區(qū)域框中,分別輸入“A1:A51”和“B1:B51”(數(shù)據(jù)區(qū)域)。 “假設(shè)平均差(P)框”中,輸入“0”。 “變量1的方差和變量2的方差”框中,分別輸入“4.68”和“5.63”(總體方差)。 單擊“標(biāo)志(L)”復(fù)選框(因為數(shù)據(jù)區(qū)域有列標(biāo)題);“(A)”框中要求輸入顯著性水,本例按默認(rèn)設(shè)置0.05即可。 本例選擇“輸出區(qū)域”設(shè)置框,在其中輸入“C1”。完成以上操作后,回車確認(rèn),在指定的區(qū)域給出計算結(jié)果,見表4-1。表4

7、-1 Z檢驗計算結(jié)果結(jié)果解釋與分析:1、“平均”為樣本均值;“已知協(xié)方差”指總體方差;“觀察值”為樣本個數(shù)。2、表中給出的Z統(tǒng)計量為:3、將Z統(tǒng)計量與臨界值相比,本例采用雙尾比較,所以只能不拒絕原假設(shè),認(rèn)為兩機(jī)場等級評分沒有差異。當(dāng)然,也可以將顯著性水平與P值比較,如果P值大于顯著性水平則不拒絕原假設(shè)。(二)T檢驗工具的使用1、假定兩總體的方差相同大學(xué)人員安排委員會公布了大學(xué)畢業(yè)生首次任職薪水?dāng)?shù)據(jù)下表列出了會計專業(yè)和財政專業(yè)樣本每年薪水?dāng)?shù)據(jù):(單位:千美元)會計 財政28.826.325.3 23.626.225.027.923.027.027.926.224.528.129.024.727.

8、425.223.529.226.929.726.229.324.0采用0.05的顯著性水平,檢驗會計專業(yè)和財政專業(yè)畢業(yè)生首次任職平均年薪是否存在差異?將數(shù)據(jù)分別輸入到Excel表中(A2:A13;B1:B13),在“工具”菜單中選擇“數(shù)據(jù)分析”選項,從其“分析工具”列表中選擇“t檢驗:雙樣本等方差假設(shè)”,回車進(jìn)入該工具對話框,如圖4-2所示。圖4-2 “t檢驗:雙樣本等方差假設(shè)”對話框?qū)⒏髯訉υ捒蜻M(jìn)行相應(yīng)設(shè)置后(具體可參照Z檢驗),回車確認(rèn),在指定的區(qū)域給出計算結(jié)果,見表4-2。表4-2 “t檢驗:雙樣本等方差假設(shè)”結(jié)果結(jié)果解釋與分析:(1)合并方差是兩樣本方差的加權(quán)平均數(shù),其計算公式為:(2

9、)df為“自由度”。本例t檢驗統(tǒng)計量的自由度為12+12-2=22。(3)t Stat是t檢驗統(tǒng)計量,其計算公式為:(4)將t統(tǒng)計量與臨界值比較,本例采用雙尾檢驗,2.23>2.07(0.04<0.05),所以拒絕原假設(shè),認(rèn)為會計專業(yè)和財政專業(yè)畢業(yè)生首次任職的平均年薪存在顯著差異。2、假定兩總體的方差不相同現(xiàn)有兩種新舊軟件包,為了評價新軟件包的優(yōu)點,隨機(jī)抽取了24個系統(tǒng)分析人員作為樣本。其中,12個分析人員用舊軟件包來開發(fā)指定信息系統(tǒng),另外12個人用新軟件包來開發(fā),得到其開發(fā)使用時間(數(shù)據(jù)如下表)。在5%的顯著性水平下,問:新軟件包是否可以縮短完成項目的平均時間。舊軟件包 新軟件包

10、299 315360 200276 214310 263340 334388 344277 282365 307281 290315 288378 318310301這是一個兩總體均值的假設(shè)檢驗問題,用表示“使用舊軟件包開發(fā)指定系統(tǒng)所需的平均時間”,表示“使用新軟件包開發(fā)指定系統(tǒng)所需的平均時間”。則此問題轉(zhuǎn)變?yōu)椋篐0: H1:假設(shè)兩總體的方差不相同,則應(yīng)從“分析工具”列表中選擇“t檢驗:雙樣本異方差假設(shè)”,回車進(jìn)入該工具對話框,如圖4-3所示。圖4-3“t檢驗:雙樣本異方差假設(shè)”對話框?qū)⒏髯訉υ捒蜻M(jìn)行相應(yīng)設(shè)置后,回車確認(rèn),在指定的區(qū)域?qū)⒔o出計算結(jié)果,如表4-3所示。結(jié)果解釋與分析:(1)自由度

11、df計算公式為: df=表4-3 “t檢驗:雙樣本異方差假設(shè)”結(jié)果(2)t統(tǒng)計量的公式計算為:t=(3)將t統(tǒng)計量與臨界值相比,本例為單尾檢驗2.16>1.72(0.02<0.05),所以拒絕原假設(shè),認(rèn)為新軟件包開發(fā)指定系統(tǒng)的時間要少于舊軟件包。3、基于成對數(shù)據(jù)的t檢驗在使用T檢驗工具的介紹中,上面兩個例子其樣本都是獨立樣本。然而在可能情況下采用相關(guān)樣本,可以進(jìn)一步提高效率。當(dāng)然其檢驗方式也有所不同。每月讀書俱樂部成員進(jìn)行了一項調(diào)查以確信是否其成員用于看電視的時間比讀書時間多(辛辛那提問詢報,1991年11月21日)。假定:從這次調(diào)查對象中抽取了一個小樣本,得到了每周收看電視小時數(shù)

12、和每周讀書小時數(shù)的數(shù)據(jù),數(shù)據(jù)如下表。應(yīng)答者看電視讀書d1106421416-2316884181085151056148671014-481214-2947-310880111651112510-5138351419109151165 *d列為應(yīng)答者看電視與讀書的時間差問:在0.05的顯著性水平下,能否得出每月讀書俱樂部成員每周用于收看電視比用于讀書的時間平均來說要多的結(jié)論?對于成對數(shù)據(jù)的檢驗,“分析工具”列表中也提供了相應(yīng)檢驗工具,選擇“t檢驗:成對二樣本均值分析”,打開其對話框,如圖4-4所示。將各子對話框進(jìn)行相應(yīng)設(shè)置后,回車確認(rèn),在指定的區(qū)域?qū)⒔o出計算結(jié)果,如表4-4所示。圖4-4 “t

13、檢驗:成對二樣本均值分析”對話框結(jié)果解釋與分析:(1)此分析方法的原理實際上是對d列數(shù)據(jù)進(jìn)行t檢驗,問題轉(zhuǎn)化為: H0: H1:(2)df自由度=15-1=14,t Stat為檢驗統(tǒng)計量,其計算公式為: t= 其中,分別為的樣本均值和樣本方差。(3)泊松相關(guān)系數(shù)應(yīng)為“皮爾遜相關(guān)系數(shù)”,反映兩組數(shù)據(jù)線性相關(guān)程度。(4)將t Stat統(tǒng)計量與臨界值相比,本例為單尾檢驗2.23>1.76(0.02<0.05),所以拒絕原假設(shè),認(rèn)為每月讀書俱樂部成員每周用于收看電視比用于讀書的時間平均來說要多。表4-4 “t檢驗:成對二樣本均值分析”結(jié)果(三)F檢驗工具在上例中,假設(shè)兩個總體,即舊軟件包和

14、新軟件包開發(fā)指定系統(tǒng)所需時間的方差不同,接下來,在0.05的顯著性水平下檢驗這一結(jié)論是否正確,需要用到F檢驗工具。從“分析工具”列表中選擇“F檢驗:雙樣本方差”,回車進(jìn)入該工具對話框,如圖4-5所示。圖4-5 “F檢驗:雙樣本方差”對話框?qū)⒏髯訉υ捒蜻M(jìn)行相應(yīng)設(shè)置后,回車確認(rèn),在指定的區(qū)域?qū)⒔o出計算結(jié)果,如表4-5所示。表4-5 “F檢驗:雙樣本方差”結(jié)果結(jié)果解釋與分析:1、“F檢驗工具”的原假設(shè)和備擇假設(shè)分別為: H0: H1:2、因為兩個樣本容量相同,所以F檢驗的第一自由度和第二自由度相同,都為11。3、F統(tǒng)計量的計算公式為: F=4、如果原假設(shè)H0:,則F統(tǒng)計量的計算公式變?yōu)椋?F=,其值

15、為表4-5中F統(tǒng)計量的倒數(shù),當(dāng)然臨界值也要改變。5、將F統(tǒng)計量與臨界值相比,0.83>0.35,所以拒絕原假設(shè),認(rèn)為新軟件包開發(fā)指定系統(tǒng)所需時間的方差不小于舊軟件包。實驗五 方差分析實驗?zāi)康模菏炀毷褂谩胺讲罘治觥惫ぞ咴诩僭O(shè)檢驗的基礎(chǔ)上,對影響均值的各個因素進(jìn)行分析。實驗要求:對房產(chǎn)分析的結(jié)果能夠作出正確合理的解釋,包括對“SUMMAY”部分,方差分析部分從而判斷該因素各水平是否對觀測變量有顯著影響,并作出相應(yīng)的決策。實驗四介紹了假設(shè)檢驗,其中用了較多的篇幅介紹了兩個總體之間均值的顯著性檢驗,實際中還會遇到多個總體均值的檢驗問題。如果按實驗四的方法兩兩進(jìn)行檢驗,將十分麻煩,并且部分總體有差

16、別能否表明有總的差別,仍有待解決。方差分析(Analysis of variance,簡稱ANOVA)能夠解決多個均值是否相等的檢驗問題,其由于在分析時將所有的樣本資料結(jié)合在一起,從而使檢驗的穩(wěn)定性增強,并且可以節(jié)省大量的時間。方差分析作為一種實用、有效的分析方法在實踐中被廣泛的應(yīng)用。本部分主要介紹如何使用Excel中的數(shù)據(jù)分析工具進(jìn)行方差分析。一、單因素方差分析單因素方差分析是在事物變化的若干因素中,只就某一特定因素分析,其它因素盡可能不變。對從事營銷的人員進(jìn)行一項調(diào)查,以研究他們的職業(yè)道德標(biāo)準(zhǔn)觀念。假定下表是從研究中所獲得的數(shù)據(jù)(高分表示道德標(biāo)準(zhǔn)高),如表5-1所示。在0.05的顯著性水平

17、下,檢驗三組人員的觀念是否存在顯著差異。表5-1 研究數(shù)據(jù)將數(shù)據(jù)輸入表單后,在“工具”菜單中選擇“數(shù)據(jù)分析”選項,從其“分析工具”列表中選擇“方差分析:單因素方差分析”,回車進(jìn)入該工具對話框,如圖5-1所示。圖5-1 “方差分析:單因素方差分析”對話框 在“輸入?yún)^(qū)域(I)”框中,輸入數(shù)據(jù)所在的區(qū)域,本例為A1:C7。 “分組方式”按默認(rèn)的列;因有列標(biāo)題,所以選擇“標(biāo)志位于第一行(L)”的復(fù)選框。 要求輸入顯著性水平,本例按默認(rèn)設(shè)置即可。 輸出選項本例選擇“新工作表(P)”(因輸出內(nèi)容比較多)。完成以上設(shè)置后,回車確認(rèn),結(jié)果見表5-2。表5-2 “方差分析:單因素方差分析”輸出結(jié)果結(jié)果解釋與分析

18、:1、SS表示平方和。組間SS(用SSA表示),計算公式為: ;組內(nèi)SS(用SSE表示),計算公式為:2、df為自由度。SSA的自由度為k-1,其中k為因素水平的個數(shù),SSE的自由度為n-k。 3、MS為平均平方。組間MS(用MSA表示),計算公式為:;組內(nèi)MS(用MSE表示),計算公式為:。4、F統(tǒng)計量為:5、將F統(tǒng)計量的值與給定顯著性水平的臨界值相比,本例7>3.68,所以拒絕原假設(shè),認(rèn)為三種營銷人員觀念有差異。也可以將給出的P檢驗值與顯著性水平比較,結(jié)論相同。二、無重復(fù)(無交互作用)雙因素的方差分析雙因素方差分析的內(nèi)容是在影響事物變化的各種因素中選定兩個因素,就其不同水平進(jìn)行交叉的

19、全面檢測,分析究竟是一個因素在起作用,還是兩個因素都起作用,或是兩個因素的影響都不起作用。進(jìn)行雙因素分析時,其各因素的不同水平可以重復(fù)測試(有交互作用),也可以不重復(fù)測試(無交互作用)。本部分介紹無重復(fù)(交互作用)雙因素分析。有四個品牌的彩電在五個地區(qū)銷售,為分析彩電的品牌(因素A)和銷售地區(qū)(因素B)對銷售量是否有影響,對每個品牌在各地區(qū)的銷售量取得以下數(shù)據(jù),見表5-3。表5-3 不同品牌的彩電在各地區(qū)的銷售量數(shù)據(jù)試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響(顯著性水平為0.05)?從“分析工具”列表中選擇“方差分析:無重復(fù)雙因素分析”,回車進(jìn)入該工具對話框,如圖5-2所示。圖5-2 “

20、方差分析:無重復(fù)雙因素分析”對話框在“輸入?yún)^(qū)域(I)”框中輸入數(shù)據(jù)所在的區(qū)域,本例為A2:F6,并選定“標(biāo)志(L)”復(fù)選框。 取默認(rèn)值0.05。 在輸出選項中,選擇“新工作表”。 完成以上設(shè)置后,回車確認(rèn),結(jié)果見表5-4。結(jié)果解釋與分析: 1、行為因素A,列為因素B。各因素和誤差項的(離差)平方和計算公式分別為:;2、三個平方和的自由度(df)分別是:因素A的離差平方和SSA的自由度為 k-1因素B的離差平方和SSB的自由度為 r-1隨機(jī)誤差平方和SSE的自由度為 (k-1)×(r-1) 3、因素A、B以及誤差項的均方(MS),計算公式分別為:;4、因素A和因素B的檢驗統(tǒng)計量(F統(tǒng)計

21、量),計算公式分別為:;5、將各因素檢驗統(tǒng)計量與給定顯著性水平下的臨界值相比(或P值與顯著性水平相比):FA=18.11>3.49(0.00<0.05);FB=2.10<3.26(0.14>0.05)。說明彩電的品牌對銷售量有顯著的影響作用,銷售地區(qū)對彩電的銷售量沒有顯著影響。表5-4 “方差分析:無重復(fù)雙因素分析”結(jié)果三、可重復(fù)(有交互作用)雙因素的方差分析在有些情況下,需要對因素間的交互效應(yīng)做檢驗,這時需要進(jìn)行“可重復(fù)雙因素方差分析”,即每個因素必須重復(fù)取樣至少2次以上。在0.05的顯著性水平,檢驗不同燃料(因素A)、不同推進(jìn)器(因素B)下的火箭射程是否有顯著差異?

22、交互作用是否顯著?實驗數(shù)據(jù)見表5-5。表5-5 實驗數(shù)據(jù)從“分析工具”列表中選擇“方差分析:可重復(fù)雙因素分析”,回車進(jìn)入該工具對話框,如圖5-3所示。 在“輸入?yún)^(qū)域(I)”要求輸入數(shù)據(jù)所在的區(qū)域,本例為“A2:D10”。 “每一樣本的行數(shù)(R)”,即重復(fù)實驗的次數(shù),本例為“2”。 取默認(rèn)值0.05。 在輸出選項中,選擇“新工作表”。完成以上設(shè)置后,回車確認(rèn),結(jié)果見表5-5,5-6。圖5-3“方差分析:可重復(fù)雙因素分析”對話框表5-5 基本統(tǒng)計數(shù)據(jù)SUMMARYB1B2B3總計A1計數(shù)2226求和110.80 97.40 126.10 334.30 平均55.40 48.70 63.05 55.

23、72 方差15.68 112.50 10.13 68.91 A2計數(shù)2226求和91.90 104.60 100.00 296.50 平均45.95 52.30 50.00 49.42 方差19.84 6.48 5.12 14.56 A3計數(shù)2226求和118.40 144.10 79.90 342.40 平均59.20 72.05 39.95 57.07 方差1.62 2.64 1.13 209.89 A4計數(shù)2226求和147.30 109.20 90.10 346.60 平均73.65 54.60 45.05 57.77 方差9.24 25.92 26.65 181.97 表5-6 基本統(tǒng)計數(shù)據(jù)(續(xù)表)總計計數(shù)888求和468.40 455.30 396.10 平均58.55 56.91 49.51 方差120.09 113.42 90.39 表5-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論