版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多重均值比較與方差分析前提假設(shè)的檢驗(yàn)2023/4/51第1頁(yè),共41頁(yè),2023年,2月20日,星期四失業(yè)保險(xiǎn)案例:為什么要進(jìn)行方差分析?
為了減小失業(yè)保險(xiǎn)支出、促進(jìn)就業(yè),政府試圖為失業(yè)者提供再就業(yè)獎(jiǎng)勵(lì):如果失業(yè)者可以在限定的時(shí)間內(nèi)重新就業(yè),他將可以獲得一定數(shù)額的獎(jiǎng)金。政策會(huì)有效嗎?第2頁(yè),共41頁(yè),2023年,2月20日,星期四試驗(yàn)數(shù)據(jù)不同獎(jiǎng)金水平失業(yè)者的再就業(yè)時(shí)間(天)
無(wú)獎(jiǎng)金低獎(jiǎng)金中獎(jiǎng)金高獎(jiǎng)金92869678100108927585939076888877878989797390757183947882828072756878798172第3頁(yè),共41頁(yè),2023年,2月20日,星期四要研究的問(wèn)題總體1,μ1(獎(jiǎng)金=1)總體2,μ2
(獎(jiǎng)金=2)總體3,μ3(獎(jiǎng)金=3)樣本1樣本2樣本3樣本4總體4,μ4(獎(jiǎng)金=4)第4頁(yè),共41頁(yè),2023年,2月20日,星期四各個(gè)總體的均值相等嗎?Xf(X)1
2
3
4
Xf(X)3
1
2
4
第5頁(yè),共41頁(yè),2023年,2月20日,星期四失業(yè)保險(xiǎn)案例:實(shí)驗(yàn)結(jié)果……1=無(wú)獎(jiǎng)金2=低獎(jiǎng)金3=中獎(jiǎng)金4=高獎(jiǎng)金。根據(jù)實(shí)驗(yàn)結(jié)果,可以認(rèn)為各總體的平均失業(yè)時(shí)間相同嗎?第6頁(yè),共41頁(yè),2023年,2月20日,星期四研究方法:兩樣本的t檢驗(yàn)?如果采用t檢驗(yàn)法對(duì)多個(gè)總體均值進(jìn)行差異顯著性檢驗(yàn),會(huì)出現(xiàn)如下問(wèn)題:全部檢驗(yàn)過(guò)程煩瑣,做法不經(jīng)濟(jì)無(wú)統(tǒng)一的總體方差估計(jì),檢驗(yàn)的精度降低犯第一類錯(cuò)誤的概率增大,檢驗(yàn)的可靠性降低第7頁(yè),共41頁(yè),2023年,2月20日,星期四思考7歲兒童的平均身高為102,現(xiàn)測(cè)得某班12名7歲兒童身高分別為:97、99、103、100、104、97、105、110、99、98、103、99請(qǐng)問(wèn)該班兒童身高與平均水平是否存在差異?第8頁(yè),共41頁(yè),2023年,2月20日,星期四方差分析可以用來(lái)比較多個(gè)均值方差分析(Analysisofvariance,ANOVA)的主要目的是通過(guò)對(duì)方差的比較來(lái)同時(shí)檢驗(yàn)多個(gè)均值之間差異的顯著性??梢钥醋鱰檢驗(yàn)的擴(kuò)展,只比較兩個(gè)均值時(shí)與t檢驗(yàn)等價(jià)。20世紀(jì)20年代由英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)喧(R.A.Fisher)最早提出的,開始應(yīng)用于生物和農(nóng)業(yè)田間試驗(yàn),以后在許多學(xué)科中得到了廣泛應(yīng)用。第9頁(yè),共41頁(yè),2023年,2月20日,星期四ANOVA(analysisofvariance)由于方差分析法是通過(guò)比較有關(guān)方差的大小而得到結(jié)論的,所以在統(tǒng)計(jì)中,常常把運(yùn)用方差分析法的活動(dòng)稱為方差分析。方差分析的內(nèi)容很廣泛,既涉及到實(shí)驗(yàn)設(shè)計(jì)的模式,又關(guān)乎數(shù)據(jù)分析模型中因素效應(yīng)的性質(zhì)。本章在完全隨機(jī)試驗(yàn)設(shè)計(jì)下,討論固定效應(yīng)模型方差分析的基本原理與方法,重點(diǎn)介紹單因素方差分析。第10頁(yè),共41頁(yè),2023年,2月20日,星期四方差分析中的基本假設(shè)(1)在各個(gè)總體中因變量都服從正態(tài)分布;(2)在各個(gè)總體中因變量的方差都相等;(3)各個(gè)觀測(cè)值之間是相互獨(dú)立的。第11頁(yè),共41頁(yè),2023年,2月20日,星期四同一試驗(yàn)條件下的數(shù)據(jù)變異-----隨機(jī)因素影響不同試驗(yàn)條件下,試驗(yàn)數(shù)據(jù)變異-----隨機(jī)因素和可能存在的系統(tǒng)性因素即試驗(yàn)因素共同影響試驗(yàn)數(shù)據(jù)變異原因(誤差來(lái)源)分析第12頁(yè),共41頁(yè),2023年,2月20日,星期四實(shí)驗(yàn)數(shù)據(jù)誤差類型隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一獎(jiǎng)金水平下不同不同人的失業(yè)時(shí)間是不同的這種差異可以看成是隨機(jī)因素影響的結(jié)果,稱為隨機(jī)誤差
系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同獎(jiǎng)金水平之間的失業(yè)時(shí)間之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于獎(jiǎng)金本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差第13頁(yè),共41頁(yè),2023年,2月20日,星期四方差分析的實(shí)質(zhì)與分析目的方差分析的實(shí)質(zhì):觀測(cè)值變異原因的數(shù)量分析。方差分析的目的:系統(tǒng)中是否存在顯著性影響因素第14頁(yè),共41頁(yè),2023年,2月20日,星期四
單因素方差分析模型(1)單因素方差分析:模型中有一個(gè)自變量(因素)和一個(gè)因變量。在失業(yè)保險(xiǎn)實(shí)驗(yàn)中,假設(shè)張三在高獎(jiǎng)金組,則
張三的失業(yè)時(shí)間
=高獎(jiǎng)金組的平均失業(yè)時(shí)間+隨機(jī)因素帶來(lái)的影響
=總平均失業(yè)時(shí)間
+高獎(jiǎng)金組平均值與總平均值之差
+隨機(jī)因素帶來(lái)的影響
第15頁(yè),共41頁(yè),2023年,2月20日,星期四
單因素方差分析模型(2)第16頁(yè),共41頁(yè),2023年,2月20日,星期四總變差(離差平方和)的分解數(shù)據(jù)的誤差用離差平方和(sumofsquares)描述。組內(nèi)離差平方和(withingroups)因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的變異比如,同一獎(jiǎng)金水平下失業(yè)時(shí)間的差異組內(nèi)離差平方和只包含隨機(jī)誤差組間離差平方和(betweengroups)因素的不同水平(不同總體)下各樣本之間的變異比如,四個(gè)獎(jiǎng)金水平之間失業(yè)時(shí)間的差異組間離差平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差第17頁(yè),共41頁(yè),2023年,2月20日,星期四總變差(離差平方和)分解的圖示組間變異總變異組內(nèi)變異第18頁(yè),共41頁(yè),2023年,2月20日,星期四SST=SSA+SSE
總變差因素A及隨機(jī)因素導(dǎo)致的變差隨機(jī)因素導(dǎo)致的變差組間離差平方和組內(nèi)離差平方和第19頁(yè),共41頁(yè),2023年,2月20日,星期四離差平方和的自由度與均方三個(gè)平方和的自由度分別是SST的自由度為nk-1,nk為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平的個(gè)數(shù)SSE的自由度為nk-k各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差。均方的計(jì)算方法是用離差平方和除以相應(yīng)的自由度。第20頁(yè),共41頁(yè),2023年,2月20日,星期四組間離差平方和組內(nèi)離差平方和組間方差組內(nèi)方差受因素A和隨機(jī)
因素的影響只受隨機(jī)
因素的影響第21頁(yè),共41頁(yè),2023年,2月20日,星期四F比值如果因素A的不同水平對(duì)結(jié)果沒有影響,那么在組間方差中只包含有隨機(jī)誤差,兩個(gè)方差的比值會(huì)接近1如果不同水平對(duì)結(jié)果有影響,組間方差就會(huì)大于組內(nèi)方差,組間方差與組內(nèi)方差的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在顯著差異,或者說(shuō)因素A對(duì)結(jié)果有顯著影響。組間方差組內(nèi)方差F=第22頁(yè),共41頁(yè),2023年,2月20日,星期四F比的分布F分布曲線第23頁(yè),共41頁(yè),2023年,2月20日,星期四F分布與拒絕域如果均值相等,F(xiàn)=MSA/MSE1a
F分布顯著水平下的臨界點(diǎn)F(k-1,nk-k)0拒絕H0不能拒絕H0F第24頁(yè),共41頁(yè),2023年,2月20日,星期四
方差分析的基本思想將k個(gè)水平(處理)的觀測(cè)值作為一個(gè)整體看待,利用方差的可分解性,把觀測(cè)值總變異的離差平方和及自由度分解為相應(yīng)于不同變異來(lái)源的離差平方和及自由度,進(jìn)而獲得不同變異來(lái)源總體方差估計(jì)值;通過(guò)計(jì)算這些總體方差估計(jì)值的適當(dāng)比值,即F比值,并以此比值的大小來(lái)判斷各樣本所屬總體平均數(shù)是否相等。目的是檢查所討論因素是否作為系統(tǒng)性因素來(lái)影響試驗(yàn)結(jié)果。第25頁(yè),共41頁(yè),2023年,2月20日,星期四思考題有三臺(tái)機(jī)器生產(chǎn)規(guī)格相同的鋁合金薄板,為檢驗(yàn)三臺(tái)機(jī)器生產(chǎn)薄板的厚度是否相同,隨
機(jī)從每臺(tái)機(jī)器生產(chǎn)的薄板中各抽取了5個(gè)樣品,測(cè)得結(jié)果如下:
機(jī)器1:0.236,0.238,0.248,0.245,0.243
機(jī)器2:0.257,0.253,0.255,0.254,0.261
機(jī)器3:0.258,0.264,0.259,0.267,0.262
問(wèn):三臺(tái)機(jī)器生產(chǎn)薄板的厚度是否有顯著差異?第26頁(yè),共41頁(yè),2023年,2月20日,星期四思考:有無(wú)差異?某化肥生產(chǎn)商需要檢驗(yàn)三種新產(chǎn)品的效果,在同一地區(qū)選取3塊同樣大小的農(nóng)田進(jìn)行試驗(yàn),甲農(nóng)田中使用甲化肥,在乙農(nóng)田使用乙化肥,在丙地使用丙化肥,得到6次試驗(yàn)的結(jié)果如表2所示,試在0.05的顯著性水平下分析甲乙丙化肥的肥效是否存在差異?、甲
50
46
49
52
48
48
、乙
49
50
47
47
46
49
、丙
515049465050第27頁(yè),共41頁(yè),2023年,2月20日,星期四方差分析檢驗(yàn)的步驟1.檢驗(yàn)數(shù)據(jù)是否符合方差分析的假設(shè)條件。2.提出零假設(shè)和備擇假設(shè):零假設(shè):各總體的均值之間沒有顯著差異,即
備擇假設(shè):至少有兩個(gè)均值不相等,即第28頁(yè),共41頁(yè),2023年,2月20日,星期四方差分析的步驟3.根據(jù)樣本計(jì)算F統(tǒng)計(jì)量的值。方差分析表變差來(lái)源離差平方和SS自由度df均方MSF值組間SSAk-1MSAMSA/MSE組內(nèi)SSEnk-kMSE總變異SSTnk-1第29頁(yè),共41頁(yè),2023年,2月20日,星期四方差分析的步驟4.確定決策規(guī)則并根據(jù)實(shí)際值與臨界值的
比較,或者p-值與α的比較得出檢驗(yàn)結(jié)論。
在零假設(shè)成立時(shí)組間方差與組內(nèi)方差的比值服從服從自由度為(k-1,nk-k)的F分布
臨界值拒絕域p-值α實(shí)際值
F檢驗(yàn)的臨界值和拒絕域
第30頁(yè),共41頁(yè),2023年,2月20日,星期四失業(yè)保險(xiǎn)的例子(1)在失業(yè)保險(xiǎn)實(shí)驗(yàn)中,設(shè)顯著性水平α=0.05,試分析獎(jiǎng)金水平對(duì)失業(yè)時(shí)間的影響是否顯著。不同獎(jiǎng)金水平失業(yè)者的再就業(yè)時(shí)間(天)
無(wú)獎(jiǎng)金低獎(jiǎng)金中獎(jiǎng)金高獎(jiǎng)金92869678100108927585939076888877878989797390757183947882828072756878798172第31頁(yè),共41頁(yè),2023年,2月20日,星期四失業(yè)保險(xiǎn)的例子(2)1、根據(jù)前面的分析,數(shù)據(jù)符合方差分析的假設(shè)條件。2、提出零假設(shè)和備擇假設(shè):H0:μ1=μ2=μ3=μ4,H1:μ1、μ2、μ3、μ4不全相等。第32頁(yè),共41頁(yè),2023年,2月20日,星期四失業(yè)保險(xiǎn)的例子(3)3、計(jì)算F統(tǒng)計(jì)量的實(shí)際值。
手工計(jì)算可以按照方差分析表的內(nèi)容逐步計(jì)算。由于計(jì)算量大,實(shí)際應(yīng)用中一般要借助于統(tǒng)計(jì)軟件。下面是Excel計(jì)算的方差分析表。變差來(lái)源SS自由度MSFp-值F臨界值組間624.973208.323.040.04332.90組內(nèi)2195.333268.60總變差2820.3135
第33頁(yè),共41頁(yè),2023年,2月20日,星期四失業(yè)保險(xiǎn)的例子(4)4、樣本的F值為3.04。由于
因此我們應(yīng)拒絕零假設(shè),從而得出獎(jiǎng)金水平對(duì)再就業(yè)時(shí)間有顯著影響的結(jié)論。類似的,由于,可以得出同樣的結(jié)論。2.90.04330.053.04第34頁(yè),共41頁(yè),2023年,2月20日,星期四例2熱帶雨林(1)各水平下的樣本容量不同時(shí)單因素方差分析的方法也完全適用,只是公式的形式稍有不同,在使用軟件進(jìn)行分析時(shí)幾乎看不出這種差別。
一份研究伐木業(yè)對(duì)熱帶雨林影響的統(tǒng)計(jì)研究報(bào)告指出,“環(huán)保主義者對(duì)于林木采伐、開墾和焚燒導(dǎo)致的熱帶雨林的破壞幾近絕望”。這項(xiàng)研究比較了類似地塊上樹木的數(shù)量,這些地塊有的從未采伐過(guò),有的1年前采伐過(guò),有的8年前采伐過(guò)。根據(jù)數(shù)據(jù),采伐對(duì)樹木數(shù)量有顯著影響嗎?顯著性水平α=0.05。
第35頁(yè),共41頁(yè),2023年,2月20日,星期四例2熱帶雨林(2)1、正態(tài)性檢驗(yàn):直方圖從未采伐過(guò)1年前采伐過(guò)8年前采伐過(guò)271218221242915222191519201833181916172220141224141227228171919第36頁(yè),共41頁(yè),2023年,2月20日,星期四例2熱帶雨林(3)同方差性檢驗(yàn):最大值與最小值之比等于33.19/4.81=1.34,明顯小于4,因此可以認(rèn)為是等方差的。
組計(jì)數(shù)求和平均方差從未采伐過(guò)1228523.7525.661年前采伐過(guò)1216914.0824.818年前采伐過(guò)914215.7833.19第37頁(yè),共41頁(yè),2023年,2月20日,星期四例2熱帶雨林(4)2、提出零假設(shè)和備擇假設(shè)零假設(shè):雨林采伐對(duì)林木數(shù)量沒有顯著影響(各組均值相等);備擇假設(shè):雨林采伐對(duì)是有顯著影響(各組均值不全相等)。第38頁(yè),共41頁(yè),2023年,2月20日,星期四例2熱帶雨林(5)3、方差分析表4、結(jié)論。F值=11.43>3.32,p-值=0.0002<0.05,因此檢驗(yàn)的結(jié)論是采伐對(duì)林木數(shù)量有顯著影響。變差源SSdfMSFP-valueFcrit組間625.162312.5811.430.00023.32組內(nèi)820.723027.36總計(jì)1445.8832
第39頁(yè),共41頁(yè),2023年,2月2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年沈陽(yáng)北軟信息職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 2025年無(wú)錫南洋職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 2025年曲阜遠(yuǎn)東職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 專題05 名句名篇默寫(第1期)
- 專題05 青春時(shí)光(第1期)
- 全新承包公寓合同下載
- 幼兒園指紋教育活動(dòng)策劃方案五篇
- 總經(jīng)理聘用合同的范文
- 金融合同保險(xiǎn)業(yè)務(wù)居間合約
- 生活垃圾清運(yùn)服務(wù)合同年
- 【人教版化學(xué)】必修1 知識(shí)點(diǎn)默寫小紙條(答案背誦版)
- 江蘇省無(wú)錫市2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 全國(guó)第三屆職業(yè)技能大賽(無(wú)人機(jī)駕駛(植保)項(xiàng)目)選拔賽理論考試題庫(kù)(含答案)
- 《奧特萊斯業(yè)態(tài)淺析》課件
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 小學(xué)語(yǔ)文中段整本書閱讀的指導(dǎo)策略研究 中期報(bào)告
- 浙教版2023-2024學(xué)年數(shù)學(xué)八年級(jí)上冊(cè)期末復(fù)習(xí)卷(含答案)
- 運(yùn)動(dòng)訓(xùn)練與康復(fù)治療培訓(xùn)資料
- 小班繪本教學(xué)《藏在哪里了》課件
- 老師呀請(qǐng)你別生氣教學(xué)反思
評(píng)論
0/150
提交評(píng)論