多重均值比較和方差分析前提假設檢驗_第1頁
多重均值比較和方差分析前提假設檢驗_第2頁
多重均值比較和方差分析前提假設檢驗_第3頁
多重均值比較和方差分析前提假設檢驗_第4頁
多重均值比較和方差分析前提假設檢驗_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于多重均值比較與方差分析前提假設的檢驗25.07.20221第一張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20222失業(yè)保險案例:為什么要進行方差分析? 為了減小失業(yè)保險支出、促進就業(yè),政府試圖為失業(yè)者提供再就業(yè)獎勵:如果失業(yè)者可以在限定的時間內重新就業(yè),他將可以獲得一定數額的獎金。政策會有效嗎? 第二張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20223試驗數據不同獎金水平失業(yè)者的再就業(yè)時間(天) 無獎金低獎金中獎金高獎金92869678100108927585939076888877878989797390757183947882828072756878798172

2、第三張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20224要研究的問題總體1,1(獎金=1)總體2,2 (獎金=2)總體3,3(獎金=3)樣本1樣本2樣本3樣本4總體4,4(獎金=4)第四張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20225各個總體的均值相等嗎?Xf(X)1 2 3 4 Xf(X)3 1 2 4 第五張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20226失業(yè)保險案例:實驗結果1=無獎金 2=低獎金 3=中獎金 4=高獎金。根據實驗結果,可以認為各總體的平均失業(yè)時間相同嗎?第六張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20227研究方法

3、:兩樣本的t檢驗?如果采用t檢驗法對多個總體均值進行差異顯著性檢驗 ,會出現如下問題:全部檢驗過程煩瑣,做法不經濟 無統一的總體方差估計 ,檢驗的精度降低犯第一類錯誤的概率增大,檢驗的可靠性降低 第七張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20228思考7歲兒童的平均身高為102,現測得某班12名7歲兒童身高分別為:97、99、103、100、104、97、105、110、99、98、103、99請問該班兒童身高與平均水平是否存在差異?第八張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.20229方差分析可以用來比較多個均值方差分析(Analysis of variance

4、,ANOVA)的主要目的是通過對方差的比較來同時檢驗多個均值之間差異的顯著性??梢钥醋鱰檢驗的擴展,只比較兩個均值時與t檢驗等價。20世紀20年代由英國統計學家費喧(R. A. Fisher)最早提出的,開始應用于生物和農業(yè)田間試驗,以后在許多學科中得到了廣泛應用。第九張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202210ANOVA (analysis of variance)由于方差分析法是通過比較有關方差的大小而得到結論的,所以在統計中,常常把運用方差分析法的活動稱為方差分析。方差分析的內容很廣泛,既涉及到實驗設計的模式,又關乎數據分析模型中因素效應的性質。本章在完全隨機試驗設

5、計下,討論固定效應模型方差分析的基本原理與方法,重點介紹單因素方差分析。 第十張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202211方差分析中的基本假設(1)在各個總體中因變量都服從正態(tài)分布;(2)在各個總體中因變量的方差都相等;(3)各個觀測值之間是相互獨立的。第十一張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202212同一試驗條件下的數據變異-隨機因素影響不同試驗條件下,試驗數據變異-隨機因素和可能存在的系統性因素即試驗因素共同影響試驗數據變異原因(誤差來源)分析第十二張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202213實驗數據誤差類型隨機誤差因素的同

6、一水平(總體)下,樣本各觀察值之間的差異比如,同一獎金水平下不同不同人的失業(yè)時間是不同的這種差異可以看成是隨機因素影響的結果,稱為隨機誤差 系統誤差因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同獎金水平之間的失業(yè)時間之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于獎金本身所造成的,后者所形成的誤差是由系統性因素造成的,稱為系統誤差第十三張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202214方差分析的實質與分析目的方差分析的實質:觀測值變異原因的數量分析。方差分析的目的:系統中是否存在顯著性影響因素第十四張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.

7、202215 單因素方差分析模型(1)單因素方差分析: 模型中有一個自變量(因素)和一個因變量。在失業(yè)保險實驗中,假設張三在高獎金組,則張三的失業(yè)時間=高獎金組的平均失業(yè)時間 + 隨機因素帶來的影響=總平均失業(yè)時間 +高獎金組平均值與總平均值之差 + 隨機因素帶來的影響第十五張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202216 單因素方差分析模型(2)第十六張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202217總變差(離差平方和)的分解數據的誤差用離差平方和(sum of squares)描述。組內離差平方和(within groups)因素的同一水平(同一個總體)下

8、樣本數據的變異比如,同一獎金水平下失業(yè)時間的差異組內離差平方和只包含隨機誤差組間離差平方和(between groups)因素的不同水平(不同總體)下各樣本之間的變異比如,四個獎金水平之間失業(yè)時間的差異組間離差平方和既包括隨機誤差,也包括系統誤差第十七張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202218總變差(離差平方和)分解的圖示組間變異總變異組內變異第十八張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202219SSTSSASSE 總變差因素A及隨機因素導致的變差隨機因素導致的變差組間離差平方和組內離差平方和第十九張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.

9、202220離差平方和的自由度與均方三個平方和的自由度分別是SST 的自由度為nk-1,nk為全部觀察值的個數SSA的自由度為k-1,其中k為因素水平的個數SSE 的自由度為nk-k各離差平方和的大小與觀察值的多少有關,為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差。均方的計算方法是用離差平方和除以相應的自由度。第二十張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202221組間離差平方和組內離差平方和組間方差組內方差受因素A和隨機因素的影響只受隨機因素的影響第二十一張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202222F比值如果因素A的不同

10、水平對結果沒有影響,那么在組間方差中只包含有隨機誤差,兩個方差的比值會接近1如果不同水平對結果有影響,組間方差就會大于組內方差,組間方差與組內方差的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在顯著差異,或者說因素A對結果有顯著影響。組間方差組內方差F =第二十二張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202223F比的分布F 分布曲線第二十三張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202224F分布與拒絕域如果均值相等,F=MSA/MSE1a F 分布顯著水平下的臨界點F(k-1,nk-k)0拒絕H0不能拒絕H0F第二十四張,PPT共四十四頁,創(chuàng)

11、作于2022年6月25.07.202225方差分析的基本思想將k個水平(處理)的觀測值作為一個整體看待,利用方差的可分解性,把觀測值總變異的離差平方和及自由度分解為相應于不同變異來源的離差平方和及自由度,進而獲得不同變異來源總體方差估計值;通過計算這些總體方差估計值的適當比值,即F比值,并以此比值的大小來判斷各樣本所屬總體平均數是否相等。目的是檢查所討論因素是否作為系統性因素來影響試驗結果。第二十五張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202226思考題 有三臺機器生產規(guī)格相同的鋁合金薄板,為檢驗三臺機器生產薄板的厚度是否相同,隨機從每臺機器生產的薄板中各抽取了5個樣品,測得結

12、果如下:機器1:0.236,0.238,0.248,0.245,0.243機器2:0.257,0.253,0.255,0.254,0.261機器3:0.258,0.264,0.259,0.267,0.262問:三臺機器生產薄板的厚度是否有顯著差異?第二十六張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202227思考:有無差異?某化肥生產商需要檢驗三種新產品的效果,在同一地區(qū)選取3塊同樣大小的農田進行試驗,甲農田中使用甲化肥,在乙農田使用乙化肥,在丙地使用丙化肥,得到6次試驗的結果如表2所示,試在0.05的顯著性水平下分析甲乙丙化肥的肥效是否存在差異?、甲504649524848、乙4

13、95047474649、丙51 50 49 46 50 50第二十七張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202228方差分析檢驗的步驟1.檢驗數據是否符合方差分析的假設條件。2.提出零假設和備擇假設:零假設:各總體的均值之間沒有顯著差異,即備擇假設:至少有兩個均值不相等,即第二十八張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202229方差分析的步驟3.根據樣本計算F統計量的值。方差分析表變差來源離差平方和SS自由度df均方MSF值組 間SSAk-1MSAMSA/MSE組 內SSEnk-kMSE總變異SSTnk-1第二十九張,PPT共四十四頁,創(chuàng)作于2022年6月2

14、5.07.202230方差分析的步驟4.確定決策規(guī)則并根據實際值與臨界值的比較,或者p-值與的比較得出檢驗結論。 在零假設成立時組間方差與組內方差的比值服從服從自由度為(k-1, nk-k) 的 F 分布 臨界值拒絕域p-值實際值 F檢驗的臨界值和拒絕域 第三十張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202231失業(yè)保險的例子(1)在失業(yè)保險實驗中,設顯著性水平=0.05,試分析獎金水平對失業(yè)時間的影響是否顯著 。不同獎金水平失業(yè)者的再就業(yè)時間(天) 無獎金低獎金中獎金高獎金92869678100108927585939076888877878989797390757183947

15、882828072756878798172第三十一張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202232失業(yè)保險的例子(2)1、根據前面的分析,數據符合方差分析的假設條件。2、提出零假設和備擇假設:H0:1234,H1:1、2、3、4 不全相等。 第三十二張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202233失業(yè)保險的例子(3)3、計算F統計量的實際值。手工計算可以按照方差分析表的內容逐步計算。由于計算量大,實際應用中一般要借助于統計軟件。下面是Excel計算的方差分析表。變差來源SS自由度MSFp-值F臨界值組間624.973208.323.040.04332.90組

16、內2195.333268.60總變差2820.3135第三十三張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202234失業(yè)保險的例子(4)4、樣本的F值為3.04。由于因此我們應拒絕零假設,從而得出獎金水平對再就業(yè)時間有顯著影響的結論。類似的,由于 ,可以得出同樣的結論。2.90.04330.053.04第三十四張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202235例2 熱帶雨林 (1)各水平下的樣本容量不同時單因素方差分析的方法也完全適用,只是公式的形式稍有不同,在使用軟件進行分析時幾乎看不出這種差別。 一份研究伐木業(yè)對熱帶雨林影響的統計研究報告指出,“環(huán)保主義者對于林

17、木采伐、開墾和焚燒導致的熱帶雨林的破壞幾近絕望”。這項研究比較了類似地塊上樹木的數量,這些地塊有的從未采伐過,有的1年前采伐過,有的8年前采伐過。根據數據,采伐對樹木數量有顯著影響嗎?顯著性水平=0.05。 第三十五張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202236例2 熱帶雨林 (2)1、正態(tài)性檢驗:直方圖 從未采伐過1年前采伐過8年前采伐過271218221242915222191519201833181916172220141224141227228171919第三十六張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202237例2 熱帶雨林 (3)同方差性檢驗:最

18、大值與最小值之比等于33.19 / 4.81=1.34,明顯小于4,因此可以認為是等方差的。 組計數求和平均方差從未采伐過1228523.75 25.66 1年前采伐過1216914.08 24.81 8年前采伐過914215.78 33.19 第三十七張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202238例2 熱帶雨林 (4)2、提出零假設和備擇假設零假設:雨林采伐對林木數量沒有顯著影響(各組均值相等);備擇假設:雨林采伐對是有顯著影響(各組均值不全相等)。第三十八張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202239例2 熱帶雨林 (5)3、方差分析表4、結論。F值

19、=11.433.32,p-值=0.00020.05,因此檢驗的結論是采伐對林木數量有顯著影響。 變差源SSdfMSFP-valueF crit組間625.162312.5811.430.00023.32組內820.723027.36總計1445.8832第三十九張,PPT共四十四頁,創(chuàng)作于2022年6月25.07.202240思考:是否意味著每兩個處理平均數間的差異都顯著或極顯著 ?例:測定東北、內蒙古、河北、安徽、貴州5個地區(qū)黃鼬冬季針毛的長度,每個地區(qū)隨機抽取4個樣本,測定的結果如表,試比較各地區(qū)黃鼬針毛長度差異顯著性。地區(qū)東北內蒙古河北安徽貴州合計132.029.225.223.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7和126.4109.6104.199.091.4530.5平均31.6027.4026.0324.7522.8526.53第四十張,PPT共四十四頁,創(chuàng)作于2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論