第6章群體間的差異比較方差分析_第1頁
第6章群體間的差異比較方差分析_第2頁
第6章群體間的差異比較方差分析_第3頁
第6章群體間的差異比較方差分析_第4頁
第6章群體間的差異比較方差分析_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第6章6.1方差分析概述6.2一元方差分析6.3二因素方差分析6.4 協(xié)方差分析3數(shù)據(jù)文件“社團.sav”是對高校學(xué)生參加社團活動的興趣調(diào)查。調(diào)查對象分四個年級:大一新生、其他高年級本科生、碩士生和博士生。用每周參加社團活動的時間來度量對社團活動感興趣的程度。u經(jīng)驗表明,隨著年級的上升,對社團活動的興趣減弱。因此需要比較這4個年級每周參加社團活動的時間均值是否有差別。u首先進(jìn)行描述性統(tǒng)計:均數(shù)比較并用箱圖呈現(xiàn)。u方法一:Explore過程u方法二:Compare MeansMeans過程 Legacy DialogsBoxplotReport參與社團活動的時間年級MeanNStd. Devia

2、tion本科新生23.38402.328其他高年級本科生21.49352.639碩士研究生5.24412.364博士研究生4.09442.321Total13.011609.278先使用Means過程比較組間的均數(shù)用箱圖呈現(xiàn)不同年級的組間差異u要比較組間的均數(shù),一種方法是通過獨立樣本的 T 檢驗進(jìn)行兩兩比較,這樣需要進(jìn)行C426次兩兩比較,即要進(jìn)行6次獨立樣本的 T 檢驗。u 在 T 檢驗中,是通過顯著性(Sig.值)來判斷原假設(shè)是否成立,顯著性0.05代表在5%的錯誤水平下拒絕或接受原假設(shè)。u 進(jìn)行6次 T 檢驗會得到6個Sig.值,綜合得到的Sig.值為10.956 0.265 ,大于預(yù)設(shè)

3、的顯著性水平0.05。u因此,對于多個分組的比較, T 檢驗不再適用。u假設(shè)4個年級的學(xué)生分別來自4個不同的總體,各組的方差都相等,數(shù)據(jù)服從正態(tài)分布,各組的樣本都是獨立的隨機樣本。即4組總體的是相同的分布。u通過均值的組間比較得知,按年級劃分的4組參加社團活動的均值是不同的。u要回答的問題是:均值的差別是不是由抽樣因素造成的?還是因為不同的組在總體上就有不相等的均值?u通過方差分析,能夠把樣本的方差分解為源于分組因素的部分和源于抽樣波動的部分;如果源于分組的方差遠(yuǎn)遠(yuǎn)大于源于抽樣波動的方差,則有理由認(rèn)為各組的均值是顯著不全相等。也就是說,這些子總體并不是來自同一個有相同均值和方差的大總體,至少有

4、一個子總體來自不同均值的其他總體。u元:指定距的因變量。用方差分析的方法來檢驗各組中的因變量均值是不是相等;u因素:用來進(jìn)行分組的變量叫“因素”,如變量“grade”就是因素,通常用因素解釋因變量的方差;u水平:因素的取值稱為“水平”,如“grade”有4種取值,也就是有4種“水平”;u組內(nèi)方差:代表本組內(nèi)各樣本取值相對于組內(nèi)平均值的分布離散程度,它代表了總方差中不能用分組因素解釋的部分;u組間方差:代表各組平均值相對于總平均值的分布離散程度,它代表了總方差中可以用分組因素解釋的部分。例:需要比較三個班的英語成績是否有差異。從每個班中隨機地抽取5個學(xué)生,他們的英語成績?nèi)缦卤硪?從一個班中隨機抽

5、取三個學(xué)生,每次抽得的學(xué)生成績是不同的,見表二.表一:三個班的樣本英語成績表二:同一個班中抽取的三個樣本英語成績抽樣波動引起抽樣波動引起的均值的均值差異差異(組內(nèi)方差(組內(nèi)方差)抽樣波動引起的,還抽樣波動引起的,還是總體間存在顯著差是總體間存在顯著差異呢?(異呢?(組間方差)組間方差)182X 384X 280X 181X 282X 383X 2222211(828084)82311()8282(8082)(8482)413xXXcSXXcc代表組數(shù)282,1xXS1、計算組間的變差:對表一可求得組間方差:對第二組同樣可求組間方差22211222()()()(1)ccpXXXXXXSc n12

6、23pS22113pS22225 4=302/35 1=1.3611/3xpxpnSFSnSFS第一組:第二組:計算得3、計算F比值2、計算組內(nèi)的變差:對表一、表二可求得組內(nèi)方差:u若F 值顯著大于1,則說明均值間的差異不能用抽樣誤差來解釋,各組間存在顯著差異。u若F 值接近1,則說明各組間差異不明顯,均值的差異主要是由抽樣誤差來造成的。u 方差分析是一種假設(shè)檢驗,運用方差分析時,對參與分析的變量所來自的總體有要求和假設(shè)。u數(shù)據(jù)要求n一個因變量(定距變量)一個因變量(定距變量)n一個或多個自變量(分類變量)一個或多個自變量(分類變量)u基本假設(shè):n獨立隨機性:每個總體中的樣本都必須是獨立隨機抽

7、樣的獨立隨機性:每個總體中的樣本都必須是獨立隨機抽樣的n各總體要求正態(tài)分布:各組樣本來自正態(tài)總體各總體要求正態(tài)分布:各組樣本來自正態(tài)總體n因變量等方差:各組樣本中因變量方差在總體水平上相等。因變量等方差:各組樣本中因變量方差在總體水平上相等。u方差分析中,n原假設(shè):被檢驗的每一個總體的均值都是相等的;原假設(shè):被檢驗的每一個總體的均值都是相等的;n備擇假設(shè):這些總體中至少有一個總體的均值與其他總體備擇假設(shè):這些總體中至少有一個總體的均值與其他總體的均值有差異。的均值有差異。0121:,nijHYYYHYY ij=u在這樣的原假設(shè)下進(jìn)行方差分析:n組內(nèi)方差的大小不依賴原假設(shè)的成立與否,不會受到樣本

8、組內(nèi)方差的大小不依賴原假設(shè)的成立與否,不會受到樣本均值的影響,是一個相對均值的影響,是一個相對“穩(wěn)定穩(wěn)定”的值;的值;n組間方差的估計只有在原假設(shè)成立的情況下才正確,否則組間方差的估計只有在原假設(shè)成立的情況下才正確,否則組間方差會非常大。組間方差會非常大。u結(jié)論n根據(jù)組內(nèi)方差可以看出同一個組內(nèi)不同案例值的差異程度;根據(jù)組內(nèi)方差可以看出同一個組內(nèi)不同案例值的差異程度;n根據(jù)組間方差可以觀察不同組別之間的差異程度。根據(jù)組間方差可以觀察不同組別之間的差異程度。n如果組間方差遠(yuǎn)遠(yuǎn)大于組內(nèi)方差,就可以拒絕各總體均值如果組間方差遠(yuǎn)遠(yuǎn)大于組內(nèi)方差,就可以拒絕各總體均值之間沒有差別這一原假設(shè)。之間沒有差別這一

9、原假設(shè)。u構(gòu)造F統(tǒng)計量,F(xiàn)統(tǒng)計量服從已知的F分布。n如果各組均值相等的原假設(shè)成立,那么組間方差主要由隨機如果各組均值相等的原假設(shè)成立,那么組間方差主要由隨機誤差造成,即組間方差的值應(yīng)接近組內(nèi)方差,也就是誤差造成,即組間方差的值應(yīng)接近組內(nèi)方差,也就是F值不值不會太大,且接近于會太大,且接近于1;n如果自變量對因變量造成了顯著影響,那么自變量的各因素如果自變量對因變量造成了顯著影響,那么自變量的各因素對組間均方差的影響必然遠(yuǎn)大于隨機誤差,對組間均方差的影響必然遠(yuǎn)大于隨機誤差,F(xiàn)值顯著大于值顯著大于1。u給出顯著性水平,與檢驗統(tǒng)計量F的概率P值相比較。n如果如果P值小于值小于,則應(yīng)拒絕零假設(shè),認(rèn)為自

10、變量的不同水平下,則應(yīng)拒絕零假設(shè),認(rèn)為自變量的不同水平下,因變量的總體均值存在顯著差異;因變量的總體均值存在顯著差異;n如果如果P值大于值大于,則不能拒絕零假設(shè),認(rèn)為自變量的不同水平,則不能拒絕零假設(shè),認(rèn)為自變量的不同水平下,因變量的總體均值之間無顯著差異。下,因變量的總體均值之間無顯著差異。u根據(jù)數(shù)據(jù)“社團.sav”推斷不同年級的學(xué)生參加社團活動的興趣是否存在差異。uAnalyzeCompare MeansOne-way ANOVA因變量因變量自變量自變量趨勢檢驗趨勢檢驗多重比較檢驗多重比較檢驗等方差性假設(shè)成立等方差性假設(shè)成立等方差性假設(shè)不成立等方差性假設(shè)不成立常用的兩種多重比常用的兩種多重

11、比較方法較方法輸出結(jié)果選項輸出結(jié)果選項方差齊性檢驗方差齊性檢驗均值圖均值圖用于各組方差不等用于各組方差不等時的統(tǒng)計指標(biāo)時的統(tǒng)計指標(biāo)u第一步:描述性統(tǒng)計結(jié)果:表格或箱圖u第二步:總體的方差齊性檢驗。n當(dāng)樣本總量較大,樣本中案例個數(shù)比較接近時,方差分析當(dāng)樣本總量較大,樣本中案例個數(shù)比較接近時,方差分析對總體正態(tài)分布和等方差性的要求不是很高;對總體正態(tài)分布和等方差性的要求不是很高;n當(dāng)樣本容量不大,樣本中案例個數(shù)差異較大時,方差分析當(dāng)樣本容量不大,樣本中案例個數(shù)差異較大時,方差分析要求正態(tài)總體和等方差性。要求正態(tài)總體和等方差性。方差齊性檢驗的方差齊性檢驗的原假設(shè):各組方原假設(shè):各組方差相等。差相等。

12、因此,因此,P值大于值大于0.05,方差齊性,方差齊性檢驗通過。檢驗通過。u第三步:總體的正態(tài)性檢驗:直方圖或Q-Q圖。n可以對數(shù)據(jù)進(jìn)行拆分,作直方圖觀察各組的正態(tài)性。可以對數(shù)據(jù)進(jìn)行拆分,作直方圖觀察各組的正態(tài)性。n也可以用也可以用Explore過程輸出過程輸出Q-Q圖或圖或KS檢驗結(jié)果判斷。檢驗結(jié)果判斷。三個組的正態(tài)性檢驗沒有通過。但只要樣本量足夠三個組的正態(tài)性檢驗沒有通過。但只要樣本量足夠大,非正態(tài)性不影響方差分析的結(jié)果。大,非正態(tài)性不影響方差分析的結(jié)果。u第四步:方差分析結(jié)果 F值遠(yuǎn)大于1,說明組間方差遠(yuǎn)大于組內(nèi)方差,由于分組造成的差異遠(yuǎn)超過抽樣誤差。 P值遠(yuǎn)小于0.05,因此可以拒絕原

13、假設(shè),而接受備擇假設(shè)。 因此認(rèn)為本科新生、高年級本科生、碩士研究生、博士研究生這4個總體的均值是有顯著差異的。u第五步:進(jìn)一步分析多重比較u當(dāng)方差分析的結(jié)果顯著,說明4組中至少有一組與其他組不同,但卻無法判斷到底是哪一組或哪些組之間結(jié)果不同,u此時需要進(jìn)一步運用多重比較來具體考察各組之間的差別。 多重比較的結(jié)果發(fā)現(xiàn):除碩士和博士外,其他組別兩兩之間差異顯著。26u 在上例中,我們只考慮了自變量“年級”對因變量“參加社團活動的時間”的影響,如果我們分兩個因素“性別”和“年級”考慮對“參加社團活動的時間”的影響,此時的分析用單因素方差分析便無法完成。u二因素方差分析是研究當(dāng)自變量有兩個時,檢驗各組

14、的均值是否全等。u1、檢驗假設(shè)n當(dāng)同時考慮年級和性別兩個因素時,要檢驗的假設(shè)變?yōu)楫?dāng)同時考慮年級和性別兩個因素時,要檢驗的假設(shè)變?yōu)?個,其中最后一個是兩個因素的交互作用是否顯著:個,其中最后一個是兩個因素的交互作用是否顯著:n不同年級的學(xué)生平均每周參加社團活動的時間是否全等;不同年級的學(xué)生平均每周參加社團活動的時間是否全等;n男女生平均每周參加社團活動的時間是否全等;男女生平均每周參加社團活動的時間是否全等;n用年級和性別進(jìn)行交互分析后,各組均值是否全等。用年級和性別進(jìn)行交互分析后,各組均值是否全等。u2、數(shù)據(jù)要求n要求各組的數(shù)據(jù)都來自正態(tài)分布總體中的隨機樣本,并且要求各組的數(shù)據(jù)都來自正態(tài)分布總

15、體中的隨機樣本,并且各組方差恒定。各組方差恒定。u3、主效應(yīng)與交互效應(yīng)n在方差分析中,主效應(yīng)指每個因素單獨對因變量的影響。在方差分析中,主效應(yīng)指每個因素單獨對因變量的影響。此例中,年級和性別兩個因素構(gòu)成了兩個主效應(yīng);此例中,年級和性別兩個因素構(gòu)成了兩個主效應(yīng);n交互效應(yīng)指第三個因素(年級和性別交互形成)對因變量交互效應(yīng)指第三個因素(年級和性別交互形成)對因變量的影響。的影響。參加社團活動的平參加社團活動的平均時間年級因素均時間年級因素的影響性別因素的影響性別因素的影響的影響沒有交互效應(yīng)的情況有交互效應(yīng)的情況平均年薪起點性平均年薪起點性別因素的影響工別因素的影響工作單位性質(zhì)的影響作單位性質(zhì)的影響

16、性別和工作單位性別和工作單位性質(zhì)的交互效應(yīng)性質(zhì)的交互效應(yīng)u4、檢驗原理n二因素方差分析也是通過比較組間與組內(nèi)方差來說明各個二因素方差分析也是通過比較組間與組內(nèi)方差來說明各個自變量的作用是否顯著。自變量的作用是否顯著。n二因素方差分析中的組內(nèi)方差之和是兩個自變量交互形成二因素方差分析中的組內(nèi)方差之和是兩個自變量交互形成的各個組內(nèi)的方差的總和。例如性別和年級的交互中,組的各個組內(nèi)的方差的總和。例如性別和年級的交互中,組內(nèi)方差之和要考慮內(nèi)方差之和要考慮248個組內(nèi)內(nèi)部各組均值差異的和。個組內(nèi)內(nèi)部各組均值差異的和。u針對數(shù)據(jù)“社團.sav”,分析年級和性別對參加社團活動時間的影響。nAnalyzeGe

17、neral Linear ModelUnivariatenModel選項卡選項卡選入年級、性別以選入年級、性別以及交互效應(yīng)的三個及交互效應(yīng)的三個變量。如果交互效變量。如果交互效應(yīng)不顯著,則回到應(yīng)不顯著,則回到此選項卡去掉交互此選項卡去掉交互效應(yīng)。效應(yīng)。nProfile Plots選項卡選項卡:輸出均值圖輸出均值圖單擊單擊Add將輸出考將輸出考慮交互效應(yīng)的均值慮交互效應(yīng)的均值圖。圖。nOptions選項卡選項卡輸出描述性統(tǒng)計量輸出描述性統(tǒng)計量方差齊性檢驗方差齊性檢驗方差齊性檢驗通過。方差齊性檢驗通過。(原假設(shè)是各組方(原假設(shè)是各組方差相等)差相等)主效應(yīng)顯著主效應(yīng)顯著 交互效應(yīng)不交互效應(yīng)不顯著顯

18、著 n當(dāng)交互效應(yīng)不顯著時,需要重新指定當(dāng)交互效應(yīng)不顯著時,需要重新指定model選項卡中的變選項卡中的變量,將交互效應(yīng)去掉。量,將交互效應(yīng)去掉。u由于主效應(yīng)顯著,可以做事后比較:Post Hoc事后比較的自變量事后比較的自變量水平應(yīng)大于三個。水平應(yīng)大于三個。交互效應(yīng)并入誤差交互效應(yīng)并入誤差項項LSD法進(jìn)行事后比法進(jìn)行事后比較的結(jié)果。較的結(jié)果。u1、針對數(shù)據(jù)“手機購買.sav”n分析不同年級的同學(xué)手機購買動機有無差別?分析不同年級的同學(xué)手機購買動機有無差別?n如果同時考慮性別因素呢?如果同時考慮性別因素呢?u2、數(shù)據(jù)“工資水平.save”統(tǒng)計了不同性別和單位性質(zhì)的薪資起點。n試分別分析不同單位性質(zhì)和性別的員工之間薪資是否有所試分別分析不同單位性質(zhì)和性別的員工之間薪資是否有所不同。不同。n試分析不同單位性質(zhì)和性別兩因素共同作用下的員工試分析不同單位性質(zhì)和性別兩因素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論