應(yīng)用統(tǒng)計學(xué)方差分析_第1頁
應(yīng)用統(tǒng)計學(xué)方差分析_第2頁
應(yīng)用統(tǒng)計學(xué)方差分析_第3頁
應(yīng)用統(tǒng)計學(xué)方差分析_第4頁
應(yīng)用統(tǒng)計學(xué)方差分析_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 方差分析入門 單因素方差分析 均數(shù)兩兩比較的方法 趨勢檢驗(yàn) 單因素方差分析小結(jié)雙因素方差分析協(xié)方差分析 內(nèi)容提要前面提到的有關(guān)統(tǒng)計推斷的方法,如單樣本、兩樣本t檢驗(yàn)等,其所涉及的對象千變?nèi)f化,但歸根結(jié)底都可以視為兩組間的比較,如果是有一組的總體均數(shù)已知,則為單樣本t檢驗(yàn),如果兩組都只有樣本信息,則為兩樣本t檢驗(yàn)。但是如果遇到以下情形,該如何處理?方差分析入門案例 對于大學(xué)新生的入學(xué)成績,可以通過t檢驗(yàn)來考察男女學(xué)生間的入學(xué)成績是否有差異?但要是想知道來自于江蘇、浙江、上海、安徽等省份的學(xué)生,其入學(xué)成績是否有差異,那么是否可以用6次t 檢驗(yàn)來達(dá)成目的?方差分析入門在以上例子中,涉及的問題其實(shí)就

2、是在單一處理因素之下,多個不同水平(多組)之間的連續(xù)性觀察值的比較,目的是通過對多個樣本的研究,來推斷這些樣本是否來自于同一個總體。那么能否使用兩兩t 檢驗(yàn),例如做三組比較,則分別進(jìn)行三次t檢驗(yàn)來解決此問題呢?這樣做在統(tǒng)計上是不妥的。因?yàn)榻y(tǒng)計學(xué)的結(jié)論都是概率性的,存在犯錯誤的可能。方差分析入門 分析:用6次t 檢驗(yàn)來考察4個省份的大學(xué)生新生入學(xué)成績是否相同,對于某一次比較,其犯I類錯誤的概率為,那么連續(xù)進(jìn)行6次比較,其犯I類錯誤的概率是多少呢?不是 6,而是1-(1- )6。也就是說,如果檢驗(yàn)水準(zhǔn)取0.05,那么連續(xù)進(jìn)行6次t 檢驗(yàn),犯I類錯誤的概率將上升為0.2649!這是一個令人震驚的數(shù)字

3、! 結(jié)論:多個均數(shù)比較不宜采用t 檢驗(yàn)作兩兩比較;而應(yīng)該采用方差分析!方差分析入門統(tǒng)計思想:觀測變量的總方差可分解為組間方差和組內(nèi)方差,前者反映控制因素的影響,后者體現(xiàn)隨機(jī)誤差,如果前者顯著大于后者,則可認(rèn)為控制因素對觀測值有影響。分析步驟:明確控制因素和觀測變量剖析觀測變量的離均差平方和:SST=SSA+SSE分解自由度比較組間和組內(nèi)的方差大小,根據(jù)F分布界值做出統(tǒng)計結(jié)論。方差分析入門組別i觀測值j數(shù)學(xué)模型:方差分析入門 R.A.Fisher 提出的方差分析的理論基礎(chǔ): 將總變異分解為由研究因素所造成的部分和由抽樣誤差所造成的部分,通過比較來自于不同部分的變異,借助F分布作出統(tǒng)計推斷。后人又

4、將線性模型的思想引入方差分析,為這一方法提供了近乎無窮的發(fā)展空間。方差分析入門總變異 隨機(jī)變異 處理因素導(dǎo)致的變異總變異 組內(nèi)變異 組間變異SS總 SS組內(nèi) SS組間這樣,我們就可以采用一定的方法來比較組內(nèi)變異和組間變異的大小,如果后者遠(yuǎn)遠(yuǎn)大于前者,則說明處理因素的確存在,如果兩者相差無幾,則說明該影響不存在,以上即方差分析的基本思想。方差分析入門方差分析的原假設(shè)和備擇假設(shè)為:H0:12=kH1:k個總體均數(shù)不同或者不全相同方差分析入門方差分析基本步驟提出假設(shè) H0:a1=a2=ak=0確定顯著性水平構(gòu)造檢驗(yàn)統(tǒng)計量并計算統(tǒng)計結(jié)論與結(jié)果解釋方差分析入門 獨(dú)立性(independence): 觀察

5、對象是所研究因素的各個水平下的獨(dú)立隨機(jī)抽樣 正態(tài)性(normality): 每個水平下的應(yīng)變量應(yīng)當(dāng)服從正態(tài)分布 方差齊性(homoscedascity) 各水平下的總體具有相同的方差。但實(shí)際上,只要最大/最小方差小于3,分析結(jié)果都是穩(wěn)定的應(yīng)用條件有時原始資料不滿足方差分析的要求,除了求助于非參數(shù)檢驗(yàn)方法外,也可以考慮變量變換。常用的變量變換方法有:對數(shù)轉(zhuǎn)換:用于服從對數(shù)正態(tài)分布的資料等;平方根轉(zhuǎn)換:可用于服從Possion分布的資料等;平方根反正弦轉(zhuǎn)換:可用于原始資料為率,且取值廣泛的資料;其它:平方變換、倒數(shù)變換、BoxCox變換等。應(yīng)用條件 例1 在腎缺血再灌注過程的研究中,將36只雄性大

6、鼠隨機(jī)等分成三組,分別為正常對照組、腎缺血60分組和腎缺血60分再灌注組,測得各個體的NO數(shù)據(jù)見數(shù)據(jù)文件no.sav,試問各組的NO平均水平是否相同?單因素方差分析分析:對于單因素方差分析,其資料在SPSS中的數(shù)據(jù)結(jié)構(gòu)應(yīng)當(dāng)由兩列數(shù)據(jù)構(gòu)成,其中一列是觀察指標(biāo)的變量值,另一列是用以表示分組變量。實(shí)際上,幾乎所有的統(tǒng)計分析軟件,包括SAS,STATA等,都要求方差分析采用這種數(shù)據(jù)輸入形式,這一點(diǎn)也暗示了方差分析與線性模型間千絲萬縷的聯(lián)系。單因素方差分析 預(yù)分析(重要):檢驗(yàn)其應(yīng)用條件單因素方差分析選擇data 中的split file,出現(xiàn)如下對話框:單因素方差分析單因素方差分析單因素方差分析 這里

7、僅取其中一組結(jié)果,表明該資料符合分組正態(tài)性的條件。單因素方差分析注意分組檢驗(yàn)正態(tài)性后,要先回到data菜單下的split file ,如下操作取消拆分后才能進(jìn)行后續(xù)的方差分析:單因素方差分析單因素方差分析選入分組變量選入因變量給出各組間樣本均數(shù)的折線圖指定進(jìn)行方差齊性檢驗(yàn)單因素方差分析結(jié)果分析單因素方差分析(1) 方差齊性檢驗(yàn) Levene方法檢驗(yàn)統(tǒng)計量為3.216,其P值為0.053,可認(rèn)為樣本所來自的總體滿足方差齊性的要求。單因素方差分析結(jié)果分析(2) 方差分析表 第1列為變異來源,第2、3、4列分別為離均差平方和、自由度、均方,檢驗(yàn)統(tǒng)計量F值為5.564,P0.008,組間均數(shù)差別統(tǒng)計學(xué)

8、意義,可認(rèn)為各組的NO不同。變異來源組間方差MS離差平方和SS自由度F值P值組內(nèi)單因素方差分析結(jié)果分析(3) 各組樣本均數(shù)折線圖Means plots 選項給出,更直觀。注意:當(dāng)分組變量體現(xiàn)出順序的趨勢時,繪制這種折線圖可以提示我們選擇正確的趨勢分析模型。通過以上分析得到了拒絕H0的結(jié)論,但實(shí)際上單因素方差分析并不這樣簡單。在解決實(shí)際問題時,往往仍需要回答多個均數(shù)間到底是哪些存在差異。雖然結(jié)論提示不同組別個體的NO量不同,但研究者并不知道到底是三者之間均有差別,還是某一組與其他兩組有差別。這就應(yīng)當(dāng)通過兩兩比較(多重比較)進(jìn)行考察。均數(shù)兩兩比較方法直接校正檢驗(yàn)水準(zhǔn)(相對粗糙)專用的兩兩比較方法:

9、計劃好的多重比較(Planned Comparisons)非計劃的多重比較(PostHoc Comparisons)均數(shù)兩兩比較方法Contrasts按鈕Post Hoc按鈕點(diǎn)擊單因素方差分析主對話框中的Post Hoc按鈕,總共有14種兩兩比較的方法,如下:均數(shù)兩兩比較方法LSD法:最靈敏,會犯假陽性錯誤;Sidak法:比LSD法保守;Bonferroni法:比Sidak法更為保守一些;Scheffe法:多用于進(jìn)行比較的兩組間樣本含量不等時;Dunnet法:常用于多個試驗(yàn)組與一個對照組的比較;S-N-K法:尋找同質(zhì)亞組的方法;Turkey法:最遲鈍,要求各組樣本含量相同;Duncan法:與S

10、idak法類似。均數(shù)兩兩比較方法仍以例1為例,LSD法的輸出格式:均數(shù)兩兩比較方法結(jié)果分析仍以例1為例,SNK法的輸出格式:結(jié)果分析均數(shù)兩兩比較方法 該方法的目的是尋找同質(zhì)子集,故各組在表格的縱向上,均數(shù)按大小排序,然后根據(jù)多重比較的結(jié)果將所有的組分為若干個子集,子集間有差別,子集內(nèi)均數(shù)無差別。 當(dāng)各組樣本含量不同,選擇Scheffe法,得結(jié)果:均數(shù)兩兩比較方法結(jié)果分析 假設(shè)在調(diào)查的設(shè)計階段,就計劃好了第二組和第一組,以及第三組和第一組的比較,可以使用主對話框中的contrast 按鈕實(shí)現(xiàn)。 在coefficients后面的框中輸入1,-1,0,每次輸入后點(diǎn)擊add,就可以比較第一組和第二組的

11、NO;再點(diǎn)擊next按鈕,繼續(xù)輸入下一個組合,即0,-1,1。均數(shù)兩兩比較方法均數(shù)兩兩比較方法結(jié)果分析可見,第一個組合無統(tǒng)計學(xué)意義,而第二個組合有顯著性差異。理論上,方差分析所對應(yīng)的分組變量應(yīng)該是一個無序的變量。但實(shí)際上,往往分組變量的取值也可以體現(xiàn)順序的意義,比如,多個時間點(diǎn)上的某項指標(biāo)的比較;不同pH下某些化學(xué)物質(zhì)轉(zhuǎn)化率的比較等。這類資料并不少見。對于這類資料,既然是多組間計量資料的比較,當(dāng)然是優(yōu)先考慮單因素方差分析。但是在得到各組間有差異的結(jié)論之余,也應(yīng)該注意到單純的方差分析并未利用分組變量中蘊(yùn)涵的次序信息。趨勢檢驗(yàn) 例2 要研究高梁的不同播種深度與出苗時間的關(guān)系,數(shù)據(jù)如下表,見tren

12、d.sav:高梁的不同播種深度與出苗時間的關(guān)系趨勢檢驗(yàn)本例經(jīng)方差分析可知各種播種深度下出苗天數(shù)不等或不全相等,而Meansplot 圖進(jìn)一步提示天數(shù)與深度之間的關(guān)系,如下。趨勢檢驗(yàn)自變量間各取值間間隔相等時,除了對此進(jìn)行方差分析之外,還可以利用線性模型的有關(guān)原理對數(shù)據(jù)作進(jìn)一步的分析,以考察應(yīng)變量與處理因素之間是否存在某種依存關(guān)系,統(tǒng)計學(xué)上稱為趨勢檢驗(yàn)。這種趨勢并非僅僅指線性的,也可能是一種多項式關(guān)系。因此,一般通過建立正交多項式模型的方法來進(jìn)行趨勢檢驗(yàn)。趨勢檢驗(yàn)在contrast對話框中,選擇polynomial復(fù)選框,并在degree列表中選擇cubic(三次型)。趨勢檢驗(yàn)可見,播種深度和發(fā)

13、芽天數(shù)之間的關(guān)系的確需要使用高次項關(guān)系來描述。趨勢檢驗(yàn)結(jié)果分析 注意: 趨勢檢驗(yàn)的目的并非擬合線性或非線性模型,而是希望知道當(dāng)因素的水平改變時,均數(shù)以什么樣的形式(線性、二次性或者其他)隨之改變。趨勢檢驗(yàn) 單因素方差分析所針對的是多組均數(shù)間的比較,其基本思想是變異分解,即將總變異分解為組間變異和組內(nèi)變異,再利用F分布做出有關(guān)的統(tǒng)計推斷。 單因素方差分析要求資料滿足正態(tài)性、獨(dú)立性和方差齊性的條件。 方差分析拒絕H0只能說明各組之間存在差異,但不足以說明各組之間的關(guān)系。利用多重比較可以初步判斷各組間的關(guān)系。小 結(jié) 多重比較可以分為事前計劃好的比較和事后比較。前者往往借助于Contrast,而后者有

14、很多不同的方法,這些方法的核心問題是如何控制總的一類錯誤的大小。 在分組變量包含次序信息時,如果方差分析作出了各組間差異有統(tǒng)計學(xué)意義的結(jié)論,并在MeansPlot提示各組均數(shù)的某種趨勢時,可以利用趨勢分析探討觀察值與分組變量取值的數(shù)量依存關(guān)系。小 結(jié)研究內(nèi)容與前提條件單元擬研究:兩個及以上控制因素對觀測變量的影響,包括各因素的獨(dú)立作用和交互作用。是實(shí)驗(yàn)設(shè)計的常用分析方法,常用于尋找最佳的實(shí)驗(yàn)因素組合。前提條件:同單因素方差分析,要求每一單元格的樣本數(shù)據(jù)符合獨(dú)立性、正態(tài)性及方差齊性。但對正態(tài)性和方差齊性的要求不嚴(yán)格。只要無極端值,前提條件稍有偏離是可以耐受的。格無重復(fù)數(shù)據(jù)時,不要求正態(tài)性及方差齊

15、性。雙因素方差分析雙因子方差分析的數(shù)據(jù)結(jié)構(gòu)利用下表資料分析研究不同地區(qū)和不同時間對農(nóng)民家庭人均純收入(元)的影響分析步驟確定觀測變量和若干個控制變量剖析觀測變量的離均差平方和SST控制變量的獨(dú)立作用SSA、SSB控制變量的交互作用SSAB隨機(jī)因素的影響SSESST=SSA+SSB+SSAB+SSE分解自由度比較各部分方差的大小雙因子方差分析數(shù)學(xué)模型設(shè)因素A有r個水平,因素B有s個水平,在每個單元格內(nèi)有l(wèi)個樣本,則在因素A的Ai水平和因素B的Bj水平下的第k個樣本值xijk,可定義為:雙因子(有交互作用)方差分析表相關(guān)概念飽和模型(Full Factorial):即全因素模型,方差分析模型中包含

16、所有因素的獨(dú)立作用和可能的交互作用。不飽和模型:非全因素模型。主效應(yīng):控制變量的獨(dú)立作用。交互效應(yīng):控制變量之間的相互作用,如果一個因素的效應(yīng)大小在另一因素不同水平下明顯不同,則二者存在交互效應(yīng)。交互作用A、B無交互作用A、B有交互作用固定效應(yīng)與隨機(jī)效應(yīng)固定效應(yīng):考察因素的水平數(shù)是可控的,在研究中對該因素的所有可能水平都進(jìn)行了考察,不需要進(jìn)一步外推,如性別。因素的效應(yīng)是固定。隨機(jī)效應(yīng):考察因素難以控制在固定的水平上,或因素的所有可能水平并未都出現(xiàn)在樣本中。因此要用樣本來推論總體情況,包括未出現(xiàn)的水平。這不可避免的存在誤差(即隨機(jī)效應(yīng)),需要估計該誤差的大小,因而其效應(yīng)具有隨機(jī)性。如家庭?;静?/p>

17、驟提出假設(shè) H0:各控制變量不同水平下觀測變量各總體的均值無統(tǒng)計學(xué)差異。確定顯著性水平構(gòu)造模型、并計算檢驗(yàn)統(tǒng)計量固定效應(yīng)模型( Fixed factor )隨機(jī)效應(yīng)模型(Random factor):統(tǒng)計結(jié)論與結(jié)果解釋SPSS多因素方差分析過程(GLM)操作AnalyzeGeneral Linear ModelUnivariate,即單變量一般線性模型飽和模型多因素方差分析的其他選項不飽和模型的建立(Model)均值檢驗(yàn)多重比較檢驗(yàn)(Post Hoc):兩兩比較對比檢驗(yàn)(Contrast):單樣本t檢驗(yàn)的思想,檢驗(yàn)值可指定:觀測變量的均值(Deviation):選擇忽略水平第一水平或最后水平的

18、觀測變量的均值(Simple)該水平前的所有水平的觀測變量的均值(Difference)該水平后的所有水平的觀測變量的均值(Helmert)前一水平的觀測變量的均值(Repeated)多項式比較(Polynomial)主效應(yīng)模型圖形分析(Pro):均值折線圖,可直觀顯示交互作用保存新變量(Save):可計算觀測變量的預(yù)測值;可計算殘差,評價模型擬和優(yōu)度;異常點(diǎn)診斷。Options選項:Estimated Marginal Means: 輸出均數(shù)比較Display:一些常用的指標(biāo)Estimates of effects:計算偏Eta統(tǒng)計量Observed power:觀測檢驗(yàn)效能Parameter estimates:參數(shù)估計Homogeneity:方差齊性檢驗(yàn)Residual plot:繪制實(shí)測值、預(yù)測值與殘差的兩兩散點(diǎn)圖Lack of fit::失擬檢驗(yàn),檢驗(yàn)?zāi)P蛿M和優(yōu)度,零假設(shè)如被拒絕,則說明模型不能刻劃

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論