統(tǒng)計(jì)學(xué)第六章方差分析_第1頁(yè)
統(tǒng)計(jì)學(xué)第六章方差分析_第2頁(yè)
統(tǒng)計(jì)學(xué)第六章方差分析_第3頁(yè)
統(tǒng)計(jì)學(xué)第六章方差分析_第4頁(yè)
統(tǒng)計(jì)學(xué)第六章方差分析_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)第六章方差分析第一頁(yè),共四十二頁(yè),編輯于2023年,星期三第一節(jié)方差分析的基本概念一、目的:AnalysisofvarianceANOVA用于檢驗(yàn)兩個(gè)或兩個(gè)以上樣本均數(shù)間差別有無(wú)統(tǒng)計(jì)意義二、樣本均數(shù)間差別的原因(變異的來(lái)源):1、總變異:全部試驗(yàn)數(shù)據(jù)大小不等。用觀察值與總均數(shù)的離均差平方和sumofsquaresofdeviationsfrommean表示,記為SS總,或l總;總的自由度總=N-1第二頁(yè),共四十二頁(yè),編輯于2023年,星期三

2、組間變異:各處理組的樣本均數(shù)大小不一,用各組均數(shù)與總均數(shù)的離均差平方和表示,記為SS組間或l組間,組間自由度

組間=k-1。MS組間=l組間/組間組間變異反映的是處理因素的作用,同時(shí)也包括隨機(jī)誤差均方:meansquare,MS第三頁(yè),共四十二頁(yè),編輯于2023年,星期三3、組內(nèi)變異:各處理組內(nèi)部觀察值大小不等,用各處理組內(nèi)部每個(gè)觀察值與組均數(shù)的離均差平方各表示,記為l組內(nèi)。組內(nèi)=(n1-1)+…+(nk-1)=N-kMS組內(nèi)=l組內(nèi)/組內(nèi)組內(nèi)變異反映的觀察值的隨機(jī)誤差,如個(gè)體差異和隨機(jī)測(cè)量誤差第四頁(yè),共四十二頁(yè),編輯于2023年,星期三4、三種變異的關(guān)系l總=l組間+l組內(nèi)總=N-1=(k-1)+(N-k)=組間+組內(nèi)第五頁(yè),共四十二頁(yè),編輯于2023年,星期三三、方差分析的基本思想:總變異可分解為組間變異和組內(nèi)變異兩個(gè)部分,相應(yīng)的總自由度也分解為組間自由度和組內(nèi)自由度。如果各樣本均數(shù)來(lái)自同一總體,即各組之間無(wú)差別,則組間變異和組內(nèi)變異均只反映隨機(jī)誤差,這時(shí)若計(jì)算組間均方與組內(nèi)均方的比值,F(xiàn)=MS組間/MS組內(nèi),應(yīng)接近1。反之,若各樣本均數(shù)不是來(lái)自同一總體,組間變異較大,F(xiàn)值將明顯大于1。要大到多大程度才有統(tǒng)計(jì)學(xué)意義?第六頁(yè),共四十二頁(yè),編輯于2023年,星期三這個(gè)程度就是與隨機(jī)誤差而言。即以隨機(jī)誤差進(jìn)行衡量,若處理組間的變異明顯大于組內(nèi)變異,則不能認(rèn)為組間的變異僅反映隨機(jī)誤差,也就是說(shuō)處理因素有作用。R.A.Fisher于20世紀(jì)20年代推導(dǎo)出在無(wú)效假設(shè)成立的情況下,統(tǒng)計(jì)量F的分布規(guī)律。1934年G.W.Snedecor以Fisher的名字命名了這一分布,稱F分布,故ANOVA又稱F檢驗(yàn)。F(組間,組內(nèi))查表第七頁(yè),共四十二頁(yè),編輯于2023年,星期三基本思想:根據(jù)資料變異的不同來(lái)源,將全部觀察值總的離均差平方和和自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余每個(gè)部分的變異可由某個(gè)因素的作用(或某幾個(gè)因素的交互作用)加以解釋,如各組均數(shù)間的變異SS組間,可由處理因素的作用加以解釋,通過(guò)比較不同變異來(lái)源的均方,用F分布作出統(tǒng)計(jì)推斷,從而了解該因素對(duì)觀察指標(biāo)有無(wú)影響。第八頁(yè),共四十二頁(yè),編輯于2023年,星期三注意:1、ANOVA與試驗(yàn)設(shè)計(jì)類(lèi)型聯(lián)系在一起,并非任何變異都有適當(dāng)?shù)姆纸狻?、數(shù)據(jù)要求:①各次觀察獨(dú)立,即任何兩個(gè)觀察值間均不相關(guān);②每一水平下的觀察值xij分別服從總體均數(shù)為

ij的正態(tài)分布;③各總體的方差相等,即方差齊性homogeneityofvariance.(任何觀察值都是獨(dú)立地來(lái)自具有等方差的正態(tài)總體)第九頁(yè),共四十二頁(yè),編輯于2023年,星期三第二節(jié)完全隨機(jī)設(shè)計(jì)的單因素ANOVA(one-wayANOVA)按完全隨機(jī)化的原則將受試對(duì)象隨機(jī)分配到一個(gè)研究因素的多個(gè)水平中去,然后觀察試驗(yàn)效應(yīng)。目的:比較不同水平下,各組均值間的差別是否具有統(tǒng)計(jì)學(xué)意義第十頁(yè),共四十二頁(yè),編輯于2023年,星期三基本步驟:P59,例6-1為例1、建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn):Ho:4種衣料吸附硼氫量的總體均數(shù)相等,即

1=

2=

3=

4H1:4種衣料吸附硼氫量的總體均數(shù)不全相等=0.052、計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值:如下表第十一頁(yè),共四十二頁(yè),編輯于2023年,星期三成組設(shè)計(jì)方差分析計(jì)算表第十二頁(yè),共四十二頁(yè),編輯于2023年,星期三以P59表6-1實(shí)例進(jìn)行計(jì)算:先計(jì)算基本數(shù)據(jù)結(jié)果,再代入上表的公式計(jì)算:C、SS、MS、F等一般將計(jì)算結(jié)果列為表6-2的形式,見(jiàn)P613、確定P值和作出統(tǒng)計(jì)推斷結(jié)論按計(jì)算所得F值:11.1644,查附表6-2,表中1指分子均方的自由度,2為分母均方的自由度。F=11.164>F0.01(3,16)=5.29,故P<0.01。認(rèn)為四組均數(shù)間差別有高度統(tǒng)計(jì)學(xué)意義第十三頁(yè),共四十二頁(yè),編輯于2023年,星期三各組樣本含量相等和各組樣本含量不等時(shí),計(jì)算的基本方法完全一樣,只是在計(jì)算l組間時(shí)有所不同,相等時(shí)將ni直接用n計(jì)算即可。舉例:P61,例6-2第十四頁(yè),共四十二頁(yè),編輯于2023年,星期三第三節(jié)隨機(jī)區(qū)組設(shè)計(jì)的ANOVA

Two-wayANOVA一、概念:1、隨機(jī)區(qū)組設(shè)計(jì)randomizedblockdesign,亦稱配伍組設(shè)計(jì):應(yīng)用分層的思想,事先將受試對(duì)象按某種或某些特征分為若干個(gè)區(qū)組block,使每個(gè)區(qū)組內(nèi)的觀察對(duì)象的特征盡可能的相近。每個(gè)區(qū)組內(nèi)的觀察對(duì)象數(shù)與研究因素的水平數(shù)相等,分別使每個(gè)區(qū)組內(nèi)的觀察對(duì)象隨機(jī)地接受研究因素某一水平的處理。第十五頁(yè),共四十二頁(yè),編輯于2023年,星期三2、此外,同一受試對(duì)象不同時(shí)間點(diǎn)上的觀察,或同一樣本給予不同處理的比較,亦當(dāng)作隨機(jī)區(qū)組設(shè)計(jì)進(jìn)行分析。3、由于區(qū)組內(nèi)個(gè)體特征比較一致,減少了個(gè)體間變異對(duì)結(jié)果的影響,統(tǒng)計(jì)效率高,易檢出組間的差別。4、用兩因素方差分析two-wayANOVA,兩因素指研究因素和區(qū)組因素。研究因素有k個(gè)水平,共n個(gè)區(qū)組。5、當(dāng)k=2時(shí),兩因素方差分析等價(jià)于配對(duì)t檢驗(yàn),且F=t2第十六頁(yè),共四十二頁(yè),編輯于2023年,星期三二、隨機(jī)區(qū)組設(shè)計(jì)方差分析中變異的分解:總變異分解為:處理組間變異、誤差、區(qū)組間變異(新增的,用ss區(qū)組l區(qū)組表示,大小為各區(qū)組均數(shù)與總均數(shù)的離均差平方和)。ss總=ss處理+ss區(qū)組+ss誤差自由度分解:總=處理+區(qū)組+誤差N-1=(k-1)+(n-1)+(k-1)(n-1).k為處理組數(shù),n為區(qū)組數(shù),N為總例數(shù)第十七頁(yè),共四十二頁(yè),編輯于2023年,星期三三、分析計(jì)算步驟:例6-3,P631、建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)H0:放置不同時(shí)間的血糖濃度相等,即

1=

2=

3=

4H1:放置不同時(shí)間的血糖濃度不全相等=0.052、計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值,根據(jù)下表計(jì)算公式計(jì)算第十八頁(yè),共四十二頁(yè),編輯于2023年,星期三隨機(jī)區(qū)組方差分析計(jì)算公式第十九頁(yè),共四十二頁(yè),編輯于2023年,星期三3、確定P值和作出推斷結(jié)論放置時(shí)間的F值=0.9681/0.0125=77.44受試者間的F值=0.3569/0.0125=28.55查附表6-2,1(處理)=3,

2(誤差)=21,F(xiàn)0.05(3,21)=3.07,F0.01=4.87;當(dāng)

1(區(qū)組)=7,

2(誤差)=21,F(xiàn)0.05(7,21)=2.49,F0.05=3.64F均>F0.01,P<0.01,說(shuō)時(shí)放置時(shí)間長(zhǎng)短對(duì)血糖濃度的變化是有影響的。另外,不同受試者間血糖濃度亦有差別。第二十頁(yè),共四十二頁(yè),編輯于2023年,星期三第四節(jié)均數(shù)間的相互比較一、幾點(diǎn)說(shuō)明1、ANOVA并不能回答哪幾個(gè)均數(shù)間差別有統(tǒng)計(jì)學(xué)意義,需進(jìn)一步做兩兩間的多重比較multiplecomparison2、兩兩比較,不可用t檢驗(yàn),因?yàn)闀?huì)增加第一類(lèi)錯(cuò)誤的概率。k個(gè)樣本均數(shù)可做k!/[2!(k-2)!]次比較,如:5個(gè)樣本→10次,不犯第一類(lèi)錯(cuò)誤的概率為(1-0.05)10=0.5987,〔正確接受全部10次無(wú)效假設(shè)的概率〕,一類(lèi)錯(cuò)誤概率為1-0.5987=0.4013第二十一頁(yè),共四十二頁(yè),編輯于2023年,星期三二、常用的多重比較的方法1、LSD-t檢驗(yàn):稱最小有意義差別(leastsignificantdifference)t檢驗(yàn),檢驗(yàn)k組某一對(duì)或某幾對(duì)在專業(yè)上有特殊意義的均數(shù)dAB=XA-XB的總體水平是否為0。第二十二頁(yè),共四十二頁(yè),編輯于2023年,星期三算得的t值以誤差自由來(lái)查t值表與前述t檢驗(yàn)的的不同:舉例說(shuō)明計(jì)算過(guò)程:t0.001(16)=4.015第二十三頁(yè),共四十二頁(yè),編輯于2023年,星期三LSDt檢驗(yàn)對(duì)比組A與B兩均數(shù)之差兩均數(shù)之差標(biāo)準(zhǔn)誤LSD

t值t臨界值P值棉與府棉與的棉與尼府與尼府與的的與尼第二十四頁(yè),共四十二頁(yè),編輯于2023年,星期三2、Dunnett-t檢驗(yàn)用于k-1個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)差別的多重比較:P66,例6-5第二十五頁(yè),共四十二頁(yè),編輯于2023年,星期三Dunnett檢驗(yàn)對(duì)比組A與B兩均數(shù)之差兩均數(shù)之差標(biāo)準(zhǔn)誤t值處理數(shù)Tt臨界值0.05t臨界值0.01P值棉與府棉與的棉與尼第二十六頁(yè),共四十二頁(yè),編輯于2023年,星期三3、Student-Newman-Keuls法SNK法,檢驗(yàn)統(tǒng)計(jì)量為q,通常稱q檢驗(yàn)用于多個(gè)樣本均數(shù)間的兩兩比較第二十七頁(yè),共四十二頁(yè),編輯于2023年,星期三SNKq檢驗(yàn)對(duì)比組A與B兩均數(shù)之差兩均數(shù)之差標(biāo)準(zhǔn)誤q值處理數(shù)Tq臨界值0.05q臨界值0.01P值棉與府棉與的棉與尼府與尼府與的的與尼第二十八頁(yè),共四十二頁(yè),編輯于2023年,星期三比較時(shí)應(yīng)將均數(shù)按大小順序排列,一般先比較相關(guān)最大的兩個(gè)均數(shù)q的分布與兩比較組間跨度a及自由度有關(guān)。組間跨度a(對(duì)比組內(nèi)包含組數(shù)a)是指XA與XB之間涵蓋的均數(shù)個(gè)數(shù),包括XA與XB自身在內(nèi)MS誤差為誤差均方或組內(nèi)均方依q值、組間跨度a(處理數(shù)Ti)、誤差自由度及檢驗(yàn)水準(zhǔn)查q值表,q≥qα(a,ν)時(shí),有統(tǒng)計(jì)學(xué)意義(P553,附表6-4)第二十九頁(yè),共四十二頁(yè),編輯于2023年,星期三兩兩比較方法選用1、在研究設(shè)計(jì)階段未預(yù)先考慮或預(yù)料到,經(jīng)假設(shè)檢驗(yàn)得出多個(gè)總體均數(shù)不全相等的提示后,才決定的多個(gè)均數(shù)的兩兩事后比較(posthoccomparisons/unplannedcomparisons),常用于探索性研究exploratoryresearch,兩兩比較用:SNK法、Bonfferonit檢驗(yàn)、Sidakt檢驗(yàn)第三十頁(yè),共四十二頁(yè),編輯于2023年,星期三2、在設(shè)計(jì)階段就根據(jù)研究目的或?qū)I(yè)知識(shí)而計(jì)劃好的某些均數(shù)間的兩兩比較(plannedcontrasts/comparisons)或稱事前beforehand比較,常用于事先有明確假設(shè)的證實(shí)性研究confirmatoryresearch,如多個(gè)處理組與對(duì)照組的比較、某一對(duì)或某幾對(duì)在專業(yè)上有特殊意義的均數(shù)間的比較,用Dunnett-t檢驗(yàn)、LSD-t檢驗(yàn),也可用Bonfferonit檢驗(yàn)(該方法最保守)或Sidakt檢驗(yàn)第三十一頁(yè),共四十二頁(yè),編輯于2023年,星期三第五節(jié)拉丁方設(shè)計(jì)資料的

方差分析*一、拉丁方設(shè)計(jì)latinsquaredesign:設(shè)計(jì)因素(標(biāo)志)兩個(gè)以上,各因素的水平數(shù)相同,可用此設(shè)計(jì)。拉丁方是以拉丁字母排列的方陣的簡(jiǎn)稱。二、分析步驟:,例6-6,P681、求C2、求l總3、求l受試者第三十二頁(yè),共四十二頁(yè),編輯于2023年,星期三4、求l日期5、求l防護(hù)服6、求l誤差7、自由度:總格子數(shù)減1為總變異自由度,防護(hù)服間、受試者間、試驗(yàn)日期間均為n-1=5-1=4;誤差自由度=總自由度-防護(hù)服間-受試者間-試驗(yàn)日期間=24-4-4-4=128、列拉丁方分析表,見(jiàn)P70,表6-169、查表,判斷結(jié)果第三十三頁(yè),共四十二頁(yè),編輯于2023年,星期三優(yōu)點(diǎn):可以從較少的實(shí)驗(yàn)數(shù)據(jù)獲得較多的信息,比隨機(jī)區(qū)組設(shè)計(jì)來(lái)得優(yōu)越。(控制受試者間個(gè)體的差異,及實(shí)驗(yàn)日期間的差異)缺點(diǎn):各因素間有交互作用時(shí),不適用。實(shí)施時(shí),要求各因素的水平數(shù)相等,實(shí)際中不易辦到。拉丁方可由統(tǒng)計(jì)書(shū)中查到,亦可自己編寫(xiě)。第三十四頁(yè),共四十二頁(yè),編輯于2023年,星期三第七節(jié)方差齊性檢驗(yàn)檢驗(yàn)多個(gè)樣本的方差齊性用Bartlett法一、各組樣本含量相等時(shí):P71,例6-7卡方值略大于某一臨界值時(shí),應(yīng)計(jì)算校正卡方值,公式見(jiàn)P72第三十五頁(yè),共四十二頁(yè),編輯于2023年,星期三二、各樣本含量不等時(shí):P72,例6-8Bartlett法在各樣本含量相等時(shí)是不敏感的。所以各組樣本含量相差不大,各組S2相差不過(guò)大,可不必進(jìn)行Bartlett檢驗(yàn)。第三十六頁(yè),共四十二頁(yè),編輯于2023年,星期三第七節(jié)近似F檢驗(yàn)方差不齊時(shí):采用以下兩方法1、對(duì)原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換2、用加權(quán)的方法計(jì)算加權(quán)的方差進(jìn)行F檢驗(yàn),即近似F檢驗(yàn)(F’檢驗(yàn)或pseudoFtest),具體計(jì)算方法,參見(jiàn)P73~74第三十七頁(yè),共四十二頁(yè),編輯于2023年,星期三第八節(jié)變量變換ANOVA的要求:任何觀察值都獨(dú)自地來(lái)自具有等方差正態(tài)總體。不能滿足時(shí),可導(dǎo)致F值偏大,從而有增加第一類(lèi)錯(cuò)誤的危險(xiǎn),尤其違反獨(dú)立性假設(shè)時(shí),影響較為嚴(yán)重。明顯偏離可進(jìn)行變量變換。樣本例數(shù)較多時(shí),對(duì)總體的正態(tài)性并不苛求;每組樣本例數(shù)相等時(shí),對(duì)方差齊性亦不苛求,故最好采用例數(shù)相等的平衡設(shè)計(jì)方案。第三十八頁(yè),共四十二頁(yè),編輯于2023年,星期三一、變量變換:是將原始數(shù)據(jù)作某種函數(shù)轉(zhuǎn)換,可使各組達(dá)到方差齊性,亦可使資料轉(zhuǎn)換成正態(tài)分布,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論