版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第7章方差分析7.1實驗設計簡介7.2方差分析基本思想7.3單因素方差分析7.4兩因素方差分析7.1實驗設計簡介幾個常用術語試驗指標(experimentalindicator)
為衡量試驗結果的好壞或處理效應的高低,在試驗中具體測定的性狀或觀測的項目稱為試驗指標血糖含量、體高、體重等幾個常用術語(續(xù))實驗因素(experimentalfactor)實驗中所研究的影響實驗指標的因素叫試驗因素當實驗中考察的因素只有一個時,稱為單因素實驗;若同時研究兩個或兩個以上的因素對實驗指標的影響時,則稱為兩因素或多因素實驗。實驗因素常用大寫字母A、B、C、…等表示。幾個常用術語(續(xù))因素水平(leveloffactor)試驗因素所處的某種特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平幾個常用術語(續(xù))實驗處理(treatment)事先設計好的實施在試驗單位上的具體項目叫實驗處理,簡稱處理進行單因素實驗時,實驗因素的一個水平就是一個處理在多因素實驗時,實驗因素的一個水平組合就是一個處理幾個常用術語(續(xù))實驗單位(experimentalunit)在實驗中能接受不同實驗處理的獨立的實驗載體叫實驗單位在實驗中,將一個處理實施在兩個或兩個以上的實驗單位上,稱為處理有重復;一處理實施的實驗單位數(shù)稱為處理的重復數(shù)幾個術語(續(xù))因素水平與處理因素水平為某因子(自變量)之特殊形式或不同狀態(tài),例如我們可以將「施肥」細分成三個水平:完全不施肥、施輕肥、施重肥如果解釋的因素為單一(施肥與否),稱為單因子分析,如果解釋因子在兩個以上(施肥與否+栽種溫度),稱為多因子分析。在單因素分析中,每一個因素水平皆稱為一種處理(treatment),多因子分析中,因子水平之組合稱為一種處理(施重肥+高溫、無施肥+高溫、施重肥+低溫、無施肥+低溫…等幾個術語自變量與因變量我們經(jīng)常設計研究來了解造成某種現(xiàn)象變化的原因例如:我們想要了解為什么有時候種植西瓜會甜有時候不會甜(甜度變動)這種我們欲了解的變量稱為因變量(dependentvariable)、被解釋變量、或反應變量(responsevariable)。我們懷疑西瓜的甜度與栽種過程中是否施肥有關,將某些西瓜種籽加以施肥處理,其它西瓜保持自然生長,這種造成依變量產(chǎn)生變化的變量稱之為因子(factor)或獨立變項、自變量(independentvariable)。實驗設計概念廣義理解是指實驗研究課題設計,也就是整個實驗計劃的擬定狹義的理解是指實驗單位的選取、重復數(shù)目的確定及實驗單位的分組實驗設計的目的是避免系統(tǒng)誤差,控制、降低實驗誤差,無偏估計處理效應,從而對樣本所在總體作出可靠、正確的推斷實驗設計(續(xù))實驗設計三原則重復重復是指試驗中同一處理實施在兩個或兩個以上的試驗單位上隨機化隨機化是指在對實驗對象進行分組時必須使用隨機的方法,使對象進入各實驗組的機會相等,以避免試驗對象分組時實驗人員主觀傾向的影響雙盲實驗設計(續(xù))局部控制─實驗條件的局部一致性在實驗環(huán)境或?qū)嶒瀱挝徊町惔蟮那闆r下,可將整個實驗環(huán)境或?qū)嶒瀱挝环殖扇舾蓚€小環(huán)境或小組,在小環(huán)境或小組內(nèi)使非處理因素盡量一致,這就是局部控制
。完全隨機化設計完全隨機化設計(completelyrandomizeddesign)“處理”被隨機地指派給試驗單元的一種設計.Subjectsareassumedtobehomogeneous只有一個因素With2ormoregroups(orlevels)完全隨機化設計(續(xù))Factor(TrainingMethod)FactorLevels
(Groups)RandomlyAssignedUnitsDependentVariable
(Response)21hrs17hrs31hrs27hrs25hrs28hrs29hrs20hrs22hrs完全隨機化設計(續(xù))高爾夫球的品牌與每次擊球的球距有無影響?隨機化區(qū)組設計隨機化區(qū)組設計(randomizedblockdesign)先按一定規(guī)則將實驗單元劃分為若干同質(zhì)組,稱為“區(qū)組(Block)”再將各種處理隨機地指派給各個區(qū)組分組后再將每個品種(處理)隨機地指派給每一個區(qū)組的設計就是隨機化區(qū)組設計隨機化區(qū)組設計(續(xù))因子設計因子設計(factorialdesign)感興趣的因素有兩個如:小麥品種和施肥方式.假定有甲、乙兩種施肥方式,這樣三個小麥品種和兩種施肥方式的搭配共有3×2=6種。如果我們選擇30個地塊進行實驗,每一種搭配可以做5次試驗,也就是每個品種(處理)的樣本容量為5,即相當于每個品種(處理)重復做了5次實驗考慮兩個因素(可推廣到多個因素)的搭配實驗設計稱為因子設計該設計主要用于分析兩個因素及其交互作用對實驗結果的影響因子設計(續(xù))7.2方差分析基本思想方差分析的概念緣由t檢驗法適用于樣本平均數(shù)與總體平均數(shù)及兩樣本平均數(shù)間的差異顯著性檢驗,但在科學研究中經(jīng)常會遇到比較多個處理優(yōu)劣的問題,即需進行多個平均數(shù)間的差異顯著性檢驗。大學中各年級的同學智商是否有別?三種不同的教學方法對于學生的成績是否有影響?方差分析的概念(續(xù))檢驗過程煩瑣這種做法太浪費時間,因為比較幾個總體可能產(chǎn)生很多的比較組,例如比較五個總體的平均值差異,如果以兩兩比較的方式,我們必須進行C52=10次的t-test。無統(tǒng)一的試驗誤差,誤差估計的精確性和檢驗的靈敏性低試驗有5個處理,每個處理重復6次,共有30個觀測值。進行t檢驗時,每次只能利用兩個處理共12個觀測值估計試驗誤差,誤差自由度為2(6-1)=10;若利用整個試驗的30個觀測值估計試驗誤差,顯然估計的精確性高,且誤差自由度為5(6-1)=25。方差分析的概念(續(xù))推斷的可靠性低,檢驗的I型錯誤率大,如果每組的顯著水平皆為α,則全體比較的顯著水平會高于α假設我們在.05的顯著水平下要檢定下列零假設:
H0:u1=u2=u3如果拆成下列三組零假設:
H0:u1=u2,H0:u1=u3,H0:u2=u3每個假設被「接受」的概率為.95,三個假設全部被接受的概率為.953=.857,也就是說當假設為真但被推翻的概率為(1-0.857)=0.143>0.05遠高于顯著水平方差分析的概念(續(xù))因此我們需要在共同的顯著水平α下,同時考慮多個均值的差異,我們以F分布來進行檢驗,稱之為方差分析方差分析(analysisofvariance)是由英國統(tǒng)計學家R.A.Fisher于1923年提出方差分析的概念(續(xù))方差分析方差分析法是一種在若干能相互比較的資料組中,把產(chǎn)生變異的原因加以區(qū)分開來的方法與技術研究分類型自變量對數(shù)值型因變量的影響
一個或多個分類尺度的自變量一個間隔或比率尺度的因變量單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量方差分析的概念(續(xù))例:消費者很想知道哪種車型與油耗關系,比較A,B,C三種車款每加侖可以行駛的里數(shù)如下:基本假設假設每個總體都應服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的各總體的觀察值是獨立的基本思想Q:我們所觀察到的樣本均值差異是否大到足以推翻上面的零假設?三種汽車每單位汽油的里數(shù)皆相同基本思想(續(xù))情形1:樣本內(nèi)的方差很小181920212223CBA基本思想(續(xù))情形2:樣本內(nèi)的方差很大151719212325CBA27基本思想(續(xù))分析邏輯假設從K個總體中抽取大小分別為n1,n2,n3…nk的K個獨立隨機樣本。我們對總體有下列的假設:各總體皆為正態(tài)分布,且有共同相同的方差σ2。以u1,u2,…uk
來表示總體的均值,單因子分析檢證下零假設H0:u1=u2…=ukvs.H1:至少有兩組均值不同基本思想(續(xù))x11x21x31xn1,1x12x22x32xn2,2共有K個總體μ1,σ1μ2,σ2x1kx2kx3kxnk,kμk,σkXiji代表在樣本中的序號,i=1,2,…njj代表樣本組別,j=1,2,…k基本思想(續(xù))分別來自k總的k個樣本第k組樣本共有nk個觀察值各組樣本數(shù)可以不同,分別為n1,n2,…nk,總樣本數(shù)n=n1+n2+…+nk基本思想(續(xù))基本思想(續(xù))總差異=由因子所引起的差異+隨機差異總平均因子的影響隨機差異的影響基本思想(續(xù))兩邊取平方和基本思想(續(xù))方差分析是通過各組樣本內(nèi)的變異與組間變異之比較來檢證各組平均值是否相等,全體樣本數(shù)據(jù)的總變異量為:即個別觀察值與總均值差距的平方和,稱為總變離差平方和基本思想(續(xù))方差分析將總方差分解成下列兩部分:總離差平方和=組內(nèi)離差平方和(未解釋)+組間離差平方和(已解釋)TotalSumofSquares(TSS)=Within-groupSumofSquaresorSumofSquaresWithin(SSW)+Between-GroupSumofSquaresorSumofSquaresBetween(SSB)基本思想(續(xù))隨機誤差與系統(tǒng)誤差隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異這種差異可以看成是隨機因素的影響,稱為隨機誤差
系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差基本思想(續(xù))組內(nèi)方差(withingroups)因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差組內(nèi)方差只包含隨機誤差組間方差(betweengroups)組間方差既包括隨機誤差,也包括系統(tǒng)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異基本思想(續(xù))例析:若不同車型對油耗沒有影響,則組間誤差中只包含隨機誤差,沒有系統(tǒng)誤差。這時,組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應該很接近,它們的比值就會接近1若不同車型對油耗有影響,在組間誤差中除了包含隨機誤差外,還會包含有系統(tǒng)誤差,這時組間誤差平均后的數(shù)值就會大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響基本思想(續(xù))判斷車型對油耗有沒有影響,實際上也就是檢驗具有同方差的三個正態(tài)總體的均值是否相等如果三個總體的均值相等,可以期望三個樣本的均值也會很接近三個樣本的均值越接近,推斷三個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分基本思想(續(xù))如果原假設成立,即H0:m1=m2=m3三種車型均值都相等意味著每個樣本都來自均值為、差為2的同一正態(tài)總體Xf(X)123基本思想(續(xù))若備擇假設成立,即H1:mi(i=1,2,3)不全相等至少有一個總體的均值是不同的三個樣本分別來自均值不同的三個正態(tài)總體
Xf(X)3
1
27.3單因素方差分析單因素方差分析組間方差SSA隨機抽樣造成組內(nèi)方差SSE總方差SST=+單因素方差分析(續(xù))方差來源自由度總離差平方方差F
Statistic組間
(Factor)c–1SSAMSA=
SSA/(c–1)MSA/MSE組內(nèi)
(Error)n–cSSEMSE=SSE/(n–c)合計n–1SST=
SSA+SSE單因素方差分析(續(xù))a若是各處理總體間均值差異不大,
則F=MSA
/MSE
?1.總是使用單側(cè)檢驗呦喲!AlwaysOne-Tail!Fa(c-1,n-c)0RejectH0DoNotRejectH0F單因素方差分析(續(xù))例析:你是生產(chǎn)管理經(jīng)理,欲知道三臺機器的產(chǎn)品裝箱平均時間是否有差異。因此你抽選了具相同訓練及經(jīng)驗的操作員,并隨機指定至此三臺機器;每臺五人。并測試得到了下列的裝箱時間。以顯著水平.05,檢定三臺機器的裝箱平均時間是否有差異?
Machine1
Machine2
Machine3
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40單因素方差分析(續(xù))272625242322212019???????????????TimeinSeconds
Machine1
Machine2
Machine3
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40單因素方差分析(續(xù))F03.89H0:1=2=3H1:不全相等=.05df1=2df2=12臨界值:檢驗統(tǒng)計量:
決策:結論:Rejectat=0.05.Thereisevidencethatatleastoneidiffersfromtherest.=0.05FMSAMSW2358209211256...單因素方差分析(續(xù))方差來源自由度總離差平方和方差F
Statistic組間
(Factor)3-1=247.164023.5820MSA/MSW=25.60組內(nèi)
(Error)15-3=1211.0532.9211合計15-1=1458.2172多重比較多重比較當方差分析的結果拒絕H0,接受H1
時,只說明k個總體均數(shù)不全相等。若想進一步了解哪些兩個總體均數(shù)不等,需進行多個樣本均數(shù)間的兩兩比較或稱多重比較(multiplecomparison)。也叫posthoc檢驗SNK-q檢驗(多個均數(shù)間全面比較)LSD-t檢驗(有專業(yè)意義的均數(shù)間比較)Dunnett檢驗(多個實驗組與對照組比較)還有TUKEY、DUNCAN、SCHEFFE、WALLER、BON等比較方法最小絕對離差法哪個總體均值差異顯著E.g.,1=2
3后驗程序方差分析拒絕原假設后進行配對比較
比較絕對均值絕對差多重比較(續(xù))Xf(X)1=23多重比較(續(xù))1.計算均值差的絕對值;
Machine1
Machine2
Machine3
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.402.計算臨界值:3.若大于臨界值,則拒絕。例子0.05水平上中皆大于臨界值,則每對皆顯著。
隨機區(qū)組實驗隨機區(qū)組實驗項目被除數(shù)分成區(qū)組假定完全隨機設計處理和區(qū)組之間沒有交互影響隨機區(qū)組實驗(續(xù))隨機區(qū)組實驗(續(xù))VariationDue
toGroup
SSAVariation
AmongBlocks
SSBVariationAmongAllObservations
SSTCommonlyreferredtoas:SumofSquaresErrorSumofSquaresUnexplainedCommonlyreferredtoas:SumofSquaresAmongAmongGroupsVariation=++VariationDuetoRandomSampling
SSECommonlyreferredtoas:SumofSquaresAmongBlock隨機區(qū)組實驗(續(xù))方差來源自由度總離差平方和方差F
Statistic組間c–1SSAMSA=
SSA/(c–1)MSA/
MSE區(qū)組間r–1SSBMSB=SSBL/(r–1)MSB/
MSE誤差(r–1)*(c
–1)SSEMSE=SSE/[(r–1)*(c–1)]合計rc–1SST隨機區(qū)組實驗(續(xù))例析:你是生產(chǎn)管理經(jīng)理,欲知道三臺機器的產(chǎn)品裝箱平均時間是否有差異。因此你抽選了具不同訓練及經(jīng)驗的操作員,每個經(jīng)驗等級五人,指定相同經(jīng)驗的三人分別至此三臺機器;并測試得到了下列的裝箱時間。以顯著水平.05,檢定三臺機器的裝箱平均時間是否有差異?
Machine1
Machine2
Machine3
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40隨機區(qū)組實驗(續(xù))F04.46H0:1=2=3H1:不全相等=.05df1=2df2=8臨界值:檢驗統(tǒng)計量:決策:結論:Rejectat=0.05.Thereisevidencethatatleastoneidiffersfromtherest.=0.05FMSAMSE235821.050322.45.隨機區(qū)組實驗(續(xù))方差來源自由度總離差平方和方差F
Statistic組間2SSA=
47.164MSA=
23.58223.582/1.0503=22.452區(qū)組間4SSB=
2.6507MSB=.6627.6627/1.0503=.6039誤差8SSE=
8.4025MSE=1.0503合計14SST=
58.21727.4兩因素方差分析兩因素方差分析概念分析兩個因素(行因素Row和列因素Column)對試驗結果的影響如果兩個因素對試驗結果的影響是相互獨立的,這時的雙因素方差分析稱為無交互作用的雙因素方差分析
(Two-factorwithoutreplication)如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結果產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析
(Two-factorwithreplication)兩因素方差分析(續(xù))基本假定每個總體都服從正態(tài)分布對于因素的每一個水平,其觀察值是來自正態(tài)分布總體的簡單隨機樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨立的兩因素方差分析(續(xù))
因子2(訓練方式)因子水平Level1Level2Level3Level119hr.J20hr.J22hr.J因子1
(高)11hr.J17hr.J31hr.J(動機
)Level227hr.L25hr.L31hr.L(低)29hr.L30hr.L49hr.L兩因素方差分析(續(xù))Xijk因子A之水平i因子B之水平j第k個觀察值因子
B因子A12...c1X111X121...X1c1X112X122...X1c22X211X221...X2c1X212X222...X2c2:::::rXr11Xr21...Xrc1Xr12Xr22...Xrc2水平組合稱為Cell兩因素方差分析(續(xù))交互作用當所選擇不同的A、B因子時,cell均值數(shù)產(chǎn)生特別的變化。無法以個別因素影響而得到的均值如何使用表或圖來觀測交互作用在數(shù)據(jù)表上計算出每一細格的平均數(shù)在圖上相對應的列與行間繪出該格平均數(shù)的位置兩因素方差分析(續(xù))在不同動機(高,低)下及不同訓練方式(A,B,C)下,以圖形了解學習平均時間之交互作用有交互作用(interaction)無交互作用(nointeraction)平均時間ABC高動機低動機平均時間ABC高動機低動機兩因素方差分析(續(xù))SSEVariationDuetoFactorAVariationDuetoRandomSamplingVariationDuetoInteractionSSASSABSSTVariationDuetoFactorBSSB總方差d.f.=n-1d.f.=r-1=++d.f.=c-1+d.f.=(r-1)(c-1)d.f.=rc(n’-1)兩因素方差分析(續(xù))方差來源自由度離差平方和方差F
Statistic因素A
(行)r–1SSAMSA=
SSA/(r–1)MSA/
MSE因素B
(列)c–1SSBMSB=SSB/(c–1)MSB/
MSEAB
(交互)(r–1)(c–1)SSABMSAB=
SSAB/[(r–1)(c–1)]MSAB/
MSE誤差r*c*(m
–1)SSEMSE=SSE/[r*c*(m
–1)]合計R*c*(m
–1)SST兩因素方差分析(續(xù))例解:你是菲爾營銷公司的分析師,你想要了解產(chǎn)品在架上不同位置會對產(chǎn)品的銷售產(chǎn)生何種的影響。今隨機抽選了三種大小的店面、配合了四種不同的架位。并選取架位配合店面大小各重復兩店。使用a=.05,檢驗所有各種效應并下結論VO-5VO-5VO-5SUAVESUAVEPERTPERTPERT兩因素方差分析(續(xù))
架上位置
(B)
店的大小
(A)
1
2
3
4
小型
45
50
56
63
65
71
48
53
中型
57
65
69
78
73
80
60
57
大型
70
78
75
82
82
89
71
75
兩因素方差分析(續(xù))SourceofVariationDegr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中考物理復習主題單元11第29課時動態(tài)電路分析課件
- 第一章集合與常用邏輯用語考點三充分條件與必要條件教案
- 初數(shù)論等教案(同余的概念及其基本性質(zhì))
- 《螞蟻》教學反思
- 電子組裝線膠工招聘協(xié)議書
- 五年級語文下冊教案
- 苗木種植承包合同
- 古玩市場土地租賃合同
- 外賣廚房炊事員聘用協(xié)議
- 道路橋梁設計與施工咨詢合同
- 河南省商丘市2023-2024學年高一上學期期中考試化學試題(含答案)
- 墓地長期租用合同模板
- 2024年心理咨詢師基礎知識考試題庫(濃縮500題)
- 物 理第四章 第1節(jié)光沿直線傳播課件-2024-2025學年八年級物理(人教版2024)
- 2024年銀行考試-反洗錢考試近5年真題集錦(頻考類試題)帶答案
- 2025年九省聯(lián)考新高考 語文試卷(含答案解析)
- 工業(yè)視覺系統(tǒng)運維員-國家職業(yè)標準(2023年版)
- 大概念統(tǒng)攝下跨學科課程的開發(fā)與實施
- 鋼結構件竣工環(huán)保驗收監(jiān)測調(diào)查報告
- 2024秋期國家開放大學《公共行政學》一平臺在線形考(形考任務一至三)試題及答案
- 廣西南寧市青秀區(qū)第十四中學2024-2025學年七年級上學期10月月考數(shù)學試題(無答案)
評論
0/150
提交評論