




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
警惕過多地假設檢驗。你對數(shù)據(jù)越苛求,數(shù)據(jù)會越多地向你供認,但在威逼下得到的供詞,在科學詢查的法庭上是不容許的。
StephenM.Stigler警惕過多地假設檢驗。你對數(shù)據(jù)越第9章方差分析與試驗設計作者:中國人民大學統(tǒng)計學院賈俊平PowerPoint統(tǒng)計學第9章方差分析與試驗設計作者:中國人民大學統(tǒng)計學院P統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年12月5日,科技部、衛(wèi)生部、國家食品藥品監(jiān)督管理局共同宣布:中國自主研制的SARS病毒滅活疫苗Ⅰ期臨床試驗圓滿結束。經對36人的試驗結果表明,36位受試者均未出現(xiàn)異常反應,其中24位接種疫苗的受試者全部產生了抗體,這表明我國自主研制的疫苗是安全有效的2003年SARS疫情發(fā)生后,SARS疫苗的研制確定為重要任務之一??萍疾糠e極組織協(xié)調,形成了由北京科興生物制品有限公司、中國疾病預防控制中心病毒病預防控制所和中國醫(yī)學科學院實驗動物研究所共同組成的疫苗研制項目課題組,研究人員包括北京科興生物制品有限公司、中國醫(yī)學科學院實驗動物研究所、中國疾病預防控制中心病毒病預防控制所、中日友好醫(yī)院等部門在內的100多位科研人員和醫(yī)生統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年12月5日,統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年1月19日,SARS病毒滅活疫苗獲準進入Ⅰ期臨床研究,本次試驗共選擇36名年齡在21歲到40歲的健康人作為志愿者,男女各18人,在中日友好醫(yī)院接受了SARS疫苗臨床研究。免疫接種分為16個單位和32個單位兩種劑量,并設安慰劑對照組,各12人。這次SARS疫苗臨床研究方案完全按照國際規(guī)范,采用知情同意、倫理審查、隨機雙盲等規(guī)范化操作本次試驗采用隨機雙盲的實驗設計。受試者和參加臨床試驗或臨床評價的研究人員或疫苗研制方的工作人員均不知道也不能識別受試者接受了何種注射(疫苗或安慰劑)。在試驗結束、完成數(shù)據(jù)清理、數(shù)據(jù)已達到可以接受水平,可由指定人員揭盲,打開密封的設盲信封,從而知道哪個受試者接種的是試驗疫苗,哪個受試者接種的是安慰劑統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年1月19日,9.1方差分析引論9.2單因素方差分析9.3雙因素方差分析9.4試驗設計初步第9章方差分析與試驗設計9.1方差分析引論第9章方差分析與試驗設計學習目標解釋方差分析的概念解釋方差分析的基本思想和原理掌握單因素方差分析的方法及應用理解多重比較的意義掌握雙因素方差分析的方法及應用掌握試驗設計的基本原理和方法學習目標解釋方差分析的概念9.1方差分析引論9.1.1方差分析及其有關術語9.1.2方差分析的基本思想和原理9.1.3方差分析的基本假定9.1.4問題的一般提法9.1方差分析引論9.1.1方差分析及其有關術語為什么不做兩兩比較?設有四個總體的均值分別為m1、
m2、m3、m4,要檢驗四個總體的均值是否相等,每次檢驗兩個的作法共需要進行6次不同的檢驗,每次檢驗犯第一類錯誤的概率為,連續(xù)作6次檢驗犯第Ⅰ類錯誤的概率增加到1-(1-)6=0.265,大于0.05。相應的置信水平會降低到0.956=0.735一般來說,隨著增加個體顯著性檢驗的次數(shù),偶然因素導致差別的可能性也會增加,(并非均值真的存在差別)方差分析方法則是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免拒絕一個真實的原假設為什么不做兩兩比較?設有四個總體的均值分別為m1、m2、方差分析及其有關術語方差分析及其有關術語什么是方差分析(ANOVA)?
(analysisofvariance)檢驗多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類型自變量對數(shù)值型因變量的影響一個或多個分類型自變量兩個或多個(k個)處理水平或分類一個數(shù)值型因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量什么是方差分析(ANOVA)?
(analysisofv什么是方差分析?
(例題分析)消費者對四個行業(yè)的投訴次數(shù)行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對幾個行業(yè)的服務質量進行評價,消費者協(xié)會在4個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費者對總共23家企業(yè)投訴的次數(shù)如下表什么是方差分析?
(例題分析)消費者對四個行業(yè)的投訴次數(shù)什么是方差分析?
(例題分析)分析4個行業(yè)之間的服務質量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結為檢驗這四個行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務質量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務質量有顯著差異什么是方差分析?
(例題分析)分析4個行業(yè)之間的服務質量是方差分析中的有關術語因素或因子(factor)所要檢驗的對象分析行業(yè)對投訴次數(shù)的影響,行業(yè)是要檢驗的因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個行業(yè)被投訴的次數(shù)方差分析中的有關術語因素或因子(factor)方差分析中的有關術語試驗這里只涉及一個因素,因此稱為單因素4水平的試驗總體因素的每一個水平可以看作是一個總體零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這4個總體中抽取的樣本數(shù)據(jù)方差分析中的有關術語試驗方差分析的基本思想和原理方差分析的基本思想和原理方差分析的基本思想和原理
(圖形分析—散點圖)零售業(yè)旅游業(yè)航空公司家電制造方差分析的基本思想和原理
(圖形分析—散點圖)方差分析的基本思想和原理
(圖形分析—Mean/SD/1.96*SD箱線圖)方差分析的基本思想和原理
(圖形分析—Mean/SD/1.9從散點圖上可以看出不同行業(yè)被投訴的次數(shù)有明顯差異同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關系如果行業(yè)與被投訴次數(shù)之間沒有關系,那么它們被投訴的次數(shù)應該差不多相同,在散點圖上所呈現(xiàn)的模式也就應該很接近方差分析的基本思想和原理
(圖形分析)從散點圖上可以看出方差分析的基本思想和原理
(圖形分析)散點圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機性造成的需要有更準確的方法來檢驗這種差異是否顯著,也就是進行方差分析所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理散點圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯方差分析的基本思想和原理
(兩類誤差)隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)之間的差異這種差異可以看成是隨機因素的影響,稱為隨機誤差
系統(tǒng)誤差因素的不同水平(不同總體)之間觀察值的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理
(兩類誤差)隨機誤差方差分析的基本思想和原理
(誤差平方和—SS)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內平方和(withingroups)因素的同一水平下數(shù)據(jù)誤差的平方和比如,零售業(yè)被投訴次數(shù)的誤差平方和只包含隨機誤差組間平方和(betweengroups)因素的不同水平之間數(shù)據(jù)誤差的平方和比如,4個行業(yè)被投訴次數(shù)之間的誤差平方和既包括隨機誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理
(誤差平方和—SS)數(shù)據(jù)的誤差用平方差分析的基本思想和原理
(均方—MS)平方和除以相應的自由度若原假設成立,組間均方與組內均方的數(shù)值就應該很接近,它們的比值就會接近1若原假設不成立,組間均方會大于組內均方,它們之間的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,即自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,也就是檢驗被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響方差分析的基本思想和原理
(均方—MS)平方和除以相應的自由方差分析的基本假定方差分析的基本假定方差分析的基本假定每個總體都應服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本比如,每個行業(yè)被投訴的次數(shù)必須服從正態(tài)分布各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,4個行業(yè)被投訴次數(shù)的方差都相等觀察值是獨立的比如,每個行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨立方差分析的基本假定每個總體都應服從正態(tài)分布方差分析中的基本假定在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否有顯著影響,實際上也就是檢驗具有同方差的4個正態(tài)總體的均值是否相等如果4個總體的均值相等,可以期望4個樣本的均值也會很接近4個樣本的均值越接近,推斷4個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中的基本假定在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否方差分析中的基本假定如果原假設成立,即H0:
m1=m2=m3=m44個行業(yè)被投訴次數(shù)的均值都相等意味著每個樣本都來自均值為、方差為2的同一正態(tài)總體
Xf(X)1
2
3
4
方差分析中的基本假定如果原假設成立,即H0:m1方差分析中的基本假定若備擇假設成立,即H1:
mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的4個樣本分別來自均值不同的4個正態(tài)總體
Xf(X)3
1
2
4
方差分析中的基本假定若備擇假設成立,即H1:mi(i方差分析的基本假定
(圖形分析—正態(tài)概率圖)方差分析的基本假定
(圖形分析—正態(tài)概率圖)問題的一般提法問題的一般提法問題的一般提法設因素有k個水平,每個水平的均值分別用1,2,,k
表示要檢驗k個水平(總體)的均值是否相等,需要提出如下假設:H0:
12…k
H1:
1,2,,k
不全相等設1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設為H0:
1234
H1:
1,2,3,4
不全相等問題的一般提法設因素有k個水平,每個水平的均值分別用1,9.2單因素方差分析9.2.1數(shù)據(jù)結構9.2.2分析步驟9.2.3關系強度的測量9.2.4方差分析中的多重比較9.2單因素方差分析9.2.1數(shù)據(jù)結構單因素方差分析的數(shù)據(jù)結構
(one-wayanalysisofvariance)
觀察值(j)因素(A)i
水平A1水平A2
…水平Ak12::n
x11
x21
…
xk1x12
x22
…
xk2::
:
:::
:
:x1n
x2n
…
xkn單因素方差分析的數(shù)據(jù)結構
(one-wayanalysis分析步驟提出假設構造檢驗統(tǒng)計量統(tǒng)計決策分析步驟提出假設一般提法H0:m1=m2=…=
mk
自變量對因變量沒有顯著影響
H1:m1,m2,…,mk不全相等自變量對因變量有顯著影響
注意:拒絕原假設,只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等提出假設一般提法構造檢驗的統(tǒng)計量構造統(tǒng)計量需要計算水平的均值全部觀察值的總均值誤差平方和均方(MS)
構造檢驗的統(tǒng)計量構造統(tǒng)計量需要計算構造檢驗的統(tǒng)計量
(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式為式中:ni為第i個總體的樣本觀察值個數(shù)
xij為第i個總體的第j個觀察值
構造檢驗的統(tǒng)計量
(計算水平的均值)假定從第i個總體中抽取一構造檢驗的統(tǒng)計量
(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數(shù)計算公式為構造檢驗的統(tǒng)計量
(計算全部觀察值的總均值)全部觀察值的總和構造檢驗的統(tǒng)計量
(例題分析)構造檢驗的統(tǒng)計量
(例題分析)構造檢驗的統(tǒng)計量
(計算總誤差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為前例的計算結果
SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構造檢驗的統(tǒng)計量
(計算總誤差平方和SST)全部觀察值構造檢驗的統(tǒng)計量
(計算組間平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度該平方和既包括隨機誤差,也包括系統(tǒng)誤差計算公式為前例的計算結果SSA=1456.608696構造檢驗的統(tǒng)計量
(計算組間平方和SSA)各組平均值構造檢驗的統(tǒng)計量
(計算組內平方和SSE)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況該平方和反映的是隨機誤差的大小計算公式為前例的計算結果SSE=2708構造檢驗的統(tǒng)計量
(計算組內平方和SSE)每個水平或組的構造檢驗的統(tǒng)計量
(三個平方和的關系)總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系SST=SSA+SSE前例的計算結果4164.608696=1456.608696+2708構造檢驗的統(tǒng)計量
(三個平方和的關系)總離差平方和(SST構造檢驗的統(tǒng)計量
(計算均方MS)各誤差平方和的大小與觀察值的多少有關,為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差由誤差平方和除以相應的自由度求得三個平方和對應的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE的自由度為n-k構造檢驗的統(tǒng)計量
(計算均方MS)各誤差平方和的大小與觀察值構造檢驗的統(tǒng)計量
(計算均方MS)組間方差:SSA的均方,記為MSA,計算公式為組內方差:SSE的均方,記為MSE,計算公式為構造檢驗的統(tǒng)計量
(計算均方MS)組間方差:SSA的均方,構造檢驗的統(tǒng)計量
(計算檢驗統(tǒng)計量F)將MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構造檢驗的統(tǒng)計量
(計算檢驗統(tǒng)計量F)將MSA和MSE進構造檢驗的統(tǒng)計量
(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a
F分布F(k-1,n-k)0拒絕H0不能拒絕H0F構造檢驗的統(tǒng)計量
(F分布與拒絕域)如果均值相等,F(xiàn)=MSA統(tǒng)計決策
將統(tǒng)計量的值F與給定的顯著性水平的臨界值F進行比較,作出對原假設H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值F
若F>F,則拒絕原假設H0,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響若F<F,則不拒絕原假設H0,無證據(jù)表明所檢驗的因素對觀察值有顯著影響統(tǒng)計決策將統(tǒng)計量的值F與給定的顯著性水平的臨界值F單因素方差分析表
(基本結構)誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(誤差)SSEn-kMSE總和SSTn-1單因素方差分析表
(基本結構)誤差來源平方和自由度均方(MS單因素方差分析
(例題分析)單因素方差分析
(例題分析)用Excel進行方差分析
(Excel分析步驟)第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項第3步:在分析工具中選擇【單因素方差分析】
,然后選擇【確定】第4步:當對話框出現(xiàn)時
在【輸入?yún)^(qū)域】方框內鍵入數(shù)據(jù)單元格區(qū)域在【】方框內鍵入0.05(可根據(jù)需要確定)在【輸出選項】中選擇輸出區(qū)域用Excel進行方差分析用Excel進行方差分析
(Excel分析步驟)第1步:關系強度的測量關系強度的測量關系強度的測量
拒絕原假設表明因素(自變量)與觀測值之間有顯著關系組間平方和(SSA)度量了自變量(行業(yè))對因變量(投訴次數(shù))的影響效應只要組間平方和SSA不等于0,就表明兩個變量之間有關系(只是是否顯著的問題)當組間平方和比組內平方和(SSE)大,而且大到一定程度時,就意味著兩個變量之間的關系顯著,大得越多,表明它們之間的關系就越強。反之,就意味著兩個變量之間的關系不顯著,小得越多,表明它們之間的關系就越弱關系強度的測量拒絕原假設表明因素(自變量)與觀測值之間有顯關系強度的測量
變量間關系的強度用自變量平方和(SSA)占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測量兩個變量之間的關系強度
關系強度的測量變量間關系的強度用自變量平方和(SSA)占關系強度的測量
(例題分析)
R=0.591404結論行業(yè)(自變量)對投訴次數(shù)(因變量)的影響效應占總效應的34.9759%,而殘差效應則占65.0241%。即行業(yè)對投訴次數(shù)差異解釋的比例達到近35%,而其他因素(殘差變量)所解釋的比例近65%以上
R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關系
關系強度的測量
(例題分析)方差分析中的多重比較
(multiplecomparisonprocedures)方差分析中的多重比較
(multiplecomparis多重比較的意義通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異可采用Fisher提出的最小顯著差異方法,簡寫為LSDLSD方法是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的多重比較的意義通過對總體均值之間的配對比較來進一步檢驗到底哪多重比較的步驟提出假設H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mimj(第i個總體的均值不等于第j個總體的均值)計算檢驗的統(tǒng)計量:計算LSD決策:若,拒絕H0;若
,不拒絕H0多重比較的步驟提出假設多重比較分析
(例題分析)第1步:提出假設檢驗1:檢驗2:檢驗3:檢驗4:檢驗5:檢驗6:多重比較分析
(例題分析)第1步:提出假設方差分析中的多重比較
(例題分析)第2步:計算檢驗統(tǒng)計量檢驗1:檢驗2:檢驗3:檢驗4:檢驗5:檢驗6:方差分析中的多重比較
(例題分析)第2步:計算檢驗統(tǒng)計量方差分析中的多重比較
(例題分析)第3步:計算LSD檢驗1:檢驗2:檢驗3:檢驗4:檢驗5:檢驗6:方差分析中的多重比較
(例題分析)第3步:計算LSD方差分析中的多重比較
(例題分析)第4步:作出決策不能認為零售業(yè)與旅游業(yè)均值之間有顯著差異
不能認為零售業(yè)與航空公司均值之間有顯著差異不能認為零售業(yè)與家電業(yè)均值之間有顯著差異不能認為旅游業(yè)與航空業(yè)均值之間有顯著差異不能認為旅游業(yè)與家電業(yè)均值之間有顯著差異航空業(yè)與家電業(yè)均值有顯著差異方差分析中的多重比較
(例題分析)第4步:作出決策不能認為零9.3雙因素方差分析9.3.1雙因素方差分析及其類型9.3.2無交互作用的雙因素方差分析9.3.3有交互作用的雙因素方差分析9.3雙因素方差分析9.3.1雙因素方差分析及其雙因素方差分析
(two-wayanalysisofvariance)
分析兩個因素(行因素row和列因素column)對試驗結果的影響如果兩個因素對試驗結果的影響是相互獨立的,分別判斷行因素和列因素對試驗數(shù)據(jù)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復雙因素方差分析(two-factorwithoutreplication)如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結果產生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復雙因素方差分析(two-factorwithreplication)雙因素方差分析
(two-wayanalysisofv雙因素方差分析的基本假定每個總體都服從正態(tài)分布對于因素的每一個水平,其觀察值是來自正態(tài)分布總體的簡單隨機樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨立的雙因素方差分析的基本假定每個總體都服從正態(tài)分布無交互作用的雙因素方差分析
(無重復雙因素分析)無交互作用的雙因素方差分析
(無重復雙因素分析)雙因素方差分析
(例題分析)不同品牌的彩電在5個地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4個品牌的彩電在5個地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對銷售量的影響,對每個品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?(=0.05)雙因素方差分析
(例題分析)不同品牌的彩電在5個地區(qū)的銷數(shù)據(jù)結構
數(shù)據(jù)結構數(shù)據(jù)結構
是行因素的第i個水平下各觀察值的平均值是列因素的第j個水平下各觀察值的平均值是全部kr個樣本數(shù)據(jù)的總平均值數(shù)據(jù)結構是行因素的第i個水平下各觀察值的平均分析步驟
(提出假設)提出假設對行因素提出的假設為H0:m1=m2
=
…=mi=…=
mk(mi為第i個水平的均值)H1:mi
(i=1,2,…,k)不全相等對列因素提出的假設為H0:m1=m2
=
…=mj=…=
mr(mj為第j個水平的均值)H1:mj
(j=1,2,…,r)不全相等分析步驟
(提出假設)提出假設分析步驟
(構造檢驗的統(tǒng)計量)計算平方和(SS)總誤差平方和行因素誤差平方和列因素誤差平方和隨機誤差項平方和分析步驟
(構造檢驗的統(tǒng)計量)計算平方和(SS)分析步驟
(構造檢驗的統(tǒng)計量)
總誤差平方和(SST)、行因素平方和(SSR)、列因素平方和(SSC)、誤差項平方和(SSE)之間的關系SST=SSR+SSC+SSE分析步驟
(構造檢驗的統(tǒng)計量)總誤差平方和(SST)分析步驟
(構造檢驗的統(tǒng)計量)計算均方(MS)誤差平方和除以相應的自由度三個平方和的自由度分別是總誤差平方和SST的自由度為kr-1行因素平方和SSR的自由度為k-1列因素平方和SSC的自由度為r-1誤差項平方和SSE的自由度為(k-1)×(r-1)
分析步驟
(構造檢驗的統(tǒng)計量)計算均方(MS)分析步驟
(構造檢驗的統(tǒng)計量)計算均方(MS)行因素的均方,記為MSR,計算公式為列因素的均方,記為MSC,計算公式為誤差項的均方,記為MSE
,計算公式為分析步驟
(構造檢驗的統(tǒng)計量)計算均方(MS)分析步驟
(構造檢驗的統(tǒng)計量)
計算檢驗統(tǒng)計量(F)檢驗行因素的統(tǒng)計量檢驗列因素的統(tǒng)計量分析步驟
(構造檢驗的統(tǒng)計量)計算檢驗統(tǒng)計量(F)分析步驟
(統(tǒng)計決策)將統(tǒng)計量的值F與給定的顯著性水平的臨界值F進行比較,作出對原假設H0的決策根據(jù)給定的顯著性水平在F分布表中查找相應的臨界值F
若FR>F,拒絕原假設H0,表明均值之間的差異是顯著的,即所檢驗的行因素對觀察值有顯著影響若FC
>F,拒絕原假設H0,表明均值之間有顯著差異,即所檢驗的列因素對觀察值有顯著影響分析步驟
(統(tǒng)計決策)將統(tǒng)計量的值F與給定的顯著性水平雙因素方差分析表
(基本結構)誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值行因素SSRk-1MSRMSRMSE列因素SSCr-1MSCMSCMSE誤差SSE(k-1)(r-1)MSE總和SSTkr-1雙因素方差分析表
(基本結構)誤差來源平方和自由度均方(MS雙因素方差分析
(例題分析)提出假設對品牌因素提出的假設為H0:m1=m2=m3=m4(品牌對銷售量無顯著影響)H1:mi
(i=1,2,…,4)不全相等(有顯著影響)對地區(qū)因素提出的假設為H0:m1=m2=m3=m4=m5(地區(qū)對銷售量無顯著影響)H1:mj
(j=1,2,…,5)不全相等(有顯著影響)
用Excel進行無重復雙因素分析雙因素方差分析
(例題分析)提出假設雙因素方差分析
(例題分析)結論:
FR=18.10777>F=3.4903,拒絕原假設H0,說明彩電的品牌對銷售量有顯著影響
FC=2.100846<F=3.2592,不拒絕原假設H0,無證據(jù)表明銷售地區(qū)對彩電的銷售量有顯著影響雙因素方差分析
(例題分析)結論:雙因素方差分析
(關系強度的測量)行平方和(SSR)度量了品牌這個自變量對因變量(銷售量)的影響效應列平方和(SSC)度量了地區(qū)這個自變量對因變量(銷售量)的影響效應這兩個平方和加在一起則度量了兩個自變量對因變量的聯(lián)合效應聯(lián)合效應與總平方和的比值定義為R2其平方根R反映了這兩個自變量合起來與因變量之間的關系強度雙因素方差分析
(關系強度的測量)行平方和(SSR)度量了品雙因素方差分析
(關系強度的測量)例題分析品牌因素和地區(qū)因素合起來總共解釋了銷售量差異的83.94%其他因素(殘差變量)只解釋了銷售量差異的16.06%R=0.9162,表明品牌和地區(qū)兩個因素合起來與銷售量之間有較強的關系雙因素方差分析
(關系強度的測量)例題分析有交互作用的雙因素方差分析
(可重復雙因素分析)有交互作用的雙因素方差分析
(可重復雙因素分析)可重復雙因素分析
(例題)【例】城市道路交通管理部門為研究不同的路段和不同的時間段對行車時間的影響,讓一名交通警察分別在兩個路段和高峰期與非高峰期親自駕車進行試驗,通過試驗共獲得了20個行車時間(單位:min)的數(shù)據(jù),如下表。試分析路段、時段以及路段和時段的交互作用對行車時間的影響可重復雙因素分析
(例題)【例】城市道路交通管理部門為研究不交互作用的圖示
(interaction)路段與時段對行車時間的影響交互作用無交互作用行車時間路段1路段2高峰期非高峰期行車時間路段1路段2高峰期非高峰期交互作用的圖示
(interaction)路段與時段對行車時可重復雙因素方差分析表
(基本結構)誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值行因素SSRk-1MSRFR列因素SSCr-1MSCFC交互作用SSRC(k-1)(r-1)MSRCFRC誤差SSEKr(m-1)MSE總和SSTn-1m為樣本的行數(shù)可重復雙因素方差分析表
(基本結構)誤差來源平方和自由度均方可重復雙因素分析
(平方和的計算)設:
為對應于行因素的第i個水平和列因素的第j個水平的第l行的觀察值
為行因素的第i個水平的樣本均值
為列因素的第j個水平的樣本均值
對應于行因素的第i個水平和列因素的第j個水平組合的樣本均值
為全部n個觀察值的總均值
可重復雙因素分析
(平方和的計算)設:為對應于行因可重復雙因素分析
(平方和的計算)總平方和:行變量平方和:列變量平方和:交互作用平方和:誤差項平方和:SST=SSR+SSC+SSRC+SSE可重復雙因素分析
(平方和的計算)總平方和:SST=SSR+可重復雙因素分析
(Excel檢驗步驟)第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】選項第2步:在分析工具中選擇【素方差分析:可重復雙因素分析】,然后選擇【確定】第3步:當對話框出現(xiàn)時
在【輸入?yún)^(qū)域】方框內鍵入數(shù)據(jù)區(qū)域(A1:C11)
在【】方框內鍵入0.05(可根據(jù)需要確定)
在【每一樣本的行數(shù)】方框內鍵入重復試驗次數(shù)(5)
在【輸出選項】中選擇輸出區(qū)域選擇【確定】用Excel進行可重復雙因素分析可重復雙因素分析
(Excel檢驗步驟)第1步:選擇“工具”9.4試驗設計初步9.4.1完全隨機化設計9.4.2隨機化區(qū)組設計9.4.3因子設計9.4試驗設計初步9.4.1完全隨機化設計試驗設計與方差分析試驗設計完全隨機化設計隨機化區(qū)組設計因子設計單因素方差分析無重復雙因素方差分析可重復雙因素方差分析試驗設計與方差分析試驗設計完全隨機化因子設計單因素無重復雙因完全隨機化設計完全隨機化設計完全隨機化設計
(completelyrandomizeddesign)“處理”被隨機地指派給試驗單元的一種設計“處理”是指可控制的因素的各個水平“試驗單元(experimentunit)”是接受“處理”的對象或實體在試驗性研究中,感興趣的變量是明確規(guī)定的,因此,研究中的一個或多個因素可以被控制,使得數(shù)據(jù)可以按照因素如何影響變量來獲取對完全隨機化設計的數(shù)據(jù)采用單因素方差分析完全隨機化設計
(completelyrandomized完全隨機化設計
(例題分析)這里的“小麥品種”就是試驗因子或因素,品種1、品種2、品種3就是因子的3個不同水平,稱為處理假定選取3個面積相同的地塊,這里的“地塊”就是接受處理的對象或實體,稱為試驗單元將每個品種隨機地指派給其中的一個地塊,這一過程就是隨機化設計過程【例】一家種業(yè)開發(fā)股份公司研究出3個新的小麥品種:品種1、品種2、品種3。為分析不同品種對產量的影響,需要選擇一些地塊,在每個地塊種上不同品種的小麥,然后獲得產量數(shù)據(jù)進行分析。這一過程就是試驗設計的過程
完全隨機化設計
(例題分析)這里的“小麥品種”就是完全隨機化設計
(例題分析)試驗數(shù)據(jù):單因素方差分析完全隨機化設計
(例題分析)試驗數(shù)據(jù):單因素方差分析完全隨機化設計
(例題分析)方差分析:完全隨機化設計
(例題分析)方差分析:隨機化區(qū)組設計隨機化區(qū)組設計隨機化區(qū)組設計
(randomizedblockdesign)先按一定規(guī)則將試驗單元劃分為若干同質組,稱為“區(qū)組(block)”再將各種處理隨機地指派給各個區(qū)組比如在上面的例子中,首先根據(jù)土壤的好壞分成幾個區(qū)組,假定分成4個區(qū)組:區(qū)組1、區(qū)組2、區(qū)組3、區(qū)組4,每個區(qū)組中有三個地塊在每個區(qū)組內的3個地塊以抽簽的方式決定所種的小麥品種分組后再將每個品種(處理)隨機地指派給每一個區(qū)組的設計就是隨機化區(qū)組設計試驗數(shù)據(jù)采用無重復雙因素方差分析隨機化區(qū)組設計
(randomizedblockdesi隨機化區(qū)組設計
(例題分析)試驗數(shù)據(jù):無重復雙因素方差分析隨機化區(qū)組設計
(例題分析)試驗數(shù)據(jù):無重復雙因素方差分隨機化區(qū)組設計
(例題分析)方差分析:隨機化區(qū)組設計
(例題分析)方差分析:因子設計因子設計因子設計
(factorialdesign)感興趣的因素有兩個如:小麥品種和施肥方式假定有甲、乙兩種施肥方式,這樣3個小麥品種和兩種施肥方式的搭配共有3×2=6種。如果我們選擇30個地塊進行實驗,每一種搭配可以做5次試驗,也就是每個品種(處理)的樣本量為5,即相當于每個品種(處理)重復做了5次試驗考慮兩個因素(可推廣到多個因素)的搭配試驗設計稱為因子設計該設計主要用于分析兩個因素及其交互作用對試驗結果的影響試驗數(shù)據(jù)采用可重復雙因素方差分析因子設計
(factorialdesign)感興趣的因素有因子設計
(例題分析)試驗數(shù)據(jù):可重復雙因素方差分析因子設計
(例題分析)試驗數(shù)據(jù):可重復雙因素方差分析因子設計
(例題分析)方差分析:因子設計
(例題分析)方差分析:本章小結方差分析(ANOVA)的概念方差分析的思想和原理方差分析中的基本假設單因素方差分析雙因素方差分析試驗設計與數(shù)據(jù)分析本章小結方差分析(ANOVA)的概念結束THANKS結束THANKS警惕過多地假設檢驗。你對數(shù)據(jù)越苛求,數(shù)據(jù)會越多地向你供認,但在威逼下得到的供詞,在科學詢查的法庭上是不容許的。
StephenM.Stigler警惕過多地假設檢驗。你對數(shù)據(jù)越第9章方差分析與試驗設計作者:中國人民大學統(tǒng)計學院賈俊平PowerPoint統(tǒng)計學第9章方差分析與試驗設計作者:中國人民大學統(tǒng)計學院P統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年12月5日,科技部、衛(wèi)生部、國家食品藥品監(jiān)督管理局共同宣布:中國自主研制的SARS病毒滅活疫苗Ⅰ期臨床試驗圓滿結束。經對36人的試驗結果表明,36位受試者均未出現(xiàn)異常反應,其中24位接種疫苗的受試者全部產生了抗體,這表明我國自主研制的疫苗是安全有效的2003年SARS疫情發(fā)生后,SARS疫苗的研制確定為重要任務之一??萍疾糠e極組織協(xié)調,形成了由北京科興生物制品有限公司、中國疾病預防控制中心病毒病預防控制所和中國醫(yī)學科學院實驗動物研究所共同組成的疫苗研制項目課題組,研究人員包括北京科興生物制品有限公司、中國醫(yī)學科學院實驗動物研究所、中國疾病預防控制中心病毒病預防控制所、中日友好醫(yī)院等部門在內的100多位科研人員和醫(yī)生統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年12月5日,統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年1月19日,SARS病毒滅活疫苗獲準進入Ⅰ期臨床研究,本次試驗共選擇36名年齡在21歲到40歲的健康人作為志愿者,男女各18人,在中日友好醫(yī)院接受了SARS疫苗臨床研究。免疫接種分為16個單位和32個單位兩種劑量,并設安慰劑對照組,各12人。這次SARS疫苗臨床研究方案完全按照國際規(guī)范,采用知情同意、倫理審查、隨機雙盲等規(guī)范化操作本次試驗采用隨機雙盲的實驗設計。受試者和參加臨床試驗或臨床評價的研究人員或疫苗研制方的工作人員均不知道也不能識別受試者接受了何種注射(疫苗或安慰劑)。在試驗結束、完成數(shù)據(jù)清理、數(shù)據(jù)已達到可以接受水平,可由指定人員揭盲,打開密封的設盲信封,從而知道哪個受試者接種的是試驗疫苗,哪個受試者接種的是安慰劑統(tǒng)計應用
SARS病毒滅活疫苗臨床試驗2004年1月19日,9.1方差分析引論9.2單因素方差分析9.3雙因素方差分析9.4試驗設計初步第9章方差分析與試驗設計9.1方差分析引論第9章方差分析與試驗設計學習目標解釋方差分析的概念解釋方差分析的基本思想和原理掌握單因素方差分析的方法及應用理解多重比較的意義掌握雙因素方差分析的方法及應用掌握試驗設計的基本原理和方法學習目標解釋方差分析的概念9.1方差分析引論9.1.1方差分析及其有關術語9.1.2方差分析的基本思想和原理9.1.3方差分析的基本假定9.1.4問題的一般提法9.1方差分析引論9.1.1方差分析及其有關術語為什么不做兩兩比較?設有四個總體的均值分別為m1、
m2、m3、m4,要檢驗四個總體的均值是否相等,每次檢驗兩個的作法共需要進行6次不同的檢驗,每次檢驗犯第一類錯誤的概率為,連續(xù)作6次檢驗犯第Ⅰ類錯誤的概率增加到1-(1-)6=0.265,大于0.05。相應的置信水平會降低到0.956=0.735一般來說,隨著增加個體顯著性檢驗的次數(shù),偶然因素導致差別的可能性也會增加,(并非均值真的存在差別)方差分析方法則是同時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免拒絕一個真實的原假設為什么不做兩兩比較?設有四個總體的均值分別為m1、m2、方差分析及其有關術語方差分析及其有關術語什么是方差分析(ANOVA)?
(analysisofvariance)檢驗多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類型自變量對數(shù)值型因變量的影響一個或多個分類型自變量兩個或多個(k個)處理水平或分類一個數(shù)值型因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量什么是方差分析(ANOVA)?
(analysisofv什么是方差分析?
(例題分析)消費者對四個行業(yè)的投訴次數(shù)行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對幾個行業(yè)的服務質量進行評價,消費者協(xié)會在4個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費者對總共23家企業(yè)投訴的次數(shù)如下表什么是方差分析?
(例題分析)消費者對四個行業(yè)的投訴次數(shù)什么是方差分析?
(例題分析)分析4個行業(yè)之間的服務質量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結為檢驗這四個行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務質量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務質量有顯著差異什么是方差分析?
(例題分析)分析4個行業(yè)之間的服務質量是方差分析中的有關術語因素或因子(factor)所要檢驗的對象分析行業(yè)對投訴次數(shù)的影響,行業(yè)是要檢驗的因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個行業(yè)被投訴的次數(shù)方差分析中的有關術語因素或因子(factor)方差分析中的有關術語試驗這里只涉及一個因素,因此稱為單因素4水平的試驗總體因素的每一個水平可以看作是一個總體零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這4個總體中抽取的樣本數(shù)據(jù)方差分析中的有關術語試驗方差分析的基本思想和原理方差分析的基本思想和原理方差分析的基本思想和原理
(圖形分析—散點圖)零售業(yè)旅游業(yè)航空公司家電制造方差分析的基本思想和原理
(圖形分析—散點圖)方差分析的基本思想和原理
(圖形分析—Mean/SD/1.96*SD箱線圖)方差分析的基本思想和原理
(圖形分析—Mean/SD/1.9從散點圖上可以看出不同行業(yè)被投訴的次數(shù)有明顯差異同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關系如果行業(yè)與被投訴次數(shù)之間沒有關系,那么它們被投訴的次數(shù)應該差不多相同,在散點圖上所呈現(xiàn)的模式也就應該很接近方差分析的基本思想和原理
(圖形分析)從散點圖上可以看出方差分析的基本思想和原理
(圖形分析)散點圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機性造成的需要有更準確的方法來檢驗這種差異是否顯著,也就是進行方差分析所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理散點圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯方差分析的基本思想和原理
(兩類誤差)隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)之間的差異這種差異可以看成是隨機因素的影響,稱為隨機誤差
系統(tǒng)誤差因素的不同水平(不同總體)之間觀察值的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理
(兩類誤差)隨機誤差方差分析的基本思想和原理
(誤差平方和—SS)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內平方和(withingroups)因素的同一水平下數(shù)據(jù)誤差的平方和比如,零售業(yè)被投訴次數(shù)的誤差平方和只包含隨機誤差組間平方和(betweengroups)因素的不同水平之間數(shù)據(jù)誤差的平方和比如,4個行業(yè)被投訴次數(shù)之間的誤差平方和既包括隨機誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理
(誤差平方和—SS)數(shù)據(jù)的誤差用平方差分析的基本思想和原理
(均方—MS)平方和除以相應的自由度若原假設成立,組間均方與組內均方的數(shù)值就應該很接近,它們的比值就會接近1若原假設不成立,組間均方會大于組內均方,它們之間的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,即自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,也就是檢驗被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響方差分析的基本思想和原理
(均方—MS)平方和除以相應的自由方差分析的基本假定方差分析的基本假定方差分析的基本假定每個總體都應服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本比如,每個行業(yè)被投訴的次數(shù)必須服從正態(tài)分布各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,4個行業(yè)被投訴次數(shù)的方差都相等觀察值是獨立的比如,每個行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨立方差分析的基本假定每個總體都應服從正態(tài)分布方差分析中的基本假定在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否有顯著影響,實際上也就是檢驗具有同方差的4個正態(tài)總體的均值是否相等如果4個總體的均值相等,可以期望4個樣本的均值也會很接近4個樣本的均值越接近,推斷4個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中的基本假定在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否方差分析中的基本假定如果原假設成立,即H0:
m1=m2=m3=m44個行業(yè)被投訴次數(shù)的均值都相等意味著每個樣本都來自均值為、方差為2的同一正態(tài)總體
Xf(X)1
2
3
4
方差分析中的基本假定如果原假設成立,即H0:m1方差分析中的基本假定若備擇假設成立,即H1:
mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的4個樣本分別來自均值不同的4個正態(tài)總體
Xf(X)3
1
2
4
方差分析中的基本假定若備擇假設成立,即H1:mi(i方差分析的基本假定
(圖形分析—正態(tài)概率圖)方差分析的基本假定
(圖形分析—正態(tài)概率圖)問題的一般提法問題的一般提法問題的一般提法設因素有k個水平,每個水平的均值分別用1,2,,k
表示要檢驗k個水平(總體)的均值是否相等,需要提出如下假設:H0:
12…k
H1:
1,2,,k
不全相等設1為零售業(yè)被投訴次數(shù)的均值,2為旅游業(yè)被投訴次數(shù)的均值,3為航空公司被投訴次數(shù)的均值,4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設為H0:
1234
H1:
1,2,3,4
不全相等問題的一般提法設因素有k個水平,每個水平的均值分別用1,9.2單因素方差分析9.2.1數(shù)據(jù)結構9.2.2分析步驟9.2.3關系強度的測量9.2.4方差分析中的多重比較9.2單因素方差分析9.2.1數(shù)據(jù)結構單因素方差分析的數(shù)據(jù)結構
(one-wayanalysisofvariance)
觀察值(j)因素(A)i
水平A1水平A2
…水平Ak12::n
x11
x21
…
xk1x12
x22
…
xk2::
:
:::
:
:x1n
x2n
…
xkn單因素方差分析的數(shù)據(jù)結構
(one-wayanalysis分析步驟提出假設構造檢驗統(tǒng)計量統(tǒng)計決策分析步驟提出假設一般提法H0:m1=m2=…=
mk
自變量對因變量沒有顯著影響
H1:m1,m2,…,mk不全相等自變量對因變量有顯著影響
注意:拒絕原假設,只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等提出假設一般提法構造檢驗的統(tǒng)計量構造統(tǒng)計量需要計算水平的均值全部觀察值的總均值誤差平方和均方(MS)
構造檢驗的統(tǒng)計量構造統(tǒng)計量需要計算構造檢驗的統(tǒng)計量
(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式為式中:ni為第i個總體的樣本觀察值個數(shù)
xij為第i個總體的第j個觀察值
構造檢驗的統(tǒng)計量
(計算水平的均值)假定從第i個總體中抽取一構造檢驗的統(tǒng)計量
(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數(shù)計算公式為構造檢驗的統(tǒng)計量
(計算全部觀察值的總均值)全部觀察值的總和構造檢驗的統(tǒng)計量
(例題分析)構造檢驗的統(tǒng)計量
(例題分析)構造檢驗的統(tǒng)計量
(計算總誤差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為前例的計算結果
SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構造檢驗的統(tǒng)計量
(計算總誤差平方和SST)全部觀察值構造檢驗的統(tǒng)計量
(計算組間平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度該平方和既包括隨機誤差,也包括系統(tǒng)誤差計算公式為前例的計算結果SSA=1456.608696構造檢驗的統(tǒng)計量
(計算組間平方和SSA)各組平均值構造檢驗的統(tǒng)計量
(計算組內平方和SSE)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況該平方和反映的是隨機誤差的大小計算公式為前例的計算結果SSE=2708構造檢驗的統(tǒng)計量
(計算組內平方和SSE)每個水平或組的構造檢驗的統(tǒng)計量
(三個平方和的關系)總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系SST=SSA+SSE前例的計算結果4164.608696=1456.608696+2708構造檢驗的統(tǒng)計量
(三個平方和的關系)總離差平方和(SST構造檢驗的統(tǒng)計量
(計算均方MS)各誤差平方和的大小與觀察值的多少有關,為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差由誤差平方和除以相應的自由度求得三個平方和對應的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE的自由度為n-k構造檢驗的統(tǒng)計量
(計算均方MS)各誤差平方和的大小與觀察值構造檢驗的統(tǒng)計量
(計算均方MS)組間方差:SSA的均方,記為MSA,計算公式為組內方差:SSE的均方,記為MSE,計算公式為構造檢驗的統(tǒng)計量
(計算均方MS)組間方差:SSA的均方,構造檢驗的統(tǒng)計量
(計算檢驗統(tǒng)計量F)將MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構造檢驗的統(tǒng)計量
(計算檢驗統(tǒng)計量F)將MSA和MSE進構造檢驗的統(tǒng)計量
(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a
F分布F(k-1,n-k)0拒絕H0不能拒絕H0F構造檢驗的統(tǒng)計量
(F分布與拒絕域)如果均值相等,F(xiàn)=MSA統(tǒng)計決策
將統(tǒng)計量的值F與給定的顯著性水平的臨界值F進行比較,作出對原假設H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值F
若F>F,則拒絕原假設H0,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響若F<F,則不拒絕原假設H0,無證據(jù)表明所檢驗的因素對觀察值有顯著影響統(tǒng)計決策將統(tǒng)計量的值F與給定的顯著性水平的臨界值F單因素方差分析表
(基本結構)誤差來源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(誤差)SSEn-kMSE總和SSTn-1單因素方差分析表
(基本結構)誤差來源平方和自由度均方(MS單因素方差分析
(例題分析)單因素方差分析
(例題分析)用Excel進行方差分析
(Excel分析步驟)第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項第3步:在分析工具中選擇【單因素方差分析】
,然后選擇【確定】第4步:當對話框出現(xiàn)時
在【輸入?yún)^(qū)域】方框內鍵入數(shù)據(jù)單元格區(qū)域在【】方框內鍵入0.05(可根據(jù)需要確定)在【輸出選項】中選擇輸出區(qū)域用Excel進行方差分析用Excel進行方差分析
(Excel分析步驟)第1步:關系強度的測量關系強度的測量關系強度的測量
拒絕原假設表明因素(自變量)與觀測值之間有顯著關系組間平方和(SSA)度量了自變量(行業(yè))對因變量(投訴次數(shù))的影響效應只要組間平方和SSA不等于0,就表明兩個變量之間有關系(只是是否顯著的問題)當組間平方和比組內平方和(SSE)大,而且大到一定程度時,就意味著兩個變量之間的關系顯著,大得越多,表明它們之間的關系就越強。反之,就意味著兩個變量之間的關系不顯著,小得越多,表明它們之間的關系就越弱關系強度的測量拒絕原假設表明因素(自變量)與觀測值之間有顯關系強度的測量
變量間關系的強度用自變量平方和(SSA)占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2,即其平方根R就可以用來測量兩個變量之間的關系強度
關系強度的測量變量間關系的強度用自變量平方和(SSA)占關系強度的測量
(例題分析)
R=0.591404結論行業(yè)(自變量)對投訴次數(shù)(因變量)的影響效應占總效應的34.9759%,而殘差效應則占65.0241%。即行業(yè)對投訴次數(shù)差異解釋的比例達到近35%,而其他因素(殘差變量)所解釋的比例近65%以上
R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關系
關系強度的測量
(例題分析)方差分析中的多重比較
(multiplecomparisonprocedures)方差分析中的多重比較
(multiplecomparis多重比較的意義通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異可采用Fisher提出的最小顯著差異方法,簡寫為LSDLSD方法是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的多重比較的意義通過對總體均值之間的配對比較來進一步檢驗到底哪多重比較的步驟提出假設H0:mi=mj(第i個總體的均值等于第j個總體的均值)H1:mimj(第i個總體的均值不等于第j個總體的均值)計算檢驗的統(tǒng)計量:計算LSD決策:若,拒絕H0;若
,不拒絕H0多重比較的步驟提出假設多重比較分析
(例題分析)第1步:提出假設檢驗1:檢驗2:檢驗3:檢驗4:檢驗5:檢驗6:多重比較分析
(例題分析)第1步:提出假設方差分析中的多重比較
(例題分析)第2步:計算檢驗統(tǒng)計量檢驗1:檢驗2:檢驗3:檢驗4:檢驗5:檢驗6:方差分析中的多重比較
(例題分析)第2步:計算檢驗統(tǒng)計量方差分析中的多重比較
(例題分析)第3步:計算LSD檢驗1:檢驗2:檢驗3:檢驗4:檢驗5:檢驗6:方差分析中的多重比較
(例題分析)第3步:計算LSD方差分析中的多重比較
(例題分析)第4步:作出決策不能認為零售業(yè)與旅游業(yè)均值之間有顯著差異
不能認為零售業(yè)與航空公司均值之間有顯著差異不能認為零售業(yè)與家電業(yè)均值之間有顯著差異不能認為旅游業(yè)與航空業(yè)均值之間有顯著差異不能認為旅游業(yè)與家電業(yè)均值之間有顯著差異航空業(yè)與家電業(yè)均值有顯著差異方差分析中的多重比較
(例題分析)第4步:作出決策不能認為零9.3雙因素方差分析9.3.1雙因素方差分析及其類型9.3.2無交互作用的雙因素方差分析9.3.3有交互作用的雙因素方差分析9.3雙因素方差分析9.3.1雙因素方差分析及其雙因素方差分析
(two-wayanalysisofvariance)
分析兩個因素(行因素row和列因素column)對試驗結果的影響如果兩個因素對試驗結果的影響是相互獨立的,分別判斷行因素和列因素對試驗數(shù)據(jù)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復雙因素方差分析(two-factorwithoutreplication)如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結果產生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復雙因素方差分析(two-factorwithreplication)雙因素方差分析
(two-wayanalysisofv雙因素方差分析的基本假定每個總體都服從正態(tài)分布對于因素的每一個水平,其觀察值是來自正態(tài)分布總體的簡單隨機樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨立的雙因素方差分析的基本假定每個總體都服從正態(tài)分布無交互作用的雙因素方差分析
(無重復雙因素分析)無交互作用的雙因素方差分析
(無重復雙因素分析)雙因素方差分析
(例題分析)不同品牌的彩電在5個地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4個品牌的彩電在5個地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對銷售量的影響,對每個品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?(=0.05)雙因素方差分析
(例題分析)不同品牌的彩電在5個地區(qū)的銷數(shù)據(jù)結構
數(shù)據(jù)結構數(shù)據(jù)結構
是行因素的第i個水平下各觀察值的平均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 年度財務報表及審計結果
- 河南省駐馬店市部分學校2024-2025學年高三下學期3月月考地理試題(含答案)
- 基于區(qū)塊鏈技術的農業(yè)溯源體系構建方案
- 服裝設計與制造業(yè)務外包合作協(xié)議
- 個性化培訓計劃實施效果分析表
- 網絡優(yōu)化服務升級合作協(xié)議
- 汽車采購銷售合同書及保修條款
- 智能醫(yī)療項目合作協(xié)議
- 企業(yè)危機管理機制構建與運行
- 交通行業(yè)交通事故處理保障預案
- 2025年國家鐵路局工程質量監(jiān)督中心招聘歷年高頻重點提升(共500題)附帶答案詳解
- 2024年03月浙江南潯銀行春季招考筆試歷年參考題庫附帶答案詳解
- 執(zhí)行立案申請書模版
- 智能建筑外掛電梯安裝方案
- 2024屆廣東省廣州市高三一模考試英語試題講評課件
- 數(shù)字電子技術(廣東工業(yè)大學)知到智慧樹章節(jié)測試課后答案2024年秋廣東工業(yè)大學
- 安徽省淮北一中2025屆高三沖刺模擬數(shù)學試卷含解析
- 白云山生態(tài)停車場工程施工組織設計施工方案
- 2022年CSCO軟組織肉瘤診療指南
- 盆底康復課件
- CNAS認可準則、規(guī)則考核專項測試題附答案
評論
0/150
提交評論