方差分析與試驗(yàn)設(shè)計(jì)【完成大部分】_第1頁
方差分析與試驗(yàn)設(shè)計(jì)【完成大部分】_第2頁
方差分析與試驗(yàn)設(shè)計(jì)【完成大部分】_第3頁
方差分析與試驗(yàn)設(shè)計(jì)【完成大部分】_第4頁
方差分析與試驗(yàn)設(shè)計(jì)【完成大部分】_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

6方差分析與實(shí)驗(yàn)設(shè)計(jì)方差分析引論方差分析:k個總體均值相等性檢驗(yàn)多重比較方法實(shí)驗(yàn)設(shè)計(jì):完全隨機(jī)化設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì):隨機(jī)化區(qū)組設(shè)計(jì)析因?qū)嶒?yàn)什么是方差分析例:某公司在亞特蘭大、達(dá)拉斯以及西雅圖的工廠生產(chǎn)打印機(jī)與傳真機(jī)。為確定這些工廠中有多少員工了解全面質(zhì)量管理,從每個工廠選取一個由6名員工組成的隨機(jī)樣本,并對他們進(jìn)行質(zhì)量意識考試。管理者想用這些數(shù)據(jù)來檢驗(yàn)假設(shè):三個工廠的平均考分相同。ObservationAtlantaDallasSeattle185715927575643827362476746957169756858267樣本均值797466樣本方差342032樣本標(biāo)準(zhǔn)差5.834.475.66響應(yīng)變量、因子及處理兩個變量分別是工廠位置及質(zhì)量意識考試的分?jǐn)?shù)。因?yàn)槟康氖桥卸▉喬靥m大、達(dá)拉斯與西雅圖三個工廠的考分是否相同,所以考分就稱為因變量或響應(yīng)變量。工廠的位置為自變量或因子。用于研究的因子的值稱為因子水平或處理。本例中三個處理分別為亞特蘭大、達(dá)拉斯和西雅圖。方差分析的假定對每個總體,響應(yīng)變量服從正態(tài)分布。每個工廠的考試分?jǐn)?shù)(響應(yīng)變量)必須服從正態(tài)分布。響應(yīng)變量的方差,對所有總體都相同。三個工廠考分的方差都相同。觀察值是獨(dú)立的。每個員工的考分都與其他員工的考分獨(dú)立。若樣本容量相等,方差分析對于總體服從正態(tài)分布的假定不敏感。問題的一般提法在上述假定條件下,判斷工廠位置對工廠的考分是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的三個正態(tài)總體的均值是否相等。如果三個總體的均值相等,可以期望三個樣本的均值也會很接近。三個樣本的均值越接近,推斷三個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分總體方差的組間估計(jì)如果原假設(shè)成立,即H0:μ1=μ2=μ3意味著每個樣本都來自均值為μ、方差為2的同一正態(tài)總體xf(x)ObservationAtlantaDallasSeattle185715927575643827362476746957169756858267樣本均值797466樣本方差342032樣本標(biāo)準(zhǔn)差5.834.475.66總體方差的組內(nèi)估計(jì)如果備擇假設(shè)成立至少有一個總體的均值是不同的三個樣本分別來自均值不同的三個正態(tài)總體xf(x)1

236方差分析與實(shí)驗(yàn)設(shè)計(jì)方差分析引論方差分析:k個總體均值相等性檢驗(yàn)多重比較方法實(shí)驗(yàn)設(shè)計(jì):完全隨機(jī)化設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì):隨機(jī)化區(qū)組設(shè)計(jì)析因?qū)嶒?yàn)被檢驗(yàn)假設(shè)的一般形式H0:12…k

H1:1,2,,k不全相等令第j個處理的樣本均值第j個處理的樣本方差總體樣本均值如果每個樣本容量都為n,則總體方差的組間估計(jì)處理均方:總體方差的組間估計(jì)。處理平方和總體方差的組內(nèi)估計(jì)誤差均方

誤差平方和方差估計(jì)量的比較:F檢驗(yàn)假定零假設(shè)為真,這時MSTR與MSE給出σ2的兩個獨(dú)立的無偏估計(jì)。對于正態(tài)分布,σ2的兩個獨(dú)立估計(jì)之比的抽樣分布服從F分布,其分子自由度為k-1,分母自由度為nT-k。aF(k-1,n-k)0拒絕H0不拒絕H0F方差估計(jì)量的比較:F檢驗(yàn)k個總體均值相等性檢驗(yàn)H0:12…k

H1:總體均值不全相等檢驗(yàn)統(tǒng)計(jì)量顯著性水平α下的拒絕域ANOVA表ANOVA表:一種用來匯總方差分析計(jì)算和結(jié)果的表。包括顯示方差來源、平方和、自由度、均方和F值的列??偲椒胶?/p>

處理平方和

誤差平方和方差來源平方和自由度均方F處理5162258.009.00誤差4301528.67合計(jì)94617練習(xí)從3個總體中各選取了5個觀察值,得到如下資料。a.求σ2的組間估計(jì)量。(268)總體樣本均值:(153+169+158)/3=160,抽樣分布的方差:134/2=67,則組間估計(jì)量:67×4=268b.求σ2的組內(nèi)估計(jì)量。(92)組內(nèi)估計(jì)量:(96.67+97.33+82)/3=276/3=92觀察值樣本1樣本2樣本31165174169214916415431561801614142158148樣本均值153169158樣本方差96.6797.3382.00

d.構(gòu)造該問題的ANOVA表。(F=2.91<4.26,不能拒絕)方差來源平方和自由度均方F處理53622692.91誤差828992合計(jì)136411練習(xí)為檢驗(yàn)三家工廠生產(chǎn)的機(jī)器混合一批原料所需平均時間是否相同,Jacobs化學(xué)公司得到了關(guān)于混合原料所需時間的如下數(shù)據(jù)。利用這些數(shù)據(jù)檢驗(yàn)三家工廠混合一批原料所需平均時間是否相同。設(shè)α

=0.05。(F=10.64<4.26)方法完全同上例!制造商1制造商2制造商32028302626192431232227226方差分析與實(shí)驗(yàn)設(shè)計(jì)方差分析引論方差分析:k個總體均值相等性檢驗(yàn)多重比較方法實(shí)驗(yàn)設(shè)計(jì):完全隨機(jī)化設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì):隨機(jī)化區(qū)組設(shè)計(jì)析因?qū)嶒?yàn)多重比較方法多重比較方法:用于進(jìn)行成對的總體均值或處理間比較的統(tǒng)計(jì)方法。用方差分析檢驗(yàn)k個總體均值是否相等時,拒絕零假設(shè)只能得出總體均值不全相等的結(jié)論。有時我們需要進(jìn)一步檢驗(yàn)到底哪些均值之間有差異。FisherLSD方法FisherLSD

(最小顯著差異)方法例:通過方差分析,我們得出三個工廠總體平均考分不全相同的結(jié)論。這時,進(jìn)一步的問題是:盡管我們承認(rèn)這些工廠有差異,但到底差異出現(xiàn)在哪兩個廠之間呢?就是說,是總體1和總體2之間的均值不同,還是總體1和總體3之間的均值不同,還是總體2和總體3之間的均值不同?FisherLSD方法檢驗(yàn)統(tǒng)計(jì)量拒絕法則式中,tα/2是基于自由度為nT-k的t分布。ObservationAtlantaDallasSeattle樣本均值797466樣本方差5.834.475.66樣本標(biāo)準(zhǔn)差342032方差來源平方和自由度均方F處理5162258.009.00誤差4301528.67合計(jì)94617基于統(tǒng)計(jì)量的FisherLSD方法檢驗(yàn)統(tǒng)計(jì)量顯著性水平α下的拒絕法則式中使用FisherLSD方法的兩個總體均值之差的置信區(qū)間估計(jì)置信區(qū)間估計(jì)式中且tα/2是基于自由度為nT-k的t分布。第一類錯誤概率比較性第一類錯誤概率:對應(yīng)于單個配對比較的第一類錯誤概率。實(shí)驗(yàn)性第一類錯誤概率:幾個配對比較中至少有1個犯第一類錯誤的概率,記為αEW。若總體個數(shù)較多,實(shí)驗(yàn)性第一類錯誤概率則更大。控制實(shí)驗(yàn)性錯誤概率Bonferroni修正在逐個檢驗(yàn)中使用更小的比較性錯誤概率。如果要檢驗(yàn)

C個配對比較并希望總的實(shí)驗(yàn)性第一類錯誤的最大概率為

αEW,那么令比較性錯誤概率等于αEW/C對于固定的樣本容量,降低犯第一類錯誤的概率將導(dǎo)致犯第二類錯誤的概率增加。這類錯誤對應(yīng)于實(shí)際上兩個總體均值不相等,但卻接受了兩個總體均值相等的假設(shè)的情形。練習(xí)

觀察值樣本1樣本2樣本31165174169214916415431561801614142158148樣本均值153169158樣本方差96.6797.3382.00練習(xí)

觀察值樣本1樣本2樣本31165174169214916415431561801614142158148樣本均值153169158樣本方差96.6797.3382.00練習(xí)為檢驗(yàn)三家工廠生產(chǎn)的機(jī)器混合一批原料所需平均時間是否相同,Jacobs化學(xué)公司得到了關(guān)于混合原料所需時間的如下數(shù)據(jù)。利用這些數(shù)據(jù)檢驗(yàn)三家工廠混合一批原料所需平均時間是否相同。設(shè)α

=0.05。用FisherLSD方法檢驗(yàn)廠家1與廠家3均值的相等性。(LSD=3.54,有顯著差異)用FisherLSD方法求總體1與總體2均值之差的95%的置信區(qū)間估計(jì)。(-8.54,-1.46)方法完全相同!制造商1制造商2制造商32028202626192431232227226方差分析與實(shí)驗(yàn)設(shè)計(jì)方差分析引論方差分析:k個總體均值相等性檢驗(yàn)多重比較方法實(shí)驗(yàn)設(shè)計(jì):完全隨機(jī)化設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì):隨機(jī)化區(qū)組設(shè)計(jì)析因?qū)嶒?yàn)在實(shí)驗(yàn)性研究中,感興趣的變量是明確規(guī)定的。因此,研究中的一個或多個因素可以被控制,使得數(shù)據(jù)可以按照因素如何影響變量來獲得。(因果關(guān)系)在觀察性或非實(shí)驗(yàn)性研究中,則不去控制這些因素。(抽樣調(diào)查)單因子實(shí)驗(yàn)只涉及到有k個總體或處理的一個因子的實(shí)驗(yàn)。例:Chemitech開發(fā)了一種新的城市供水過濾系統(tǒng),其元件需從幾家供應(yīng)商處購買,然后Chemitech在位于南加州哥倫比亞的工廠裝配這些元件。由工程部負(fù)責(zé)確定新過濾系統(tǒng)的最佳裝配方法??紤]過各種可能之后,小組將范圍縮小至三種方法:方法A、方法B及方法C。這些方法在產(chǎn)品裝配步驟上有所不同。Chemitech的管理者希望確定哪種裝配方法每周生產(chǎn)的過濾系統(tǒng)數(shù)最大。完全隨機(jī)化設(shè)計(jì)處理被隨機(jī)地指派給實(shí)驗(yàn)單元的一種實(shí)驗(yàn)設(shè)計(jì)。假定從Chemitech的生產(chǎn)車間的全體裝配工人中抽取了由三名員工組成的樣本,這三名隨機(jī)抽取的工人被稱為實(shí)驗(yàn)單元。隨機(jī)化的概念是所有實(shí)驗(yàn)設(shè)計(jì)的一個重要原理。完全隨機(jī)化設(shè)計(jì)數(shù)據(jù)收集ObservationMethodAMethodBMethodC15858482646957355715946664475676849樣本均值626652樣本方差27.526.531.0樣本標(biāo)準(zhǔn)差5.245.155.57完全隨機(jī)化設(shè)計(jì)總體方差的組間估計(jì)總體方差的組內(nèi)估計(jì)方差估計(jì)量的比較:F檢驗(yàn)ANOVA表方差來源平方和自由度均方F處理5202260.009.18誤差3401228.33合計(jì)86014完全隨機(jī)化設(shè)計(jì)配對比較結(jié)論:方法A與方法B要優(yōu)于方法C

練習(xí)

練習(xí)

6方差分析與實(shí)驗(yàn)設(shè)計(jì)方差分析引論方差分析:k個總體均值相等性檢驗(yàn)多重比較方法實(shí)驗(yàn)設(shè)計(jì):完全隨機(jī)化設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì):隨機(jī)化區(qū)組設(shè)計(jì)析因?qū)嶒?yàn)為檢驗(yàn)處理均值之間的差異,計(jì)算F值時使用了比值當(dāng)外在因素(實(shí)驗(yàn)中沒有考慮到的因素)引起的差異導(dǎo)致該比值中MSE項(xiàng)增大時,F(xiàn)值會變小。這樣,在實(shí)際中存在差異時,F(xiàn)值卻給出處理均值之間沒有差異的信號。隨機(jī)化區(qū)組設(shè)計(jì)區(qū)組劃分:在每個處理中使用相同或相近實(shí)驗(yàn)單元的過程。目的是從誤差項(xiàng)中剔除外來方差,并因此給出總體或處理均值之間差異的更有力的檢驗(yàn)方法。隨機(jī)化區(qū)組設(shè)計(jì):采用區(qū)組劃分的一種實(shí)驗(yàn)設(shè)計(jì)。例:空中交通管制員工作壓力測試一次衡量空中交通管制員的疲勞程度與工作壓力的研究得到的結(jié)果是建議改造并重新設(shè)計(jì)管制員工作站??紤]了工作站的若干設(shè)計(jì)方案后,由于三種方案最能減輕管制員壓力而被選出。關(guān)鍵問題是:三種方案對于管制員壓力的效果有多大差異?在完全隨機(jī)化實(shí)驗(yàn)中,管制員的隨機(jī)樣本被指派給每個工作站方案。但是,管制員之間的差別是很大的。一名管制員認(rèn)為是大的壓力對于另一名管制員來說可能是中等的壓力或甚至是小的壓力。將個人差異分離出來的一種辦法是使用隨機(jī)化區(qū)組設(shè)計(jì)。例:空中交通管制員工作壓力測試隨機(jī)化區(qū)組需要管制員的一個單個樣本,樣本中每個管制員都分別在三種工作站方案下接受檢驗(yàn)。工作站是興趣因子,管制員為區(qū)組,與工作站因子有關(guān)的三個處理或總體分別對應(yīng)于三種工作站方案。為簡化起見,稱工作站方案為系統(tǒng)A、系統(tǒng)B、系統(tǒng)C。隨機(jī)化區(qū)組設(shè)計(jì)中的隨機(jī)化是指處理(系統(tǒng))指派給管制員的順序是隨機(jī)的。如果每個管制員測試三個系統(tǒng)的順序都是一樣的,任何觀察到的系統(tǒng)差異都可能歸因于檢驗(yàn)順序而不是系統(tǒng)真正的差異??罩薪煌ü苤茊T壓力測試的隨機(jī)化區(qū)組設(shè)計(jì)處理系統(tǒng)A系統(tǒng)B系統(tǒng)C區(qū)組管制員1151518管制員2141414管制員3101115管制員4131217管制員5161316管制員6131313空中交通管制員壓力測試的壓力數(shù)據(jù)匯總處理區(qū)組合計(jì)區(qū)組均值系統(tǒng)A系統(tǒng)B系統(tǒng)C區(qū)組管制員11515184816.0管制員21414144214.0管制員31011153612.0管制員41312174214.0管制員51613164515.0管制員61313133913.0處理合計(jì)81789325214.0處理均值13.513.015.5ANOVA方法將總平方和分解成三部分:處理平方和、區(qū)組平方和以及誤差平方和。SST=SSTR+SSBL+SSE計(jì)算第1步:計(jì)算總平方和(SST)第2步:計(jì)算處理平方和(SSTR)第3步:計(jì)算區(qū)組平方和(SSBL)第4步:計(jì)算誤差平方和(SSE)計(jì)算方差來源平方和自由度均方F處理21210.510.5/1.9=5.53區(qū)組3056.0誤差19101.9合計(jì)7017隨機(jī)化區(qū)組設(shè)計(jì)在某些情形,區(qū)組的劃分是針對每個區(qū)組內(nèi)的“相似的”實(shí)驗(yàn)單元而進(jìn)行的。例如,假設(shè)在關(guān)于空中交通管制員的一個預(yù)先的測試中,管制員總體被分成從極高壓力組到極低壓力組的幾個組。通過讓來自壓力分類中每一類的三名管制員參加研究,仍然可以實(shí)現(xiàn)分區(qū)組。因?yàn)橛衎個區(qū)組導(dǎo)致自由度減少了b-1,所以隨機(jī)化區(qū)組設(shè)計(jì)的誤差自由度小于完全隨機(jī)化設(shè)計(jì)的誤差自由度。如果n很小,因?yàn)檎`差自由度的減少,區(qū)組的潛在影響可能被掩蓋;當(dāng)n很大時,這種影響被最小化了。練習(xí)考慮用如下隨機(jī)化區(qū)組設(shè)計(jì)的實(shí)驗(yàn)結(jié)果,進(jìn)行建立方差分析表所需的計(jì)算。用α

=0.05,檢驗(yàn)顯著性差異。(F=6.58>4.46,拒絕)處理ABC區(qū)組1109821265318151442018185878練習(xí)對5種不同的審計(jì)方法的總審計(jì)時間進(jìn)行比較。為控制屬于進(jìn)行審計(jì)的個人的可能的方差,隨機(jī)選取了四名會計(jì)師當(dāng)作實(shí)驗(yàn)中的區(qū)組。由ANOVA方法得到下列數(shù)據(jù):SST=100,SSTR=45,SSBL=36。用α

=0.05檢驗(yàn)5種審計(jì)方法平均總審計(jì)時間是否有顯著差異。(F=7.11>3.26,拒絕)6方差分析與實(shí)驗(yàn)設(shè)計(jì)方差分析引論方差分析:k個總體均值相等性檢驗(yàn)多重比較方法實(shí)驗(yàn)設(shè)計(jì):完全隨機(jī)化設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì):隨機(jī)化區(qū)組設(shè)計(jì)析因?qū)嶒?yàn)析因?qū)嶒?yàn)析因?qū)嶒?yàn):允許進(jìn)行關(guān)于兩個或兩個以上因子統(tǒng)計(jì)推斷的一種實(shí)驗(yàn)設(shè)計(jì)。例:為嘗試提高考生在考試中的分?jǐn)?shù),一所較大的得克薩斯州的大學(xué)考慮提供下面三種GMAT輔導(dǎo)課程:(1)3小時的復(fù)習(xí);(2)1天的課程;(3)10周的強(qiáng)化班。通常GMAT的考生來自三類院校:商學(xué)院、工學(xué)院和藝術(shù)與科學(xué)學(xué)院。兩因子實(shí)驗(yàn)的GMAT分?jǐn)?shù)BusinessEngineeringArtsandSciences3-hourreview5005404805804604001-dayprogram4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論