




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理筆記谷鐘汝說明此文檔為試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理的讀書筆記,其中較為詳細(xì)介紹了正交設(shè)計(jì)、均勻設(shè)計(jì)等內(nèi)容,以及相關(guān)的SAS實(shí)現(xiàn),方便同學(xué)學(xué)習(xí)。此文檔僅為學(xué)習(xí)交流之用。谷鐘汝試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理目錄目錄第一章試驗(yàn)設(shè)計(jì)概述 (3一、類型 (3二、基本概念 (3三、三要素和四原則 (4第二章比較試驗(yàn)與方差分析 (7一、兩個(gè)處理的水平對(duì)比 (7二、方差分析 (8第三章單因素優(yōu)化試驗(yàn)設(shè)計(jì) (17一、均分法 (17二、對(duì)分法 (17三、黃金分割法 (17四、分?jǐn)?shù)法 (17第四章多因素優(yōu)化試驗(yàn) (18一、因素輪換法 (18二、隨機(jī)試驗(yàn) (18三、拉丁方設(shè)計(jì) (18第五章正交設(shè)計(jì) (2
2、1一、原理 (21二、用正交表安排實(shí)驗(yàn) (21三、一般的正交分析 (21四、有交互作用的正交設(shè)計(jì) (28五、水平不等的正交設(shè)計(jì) (31六、獨(dú)立重復(fù)試驗(yàn) (36七、篩選實(shí)驗(yàn) (39八、正交設(shè)計(jì)與區(qū)組設(shè)計(jì) (41第六章均勻設(shè)計(jì) (47一、原理及簡(jiǎn)單介紹 (47二、均勻表的介紹 (47三、均勻設(shè)計(jì)的實(shí)驗(yàn)結(jié)果分析 (49第七章穩(wěn)健性設(shè)計(jì) (561E-mail :904374049 谷鐘汝 河北大學(xué)生命科學(xué)學(xué)院 2一、 基本概念 (56試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第一章試驗(yàn)設(shè)計(jì)概述3 試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第一章試驗(yàn)設(shè)計(jì)概述試驗(yàn)設(shè)計(jì)(design of experiment, DOE:對(duì)試驗(yàn)進(jìn)行科學(xué)合理的安排,以達(dá)到
3、最好的試驗(yàn)效果。一、類型1.演示實(shí)驗(yàn)就是我們中小學(xué)時(shí)做的那種實(shí)驗(yàn)。2.驗(yàn)證實(shí)驗(yàn)3.比較實(shí)驗(yàn)檢驗(yàn)一種或多種處理的效果,比如對(duì)生產(chǎn)工藝效果的檢驗(yàn),對(duì)一種新藥物療效的檢驗(yàn),這種實(shí)驗(yàn)的設(shè)計(jì)需要結(jié)合專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì)兩方面的知識(shí)。4.優(yōu)化實(shí)驗(yàn)按實(shí)驗(yàn)因素的數(shù)目不同可以分為單因素實(shí)驗(yàn)設(shè)計(jì)和多因素實(shí)驗(yàn)設(shè)計(jì);按實(shí)驗(yàn)?zāi)康牟煌梢苑譃橹笜?biāo)水平優(yōu)化和穩(wěn)健性優(yōu)化(指標(biāo)水平優(yōu)化的目的是優(yōu)化實(shí)驗(yàn)指標(biāo)的平均水平,而穩(wěn)健性優(yōu)化的目的是減少產(chǎn)品指標(biāo)的波動(dòng)標(biāo)準(zhǔn)差;按形式不同可以分為實(shí)物實(shí)驗(yàn)和計(jì)算實(shí)驗(yàn);按過程不同還可以分為序貫實(shí)驗(yàn)設(shè)計(jì)和整體實(shí)驗(yàn)設(shè)計(jì)(序貫實(shí)驗(yàn)就是從一個(gè)起點(diǎn)出發(fā),稱為“爬山法”,如0.618法、分?jǐn)?shù)法、因素輪換法;整體
4、實(shí)驗(yàn)就是在實(shí)驗(yàn)之前就已經(jīng)把實(shí)驗(yàn)的位置確定好了,如正交設(shè)計(jì)和均勻設(shè)計(jì)。5.探索實(shí)驗(yàn)二、基本概念1.實(shí)驗(yàn)因素因素或因子,是實(shí)驗(yàn)的設(shè)計(jì)者希望考察的實(shí)驗(yàn)條件。因素的具體取值就是水平(level。2.處理按照因素的給定水平對(duì)實(shí)驗(yàn)對(duì)象所做的操作稱為處理。接受處理的實(shí)驗(yàn)對(duì)象稱為實(shí)驗(yàn)單元。3.實(shí)驗(yàn)指標(biāo)E-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 衡量實(shí)驗(yàn)結(jié)果好壞程度的指標(biāo)稱為實(shí)驗(yàn)指標(biāo),也成為響應(yīng)變量(response variable。例題:大豆的產(chǎn)量實(shí)驗(yàn),考察N對(duì)大豆產(chǎn)量的影響,每畝地的施肥量分別為0、1、2、3Kg。則N肥施加量就是實(shí)驗(yàn)因素,它有四個(gè)水平,按每一種N肥量的水平所做的施肥就是
5、一種處理,共有四中處理,其中施肥量為0的也可以稱為空白處理。播種大豆的地就是實(shí)驗(yàn)單元,大豆的畝產(chǎn)量就是實(shí)驗(yàn)指標(biāo)。這屬于單因素實(shí)驗(yàn),若同時(shí)考察N肥和P肥的施加量,就變成了雙因素實(shí)驗(yàn),若P肥也有四個(gè)水平,那么就會(huì)有16個(gè)處理三、三要素和四原則1.三要素試驗(yàn)設(shè)計(jì)的一項(xiàng)重要工作就是確定可能影響試驗(yàn)指標(biāo)的實(shí)驗(yàn)因素,并根據(jù)專業(yè)知識(shí)初步確定因素水平的范圍。實(shí)驗(yàn)的因素應(yīng)該盡量選擇為數(shù)量因素,少用或不用品質(zhì)因素。實(shí)驗(yàn)效應(yīng)用試驗(yàn)指標(biāo)反映,也要盡量選擇數(shù)量的試驗(yàn)指標(biāo)。2.四原則隨機(jī)化是指每個(gè)處理以概率均等的原則,隨機(jī)地選擇實(shí)驗(yàn)單元。統(tǒng)計(jì)學(xué)中的很多方法都是建立在獨(dú)立樣本的基礎(chǔ)上的,用隨機(jī)化原則設(shè)計(jì)和實(shí)施的實(shí)驗(yàn)就可以保
6、證實(shí)驗(yàn)數(shù)據(jù)的獨(dú)立性。由于實(shí)驗(yàn)的個(gè)體差異、操作差異以及其他影響因素的存在,同一處理對(duì)不同的實(shí)驗(yàn)單元所產(chǎn)生的效果也是有差異的。通過一定數(shù)量的重復(fù)試驗(yàn),該處理的真實(shí)效應(yīng)就會(huì)比較確定的顯現(xiàn)出來。獨(dú)立重復(fù)實(shí)驗(yàn)在相同的處理?xiàng)l件下對(duì)不同的實(shí)驗(yàn)單元做多次實(shí)驗(yàn),這是人們通常意義下的獨(dú)立重復(fù)試驗(yàn)。在相同的處理?xiàng)l件下對(duì)同一個(gè)樣品做多次重復(fù)試驗(yàn),以排除操作方法產(chǎn)生的誤差。例外:研究減肥效果的一個(gè)實(shí)驗(yàn),對(duì)受試者每隔一周測(cè)量一次體重,連續(xù)測(cè)量五周作為一個(gè)實(shí)驗(yàn)周期,這樣得到的五次測(cè)量數(shù)據(jù)不是在同一個(gè)實(shí)驗(yàn)條件下的五次獨(dú)立實(shí)驗(yàn)數(shù)據(jù),因?yàn)橛嘘P(guān)聯(lián)性,但也屬于重復(fù)試驗(yàn),具體統(tǒng)計(jì)分析方法,見胡良平寫的現(xiàn)代統(tǒng)計(jì)學(xué)與SAS應(yīng)用一書。試驗(yàn)設(shè)
7、計(jì)與數(shù)據(jù)處理第一章試驗(yàn)設(shè)計(jì)概述 對(duì)照組不施加任何處理因素。對(duì)照組要采用一種無藥理作用的安慰劑,因?yàn)榫裥睦硪蛩匾埠苤匾?。但要求采用雙盲實(shí)驗(yàn)(受試者與實(shí)驗(yàn)者都不知道服用的是安慰劑還是藥物。對(duì)照組不施加處理因素,但施加與處理組因素相同的實(shí)驗(yàn)條件。對(duì)照組在試驗(yàn)中是一種處理,在統(tǒng)計(jì)分析中作為實(shí)驗(yàn)因素的一個(gè)水平。例如N肥施肥量的四個(gè)水平,0就是空白對(duì)照組。人為劃分的時(shí)間、空間、設(shè)備等實(shí)驗(yàn)條件稱為區(qū)組(block。區(qū)組因素也是影響試驗(yàn)指標(biāo)的因素,但并不是實(shí)驗(yàn)者所要考察的因素,也稱為非處理因素。因?yàn)樗械膶?shí)驗(yàn)條件都不是理想的,他們之間必然存在差異,最好的解決方法就是把區(qū)組因素也納入實(shí)驗(yàn)中。例如施肥實(shí)驗(yàn)中,但
8、是地塊土壤的狀況對(duì)單產(chǎn)也有影響,有的地塊土壤松軟,有的地塊比較堅(jiān)硬。所以說這塊土壤的狀況就是試驗(yàn)中要考察的區(qū)組。四個(gè)原則之間的關(guān)系按照是否考察區(qū)組因素,隨機(jī)設(shè)計(jì)可以分為兩種方式:完全隨機(jī)化設(shè)計(jì)每一個(gè)處理都隨機(jī)的選取實(shí)驗(yàn)單元,適用于實(shí)驗(yàn)的例數(shù)較大或?qū)嶒?yàn)單元差異小的情況。還是施肥的例子(哈哈,全書就這一個(gè)例子,將實(shí)驗(yàn)地分為100塊,每一個(gè)水平都隨機(jī)的選擇其中的25個(gè)塊地。隨機(jī)化區(qū)組設(shè)計(jì)如果上述例子中的實(shí)驗(yàn)塊地只有16塊,那么完全隨機(jī)化的話,不同的處理所分配到的這塊土壤的性狀就會(huì)好壞不均,導(dǎo)致結(jié)果失真,則這個(gè)時(shí)候就要采用隨機(jī)化區(qū)組設(shè)計(jì),使好地和差地在幾個(gè)處理中均衡分配。這個(gè)試驗(yàn)中的好壞就是區(qū)組因素,
9、選取的16個(gè)試驗(yàn)地塊中要包括8個(gè)好地和8個(gè)差地。這種方式就是隨機(jī)化區(qū)組設(shè)計(jì),其目的就是把性狀不同的實(shí)驗(yàn)單元均衡的非配給每個(gè)處理。試驗(yàn)中的各個(gè)處理和各區(qū)組內(nèi)的實(shí)驗(yàn)次數(shù)都相同時(shí)稱為平衡設(shè)計(jì)(balanced designE-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 之前的施肥實(shí)驗(yàn)中,如果不考慮區(qū)組因素,那么4種施肥量的處理中,每一個(gè)處理都分配到4塊試驗(yàn)樣地,重復(fù)4次;如果考慮好壞,那么每一個(gè)處理都分配都2個(gè)好地和2個(gè)差地,是重復(fù)次數(shù)為2次的實(shí)驗(yàn)。區(qū)組原則與對(duì)照原則的關(guān)系相同點(diǎn)就是,同屬于費(fèi)希爾提出的局部控制原則;差異就是統(tǒng)計(jì)分析中,對(duì)照組的比較實(shí)驗(yàn)屬于單因素實(shí)驗(yàn),而區(qū)組因素則是影響
10、實(shí)驗(yàn)指標(biāo)的其他因素,與實(shí)驗(yàn)因素共同構(gòu)成了多因素實(shí)驗(yàn)。試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第二章比較試驗(yàn)與方差分析 第二章比較試驗(yàn)與方差分析比較試驗(yàn)的目的就是水平對(duì)比,兩個(gè)處理之間的水平對(duì)比用t檢驗(yàn),多個(gè)處理之間的水平對(duì)比則要用方差分析。一些簡(jiǎn)單的例題可以用Excel的數(shù)據(jù)分析工具解決,但是復(fù)雜的則需要用SPSS或者SAS來解決,但是軟件之間的算法不同。一、兩個(gè)處理的水平對(duì)比案例:研究一種新安眠藥的療效,安慰組6人,服藥組8人,原始數(shù)據(jù)如下圖: 1.先做方差齊性檢驗(yàn) 由結(jié)果可以看出雙側(cè)檢驗(yàn)的p=2×0.013351=0.02670<0.05,說明兩個(gè)處理下的方差有顯著差異,所以要采用雙樣本異方差分
11、析。雙樣本異方差分析 由結(jié)果可以看出單側(cè)檢驗(yàn)p=0.041663<0.05,可以認(rèn)為有顯著差異,雙側(cè)則認(rèn)為沒有顯著差異。選擇單側(cè)還是雙側(cè),原則就是能否利用專業(yè)知識(shí)確定。比如本例中可以利用專業(yè)知識(shí)確定該安眠藥至多是無效,則可以選擇單側(cè)檢驗(yàn)。這里的P值表示判定該安眠藥顯著有效所犯錯(cuò)誤的概率,這個(gè)錯(cuò)誤是指該安眠藥無效而判定它有效的錯(cuò)誤(當(dāng)該E-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 安眠藥有效時(shí)而判定它有效時(shí)是正確判斷,也即棄真錯(cuò)誤關(guān)于方差齊性的問題:在試驗(yàn)的處理數(shù)目多于兩個(gè)時(shí),要使用方差分析比較多個(gè)處理間平均水平的差異,而方差分析的前提條件就是方差齊性,所以等方差的假設(shè)是普
12、遍的。等方差的檢驗(yàn)效率要比異方差要高,當(dāng)樣本量較小時(shí),兩者相差較大,但是在大樣本(每個(gè)處理的樣本大于30時(shí),兩種檢驗(yàn)相差不大,此時(shí)推薦用異方差,因?yàn)榈确讲畹募僭O(shè)總是近似的,其檢驗(yàn)結(jié)果就是一種“軟結(jié)論”。兩個(gè)處理的比例差異檢驗(yàn):例如要檢驗(yàn)?zāi)撤N藥物的有效性,有效的病例記為1,無效的記為0,然后用t檢驗(yàn)即可,但是要注意,如果是檢驗(yàn)兩個(gè)比例是否相等,那么使用等方差t檢驗(yàn);如果檢驗(yàn)兩個(gè)比例的差異是否超出了一定的程度,就要使用異方差t 檢驗(yàn)。不合格品率等問題也都可以做類似的處理。這種檢驗(yàn)實(shí)際上就是醫(yī)學(xué)統(tǒng)計(jì)中四個(gè)表的相關(guān)性檢驗(yàn),并且具有更強(qiáng)的檢驗(yàn)功能,一方面可以做單側(cè)檢驗(yàn),另一方面還可以檢驗(yàn)兩個(gè)比例的差異是
13、否達(dá)到某一個(gè)界限。二、方差分析1.單因素方差分析案例:四種炮彈結(jié)構(gòu)對(duì)直射距離的影響。 1.4. 結(jié)果解釋差異源:組間表示處理之間,反應(yīng)因素各水平之間的差異;組內(nèi)反映處理內(nèi)的差異,也就是隨機(jī)誤差。離差平方和:SS 就是離差平方和,SSA 表示組間離差平方和,也就是因素A 的離差平方和 SSA =(yi y 2nij=1a i=1 組內(nèi)平方和記為 SSE 也就是誤差平方和 總離差平方和為 SST =SSA +SSE自由度:組間的自由度也就是因素的自由度,是因素水平數(shù)減1,總自由度是數(shù)據(jù)個(gè)數(shù)減1,本例是31,組內(nèi)的自由度也就是誤差的自由度,等于總自由度減因素的自由度,即31-3=28均方:也就是離差
14、平方和除以自由度:MSA =SSA/(a 1 MSE =SSE/(n a F 統(tǒng)計(jì)量:構(gòu)造出來的F 統(tǒng)計(jì)量等于因素的均方除以誤差的均方。 2. 雙因素方差分析案例:加上區(qū)組因素的炮彈結(jié)構(gòu)對(duì)直射舉例的影響。 2.1. 數(shù)據(jù)準(zhǔn)備 2.2. 方法 2.3. 輸出結(jié)果 “樣本”是指行因素,也就是區(qū)組因素火炮;列是指炮彈結(jié)構(gòu)因素;內(nèi)部是指誤差項(xiàng),另外還有一個(gè)交互項(xiàng),指的是交互效應(yīng)??梢钥闯鯬=0.058>0.05,略大于0.05,但是我們還不能就此說他們之間不存在顯著差異。需要進(jìn)一步的檢驗(yàn):方法有兩種:一個(gè)是增大樣本量,另一個(gè)就是做進(jìn)一步的統(tǒng)計(jì)分析。第二種方法:由于三個(gè)因素都不顯著,則可以把最不顯
15、著的一項(xiàng)歸入誤差項(xiàng),來增加誤差項(xiàng)的自由度,提高檢驗(yàn)的效率??梢钥闯鼋换ロ?xiàng)的P值最大,則把它劃入誤差項(xiàng),即認(rèn)為火炮與炮彈結(jié)構(gòu)之間沒有交互作用。這就屬于重復(fù)試驗(yàn)無交互作用的情況了。然而此時(shí)Excel的不足之處就顯示出來了,沒有提供此項(xiàng)分析功能,可以借助SPSS或SAS 來解決。不過也可以手算:手算可以幫助理解其中的算法,但是過程太繁瑣。誤差平方和SSE=5290.5+546.5=5837.0誤差自由度Df=19+6=25均方誤差MSE=5837/25=223.48炮彈結(jié)構(gòu)因素A(列FA=MSA/MSE=1010.11/223.48=4.326區(qū)組因素火炮B(樣本FB=MSB/MSE=478.95/
16、223.48=2.051A因素的P值則可以用公式“=FDIST(4.326,3,25”B因素的P值公式“=FDIST(2.051,3,25”得出的結(jié)果為:A因素的P值為0.0138,B因素的P值為0.1323。則可以認(rèn)為不同結(jié)構(gòu)炮彈對(duì)直射距離有顯著影響,不同火炮對(duì)其沒有影響。關(guān)于誤差項(xiàng)的合并:此例中涉及到了誤差項(xiàng)的合并,把不顯著的因素和交互作用合并到誤差項(xiàng)中,使其他因素和交互作用的顯著性增加,這是多因素方差分析的通用做法。一般是把均方小于誤差項(xiàng)的均方或者P值大于0.20的項(xiàng)合并到誤差項(xiàng)中,對(duì)于正交設(shè)計(jì),由于合并誤差項(xiàng)后其他因素的離差平方和不變,因此可以同時(shí)合并多項(xiàng)。附:單方差分析原理單因素方差
17、分析通過一個(gè)簡(jiǎn)單的例子,通俗的解釋方差分析的思想。1、【案例】2004年雅典奧運(yùn)會(huì),要考察北京(第一組、上海(第二組和廣州(第三組的三組居民在關(guān)于“國際奧委會(huì)全球合作伙伴”的態(tài)度上有沒有顯著的差異,即要檢驗(yàn)從“態(tài)度”上看,這三組居民的樣本是取自態(tài)度相同的同一總體還是取自態(tài)度不同的總體。2、方差分析思想介紹:組間的變差:假定將三個(gè)城市的居民按前面所述分成三個(gè)組,由于種種原因,每一組居民在“態(tài)度得分”上也是隨機(jī)波動(dòng)的。因此從每一組中個(gè)隨機(jī)地抽取5位居民,測(cè)量了他們的“態(tài)度得分”如表1所示,表中還給出了每個(gè)樣本的平均態(tài)度得分值。表1 表2第一組第二組第三組82 79 8381 80 8482 80
18、8382 81 8583 80 85 X1=82X2=80X3=84樣本1 樣本2 樣本379 80 8182 84 8484 83 8480 80 8580 83 81 X1=81X2=82X3=83那么,現(xiàn)在的一個(gè)問題是:這三個(gè)組的態(tài)度真的是有差異的嗎?換句話說,表格中樣本均值 X的不同是由于潛在總體均值的不同產(chǎn)生的嗎?(表示其中一個(gè)組的全體居民的平均態(tài)度分,如果不是,那么樣本均值 X中的這些差異是否可以僅僅認(rèn)為是由于隨機(jī)波動(dòng)造成的?為了說明這一點(diǎn),假定我們從某一組(比如北京組中抽取三個(gè)樣本,如表2所示。正如我們所預(yù)料的,盡管在這種情況下三個(gè)樣本取自同一總體,因而其均值是相同的, 但抽樣的
19、波動(dòng)也引起了各個(gè) X之間的微小差別。因此,我們可以將問題重新敘述如下:表1中 X間的差別和表2中 X間的差別大體上階數(shù)相同呢(因此說明表1中的 X間的差別也是由于隨機(jī)波動(dòng)造成的,還是表1中X間的差別大得多,從而足以說明潛在總體的均值之間存在差異?由直觀上看,似乎后一種解釋更符合實(shí)際,那么怎樣給出一個(gè)正確的檢驗(yàn)?zāi)?和通常那樣,在總體均值中“無差異”的假設(shè)稱為原假設(shè),即:H0:1=2=3檢驗(yàn)H0首先要求測(cè)量一下樣本均值之間相差多少,為此要找到一個(gè)合適的、能描述各組之間變差的量,我們可以先求出這三個(gè)樣本的總平均值X。X=1X=1(82+80+84=82其中c表示小組數(shù)或列數(shù),然后計(jì)算樣本均值 X相對(duì)
20、于其總均值 X的總方差S x2=1( XX2=1(82822+(80822+(84822=4由S x2的定義可知,它是一個(gè)描述組間(列間變差的量。對(duì)于表2中的數(shù)據(jù),由于三個(gè)樣本取自同一總體,那么應(yīng)該樣本間的變差較小,事實(shí)上,計(jì)算得到的結(jié)果為1。組內(nèi)的變差:前面給出的各組均值之間的方差S x2還不能完全說明問題。例如,考慮表3中的數(shù)據(jù),顯然,它的總方差S x2和表1中的相同。但是,每一組的樣本態(tài)度得分都是十分不穩(wěn)定,每列都有很大的隨機(jī)波動(dòng)。比如圖1與圖2分別給出了潛在總體的可能形狀。從圖2中可以看到,表3對(duì)應(yīng)的三個(gè)組的態(tài)度得分是十分不穩(wěn)定的,因此三個(gè)樣本都有可能是取自同一總體的,也就是說,樣本均
21、值之間的差異可以解釋為是隨機(jī)波動(dòng)產(chǎn)生的。但是對(duì)于表1,從圖1中可以看到,樣本均值之間的差異卻很難用隨機(jī)因素來解釋,因?yàn)樵谶@種情況下三個(gè)組內(nèi)的態(tài)度得分并非那么不穩(wěn)定?,F(xiàn)在我們也就有了比較的標(biāo)準(zhǔn)。在圖2中,我們的結(jié)論是:三個(gè)之間并不是完全相同的,因?yàn)闃颖揪档姆讲頢 x2相對(duì)于隨機(jī)波動(dòng)來說是比較大的,因此我們拒絕H0。那 么我們?cè)鯓硬拍軌蚨攘窟@些隨機(jī)波動(dòng)即組內(nèi)的變差呢?從直觀上看,應(yīng)當(dāng)是每個(gè)樣本內(nèi)觀測(cè)值的變化程度或偏離其均值的程度。為此我們先計(jì)算表1中第一個(gè)樣本內(nèi)的偏差平方和:(X1X12=(82822+(81822+(82822+(82822+(83822=2表3樣本1 樣本2 樣本380 79
22、 8185 84 8786 76 8078 83 8781 78 85X1=82X2=80X3=84 類似地計(jì)算第2個(gè)樣本和第3個(gè)樣本的內(nèi)的偏差平方和,將它們向相加,然后用所有3個(gè)樣本的總自由度(每個(gè)樣本的自由度都為n-1=4去除,這樣就得到了聯(lián)合方差S p2。S p2=2+2+4=2聯(lián)合方差的計(jì)算繼續(xù)推廣到C組(列數(shù)據(jù),每組數(shù)據(jù)有n個(gè)觀測(cè)值的情形:S p2=(X1X12+(X2X22+···+(X cX c2由S p2的定義可以知道,它是一個(gè)描述組內(nèi)變差的量,對(duì)于表3中的數(shù)據(jù),我們有理由猜測(cè)其聯(lián)合方差一定比表1的大得多,事實(shí)上表3中數(shù)據(jù)的聯(lián)合方差為343。F比值
23、: E-mail :904374049 谷鐘汝 河北大學(xué)生命科學(xué)學(xué)院那么現(xiàn)在就可以給出檢驗(yàn)統(tǒng)計(jì)量了,是否拒絕原假設(shè),要看組間變差相對(duì)于組內(nèi)變 差來說是否足夠大,也就是說要考察比值S x 2/S p 2的大小。但是,我們習(xí)慣上是用一個(gè)稍微修改一下的比值:F =nS x 2S p 2 其中一個(gè)分子多乘上一個(gè)n 是為了使當(dāng)H 0為真時(shí)分子的值平均上來說等于分母(試想為什么?如果H 0為真,那么F 比值將圍繞著1波動(dòng);如果H 0不真,此時(shí)幾個(gè)值是不相同的,那么nS x 2將相對(duì)地會(huì)大于S p 2,這時(shí)F 比值將傾向于比1大得多。因此,F 值越大,則原假設(shè)越不可信。為了從數(shù)量上來度量H 0的可信程度,就
24、像通常我們求H 0的概率值那樣,這時(shí),概率值就等于F 分布中超過實(shí)際觀測(cè)值的尾部概率。除此之外,還需知道自由度,因?yàn)镕 分布是取決于分子方差的自由度(c 1和分母方差的自由度c (n 1的。第一自由度(分子自由度df 1=c 1第二自由度(分母自由度df 2=c (n 1綜上所述,那么解決此問題的具體方法歸納如下:對(duì)于表1中的數(shù)據(jù),我們求出的三個(gè)樣本間的總方差為S x 2=4以及三個(gè)樣本的聯(lián)合方差S p 2=23 F 的比值:F =nS x 2p 2=5×423=30 自由度:df 1=c 1=31=2df 2=c (n 1=3(51=12查表可知,F 大于臨界值,也就是概值小于0.
25、001這就意味著如果H 0為真,那么抽取到如表1中的數(shù)據(jù),有這么大差異的三個(gè)樣本的機(jī)會(huì)小于千分之一,因此可以認(rèn)為表1中的三個(gè)組的態(tài)度得分均值是不同的,即來自三試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理 第二章 比較試驗(yàn)與方差分析個(gè)城市的三個(gè)組的居民,其態(tài)度得分屬于三個(gè)不同的總體。 最后,方差分析可以簡(jiǎn)潔的用一張表格來表示:表4方差分析表變差的來源 變差(平方和SS 自由度df 方差(平均平方和MSS F 比值組間變差(由于X 間的差異造成的 SS b =n ( X 1X 2+( X 2X 2+····+( X c X 2 c 1 MSS b =SSb (=nS x 2 F =M
26、SS bMSS w=nSx 2S p 2組內(nèi)變差(由于隨機(jī)波動(dòng)造成的殘差 SS w =(X 1X 12+(X 2X 22+···+(X c X c 2 c (n 1 MSS w=SS wc (n 1=S p 2總和 SS t =(X X 2nc 1用自由度去除對(duì)應(yīng)變差,就得到了表4中的方差,根據(jù)各組可能屬于不同的總體(態(tài)度有差異的總體這一事實(shí),可以“解釋”組間的方差。組內(nèi)的方差是“不能解釋的”,因?yàn)樗鼈兪菬o法系統(tǒng)地(用總體的差異來解釋的隨機(jī)或偶然的方差。因此F 比值有時(shí)也叫方差比,也就是F =可以解釋的方差不能解釋的方差樣本量不相等的方差分析上文表1中,每一組所取
27、的觀測(cè)數(shù)(n=5是相同的,一般來說,這是收集數(shù)據(jù)比較有效的辦法,即讓所有的樣本有相同的樣本量n 。但是,當(dāng)樣本量n 1,n 2,n 3,···不相同時(shí),如何分析?方法如下:現(xiàn)在總觀測(cè)數(shù)是n 1+n 2+···+n c =N ,而不再是nc 。表中所有數(shù)值的總平均為E-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 X=Xn1+n2+···+n c=XN或者,將總均值X清楚的表示成各組均值的一種加權(quán)平均的形式,即X=n1X1+n2X2+···+n c X c12c=n
28、X那么各組(列之間的變差也就相應(yīng)的變成SS b=n1(X1X2+n2(X2X2+···自由度也做相應(yīng)的變化,總自由度不再是nc1,而是df=n1+n2+···+n c1=N1組(列內(nèi)自由度c(n1則變成列內(nèi)自由度df=(n11+(n21+···+(n31=(n i1=Nc修改后的方差分析表變差的來源變差(平方和SS自由度df方差(平均平方和MSSF比值列間變差(由于列均值X i間的差異造成的SS列=( X iX2ci=1c1MSS列=SS列(=nS x2F=MSS列殘=nS x2S p2(列內(nèi)變差殘差(由
29、于觀測(cè)值X ij和列均值X i間的差異造成的SS殘=(X ijn ij=1ci=1X i2(n i1ci=1=NcMSS殘=SS殘(n i1ci=1=S p2合計(jì)SS總=(X ijn ij=1ci=1X2n11ci=1=N1其中X=全部X ij的總平均X=X ijn i=n i X in i試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第三章單因素優(yōu)化試驗(yàn)設(shè)計(jì) 第三章單因素優(yōu)化試驗(yàn)設(shè)計(jì)一、均分法均分法是單因素試驗(yàn)設(shè)計(jì)方法,它是在因素水平的試驗(yàn)范圍a,b內(nèi)按等間隔安排實(shí)驗(yàn)點(diǎn),但是均分法適合于每一個(gè)處理費(fèi)用都不高的簡(jiǎn)單實(shí)驗(yàn)。二、對(duì)分法對(duì)分法也就是等分發(fā)、平分法,應(yīng)用的很廣泛,比如地下輸電線路發(fā)生故障,這種實(shí)驗(yàn)不是整體設(shè)計(jì),而
30、是每一次試驗(yàn)后才能確定下一次實(shí)驗(yàn)位置,屬于序貫實(shí)驗(yàn),原理很簡(jiǎn)單。三、黃金分割法黃金分割法就是0.618法,由華羅庚教授提出來的,應(yīng)用也很廣泛,其實(shí)本質(zhì)上跟對(duì)分法是沒有區(qū)別的。當(dāng)時(shí)華羅庚在基層發(fā)現(xiàn),實(shí)際生活中有兩類問題:一類關(guān)于組織管理,一類關(guān)于產(chǎn)品的質(zhì)量。把生產(chǎn)組織好,盡量減少窩工現(xiàn)象,找出影響工期的原因,合理安排時(shí)間,統(tǒng)籌人力物力,使產(chǎn)品生產(chǎn)的觀呢更好更快更多,在這一方面,統(tǒng)籌法大有可為。再就是優(yōu)選法,它能以最少的實(shí)驗(yàn)次數(shù),迅速找到生產(chǎn)的最優(yōu)方案。黃金分割法適用于試驗(yàn)指標(biāo)或目標(biāo)函數(shù)是單峰函數(shù)的情況,要求實(shí)驗(yàn)的因素水平可以精確測(cè)量,但是試驗(yàn)指標(biāo)只要能比較出好壞就行。四、分?jǐn)?shù)法分?jǐn)?shù)法也就是斐波那
31、契法,是用斐波那契數(shù)列安排實(shí)驗(yàn)的。和0.618法相似,也是適用于試驗(yàn)范圍a,b內(nèi)目標(biāo)函數(shù)為單峰的情況,但是需要預(yù)先給出實(shí)驗(yàn)次數(shù),尤其適用于因素水平僅取整數(shù)值或有限個(gè)值的情況。E-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 第四章多因素優(yōu)化試驗(yàn)概述:日本在20世紀(jì)60年代開始推廣正交設(shè)計(jì)的方法,10年間使用正交表超過100萬次,豐田公司當(dāng)時(shí)對(duì)正交設(shè)計(jì)方法的評(píng)價(jià)是:在為公司產(chǎn)品質(zhì)量改進(jìn)做出貢獻(xiàn)的各種方法中,田口方法占50%。20世紀(jì)20年代以來,歐美國家也積極推廣使用試驗(yàn)設(shè)計(jì)的方法,但是局限于數(shù)學(xué)方法奧秘的析因設(shè)計(jì),從80年代開始,正交設(shè)計(jì)被引入美國,首先在福特公司開始使用,之后取得
32、了廣泛應(yīng)用,所以說,試驗(yàn)設(shè)計(jì)技術(shù)是過去50年日本工業(yè)快速增長(zhǎng)的決定性因素。一、因素輪換法因素輪換法是一種簡(jiǎn)單的多因素優(yōu)化方法,它的想法是每次試驗(yàn)中只變化一個(gè)因素的水平,其他因素的水平保持固定不變,希望逐一地把每一個(gè)因素對(duì)實(shí)指標(biāo)的影響摸清,分別找到每個(gè)因素的最優(yōu)水平。這個(gè)方法只適合于因素間沒有交互作用的情況,當(dāng)因素間有交互作用的時(shí)候,每次變動(dòng)一個(gè)因素的做法不能反應(yīng)因素間交互作用的效果。二、隨機(jī)試驗(yàn)隨機(jī)試驗(yàn)是按照隨機(jī)化的原則選擇試驗(yàn)點(diǎn)或者實(shí)驗(yàn)因素水平(隨機(jī)布點(diǎn),上邊的因素輪換法是一種選擇因素水平的試驗(yàn)方法,正交設(shè)計(jì)、均勻設(shè)計(jì)、析因設(shè)計(jì)都是合理的選擇實(shí)驗(yàn)因素水平的方法,但是在一些特殊的情況下,可能這
33、些人為精心設(shè)計(jì)的實(shí)驗(yàn)條件難以實(shí)現(xiàn),就要采用隨機(jī)試驗(yàn)法,一種情況就是實(shí)驗(yàn)水平只能觀測(cè),不能嚴(yán)格控制(比如利用氣象氣球收集氣象數(shù)據(jù)。另一種就是試驗(yàn)水平間有約束關(guān)系,比如有約束的配方設(shè)計(jì)(后期介紹。三、拉丁方設(shè)計(jì)1.定義拉丁方設(shè)計(jì)是正交設(shè)計(jì)、均勻設(shè)計(jì)、析因設(shè)計(jì)等試驗(yàn)設(shè)計(jì)方法的起源,所謂的拉丁方就是用字母或者數(shù)字排列的具有一定性質(zhì)的方陣,每一個(gè)字母在每行和每列中恰好出現(xiàn)一次。方陣的行數(shù)或例數(shù)就是拉丁方的階數(shù)二階的拉丁方表A B a bB A b a三階拉丁方表試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第四章 多因素優(yōu)化試驗(yàn) A B C B C A C A B(標(biāo)準(zhǔn)拉丁方表:就是第一行和第一列的排列順序是按字母排序 用途一般的
34、拉丁方設(shè)計(jì),用于安排只有一個(gè)處理因素和兩個(gè)區(qū)組因素時(shí)的水平比較。 案列考察四種催化劑(處理因素A 的效果,同時(shí)考慮反應(yīng)溫度(區(qū)組因素B 和原材料的批次(區(qū)組因素C 的影響。三個(gè)因素都取4個(gè)水平。如果此實(shí)驗(yàn)中只有一個(gè)區(qū)組因素B ,那么就可以直接用雙因素方差分析,但是現(xiàn)在又多了一個(gè)C 因素,因此采用拉丁方設(shè)計(jì)。1.1. 4階拉丁方設(shè)計(jì)表區(qū)組因素B區(qū)組因素C1 2 3 4 1 b a c d 2 d c a b 3 c d b a 4abdc表中的a 、b 、c 、d 分別表示因素A 的四個(gè)水平。上表可以進(jìn)行轉(zhuǎn)化,如下表。表格化的4階拉丁方設(shè)計(jì)實(shí)驗(yàn)號(hào) 區(qū)組因素B區(qū)組因素C區(qū)組因素A1 1 12 2
35、1 2 13 1 3 34 1 4 45 2 1 46 2 2 37 2 3 18 2 4 29 3 1 3 10 3 2 4 11332E-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 12 3 4 113 4 1 114 4 2 215 4 3 416 4 4 3這個(gè)表格可以看出拉丁方設(shè)計(jì)具有的一個(gè)重要性質(zhì)正交性。正交性可以保證每個(gè)因素的水平在統(tǒng)計(jì)學(xué)上是不相關(guān)的,具體表現(xiàn)在兩個(gè)方面:(1均勻分散性。表的每一列中不同數(shù)字出現(xiàn)的次數(shù)相等。(2整齊可比性。表的任意兩列所構(gòu)成的有序數(shù)對(duì)出現(xiàn)的次數(shù)相等。拉丁方也被成為兩向區(qū)組設(shè)計(jì),也就是有一個(gè)處理因素和兩個(gè)區(qū)組因素,是平衡設(shè)計(jì),每種搭配下
36、都是做一次實(shí)驗(yàn),因此也稱為平衡雙向區(qū)組設(shè)計(jì)。實(shí)際上,區(qū)組因素可以跟試驗(yàn)因素互換的,這并不影響正交性。所以,進(jìn)一步來講,拉丁方設(shè)計(jì)還可以用來安排兩個(gè)處理因素和一個(gè)區(qū)組因素,或者三個(gè)處理因素沒有區(qū)組因素的試驗(yàn)設(shè)計(jì)。其他形式的變化,試驗(yàn)中有一個(gè)實(shí)驗(yàn)因素,和三個(gè)區(qū)組因素的成為希臘拉丁方設(shè)計(jì),只要再找一個(gè)與前三列正交的列就行。還有一中就是尤登方區(qū)組設(shè)計(jì),是行數(shù)和列數(shù)不相等的“不完全”拉丁方區(qū)組設(shè)計(jì),也就是缺少一行或幾行的拉丁方設(shè)計(jì),此時(shí)便不再有正交性。試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第五章正交設(shè)計(jì) 第五章正交設(shè)計(jì)一、原理正交設(shè)計(jì)就是在全面實(shí)驗(yàn)的樣本點(diǎn)中挑選出部分有代表性的樣本點(diǎn)做實(shí)驗(yàn),這些點(diǎn)具有正交性。是由日本學(xué)者田
37、口玄一于40年代提出來的,正交試驗(yàn)設(shè)計(jì)就是使用orthogonal array來安排實(shí)驗(yàn)。常見的正交表有L4(23,L8(27,L16(45以及混合水平L18(2×37等。用正交表安排實(shí)驗(yàn)就是把實(shí)驗(yàn)的因素(包括區(qū)組因素安排到正交表列,允許有空白列,把因素水平按安排到正交表的行。L n(a p表示最多可以安排P個(gè)水平數(shù)目為a的因素,需要做n次實(shí)驗(yàn)(含有n個(gè)處理性質(zhì):正交性。正交表的列之間具有正交性,正交性可以保證每?jī)蓚€(gè)因素的水平在統(tǒng)計(jì)學(xué)上是不相關(guān)的,具體表現(xiàn)在兩個(gè)方面:均勻分散性。在正交表的每一列中,不同數(shù)字出現(xiàn)的次數(shù)相等。整齊可比性。對(duì)于正交表的任意兩列,將同一行的兩個(gè)數(shù)字看做有序數(shù)
38、對(duì),每種數(shù)對(duì)出現(xiàn)的次數(shù)是相等的。例如L9(34表,有序數(shù)對(duì)一共有9個(gè),(1,1(1,2(1,3 (2,1(2,2(2,3(3,1(3,2(3,3,它們各出現(xiàn)一次。二、用正交表安排實(shí)驗(yàn)選擇合適的正交試驗(yàn)表,在實(shí)施過程中有一個(gè)問題需要強(qiáng)調(diào),那就是做實(shí)驗(yàn)的順序要依照隨機(jī)化的原則,可以采用抽簽的方式確定。按隨機(jī)化順序做實(shí)驗(yàn)的目的是盡量避免實(shí)驗(yàn)因素外的其他因素對(duì)實(shí)驗(yàn)的影響,避免實(shí)驗(yàn)受區(qū)組因素的影響。比如說假如實(shí)驗(yàn)員在實(shí)驗(yàn)過程中對(duì)這項(xiàng)實(shí)驗(yàn)逐漸熟悉,則實(shí)驗(yàn)的效果會(huì)越來越好,當(dāng)然也可以把人也看成一個(gè)區(qū)組因素,3個(gè)人便是3個(gè)水平將其放到空白列上,那么該列的1、2、3水平便是三個(gè)不同的人,這樣就避免了人為變動(dòng)所造
39、成的誤差。三、一般的正交分析案列1:某化工廠生產(chǎn)一種化工產(chǎn)品,采收率低并且不穩(wěn)定,一般在60%-80%之間波動(dòng)。現(xiàn)在希望通過試驗(yàn)設(shè)計(jì),找到好的生產(chǎn)方案,提高采收率。分析:三個(gè)因素,每個(gè)因素三個(gè)水平,因此選擇L9(34正交試驗(yàn)表。1.數(shù)據(jù)準(zhǔn)備原始的因素與水平表水平因素E-mail:904374049 谷鐘汝河北大學(xué)生命科學(xué)學(xué)院 A反應(yīng)溫度B加堿量C催化劑種類1 A1=80 B1=35 C1=甲種2 A2=85 B2=48 C2=乙種3 A3=90 B3=55 C3=丙種放到L9(34正交試驗(yàn)表中列號(hào) 1 2 3 4試驗(yàn)號(hào) A B C D(空白列實(shí)驗(yàn)結(jié)果y1 1 1 1 1 512 1 2 2 2
40、 713 1 3 3 3 584 2 1 2 3 825 2 2 3 1 696 2 3 1 2 597 3 1 3 2 778 3 2 1 3 859 3 3 2 1 842.結(jié)果分析簡(jiǎn)便的一種方法,無需統(tǒng)計(jì)學(xué)知識(shí)。分為兩種:一是直接看好的條件,比如8號(hào)試驗(yàn)的采收率最高,但是8號(hào)試驗(yàn)條件不一定就是最優(yōu)方案。二就是通過計(jì)算得到。方法如下:試驗(yàn)號(hào) A B C D(空白列實(shí)驗(yàn)結(jié)果y1 1 1 1 1 512 1 2 2 2 713 1 3 3 3 584 2 1 2 3 825 2 2 3 1 696 2 3 1 2 597 3 1 3 2 77試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理第五章正交設(shè)計(jì) 8 3 2 1 3
41、 859 3 3 2 1 84T1 180 210 195 204T2 210 225 237 207T3 246 201 204 225T1均60 70 65 68T2均70 75 79 69T3均82 67 68 75R 22 8 14 7用excel計(jì)算結(jié)果如上圖,T1,T2,T3分別為各個(gè)因素1、2、3水平的結(jié)果之和TT1A=y1+y2+y3 T1B=y1+y4+y7Ti均=Ti/3 “T1均”行A因素下的值為60表示反應(yīng)溫度為80時(shí)的平均采收率為60%R=最大值-最小值,可以反應(yīng)對(duì)試驗(yàn)的影響程度。需要說明的是,空白列的各個(gè)值也需要計(jì)算出來。從上表中可以看出最優(yōu)的實(shí)驗(yàn)條件為:A3B2C
42、2分析極差:可以看出A因素的影響最大,B因素的影響最小。畫趨勢(shì)圖: 、 從圖中可以看出反應(yīng)溫度越高越好,因而有必要進(jìn)一步判斷實(shí)驗(yàn)的反應(yīng)溫度是否還可以提高。成本分析:比如B 因素對(duì)采收量沒有多大的影響,那么就要在考慮到成本的基礎(chǔ)上適當(dāng)?shù)膶?duì)B 做出調(diào)整。綜合分析與撒細(xì)網(wǎng):得到最優(yōu)的水平搭配后,還可以在該基礎(chǔ)上微調(diào),最后一步是對(duì)得出的最有搭配進(jìn)行驗(yàn)證。以上的方法稱為直觀分析法,通過極差的大小來評(píng)價(jià)各因素對(duì)試驗(yàn)指標(biāo)影響的程度,但是,極差的大小并沒有一個(gè)客觀的評(píng)價(jià)標(biāo)準(zhǔn),而且不能估計(jì)試驗(yàn)過程及試驗(yàn)結(jié)果測(cè)定中必然存在的誤差,因而不能區(qū)分某因素各水平所對(duì)應(yīng)的試驗(yàn)結(jié)果的差異究竟是由于水平的改變所引起的,還是由試
43、驗(yàn)誤差所引起的。這時(shí)候便要用到下邊的方法了方差分析法。SST =(y i y 2ni=1因素A 的離差平方和:SSA =n i (T i y2a i=1 其中a=3是A 因素的水平數(shù),i n 是在第i 水平下所做的實(shí)驗(yàn)的次數(shù),也就是計(jì)算 T i 時(shí)所用到的數(shù)據(jù)個(gè)數(shù)。本例中i n =n/a=9/3=3,A 因素在每一個(gè)水平下都是做了3次實(shí)驗(yàn)。 Ti 是在前面的直觀分析方法中計(jì)算出的A 因素的每一水平下的實(shí)驗(yàn)平均值。然后可以分別計(jì)算出SSB 和SSC 。這里有兩種方法計(jì)算:方法一:空白列計(jì)算。本例中的第四列沒有安排因素,是空白列,雖然空白列上沒有因素,但是在數(shù)據(jù)的方差分析中也有自己的作用,actu
44、ally 空白列恰好反映了誤差程度。同樣按照上述的方式計(jì)算空白列的離差平方和,如果有多個(gè)空白列,那就要分別計(jì)算出相應(yīng)的離差平方和相加,空白列的自由度之和就是誤差平方和的自由度。方法二:公式:SSE=SSTSSASSBSSC這是一個(gè)通用的方法,如果不考慮交互作用的話,上述公式即為:誤差平方和=總離差平方和-各因素離差平方和之和特例:有的時(shí)候方法一不適用,因?yàn)檫@時(shí)候列離差平方和只是誤差平方和的一部分,空白列離差平方和的自由度小于誤差平方和的自由度,用空白列做誤差就會(huì)減少誤差平方和的自由度,從而降低方差分析的效率,使得一些對(duì)試驗(yàn)指標(biāo)有顯著影響的因素被誤認(rèn)為沒有顯著影響。方差分析表因素A SSA a-
45、1 SSA/(a-1 MSA/MSE因素B SSB a-1 SSB/(a-1 MSB/MSE因素C SSC a-1 SSC/(a-1 MSC/MSE誤差(空白列SSE a-1 SSE/(n-1總和SST n-1SPSS實(shí)現(xiàn)方差分析步驟在其他文章中寫道,下邊主要是用SAS實(shí)現(xiàn)的方差分析。SAS實(shí)現(xiàn)方法:DATA zhjiao1;input A B C y;output; cards;1 1 1 51 12 2 711 3 3 582 1 2 82 2 23 69 2 3 1 593 1 3 77 3 2 1 85 3 3 2 84 proc anova; class A B C; model y
46、=A B C; means A B C; run;解釋:Proc anova 是調(diào)用方差分析命令其中的class A B C意思是指定A、B、C這三個(gè)變量為定類變量,Model y=A B C指明方差分析模型中的試驗(yàn)指標(biāo)與因素,即因變量與自變量Means A B C語句用于計(jì)算因素各個(gè)水平的均值。其中切記數(shù)據(jù)后邊不要輸入“;”這個(gè)本人測(cè)試過,否則SAS可能會(huì)把數(shù)據(jù)塊的一行或者幾行作為程序語句處理。同樣,本例中要注意,輸入數(shù)據(jù)的時(shí)候,不要輸入空白列的值 結(jié)果: 關(guān)于自由度的計(jì)算:各列的自由度是水平數(shù)減1,總自由度是試驗(yàn)次數(shù)減1,模型的自由度6是三個(gè)因素自由度之和。本列中的P值雖然都大于0.05,
47、但是還不能急于斷定3各因素均不顯著,這時(shí)要剔除一個(gè)最不顯著的因素。觀察到B的P值為0.4674,最不顯著,踢出師門。然后重新做方差分析。只需將上述語句改為“model=A C”結(jié)果為: 關(guān)于剔除不顯著因素的討論:可以看出剔除B因素后A、C因素的離差平方和都沒有改變,這是由于正交表的正交性決定的額,是正交表的一個(gè)優(yōu)良性質(zhì),但是剔除B因素后SSE從86增加到了184,正好增加了98(B因素的離差平方和。所以有的書上也叫此種方法為合并誤差項(xiàng)。Actually,剔除B因素后把B因素所在的第2列和空白列第4列都作為了誤差項(xiàng),這時(shí)候的SSE的自由度為4。關(guān)于為什么將其并入誤差項(xiàng),原因就是B因素太不顯著了,
48、SSE就到了86,而SSB只有98。我們還可以發(fā)現(xiàn),剔除B因素前F A=8,47大于剔除B因素后的7.91,但是顯著性卻提高了,為什么F值減小而顯著性反而提高呢?這正是把B因素并入誤差項(xiàng)的緣故,它使得誤差項(xiàng)的自由度增大,提高了檢驗(yàn)的功效。除了用SAS實(shí)現(xiàn)方差分析,還可以用EXCEL的函數(shù)計(jì)算得到,步驟有些繁瑣,不過為了練習(xí)一下函數(shù),還是試一下數(shù)據(jù)輸入: 主要用了以下的函數(shù):計(jì)算水平1均值:B11=SUMIF(B$2:B$10,$A2,$E$2:$E$10/3SUMIF函數(shù)的使用說明:SUMIF(range,criteria,sum_rangerange 為用于條件判斷的單元格區(qū)域。criter
49、ia 為確定哪些單元格將被相加求和的條件,其形式可以為數(shù)字、表達(dá)式、文本或單元格內(nèi)容。例如,條件可以表示為32、"32"、">32" 、"apples"或A1。條件還可以使用通配符:問號(hào)(? 和星號(hào)(*,如需要求和的條件為第二個(gè)數(shù)字為2的,可表示為"?2*",從而簡(jiǎn)化公式設(shè)置。問號(hào)匹配任意單個(gè)字符;星號(hào)匹配任意一串字符。如果要查找實(shí)際的問號(hào)或星號(hào),請(qǐng)?jiān)谠撟址版I入波形符( sum_range 是需要求和的實(shí)際單元格。補(bǔ)充:SUMIF函數(shù)可對(duì)滿足某一條件的單元格區(qū)域求和,該條件可以是數(shù)值、文本或表達(dá)式,可以應(yīng)用
50、在人事、工資和成績(jī)統(tǒng)計(jì)中。仍以上圖為例,在工資表中需要分別計(jì)算各個(gè)科室的工資發(fā)放情況。要計(jì)算銷售部2001年5月加班費(fèi)情況。則在F15中輸入公式為=SUMIF($C:$C,"銷售部",$F:$F ,其中"$C:$C"為提供邏輯判斷依據(jù)的單元格區(qū)域,"銷售部"為判斷條件即只統(tǒng)計(jì)$C:$C區(qū)域中部門為"銷售部"的單元格,$F:$F為實(shí)際求和的單元格區(qū)域。多條件求平均數(shù):A VERAGEIFS(計(jì)算數(shù)據(jù)區(qū)域,條件區(qū)域1,條件1,條件區(qū)域2,條件2,條件區(qū)域3,條件3,即求同時(shí)符合三個(gè)條件的數(shù)據(jù)記錄平均數(shù),例如: =A V
51、ERAGEIFS(G3:G16,B3:B16,"手機(jī)",G3:G16,">=4000" 。 SST=DEVSQ(E2:E10DEVSQ函數(shù)的使用說明:返回?cái)?shù)據(jù)點(diǎn)與各自樣本均值偏差的平方和F值的計(jì)算只是用了一下絕對(duì)引用:F A(B17=B16/$F16P值的計(jì)算:B18=FDIST(B17,B15,$F15FDIST函數(shù)使用說明:=FDIST(F值,因素的自由度,誤差的自由度四、有交互作用的正交設(shè)計(jì)1.原理若因素間有交互作用,則需要考慮其交互作用。安排有交互作用的正交設(shè)計(jì)不僅要把實(shí)驗(yàn)因素安排在正交表的列上,同時(shí)還要把正交表所附帶的交互作用表查出交互作
52、用所在的列,把因素與交互作用都安排在正交表上,這就是表頭設(shè)計(jì)交互作用表列號(hào) 1 2 3 4 5 6 71 32 5 4 7 62 1 6 7 4 53 7 6 5 44 1 2 35 3 26 1第1列與第2列的交互作用列體現(xiàn)在第3列(A×B,然后第3個(gè)因素放在第4列,因?yàn)榈?列已經(jīng)放了交互作用,便不能再放置其他因素,這就是避免混雜原則。表頭設(shè)計(jì)表頭A B A×B C A×C D設(shè)計(jì)列號(hào) 1 2 3 4 5 6 72.案例在降低柴油機(jī)耗油率的研究中,根據(jù)專業(yè)技術(shù)人員的分析,影響耗油率的4個(gè)主要因素和水平見下表。(耗油率越小越好因素名稱單位1水平2水平A 噴嘴器的噴
53、嘴形式類型B 噴油泵柱塞直徑mm 16 14C 供油提前角度(° 30 33B 配氣相位(°120 140實(shí)驗(yàn)號(hào) A B A×B C A×C D 空白y1 2 3 4 5 6 71 1 1 1 1 1 1 1 228.62 1 1 1 2 2 2 2 225.83 1 2 2 1 1 2 2 230.24 1 2 2 2 2 1 1 218.05 2 1 2 1 2 1 2 220.86 2 1 2 2 1 2 1 215.87 2 2 1 1 2 2 1 228.5直接看好的條件是8號(hào)試驗(yàn),水平搭配為A2B2C2D1直觀分析法:T1-220 5.65
54、2.75 4.425 7.025 2.35 0.55 2.725T2-220 -0.025 2.875 1.2 -1.4 3.275 5.075 2.9R 5.675 0.125 3.225 8.425 0.925 4.525 0.175 從上表中可以看出:C因素對(duì)其影響最大,其次是A因素,最小的是B因素,但是不能說明B因素對(duì)耗油率沒有影響,因?yàn)锳×B的極差值為3.225并不小。說明A與B 之間可能存在交互作用。方差分析法:SAS實(shí)現(xiàn)過程:data zhjiao2;input A B C D y; output;cards;1 1 1 1 228.6 1 12 2 225.8 1 2
55、 1 2 230.21 2 2 1 218.02 1 1 1 220.8 2 1 2 2215.8 2 2 1 2 228.5 2 221214.8 proc anova ; class A B C D; model y=A B C D A*B A*C; means A B C D; run ;輸出結(jié)果: 解釋:B 因素的P 值最大,不顯著;但是A 與C 的交互作用還要經(jīng)一部考慮,把最不顯著的B 因素剔除后重新做方差分析即可。然而任何統(tǒng)計(jì)軟件都有規(guī)定,如果方差分析中包含某一個(gè)交互作用,那么就必須同時(shí)包含兩個(gè)因素。此時(shí)有兩個(gè)解決方案:一個(gè)是用EXCEL 計(jì)算,計(jì)算步驟省略,無非就是各個(gè)函數(shù)的應(yīng)用;第二個(gè)解決方案就是把A×B ,A×C 作為兩個(gè)因素AB ,AC 看待,將對(duì)應(yīng)的列水平也同時(shí)輸入到SAS 里。SAS 過程修改如下: data zhjiao3;input A AB C AC D y; output ; cards ; 1 1 1 1 1 228.6 1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中信銀行濟(jì)南分行招聘真題2024
- 甘肅省事業(yè)單位招聘真題2024
- 化學(xué)力驅(qū)醫(yī)療創(chuàng)新
- 廣東省深圳市2022-2023學(xué)年九年級(jí)上學(xué)期期末數(shù)學(xué)考前模擬試卷(一)(原卷版)
- 2025至2030年中國水輪數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國平板硫化機(jī)組市場(chǎng)調(diào)查研究報(bào)告
- 2025━2030年中國移栽靈項(xiàng)目投資可行性研究報(bào)告
- 2025-2035年全球及中國乳房手術(shù)定位行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及發(fā)展前景研究報(bào)告
- 工程項(xiàng)目月度審視
- 趣味插花培訓(xùn)
- 2025年海南??谑兴畡?wù)局招聘事業(yè)單位人員35人歷年高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- COP生產(chǎn)一致性控制計(jì)劃
- 中考英語專題總復(fù)習(xí)-題型9省公開課一等獎(jiǎng)百校聯(lián)賽賽課微課獲獎(jiǎng)?wù)n件
- 2025年電力人工智能多模態(tài)大模型創(chuàng)新技術(shù)及應(yīng)用報(bào)告-西安交通大學(xué)
- 天津2025年天津市機(jī)關(guān)后勤事務(wù)服務(wù)中心分支機(jī)構(gòu)天津市迎賓館招聘2人筆試歷年參考題庫附帶答案詳解
- 華東師大版七年級(jí)數(shù)學(xué)下冊(cè)“第1周周考”
- 教師論文撰寫培訓(xùn)
- 2024年道路運(yùn)輸企業(yè)安全生產(chǎn)管理人員證考試題庫
- EPC總承包管理方案
- 安全生產(chǎn)管理體系建設(shè)講解
- 化工設(shè)備巡檢培訓(xùn)
評(píng)論
0/150
提交評(píng)論