第9章方差分析_第1頁
第9章方差分析_第2頁
第9章方差分析_第3頁
第9章方差分析_第4頁
第9章方差分析_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第9章 方差分析Statistical Analysis System本章主要內(nèi)容概述Anova過程(方差分析)Plan過程(試驗(yàn)設(shè)計(jì))單因素完全隨機(jī)設(shè)計(jì)的方差分析Glm過程(廣義線性模型)單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì)單因素隨機(jī)區(qū)組設(shè)計(jì)的方差分析(相當(dāng)于雙因素)系統(tǒng)分組(巢式)設(shè)計(jì)的方差分析雙因素?zé)o重復(fù)設(shè)計(jì)的方差分析析因設(shè)計(jì)的方差分析(完全隨機(jī)、隨機(jī)區(qū)組設(shè)計(jì)、多因素)拉丁方設(shè)計(jì)的方差分析裂區(qū)設(shè)計(jì)的方差分析重復(fù)度量設(shè)計(jì)的方差分析正交設(shè)計(jì)的方差分析Statistical Analysis System概述 在科學(xué)試驗(yàn)中,有很多研究多個(gè)處理(變量)之間差異顯著性的問題。 對多個(gè)變量均數(shù)采用兩兩比較

2、的方法進(jìn)行假設(shè)測驗(yàn),分別作出統(tǒng)計(jì)推斷,表面看是可行的。但實(shí)際上存在著三方面的缺陷: 從統(tǒng)計(jì)上夸大了變量間的差異; 割裂了變量間內(nèi)在的聯(lián)系(特別是對試驗(yàn)誤差); 加大了統(tǒng)計(jì)工作量。 基于以上考慮,1923年英國著名統(tǒng)計(jì)學(xué)家費(fèi)休(R. A. Fisher)提出了方差分析(ANOVA,ANalysis Of Variance)的統(tǒng)計(jì)方法。Statistical Analysis System概述 方差是一個(gè)表示變異的量,在一項(xiàng)試驗(yàn)或調(diào)查中往往存在著許多造成生物性狀變異的因素,這些因素有較重要的,也有較次要的。 方差分析就是將總變異分裂為各因素相應(yīng)的變異,作出其數(shù)量估計(jì),從而發(fā)現(xiàn)各因素在變異中所占的重

3、要程度; 而且除了可控因素引起的變異,剩余變異可提供試驗(yàn)誤差的準(zhǔn)確而無偏的估計(jì),作為統(tǒng)計(jì)假設(shè)測驗(yàn)的依據(jù)。 因此,方差分析在統(tǒng)計(jì)分析中占有十分重要的地位,特別是在多因素試驗(yàn)中,它可以幫助我們發(fā)現(xiàn)起主要作用的變異因素,從而抓住主要矛盾或關(guān)鍵措施。Statistical Analysis System概述 SAS中常用的方差分析過程有ANOVA過程和GLM過程。 ANOVA過程運(yùn)算速度較快,但功能較為有限; GLM過程運(yùn)算速度較慢,但功能強(qiáng)大,我們做協(xié)方差分析時(shí)也要用到GLM過程。Statistical Analysis System概述 方差分析的數(shù)據(jù)集至少應(yīng)有一個(gè)依變量(反應(yīng)變量、結(jié)果變量),用

4、于記錄不同處理因素水平下的觀測值; 至少有一個(gè)處理因素變量,用于記錄處理因素的類型和水平數(shù)。 以單因素方差分析為例,應(yīng)有一個(gè)依變量和一個(gè)處理因素變量; 兩因素的方差分析應(yīng)有一個(gè)依變量和兩個(gè)處理因素變量。Statistical Analysis SystemAnova過程 anova過程的主要功能就是進(jìn)行方差分析。 anova過程用以對平衡實(shí)驗(yàn)設(shè)計(jì)資料平衡實(shí)驗(yàn)設(shè)計(jì)資料進(jìn)行分析,不能用于對非平衡實(shí)驗(yàn)設(shè)計(jì)資料的方差分析。平衡實(shí)驗(yàn)設(shè)計(jì)資料平衡實(shí)驗(yàn)設(shè)計(jì)資料:各分組因素各水平的所有組合具有相同的樣本量或觀察值。Statistical Analysis SystemAnova過程 anova過程的一般格式如

5、下:PROC ANOVA ; CLASS variables; MODEL dependents=effects ; ABSORB variables; BY variables; FREQ variable; MANOVA ; MEANS effects; REPEATED factor-specification ; TEST E=effect; Run;Statistical Analysis SystemAnova過程 anova過程的Options:選項(xiàng)功能和用法Data=指定分析的數(shù)據(jù)集。ORDER=指定anova過程對分類變量(class語句指定的變量)各水平的排序方式,可選值:

6、 DATA按照原始數(shù)據(jù)中的順序; FORMATTED輸出格式值的順序; FREQ各水平觀察值頻數(shù)多少的順序; INTERNAL內(nèi)部值的順序。MANOVA在多變量分析時(shí),去掉有缺失值的變量。MultiPass在必要時(shí)重新讀入數(shù)據(jù),而不是將數(shù)據(jù)寫入某個(gè)中間文件,對大樣本數(shù)據(jù)處理時(shí)非常有用。NoPrint禁止將分析結(jié)果輸出到Output窗口。NameLen=指定效應(yīng)名稱字符串的長度(20-200的整數(shù)),默認(rèn)值為20。OutStat=指定存儲(chǔ)方差分析表的數(shù)據(jù)集。Statistical Analysis SystemAnova過程 Anova過程的Model語句: 格式: MODEL dependen

7、ts=effects; dependents代表依變量(即分析變量、因變量),可以是輸入數(shù)據(jù)集中的一個(gè)或多個(gè)數(shù)值型變量,多個(gè)變量間以空格相分隔。effects為方差分析模型的效應(yīng)項(xiàng),是由自變量(分組變量)以特定方式組合而成的表達(dá)式,一個(gè)模型表達(dá)式中可以同時(shí)包含多個(gè)效應(yīng)項(xiàng)。Statistical Analysis SystemAnova過程 Anova過程的Model語句: 如果沒有指定任何自變量,則模型中僅包含常數(shù)項(xiàng),此時(shí)檢驗(yàn)的內(nèi)容是依變量的均數(shù)是否為零。 model語句中指定的自變量必須是class語句中聲明過的分類變量,anova過程不允許自變量中有連續(xù)型變量(數(shù)值變量),而依變量則必須是

8、數(shù)值型變量。Statistical Analysis SystemAnova過程 Anova過程的Model語句: 自變量表達(dá)式可以有三種不同的效應(yīng)模型,模型的表達(dá)方式如下(假定依變量為y,模型中包含三個(gè)自變量:a, b, c) :(1)主效應(yīng)(Main Effect)模型: y=a b c;(2)交互效應(yīng)(Crossed effect或Interaction)模型: y=a b c a*b a*c b*c a*b*c;(3)嵌套效應(yīng)(Nested effect)模型: y=a b c(a b); 其中c因素為a、b兩因素各種組合下的二級因素。效應(yīng)(效應(yīng)(Effect):指用分類變量說明依變量

9、的關(guān)系。Statistical Analysis SystemAnova過程 Anova過程的Model語句: model語句末尾的選項(xiàng)可以設(shè)置為“intercept”和“nouni”; intercept指定SAS進(jìn)行關(guān)于常數(shù)項(xiàng)(截距)的假設(shè)檢驗(yàn)。默認(rèn)情況下,模型中包括截距,但并不顯示有關(guān)截距項(xiàng)的假設(shè)檢驗(yàn)結(jié)果。 nouni在多變量方差分析(或重復(fù)測量資料方差分析)時(shí)禁止有關(guān)單變量統(tǒng)計(jì)結(jié)果的輸出,但它不影響repeated語句所產(chǎn)生的有關(guān)單變量分析結(jié)果的顯示。Statistical Analysis SystemAnova過程 Anova過程的absorb語句: 對于僅發(fā)揮主效應(yīng)的因素,abs

10、orb語句指定SAS消除此變量的作用,只對其余變量進(jìn)行分析,起到大幅度減少計(jì)算機(jī)資源和時(shí)間消耗的作用。 應(yīng)用此功能時(shí),須先對指定變量排序,且此變量不能再出現(xiàn)在class語句和model語句中,否則將導(dǎo)致離均差平方和計(jì)算錯(cuò)誤。Statistical Analysis SystemAnova過程 Anova過程的manova語句: 當(dāng)有多個(gè)依變量時(shí),此語句控制anova過程進(jìn)入多元方差分析模式,其后的選項(xiàng)用以指定多元方差分析時(shí)的各項(xiàng)指標(biāo)。Statistical Analysis SystemAnova過程 Anova過程的means語句: 通過使用means語句,anova過程可對model語句所

11、定義的效應(yīng)計(jì)算各水平下依變量的均值、標(biāo)準(zhǔn)差 Means語句通過選項(xiàng)的設(shè)置可以實(shí)現(xiàn)對指定主效應(yīng)的組間多重比較(anova過程不能執(zhí)行模型中交互效應(yīng)的組間多重比較)。 可用時(shí)使用多條means語句,但均必須位于model語句之后。Statistical Analysis SystemAnova過程 means語句的選項(xiàng)(部分): 選項(xiàng)功能和用法Alpha=指定均數(shù)多重比較的顯著性水平,默認(rèn)為0.05。Bon對全部主效應(yīng)執(zhí)行組間多重比較的Bonferroni t檢驗(yàn)。Duncan對全部主效應(yīng)執(zhí)行組間多重比較的Duncans檢驗(yàn)(新復(fù)極差法,又叫鄧肯法,1955年由Duncan提出)。Dunnett對

12、全部主效應(yīng)執(zhí)行各組與對照組間多重比較的雙側(cè)Dunnetts t檢驗(yàn)。默認(rèn)情況下,各效應(yīng)的第一個(gè)水平將被作為對照組。Dunnettl對全部主效應(yīng)執(zhí)行各組與對照組間多重比較的單側(cè)Dunnetts t檢驗(yàn)。Gabriel對全部主效應(yīng)執(zhí)行Gabriels組間多重比較的過程。T在樣本量相等的情況下,執(zhí)行組間均數(shù)的兩兩t檢驗(yàn)過程,等同于Fisher的最小顯著差異(LSD,least significant difference)檢驗(yàn)。Statistical Analysis SystemAnova過程 means語句的選項(xiàng)(部分): 選項(xiàng)功能和用法E=指定在多重比較中用來作誤差項(xiàng)的效應(yīng),所指定的效應(yīng)必須為

13、Model語句中所飲食的效應(yīng),否則以默認(rèn)值替代。默認(rèn)情況下殘差均方作為誤差項(xiàng)。Lsd同“T選項(xiàng)。(費(fèi)歇爾LSD檢驗(yàn))Snk對全部主效應(yīng)執(zhí)行Student-Newman-Keuls組間多重比較過程。Tukey對全部主效應(yīng)執(zhí)行Tukeys HSD組間多重比較過程。Scheffe對全部主效應(yīng)執(zhí)行Scheffe多重比較。Waller對全部主效應(yīng)執(zhí)行組間多重比較的Waller-Duncan t檢驗(yàn)過程。Welch執(zhí)行Welch方差加權(quán)的單因素方差分析過程。在方差齊性的前提條件下,此方法比一般的方差分析方法更為穩(wěn)健。設(shè)置Welch選項(xiàng)時(shí),Model語句必須為單因素模型,否則將忽略該選項(xiàng)。Statistic

14、al Analysis SystemAnova過程 Anova過程的repeated語句: 如果依變量為重復(fù)測量數(shù)據(jù),此語句用以指定anova過程進(jìn)入重復(fù)測量數(shù)據(jù)方差分析模式。 其中的變量名代表重復(fù)測量因素(如測量時(shí)間等),其后水平數(shù)代表重復(fù)測量的次數(shù),如果需指定重復(fù)測量各次的具體標(biāo)識,可在其后按順序列出,并用圓括號括起來。Statistical Analysis SystemAnova過程 Anova過程的test語句: 用以進(jìn)行其他類型的f檢驗(yàn),這種檢驗(yàn)不同于通常方差分析中以誤差均方為分母的f檢驗(yàn); 選項(xiàng)“h=”用以指定作為分子的變量表達(dá)式(必須在model語句中出現(xiàn)過); 選項(xiàng)“e=”用

15、以指定一個(gè)作為分母的變量。Statistical Analysis SystemPlan過程 隨機(jī)化(randomization)是將實(shí)驗(yàn)對象的實(shí)驗(yàn)順序及分組進(jìn)行隨機(jī)分配。這是保證非處理因素均衡的一個(gè)重要手段。 常用的隨機(jī)化分組方法有抽簽法和隨機(jī)數(shù)字表法。 SAS軟件中用于試驗(yàn)設(shè)計(jì)的SAS過程稱為試驗(yàn)設(shè)計(jì)(PLAN)。SAS的PLAN過程基本語法格式如下: Proc Plan ; Factors requirements/noprint; Treatments requirements; Output Out=Sas-datasetDATA=Sas-dataset試驗(yàn)因子值設(shè)定; Run;St

16、atistical Analysis SystemPlan過程 PLAN語句有2個(gè)選項(xiàng): Seed=n:用于設(shè)定種子數(shù),n為一個(gè)5、6或7位的奇數(shù),缺省時(shí)利用系統(tǒng)時(shí)鐘時(shí)間作種子數(shù)。 Ordered:要求因子組以1,2,m給出,與Factors語句聯(lián)用。 FACTORS語句指明試驗(yàn)處理因子的抽樣方式,格式是: 因子=m OF n抽樣方式 m和n為數(shù)字,且mn。 例如:unit=6,表示對試驗(yàn)因子unit產(chǎn)生1,2,3,4,5,6的一個(gè)排列。unit=6 OF 8,表示從8個(gè)中挑選出6個(gè)。 抽樣方式包括RANDOM、ORDERED和CYCLIC。缺省為RANDOM。 Statistical Ana

17、lysis SystemPlan過程 RANDOM為隨機(jī)排列,從1,2,m中隨機(jī)抽出; ORDERED為順序排列,順序產(chǎn)生1,2,m序列; CYCLIC為循環(huán)排列,格式:CYCLIC(初始排列)增量。因子水平依1,2,m或原始區(qū)組循環(huán)排列。如GROUP=5 CYCLIC,產(chǎn)生排列1,2,3,4,5;GROUP=5 CYCLIC 2,產(chǎn)生排列1,2,3,4,5,以后每次增量為2。 TREATMENT語句與FACTOR語句類似。 OUTPUT語句將結(jié)果存儲(chǔ)至SAS數(shù)據(jù)集中,供其他過程調(diào)用。 Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析 單因素方差分析(One-

18、Way ANOVA)模型,只有1個(gè)分組自變量(因子),而且只有1個(gè)依變量。 通過觀察因子的不同水平值來分析對依變量的影響,比較這些影響是否具有顯著性差異。 方差分析的目的是分析或檢驗(yàn)總體間的均值是否相同,而不是方差本身是否相同,但檢驗(yàn)的手段則是通過方差加以分析比較的。 類型: 試驗(yàn)設(shè)計(jì),示例09a00; 分為均衡設(shè)計(jì)的方差分析,示例09a01; 非均衡設(shè)計(jì)的方差分析,示例09a02。Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析 單因素完全隨機(jī)試驗(yàn)設(shè)計(jì) 示例示例09a00:2組(水平),每組6個(gè)樣本。/* SasProg09a00.Sas */data D0

19、9a00; do unit=1 to 12; if unit=6 then group=1; else group=2; output; end;proc plan seed=27371; factors unit=12; output out=crddat data=D09a00;proc print;run;方法一結(jié)果:第1組: 8 5 1 4 6 2第2組:12 7 3 9 10 11Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析 方法二proc plan seed=27371; factors unit=12; treatments group=12

20、 cyclic(1 1 1 1 1 1 2 2 2 2 2 2); output out=outdata;proc print;run;方法二結(jié)果:第1組: 8 5 1 4 6 2第2組:12 7 3 9 10 11Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析 示例09a01(李偉凱、蔡德利著Foxpro數(shù)據(jù)庫組織和統(tǒng)計(jì)分析): 研究小麥6種氮肥施用法效應(yīng),每種施肥法種小麥5盆,完全隨機(jī)設(shè)計(jì),最后測得含氮量(mg)如下表。試作方差分析。X1X2X3X4X5X612.9014.0012.6010.5014.6014.0012.3013.8013.2010.8

21、014.6013.3012.2013.8013.4010.7014.4013.7012.5013.6013.4010.8014.4013.5012.7013.6013.0010.5014.4013.70Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析/* SasProg09a01.Sas */data D09a01; infile E:SasSasDataSasData09a01.txt; do i=1 to 5; do group=1 to 6; input x; output;end; end;proc anova; class group; model

22、x=group; means group/duncan;run;因?yàn)閿?shù)據(jù)位于不同的列中,每行包含各組的一個(gè)數(shù)據(jù),用循環(huán)語句正好可以產(chǎn)生一個(gè)代表不同分組的自變量(group)。此處依變量為x,自變量(分組變量)為group,因而model語句中的效應(yīng)表達(dá)式為x=group;means語句指定對變量group進(jìn)行多重比較。Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析 非均衡設(shè)計(jì)(各組觀測值不相等)的方差分析 示例09a02(徐夕水.微機(jī)編程技術(shù)在生物統(tǒng)計(jì)中的應(yīng)用. 畜牧與獸醫(yī).1997,29(6):260-261): 抽測5頭不同品種的母豬窩產(chǎn)仔數(shù)(頭)如表,

23、試對不同品種母豬平均窩產(chǎn)仔數(shù)做F檢驗(yàn)及利用SSR法進(jìn)行多重比較。品種號觀測數(shù)觀察值Xij(頭/窩)168 13 12 9 9 9247 8 10 73613 14 10 11 12 124513 9 8 8 105412 11 15 14Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的方差分析/* SasProg09a02.SAS */data D09a02; Infile e:sassasdataSasData09a02.txt; input s; do a=1 to s; input n; do i=1 to n; input x; output; end; en

24、d;proc glm; Class a; Model x=a; Means a/Duncan alpha=0.01;run;Statistical Analysis SystemGlm過程 Glm過程即廣義線形模型(General Liner Model)過程,存在于Stat模塊中,執(zhí)行以最小二乘法進(jìn)行模型擬合的功能。 Glm過程對數(shù)據(jù)的分析處理均在一般線性模型的框架下進(jìn)行,依變量可以為一個(gè)或多個(gè)連續(xù)型變量,自變量可以是連續(xù)型也可以是離散型的。Statistical Analysis SystemGlm過程 Glm過程可實(shí)現(xiàn)的分析類型: 簡單回歸 多重回歸 方差分析,尤其針對非平衡設(shè)計(jì)的數(shù)據(jù)

25、協(xié)方差分析 響應(yīng)面模型(Response-surface model) 加權(quán)回歸分析 多項(xiàng)式回歸分析 偏相關(guān)分析 多元方差分析 重復(fù)測量資料的方差分析Statistical Analysis SystemGlm過程 Glm過程的一般格式如下:PROC Glm ; CLASS variables; MODEL dependents=independents ; ABSORB variables; BY variables; FREQ variable; Id variables; Weight variable; Contrast label effect values; Estimate la

26、bel effect values; Lsmeans effects; MANOVA ; MEANS effects; Output keyword=names; Random effects; REPEATED factor-specification ; TEST E=effect; Run;Statistical Analysis SystemGlm過程 Glm過程的選項(xiàng)列表比Anova過程多了 “alpha=p”選項(xiàng),此選項(xiàng)用來指定計(jì)算過程中所采用的顯著性水平。其余選項(xiàng)的用法和含義與Anova過程的相同。 Anova過程中涉及的所有語句都包含在Glm過程所涉及的語句中,其用法和功能也都

27、是基本相同的。Statistical Analysis SystemGlm過程 Glm過程中的Contrast語句: Contrast語句可以用自定義的方式進(jìn)行假設(shè)檢驗(yàn); Contrast語句必須出現(xiàn)在model語句之后; 如果用到manova、repeated、random或test語句,contrast語句必須出現(xiàn)在這些語句之前。 “標(biāo)記”用來標(biāo)識所進(jìn)行的檢驗(yàn),作為標(biāo)記的文字或符號需用單引號括起來。 效應(yīng)表達(dá)式用以指定假設(shè)檢驗(yàn)的因素(組合),這些因素(組合)必須是model語句中出現(xiàn)過的。 效應(yīng)表達(dá)式后的常數(shù)向量用以指定相應(yīng)因素(組合)各水平的值,在指定各水平的情況下進(jìn)行相關(guān)因素的分析。S

28、tatistical Analysis SystemGlm過程 Estimate語句可實(shí)現(xiàn)對線性方程的估計(jì),它也必須出現(xiàn)在model語句之后,使用的規(guī)則和contrast語句基本相同。 Lsmeans語句用以指示SAS對指定的因素(組合)計(jì)算依變量的最小二乘均數(shù)并輸出到結(jié)果中。 Random語句用以指定哪些因素(組合)是隨機(jī)變量,即相對于這些因素(組合),樣本是來自于正態(tài)總體的隨機(jī)樣本,這樣SAS可對相應(yīng)因素(組合)作隨機(jī)效應(yīng)模型的分析。Statistical Analysis SystemGlm過程 四種類型的SS: SS即離差平方和(Sum of Squares) ; 在SAS 的方差分析

29、程序里(如:GLM、VARCOMP、ANOVA) 每一種效應(yīng)的SS都被歸納成第一型、第二型、第三型、第四型。這種分類是便于統(tǒng)計(jì)分析的檢驗(yàn),而非統(tǒng)計(jì)學(xué)上公認(rèn)的分類方式。 如果對這四種類型的SS有興趣,可參考Freund, Littell 及Spector(1986)合著的SAS System for Linear Models。Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì) 當(dāng)方差分析的正態(tài)分布假定或方差相等假定不能滿足時(shí),對單因素問題,可以使用非參數(shù)方差分析的Kruskal-Wallis 檢驗(yàn)方法。 這種檢驗(yàn): 不要求觀測來自正態(tài)分布總體; 不要求各組的方

30、差相等; 甚至依變量(指標(biāo))可以是有序變量(變量取值只有大小之分而沒有差距的概念,比如磨損量可以分為大、中、小三檔,得病的程度可以分為重、輕、無,等等)。Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì) NPAR1WAY 過程的調(diào)用與ANOVA 過程不同,因?yàn)樗菃我蛩胤讲罘治鲞^程,所以要用CLASS 語句給出分類變量(自變量,因素),用VAR 語句給出依變量(因變量,指標(biāo))。 一般格式為:PROC NPAR1WAY DATA=數(shù)據(jù)集 WILCOXON; CLASS 因素; VAR 指標(biāo);RUN;Statistical Analysis System單因素完

31、全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì) 示例09b01: 分析五個(gè)牌子的膠合板耐磨數(shù)據(jù)有無差異。 數(shù)據(jù)集:Mylib.VeneerACMECHAMPAJAXTUFFYXTRA2.32.22.22.42.32.12.32.02.72.52.42.41.92.62.32.52.62.12.72.4Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì)/* SasProg09b01.Sas */proc npar1way data=mylib.veneer wilcoxon; class brand; var wear;run; “Average scores were used fo

32、r ties.”是說當(dāng)名次相同時(shí)(如兩個(gè)第2)用名次的平均值((2+3)/2=2.5) Kruskal-Wallis 檢驗(yàn)的結(jié)果,包括近似的卡方 統(tǒng)計(jì)量、自由度、檢驗(yàn)的p 值(Prob CHISQ)。現(xiàn)在p 值0.0175 小于預(yù)定的水平0.05 所以結(jié)論是各種牌子的膠合板的耐磨性能有顯著差異。 注意,Kruskal-Wallis 檢驗(yàn)是非參數(shù)檢驗(yàn),在同等條件下非參數(shù)檢驗(yàn)一般比參數(shù)檢驗(yàn)的功效低,所以這里的p 值比用ANOVA 過程得到的p 值要大。Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì) 示例09b02(王忠偉,徐英杰,李國棟.應(yīng)用VBA語言實(shí)現(xiàn)完全

33、隨機(jī)設(shè)計(jì)多組差別的秩和檢驗(yàn). 衛(wèi)生毒理學(xué)雜志. 2004,18(2):112-114): 不同濃度的苯并芘B(a)P對昆明屬小鼠睪丸細(xì)胞DNA損傷的體外單細(xì)胞凝膠電泳(SCGE)試驗(yàn)數(shù)據(jù)。試驗(yàn)組1試驗(yàn)組2試驗(yàn)組3試驗(yàn)組4試驗(yàn)組516411242342254657507292850435521123325103284120Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì)/* SasProg09b02.Sas */data D09b02; infile E:SasSasDataSasData09b02.txt; do n=1 to 5; do group=1 t

34、o 5; input x; output; end; end;proc npar1way wilcoxon; class group; var x;run;Statistical Analysis System單因素完全隨機(jī)設(shè)計(jì)的非參數(shù)統(tǒng)計(jì) 結(jié)果 Kruskal-Wallis(克魯斯-沃里斯)秩和檢驗(yàn)(卡方近似)是針對多組數(shù)據(jù)的分析,Wilcoxon秩和檢驗(yàn)只用于兩組數(shù)據(jù)的比較。 本例Kruskal-Wallis Test Chi-Square 2.7503 DF 4 Pr Chi-Square 0.6005Statistical Analysis System單因素隨機(jī)區(qū)組設(shè)計(jì)的方差分析 隨

35、機(jī)區(qū)組設(shè)計(jì)(The randomized complete-block design)比完全隨機(jī)資料多了一個(gè)控制因素,即區(qū)組因素。 SAS中無須對區(qū)組因素或其他因素進(jìn)行特別的說明或標(biāo)識,僅將它們作為效應(yīng)因素來處理即可。 類型: 隨機(jī)區(qū)組試驗(yàn)設(shè)計(jì),示例09c00; 多個(gè)實(shí)驗(yàn)組與對照組的均值比較,示例09c01;Statistical Analysis System單因素隨機(jī)區(qū)組設(shè)計(jì)的方差分析 隨機(jī)區(qū)組試驗(yàn)設(shè)計(jì) 示例示例09c00:處理組8個(gè),13個(gè)區(qū)組,請給出試驗(yàn)方案。/* SasProg09c00.Sas */proc plan seed=33373; treatments plots=8 o

36、f 52 cyclic(1 2 3 4 32 43 46 49) 4; factors block=13 treats=8;output out=d09c001;run;排列方式:循環(huán)排列。依據(jù)原始排列,增量為4,從52個(gè)排列值中選擇8個(gè)。 如果需要 完全隨機(jī),可改為treatments plots=8;Statistical Analysis System單因素隨機(jī)區(qū)組設(shè)計(jì)的方差分析 示例09c01(李偉凱、蔡德利著Foxpro數(shù)據(jù)庫組織和統(tǒng)計(jì)分析): 7個(gè)大麥品種進(jìn)行比較試驗(yàn),隨機(jī)區(qū)組設(shè)計(jì),3次重復(fù),小區(qū)計(jì)產(chǎn)面積30m2,產(chǎn)量(kg)結(jié)果見表,試作方差分析。重復(fù)(區(qū)組)ABCDEFG(對照

37、)12.010.011.59.011.010.010.013.09.59.58.010.010.59.511.510.510.09.511.510.510.5Statistical Analysis System單因素隨機(jī)區(qū)組設(shè)計(jì)的方差分析/* SasProg09c01.Sas */data D09c01; infile E:SasSasDataSasData09c01.txt; do block=1 to 3; do group=1 to 7; input x; output;end; end;proc anova; class block group; model x=block grou

38、p; means group/duncan; means group/dunnett(7);run;Means語句dunnett指定各組與一個(gè)對照組進(jìn)行比較,采用dunnett t檢驗(yàn),圓括號中的變量值用來指定對照組對應(yīng)的水平值。Model語句中的效應(yīng)表達(dá)式x=block group,對區(qū)組(3次重復(fù))和處理(7個(gè)品種)兩個(gè)因素的主效應(yīng)進(jìn)行分析。Statistical Analysis System單因素隨機(jī)區(qū)組設(shè)計(jì)的方差分析 結(jié)果分析 F=5.37,p=0.00491時(shí),有重復(fù)觀測值的兩因素方差分析,可以考慮因素的交互作用。Statistical Analysis System雙因素?zé)o重復(fù)設(shè)

39、計(jì)的方差分析 示例09e01(李春喜,王文林等編著生物統(tǒng)計(jì)學(xué)93頁): 四川西部高山區(qū)林麝的種群密度在不同的海拔高度是不同的,推測影響其分布的因素可能是海拔高度或植被類型,調(diào)查林麝的種群數(shù)量(頭/100km2)見下表。海拔(m)原生林次生喬木林次生灌木林人工林1000-15001259876561500-2000154139112672000-2500268225198942500-30001881058462Statistical Analysis System雙因素?zé)o重復(fù)設(shè)計(jì)的方差分析/* SasProg09e01.Sas */Data D09e01; infile E:SasSasDat

40、aSasData09e01.txt; do b=1 to 4; do a=1 to 4; input x; output; end;end;proc anova; class a b; model x=a b; means a b/duncan;run;Statistical Analysis System雙因素?zé)o重復(fù)設(shè)計(jì)的方差分析 結(jié)果分析 A因素代表植被間差異,F(xiàn)值15.31,p值0.0007,表明不同植被類型條件下林麝的種群數(shù)量差異極顯著。 B因素代表海拔間差異,F(xiàn)值14.93,p值0.0008,表明不同海拔條件下林麝的種群數(shù)量差異極顯著。 多重比較表明:林麝在不同植被類型間的分布有極顯

41、著的差異,按原生林、次生喬木林、次生灌木林、人工林順序,種群極顯著降低。在海拔高度上,明顯集中分布于2000-2500m,其他海拔分布數(shù)量無顯著差異。Statistical Analysis System雙因素?zé)o重復(fù)設(shè)計(jì)的方差分析 示例09e02: 一個(gè)隨機(jī)抽樣調(diào)查,得到四個(gè)工廠在四種改革方案中工人月收入狀況。工廠方案1方案2方案3方案41146200148151215830328229034154614314134454452453415Statistical Analysis System雙因素?zé)o重復(fù)設(shè)計(jì)的方差分析/* SasProg09e02.Sas */Data D09e02; lab

42、el a=改革方案 b=工廠 x=月收入; input a b x;cards;1 1 146 2 1 200 3 1 148 4 1 1511 2 158 2 2 303 3 2 282 4 2 2901 3 415 2 3 461 3 3 431 4 3 4131 4 454 2 4 452 3 4 453 4 4 415;proc format; value bf 1=工廠1 2=工廠2 3=工廠3 4=工廠4;proc anova; class a b; model x=a b; means a b/duncan; format b bf.;run;Statistical Analys

43、is System雙因素?zé)o重復(fù)設(shè)計(jì)的方差分析 結(jié)果分析 A因素代表改革方案,假設(shè)測驗(yàn)F值2.17,p值0.16160.05,說明各種改革方案,工人的月收沒有差異。 B因素代表不同工廠,假設(shè)測驗(yàn)F值63.98,p值0.0001,表示不同工廠之間工人的月收不相等。Statistical Analysis System析因設(shè)計(jì)的方差分析 兩因子之間的交互作用AB,稱為一級交互作用。 今假定因子A分為a1、a2二個(gè)水平,因子B分為b1、b2、b3、b4四個(gè)水平。 當(dāng)AB達(dá)顯著時(shí),表示a1下b1、b2、b3、b4之間的差異與a2下b1、b2、b3、b4之間的差異顯著不同,這時(shí)須分別對a1、a2以下B之各

44、水平差異顯著性作出測驗(yàn)。 當(dāng)AB不顯著時(shí),表示A、B彼此獨(dú)立,即B之各水平差異的顯著性,不會(huì)因A的水平變化而有異。Statistical Analysis System析因設(shè)計(jì)的方差分析 示例09f01(林德光.析因試驗(yàn)中交互作用分析的SAS技術(shù).工科數(shù)學(xué).2001,17(4):48-54): 24析因設(shè)計(jì) 以下是馮奇、萬華于1998年所作華南熱帶農(nóng)業(yè)大學(xué)英語教學(xué)方法的測評試驗(yàn)。因子、水平、測評人數(shù)如表。地區(qū)(A)專業(yè)(B)園林(b1) 果樹(b2) 會(huì)計(jì)(b3) 公關(guān)(b4)農(nóng)村(a1) 28282320城市(a2) 9101418Statistical Analysis System析因設(shè)

45、計(jì)的方差分析/* SasProg09f01.Sas */data D09f01; infile e:sassasdatasasdata09f01.txt; input a b score ;proc anova; class a b; model score=a b a*b; means a b a*b/duncan alpha=0.05; means a b a*b/duncan alpha=0.01;run;數(shù)據(jù)文件:SasData09f01.txt此處不僅要分析兩個(gè)因素A、B各自的主效應(yīng),還分析兩者的交互效應(yīng),因此Model語句的效應(yīng)表達(dá)式為score=a b a*b。也可以利用豎杠操作

46、符“|”,將效應(yīng)表達(dá)式寫為score=a|b。Statistical Analysis System析因設(shè)計(jì)的方差分析 結(jié)果分析: 主效應(yīng)A不顯著,表明四個(gè)專業(yè),來自農(nóng)村與來自城市學(xué)生的英語成績,經(jīng)過大學(xué)階段的英語學(xué)習(xí)后,已不存在顯著性的差異。 主效應(yīng)B極顯著,表明不同專業(yè)之間的英語成績存在極顯著的差異。從均數(shù)多重比較可知,會(huì)計(jì)專業(yè)(b3)的成績極顯著低于其他三個(gè)專業(yè)的成績,其他三個(gè)專業(yè)間的英語成績差異不顯著。這對深入探討英語教學(xué)方法極有幫助。 交互作用AB顯著,表明a1條件下b1、b2、b3、b4之間的成績差異與a2條件下b1、b2、b3、b4之間的成績差異顯著不同。Statistical

47、Analysis System析因設(shè)計(jì)的方差分析 示例09f02: 將示例09f01資料SasData09f01.txt中城市學(xué)生的數(shù)據(jù)刪去,建立SasData09f02,分析來自農(nóng)村學(xué)生的英語成績4個(gè)專業(yè)有無差異顯著性。 這是一個(gè)單因素方差分析問題,是前一個(gè)問題的分水平比較。這樣做的原因是SAS沒有提供對交互作用的多重比較。Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f02.Sas */data D09f02; infile e:sassasdatasasdata09f02.txt;input a b score ;proc anova;

48、class b; model score=b; means b/duncan alpha=0.05; means b/duncan alpha=0.01;run;Statistical Analysis System析因設(shè)計(jì)的方差分析 結(jié)果分析 來自農(nóng)村學(xué)生的英語成績,方差分析的F=6.99, P=0.0003,極顯著。 由均數(shù)的多重比較可知,b1與b2差異不顯著,b3與b4也差異不顯著,而b1、b2均顯著高于b3、b4。這說明就農(nóng)村學(xué)生而言,本科生英語成績顯著高于??粕⒄Z成績。 同時(shí)還可見到,b3極顯著低于b1、b2,即會(huì)計(jì)??频挠⒄Z成績極顯著低于兩本科專業(yè)的英語成績。Statistica

49、l Analysis System析因設(shè)計(jì)的方差分析 示例09f03: 將示例09f01資料SasData09f01.txt中農(nóng)村學(xué)生的數(shù)據(jù)刪去,建立SasData09f03,分析來自城市學(xué)生的英語成績4個(gè)專業(yè)有無差異顯著性。 這是也一個(gè)單因素方差分析問題,是前一個(gè)問題的分水平比較。Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f03.Sas */data D09f03; infile e:sassasdatasasdata09f03.txt;input a b score ;proc anova; class b; model score=b

50、; means b/duncan alpha=0.05; means b/duncan alpha=0.01;run;Statistical Analysis System析因設(shè)計(jì)的方差分析 結(jié)果分析 由方差分析結(jié)果可知,F(xiàn)=3.88, P=0.0147,顯著。 由均數(shù)的多重比較可知,b1、b2、b3間差異不顯著,而b4顯著高于b2、b3,但與b1差異不顯著。這說明,對城市學(xué)生而言,公關(guān)專科的英語成績,比果樹本科及會(huì)計(jì)??频挠⒄Z成績均顯著地高。Statistical Analysis System析因設(shè)計(jì)的方差分析 示例09f04: 22析因設(shè)計(jì)(完全隨機(jī)設(shè)計(jì)) 20只神經(jīng)損傷的家兔隨機(jī)等分為

51、5組,分別用2種神經(jīng)縫合方法,在縫合后2個(gè)時(shí)間點(diǎn)觀察神經(jīng)的軸突通過率(%),試作統(tǒng)計(jì)分析。A(縫合方法)外膜縫合(a1)束膜縫合(a2)B(縫合后時(shí)間)1月(b1)2月(b2)1月(b1)2月(b2)1組103010502組103020503組407030704組506050605組10303030Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f04.Sas */Data D09f04; infile E:SasSasDataSasData09f04.txt; do a=1 to 2; do b=1 to 2; input x; output;

52、 end;end;proc anova; class a b; model x=a b a*b;run;Statistical Analysis System析因設(shè)計(jì)的方差分析 示例09f05: 上例數(shù)據(jù)結(jié)構(gòu)等同于下表。 重新編程進(jìn)行方差分析。重復(fù)a1a2b11101021020340304505051030b21305023050370704606053030Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f05.Sas */Data D09f05; infile E:SasSasDataSasData09f05.txt; do b=1 to

53、2; do i=1 to 5; do a=1 to 2; input x; output;end; end; end; proc anova; class a b; model x=a|b;run;Statistical Analysis System析因設(shè)計(jì)的方差分析 示例09f06(西北農(nóng)學(xué)院、華南農(nóng)業(yè)大學(xué)主編農(nóng)業(yè)化學(xué)研究法139頁): 22析因設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì)) 華北某地對玉米前期(拔節(jié))、后期(抽雄)分別施氮素2.5kg和5kg以確定最經(jīng)濟(jì)有效的施肥時(shí)期與施肥量,產(chǎn)量結(jié)果(斤/小區(qū))見下表。區(qū)組(重復(fù))前期后期N2.5N5N2.5N51506055712595360653455856

54、75452626278558654580Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f06.Sas */Data D09f06; do i=1 to 5; do a=1 to 2; do b=1 to 2; input x; output; end; end;end;cards;50 60 55 71 59 53 60 6545 58 56 75 52 62 62 7858 65 45 80;proc anova; class a b i; model x=a b a*b i; means a b/duncan;run;Statistical

55、 Analysis System析因設(shè)計(jì)的方差分析 結(jié)果分析 施肥期因素(A)達(dá)到極顯著差異。 施肥量因素(B)達(dá)到極顯著差異。 施肥期與施肥量的交互作用差異不顯著。 區(qū)組(或重復(fù))差異不顯著。 SAS無法進(jìn)行交互項(xiàng)的多重比較。Statistical Analysis System析因設(shè)計(jì)的方差分析 示例09f07 (林德光.析因試驗(yàn)中交互作用分析的SAS技術(shù).工科數(shù)學(xué).2001,17(4):48-54): 232析因設(shè)計(jì) 馬鈴薯品種、栽期、栽量析因試驗(yàn),采用重復(fù)三次的隨機(jī)區(qū)組設(shè)計(jì),小區(qū)面積為22.22m2。因子123品種(A) 甲乙栽期(B) 早中 晚栽量(C) 多少1甲早多7乙早多2甲早少

56、8乙早少3甲中多9乙中多4甲中少10乙中少5甲晚多11乙晚多6甲晚少12乙晚少處理組合Statistical Analysis System析因設(shè)計(jì)的方差分析重復(fù)處理組合123456789101112141342718139725039282917240322617127704929292414339302315105694327332611Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f07.Sas */data d09f07; infile e:sassasdatasasdata09f07.txt; do block=1 to 3; do

57、a=1 to 2; do b=1 to 3; do c=1 to 2; input y ; output; end; end; end; end;proc anova; class block a b c; model y=block a|b|c; means a|b|c/duncan alpha=0.05; means a|b|c/duncan alpha=0.01;run;Statistical Analysis System析因設(shè)計(jì)的方差分析 結(jié)果分析 各主效應(yīng)及交互作用均達(dá)極顯著。 如品種與栽期的交互作用(AB),其處理組合為甲早(1)、甲中(2)、甲晚(3)、乙早(4)、乙中(5)、

58、乙晚(6)共6個(gè)(必須注意,這里的處理1,等于原來12個(gè)處理組合的處理1與處理2之和;這里的處理2,等于原來12個(gè)處理組合的處理3與處理4之和,余類推)。 需繼續(xù)對AB作分析。Statistical Analysis System析因設(shè)計(jì)的方差分析/* SasProg09f08.Sas */data d09f08; infile e:sassasdatasasdata09f07.txt;do block=1 to 3; do treat=1 to 6; do c=1 to 2; input y ; output; end; end;end;proc anova; class block tre

59、at; model y=block treat; means treat/duncan alpha=0.05; means treat/duncan alpha=0.01;run;結(jié)果表明:處理組合7(乙早多)最優(yōu),即“用品種乙、于早期播種、用栽量多”將獲得最高產(chǎn)量。這與對各主效應(yīng)及各一級交互作用的分析結(jié)果相合,因此可以斷言,這也是最優(yōu)處理組合。Statistical Analysis System拉丁方設(shè)計(jì)的方差分析 利用拉丁文安排試驗(yàn)的設(shè)計(jì)稱為拉丁方設(shè)計(jì)(The Latin-square design) 優(yōu)點(diǎn)是可以大大減少試驗(yàn)次數(shù),尤其適合動(dòng)物實(shí)驗(yàn)和實(shí)驗(yàn)室研究。 內(nèi)容: 拉丁方試驗(yàn)設(shè)計(jì),示

60、例09g00; 拉丁方設(shè)計(jì)資料的方差分析,示例09g01。Statistical Analysis System拉丁方設(shè)計(jì)的方差分析 拉丁方試驗(yàn)設(shè)計(jì)示例示例09g00:試驗(yàn)處理數(shù)k=4,分別為0,100,200,300,在4個(gè)實(shí)驗(yàn)室(Lab),4天(Day)完成,試做拉丁方設(shè)計(jì)。Statistical Analysis System拉丁方設(shè)計(jì)的方差分析/* SasProg09g00.Sas */proc plan seed=33373; factors rows=4 ordered cols=4 ordered/noprint; treatments tmts=4 cyclic; output

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論