第9章 方差分析_第1頁
第9章 方差分析_第2頁
第9章 方差分析_第3頁
第9章 方差分析_第4頁
第9章 方差分析_第5頁
已閱讀5頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第9章方差分析本章主要內(nèi)容概述Anova過程(方差分析)Plan過程(試驗設計)單因素完全隨機設計的方差分析Glm過程(廣義線性模型)單因素完全隨機設計的非參數(shù)統(tǒng)計單因素隨機區(qū)組設計的方差分析(相當于雙因素)系統(tǒng)分組(巢式)設計的方差分析雙因素無重復設計的方差分析析因設計的方差分析(完全隨機、隨機區(qū)組設計、多因素)拉丁方設計的方差分析裂區(qū)設計的方差分析重復度量設計的方差分析正交設計的方差分析概述在科學試驗中,有很多研究多個處理(變量)之間差異顯著性的問題。對多個變量均數(shù)采用兩兩比較的方法進行假設測驗,分別作出統(tǒng)計推斷,表面看是可行的。但實際上存在著三方面的缺陷:從統(tǒng)計上夸大了變量間的差異;割裂了變量間內(nèi)在的聯(lián)系(特別是對試驗誤差);加大了統(tǒng)計工作量?;谝陨峡紤],1923年英國著名統(tǒng)計學家費休(R.A.Fisher)提出了方差分析(ANOVA,ANalysisOfVariance)的統(tǒng)計方法。概述方差是一個表示變異的量,在一項試驗或調(diào)查中往往存在著許多造成生物性狀變異的因素,這些因素有較重要的,也有較次要的。方差分析就是將總變異分裂為各因素相應的變異,作出其數(shù)量估計,從而發(fā)現(xiàn)各因素在變異中所占的重要程度;而且除了可控因素引起的變異,剩余變異可提供試驗誤差的準確而無偏的估計,作為統(tǒng)計假設測驗的依據(jù)。因此,方差分析在統(tǒng)計分析中占有十分重要的地位,特別是在多因素試驗中,它可以幫助我們發(fā)現(xiàn)起主要作用的變異因素,從而抓住主要矛盾或關鍵措施。概述SAS中常用的方差分析過程有ANOVA過程和GLM過程。ANOVA過程運算速度較快,但功能較為有限;GLM過程運算速度較慢,但功能強大,我們做協(xié)方差分析時也要用到GLM過程。概述方差分析的數(shù)據(jù)集至少應有一個依變量(反應變量、結(jié)果變量),用于記錄不同處理因素水平下的觀測值;至少有一個處理因素變量,用于記錄處理因素的類型和水平數(shù)。以單因素方差分析為例,應有一個依變量和一個處理因素變量;兩因素的方差分析應有一個依變量和兩個處理因素變量。Anova過程anova過程的主要功能就是進行方差分析。anova過程用以對平衡實驗設計資料進行分析,不能用于對非平衡實驗設計資料的方差分析。平衡實驗設計資料:各分組因素各水平的所有組合具有相同的樣本量或觀察值。Anova過程anova過程的一般格式如下:PROCANOVA<options>;

CLASS

variables;

MODEL

dependents=effects</options>;

ABSORB

variables;

BY

variables;

FREQ

variable;

MANOVA<test-options></detail-options>;

MEANS

effects</options>;

REPEATED

factor-specification</options>;

TEST<H=effects>E=effect;Run;Anova過程anova過程的Options:選項功能和用法Data=指定分析的數(shù)據(jù)集。ORDER=指定anova過程對分類變量(class語句指定的變量)各水平的排序方式,可選值:DATA——按照原始數(shù)據(jù)中的順序;FORMATTED——輸出格式值的順序;FREQ——各水平觀察值頻數(shù)多少的順序;INTERNAL——內(nèi)部值的順序。MANOVA在多變量分析時,去掉有缺失值的變量。MultiPass在必要時重新讀入數(shù)據(jù),而不是將數(shù)據(jù)寫入某個中間文件,對大樣本數(shù)據(jù)處理時非常有用。NoPrint禁止將分析結(jié)果輸出到Output窗口。NameLen=指定效應名稱字符串的長度(20-200的整數(shù)),默認值為20。OutStat=指定存儲方差分析表的數(shù)據(jù)集。Anova過程Anova過程的Model語句:格式:MODEL

dependents=effects</options>;

dependents代表依變量(即分析變量、因變量),可以是輸入數(shù)據(jù)集中的一個或多個數(shù)值型變量,多個變量間以空格相分隔。effects為方差分析模型的效應項,是由自變量(分組變量)以特定方式組合而成的表達式,一個模型表達式中可以同時包含多個效應項。Anova過程Anova過程的Model語句:如果沒有指定任何自變量,則模型中僅包含常數(shù)項,此時檢驗的內(nèi)容是依變量的均數(shù)是否為零。model語句中指定的自變量必須是class語句中聲明過的分類變量,anova過程不允許自變量中有連續(xù)型變量(數(shù)值變量),而依變量則必須是數(shù)值型變量。Anova過程Anova過程的Model語句:自變量表達式可以有三種不同的效應模型,模型的表達方式如下(假定依變量為y,模型中包含三個自變量:a,b,c):(1)主效應(MainEffect)模型:y=abc;(2)交互效應(Crossedeffect或Interaction)模型:y=abca*ba*cb*ca*b*c;(3)嵌套效應(Nestedeffect)模型:y=abc(ab);

其中c因素為a、b兩因素各種組合下的二級因素。效應(Effect):指用分類變量說明依變量的關系。Anova過程Anova過程的Model語句:model語句末尾的選項可以設置為“intercept”和“nouni”;intercept指定SAS進行關于常數(shù)項(截距)的假設檢驗。默認情況下,模型中包括截距,但并不顯示有關截距項的假設檢驗結(jié)果。nouni在多變量方差分析(或重復測量資料方差分析)時禁止有關單變量統(tǒng)計結(jié)果的輸出,但它不影響repeated語句所產(chǎn)生的有關單變量分析結(jié)果的顯示。Anova過程Anova過程的absorb語句:對于僅發(fā)揮主效應的因素,absorb語句指定SAS消除此變量的作用,只對其余變量進行分析,起到大幅度減少計算機資源和時間消耗的作用。應用此功能時,須先對指定變量排序,且此變量不能再出現(xiàn)在class語句和model語句中,否則將導致離均差平方和計算錯誤。Anova過程Anova過程的manova語句:當有多個依變量時,此語句控制anova過程進入多元方差分析模式,其后的選項用以指定多元方差分析時的各項指標。Anova過程Anova過程的means語句:通過使用means語句,anova過程可對model語句所定義的效應計算各水平下依變量的均值、標準差Means語句通過選項的設置可以實現(xiàn)對指定主效應的組間多重比較(anova過程不能執(zhí)行模型中交互效應的組間多重比較)??捎脮r使用多條means語句,但均必須位于model語句之后。Anova過程means語句的選項(部分):選項功能和用法Alpha=指定均數(shù)多重比較的顯著性水平,默認為0.05。Bon對全部主效應執(zhí)行組間多重比較的Bonferronit檢驗。Duncan對全部主效應執(zhí)行組間多重比較的Duncan’s檢驗(新復極差法,又叫鄧肯法,1955年由Duncan提出)。Dunnett對全部主效應執(zhí)行各組與對照組間多重比較的雙側(cè)Dunnett’st檢驗。默認情況下,各效應的第一個水平將被作為對照組。Dunnettl對全部主效應執(zhí)行各組與對照組間多重比較的單側(cè)Dunnett’st檢驗。Gabriel對全部主效應執(zhí)行Gabriel’s組間多重比較的過程。T在樣本量相等的情況下,執(zhí)行組間均數(shù)的兩兩t檢驗過程,等同于Fisher的最小顯著差異(LSD,leastsignificantdifference)檢驗。Anova過程means語句的選項(部分):選項功能和用法E=指定在多重比較中用來作誤差項的效應,所指定的效應必須為Model語句中所飲食的效應,否則以默認值替代。默認情況下殘差均方作為誤差項。Lsd同“T選項。(費歇爾LSD檢驗)Snk對全部主效應執(zhí)行Student-Newman-Keuls組間多重比較過程。Tukey對全部主效應執(zhí)行Tukey’sHSD組間多重比較過程。Scheffe對全部主效應執(zhí)行Scheffe多重比較。Waller對全部主效應執(zhí)行組間多重比較的Waller-Duncant檢驗過程。Welch執(zhí)行Welch方差加權的單因素方差分析過程。在方差齊性的前提條件下,此方法比一般的方差分析方法更為穩(wěn)健。設置Welch選項時,Model語句必須為單因素模型,否則將忽略該選項。Anova過程Anova過程的repeated語句:如果依變量為重復測量數(shù)據(jù),此語句用以指定anova過程進入重復測量數(shù)據(jù)方差分析模式。其中的變量名代表重復測量因素(如測量時間等),其后水平數(shù)代表重復測量的次數(shù),如果需指定重復測量各次的具體標識,可在其后按順序列出,并用圓括號括起來。Anova過程Anova過程的test語句:用以進行其他類型的f檢驗,這種檢驗不同于通常方差分析中以誤差均方為分母的f檢驗;選項“h=”用以指定作為分子的變量表達式(必須在model語句中出現(xiàn)過);選項“e=”用以指定一個作為分母的變量。Plan過程隨機化(randomization)是將實驗對象的實驗順序及分組進行隨機分配。這是保證非處理因素均衡的一個重要手段。常用的隨機化分組方法有抽簽法和隨機數(shù)字表法。SAS軟件中用于試驗設計的SAS過程稱為試驗設計(PLAN)。SAS的PLAN過程基本語法格式如下:ProcPlan<options>;

Factors

requirements/noprint;

Treatments

requirements;

OutputOut=Sas-dataset[DATA=Sas-dataset][試驗因子值設定];Run;Plan過程PLAN語句有2個選項:Seed=n:用于設定種子數(shù),n為一個5、6或7位的奇數(shù),缺省時利用系統(tǒng)時鐘時間作種子數(shù)。Ordered:要求因子組以1,2,…,m給出,與Factors語句聯(lián)用。FACTORS語句指明試驗處理因子的抽樣方式,格式是:因子=m[OFn][抽樣方式]m和n為數(shù)字,且m≤n。例如:unit=6,表示對試驗因子unit產(chǎn)生1,2,3,4,5,6的一個排列。unit=6OF8,表示從8個中挑選出6個。抽樣方式包括RANDOM、ORDERED和CYCLIC。缺省為RANDOM。Plan過程RANDOM為隨機排列,從1,2,…,m中隨機抽出;ORDERED為順序排列,順序產(chǎn)生1,2,…,m序列;CYCLIC為循環(huán)排列,格式:CYCLIC[(初始排列)][增量]。因子水平依1,2,…,m或原始區(qū)組循環(huán)排列。如GROUP=5CYCLIC,產(chǎn)生排列1,2,3,4,5;GROUP=5CYCLIC2,產(chǎn)生排列1,2,3,4,5,以后每次增量為2。TREATMENT語句與FACTOR語句類似。OUTPUT語句將結(jié)果存儲至SAS數(shù)據(jù)集中,供其他過程調(diào)用。

單因素完全隨機設計的方差分析單因素方差分析(One-WayANOVA)模型,只有1個分組自變量(因子),而且只有1個依變量。通過觀察因子的不同水平值來分析對依變量的影響,比較這些影響是否具有顯著性差異。方差分析的目的是分析或檢驗總體間的均值是否相同,而不是方差本身是否相同,但檢驗的手段則是通過方差加以分析比較的。類型:試驗設計,示例09a00;分為均衡設計的方差分析,示例09a01;非均衡設計的方差分析,示例09a02。單因素完全隨機設計的方差分析單因素完全隨機試驗設計示例09a00:2組(水平),每組6個樣本。/*SasProg09a00.Sas*/dataD09a00;

dounit=1

to

12;

ifunit<=6

thengroup=1;

elsegroup=2;

output;

end;proc

plan

seed=27371;

factorsunit=12;

output

out=crddat

data=D09a00;proc

print;run;方法一結(jié)果:第1組:851462第2組:127391011單因素完全隨機設計的方差分析方法二proc

plan

seed=27371;

factorsunit=12;

treatmentsgroup=12

cyclic(1

1

1

1

1

1

2

2

2

2

2

2);

output

out=outdata;proc

print;run;方法二結(jié)果:第1組:851462第2組:127391011單因素完全隨機設計的方差分析示例09a01(李偉凱、蔡德利著《Foxpro數(shù)據(jù)庫組織和統(tǒng)計分析》):研究小麥6種氮肥施用法效應,每種施肥法種小麥5盆,完全隨機設計,最后測得含氮量(mg)如下表。試作方差分析。X1X2X3X4X5X612.9014.0012.6010.5014.6014.0012.3013.8013.2010.8014.6013.3012.2013.8013.4010.7014.4013.7012.5013.6013.4010.8014.4013.5012.7013.6013.0010.5014.4013.70單因素完全隨機設計的方差分析/*SasProg09a01.Sas*/dataD09a01;

infile

'E:\Sas\SasData\SasData09a01.txt';

doi=1

to

5;

dogroup=1

to

6;

inputx@@;

output;

end;

end;proc

anova;

classgroup;

modelx=group;

meansgroup/duncan;run;因為數(shù)據(jù)位于不同的列中,每行包含各組的一個數(shù)據(jù),用循環(huán)語句正好可以產(chǎn)生一個代表不同分組的自變量(group)。此處依變量為x,自變量(分組變量)為group,因而model語句中的效應表達式為x=group;means語句指定對變量group進行多重比較。單因素完全隨機設計的方差分析非均衡設計(各組觀測值不相等)的方差分析示例09a02(徐夕水.微機編程技術在生物統(tǒng)計中的應用.畜牧與獸醫(yī).1997,29(6):260-261):抽測5頭不同品種的母豬窩產(chǎn)仔數(shù)(頭)如表,試對不同品種母豬平均窩產(chǎn)仔數(shù)做F檢驗及利用SSR法進行多重比較。品種號觀測數(shù)觀察值Xij(頭/窩)16813129992478107361314101112124513988105412111514單因素完全隨機設計的方差分析/*SasProg09a02.SAS*/dataD09a02;

Infile

'e:\sas\sasdata\SasData09a02.txt';

inputs;

doa=1

tos;

inputn;

doi=1

ton;

inputx@@;

output;

end;

end;proc

glm;

Classa;

Modelx=a;

Meansa/Duncan

alpha=0.01;run;Glm過程Glm過程即廣義線形模型(GeneralLinerModel)過程,存在于Stat模塊中,執(zhí)行以最小二乘法進行模型擬合的功能。Glm過程對數(shù)據(jù)的分析處理均在一般線性模型的框架下進行,依變量可以為一個或多個連續(xù)型變量,自變量可以是連續(xù)型也可以是離散型的。Glm過程Glm過程可實現(xiàn)的分析類型:簡單回歸多重回歸方差分析,尤其針對非平衡設計的數(shù)據(jù)協(xié)方差分析響應面模型(Response-surfacemodel)加權回歸分析多項式回歸分析偏相關分析多元方差分析重復測量資料的方差分析Glm過程Glm過程的一般格式如下:PROCGlm<options>;

CLASS

variables;

MODEL

dependents=independents</options>;

ABSORB

variables;

BY

variables;

FREQ

variable;Idvariables;Weightvariable;Contrast’label’effectvalues<…effectvalues></options>;Estimate’label’effectvalues<…effectvalues></options>;

Lsmeans

effects</options>;

MANOVA<test-options></detail-options>;

MEANS

effects</options>;Output<Out=Sas-dataset>keyword=names<…></options>;Randomeffects</options>;

REPEATED

factor-specification</options>;

TEST<H=effects>E=effect</options>;Run;Glm過程Glm過程的選項列表比Anova過程多了“alpha=p”選項,此選項用來指定計算過程中所采用的顯著性水平。其余選項的用法和含義與Anova過程的相同。Anova過程中涉及的所有語句都包含在Glm過程所涉及的語句中,其用法和功能也都是基本相同的。Glm過程Glm過程中的Contrast語句:Contrast語句可以用自定義的方式進行假設檢驗;Contrast語句必須出現(xiàn)在model語句之后;如果用到manova、repeated、random或test語句,contrast語句必須出現(xiàn)在這些語句之前?!皹擞洝庇脕順俗R所進行的檢驗,作為標記的文字或符號需用單引號括起來。效應表達式用以指定假設檢驗的因素(組合),這些因素(組合)必須是model語句中出現(xiàn)過的。效應表達式后的常數(shù)向量用以指定相應因素(組合)各水平的值,在指定各水平的情況下進行相關因素的分析。Glm過程Estimate語句可實現(xiàn)對線性方程的估計,它也必須出現(xiàn)在model語句之后,使用的規(guī)則和contrast語句基本相同。Lsmeans語句用以指示SAS對指定的因素(組合)計算依變量的最小二乘均數(shù)并輸出到結(jié)果中。Random語句用以指定哪些因素(組合)是隨機變量,即相對于這些因素(組合),樣本是來自于正態(tài)總體的隨機樣本,這樣SAS可對相應因素(組合)作隨機效應模型的分析。Glm過程四種類型的SS:SS即離差平方和(SumofSquares);在SAS的方差分析程序里(如:GLM、VARCOMP、ANOVA)每一種效應的SS都被歸納成第一型、第二型、第三型、第四型。這種分類是便于統(tǒng)計分析的檢驗,而非統(tǒng)計學上公認的分類方式。如果對這四種類型的SS有興趣,可參考Freund,Littell

及Spector(1986)合著的SASSystemforLinearModels。單因素完全隨機設計的非參數(shù)統(tǒng)計當方差分析的正態(tài)分布假定或方差相等假定不能滿足時,對單因素問題,可以使用非參數(shù)方差分析的Kruskal-Wallis檢驗方法。這種檢驗:不要求觀測來自正態(tài)分布總體;不要求各組的方差相等;甚至依變量(指標)可以是有序變量(變量取值只有大小之分而沒有差距的概念,比如磨損量可以分為大、中、小三檔,得病的程度可以分為重、輕、無,等等)。單因素完全隨機設計的非參數(shù)統(tǒng)計NPAR1WAY過程的調(diào)用與ANOVA過程不同,因為它是單因素方差分析過程,所以要用CLASS語句給出分類變量(自變量,因素),用VAR語句給出依變量(因變量,指標)。一般格式為:PROCNPAR1WAYDATA=數(shù)據(jù)集WILCOXON;

CLASS

因素;

VAR

指標;RUN;單因素完全隨機設計的非參數(shù)統(tǒng)計示例09b01:分析五個牌子的膠合板耐磨數(shù)據(jù)有無差異。數(shù)據(jù)集:Mylib.VeneerACMECHAMPAJAXTUFFYXTRA2.32.22.22.42.32.12.32.02.72.52.42.41.92.62.32.52.62.12.72.4單因素完全隨機設計的非參數(shù)統(tǒng)計/*SasProg09b01.Sas*/proc

npar1way

data=mylib.veneerwilcoxon;

classbrand;

varwear;run;“Averagescoreswereusedforties.”是說當名次相同時(如兩個第2)用名次的平均值((2+3)/2=2.5)Kruskal-Wallis檢驗的結(jié)果,包括近似的卡方

統(tǒng)計量、自由度、檢驗的p值(Prob>CHISQ)?,F(xiàn)在p值0.0175小于預定的水平0.05所以結(jié)論是各種牌子的膠合板的耐磨性能有顯著差異。注意,Kruskal-Wallis檢驗是非參數(shù)檢驗,在同等條件下非參數(shù)檢驗一般比參數(shù)檢驗的功效低,所以這里的p值比用ANOVA過程得到的p值要大。單因素完全隨機設計的非參數(shù)統(tǒng)計示例09b02(王忠偉,徐英杰,李國棟.應用VBA語言實現(xiàn)完全隨機設計多組差別的秩和檢驗.衛(wèi)生毒理學雜志.2004,18(2):112-114):不同濃度的苯并芘[B(a)P]對昆明屬小鼠睪丸細胞DNA損傷的體外單細胞凝膠電泳(SCGE)試驗數(shù)據(jù)。試驗組1試驗組2試驗組3試驗組4試驗組516411242342254657507292850435521123325103284120單因素完全隨機設計的非參數(shù)統(tǒng)計/*SasProg09b02.Sas*/dataD09b02;

infile

'E:\Sas\SasData\SasData09b02.txt';

don=1

to

5;

dogroup=1

to

5;

inputx@@;

output;

end;

end;proc

npar1way

wilcoxon;

classgroup;

varx;run;單因素完全隨機設計的非參數(shù)統(tǒng)計結(jié)果Kruskal-Wallis(克魯斯-沃里斯)秩和檢驗(卡方近似)是針對多組數(shù)據(jù)的分析,Wilcoxon秩和檢驗只用于兩組數(shù)據(jù)的比較。本例Kruskal-WallisTestChi-Square2.7503DF4Pr>Chi-Square0.6005單因素隨機區(qū)組設計的方差分析隨機區(qū)組設計(Therandomizedcomplete-blockdesign)比完全隨機資料多了一個控制因素,即區(qū)組因素。SAS中無須對區(qū)組因素或其他因素進行特別的說明或標識,僅將它們作為效應因素來處理即可。類型:隨機區(qū)組試驗設計,示例09c00;多個實驗組與對照組的均值比較,示例09c01;單因素隨機區(qū)組設計的方差分析隨機區(qū)組試驗設計示例09c00:處理組8個,13個區(qū)組,請給出試驗方案。/*SasProg09c00.Sas*/proc

plan

seed=33373;

treatmentsplots=8

of

52

cyclic(1

2

3

4

32

43

46

49)4;

factorsblock=13treats=8;

output

out=d09c001;run;排列方式:循環(huán)排列。依據(jù)原始排列,增量為4,從52個排列值中選擇8個。

如果需要完全隨機,可改為treatmentsplots=8;單因素隨機區(qū)組設計的方差分析示例09c01(李偉凱、蔡德利著《Foxpro數(shù)據(jù)庫組織和統(tǒng)計分析》):7個大麥品種進行比較試驗,隨機區(qū)組設計,3次重復,小區(qū)計產(chǎn)面積30m2,產(chǎn)量(kg)結(jié)果見表,試作方差分析。重復(區(qū)組)ABCDEFG(對照)Ⅰ12.010.011.59.011.010.010.0Ⅱ13.09.59.58.010.010.59.5Ⅲ11.510.510.09.511.510.510.5單因素隨機區(qū)組設計的方差分析/*SasProg09c01.Sas*/dataD09c01;

infile

'E:\Sas\SasData\SasData09c01.txt';

doblock=1

to

3;

dogroup=1

to

7;

inputx@@;

output;

end;

end;proc

anova;

classblockgroup;

modelx=blockgroup;

meansgroup/duncan;

meansgroup/dunnett('7');run;Means語句dunnett指定各組與一個對照組進行比較,采用dunnettt檢驗,圓括號中的變量值用來指定對照組對應的水平值。Model語句中的效應表達式x=blockgroup,對區(qū)組(3次重復)和處理(7個品種)兩個因素的主效應進行分析。單因素隨機區(qū)組設計的方差分析結(jié)果分析F=5.37,p=0.0049<0.05,模型擬合度很好,各大麥品種產(chǎn)量差異顯著。R2=0.781576,說明模型可以確定78%的變異。各組與對照組的平均數(shù)比較顯示,只有A品種與對照的差異達到顯著水平(標有***)。單因素隨機區(qū)組設計的方差分析示例09c02:不同放置時間的血糖濃度有無變化。────────────────────────受試者編號放置時間(分)────────────────(即區(qū)組號)04590135────────────────────────15.275.274.944.6125.275.224.884.6635.885.835.385.0045.445.385.275.0055.665.445.384.8866.226.225.615.2275.835.725.384.8885.275.115.004.44────────────────────────單因素隨機區(qū)組設計的方差分析/*SasProg09c02.Sas*/dataD09c02;

doa=1

to

10;/*處理因素*/

dob=1

to

8;/*區(qū)組因素*/

inputx@@;

output;

end;

end;cards;5.275.275.885.445.666.225.835.275.275.225.835.385.446.225.725.114.944.885.385.275.385.615.385.004.614.665.005.004.885.224.884.44;proc

anova;

classab;

modelx=ab;

meansa/snk;run;用SNK法進行兩兩比較(相當于q檢驗)

單因素隨機區(qū)組設計的方差分析示例09c03(劉明啟,孫建義,王成章.不同紫花苜蓿品種生產(chǎn)性能比較試驗.中國飼料.2004,(13):18-20):10個紫花苜蓿品種,隨機區(qū)組法設計田間試驗,3次重復。第二年第一茬苜蓿鮮草(kg/hm2)數(shù)據(jù)SasData09c03.txt,試進行方差分析。單因素隨機區(qū)組設計的方差分析/*SasProg09c03.Sas*/dataD09c03;

infile

'E:\sas\sasdata\sasdata09c03.txt';

dovariety=1

to

10;

inputalfalfa$@;

doblock=1

to

3;

inputx@@;

output;

end;

end;proc

anova;

classvarietyblock;

modelx=varietyblock;

meansvariety/duncan

alpha=0.05;run;10個試種苜蓿品種的鮮草產(chǎn)量最高的為“78”。其中“78”、中苜1號、內(nèi)蒙古苜蓿3個品種與“意大利”之間差異顯著。(原文有誤:沒有極顯著差異)系統(tǒng)分組設計的方差分析單向分組設計,如果每組又分若干亞組,每個亞組內(nèi)又有若干觀察值,則為組內(nèi)分亞組的單向分組設計,簡稱系統(tǒng)分組設計。系統(tǒng)分組設計可能組內(nèi)分亞組,亞組內(nèi)又分小組,如此分下去,形成巢式設計(Nesteddesign)試驗。在這里,我們討論二級分組且組內(nèi)觀察值數(shù)目相等資料的方差分析。

系統(tǒng)分組設計的方差分析二級系統(tǒng)分組試驗設計示例09d00:組數(shù)為3,組內(nèi)亞組數(shù)4,亞組內(nèi)個體為3,試作試驗設計。/*SasProg09d00.Sas*/proc

plan

seed=17431;

factorsgroup=3subgroup=4n=3;run;系統(tǒng)分組設計的方差分析示例09d01(南京農(nóng)學院主編《田間試驗和統(tǒng)計方法》102頁):溫室內(nèi)以4種培養(yǎng)液培養(yǎng)某作物,每種3盆,每盆4株,1個月后測定其株高(mm),試作方差分析。培養(yǎng)液A1A2A3A4盆號A1B1A1B2A1B3A2B1A2B2A2B3A3B1A3B2A3B3A4B1A4B2A4B3生長量503545505555856570606065553540456045607070558565403040505065908070354585354050455055856570707575系統(tǒng)分組設計的方差分析/*SasProg09d01.sas*/datad09d01;

infile

'e:\sas\sasdata\sasdata09d01.txt';

doplant=1

to

4;

doa=1

to

4;

dob=1

to

3;

inputx@@;

output;

end;

end;

end;proc

anova;

classab;

modelx=ab(a);

test

h=ae=b(a);

meansa/duncan

e=b(a);run;Test語句指定以a變量為分子,b(a)為分母進行f檢驗。Means語句選項e=b(a)的作用也是指定多重比較時的誤差效應項。SAS默認以殘差(本例為盆內(nèi)株間變異)均方作為誤差項。系統(tǒng)分組設計的方差分析在進行組間F檢驗時,我國常用的方法和SAS默認方式公式不同,進而進行均數(shù)多數(shù)比較時,均數(shù)的標準誤也不同。蔣忠民、張鳳銀在《SAS軟件在生物統(tǒng)計應用中的問題探討》(江漢大學學報.2000,17(6):87-89)一文指出:組間存在差異性的標準我國高于SAS,因此,對于一些重要事情的鑒定,最好采用我國的方法,但是如果組內(nèi)亞組確定不是隨機的,那么St2、Se12不是相互獨立的,這時采用SAS軟件的默認方法進行方差分析是比較確切的。系統(tǒng)分組設計的方差分析/*SasProg09d02.sas*/proc

glm

data=d09d01;

classab;

modelx=ab(a);

lsmeansa/pdiff

e=b(a)cl;run;Lsmeans語句執(zhí)行最小二乘均數(shù)比較。選項pdiff,打印均數(shù)比較的顯著性檢驗結(jié)果;選項e=,指定某一效應的均方作為t檢驗的分母。選項cl,打印最小二乘均數(shù)及其差數(shù)的置信區(qū)間。示例09d02:以Glm過程分析上例數(shù)據(jù)。系統(tǒng)分組設計的方差分析/*SasProg09d03.sas*/proc

mixed

data=d09d01;

classab;

modelx=ab(a)/ddfm=kr;

lsmeansa/pdiff;run;Model語句指明固定效應,而且依變量只能有一個。Random語句指定試驗設計中的隨機效應,可以是分類數(shù)據(jù)也可以是連續(xù)型數(shù)據(jù),或者截距。其后可以用選項type=指明隨機變量協(xié)方差矩陣的結(jié)構。示例09d03:以Mixed過程分析上例數(shù)據(jù)。系統(tǒng)分組設計的方差分析示例09d04(胡希遠.不等重復系統(tǒng)分組試驗設計分析.西北農(nóng)林科技大學學報(自然科學版).2003,31(增刊):101-105):由于植株死亡或其他原因,出現(xiàn)數(shù)據(jù)缺失,形成非平衡資料,試進行方差分析。培養(yǎng)液A1A2A3A4盆號A1B1A1B2A1B3A2B1A2B2A2B3A3B1A3B2A3B3A4B1A4B2A4B3生長量503545505555856570606065553540456045607070558565403040506590703545854045505585707075系統(tǒng)分組設計的方差分析對重復數(shù)不等系統(tǒng)分組試驗資料分析的最簡單方法是采用每組平均值進行方差分析,這種分析方法就是所謂的普通最小二乘法(OLS)。由于每組重復數(shù)不同,每組均值的方差存在異質(zhì)性,因此,這種方法僅是一種近似的方法。當數(shù)據(jù)不平衡性較小時,可以采用這種方法。另一個不同的分析方法就是采用加權最小二乘法(WLS),其權重因觀測的方差和協(xié)方差而變化。對于組內(nèi)有重復觀測值的試驗可以利用每組方差的倒數(shù)對其平均值予以權重處理。系統(tǒng)分組設計的方差分析/*SasProg09d04.sas*/datad09d04;

infile

'e:\sas\sasdata\sasdata09d04.txt';

inputplantabx@@;proc

mixed;

classab;

modelx=a/ddfm=kenwardroger;

randomb(a);

lsmeansa/pdiff

cl;run;雙因素無重復設計的方差分析雙因素方差分析(Two-wayANOVA)模型中,自變量有2個,依變量仍是1個。A因素有a個水平,B因素有b個水平,試驗重復N次。N=1時,無重復觀測值的兩因素方差分析,不能分析因素間的交互作用(各因素具有獨立性);N>1時,有重復觀測值的兩因素方差分析,可以考慮因素的交互作用。雙因素無重復設計的方差分析示例09e01(李春喜,王文林等編著《生物統(tǒng)計學》93頁):四川西部高山區(qū)林麝的種群密度在不同的海拔高度是不同的,推測影響其分布的因素可能是海拔高度或植被類型,調(diào)查林麝的種群數(shù)量(頭/100km2)見下表。海拔(m)原生林次生喬木林次生灌木林人工林1000-15001259876561500-2000154139112672000-2500268225198942500-30001881058462雙因素無重復設計的方差分析/*SasProg09e01.Sas*/DataD09e01;

infile

'E:\Sas\SasData\SasData09e01.txt';

dob=1

to

4;

doa=1

to

4;

inputx@@;

output;

end;

end;proc

anova;

classab;

modelx=ab;

meansab/duncan;run;雙因素無重復設計的方差分析結(jié)果分析A因素代表植被間差異,F(xiàn)值15.31,p值0.0007,表明不同植被類型條件下林麝的種群數(shù)量差異極顯著。B因素代表海拔間差異,F(xiàn)值14.93,p值0.0008,表明不同海拔條件下林麝的種群數(shù)量差異極顯著。多重比較表明:林麝在不同植被類型間的分布有極顯著的差異,按原生林、次生喬木林、次生灌木林、人工林順序,種群極顯著降低。在海拔高度上,明顯集中分布于2000-2500m,其他海拔分布數(shù)量無顯著差異。雙因素無重復設計的方差分析示例09e02:一個隨機抽樣調(diào)查,得到四個工廠在四種改革方案中工人月收入狀況。工廠方案1方案2方案3方案41146200148151215830328229034154614314134454452453415雙因素無重復設計的方差分析/*SasProg09e02.Sas*/DataD09e02;

labela='改革方案'

b='工廠'

x='月收入';

inputabx@@;cards;11146212003114841151121582230332282422901341523461334314341314454244523445344415;proc

format;

valuebf1='工廠1'

2='工廠2'

3='工廠3'

4='工廠4';proc

anova;

classab;modelx=ab;meansab/duncan;

formatbbf.;run;雙因素無重復設計的方差分析結(jié)果分析A因素代表改革方案,假設測驗F值2.17,p值0.1616>0.05,說明各種改革方案,工人的月收沒有差異。B因素代表不同工廠,假設測驗F值63.98,p值<0.0001,表示不同工廠之間工人的月收不相等。析因設計的方差分析兩因子之間的交互作用A×B,稱為一級交互作用。今假定因子A分為a1、a2二個水平,因子B分為b1、b2、b3、b4四個水平。當A×B達顯著時,表示a1下b1、b2、b3、b4之間的差異與a2下b1、b2、b3、b4之間的差異顯著不同,這時須分別對a1、a2以下B之各水平差異顯著性作出測驗。當A×B不顯著時,表示A、B彼此獨立,即B之各水平差異的顯著性,不會因A的水平變化而有異。析因設計的方差分析示例09f01(林德光.析因試驗中交互作用分析的SAS技術.工科數(shù)學.2001,17(4):48-54):2×4析因設計以下是馮奇、萬華于1998年所作華南熱帶農(nóng)業(yè)大學英語教學方法的測評試驗。因子、水平、測評人數(shù)如表。地區(qū)(A)專業(yè)(B)園林(b1)果樹(b2)會計(b3)公關(b4)農(nóng)村(a1)28282320城市(a2)9101418析因設計的方差分析/*SasProg09f01.Sas*/dataD09f01;

infile

'e:\sas\sasdata\sasdata09f01.txt';

inputabscore@@;proc

anova;

classab;

modelscore=aba*b;

meansaba*b/duncan

alpha=0.05;

meansaba*b/duncan

alpha=0.01;run;數(shù)據(jù)文件:SasData09f01.txt此處不僅要分析兩個因素A、B各自的主效應,還分析兩者的交互效應,因此Model語句的效應表達式為score=aba*b。也可以利用豎杠操作符“|”,將效應表達式寫為score=a|b。析因設計的方差分析結(jié)果分析:主效應A不顯著,表明四個專業(yè),來自農(nóng)村與來自城市學生的英語成績,經(jīng)過大學階段的英語學習后,已不存在顯著性的差異。主效應B極顯著,表明不同專業(yè)之間的英語成績存在極顯著的差異。從均數(shù)多重比較可知,會計專業(yè)(b3)的成績極顯著低于其他三個專業(yè)的成績,其他三個專業(yè)間的英語成績差異不顯著。這對深入探討英語教學方法極有幫助。交互作用A×B顯著,表明a1條件下b1、b2、b3、b4之間的成績差異與a2條件下b1、b2、b3、b4之間的成績差異顯著不同。析因設計的方差分析示例09f02:將示例09f01資料SasData09f01.txt中城市學生的數(shù)據(jù)刪去,建立SasData09f02,分析來自農(nóng)村學生的英語成績4個專業(yè)有無差異顯著性。這是一個單因素方差分析問題,是前一個問題的分水平比較。這樣做的原因是SAS沒有提供對交互作用的多重比較。析因設計的方差分析/*SasProg09f02.Sas*/dataD09f02;

infile

'e:\sas\sasdata\sasdata09f02.txt';

inputabscore@@;proc

anova;

classb;

modelscore=b;

meansb/duncan

alpha=0.05;meansb/duncan

alpha=0.01;run;析因設計的方差分析結(jié)果分析來自農(nóng)村學生的英語成績,方差分析的F=6.99,P=0.0003,極顯著。由均數(shù)的多重比較可知,b1與b2差異不顯著,b3與b4也差異不顯著,而b1、b2均顯著高于b3、b4。這說明就農(nóng)村學生而言,本科生英語成績顯著高于??粕⒄Z成績。同時還可見到,b3極顯著低于b1、b2,即會計??频挠⒄Z成績極顯著低于兩本科專業(yè)的英語成績。析因設計的方差分析示例09f03:將示例09f01資料SasData09f01.txt中農(nóng)村學生的數(shù)據(jù)刪去,建立SasData09f03,分析來自城市學生的英語成績4個專業(yè)有無差異顯著性。這是也一個單因素方差分析問題,是前一個問題的分水平比較。析因設計的方差分析/*SasProg09f03.Sas*/dataD09f03;

infile

'e:\sas\sasdata\sasdata09f03.txt';

inputabscore@@;proc

anova;

classb;

modelscore=b;

meansb/duncan

alpha=0.05;

meansb/duncan

alpha=0.01;run;析因設計的方差分析結(jié)果分析由方差分析結(jié)果可知,F(xiàn)=3.88,P=0.0147,顯著。由均數(shù)的多重比較可知,b1、b2、b3間差異不顯著,而b4顯著高于b2、b3,但與b1差異不顯著。這說明,對城市學生而言,公關??频挠⒄Z成績,比果樹本科及會計專科的英語成績均顯著地高。析因設計的方差分析示例09f04:2×2析因設計(完全隨機設計)20只神經(jīng)損傷的家兔隨機等分為5組,分別用2種神經(jīng)縫合方法,在縫合后2個時間點觀察神經(jīng)的軸突通過率(%),試作統(tǒng)計分析。A(縫合方法)外膜縫合(a1)束膜縫合(a2)B(縫合后時間)1月(b1)2月(b2)1月(b1)2月(b2)1組103010502組103020503組407030704組506050605組10303030析因設計的方差分析/*SasProg09f04.Sas*/DataD09f04;

infile

'E:\Sas\SasData\SasData09f04.txt';

doa=1

to

2;

dob=1

to

2;

inputx@@;

output;

end;

end;proc

anova;

classab;

modelx=aba*b;run;析因設計的方差分析示例09f05:上例數(shù)據(jù)結(jié)構等同于下表。重新編程進行方差分析。重復a1a2b11101021020340304505051030b21305023050370704606053030析因設計的方差分析/*SasProg09f05.Sas*/DataD09f05;

infile

'E:\Sas\SasData\SasData09f05.txt';

dob=1

to

2;

doi=1

to

5;

doa=1

to

2;

inputx@@;

output;

end;

end;

end;proc

anova;

classab;

modelx=a|b;run;析因設計的方差分析示例09f06(西北農(nóng)學院、華南農(nóng)業(yè)大學主編《農(nóng)業(yè)化學研究法》139頁):2×2析因設計(隨機區(qū)組設計)華北某地對玉米前期(拔節(jié))、后期(抽雄)分別施氮素2.5kg和5kg以確定最經(jīng)濟有效的施肥時期與施肥量,產(chǎn)量結(jié)果(斤/小區(qū))見下表。區(qū)組(重復)前期后期N2.5N5N2.5N5150605571259536065345585675452626278558654580析因設計的方差分析/*SasProg09f06.Sas*/DataD09f06;

doi=1

to

5;

doa=1

to

2;

dob=1

to

2;

inputx@@;

output;

end;

end;

end;cards;5060557159536065455856755262627858654580;proc

anova;

classabi;

modelx=aba*bi;

meansab/duncan;run;析因設計的方差分析結(jié)果分析施肥期因素(A)達到極顯著差異。施肥量因素(B)達到極顯著差異。施肥期與施肥量的交互作用差異不顯著。區(qū)組(或重復)差異不顯著。SAS無法進行交互項的多重比較。析因設計的方差分析示例09f07(林德光.析因試驗中交互作用分析的SAS技術.工科數(shù)學.2001,17(4):48-54):

2×3×2析因設計馬鈴薯品種、栽期、栽量析因試驗,采用重復三次的隨機區(qū)組設計,小區(qū)面積為22.22m2。因子123品種(A)甲乙栽期(B)早中晚栽量(C)多少1甲早多7乙早多2甲早少8乙早少3甲中多9乙中多4甲中少10乙中少5甲晚多11乙晚多6甲晚少12乙晚少處理組合析因設計的方差分析重復處理組合123456789101112141342718139725039282917240322617127704929292414339302315105694327332611析因設計的方差分析/*SasProg09f07.Sas*/datad09f07;

infile

'e:\sas\sasdata\sasdata09f07.txt';

doblock=1

to

3;

doa=1

to

2;

dob=1

to

3;

doc=1

to

2;

inputy@@;

output;

end;

end;

end;

end;proc

anova;

classblockabc;

modely=blocka|b|c;

meansa|b|c/duncan

alpha=0.05;

meansa|b|c/duncan

alpha=0.01;run;析因設計的方差分析結(jié)果分析各主效應及交互作用均達極顯著。如品種與栽期的交互作用(A×B),其處理組合為甲早(1)、甲中(2)、甲晚(3)、乙早(4)、乙中(5)、乙晚(6)共6個(必須注意,這里的處理1,等于原來12個處理組合的處理1與處理2之和;這里的處理2,等于原來12個處理組合的處理3與處理4之和,余類推)。需繼續(xù)對A×B作分析。析因設計的方差分析/*SasProg09f08.Sas*/datad09f08;

infile

'e:\sas\sasdata\sasdata09f07.txt';

doblock=1

to

3;

dotreat=1

to

6;

doc=1

to

2;

inputy@@;

output;

end;

end;

end;proc

anova;

classblocktreat;

modely=blocktreat;

meanstreat/duncan

alpha=0.05;

meanstreat/duncan

alpha=0.01;run;結(jié)果表明:處理組合7(乙早多)最優(yōu),即“用品種乙、于早期播種、用栽量多”將獲得最高產(chǎn)量。這與對各主效應及各一級交互作用的分析結(jié)果相合,因此可以斷言,這也是最優(yōu)處理組合。拉丁方設計的方差分析利用拉丁文安排試驗的設計稱為拉丁方設計(TheLatin-squaredesign)優(yōu)點是可以大大減少試驗次數(shù),尤其適合動物實驗和實驗室研究。內(nèi)容:拉丁方試驗設計,示例09g00;拉丁方設計資料的方差分析,示例09g01。拉丁方設計的方差分析拉丁方試驗設計示例09g00:試驗處理數(shù)k=4,分別為0,100,200,300,在4個實驗室(Lab),4天(Day)完成,試做拉丁方設計。拉丁方設計的方差分析/*SasProg09g00.Sas*/proc

plan

seed=33373;

factorsrows=4

orderedcols=4

ordered/noprint;

treatments

tmts=4

cyclic;

output

out=growscvals=('Day1'

'Day2'

'Day3'

'Day4')randomcolscvals=('Lab1'

'Lab2'

'Lab3'

'Lab4')random

tmts

nvals(0

100

200

300)random;run;PROC

TABULATE;

CLASSROWSCOLS;

VARTMTS;

TABLEROWSCOLS*(TMTS*F=6.)/RTS=8;RUN;拉丁方設計的方差分析示例09g01(李偉凱、蔡德利著《Foxpro數(shù)據(jù)庫組織和統(tǒng)計分析》):有5個水稻品種作品種比較試驗,設計5×5拉丁方試驗,田間排列方式和產(chǎn)量結(jié)果見表,試作方差分析。123451D18.5A19.0C19.0B22.0E

19.02B24.0E20.0D18.0C16.0A17.53C13.5B16.0A

16.0E15.0D13.04E14.0D

18.5B21.5A19.0C20.55A17.0C15.0E13.5D15.0B20.5拉丁方設計的方差分析/*SasProg09g01.Sas*/DataD09g01;

infile

'E:\Sas\SasData\SasData09g01.txt';

dob=1

to

5;

doa=1

to

5;

inputscheme$x@@;

output;

end;

end;proc

anova;

classabscheme;

modelx=abscheme;

meansbscheme/duncan;run;拉丁方設計的方差分析結(jié)果分析橫行區(qū)組間(B)達到極顯著差異。處理間(Scheme)達到顯著差異??v行區(qū)組間(A)差異不顯著。裂區(qū)設計的方差分析裂區(qū)試驗(Thesplit-plotexperiment)的每個因素作用于不同級別的實驗單位(或?qū)ο?。實驗單位具有隸屬關系,高級的實驗單位包含低級實驗單位。A因素的I個水平只作用于一級實驗單位,B因素的J個水平作用于二級實驗單位。裂區(qū)試驗設計可根據(jù)一級實驗單位是否可形成區(qū)組而采用完全隨機設計或隨機區(qū)組設計。裂區(qū)設計的方差分析裂區(qū)試驗設計示例09h00:試作一裂區(qū)試驗設計方案,區(qū)組數(shù)為3,因素A4水平,因素B2水平。

/*SasProg09h00.Sas*/proc

plan

seed=32767;

factorsblock=3

ordereda=4b=2;run;裂區(qū)設計的方差分析示例09h01:(南京農(nóng)學院主編《田間試驗和統(tǒng)計方法》176頁):小麥中耕次數(shù)(A)與施肥量(B)試驗,裂區(qū)設計,3次重復。小區(qū)計產(chǎn)(斤/300尺2),試作方差分析。主處理A副處理B區(qū)組I區(qū)組II區(qū)組IIIA1B1302832B2373231B3181417B4171615A2B1282925B2312829B3131310B4131212A3B1302726B2312831B3151411B4161513裂區(qū)設計的方差分析/*SasProg09h01.Sas*/dataD09h01;

infile

'e:\Sas\SasData\Sasdata09h01.txt';

doa=1

to

3;

dob=1

to

4;

doblock=1

to

3;

inputx@@;

output;

end;

end;

end;proc

anova;

classabblock;

modelx=blockabb(a)a*block;

test

h=ae=a*block;

test

h=blocke=a*block;

meansa/duncan

e=a*block;

meansb/duncan;run;本例主區(qū)部分a*block為誤差項;副區(qū)部分a*b*block為誤差項;誤差方差相等是巧合。仍需對a、block作指定誤差項的假設測驗。裂區(qū)設計的方差分析三因素條裂區(qū)設計:設A,B,C三個因素,分別有a,b,c個水平,A,B兩因素為主因素,C因素為副因素,重復q次。遵循重復、隨機排列、局部控制3個基本原則,首先將試驗地按肥力程度劃分為等于重復次數(shù)的區(qū)組,將每一個區(qū)組劃分為若干縱向小區(qū),安排A因素的各個水平;再將每一區(qū)組劃分為若干橫向小區(qū),安排B因素各個水平,然后在A因素的各個水平或B因素的各個水平中引進C因素,安排其各水平。這種試驗設計方法叫三因素條裂區(qū)試驗。這一新的試驗設計既可全面實施三因素多水平構成的平衡處理組合,又能保證各因素有較大的試驗面積,且便于試驗實施的操作管理。裂區(qū)設計的方差分析示例09h02(李永慈,楊俊霞.三因素條裂區(qū)試驗設計的統(tǒng)計分析和SAS實現(xiàn).河北農(nóng)業(yè)大學學報.1999,22(2):87-89):有一水稻栽培試驗,設

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論