直線回歸與相關課件_第1頁
直線回歸與相關課件_第2頁
直線回歸與相關課件_第3頁
直線回歸與相關課件_第4頁
直線回歸與相關課件_第5頁
已閱讀5頁,還剩112頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 直線回歸和相關第一節(jié) 回歸和相關的概念(掌握)第二節(jié) 直線回歸(掌握)第三節(jié) 直線相關(掌握)第四節(jié) 直線回歸與相關的內在關系和應用要點(理解)第五節(jié) 協(xié)方差分析第八章 直線回歸和相關第一節(jié) 回歸和相關的概第一節(jié)回歸和相關的概念1.函數(shù)關系與統(tǒng)計關系 函數(shù)關系(完全相關)是確定性關系,即一個變數(shù)的任一變量必與另一變數(shù)的一個確定值相對應。不包括誤差的干擾,常見于物理學、化學等理論科學。統(tǒng)計關系(不完全相關)是非確定性的關系,即一個變數(shù)的取值受到另一變數(shù)的影響,兩者之間既有關系,但又不存在完全確定的函數(shù)關系。例如,作物的產(chǎn)量與施肥量的關系,兩類變數(shù)因受誤差的干擾而表現(xiàn)為統(tǒng)計關系,在生物學中

2、常見。第一節(jié)回歸和相關的概念1.函數(shù)關系與統(tǒng)計關系 2.自變數(shù)與依變數(shù) 有統(tǒng)計關系的兩個變數(shù),分別用符號Y和X表示。統(tǒng)計關系分因果關系和相關關系兩種。 如果兩個變數(shù)并非因果關系,而是共同變化,則為相關關系。相關關系中并沒有自變數(shù)和依變數(shù)之分。 如玉米穗長與穗重的關系。2.自變數(shù)與依變數(shù) 兩個變數(shù)間的關系若有因果關系,并定義以X表示自變數(shù),Y表示依變數(shù)。 如施肥量與產(chǎn)量的關系,施肥量是是自變數(shù)(X);產(chǎn)量是依變數(shù)(Y)。直線回歸與相關課件3回歸分析和相關分析 回歸分析是建立X與Y之間的數(shù)學關系式,用于預測; 相關分析研究X與Y兩個隨機變量之間的共同變化規(guī)律,例如當X增大時Y如何變化,以及這種共變

3、關系的強弱。3回歸分析和相關分析 原則上Y含有試驗誤差,而X不含試驗誤差時著重回歸分析;Y和x均含有試驗誤差時著重相關分析。 但討論X為非隨機變量的情況,所得到的參數(shù)估計式也可用于X為隨機變量的情況。 原則上Y含有試驗誤差,而X不含試驗誤差時著重4兩個變數(shù)資料的散點圖 對x、y進行考察的簡便方法是將n對觀察值(x1,y1)、(x2,y2)、(xn,yn) 于同一直角坐標平面上制作散點圖:X和Y的相關的性質(正或負)和密切程度; X和Y的關系是直線型的還是非直線型的; 是否有一些特殊的點表示其他因素的干擾等。4兩個變數(shù)資料的散點圖 圖9.1A 單株的生物產(chǎn)量(X)和稻谷產(chǎn)量(Y)圖9.1B 每平

4、方米土地上 的總穎花數(shù)(X)和結實率(Y)圖9.1C 最高葉面積指數(shù)(X)和每畝稻谷產(chǎn)量(Y)圖9.1A 單株的生物產(chǎn)量(X)和稻谷產(chǎn)量(Y)圖9.1B從中可以看出:圖9.1A和9.1B都是直線型的,但方向相反;前者表示兩個變數(shù)的關系是正的,后者表示關系是負的。圖9.1B的各個點幾乎都落在一直線上,圖9.1A則較為分散;因此,圖9.1B中X和Y相關的密切程度必高于圖9.1A。圖9.1C中X和Y的關系是非直線型的;從中可以看出:第二節(jié) 直線回歸一、一元正態(tài)線性回歸統(tǒng)計模型和基本假定 直線回歸模型中,Y 總體的每一個值由以下三部分組成:回歸截距,回歸系數(shù),Y變數(shù)的隨機誤差??傮w直線回歸的數(shù)學模型:

5、相應的樣本線性組成為:第二節(jié) 直線回歸一、一元正態(tài)線性回歸統(tǒng)計模型和基本假回歸分析時的假定:(1) Y 變數(shù)是隨機變數(shù),而X 變數(shù)則是沒有誤差的固定變數(shù),至少和Y 變數(shù)比較起來X 的誤差小到可以忽略。(2) 在任一X 上都存在著一個Y 總體(可稱為條件總體),它是作正態(tài)分布的,其平均數(shù) 是X 的線性函數(shù): 的樣本估計值,與X 的關系就是線性回歸方程 回歸分析時的假定:(3) 所有的Y 總體都具有共同的方差 ,而直線回歸總體具有 。試驗所得的一組觀察值(xi,yi )只是 中的一個隨機樣本。(4)隨機誤差 相互獨立,并作正態(tài)分布,具有 。 (3) 所有的Y 總體都具有共同的方差 ,而直線回歸總體

6、二、參數(shù)和的估計 和是參數(shù), 只能根據(jù)有限的觀察數(shù)據(jù)求出相應的估計值a和b,并得到y(tǒng)i的估計值: 為殘差平方和SSe(Q) 使殘差平方和達到最小的直線為回歸線 二、參數(shù)和的估計SSe對a、b的一階偏導數(shù)等于0 直線回歸與相關課件 為X的校正平方和 為Y的總校正平方和 為校正交叉乘積和 直線回歸與相關課件則:a樣本回歸截距,是回歸直線與y軸交點的縱坐標;b樣本回歸系數(shù),表示x 改變一個單位,y平均改變的數(shù)量;b 的符號反映了x影響y的性質,b的絕對值大小反映了x 影響y 的程度; 回歸估計值,是當x在在其研究范圍內取某一個值時,x的估計值則: y a0,b0,b0 a0 x 直線回歸方程的圖象由

7、下式可看到:當x以離均差(x - )為單位時,回歸直線的位置僅決定于 和b ;當將坐標軸平移到以( , )為原點時,回歸直線的走向僅決定于b,所以一般又稱b為回歸斜率(regression slope)。 直線回歸與相關課件在實際計算時,可采用以下公式:SSx=x2-(x)2/nSSy=y2-(y)2/nSPxy=xy-xy/n在實際計算時,可采用以下公式:三、 直線回歸方程的計算 例9.1一些夏季害蟲盛發(fā)期的早遲和春季溫度高低有關。江蘇武進連續(xù)9年測定3月下旬至4月中旬平均溫度累積值(x,旬度)和水稻一代三化螟盛發(fā)期(y,以5月10日為0)的關系,得結果于表9.1。試計算其直線回歸方程。首先

8、由表9.1算得回歸分析所必須的6個一級數(shù)據(jù)(即由觀察值直接算得的數(shù)據(jù)):n=9x=35.5+34.1+44.2=333.7x2=35.52+34.12+44.22=12517.49y=12+16+(-1)=70y2=122+162+(-1)2=794xy=(35.512)+(34.116)+ +44.2(-1)=2436.4表9.1 累積溫和一代三化螟盛發(fā)期的關系x累積溫 y盛發(fā)期35.5 1234.1 1631.7 940.3 236.8 7 40.2 331.7 1339.2 944.2 -1三、 直線回歸方程的計算 例9.1一些夏季害蟲盛發(fā)期的早然后,由一級數(shù)據(jù)算得5個二級數(shù)據(jù):SSx=

9、x2-(x)2/n=12517.49-(333.7)2/9 =144.6356SSy=y2-(y)2/n=794-(70)2/9=249.5556SPxy=xy-xy/n=2436.4-(333.770)/9=-159.0444X =x/n=333.7/9=37.0778Y =y/n=70/9=7.7778因而有:b=SPxy/SSx=-159.0444/144.6356 =-1.0996天/(旬度)a=ybx=7.7778-(-1.099637.0778)=48.5485(天)故得表9.1資料的回歸方程為: =48.5485-1.0996x然后,由一級數(shù)據(jù)算得5個二級數(shù)據(jù): 上述方程的意義為

10、:當3月下旬至4月中旬的積溫(x)每提高1旬度時,一代三化螟的盛發(fā)期平均將提早1.1天;若積溫為0,則一代三化螟的盛發(fā)期將在6月27-28日(x=0時,y=48.5;因y是以5月10日為0,故48.5為6月27-28日)。由于x變數(shù)的實測區(qū)間為31.7,44.2,當x31.7或44.2時,y的變化是否還符合y=48.5-1.1x的規(guī)律,觀察數(shù)據(jù)中未曾得到任何信息。 上述方程的意義為:X,y四、直線回歸方程的圖示 3月下旬至4月中旬旬平均溫度累積值圖 旬平均溫度累積值和一代三化螟盛發(fā)期的關系X,y四、直線回歸方程的圖示 3月下五、直線回歸的偏離度估計 表示了實測點與回歸直線偏離的程度,因而偏差平

11、方和又稱為離回歸平方和 。 其自由度為n-2 (用了a和b兩個統(tǒng)計數(shù)) 所以,離回歸均方為 離回歸標準誤為 表示了回歸直線與實測點偏差的程度,即回歸方程的偏離度。 五、直線回歸的偏離度估計 Q=(y-y)2=SSy-(SPxy)2/SSx =SSy-b(SPxy) =SSy-b2(SSx) =y2-ay-bxy直線回歸與相關課件例9.2 試計算由表9.1資料獲得的回歸方程的估計標準誤。 由例9.1算好的有關數(shù)據(jù)可直接得到:Q=249.5556-(-159.0444)2/144.6356=74.6670 sy/x=Q/(n-2)1/2=(y-y)2/(n-2)1/2=3.266(天) 統(tǒng)計意義是

12、:在y3.266天范圍內約有68.27%個觀察點,在y6.532天范圍內約有95.45%個觀察點等。例9.2 試計算由表9.1資料獲得的回歸方程的估計標準誤六、直線回歸的顯著性檢驗和區(qū)間估計直線回歸的變異來源六、直線回歸的顯著性檢驗和區(qū)間估計直線回歸的變異來源(一)一元回歸的方差分析(一)一元回歸的方差分析即: SSy = SSe + SSR y的總校正平方和 殘差平方和 回歸平方和自由度: n-1 n-2 1y的總變異程度 y與x間存在直線關系所引起的y的變異程度 除y與x存在直線關系以外的原因,包括隨機誤差所引起的y的變異程度 回歸和離回歸的方差比遵循df1=1,df2=n-2 的F分布即

13、: SSy = SF-檢驗H0: = 0。若F F(1, n-2),則接受H0,否則拒絕。簡化公式: F-檢驗H0: = 0。若F F0.01(1, 7) ,拒絕H0,差異極顯著。即應認為回歸方程有效。對例9.1作方差分析(二)一元回歸的t檢驗 H0 : = 0HA: 0 (雙側檢驗)HA: 0 (或 0) (單側檢驗)Sb為回歸系數(shù)標準誤 ;自由度為n-2 (二)一元回歸的t檢驗 H0 : = 0對例9.1中的作t-檢驗:H0: =0查表,t0.01(7) = 3.499 t,差異極顯著,應拒絕H0,即 0,或X與Y有著極顯著的線性關系。對例9.1中的作t-檢驗:H0: =0查表,t0.01

14、((三)兩個回歸系數(shù)比較時的假設測驗 H0: 對 HA: (三)兩個回歸系數(shù)比較時的假設測驗例 測定兩玉米品種葉片長寬乘積(x)和實際葉面積(y)的關系,得表9.4結果,試測驗兩回歸系數(shù)間是否有顯著差異。表9.4 玉米葉片長寬乘積和葉面積關系的計算結果 由表9.4可得:品 種nSSxSSySPbQ七葉白2213518246585139424830.697181420石榴子1810708225168637436520.69447 420例 測定兩玉米品種葉片長寬乘積(x)和實際葉面積(y) 這一結果是完全不顯著的,所以應接受H0: 即認為葉片長寬乘積每增大1cm2,葉面積平均要增大的單位數(shù)在七葉

15、白和石榴子兩品種上是一致的,其共同值為: (四)直線回歸的區(qū)間估計 1直線回歸的抽樣誤差在直線回歸總體 中抽取若干個樣本時,由于 、各樣本的a、b 值都有誤差。因此,由 =a+bx給出的點估計的精確性,決定于 和a、b的誤差大小。比較科學的方法應是考慮到誤差的大小和坐標點的離散程度,給出一個區(qū)間估計,即給出對其總體的 、 、 等的置信區(qū)間。 (四)直線回歸的區(qū)間估計 2回歸截距的置信區(qū)間 樣本回歸截距a ,而 和b的誤差方差分別為: 。故根據(jù)誤差合成原理,a的標準誤為:由 是遵循 的t 分布的???體 回歸截距有95可靠度的置信區(qū)間為: L1=a-t 0.05 ,L2=a+t0.05 2回歸截

16、距的置信區(qū)間 3回歸系數(shù)的置信區(qū)間 可推得總體回歸系數(shù) 的95%可靠度的置信區(qū)間為:L1=b-t 0.05 ,L2=b+t 0.05 4條件總體平均數(shù) 的置信區(qū)間 由 ,故 的標準誤為:條件總體平均數(shù) 的95%置信區(qū)間為: L1= -t 0.05 ,L2= +t0.05 3回歸系數(shù)的置信區(qū)間 5條件總體觀察值Y 的預測區(qū)間 yi= +ei, 5條件總體觀察值Y 的預測區(qū)間 保證概率為0.95的Y 的預測區(qū)間為: L1= -t0.05 ,L2= +t0.05 (923) 6置信區(qū)間和預測區(qū)間的圖示 首先取若干個等距的x 值(x 取值愈密,作圖愈準確),算得與其相應的 、 、 和 、 的值;然后再

17、由 和 算得各x上的L1和L2,并標于圖上;最后將各個L1和L2分別連成曲線即可。 保證概率為0.95的Y 的預測區(qū)間為: 例9.10 試制作例9.1資料的y估計值包括和y在內有95%可靠度的置信區(qū)間圖。表9.6 例9.1資料的置信區(qū)間和y的預測區(qū)間的計算(2)(3)(4)(6)(7)(8),(1)x的95置信區(qū)間計算y的95預測區(qū)間計算(5)L1,L23032343637384042444615.613.411.29.07.96.84.62.40.2-2.02.211.751.371.131.091.121.351.722.172.665.24.13.22.72.62.63.24.15.16

18、.310.4,9.3,8.0,6.3,5.3,4.2,1.4,-1.7,-4.9,-8.3,20.817.514.411.710.59.47.86.55.34.33.952.723.533.463.433.463.533.693.924.219.38.88.38.28.18.28.38.79.39.96.3,4.6,2.9,0.8,-0.2,-1.4,-3.7,-6.3,-9.1,-11.9,24.922.219.517.216.015.012.911.19.57.9 例9.10 試制作例9.1資料的y估計值包括和y在內 一代三化螟盛發(fā)期估計及其 95%置信限 畫出 的圖像,依次標出(x,L1

19、)和(x,L2)坐標點,再連接各(x,L1)得 線,連接各(x,L2)得 線。 和 所夾的區(qū)間即包括 在內有95可靠度的置信區(qū)間。 稱(x, )的連線 ,(x, )的連線 。其所夾的區(qū)間即為y的95的預測區(qū)間或預測帶。 3月下至4月中旬平均溫度累積值 例9.1資料的y 估計值及其95%置信帶cDABEFGH 第三節(jié) 直線相關 直線相關分析是根據(jù)x、y的實際觀測值,計算表示兩個相關變量x、y間線性相關程度和性質的統(tǒng)計量相關系數(shù)r并進行顯著性檢驗。第三節(jié) 直線相關 直線相關分析是根據(jù)x、y的實際一、相關系數(shù)例:(1)X 7 7 1 6 5 3 8 9 3 1 1 總和50 Y 5 9 6 1 3

20、1 9 4 6 6 6 總和52 (2)X 9 8 7 9 6 5 3 3 1 1 總和50 Y 9 9 8 6 6 5 4 3 1 1 總和52 (3)X 1 1 3 3 5 6 7 1 8 9 總和50 Y 9 9 8 6 6 5 4 3 1 1 總和52可見:(1)X、Y關系紊亂 (2)X減小、Y也減小 (3)X增大、Y減小一、相關系數(shù)例:(1)X 7 7 1 6 5 作散點圖,如果以X和Y的平均數(shù)作坐標原點,將原散點圖劃分為四個象限,則:各點均勻分布 0(如(1);落在2、4象限則小于0負相關(如(3);落在1、3象限則大于0正相關。為消除變異程度(n-1)和單位的影響,需除以標準差。

21、作散點圖,如果以X和Y的平均數(shù)作坐標原點,將原散點圖劃分為四(X,Y )總體沒有相關,則落在象限、的點是均勻分散的,因而正負相消, = 0。 直線回歸與相關課件當(X,Y )總體呈正相關時,落在象限、的點一定比落在象限、的多,故 一定為正;同時落在象限、的點所占的比率愈大,此正值也愈大。 直線回歸與相關課件當(X,Y )總體呈負相關時,則落在象限、的點一定比落在象限、的為多,故 一定為負;且落在象限、的點所占的比率愈大,此負值的絕對值也愈大。 直線回歸與相關課件性質: 。當 時,SSe = 0,即用可以準確預測y值。當r = 0時,SSe = SSy,回歸無作用,即用X的線性函數(shù)完全不能預測Y

22、的變化。但X與Y間還可能存在著非線性關系。當 時,X的線性函數(shù)對預測Y的變化有一定作用,但不能準確預測,這說明Y還受其他一些因素,包括隨機誤差的影響。直線回歸與相關課件二、決定系數(shù)和相關系數(shù) 即:y與x直線回歸效果的好壞取決于回歸平方和在y的總平方和中所占的比例的大小。 r2為 x 對 y 的決定系數(shù),表示了回歸方程估測可靠程度的高低。 二、決定系數(shù)和相關系數(shù) r決定系數(shù)和相關系數(shù)的區(qū)別在于:除掉r=1和0的情況外,r2總是小于r。這就可以防止對相關系數(shù)所表示的相關程度作夸張的解釋。例如:r=0.5,只是說明由x的不同而引起的y變異平方和僅占y總變異(或x總變異)平方和的r2=0.25,即25

23、%,而不是50%。r是可正可負的,而r2則一律取正值,其取值區(qū)間為0,1。因此,在相關分析中將兩者結合起來是可取的,即由r的正或負表示相關的性質,由r2的大小表示相關的程度。決定系數(shù)和相關系數(shù)的區(qū)別在于:相關系數(shù)和決定系數(shù)的計算例9.11 試計算例9.1資料3月下旬至4月中旬積溫和一代三化螟盛發(fā)期的相關系數(shù)和決定系數(shù)。 解:SSx=144.6356,SSy=249.5556,SPxy=-159.0444 r=-159.0444/(144.6356249.5556)1/2=-0.8371 r2=(-159.0444)2/144.6356249.5556=0.7008 以上結果表明,一代三化螟盛發(fā)

24、期與3月下旬至4月中旬的積溫成負相關,即積溫愈高,一代三化螟盛發(fā)期愈早。在一代三化螟盛發(fā)期的變異中有70.08%是由3月下旬至4月中旬的積溫不同造成的。 相關系數(shù)和決定系數(shù)的計算例9.11 試計算例9.1資料3三、相關系數(shù)的顯著性檢驗 (一)查表法: 例9.1,查相關系數(shù)檢驗表(附表12),可得:剩余自由度為7,獨立自變量為1; r0.05=0.666, r0.01=0.798 0.8371, 差異為極顯著。三、相關系數(shù)的顯著性檢驗 (一)查表法:(二)t-檢驗 當總體相關系數(shù)= 0時,r的分布近似于正態(tài)分布。 t = b/Sb b=SPxy/SSx (二)t-檢驗對例9.1進行相關顯著性檢驗

25、查表,t0.01(7) = 3.499 t, 差異極顯著,即X與Y有極顯著的線性關系。對例9.1進行相關顯著性檢驗(1) 回歸和相關分析要有學科專業(yè)知識作指導,回歸和相關分析只是作為一種工具。(2) 要嚴格控制研究對象(X和Y)以外的有關因素,使之保持穩(wěn)定一致。如身高與胸圍。(3) 直線回歸和相關不顯著,并不意味著X和Y沒有關系,只說明沒有顯著的線性關系,不能排除存在曲線關系的可能性。第四節(jié) 直線回歸與相關的應用要點(1) 回歸和相關分析要有學科專業(yè)知識作指導,回歸和相關分析(4)需限制自變量的范圍,結論不能外推。(5) 一個顯著的相關或回歸并不一定具有實踐上的預測意義。 例如,當v=50 時

26、,r=0.273即顯著,但這表明X和Y可用線性關系說明的部分僅占總變異的7.4%,顯然由X預測Y并不可靠。一般,當需要由X預測Y時,r必須在0.7以上,此時Y的變異將有49%以上可以為X的變異說明。(4)需限制自變量的范圍,結論不能外推。(6)為了提高分析的準確度,n要盡可能大一些,至少應有5對以上。同時,X變數(shù)的取值范圍盡可能寬些,一方面可降低回歸方程的誤差,另一方面也能及時發(fā)現(xiàn)X和Y間可能存在的曲線關系。(6)為了提高分析的準確度,n要盡可能大一些,至少應有5對第五節(jié) 協(xié)方差分析一、協(xié)方差分析的意義和功用二、單向分組資料的協(xié)方差分析三、兩向分組資料的協(xié)方差分析第五節(jié) 協(xié)方差分析一、協(xié)方差分

27、析的意義和功用一、協(xié)方差分析的意義和功用(一) 協(xié)方差分析的意義協(xié)方差(covariance)是兩個變數(shù)的互變異數(shù)。對于一個具有N 對(X,Y )的有限總體,定義為: (945)一、協(xié)方差分析的意義和功用(945)對于由n 對(x,y )組成的樣本,定義: 樣本協(xié)方差是乘積和與自由度的商,即平均的乘積和。又稱為均積(mean products)或協(xié)方(MP),是總體協(xié)方差 cov 的估值。協(xié)方差分析(analysis of covariance)是將回歸分析和方差分析綜合起來的一種統(tǒng)計方法。 (946)對于由n 對(x,y )組成的樣本,定義:(946)(二) 協(xié)方差分析的功用1. 當(x,y

28、)為因果關系時,利用 y 依 x 的回歸系數(shù)矯正y變數(shù)的處理平均數(shù),提高精確度。2. 當(x,y)為相關關系時,可通過估計不同變異來源的總體方差和協(xié)方差,作出相應的相關分析。二、單向分組資料的協(xié)方差分析(一) 資料模式與線性組成(二) 協(xié)方差分析的功用設有k 組回歸樣本,每組各有n 對觀察值,則該資料共有kn 對數(shù)據(jù),其模式如表9.8。組 別觀察值總和平均1x11x12x13x1ny11y12y13y1n2x21x22x23x2ny21y22y23y2nk設有k 組回歸樣本,每組各有n 對觀察值,則該資料共有kn 單向分組資料協(xié)方差分析的樣本線性組成為: (947A)將(947A)移項得: (

29、947B) 和 (947C)單向分組資料協(xié)方差分析的樣本線性組成為: (二) 乘積和和自由度的分解 上式中和的 i=1,2,3,k。其中: (949)(948)(二) 乘積和和自由度的分解(949)(948)如果各組的n不等,分別為n1、n2、nk,其和為,則 其相應自由度為 、 、 。(950)如果各組的n不等,分別為n1、n2、nk,其和為,則(9(三) 回歸關系的協(xié)方差分析協(xié)方差分析解決問題的步驟如下:(1)列出處理間、處理內和總變異的DF、SSx、SSy和SP。(2)測驗x 和y 是否存在直線回歸關系。(3)測驗矯正平均數(shù)間的差異顯著性。(4) 如果所得F 為不顯著,表明處理間無顯著差

30、異;如果F 為顯著,則必須算出各個矯正平均數(shù),進行多重比較,作出相應推斷。 (三) 回歸關系的協(xié)方差分析【例10.1】 為了尋找一種較好的哺乳仔豬食欲增進劑,以增進食欲,提高斷奶重,對哺乳仔豬做了以下試驗: 試驗設對照、配方1、配方2、配方3共四個處理,重復12 次,選擇初始條件盡量相近的長白種母豬的哺乳仔豬48頭 ,完全隨機分為4組進行試驗,結果見表10-2,試作分析。 【例10.1】 為了尋找一種較好的哺乳仔豬食欲增進劑,以增 表102 不同食欲增進劑仔豬生長情況表 (單位:kg) 表102 不同食欲增進劑仔豬 此例, =18.25+15.40+15.65+13.85=63.15 =141

31、.80+130.10+144.80+133.80 =550.50 k=4,n=12,kn=412=48 此例, 協(xié)方差分析的計算步驟如下: (一)求x變量的各項平方和與自由度 1、總平方和與自由度 dfT(x)=kn-1=412-1=47 協(xié)方差分析的計算步驟如下:2、處理間平方和與自由度 =k-1=4-1=32、處理間平方和與自由度=k-1=4-1=3 3、處理內平方和與自由度 (二)求y變量各項平方和與自由度 1、總平方和與自由度下一張 主 頁 退 出 上一張 3、處理內平方和與自由度下一張 主 頁 退 2、處理間平方和與自由度 3、處理內平方和與自由度 (三) 求x和y兩變量的各項離均差

32、乘積和與自由度 1、總乘積和與自由度 2、處理間平方和與自由度 =kn-1=412-1=47 2、處理間乘積和與自由度 =1.64下一張 主 頁 退 出 上一張 下一張 主 頁 退 出 上一張 =k-1=4-1=3 3、處理內乘積和與自由度 平方和、乘積和與自由度的計算結果列于表103。 表103 x與y的平方和與乘積和表 =k-1=4-1=3 (四) 對x和y各作方差分析(表104) 表104 初生重與50日齡重的方差分析表下一張 主 頁 退 出 上一張 (四) 對x和y各作方差分析(表104)下 結果表明,4種處理的供試仔豬平均初生重間存在著極顯著的差異,其50 日齡平均重差異不顯著。 須

33、進行協(xié)方差分析,以消除初生重不同對試驗結果的影響,減小試驗誤差,揭示出可能被掩蓋的處理間差異的顯著性。 (五) 協(xié)方差分析 下一張 主 頁 退 出 上一張 結果表明,4種處理的供試仔豬平均初生重間存在著極 1、誤差項回歸關系的分析 誤差項回歸關系分析的意義是要從剔除處理間差異的影響的誤差變異中找出50日齡重(y)與初生重(x)之間是否存在線性回歸關系。 計算出誤差項的回歸系數(shù)并對線性回歸關系進行顯著性檢驗。 若顯著則說明兩者間存在回歸關系,可應用線性回歸關系來校正y值(50日齡重)以消去仔豬初生重(x)不同對它的影響。根據(jù)校正后的y值(校正50日齡重)來進行方差分析。如線性回歸關系不顯著,則無

34、需繼續(xù)進行分析。 1、誤差項回歸關系的分析 回歸分析的步驟如下: (1) 計算誤差項回歸系數(shù),回歸平方和,離回歸平方和與相應的自由度 從誤差項的平方和與乘積和求誤差項回歸系數(shù): (10-10) 誤差項回歸平方和與自由度 (10-11) dfR(e)=1下一張 主 頁 退 出 上一張 回歸分析的步驟如下:下一張 主 頁 退 誤差項離回歸平方和與自由度 =85.08-47.49=37.59 (10-12) (2) 檢驗回歸關系的顯著性(表105) 表105 哺乳仔豬50日齡重與初生重的 回歸關系顯著性檢驗表 誤差項離回歸平方和與自由度 F檢驗表明,誤差項回歸關系極顯著,表明哺乳仔豬50 日齡重與初

35、生重間存在極顯著的線性回歸關系。因此,可以利用線性回歸關系來校正y,并對校正后的y進行方差分析。 2、對校正后的50日齡重作方差分析 (1)求校正后的50日齡重的各項平方和及自由度 利用線性回歸關系對50日齡重作校正 ,并由校正后的50日齡重計算各項平方和是相當 麻煩的,統(tǒng)計學已證明,校正后的總平方和、誤差平方和及自由度等于其相應變異項的離回歸平方和及自由度,因此,其各項平方和及自由度可直接由下述公式計算。 下一張 主 頁 退 出 上一張 F檢驗表明,誤差項回歸關系極顯著,表明哺乳仔豬5 校正50日齡重的總平方和與自由度,即總離回歸平方和與自由度 (10-13) = - =47-1=46 校正

36、50日齡重的誤差項平方和與自由度,即誤差離回歸平方和與自由度 (10-14) = - =44-1=43 上述回歸自由度均為1,因僅有一個自變量x。 校正50日齡重的總平方和與自由度,即總離回歸 校正50日齡重的處理間平方和與自由度 =57.87-37.59=20.28 (10-15) =k-1=4-1=3 (2) 列出協(xié)方差分析表,對校正后的50日齡重進行方差分析(表106) 查F值: =4.275(由線性內插法計算),由于F=7.63 ,P0.01,表明對于校正后的50日齡重不同食欲添加劑配方間存在極顯著的差異。故須進一步檢驗不同處理間的差異顯著性,即進行多重比較。 下一張 主 頁 退 出

37、上一張 校正50日齡重的處理間平方和與自由度下一張 表106 表10-2資料的協(xié)方差分析表SPxybSSy 表106 表10-2資料的協(xié)方差分析表SPx 3、根據(jù)線性回歸關系計算各處理的校正50日齡平均重 誤差項的回歸系數(shù) 表示初生重對50日齡重影響的性質和程度,且不包含處理間差異的影響,于是可用 根據(jù)平均初生重的不同來校正每一處理的50日齡平均重。校正50日齡平均重計算公式如下: (10-16) 下一張 主 頁 退 出 上一張 3、根據(jù)線性回歸關系計算各處理的校正50日齡平均 公式中: 為第i處理校正50日齡平均重; 為第i處理實際50日齡平均重(見表102); 為第i處理實際平均初生重(見

38、表102); 為全試驗的平均數(shù), 為誤差回歸系數(shù), =7.1848 將所需要的各數(shù)值代入(1016)式中,即可計算出各處理的校正50日齡平均重(見表 107)。 公式中: 表107 各處理的校正50日齡平均重計算表 下一張 主 頁 退 出 上一張 表107 各處理的校正50日齡平均重計算表 下一張 主 (10-19) 公式中SSt(x)為x變量的處理間平方和。 然后按誤差自由度查臨界t值,計算出最小顯著差數(shù): (10-20) 4、各處理校正50日齡平均重間的多重比較(1)最小顯著差數(shù)法 由 =43,查臨界t值得: t0.05(43)=2.017,t0.01(43)=2.70于是 LSD0.05

39、=2.0170.4353=0.878 LSD0.01 =2.700.4353 =1.175下一張 主 頁 退 出 上一張 下一張 主 頁 退 出 上一張 不同食欲添加劑配方與對照校正50日齡平均重比較結果見表108。 表108 不同食欲添加劑配方與對照間的 效果比較表 不同食欲添加劑配方與對照校正50日齡平均重比較結 多重比較結果表明: 食欲添加劑配方1、2、3號與對照比較, 其校正50 日齡平均重間均存在極 顯 著的差異,這 里 表 現(xiàn) 為 配 方1、2、3號的校正50日齡平均重均極顯著高于對照。 多重比較結果表明: (2) 最小顯著極差法 (10-21) (10-22)下一張 主 頁 退

40、出 上一張 (2) 最小顯著極差法 下一張 主 頁 =0.8742, n=12,SSt(x)=0.83, SSe(x)=0.92,k=4,代入(1021)式可計算得: SSR值與LSR值見表109。 下一張 主 頁 退 出 上一張 此時 =0.87表109 SSR值與LSR值表下一張 主 頁 退 出 上一張 表109 SSR值與LSR值表下一張 主 頁 退 各處理校正50日齡平均重多重比較結果見表1010。 表1010 各處理校正50日齡平均重 多重比較表(SSR法) 下一張 主 頁 退 出 上一張 各處理校正50日齡平均重多重比較結果見表10 多重比較結果表明: 食欲添加劑配方3、2、1號的

41、哺乳仔豬校正 5 0 日齡平均重極顯著高于對照 ,不同食欲添加劑配方間哺乳仔豬校正50日齡平均重差異不顯著。 下一張 主 頁 退 出 上一張 下一張 主 頁 退 出 上一張 (四) 相關關系資料的協(xié)方差分析相關關系資料的協(xié)方差分析主要討論兩個互有聯(lián)系的總體的相關問題。例9.16 為研究小麥品種經(jīng)濟性狀的數(shù)量遺傳,隨機抽取90個品種,在田間每品種皆種成4個小區(qū)(每小區(qū)1行),共904=360個小區(qū),完全隨機排列。得到小穗數(shù)(x )和百粒重(y )的方差和協(xié)方差分析結果于表9.13。 (四) 相關關系資料的協(xié)方差分析表9.13 90個小麥品種的小穗數(shù)(x)和百粒重(y)的方差分析與協(xié)方差分析 +4

42、變異來源DFx的方差分析y的方差分析(x,y)的協(xié)方差分析SSMSEMSSSMSEMSSPMPEMP品種間 89597.996.719087.82510.9868-127.426-1.4322品種內270108.810.4030 8.31610.03089.9610.0369總變異359706.8096.1412-117.501+4變異來源DFx的方差分析y的方差分析(x,y)的協(xié)方差分表9.13中,x和y兩者的方差分析按單因素方差分析的方法作出;(x,y )的SP 則由(949)求出。將各SP除以相應的DF,即得平均的乘積和,即MP。期望協(xié)方EMP的分量和隨機模型的EMS 相同,僅是以協(xié)方差

43、符號cov代替 。這是處理(品種)效應 為隨機型的資料,目的不是研究特定的品種,而是研究抽出這些品種的小麥總體,因而需估計有關總體參數(shù)。由表9.13中的MS 和EMS 的關系可得:表9.13中,x和y兩者的方差分析按單因素方差分析的方法作出 由表9.13中MP 和EMP 的關系得:因此,小穗數(shù)和百粒重的環(huán)境相關系數(shù)re為: 因此,小穗數(shù)和百粒重的環(huán)境相關系數(shù)re為: 品種(基因型)相關系數(shù)rg為: 以上re所對應的自由度是k(n-1)-1=269,為極顯 著;rg的假設測驗比較復雜,其簡單近似是具自由 度k-2=88,亦為極顯著。 根據(jù)以上方差和協(xié)方差分量,還能估計出小穗數(shù)和 百粒重的表型相關

44、rp可估計為: 品種(基因型)相關系數(shù)rg為: 以上re所對應的自由度是k 三、兩向分組資料的協(xié)方差分析 (一) 資料模式與線性組成 若資料有m類k組,則mk對觀察值按兩向分類,其模式如表9.14。表9.14 兩向分組的兩個變數(shù)的符號三、兩向分組資料的協(xié)方差分析 樣本線性組成為: (954A)移項后可得: (954B) 和 (954C) 樣本線性組成為:(二) 乘積和和自由度的分解 表9.14的總SP 可分解為類間、組間和誤差三部分,其值為: (955)(二) 乘積和和自由度的分解(三)協(xié)方差分析兩向分組資料的協(xié)方差分析和單向分組資料并無原則上的不同,只是多了一個方向的變異來源。例9.17 表

45、9.15是研究施肥期和施肥量對雜交水稻南優(yōu)3號結實率影響的部分結果,共14個處理,2個區(qū)組,隨機區(qū)組設計。由于在試驗過程中發(fā)現(xiàn)單位面積上的穎花數(shù)對結實率似有明顯的回歸關系,因此將穎花數(shù)(x,萬/m2)和結實率(y,%)一起測定。該試驗的處理效應為固定型,故按因果關系資料回歸模型作協(xié)方差分析。 (三)協(xié)方差分析表9.15 南優(yōu)3號的穎花數(shù)(x)和結實率(y)資料 處理區(qū) 組TiIIIxyxyxy12345678910111213144.594.093.943.903.453.483.393.143.344.124.123.843.963.03586564667171717269616367647

46、54.324.114.113.573.793.383.033.243.044.764.753.604.503.01 61 62 64 69 67 72 74 69 69 54 56 62 60 718.918.208.057.477.246.866.426.386.388.888.877.448.466.041191271281351381431451411381151191291241464.4554.1004.0253.7353.6203.4303.2103.1903.1904.4404.4353.7204.2303.02059.563.564.067.569.071.572.570.56

47、9.057.559.564.562.073.064.7666.0365.9567.2267.8468.8768.1866.0264.5362.6464.6064.1065.5367.22Tr52.3993753.21910105.60 1847處理區(qū) 組TiIIIxyxyxy14.595 首先用兩向分組資料的通常方法算得表9.15資料的各項平方和于表9.16,乘積和則由以下各式算出:SPT=(4.5958)+(4.0965)+(3.0171) = - 73.60SPR=SPt= 首先用兩向分組資料的通常方法算得表9.15資料的各項平方和 SPe= - 73.60 - (- 0.79) - (- 66.37)= - 6.44 表9.16 表9.15資料的平方和和乘積和 變 異 來 源SSxSSySP總 變 異7.7344802.96-73.60區(qū) 組 間0.024026.03-0.79處 理 間6.8732694.46-66.37誤 差0.837282.47-6.44 有了上述結果,就可先對x 和y 變數(shù)各作一方差分 析,見表9.17。 SPe= - 7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論