[整理]excel一元及多元線性回歸實例._第1頁
[整理]excel一元及多元線性回歸實例._第2頁
[整理]excel一元及多元線性回歸實例._第3頁
[整理]excel一元及多元線性回歸實例._第4頁
[整理]excel一元及多元線性回歸實例._第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、野外實習(xí)資料的數(shù)理統(tǒng)計分析 一元線性回歸分析 一元回歸處理的是兩個變量之間的關(guān)系,即兩個變量X和Y之間如 果存在一定的關(guān)系,則通過觀測所得數(shù)據(jù),找出兩者之間的關(guān)系式。 如果兩個變量的關(guān)系大致是線性的,那就是一元線性回歸問題。 對兩個現(xiàn)象X和丫進行觀察或?qū)嶒灒玫絻山M數(shù)值:X1,X2,, Xn和Y1 , Y2,,Yn,假如要找出一個函數(shù) Y=f(X),使它在 X=X1,X2,Xr時寸的數(shù)值f(X1),f(X2),與觀察值Y1, Y2, Yn趨于接近。 在一個平面直角坐標XOY中找出(X1 , Y1) ,( X2 , Y2),, (Xn, Yn)各點,將其各點分布狀況進行察看,即可以清楚地看出 其

2、各點分布狀況接近一條直線。對于這種線性關(guān)系,可以用數(shù)學(xué)公式 表示: Y 二 a + bX 這條直線所表示的關(guān)系,叫做變量 丫對X的回歸直線,也叫Y對X 的回歸方程。其中a為常數(shù),b為丫對于X的回歸系數(shù)。 對于任何具有線性關(guān)系的兩組變量 Y與X,只要求解出a與b的值, 即可以寫出回歸方程。計算a與b值的公式為: a=Y-bX 式中:匚為變量X的均值,Xi為第i個自變量的樣本值,?為因變量 的均值,Yi為第i個因變量Y的樣本值。n為樣本數(shù)。 當前一般計算機的Microsoft Excel中都有現(xiàn)成的回歸程序,只要將所 獲得的數(shù)據(jù)錄入就可自動得到回歸方程。 得到的回歸方程是否有意義,其相關(guān)的程度有多

3、大,可以根據(jù)相關(guān)系 數(shù)的大小來決定。通常用r來表示兩個變量X和Y之間的直線相關(guān) 程度,r為X和丫的相關(guān)系數(shù)。r值的絕對值越大,兩個變量之間的 相關(guān)程度就越高。當r為正值時,叫做正相關(guān),r為負值時叫做負相 關(guān)。r的計算公式如下: 辛(尤-和叼/ rJ)吃3 叩 / V Zi.l 式中各符號的意義同上。 在求得了回歸方程與兩個變量之間的相關(guān)系數(shù)后,可以利用F檢驗 法、t檢驗法或r檢驗法來檢驗兩個變量是否顯著相關(guān)。具體的檢驗 方法在后面介紹。 2多元線性回歸分析 一元回歸研究的是一個自變量和一個因變量的各種關(guān)系。 但是客觀事 物的變化往往受到多種因素的影響, 即使其中有一個因素起著主導(dǎo)作 用,但其它

4、因素的作用也是不可忽視的。因此,我們還需要研究多種 變量的關(guān)系,這種多個變量之間的關(guān)系就叫做多元回歸問題。例如, 水稻的產(chǎn)量不僅與生長期內(nèi)的雨量有關(guān), 而且與溫度也有關(guān)系。 所以 尋求水稻的產(chǎn)量不僅與生長期內(nèi)的雨量之間的相互關(guān)系, 就是多元回 歸問題。 如果假設(shè)自變量為X1 , X2,,Xm,因變量為Y,而且因變量與 自變量之間是線性的關(guān)系,則因變量丫與自變量為X1 , X2,,Xm 的多元線性回歸方程為: Y = a+b1X1+b2X2+ +bmXm 式中: a, b1 , b2, bm 為常數(shù)。 因此,只要能夠求出a, bl, b2,,bm這些常數(shù),就可以得到因 變量 Y 與自變量為 X1

5、 , X2 , , Xm 之間的多元回歸方程。具體的 算法比較簡單,但很煩瑣。 這里不再敘述。求解多元回歸的計算機程 序很多,只要將自變量的數(shù)據(jù)以及與其相對應(yīng)的因變量的數(shù)據(jù)輸入計 算機程序中,立刻就可以求出 a, b1, b2,,bm各常數(shù)的值,從 而可以獲得因變量丫與自變量為X1 , X2 ,,Xm的多元線性回歸 方程。 例如,設(shè)已知因變量Y的自變量X1 , X2, X3,共得18組數(shù)據(jù),并 已知 Y 對 Xi 存在著線性關(guān)系,求其回歸方程。 樣品 X1 X2 X3 Y 1 0.4 53 158 64 2 0.4 23 163 60 3 3.1 19 37 71 4 0.6 34 157 6

6、1 5 4.7 24 59 54 6 1.7 65 123 77 7 9.4 44 46 81 10.1 93 8 31 117 9 11.6 29 173 93 112 51 10 12.6 58 11 10.9 37 111 76 12 23.1 46 114 96 13 23.1 50 134 77 14 21.6 44 73 93 15 23.1 56 168 95 16 1.9 36 143 54 17 26.8 58 202 168 18 29.9 51 124 99 通過求解,得到 a=41.6516b1=1.7410b2=-0.0062b3=0.1553 所以,回歸方程為 Y=

7、41.6516+1.7410 X1 -0.0062 X2+0.1553 X3 通常可采用單相關(guān)系數(shù)、 偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)來說明這三個自變 量與因變量之間是否有明顯的線性關(guān)系以及它們之間相關(guān)的程度如 何。單相關(guān)系數(shù)是指在不考慮其他因素影響的條件下, 所求兩個變量 之間的相關(guān)系數(shù)。用rX1X2、rYX1和rYX2分別表示X1和X2、Y 和 X1 以及 Y 與 X2 之間的單相關(guān)系數(shù)。偏相關(guān)系數(shù)是指在這三個變 量中,將其中一個變量保持常數(shù)時,其他兩個變量之間的相關(guān)系數(shù)。 用 rYX1X2 和 rYX2X1 分別表示 X2 為常數(shù)時, Y 與 X1 的偏相關(guān)系 數(shù)和 X1 為常數(shù)時, Y 與 X2

8、 的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)可以用單相 關(guān)系數(shù)求得。 當這三個變量中, 同時考慮兩個變量對另一個變量相關(guān) 系數(shù)時,叫做復(fù)相關(guān)系數(shù)。用r (X1X2) 丫表示X1和X2、兩個自 變量對于 Y 的復(fù)相關(guān)系數(shù)。 3. 方差分析 方差分析法是分析多組平均數(shù)之間差異顯著性時常用的一種統(tǒng)計方 法。方差(或均方)是一個表示變異程度的量,它是離均差的平方和 與自由度之商。在一項實驗或調(diào)查中往往存在著許多造成生物形狀變 異的因素,這些因素有比較重要的,也有較次要的。分析時主要是把 平方和與自由度按不同的變異起因分解為若干部分, 從而構(gòu)成來自不 同起因的方差。 利用它來檢驗各組平均數(shù)之間差異的顯著性。 在正態(tài) 總體

9、及方差相同的基本假定下, 我們將利用方差比給出 F 分布的檢驗 統(tǒng)計量。因此這種方法稱為方差分析法。 方差分析是分析和處理試驗或觀測數(shù)據(jù)的主要方法之一。 它首先被應(yīng) 用于農(nóng)業(yè)試驗,目前它在農(nóng)業(yè)、工業(yè)、生物、醫(yī)學(xué)等各部門有著廣泛 的應(yīng)用。方差分析的方法往往與試驗設(shè)計的方式緊密地聯(lián)系在一起。 對于從不同試驗設(shè)計中得出觀測資料, 進行方差分析時將有不同的計 算方法,類型繁多,但其基本原理卻大同小異。在這里將結(jié)合一個較 簡單的例子介紹方差分析的數(shù)學(xué)模型和基本方法, 以便于讀者對方差 分析的方法有一個大致的了解。 在實驗設(shè)計的基礎(chǔ)上,分組試驗,如分為 a組,每組作b個水平的試 驗,共得到ab個數(shù)據(jù)。然后

10、,算出組平均值和總平均值,組內(nèi)和組 間的離差平方和,組內(nèi)和組間方差,作 F 檢驗。 F=組間方差/組內(nèi)方差 假設(shè)HO:1 =卩2=p b,表示各水平的均值相等。當 F F出寸,HO:假。 試驗中必不可少地會產(chǎn)生誤差。誤差有兩種:條件誤差和試驗誤差。 前者是由試驗條件不同而引起的系統(tǒng)性誤差, 后者是在相同試驗條件 下引起的隨機誤差。 例如,把四種不同的飼料分別喂給 4 組小雞,每組 5只,它們的增重 情況如下: 組別增重( Xij ) 1 5549422152 2 61112308963 3 4297819592 4 16913716885153 試問四組小雞在平均增重量方面有沒有明顯的差別?

11、通過計算,得到組內(nèi)和組間方差分別為719.2和 8706.3,因此, F=8706.3/719.2=12.1 對于給定的顯著性水平 a將有臨界值Fa ,當a =0.01時, F0.01(3,16)=5.3,其中3與16是自由度。 所以 F=12.15.3= F0.01(3,16) 故,否定各種飼料效果一致的假設(shè),可以認為四種飼料的效果有極明 顯的差別。 目前現(xiàn)成的計算機方差分析計算程序很多,如 SPASS、SAS軟件等, 將數(shù)據(jù)輸入后,都可以直接計算,并按要求輸出結(jié)果。 上述例子是單因素的方差分析,比較簡單。對于多因素的方差分析, 由于比較復(fù)雜,這里就不再敘述了。 4. T檢驗 生物學(xué)中所遇到

12、的絕大多數(shù)問題,總體標準差 C都是未知的。在(T 未知時,平均數(shù)的顯著性檢驗有兩種解決方法。 其一是根據(jù)以往的經(jīng) 驗或從類似的工作中估計出一個。值,用這個。做卩檢驗。使用估計 的C做檢驗并不是很可靠的。因此在實際工作中,一般不用這種方法 而廣泛使用t檢驗。 對于一個正態(tài)分布總體,若 。未知則二服從n-1自由度的t分布,因 此,在未知時可以用t檢驗做平均數(shù)的顯著性檢驗。 t檢驗的零假設(shè)H0為:卩=0 備擇假設(shè)有以下三種情況:(1) HA :卩 卩,0若已知不可能小于卩0 (2) HA :卩 卩,0若已知 卩不可能大于 卩0 (3) HA :卩工卩0包括 卩 卩和卩 卩0 三種備擇假設(shè)的拒絕域為:

13、 (1) tt a; ( 2) t t ,或表示為 t t a雙側(cè))。 其中a為給定的顯著性水平。 t檢驗的統(tǒng)計量為: t =(X十0 / (s/n1/2) 例如,已知玉米單交種群單105的平均穗重卩0=30(克,噴藥后,隨 機抽取9個果穗,其穗重為分別:308、305、311、298、315、300、 321、294、320克。問噴藥后與噴藥前的果穗重差異是否顯著? 根據(jù)上面介紹的基本程序: -已知玉米穗重是服從正態(tài)分布的隨機變量,未知。 (2) 假設(shè):H0 :卩二卩0=300HA卩工卩0=300 由于問題要求檢驗的是 果穗重差異是否顯著”,并沒有明確穗重一定 增加或一定減少,所以備擇假設(shè)為

14、 HA :卩工卩0 (3) 顯著性水平:根據(jù)實驗的要求(差異是否 顯著”)規(guī)定a =0.05 (4) 統(tǒng)計量的值:由于 。未知需使用t檢驗。 t = (X-/ (s/n1/2) t =(308-3000) / (9.62/91 =2.49 11(5)建立的拒絕域H0:因HA :卩工廚以是雙側(cè)檢驗。當t t0.05 (雙 側(cè))時拒絕H0, a =0.05寸,經(jīng)查表t8, 0.05 (雙側(cè))=2.306。 I(6)結(jié)論:因t =2.49 t8, 0.05 (雙側(cè))=2.306,所以結(jié)論是拒絕 H0,接受HA。即噴藥前后果穗重的差異是顯著的。 5. F檢驗 t檢驗屬于單個樣本的顯著性檢驗,即在樣本統(tǒng)計量與零假設(shè)所提出 的總體參量之間做比較。這種檢驗需要我們事先能夠提出合理的參量 假設(shè)值和對參量有某種意義的備擇值。然而,在實際工作中,很難提 出這樣的假設(shè)值及備擇值。因此,限制了這種方法在實際工作中的應(yīng) 用。 為了避免上述問題的出現(xiàn),在實際應(yīng)用時,常常選擇兩個樣本,一個 作為處理,一個作為對照。在這兩個樣本之間做比較。判斷它們之間 是否存在足夠顯著的差異。當它們之間的差異不能用偶然性解釋時, 則認為它們之間存在足夠顯著的差異,這兩個樣本來自兩個不同的總 體。而F檢驗是關(guān)于兩個方差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論