excel一元及多元線性回歸實例._第1頁
excel一元及多元線性回歸實例._第2頁
excel一元及多元線性回歸實例._第3頁
excel一元及多元線性回歸實例._第4頁
excel一元及多元線性回歸實例._第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、野外實習(xí)資料的數(shù)理統(tǒng)計分析一元線性回歸分析一元回歸處理的是兩個變量之間的關(guān)系,即兩個變量X和Y之間如 果存在一定的關(guān)系,則通過觀測所得數(shù)據(jù),找出兩者之間的關(guān)系式。 如果兩個變量的關(guān)系大致是線性的,那就是一元線性回歸問題。對兩個現(xiàn)象X和Y進(jìn)行觀察或?qū)嶒?,得到兩組數(shù)值:XI,X2,.,Xn和Y1,Y2,Yn,假如要找出一個函數(shù)Y=f(X),使它在X=X1,X2, .,Xn 時的數(shù)值 f(X1),f(X2), .,f(Xn)與觀察值 Y1,Y2,,Yn趨于接近。在一個平面直角坐標(biāo)XOY中找出(XI,Y1),(X2,Y2),(Xn,Yn)各點,將其各點分布狀況進(jìn)行察看,即可以清楚地看出 其各點分布狀況

2、接近一條直線。對于這種線性關(guān)系,可以用數(shù)學(xué)公式 表示:Y = a + bX這條直線所表示的關(guān)系,叫做變量Y對X的回歸直線,也叫Y對X 的回歸方程。其中a為常數(shù),b為Y對于X的回歸系數(shù)。對于任何具有線性關(guān)系的兩組變量Y與X,只要求解出a與b的值, 即可以寫出回歸方程。計算a與b值的公式為:a =Y-bX乎i - g式中:云為變量X的均值,Xi為第i個自變量的樣本值,為因變量 的均值,Yi為第i個因變量Y的樣本值。n為樣本數(shù)。當(dāng)前一般計算機(jī)的Microsoft Excel中都有現(xiàn)成的回歸程序,只要將所 獲得的數(shù)據(jù)錄入就可自動得到回歸方程。得到的回歸方程是否有意義,其相關(guān)的程度有多大,可以根據(jù)相關(guān)系

3、 數(shù)的大小來決定。通常用r來表示兩個變量X和Y之間的直線相關(guān) 程度,r為X和Y的相關(guān)系數(shù)。r值的絕對值越大,兩個變量之間的 相關(guān)程度就越高。當(dāng)r為正值時,叫做正相關(guān),r為負(fù)值時叫做負(fù)相 關(guān)。r的計算公式如下:F = i-1律-打玄尊3尸 式中各符號的意義同上。在求得了回歸方程與兩個變量之間的相關(guān)系數(shù)后,可以利用F檢驗 法、t檢驗法或r檢驗法來檢驗兩個變量是否顯著相關(guān)。具體的檢驗 方法在后面介紹。2.多元線性回歸分析一元回歸研究的是一個自變量和一個因變量的各種關(guān)系。但是客觀事 物的變化往往受到多種因素的影響,即使其中有一個因素起著主導(dǎo)作 用,但其它因素的作用也是不可忽視的。因此,我們還需要研究多

4、種 變量的關(guān)系,這種多個變量之間的關(guān)系就叫做多元回歸問題。例如, 水稻的產(chǎn)量不僅與生長期內(nèi)的雨量有關(guān),而且與溫度也有關(guān)系。所以 尋求水稻的產(chǎn)量不僅與生長期內(nèi)的雨量之間的相互關(guān)系,就是多元回 歸問題。如果假設(shè)自變量為XI,X2,Xm,因變量為Y,而且因變量與 自變量之間是線性的關(guān)系,則因變量Y與自變量為XI,X2,,Xm 的多元線性回歸方程為:Y = a+b1X1+b2X2+. .+bmXm式中:a, bl,b2,bm為常數(shù)。因此,只要能夠求出a,bl,b2,bm這些常數(shù),就可以得到因 變量Y與自變量為Xl,X2,,Xm之間的多元回歸方程。具體的 算法比較簡單,但很煩瑣。這里不再敘述。求解多元回

5、歸的計算機(jī)程 序很多,只要將自變量的數(shù)據(jù)以及與其相對應(yīng)的因變量的數(shù)據(jù)輸入計 算機(jī)程序中,立刻就可以求出a,bl,b2,,bm各常數(shù)的值,從 而可以獲得因變量Y與自變量為Xl,X2,Xm的多元線性回歸 方程。例如,設(shè)已知因變量Y的自變量X1, X2, X3,共得18組數(shù)據(jù),并 已知Y對Xi存在著線性關(guān)系,求其回歸方程。樣品X1X2X3Y10.4531586420.4231636033.119377140.6341576154.724595461.7651237779.444468110.193831117911.62917393112511012.6581110.937111761223.146

6、114961323.150134771421.64473931523936143541726.8582021681829.95112499通過求解,得到 a=41.6516b1=1.7410b2=-0.0062b3=0.1553所以,回歸方程為Y=41.6516+1.7410 X1 -0.0062 X2+0.1553 X3通??刹捎脝蜗嚓P(guān)系數(shù)、偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)來說明這三個自變 量與因變量之間是否有明顯的線性關(guān)系以及它們之間相關(guān)的程度如 何。單相關(guān)系數(shù)是指在不考慮其他因素影響的條件下,所求兩個變量 之間的相關(guān)系數(shù)。用rX1X2、rYX1和rYX2分別表示X1和X2

7、、Y 和X1以及Y與X2之間的單相關(guān)系數(shù)。偏相關(guān)系數(shù)是指在這三個變 量中,將其中一個變量保持常數(shù)時,其他兩個變量之間的相關(guān)系數(shù)。 用rYX1X2和rYX2X1分別表示X2為常數(shù)時,Y與X1的偏相關(guān)系 數(shù)和X1為常數(shù)時,Y與X2的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)可以用單相 關(guān)系數(shù)求得。當(dāng)這三個變量中,同時考慮兩個變量對另一個變量相關(guān) 系數(shù)時,叫做復(fù)相關(guān)系數(shù)。用r(X1X2)Y表示X1和X2、兩個自 變量對于Y的復(fù)相關(guān)系數(shù)。3.方差分析方差分析法是分析多組平均數(shù)之間差異顯著性時常用的一種統(tǒng)計方 法。方差(或均方)是一個表示變異程度的量,它是離均差的平方和 與自由度之商。在一項實驗或調(diào)查中往往存在著許多造成生

8、物形狀變 異的因素,這些因素有比較重要的,也有較次要的。分析時主要是把 平方和與自由度按不同的變異起因分解為若干部分,從而構(gòu)成來自不 同起因的方差。利用它來檢驗各組平均數(shù)之間差異的顯著性。在正態(tài) 總體及方差相同的基本假定下,我們將利用方差比給出F分布的檢驗 統(tǒng)計量。因此這種方法稱為方差分析法。方差分析是分析和處理試驗或觀測數(shù)據(jù)的主要方法之一。它首先被應(yīng) 用于農(nóng)業(yè)試驗,目前它在農(nóng)業(yè)、工業(yè)、生物、醫(yī)學(xué)等各部門有著廣泛 的應(yīng)用。方差分析的方法往往與試驗設(shè)計的方式緊密地聯(lián)系在一起。 對于從不同試驗設(shè)計中得出觀測資料,進(jìn)行方差分析時將有不同的計 算方法,類型繁多,但其基本原理卻大同小異。在這里將結(jié)合一個

9、較 簡單的例子介紹方差分析的數(shù)學(xué)模型和基本方法,以便于讀者對方差 分析的方法有一個大致的了解。在實驗設(shè)計的基礎(chǔ)上,分組試驗,如分為a組,每組作b個水平的試 驗,共得到axb個數(shù)據(jù)。然后,算出組平均值和總平均值,組內(nèi)和組 間的離差平方和,組內(nèi)和組間方差,作F檢驗。F=組間方差/組內(nèi)方差假設(shè)HO:叩=p2 = .=皿,表示各水平的均值相等。當(dāng)F Fa時,HO:假。試驗中必不可少地會產(chǎn)生誤差。誤差有兩種:條件誤差和試驗誤差。前者是由試驗條件不同而引起的系統(tǒng)性誤差,后者是在相同試驗條件 下引起的隨機(jī)誤差。例如,把四種不同的飼料分別喂給4組小雞,每組5只,它們的增重 情況如下:組別增重(Xij)5549

10、42215261112308963429781959216913716885153試問四組小雞在平均增重量方面有沒有明顯的差別?通過計算,得到組內(nèi)和組間方差分別為719.2和8706.3,因此,F(xiàn)=8706.3/719.2=12.1對于給定的顯著性水平a,將有臨界值Fa 一,當(dāng)a=0.01時, F0.01(3,16)=5.3,其中3與16是自由度。所以 F=12.15.3= F0.01(3,16)故,否定各種飼料效果一致的假設(shè),可以認(rèn)為四種飼料的效果有極明 顯的差別。目前現(xiàn)成的計算機(jī)方差分析計算程序很多,如SPASS、SAS軟件等, 將數(shù)據(jù)輸入后,都可以直接計算,并按要求輸出結(jié)果。上述例子是單

11、因素的方差分析,比較簡單。對于多因素的方差分析, 由于比較復(fù)雜,這里就不再敘述了。4. T檢驗生物學(xué)中所遇到的絕大多數(shù)問題,總體標(biāo)準(zhǔn)差。都是未知的。在。未知時,平均數(shù)的顯著性檢驗有兩種解決方法。其一是根據(jù)以往的經(jīng) 驗或從類似的工作中估計出一個。值,用這個。做檢驗。使用估計 的。做檢驗并不是很可靠的。因此在實際工作中,一般不用這種方法 而廣泛使用t檢驗。對于一個正態(tài)分布總體,若。未知則云服從n-1自由度的t分布,因 此,在。未知時可以用t檢驗做平均數(shù)的顯著性檢驗。t檢驗的零假設(shè)H0為:p=M備擇假設(shè)有以下三種情況:(1)HA: pM,若已知不可能小于M;(2)HA: pM 和 pta ; (2)

12、 t ta/2,或表示為 t ta (雙側(cè))。其中a為給定的顯著性水平。t檢驗的統(tǒng)計量為:t = ( X中0)/(s/n1/2)例如,已知玉米單交種群單105的平均穗重M=300克,噴藥后,隨 機(jī)抽取9個果穗,其穗重為分別:308、305、311、298、315、300、 321、294、320克。問噴藥后與噴藥前的果穗重差異是否顯著?根據(jù)上面介紹的基本程序:已知玉米穗重是服從正態(tài)分布的隨機(jī)變量,o未知。(2)假設(shè):H0 : ji=M=300HA:岬M=300由于問題要求檢驗的是“果穗重差異是否顯著”,并沒有明確穗重一定 增加或一定減少,所以備擇假設(shè)為HA:岬M(3)顯著性水平:根據(jù)實驗的要求

13、(差異是否,顯著”)規(guī)定a=0.05。(4)統(tǒng)計量的值:由于o未知需使用t檢驗。t = ( X中0)/ (s/n1/2)t = (308-3000) / (9.62/91/2) =2.4911(5)建立的拒絕域H0: 因 HA:岬皿所以是雙側(cè)檢驗。當(dāng)tt0.05 (雙 側(cè))時拒絕H0,a=0.05時,經(jīng)查表t8,0.05(雙側(cè))=2.306。II(6)結(jié)論:因t =2.49 t8,0.05(雙側(cè))=2.306,所以結(jié)論是拒絕 曰0,接受曰人。即噴藥前后果穗重的差異是顯著的。5. F檢驗t檢驗屬于單個樣本的顯著性檢驗,即在樣本統(tǒng)計量與零假設(shè)所提出 的總體參量之間做比較。這種檢驗需要我們事先能夠提出合理的參量 假設(shè)值和對參量有某種意義的備擇值。然而,在實際工作中,很難提 出這樣的假設(shè)值及備擇值。因此,限制了這種方法在實際工作中的應(yīng) 用。為了避免上述問題的出現(xiàn),在實際應(yīng)用時,常常選擇兩個樣本,一個 作為處理,一個作為對照。在這兩個樣本之間做比較。判斷它們之間 是否存在足夠顯著的差異。當(dāng)它們之間的差異不能用偶然性解釋時, 則認(rèn)為它們之間存在足夠顯著的差異,這兩個樣本來自兩個不同的總 體。而F檢驗是關(guān)于兩個方差的檢驗,所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論