excel一元及多元線(xiàn)性回歸實(shí)例教學(xué)內(nèi)容_第1頁(yè)
excel一元及多元線(xiàn)性回歸實(shí)例教學(xué)內(nèi)容_第2頁(yè)
excel一元及多元線(xiàn)性回歸實(shí)例教學(xué)內(nèi)容_第3頁(yè)
excel一元及多元線(xiàn)性回歸實(shí)例教學(xué)內(nèi)容_第4頁(yè)
excel一元及多元線(xiàn)性回歸實(shí)例教學(xué)內(nèi)容_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Good is good, but better carries it.精益求精,善益求善。excel一元及多元線(xiàn)性回歸實(shí)例-野外實(shí)習(xí)資料的數(shù)理統(tǒng)計(jì)分析一元線(xiàn)性回歸分析一元回歸處理的是兩個(gè)變量之間的關(guān)系,即兩個(gè)變量X和Y之間如果存在一定的關(guān)系,則通過(guò)觀測(cè)所得數(shù)據(jù),找出兩者之間的關(guān)系式。如果兩個(gè)變量的關(guān)系大致是線(xiàn)性的,那就是一元線(xiàn)性回歸問(wèn)題。對(duì)兩個(gè)現(xiàn)象X和Y進(jìn)行觀察或?qū)嶒?yàn),得到兩組數(shù)值:X1,X2,,Xn和Y1,Y2,Yn,假如要找出一個(gè)函數(shù)Y=f(X),使它在X=X1,X2,Xn時(shí)的數(shù)值f(X1),f(X2),f(Xn)與觀察值Y1,Y2,Yn趨于接近。在一個(gè)平面直角坐標(biāo)XOY中找出(X1,Y

2、1),(X2,Y2),(Xn,Yn)各點(diǎn),將其各點(diǎn)分布狀況進(jìn)行察看,即可以清楚地看出其各點(diǎn)分布狀況接近一條直線(xiàn)。對(duì)于這種線(xiàn)性關(guān)系,可以用數(shù)學(xué)公式表示:Y=a+bX這條直線(xiàn)所表示的關(guān)系,叫做變量Y對(duì)X的回歸直線(xiàn),也叫Y對(duì)X的回歸方程。其中a為常數(shù),b為Y對(duì)于X的回歸系數(shù)。對(duì)于任何具有線(xiàn)性關(guān)系的兩組變量Y與X,只要求解出a與b的值,即可以寫(xiě)出回歸方程。計(jì)算a與b值的公式為:式中:為變量X的均值,Xi為第i個(gè)自變量的樣本值,為因變量的均值,Yi為第i個(gè)因變量Y的樣本值。n為樣本數(shù)。當(dāng)前一般計(jì)算機(jī)的MicrosoftExcel中都有現(xiàn)成的回歸程序,只要將所獲得的數(shù)據(jù)錄入就可自動(dòng)得到回歸方程。得到的回歸

3、方程是否有意義,其相關(guān)的程度有多大,可以根據(jù)相關(guān)系數(shù)的大小來(lái)決定。通常用r來(lái)表示兩個(gè)變量X和Y之間的直線(xiàn)相關(guān)程度,r為X和Y的相關(guān)系數(shù)。r值的絕對(duì)值越大,兩個(gè)變量之間的相關(guān)程度就越高。當(dāng)r為正值時(shí),叫做正相關(guān),r為負(fù)值時(shí)叫做負(fù)相關(guān)。r的計(jì)算公式如下:式中各符號(hào)的意義同上。在求得了回歸方程與兩個(gè)變量之間的相關(guān)系數(shù)后,可以利用F檢驗(yàn)法、t檢驗(yàn)法或r檢驗(yàn)法來(lái)檢驗(yàn)兩個(gè)變量是否顯著相關(guān)。具體的檢驗(yàn)方法在后面介紹。2多元線(xiàn)性回歸分析一元回歸研究的是一個(gè)自變量和一個(gè)因變量的各種關(guān)系。但是客觀事物的變化往往受到多種因素的影響,即使其中有一個(gè)因素起著主導(dǎo)作用,但其它因素的作用也是不可忽視的。因此,我們還需要研究

4、多種變量的關(guān)系,這種多個(gè)變量之間的關(guān)系就叫做多元回歸問(wèn)題。例如,水稻的產(chǎn)量不僅與生長(zhǎng)期內(nèi)的雨量有關(guān),而且與溫度也有關(guān)系。所以尋求水稻的產(chǎn)量不僅與生長(zhǎng)期內(nèi)的雨量之間的相互關(guān)系,就是多元回歸問(wèn)題。如果假設(shè)自變量為X1,X2,Xm,因變量為Y,而且因變量與自變量之間是線(xiàn)性的關(guān)系,則因變量Y與自變量為X1,X2,Xm的多元線(xiàn)性回歸方程為:Y=a+b1X1+b2X2+bmXm式中:a,b1,b2,bm為常數(shù)。因此,只要能夠求出a,b1,b2,bm這些常數(shù),就可以得到因變量Y與自變量為X1,X2,Xm之間的多元回歸方程。具體的算法比較簡(jiǎn)單,但很煩瑣。這里不再敘述。求解多元回歸的計(jì)算機(jī)程序很多,只要將自變量

5、的數(shù)據(jù)以及與其相對(duì)應(yīng)的因變量的數(shù)據(jù)輸入計(jì)算機(jī)程序中,立刻就可以求出a,b1,b2,bm各常數(shù)的值,從而可以獲得因變量Y與自變量為X1,X2,Xm的多元線(xiàn)性回歸方程。例如,設(shè)已知因變量Y的自變量X1,X2,X3,共得18組數(shù)據(jù),并已知Y對(duì)Xi存在著線(xiàn)性關(guān)系,求其回歸方程。樣品X1X2X3Y10.4531586420.4231636033.119377140.6341576154.724595461.7651237779.4444681810629173931012.658112511110.937111761223.146114961323.150134771421.6

6、4473931523936143541726.8582021681829.95112499通過(guò)求解,得到a=41.6516b1=1.7410b2=-0.0062b3=0.1553所以,回歸方程為Y=41.6516+1.7410X1-0.0062X2+0.1553X3通??刹捎脝蜗嚓P(guān)系數(shù)、偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)來(lái)說(shuō)明這三個(gè)自變量與因變量之間是否有明顯的線(xiàn)性關(guān)系以及它們之間相關(guān)的程度如何。單相關(guān)系數(shù)是指在不考慮其他因素影響的條件下,所求兩個(gè)變量之間的相關(guān)系數(shù)。用rX1X2、rYX1和rYX2分別表示X1和X2、Y和X1以及Y與X2之間的單相關(guān)系數(shù)。偏相關(guān)系數(shù)是指在這三個(gè)變

7、量中,將其中一個(gè)變量保持常數(shù)時(shí),其他兩個(gè)變量之間的相關(guān)系數(shù)。用rYX1X2和rYX2X1分別表示X2為常數(shù)時(shí),Y與X1的偏相關(guān)系數(shù)和X1為常數(shù)時(shí),Y與X2的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)可以用單相關(guān)系數(shù)求得。當(dāng)這三個(gè)變量中,同時(shí)考慮兩個(gè)變量對(duì)另一個(gè)變量相關(guān)系數(shù)時(shí),叫做復(fù)相關(guān)系數(shù)。用r(X1X2)Y表示X1和X2、兩個(gè)自變量對(duì)于Y的復(fù)相關(guān)系數(shù)。3.方差分析方差分析法是分析多組平均數(shù)之間差異顯著性時(shí)常用的一種統(tǒng)計(jì)方法。方差(或均方)是一個(gè)表示變異程度的量,它是離均差的平方和與自由度之商。在一項(xiàng)實(shí)驗(yàn)或調(diào)查中往往存在著許多造成生物形狀變異的因素,這些因素有比較重要的,也有較次要的。分析時(shí)主要是把平方和與自由度

8、按不同的變異起因分解為若干部分,從而構(gòu)成來(lái)自不同起因的方差。利用它來(lái)檢驗(yàn)各組平均數(shù)之間差異的顯著性。在正態(tài)總體及方差相同的基本假定下,我們將利用方差比給出F分布的檢驗(yàn)統(tǒng)計(jì)量。因此這種方法稱(chēng)為方差分析法。方差分析是分析和處理試驗(yàn)或觀測(cè)數(shù)據(jù)的主要方法之一。它首先被應(yīng)用于農(nóng)業(yè)試驗(yàn),目前它在農(nóng)業(yè)、工業(yè)、生物、醫(yī)學(xué)等各部門(mén)有著廣泛的應(yīng)用。方差分析的方法往往與試驗(yàn)設(shè)計(jì)的方式緊密地聯(lián)系在一起。對(duì)于從不同試驗(yàn)設(shè)計(jì)中得出觀測(cè)資料,進(jìn)行方差分析時(shí)將有不同的計(jì)算方法,類(lèi)型繁多,但其基本原理卻大同小異。在這里將結(jié)合一個(gè)較簡(jiǎn)單的例子介紹方差分析的數(shù)學(xué)模型和基本方法,以便于讀者對(duì)方差分析的方法有一個(gè)大致的了解。在實(shí)驗(yàn)設(shè)計(jì)

9、的基礎(chǔ)上,分組試驗(yàn),如分為a組,每組作b個(gè)水平的試驗(yàn),共得到ab個(gè)數(shù)據(jù)。然后,算出組平均值和總平均值,組內(nèi)和組間的離差平方和,組內(nèi)和組間方差,作F檢驗(yàn)。F組間方差/組內(nèi)方差假設(shè)HO:12b,表示各水平的均值相等。當(dāng)FF時(shí),HO:真;當(dāng)FF時(shí),HO:假。試驗(yàn)中必不可少地會(huì)產(chǎn)生誤差。誤差有兩種:條件誤差和試驗(yàn)誤差。前者是由試驗(yàn)條件不同而引起的系統(tǒng)性誤差,后者是在相同試驗(yàn)條件下引起的隨機(jī)誤差。例如,把四種不同的飼料分別喂給4組小雞,每組5只,它們的增重情況如下:組別增重(Xij)1554942215226111230896334297819592416913716885153試問(wèn)四組小雞在平均增重量

10、方面有沒(méi)有明顯的差別?通過(guò)計(jì)算,得到組內(nèi)和組間方差分別為719.2和8706.3,因此,F(xiàn)=8706.3/719.2=12.1對(duì)于給定的顯著性水平,將有臨界值F一,當(dāng)=0.01時(shí),F(xiàn)0.01(3,16)=5.3,其中3與16是自由度。所以F=12.15.3=F0.01(3,16)故,否定各種飼料效果一致的假設(shè),可以認(rèn)為四種飼料的效果有極明顯的差別。目前現(xiàn)成的計(jì)算機(jī)方差分析計(jì)算程序很多,如SPASS、SAS軟件等,將數(shù)據(jù)輸入后,都可以直接計(jì)算,并按要求輸出結(jié)果。上述例子是單因素的方差分析,比較簡(jiǎn)單。對(duì)于多因素的方差分析,由于比較復(fù)雜,這里就不再敘述了。4.T檢驗(yàn)生物學(xué)中所遇到的絕大多數(shù)問(wèn)題,總體

11、標(biāo)準(zhǔn)差都是未知的。在未知時(shí),平均數(shù)的顯著性檢驗(yàn)有兩種解決方法。其一是根據(jù)以往的經(jīng)驗(yàn)或從類(lèi)似的工作中估計(jì)出一個(gè)值,用這個(gè)做檢驗(yàn)。使用估計(jì)的做檢驗(yàn)并不是很可靠的。因此在實(shí)際工作中,一般不用這種方法而廣泛使用t檢驗(yàn)。對(duì)于一個(gè)正態(tài)分布總體,若未知?jiǎng)t服從n-1自由度的t分布,因此,在未知時(shí)可以用t檢驗(yàn)做平均數(shù)的顯著性檢驗(yàn)。t檢驗(yàn)的零假設(shè)H0為:=0備擇假設(shè)有以下三種情況:(1)HA:0,若已知不可能小于0;(2)HA:0和t;(2)tt/2,或表示為tt(雙側(cè))。其中為給定的顯著性水平。t檢驗(yàn)的統(tǒng)計(jì)量為:t=(-0)/(s/n1/2)例如,已知玉米單交種群?jiǎn)?05的平均穗重0=300克,噴藥后,隨機(jī)抽取

12、9個(gè)果穗,其穗重為分別:308、305、311、298、315、300、321、294、320克。問(wèn)噴藥后與噴藥前的果穗重差異是否顯著?根據(jù)上面介紹的基本程序:已知玉米穗重是服從正態(tài)分布的隨機(jī)變量,未知。(2)假設(shè):H0:=0=300HA:0=300由于問(wèn)題要求檢驗(yàn)的是“果穗重差異是否顯著”,并沒(méi)有明確穗重一定增加或一定減少,所以備擇假設(shè)為HA:0(3)顯著性水平:根據(jù)實(shí)驗(yàn)的要求(差異是否“顯著”)規(guī)定=0.05。(4)統(tǒng)計(jì)量的值:由于未知需使用t檢驗(yàn)。t=(-0)/(s/n1/2)t=(308-3000)/(9.62/91/2)=2.49(5)建立的拒絕域H0:因HA:0,所以是雙側(cè)檢驗(yàn)。當(dāng)

13、tt0.05(雙側(cè))時(shí)拒絕H0,=0.05時(shí),經(jīng)查表t8,0.05(雙側(cè))=2.306。(6)結(jié)論:因t=2.49t8,0.05(雙側(cè))=2.306,所以結(jié)論是拒絕H0,接受HA。即噴藥前后果穗重的差異是顯著的。5.F檢驗(yàn)t檢驗(yàn)屬于單個(gè)樣本的顯著性檢驗(yàn),即在樣本統(tǒng)計(jì)量與零假設(shè)所提出的總體參量之間做比較。這種檢驗(yàn)需要我們事先能夠提出合理的參量假設(shè)值和對(duì)參量有某種意義的備擇值。然而,在實(shí)際工作中,很難提出這樣的假設(shè)值及備擇值。因此,限制了這種方法在實(shí)際工作中的應(yīng)用。為了避免上述問(wèn)題的出現(xiàn),在實(shí)際應(yīng)用時(shí),常常選擇兩個(gè)樣本,一個(gè)作為處理,一個(gè)作為對(duì)照。在這兩個(gè)樣本之間做比較。判斷它們之間是否存在足夠顯著的差異。當(dāng)它們之間的差異不能用偶然性解釋時(shí),則認(rèn)為它們之間存在足夠顯著的差異,這兩個(gè)樣本來(lái)自?xún)蓚€(gè)不同的總體

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論