




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第八章直線回歸與相關
前面各章我們討論的問題,都只涉及到一個變量,如體重、日增重、產仔數、體溫、血糖濃度、產奶量、產毛量或孵化率、發(fā)病率等。但是,由于客觀事物在發(fā)展過程中相互聯系、相互影響,因而在畜牧、水產等試驗研究中常常要研究兩個或兩個以上變量間的關系。下一張
主頁
退出
上一張
第一頁,共六十四頁。最高月產、豬瘦肉率與背膘厚度、眼肌面積、胴體長;綿羊產毛量與體重、胸圍、體長;黑白花奶牛的一胎305天產奶量與、最高日產天數;
90天產奶量、最高日產豬的增重與飼料消耗;雛鵝重與70日齡重;綿羊胸圍與體長;仔豬初生重與斷奶重;例如第二頁,共六十四頁。變量間的關系有兩類:
一類是變量間存在著完全確定性的關系,可以用精確的數學表達式來表示。
如長方形的面積(S)與長(a)和寬(b)的關系可以表達為:S=ab。它們之間的關系是確定性的,只要知道了其中兩個變量的值就可以精確地計算出另一個變量的值,這類變量間的關系稱為函數關系。下一張
主頁
退出
上一張
第三頁,共六十四頁。
另一類是變量間不存在完全的確定性關系,不能用精確的數學公式來表示。
如黃牛的體長與體重的關系;仔豬初生重與斷奶重的關系;豬瘦肉率與背膘厚度、眼肌面積、胴體長等的關系等等,這些變量間都存在著十分密切的關系,但不能由一個或幾個變量的值精確地求出另一個變量的值。像這樣一類關系在生物界中是大量存在的,統(tǒng)計學中把這些變量間的關系稱為相關關系,把存在相關關系的變量稱為相關變量。下一張
主頁
退出
上一張
第四頁,共六十四頁。相關變量間的關系一般分為兩種:一種是因果關系,即一個變量的變化受另一個或幾個變量的影響。如仔豬的生長速度受遺傳特性、營養(yǎng)水平、飼養(yǎng)管理條件等因素的影響,子代的體高受親本體高的影響;另一種是平行關系,它們互為因果或共同受到另外因素的影響。如黃牛的體長和胸圍之間的關系,豬的背膘厚度和眼肌面積之間的關系等都屬于平行關系。下一張
主頁
退出
上一張
第五頁,共六十四頁。
統(tǒng)計學上采用回歸分析(regressionanalysis)研究呈因果關系的相關變量間的關系。表示原因的變量稱為自變量,表示結果的變量稱為依變量。研究“一因一果”,即一個自變量與一個依變量的回歸分析稱為一元回歸分析;研究“多因一果”,即多個自變量與一個依變量的回歸分析稱為多元回歸分析。一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。下一張
主頁
退出
上一張
第六頁,共六十四頁?;貧w分析的任務是揭示出呈因果關系的相關變量間的聯系形式,建立它們之間的回歸方程,利用所建立的回歸方程,由自變量(原因)來預測、控制依變量(結果)。第七頁,共六十四頁。
統(tǒng)計學上采用相關分析(correlationanalysis)研究呈平行關系的相關變量之間的關系。對兩個變量間的直線關系進行相關分析稱為簡單相關分析(也叫直線相關分析);對多個變量進行相關分析時,研究一個變量與多個變量間的線性相關稱為復相關分析;研究其余變量保持不變的情況下兩個變量間的線性相關稱為偏相關分析。
下一張
主頁
退出
上一張
第八頁,共六十四頁。第一節(jié)直線回歸
一、直線回歸方程的建立
對于兩個相關變量,一個變量用x表示,另一個變量用y表示,如果通過試驗或調查獲得兩個變量的n對觀測值:(x1,y1),(x2,y2),……,(xn,yn)
下一張
主頁
退出
上一張
為了直觀地看出x和y間的變化趨勢,可將每一對觀測值在平面直角坐標系描點,作出散點圖(見圖8-1)。第九頁,共六十四頁。從散點圖(圖8-1)可以看出:
②兩個變量間直線關系的性質(是正相關還是負相關)和程度(是相關密切還是不密切);下一張
主頁
退出
上一張
散點圖直觀地、定性地表示了兩個變量之間的關系。為了探討它們之間的規(guī)律性,還必須根據觀測值將其內在關系定量地表達出來。
①兩個變量間有關或無關;若有關,兩個變量間關系類型,是直線型還是曲線型;第十頁,共六十四頁。如果呈因果關系的兩個相關變量y(依變量)與x(自變量)間的關系是直線關系,根據n對觀測值所描出的散點圖,如圖8—1(b)和圖8—1(e)所示。
由于依變量y的實際觀測值總是帶有隨機誤差,因而依變量y的實際觀測值yi可用自變量x的實際觀測值xi表示為:(i=1,2,…,n)(8—1)第十一頁,共六十四頁。其中:x為可以觀測的一般變量(也可以是可以觀測的隨機變量);y為可以觀測的隨機變量;
這就是直線回歸的數學模型。我們可以根據實際觀測值對α,β以及方差做出估計。
i為相互獨立,且都服從N(0,)的隨機變量。第十二頁,共六十四頁。在x、y直角坐標平面上可以作出無數條直線,我們把所有直線中最接近散點圖中全部散點的直線用來表示x與y的直線關系,這條直線稱為回歸直線。
下一張
主頁
退出
上一張
設回歸直線的方程為:(8-2)第十三頁,共六十四頁。其中,a是α的估計值,b是β的估計值。
a、b應使回歸估計值與實際觀測值y的偏差平方和最小,即:
根據微積分學中的求極值的方法,令Q對a、b的一階偏導數等于0,即:最小第十四頁,共六十四頁。整理得關于a、b的正規(guī)方程組:
下一張
主頁
退出
上一張
解正規(guī)方程組,得:(8-3)(8-4)第十五頁,共六十四頁。
(8-3)式中的分子是自變量x的離均差與依變量y的離均差的乘積和,簡稱乘積和,記作,分母是自變量x的離均差平方和,記作SSX。a叫做樣本回歸截距,是回歸直線與y軸交點的縱坐標,當x=0時,=a;
第十六頁,共六十四頁。b叫做樣本回歸系數,表示x改變一個單位,y平均改變的數量;b的符號反映了x影響y的性質,b的絕對值大小反映了x影響y的程度;的估計值。叫做回歸估計值,是當x在在其研究范圍內取某一個值時,y值平均數第十七頁,共六十四頁?;貧w方程的基本性質:
如果將(8-4)式代入(8-2)式,得到回歸方程的另一種形式(中心化形式):
下一張
主頁
退出
上一張
性質1最?。恍再|2;性質3回歸直線通過點。(8-5)第十八頁,共六十四頁。【例8.1】在四川白鵝的生產性能研究中,得到如下一組關于雛鵝重(g)與70日齡重(g)的數據,試建立70日齡重(y)與雛鵝重(x)的直線回歸方程。第十九頁,共六十四頁。表8-1四川白鵝雛鵝重與70日齡重測定結果(單位:g)下一張
主頁
退出
上一張
第二十頁,共六十四頁。
1、作散點圖以雛鵝重(x)為橫坐標,70日齡重(y)為縱坐標作散點圖,見圖8-3。
2、計算回歸截距a,回歸系數b,建立直線回歸方程首先根據實際觀測值計算出下列數據:第二十一頁,共六十四頁。下一張
主頁
退出
上一張
第二十二頁,共六十四頁。進而計算出b、a:
得到四川白鵝的70日齡重y對雛鵝重x的直線回歸方程為:第二十三頁,共六十四頁。根據直線回歸方程可作出回歸直線,見圖8-3。從圖8-3看出,并不是所有的散點都恰好落在回歸直線上,這說明用去估計y是有偏差的。下一張
主頁
退出
上一張
第二十四頁,共六十四頁。
3、直線回歸的偏離度估計
偏差平方和的大小表示了實測點與回歸直線偏離的程度,因而偏差平方和又稱為離回歸平方和。統(tǒng)計學已經證明:在直線回歸分析中離回歸平方和的自由度為n-2。于是可求得離回歸均方為:離回歸均方是模型(8-1)中σ2的估計值。離回歸均方的平方根叫離回歸標準誤,記為,即第二十五頁,共六十四頁。
(8-6)
離回歸標準誤Syx的大小表示了回歸直線與實測點偏差的程度,即回歸估測值與實際觀測值y偏差的程度,于是我們把離回歸標準誤Syx用來表示回歸方程的偏離度。下一張
主頁
退出
上一張
第二十六頁,共六十四頁。
以后我們將證明:(8-7)利用(8-7)式先計算出,然后再代入(8-6)式求Syx。
對于【例8.1】有所以第二十七頁,共六十四頁。二、直線回歸的顯著性檢驗若x和y變量間并不存在直線關系,但由n對觀測值(xi,yi)也可以根據上面介紹的方法求得一個回歸方程=a+bx。顯然,這樣的回歸方程所反應的兩個變量間的直線關系是不真實的。如何判斷直線回歸方程所反應的兩個變量間的直線關系的真實性呢?這取決于變量x與y間是否存在直線關系。我們先探討依變量y的變異,然后再作出統(tǒng)計推斷。下一張
主頁
退出
上一張
第二十八頁,共六十四頁。1、直線回歸的變異來源圖8-4的分解圖第二十九頁,共六十四頁。從圖8-4看到:上式兩端平方,然后對所有的n點求和,則有
下一張
主頁
退出
上一張
由于所以于是第三十頁,共六十四頁。
所以有(8-8)反映了y的總變異程度,稱為y的總平方和,記為SSy;反映了由于y與x間存在直線關系所引起的y的變異程度,稱為回歸平方和,記為SSR;第三十一頁,共六十四頁。反映了除y與x存在直線關系以外的原因,包括隨機誤差所引起的y的變異程度,稱為離回歸平方和或剩余平方和,記為SSr。(8-8)式又可表示為:(8-9)這表明y的總平方和剖分為回歸平方和與離回歸平方和兩部分。與此相對應,y的總自由度dfy也劃分為回歸自由度dfr與離回歸自由度dfr兩部分,即下一張
主頁
退出
上一張
第三十二頁,共六十四頁。(8-10)在直線回歸分析中,回歸自由度等于自變量的個數,即;y的總自由度;離回歸自由度。于是:離回歸均方,回歸均方。2、回歸關系顯著性檢驗—F檢驗第三十三頁,共六十四頁。x與y兩個變量間是否存在直線關系,可用F檢驗法進行檢驗。無效假設HO:=0,備擇假設HA:≠0。在無效假設成立的條件下,回歸均方與離回歸均方的比值服從和的F分布,所以可以用
df1=1,df2=n-2(8-11)下一張
主頁
退出
上一張
第三十四頁,共六十四頁。來檢驗回歸關系即回歸方程的顯著性。回歸平方和還可用下面的公式計算得到:(8-12)(8-13)根據(8-9)式,可得到離回歸平方和計算公式為:下一張
主頁
退出
上一張
第三十五頁,共六十四頁。對于【例8.1】資料,有而。于是可以列出方差分析表進行回歸關系顯著性檢驗。第三十六頁,共六十四頁。表8-2四川白鵝70日齡重與雛鵝重回歸關系方差分析下一張
主頁
退出
上一張
第三十七頁,共六十四頁。因為,表明四川白鵝70日齡重與雛鵝重間存在極顯著的直線關系。3、回歸系數的顯著性檢驗—t檢驗采用回歸系數的顯著性檢驗—t檢驗也可檢驗x與y間是否存在直線關系?;貧w系數顯著性檢驗的無效假設和備擇假設為
HO:β=0,HA:β≠0。第三十八頁,共六十四頁。t檢驗的計算公式為:(8-14)
(8-15)
其中,Sb為回歸系數標準誤。
第三十九頁,共六十四頁。
對于【例8.1】資料,已計算得
故有
下一張
主頁
退出
上一張
第四十頁,共六十四頁。當,查t值表,得
因,,否定HO:β=0,接受HA:β≠0,即直線回歸系數b=21.7122是極顯著的,表明四川白鵝70日齡重與雛鵝重間存在極顯著的直線關系,可用所建立的直線回歸方程來進行預測和控制。第四十一頁,共六十四頁。F檢驗的結果與t檢驗的結果一致。事實上,統(tǒng)計學已證明,在直線回歸分析中,這二種檢驗方法是等價的,可任選一種進行檢驗。
下一張
主頁
退出
上一張
第四十二頁,共六十四頁。特別要指出的是:利用直線回歸方程進行預測或控制時,一般只適用于原來研究的范圍,不能隨意把范圍擴大,因為在研究的范圍內兩變量是直線關系,這并不能保證在這研究范圍之外仍然是直線關系。若需要擴大預測和控制范圍,則要有充分的理論依據或進一步的實驗依據。利用直線回歸方程進行預測或控制,一般只能內插,不要輕易外延。第四十三頁,共六十四頁。第二節(jié)直線相關
進行直線相關分析的基本任務在于根據x、y的實際觀測值,計算表示兩個相關變量x、y間線性相關程度和性質的統(tǒng)計量——相關系數r并進行顯著性檢驗。下一張
主頁
退出
上一張
第四十四頁,共六十四頁。
一、決定系數和相關系數
在上一節(jié)中已經證明了等式:
從這個等式不難看到:y與x直線回歸效果的好壞取決于回歸平方和與離回歸平方和的大小,或者說取決于回歸平方和在y的總平方和中所占的比例的大小。這個比例越大,y與x的直線回歸效果就越好,反之則差。我們把比值
叫做x對y的決定系數(coefficientofdetermination),記為r2,即下一張
主頁
退出
上一張
第四十五頁,共六十四頁。
(8-24)
決定系數的大小表示了回歸方程估測可靠程度的高低,或者說表示了回歸直線擬合度的高低。顯然有0≤r2≤1。因為第四十六頁,共六十四頁。而SPxy/SSx是以x為自變量、y為依變量時的回歸系數byx。若把y作為自變量、x作為依變量,則回歸系數bxy=SPxy/Ssy,所以決定系數r2等于y對x的回歸系數與x對y的回歸系數的乘積。這就是說,決定系數反應了x為自變量、y為依變量和y為自變量、x為依變量時兩個相關變量x與y直線相關的信息,即決定系數表示了兩個互為因果關系的相關變量間直線相關的程度。但決定系數介于0和1之間,不能反應直線關系的性質——是同向增減或是異向增減。下一張
主頁
退出
上一張
第四十七頁,共六十四頁。若求r2的平方根,且取平方根的符號與乘積和SPxy的符號一致,即與bxy、byx的符號一致,這樣求出的平方根既可表示y與x的直線相關的程度,也可表示直線相關的性質。統(tǒng)計學上把這樣計算所得的統(tǒng)計量稱為x與y的相關系數(coefficientofcorrelation),記為r,即第四十八頁,共六十四頁。
(8-25)(8-26)下一張
主頁
退出
上一張
第四十九頁,共六十四頁。二、相關系數的計算【例8.6】計算10只綿羊的胸圍(cm)和體重(kg)的相關系數。表8-310只綿羊胸圍和體重資料下一張
主頁
退出
上一張
第五十頁,共六十四頁。根據表8-3所列數據先計算出:代入(8-25)式得:即綿羊胸圍與體重的相關系數為0.8475。下一張
主頁
退出
上一張
第五十一頁,共六十四頁。三、相關系數的顯著性檢驗
上述根據實際觀測值計算得來的相關系數r是樣本相關系數,它是雙變量正態(tài)總體中的總體相關系數ρ的估計值。樣本相關系數r是否來自ρ≠0的總體,還須對樣本相關系數r進行顯著性檢驗。此時無效假設、備擇假設為HO:ρ=0,HA:ρ≠0。與直線回歸關系顯著性檢驗一樣,可采用t檢驗法與F檢驗法對相關系數r的顯著性進行檢驗。第五十二頁,共六十四頁。
t檢驗的計算公式為:t=,df=n-2(8-27)其中,,叫做相關系數標準誤。F檢驗的計算公式為:F=,df1=1,df2=n-2(8-28)下一張
主頁
退出
上一張
第五十三頁,共六十四頁。
統(tǒng)計學家已根據相關系數r顯著性t檢驗法計算出了臨界r值并列出了表格。所以可以直接采用查表法對相關系數r進行顯著性檢驗。具體作法是:先根據自由度n-2查臨界r值(附表8),得,。若|r|<,P>0.05,則相關系數r不顯著,在r的右上方標記“ns”;若≤|r|<,0.01<P≤0.05,則相關系數r顯著,在r的右上方標記“*”;若|r|≥,P≤0.01,則相關系數r極顯著,在r的右上方標記“**”。第五十四頁,共六十四頁。對于【例8-6】,因為df=n-2=10-2=8,查附表8得:=0.632,=0.765,而r=0.8475>,P<0.01,表明綿羊胸圍與體重的相關系數極顯著。四、相關系數與回歸系數的關系從相關系數計算公式的導出可以看到:相關變量x與y的相關系數r是y對x的回歸系數與x對y的相關系數bxv的幾何平均數:下一張
主頁
退出
上一張
第五十五頁,共六十四頁。表明直線相關分析與回歸分析關系十分密切。事實上,它們的研究對象都是呈直線關系的相關變量。直線回歸分析將二個相關變量區(qū)分為自變量和依變量,側重于尋求它們之間的聯系形式——直線回歸方程;直線相關分析不區(qū)分自變量和依變量,側重于揭示它們之間的聯系程度和性質——計算出相關系數。兩種分析所進行的顯著性檢驗都是解決y與x間是否存在直線關系。因而二者的檢驗是等價的。即相關系數顯著,回歸系數亦顯著;相關系數不第五十六頁,共六十四頁。顯著,回歸系數也必然不顯著。由于利用查表法對相關系數進行檢驗十分簡便,因此在實際進行直線回歸分析時,可用相關系數顯著性檢驗代替直線回歸關系顯著性檢驗,即可先計算出相關系數r并對其進行顯著性檢驗,若檢驗結果r不顯著,則用不著建立直線回歸方程;若r顯著,再計算回歸系數b、回歸截距a,建立直線回歸方程,此時所建立的直線回歸方程代表的直線關系是真實的,可利用來進行預測和控制。下一張
主頁
退出
上一張
第五十七頁,共六十四頁。
五、應用直線回歸與相關的注意事項直線回歸分析與相關分析在生物科學研究領域中已得到了廣泛的應用,但在實際工作中卻很容易被誤用或作出錯誤的解釋。為了正確地應用直線回歸分析和相關分析這一工具,必須注意以下幾點:第五十八頁,共六十四頁。1、變量間是否存在相關
直線回歸分析和相關分析畢竟是處理變量間關系的數學方法,在將這些方法應用于生物科學研究時要考慮到生物本身的客觀實際情況,譬如變量間是否存在直線相關以及在什么條件下會發(fā)生直線相關,求出的直線回歸方程是否有意義,某性狀作為自變量或依變量的確定等等,都必須由生物科學相應的專業(yè)知識來決定,并且還要用到生物科學實踐中去檢驗。如果不以一定的生物科學依據為前提,把
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 IEC 61196-1-112:2025 EN Coaxial communication cables - Part 1-112: Electrical test methods - Test for return loss and voltage standing wave ratio
- 工程項目分包合同
- 綠色能源項目投資風險防控協(xié)議書
- 現代商業(yè)房屋買賣合同
- 產品供貨合同范本(32篇)
- 離婚房產協(xié)議書
- 純人工勞務分包合同
- 環(huán)保設備銷售安裝維修服務合同
- 合伙人股份轉讓協(xié)議書
- 居間合同服務協(xié)議書
- 教學課件-電力系統(tǒng)的MATLAB-SIMULINK仿真與應用(王晶)
- GB/T 26189.2-2024工作場所照明第2部分:室外作業(yè)場所的安全保障照明要求
- 新教科版一年級科學下冊第一單元《身邊的物體》全部課件(共7課時)
- 鹽城江蘇鹽城市住房和城鄉(xiāng)建設局直屬事業(yè)單位市政府投資工程集中建設管理中心招聘4人筆試歷年參考題庫附帶答案詳解
- 醫(yī)院教學秘書培訓
- 2025江蘇常州西太湖科技產業(yè)園管委會事業(yè)單位招聘8人歷年高頻重點提升(共500題)附帶答案詳解
- 2025年北京控股集團有限公司招聘筆試參考題庫含答案解析
- 小學教室衛(wèi)生管理
- 信息技術必修一《數據與計算》第三章第三節(jié)《數據分析報告與應用》說課稿
- 體育科學急救知識
- 工程項目建設流程
評論
0/150
提交評論