大學(xué)課件 直線回歸和相關(guān)ppt課件_第1頁
大學(xué)課件 直線回歸和相關(guān)ppt課件_第2頁
大學(xué)課件 直線回歸和相關(guān)ppt課件_第3頁
大學(xué)課件 直線回歸和相關(guān)ppt課件_第4頁
大學(xué)課件 直線回歸和相關(guān)ppt課件_第5頁
已閱讀5頁,還剩77頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第八章第八章 直線回歸與相關(guān)直線回歸與相關(guān)變量之間常常是相互影響、彼此相關(guān)的,變量之間常常是相互影響、彼此相關(guān)的,例如例如: :產(chǎn)量與施肥量有關(guān)產(chǎn)量與施肥量有關(guān); ;病蟲害發(fā)生時(shí)期與溫度有關(guān)病蟲害發(fā)生時(shí)期與溫度有關(guān); ;小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗粒數(shù)、千粒重有關(guān),等等。粒數(shù)、千粒重有關(guān),等等。常常需要研究兩個(gè)或多個(gè)變量之間的關(guān)系。常常需要研究兩個(gè)或多個(gè)變量之間的關(guān)系。變量間的關(guān)系有兩類,一類是變量間存在變量間的關(guān)系有兩類,一類是變量間存在著完全確定性的關(guān)系,可以用精確的數(shù)學(xué)表達(dá)著完全確定性的關(guān)系,可以用精確的數(shù)學(xué)表達(dá)式來表示。式來表示。如長方體的體

2、積如長方體的體積V V與長與長a a)、寬)、寬b b)、)、高高h(yuǎn) h的關(guān)系可以表達(dá)為:的關(guān)系可以表達(dá)為: V=abh V=abh 它們之間的關(guān)系是確定性的,只要知道了其它們之間的關(guān)系是確定性的,只要知道了其中中3 3個(gè)變量的值就可以精確地計(jì)算出另一個(gè)變量個(gè)變量的值就可以精確地計(jì)算出另一個(gè)變量的值。這類變量間的關(guān)系稱為函數(shù)關(guān)系。的值。這類變量間的關(guān)系稱為函數(shù)關(guān)系。另一類是變量間不存在完全的確定性關(guān)系,另一類是變量間不存在完全的確定性關(guān)系,不能用精確的數(shù)學(xué)公式來表示。不能用精確的數(shù)學(xué)公式來表示。如如: :產(chǎn)量與施肥量的關(guān)系產(chǎn)量與施肥量的關(guān)系; ;病蟲害發(fā)生時(shí)期與溫度的關(guān)系病蟲害發(fā)生時(shí)期與溫度的

3、關(guān)系; ;小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗小麥單位面積產(chǎn)量與單位面積穗數(shù)、每穗粒數(shù)、千粒重的關(guān)系等。粒數(shù)、千粒重的關(guān)系等。這些變量間都存在著十分密切的關(guān)系,但這些變量間都存在著十分密切的關(guān)系,但由于隨機(jī)誤差的影響,不能由一個(gè)或幾個(gè)變量由于隨機(jī)誤差的影響,不能由一個(gè)或幾個(gè)變量的值精確地求出另一個(gè)變量的值。這樣的變量的值精確地求出另一個(gè)變量的值。這樣的變量在生物界中是大量存在的,統(tǒng)計(jì)學(xué)中把這類變?cè)谏锝缰惺谴罅看嬖诘模y(tǒng)計(jì)學(xué)中把這類變量關(guān)系稱為統(tǒng)計(jì)關(guān)系。量關(guān)系稱為統(tǒng)計(jì)關(guān)系。統(tǒng)計(jì)關(guān)系分為兩種:統(tǒng)計(jì)關(guān)系分為兩種:一種是因果關(guān)系,即一個(gè)變量的變化受另一種是因果關(guān)系,即一個(gè)變量的變化受另一個(gè)或幾個(gè)變量

4、的影響。一個(gè)或幾個(gè)變量的影響。如如:病蟲害發(fā)生時(shí)期受溫度的影響病蟲害發(fā)生時(shí)期受溫度的影響;小麥單位面積產(chǎn)量受單位面積穗數(shù)、每穗小麥單位面積產(chǎn)量受單位面積穗數(shù)、每穗粒數(shù)、千粒重的影響;粒數(shù)、千粒重的影響;另一種是相關(guān)關(guān)系,即二個(gè)變量相互影另一種是相關(guān)關(guān)系,即二個(gè)變量相互影響,互為因果。響,互為因果。如小麥每穗粒數(shù)與千粒重之間的關(guān)系,如小麥每穗粒數(shù)與千粒重之間的關(guān)系,株高與穗長之間的關(guān)系等都屬于平行關(guān)系。株高與穗長之間的關(guān)系等都屬于平行關(guān)系。統(tǒng)計(jì)學(xué)上采用回歸分析研究呈因果關(guān)系統(tǒng)計(jì)學(xué)上采用回歸分析研究呈因果關(guān)系的相關(guān)變量間的關(guān)系。的相關(guān)變量間的關(guān)系。表示原因的變量稱為自變量表示原因的變量稱為自變量X

5、 X (independent variable)(independent variable),表示結(jié)果的變量,表示結(jié)果的變量稱為依變量稱為依變量Y (dependent variable)Y (dependent variable)。研討研討“一因一果一因一果”,即一個(gè)自變量與一個(gè),即一個(gè)自變量與一個(gè)依變量的回歸分析稱為一元回歸分析;依變量的回歸分析稱為一元回歸分析;研討研討“多因一果多因一果”,即多個(gè)自變量與一個(gè),即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析。依變量的回歸分析稱為多元回歸分析。一元回歸分析又分為直線回歸分析與曲一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;線回歸分

6、析兩種;多元回歸分析又分為多元線性回歸分析多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。與多元非線性回歸分析兩種?;貧w分析的任務(wù)是揭示出呈因果關(guān)系的回歸分析的任務(wù)是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立它們之間的回相關(guān)變量間的聯(lián)系形式,建立它們之間的回歸方程,利用所建立的回歸方程,由自變量歸方程,利用所建立的回歸方程,由自變量緣由來預(yù)測(cè)、控制依變量結(jié)果)。緣由來預(yù)測(cè)、控制依變量結(jié)果)。統(tǒng)計(jì)學(xué)上采用相關(guān)分析研究呈平行關(guān)系統(tǒng)計(jì)學(xué)上采用相關(guān)分析研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系。的相關(guān)變量之間的關(guān)系。對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析稱為直線相關(guān)

7、分析也叫簡單相關(guān)分析);稱為直線相關(guān)分析也叫簡單相關(guān)分析);( (對(duì)多個(gè)變量進(jìn)行相關(guān)分析時(shí),研究一對(duì)多個(gè)變量進(jìn)行相關(guān)分析時(shí),研究一個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)分析;分析;) ) 在相關(guān)分析中,不區(qū)分自變量和依變量。在相關(guān)分析中,不區(qū)分自變量和依變量。相關(guān)分析只研究兩個(gè)變量之間線性相關(guān)的相關(guān)分析只研究兩個(gè)變量之間線性相關(guān)的程度和性質(zhì)或一個(gè)變量與多個(gè)變量之間線性相程度和性質(zhì)或一個(gè)變量與多個(gè)變量之間線性相關(guān)的程度,不能用一個(gè)或多個(gè)變量去預(yù)測(cè)、控關(guān)的程度,不能用一個(gè)或多個(gè)變量去預(yù)測(cè)、控制另一個(gè)變量的變化。制另一個(gè)變量的變化。本章介紹直線回歸與相關(guān)分析。本

8、章介紹直線回歸與相關(guān)分析。 第一節(jié)第一節(jié) 直線回歸分析直線回歸分析對(duì)于兩個(gè)相關(guān)變量對(duì)于兩個(gè)相關(guān)變量x x和和y y,通過試驗(yàn)或調(diào),通過試驗(yàn)或調(diào)查獲得查獲得n n對(duì)觀測(cè)值,(對(duì)觀測(cè)值,(x1x1,y1y1),(),(x2x2,y2y2),), ,(,(xnxn,ynyn),作出散點(diǎn)圖。),作出散點(diǎn)圖。 xy0.X,最高葉面積指數(shù)y0.X,每平方米穎花數(shù)(萬)y0. 水稻單株生物產(chǎn)量與稻谷產(chǎn)量的散點(diǎn)圖水稻每平方米穎花數(shù)與結(jié)實(shí)率的散點(diǎn)圖水稻最高葉面積指數(shù)和畝產(chǎn)量的散點(diǎn)圖ABC結(jié)實(shí)率生物產(chǎn)量從散點(diǎn)圖可以看出:從散點(diǎn)圖可以看出:兩個(gè)變量間關(guān)系的類型,是直線還是兩個(gè)變量間關(guān)系的類型,是直線還是曲線。曲線。

9、 圖圖9.1A9.1A、9.1B 9.1B 表明表明x x與與y y是直線相關(guān)關(guān)系;是直線相關(guān)關(guān)系;圖圖9.1C9.1C表明表明x x與與y y是曲線關(guān)系,這幾種情況在是曲線關(guān)系,這幾種情況在生物界較常見。生物界較常見。兩個(gè)變量間關(guān)系的性質(zhì)是同向增減兩個(gè)變量間關(guān)系的性質(zhì)是同向增減還是異向增減。還是異向增減。 圖圖9.1A9.1A表明表明 x x與與y y的直線關(guān)系是同向增的直線關(guān)系是同向增減,圖減,圖9.1B 9.1B 闡明闡明 x x與與y y的是直線關(guān)系是異向的是直線關(guān)系是異向增減。還可以表示密切的程度。增減。還可以表示密切的程度。是否有異常觀測(cè)值。是否有異常觀測(cè)值。 一、直線回歸方程的建

10、立一、直線回歸方程的建立 如果呈因果關(guān)系的兩個(gè)相關(guān)變量如果呈因果關(guān)系的兩個(gè)相關(guān)變量x x與與y y間的間的關(guān)系是直線關(guān)系,由于依變量關(guān)系是直線關(guān)系,由于依變量x x與與y y間的關(guān)系是間的關(guān)系是直線關(guān)系直線關(guān)系 在在x,yx,y的直角坐標(biāo)平面上可以作出無數(shù)條直的直角坐標(biāo)平面上可以作出無數(shù)條直線線 ,回歸直線是指所有直線中最接近散點(diǎn)圖全,回歸直線是指所有直線中最接近散點(diǎn)圖全部散點(diǎn)的直線。部散點(diǎn)的直線。 設(shè)直線回歸方程為:設(shè)直線回歸方程為: yabx(8-1) (8-1) a是回歸直線在y軸上的截距,叫回歸截距(regression intercept);b是回歸系數(shù)(regression coe

11、fficient)。a a、b b應(yīng)使回歸估計(jì)值與實(shí)際觀測(cè)值的偏差應(yīng)使回歸估計(jì)值與實(shí)際觀測(cè)值的偏差平方和最小,即:平方和最小,即:22()()Qyyyabx最小最小 令令 Q Q對(duì)對(duì)a a、b b的一階偏導(dǎo)數(shù)等于的一階偏導(dǎo)數(shù)等于0 0,即:,即: 2()0Qyabxa 2()0Qyabx xb 整理得關(guān)于整理得關(guān)于a a、b b的正規(guī)方程組的正規(guī)方程組 anbxy2axbxxy 解正規(guī)方程組,得:解正規(guī)方程組,得:222()()/() /()()()xyxxyxynbxxnSPxxyyxxSSaybx(8-28-2) (8-38-3) (8-38-3式中的分子是自變量式中的分子是自變量x x的

12、離均差與的離均差與依變量依變量y y的離均差的乘積和的離均差的乘積和 ,簡,簡稱乘積和稱乘積和(sum of products)(sum of products),記作,記作SPSP,分母,分母是自變量是自變量x x的離均差平方和的離均差平方和 ,記作,記作 。()()xxyy2()xxxSSa a叫做樣本回歸截距,是總體回歸截距的叫做樣本回歸截距,是總體回歸截距的最小二乘估計(jì)值也是無偏估計(jì)值,是回歸直線最小二乘估計(jì)值也是無偏估計(jì)值,是回歸直線與與y y軸交點(diǎn)的縱坐標(biāo),當(dāng)軸交點(diǎn)的縱坐標(biāo),當(dāng)x=0 x=0時(shí),時(shí), =a =a; y b b叫做樣本回歸系數(shù),是總體回歸系數(shù)叫做樣本回歸系數(shù),是總體回

13、歸系數(shù) 的最小二乘估計(jì)值也是無偏估計(jì)值,表示的最小二乘估計(jì)值也是無偏估計(jì)值,表示x x改變一個(gè)單位,改變一個(gè)單位,y y平均改變的數(shù)量,平均改變的數(shù)量,b b的符號(hào)的符號(hào)反映了反映了x x影響影響y y的性質(zhì),的性質(zhì),b b的絕對(duì)值大小反映了的絕對(duì)值大小反映了x x影響影響y y的大小的大小,a,a和和b b值有專業(yè)上的意義;值有專業(yè)上的意義; 叫做回歸估計(jì)值叫做回歸估計(jì)值 ,是當(dāng),是當(dāng)x x在其研究范圍在其研究范圍內(nèi)取某一個(gè)值時(shí),內(nèi)取某一個(gè)值時(shí),y y總體平均數(shù)(總體平均數(shù)( )的)的估計(jì)值。估計(jì)值。x y如果將如果將8-28-2式代入式代入8-18-1式,得到回式,得到回歸方程的另一種形式

14、:歸方程的另一種形式:()yybxbxyb xx(8-58-5) 說明直線回歸方程一定通過點(diǎn)說明直線回歸方程一定通過點(diǎn) 。 ),(yx【例【例8181】 江蘇武進(jìn)縣測(cè)定江蘇武進(jìn)縣測(cè)定1956-19641956-1964年年間間3 3月下旬至月下旬至4 4月中旬平均溫度累積值月中旬平均溫度累積值(x(x,單位:,單位:旬旬 度度) )和一代三化螟蛾盛發(fā)期和一代三化螟蛾盛發(fā)期y y,以,以5 5月月1010日日為為0 0的資料如下表,建立的資料如下表,建立y y與與x x的直線回歸方程。的直線回歸方程。表表8-1 8-1 平均溫度累積值平均溫度累積值(x)(x)與一代三化螟盛發(fā)期與一代三化螟盛發(fā)期

15、y y資料資料 計(jì)算計(jì)算6個(gè)一級(jí)數(shù)據(jù)個(gè)一級(jí)數(shù)據(jù)n=9x=35.5+34.1+44.2=333.7x2=35.52+34.12+44.22=12517.49y=12+16+(-1)=70y2=122+162+(-1)2=794xy=(35.512)+(34.116)+44.2 (-1)2 = 2436.4 計(jì)算計(jì)算5個(gè)二級(jí)數(shù)據(jù)個(gè)二級(jí)數(shù)據(jù)222/12517.49333.7/9144.6356xSSxxn 222/79470/ 9249.5556ySSyyn ()()/2436.4 (333.7 70)/9159.0444xySPxyxy n /333.7/937.0778xx n/70/97.77

16、78yy n2 2、計(jì)算回歸系數(shù)、計(jì)算回歸系數(shù)b b,回歸截距,回歸截距a a,建,建立直線回歸方程立直線回歸方程 1 1、作散點(diǎn)圖、作散點(diǎn)圖/159.0444/144.63561.0996xyxbSPSS (天/旬度)7.7778( 1.0996 37.0778)48.5485aybx (天)(天) 直線回歸方程為:直線回歸方程為:48.5485 1.0996yxxy1 .15 .48或或留意,由于實(shí)測(cè)區(qū)間為留意,由于實(shí)測(cè)區(qū)間為31.731.7,44.244.2,當(dāng),當(dāng) 31.731.7或或 44.244.2時(shí),時(shí), 的變化是否還符合的變化是否還符合 的規(guī)律,還必須提供新的依據(jù)。的規(guī)律,還必

17、須提供新的依據(jù)。 回歸系數(shù)回歸系數(shù) = -1.1 = -1.1的意義為:當(dāng)?shù)囊饬x為:當(dāng)3 3月下旬的積溫月下旬的積溫( )每提高)每提高1 1旬旬 度時(shí),一代三化螟盛發(fā)期將平均提度時(shí),一代三化螟盛發(fā)期將平均提早早1.11.1天;天; bx回歸截距回歸截距 =48.5485 =48.5485的意義為:若的意義為:若3 3月下旬的積月下旬的積溫為溫為0 0,則一代三化螟盛發(fā)期為,則一代三化螟盛發(fā)期為48.548.5,即在,即在6 6月月27-2827-28日。日。axy48.5485 1.0996yxx3 3、直線回歸方程的圖示、直線回歸方程的圖示 P161 P1614 4、直線回歸方程的離回歸標(biāo)

18、準(zhǔn)誤、直線回歸方程的離回歸標(biāo)準(zhǔn)誤 Q= Q=的大小表示了實(shí)測(cè)點(diǎn)與回歸直線偏的大小表示了實(shí)測(cè)點(diǎn)與回歸直線偏離的程度,又稱為離回歸平方和離的程度,又稱為離回歸平方和(sum of (sum of squares due to deviation from regression)squares due to deviation from regression)。統(tǒng)計(jì)學(xué)已經(jīng)證明:在直線回歸分析中離回歸平方統(tǒng)計(jì)學(xué)已經(jīng)證明:在直線回歸分析中離回歸平方和的自由度為和的自由度為n-2(n-2(由于在建立回歸方程時(shí)用了由于在建立回歸方程時(shí)用了a a、b b兩個(gè)統(tǒng)計(jì)數(shù))。兩個(gè)統(tǒng)計(jì)數(shù))。2()yy于是可求得離回歸均

19、方為:于是可求得離回歸均方為: 2() /(2)yynS2y/x=Q/(n-2)=離回歸均方是模型離回歸均方是模型8-18-1中方差中方差22的估的估計(jì)值。計(jì)值。離回歸均方的平方根叫離回歸標(biāo)準(zhǔn)誤,記離回歸均方的平方根叫離回歸標(biāo)準(zhǔn)誤,記為為Sy/xSy/x,即,即 (8-68-6) 2) (22/nyynQSxy離回歸標(biāo)準(zhǔn)誤離回歸標(biāo)準(zhǔn)誤Sy/x Sy/x 的大小表示了回歸直的大小表示了回歸直線與實(shí)測(cè)點(diǎn),即回歸估計(jì)值與實(shí)際觀測(cè)值線與實(shí)測(cè)點(diǎn),即回歸估計(jì)值與實(shí)際觀測(cè)值y y偏偏離度的大小。計(jì)算離度的大小。計(jì)算Sy/xSy/x值主要是求值主要是求Q Q,直接計(jì)算,直接計(jì)算工作量大,而且容易引入誤差,可以

20、用下列恒工作量大,而且容易引入誤差,可以用下列恒等式計(jì)算等式計(jì)算 y22()xyyxSPyySSSS(8-7a8-7a) Q =SSy-b(SP) =SSy-b2(SSx) =y2-ay-bxy(8-7b8-7b) (8-7c8-7c) (8-7d8-7d) 對(duì)于【例對(duì)于【例8181】有】有 222144.6356()( 159.0444)249.555674.6670 xyyxSPyySSSS 所以所以 2()74.6670292yxyySn=3.2660=3.2660天)天) 三、直線回歸的顯著性檢驗(yàn)三、直線回歸的顯著性檢驗(yàn)如何判斷直線回歸方程所反應(yīng)的兩個(gè)變?nèi)绾闻袛嘀本€回歸方程所反應(yīng)的兩個(gè)

21、變量間的直線關(guān)系的真實(shí)性呢?這取決于變量量間的直線關(guān)系的真實(shí)性呢?這取決于變量y y與與x x間是否存在直線關(guān)系,也就是須對(duì)直線回間是否存在直線關(guān)系,也就是須對(duì)直線回歸進(jìn)行顯著性檢驗(yàn)。歸進(jìn)行顯著性檢驗(yàn)。直線回歸顯著性檢驗(yàn)的方法有直線回歸顯著性檢驗(yàn)的方法有F F檢驗(yàn)和檢驗(yàn)和t t 檢驗(yàn)兩種。檢驗(yàn)兩種。 從圖從圖8.38.3P161P161看到,可表示為看到,可表示為與之和,即與之和,即()yy()yy()yy()()()yyyyyy則有則有 2()yy2()()yyyy 22()()2()()yyyyyyyy(一)(一)F檢驗(yàn)檢驗(yàn)1 1、依變量、依變量y y的總平方和與自由度的分解的總平方和與自

22、由度的分解 由于由于()yabxyb xx所以所以()yyb xx于是于是 ()()()()yyyyb xxyy ()()()b xxyyb xx()()()()b xxyyb xxb xx 2xyxb SPbSS20 xyxyxyxxxSPSPSPSSSSSS 所以所以2()yy22()()yyyy(8-88-8) 反映了反映了y y的總變異程度,稱為的總變異程度,稱為y y的總平方和,記為;的總平方和,記為;2()yyySS反映了由于反映了由于y y與與x x間存在直線關(guān)間存在直線關(guān)系所引起的系所引起的y y的變異程度,稱為回歸平方和,的變異程度,稱為回歸平方和,記為記為SSRSSR;2(

23、)yy 反映了除反映了除y y與與x x存在直線關(guān)系存在直線關(guān)系以外的原因包括隨機(jī)誤差所引起的以外的原因包括隨機(jī)誤差所引起的y y的的變異程度變異程度, ,稱為離回歸平方和或剩余平方和稱為離回歸平方和或剩余平方和, ,記為記為SSrSSr。 2()yy 于是,(于是,(7-87-8式又可表示為:式又可表示為:SSy=SSR+SSr SSy=SSR+SSr 與此相對(duì)應(yīng),與此相對(duì)應(yīng),dfy=dfR+dfr (8-98-9) (8-108-10) 在直線回歸分析中在直線回歸分析中 dfy=n-1 dfR=1 dfr=n- dfy=n-1 dfR=1 dfr=n-2 2 、回歸關(guān)系顯著性檢驗(yàn)、回歸關(guān)系

24、顯著性檢驗(yàn)F F 檢驗(yàn)檢驗(yàn) 對(duì)對(duì)y y與與x x間是否存在直線關(guān)系的假設(shè)檢驗(yàn)其間是否存在直線關(guān)系的假設(shè)檢驗(yàn)其無效假設(shè):無效假設(shè):=0=0,備擇假設(shè):,備擇假設(shè):00。0HAH在無效假設(shè)成立的條件下,回歸均方與離在無效假設(shè)成立的條件下,回歸均方與離回歸均方的比值服從和的回歸均方的比值服從和的F F分分布,所以可以用布,所以可以用11df 22dfn/(2)RRRRrrrrMSMSdfSSFMSSSdfSSn, df1=1,df2=n-2 (8-11) 來檢驗(yàn)回歸關(guān)系即回歸方程的顯著性。來檢驗(yàn)回歸關(guān)系即回歸方程的顯著性。 22() ()RSSyyb xx 222()xxybxxb SSbSP(8-

25、12)2xyxyxyxxSPSPSPSSSS(8-13)2xyryRyxSPSSSSSSSSSS對(duì)于【例對(duì)于【例8181】 249.5556ySS ,159.0444xySP 144.6356xSS 22( 159.0444)174.8886144.6356xyRxSPSSSS,249.5556 174.888674.6670ryRSSSSSS 而,而, 于是于是 1,927Rrdfdf174.888616.4074.6670/7ReMSFMS , , , , p p0.010.01,表明一代三化螟蛾盛發(fā)期,表明一代三化螟蛾盛發(fā)期y y與積與積溫(溫( )的直線回歸關(guān)系極顯著。)的直線回歸關(guān)系

26、極顯著。0.01(1,7)12.25F0.01(1,7)16.4012.25FFx 3 3、回歸系數(shù)的顯著性檢驗(yàn)、回歸系數(shù)的顯著性檢驗(yàn)tt檢驗(yàn)檢驗(yàn) 回歸系數(shù)顯著性檢驗(yàn)的無效假設(shè)和備擇假回歸系數(shù)顯著性檢驗(yàn)的無效假設(shè)和備擇假設(shè)分別為設(shè)分別為 :0 0, :00。 0HAHt t檢驗(yàn)的計(jì)算公式為:檢驗(yàn)的計(jì)算公式為: ,bbtS2dfn(7-147-14) 其中,為回歸系數(shù)標(biāo)準(zhǔn)誤其中,為回歸系數(shù)標(biāo)準(zhǔn)誤 : yxbxSSSS(7-157-15) 對(duì)于【例對(duì)于【例8181】 ,已計(jì)算得,已計(jì)算得1.0996b 144.6356xSS 3.266yxS, , , 故有故有 3.2660.2715144.63

27、56yxbxSSSS1.09964.050.2715bbtS , ,因因 , ,否,否認(rèn)認(rèn) :0 0,接受,接受 :00,即一代三化螟,即一代三化螟蛾盛發(fā)期蛾盛發(fā)期y y與積溫與積溫x x的直線回歸系數(shù)的直線回歸系數(shù)b=-1.0996b=-1.0996極顯著,表明一代三化螟蛾盛發(fā)期極顯著,表明一代三化螟蛾盛發(fā)期與積溫間存在極顯著的直線關(guān)系。與積溫間存在極顯著的直線關(guān)系。0.01(7)3.50t0.01(7)4.05tt0.01P 0HAH F F 檢驗(yàn)的結(jié)果與檢驗(yàn)的結(jié)果與t t檢驗(yàn)的結(jié)果一致。檢驗(yàn)的結(jié)果一致。 事實(shí)上,統(tǒng)計(jì)學(xué)已證明,在直線回歸分析事實(shí)上,統(tǒng)計(jì)學(xué)已證明,在直線回歸分析中,這二種檢

28、驗(yàn)方法是等價(jià)的,可任選一種進(jìn)中,這二種檢驗(yàn)方法是等價(jià)的,可任選一種進(jìn)行檢驗(yàn)。行檢驗(yàn)。 四、直線回歸的區(qū)間估計(jì)四、直線回歸的區(qū)間估計(jì) 經(jīng)檢驗(yàn)直線回歸關(guān)系顯著之后:經(jīng)檢驗(yàn)直線回歸關(guān)系顯著之后: 可用樣本統(tǒng)計(jì)數(shù)可用樣本統(tǒng)計(jì)數(shù) 來估計(jì)總體參數(shù)來估計(jì)總體參數(shù), ,ab, 可利用來估計(jì)某一值對(duì)應(yīng)的總可利用來估計(jì)某一值對(duì)應(yīng)的總體的平均數(shù)();體的平均數(shù)(); yxyx還可對(duì)總體參數(shù),某一值對(duì)應(yīng)還可對(duì)總體參數(shù),某一值對(duì)應(yīng)的總體的平均數(shù)()和單個(gè)觀測(cè)值的總體的平均數(shù)()和單個(gè)觀測(cè)值作出區(qū)間估計(jì),即求出它們?cè)谝欢ㄖ眯哦认碌淖鞒鰠^(qū)間估計(jì),即求出它們?cè)谝欢ㄖ眯哦认碌闹眯艆^(qū)間。置信區(qū)間。 ,xyxy表表8-2 8-2

29、回歸截距,回歸系數(shù),總體回歸截距,回歸系數(shù),總體平均數(shù)()和單個(gè)觀測(cè)值平均數(shù)()和單個(gè)觀測(cè)值y y置信度為(置信度為()的置信區(qū)間)的置信區(qū)間 x1 【例【例8282】 根據(jù)【例根據(jù)【例8181】的資料估計(jì):】的資料估計(jì):(1 1當(dāng)當(dāng)3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時(shí),歷年的一代三化螟蛾平均盛發(fā)期在何時(shí)度時(shí),歷年的一代三化螟蛾平均盛發(fā)期在何時(shí)置信度為置信度為9595)?)?(2 2某年某年3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時(shí),該年的一代三化螟蛾盛發(fā)期在何時(shí)度時(shí),該年的一代三化螟蛾盛發(fā)期在何時(shí)置信度為置信度為9595)

30、?)?利用直線回歸方程利用直線回歸方程 計(jì)計(jì)算當(dāng)算當(dāng) 時(shí)的時(shí)的 , 48.5485 1.0996yx40 x y48.5485 1.0996 404.56y 由于由于 23.2661.351(4037.0778)9144.6356yS23.26613.531(4037.0778)9144.6356yS將將 =4.56 =4.56、 、 2.36 2.36代入,得代入,得 所以所以 (1 1在置信度為在置信度為9595時(shí),時(shí), 的的 總體平均數(shù)(總體平均數(shù)( )的置信區(qū)間為:)的置信區(qū)間為: 40 x yx0.05(7)0.05(7)()yyytSxytS y1.35ys0.05(7)t4.56

31、(2.36 1.35)()4.56(2.36 1.35)x1.4()7.7x即當(dāng)即當(dāng)3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時(shí),度時(shí),歷年的一代三化螟蛾平均盛發(fā)期在歷年的一代三化螟蛾平均盛發(fā)期在1.4, 7.71.4, 7.7或或5 5月月12181218日,置信度為日,置信度為9595。(2 2在置信度為在置信度為9595時(shí),時(shí), 的單個(gè)觀的單個(gè)觀測(cè)值測(cè)值 的置信區(qū)間為:的置信區(qū)間為:40 x y0.05(7)0.05(7)yyytSyytS將將 =4.56 =4.56、 、 2.36 2.36代入,代入,得得 y3.53ys0.05(7)t4.56(2.36

32、 3.53) 4.56(2.36 3.53)y 3.819.9y即當(dāng)某年即當(dāng)某年3 3月下旬至月下旬至4 4月中旬的積溫為月中旬的積溫為4040旬旬 度時(shí),度時(shí),該年的一代三化螟蛾盛發(fā)期在該年的一代三化螟蛾盛發(fā)期在-3.8, 19.9-3.8, 19.9或或5 5月月630630日,置信度為日,置信度為9595。類似地可求出取其它值時(shí)總體平均數(shù)(類似地可求出取其它值時(shí)總體平均數(shù)()和單個(gè)觀測(cè)值的)和單個(gè)觀測(cè)值的95%95%置信區(qū)間,列于表置信區(qū)間,列于表8-38-3。 xyx表表8-3 8-3 一代三化螟蛾盛發(fā)期一代三化螟蛾盛發(fā)期95%95%置信區(qū)間置信區(qū)間 從和的計(jì)算公式看出,越接近,從和的

33、計(jì)算公式看出,越接近,和越小,置信區(qū)間的置信距也越小,預(yù)測(cè)越和越小,置信區(qū)間的置信距也越小,預(yù)測(cè)越精確。精確。 ySySxx ySyS第二節(jié)第二節(jié) 直線相關(guān)分析直線相關(guān)分析進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x x、y y的實(shí)際觀測(cè)值計(jì)算表示兩個(gè)相關(guān)變量的實(shí)際觀測(cè)值計(jì)算表示兩個(gè)相關(guān)變量x x與與y y線性相線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)數(shù)關(guān)程度和性質(zhì)的統(tǒng)計(jì)數(shù)相關(guān)系數(shù)相關(guān)系數(shù)r r,并進(jìn)行,并進(jìn)行顯著性檢驗(yàn)。顯著性檢驗(yàn)。 一、決定系數(shù)和相關(guān)系數(shù)、決定系數(shù)和相關(guān)系數(shù)已經(jīng)證明了等式:已經(jīng)證明了等式: 2()yy22()()yyyy。 從這個(gè)等式不難看到:從這個(gè)等式不難看到:

34、y y與與x x直線回歸效果的好壞直線回歸效果的好壞取決于回歸平方和與離回歸平方和取決于回歸平方和與離回歸平方和的大小,或者說取決于回歸平方和在的大小,或者說取決于回歸平方和在y y的總的總平方和中所占比例的大小。這個(gè)比例越大,平方和中所占比例的大小。這個(gè)比例越大,y y與與x x的直線回歸效果就越好,反之則差。的直線回歸效果就越好,反之則差。2()yy2()yy2()yy2()yy比值叫做比值叫做x x對(duì)對(duì)y y的決定系的決定系數(shù)數(shù) ,記為,記為 r2 r2,即,即2() /yy2()yy222()()yyryy(7-167-16) 決定系數(shù)的大小表示了回歸方程估測(cè)可靠決定系數(shù)的大小表示了回

35、歸方程估測(cè)可靠程度的高低,或者說表示了回歸直線擬合度的高程度的高低,或者說表示了回歸直線擬合度的高低,顯然低,顯然0r210r21。 由于由于2222()()xyxyxyyxxyxyxySPSP SPyyrb byySS SSSSSS而而SPxy/SSxSPxy/SSx是以是以x x為自變量、為自變量、y y為依變量時(shí)為依變量時(shí)的回歸系數(shù)的回歸系數(shù)byxbyx。 若把若把y y作為自變量、作為自變量、x x作為依變量,則回歸作為依變量,則回歸系數(shù)系數(shù)bxy=SPxy/SSybxy=SPxy/SSy。 所以決定系數(shù)所以決定系數(shù)r2r2等于等于y y對(duì)對(duì)x x的回歸系數(shù)與的回歸系數(shù)與x x對(duì)對(duì)y

36、y的回歸系數(shù)的乘積。的回歸系數(shù)的乘積。這就是說,決定系數(shù)反應(yīng)了這就是說,決定系數(shù)反應(yīng)了x x為自變量、為自變量、y y為依變量和為依變量和y y為自變量、為自變量、x x為依變量時(shí)兩個(gè)相關(guān)變?yōu)橐雷兞繒r(shí)兩個(gè)相關(guān)變量量x x與與y y直線相關(guān)的信息,即決定系數(shù)表示了兩個(gè)直線相關(guān)的信息,即決定系數(shù)表示了兩個(gè)互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。但互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。但決定系數(shù)介于決定系數(shù)介于0 0和和1 1之間,不能反應(yīng)直線關(guān)系的性之間,不能反應(yīng)直線關(guān)系的性質(zhì)質(zhì)是同向增減或是異向增減。是同向增減或是異向增減。若求若求r2r2的平方根,且取平方根的符號(hào)與乘的平方根,且取平方根的符

37、號(hào)與乘積和積和SPxySPxy的符號(hào)一致,即與的符號(hào)一致,即與bxy bxy 、byxbyx的符號(hào)一的符號(hào)一致,這樣求出的平方根既可表示致,這樣求出的平方根既可表示y y與與x x的直線相的直線相關(guān)的程度,也可表示關(guān)的程度,也可表示y y與與x x直線相關(guān)的性質(zhì)。直線相關(guān)的性質(zhì)。統(tǒng)計(jì)學(xué)上把這樣計(jì)算所得的統(tǒng)計(jì)數(shù)稱為統(tǒng)計(jì)學(xué)上把這樣計(jì)算所得的統(tǒng)計(jì)數(shù)稱為x x與與y y的相關(guān)系數(shù)的相關(guān)系數(shù), ,記為記為r r,即,即xyxySPrSS SS(7-17)2222()()()()xyxynxyxynn(7-18)顯然顯然 -1r1 -1r1。當(dāng)。當(dāng)r r0 0時(shí),相關(guān)變量時(shí),相關(guān)變量x x與與y y異向增

38、減,稱為異向增減,稱為x x與與y y負(fù)相關(guān);當(dāng)負(fù)相關(guān);當(dāng)r r0 0時(shí),相關(guān)變時(shí),相關(guān)變量量x x與與y y同向增減,稱為同向增減,稱為x x與與y y正相關(guān)。正相關(guān)?!纠纠?383】 計(jì)算【例計(jì)算【例8181】資料】資料3 3月下旬月下旬至至4 4月中旬積溫和一代三化螟蛾盛發(fā)期的決定系月中旬積溫和一代三化螟蛾盛發(fā)期的決定系數(shù)和相關(guān)系數(shù)。數(shù)和相關(guān)系數(shù)。已經(jīng)算得已經(jīng)算得249.5556ySS 144.6356xSS 、159.0444xySP 222( 159.0444)0.7007.144.6356 249.5556xyxySPrSS SS 、闡明,用一代三化螟盛發(fā)期闡明,用一代三化螟盛發(fā)

39、期y y與與3 3月下月下旬至旬至4 4月中旬積溫月中旬積溫x x的直線回歸方程來進(jìn)行的直線回歸方程來進(jìn)行預(yù)測(cè)其可靠程度為預(yù)測(cè)其可靠程度為70.0770.07。 .159.04440.8371144.6356 249.5556xyxySPrSS SS 二、相關(guān)系數(shù)的顯著性檢驗(yàn)二、相關(guān)系數(shù)的顯著性檢驗(yàn) 上述根據(jù)實(shí)際觀測(cè)值計(jì)算得來的上述根據(jù)實(shí)際觀測(cè)值計(jì)算得來的r r是樣本相是樣本相關(guān)系數(shù),關(guān)系數(shù), 它是雙變量正態(tài)總體的總體相關(guān)系數(shù)它是雙變量正態(tài)總體的總體相關(guān)系數(shù)的估計(jì)值。樣本相關(guān)系數(shù)的估計(jì)值。樣本相關(guān)系數(shù)r r是否來自是否來自00的的總體,還須對(duì)樣本相關(guān)系數(shù)總體,還須對(duì)樣本相關(guān)系數(shù)r r 進(jìn)行顯著

40、性檢驗(yàn)。進(jìn)行顯著性檢驗(yàn)。此時(shí)無效假設(shè)、備擇假設(shè)分別為此時(shí)無效假設(shè)、備擇假設(shè)分別為: :0H=0=0, AH00。 由于r的取值區(qū)間在-1,1,r本身并不服從某個(gè)已知的理論分布。r的抽樣誤差為:當(dāng)H0 正確時(shí)此t值遵循=n-2的t分布,由之可檢驗(yàn)H0。 21S2rnr212trnrSrr 由于由于一定時(shí),一定時(shí),t0.05(0.01)t0.05(0.01)是一定的,采用查表法是一定的,采用查表法對(duì)相關(guān)系數(shù)對(duì)相關(guān)系數(shù)r r進(jìn)行顯著性檢驗(yàn)進(jìn)行顯著性檢驗(yàn). . 具體作法是:具體作法是: 先根據(jù)自由度先根據(jù)自由度n-2n-2查臨界查臨界r r值值( (附附表表8)8),得,得0.05(2)nr,0.01

41、(2)nr。假設(shè)假設(shè)|r|r| ,p p0.050.05,則相關(guān)系,則相關(guān)系數(shù)數(shù)r r不顯著,在不顯著,在r r的右上方標(biāo)記的右上方標(biāo)記“nsns或不標(biāo)記符或不標(biāo)記符號(hào);號(hào); 0.05(2)nr假設(shè)假設(shè) |r| |r| ,0.010.01p0.05p0.05,則相關(guān)系數(shù),則相關(guān)系數(shù)r r顯著,在顯著,在r r的右上方標(biāo)記的右上方標(biāo)記“* *”; 0.05(2)nr0.01(2)nr假設(shè)假設(shè)|r| |r| ,p0.01p0.01, 則相關(guān)則相關(guān)系數(shù)系數(shù)r r極顯著,在極顯著,在r r的右上方標(biāo)記的右上方標(biāo)記“* * *”。0.01(2)nr對(duì)于【例對(duì)于【例8383】,】, =0.666 =0.6

42、66,=0.798=0.798,而而 |r|=0.8371 |r|=0.8371 ,p p0.010.01,表明一代三,表明一代三化螟盛發(fā)期與化螟盛發(fā)期與3 3月下旬至月下旬至4 4月中旬積溫的相關(guān)系數(shù)月中旬積溫的相關(guān)系數(shù)極顯著,即一代三化螟盛發(fā)期與極顯著,即一代三化螟盛發(fā)期與3 3月下旬至月下旬至4 4月中月中旬積溫呈極顯著負(fù)相關(guān),積溫越高,螟蛾的盛發(fā)旬積溫呈極顯著負(fù)相關(guān),積溫越高,螟蛾的盛發(fā)期越早。期越早。 0.05(7)r0.01(7)r0.01(7)r 三、直線相關(guān)分析與回歸分析的關(guān)系三、直線相關(guān)分析與回歸分析的關(guān)系相關(guān)變量相關(guān)變量x x與與y y的相關(guān)系數(shù)的相關(guān)系數(shù)r r是是y y對(duì)對(duì)x x的回歸系的回歸系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論