第六章相關與回歸分析(新)_第1頁
第六章相關與回歸分析(新)_第2頁
第六章相關與回歸分析(新)_第3頁
第六章相關與回歸分析(新)_第4頁
第六章相關與回歸分析(新)_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、6-1第六章第六章 相關與回歸分析相關與回歸分析n第一節(jié)第一節(jié) 相關與回歸分析的基本概念相關與回歸分析的基本概念n第二節(jié)簡單線性相關分析第二節(jié)簡單線性相關分析n第三節(jié)一元線性回歸分析第三節(jié)一元線性回歸分析6-2函函數數關關系系與與相相關關關關系系相相關關關關系系的的判判斷斷基本概念基本概念 相關與回歸分析相關與回歸分析簡單線性相關分析簡單線性相關分析一元線性回歸分析一元線性回歸分析相相關關關關系系的的類類型型相相關關分分析析與與回回歸歸分分析析的的關關系系相相關關系系數數的的檢檢驗驗相相關關系系數數的的計計算算特特點點相相關關系系數數的的概概念念和和作作用用回回歸歸系系數數的的估估計計回回歸歸

2、模模型型的的檢檢驗驗一一元元線線性性回回歸歸模模型型回回歸歸模模型型的的估估計計和和預預測測6-3第一節(jié)第一節(jié) 相關與回歸分析的基本概念相關與回歸分析的基本概念一、函數關系與相關關系一、函數關系與相關關系1.函數關系函數關系當一個或幾個變量取一定的值當一個或幾個變量取一定的值時,另一個變量有確定值與之時,另一個變量有確定值與之相對應,我們稱這種關系為確相對應,我們稱這種關系為確定性的函數關系。定性的函數關系。6-4(函數關系(函數關系)(1)是一一對應的確定關系)是一一對應的確定關系(2)設有兩個變量)設有兩個變量 x 和和 y ,變量變量 y 隨變量隨變量 x 一起變化,一起變化,并完全依賴

3、并完全依賴于于 x ,當變量,當變量 x 取某個數值時,取某個數值時, y 依確依確定的關系取相應的值,則定的關系取相應的值,則稱稱 y 是是 x 的函數,記為的函數,記為 y = f (x),其中,其中 x 稱為自變稱為自變量,量,y 稱為因變量稱為因變量(3)各觀測點落在一條線上)各觀測點落在一條線上 6-5變量間的關系變量間的關系(函數關系)(函數關系) 函數關系的例子函數關系的例子某種商品的銷售額某種商品的銷售額(y)與銷售量與銷售量(x)之間的關之間的關系可表示為系可表示為 y = p x (p 為單價為單價)圓的面積圓的面積(S)與半徑之間的關系可表示為與半徑之間的關系可表示為S

4、= r2 企業(yè)的原材料消耗額企業(yè)的原材料消耗額(y)與產量與產量(x1) 、單位產、單位產量消耗量消耗(x2) 、原材料價格、原材料價格(x3)之間的關系可之間的關系可表示為表示為y = x1 x2 x3 6-62. 相關關系:相關關系: 當一個或幾個相互聯系的當一個或幾個相互聯系的變量取一定數值時,與之相對應的另一變量取一定數值時,與之相對應的另一變量的值雖然不確定,但它仍按某種規(guī)變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內變化。律在一定的范圍內變化?,F象之間客觀存在的不嚴格、不確定的數量依存關系。6-7變量間的關系變量間的關系(相關關系)(相關關系)(1)變量間關系不能用函數關)變量

5、間關系不能用函數關系精確表達;系精確表達;(2)一個變量的取值不能由另)一個變量的取值不能由另一個變量唯一確定;一個變量唯一確定;(3)當變量)當變量 x 取某個值時,變取某個值時,變量量 y 的取值可能有幾個;的取值可能有幾個;(4)各觀測點分布在線周圍。)各觀測點分布在線周圍。6-8(相關關系)(相關關系) 相關關系的例子相關關系的例子商品的消費量商品的消費量(y)與居民收入與居民收入(x)之間的關系之間的關系商品的消費量商品的消費量(y)與物價與物價(x)之間的關系之間的關系商品銷售額商品銷售額(y)與廣告費支出與廣告費支出(x)之間的關系之間的關系糧食畝產量糧食畝產量(y)與施肥量與施

6、肥量(x1) 、降雨量、降雨量(x2) 、溫度溫度(x3)之間的關系之間的關系收入水平收入水平(y)與受教育程度與受教育程度(x)之間的關系之間的關系父親身高父親身高(y)與子女身高與子女身高(x)之間的關系之間的關系6-9二、相關關系的種類二、相關關系的種類n1.按相關關系的程度劃分可分為完全相關,不完按相關關系的程度劃分可分為完全相關,不完全相關和不相關。全相關和不相關。n2.按相關形式劃分可以分為線性相關和非線性相按相關形式劃分可以分為線性相關和非線性相關。關。) 1 ()2() 3()4()為非線性相關。)、()為線性相關,()、(圖中(43216-10(1)正相關:兩個相關現象間,當

7、一個變量)正相關:兩個相關現象間,當一個變量的數值增加(或減少)時,另一個變量的數的數值增加(或減少)時,另一個變量的數值也隨之增加(或減少),即同方向變化。值也隨之增加(或減少),即同方向變化。 例如收入與消費的關系。例如收入與消費的關系。(2)負相關:當一個變量的數值增加(或減)負相關:當一個變量的數值增加(或減少)時,而另一個變量的數值相反地呈減少少)時,而另一個變量的數值相反地呈減少(或增加)趨勢變化,即反方向變化。(或增加)趨勢變化,即反方向變化。 例如物價與消費的關系。例如物價與消費的關系。3.按相關的方向劃分可分為正相關和負相關按相關的方向劃分可分為正相關和負相關6-114.按相

8、關關系涉及的變量多少劃分分為單相關、按相關關系涉及的變量多少劃分分為單相關、復相關和偏相關。復相關和偏相關。n兩個變量之間的相關,稱為單相關。兩個變量之間的相關,稱為單相關。n當所研究的是一個變量對兩個或兩個以上其他變量當所研究的是一個變量對兩個或兩個以上其他變量的相關關系時,稱為復相關。例如,某種商品的需的相關關系時,稱為復相關。例如,某種商品的需求與其價格水平以及收入水平之間的相關關系便是求與其價格水平以及收入水平之間的相關關系便是一種復相關。一種復相關。n在某一現象與多種現象相關的場合,假定其他變量在某一現象與多種現象相關的場合,假定其他變量不變,專門考察其中兩個變量的相關關系稱為偏相不

9、變,專門考察其中兩個變量的相關關系稱為偏相關。例如,在假定人們的收入水平不變的條件下,關。例如,在假定人們的收入水平不變的條件下,某種商品的需求與其價格水平的關系就是一種偏相某種商品的需求與其價格水平的關系就是一種偏相關。關。6-12n5、按相關的性質劃分可分為真相關和偽相關、按相關的性質劃分可分為真相關和偽相關6-13三、相關分析與回歸分析的關系三、相關分析與回歸分析的關系(一)概念:(一)概念:1.相關分析相關分析就是用一個指標來表明現象間相互就是用一個指標來表明現象間相互依存關系的密切程度。廣義的相關依存關系的密切程度。廣義的相關分析包括相關關系的分析(狹義的分析包括相關關系的分析(狹義

10、的相關分析)和回歸分析。相關分析)和回歸分析。2.回歸分析回歸分析是指對具有相關關系的現象,根據是指對具有相關關系的現象,根據其相關關系的具體形態(tài),選擇一個其相關關系的具體形態(tài),選擇一個合適的數學模型(稱為回歸方程合適的數學模型(稱為回歸方程式),用來近似地表達變量間的平式),用來近似地表達變量間的平均變化關系的一種統(tǒng)計分析方法。均變化關系的一種統(tǒng)計分析方法。6-14(二)相關分析與回歸分析的(二)相關分析與回歸分析的區(qū)別區(qū)別 n 1.在相關分析中,不必確定自變量和因變量;在相關分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個為自變而在回歸分析中,必須事先確定哪個為自變量,哪個

11、為因變量,而且只能從自變量去推量,哪個為因變量,而且只能從自變量去推測因變量,而不能從因變量去推斷自變量。測因變量,而不能從因變量去推斷自變量。n2.相關分析不能指出變量間相互關系的具體相關分析不能指出變量間相互關系的具體形式;而回歸分析能確切的指出變量之間相形式;而回歸分析能確切的指出變量之間相互關系的具體形式,它可根據回歸模型從已互關系的具體形式,它可根據回歸模型從已知量估計和預測未知量。知量估計和預測未知量。n3.相關分析所涉及的變量一般都是隨機變量,相關分析所涉及的變量一般都是隨機變量,而回歸分析中因變量是隨機的,自變量則作而回歸分析中因變量是隨機的,自變量則作為研究時給定的非隨機變量

12、。為研究時給定的非隨機變量。6-15(三)相關分析與回歸分析的聯系(三)相關分析與回歸分析的聯系n相關分析和回歸分析有著密切的聯系,它們相關分析和回歸分析有著密切的聯系,它們不僅具有共同的研究對象,而且在具體應用不僅具有共同的研究對象,而且在具體應用時,常常必須互相補充。相關分析需要依靠時,常常必須互相補充。相關分析需要依靠回歸分析來表明現象數量相關的具體形式,回歸分析來表明現象數量相關的具體形式,而回歸分析則需要依靠相關分析來表明現象而回歸分析則需要依靠相關分析來表明現象數量變化的相關程度。只有當變量之間存在數量變化的相關程度。只有當變量之間存在著高度相關時,進行回歸分析尋求其相關的著高度相

13、關時,進行回歸分析尋求其相關的具體形式才有意義。具體形式才有意義。n簡單說:簡單說:1、相關分析是回歸分析的基礎和前相關分析是回歸分析的基礎和前提提;2、回歸分析是相關分析的深入和繼續(xù)回歸分析是相關分析的深入和繼續(xù)。6-16定性分析定性分析定量分析定量分析四、相關關系的判斷四、相關關系的判斷6-17 (一一)相關表:相關表:將自變量將自變量x的數值按照從小到大的順序,的數值按照從小到大的順序,并配合因變量并配合因變量y的數值一一對應而平行排列的表。的數值一一對應而平行排列的表。 例:為了研究分析某種勞務產品完成量與其單位產品成本之間的關系,調查30個同類服務公司得到的原始數據如表。完成量(小時

14、)20 30 20 20 40 30 40 80 80 50 40 30 20 80 50單位成本(元/小時)18 16 16 15 16 15 15 14 14 15 15 16 18 14 14完成量(小時)20 50 20 30 50 20 50 40 20 80 40 20 50 80 30單位成本(元/小時)16 16 18 16 15 18 15 14 16 14 15 16 14 15 15整理后有整理后有完成量(小時)20 20 20 20 20 20 20 20 20 30 30 30 30 30 40單位成本(元/小時)15 16 16 16 16 18 18 18 18

15、15 15 15 16 16 14完成量(小時)40 40 40 40 50 50 50 50 50 50 80 80 80 80 80單位成本(元/小時)15 15 15 16 14 14 15 15 15 16 14 14 14 14 156-18( 二二)相關圖:又稱散點圖。將相關圖:又稱散點圖。將x置于橫軸上,置于橫軸上,y置于置于縱軸上,將(縱軸上,將(x,y)繪于坐標圖上。)繪于坐標圖上。用來反映兩變用來反映兩變量之間相關關系的圖形。量之間相關關系的圖形。廣告費(萬元)3033334056586572808090年銷售收入(百萬元)12121213141420222626306-1

16、9第二節(jié)第二節(jié) 簡單線性相關分析簡單線性相關分析一、相關系數和作用一、相關系數和作用(一一)相關系數的定義相關系數的定義1.簡單相關系數:在線性條件下說明兩個變簡單相關系數:在線性條件下說明兩個變量之間相關關系密切程度的統(tǒng)計分析指標,量之間相關關系密切程度的統(tǒng)計分析指標,簡稱相關系數。簡稱相關系數。若相關系數是根據總體全部數據計算的,若相關系數是根據總體全部數據計算的,稱為總體相關系數,記為稱為總體相關系數,記為若是根據樣本數據計算的,則稱為樣本相若是根據樣本數據計算的,則稱為樣本相關系數,記為關系數,記為 r6-20(二)相關系數的作用(二)相關系數的作用n1、判斷兩變量之間存在的線性相關關

17、系的方、判斷兩變量之間存在的線性相關關系的方向;向;n2、判斷兩變量之間存在的線性相關關系的密、判斷兩變量之間存在的線性相關關系的密切程度;切程度;n3、確定是否需要進一步對兩變量之間的依存、確定是否需要進一步對兩變量之間的依存關系做進一步的回歸分析。關系做進一步的回歸分析。6-21二、相關系數的計算和特點二、相關系數的計算和特點6-226-23yxxyr2樣本相關系數的定義公式實質樣本相關系數的定義公式實質6-24(二二)相關系數的特點相關系數的特點1.的取值介于與之間,的取值介于與之間, r 的取值范圍是的取值范圍是 -1,12.在大多數情況下,在大多數情況下,|,即,即與與的樣本的樣本觀

18、測值之間存在著一定的線性關系,當觀測值之間存在著一定的線性關系,當時,時,與為正相關,當與為正相關,當時,時,與與為負相關。為負相關。 |的數值愈接近于的數值愈接近于1,表示,表示x與與y直線相關程度愈直線相關程度愈高;反之,高;反之, |的數值愈接近于的數值愈接近于0,表示,表示x與與y直直線相關程度愈低。通常判斷的標準是線相關程度愈低。通常判斷的標準是: |0.3稱為微弱相關,稱為微弱相關,0.3 |0.5稱為低度相關,稱為低度相關,0. |0.8稱為顯著相關稱為顯著相關 ,0.8 |1稱為高度相關或強相關。稱為高度相關或強相關。6-253.如果如果|=1,則表明,則表明與與完全線性相關,

19、完全線性相關,當當=1時,稱為完全正相關,時,稱為完全正相關, 而而=-1時,稱為完全負相關。時,稱為完全負相關。4.是對變量之間線性相關關系的度量。是對變量之間線性相關關系的度量。 =0只是表明兩個變量之間不存在線性關系,只是表明兩個變量之間不存在線性關系,它并不意味著它并不意味著與與之間不存在其他類型的之間不存在其他類型的關系。關系。 6-26相關關系的測度相關關系的測度(相關系數取值及其意義)(相關系數取值及其意義)6-2722)()()(yyxxyyxxr yxnxyyyxx1)(222)(1)(xnxxx222)(1)(ynyyy計算相關系數計算相關系數的的“積差法積差法”(三三)相

20、關系數的計算實例相關系數的計算實例yyLxxLxyLr )()(yxxynxyL2)(2xxnxxL2)(2yynyyL6-28 例:下表是有關例:下表是有關15個地區(qū)某種食物需求量和地區(qū)人口個地區(qū)某種食物需求量和地區(qū)人口增加量的資料。增加量的資料。6-29yxxynLxy2261362664785115151937928663342362610676141522)(xxnLxx222613950391522)(yynLyy81346481346428663341519379yyxxxyLLLr9950. 06-30計算公式還可以有:計算公式還可以有:yxnynxnxy22)()()(yyxx

21、yyxxrnyyxxnyyxx/ )()(/)(22yxyxxynyynxxnyyxx2)(2)()(6-31三、相關系數的顯著性檢驗三、相關系數的顯著性檢驗 n1、檢驗兩個變量之間是否存在線性相關、檢驗兩個變量之間是否存在線性相關關系關系n2、采用、采用 t 檢驗檢驗n3、檢驗的步驟為、檢驗的步驟為n提出假設提出假設:H0: ;H1: 0n 確定顯著性水平確定顯著性水平 ,并作出決策,并作出決策 若若tt,拒絕,拒絕H0 若若tt,接受,接受H06-32相關系數的顯著性檢驗相關系數的顯著性檢驗(實例)(實例) n 對前例計算的相關系數進行顯著性檢對前例計算的相關系數進行顯著性檢(0.05)1

22、.提出假設提出假設:H0: ;H1: 02.計算檢驗的統(tǒng)計量計算檢驗的統(tǒng)計量種食物需求量和地區(qū)人口增加量種食物需求量和地區(qū)人口增加量6-33什么是回歸分析?什么是回歸分析? (內容)(內容)1.從一組樣本數據出發(fā),確定變量之間的數學從一組樣本數據出發(fā),確定變量之間的數學關系式關系式2.對這些關系式的可信程度進行各種統(tǒng)計檢驗,對這些關系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著些變量的影響顯著,哪些不顯著3.利用所求的關系式,根據一個或幾個變量的利用所求的關系式,根據一個或幾個變量的取值來預測或控制另一個

23、特定變量的取值,取值來預測或控制另一個特定變量的取值,并給出這種預測或控制的精確程度并給出這種預測或控制的精確程度第三節(jié)第三節(jié) 簡單線性回歸分析簡單線性回歸分析6-34回歸模型回歸模型1. 回答回答“變量之間是什么樣的關系?變量之間是什么樣的關系?”2. 方程中運用方程中運用n1 個數字的因變量個數字的因變量(響應變量響應變量)n被預測的變量被預測的變量n1 個或多個數字的或分類的自變量個或多個數字的或分類的自變量 (解釋變量解釋變量)n用于預測的變量用于預測的變量3. 主要用于預測和估計主要用于預測和估計6-35回歸模型的類型回歸模型的類型回歸模型回歸模型多元回歸多元回歸一元回歸一元回歸線性

24、線性回歸回歸非線性非線性回歸回歸線性線性回歸回歸非線性非線性回歸回歸6-36一、一、 一元線性回歸模型一元線性回歸模型 (概念要點(概念要點)1.當只涉及一個自變量時稱為當只涉及一個自變量時稱為一元回歸一元回歸,若因變,若因變量量 y 與自變量與自變量 x 之間為線性關系時稱為之間為線性關系時稱為一元線一元線性回歸。性回歸。2.對于具有線性關系的兩個變量,可以用一條線對于具有線性關系的兩個變量,可以用一條線性方程來表示它們之間的關系。性方程來表示它們之間的關系。3.描述因變量描述因變量 y 如何依賴于自變量如何依賴于自變量 x 和誤差項和誤差項 的方程稱為的方程稱為回歸模型?;貧w模型。6-37

25、n (一一)總體回歸函數總體回歸函數 i01iui(6.3) u i是隨機誤差項,又稱隨機干擾項,它是隨機誤差項,又稱隨機干擾項,它是一個特殊的隨機變量,反映未列入方程式是一個特殊的隨機變量,反映未列入方程式的其他各種因素對的影響。的其他各種因素對的影響。n (二二)樣本回歸函數樣本回歸函數: (i i,. n). n) i稱為殘差,在概念上,稱為殘差,在概念上,i與總體誤差與總體誤差項項ui相互對應;是樣本的容量。相互對應;是樣本的容量。01iiyxe6-38一元線性回歸模型一元線性回歸模型 (概念要點(概念要點)對于只涉及一個自變量的簡單線性回歸模型可表對于只涉及一個自變量的簡單線性回歸模

26、型可表示為示為 yi= 1 x i模型中,模型中,y 是是 x 的線性函數的線性函數(部分部分)加上誤差項加上誤差項n線性部分反映了由于線性部分反映了由于 x 的變化而引起的的變化而引起的 y 的變化的變化n誤差項誤差項 i 是隨機變量是隨機變量,反映了除反映了除 x 和和 y 之間的線之間的線性關系之外的隨機因素對性關系之外的隨機因素對 y 的影響的影響,是不能由是不能由 x 和和 y 之間的線性關系所解釋的變異性之間的線性關系所解釋的變異性n 0 和和 1 稱為模型的參數稱為模型的參數6-391、總體回歸線是未知的,只有一條。樣本回歸線是根據樣本數、總體回歸線是未知的,只有一條。樣本回歸線

27、是根據樣本數據擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。據擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。2、總體回歸函數中的、總體回歸函數中的0和和1是未知的參數,表現為常數。而樣是未知的參數,表現為常數。而樣本回歸函數中的本回歸函數中的 是隨機變量,其具體數值隨所抽取是隨機變量,其具體數值隨所抽取的樣本觀測值不同而變動。的樣本觀測值不同而變動。3、總體回歸函數中的、總體回歸函數中的ui是是i與未知的總體回歸線之間的縱向距與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數中的離,它是不可直接觀測的。而樣本回歸函數中的i是是i與與樣本回歸線之間的縱向距離,當根據樣本

28、觀測值擬合出樣樣本回歸線之間的縱向距離,當根據樣本觀測值擬合出樣本回歸線之后,可以計算出本回歸線之后,可以計算出i的具體數值。的具體數值。01和6-40(三)(三)的的基本標準假定基本標準假定1.誤差項誤差項ui是一個期望值為是一個期望值為0的隨機變量,即的隨機變量,即E(ui)=0。對于一個給定的。對于一個給定的 x 值,值,y 的期望值為的期望值為E ( yi ) = 0+ 1 xi2.對于所有的對于所有的 x 值,值,ui的方差的方差2 都相同都相同3.誤差項誤差項ui是一個服從正態(tài)分布的隨機變量,且是一個服從正態(tài)分布的隨機變量,且相互獨立。即相互獨立。即uN( 0 ,2 )n獨立性意味

29、著對于一個特定的獨立性意味著對于一個特定的 x值,它所值,它所對應的對應的u與其他與其他 x 值所對應的值所對應的u不相關不相關n對于一個特定的對于一個特定的 x 值,它所對應的值,它所對應的 yi值與值與其他其他 xi所對應的所對應的 y 值也不相關值也不相關6-41總體回歸線與隨機誤差項總體回歸線與隨機誤差項P168 (t)01iXYiY 。 。 。ui 6-42(四)回歸方程(四)回歸方程 (概念要點)(概念要點)1. 描述描述 y 的平均值或期望值如何依賴于的平均值或期望值如何依賴于 x 的的方程稱為方程稱為回歸方程。2. 簡單線性回歸方程的形式如下簡單線性回歸方程的形式如下 E( y

30、 ) = 0+ 1 x方程的圖示是一條直線,因此也稱為直線回歸方程的圖示是一條直線,因此也稱為直線回歸方程方程 0是回歸直線在是回歸直線在 y 軸上的截距,是當軸上的截距,是當 x=0 時時 y 的期望值的期望值 1是直線的斜率,稱為回歸系數,表示當是直線的斜率,稱為回歸系數,表示當 x 每每變動一個單位時,變動一個單位時,y 的平均變動值的平均變動值6-43估計估計( (經驗經驗) )的回歸的回歸方程方程3. 簡單線性回歸中估計的回歸方程為簡單線性回歸中估計的回歸方程為其中:其中: 是估計的回歸直線在是估計的回歸直線在 y 軸上的截距,軸上的截距, 是直線是直線的斜率,它表示對于一個給定的的

31、斜率,它表示對于一個給定的 x 的值,是的值,是 y 的估計的估計值,也表示值,也表示 x 每變動一個單位時,每變動一個單位時, y 的平均變動值。的平均變動值。 2. 用樣本統(tǒng)計量用樣本統(tǒng)計量 和和 代替回歸方程中的未知參代替回歸方程中的未知參數數 和和 ,就得到了,就得到了1. 總體回歸參數總體回歸參數 和和 是未知的,必需利用樣是未知的,必需利用樣本數據去估計本數據去估計6-44n二、參數二、參數 0 和和 1 的最小二乘估計的最小二乘估計6-45(一)最小二乘法(一)最小二乘法 (概念要點(概念要點)1. 使因變量的觀察值與估計值之間的離差平方和達使因變量的觀察值與估計值之間的離差平方

32、和達到最小來求得到最小來求得 和和 的方法。即的方法。即016-46最小二乘法最小二乘法(圖示)(圖示)(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi6-47 設設 將對求偏導數,并令其等于零,可得將對求偏導數,并令其等于零,可得: n加以整理后有:加以整理后有: 22)(tttYYeQ210)(ttXY0102()0iiQYX0112()0itiQX YX 01iinXY 201iiiiXXX Y6-48最小二乘法最小二乘法 ( 和和 的計算公式的計算公式) 解方程組解方程組可得求解可得求解 和和 的標準方程如下:的標準方程如下:6-49例:現以

33、前例的資料配合回歸直線,計算如下:例:現以前例的資料配合回歸直線,計算如下:6-50yxxynLxy2261362664785115151937928663342362610676141522)(xxnLxx5301. 0286633415193791xxLxyL226136260.0530122.5905011515yx 15n6-51xxy5301. 05905.2210所以上式中上式中 表示人口增加量每增加(或減少)表示人口增加量每增加(或減少)1千千人,該種食品的年需求量平均來說增加(或減少)人,該種食品的年需求量平均來說增加(或減少)0.5301十噸即十噸即5.301噸。噸。16-5

34、2估計方程的求法估計方程的求法(Excel的輸出結果)的輸出結果)016-53(二)估計標準誤差(二)估計標準誤差 Sy1.實際觀察值與回歸估計值離差平方和的均方根。實際觀察值與回歸估計值離差平方和的均方根。2.反映實際觀察值在回歸直線周圍的分散狀況。反映實際觀察值在回歸直線周圍的分散狀況。3.從另一個角度說明了回歸直線的擬合程度。從另一個角度說明了回歸直線的擬合程度。4.計算公式為計算公式為由樣本資料計算由樣本資料計算由總體資料計算或由總體資料計算或在大樣本情況下在大樣本情況下6-54)(4215. 62150644.53622) (十噸nyyQS計算例子計算例子6-55可得簡化式:(可得簡

35、化式:(P172)上式的推導證明(上式的推導證明(P172)6-56了解了解(三)最小二乘估計量的性質(三)最小二乘估計量的性質(四)回歸系數的區(qū)間估計(四)回歸系數的區(qū)間估計6-57(一)(一) 回歸模型檢驗的種類回歸模型檢驗的種類 回歸模型的檢驗包括理論意義檢驗、一級檢回歸模型的檢驗包括理論意義檢驗、一級檢驗和二級檢驗。驗和二級檢驗。(二)擬合程度的評價(二)擬合程度的評價n 所謂擬合程度,是指樣本觀測值聚集在樣本所謂擬合程度,是指樣本觀測值聚集在樣本回歸線周圍的緊密程度。判斷回歸模型擬合回歸線周圍的緊密程度。判斷回歸模型擬合程度優(yōu)劣最常用的數量尺度是樣本決定系數程度優(yōu)劣最常用的數量尺度是

36、樣本決定系數(又稱決定系數)。它是建立在對總離差平(又稱決定系數)。它是建立在對總離差平方和進行分解的基礎之上的。方和進行分解的基礎之上的。三、一元線性回歸模型的檢驗三、一元線性回歸模型的檢驗6-58總離差平方和的分解總離差平方和的分解1. 因變量因變量 y 的取值是不同的,的取值是不同的,y 取值的這種取值的這種波動稱為波動稱為變差變差。變差來源于兩個方面:。變差來源于兩個方面:n由于自變量由于自變量 x 的取值不同造成的;的取值不同造成的;n除除 x 以外的其他因素以外的其他因素(如如x對對y的非線性影響、的非線性影響、測量誤差等測量誤差等)的影響。的影響。2. 對一個具體的觀測值來說,變

37、差的大小可對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差以通過該實際觀測值與其均值之差 來來表示。表示。6-59離差平方和的分解離差平方和的分解(圖示)(圖示)y離差分解圖離差分解圖6-60離差平方和的分解離差平方和的分解 (三個平方和的關系)(三個平方和的關系)2. 兩端平方后求和有兩端平方后求和有SST = SSR + SSE總變差平方和總變差平方和(SST)回歸平方和回歸平方和(SSR)殘差平方和殘差平方和(SSE)6-61離差平方和的分解離差平方和的分解 (三個平方和的意義(三個平方和的意義)1.總平方和總平方和(SST)n 反映因變量的反映因變量的 n 個觀察值與

38、其均值的總離差個觀察值與其均值的總離差2.回歸平方和回歸平方和(SSR)n 反映自變量反映自變量 x 的變化對因變量的變化對因變量 y 取值變化的取值變化的影響,或者說,是由于影響,或者說,是由于 x 與與 y 之間的線性關之間的線性關系引起的系引起的 y 的取值變化,也稱為可解釋的平的取值變化,也稱為可解釋的平方和。方和。3.殘差平方和殘差平方和(SSE)n 反映除反映除 x 以外的其他因素對以外的其他因素對 y 取值的影響,取值的影響,也稱為不可解釋的平方和或剩余平方和。也稱為不可解釋的平方和或剩余平方和。6-62樣本決定系數樣本決定系數 (判定系數(判定系數 r2 )1.回歸平方和占總離

39、差平方和的比例:回歸平方和占總離差平方和的比例:2. 反映回歸直線的擬合程度反映回歸直線的擬合程度3. 取值范圍在取值范圍在 0 , 1 之間之間4. r2 1,說明回歸方程擬合的越好;,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差,說明回歸方程擬合的越差5. 判定系數等于相關系數的平方,即判定系數等于相關系數的平方,即r2(r)26-63(三)回歸方程的顯著性檢驗(三)回歸方程的顯著性檢驗 (線性關系的檢驗線性關系的檢驗 )1. 檢驗自變量和因變量之間的線性關系是否檢驗自變量和因變量之間的線性關系是否顯著顯著2. 具體方法是將回歸離差平方和具體方法是將回歸離差平方和(SSR)同剩余

40、同剩余離差平方和離差平方和(SSE)加以比較,應用加以比較,應用F檢驗來檢驗來分析二者之間的差別是否顯著分析二者之間的差別是否顯著如果是顯著的,兩個變量之間存在線性關系如果是顯著的,兩個變量之間存在線性關系如果不顯著,兩個變量之間不存在線性關系如果不顯著,兩個變量之間不存在線性關系6-64回歸方程的顯著性檢驗回歸方程的顯著性檢驗 (檢驗檢驗的步驟)的步驟)1.提出假設提出假設nH0:線性關系不顯著:線性關系不顯著6-65回歸方程的顯著性檢驗回歸方程的顯著性檢驗 (方差分析表方差分析表)1296.5266-66回歸系數的顯著性檢驗回歸系數的顯著性檢驗(要點)(要點)3. 在一元線性回歸中,等價于

41、回歸方程的在一元線性回歸中,等價于回歸方程的顯著性檢驗顯著性檢驗1. 檢驗檢驗 x 與與 y 之間是否具有線性關系,或之間是否具有線性關系,或者說,檢驗自變量者說,檢驗自變量 x 對因變量對因變量 y 的影響的影響是否顯著是否顯著6-671.1. 是根據最小二乘法求出的樣本統(tǒng)計量,它是根據最小二乘法求出的樣本統(tǒng)計量,它有自己的分布有自己的分布2.2. 的分布具有如下性質的分布具有如下性質分布形式:正態(tài)分布分布形式:正態(tài)分布數學期望:數學期望:標準差:標準差:由于由于 無未知,需用其估計量無未知,需用其估計量S Sy y來代替得到來代替得到 的估計的標準差的估計的標準差回歸系數的顯著性檢驗回歸系

42、數的顯著性檢驗(樣本統(tǒng)計量(樣本統(tǒng)計量 的分布)的分布)11)(E2)(1xxi2)(1xxSSiy6-68回歸系數的顯著性檢驗回歸系數的顯著性檢驗(樣本統(tǒng)計量(樣本統(tǒng)計量 的分布)的分布)2)(1xxSSiy 的抽樣分布的抽樣分布11)(E6-69回歸系數的顯著性檢驗回歸系數的顯著性檢驗 (步驟)(步驟)1.提出假設提出假設nH0: 1 = 0 (沒有線性關系沒有線性關系) nH1: 1 0 (有線性關系有線性關系) 2.計算檢驗的統(tǒng)計量計算檢驗的統(tǒng)計量3. 確定顯著性水平確定顯著性水平 ,并進行決策,并進行決策 t t,拒絕,拒絕H0; t t=2.201,拒絕,拒絕H0,表明,表明人均收入人均收入與人均消費之間有線性關系與人均消費之間有線性關系對前例的回歸系數進行顯著性檢驗對前例的回歸系數進行顯著性檢驗( 0.05)6-71回歸系數的顯著性檢驗回歸系數的顯著性檢驗(Excel輸出的結果)輸出的結果)051872. 0867789. 1111St418049. 88047.39000StniiyxxxnSS122)()(10niiyxxSS12)(16-72四、利用回歸方程進行估計和預測四、利用回歸方程進行估計和預測1. 根據自變量根

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論