第10章 相關(guān)與回歸分析(統(tǒng)計學(xué)PPT)_第1頁
第10章 相關(guān)與回歸分析(統(tǒng)計學(xué)PPT)_第2頁
第10章 相關(guān)與回歸分析(統(tǒng)計學(xué)PPT)_第3頁
第10章 相關(guān)與回歸分析(統(tǒng)計學(xué)PPT)_第4頁
第10章 相關(guān)與回歸分析(統(tǒng)計學(xué)PPT)_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第第1010章章 相關(guān)與回歸分析相關(guān)與回歸分析統(tǒng)計學(xué)餐飲消費額與小費數(shù)據(jù)如下:單位:美元餐飲消費額與小費數(shù)據(jù)如下:單位:美元消費消費 33.5 50.7 87.9 98.8 63.6 107.3 120.7 78.5 102.3 140.6 小費小費 5.55.5 5.05.0 8.08.0 1717 1212 1616 18.518.5 9.09.0 15.515.5 22.022.0 實例實例 西方國家餐飲等服務(wù)行業(yè)有一條不成文的規(guī)定,即發(fā)生餐飲等服務(wù)項目消費時,必須給服務(wù)員一定數(shù)額小費,許多人都聽說小費,但消費者應(yīng)該留下多少小費? 有人說應(yīng)該是賬單的16%左右,是否真的如此呢?某機構(gòu)經(jīng)過

2、調(diào)查搜集到以下數(shù)據(jù),通過對這幾組數(shù)據(jù)的分析與觀察,他們發(fā)現(xiàn)了兩者之間的數(shù)量關(guān)系。1.1.是否有足夠的證據(jù)斷定:在是否有足夠的證據(jù)斷定:在賬單與小費數(shù)額之間存在賬單與小費數(shù)額之間存在某種聯(lián)系?某種聯(lián)系?2.2.如果存在某種聯(lián)系,怎樣根如果存在某種聯(lián)系,怎樣根據(jù)這種聯(lián)系來確定應(yīng)該留據(jù)這種聯(lián)系來確定應(yīng)該留下多少小費?下多少小費?第第1010章章 相關(guān)與回歸分析相關(guān)與回歸分析一、簡單線性相關(guān)分析一、簡單線性相關(guān)分析二、簡單線性回歸分析二、簡單線性回歸分析三、三、ExcelExcel在簡單線性相關(guān)與回在簡單線性相關(guān)與回歸分析中的應(yīng)用歸分析中的應(yīng)用本章學(xué)習(xí)目標(biāo)本章學(xué)習(xí)目標(biāo)1.1.熟悉相關(guān)關(guān)系的概念、特點、

3、種類和度量熟悉相關(guān)關(guān)系的概念、特點、種類和度量2.2.掌握簡單線性回歸方程的建立方法掌握簡單線性回歸方程的建立方法3.3.理解簡單線性回歸方程的統(tǒng)計檢驗理解簡單線性回歸方程的統(tǒng)計檢驗擬擬合優(yōu)度檢驗、變量顯著性檢驗和方程顯著性合優(yōu)度檢驗、變量顯著性檢驗和方程顯著性檢驗檢驗4.4.掌握利用回歸方程進行預(yù)測的方法掌握利用回歸方程進行預(yù)測的方法5.5.利利一、簡單線性相關(guān)分析一、簡單線性相關(guān)分析(一)變量間的關(guān)系(一)變量間的關(guān)系(二)相關(guān)關(guān)系的描述與測度(二)相關(guān)關(guān)系的描述與測度相關(guān)分析要解決的問題相關(guān)分析要解決的問題變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強度如何

4、?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?為解決這些問題,在進行相關(guān)分析時,對總體有為解決這些問題,在進行相關(guān)分析時,對總體有以下兩個主要假定以下兩個主要假定兩個變量之間是線性關(guān)系兩個變量都是隨機變量相關(guān)分析及其假定相關(guān)分析及其假定 2rS例如:圓面積21I PQbbIaPQ之間、居民收入商品價格與例如:商品需求量函數(shù)關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系(一)變量的關(guān)系(一)變量的關(guān)系1.1. 是一一對應(yīng)的確定關(guān)系是一一對應(yīng)的確定關(guān)系2.2. 設(shè)有兩個變量設(shè)有兩個變量 x x 和和 y y ,變量,變量 y y 隨變量隨變量 x x 一起變化,并完一起變化,并完全依賴于全依賴于 x x

5、,當(dāng)變量,當(dāng)變量 x x 取某取某個數(shù)值時,個數(shù)值時, y y 依確定的關(guān)系依確定的關(guān)系取相應(yīng)的值,則稱取相應(yīng)的值,則稱 y y 是是 x x 的函數(shù),記為的函數(shù),記為 y = f (x),其,其中中 x x 稱為自變量,稱為自變量,y y 稱為因稱為因變量變量3.3. 各觀測點落在一條線上各觀測點落在一條線上 函數(shù)關(guān)系函數(shù)關(guān)系函數(shù)關(guān)系的例子函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為 y y = = pxpx (p 為單價)圓的面積(S)與半徑之間的關(guān)系可表示為S S= = R R2 2 企業(yè)的原材料消耗額(y)與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價格(x

6、3)之間的關(guān)系可表示為y y = = x x1 1 x x2 2 x x3 3 1.1. 變量間關(guān)系不能用函數(shù)關(guān)變量間關(guān)系不能用函數(shù)關(guān)系精確表達系精確表達2.2. 一個變量的取值不能由另一個變量的取值不能由另一個變量唯一確定一個變量唯一確定3.3. 當(dāng)變量當(dāng)變量 x x 取某個值時,取某個值時,變量變量 y y 的取值可能有幾的取值可能有幾個個4.4. 各觀測點分布在直線周圍各觀測點分布在直線周圍 xy 相關(guān)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系的例子相關(guān)關(guān)系的例子父親身高(y)與子女身高(x)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)

7、之間的關(guān)系商品的消費量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費支出(x)之間的關(guān)系相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別和聯(lián)系相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別和聯(lián)系 聯(lián)系:聯(lián)系:具有函數(shù)關(guān)系的某些現(xiàn)象也會因觀察測量的具有函數(shù)關(guān)系的某些現(xiàn)象也會因觀察測量的誤差,而使得到的數(shù)據(jù)表現(xiàn)為非確定性的相誤差,而使得到的數(shù)據(jù)表現(xiàn)為非確定性的相關(guān)關(guān)系關(guān)關(guān)系對相關(guān)關(guān)系作進一步的觀察,不難發(fā)現(xiàn)它們對相關(guān)關(guān)系作進一步的觀察,不難發(fā)現(xiàn)它們也是有規(guī)律可循的,可以借助函數(shù)關(guān)系的數(shù)也是有規(guī)律可循的,可以借助函數(shù)關(guān)系的數(shù)學(xué)表達式來近似地描述學(xué)表達式來近似地描述 區(qū)別:區(qū)別:函數(shù)關(guān)系是變量值之間一種確定性的對應(yīng)關(guān)函數(shù)關(guān)系是變量值之間

8、一種確定性的對應(yīng)關(guān)系,而相關(guān)關(guān)系則是一種非確定性的依存關(guān)系系,而相關(guān)關(guān)系則是一種非確定性的依存關(guān)系 從變量相關(guān)的程度看從變量相關(guān)的程度看 完全相關(guān)(完全相關(guān)(B B) 不完全相關(guān)(不完全相關(guān)(A A) 不相關(guān)不相關(guān)(C)C)(二)相關(guān)關(guān)系的描述與測度(二)相關(guān)關(guān)系的描述與測度1.1.相關(guān)關(guān)系的類型相關(guān)關(guān)系的類型從變量相關(guān)關(guān)系變化的從變量相關(guān)關(guān)系變化的方向看看 正相關(guān)變量同方向變化變量同方向變化 同增同減同增同減 (A)(A) 負相關(guān)變量反方向變化變量反方向變化 一增一減一增一減(B)(B)ABC 從涉及的變量數(shù)量看從涉及的變量數(shù)量看 單相關(guān):單相關(guān):是兩個變量之間存在的相關(guān)關(guān)系是兩個變量之間存

9、在的相關(guān)關(guān)系 復(fù)相關(guān):復(fù)相關(guān):三個或三個以上變量之間存在的三個或三個以上變量之間存在的相關(guān)關(guān)系相關(guān)關(guān)系 從變量相關(guān)關(guān)系的表現(xiàn)形式看從變量相關(guān)關(guān)系的表現(xiàn)形式看 線性相關(guān)線性相關(guān)散布圖接近一條直線散布圖接近一條直線 非線性相關(guān)非線性相關(guān)散布圖接近一條曲線散布圖接近一條曲線定性分析法定性分析法是依據(jù)研究者的理論知識和實踐經(jīng)驗,是依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷及何種關(guān)系作出判斷定量分析法定量分析法在定性分析的基礎(chǔ)上,通過編制相關(guān)表、在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)與判定系數(shù)繪制相關(guān)圖、計

10、算相關(guān)系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度形態(tài)及密切程度2.2.相關(guān)關(guān)系的描述與測度方法相關(guān)關(guān)系的描述與測度方法 將一變量的若干變量值按從小到大的順序排列,將一變量的若干變量值按從小到大的順序排列,并將另一變量或多個相關(guān)變量的值與之對應(yīng)排列形并將另一變量或多個相關(guān)變量的值與之對應(yīng)排列形成的統(tǒng)計表。成的統(tǒng)計表。相關(guān)表相關(guān)表財務(wù)軟件代理商的廣告費與月平均銷售額相關(guān)表財務(wù)軟件代理商的廣告費與月平均銷售額相關(guān)表年廣告費投入(萬元)年廣告費投入(萬元)x月均銷售額(萬元)月均銷售額(萬元)y12.515.323.226.433.534.439.

11、445.255.460.915.828.735.037.840.145.249.050.557.268.9某銀行所屬的某銀行所屬的2525家分行的有關(guān)業(yè)務(wù)數(shù)據(jù)家分行的有關(guān)業(yè)務(wù)數(shù)據(jù) 將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形,出來,用以表明相關(guān)點分布狀況的圖形,又稱散點圖。又稱散點圖。相關(guān)圖相關(guān)圖負線性相關(guān)負線性相關(guān)正線性相關(guān)正線性相關(guān)非線性相關(guān)非線性相關(guān)完全負線性相關(guān)完全負線性相關(guān)完全正線性相關(guān)完全正線性相關(guān)常見的散點圖常見的散點圖度量變量之間線性相關(guān)關(guān)系密切程度的指標(biāo)度量變量之間線性相關(guān)關(guān)系密切程度的指標(biāo)反映兩變

12、量間線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為反映兩變量間線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為簡單相關(guān)系數(shù)簡單相關(guān)系數(shù);反映多元線性相關(guān)關(guān)系的統(tǒng)反映多元線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為復(fù)相關(guān)系數(shù)。計指標(biāo)稱為復(fù)相關(guān)系數(shù)。 若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為系數(shù),記為 r相關(guān)系數(shù)相關(guān)系數(shù) 總體相關(guān)系數(shù)總體相關(guān)系數(shù) 反映總體兩個變量反映總體兩個變量X X和和Y Y的線性相關(guān)程度的的線性相關(guān)程度的統(tǒng)計指標(biāo)。其計算公式為:統(tǒng)計指標(biāo)。其計算公式為: 特點:特點:對于特定的

13、總體來說,對于特定的總體來說,X X和和Y Y的數(shù)值是的數(shù)值是既定的,總體相關(guān)系數(shù)是客觀存在的特定數(shù)既定的,總體相關(guān)系數(shù)是客觀存在的特定數(shù)值,但通常是無法計算的。值,但通常是無法計算的。 )()(),(YVarXVarYXCov 樣本相關(guān)系數(shù)樣本相關(guān)系數(shù) 通過通過X X和和Y Y 的樣本觀測值的樣本觀測值x x和和y y去估計的樣本相關(guān)系去估計的樣本相關(guān)系數(shù)。變量數(shù)。變量x x和和y y的樣本相關(guān)系數(shù)通常用的樣本相關(guān)系數(shù)通常用 表示表示 XYrXYrxyrXYr2222222)(yynxxnyxxynnyynxxnyyxxSSSryxxyxy特點:特點:樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機樣本

14、樣本相關(guān)系數(shù)是根據(jù)從總體中抽取的隨機樣本的觀測值計算出來的,是對總體相關(guān)系數(shù)的估計值,的觀測值計算出來的,是對總體相關(guān)系數(shù)的估計值,它是個隨機變量。它是個隨機變量。相關(guān)系數(shù)的取值及其意義相關(guān)系數(shù)的取值及其意義 r r 的取值范圍是的取值范圍是 -1,1-1,1 | |r r|=1|=1,為完全相關(guān),為完全相關(guān)r =1,為完全正相關(guān)r = -1,為完全負相關(guān) r r = 0= 0,不存在線性相關(guān)關(guān)系(不相關(guān)),不存在線性相關(guān)關(guān)系(不相關(guān)) -1-1 r r00,為負相關(guān),為負相關(guān) 0 0 r r 1 1,為正相關(guān),為正相關(guān) | |r r| |越趨于越趨于1 1表示關(guān)系越密切;表示關(guān)系越密切;|

15、|r r| |越趨于越趨于0 0表示表示關(guān)系越不密切關(guān)系越不密切相關(guān)系數(shù)的經(jīng)驗解釋相關(guān)系數(shù)的經(jīng)驗解釋| |r r| | 0.80.8時,可視為兩個變量之間高度相關(guān)時,可視為兩個變量之間高度相關(guān)0.50.5 | |r r|0.8|0.8時,可視為中度相關(guān)時,可視為中度相關(guān)0.30.3 | |r r|0.5|0.5時,視為低度相關(guān)時,視為低度相關(guān)| |r r|0.3|=7.5344t t0.0250.025(25-2)=2.0687(25-2)=2.0687,所以要拒絕,所以要拒絕H H0 0,說明不良貸款與貸款余額之間存在著顯著的正,說明不良貸款與貸款余額之間存在著顯著的正線性相關(guān)關(guān)系線性相關(guān)關(guān)

16、系 各相關(guān)系數(shù)檢驗的統(tǒng)計量各相關(guān)系數(shù)檢驗的統(tǒng)計量二、簡單線性回歸分析二、簡單線性回歸分析(一)回歸分析概述(一)回歸分析概述(二)簡單線性回歸模型(二)簡單線性回歸模型(三)參數(shù)的最小二乘估計(三)參數(shù)的最小二乘估計(四)回歸直線的擬合程度(四)回歸直線的擬合程度(五)回歸系數(shù)的顯著性檢驗(五)回歸系數(shù)的顯著性檢驗(六)利用回歸方程進行估計和預(yù)測(六)利用回歸方程進行估計和預(yù)測回歸:退回回歸:退回regression18771877年年 弗朗西斯弗朗西斯高爾頓爵士高爾頓爵士 遺傳學(xué)研究遺傳學(xué)研究平均身高平均身高回歸分析產(chǎn)生的歷史回歸分析產(chǎn)生的歷史(一)回歸分析概述(一)回歸分析概述什么是回歸分

17、析?什么是回歸分析? 就是通過一個變量或一些變就是通過一個變量或一些變量的變化解釋另一變量的變化。量的變化解釋另一變量的變化。 1.1. 根據(jù)理論和對問題的分析判斷,根據(jù)理論和對問題的分析判斷, 區(qū)分自區(qū)分自變量和因變量;變量和因變量; 2. 設(shè)法找出適合的數(shù)學(xué)方程式設(shè)法找出適合的數(shù)學(xué)方程式( (即即 回歸?;貧w模型型) )描述變量間的關(guān)系描述變量間的關(guān)系 3. 3. 對回歸模型進行統(tǒng)計檢驗;對回歸模型進行統(tǒng)計檢驗; 4. 4. 統(tǒng)計檢驗通過后,利用回歸模型,根據(jù)統(tǒng)計檢驗通過后,利用回歸模型,根據(jù)解釋變量去估計,預(yù)測因變量。解釋變量去估計,預(yù)測因變量。 回歸分析的內(nèi)容與步驟回歸分析的內(nèi)容與步驟

18、線線性性回回歸歸非非線線性性回回歸歸一一元元回回歸歸線線性性回回歸歸非非線線性性回回歸歸多多元元回回歸歸回回歸歸模模型型回歸模型的類型回歸模型的類型2.2.簡單線性回歸模型可表示為簡單線性回歸模型可表示為Y 是X的線性函數(shù)(部分)加上誤差項 線性部分反映了由于 X 的變化而引起的 Y 的變化 誤差項 是隨機變量反映了除 X 和 Y之間的線性關(guān)系之外的隨機因素對 Y 的影響是不能由 X 和 Y 之間的線性關(guān)系所解釋的變異性0和 1 稱為回歸模型的參數(shù)(二)簡單線性回歸模型(二)簡單線性回歸模型01iiiYX1.1.描述因變量描述因變量Y Y如何依賴于自變量如何依賴于自變量X X和誤差項和誤差項的

19、的方程稱為回歸模型方程稱為回歸模型簡單線性回歸模型的基本假定簡單線性回歸模型的基本假定 1.1. 線性假設(shè)。線性假設(shè)。誤差項是一個期望值為0的隨機變量,即E()=0。對于一個給定的 X 值,Y 的期望值為2.2. 同方差假設(shè)。同方差假設(shè)。對于所有的 X 值,的方差2 都相同3.3. 正態(tài)性假設(shè)。正態(tài)性假設(shè)。誤差項是一個服從正態(tài)分布的隨機變量,且相互獨立。即服從N( 0 ,2 )4. 獨立性假設(shè)。獨立性假設(shè)。對于一個特定的 X 值,它所對應(yīng)的與其他 X 值所對應(yīng)的不相關(guān);對于一個特定的 X 值,它所對應(yīng)的 Y 值與其他 X 所對應(yīng)的 Y 值也不相關(guān)01( )iiE YXXY0X1XX2XX3XX

20、)(YF)(1YE)(1YFXY10XYE10)(0)(E2)()(iiYVarVar0),(iiXCov服從N( 0 ,2 )1.1. 描述描述 Y Y的平均值或期望值如何依賴于的平均值或期望值如何依賴于X X 的方程稱為回歸方程的方程稱為回歸方程2.2. 簡單線性回歸方程的形式如下:簡單線性回歸方程的形式如下: 方程的圖示是一條直線,也稱為直線回歸方程方程的圖示是一條直線,也稱為直線回歸方程0 0是回歸直線在是回歸直線在 Y Y 軸上的截距,是當(dāng)軸上的截距,是當(dāng) X X=0 =0 時時Y Y的期望值的期望值1 1是直線的斜率,稱為回歸系數(shù),表示當(dāng)是直線的斜率,稱為回歸系數(shù),表示當(dāng)X X每每

21、變動一個單位時,變動一個單位時,Y Y 的平均變動值的平均變動值簡單線性回歸方程簡單線性回歸方程01()iiE YX3.3. 對于簡單線性回歸,估計的回歸方程形式為對于簡單線性回歸,估計的回歸方程形式為估計的回歸方程估計的回歸方程01iiyx1.1. 總體總體回歸參數(shù)回歸參數(shù) 和和 是未知的,必需利用樣本數(shù)是未知的,必需利用樣本數(shù)據(jù)去估計據(jù)去估計012.2. 用用樣本統(tǒng)計量樣本統(tǒng)計量 和和 代替回歸方程中的未知代替回歸方程中的未知參數(shù)參數(shù) 和和 ,就得到了估計的回歸方程,就得到了估計的回歸方程0101其中:其中: 是估計的回歸直線在是估計的回歸直線在 y y 軸上的截距,軸上的截距, 是直線的

22、斜率,表示是直線的斜率,表示 x x 每變動一個單位時,每變動一個單位時,y y 的平均變動值的平均變動值 10使因變量的觀察值與估計值之間的離差平方和達使因變量的觀察值與估計值之間的離差平方和達到最小來求得到最小來求得 和和 的方法。即的方法。即用最小二乘法擬合的直線來代表用最小二乘法擬合的直線來代表x x與與y y之間之間的的關(guān)系與實際數(shù)據(jù)的誤差比其他任何直線都小關(guān)系與實際數(shù)據(jù)的誤差比其他任何直線都小參數(shù)的最小二乘估計參數(shù)的最小二乘估計01xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi最小二乘估計示意圖最小二乘估計示意圖根據(jù)最小二乘法的要求

23、,可得求解根據(jù)最小二乘法的要求,可得求解 和和 的的公式如下:公式如下:01xynxnyxxyyxxssxxnyxxynxxy110222221)()()( 與與r r的關(guān)系的關(guān)系 r 0 r 0 r =0 0 0 =01111yxxySSrSSr11;【例】求不良貸款依賴于貸款余額的回歸方程回歸方程為:回歸系數(shù) =0.037895 表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元 1xy037895. 08295. 0估計方程的求法估計方程的求法(例題分析)不良貸款對貸款余額回歸方程的圖示不良貸款對貸款余額回歸方程的圖示不良貸款對貸款余額的回歸直線不良貸款對貸款余額的回歸直線

24、-2024681012140100200300400貸款余額不良貸款 確定回歸直線后,需要評價這一直線方程是否確定回歸直線后,需要評價這一直線方程是否有效地反映了這兩變量之間的關(guān)系。評價回歸方程有效地反映了這兩變量之間的關(guān)系。評價回歸方程配合好壞的主要指標(biāo)有是判定系數(shù)和估計標(biāo)準誤差。配合好壞的主要指標(biāo)有是判定系數(shù)和估計標(biāo)準誤差。 是相關(guān)系數(shù)的平方,用是相關(guān)系數(shù)的平方,用 表示,用來衡量表示,用來衡量回歸方程對回歸方程對y y的解釋程度。的解釋程度。2r102 r判定系數(shù)取值范圍:判定系數(shù)取值范圍:2r 越接近于越接近于1 1,表明,表明x x與與y y之間的相關(guān)性越強;之間的相關(guān)性越強; 越越

25、接近于接近于0,0,表明兩個變量之間幾乎沒有直線相關(guān)關(guān)系表明兩個變量之間幾乎沒有直線相關(guān)關(guān)系. .2r回歸直線的擬合程度回歸直線的擬合程度1.1.判定系數(shù)判定系數(shù)yy yy yyyy2)(yySST2) (yySSE2) (yySSR殘差平方和殘差平方和回歸回歸平方和平方和總離差平方和總離差平方和222)()()(yyyyyy總偏差總偏差 = = 回歸偏差回歸偏差 + + 剩余偏差剩余偏差 r r2 2表示全部偏差中有百分之幾的偏差可由表示全部偏差中有百分之幾的偏差可由x x與與y y的回歸的回歸關(guān)系來解釋關(guān)系來解釋222222)()(1)()(yyyyryyyyr或【例】計算不良貸款對貸款余

26、額回歸的判定系計算不良貸款對貸款余額回歸的判定系數(shù),并解釋其意義數(shù),并解釋其意義 表示在不良貸款取值的變差中,有表示在不良貸款取值的變差中,有71.16%71.16%可可以由不良貸款與貸款余額之間的線性關(guān)系來解釋以由不良貸款與貸款余額之間的線性關(guān)系來解釋,或者說,在不良貸款取值的變動中,有,或者說,在不良貸款取值的變動中,有71.16%71.16%是由貸款余額所決定的。也就是說,不良貸款取是由貸款余額所決定的。也就是說,不良貸款取值的差異有值的差異有2/32/3以上是由貸款余額決定的??梢娨陨鲜怯少J款余額決定的。可見不良貸款與貸款余額之間有較強的線性關(guān)系不良貸款與貸款余額之間有較強的線性關(guān)系

27、判定系數(shù)判定系數(shù)r r2 2的計算的計算( (例題分析例題分析) )判定系數(shù)與相關(guān)系數(shù)的區(qū)別判定系數(shù)與相關(guān)系數(shù)的區(qū)別1.1.判定系數(shù)無方向性,相關(guān)系數(shù)則有方向,判定系數(shù)無方向性,相關(guān)系數(shù)則有方向,其方向與樣本回歸系數(shù)相同;其方向與樣本回歸系數(shù)相同;2.2.判定系數(shù)說明變量值的總離差平方和中可判定系數(shù)說明變量值的總離差平方和中可以用回歸線來解釋的比例,相關(guān)系數(shù)只說以用回歸線來解釋的比例,相關(guān)系數(shù)只說明兩變量間關(guān)聯(lián)程度及方向;明兩變量間關(guān)聯(lián)程度及方向;3.3.相關(guān)系數(shù)有夸大變量間相關(guān)程度的傾向,相關(guān)系數(shù)有夸大變量間相關(guān)程度的傾向,因而判定系數(shù)是更好的度量值。因而判定系數(shù)是更好的度量值。實際觀察值與

28、回歸估計值離差平方和的均方根實際觀察值與回歸估計值離差平方和的均方根反映實際觀察值在回歸直線周圍的分散狀況反映實際觀察值在回歸直線周圍的分散狀況對誤差項對誤差項 的標(biāo)準差的標(biāo)準差 的估計,是在排除了的估計,是在排除了x x對對y y的線性影響后,的線性影響后,y y隨機波動大小的一個估計量隨機波動大小的一個估計量反映用估計的回歸方程預(yù)測反映用估計的回歸方程預(yù)測y y時預(yù)測誤差的大小時預(yù)測誤差的大小 計算公式為計算公式為2.2.估計標(biāo)準誤估計標(biāo)準誤注:前例題中不良貸款的估計標(biāo)準誤為注:前例題中不良貸款的估計標(biāo)準誤為1.97991.9799在簡單線性回歸中,等價于線性關(guān)系的顯著性檢驗在簡單線性回歸

29、中,等價于線性關(guān)系的顯著性檢驗檢驗檢驗 X X 與與 Y Y 之間是否具有線性關(guān)系,之間是否具有線性關(guān)系,或者說,檢驗自變量或者說,檢驗自變量 X X 對因變量對因變量 Y Y 的的影響是否顯著影響是否顯著理論基礎(chǔ)是回歸系數(shù)理論基礎(chǔ)是回歸系數(shù) 的抽樣分布的抽樣分布回歸系數(shù)的顯著性檢驗回歸系數(shù)的顯著性檢驗11.t1.t檢驗檢驗提出假設(shè)提出假設(shè): :確定檢驗統(tǒng)計量確定檢驗統(tǒng)計量: :給定顯著性水平給定顯著性水平,確定臨界值,確定臨界值: :確定原假設(shè)的拒絕規(guī)則確定原假設(shè)的拒絕規(guī)則: :計算檢驗統(tǒng)計量并做出決策。計算檢驗統(tǒng)計量并做出決策。2t22ntt0:;0:1110HH111stt t檢驗步驟檢

30、驗步驟t t檢驗檢驗( (例題分析例題分析) )對例題的回歸系數(shù)進行顯著性檢驗對例題的回歸系數(shù)進行顯著性檢驗( ( 0.05)0.05)1.1. 提出假設(shè)提出假設(shè)H H0 0:1 1 = 0 = 0 H H1 1:1 1 0 0 2.2. 計算檢驗的統(tǒng)計量計算檢驗的統(tǒng)計量t t=7.533515=7.533515t t=2.201=2.201,拒絕,拒絕H H0 0,表明,表明不良貸不良貸款與貸款余額之間有線性關(guān)系款與貸款余額之間有線性關(guān)系學(xué)學(xué)生生身高身高體體重重估計值估計值A(chǔ)BCDEFGHIJ15816016216416616817017217417647504855626052617065

31、24964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71-9.71-7.55-5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-541381670 570 279220 3303295546-002x2yxyy yy yy xy542TSS38

32、4RSS158ESS444.4eS41. 4t0788.1131. 2)210()2(025. 02tnt拒絕原假設(shè),接受備擇假設(shè)。即可以認為拒絕原假設(shè),接受備擇假設(shè)。即可以認為 B B1 1明顯地明顯地不等于零,不等于零,X X 與與 Y Y 存在顯著的線性關(guān)系。存在顯著的線性關(guān)系。2.F2.F檢驗檢驗檢驗自變量與因變量之間的線性關(guān)系檢驗自變量與因變量之間的線性關(guān)系是否顯著是否顯著將回歸均方將回歸均方( (MSRMSR) )同殘差均方同殘差均方( (MSEMSE) )加加以比較,應(yīng)用以比較,應(yīng)用F F 檢驗來分析二者之間檢驗來分析二者之間的差別是否顯著的差別是否顯著回歸均方:回歸平方和SSR

33、除以相應(yīng)的自由度(自變量的個數(shù)p) 殘差均方:殘差平方和SSE除以相應(yīng)的自由度(n-p-1)1.1. 提出假設(shè)提出假設(shè)H H0 0: 1 1=0 =0 線性關(guān)系不顯著線性關(guān)系不顯著2. 2. 計算計算檢驗統(tǒng)計量檢驗統(tǒng)計量F F3.3. 確定確定顯著性水平顯著性水平 ,并根據(jù)分子自由度,并根據(jù)分子自由度1 1和分母和分母自由度自由度n n-2-2找出找出臨界值臨界值F F 4.4. 作作出決策:若出決策:若F F F F , ,拒絕拒絕H H0 0;若若F F F F , ,拒絕拒絕H H0 0,線性關(guān)系顯著,線性關(guān)系顯著F F檢驗檢驗檢驗檢驗( (例題分析例題分析) ) 線性關(guān)系的檢驗線性關(guān)系

34、的檢驗( (方差分析表方差分析表) ) Excel Excel 輸出的方差分析表輸出的方差分析表利用回歸方程進行估計與預(yù)測利用回歸方程進行估計與預(yù)測預(yù)測的前提:預(yù)測的前提:回歸方程經(jīng)過檢驗,證明回歸方程經(jīng)過檢驗,證明 X X 和和 Y Y 的關(guān)系在統(tǒng)計上是顯著相關(guān)的。的關(guān)系在統(tǒng)計上是顯著相關(guān)的。對于給定的對于給定的 X X 值,求出值,求出 Y Y 平均值的一個平均值的一個估計值或估計值或 Y Y 的一個個別值的預(yù)測值。的一個個別值的預(yù)測值。對于給定的對于給定的 X X 值,求出值,求出 Y Y 的平均值的置的平均值的置信區(qū)間或信區(qū)間或 Y Y 的一個個別值的預(yù)測區(qū)間。的一個個別值的預(yù)測區(qū)間。

35、點預(yù)測點預(yù)測區(qū)間預(yù)測區(qū)間預(yù)測2. 2. 點估計值有點估計值有ny y 的平均值的點估計的平均值的點估計ny y 的個別值的點估計的個別值的點估計3.3. 在點估計條件下,平均值的點估計和個別值的點在點估計條件下,平均值的點估計和個別值的點估計是一樣的,但在區(qū)間估計中則不同估計是一樣的,但在區(qū)間估計中則不同1.1. 對于對于自變量自變量 x x 的一個給定值的一個給定值x x0 0 ,根據(jù)回歸方,根據(jù)回歸方程得到因變量程得到因變量 y y 的一個估計值的一個估計值點估計點估計yx0 x若若 x = 169x = 169,則:,則:Yy16.591690788.11596.123xy0788.11

36、596.123點估計點估計xy101.1. 點估計不能給出估計的精度,點估計值與點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)實際值之間是有誤差的,因此需要進行區(qū)間估計間估計2.2. 對于自變量對于自變量 x x 的一個給定值的一個給定值 x x0 0,根據(jù)回,根據(jù)回歸方程得到因變量歸方程得到因變量 y y 的一個估計區(qū)間的一個估計區(qū)間3.3. 區(qū)間估計有兩種類型區(qū)間估計有兩種類型置信區(qū)間估計置信區(qū)間估計預(yù)測區(qū)間估計預(yù)測區(qū)間估計區(qū)間估計區(qū)間估計yx0 x對于給定的對于給定的 x = xx = x0 0 ,Y Y 的的1-1- 置信區(qū)間為置信區(qū)間為yty20自由度為自由

37、度為n-2n-2的的 t t 分布值分布值Y Y 的平均值的置信區(qū)間估計的平均值的置信區(qū)間估計xy10nxxxxniiy2220)()(1學(xué)學(xué)生生身高身高體體重重估計值估計值A(chǔ)BCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.

38、7655.9258.0860.2462.3964.5566.71-9.71-7.55-5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-541381670570279220 3303295546-002xxy2yxyy yy yy xy0788.11596.123444. 4eS若令若令 =0.05=0.05,則有,則有 t t /2/2(n n-2-2) = 2.31= 2.31257.60,743.5341. 131. 257571670788. 11596.12341. 1101444. 4101670279220)167167(101444.

39、4:16720022yytyyx當(dāng)當(dāng) 時,時, 得到得到最小值。當(dāng)最小值。當(dāng) 時,時, 的值隨的值隨 的減少或增的減少或增加而逐步增大。加而逐步增大。xx y xx y xx 對于給定的對于給定的 X X = = X X0 0,如果要預(yù)測,如果要預(yù)測Y Y 的一的一個個別值個個別值 Y Y0 0 的置信區(qū)間,則其相應(yīng)的殘差為:的置信區(qū)間,則其相應(yīng)的殘差為: Y Y 的個別值相對的個別值相對于其平均值的方差于其平均值的方差當(dāng)當(dāng)X X = =X X0 0時,時,所估計的所估計的Y Y0 0 的方差組成的方差組成 與其平均與其平均值的方差值的方差22 y000YY Y Y 的個別值的置信區(qū)間估計的個

40、別值的置信區(qū)間估計即:即:Y Y0 0的方差為:的方差為:即:即:則:則:Y Y 的一個個別值的一個個別值 Y Y0 0 的標(biāo)準差的估計值為:的標(biāo)準差的估計值為:nxxxxniiy2220222)()(10nxxxxniiy222022)()(110nxxxxnSiiey2220)()(110 對于給定的對于給定的X X0 0 ,Y Y 的一個個別值的一個個別值Y Y0 0 的的預(yù)測區(qū)間估計值為:預(yù)測區(qū)間估計值為:020yty也就是:也就是:nxxxxnStyiie222020)()(11與估計與估計Y Y的平均值公式相比,此的平均值公式相比,此公式中多了一項公式中多了一項“1”1”,因此,因

41、此,這個置信區(qū)間要相對大一些這個置信區(qū)間要相對大一些學(xué)學(xué)生生身高身高體體重重估計值估計值A(chǔ)BCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71-9.71-7.55-

42、5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-541381670570279220 3303295546-002xxy2yxyy yy yy xy0788.11596.123444. 4eS若令若令 =0.05,則有,則有 t /2(n-2) = 2.31767.67,233.46661. 431. 257571670788. 11596.123661. 41011444. 4101670279220)167167(1011444. 4:1670020022yytyyx當(dāng)當(dāng) 時,時, 得到最小得到最小值。當(dāng)值。當(dāng) 時,時, 的值的值隨隨 的減少或增

43、加而逐步的減少或增加而逐步增大。增大。xx 0yxx 0yx 相關(guān)分析與回歸分析的聯(lián)系相關(guān)分析與回歸分析的聯(lián)系共同的研究對象:都是對變量間相關(guān)關(guān)系的分析共同的研究對象:都是對變量間相關(guān)關(guān)系的分析. .理論和方法具有一致性理論和方法具有一致性. .只有當(dāng)變量間存在相關(guān)關(guān)系時,用回歸分析去尋只有當(dāng)變量間存在相關(guān)關(guān)系時,用回歸分析去尋求相關(guān)的具體數(shù)學(xué)形式才有實際意義求相關(guān)的具體數(shù)學(xué)形式才有實際意義. .無相關(guān)就無相關(guān)就無回歸,相關(guān)程度越高,回歸越好無回歸,相關(guān)程度越高,回歸越好. .相關(guān)分析只表明變量間相關(guān)關(guān)系的性質(zhì)和程度,相關(guān)分析只表明變量間相關(guān)關(guān)系的性質(zhì)和程度,要確定變量間相關(guān)的具體數(shù)學(xué)形式依賴

44、于回歸分要確定變量間相關(guān)的具體數(shù)學(xué)形式依賴于回歸分析析相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算. .相關(guān)分析中相關(guān)分析中x x與與y y對等,回歸分析中對等,回歸分析中x x與與y y要確定自變量和因變量;要確定自變量和因變量;相關(guān)分析中相關(guān)分析中x x、y y均為隨機變量,回歸分均為隨機變量,回歸分析中只有析中只有y y為隨機變量;為隨機變量;相關(guān)分析測定相關(guān)程度和方向,回歸分相關(guān)分析測定相關(guān)程度和方向,回歸分析用回歸模型進行預(yù)測和控制。析用回歸模型進行預(yù)測和控制?;貧w分析與相關(guān)分析的區(qū)別回歸分析與相關(guān)分析的區(qū)別應(yīng)用相關(guān)與回歸分析應(yīng)注意的問題應(yīng)用相關(guān)與

45、回歸分析應(yīng)注意的問題 1 1變量間是否存在相關(guān)變量間是否存在相關(guān)2 2其余變量盡量保持一致其余變量盡量保持一致 3 3觀測值要盡可能的多觀測值要盡可能的多 4 4外推要謹慎外推要謹慎 5 5正確理解相關(guān)或回歸顯著與否正確理解相關(guān)或回歸顯著與否的含義的含義 (一)相關(guān)圖的繪制(一)相關(guān)圖的繪制(二)相關(guān)系數(shù)的計算(二)相關(guān)系數(shù)的計算(三)回歸分析宏的應(yīng)用(三)回歸分析宏的應(yīng)用(四)回歸系數(shù)的檢驗(四)回歸系數(shù)的檢驗 21歲以下者所占比例(%)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)21歲以下者所占比例(%)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)21歲以下者所占比例(%)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)21歲以下者所占比例

46、(%)每千個駕駛執(zhí)照中發(fā)生車禍次數(shù)132.962162.80182.190183.614120.708121.405163.623101.92680.88591.433152.623141.643121.652100.03990.835162.943112.09190.33880.820121.913172.627111.849142.890152.814183.830122.24681.267132.63480.368142.885153.22490.926131.142142.352101.014173.25680.645111.294100.49391.082174.100141.443【案例【案例】:發(fā)生車禍次數(shù)與司機年齡有關(guān)嗎?:發(fā)生車禍次數(shù)與司機年齡有關(guān)嗎?(一)制作相關(guān)圖(一)制作相關(guān)圖 第一步,將上例數(shù)據(jù)輸入第一步,將上例數(shù)據(jù)輸入ExcelExcel數(shù)據(jù)表的數(shù)據(jù)表的A1:B43A1:B43區(qū)域,并選定區(qū)域,并選定第二步

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論