計(jì)量經(jīng)濟(jì)學(xué)--高(2)_第1頁
計(jì)量經(jīng)濟(jì)學(xué)--高(2)_第2頁
計(jì)量經(jīng)濟(jì)學(xué)--高(2)_第3頁
計(jì)量經(jīng)濟(jì)學(xué)--高(2)_第4頁
計(jì)量經(jīng)濟(jì)學(xué)--高(2)_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第第2講講 2.1變量間關(guān)系的度量變量間關(guān)系的度量2.2一元線性回歸一元線性回歸2.3殘差分析殘差分析2.4利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)2.1 變量間關(guān)系的度量變量間關(guān)系的度量1.變量間關(guān)系變量間關(guān)系2.相關(guān)關(guān)系的描述與測(cè)度相關(guān)關(guān)系的描述與測(cè)度3.相關(guān)關(guān)系的顯著性檢驗(yàn)相關(guān)關(guān)系的顯著性檢驗(yàn)1.變量間關(guān)系變量間關(guān)系函數(shù)關(guān)系函數(shù)關(guān)系是一一是一一對(duì)應(yīng)的確定關(guān)系對(duì)應(yīng)的確定關(guān)系設(shè)設(shè)有兩個(gè)變量有兩個(gè)變量 x 和和 y ,變量,變量 y 隨變量隨變量 x 一起變化,并一起變化,并完全依完全依賴于賴于 x ,當(dāng)變量,當(dāng)變量 x 取某個(gè)數(shù)值取某個(gè)數(shù)值時(shí),時(shí), y 依確定的關(guān)系取相應(yīng)的依確

2、定的關(guān)系取相應(yīng)的值,則稱值,則稱 y 是是 x 的函數(shù),記為的函數(shù),記為 y = f (x),其中,其中 x 稱為自變量,稱為自變量,y 稱為因變量稱為因變量各各觀測(cè)點(diǎn)落在一條線上觀測(cè)點(diǎn)落在一條線上 函數(shù)關(guān)系函數(shù)關(guān)系(幾個(gè)例子幾個(gè)例子)函數(shù)關(guān)系的例子函數(shù)關(guān)系的例子某種商品的銷售額某種商品的銷售額y與銷售量與銷售量x之間的關(guān)系可表之間的關(guān)系可表示為示為 y = px (p 為單價(jià)為單價(jià))圓的面積圓的面積S與半徑之間的關(guān)系可表示為與半徑之間的關(guān)系可表示為S= R2 企業(yè)的原材料消耗額企業(yè)的原材料消耗額y與產(chǎn)量與產(chǎn)量x1 、單位產(chǎn)量消、單位產(chǎn)量消耗耗x2 、原材料價(jià)格、原材料價(jià)格x3之間的關(guān)系可表示

3、為之間的關(guān)系可表示為 y = x1 x2 x3 2) 相關(guān)關(guān)系相關(guān)關(guān)系(correlation)變量間關(guān)系不能用函數(shù)關(guān)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量的取值不能由另一個(gè)變量唯一確定一個(gè)變量唯一確定當(dāng)變量當(dāng)變量 x 取某個(gè)值時(shí),變?nèi)∧硞€(gè)值時(shí),變量量 y 的取值可能有幾個(gè)的取值可能有幾個(gè)各觀測(cè)各觀測(cè)點(diǎn)分布在直線周圍點(diǎn)分布在直線周圍 相關(guān)關(guān)系相關(guān)關(guān)系(幾個(gè)例子幾個(gè)例子) 相關(guān)關(guān)系的例子相關(guān)關(guān)系的例子父親身高父親身高y與子女身高與子女身高x之間的關(guān)系之間的關(guān)系收入水平收入水平y(tǒng)與受教育程度與受教育程度x之間的關(guān)系之間的關(guān)系糧食畝產(chǎn)量糧食畝產(chǎn)量y與施肥量與施肥量x

4、1 、降雨量、降雨量x2 、溫度、溫度x3之間的關(guān)系之間的關(guān)系商品的消費(fèi)量商品的消費(fèi)量y與居民收入與居民收入x之間的關(guān)系之間的關(guān)系商品銷售額商品銷售額y與廣告費(fèi)支出與廣告費(fèi)支出x之間的關(guān)系之間的關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系(類型類型)正正 相相 關(guān)關(guān) 負(fù)負(fù) 相相 關(guān)關(guān)線線 性性 相相 關(guān)關(guān) 非非 線線 性性 相相 關(guān)關(guān)正正 相相 關(guān)關(guān) 負(fù)負(fù) 相相 關(guān)關(guān)完完 全全 相相 關(guān)關(guān) 不不 相相 關(guān)關(guān)相相 關(guān)關(guān) 關(guān)關(guān) 系系2.相關(guān)關(guān)系的描述與測(cè)度相關(guān)關(guān)系的描述與測(cè)度1)散點(diǎn)圖(scatter diagram)散點(diǎn)圖散點(diǎn)圖(例題分析例題分析) 【例例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建

5、設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù) 散點(diǎn)圖散點(diǎn)圖(例題分析) 不良貸款與貸款余額的散點(diǎn)圖不良貸款與貸款余額的散點(diǎn)圖024681012140100200300400貸款余額不良貸款 不良貸款與累計(jì)應(yīng)收貸款不良貸款與累計(jì)應(yīng)收貸款的散點(diǎn)圖的散點(diǎn)圖02468101214051015202530累計(jì)應(yīng)收貸款不良貸款 不良貸款與貸款項(xiàng)目個(gè)數(shù) 不良貸款與

6、貸款項(xiàng)目個(gè)數(shù)的散點(diǎn)圖的散點(diǎn)圖0 02 24 46 68 81010121214140 020204040貸款項(xiàng)目個(gè)數(shù)貸款項(xiàng)目個(gè)數(shù)不良貸款不良貸款 不良貸款與固定資產(chǎn)投資額不良貸款與固定資產(chǎn)投資額的散點(diǎn)圖的散點(diǎn)圖02468101214050100150200固定資產(chǎn)投資額不良貸款2)相關(guān)系數(shù)相關(guān)系數(shù)(correlation coefficient)1.概念:概念:對(duì)變量之間關(guān)系密切程度的度量對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)簡(jiǎn)單相關(guān)系數(shù)若相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)

7、系數(shù),記為稱為總體相關(guān)系數(shù),記為 若若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為關(guān)系數(shù),記為 r2.相關(guān)系數(shù)的計(jì)算公式相關(guān)系數(shù)的計(jì)算公式 樣本相關(guān)系數(shù)的計(jì)算公式22)()()(yyxxyyxxr2222 yynxxnyxxynr3)相關(guān)系數(shù)取值及其意義)相關(guān)系數(shù)取值及其意義 r 的取值范圍的取值范圍是是 -1,1 |r|=1,為完全相關(guān)為完全相關(guān)nr =1,為完全正相關(guān),為完全正相關(guān)nr =-1,為完全負(fù)正相關(guān),為完全負(fù)正相關(guān) r = 0,不存在不存在線性線性相關(guān)關(guān)系相關(guān)關(guān)系 -1 r0,為負(fù)相關(guān)為負(fù)相關(guān) 0t,拒絕,拒絕H0 若若tt,不能拒絕,不能拒絕

8、H0相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)(例題分析) 對(duì)不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行對(duì)不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢顯著性檢(0.05)1.假設(shè):假設(shè):H0: ;H1: 02.計(jì)算計(jì)算檢驗(yàn)的統(tǒng)計(jì)量檢驗(yàn)的統(tǒng)計(jì)量5344. 78436. 012258436. 02t(例題分析)各相關(guān)系數(shù)檢驗(yàn)的統(tǒng)計(jì)量各相關(guān)系數(shù)檢驗(yàn)的統(tǒng)計(jì)量 回歸模型、回歸方程、估計(jì)的回歸方程回歸模型、回歸方程、估計(jì)的回歸方程 判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差 線性關(guān)系的檢驗(yàn)、回歸系數(shù)的檢驗(yàn)線性關(guān)系的檢驗(yàn)、回歸系數(shù)的檢驗(yàn)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)

9、關(guān)系式系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度出這種預(yù)測(cè)或控制的精確程度相關(guān)分析中,變量相關(guān)分析中,變量 x x 變量變量 y y 處于處于平等平等的地位;回歸的地位;回歸分析中,變量分析中,變量 y y 稱為因變量,處在稱為因變量,處在

10、被解釋被解釋的地位,的地位,x x 稱為自變量,用于預(yù)測(cè)稱為自變量,用于預(yù)測(cè)因變量因變量的變化的變化相關(guān)分析中所涉及的變量相關(guān)分析中所涉及的變量 x x 和和 y y 都是隨機(jī)變量;回都是隨機(jī)變量;回歸分析中,因變量歸分析中,因變量 y y 是隨機(jī)變量是隨機(jī)變量,自變量,自變量 x x 可以是可以是隨機(jī)變量,也可以隨機(jī)變量,也可以是非隨機(jī)的確定是非隨機(jī)的確定變量變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量度;回歸分析不僅可以揭示變量 x x 對(duì)變量對(duì)變量 y y 的影響的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制大小

11、,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制線線 性性 回回 歸歸非非 線線 性性 回回 歸歸一一 元元 回回 歸歸線線 性性 回回 歸歸非非 線線 性性 回回 歸歸多多 元元 回回 歸歸回回 歸歸 模模 型型涉及一個(gè)自變量的回歸因變量y與自變量x之間為線性關(guān)系n被 預(yù) 測(cè) 或 被 解 釋 的 變 量 稱 為 因 變 量(dependent variable),用y表示n用來預(yù)測(cè)或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independent variable),用x表示 因變量與自變量之間的關(guān)系用一個(gè)線性方程來表示描述因變量 y 如何依賴于自變量 x 和誤差項(xiàng) 的方程稱為一元線性回歸模型可表示為 y

12、= b b + + b b1 1 x + + ny 是 x 的線性函數(shù)(部分)加上誤差項(xiàng)n線性部分反映了由于 x 的變化而引起的 y 的變化n誤差項(xiàng) 是隨機(jī)變量w反映了除 x 和 y 之間的線性關(guān)系之外的隨機(jī)因素對(duì) y 的影響w是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性nb0 和 b1 稱為模型的參數(shù)理論回歸模型一元線性回歸模型一元線性回歸模型基本假定基本假定因變量因變量y與自變量與自變量x具有線性關(guān)系具有線性關(guān)系自變量自變量x 取值取值,y 是隨機(jī)變量是隨機(jī)變量誤差誤差項(xiàng)項(xiàng)是一個(gè)期望值為是一個(gè)期望值為0的隨機(jī)變量,即的隨機(jī)變量,即E()=0。對(duì)于一個(gè)給定的對(duì)于一個(gè)給定的 x 值,值,

13、y 的期望值為的期望值為 E ( y ) =b b 0+ b b 1 x對(duì)對(duì)于所有的于所有的 x 值,值,的方差的方差2 都相同都相同誤差誤差項(xiàng)項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即獨(dú)立。即N( 0 ,2 )n獨(dú)立性意味著對(duì)于一個(gè)特定的獨(dú)立性意味著對(duì)于一個(gè)特定的 x 值,它所對(duì)應(yīng)的值,它所對(duì)應(yīng)的與與其他其他 x 值所對(duì)應(yīng)的值所對(duì)應(yīng)的不相關(guān)不相關(guān)2.回歸方程回歸方程(regression equation)描描述述 y 的的平均值或期望值平均值或期望值如何依賴于如何依賴于 x 的方的方程稱為程稱為回歸方程回歸方程一元一元線性回歸方程的形式如下線性回歸方

14、程的形式如下 E( y ) = b b0+ b b1 x方程的圖示是一條直線,也稱為直線回歸方程方程的圖示是一條直線,也稱為直線回歸方程b b0是回歸直線在是回歸直線在 y 軸上的截距,是當(dāng)軸上的截距,是當(dāng) x=0 時(shí)時(shí) y 的期的期望值望值b b1是直線的斜率,稱為回歸系數(shù),表示當(dāng)是直線的斜率,稱為回歸系數(shù),表示當(dāng) x 每變動(dòng)每變動(dòng)一個(gè)單位時(shí),一個(gè)單位時(shí),y 的平均變動(dòng)值的平均變動(dòng)值3.估計(jì)的回歸方程估計(jì)的回歸方程(estimated regression equation)P365用用樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量 和和 代替回歸方程中的未知參代替回歸方程中的未知參數(shù)數(shù) 和和 ,就得到了,就得到了估

15、計(jì)的回歸方程估計(jì)的回歸方程0b1b0b1b總體總體回歸參數(shù)回歸參數(shù) 和和 是是 未知的,必須利用樣本數(shù)未知的,必須利用樣本數(shù)據(jù)去估計(jì)據(jù)去估計(jì)0b1bxy10bb+其中:其中: 是估計(jì)的回歸直線在是估計(jì)的回歸直線在 y 軸上的截距,軸上的截距, 是直線是直線的斜率,它表示對(duì)于一個(gè)給定的的斜率,它表示對(duì)于一個(gè)給定的 x 的值,的值, 是是 y 的估的估計(jì)值,也表示計(jì)值,也表示 x 每變動(dòng)一個(gè)單位時(shí),每變動(dòng)一個(gè)單位時(shí), y 的平均變動(dòng)值的平均變動(dòng)值 0b1by 2.2.參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)最小值niiiniixyyy121012)()(bb使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到

16、最小來求得 和 的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小0b1b最小二乘估計(jì)的圖示 xy10bb+最小二乘法 ( 和 的計(jì)算公式)xyxxnyxyxnniniiiniiniiniii1012121111bbb1b0b0b1b0)(20)(212101121001100niiiiniiixyxQxyQbbbbbbbbbb 和和 的計(jì)算公式的計(jì)算公式xyxxnyxyxnniniiiniiniiniii1012121111bbb1b0b0b1b估計(jì)方程的求法估計(jì)方程的求法(例題分析例題分析)【例例】求不良貸款對(duì)貸款余額的回歸方程8295. 0268.1

17、20037895. 0728. 3037895. 07 .300637.516543252 .937 .300614.1708025021bb回歸系數(shù)回歸系數(shù) =0.037895 表示,貸款余額每增加表示,貸款余額每增加1億元,不良貸款平均增加億元,不良貸款平均增加0.037895億元億元 1b估計(jì)方程的求法(例題分析)不良貸款對(duì)貸款余額回歸方程的圖示不良貸款對(duì)貸款余額的回歸直線不良貸款對(duì)貸款余額的回歸直線-2024681012140100200300400貸款余額不良貸款用用Excel進(jìn)行回歸分析進(jìn)行回歸分析第第1步:步:選擇“工具工具”下拉菜單第第2步:步:選擇“數(shù)據(jù)分析數(shù)據(jù)分析”選項(xiàng)第第

18、3步:步:在分析工具中選擇“回歸回歸”,然后選擇“確定確定”第第4步:步:當(dāng)對(duì)話框出現(xiàn)時(shí) 在“Y值輸入?yún)^(qū)域值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域 在“X值輸入?yún)^(qū)域值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域 在“置信度置信度”選項(xiàng)中給出所需的數(shù)值 在“輸出選項(xiàng)輸出選項(xiàng)”中選擇輸出區(qū)域 在“殘差殘差”分析選項(xiàng)中選擇所需的選項(xiàng)(1)變差因變量 y 的取值是不同的,y 取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面n由于自變量 x 的取值不同造成的n除 x 以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值具體的觀測(cè)值來說,變差的大小可以通過該實(shí)際觀測(cè)值與其均值之差實(shí)際觀測(cè)值與其均值之差

19、來表示。yy(2)變差的分解變差的分解(圖示圖示)xy10bb+yyyyyy),(iiyxy+niiniiniiyyyyyy1212121.總平方和總平方和(SST)n反映因變量的 n 個(gè)觀察值與其均值的總離差2.回歸平方和回歸平方和(SSR) (SSR:sum of squares for regression)n反映自變量 x 的變化對(duì)因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和3.殘差平方和殘差平方和(SSE)n反映除 x 以外的其他因素對(duì) y 取值的影響,也稱為不可解釋的平方和或剩余平方和(4) 三個(gè)平方和的意義三個(gè)

20、平方和的意義(5)判定系數(shù)判定系數(shù)r2 (coefficient of determination)回歸平方和占總離差平方和的比例n1i2in1i2in1i2in1i2i2yy y y1yyyy SSTSSRR反映回歸直線的擬合程度反映回歸直線的擬合程度取值范圍在取值范圍在 0 , 1 之間之間 R2 1,說明回歸方程擬合的越好;,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差說明回歸方程擬合的越差判定判定系數(shù)等于相關(guān)系數(shù)的平方,即系數(shù)等于相關(guān)系數(shù)的平方,即R2r2 聯(lián)系:數(shù)值上判定(可決)系數(shù)是相關(guān)系數(shù)的平方 區(qū)別: 判定系數(shù) 相關(guān)系數(shù) 就模型而言就模型而言 就兩個(gè)變量而言就兩個(gè)變量

21、而言 說明解釋變量對(duì)因變說明解釋變量對(duì)因變 說明兩變量線性依存程度說明兩變量線性依存程度 量的解釋程度量的解釋程度 取值 有非負(fù)性 取值 -1r1 可正可負(fù)201r【例例】計(jì)算不良貸款對(duì)貸款余額回歸的判定系數(shù),并解釋其意義 判定系數(shù)的實(shí)際意義是判定系數(shù)的實(shí)際意義是:在不良貸款取值的變差中,有71.16%可以由不良貸款與貸款余額之間的線性關(guān)系來可以由不良貸款與貸款余額之間的線性關(guān)系來解釋解釋,或者說,在不良貸款取值的變動(dòng)中,有71.16%是由貸款余額所決定的。也就是說,不良貸款取值的差異有2/3以上是由貸款余額決定的??梢姴涣假J款與貸款余額之間有較強(qiáng)的線性關(guān)系 %16.717116. 06504

22、.3124860.2222SSTSSRR(standard error of estimate)實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根對(duì)對(duì)誤差項(xiàng)誤差項(xiàng) 的標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差 的估計(jì),是在排除了的估計(jì),是在排除了x對(duì)對(duì)y的線的線性影響后,性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量反反映用估計(jì)的回歸方程預(yù)測(cè)映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小時(shí)預(yù)測(cè)誤差的大小 計(jì)算公式為計(jì)算公式為MSEnSSEnyysniiiy2212將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應(yīng)

23、的自由度(自變量的個(gè)數(shù)p) 殘差均方(MSE) :殘差平方和SSE除以相應(yīng)的自由度(n-p-1)(注:P為字變量個(gè))線性關(guān)系的檢驗(yàn)的步驟線性關(guān)系的檢驗(yàn)的步驟 提出假設(shè)nH0:b1=0 線性關(guān)系不顯著)2,1 (21nFMSEMSRnSSESSRF(以前面資料以前面資料)提出假設(shè)nH0: b1=0 不良貸款與貸款余額之間的線性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F753844.56225164421.90148598.22221nSSESSRFExcel 輸出的方差分析表輸出的方差分析表(3)在一元線性回歸中,等價(jià)于線性關(guān)系的在一元線性回歸中,等價(jià)于線性關(guān)系的顯著性檢驗(yàn)顯著性檢驗(yàn)(1)檢驗(yàn)檢驗(yàn) x 與與 y

24、 之間是否具有線性關(guān)系,或之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量者說,檢驗(yàn)自變量 x 對(duì)因變量對(duì)因變量 y 的影響的影響是否顯著是否顯著(2)理論基礎(chǔ)是回歸系數(shù)理論基礎(chǔ)是回歸系數(shù) 的抽樣分布的抽樣分布1b樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量 的分布的分布 是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布己的分布 的的分布具有如下性質(zhì)分布具有如下性質(zhì)分布形式:正態(tài)分布分布形式:正態(tài)分布數(shù)學(xué)期望:數(shù)學(xué)期望:標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差:由于由于 未知,需用其估計(jì)量未知,需用其估計(jì)量s sy y來代替得到來代替得到 的估計(jì)的的估計(jì)的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差1b1b1b11)(bbE21xxib1b2

25、1xxssieb11)(bbE21xxssieb回歸系數(shù)的檢驗(yàn)檢驗(yàn)步驟回歸系數(shù)的檢驗(yàn)檢驗(yàn)步驟 提出假設(shè)nH0: b1 = 0 (沒有線性關(guān)系) nH1: b1 0 (有線性關(guān)系) 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量) 2(11ntstbb對(duì)例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(0.05)提出假設(shè)nH0:b1 = 0 nH1:b1 0 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量533515. 7005030. 0037895. 0tP 值的應(yīng)用值的應(yīng)用在一元線性回歸分析中,回歸系數(shù)顯著在一元線性回歸分析中,回歸系數(shù)顯著性的性的t檢驗(yàn)、回歸方程顯著性的檢驗(yàn)、回歸方程顯著性的F檢驗(yàn),檢驗(yàn),相關(guān)系數(shù)顯著性相關(guān)系數(shù)顯著性 t檢驗(yàn),三者等價(jià)的,檢驗(yàn),三者等

26、價(jià)的,檢驗(yàn)結(jié)果是完全一致的。檢驗(yàn)結(jié)果是完全一致的。對(duì)一元線性回歸,只做其中對(duì)一元線性回歸,只做其中 的一種檢驗(yàn)即可。的一種檢驗(yàn)即可。l建立的模型是否合適?或者說,這個(gè)擬合的模型有多建立的模型是否合適?或者說,這個(gè)擬合的模型有多“好好”?要回答這些問題,可以從以下幾個(gè)方面入手?要回答這些問題,可以從以下幾個(gè)方面入手所估計(jì)的回歸系數(shù)所估計(jì)的回歸系數(shù) 的符號(hào)是否與理論或事先預(yù)期相的符號(hào)是否與理論或事先預(yù)期相一致一致n在不良貸款與貸款余額的回歸中,可以預(yù)期貸款余額越多在不良貸款與貸款余額的回歸中,可以預(yù)期貸款余額越多不良貸款也可能會(huì)越多,也就是說,回歸系數(shù)的值應(yīng)該是不良貸款也可能會(huì)越多,也就是說,回歸

27、系數(shù)的值應(yīng)該是正的,在上面建立的回歸方程中,我們得到的回歸系數(shù)正的,在上面建立的回歸方程中,我們得到的回歸系數(shù) 為正值為正值如果理論上認(rèn)為如果理論上認(rèn)為x與與y之間的關(guān)系不僅是正的,而且是之間的關(guān)系不僅是正的,而且是統(tǒng)計(jì)上顯著的,那么所建立的回歸方程也應(yīng)該如此統(tǒng)計(jì)上顯著的,那么所建立的回歸方程也應(yīng)該如此n在不良貸款與貸款余額的回歸中,二者之間為正的線性關(guān)在不良貸款與貸款余額的回歸中,二者之間為正的線性關(guān)系,而且,對(duì)回歸系數(shù)的系,而且,對(duì)回歸系數(shù)的t檢驗(yàn)結(jié)果表明二者之間的線性關(guān)檢驗(yàn)結(jié)果表明二者之間的線性關(guān)系是統(tǒng)計(jì)上顯著的系是統(tǒng)計(jì)上顯著的1b037895. 01b回歸模型在多大程度上解釋了因變量回

28、歸模型在多大程度上解釋了因變量y取值的取值的差異?可以用判定系數(shù)差異?可以用判定系數(shù)R2來回答這一問題來回答這一問題n在不良貸款與貸款余額的回歸中,得到的在不良貸款與貸款余額的回歸中,得到的R2=71.16%,解釋了不良貸款變差的,解釋了不良貸款變差的2/3以以上,說明擬合的效果還算不錯(cuò)上,說明擬合的效果還算不錯(cuò)考察關(guān)于誤差項(xiàng)考察關(guān)于誤差項(xiàng) 的正態(tài)性假定是否成立。因的正態(tài)性假定是否成立。因?yàn)槲覀冊(cè)趯?duì)線性關(guān)系進(jìn)行為我們?cè)趯?duì)線性關(guān)系進(jìn)行 檢驗(yàn)和回歸系數(shù)進(jìn)檢驗(yàn)和回歸系數(shù)進(jìn)行行時(shí),都要求誤差項(xiàng)時(shí),都要求誤差項(xiàng) 服從正態(tài)分布,服從正態(tài)分布,否則,我們所用的檢驗(yàn)程序?qū)⑹菬o效的。否則,我們所用的檢驗(yàn)程序?qū)⑹?/p>

29、無效的。 正正態(tài)性的簡(jiǎn)單方法是畫出殘差的直方圖或正態(tài)態(tài)性的簡(jiǎn)單方法是畫出殘差的直方圖或正態(tài)概率圖概率圖Excel輸出的部分回歸結(jié)果輸出的部分回歸結(jié)果R2)3 殘差分析殘差分析1 用殘差證實(shí)模型的假定用殘差證實(shí)模型的假定2 用殘差檢測(cè)異常值和有影響的觀測(cè)用殘差檢測(cè)異常值和有影響的觀測(cè)值值殘差圖殘差圖(residual plot)表示殘差的圖形表示殘差的圖形n關(guān)于關(guān)于x的殘差圖的殘差圖n關(guān)于關(guān)于y的殘差圖的殘差圖n標(biāo)準(zhǔn)化殘差圖標(biāo)準(zhǔn)化殘差圖用于判斷誤差用于判斷誤差 的假定是否成立的假定是否成立 檢測(cè)有影響的觀測(cè)值檢測(cè)有影響的觀測(cè)值殘差圖殘差圖(形態(tài)及判別形態(tài)及判別)殘差圖殘差圖(例題分析例題分析)不

30、良貸款對(duì)貸款余額回歸的殘差圖不良貸款對(duì)貸款余額回歸的殘差圖-4-2024680100200300400貸款余額(x)殘差標(biāo)準(zhǔn)化殘差標(biāo)準(zhǔn)化殘差(standardized residual) 殘差除以它的標(biāo)準(zhǔn)差后得到的數(shù)值。計(jì)算公式為n sei是第i個(gè)殘差的標(biāo)準(zhǔn)差,其計(jì)算公式為 iiieiieiesyysez+22)()(111xxxxnshssiiyiyei標(biāo)準(zhǔn)化殘差圖標(biāo)準(zhǔn)化殘差圖 用以直觀地判斷誤差項(xiàng)服從正態(tài)分布用以直觀地判斷誤差項(xiàng)服從正態(tài)分布這一假定是否成立這一假定是否成立 n若假定成立,標(biāo)準(zhǔn)化殘差的分布也應(yīng)服從若假定成立,標(biāo)準(zhǔn)化殘差的分布也應(yīng)服從正態(tài)分布正態(tài)分布n在標(biāo)準(zhǔn)化殘差圖中,大約有在

31、標(biāo)準(zhǔn)化殘差圖中,大約有95%的標(biāo)準(zhǔn)的標(biāo)準(zhǔn)化殘差在化殘差在-2到到+2之間之間 標(biāo)準(zhǔn)化殘差圖標(biāo)準(zhǔn)化殘差圖(例題分析例題分析)不良貸款對(duì)貸款余額回歸的不良貸款對(duì)貸款余額回歸的標(biāo)準(zhǔn)化殘差圖標(biāo)準(zhǔn)化殘差圖-2-1012340100200300400貸款余額標(biāo)準(zhǔn)化殘差異常值異常值(outlier)如果某一個(gè)點(diǎn)與其他點(diǎn)所呈現(xiàn)的趨勢(shì)不相吻合,這個(gè)點(diǎn)就有可能是異常點(diǎn),或稱為野點(diǎn)n如果異常值是一個(gè)錯(cuò)誤的數(shù)據(jù),比如記錄錯(cuò)誤造成如果異常值是一個(gè)錯(cuò)誤的數(shù)據(jù),比如記錄錯(cuò)誤造成的,應(yīng)該修正該數(shù)據(jù),以便改善回歸的效果的,應(yīng)該修正該數(shù)據(jù),以便改善回歸的效果n如果是由于模型的假定不合理,使得標(biāo)準(zhǔn)化殘差偏如果是由于模型的假定不合理

32、,使得標(biāo)準(zhǔn)化殘差偏大,應(yīng)該考慮采用其他形式的模型,比如非線性模大,應(yīng)該考慮采用其他形式的模型,比如非線性模型型n如果完全是由于隨機(jī)因素而造成的異常值,則應(yīng)該如果完全是由于隨機(jī)因素而造成的異常值,則應(yīng)該保留該數(shù)據(jù)保留該數(shù)據(jù)在處理異常值時(shí),若一個(gè)異常值是一個(gè)有效的觀測(cè)值,不應(yīng)輕易地將其從數(shù)據(jù)集中予以剔除 異常值異常值識(shí)別識(shí)別異常值也可以通過標(biāo)準(zhǔn)化殘差來識(shí)別如果某一個(gè)觀測(cè)值所對(duì)應(yīng)的標(biāo)準(zhǔn)化殘差較大,就可以識(shí)別為異常值一般情況下,當(dāng)一個(gè)觀測(cè)值所對(duì)應(yīng)的標(biāo)準(zhǔn)化殘差小于-2或大于+2時(shí),就可以將其視為異常值有影響的觀測(cè)值有影響的觀測(cè)值如果某一個(gè)或某一些觀測(cè)值對(duì)回歸的結(jié)果有強(qiáng)烈的影響,那么該觀測(cè)值或這些觀測(cè)值就

33、是有影響的觀測(cè)值 一個(gè)有影響的觀測(cè)值可能是n一個(gè)異常值,即有一個(gè)值遠(yuǎn)遠(yuǎn)偏離了散點(diǎn)一個(gè)異常值,即有一個(gè)值遠(yuǎn)遠(yuǎn)偏離了散點(diǎn)圖中的趨勢(shì)線圖中的趨勢(shì)線n對(duì)應(yīng)一個(gè)遠(yuǎn)離自變量平均值的觀測(cè)值對(duì)應(yīng)一個(gè)遠(yuǎn)離自變量平均值的觀測(cè)值n或者是這二者組合而形成的觀測(cè)值或者是這二者組合而形成的觀測(cè)值 有影響的觀測(cè)值圖示有影響的觀測(cè)值圖示存在一個(gè)有影響觀測(cè)值的散點(diǎn)圖存在一個(gè)有影響觀測(cè)值的散點(diǎn)圖024681012010203040 xy不存在影響值的趨勢(shì)有影響的觀測(cè)值存在影響值的趨勢(shì)692.4利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)根據(jù)自變量 x 的取值估計(jì)或預(yù)測(cè)因變量 y的取值估計(jì)或預(yù)測(cè)的類型n點(diǎn)估計(jì)wy 的平均值的點(diǎn)估計(jì)wy 的個(gè)別值的點(diǎn)

34、估計(jì)n區(qū)間估計(jì)wy 的平均值的置信區(qū)間估計(jì)wy 的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)70利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(點(diǎn)估計(jì))0 y71 y 的平均值的點(diǎn)估計(jì)的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值的一個(gè)估計(jì)值E(y0) ,就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)人均國民收入為2000元時(shí),所有年份人均消費(fèi)金額的的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得)(98.1160200052638. 022286.540元+y72 y 的個(gè)別值的點(diǎn)估計(jì)的個(gè)別值的點(diǎn)估計(jì)0 y)(57.7127 .125052638. 022286.540元+y7

35、3點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量 x 的一個(gè)給定值 x0,根據(jù)回歸方程得到因變量 y 的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型n置信區(qū)間估計(jì)n預(yù)測(cè)區(qū)間估計(jì)74 y 的平均值的置信區(qū)間估計(jì)的平均值的置信區(qū)間估計(jì) 利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值E(y0)的估計(jì)區(qū)間 ,這一估計(jì)區(qū)間稱為置信區(qū)間置信區(qū)間1. E(y0) 在1-置信水平下的置信區(qū)間為+niiyxxxxnSnty1220201)2(75827.341603473077.9867 .125013195.14201. 257.7122+【例例

36、】根據(jù)前例,求出人均國民收入為1250.7元時(shí),人均消費(fèi)金額95%的置信區(qū)間 解:根據(jù)前面的計(jì)算結(jié)果 712.57,Sy=14.95, t(13-2)2.201,n=13置信區(qū)間為:0 y0 y76 y 的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì) 利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間預(yù)測(cè)區(qū)間 1. y0在1-置信水平下的預(yù)測(cè)區(qū)間為+niiyxxxxnSnty12202011)2(77827.341603473077.9867 .1250131195.14201. 257.7122+ 【例例】根據(jù)前例,求出1990年人均國民收入為1250.7元時(shí),人均消費(fèi)金額的95%的預(yù)測(cè)區(qū)間 解:根據(jù)前面的計(jì)算結(jié)果有 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為0 y0 y78影響區(qū)間寬度的因素1. 置信水平 (1 - )n區(qū)間寬度隨置信水平的增大而增大2. 數(shù)據(jù)的離散程度 (s)n區(qū)間寬度隨離散程度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論