計量經(jīng)濟(jì)學(xué)簡單線性回歸模型_第1頁
計量經(jīng)濟(jì)學(xué)簡單線性回歸模型_第2頁
計量經(jīng)濟(jì)學(xué)簡單線性回歸模型_第3頁
計量經(jīng)濟(jì)學(xué)簡單線性回歸模型_第4頁
計量經(jīng)濟(jì)學(xué)簡單線性回歸模型_第5頁
已閱讀5頁,還剩142頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

計量經(jīng)濟(jì)學(xué)第二章簡單線性回歸模型1從2004中國國際旅游交易會上獲悉,到2020年,中國旅游業(yè)總收入將超過3000億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%至11%。(資料來源:國際金融報2004年11月25日第二版)◆是什么決定性的因素能使中國旅游業(yè)總收入到2020年達(dá)到3000億美元?◆旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?◆怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?引子:

中國旅游業(yè)總收入將超過3000億美元嗎?2第二章簡單線性回歸模型

本章主要討論:

●回歸分析與回歸函數(shù)

●簡單線性回歸模型參數(shù)的估計●擬合優(yōu)度的度量●回歸系數(shù)的區(qū)間估計和假設(shè)檢驗●簡單線性回歸模型檢驗●回歸模型預(yù)測3第一節(jié)回歸分析與回歸方程本節(jié)基本內(nèi)容:

●回歸與相關(guān)●總體回歸函數(shù)●隨機(jī)擾動項●樣本回歸函數(shù)●非線性模型線性化

4

1.經(jīng)濟(jì)變量間的相互關(guān)系

◆確定性的函數(shù)關(guān)系

◆不確定性的統(tǒng)計關(guān)系—相關(guān)關(guān)系

(ε為隨機(jī)變量)

◆沒有關(guān)系一、回歸與相關(guān)

(對統(tǒng)計學(xué)的回顧)5對變量間統(tǒng)計依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:62.相關(guān)關(guān)系◆相關(guān)關(guān)系的描述

相關(guān)關(guān)系最直觀的描述方式——散點圖

7

◆相關(guān)關(guān)系的類型

從涉及的變量數(shù)量看

簡單相關(guān)多重相關(guān)(復(fù)相關(guān))

從變量相關(guān)關(guān)系的表現(xiàn)形式看

線性相關(guān)——散布圖接近一條直線非線性相關(guān)——散布圖接近一條曲線

從變量相關(guān)關(guān)系變化的方向看

正相關(guān)——變量同方向變化,同增同減負(fù)相關(guān)——變量反方向變化,一增一減不相關(guān)89▲注意①不線性相關(guān)意味著不相關(guān)?②有相關(guān)關(guān)系意味著一定有因果關(guān)系?③相關(guān)分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機(jī)的。回歸分析對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是。10相關(guān)系數(shù)的度量總體相關(guān)系數(shù):樣本相關(guān)系數(shù):11相關(guān)系數(shù)的取值范圍12

●X和Y都是相互對稱的隨機(jī)變量,x與y和y與x的相關(guān)系數(shù)相等。●

線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系?!?/p>

相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線●相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于抽樣波動,樣本相關(guān)系數(shù)是個隨機(jī)變量,其統(tǒng)計顯著性有待檢驗。

計量經(jīng)濟(jì)學(xué)關(guān)心:變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計規(guī)律性,這有賴于回歸分析方法

使用相關(guān)系數(shù)時應(yīng)注意13簡單相關(guān)系數(shù)的檢驗14線性相關(guān)系數(shù)的局限性154.回歸分析回歸的古典意義:高爾頓遺傳學(xué)的回歸概念

(父母身高與子女身高的關(guān)系)回歸的現(xiàn)代意義:一個被解釋變量對若干解釋變量依存關(guān)系的研究回歸的目的(實質(zhì)):由固定的解釋變量去估計被解釋變量的平均值161.相關(guān)分析

變量性質(zhì):都是隨機(jī)變量且關(guān)系對等。

分析方法:圖表法和相關(guān)系數(shù)。

分析目的:判定變量之間相關(guān)的方向和關(guān)系的密切程度。相關(guān)分析和回歸分析區(qū)別172.回歸分析變量性質(zhì):解釋變量(因)與被解釋變量(果)的關(guān)系不對等。解釋變量是非隨機(jī)的被解釋變量是隨機(jī)的分析方法:建立回歸方程。分析目的:變量之間的數(shù)量依存關(guān)系,并根據(jù)自變量的數(shù)值變化去推測因變量數(shù)值變化。18相關(guān)分析和回歸分析聯(lián)系相關(guān)分析與回歸分析有密切的聯(lián)系,都是對變量之間相關(guān)關(guān)系的研究,二者可以互相補充。相關(guān)分析表明變量之間相關(guān)關(guān)系的性質(zhì)和程度,只有變量之間存在一定程度的相關(guān)關(guān)系時,進(jìn)行回歸分析尋求相關(guān)的具體數(shù)學(xué)形式才有實際意義。19●

的條件分布

當(dāng)解釋變量

取某固定值時(條件),

的值不確定,

的不同取值形成一定的分布,即

的條件分布?!?/p>

的條件期望

對于

的每一個取值,

所形成的分布確定其期望或均值,稱為

的條件期望或條件均值

注意幾個概念20●回歸線:

對于每一個

的取值,都有

的條件期望與之對應(yīng),代表這些

的條件期望的點的軌跡所形成的直線或曲線,稱為回歸線。21

回歸函數(shù):應(yīng)變量的條件期望隨解釋變量的的變化而有規(guī)律的變化,如果把的條件期望表現(xiàn)為的某種函數(shù)這個函數(shù)稱為回歸函數(shù)?;貧w函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)舉例:假如已知100個家庭構(gòu)成的總體。22每月家庭可支配收入

X100015002000250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每960121013101432183510682319248828563201月125913401520188520662321258729003288家132414001615194321852365265030213399庭1448165020372210239827893064消1489171220782289248728533142費1538177821792313251329343274支160018412298239825383110出17021886231624232567

Y1900238724532610201224982487271025892586900115014001650190021502400265029003150例:100個家庭構(gòu)成的總體(單位:元)2324二、總體回歸函數(shù)(PRF)1.總體回歸函數(shù)的概念

假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體應(yīng)變量

和解釋變量X的每個觀測值,可以計算出總體應(yīng)變量Y的條件均值E[Y|X],并將其表現(xiàn)為解釋變量X的某種函數(shù)E[Y|X]=f(x)這個函數(shù)稱為總體回歸函數(shù)(PRF)25

(1)條件均值表現(xiàn)形式

假如

的條件均值是解釋變量

的線性函數(shù),可表示為:

(2)個別值表現(xiàn)形式

對于一定的,

的各個別值分布在的周圍,若令各個與條件均值的偏差為,顯然是隨機(jī)變量,則有

2.總體回歸函數(shù)的表現(xiàn)形式26上式稱為總體回歸模型,真實反映被解釋變量與解釋變量和隨機(jī)因素的關(guān)系。該模型參數(shù)是未知的。上式稱為總體回歸函數(shù)(方程),真實反映被解釋變量均值與解釋變量的關(guān)系。該方程參數(shù)是未知的。27......

..由于總體回歸模型參數(shù)不知道,所以只能通過抽樣調(diào)查取得數(shù)據(jù),并基于數(shù)據(jù)估計出參數(shù)的近似值。28●實際的經(jīng)濟(jì)研究中總體回歸函數(shù)通常是未知的,只能根據(jù)經(jīng)濟(jì)理論和實踐經(jīng)驗去設(shè)定?!坝嬃俊钡哪康木褪菍で驪RF。●總體回歸函數(shù)中

的關(guān)系可是線性的,也可是非線性的。對線性回歸模型的“線性”有兩種解釋

就變量而言是線性的

——

的條件均值是

的線性函數(shù)

就參數(shù)而言是線性的

——

的條件均值是參數(shù)

的線性函數(shù)

3.如何理解總體回歸函數(shù)29

變量、參數(shù)均為“線性”

參數(shù)“線性”,變量”非線性”變量“線性”,參數(shù)”非線性”計量經(jīng)濟(jì)學(xué)中:

線性回歸模型主要指就參數(shù)而言是“線性”,因為只要對參數(shù)而言是線性的,都可以用類似的方法估計其參數(shù)?!熬€性”的判斷30三、隨機(jī)擾動項◆概念:

各個值與條件均值的偏差代表排除在模型以外的所有因素對

的影響。◆性質(zhì):是期望為0有一定分布的隨機(jī)變量重要性:隨機(jī)擾動項的性質(zhì)決定著計量經(jīng)濟(jì)方法的選擇31

未知影響因素的代表●

無法取得數(shù)據(jù)的已知影響因素的代表●

眾多細(xì)小影響因素的綜合代表●

模型的設(shè)定誤差●

變量的觀測誤差●

變量內(nèi)在隨機(jī)性引入隨機(jī)擾動項的原因32四、樣本回歸函數(shù)(SRF)

樣本回歸線:

對于的一定值,取得的樣本觀測值,可計算其條件均值,樣本觀測值條件均值的軌跡稱為樣本回歸線。

樣本回歸函數(shù):如果把應(yīng)變量的樣本條件均值表示為解釋變量X的某種函數(shù),這個函數(shù)稱為樣本回歸函數(shù)(SRF)。

33SRF的特點●每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,所以樣本回歸線隨抽樣波動而變化,可以有許多條(SRF不唯一)。

SRF2SRF134●樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。●樣本回歸線還不是總體回歸線,至多只是未知總體回歸線的近似表現(xiàn)。35例一個假想社區(qū)是有一百戶家庭組成的總體,研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系,即根據(jù)家庭的每月的可支配收入,考察該社區(qū)家庭每月消費支出的平均水平。為方便研究,將該100戶家庭組成的總體按照可支配收入水平劃分為10組,并分析每一組的家庭消費支出。收入支出統(tǒng)計表見下頁。單位:元36X800110014001700200023002600290032003500每月家庭消費支出Y56163886910231254140816501969209022995947489131100130914521738199121342321627814924114413641551174920462178253063884797911551397159518042068226626299351012121014081650174821012354286096810451243147416721881218924862871107812541496168319252233255211221298149617161969224425851155133115621749201322992640118813641573177120352310121014081606180421011430165018702112171619472002合計24204950114951644519305238702502521450212851551037收入水平800110014001700200023002600290032003500條件均值60582510451265148517051925214523652585收入水平與消費支出的條件均值統(tǒng)計表單位:元38家庭消費支出與可支配收入的一個隨機(jī)樣本X800110014001700200023002600290032003500Y59463811221150140815951969207825852530單位(元)39

樣本回歸函數(shù)如果為線性函數(shù),可表示為

其中:是與相對應(yīng)的的樣本條件均值和分別是樣本回歸函數(shù)的參數(shù)應(yīng)變量的實際觀測值不完全等于樣本條件均值,二者之差用表示,稱為剩余項或殘差項:

或者樣本回歸函數(shù)的表現(xiàn)形式40

對樣本回歸的理解

如果能夠獲得和的數(shù)值,顯然:●和是對總體回歸函數(shù)參數(shù)和的估計

●是對總體條件期望的估計

在概念上類似總體回歸函數(shù)中的,可視為對的估計。樣本線性回歸模型41

樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系

SRF

PRF

A

42樣本回歸函數(shù)通過樣本回歸模型推斷總體回歸模型抽取樣本運用回歸分析方法估計出樣本回歸模型——樣本回歸函數(shù)43估計量一個估計量又稱統(tǒng)計量,是指一個公式或方法,是用已知的樣本所提供的信息去估計總體參數(shù)。估計量的二重性:統(tǒng)計量是樣本的函數(shù),因為抽樣是隨機(jī)的,統(tǒng)計量具有隨機(jī)性;對一次已經(jīng)實現(xiàn)的抽樣,統(tǒng)計量又是確定的。在應(yīng)用中,由估計量算出的數(shù)值稱為估計值。44

與抽樣有關(guān)

與抽樣無關(guān)關(guān)系可估計得到

關(guān)系未知

近似關(guān)系真實關(guān)系總體回歸方程與樣本回歸方程的區(qū)別45如果估計誤差較小,即估計值與真實值比較接近,則可以用樣本回歸方程近似地代替總體回歸方程,即利用樣本回歸方程近似地描述總體的平均變化規(guī)律。因此,回歸分析的主要內(nèi)容可以概括成:根據(jù)樣本觀察值確定樣本回歸方程;檢驗樣本回歸方程對總體回歸方程的近似程度;利用樣本回歸方程分析總體的平均變化規(guī)律。46回歸分析的目的

用樣本回歸函數(shù)SRF去估計總體回歸函數(shù)PRF。

由于樣本對總體總是存在代表性誤差,SRF總會過高或過低估計PRF。要解決的問題:尋求一種規(guī)則和方法,使得到的SRF的參數(shù)和盡可能“接近”總體回歸函數(shù)中的參數(shù)和。這樣的“規(guī)則和方法”有多種,最常用的是最小二乘法47

五、非線性模型的處理1.可線性化直接置換法對數(shù)變換法2.不可線性化泰勒公式(級數(shù))展開法高斯-牛頓迭代法牛頓-拉夫森迭代法481、直接置換法:

用變量代換使代換后的變量呈現(xiàn)線性關(guān)系。49

2、對數(shù)變換法:將回歸方程取對數(shù),然后變量代換503、級數(shù)展開法:首先展開成冪級數(shù),然后取線性項51非線性模型的線性化5253545556575859606162第二節(jié)

簡單線性回歸模型的最小二乘估計

本節(jié)基本內(nèi)容:●簡單線性回歸的基本假定●普通最小二乘法●OLS回歸線的性質(zhì)●參數(shù)估計式的統(tǒng)計性質(zhì)63

一、簡單線性回歸的基本假定

1.為什么要作基本假定?

●模型中有隨機(jī)擾動,估計的參數(shù)是隨機(jī)變量,只有對隨機(jī)擾動的分布作出假定,才能確定所估計參數(shù)的分布性質(zhì),也才可能進(jìn)行假設(shè)檢驗和區(qū)間估計●只有具備一定的假定條件,所作出的估計才具有較好的統(tǒng)計性質(zhì)。64

(1)對模型和變量的假定如假定解釋變量是非隨機(jī)的,或者雖然是隨機(jī)的,但與擾動項

是不相關(guān)的。假定解釋變量

在重復(fù)抽樣中為固定值。假定模型對變量和函數(shù)的設(shè)定是正確的,無設(shè)定誤差。假定模型對參數(shù)是線性的,y與參數(shù)和x之間為線性關(guān)系。2、基本假定的內(nèi)容65

又稱高斯假定、古典假定假定1:零均值假定

在給定的條件下,的條件期望為零假定2:同方差假定

在給定的條件下,的條件方差為某個常數(shù)(2)對隨機(jī)擾動項

的假定66

假定3:無自相關(guān)假定

隨機(jī)擾動項的逐次值互不相關(guān)

假定4:隨機(jī)擾動與解釋變量不相關(guān)

67

假定5:對隨機(jī)擾動項分布的正態(tài)性假定即假定服從均值為零、方差為的正態(tài)分布

(說明:正態(tài)性假定不影響對參數(shù)的點估計,但對確定所估計參數(shù)的分布性質(zhì)是需要的。且根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時,的分布會趨近于正態(tài)分布。所以正態(tài)性假定是合理的)68的分布性質(zhì)由于

的分布性質(zhì)決定了的分布性質(zhì)。對的一些假定可以等價地表示為對的假定:假定1:零均值假定

假定2:同方差假定假定3:無自相關(guān)假定假定5:正態(tài)性假定69(3)對模型參數(shù)估計時的假設(shè)樣本觀測次數(shù)必須大于待估計的參數(shù)的個數(shù)。X的數(shù)值要有變異性,不可以全是相同的值。70二、普通最小二乘法

(OrdinaryLeastSquares)對于一元線性回歸模型,假設(shè)從總體中獲取了n組觀察值(X1,Y1),(X2,Y2),…,(Xn,Yn)。對于平面中的這n個點,可以使用無數(shù)條曲線來擬合。要求樣本回歸函數(shù)盡可能好地擬合這組值.綜合起來看,這條直線處于樣本數(shù)據(jù)的中心位置最合理。

71選擇最佳擬合曲線的標(biāo)準(zhǔn)可以確定為:使總的擬合誤差(即總殘差)達(dá)到最小。有以下三個標(biāo)準(zhǔn)可以選擇:(1)用“殘差和最小”確定直線位置是一個途徑。但很快發(fā)現(xiàn)計算“殘差和”存在相互抵消的問題.72yx縱向距離A為實際點,B為擬合直線上與之對應(yīng)的點....73....Y4Y1Y2Y3X1X2X3X4}}{{u1u2u3u4xyE(Y|X)=b1+b2X74(2)用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩。(3)最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外,得到的估計量還具有優(yōu)良特性。這種方法對異常值非常敏感

描述這一標(biāo)準(zhǔn)最常用的是普通最小二乘法(OrdinaryLeastSquare,OLS):所選擇的回歸模型應(yīng)該使所有觀察值的殘差平方和達(dá)到最小75

◆OLS的基本思想●不同的估計方法可得到不同的樣本回歸參數(shù)和,所估計的也不同?!窭硐氲墓烙嫹椒☉?yīng)使與的差即剩余越小越好●因可正可負(fù),所以可以取最小即76數(shù)學(xué)推證77

正規(guī)方程和估計式

用克萊姆法則求解得觀測值形式的OLS估計式:

取偏導(dǎo)數(shù)為0,得正規(guī)方程78

為表達(dá)得更簡潔,或者用離差形式OLS估計式:

注意其中:用離差表現(xiàn)的OLS估計式79而且樣本回歸函數(shù)可寫為

上式也稱為樣本回歸函數(shù)的離差形式。注意:在計量經(jīng)濟(jì)學(xué)中,往往以小寫字母表示對均值的離差。

8081三、OLS回歸線的性質(zhì)可以證明:書上P34●回歸線通過樣本均值●估計值的均值等于實際觀測值的均值

82●剩余項的均值為零●應(yīng)變量估計值與剩余項不相關(guān)

●解釋變量與剩余項不相關(guān)

83

四、參數(shù)估計式的統(tǒng)計性質(zhì)(一)參數(shù)估計式的評價標(biāo)準(zhǔn)

1.無偏性前提:重復(fù)抽樣中估計方法固定、樣本數(shù)不變、經(jīng)重復(fù)抽樣的觀測值,可得一系列參數(shù)估計值參數(shù)估計值的分布稱為的抽樣分布,密度函數(shù)記為如果,稱是參數(shù)

的無偏估計式,否則稱是有偏的,其偏倚為(見圖1.2)84圖1.2估計值偏倚

概率密度85前提:樣本相同、用不同的方法估計參數(shù),可以找到若干個不同的估計式

目標(biāo):努力尋求其抽樣分布具有最小方差的估計式——最小方差準(zhǔn)則,或稱最佳性準(zhǔn)則(見圖1.3)

既是無偏的同時又具有最小方差的估計式,稱為有效估計式。2.最小方差性86概率密度

圖1.3估計值87

4.漸近性質(zhì)(大樣本性質(zhì))

思想:當(dāng)樣本容量較小時,有時很難找到最佳無偏估計,需要考慮樣本擴(kuò)大后的性質(zhì)一致性:

當(dāng)樣本容量

n

趨于無窮大時,如果估計式依概率收斂于總體參數(shù)的真實值,就稱這個估計式是

的一致估計式。即或

漸近有效性:當(dāng)樣本容量n趨于無窮大時,在所有的一致估計式中,具有最小的漸近方差。

(見圖1.4)88概率密度

估計值

圖1.489(二)

OLS估計式的統(tǒng)計性質(zhì)●

由OLS估計式可以看出

由可觀測的樣本值和唯一表示。●

因存在抽樣波動,OLS估計是隨機(jī)變量●

OLS估計式是點估計式90當(dāng)模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質(zhì)。一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性:

(1)線性性,即它是否是另一隨機(jī)變量的線性函數(shù);91(2)無偏性,即它的均值或期望值是否等于總體的真實值;(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。

這三個準(zhǔn)則也稱作估計量的小樣本性質(zhì)。擁有這類性質(zhì)的估計量稱為最佳線性無偏估計量(bestlinerunbiasedestimator,BLUE)。

92(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。

當(dāng)不滿足小樣本性質(zhì)時,需進(jìn)一步考察估計量的大樣本或漸近性質(zhì):931.線性特征

是的線性函數(shù)

2.無偏特性

3.最小方差特性

在所有的線性無偏估計中,OLS估計具有最小方差結(jié)論:在古典假定條件下,OLS估計式是最佳線性無偏估計式(BLUE)OLS估計式的統(tǒng)計性質(zhì)——高斯定理949596的估計證明見P6997結(jié)論:高斯-馬爾可夫定理:在古典假定條件下,用OLS法得到的估計量就具有最佳線性無偏性。估計量稱最佳線性無偏估計量。最佳線性無偏估計特性保證估計值最大限度的集中在真值周圍,估計值的置信區(qū)間最小。98所有的估計值線性估計值線性無偏估計值最小二乘估計值|方差最小高斯-馬爾科夫理論所考慮的各種估計值分類圖99第三節(jié)

擬合優(yōu)度的度量本節(jié)基本內(nèi)容:●什么是擬合優(yōu)度●總變差的分解●可決系數(shù)

100說明回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。盡管從統(tǒng)計性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。101那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計檢驗。主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數(shù)的區(qū)間估計。102

一、什么是擬合優(yōu)度?

概念:樣本回歸線是對樣本數(shù)據(jù)的一種擬合,不同估計方法可擬合出不同的回歸線,擬合的回歸線與樣本觀測值總有偏離。

樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度

——擬合優(yōu)度擬合優(yōu)度的度量建立在對總變差分解的基礎(chǔ)上103二、總變差的分解

分析Y的觀測值、估計值與平均值的關(guān)系將上式兩邊平方加總,可證得

(TSS)(ESS)(RSS)

104

總變差(TSS):應(yīng)變量Y的觀測值與其平均值的離差平方和(總平方和)

解釋了的變差(ESS):應(yīng)變量Y的估計值與其平均值的離差平方和(回歸平方和)

剩余平方和(RSS):應(yīng)變量觀測值與估計值之差的平方和(未解釋的平方和)105

變差分解的圖示106

三、可決系數(shù)以TSS同除總變差等式兩邊:或

定義:回歸平方和(解釋了的變差ESS)在總變差(TSS)中所占的比重稱為可決系數(shù),用表示:

107作用:可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)小,說明模型對樣本觀測值的擬合程度越差。特點:●可決系數(shù)取值范圍:●隨抽樣波動,樣本可決系數(shù)是隨抽樣而變動的隨機(jī)變量●可決系數(shù)是非負(fù)的統(tǒng)計量可決系數(shù)的作用和特點108可決系數(shù)與相關(guān)系數(shù)的關(guān)系(1)聯(lián)系

數(shù)值上,可決系數(shù)等于應(yīng)變量與解釋變量之間簡單相關(guān)系數(shù)的平方:109可決系數(shù)與相關(guān)系數(shù)的關(guān)系可決系數(shù)相關(guān)系數(shù)就模型而言就兩個變量而言說明解釋變量對應(yīng)變量的解釋程度度量兩個變量線性依存程度。度量不對稱的因果關(guān)系度量不含因果關(guān)系的對稱相關(guān)關(guān)系取值:[0,1]取值:[-1,1](2)區(qū)別110運用可決系數(shù)時應(yīng)注意●可決系數(shù)只是說明列入模型的所有解釋變量對因變量的聯(lián)合的影響程度,不說明模型中每個解釋變量的影響程度(在多元中)●回歸的主要目的如果是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的估計量,可決系數(shù)高并不表示每個回歸系數(shù)都可信任●如果建模的目的只是為了預(yù)測因變量值,不是為了正確估計回歸系數(shù),一般可考慮有較高的可決系數(shù)111第四節(jié)

、回歸系數(shù)的區(qū)間估計本節(jié)基本內(nèi)容:●OLS估計的分布性質(zhì)●回歸系數(shù)的區(qū)間估計

112問題的提出

為什么要作區(qū)間估計?OLS估計只是通過樣本得到的點估計,不一定等于真實參數(shù),還需要找到真實參數(shù)的可能范圍,并說明其可靠性為什么要作假設(shè)檢驗?OLS估計只是用樣本估計的結(jié)果,是否可靠?是否抽樣的偶然結(jié)果?還有待統(tǒng)計檢驗。區(qū)間估計和假設(shè)檢驗都是建立在確定參數(shù)估計值概率分布性質(zhì)的基礎(chǔ)上。113

一、OLS估計的分布性質(zhì)基本思想

是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)間估計和假設(shè)檢驗是服從正態(tài)分布的隨機(jī)變量,決定了也是服從正態(tài)分布的隨機(jī)變量,

是的線性函數(shù),決定了也是服從正態(tài)分布的隨機(jī)變量,只要確定的期望和方差,即可確定的分布性質(zhì)114●的期望:(無偏估計)●的方差和標(biāo)準(zhǔn)誤差

(標(biāo)準(zhǔn)誤差是方差的算術(shù)平方根)

注意:以上各式中未知,其余均是樣本觀測值

參數(shù)估計值的期望和方差115

可以證明(見教材P70附錄2.2)

的無偏估計為

(n-2為自由度,即可自由變化的樣本觀測值個數(shù))對隨機(jī)擾動項u方差的估計116

●在已知時將作標(biāo)準(zhǔn)化變換,可得參數(shù)估計量所服從的概率分布117

(1)當(dāng)樣本為大樣本時,用估計的參數(shù)標(biāo)準(zhǔn)誤差對作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計量仍可視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)(2)當(dāng)樣本為小樣本時,可用代替,去估計參數(shù)的標(biāo)準(zhǔn)誤差,用估計的參數(shù)標(biāo)準(zhǔn)誤差對作標(biāo)準(zhǔn)化變換,所得的t統(tǒng)計量不再服從正態(tài)分布(這時分母也是隨機(jī)變量),而是服從t分布:

●當(dāng)未知時

118二、回歸系數(shù)的區(qū)間估計概念:對參數(shù)作出的點估計是隨機(jī)變量,雖然是無偏估計,但還不能說明估計的可靠性和精確性,需要找到包含真實參數(shù)的一個范圍,并確定這個范圍包含參數(shù)真實值的可靠程度。在確定參數(shù)估計式概率分布性質(zhì)的基礎(chǔ)上,可找到兩個正數(shù)δ和α(),使得區(qū)間包含真實的概率為,即

119這樣的區(qū)間稱為所估計參數(shù)的置信區(qū)間。(confidenceinterval);1-稱為置信系數(shù)(置信度)(confidencecoefficient),稱為顯著性水平(levelofsignificance);置信區(qū)間的端點稱為置信限(confidencelimit)或臨界值(criticalvalues)。120由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。要縮小置信區(qū)間,需要(1)增大樣本容量n。因為在同樣的置信水平下,n越大,t分布表中的臨界值越??;同時,增大樣本容量,還可使樣本參數(shù)估計量的標(biāo)準(zhǔn)差減??;121(2)提高模型的擬合優(yōu)度。因為樣本參數(shù)估計量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。122

一般情況下,總體方差未知,用無偏估計去代替,由于樣本容量較小,統(tǒng)計量

t不再服從正態(tài)分布,而服從

t分布。可用t分布去建立參數(shù)估計的置信區(qū)間。

回歸系數(shù)區(qū)間估計的方法123選定α,查t分布表得顯著性水平為

,自由度為

的臨界值,則有即124對回歸系數(shù)假設(shè)檢驗的方式1.假設(shè)檢驗的基本思想為什么要作假設(shè)檢驗?所估計的回歸系數(shù)、和方差都是通過樣本估計的,都是隨抽樣而變動的隨機(jī)變量,它們是否可靠?是否抽樣的偶然結(jié)果呢?還需要加以檢驗。125計量經(jīng)濟(jì)學(xué)中,主要是針對變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗的。目的:對簡單線性回歸,判斷解釋變量是否是被解釋變量

的顯著影響因素。在一元線性模型中,就是要判斷是否對具有顯著的線性影響。這就需要進(jìn)行變量的顯著性檢驗。

126一般情況下,總體方差未知,只能用去

代替,可利用t分布作t檢驗給定,查

t分布表得▼如果或者則拒絕原假設(shè),而接受備擇假設(shè)▼如果則接受原假設(shè)2.回歸系數(shù)的檢驗方法127

P用P值判斷參數(shù)的顯著性假設(shè)檢驗的p值:p值是基于既定的樣本數(shù)據(jù)所計算的統(tǒng)計量,是拒絕原假設(shè)的最低顯著性水平。統(tǒng)計分析軟件中通常都給出了檢驗的p值統(tǒng)計量t由樣本計算的統(tǒng)計量為:相對于顯著性水平的臨界值:或注意:t檢驗是比較和P值檢驗是比較和p與相對應(yīng)與P相對應(yīng)128

用P值判斷參數(shù)的顯著性假設(shè)檢驗的p

值:p

值是根據(jù)既定的樣本數(shù)據(jù)所計算的統(tǒng)計量,拒絕原假設(shè)的最小顯著性水平。統(tǒng)計分析軟件中通常都給出了檢驗的p

值。129方法:將給定的顯著性水平與

值比較:?若值,則在顯著性水平下拒絕原假設(shè),即認(rèn)為

有顯著影響?若值,則在顯著性水平下接受原假設(shè),即認(rèn)為

沒有顯著影響規(guī)則:當(dāng)時,

值越小,越能拒絕原假設(shè)用P值判斷參數(shù)的顯著性的方法130第五節(jié)、一元線性回歸模型的檢驗?zāi)P凸烙嬍降臋z驗就是利用一定的定性與定量的標(biāo)準(zhǔn)對模型的函數(shù)形式,變量的選擇及參數(shù)估計的正確性進(jìn)行評價。1、模型估計式檢驗的必要性:模型解釋變量選擇的正確性需要證明(主觀隨意性,解釋變量的種類與多少由人為主觀決定)模型函數(shù)形式的正確性需要驗證。解釋變量與被解釋變量的關(guān)系選擇具有唯一性,很多情況下并非線性。模型估計的可靠性需要評價。估計式來源于樣本,對總體是否適合需要檢驗。(估計式的可靠性、穩(wěn)定性)1312、模型估計式的理論檢驗:是對模型估計式在理論上能否成立進(jìn)行判別,又稱符號檢驗。OLS估計值的符號及取值大小是否符合經(jīng)濟(jì)理論或社會經(jīng)濟(jì)實踐常規(guī)。3、統(tǒng)計準(zhǔn)則檢驗(一級檢驗)(1)估計標(biāo)準(zhǔn)誤差。

反映各實際點在直線周圍的散布情況,越小越好。一般用標(biāo)準(zhǔn)差與均值之比。及變異系數(shù)132(2)相關(guān)系數(shù)相關(guān)系數(shù)的含義。相關(guān)系數(shù)的顯著性檢驗。(3)解釋變量回歸系數(shù)的顯著性檢驗H0:即假設(shè)Xi對Y沒有顯著影響,則133給定α,可由t分布表查得臨界值tα/2,

若|t|>tα/2

,拒絕H0,Xi對Y有顯著影響;若|t|≤tα/2

,接受H0,認(rèn)為Xi

對Y影響不顯著,應(yīng)考慮將Xi

從模型中剔除,重新建模。(4)擬合優(yōu)度檢驗134(5)總體線性關(guān)系的檢驗1.F檢驗對于若原假設(shè)H0:成立,則給定顯著水平α,查表得臨界值Fα(單側(cè)檢驗)若F>Fα,拒絕H0,模型的線性關(guān)系是顯著的;若F<Fα,接受H0,模型的線性關(guān)系不顯著,回歸模型無效。

135檢驗通不過的原因可能在于:解釋變量選取不當(dāng)或遺漏重要解釋變量;解釋變量與被解釋變量之間不存在線性相關(guān)關(guān)系;樣本容量n比較小;回歸模型存在序列相關(guān)(時間序列中,不同時期)。r2檢驗與F檢驗的關(guān)系136

(6)其他準(zhǔn)則調(diào)整判定系數(shù):判定系數(shù)受解釋變量X的個數(shù)k的影響,在k的個數(shù)不同的模型之間進(jìn)行比較時,判定系數(shù)必須進(jìn)行調(diào)整。4、正態(tài)性檢驗.Jarque-Bera(雅克貝拉檢驗).JB檢驗5、計量經(jīng)濟(jì)學(xué)準(zhǔn)則檢驗(二級檢驗)(1)異方差檢驗(2)自相關(guān)檢驗(3)多重共線性檢驗138

本節(jié)主要內(nèi)容:

●回歸分析結(jié)果的報告

●被解釋變量平均值預(yù)測

●被解釋變量個別值預(yù)測第六節(jié)

回歸模型預(yù)測139一、回歸分析結(jié)果的報告

經(jīng)過模型的估計、檢驗,得到一系列重要的數(shù)據(jù),為了簡明、清晰、規(guī)范地表述這些數(shù)據(jù),計量經(jīng)濟(jì)學(xué)通常采用了以下規(guī)范化的方式:例如:回歸結(jié)果為

標(biāo)準(zhǔn)誤差SEt統(tǒng)計量可決系數(shù)和自由度140

二、被解釋變量平均值預(yù)測1.基本思想●運用計量經(jīng)濟(jì)模型作預(yù)測:指利用所估計的樣本回歸函數(shù),用解釋變量的已知值或預(yù)測值,對預(yù)測期或樣本以外的被解釋變量數(shù)值作出定量的估計。()●控制()●計量經(jīng)濟(jì)預(yù)測是一種條件預(yù)測:

條件:◆模型設(shè)定的關(guān)系式不變

◆所估計的參數(shù)不變

解釋變量在預(yù)測期的取值已經(jīng)確定或已作出預(yù)測對應(yīng)變量的預(yù)測分為平均值預(yù)測和個別值預(yù)測對應(yīng)變量的預(yù)測又分為點預(yù)測和區(qū)間預(yù)測141預(yù)測值、平均值、個別值的相互關(guān)系

是真實平均值的點估計,也是對個別值的點估計個別值真實平均值點預(yù)測值1422.Y

平均值的點預(yù)測

將解釋變量預(yù)測值直接代入估計的方程這樣計算的是一個點估計值

143

3.Y平均值的區(qū)間預(yù)測基本思想:由于存在抽樣波動,預(yù)測的平均值不一定等于真實平均值,還需要對作區(qū)間估計。為對Y作區(qū)間預(yù)測,必須確定平均值預(yù)測值的抽樣分布,

必須找出與和都有關(guān)的統(tǒng)計量144具體作法(從的分布分析)

已知

可以證明

服從正態(tài)分布,將其標(biāo)準(zhǔn)化,當(dāng)未知時,只得用代替,這時有145顯然這樣的t統(tǒng)計量與和都有關(guān)。給定顯著性水平α,查t分布表,得自由度n-2的臨界值則有Y平均值的置信度為的預(yù)測區(qū)間為構(gòu)建平均值的預(yù)測區(qū)間146三、應(yīng)變量個別值預(yù)測基本思想:◆既是對

平均值的點預(yù)測,也是對

個別值的點預(yù)測◆由于存在隨機(jī)擾動的影響,

的平均值并不等于

的個別值◆為了對

的個別值作區(qū)間預(yù)測,需要尋找與預(yù)測值和個別值有關(guān)的統(tǒng)計量,并要明確其概率分布147

具體作法:

已知剩余項是與預(yù)測值及個別值都有關(guān)的變量,并且已知服從正態(tài)分布,且可證明當(dāng)用代替時,對標(biāo)準(zhǔn)化的變量t為

148構(gòu)建個別值的預(yù)測區(qū)間給定顯著性水平,查

t分布表得自由度為的臨界值,則有

因此,一元回歸時

的個別值的置信度為的預(yù)測區(qū)間上下限為

149應(yīng)變量Y區(qū)間預(yù)測的特點

1、

平均值的預(yù)測值與真實平均值有誤差,主要是受抽樣波動影響

個別值的預(yù)測值與真實個別值的差異,不僅受抽樣波動影響,而且還受隨機(jī)擾動項的影響

1502、平均值和個別值預(yù)測區(qū)間都不是常數(shù),是隨的變化而變化的,都以為區(qū)間中心.3、預(yù)測區(qū)間上下限與樣本容量有關(guān),當(dāng)樣本容量時個別值的預(yù)測誤差只決定于隨機(jī)擾動的方差151SRF各種預(yù)測值的關(guān)系Y的個別值的置信區(qū)間Y均值的置信區(qū)間152第六節(jié)案例分析

提出問題:改革開放以來隨著中國經(jīng)濟(jì)的快速發(fā)展,居民的消費水平也不斷增長。但全國各地區(qū)經(jīng)濟(jì)發(fā)展速度不同,居民消費水平也有明顯差異。為了分析什么是影響各地區(qū)居民消費支出有明顯差異的最主要因素,并分析影響因素與消費水平的數(shù)量關(guān)系,可以建立相應(yīng)的計量經(jīng)濟(jì)模型去研究。

研究范圍:全國各省市2002年城市居民家庭平均每人每年消費截面數(shù)據(jù)模型。

153理論分析:影響各地區(qū)城市居民人均消費支出的因素有多種,但從理論和經(jīng)驗分析,最主要的影響因素應(yīng)是居民收入。從理論上說可支配收入越高,居民消費越多,但邊際消費傾向大于0,小于1。建立模型:

其中:Y—城市居民家庭平均每人每年消費支出(元)

X—城市居民人均年可支配收入(元)154數(shù)據(jù):從2002年《中國統(tǒng)計年鑒》中得到地區(qū)城市居民家庭平均每人每年消費支出(元)Y城市居民人均年可支配收入(元)

X北京天津河北山西內(nèi)蒙古遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北10284.607191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.9212463.929337.566679.685234.356051.066524.526260.166100.5613249.808177.6411715.606032.409189.366334.647614.366245.406788.52155(接上頁數(shù)據(jù)表)地區(qū)城市居民家庭平均每人每年消費支出(元)

Y城市居民人均年可支配收入(元)X湖南廣東廣西海南重慶四川貴州云南西藏陜西甘肅青海寧夏新疆5574.728988.485413.445459.646360.245413.084598.285827.926952.445278.045064.245042.526104.925636.40695

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論