計量經(jīng)濟學(xué)(全套課件579P)_第1頁
計量經(jīng)濟學(xué)(全套課件579P)_第2頁
計量經(jīng)濟學(xué)(全套課件579P)_第3頁
計量經(jīng)濟學(xué)(全套課件579P)_第4頁
計量經(jīng)濟學(xué)(全套課件579P)_第5頁
已閱讀5頁,還剩574頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章經(jīng)典單方程計量經(jīng)濟學(xué)模型:一元線性回歸模型?????回歸分析概述一元線性回歸模型的參數(shù)估計一元線性回歸模型檢驗一元線性回歸模型預(yù)測實例§2.1回歸分析概述

一、變量間的關(guān)系及回歸分析的基本概念二、總體回歸函數(shù) 三、隨機擾動項 四、樣本回歸函數(shù)(SRF)§2.1回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念

1、變量間的關(guān)系

經(jīng)濟變量之間的關(guān)系,大體可分為兩類: (1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機變量間的關(guān)系。

(2)統(tǒng)計依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機變量間的關(guān)系。例如: 函數(shù)關(guān)系:

圓面積=f(π,半徑)=π?半徑2

統(tǒng)計依賴關(guān)系/統(tǒng)計相關(guān)關(guān)系:

農(nóng)作物產(chǎn)量=f(氣溫,降雨量,陽光,施肥量)對變量間統(tǒng)計依賴關(guān)系的考察主要是通過相關(guān)分析(correlation

analysis)或回歸分析(regression

analysis)來完成的:

正相關(guān)線性相關(guān)不相關(guān)相關(guān)系數(shù):統(tǒng)計依賴關(guān)系負相關(guān)?1≤ρXY≤1

正相關(guān)有因果關(guān)系無因果關(guān)系回歸分析相關(guān)分析非線性相關(guān)不相關(guān) 負相關(guān)▲注意:①不線性相關(guān)并不意味著不相關(guān);②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個變量對另一個(些)變量的統(tǒng)計依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。

④相關(guān)分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的?;貧w分析對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是。2、回歸分析的基本概念回歸分析(regression

analysis)是研究一個變量關(guān)于另一個(些)變量的具體依賴關(guān)系的計算方法和理論。其用意:在于通過后者的已知或設(shè)定值,去估計和(或)預(yù)測前者的(總體)均值。

這里:前一個變量被稱為被解釋變量(Explained

Variable)或應(yīng)變量(Dependent

Variable),后一個(些)變量被稱為解釋變量(Explanatory

Variable)或自變量(Independent

Variable)?;貧w分析構(gòu)成計量經(jīng)濟學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:(1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)利用回歸方程進行分析、評價及預(yù)測。二、總體回歸函數(shù)

由于變量間關(guān)系的隨機性,回歸分析關(guān)心的是根 據(jù)解釋變量的已知或給定值,考察被解釋變量的總體 均值,即當(dāng)解釋變量取某個確定值時,與之統(tǒng)計相關(guān) 的被解釋變量所有可能出現(xiàn)的對應(yīng)值的平均值。

例2.1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系。即如果知道了家庭的月收入,能否預(yù)測該社區(qū)家庭的平均月消費支出水平。

為達到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費支出。表2.1.1某社區(qū)家庭每月收入與消費支出統(tǒng)計表 每月家庭可支配收入X(元)8005611100 6381400 86917001023200012542300140826001650290019693200209035002299594627748814913924110011441309136414521738155117491991204621342178232125306388479791155139715951804206822662629每月家93596828602871101210451078 1122 11551210124312541298133114081474149614961562165018481672188116831925171619691749 20132101218922332244229923542486255225852640庭消費支出2310

1188121013641408143015731606165017712035180421011870 2112

Y(元)14851716194722002002共計242049501149516445193052387025025214502128515510

分析:

(1)由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同; (2)但由于調(diào)查的完備性,給定收入水平X的消費支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditional

distribution)是已知的,如:P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費支出Y的條件均值(conditional

mean)或條件期望(conditional

expectation):

E(Y|X=Xi)

該例中:E(Y

|

X=800)=561

描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。

350030002500200015001000 500 0

每 月 消 費 支 出

Y(元)5001000150020002500300035004000每月可支配收入X(元)?概念:在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(population

regression

line),或更一般地稱為總體回歸曲線(population

regression

curve)。相應(yīng)的函數(shù):E(Y|Xi)=f(Xi)稱為(雙變量)總體回歸函數(shù)(population

regression

function,

PRF)。?含義:

回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。?函數(shù)形式:可以是線性或非線性的。例2.1中,將居民消費支出看成是其可支配收入的線性函數(shù)時:E(Y|Xi)=β0+β1Xi為一線性函數(shù)。其中,β0,β1是未知參數(shù),稱為回歸系數(shù)(regression

coefficients)。。

三、隨機擾動項

總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費支出水平。 但對某一個別的家庭,其消費支出可能與該平均水平有偏差。記μi=Yi?E(Y|Xi)稱μi為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochastic

disturbance)或隨機誤差項(stochastic

error)。例2.1中,個別家庭的消費支出為:(*)(1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統(tǒng)性(systematic)即,給定收入水平Xi,個別家庭的支出可表示為兩部分之和:或確定性(deterministic)部分。(2)其他隨機或非確定性(nonsystematic)部分μi。(*)式稱為總體回歸函數(shù)(方程)PRF的隨機設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。由于方程中引入了隨機項,成為計量經(jīng)濟學(xué)模型,因此也稱為總體回歸模型。隨機誤差項主要包括下列因素的影響:

1)在解釋變量中被忽略的因素的影響;

2)變量觀測值的觀測誤差的影響;

3)模型關(guān)系的設(shè)定誤差的影響;

4)其它隨機因素的影響。產(chǎn)生并設(shè)計隨機誤差項的主要原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則。

四、樣本回歸函數(shù)(SRF)

總體的信息往往無法掌握,現(xiàn)實的情況只能是在一次觀測中得到總體的一個樣本。

問題:能從一次抽樣中獲得總體的近似的信息嗎? 如果可以,如何從抽樣中獲得總體的近似信息?

例2.2:在例2.1的總體中有如下一個樣本,

問:能否從該樣本估計總體回歸函數(shù)PRF?

表2.1.3家庭消費支出與可支配收入的一個隨機樣本YX8005941100 6381400112217001155200014082300159526001969290020783200258535002530回答:能核樣本的散點圖(scatter

diagram):樣本散點圖近似于一條直線,畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sample

regression

lines)。記樣本回歸線的函數(shù)形式為:Y?i=f(Xi)=β?0+β?1Xi稱為樣本回歸函數(shù)(sample

regression

function,SRF)。這里將樣本回歸線看成總體回歸線的近似替代注意:則樣本回歸函數(shù)的隨機形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式:Yi=Y?i+μ?i=β?0+β?1Xi+ei式中,ei稱為(樣本)殘差(或剩余)項(residual),代表了其他影響Yi的隨機因素的集合,可看成是μi的估計量μ?i。由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型(sample

regression

model)。

▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。

即,根據(jù)估計

Yi=Y?i+ei=β?0+β?1Xi+eiYi=E(Y|Xi)+μi=β0+β1Xi+μi注意:這里PRF可能永遠無法知道?!?.2一元線性回歸模型的參數(shù)估計一、一元線性回歸模型的基本假設(shè)二、參數(shù)的普通最小二乘估計(OLS)三、參數(shù)估計的最大或然法(ML)四、最小二乘估計量的性質(zhì)五、參數(shù)估計量的概率分布及隨機干 擾項方差的估計

單方程計量經(jīng)濟學(xué)模型分為兩大類:

線性模型和非線性模型?線性模型中,變量之間的關(guān)系呈線性關(guān)系?非線性模型中,變量之間的關(guān)系呈非線性關(guān)系

一元線性回歸模型:只有一個解釋變量Yi=β0+β1Xi+μii=1,2,…,nY為被解釋變量,X為解釋變量,β0與β1為待估參數(shù),μ為隨機干擾項

回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準確地估計總體回歸函數(shù)(模型)PRF。

估計方法有多種,其種最廣泛使用的是普通最小二乘法(ordinary

least

squares,

OLS)。為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。注:實際這些假設(shè)與所采用的估計方法緊密相關(guān)。

一、線性回歸模型的基本假設(shè)

假設(shè)1、解釋變量X是確定性變量,不是隨機變量;

假設(shè)2、隨機誤差項μ具有零均值、同方差和不序列相關(guān)性:

E(μi)=0i=1,2,…,nVar(μi)=σμ2i=1,2,…,n

Cov(μi,

μj)=0

i≠j

i,j=

1,2,

…,n假設(shè)3、隨機誤差項μ與解釋變量X之間不相關(guān):

Cov(Xi,

μi)=0

i=1,2,

…,n假設(shè)4、μ服從零均值、同方差、零協(xié)方差的正態(tài)分布

μi~N(0,

σμ2)

i=1,2,

…,n注意:1、如果假設(shè)1、2滿足,則假設(shè)3也滿足;2、如果假設(shè)4滿足,則假設(shè)2也滿足。

以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(Classical

Linear

Regression

Model,

CLRM)。

另外,在進行模型回歸時,還有兩個暗含的 假設(shè):

假設(shè)5:隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即∑n→∞(Xi?X)2/n→Q,

假設(shè)6:回歸模型是正確設(shè)定的

假設(shè)5旨在排除時間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因為這類數(shù)據(jù)不僅使大樣本統(tǒng)計推斷變得無效,而且往往產(chǎn)生所謂的偽回歸問題(spurious

regression

problem)。 假設(shè)6也被稱為模型沒有設(shè)定偏誤(specification

error)∑∑+?=?=iiiiXYYYQ210))??(()?(ββ二、參數(shù)的普通最小二乘估計(OLS)給定一組樣本觀測值(Xi,

Yi)(i=1,2,…n)要求樣本回歸函數(shù)盡可能好地擬合這組值.普通最小二乘法(Ordinary

least

squares,

OLS)給出的判斷標準是:二者之差的平方和nn211最小。方程組(*)稱為正規(guī)方程組(normal

equations)。記(∑Xi)21n∑xi2=∑(Xi?X)2=∑Xi2?∑Xi∑Yi1n∑xiyi=∑(Xi?X)(Yi?Y)=∑XiYi??????

上述參數(shù)估計量可以寫成:?β=Σxiyi

12

?β0=Y?β1X稱為OLS估計量的離差形式(deviation

form)。 由于參數(shù)的估計結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計量(ordinary

least

squares

estimators)。順便指出,記y?i=Y?i?Y則有y?i=(β?0+β?1Xi)?(β?0+β?1X+e)

=β?1(Xi?X)?1n∑ei可得y?i=β?1xi(**)

(**)式也稱為樣本回歸函數(shù)的離差形式。注意:

在計量經(jīng)濟學(xué)中,往往以小寫字母表示對均值的離差。三、參數(shù)估計的最大或然法(ML)最大或然法(Maximum

Likelihood,簡稱ML),也稱最大似然法,是不同于最小二乘法的另一種參數(shù)估計方法,是從最大或然原理出發(fā)發(fā)展起來的其它估計方法的基礎(chǔ)?;驹恚簩τ谧畲蠡蛉环ǎ?dāng)從模型總體隨機抽取n組樣本觀測值后,最合理的參數(shù)估計量應(yīng)該使得從模型中抽取該n組樣本觀測值的概率最大。

在滿足基本假設(shè)條件下,對一元線性回歸模型:

Yi=β0+β1Xi+μi隨機抽取n組樣本觀測值(Xi,

Yi)(i=1,2,…n)。 假如模型的參數(shù)估計量已經(jīng)求得,為 那么Yi服從如下的正態(tài)分布:

Yi~N(β?0+β?1Xi,σ2)

于是,Y的概率函數(shù)為2e

12σ

1σ2π(Yi?β?0?β?1Xi)2?P(Yi)=(i=1,2,…n)(2π)σn因為Yi是相互獨立的,所以的所有樣本觀測值的聯(lián)合概率,也即或然函數(shù)(likelihoodfunction)為:

L(β?0,β?1,σ2)=P(Y1,Y2,???,Yn)21

n

2e

12σΣ(Yi?β?0?β?1Xi)2?=

將該或然函數(shù)極大化,即可求得到模型參數(shù)的極大或然估計量。=?nln(2πσ)?

由于或然函數(shù)的極大化與或然函數(shù)的對數(shù)的極大化是等價的,所以,取對數(shù)或然函數(shù)如下:

L*=ln(L)Σ(Yi?β?0?β?1Xi)2

12σ2?ΣΣ?ΣΣ2?iiiiiXYXYX?=0β?ΣΣ?Σ?iiiiXYXYnβ=1解得模型的參數(shù)估計量為:??nΣXi2?(ΣXi)2??nΣXi2?(ΣXi)2

可見,在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大或然估計量與普通最小二乘估計量是相同的。

例2.2.1:在上述家庭可支配收入-消費支出例中,對于所抽出的一組樣本數(shù),參數(shù)估計的計算可通過下面的表2.2.1進行。表2.2.1參數(shù)估計的計算表XiYixiyixiyixi2yi2Xi2Yi21800594-135021100638-1050-97313140901822500947508-9299758701102500863784

6400003528361210000407044314001122-750-44533405056250019838119600001258884-412185580202500170074-159239102250025408 28414022500762 402180720202500161283 5113829505625002607121018106848011025001035510 96312995101822500926599 576930074250004590020

28900001334025 40000001982464 52900002544025 67600003876961 841000043180841024000066822251225000064009005365000029157448

417001155-450 520001408-150 623001595150 726001969450 829002078750 9320025851050 10350025301350求和2150015674平均21501567∑x57693007425000=0.777=i∑xiy

2

iβ?1=

β?0=Y?β?0X=1567?0.777×2150=?103.172因此,由該樣本估計的回歸方程為:

Y?i=?103.172+0.777Xi四、最小二乘估計量的性質(zhì)

當(dāng)模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質(zhì)。一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性:(1)線性性,即它是否是另一隨機變量的線性函數(shù);(2)無偏性,即它的均值或期望值是否等于總體的真實值;(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。這三個準則也稱作估計量的小樣本性質(zhì)。

擁有這類性質(zhì)的估計量稱為最佳線性無偏估計量(best

liner

unbiased

estimator,

BLUE)。當(dāng)不滿足小樣本性質(zhì)時,需進一步考察估計量的大樣本或漸近性質(zhì):(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。高斯—馬爾可夫定理(Gauss‐Markovtheorem)在給定經(jīng)典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量?!苮2、無偏性,即估計量β?0、β?1的均值(期望)等于總體回歸參數(shù)真值β0與β1

證:β?1=∑kiYi=∑ki(β0+β1Xi+μi)=β0∑ki+β1∑kiXi+∑kiμi易知=0∑xi

2

i∑ki==1i∑kiX故β?1=β1+∑kiμi

E(β?1)=E(β1+∑kiμi)=β1+∑kiE(μi)=β1同樣地,容易得出

E(β?0)=E(β0+∑wiμi)=E(β0)+∑wiE(μi)=β0?xi=∑???σ=??1?n?2?σ=?∑x+nXn∑x∑X=∑????2?2?1Xki+Xki?σ=???2X???n∑x∑ki+X∑?x2????σ2??3、有效性(最小方差性),即在所有線性無偏估計量中,最小二乘估計量β?0、β?1具有最小方差。

(1)先求β?0與β?1的方差

var(β?1)=var(∑kiYi)=∑ki2var(β0+β1Xi+μi)=∑ki2var(μi)?22i?i

σ2∑x2?xi?∑x2var((β?0)=var((∑wiYi)=∑wi2var((β0+β1Xi+μi)=∑(1/n?Xki)2σ22222??????nn1n??1?2??n??∑i2σ2σ2=?=?+ ?2i

2i

2

i2i

X2∑xi2(2)證明最小方差性假設(shè)β?1*是其他估計方法得到的關(guān)于β1的線性無偏估計量:

β?1*=∑ciYi

其中,ci=ki+di,di為不全為零的常數(shù) 則容易證明

var((β?1*)≥var((β?1)

同理,可證明β0的最小二乘估計量β?0具有最的小方差

普通最小二乘估計量(ordinary

least

Squares

Estimators)稱為最佳線性無偏估計量(best

linear

unbiased

estimator,

BLUE)Plim(∑xiμi/n)Plim(∑xi2/n)

由于最小二乘估計量擁有一個“好”的估計量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。?∑xiμi)

∑x2iPlim(β1)=Plim(β1+∑kiμi)=Plim(β1)+Plim(=β1+=β1=β1+=β1+

0QCov(X,μ)

Qn∑x

五、參數(shù)估計量的概率分布及隨機干擾項方差的估計1、參數(shù)估計量β?0和β?1的概率分布)β?1~N(β1,σ2)∑Xi2

2i

σ2∑xβ?0~N(β0,

2i?iσβ1=σ2/∑x2?σ2∑Xi2

n∑xi2σβ0=

2、隨機誤差項μ的方差σ2的估計

σ2又稱為總體方差。 由于隨機項μi不可觀測,只能從μi的估計——殘差ei出發(fā),對總體方差進行估計。

可以證明,σ2的最小二乘估計量為∑e2

n?2iσ?2=它是關(guān)于σ2的無偏估計量。在最大或然估計法中,因此,σ2的最大或然估計量不具無偏性,但卻具有一致性。

2和β?1的方差和標準差的估計量分別是:β?∑1的樣本方差:2??xi2Sβ1=σ2∑???xi2β1的樣本標準差:Sβ1=σβ?0的樣本方差:2??iSβ0=σ2∑Xi2n∑x2∑???Xi2n∑xi2β0的樣本標準差:Sβ0=σ§2.3

一元線性回歸模型的統(tǒng)計檢驗一、擬合優(yōu)度檢驗二、變量的顯著性檢驗三、參數(shù)的置信區(qū)間?回歸分析是要通過樣本所估計的參數(shù)來代替總 體的真實參數(shù),或者說是用樣本回歸線代替總 體回歸線。?盡管從統(tǒng)計性質(zhì)上已知,如果有足夠多的重

復(fù)抽樣,參數(shù)的估計值的期望(均值)就等 于其總體的參數(shù)真值,但在一次抽樣中,估計 值不一定就等于該真值。?那么,在一次抽樣中,參數(shù)的估計值與真值 的差異有多大,是否顯著,這就需要進一步進 行統(tǒng)計檢驗。?主要包括擬合優(yōu)度檢驗、變量的顯著性檢驗

及參數(shù)的區(qū)間估計。一、擬合優(yōu)度檢驗擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。度量擬合優(yōu)度的指標:判定系數(shù)(可決系數(shù))R2

問題:采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?1、總離差平方和的分解已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線Y?i=β?0+β?1Xiyi=Yi?Y=(Yi?Y?i)+(Y?i?Y)=ei+y?i如果Yi=?i

即實際觀測值落在樣本回歸“線”上,則擬合最好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。

對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:記TSS=∑yi2=∑(Yi?Y)2

ESS=∑y?i2=∑(Y?i?Y)2

RSS=∑ei2=∑(Yi?Y?i)2總體平方和(Total

Sum

of

Squares)回歸平方和(Explained

Sum

of

Squares)殘差平方和(Residual

Sum

of

Squares)TSS=ESS+RSS

Y的觀測值圍繞其均值的總離差(total

variation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS2、可決系數(shù)R2統(tǒng)計量RSSTSSESSTSSR==1?記2

稱R2

為(樣本)可決系數(shù)/判定系數(shù)(coefficient

of

determination)。

可決系數(shù)的取值范圍:[0,1]

R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。?∑xi2?∑y2??2∑x2R=β?1∑yi在實際計算可決系數(shù)時,在β?1已經(jīng)估計出后:??R2=β?12? ?i在例2.1.1的收入‐消費支出例中,(0.777)2×7425000 459002022=0.9766=

注:可決系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可靠性也應(yīng)進行檢驗,這將在第3章中進行。二、變量的顯著性檢驗回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著性檢驗。變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計學(xué)中的假設(shè)檢驗。計量經(jīng)計學(xué)中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。1、假設(shè)檢驗?所謂假設(shè)檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。?假設(shè)檢驗采用的邏輯推理方法是反證法。

先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。?判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的σ∑x2、變量的顯著性檢驗)β?1~N(β1,

2i

σ2∑x?=~t(n?2)t=

2iβ?1?β1

Sβ1β?1?β1 2

檢驗步驟:(1)對總體參數(shù)提出假設(shè)H0:β1=0,H1:β1≠0(2)以原假設(shè)H0構(gòu)造t統(tǒng)計量,并由樣本計算其值?

β?1Sβ1t=(3)給定顯著性水平α,查t分布表,得臨界值t

α/2(n‐2)

(4)

比較,判斷 若|t|>

t

α/2(n‐2),則拒絕H0,接受H1;

若|t|≤t

α/2(n‐2),則拒絕H1,接受H0;∑Xn∑x∑e

對于一元線性回歸方程中的β0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗:?2=~t(n?2)t=

β?0Sβ0σ?β?0?β0 22

ii在上述收入-消費支出例中,首先計算σ2的估計值2=134024590020?0.7772×7425000 10?2===∑y2i

2

in?2

?β?12∑xi2n?2σ???∑xi2=13402/7425000=0.0018=0.0425Sβ1=σ2??iSβ0=σ2∑Xi2n∑x2=13402×53650000/10×7425000=98.41t統(tǒng)計量的計算結(jié)果分別為:????t1=β1Sβ1=0.7770.0425=18.29t0=β0Sβ0=?103.1798.41=?1.048給定顯著性水平α=0.05,查t分布表得臨界值t

0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費支出的主要解釋變量;|t2|<2.306,表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。三、參數(shù)的置信區(qū)間

假設(shè)檢驗可以通過一次抽樣的結(jié)果檢驗總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。

要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計。P(β??δ≤β≤β?+δ)=1?α如果存在這樣一個區(qū)間,稱之為置信區(qū)間(confidenceinterval);1‐α稱為置信系數(shù)(置信度)(confidencecoefficient),α稱為顯著性水平(levelofsignificance);置信區(qū)間的端點稱為置信限(confidencelimit)或臨界值(criticalvalues)。一元線性模型中,βi(i=1,2)的置信區(qū)間:

在變量的顯著性檢驗中已經(jīng)知道:?~t(n?2)t=β?i?βi

sβi(1-是(1-

意味著,如果給定置信度(α),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-tα/2,tα/2)的概率是(α)。表示為:

P(?tα<t<tα)=1?α22即$$βi?βi

sβiP(?tα<

2<tα)=1?α

2$$$$22P(βi?tα×sβi<βi<βi+tα×sβi)=1?α到:(1-下,

于是得到:(1α)的置信度下βi的置信區(qū)間是

ii

22

在上述收入-消費支出例中,如果給定α=0.01,查表得:

tα(n?2)=t0.005(8)=3.355

2由于?Sβ1=0.042?Sβ0=98.41于是,β1、β0的置信區(qū)間分別為: (0.6345,0.9195)

(-433.32,226.98)

由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。要縮小置信區(qū)間,需

(1)增大樣本容量n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越?。煌瑫r,增大樣本容量,還可使樣本參數(shù)估計量的標準差減?。?/p>

(2)提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標準差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小?!?2.44

一元線性回歸分析的應(yīng)用:預(yù)測問題一、?0是條件均值E(Y|X=X0)或個值Y0的一個無偏估計二、總體條件均值與個值預(yù)測值的置信區(qū)間對于一元線性回歸模型Y?i=β?0+β?1Xi給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預(yù)測值?

0,可以此作為其條件均值E(Y|X=X0)或個別值Y0的一個近似估計。注意:嚴格地說,這只是被解釋變量的預(yù)測值的估計值,而不是預(yù)測值。原因因:(1)參數(shù)估計量不確定;(2)隨機項的影響

一、?0是條件均值E(Y|X=X0)或個值Y0的一個無偏估計

對總體回歸函數(shù)E(Y|X=X0)=β0+β1X,X=X0時

E(Y|X=X0)=β0+β1X0

Y?0=β?0+β?1X0于是E(Y?0)=E(β?0+β?1X0)=E(β?0)+X0E(β?1)=β0+β1X0可見,?0是條件均值E(Y|X=X0)的無偏估計。對總體回歸模型Y=β0+β1X+μ,當(dāng)X=X0時Y0=β0+β1X0+μ于是E(Y0)=E(β0+β1X0+μ)=β0+β1X0+E(μ)=β0+β1X0E(Y?0)=E(β?0+β?1X0)=E(β?0)+X0E(β?1)=β0+β1X0?β~N(β,σ∑xi∑Xn∑x

二、總體條件均值與個值預(yù)測值的置信區(qū)間

1、總體均值預(yù)測值的置信區(qū)間由于Y?0=β?0+β?1X02)112,σ2)2i

2

iβ?0~N(β0

于是可以證明

E(Y?0)=E(β?0)+X0E(β?1)=β0+β1X0Var(Y?0)=Var(β?0)+2X0Cov(β?0,β?1)+X02Var(β?1)

Cov(β?0,β?1)=?σ2X/∑xi2∑xi?σ2??∑Xi?nX∑x?n+X?2X0X+X???+(X0?X)2)=σ(+∑xiY?0~N(β0+β1X0,σ(+∑xi=σ?(+因此+?Var(Y?0)=2X0Xσ2 2X02σ2∑xi2σ2∑Xi2

n∑xi2?=022222i(

2i=)(X0?X)2 221

n∑x n

σ2∑x

2i故))(X0?X)2 221

n?~t(n?2)t=Y?0?(β0+β1X0)

SY0)?i(X0?X)2

∑x221

nSY0其中????于是,在1‐α的置信度下,總體均值E(Y|X0)的置信區(qū)間為

Y0?tα×SY0<E(Y|X0)<Y0+tα×SY0 22Y?0?Y0~N(0,σ(1+∑xi=σ?(1+2、總體個值預(yù)測值的預(yù)測區(qū)間由Y0=β0+β1X0+μ知:

Y0~N(β0+β1X0,σ2)于是))2+(X0?X)2 21n?~t(n?2)t=Y?0?Y0

SY0?Y0式中:)2?+i(X0?X)2

∑x21nSY0?Y0????從而在1‐α的置信度下,Y0的置信區(qū)間為

Y0?tα

×SY0?Y0<Y0<Y0+tα×SY0?Y0 22Var(Y?0)=13402??=3727.29?在上述收入‐消費支出例中,得到的樣本回歸函數(shù)為

Y?i=?103.172+0.777Xi則在X0=1000處,?0=

–103.172+0.777×1000=673.84而?1?10(1000?2150)2?

7425000+

S(Y?0)=61.05

因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為:673.84‐2.306×61.05<

E(Y|X=1000)<673.84+2.306×61.05或(533.05,

814.62)同樣地,對于Y在X=1000的個體值,其95%的置信區(qū)間為:

673.84

‐2.306×61.05<Yx=1000<673.84

+

2.306×61.05或(372.03,

975.65)

?總體回歸函數(shù)的置信帶(域)(confidence

band)?個體的置信帶(域)對于Y的總體均值E(Y|X)與個體值的預(yù)測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低;(2)樣本容量一定時,置信帶的寬度當(dāng)在X均值處最小,其附近進行預(yù)測(插值預(yù)測)精度越大;X越遠離其均值,置信帶越寬,預(yù)測可信度下降?!?2.55

實例:時間序列問題一、中國居民人均消費模型二、時間序列問題

一、中國居民人均消費模型

例2.5.1考察中國居民收入與消費支出的關(guān)系。GDPP:人均國內(nèi)生產(chǎn)總值(1990年不變價)CONSP:人均居民消費(以居民消費價格指數(shù)(1990=100)縮減)。

表2.5.1中國居民人均消費支出與人均GDP(元/人)年份19781979198019811982198319841985198619871988人均居民消費

CONSP 395.8 437.0 464.1 501.9 533.5 572.8 635.6 716.0 746.5 788.3 836.4人均GDP GDPP 675.1 716.9 763.7 792.4 851.1 931.4 1059.2 1185.2 1269.6 1393.6 1527.0年份19901991199219931994199519961997199819992000人均居民消費

CONSP 797.1 861.4 966.6 1048.6 1108.7 1213.1 1322.8 1380.9 1460.6 1564.4 1690.8人均GDP GDPP 1602.3 1727.2 1949.8 2187.9 2436.1 2663.7 2889.1 3111.9 3323.1 3529.3 3789.71989779.71565.9該兩組數(shù)據(jù)是1978~2000年的時間序列數(shù)據(jù)(timeseriesdata);前述收入‐消費支出例中的數(shù)據(jù)是截面數(shù)據(jù)(cross‐sectional

data)。1、建立模型擬建立如下一元回歸模型CONSP=C+βGDPP+μ采用Eviews軟件進行回歸分析的結(jié)果見下表

表2.5.2中國居民人均消費支出對人均GDP的回歸(1978~2000)LS//DependentVariableisCONSPSample:19782000Includedobservations:23VariableCGDPP1Coefficient 201.1071 0.386187Std.Error14.88514 0.007222t-Statistic13.5106053.47182

Prob.0.00000.0000R-squared0.992709AdjustedR-squared0.992362MeandependentvarS.D.dependentvar

905.3331380.6428S.E.ofregression33.26711Akaikeinfocriterion7.092079Sumsquaredresid23240.71Loglikelihood-112.1945SchwarzcriterionF-statistic7.1908182859.235Durbin-Watsonstat0.550288Prob(F-statistic)0.000000一般可寫出如下回歸分析結(jié)果:

(13.51)

(53.47) R2=0.9927

F=2859.23

DW=0.5503

2、模型檢驗R2=0.9927T值:C:13.51,GDPP:53.47

臨界值:

t0.05/2(21)=2.08斜率項:0<0.3862<1,符合絕對收入假說3、預(yù)測2001年:GDPP=4033.1(元)(90年不變價)點估計:CONSP2001=201.107

+

0.3862×4033.1

=

1758.7(元)2001年實測的CONSP(1990年價):1782.2元,相對誤差:‐1.32%。2001年人均居民消費的預(yù)測區(qū)間

人均GDP的樣本均值與樣本方差:

E(GDPP)=1823.5

Var(GDPP)=982.042=964410.4

在95%的置信度下,E(CONSP2001)的預(yù)測區(qū)間為:)

123(4033.1?1823.5)2(23?1)×964410.4+×(23240.71 23?21758.7±2.306×=1758

1758.7±40.13或:(1718.6,1798.8) 同樣地,在95%的置信度下,CONSP2001的預(yù)測區(qū)間為:)

123+×(1+1758.7±2.306×(4033.1?1823.5)2(23?1)×964410.423240.71 23?2=1758.7±86.57或(1672.1,

1845.3)二、時間序列問題上述實例表明,時間序列完全可以進行類似于截面數(shù)據(jù)的回歸分析。然而,在時間序列回歸分析中,有兩個需注意的問題:第一,關(guān)于抽樣分布的理解問題。能把表2.5.1中的數(shù)據(jù)理解為是從某個總體中抽出的一個樣本嗎?第二,關(guān)于“偽回歸問題”(spuriousregressionproblem)。可決系數(shù)R2,考察被解釋變量Y的變化中可由解釋變量X的變化“解釋”的部分。這里“解釋”能否換為“引起”?

在現(xiàn)實經(jīng)濟問題中,對時間序列數(shù)據(jù)作回歸,即使兩個變量間沒有任何的實際聯(lián)系,也往往會得到較高的可決系數(shù),尤其對于具有相同變化趨勢(同時上升或下降)的變量,更是如此。 這種現(xiàn)象被稱為“偽回歸”或“虛假回歸”。第三章經(jīng)典單方程計量經(jīng)濟學(xué)模型:多 元回歸多元線性回歸模型多元線性回歸模型的參數(shù)估計多元線性回歸模型的統(tǒng)計檢驗多元線性回歸模型的預(yù)測回歸模型的其他形式回歸模型的參數(shù)約束??????§33.11

多元線性回歸模型一、多元線性回歸模型二、多元線性回歸模型的基本假定

一、多元線性回歸模型

多元線性回歸模型:表現(xiàn)在線性回歸模型中的解釋變量有多個。 一般表現(xiàn)形式:Yi=β0+β1X1i+β2X2i+???+βkXki+μii=1,2…,n其中:k為解釋變量的數(shù)目,βj稱為回歸參數(shù)(regression

coefficient)。 習(xí)慣上:把常數(shù)項看成為一虛變量的系數(shù),該虛變量的樣本觀測值始終取1。這樣:

模型中解釋變量的數(shù)目為(k+1)Yi=β0+β1X1i+β2X2i+???+βkXki+μi也被稱為總體回歸函數(shù)的隨機表達形式。它的非隨機表達式為:E(Yi|X1i,X2i,LXki)=β0+β1X1i+β2X2i+???+βkXki方程表示:各變量X值固定時Y的平均響應(yīng)。βj也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個單位時,Y的均值E(Y)的變化;或者說βj給出了Xj的單位變化對Y均值的“直接”或“凈”(不含其他變量)影響。?1?MM??β??μ??M?μn?n×1總體回歸模型n個隨機方程的矩陣表達式為

Y=Xβ+μ

其中

?1X=? ? ?1

Xk1?Xk2?? ?Xkn?n×(k+1)X21X22

MX2nX11X12

MX1nLLL

?β0? ?1?β=?β2? ?? ?M? ??βk??(k+1)×1

?μ1?μ=?2? ?? ??β?0?β=??e1?e=?

樣本回歸函數(shù):用來估計總體回歸函數(shù)

Y?i=β?0+β?1X1i+β?2X2i+L+β?kiXki其隨機表示式:

Yi=β?0+β?1X1i+β?2X2i+L+β?kkiXkki+ei

ei稱為殘差或剩余項(residuals),可看成是總 體回歸函數(shù)中隨機擾動項μi的近似替代。

樣本回歸函數(shù)的矩陣表達:??Y=Xβ或Y=Xβ+e?其中:?

????β1? ? ?M? ?βk?????????e2??M??en?

二、多元線性回歸模型的基本假定

假設(shè)1,解釋變量是非隨機的或固定的,且各X之間互不相關(guān)(無多重共線性)。

假設(shè)2,隨機誤差項具有零均值、同方差及不序列相關(guān)性

E(μi)=0Var(μi)=E(μi2)=σ2i≠ji,j=1,2,L,n

Cov(μi,μj)=E(μiμj)=0假設(shè)3,解釋變量與隨機項不相關(guān)j=1,2L,k

Cov(Xji,μi)=0假設(shè)4,隨機項滿足正態(tài)分布

μi~N(0,σ2)?μ1??E(μ1)???μ1???μ1E(μμ′)=E??M?(μ1Lμn)?=E?M??μ??μμ?n??∑μi???∑X1iμi?M?∑X1iE(μi)?=??=0上述假設(shè)的矩陣符號表示式:

假設(shè)1,n×(k+1)矩陣X是非隨機的,且X的秩ρ=k+1,即X滿秩。假設(shè)2,)????

????E(μ=E?M?=?M?=0

?μn??E(μn)???2?1??????

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論