




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1第二章 單方程計量經(jīng)濟學(xué)模型理論與方法Theory and Methodology of Single-Equation Econometric Model 2第一節(jié) 回歸分析概述一、變量間的關(guān)系及回歸分析的基本概念 二、總體回歸函數(shù)三、隨機擾動項四、樣本回歸函數(shù)(SRF)3一.變量之間的關(guān)系 現(xiàn)象(事物) 統(tǒng)計上 變量之間 之間的關(guān)系 數(shù)學(xué)上 的關(guān)系 函數(shù)關(guān)系(確定性關(guān)系): Y=f(X); 變量關(guān)系 統(tǒng)計(或相關(guān))關(guān)系(不確定關(guān)系): XY. 1.函數(shù)關(guān)系: 一個變量(X)的變化能完全決定另外一個變量的變化,即它們之間有精確的函數(shù)關(guān)系式 Y=f(X).一、變量間的關(guān)系及回歸分析的基本概念
2、4例如: Taxi收費(Y)和行駛里程(X)的關(guān)系:Y=aX+b5二.統(tǒng)計(相關(guān))關(guān)系:變量之間有密切關(guān)系,但密切程度并沒有達到由一個完全確定另一個的程度,即不能找到一個精確的函數(shù)關(guān)系式來描述這種關(guān)系,這種關(guān)系就稱為統(tǒng)計關(guān)系(或相關(guān)關(guān)系). 比如:6 相關(guān)分析(Correlation analysis) 統(tǒng)計關(guān)系的研究 回歸分析(Regression analysis)7 相關(guān)分析對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的。回歸分析對變量的處理方法存在不對稱性,即區(qū)分因變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是。注意:8 回歸分析(regression anal
3、ysis)是研究一個變量關(guān)于另一些變量的具體統(tǒng)計依賴關(guān)系的計算方法和理論。 其用意:在于通過后者的已知或設(shè)定值,去估計和(或)預(yù)測前者的(總體)均值。 2、回歸分析的基本概念 例2.1:一個社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系。9 1)該社區(qū)每月家庭消費支出Y與每月可支配收入X的關(guān)系? 2)如果知道了家庭的月收入,預(yù)測該社區(qū)家庭的平均月 消費支出水平?這里: 前一個變量被稱為被解釋變量(Explained Variable)或因變量(Dep-endent Variable),后一個(些)變量被稱為解釋變量(Explanatory Variable)
4、或自變量(Independent Variable)。如果該社區(qū)全體家庭月收入和消費支出情況未知?,F(xiàn)從該社區(qū)家庭中抽樣10個家庭調(diào)查,獲得如下數(shù)據(jù)10 回歸分析構(gòu)成計量經(jīng)濟學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括: (1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估 計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)利用回歸方程進行分析、評價及預(yù)測。11 在給定解釋變量X1 ,X2 , Xk條件下被解釋變量Y的期望軌跡稱為總體回歸線(population regre- ssion line),或更一般地稱為總體回歸曲線(popu lation regression curve)。稱為總體回歸
5、函數(shù)(population regression function, PRF)。 相應(yīng)的函數(shù): 二、總體回歸函數(shù)12 回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。含義: 函數(shù)形式: 可以是線性或非線性的。 例2.1中,將居民消費支出看成是其可支配收入的線性函數(shù)時: 為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regression coefficients)。 13 三、隨機擾動項 總體回歸函數(shù)確定了在給定解釋變量X1 ,X2 , Xk取值的條件下,被解釋變量Y的期望值(平均水平)。 但被解釋變量Y的觀察值Yi可能與該平均水平有偏差。稱i為觀察值Y
6、i圍繞它的期望值E(Y| X1i ,X2i , Xki)的離差(deviation),是一個不可預(yù)測的隨機變量,又稱為隨機干擾項(stochastic disturbance)或隨機誤差項(stochastic error)。 記(*)14例2.1中,個別家庭的消費支出為: (*)式稱為總體回歸函數(shù)(方程,PRF)的隨機設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。 (1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分。 (2)其他隨機或非確定性(nonsystematic)部分i
7、。即,給定收入水平Xi ,個別家庭的支出可表示為兩部分之和: 由于方程中引入了隨機項,成為計量經(jīng)濟學(xué)模型,因此也稱為總體回歸模型。15隨機誤差項主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測值的觀測誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機因素的影響。16四、樣本回歸函數(shù)(SRF) 問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息? 問:能否從該樣本估計總體回歸函數(shù)PRF? 例:一個社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關(guān)系?,F(xiàn)從該總體中得到如下一個樣本, 總體的信息往往無法掌握,
8、現(xiàn)實的情況只能是在一次觀測中得到總體的一個樣本。17核樣本的散點圖(scatter diagram): 樣本散點圖近似于一條函數(shù)曲線(直線),畫一條函數(shù)曲線(直線)以盡好地擬合該散點圖,由于樣本取自總體,可以該線近似地代表總體回歸線。該線稱為樣本回歸線(sample regression lines)。 記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sample regression function,SRF)。 18 這里將樣本回歸線看成總體回歸線的近似替代即 注意:19 樣本回歸函數(shù)的隨機形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式: 由于方程中引入了隨機項,成為計量經(jīng)濟模型,
9、因此也稱為樣本回歸模型(sample regression model)。 20 回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。注意:這里PRF可能永遠無法知道。即,根據(jù) 估計21第二節(jié) 一元線性回歸模型 一元線性回歸模型的參數(shù)估計 一元線性回歸模型檢驗一元線性回歸模型預(yù)測實例22單方程計量經(jīng)濟學(xué)模型分為兩大類: 線性模型和非線性模型線性模型中,變量之間的關(guān)系呈線性關(guān)系非線性模型中,變量之間的關(guān)系呈非線性關(guān)系 一元線性回歸模型:只有一個解釋變量 i=1,2,nY為被解釋變量,X為解釋變量,0與1為待估參數(shù), 為隨機干擾項(一) 一元線性回歸模型的參數(shù)估計 23 回歸分析的
10、主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準(zhǔn)確地估計總體回歸函數(shù)(模型)PRF。 估計方法有多種,其種最廣泛使用的是普通最小二乘法(ordinary least squares, OLS)。 為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。 注:實際這些假設(shè)與所采用的估計方法緊密相關(guān)。 24 一、線性回歸模型的基本假設(shè) 假設(shè)1、 隨機誤差項i不序列相關(guān)性: Cov(i, j)=0 ij i,j= 1,2, ,n 假設(shè)2、 隨機誤差項與解釋變量X之間不相關(guān): Cov(Xi, i)=0 i=1,2, ,n 假設(shè)3、 i服從零均值同方差的正態(tài)分布 iN(0, 2 ) i=1,2,
11、,n 以上假設(shè)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(Classical Linear Regression Model, CLRM)。 25 另外,在進行模型回歸時,還有兩個暗含的假設(shè): 假設(shè)4:隨著樣本容量的無限增加,解釋變量X的樣本方差趨于一有限常數(shù)。即 假設(shè)5:回歸模型是正確設(shè)定的 假設(shè)4旨在排除時間序列數(shù)據(jù)出現(xiàn)持續(xù)上升或下降的變量作為解釋變量,因為這類數(shù)據(jù)不僅使大樣本統(tǒng)計推斷變得無效,而且往往產(chǎn)生所謂的偽回歸問題(spurious regr-ession problem)。 假設(shè)5也被稱為模型沒有設(shè)定偏誤(specifi
12、cation error)26二、參數(shù)的普通最小二乘估計(OLS) 給定一組樣本觀測值(Xi, Yi)(i=1,2,n)要求樣本回歸函數(shù)盡可能好地擬合這組值. 普通最小二乘法(Ordinary least squares, OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小。27方程組(*)稱為正規(guī)方程組(normal equations)。 28記上述參數(shù)估計量可以寫成: 稱為OLS估計量的離差形式(deviation form)。 由于參數(shù)的估計結(jié)果是通過最小二乘法得到的,故稱為普通最小二乘估計量(ordinary least squares estimators)。 29順便指出 ,記則有
13、可得 (*)式也稱為樣本回歸函數(shù)的離差形式。(*)注意: 在計量經(jīng)濟學(xué)中,往往以小寫字母表示對均值的離差。 30 三、參數(shù)估計的最大似然法(ML) 最大似然法(Maximum Likelihood,簡稱ML) 是不同于最小二乘法的另一種參數(shù)估計方法,是從最大似然原理出發(fā)發(fā)展起來的其它估計方法的基礎(chǔ)。 基本原理: 對于最大似然法,當(dāng)從模型總體隨機抽取n組樣本觀測值后,最合理的參數(shù)估計量應(yīng)該使得從模型中抽取該n組樣本觀測值的概率最大。31在滿足基本假設(shè)條件下,對一元線性回歸模型: 隨機抽取n組樣本觀測值(Xi, Yi)(i=1,2,n)。 那么Yi服從如下的正態(tài)分布:于是,Y的概率函數(shù)為(i=1,
14、2,n) 32因為Yi是相互獨立的,所以的所有樣本觀測值的聯(lián)合概率,也即似然函數(shù)(likelihood function)為: 將該似然函數(shù)極大化,即可求得到模型參數(shù)的極大或然估計量。33 由于或然函數(shù)的極大化與或然函數(shù)的對數(shù)的極大化是等價的,所以,取對數(shù)或然函數(shù)如下:34解得模型的參數(shù)估計量為: 可見,在滿足一系列基本假設(shè)的情況下,模型結(jié)構(gòu)參數(shù)的最大或然估計量與普通最小二乘估計量是相同的。35 例1:在家庭可支配收入-消費支出例中,對于所抽出的一組樣本數(shù),參數(shù)估計的計算可通過下面的表2.2.1進行。 36因此,由該樣本估計的回歸方程為: 37 四、最小二乘估計量的性質(zhì) 當(dāng)模型參數(shù)估計出后,需
15、考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質(zhì)。 一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性: (1)線性性,即它是否是另一隨機變量的線性函數(shù); (2)無偏性,即它的均值或期望值是否等于總體的真實值; (3)有效性,即它是否在所有線性無偏估計量中具有最小方差。38(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。 這三個準(zhǔn)則也稱作估計量的小樣本性質(zhì)。 擁有這類性質(zhì)的估計量
16、稱為最佳線性無偏估計量(best liner unbiased estimator, BLUE)。 當(dāng)不滿足小樣本性質(zhì)時,需進一步考察估計量的大樣本或漸近性質(zhì):39高斯馬爾可夫定理(Gauss-Markov theorem) 在給定經(jīng)典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。40證:易知故同樣地,容易得出 4142(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明 普通最小二乘估計量(ordinary least Squares Estimators)稱為最佳線性無偏估計量(best linear unbiased estimator, BLUE
17、) 43 由于最小二乘估計量擁有一個“好”的估計量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。 44 五、參數(shù)估計量的概率分布及隨機干擾項方差的估計 45462、隨機誤差項的方差2的估計 由于隨機項i不可觀測,只能從i的估計殘差ei出發(fā),對總體方差進行估計。 2又稱為總體方差。 可以證明,2的最小二乘估計量為它是關(guān)于2的無偏估計量。 47 在最大似然估計法中, 因此, 2的最大或然估計量不具無偏性,但卻具有一致性。 4849(二)一元線性回歸模型的統(tǒng)計檢驗 通過參數(shù)估計得到總體回歸函數(shù)的估計表達式樣本回歸函數(shù)以后,還必須對樣本回歸函數(shù)能否代表總體回歸函數(shù)進行統(tǒng)計推斷,即進行所謂的統(tǒng)計檢驗。主
18、要包括擬合優(yōu)度檢驗、變量的顯著性檢驗及參數(shù)的區(qū)間估計。50一、擬合優(yōu)度檢驗 擬合優(yōu)度檢驗:對樣本回歸直線與樣本觀測值之間擬合程度的檢驗。 度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2 問題:采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?51 1、總離差平方和的分解 已知由一組樣本觀測值(Xi , Yi),i=1,2,n得到如下樣本回歸直線 52 如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。53 對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:記總體平方和(Total Su
19、m of Squares)回歸平方和(Explained Sum of Squares)殘差平方和(Residual Sum of Squares )54TSS=ESS+RSS Y的觀測值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變, 如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此 擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS552、可決系數(shù)R2統(tǒng)計量 稱 R2 為(樣本)可決系數(shù)/判定系數(shù)(coefficient of determination)。 可決系數(shù)的
20、取值范圍:0,1 R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。56 在例2.1.1的收入-消費支出例中, 57 二、變量的顯著性檢驗 回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。 在一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著性檢驗。 變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計學(xué)中的假設(shè)檢驗。 計量經(jīng)計學(xué)中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。 58 1、假設(shè)檢驗 所謂假設(shè)檢驗,就是事先對總體作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。
21、 假設(shè)檢驗采用的邏輯推理方法是反證法。 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。 判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的。 即在一次抽樣中,小概率事件(P t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ;64 對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗: 在上述收入-消費支出例中,首先計算2的估計值 65t統(tǒng)計量的計算結(jié)果分別為: 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收
22、入在95%的置信度下顯著,即是消費支出的主要解釋變量; |t2|2.306,表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。 66 假設(shè)檢驗可以通過一次抽樣的結(jié)果檢驗總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計。 三、參數(shù)的置信區(qū)間 67 如果存在這樣一個區(qū)間,稱之為置信區(qū)間(confidence interval);
23、1-稱為置信系數(shù)(置信度)(confidence coefficient), 稱為顯著性水平(level of significance);置信區(qū)間的端點稱為置信限(confidence limit)或臨界值(critical values)。68一元線性模型中,i (i=1,2)的置信區(qū)間:在變量的顯著性檢驗中已經(jīng)知道: 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: 即69于是得到:(1-)的置信度下, i的置信區(qū)間是 在上述收入-消費支出例中,如果給定 =0.01,查表得: 由于于是,1、0的置信區(qū)
24、間分別為: (0.6345,0.9195) (-433.32,226.98) 70 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。 要縮小置信區(qū)間,需 (1)增大樣本容量n,因為在同樣的置信水平下,n越大,t分布表中的臨界值越?。煌瑫r,增大樣本容量,還可使樣本參數(shù)估計量的標(biāo)準(zhǔn)差減??; (2)提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。71(三). 一元線性回歸分析的應(yīng)用:預(yù)測問題 對于一元線性回歸模型 給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預(yù)測值0 ,可以此作為其條件均值
25、E(Y|X=X0)或個別值Y0的一個近似估計。 注意:嚴格地說,這只是被解釋變量的預(yù)測值的估計值,而不是預(yù)測值。 原因:(1)參數(shù)估計量不確定; (2)隨機項的影響72一、0是條件均值E(Y|X=X0)的一個無偏估計對總體回歸函數(shù)E(Y|X=X0)=0+1X,X=X0時 E(Y|X=X0)=0+1X0于是可見,0是條件均值E(Y|X=X0)的無偏估計。73 二、總體條件均值與個值預(yù)測值的置信區(qū)間 1、總體均值預(yù)測值的置信區(qū)間 由于 于是可以證明 74因此 故 其中于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為 752、總體個值預(yù)測值的預(yù)測區(qū)間 由 Y0=0+1X0+ 知: 于是 式
26、中 :從而在1-的置信度下, Y0的置信區(qū)間為 76在上述收入-消費支出例中,得到的樣本回歸函數(shù)為 則在 X0=1000處, 0 = 103.172+0.7771000=673.84 而 因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為: 673.84-2.30661.05 E(Y|X=1000) 673.84+2.30661.05或 (533.05, 814.62) 77同樣地,對于Y在X=1000的個體值,其95%的置信區(qū)間為: 673.84 - 2.30661.05Yx=1000 673.84 + 2.30661.05或 (372.03, 975.65) 總體回歸函數(shù)的置信帶(域
27、)(confidence band) 個體的置信帶(域) 78 對于Y的總體均值E(Y|X)與個體值的預(yù)測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低;(2)樣本容量一定時,置信帶的寬度當(dāng)在X均值處最小,其附近進行預(yù)測(插值預(yù)測)精度越大;X越遠離其均值,置信帶越寬,預(yù)測可信度下降。79 一、中國居民人均消費模型 例2 考察中國居民收入與消費支出的關(guān)系。GDPP: 人均國內(nèi)生產(chǎn)總值(1990年不變價)CONSP:人均居民消費(以居民消費價格指數(shù)(1990=100)縮減)。(四) 實例:時間序列問題 80 該兩組數(shù)據(jù)是19782000年的時間序列數(shù)據(jù)(time seri
28、es data); 1、建立模型 擬建立如下一元回歸模型 采用Eviews軟件進行回歸分析的結(jié)果見下表 前述收入-消費支出例中的數(shù)據(jù)是截面數(shù)據(jù)(cross-sectional data)。81一般可寫出如下回歸分析結(jié)果: (13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 82 2、模型檢驗 R2=0.9927T值:C:13.51, GDPP:53.47 臨界值: t0.05/2(21)=2.08斜率項:00.38621,符合絕對收入假說3、預(yù)測 2001年:GDPP=4033.1(元)(90年不變價) 點估計:CONSP2001=201.107 + 0
29、.38624033.1 = 1758.7(元) 2001年實測的CONSP(1990年價):1782.2元, 相對誤差: -1.32%。 832001年人均居民消費的預(yù)測區(qū)間 人均GDP的樣本均值與樣本方差: E(GDPP)=1823.5 Var(GDPP)=982.042=964410.4 在95%的置信度下,E(CONSP2001)的預(yù)測區(qū)間為: =1758.740.13或: (1718.6,1798.8) 同樣地,在95%的置信度下,CONSP2001的預(yù)測區(qū)間為: =1758.786.57或 (1672.1, 1845.3) 84 二、時間序列問題 上述實例表明,時間序列完全可以進行類
30、似于截面數(shù)據(jù)的回歸分析。 然而,在時間序列回歸分析中,有兩個需注意的問題: 第一,關(guān)于抽樣分布的理解問題。 能把表2.5.1中的數(shù)據(jù)理解為是從某個總體中抽出的一個樣本嗎?85 第二,關(guān)于“偽回歸問題”(spurious regression problem)。 在現(xiàn)實經(jīng)濟問題中,對時間序列數(shù)據(jù)作回歸,即使兩個變量間沒有任何的實際聯(lián)系,也往往會得到較高的可決系數(shù),尤其對于具有相同變化趨勢(同時上升或下降)的變量,更是如此。 這種現(xiàn)象被稱為“偽回歸”或“虛假回歸”。 86第三節(jié) 經(jīng)典單方程計量經(jīng)濟學(xué)模型:多元線性回歸 多元線性回歸模型 多元線性回歸模型的參數(shù)估計多元線性回歸模型的統(tǒng)計檢驗多元線性回
31、歸模型的預(yù)測回歸模型的其他形式回歸模型的參數(shù)約束87一、多元線性回歸模型 多元線性回歸模型:表現(xiàn)在線性回歸模型中的解釋變量有多個。 一般表現(xiàn)形式:i=1,2,n其中:k為解釋變量的數(shù)目,j稱為回歸參數(shù)(regression coefficient)。 習(xí)慣上:把常數(shù)項看成為一虛變量的系數(shù),該虛變量的樣本觀測值始終取1。這樣: 模型中解釋變量的數(shù)目為(k+1) (一) 多元線性回歸模型 88也被稱為總體回歸函數(shù)的隨機表達形式。它 的非隨機表達式為: 方程表示:各變量X值固定時Y的平均響應(yīng)。 j也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個單位時,Y的均值E(Y)的變化;
32、或者說j給出了Xj的單位變化對Y均值的“直接”或“凈”(不含其他變量)影響。89總體回歸模型n個隨機方程的矩陣表達式為 其中90樣本回歸函數(shù):用來估計總體回歸函數(shù)其隨機表示式: ei稱為殘差或剩余項(residuals),可看成是總體回歸函數(shù)中隨機擾動項i的近似替代。 樣本回歸函數(shù)的矩陣表達: 或其中:91二、多元線性回歸模型的基本假定 假設(shè)1,解釋變量是非隨機的或固定的,且各X之間互不相關(guān)(無多重共線性)。 假設(shè)2,隨機誤差項具有零均值、同方差及不序列相關(guān)性 假設(shè)3,解釋變量與隨機項不相關(guān) 假設(shè)4,隨機項滿足正態(tài)分布 92上述假設(shè)的矩陣符號表示 式: 假設(shè)1,n(k+1)矩陣X是非隨機的,且
33、X的秩=k+1,即X滿秩。 假設(shè)2, 93假設(shè)4,向量 有一多維正態(tài)分布,即 同一元回歸一樣,多元回歸還具有如下兩個重要假設(shè): 假設(shè)5,樣本容量趨于無窮時,各解釋變量的方差趨于有界常數(shù),即n時, 或 其中:Q為一非奇異固定矩陣,矩陣x是由各解釋變量的離差為元素組成的nk階矩陣 假設(shè)6,回歸模型的設(shè)定是正確的。 94(二) 多元線性回歸模型的估計 估計方法:OLS、ML或者MM一、普通最小二乘估計 *二、最大或然估計 *三、矩估計 四、參數(shù)估計量的性質(zhì) 五、樣本容量問題 六、估計實例 95一、普通最小二乘估計對于隨機抽取的n組觀測值如果樣本函數(shù)的參數(shù)估計值已經(jīng)得到,則有: i=1,2n根據(jù)最小二
34、乘原理,參數(shù)估計值應(yīng)該是下列方程組的解 其中96于是得到關(guān)于待估參數(shù)估計值的正規(guī)方程組: 97正規(guī)方程組的矩陣形式即由于XX滿秩,故有 98將上述過程用矩陣表示如下: 即求解方程組:得到: 于是:99例3:在例2的家庭收入-消費支出例中, 可求得 于是 100正規(guī)方程組 的另一種寫法對于正規(guī)方程組 于是 或 (*)或(*)是多元線性回歸模型正規(guī)方程組的另一種寫法 (*)(*)101樣本回歸函數(shù)的離差形式i=1,2n其矩陣形式為 其中 :在離差形式下,參數(shù)的最小二乘估計結(jié)果為 102隨機誤差項的方差的無偏估計 可以證明,隨機誤差項的方差的無偏估計量為 103 *二、最大或然估計 對于多元線性回歸
35、模型易知 Y的隨機抽取的n組樣本觀測值的聯(lián)合概率即為變量Y的似然函數(shù) 104對數(shù)或然函數(shù)為對對數(shù)或然函數(shù)求極大值,也就是對 求極小值。 因此,參數(shù)的最大或然估計為結(jié)果與參數(shù)的普通最小二乘估計相同105*三、矩估計(Moment Method, MM) OLS估計是通過得到一個關(guān)于參數(shù)估計值的正規(guī)方程組并對它進行求解而完成的。 該正規(guī)方程組 可以從另外一種思路來導(dǎo): 求期望 :106稱為原總體回歸方程的一組矩條件,表明了原總體回歸方程所具有的內(nèi)在特征。 由此得到正規(guī)方程組 解此正規(guī)方程組即得參數(shù)的MM估計量。 易知MM估計量與OLS、ML估計量等價。107矩方法是工具變量方法(Instrumen
36、tal Variables,IV)和廣義矩估計方法(Generalized Moment Method, GMM)的基礎(chǔ) 在矩方法中關(guān)鍵是利用了 E(X)=0 如果某個解釋變量與隨機項相關(guān),只要能找到1個工具變量,仍然可以構(gòu)成一組矩條件。這就是IV。 如果存在k+1個變量與隨機項不相關(guān),可以構(gòu)成一組包含k+1方程的矩條件。這就是GMM。108 四、參數(shù)估計量的性質(zhì) 在滿足基本假設(shè)的情況下,其結(jié)構(gòu)參數(shù)的普通最小二乘估計、最大或然估計及矩估計仍具有: 線性性、無偏性、有效性。 同時,隨著樣本容量增加,參數(shù)估計量具有: 漸近無偏性、漸近有效性、一致性。 1、線性性 其中,C=(XX)-1 X 為一僅
37、與固定的X有關(guān)的行向量 109 2、無偏性 這里利用了假設(shè): E(X)=0 3、有效性(最小方差性) 110其中利用了 和111 五、樣本容量問題 所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數(shù)估計量,不管其質(zhì)量如何,所要求的樣本容量的下限。 最小樣本容量 樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項),即 n k+1因為,無多重共線性要求:秩(X)=k+1112 2、滿足基本要求的樣本容量 從統(tǒng)計檢驗的角度: n30 時,Z檢驗才能應(yīng)用; n-k8時, t分布較為穩(wěn)定 一般經(jīng)驗認為: 當(dāng)n30或者至少n3(k+1)時,才能說滿足模型估計的基本要求。 模型的良好
38、性質(zhì)只有在大樣本下才能得到理論上的證明113 六、多元線性回歸模型的參數(shù)估計實例 例3 在例2中,已建立了中國居民人均消費一元線性模型。這里我們再考慮建立多元線性模型。解釋變量:人均GDP:GDPP 前期消費:CONSP(-1)估計區(qū)間:19792000年114Eviews軟件估計結(jié)果 115(三) 多元線性回歸模型的統(tǒng)計檢驗 一、擬合優(yōu)度檢驗 二、方程的顯著性檢驗(F檢驗) 三、變量的顯著性檢驗(t檢驗) 四、參數(shù)的置信區(qū)間 116 一、擬合優(yōu)度檢驗 1、可決系數(shù)與調(diào)整的可決系數(shù)則 總離差平方和的分解117由于 =0所以有: 注意:一個有趣的現(xiàn)象118 可決系數(shù)該統(tǒng)計量越接近于1,模型的擬合
39、優(yōu)度越高。 問題: 在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個解釋變量, R2往往增大(Why?) 這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可。 但是,現(xiàn)實情況往往是,由增加解釋變量個數(shù)引起的R2的增大與擬合好壞無關(guān),R2需調(diào)整。119 調(diào)整的可決系數(shù)(adjusted coefficient of determination) 在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數(shù)對擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。120121 *2、赤池信息準(zhǔn)則和施
40、瓦茨準(zhǔn)則 為了比較所含解釋變量個數(shù)不同的多元回歸模型的擬合優(yōu)度,常用的標(biāo)準(zhǔn)還有: 赤池信息準(zhǔn)則(Akaike information criterion, AIC)施瓦茨準(zhǔn)則(Schwarz criterion,SC) 這兩準(zhǔn)則均要求僅當(dāng)所增加的解釋變量能夠減少AIC值或AC值時才在原模型中增加該解釋變量。 122 Eviews的估計結(jié)果顯示: 中國居民消費二元例中: AIC=6.68 AC=6.83 中國居民消費一元例中: AIC=7.09 AC=7.19從這點看,可以說前期人均居民消費CONSP(-1)應(yīng)包括在模型中。 123 二、方程的顯著性檢驗(F檢驗) 方程的顯著性檢驗,旨在對模型中
41、被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。 1、方程顯著性的F檢驗 即檢驗?zāi)P?Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n是否顯著。 可提出如下原假設(shè)與備擇假設(shè): H0: 0=1=2= =k=0 H1: j不全為0124 F檢驗的思想來自于總離差平方和的分解式: TSS=ESS+RSS 如果這個比值較大,則X的聯(lián)合體對Y的解釋程度高,可認為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。 因此,可通過該比值的大小對總體線性關(guān)系進行推斷。125 根據(jù)數(shù)理統(tǒng)計學(xué)中的知識,在原假設(shè)H0成立的條件下,統(tǒng)計量 服從自由度為(k , n-k-1)的F分布 給定
42、顯著性水平,可得到臨界值F(k,n-k-1),由樣本求出統(tǒng)計量F的數(shù)值,通過 F F(k,n-k-1) 或 FF(k,n-k-1)來拒絕或接受原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。 126對于中國居民人均消費支出的例子: 一元模型:F=285.92 二元模型:F=2057.3給定顯著性水平 =0.05,查分布表,得到臨界值: 一元例:F(1,21)=4.32 二元例: F(2,19)=3.52顯然有 F F(k,n-k-1) 即二個模型的線性關(guān)系在顯著性水平 =0.05下顯著成立。127 2、關(guān)于擬合優(yōu)度檢驗與方程顯著性檢驗關(guān)系的討論 由可推出:與或128在中國居民人均收入-消
43、費一元模型中,在中國居民人均收入-消費二元模型中, 129 三、變量的顯著性檢驗(t檢驗) 方程的總體線性關(guān)系顯著每個解釋變量對被解釋變量的影響都是顯著的 因此,必須對每個解釋變量進行顯著性檢驗,以決定是否作為解釋變量被保留在模型中。 這一檢驗是由對變量的 t 檢驗完成的。130 1、t統(tǒng)計量 由于 以cii表示矩陣(XX)-1 主對角線上的第i個元素,于是參數(shù)估計量的方差為: 其中2為隨機誤差項的方差,在實際計算時,用它的估計量代替: 131因此,可構(gòu)造如下t統(tǒng)計量 132 2、t檢驗 設(shè)計原假設(shè)與備擇假設(shè): H1:i0 給定顯著性水平,可得到臨界值t/2(n-k-1),由樣本求出統(tǒng)計量t的
44、數(shù)值,通過 |t| t/2(n-k-1) 或 |t|t/2(n-k-1)來拒絕或接受原假設(shè)H0,從而判定對應(yīng)的解釋變量是否應(yīng)包括在模型中。 H0:i=0 (i=1,2k) 133注意:一元線性回歸中,t檢驗與F檢驗一致 一方面,t檢驗與F檢驗都是對相同的原假設(shè)H0:1=0 進行檢驗; 另一方面,兩個統(tǒng)計量之間有如下關(guān)系: 134在中國居民人均收入-消費支出二元模型例中,由應(yīng)用軟件計算出參數(shù)的t值: 給定顯著性水平=0.05,查得相應(yīng)臨界值: t0.025(19) =2.093。可見,計算的所有t值都大于該臨界值,所以拒絕原假設(shè)。即:包括常數(shù)項在內(nèi)的3個解釋變量都在95%的水平下顯著,都通過了變
45、量顯著性檢驗。135 四、參數(shù)的置信區(qū)間 參數(shù)的置信區(qū)間用來考察:在一次抽樣中所估計的參數(shù)值離參數(shù)的真實值有多“近”。 在變量的顯著性檢驗中已經(jīng)知道:容易推出:在(1-)的置信水平下i的置信區(qū)間是 其中,t/2為顯著性水平為 、自由度為n-k-1的臨界值。 136 在中國居民人均收入-消費支出二元模型例中,給定=0.05,查表得臨界值:t0.025(19)=2.093計算得參數(shù)的置信區(qū)間: 0 :(44.284, 197.116) 1 : (0.0937, 0.3489 ) 2 :(0.0951, 0.8080) 從回歸計算中已得到:137如何才能縮小置信區(qū)間? 增大樣本容量n,因為在同樣的樣
46、本容量下,n越大,t分布表中的臨界值越小,同時,增大樣本容量,還可使樣本參數(shù)估計量的標(biāo)準(zhǔn)差減??;提高模型的擬合優(yōu)度,因為樣本參數(shù)估計量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型優(yōu)度越高,殘差平方和應(yīng)越小。提高樣本觀測值的分散度,一般情況下,樣本觀測值越分散,(XX)-1的分母的|XX|的值越大,致使區(qū)間縮小。138(四)多元線性回歸模型的預(yù)測 一、E(Y0)的置信區(qū)間 二、Y0的置信區(qū)間139對于模型 給定樣本以外的解釋變量的觀測值X0=(1,X10,X20,Xk0),可以得到被解釋變量的預(yù)測值: 它可以是總體均值E(Y0)或個值Y0的預(yù)測。 但嚴格地說,這只是被解釋變量的預(yù)測值的估計值,而不是預(yù)測值。
47、 為了進行科學(xué)預(yù)測,還需求出預(yù)測值的置信區(qū)間,包括E(Y0)和Y0的置信區(qū)間。 140 一、E(Y0)的置信區(qū)間易知 141容易證明 于是,得到(1-)的置信水平下E(Y0)的置信區(qū)間: 其中,t/2為(1-)的置信水平下的臨界值。142 二、Y0的置信區(qū)間 如果已經(jīng)知道實際的預(yù)測值Y0,那么預(yù)測誤差為:容易證明 143e0服從正態(tài)分布,即 構(gòu)造t統(tǒng)計量 可得給定(1-)的置信水平下Y0的置信區(qū)間: 144 中國居民人均收入-消費支出二元模型例中:2001年人均GDP:4033.1元, 于是人均居民消費的預(yù)測值為 2001=120.7+0.22134033.1+0.45151690.8=177
48、6.8(元) 實測值(90年價)=1782.2元,相對誤差:-0.31% 預(yù)測的置信區(qū)間 :145于是E(2001)的95%的置信區(qū)間為: 或 (1741.8,1811.7)或 (1711.1, 1842.4) 同樣,易得2001的95%的置信區(qū)間為146第四節(jié) 回歸模型的其他函數(shù)形式 一、模型的類型與變換 二、非線性回歸實例147 在實際經(jīng)濟活動中,經(jīng)濟變量的關(guān)系是復(fù)雜的,直接表現(xiàn)為線性關(guān)系的情況并不多見。 如著名的恩格爾曲線(Engle curves)表現(xiàn)為冪函數(shù)曲線形式、宏觀經(jīng)濟學(xué)中的菲利普斯曲線(Pillips cuves)表現(xiàn)為雙曲線形式等。 但是,大部分非線性關(guān)系又可以通過一些簡單的數(shù)學(xué)處理,使之化為數(shù)學(xué)上的線性關(guān)系,從而可以運用線性回歸的方法進行計量經(jīng)濟學(xué)方面的處理。148 一、模型的類型與變換 1、倒數(shù)模型、多項式模型與變量的直接置換法 例如,描述稅收與稅率關(guān)系的拉弗曲線:拋物線 s = a + b r + c r2 c0 s:稅收; r:稅率設(shè)X1 = r,X2 = r2, 則原方程變換為 s = a + b X1 + c X2 ck。 如果出現(xiàn)n2F(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 律所托管輔合同范本
- 書桌采購合同范本
- 制定合同范本意義
- 瓷磚鋪貼施工合同范本
- 南水北調(diào)供水合同范本
- 蘇州市勞動合同范本
- 包月鮮花合同范本
- 樂隊駐唱合同范本
- 合作養(yǎng)魚協(xié)議合同范本
- 合伙安裝水電合同范本
- 旅游景區(qū)股份合作開發(fā)協(xié)議書范本
- 2025年湖南有色金屬職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫匯編
- 學(xué)情分析方案及學(xué)情分析報告范文
- 《急性冠狀動脈綜合征》課件
- 【博觀研究院】2025年跨境進口保健品市場分析報告
- 游戲直播平臺推廣合作協(xié)議
- 《高科技服裝與面料》課件
- 《馬克思生平故事》課件
- 2024-2025學(xué)年四川省成都市高一上學(xué)期期末教學(xué)質(zhì)量監(jiān)測英語試題(解析版)
- HRBP工作總結(jié)與計劃
- 八大危險作業(yè)安全培訓(xùn)考試試題及答案
評論
0/150
提交評論