違背模型基本假設(shè)_第1頁(yè)
違背模型基本假設(shè)_第2頁(yè)
違背模型基本假設(shè)_第3頁(yè)
違背模型基本假設(shè)_第4頁(yè)
違背模型基本假設(shè)_第5頁(yè)
已閱讀5頁(yè),還剩210頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第四章:違背基本假設(shè)的問(wèn)題2違背基本假定的各種情形:(1)隨機(jī)誤差項(xiàng)序列存在異方差性(heteroskedasticity);(2)隨機(jī)誤差項(xiàng)序列存在自相關(guān)性(autocorrelation);(3)解釋變量之間存在多重共線性(MultiCollinearity);(4)解釋變量為隨機(jī)變量;

回顧:經(jīng)典線性回歸模型的基本假定條件。3OLS法是否還適用?所得參數(shù)的OLS估計(jì)量是否還具有優(yōu)良的統(tǒng)計(jì)性質(zhì)?變量顯著性t檢驗(yàn)和方程顯著性F檢驗(yàn)還有效嗎?如果OLS法失效,有哪些補(bǔ)救措施?如何檢驗(yàn)?zāi)P褪欠襁`背基本假定條件?建立違背基本假定回歸模型存在的基本問(wèn)題:

本章主要討論不滿足基本假定中的某一條,而其余假定條件均成立時(shí),多元線性回歸模型參數(shù)的有效估計(jì)和檢驗(yàn)問(wèn)題。

4[內(nèi)容]共分4節(jié):

§4.1多重共線性

§4.2異方差性

§4.3自相關(guān)性

§4.4隨機(jī)解釋變量模型[目的]

討論違背基本假定的多元線性回歸模型的建模問(wèn)題(參數(shù)的估計(jì)、統(tǒng)計(jì)檢驗(yàn))。5[要求]1、理解多重共線性、異方差性、自相關(guān)性、隨機(jī)解釋變量的基本概念;

2、理解違背基本假定的各種情形產(chǎn)生的原因及(利用OLS法估計(jì)的)后果;

3、掌握估計(jì)各種違背基本假定的多元線性回歸模型的常用估計(jì)方法;

4、掌握檢驗(yàn)?zāi)P褪欠襁`背基本假定的常用檢驗(yàn)方法。[教學(xué)安排]

共12學(xué)時(shí)(每講3學(xué)時(shí))第一講§4.1

第二講§4.2

第三講§4.3

第四講§4.4和本章小結(jié)6§4.1多重共線性基本內(nèi)容:一、多重共線性的概念二、多重共的后果三、多重共線性的診斷四、多重共線性的處理7

在計(jì)量經(jīng)濟(jì)學(xué)中所謂的多重共線性,包括完全的多重共線性和不完全的多重共線性對(duì)于線性回歸模型一、多重共線性的概念

即8

完全的多重共線性:解釋變量之間存在完全的多重共線性是指,它意味著X的各列是線性相關(guān)的,即存在不全為0的數(shù),使得

顯然,解釋變量之間的完全多重共線性也意味著存在某一解釋變量的樣本數(shù)據(jù)能由其余解釋變量的樣本數(shù)據(jù)線性表示。若兩個(gè)解釋變量的序列線性相關(guān),則解釋變量之間存在完全的多重線性。9

不完全的多重共線性:解釋變量之間存在不完全的多重共線性,是指X的各列是近似線性相關(guān)的,即存在不全為0的數(shù),使得

顯然,解釋變量之間存在不完全的多重共線性意味著存在某一解釋變量的樣本數(shù)據(jù)能由其余解釋變量的樣本數(shù)據(jù)近似地線性表示。

多重共線性:解釋變量之間的完全多重共線性和不完全多重共線性的統(tǒng)稱,其本質(zhì)是解釋變量的樣本數(shù)據(jù)之間存在完全的或近似的線性相關(guān)性。10

一個(gè)基本結(jié)論:

當(dāng)解釋變量中有兩個(gè)變量的樣本數(shù)據(jù)之間高度相關(guān)時(shí),模型就存在較嚴(yán)重的多重共線性;但當(dāng)解釋變量?jī)蓛芍g的相關(guān)程度都很低時(shí),所有解釋變量之間仍可能存在較嚴(yán)重的多重共線性。

問(wèn)題:在多元線性回歸模型中,解釋變量之間存在多重共線性就是指解釋變量?jī)蓛晒簿€或高度相關(guān),對(duì)否?

特例:不可識(shí)別的情形。11用矩陣表示:在矩陣表示的線性回歸模型

Y=X+

中,完全共線性指:秩(X)<k+1,從而k+1階方陣X’X是不可逆的。即中,至少有一列向量可由其他列向量(不包括第一列)線性表出。

如:X2=X1,則X2對(duì)Y的作用可由X1代替。12

注意:完全共線性的情況并不多見(jiàn),一般出現(xiàn)的是在一定程度上的共線性,即近似共線性?!耆嘀毓簿€性和近似多重共線性統(tǒng)稱多重共線性。能夠進(jìn)行OLS估計(jì)嗎?完全多重共線性意味著13實(shí)際經(jīng)濟(jì)問(wèn)題中的多重共線性

一般地,產(chǎn)生多重共線性的主要原因有以下三個(gè)方面:

(1)經(jīng)濟(jì)變量相關(guān)的共同趨勢(shì)

時(shí)間序列樣本:經(jīng)濟(jì)繁榮時(shí)期,各基本經(jīng)濟(jì)變量(收入、消費(fèi)、投資、價(jià)格)都趨于增長(zhǎng);衰退時(shí)期,又同時(shí)趨于下降。橫截面數(shù)據(jù):生產(chǎn)函數(shù)中,資本投入與勞動(dòng)力投入往往出現(xiàn)高度相關(guān)情況,大企業(yè)二者都大,小企業(yè)都小。14(2)樣本數(shù)據(jù)自身的原因

抽樣中僅僅限于總體中解釋變量取值的一個(gè)有限范圍,使得變量的變異不大;或者由于總體受限,多個(gè)解釋變量的樣本數(shù)據(jù)之間存在相關(guān)性15

(3)滯后變量的引入

在經(jīng)濟(jì)計(jì)量模型中,往往需要引入滯后經(jīng)濟(jì)變量來(lái)反映真實(shí)的經(jīng)濟(jì)關(guān)系。

例如,消費(fèi)=f(當(dāng)期收入,前期收入)用GDP表示顯然,兩期收入間有較強(qiáng)的線性相關(guān)性。16

注意:由于完全符合理論模型所要求的樣本數(shù)據(jù)較難收集,特定樣本可能存在某種程度的多重共線性。在多元線性回歸模型中我們關(guān)心的不是多重共線性是否存在的問(wèn)題,而是其多重共線性程度的問(wèn)題。因?yàn)樵诂F(xiàn)實(shí)的經(jīng)濟(jì)問(wèn)題中變量之間完全不相關(guān)的現(xiàn)象很少見(jiàn),大多數(shù)變量之間或多或少都有一些相關(guān)性。

一般經(jīng)驗(yàn):時(shí)間序列數(shù)據(jù)樣本:簡(jiǎn)單線性模型,往往存在多重共線性。截面數(shù)據(jù)樣本:?jiǎn)栴}不那么嚴(yán)重,但多重共線性仍然是存在的。17二、多重共線性的后果

多重共線性的后果,是指當(dāng)模型存在多重共線性時(shí),利用OLS法估計(jì)參數(shù),可能會(huì)出現(xiàn)的后果。分如下兩種情形討論:1、完全多重共線性的情形參數(shù)的OLS估計(jì)量無(wú)法確定。

r

XiXj

=1,X為降秩矩陣,|X’X|=0,則(X’X)-1不存在,

(X‘X)-1X'Y不可計(jì)算。182、不完全多重共線性的情形

(1)嚴(yán)重的多重共線性會(huì)使模型的估計(jì)結(jié)果對(duì)數(shù)據(jù)的微小變化非常敏感,可能出現(xiàn)參數(shù)的估計(jì)值具有不合理的大小,甚至“錯(cuò)誤的”符號(hào),使回歸結(jié)果不能通過(guò)經(jīng)濟(jì)意義檢驗(yàn)。

rXiXj

1,但rXiXj

1,|X’X|0,仍具有無(wú)偏性。

E()=E[(X'X)-1X'Y]=E[(X'X)-1X'(X

+U)]=

+(X’X)-1X’E(U)=Var()=

2(X’X)-1中元素很大,參數(shù)標(biāo)準(zhǔn)差的估計(jì)值很大,置信區(qū)間很大,參數(shù)估計(jì)的效率降低。19

以二元線性模型

y=1x1+2x2+為例:

恰為X1與X2的線性相關(guān)系數(shù)的平方r2由于r2

1,故1/(1-r2)1。20多重共線性使參數(shù)估計(jì)值的方差增大,1/(1-r2)為方差膨脹因子(VarianceInflationFactor,VIF)當(dāng)完全不共線時(shí),r2

=0

當(dāng)近似共線時(shí),0<

r2

<1當(dāng)完全共線時(shí),r2=1,21對(duì)于模型:r232的95%置信區(qū)間0.000.500.990.999變大的方差容易使區(qū)間預(yù)測(cè)的“區(qū)間”變大,使預(yù)測(cè)失去意義。

(2)對(duì)于一定的置信度,由于參數(shù)估計(jì)量方差的增加,導(dǎo)致樣本回歸函數(shù)不穩(wěn)定,進(jìn)而可能使得對(duì)被解釋變量進(jìn)行預(yù)測(cè)的精度下降。22(3)對(duì)回歸系數(shù)估計(jì)參數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))失去意義回歸參數(shù)估計(jì)量的方差()變大X’X接近降秩矩陣,即

X’X

0存在高度的多重共線性使得t

統(tǒng)計(jì)量的值()變小接受H0:β=0(回歸系數(shù)不顯著)的概率增大

重要的解釋變量被舍去,檢驗(yàn)失去意義23

多重共線性檢驗(yàn)的任務(wù)是:

(1)檢驗(yàn)多重共線性是否存在;(2)估計(jì)多重共線性的范圍,即判斷哪些變量之間存在共線性。

多重共線性表現(xiàn)為解釋變量之間具有相關(guān)關(guān)系,所以用于多重共線性的檢驗(yàn)方法有:如綜合分析法、相關(guān)系數(shù)檢驗(yàn)法、輔助回歸檢驗(yàn)法、條件指數(shù)檢驗(yàn)法等。三、多重共線性的診斷24

當(dāng)模型的擬合優(yōu)度(R2)很高,F(xiàn)值很高,但每個(gè)回歸參數(shù)估計(jì)值的方差Var(j)又非常大(即t值很低)時(shí),說(shuō)明解釋變量間可能存在多重共線性。例如:中國(guó)電信業(yè)務(wù)總量變化的影響因素是郵政業(yè)務(wù)總量、中國(guó)人口數(shù)、市鎮(zhèn)人口占總?cè)丝诘谋戎?、人均GDP、全國(guó)居民人均消費(fèi)水平。

y=24.94+2.16x1–3.03x2+33.7x3+1.29x4-2.03x5+e(0.7)(1.6)(-0.8)(1.0)(1.5)(-1.2)

R2=0.99,F=106.3,DW=3.41.綜合分析法(常用)25

計(jì)算解釋變量之間的簡(jiǎn)單相關(guān)系數(shù)rXiXj

;或通過(guò)作兩解釋變量之間的散點(diǎn)圖來(lái)考察兩變量之間是否存在顯著的線性關(guān)系。

2.相關(guān)系數(shù)檢驗(yàn)X1X2X3X4X5X1

1.000000

0.989519

0.970025

0.962777

0.970291X2

0.989519

1.000000

0.988234

0.987184

0.988805X3

0.970025

0.988234

1.000000

0.967789

0.965389X4

0.962777

0.987184

0.967789

1.000000

0.998610X5

0.970291

0.988805

0.965389

0.998610

1.000000263.輔助回歸法(方差膨脹因子大于5或者10存在嚴(yán)重的多重共線性)Rj2是下面多元輔助回歸模型的可決系數(shù):

Xji=0+1X1i+…+j-1Xj-1i+j+1Xj+1i+…kXki+wi

對(duì)于2,輔助回歸模型的可決系數(shù)R2=0.9955,方差膨脹因子為:27

**max、min分別表示矩陣A的最大和最小特征值。由于特征根的值受A中各列尺度的影響,實(shí)際應(yīng)用中經(jīng)常將其各列長(zhǎng)度規(guī)范化為1。這就是書中將X’X轉(zhuǎn)換為S(X’X)S的原因。4.條件指數(shù)

為判定|X’X|是否接近于零,通常計(jì)算其條件指數(shù)CI:28

注意:

rank(X’X)=rank(X)。當(dāng)CI很大時(shí)就意味著X’X接近非滿秩,從而X的各列存在嚴(yán)重的共線性。實(shí)際經(jīng)驗(yàn)表明CI>20可認(rèn)為存在嚴(yán)重的多重共線性。29四、多重共線性的處理

當(dāng)模型存在較嚴(yán)重的多重共線性時(shí)的處理方法:1、不做處理;2、采用某些補(bǔ)救措施以減弱多重共線性對(duì)估計(jì)結(jié)果的影響。1、不做處理

當(dāng)模型的估計(jì)結(jié)果能夠通過(guò)經(jīng)濟(jì)意義檢驗(yàn),并且變量的顯著性檢驗(yàn)結(jié)果也合理時(shí),多重共線性并不是一個(gè)嚴(yán)重的問(wèn)題,可以不做任何處理,或者說(shuō),“無(wú)為而治”。30

另外,如果研究目的僅在于預(yù)測(cè)被解釋變量Y的值,而且各個(gè)解釋變量之間多重共線性關(guān)系的性質(zhì)在預(yù)測(cè)期將繼續(xù)保持,這時(shí)可決系數(shù)R2越高,預(yù)測(cè)就越準(zhǔn)確,對(duì)多重共線性問(wèn)題也可以不做處理。

分析:31

若多重共線性導(dǎo)致模型的估計(jì)出現(xiàn)了嚴(yán)重的后果,則應(yīng)該采取必要的措施減弱多重共線性引起的不良影響。這里介紹幾類常用的做法:2、補(bǔ)救措施

第一類做法:經(jīng)驗(yàn)做法

(1)剔除相對(duì)不重要的變量

(2)補(bǔ)充新樣本數(shù)據(jù)(3)利用先驗(yàn)信息(4)截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)并用(5)變換模型的形式32

時(shí)間序列數(shù)據(jù)、線性模型:將原模型變換為差分模型:將式(1)-式(2)得到

Yi=1X1i+2X2i++kXki+i可以有效地消除原模型中的多重共線性。

一般講,增量之間的線性關(guān)系遠(yuǎn)比總量之間的線性關(guān)系弱得多。這里t可以是任何一個(gè)時(shí)點(diǎn),因此對(duì)于t-1時(shí)點(diǎn)也會(huì)有:式(1)式(2)33第二類做法:逐步回歸法

逐步回歸法也稱為Frisch修正法,是處理多重共線性問(wèn)題的一種常用方法,其基本步驟是:(1)用被解釋變量分別對(duì)每一個(gè)解釋變量進(jìn)行線性回歸,依據(jù)對(duì)解釋變量的重要性、變量的顯著性和的綜合分析,從中選擇一個(gè)最合適的回歸模型作為基礎(chǔ)模型。(2)依據(jù)變量的重要性,在基礎(chǔ)模型中逐個(gè)增加其他解釋變量,每增加一個(gè)解釋變量都重新進(jìn)行線性回歸,并按以下規(guī)則決定舍棄還是保留新增加的解釋變量,直至考慮完所有的解釋變量為止。34逐步回歸法添加解釋變量的一般規(guī)則:①若樣本回歸函數(shù)不能通過(guò)經(jīng)濟(jì)意義檢驗(yàn),或者明顯地影響了其他變量顯著性檢驗(yàn)的結(jié)果,則說(shuō)明該解釋變量與其他變量之間具有較嚴(yán)重的多重共線性,應(yīng)該舍棄。②若樣本回歸函數(shù)通過(guò)了經(jīng)濟(jì)意義檢驗(yàn),對(duì)其他變量的顯著性t檢驗(yàn)未帶來(lái)什么影響,但未能明顯改進(jìn)或新增加的解釋變量是不顯著的,則認(rèn)為該變量是多余的,應(yīng)該舍棄;

逐步回歸法的缺陷:逐步回歸法在取舍變量上缺乏理論依據(jù),它實(shí)際上仍屬于一種經(jīng)驗(yàn)做法。③除①、②之外,則保留新增加的解釋變量。

35案例1:關(guān)于中國(guó)電信業(yè)務(wù)總量的計(jì)量經(jīng)濟(jì)模型(file:coline2)經(jīng)初步分析,認(rèn)為影響中國(guó)電信業(yè)務(wù)總量變化的主要因素是郵政業(yè)務(wù)總量、中國(guó)人口數(shù)、市鎮(zhèn)人口占總?cè)丝诘谋戎亍⑷司鵊DP、全國(guó)居民人均消費(fèi)水平。用1991-1999年數(shù)據(jù)建立中國(guó)電信業(yè)務(wù)總量計(jì)量經(jīng)濟(jì)模型.363738Lny=24.94+2.16x1–3.03x2+33.7x3+1.29x4-2.03x5(0.7)(1.6)(-0.8)(1.0)(1.5)(-1.2)R2=0.9944,F=106.3,DW=3.4,T=9,(1991-1999),t0.05(3)=3.18,R2=0.99,而每個(gè)回歸參數(shù)的t檢驗(yàn)在統(tǒng)計(jì)上都不顯著,這說(shuō)明模型中存在嚴(yán)重的多重共線性。3940下面用Klein判別法進(jìn)行分析。首先給出解釋變量間的簡(jiǎn)單相關(guān)系數(shù)矩陣。因?yàn)槠渲杏幸粋€(gè)簡(jiǎn)單相關(guān)系數(shù)大于R

2=0.9944,所以根據(jù)Klein判別法,模型中存在嚴(yán)重的多重共線性。Ln(y)X1X2X3X4X5Ln(y)1.0000x10.98331.0000x20.99380.98951.0000x30.98750.97000.98821.0000x40.98200.96280.98720.96781.0000x50.98150.97030.98880.96540.99861.000041

用逐步回歸法篩選解釋變量。(1)用每個(gè)解釋變量分別對(duì)被解釋變量做簡(jiǎn)單回歸,以可決系數(shù)為標(biāo)準(zhǔn)確定解釋變量的重要程度,為解釋變量排序。

Lny=-0.39+2.06x1

(-2.1)(14.3)R2=0.9668,F=204,T=9

Lny=-33.26+2.91x2

(-22.2)(23.6)R2=0.9875,F=555,T=9

Lny=-18.46+70.75x3

(-14.9)(16.6)R2=0.9752,F=275.5,T=9

Lny=-0.49+0.56x4(-2.5)(13.8)R2=0.9644,F=189.7,T=9

Lny=-0.42+1.16x5

(-2.2)(13.5)R2=0.9633,F=183.5,T=942解釋變量的重要程度依次為x2,x3,x1,x4,x5

。(2)以Lny=-33.26-291x2為基礎(chǔ),依次引入x3,x1,x4,x5

。首先把x3引入模型,Lny=-29.9+2.24x2+16.76x3(-6.9)(2.7)(0.8)

R2=0.988,F=265.5,T=9因?yàn)閤3的引入使各回歸系數(shù)的t值下降,同時(shí)x3的系數(shù)也未通過(guò)t檢驗(yàn),所以應(yīng)剔除x3。接著把x1引入模型,Lny=-33.37+2.92x2–0.007x1(-3.2)(3.2)(-0.01)R2=0.9875,F=237.9,T=943同理剔除x1引入x4Lny=-31.94+2.79x2+0.022x4(-3.4)(3.3)(0.14)

R2=0.9876,F=238.7,T=9同理剔除x4引入x5Lny=-34.97+3.06x2-0.062x5(-3.4)(3.4)(-0.17)R2=0.9876,F=238.7,T=9同理剔除x5,最后確定的模型是

Lny=-33.26+2.91x2(-22.2)(23.6)

R2=0.9875,F=555,T=944例題4.1454647第三類做法:改變參數(shù)的估計(jì)方法以減小參數(shù)估計(jì)量的方差

多重共線性造成的主要后果是參數(shù)估計(jì)量具有較大的方差。為了解決這一問(wèn)題,計(jì)量經(jīng)濟(jì)學(xué)家們提出了一些以引入偏誤為代價(jià)來(lái)提高參數(shù)估計(jì)量的穩(wěn)定性的參數(shù)估計(jì)方法,如嶺回歸法(ridgeregression)、主成分回歸法(principalcomponentsregression)等。48

嶺回歸估計(jì)法是借助于OLS估計(jì)量的表達(dá)式,機(jī)械地設(shè)定一種具有較小方差的參數(shù)估計(jì)量以解決多重共線性問(wèn)題的方法。該方法的吸引力在于用較小的偏誤換來(lái)方差的改善。具體做法是令估計(jì)量為其中D為主對(duì)角線上的元素構(gòu)成的對(duì)角矩陣,r為大于0的常數(shù)。該方法的缺陷:在如何確定r值上缺乏令人信服的理論依據(jù),而且對(duì)參數(shù)的統(tǒng)計(jì)推斷也相當(dāng)復(fù)雜。因此,這種方法在實(shí)際中并不常用。49

如果回歸的目的在于預(yù)測(cè),則多重共線性不是一個(gè)嚴(yán)重的問(wèn)題,因?yàn)镽2越高預(yù)測(cè)越準(zhǔn)確,但是如果回歸的目的不在于預(yù)測(cè),而在于參數(shù)的可靠性估計(jì),嚴(yán)重的多重共線性將成為問(wèn)題,因?yàn)槲覀兛吹剿鼤?huì)導(dǎo)致估計(jì)量的大標(biāo)準(zhǔn)誤。50§4.2異方差性基本內(nèi)容一、異方差性的概念二、異方差性的類型三、異方差性的來(lái)源四、異方差性的后果五、異方差性的檢驗(yàn)六、異方差性的修正51(1)同方差的概念:對(duì)于模型如果一、異方差性的概念

因?yàn)榉讲钍嵌攘勘唤忉屪兞縔的觀測(cè)值圍繞回歸線的分散程度,因此同方差性指的是所有觀測(cè)值的分散程度相同。表示為同方差如果表示為異方差52

對(duì)于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)的方差不再是常數(shù),而互不相同,則認(rèn)為出現(xiàn)了異方差性(Heteroskedasticity)。進(jìn)一步,把異方差看成是由于某個(gè)解釋變量的變化而引起的,則53圖形表示:

異方差同方差XXYY密度密度54二、方差性的類型同方差:i2=常數(shù),與解釋變量觀測(cè)值Xi無(wú)關(guān);異方差:i2=f(Xi),與解釋變量觀測(cè)值Xi有關(guān)。異方差一般可歸結(jié)為三種類型:?jiǎn)握{(diào)遞增型:i2隨X的增大而增大單調(diào)遞減型:i2隨X的增大而減小復(fù)雜型:i2與X的變化呈復(fù)雜形式55同方差遞增型異方差遞減型異方差復(fù)雜型異方差561.模型中省略了某些重要的解釋變量

假設(shè)正確的計(jì)量模型是:但由于總體模型是未知的,建立模型時(shí)遺漏了X2i,而采用此時(shí),ui*=ui+2X2i

當(dāng)被略去的X2i與X1i有呈同方向或反方向變化的趨勢(shì)時(shí),X2i隨X1i的有規(guī)律變化會(huì)體現(xiàn)在ui*中。三、異方差性的來(lái)源

在模型中忽略了或?yàn)闇p弱多重共線性人為去掉了某些變量,這些變量就歸入了隨機(jī)誤差項(xiàng)中,如果它們本身存在異方差性,就可能會(huì)導(dǎo)致隨機(jī)誤差項(xiàng)出現(xiàn)異方差性。572.模型的設(shè)定誤差模型的設(shè)定主要包括變量的選擇和模型數(shù)學(xué)形式的確定。模型中略去了重要解釋變量常常導(dǎo)致異方差,實(shí)際就是模型設(shè)定問(wèn)題。除此而外,模型的函數(shù)形式不正確,如把變量間本來(lái)為非線性的關(guān)系設(shè)定為線性,也可能導(dǎo)致異方差。3.數(shù)據(jù)的測(cè)量誤差樣本數(shù)據(jù)觀測(cè)誤差的波動(dòng)性有可能隨研究范圍的擴(kuò)大而增加,也可能隨著觀測(cè)技術(shù)的提高和數(shù)據(jù)處理方法的改進(jìn)而逐步減小,因此當(dāng)觀測(cè)誤差構(gòu)成了隨機(jī)誤差項(xiàng)的一個(gè)主要成分時(shí),隨機(jī)誤差項(xiàng)就可能出現(xiàn)異方差性。58

例:截面資料下研究居民家庭的儲(chǔ)蓄行為:Yi=0+1Xi+iYi:第i個(gè)家庭的儲(chǔ)蓄額Xi:第i個(gè)家庭的可支配收入高收入家庭:儲(chǔ)蓄的差異較大低收入家庭:儲(chǔ)蓄則更有規(guī)律性,差異較小i的方差呈現(xiàn)單調(diào)遞增型變化4.截面數(shù)據(jù)中各單位的差異通常認(rèn)為,截面數(shù)據(jù)較時(shí)間序列數(shù)據(jù)更容易產(chǎn)生異方差。這是因?yàn)橥粫r(shí)點(diǎn)不同對(duì)象的差異,一般說(shuō)來(lái)會(huì)大于同一對(duì)象不同時(shí)間的差異。不過(guò),在時(shí)間序列數(shù)據(jù)發(fā)生較大變化的情況下,也可能出現(xiàn)比截面數(shù)據(jù)更嚴(yán)重的異方差。59

例:以絕對(duì)收入假設(shè)為理論假設(shè)、以截面數(shù)據(jù)為樣本建立居民消費(fèi)函數(shù):

Ci=0+1Yi+I

將居民按照收入等距離分成n組,取組平均數(shù)為樣本觀測(cè)值。

一般情況下,居民收入服從正態(tài)分布:中等收入組人數(shù)多,兩端收入組人數(shù)少。而人數(shù)多的組平均數(shù)的誤差小,人數(shù)少的組平均數(shù)的誤差大。

所以樣本觀測(cè)值的觀測(cè)誤差隨著解釋變量觀測(cè)值的不同而不同,往往引起異方差性。60例:以某一行業(yè)的企業(yè)為樣本建立企業(yè)生產(chǎn)函數(shù)模型

Yi=Ai1

Ki2

Li3ei

被解釋變量:產(chǎn)出量Y

解釋變量:資本K、勞動(dòng)L、技術(shù)A,

那么:每個(gè)企業(yè)所處的外部環(huán)境對(duì)產(chǎn)出量的影響被包含在隨機(jī)誤差項(xiàng)中。每個(gè)企業(yè)所處的外部環(huán)境對(duì)產(chǎn)出量的影響程度不同,造成了隨機(jī)誤差項(xiàng)的異方差性。這時(shí),隨機(jī)誤差項(xiàng)的方差并不隨某一個(gè)解釋變量觀測(cè)值的變化而呈規(guī)律性變化,呈現(xiàn)復(fù)雜型。61四、異方差性的后果1、OLS估計(jì)量仍具有線性性、無(wú)偏性和一致性622、參數(shù)估計(jì)量不具有有效性(不再具有最小方差性)

可以證明,在所有線性無(wú)偏估計(jì)量中,回歸系數(shù)OLS估計(jì)量的方差不再是最小的。此表明模型的異方差性使回歸系數(shù)的OLS估計(jì)量的穩(wěn)定性或估計(jì)的精度下降,此時(shí)也稱OLS估計(jì)量是非有效的。63β的加權(quán)最小二乘估計(jì)量是最佳線性無(wú)偏的(見(jiàn)后文)舉例說(shuō)明:對(duì)于模型64因?yàn)椋挥挟?dāng)Xi2是和i無(wú)關(guān)的常數(shù)時(shí)等式才能成立,因此653、通常的變量的顯著性檢驗(yàn)失效4、預(yù)測(cè)精度下降且通常的預(yù)測(cè)區(qū)間不可靠

該分布不成立,這里原因:(1)OLS估計(jì)量不再是有效的;t檢驗(yàn)失效原因:(2)通常建立預(yù)測(cè)區(qū)間依據(jù)的分布和不再成立。66五、異方差性的檢驗(yàn)檢驗(yàn)思路:

由于異方差性就是相對(duì)于不同的解釋變量觀測(cè)值,隨機(jī)誤差項(xiàng)具有不同的方差。

那么:檢驗(yàn)異方差性,也就是檢驗(yàn)隨機(jī)誤差項(xiàng)的方差與解釋變量觀測(cè)值之間的相關(guān)性及其相關(guān)的“形式”。671.定性分析異方差2.Goldfeld-Quandt檢驗(yàn)3.White檢驗(yàn)4.Glejser檢驗(yàn)68用1998年四川省各地市州農(nóng)村居民家庭消費(fèi)支出與家庭純收入的數(shù)據(jù),繪制出消費(fèi)支出對(duì)純收入的散點(diǎn)圖,其中用表示農(nóng)村家庭消費(fèi)支出,表示家庭純收入。1.定性分析異方差(1)利用散點(diǎn)圖做初步判斷。69(2)利用殘差圖做初步判斷。e2Xi0e2Xi0e2Xie2Xie2Xi000702.戈德菲而德-夸特(Goldfeld-Quandt)檢驗(yàn)該檢驗(yàn)常用于檢驗(yàn)遞增型的異方差,且在大樣本容量的前提下使用。(1)將觀測(cè)值按遞增的方差排列,根據(jù)假設(shè),對(duì)于遞增的異方差,可以從按解釋變量X的值按升序排列;(2)略去中間c個(gè)值(約為n/4),余下的n-c個(gè)分為兩組并分別擬合出回歸方程;

{X1,X2,…,Xi-1,Xi,Xi+1,…,Xn-1,Xn}(n-c)/2c

=n/4

(n-c)/271(3)計(jì)算兩個(gè)回歸方差的殘差平方和RSS1和RSS2;

自由度

v1=v2=[(n-c)/2]-k-1(4)構(gòu)造統(tǒng)計(jì)量:72(5)給定顯著性水平α,查找臨界值Fα.

若:F>Fα

,則拒絕H0,認(rèn)為存在遞增型的異方差。F<Fα

,不能拒絕H0,認(rèn)為隨機(jī)誤差項(xiàng)是同方差分布的。樣本a樣本b73注:⑴該檢驗(yàn)的功效取決于c值,c值越大,則大小方差的差異越大,檢驗(yàn)功效越好;但是c值太大會(huì)使自由度減小,又會(huì)降低檢驗(yàn)的功效,一般經(jīng)驗(yàn)n=30,c=4;n=60,c=10。⑵兩個(gè)回歸所用的觀測(cè)值的個(gè)數(shù)是否相等并不重要,因?yàn)榭梢酝ㄟ^(guò)改變自由度和統(tǒng)計(jì)量的計(jì)算公式來(lái)調(diào)整。⑶該檢驗(yàn)多用于遞增型的異方差,依賴于觀測(cè)值是否正確排序。⑷當(dāng)模型中包含多個(gè)解釋變量時(shí),應(yīng)對(duì)每一個(gè)解釋變量都進(jìn)行檢驗(yàn)。74銷售量和R&D支出(研究了18個(gè)行業(yè)):{X1,X2,…,X8,X9,X10,X11,…,X17,X18}

(18-4)/2=7c

=18/44(18-4)/2=7如果中間除去c=3個(gè),如何進(jìn)行檢驗(yàn)(假定前面有8個(gè),后面有7個(gè))?v1=v2=7-2=5R&Di=0+1Salesi+uiv2=5,v1=6753、懷特(White)檢驗(yàn)懷特檢驗(yàn)是懷特在1980年提出的一種異方差性檢驗(yàn)方法。在原來(lái)殘差與解釋變量線性關(guān)系的基礎(chǔ)上再加上解釋變量的平方項(xiàng)與交叉項(xiàng);因此我們就可以得到輔助回歸模型:通過(guò)對(duì)這個(gè)模型的參數(shù)的顯著性檢驗(yàn)來(lái)判斷是否具有異方差性,不存在異方差至少有一個(gè)不為0,存在異方差76檢驗(yàn)步驟:(1)首先對(duì)上式進(jìn)行OLS回歸,求殘差ei(2)做如下輔助回歸(注意包括常數(shù)項(xiàng),計(jì)算可決系數(shù)R2):H0:上式ui不存在異方差H1:上式ui存在異方差以二元回歸線性回歸模型為例:77(4)根據(jù)臨界值進(jìn)行判斷若,則不能拒絕H0(ui具有同方差)若,則拒絕H0(ui具有異方差):(3)在原假設(shè)下(不存在異方差)計(jì)算統(tǒng)計(jì)量:2的自由度為K,K是輔助回歸方程中解釋變量的個(gè)數(shù)(不包括截距項(xiàng))78

執(zhí)行懷特檢驗(yàn)需要注意以下事項(xiàng):(1)如果模型中含有虛擬變量,即取值為0、1的人工變量(見(jiàn)第1章),必須舍棄輔助回歸中相同的變量,否則會(huì)產(chǎn)生完全多重共線性問(wèn)題。(2)當(dāng)解釋變量個(gè)數(shù)較多時(shí),輔助回歸模型中的解釋變量會(huì)相當(dāng)多,造成輔助回歸估計(jì)精度較差,甚至無(wú)法進(jìn)行估計(jì),此時(shí)一種處理辦法是去掉輔助回歸中的交叉乘積項(xiàng)。(3)懷特檢驗(yàn)是基于統(tǒng)計(jì)量的漸近分布,因此該檢驗(yàn)要求樣本為大樣本。794.戈里瑟(Glejser)檢驗(yàn)

檢驗(yàn)是否與解釋變量Xt存在函數(shù)關(guān)系。若有,則說(shuō)明存在異方差;若無(wú),則說(shuō)明不存在異方差。基本思想:假設(shè)殘差與解釋變量直接存在某種冪函數(shù)的關(guān)系。

步驟:(1)首先用OLS估計(jì)經(jīng)濟(jì)計(jì)量模型的回歸系數(shù),求出隨機(jī)誤差項(xiàng)ut的估計(jì)值et。80(2)用|ei|與解釋變量Xi的不同冪次進(jìn)行回歸(|ei|為被解釋變量,Xi為解釋變量)。常用形式有:ei=a0+a1

Xiei=a0+a1Xi2ei=a0+a1,ei=a0+a11/Xi,

….

利用樣本可決系數(shù)R2,t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn),若有通過(guò)檢驗(yàn)的模型,則說(shuō)明原計(jì)量模型存在該種形式的異方差。81特點(diǎn):(1)既可以檢驗(yàn)遞增型的異方差,也可以檢驗(yàn)遞減型的異方差;(2)一旦發(fā)現(xiàn)異方差,同時(shí)也發(fā)行了異方差的具體表現(xiàn)形式;(3)該檢驗(yàn)是探測(cè)性的,如果試驗(yàn)?zāi)P瓦x擇的不好,則不易檢測(cè)出是否存在異方差;(4)比較繁瑣,需要對(duì)各種可能的形式做試驗(yàn)。821.方差2已知時(shí),加權(quán)最小二乘法(WLS)(1)誤差項(xiàng)方差已知的加權(quán)最小二乘法(2)誤差項(xiàng)方差隨一個(gè)自變量變化時(shí)的加權(quán)最小二乘法2.方差2未知時(shí),異方差的修正(1)可行的加權(quán)最小二乘法(2)異方差——穩(wěn)健性估計(jì)程序六、異方差的修正831.方差已知的加權(quán)最小二乘法(WLS)對(duì)于多元回歸模型:為修正異方差,可做一下變換:變換后的模型為(注意沒(méi)有截距項(xiàng)):j=1,2,…,k令:(1)方差已知的加權(quán)最小二乘法84現(xiàn)在我們來(lái)看對(duì)加權(quán)模型的最小二乘估計(jì)(OLS)的殘差平方和——加權(quán)殘差平方和

從這里可以看出,變化后的殘差平方和給原來(lái)的殘差進(jìn)行了加權(quán),權(quán)數(shù)為隨機(jī)誤差項(xiàng)方差的倒數(shù),來(lái)自較大方差的觀測(cè)值得到了較小的加權(quán),而來(lái)自較小方差的觀測(cè)值得到了較大的加權(quán)。即:85(2)誤差項(xiàng)方差隨一個(gè)自變量變化時(shí)的加權(quán)最小二乘法

有一種可能性是回歸模型誤差項(xiàng)的方差與一個(gè)解釋變量取值直接存在某種關(guān)系,特別地,假設(shè):其中,hi是多元線性模型中某個(gè)解釋變量的函數(shù):

我們將模型兩側(cè)同時(shí)除以:

86變換后的模型為(注意沒(méi)有截距項(xiàng)):j=1,2,…,k令:可以看出,變換后的誤差項(xiàng)具有相同的方差,因?yàn)椋?7原來(lái)的常數(shù)項(xiàng)變成了偏回歸系數(shù),而變量X2的斜率變成了新的常數(shù)項(xiàng)。變換后的模型具有相同的方差,OLS估計(jì)量是一個(gè)BLUE。注意,最終給出估計(jì)模型,并對(duì)這些參數(shù)進(jìn)行經(jīng)濟(jì)解釋時(shí),要將這些參數(shù)的值代入原始的模型之中。例如,2所反映的依然是,其他條件不變的情況下,變量X2對(duì)被解釋變量Y的邊際影響??紤]兩種特殊情況:即:(1)88

變換后的模型增加了一個(gè)解釋變量,但沒(méi)有常數(shù)項(xiàng),因而,利用Eviews進(jìn)行回歸時(shí),注意,不要輸入代表常數(shù)項(xiàng)的c。(2)89XeXe90銷售量和R&D支出(研究了18個(gè)行業(yè)):R&Di=-235.61+0.036Salesi+eis.e=(383.63)(0.007)

R2=0.3549D.W.=2.89估計(jì)結(jié)果為:模型寫作:-8000-6000-4000-200002000400060008000050000100000200000300000Sales912、方差2未知時(shí),異方差的修正

在實(shí)際應(yīng)用中,中的通常是未知的,含有未知的參數(shù),不能直接應(yīng)用WLS法估計(jì)模型。對(duì)于這種情形,通常采用可行的加權(quán)最小二乘法(FWLS:feasibleweightedleastsquares),92

可行的加權(quán)最小二乘估計(jì)量的性質(zhì):在一定的基本假定條件下,可行的加權(quán)最小二乘估計(jì)量服從漸近正態(tài)分布,并且是一致且漸近有效的。估計(jì)過(guò)程:首先,依據(jù)樣本數(shù)據(jù)得到中參數(shù)的一致估計(jì)量,進(jìn)而得到的估計(jì)值;其次,以為權(quán)序列進(jìn)行WLS法的估計(jì)過(guò)程,得到原模型中參數(shù)的估計(jì)量和樣本回歸函數(shù)。由可行的加權(quán)最小二乘法得到的估計(jì)量稱為可行的加權(quán)最小二乘估計(jì)量。(1)可行的加權(quán)最小二乘法93

方法之二:利用OLS法回歸原模型得到殘差序列,直接令

方法之一:依據(jù)異方差性檢驗(yàn)中提供的信息將設(shè)定為含有未知參數(shù)的解釋變量的函數(shù)形式,然后通過(guò)建立回歸模型得到。

關(guān)于權(quán)序列的估計(jì):94

注意:

(1)基于適當(dāng)?shù)臋?quán)序列(如基于正確設(shè)定的的函數(shù)表達(dá)式得到的)的可行的加權(quán)最小二乘估計(jì)量具有良好的大樣本性質(zhì),通常進(jìn)行的統(tǒng)計(jì)推斷也是可靠的;與之相反,基于一個(gè)糟糕的權(quán)序列,盡管仍能得到參數(shù)的一致估計(jì)量,但其有效性可能會(huì)比OLS估計(jì)量還要差。(2)可行的加權(quán)最小二乘法適合于大樣本的情形,當(dāng)樣本容量較小時(shí),其與OLS法相比哪一個(gè)更有效是未知的。95(2)基于OLS法的懷特異方差-穩(wěn)健性估計(jì)程序

利用OLS法估計(jì)存在異方差性的模型,所得參數(shù)估計(jì)量仍具有無(wú)偏性和一致性,但通常的t檢驗(yàn)是失效的,造成這一后果的根本原因是,構(gòu)造t統(tǒng)計(jì)量所依據(jù)的參數(shù)估計(jì)量標(biāo)準(zhǔn)差的估計(jì)量是不合適的。為此,在未知異方差性表現(xiàn)形式的情形下,懷特(1980)提出了的一致估計(jì)量(稱之為的異方差-穩(wěn)健性方差-協(xié)方差估計(jì)量):96其中為利用OLS法回歸原模型得到的第i個(gè)觀測(cè)點(diǎn)上的殘差,.矩陣主對(duì)角線上的第j+1個(gè)元素即為的一致估計(jì)量,記為

異方差-穩(wěn)健性t統(tǒng)計(jì)量:

在大樣本的情形下,利用異方差-穩(wěn)健性t統(tǒng)計(jì)量便可以對(duì)進(jìn)行假設(shè)檢驗(yàn)。97

關(guān)于異方差性模型估計(jì)的幾點(diǎn)說(shuō)明:

(1)引進(jìn)參數(shù)的異方差-穩(wěn)健性方差估計(jì)量的目的是糾正在參數(shù)統(tǒng)計(jì)推斷上存在的問(wèn)題,但其參數(shù)的估計(jì)量仍是非有效的OLS估計(jì)量。因此,盡管這種估計(jì)程序不要求知道隨機(jī)誤差項(xiàng)的異方差性,具有廣泛的實(shí)用性,但它不能替代(可行的)加權(quán)最小二乘法,因?yàn)楫?dāng)異方差性已知或其中的參數(shù)可以一致的估計(jì)時(shí),(可行的)加權(quán)最小二乘估計(jì)量是(漸近)有效的估計(jì)量。98

(2)無(wú)論是可行的加權(quán)最小二乘估法還是基于OLS法的異方差-穩(wěn)健性估計(jì)程序,都是適用于大樣本的情形。對(duì)于小樣本的情形,這些處理異方差性的方法與OLS法相比,哪一個(gè)更有效并沒(méi)有一般的結(jié)論。但參考異方差-穩(wěn)健性方差的估計(jì)量,可以幫助我們判斷是否有些結(jié)論對(duì)所使用的方差估計(jì)量有敏感的反應(yīng)。

99

(3)對(duì)于大樣本的情形,由于異方差-穩(wěn)健性方差的估計(jì)量是對(duì)OLS估計(jì)量的方差的漸近估計(jì),而利用一個(gè)合適的權(quán)序列所得到的可行的加權(quán)最小二乘估計(jì)量是漸近有效的,因此它的方差通常應(yīng)該小于異方差-穩(wěn)健性方差的估計(jì)量。由此可以通過(guò)比較異方差-穩(wěn)健性方差的估計(jì)量與可行的加權(quán)最小二乘法的方差估計(jì)量,為權(quán)序列的選擇提供基本依據(jù)。100案例--中國(guó)農(nóng)村居民人均消費(fèi)函數(shù)

例:中國(guó)農(nóng)村居民人均消費(fèi)支出主要由人均純收入來(lái)決定。農(nóng)村人均純收入包括(1)從事農(nóng)業(yè)經(jīng)營(yíng)的收入,(2)包括從事其他產(chǎn)業(yè)的經(jīng)營(yíng)性收入(3)工資性收入、(4)財(cái)產(chǎn)收入(4)轉(zhuǎn)移支付收入??疾鞆氖罗r(nóng)業(yè)經(jīng)營(yíng)的收入(X1)和其他收入(X2)對(duì)中國(guó)農(nóng)村居民消費(fèi)支出(Y)增長(zhǎng)的影響:101102普通最小二乘法的估計(jì)結(jié)果:異方差檢驗(yàn)103進(jìn)一步的統(tǒng)計(jì)檢驗(yàn)(1)G-Q檢驗(yàn)

將原始數(shù)據(jù)按X2排成升序,去掉中間的7個(gè)數(shù)據(jù),得兩個(gè)容量為12的子樣本。對(duì)兩個(gè)子樣本分別作OLS回歸,求各自的殘差平方和RSS1和RSS2:子樣本1:(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648子樣本2:(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729104計(jì)算F統(tǒng)計(jì)量:

F=RSS2/RSS1=0.2792/0.0648=4.31

查表給定=5%,查得臨界值F0.05(9,9)=2.97

判斷

F>F0.05(9,9)

否定兩組子樣方差相同的假設(shè),從而該總體隨機(jī)項(xiàng)存在遞增異方差性。105(2)懷特檢驗(yàn)作輔助回歸:

(-0.04)(0.10)(0.21)(-0.12)(1.47) R2=0.4638似乎沒(méi)有哪個(gè)參數(shù)的t檢驗(yàn)是顯著的。但

nR2

=31*0.4638=14.38=5%下,臨界值20.05(5)=11.07,拒絕同方差性

(-1.11)106去掉交叉項(xiàng)后的輔助回歸結(jié)果

(1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374X2項(xiàng)與X2的平方項(xiàng)的參數(shù)的t檢驗(yàn)是顯著的,且

nR2

=310.4374=13.56=5%下,臨界值20.05(4)=9.49

拒絕同方差的原假設(shè)

107

原模型的加權(quán)最小二乘回歸

對(duì)原模型進(jìn)行OLS估計(jì),得到隨機(jī)誤差項(xiàng)的近似估計(jì)量ěi,以此構(gòu)成權(quán)矩陣2W的估計(jì)量;再以1/|

ěi|為權(quán)重進(jìn)行WLS估計(jì),得各項(xiàng)統(tǒng)計(jì)檢驗(yàn)指標(biāo)全面改善108習(xí)題:以每天抽煙支數(shù)(cigs)為因變量,主要關(guān)注的影響因素包括收入(income)、香煙價(jià)格(cigpric)、教育水平(educ)和年齡(age),建立香煙的日需求函數(shù)模型:cigs=b0+b1ln(income)+b2ln(cigpric)+b3educ+b4agec+b5age2+u利用807個(gè)調(diào)查數(shù)據(jù),對(duì)模型進(jìn)行OLS估計(jì),結(jié)果如下:請(qǐng)回答以下問(wèn)題(顯著水平為5%,t0.05()=1.65,t0.025()=1.96):(1)解釋模型中l(wèi)n(cigpric)系數(shù)的經(jīng)濟(jì)含義。(2)大約到多大歲數(shù),抽煙數(shù)量開始隨著年齡增長(zhǎng)有所下降?(3)利用White檢驗(yàn)考察u的異方差性,輔助回歸的可決系數(shù)為0.0519,Eviews輸出結(jié)果如下:109

給出圖中空格處的數(shù)值,并檢驗(yàn)?zāi)P蛿_動(dòng)項(xiàng)是否存在異方差。(4)假定u的方差隨著educ的變化而變化,具體形式為:

Var(u)=2educ

如何修正異方差?給出簡(jiǎn)要步驟,并說(shuō)明修正后的模型滿足同方差假定(5)為修正異方差,對(duì)模型進(jìn)行WLS估計(jì),結(jié)果如下:

分別利用模型(1)和模型(2)的估計(jì)結(jié)果檢驗(yàn)log(income)的統(tǒng)計(jì)顯著性。你認(rèn)為收入對(duì)香煙需求有顯著影響嗎?給出你的理由。(6)檢驗(yàn)香煙價(jià)格影響的顯著性,結(jié)論與你的預(yù)期相符嗎?給出你的理由。(括號(hào)內(nèi)為對(duì)應(yīng)系數(shù)的標(biāo)準(zhǔn)差)

110§4-3:自相關(guān)基本內(nèi)容一、自相關(guān)性的概念二、自相關(guān)性的來(lái)源三、自相關(guān)性后果四、自相關(guān)性檢驗(yàn)五、自相關(guān)性的補(bǔ)救方法六、自相關(guān)系數(shù)的估計(jì)111無(wú)自相關(guān)假設(shè)——回歸模型的假定條件之一:即誤差項(xiàng)ut的取值在時(shí)間或空間上是相互無(wú)關(guān)的,誤差項(xiàng)ut非序列相關(guān)(不存在自相關(guān))如果則稱誤差項(xiàng)ut存在自相關(guān)。概念:總體回歸模型的隨機(jī)誤差項(xiàng)之間存在相關(guān)關(guān)系。一、自相關(guān)性的概念

自相關(guān)的概念112

其中:被稱為自協(xié)方差系數(shù)(coefficientofautocovariance)或自相關(guān)系數(shù)(first-ordercoefficientofautocorrelation)

ωi是滿足以下標(biāo)準(zhǔn)的OLS假定的隨機(jī)干擾項(xiàng):

自相關(guān)往往可寫成如下形式:

由于自相關(guān)性經(jīng)常出現(xiàn)在以時(shí)間序列為樣本的模型中,因此,本節(jié)將用下標(biāo)t代表i。113

一階自回歸誤差項(xiàng)線性一階自回歸形式:可以證明:

=

即:一階自回歸形式的自回歸系數(shù)=ut和ut-1的自相關(guān)系數(shù)。φ的取值范圍是[-1,1]當(dāng)φ0時(shí),稱ut

存在正自相關(guān);當(dāng)φ0時(shí),稱ut存在負(fù)自相關(guān);當(dāng)φ=0時(shí),稱ut不存在自相關(guān)。114p階自回歸

當(dāng)誤差項(xiàng)ut的本期值不僅與其前一期值有關(guān),而且與其前若干期的值都有關(guān)系時(shí),即:

ut=f(ut–1,ut–2,…),則稱ut具有高階自相關(guān)。通常假定誤差項(xiàng)的自相關(guān)是線性的。因計(jì)量經(jīng)濟(jì)模型中自相關(guān)的最常見(jiàn)形式是一階自回歸形式,所以下面重點(diǎn)討論誤差項(xiàng)的線性一階自回歸形式。115二、自相關(guān)性的來(lái)源自相關(guān)產(chǎn)生的原因1、經(jīng)濟(jì)系統(tǒng)的慣性2、設(shè)定偏誤3、數(shù)據(jù)處理造成的相關(guān)4、蛛網(wǎng)現(xiàn)象

116

如GDP、價(jià)格、就業(yè)、生產(chǎn)等經(jīng)濟(jì)指標(biāo)都會(huì)隨經(jīng)濟(jì)系統(tǒng)的周期而波動(dòng)。例如,在經(jīng)濟(jì)高漲時(shí)期,較高的經(jīng)濟(jì)增長(zhǎng)率會(huì)持續(xù)一段時(shí)間,而在經(jīng)濟(jì)衰退期,較高的失業(yè)率和較低的經(jīng)濟(jì)增長(zhǎng)也會(huì)持續(xù)一段時(shí)間,也就是相繼的觀測(cè)值很可能是相依賴的。這種現(xiàn)象就會(huì)表現(xiàn)為經(jīng)濟(jì)指標(biāo)的自相關(guān)現(xiàn)象。原因1-經(jīng)濟(jì)系統(tǒng)的慣性

自相關(guān)現(xiàn)象大多出現(xiàn)在時(shí)間序列數(shù)據(jù)中,而經(jīng)濟(jì)系統(tǒng)的經(jīng)濟(jì)行為都具有時(shí)間上的慣性。117原因2-設(shè)定偏誤例如,應(yīng)該用兩個(gè)解釋變量解釋Y,即:

如果模型中省略了某些重要的解釋變量或者模型函數(shù)形式不正確,都會(huì)產(chǎn)生系統(tǒng)誤差,這種誤差存在于隨機(jī)誤差項(xiàng)中,從而帶來(lái)了自相關(guān)。由于該現(xiàn)象是由于設(shè)定失誤造成的自相關(guān),因此,也稱其為虛假自相關(guān)。118而建立模型時(shí),模型設(shè)定為:

則X3t對(duì)Yt的影響在上式中便歸入隨機(jī)誤差項(xiàng)ut中,由于X3t在不同觀測(cè)點(diǎn)上是相關(guān)的,這就造成了ut在不同觀測(cè)點(diǎn)是相關(guān)的,呈現(xiàn)出系統(tǒng)模式,此時(shí)ut是自相關(guān)的。119

因?yàn)槟承┰驅(qū)?shù)據(jù)進(jìn)行了修整和內(nèi)插處理,在這樣的數(shù)據(jù)序列中就會(huì)有自相關(guān)。

例如,將月度數(shù)據(jù)調(diào)整為季度數(shù)據(jù),由于采用了加合處理,修勻了月度數(shù)據(jù)的波動(dòng),使季度數(shù)據(jù)具有平滑性,這種平滑性產(chǎn)生自相關(guān)。對(duì)缺失的歷史資料,采用特定統(tǒng)計(jì)方法進(jìn)行內(nèi)插處理,使得數(shù)據(jù)前后期相關(guān),產(chǎn)生了自相關(guān)。原因3-數(shù)據(jù)處理造成的相關(guān)120

許多農(nóng)產(chǎn)品的供給呈現(xiàn)為蛛網(wǎng)現(xiàn)象

蛛網(wǎng)現(xiàn)象是微觀經(jīng)濟(jì)學(xué)中的一個(gè)概念。它表示某種商品的供給量受前一期價(jià)格影響而表現(xiàn)出來(lái)的某種規(guī)律性。原因4-蛛網(wǎng)現(xiàn)象供給t=β1+β2Pt-1+ut121注意:模型形式設(shè)定偏誤也會(huì)導(dǎo)致自相關(guān)現(xiàn)象。如將“U”形成本曲線設(shè)定為線性成本曲線,則必定會(huì)導(dǎo)致自相關(guān)。由設(shè)定偏誤產(chǎn)生的自相關(guān)是一種虛假自相關(guān),可通過(guò)改變模型設(shè)定予以消除。自相關(guān)關(guān)系主要存在于時(shí)間序列數(shù)據(jù)中,但是在橫截面數(shù)據(jù)中,也可能會(huì)出現(xiàn)自相關(guān),通常稱其為空間自相關(guān)(Spatialautocorrelation)。122

設(shè)隨機(jī)誤差項(xiàng)具有零均值、同方差,且與獨(dú)立,但存在序列相關(guān)性。在普通最小二乘法下計(jì)算得到三、自相關(guān)性的后果

在模型存在自相關(guān)性的情形下,回歸系數(shù)的OLS估計(jì)量為仍然具有線性性、無(wú)偏性和一致性。盡管如此,采用OLS法估計(jì)存在自相關(guān)性的模型會(huì)產(chǎn)生以下后果:1、參數(shù)估計(jì)值仍然是無(wú)偏的以一元線性回歸模型為例,其模型為123

1242、OLS估計(jì)量不再具有最小方差性

可以證明,在所有線性無(wú)偏估計(jì)量中,回歸系數(shù)OLS估計(jì)量的方差不再是最小的。此表明模型的自相關(guān)性使回歸系數(shù)OLS估計(jì)量的穩(wěn)定性或精確性下降,此時(shí)也稱OLS估計(jì)量是非有效的。舉例說(shuō)明:設(shè)模型為β的OLS估計(jì)量為125利用廣義最小二乘法得到的β的最佳線性無(wú)偏估計(jì)量為比較結(jié)果:126回歸參數(shù)不再具有最小方差()可能低估隨機(jī)誤差項(xiàng)的方差σ2隨機(jī)誤差項(xiàng)ut存在自相關(guān)t

統(tǒng)計(jì)量值,F(xiàn)統(tǒng)計(jì)量值不可靠變量或者方程的顯著性檢驗(yàn)失去意義3、通常的變量和方程的顯著性檢驗(yàn)失效

1274、預(yù)測(cè)精度下降且通常的預(yù)測(cè)區(qū)間不可靠,

當(dāng)模型存在自相關(guān)性時(shí),

回歸系數(shù)估計(jì)的有效性下降,導(dǎo)致對(duì)Y的基于樣本回歸函數(shù)的預(yù)測(cè)精度下降。

不再成立,從而基于此所建立的預(yù)測(cè)區(qū)間將不再可靠。和128

四、自相關(guān)的檢驗(yàn)1.圖示法……2.杜賓-瓦德森檢驗(yàn)(DW檢驗(yàn))……3.LM檢驗(yàn)……129圖示檢驗(yàn)法

圖示法是一種直觀的診斷方法,它是把給定的回歸模型直接用普通最小二乘法估計(jì)參數(shù),求出殘差項(xiàng)et,et作為ut隨機(jī)項(xiàng)的真實(shí)估計(jì)值,再描繪et的散點(diǎn)圖,根據(jù)散點(diǎn)圖來(lái)判斷et的相關(guān)性。殘差et的散點(diǎn)圖通常有兩種繪制方式。130圖1et與et-1的關(guān)系繪制et-1

,et

的散點(diǎn)圖。用(et-1

,et

)(t=1,2,…n)作為散布點(diǎn)繪圖,如果大部分點(diǎn)落在第Ⅰ、Ⅲ象限,表明隨機(jī)誤差項(xiàng)ut存在著正自相關(guān),如圖1所示。的散點(diǎn)圖1.繪制etet-1131

如果大部分點(diǎn)落在第Ⅱ、Ⅳ象限,那么隨機(jī)誤差項(xiàng)ut存在著負(fù)自相關(guān),如圖2所示。圖2et與et-1的關(guān)系etet-1

132

如果觀測(cè)點(diǎn)隨意落在各個(gè)象限,沒(méi)有固定的規(guī)則,那么隨機(jī)誤差項(xiàng)ut不存在自相關(guān),如圖3所示。圖3et與et-1的關(guān)系et-1et133圖4et的分布按照時(shí)間順序繪制回歸殘差項(xiàng)et

的圖形。如果et(t=1,2,…,n)隨著t的變化逐次有規(guī)律地變化,呈現(xiàn)鋸齒形或循環(huán)形狀的變化,就可斷言et存在相關(guān),表明存在著自相關(guān);如果et隨著t的變化逐次變化并不斷地改變符號(hào),那么隨機(jī)誤差項(xiàng)ut存在負(fù)自相關(guān);如圖4所示。2.按時(shí)間順序繪制殘差圖

134圖5et的分布如果et隨著t的變化逐次變化并不頻繁地改變符號(hào),而是幾個(gè)正的et后面跟著幾個(gè)負(fù)的,則表明隨機(jī)誤差項(xiàng)存ut

在正自相關(guān),如圖5所示。135圖6et的分布如果et隨著t的變化無(wú)系統(tǒng)性變化模樣,符合經(jīng)典線性回歸模型的無(wú)相關(guān)性假定。如圖6所示。136DW檢驗(yàn)法DW檢驗(yàn)是J.Durbin(杜賓)和G.S.Watson(沃特森)于1951年提出的一種檢驗(yàn)方法。DW檢驗(yàn)只能用于檢驗(yàn)隨機(jī)誤差項(xiàng)具有一階自回歸形式的自相關(guān)問(wèn)題。這種檢驗(yàn)方法是建立經(jīng)濟(jì)計(jì)量模型中最常用的方法,一般的計(jì)算機(jī)軟件都可以計(jì)算出DW值。137

(1)(2)(3)隨機(jī)誤差項(xiàng)的一階自回歸形式為:為了檢驗(yàn)序列的相關(guān)性,構(gòu)造的原假設(shè)和備擇假設(shè)是:

為了檢驗(yàn)上述假設(shè),構(gòu)造DW統(tǒng)計(jì)量首先要求出回歸估計(jì)式的殘差et

定義DW統(tǒng)計(jì)量為:(無(wú)自相關(guān)性)(存在自相關(guān)性)138DW值的取值范圍

在認(rèn)為:

則:(4)(5)

其中一階自回歸中ψ=ρ所以:DW=2(1-ρ)139因此,。所以,DW值與的對(duì)應(yīng)關(guān)系如表1所示。

4(2,4)2(0,2)0-1(-1,0)0(0,1)1DW由上述討論可知DW的取值范圍為:0≤DW≤4

根據(jù)樣本容量n和解釋變量的數(shù)目k′(不包括常數(shù)項(xiàng))查DW分布表,得臨界值

dL

和dU,然后依下列準(zhǔn)則考察計(jì)算得到的DW值,以決定模型的自相關(guān)狀態(tài)。140誤差項(xiàng)u1,u2,…,un間存在負(fù)相關(guān)

4-dL≤DW≤4不能判定是否有自相關(guān)

4-dU≤DW<4-dL誤差項(xiàng)u1,u2,…,un間無(wú)自相關(guān)

dU<DW<4-dU不能判定是否有自相關(guān)

dL<DW≤dU誤差項(xiàng)u1,u2,…,un間存在正相關(guān)

0≤DW≤dLDW檢驗(yàn)決策規(guī)則141不能確定正自相關(guān)無(wú)自相關(guān)不能確定負(fù)自相關(guān)DW44-dL4-

dU2dUdLDW檢驗(yàn)示意圖可以用坐標(biāo)圖更加直觀地表示出來(lái):0f(DW)142

需要注意的是,DW檢驗(yàn)盡管有著廣泛的應(yīng)用,但也有明顯的缺點(diǎn)和局限性。DW檢驗(yàn)有兩個(gè)不能確定的區(qū)域,一旦DW值落在這兩個(gè)區(qū)域,就無(wú)法判斷。這時(shí),只有增大樣本容量或選取其他方法;DW統(tǒng)計(jì)量的上、下界表要求n≥15,這是因?yàn)闃颖救绻傩?,利用殘差就很難對(duì)自相關(guān)的存在性做出比較正確的診斷;DW檢驗(yàn)不適應(yīng)隨機(jī)誤差項(xiàng)具有高階序列相關(guān)的檢驗(yàn);143只適用于有常數(shù)項(xiàng)的回歸模型并且解釋變量中不能含滯后的被解釋變量。解釋變量X非隨機(jī)【殘差中包含了X的組合,X隨機(jī)會(huì)使統(tǒng)計(jì)量的分布復(fù)雜化】回歸含有截距項(xiàng)【保證殘差均值為0】144例題:真實(shí)工資和勞動(dòng)生產(chǎn)率(1959-2002,美國(guó))

wt=29.57+0.70pt+et

s.e=(1.46)(0.02)R2=0.9755F=1674.30 DW=0.21查表得(5%的顯著水平):

dL=1.475dU=1.566DW=0.21<1.474,在5%的顯著水平下,拒絕零假設(shè),即存在正的自相關(guān)。145LM(BG)檢驗(yàn)

該檢驗(yàn)由布勞殊和格弗雷(Breusch-Godfrey)提出,適用于任何階數(shù)的自相關(guān)??紤]回歸模型及其隨機(jī)誤差項(xiàng)的p階自回歸形式:

146過(guò)程:

(1)提出原假設(shè)和備擇假設(shè):

H0:1

=2=…=p=0

H1:至少一個(gè)j不等于0,j=1,2,…,n(2)用給定樣本估計(jì)模型并計(jì)算殘差et,并對(duì)殘差序列et

,(t=1,2,…,n)建立p階自回歸模型

(3)估計(jì)上式,并確定回歸樣本可決系數(shù)R2。構(gòu)造LM統(tǒng)計(jì)量。LM=nR2~2(p)147(4)根據(jù)臨界值進(jìn)行判斷:若LM=nR2

2(p),不能拒絕H0,認(rèn)為隨機(jī)誤差項(xiàng)不存在自相關(guān);若LM=nR2>

2(p),拒絕H0,認(rèn)為隨機(jī)誤差項(xiàng)存在自相關(guān);148例題:真實(shí)工資和勞動(dòng)生產(chǎn)率(1959-2002,美國(guó))

wt=29.57+0.70pt+et

s.e=(1.46)(0.02)R2=0.9755F=1674.30 DW=0.21

檢驗(yàn)一階自相關(guān),H0:1=0;H1:1

0 LM=44*0.71=31.432(1)

檢驗(yàn)二階自相關(guān),H0:1=2=0;

H1:1

0或20 LM=44*0.72=31.512(2)1491.廣義最小二乘法

對(duì)于模型

Y=X+u

如果存在序列相關(guān),或者存在異方差,即有是一對(duì)稱正定矩陣,存在一可逆矩陣P,使得

=PP’五、自相關(guān)的補(bǔ)救方法150變換原模型:即(*)式的OLS估計(jì):

該模型具有同方差性和隨機(jī)誤差項(xiàng)互相獨(dú)立性:151

這就是原模型的廣義最小二乘估計(jì)量(GLSestimators),是無(wú)偏的、有效的估計(jì)量。

首先,得到的一致估計(jì)量,然后,應(yīng)用替換GLS法估計(jì)過(guò)程中的

,進(jìn)而得到參數(shù)的估計(jì)量。GLS估計(jì)量的性質(zhì):在一定的基本假定條件下,可行的GLS估計(jì)量是一致且漸近有效的。

當(dāng)未知時(shí),可行的GLS法:1522.廣義差分法

對(duì)于自相關(guān)的結(jié)構(gòu)已知的情形可采用廣義差分法解決。

由于隨機(jī)誤差項(xiàng)ut是不可觀測(cè)的,通常我們假定ut為一階自回歸形式,即ut

=ρut-1+vt其中,|ρ|<1,vt為經(jīng)典誤差項(xiàng)。

當(dāng)自相關(guān)系數(shù)為已知時(shí),使用廣義差分法,自相關(guān)問(wèn)題就可徹底解決。我們以一元線性回歸模型為例說(shuō)明廣義差分法的應(yīng)用。 153對(duì)于一元線性回歸模型(1)將模型(1)滯后一期可得(2)用ρ

乘式(2)兩邊,得(3)154用式(1)減去式(3)可得(4)模型,隨機(jī)誤差項(xiàng)無(wú)序列相關(guān)。式(10)中,ut-ρut-1=vt

是經(jīng)典誤差項(xiàng)。因此,模型(4)已經(jīng)是經(jīng)典線性回歸令

155則式(4)可表示為:(5)

對(duì)模型(5)使用普通最小二乘估計(jì)就會(huì)得到參數(shù)估計(jì)的最佳線性無(wú)偏估計(jì)量。

式(4)稱為廣義差分方程,因?yàn)楸唤忉屪兞颗c解釋變量均為現(xiàn)期值減去前期值的一部分,由此而得名。156補(bǔ)充到差分序列中,再使用普通最小二乘法估計(jì)參數(shù)。

在進(jìn)行廣義差分時(shí),解釋變量X與被解釋變量Y均以差分形式出現(xiàn),因而樣本容量由n減少為n-1,即丟失了第一個(gè)觀測(cè)值。如果樣本容量較大,減少一個(gè)觀測(cè)值對(duì)估計(jì)結(jié)果影響不大。但是,如果樣本容量較小,則對(duì)估計(jì)精度產(chǎn)生較大的影響。此時(shí),可采用普萊斯-溫斯滕(Prais-Winsten)變換,將第一個(gè)觀測(cè)值變換為157六、自相關(guān)系數(shù)的估計(jì)1、杜賓兩步法

進(jìn)行廣義差分變換的前提是已知ρ的值。但是隨機(jī)誤差項(xiàng)的自相關(guān)系數(shù),μt的值是不可以觀測(cè)的,使得ρ的值也是未知的。所以利用廣義差分法處理序列相關(guān)性時(shí),首先需要估計(jì)出ρ的值。這可以用杜賓(Durbin)兩步估計(jì)法。158如果隨機(jī)誤差項(xiàng)μt存在h階自回歸形式的序列相關(guān),即當(dāng)時(shí),便可利用杜賓兩步法對(duì)μt的相關(guān)系數(shù)ρ進(jìn)行估計(jì)。(6)我們以一元線性回歸模型為例,對(duì)于模型159第一步,對(duì)(6)式進(jìn)行差分變換,可得整理,可得(7)(8)160第二步:應(yīng)用普通最小二乘法對(duì)包含被解釋變量及解釋變量的滯后變量在內(nèi)的模型(8)式進(jìn)行估計(jì),求出隨機(jī)誤差項(xiàng)μt的自相關(guān)系數(shù)ρi的估計(jì)值。再將ρi的估計(jì)值,代入(7)式,可得(9)對(duì)(9)式回歸,得到βi的估計(jì)值。1612、用DW的值計(jì)算ρ的值由(6)式可得:

首先利用殘差求出DW的值,然后利用上式進(jìn)行變化可得:3、從殘差中估計(jì)ρ的值以一元線性回歸模型為例,對(duì)于模型ut

=ρut-1+vt若為一階自回歸AR(1),直接做如下回歸即:得到ρ的估計(jì)值162年份全年人均純收入(現(xiàn)價(jià))

全年人均消費(fèi)性支出(現(xiàn)價(jià))消費(fèi)價(jià)格指數(shù)(1985=100)人均實(shí)際純收入(1985可比價(jià))人均實(shí)際消費(fèi)性支出(1985可比價(jià))1985397.60317.42100.0397.60317.401986423.80357.00106.1399.43336.481987462.60398.30112.7410.47353.421988544.90476.70132.4411.56360.051989601.50535.40157.9380.94339.081990686.30584.63165.1415.69354.111991708.60619.80168.9419.54366.961992784.00659.80176.8443.44373.191993921.60769.70201.0458.51382.94表1985-2003年農(nóng)村居民人均收入和消費(fèi)單位:元

163

年份全年人均純收入(現(xiàn)價(jià))全年人均消費(fèi)性支出(現(xiàn)價(jià))消費(fèi)價(jià)格指數(shù)(1985=100)人均實(shí)際純收入(1985可比價(jià))人均實(shí)際消費(fèi)性支出(19

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論