2020面板數(shù)據(jù)講義_第1頁
2020面板數(shù)據(jù)講義_第2頁
2020面板數(shù)據(jù)講義_第3頁
2020面板數(shù)據(jù)講義_第4頁
2020面板數(shù)據(jù)講義_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

面板數(shù)據(jù)模型與應(yīng)用

1.面板數(shù)據(jù)定義

paneldata的中譯:面板數(shù)據(jù)、桌面數(shù)據(jù)、平行數(shù)據(jù)、縱列數(shù)據(jù)、時(shí)間

序列截面數(shù)據(jù)、混合數(shù)據(jù)(pooldata)、固定調(diào)查對象數(shù)據(jù)。

面板數(shù)據(jù)定義

(1)面板數(shù)據(jù)定義為相同截面上的個(gè)體在不同時(shí)點(diǎn)的重復(fù)觀測數(shù)據(jù)。

(2)稱為縱向(longitudinal)變量序列(個(gè)體)的多次測量。

面板數(shù)據(jù)從橫截面(crosssection)看,是由若干個(gè)體(entity,unit,

individual)在某一時(shí)點(diǎn)構(gòu)成的截面觀測值,從縱剖面(longitudinalsection)

看每個(gè)個(gè)體都是一個(gè)時(shí)間序列。

圖1N=7,T=50的面板數(shù)據(jù)示意圖

面板數(shù)據(jù)用雙下標(biāo)變量表示。例如

加,i=1,2,...,N;t=1,2,T

i對應(yīng)面板數(shù)據(jù)中不同個(gè)體。N表示面板數(shù)據(jù)中含有N個(gè)個(gè)體。1對應(yīng)面板數(shù)據(jù)中

不同時(shí)點(diǎn)。T表示時(shí)間序列的最大長度。若固定%不變,M,(…,N)是橫

截面上的N個(gè)隨機(jī)變量;若固定i不變,乂〃0=1,2L..,7)是縱剖面上的一個(gè)時(shí)

間序列(個(gè)體)。

2.面板數(shù)據(jù)模型

面板數(shù)據(jù)模型是利用面板數(shù)據(jù)構(gòu)建的模型。面板數(shù)據(jù)系一組個(gè)體在一段時(shí)間

內(nèi)的觀測值形成的數(shù)據(jù)集,這里“個(gè)體”可以是個(gè)人、家庭、企業(yè)、行業(yè)、地區(qū)

或國家(Baltagi)2008)o1966年,Balestra&Nerlove發(fā)表了第一篇利用面板數(shù)

據(jù)模型研究天然氣需求估計(jì)的論文,此后,面板數(shù)據(jù)模型這一新的計(jì)量分析方法

在理論和應(yīng)用上得到迅速發(fā)展,已形成現(xiàn)代計(jì)量經(jīng)濟(jì)學(xué)的一個(gè)相對獨(dú)立的分支。

面板數(shù)據(jù)模型由于同時(shí)使用了截面數(shù)據(jù)(cross-sectionaldata)和時(shí)間序列數(shù)

據(jù)(timeseriesdata),因而可以控制個(gè)體的異質(zhì)性,識別、測量單純使用這兩種

數(shù)據(jù)無法估計(jì)的效應(yīng);并且具有包含更多的信息、更大的變異和自由度、變量間

的共線性也更弱的特性,可得到更精確的參數(shù)估計(jì)(Hsiao,2003、2008)o

面板數(shù)據(jù)涉及個(gè)體(N)和時(shí)間(T)兩個(gè)維度,有微觀面板(micropanels)

和宏觀面板(macropanels)之分。

微觀面板源于截面數(shù)據(jù)的計(jì)量分析,是針對個(gè)體的調(diào)查數(shù)據(jù),其特點(diǎn)是個(gè)體

數(shù)N較大(通常是幾百或幾千個(gè)),而時(shí)期數(shù)T較?。ㄗ钌贋?年,最長不超過

20年),主要應(yīng)用于勞動(dòng)經(jīng)濟(jì)學(xué)以及需求分析、成本分析和生產(chǎn)函數(shù)分析等。

宏觀面板一般具有適度規(guī)模的個(gè)體N(從7到100或200不等,如G7,OECD、

歐盟、發(fā)達(dá)國家或發(fā)展中國家),時(shí)期數(shù)T一般在20至60之間,甚至更大。這

類數(shù)據(jù)可以刻畫一些制度或政策的外生變化,常用于識別政策效應(yīng)研究中的關(guān)注

參數(shù)。

宏觀和微觀面板要求使用不同的計(jì)量建模方法。微觀面板通常研究T固定而

N較大時(shí)(簡稱“大N小T”)的漸近性質(zhì),而宏觀面板則是同時(shí)考慮T和N都

較大時(shí)(簡稱“大N大T”)的漸近性質(zhì),此時(shí)可以分為對角極限、序貫極限和

聯(lián)合極限三種情形來討論。

對于宏觀面板,當(dāng)T較大時(shí)需要考慮數(shù)據(jù)的非平穩(wěn)(如單位根和協(xié)整)與結(jié)

構(gòu)變化等特征;微觀面板由于時(shí)間短,一般不需要處理非平穩(wěn)問題。在處理宏觀

面板時(shí),還必須考慮個(gè)體之間的相關(guān)性,即截面相關(guān),而在微觀面板中,如果個(gè)

體是隨機(jī)抽樣產(chǎn)生,則個(gè)體之間不大可能存在相關(guān)性,不需要考慮此類問題

(Baltagi;2008)。

假設(shè)有N個(gè)個(gè)體T期的觀測值先和z=l,,N,t=l,,Ttk=l,,K;yit

是在X”、Z〃和一組固定參數(shù)。的條件下,概率分布廠(為國”,乙,,)產(chǎn)生的隨機(jī)

結(jié)果,其中Z〃是不可觀測的影響因素。(如何理解?)

面板數(shù)據(jù)建模的目的是利用全部的樣本信息來對。進(jìn)行推斷。

假定感興趣的影響因素是X”,通常的做法是通過。在時(shí)間和個(gè)體上的變化,

即為來反映不可觀測的異質(zhì)性;因此,給定X”,%的條件密度為

此時(shí)如果不對必進(jìn)行任何約束,該模型就只有描述性作用,不能進(jìn)行任何的統(tǒng)計(jì)

推斷(如何理解?)。

常用的施加在%上的約束條件是將必分解為(月,凡),其中,不隨時(shí)間和個(gè)體

變動(dòng),稱為結(jié)構(gòu)參數(shù)(structuralparameters),4〃稱為冗余參數(shù)(incidental

parameters),迄今,面板數(shù)據(jù)的文獻(xiàn)主要集中在控制了4后如何對戶進(jìn)行推斷。

進(jìn)一步,如果不對人施加約束也不能對月做出推斷,因?yàn)榉矊?huì)耗盡所有的

樣本信息。

一般的處理思路是:假定可觀測變量X”的影響不隨時(shí)間和個(gè)體變化,由尸描

述;冗余參數(shù)4代表了X〃以外隨個(gè)體和時(shí)間變化的異質(zhì)性影響,這種影響可以

分解為個(gè)體效應(yīng)均、時(shí)間效應(yīng)%以及隨個(gè)體和時(shí)間變化的效應(yīng)與0

個(gè)體效應(yīng)應(yīng)和時(shí)間效應(yīng)九可以設(shè)定為隨機(jī)變量,也可以設(shè)定為固定的參數(shù),分

別形成了隨機(jī)效應(yīng)(randomeffects)模型和固定效應(yīng)(fixedeffects)模型。

所要研究的問題:

1.模型的設(shè)定

2.模型估計(jì)

3.模型的檢驗(yàn)

4.模型的應(yīng)用

問題:是否可將前面計(jì)量經(jīng)濟(jì)學(xué)所教授的內(nèi)容直接應(yīng)用于面板數(shù)據(jù)計(jì)量經(jīng)

濟(jì)學(xué)模型。

答案是否定的。

盡管基本的思路有相似之處,但面板數(shù)據(jù)模型有其自身的特點(diǎn)。

特點(diǎn):

L模型的設(shè)定:FE(FixedEffect)>RE(RandomEffect)Pool等等;

2.估計(jì)Within估計(jì),F(xiàn)GLS估計(jì)等等

3.檢驗(yàn)異方差性檢驗(yàn)、Hausman檢驗(yàn)等等;

如何理解估計(jì)、推斷、檢驗(yàn)、設(shè)定等方面的問題?

經(jīng)典的面板數(shù)據(jù)模型可以分為靜態(tài)模型和動(dòng)態(tài)模型o

靜態(tài)面板數(shù)據(jù)模型設(shè)定的一般形式為:

%=o+X;a+%+%+i=l,,N;t=l,,T(1)

其中,%與乂〃不相關(guān)。

若應(yīng)和4為固定的常數(shù),模型(1)稱為固定效應(yīng)模型;為了避免dummy陷

NT

阱,設(shè)定Z%=°,Z%=°,通常采用組內(nèi)(within-group)(WithinVSBetween)

/=1t=\

方法來估計(jì),并通過F檢驗(yàn)或Wald檢驗(yàn)考察固定效應(yīng)是否存在(為什么要檢驗(yàn)?

檢驗(yàn)什么?如何檢驗(yàn)?)o

若火和4為隨機(jī)變量,模型(1)稱為隨機(jī)效應(yīng)模型。此時(shí)除了假定%與X.不

相關(guān),還需進(jìn)一步假定應(yīng)和乙與X〃不相關(guān)。對于隨機(jī)效應(yīng)模型,可以采用FGLS

的方法來估計(jì)。

上述兩種效應(yīng)的設(shè)定各有特點(diǎn)。

固定效應(yīng)模型允許個(gè)體效應(yīng)(時(shí)間效應(yīng))與解釋變量X”相關(guān),但待估參數(shù)個(gè)

數(shù)隨著樣本容量的增大而增大,即存在冗余參數(shù)問題,且模型中不能包含非時(shí)變

的變量。(會(huì)出現(xiàn)什么問題?)

隨機(jī)效應(yīng)模型中,待估參數(shù)個(gè)數(shù)不隨樣本容量的變化而變化,當(dāng)隨機(jī)的個(gè)體

效應(yīng)(時(shí)間效應(yīng))與X”不相關(guān)時(shí)能夠得到更有效的估計(jì)量,模型中可以包括不

隨時(shí)間變化的變量;其缺點(diǎn)在于若隨機(jī)的個(gè)體效應(yīng)(時(shí)間效應(yīng))與X〃相關(guān)時(shí),

FGLS估計(jì)量是不一致的。通過Hausman檢驗(yàn),即原假設(shè)下兩個(gè)一致統(tǒng)計(jì)量是

否有顯著差異可以判斷采用何種設(shè)定更合適。(操作細(xì)節(jié)?)

很多經(jīng)濟(jì)關(guān)系具有動(dòng)態(tài)性,可以通過在模型中加入被解釋變量的滯后作為解

釋變量來刻畫:

%=yy"-i+x[0+Ui+£",t=i,,N;t=i,j(2)

其中,個(gè)體效應(yīng)均可以是固定或隨機(jī)的;若均為隨機(jī)的,則假定對與%不相關(guān)。

式(2)稱為動(dòng)態(tài)面板數(shù)據(jù)模型,其在時(shí)間上的記憶性來自兩個(gè)方面:

一是先-作為解釋變量所引起的自相關(guān);

二是由個(gè)體效應(yīng)所引起的自相關(guān)。

無論將應(yīng)設(shè)定為固定效應(yīng)還是隨機(jī)效應(yīng),即使總是萬d,模型(2)也會(huì)產(chǎn)生

內(nèi)生性問題,對應(yīng)的估計(jì)量均是不一致的。為什么?

為了解決這一問題,早期的研究采取方法有:

一是對模型(2)進(jìn)行一階差分,然后進(jìn)行IV估計(jì)或GMM估計(jì)

(Anderson&Hsiao;1981)。

Arellano&Bond(1991)擴(kuò)展了一般的GMM估計(jì),建議使用變量水平值的

所有滯后項(xiàng)作為差分變量的工具變量以提高估計(jì)的有效性,這一方法稱為差分

GMM估計(jì);

差分GMM估計(jì)的一個(gè)缺點(diǎn)是差分會(huì)導(dǎo)致模型擾動(dòng)項(xiàng)出現(xiàn)序列相關(guān)。

為此,Arellano&Bover(1995)建議通過正交離差(orthogonaldeviation)

的變換來消除個(gè)體效應(yīng)的影響。差分GMM估計(jì)的另一個(gè)缺陷是估計(jì)量在有限樣

本下存在較大的偏差,當(dāng)自回歸系數(shù)/接近1時(shí)尤為嚴(yán)重;

Bhmdell和Bond(1998)的研究表明,差分GMM估計(jì)的這一不良表現(xiàn)源于

使用變量水平值的滯后項(xiàng)作為差分變量的工具變量所導(dǎo)致的弱工具變量問題

(Staiger&Stock,1997),因而提出系統(tǒng)GMM估計(jì)的方法,建議在進(jìn)行差分GMM

估計(jì)的同時(shí)使用另一組矩條件來估計(jì)參數(shù),即使用變量差分值的滯后項(xiàng)作為水平

變量的工具變量。Blundell&Bond(1998)的推導(dǎo)與模擬表明,系統(tǒng)GMM估計(jì)

能有效克服弱工具變量的問題,極大地改進(jìn)了估計(jì)量的有限樣本表現(xiàn),在降低偏

差的同時(shí)提高了估計(jì)的精度。

早期的面板數(shù)據(jù)模型均假定截面之間是相互獨(dú)立的。但是,忽略個(gè)體之間的

截面相關(guān)將會(huì)影響估計(jì)量的有效性甚至導(dǎo)致估計(jì)量的不一致(Pesaran,2006)。

近年來,面板數(shù)據(jù)模型的一個(gè)重要發(fā)展方向是考慮截面相關(guān)的面板數(shù)據(jù)模型的估

計(jì)與推斷。與時(shí)序數(shù)據(jù)中度量序列相關(guān)不同,截面相關(guān)并沒有一個(gè)直接的度量方

式。因此,為了刻畫模型的截面相關(guān),必須對模型施加很強(qiáng)的假定。常用的兩種

度量截面相關(guān)的方法是空間的方法(spatialapproach)和因子的方法(factor

approach)o

空間的方法是通過空間加權(quán)矩陣建立起個(gè)體之間的相依性,往往用于刻畫由

于經(jīng)濟(jì)活動(dòng)的相互依賴、相互影響而呈現(xiàn)的相關(guān),如源于地理位置相近,文化、

歷史的相似,或由于存在貿(mào)易往來、勞動(dòng)力流動(dòng)、產(chǎn)業(yè)結(jié)構(gòu)關(guān)聯(lián)等。由空間方法

刻畫的截面相關(guān)反映不同個(gè)體之間存在一般的相關(guān)性,即截面相關(guān)陣的特征根有

界,是一種截面弱相關(guān)。理論上空間加權(quán)矩陣可以出現(xiàn)在模型中的任何位置(因

變量、自變量和擾動(dòng)項(xiàng)),因自變量的空間相關(guān)不會(huì)產(chǎn)生新的估計(jì)問題,所以相

關(guān)研究集中在因變量和擾動(dòng)項(xiàng)的空間相關(guān),對應(yīng)的模型分別稱為空間滯后模型和

空間誤差模型。這兩類模型一般采用工具變量估計(jì)(廣義矩估計(jì))或極大似然估

計(jì)。

因子的方法描述的是由凌駕于整個(gè)區(qū)域市場的經(jīng)濟(jì)波動(dòng)或行政力量沖擊造成

的結(jié)果,表現(xiàn)為一種共同沖擊,即不同個(gè)體之間的相關(guān)性是由某個(gè)共同的因子引

起,因此截面相關(guān)陣存在0(11)階的發(fā)散特征根,屬于截面強(qiáng)相關(guān)。因子模型的一

般形式為:

y=x;p+j

iti=V,N;t=\,,T(3)

J=AM+彩

其中,耳=",,"J是廠維的隨機(jī)因子,A,=(4,,4J是廣維的非隨機(jī)因

子載荷系數(shù)。腺代表異質(zhì)的沖擊,與耳相互獨(dú)立,且在截面之間相互獨(dú)立。Bai

(2009)對式(3)所刻畫的因子模型的估計(jì)和推斷做了詳細(xì)的討論。

Pesaran&Tosetti(2011)考慮了如下更一般的模型來同時(shí)刻畫截面強(qiáng)相關(guān)與

截面弱相關(guān):

%=“+0;X"+y\f\+sit(4)

其中,4是〃xl的可觀測的共同效應(yīng)(commoneffects),X”是kxl的個(gè)體特

質(zhì)的解釋變量,力是mxl的不可觀測的共同因子,用于刻畫截面強(qiáng)相關(guān),%假定

存在空間相關(guān),用于刻畫截面弱相關(guān)。Pesaran&Tosetti(2011)指出,對于該模

型,可以采用Pesaran(2006)提出的CCEP方法來得到參數(shù)的一致估計(jì)。

除了上述討論的幾類面板數(shù)據(jù)模型外,文獻(xiàn)中還有很多其它類型的面板數(shù)據(jù)

模型,如微觀計(jì)量模型中的離散因變量模型(包括靜態(tài)和動(dòng)態(tài))、受限因變量模

型(包括截?cái)嗪蜌w并)在面板數(shù)據(jù)下的擴(kuò)展,以及非線性面板數(shù)據(jù)模型(閾值面板

數(shù)據(jù)模型、平滑轉(zhuǎn)移的面板數(shù)據(jù)模型等)、多方程面板數(shù)據(jù)模型等等(Hsiao,2003;

Baltagi,2008)o這些模型也是未來面板數(shù)據(jù)模型理論和應(yīng)用研究的重要發(fā)展方

向。

下面以例子來加以說明如何理解上述描述:

例1:1996-2002年中國東北、華北、華東15個(gè)省級地區(qū)的居民家庭固定價(jià)

格的人均消費(fèi)(CP)和人均收入(IP)數(shù)據(jù)見5panel02.wfl。數(shù)據(jù)是7年的,每

一年都有15個(gè)數(shù)據(jù),共105組(個(gè))觀測值。

人均消費(fèi)和收入兩個(gè)面板數(shù)據(jù)都是平衡(balance)面板數(shù)據(jù),各有15個(gè)時(shí)間

序列數(shù)據(jù)。人均消費(fèi)和收入的面板數(shù)據(jù)從縱剖面觀察分別見圖2和圖3。從橫截

面觀察分別見圖4和圖5。橫截面數(shù)據(jù)散點(diǎn)圖的表現(xiàn)與觀測值順序有關(guān)。圖4和

圖5中人均消費(fèi)和收入觀測值順序是按地區(qū)名的漢語拼音字母順序排序的。

1400014000

12000

10000

8000

6000

4000

2000

1996199719981999200020012002

--------CPAH---------CPJL---------CPSD--------IPAH---------IPJL--------IPSD

--------CPBJ—CPJS-----------CPSH--------IPBJ---------IPJS--------IPSH

--------CPFJ---------CPJX---------CPSX—IPFJ--------IPJX—IPSX

--------CPHB--CPLN-----------CPTJ--------IPHB—IPLN--------IPTJ

—CPHLJ-CPNMG--CPZJIPHLJIPNMGIPZJ

圖215個(gè)省級地區(qū)的人均消費(fèi)序列(縱剖面)圖315個(gè)省級地區(qū)的人均收入序列(5panel02)

一一CP1996—CP1999—CP2002——IP1996—IP1999—IP2002

-CP1997—CP2000-IP1997——IP2000

一一CP1998CP2001——IP1998---IP2001

圖47個(gè)時(shí)點(diǎn)人均消費(fèi)橫截面數(shù)據(jù)(含15個(gè)地區(qū))圖57個(gè)時(shí)點(diǎn)人均收入橫截面數(shù)據(jù)(含15個(gè)地區(qū))

(每條連線數(shù)據(jù)表示同一年度15個(gè)地區(qū)的消費(fèi)值)(每條連線數(shù)據(jù)表示同一年度15個(gè)地區(qū)的收入值)

用CP表示消費(fèi),IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,

SD,SH,SX,TJ,ZJ分別表示安徽省、北京市、福建省、河北省、黑龍江省、吉

林省、江蘇省、江西省、遼寧省、內(nèi)蒙古自治區(qū)、山東省、上海市、山西省、天

津市、浙江省。

11000

CPAH

10000

一?-CPBJ

9000一^一-CPFJ

*CPHB

8000xCPHLJ

+CPJL

7000■CPJS

6000°CPJX

ACPLN

5000△CPNMG

▼CPSD

4000CPSH

。CPSX

3000

?CPTJ

2000—e——CPZJ

IP(1996-2002)

圖6人均消費(fèi)對收入的面板數(shù)據(jù)散點(diǎn)圖(15個(gè)時(shí)間序列疊加)

12000

-CP1996

△CP1997

10000■CP1998

*CP1999

vCP2000

8000-CP2001

△CP2002*

L

,-V

△*△

6000

4000

產(chǎn)

IP(1996-2002)

2000

2000400060008000100001200014000

圖7人均消費(fèi)對收入的面板數(shù)據(jù)散點(diǎn)圖(7個(gè)截面疊加)

2.面板數(shù)據(jù)模型分類

用面板數(shù)據(jù)建立的模型通常有3種,即混合回歸模型、固定效應(yīng)回歸模型和隨機(jī)

效應(yīng)回歸模型。

2.1混合回歸模型(Pooledmodel)o

如果一個(gè)面板數(shù)據(jù)模型定義為,

yit=a+Xit'p+£it,i=1,2,N;t=l,2,T(1)

其中為為被回歸變量(標(biāo)量),a表示截距項(xiàng),居為Axl階回歸變量列向量(包

括左個(gè)回歸量),/為Axl階回歸系數(shù)列向量,品為誤差項(xiàng)(標(biāo)量)。則稱此模型

為混合回歸模型?;旌匣貧w模型的特點(diǎn)是無論對任何個(gè)體和截面,回歸系數(shù)a和萬

都相同。

如果模型是正確設(shè)定的,解釋變量與誤差項(xiàng)不相關(guān),即Cov(X",&)=0。那么

無論是Nfoo,還是T->oo,模型參數(shù)的混合最小二乘估計(jì)量(PooledOLS)都是

一致估計(jì)量。

2.2固定效應(yīng)回歸模型(自xedeffectsregressionmodel)。

固定效應(yīng)模型分為3種類型,即個(gè)體固定效應(yīng)回歸模型、時(shí)點(diǎn)固定效應(yīng)回歸

模型和個(gè)體時(shí)點(diǎn)雙固定效應(yīng)回歸模型。下面分別介紹。

2.2.1個(gè)體固定效應(yīng)回歸模型(entityfixedeffectsregressionmodel)

如果一個(gè)面板數(shù)據(jù)模型定義為,

yit=0+XfP+%,/=1,2,...,N;t=1,2,T(2)

其中a是隨機(jī)變量,表示對于i個(gè)個(gè)體有i個(gè)不同的截距項(xiàng),且其變化與《有關(guān)

系;如為被回歸變量(標(biāo)量),品為誤差項(xiàng)(標(biāo)量),Xm為kxl階回歸變量列向

量(包括4個(gè)回歸量),£為kxi階回歸系數(shù)列向量,對于不同個(gè)體回歸系數(shù)相同,

則稱此模型為個(gè)體固定效應(yīng)回歸模型。

a作為隨機(jī)變量描述不同個(gè)體建立的模型間的差異。因?yàn)閍是不可觀測的,

且與可觀測的解釋變量心的變化相聯(lián)系,所以稱(2)式為個(gè)體固定效應(yīng)回歸模

型。

個(gè)體固定效應(yīng)回歸模型也可以表示為

yit=?i+a2D2+...+aNDN+X/B+M£=1,2,…,T(3)

其中

fl,如果屬于第i個(gè)個(gè)體,i=2,…,N,

Di=[0,其他,

設(shè)定個(gè)體固定效應(yīng)回歸模型的原因如下。假定有面板數(shù)據(jù)模型

yit=A+AX"+-0+%,1=1,2,...,N;t=l,2,T(4)

其中自為常數(shù),不隨時(shí)間、截面變化;&表示隨個(gè)體變化,但不隨時(shí)間變化

的難以觀測的變量。上述模型可以被解釋為含有N個(gè)截距,即每個(gè)個(gè)體都

對應(yīng)一個(gè)不同截距的模型。令°=自+居&,于是(4)式變?yōu)?/p>

yit=a+£ixit+Sit,i=1,2,N;£=1,2,T⑸

這正是個(gè)體固定效應(yīng)回歸模型形式。對于每個(gè)個(gè)體回歸函數(shù)的斜率相同(都

是£1),截距a?卻因個(gè)體不同而變化??梢妭€(gè)體固定效應(yīng)回歸模型中的截距

項(xiàng)a中包括了那些隨個(gè)體變化,但不隨時(shí)間變化的難以觀測的變量的影響。

a?是一個(gè)隨機(jī)變量。

以案例1為例,省家庭平均人口數(shù)就是這樣的一個(gè)變量。對于短期面板

來說,這是一個(gè)基本不隨時(shí)間變化的量,但是對于不同的省份,這個(gè)變量的

值是不同的。

以案例1為例(file:panel02)得到的個(gè)體固定效應(yīng)模型估計(jì)結(jié)果如下:

DependentVariable:CP?

Method:PooledLeastSquares

Date:11/07/04Time:20:52

Sample:19962002

Includedobservations:7

Numberofcross-sectionsused:15

Totalpanel(balanced)observations:105

VariableCoefficientStd.Errort-StatisticProb.

IP?0.6975610.01269254.960290.0000

FixedEffects

AH-C_____479.3084

BJ-C1053.180

FJ-C467.9690

HB-C361.3774

HLJ-C345.9127

JL-C540.1185

JS-C480.4183

JX-C195.9182

LN-C622.0415

NMG-C306.0658

SD--C381.4997

SH--C782.6001

SX--C440.7252

TJ-C562.8436

ZJ-714.2344

R-squared0.992488Meandependentvar4917.608

AdjustedR-squared0.991222S.D.dependentvar1704.704

S.E.ofregression159.7184Sumsquaredresid2270386.

Durbin-Watsonstat1.609517

注意:個(gè)體固定效應(yīng)模型的EViwes輸出結(jié)果中沒有公共截距項(xiàng)。

圖10個(gè)體固定效應(yīng)回歸模型的估計(jì)結(jié)果

2.2.2時(shí)點(diǎn)固定效應(yīng)回歸模型(timefixedeffectsregressionmodel)

如果一個(gè)面板數(shù)據(jù)模型定義為,

yu=Yt+Xit'P+痂,i=1,2,…,N(6)

其中%是模型截距項(xiàng),隨機(jī)變量,表示對于T個(gè)截面有T個(gè)不同的截距項(xiàng),且其

變化與《有關(guān)系;為為被回歸變量(標(biāo)量),品為誤差項(xiàng)(標(biāo)量),滿足通常假定

條件。X”為Axl階回歸變量列向量(包括4個(gè)回歸變量),笈為Axl階回歸系數(shù)

列向量,則稱此模型為時(shí)點(diǎn)固定效應(yīng)回歸模型。

時(shí)點(diǎn)固定效應(yīng)回歸模型也可以加入虛擬變量表示為

=/I+vv2+...+/TWT+xit'P+£it,f=1,2,...,N;t=1,2,T(7)

其中

1,如果屬于第/個(gè)截面,t=2,...,T;

w'二[o,其他(不屬于第,個(gè)截面)。

設(shè)定時(shí)點(diǎn)固定效應(yīng)回歸模型的原因。假定有面板數(shù)據(jù)模型

%=4)+尸1xit+P2&+%,1=1,2,N;t=l,2,T(8)

其中同為常數(shù),不隨時(shí)間、截面變化;a表示隨不同截面(時(shí)點(diǎn))變化,但

不隨個(gè)體變化的難以觀測的變量。上述模型可以被解釋為含有T個(gè)截距,即

每個(gè)截面都對應(yīng)一個(gè)不同截距的模型。令%=4+四%,于是(8)式變?yōu)?/p>

yit=Yt+AXit+%,i=1,2,…,N;t=l,2,T(9)

這正是時(shí)點(diǎn)固定效應(yīng)回歸模型形式。對于每個(gè)截面,回歸函數(shù)的斜率相

同(都是尸I),不卻因截面(時(shí)點(diǎn))不同而異??梢姇r(shí)點(diǎn)固定效應(yīng)回歸模型中

的截距項(xiàng)%包括了那些隨不同截面(時(shí)點(diǎn))變化,但不隨個(gè)體變化的難以觀

測的變量的影響。先是一個(gè)隨機(jī)變量。

以案例1為例,“全國零售物價(jià)指數(shù)”就是這樣的一個(gè)變量。對于不同

時(shí)點(diǎn),這是一個(gè)變化的量,但是對于不同省份(個(gè)體),這是一個(gè)不變化的

量。

DependentVariable:CP?

Method:PooledLeastSquares

Date:11/07/04Time:20:57

Sample:19962002

Includedobservations:7

Numberofcross-sectionsused:15

Totalpanel(balanced)observations:105

VariableCoefficientStd.Errort-StatisticProb.

C108.505771.423181.5191950.1320

IP?0.7788600.01043874.619110.0000

D199728.1273174.733050.3763700.7075

D1998-51.0802375,29270-0.6784220.4991

D1999-143.002676.42658-1.8711100.0643

D2000-113.046977,44443-1.4597160.1476

D2001-262.675979,76098-3.2932880.0014

D2002-199.821383.17701-2.4023620.0182

R-squared0.986669Meandependentvar4917.608

AdjustedR-squared0.985707S.D.dependentvar1704.704

S.E.ofregression203.8001Sumsquaredresid4028843.

F-statistic1025.643Durbin-Watsonstat0.785376

Prob(F-statistic)0.000000

圖11

2.2.3個(gè)體時(shí)點(diǎn)雙固定效應(yīng)回歸模型(timeandentityfixedeffectsregression

model)

如果一個(gè)面板數(shù)據(jù)模型定義為,

yn=a+%+Xf/3+%,=1,2,...,N;t=1,2,T(11)

其中為為被回歸變量(標(biāo)量);a是隨機(jī)變量,表示對于N個(gè)個(gè)體有N個(gè)不同的

截距項(xiàng),且其變化與X”有關(guān)系;力是隨機(jī)變量,表示對于T個(gè)截面(時(shí)點(diǎn))有T

個(gè)不同的截距項(xiàng),且其變化與居有關(guān)系;X"為kX1階回歸變量列向量(包括女

個(gè)回歸量);N為女X1階回歸系數(shù)列向量;為為誤差項(xiàng)(標(biāo)量)滿足通常假定(與1居,

%%)=0;則稱此模型為個(gè)體時(shí)點(diǎn)固定效應(yīng)回歸模型。

個(gè)體時(shí)點(diǎn)固定效應(yīng)回歸模型還可以表示為,

yit=ai+a2D2+...+aNDN+桂W2+...+yT啊+X”/+%,r=1,2,(12)

其中

p._f1,如果屬于第i個(gè)個(gè)體,i=2,…,N,

[0,其他,

fl,如果屬于第,個(gè)截面,r=2〃..,T;/I小

用=4(14)

0,其他(不屬于第r個(gè)截面)。

如果模型形式是正確設(shè)定的,并且滿足模型通常的假定條件,對模型(12)

進(jìn)行混合OLS估計(jì),全部參數(shù)估計(jì)量都是不一致的。正如個(gè)體固定效應(yīng)回歸模

型可以得到一致的、甚至有效的估計(jì)量一樣,一些計(jì)算方法也可以使個(gè)體時(shí)點(diǎn)雙

固定效應(yīng)回歸模型得到更有效的參數(shù)估計(jì)量。

以例1為例得到的截面、時(shí)點(diǎn)固定效應(yīng)模型估計(jì)結(jié)果如下:

DependentVariable:CP?

Method:PooledLeastSquares

Date:11/07/04Time:20:59

Sample:19962002

Includedobservations:7

Numberofcross-sectionsused:15

Totalpanel(balanced)observations:105

VariableCoefficientStd.Errort-StatisticProb.

IP?0.6712060.03275620.491040.0000

D199798.9112661.237941.6151960.1101

D199866.9952867.653340.9902730.3249

D199936.5569379190910.4616300.6456

D200010809068839472122281702249

D200133366281067716031250207554

D200218338821299300141143901619

FixedEffects

AH-C5379627

BJ-C1223758

FJ-C5782207

HB-C4289540

HLJ-C394.6776

JL-C588.4515

JS-C576.1935

JX-C246.4431

LN-C680.9611

NMG-C353.9778

SD-C463.9048

SH-C9811455

SX-C4862647

TJ-C6876891

ZJ-C8704197

圖12

回歸系數(shù)為0.67,這與個(gè)體固定效應(yīng)回歸模型給出的估計(jì)結(jié)果0.70基本一致。

在上述三種固定效應(yīng)回歸模型中,個(gè)體固定效應(yīng)回歸模型最為常用。

2.3隨機(jī)效應(yīng)模型

對于面板數(shù)據(jù)模型

為=a+X/尸+與,i=1,2,1,2,T(15)

如果a為隨機(jī)變量,其分布與《無關(guān);如為被回歸變量(標(biāo)量),時(shí)為誤差

項(xiàng)(標(biāo)量),X"為兒X1階回歸變量列向量(包括4個(gè)回歸量),£為兒X1階

回歸系數(shù)列向量,對于不同個(gè)體回歸系數(shù)相同,這種模型稱為個(gè)體隨機(jī)效應(yīng)

回歸模型(隨機(jī)截距模型、隨機(jī)分量模型)。其假定條件是

2

a?iid(a,cra),“?iid(O,o,)

都被假定為獨(dú)立同分布,但并未限定何種分布。

同理也可定義時(shí)點(diǎn)隨機(jī)效應(yīng)回歸模型和個(gè)體時(shí)點(diǎn)隨機(jī)效應(yīng)回歸模型,但

個(gè)體隨機(jī)效應(yīng)回歸模型最為常用。

個(gè)體隨機(jī)效應(yīng)模型又稱為等相關(guān)模型(Equicorrelatedmodel)o原因如

下。隨機(jī)效應(yīng)模型可以看作是混合模型的特例。對于個(gè)體隨機(jī)效應(yīng)回歸模型

為=a+招力+時(shí),可以把4并入誤差項(xiàng)與。模型改寫為

y尸Xit'P+(0+%)=Xit'B+uit(16)

其中%產(chǎn)(a+品)。如果有a??(a,crj),為?(0,成立,那么,

2

COV(MJ,WIS)=Cov[(a+%)(a+Cs)]=%2'2''s(17)

79a+%,r=S

因?yàn)閷τ趂ws,有

r(w/z,w/s)=Cov如,",、)=__屋_(18)

必N%)加ar?)bJ+bJ

相關(guān)系數(shù)r(如MJ與(t-s)即相隔期數(shù)長短無關(guān)。所以個(gè)體隨機(jī)效應(yīng)模型也

稱作等相關(guān)模型,或者可交換誤差模型(exchangeablemodel)。

對于個(gè)體隨機(jī)效應(yīng)模型,E(aIXit)=a,則有,E(yl71xit)=a+X:B,對yit

可以識別。所以隨機(jī)效應(yīng)模型參數(shù)的混合OLS估計(jì)量具有一致性,但不具

有有效性。

注意:“固定效應(yīng)模型”這個(gè)術(shù)語用得并不十分恰當(dāng),容易產(chǎn)生誤解。

其實(shí)固定效應(yīng)模型應(yīng)該稱之為“相關(guān)效應(yīng)模型”,而隨機(jī)效應(yīng)模型應(yīng)該稱之

為“非相關(guān)效應(yīng)模型“。因?yàn)楣潭ㄐ?yīng)模型和隨機(jī)效應(yīng)模型中的a都是隨機(jī)

變量。

3.面板數(shù)據(jù)模型估計(jì)方法

面板數(shù)據(jù)模型中碘估計(jì)量既不同于截面數(shù)據(jù)估計(jì)量,也不同于時(shí)間序列

估計(jì)量,其性質(zhì)隨設(shè)定固定效應(yīng)模型是否正確而變化。

3.1混合最小二乘(PooledOLS)估計(jì)

混合OLS估計(jì)方法是在時(shí)間上和截面上把NT個(gè)觀測值混合在一起,然

后用OLS法估計(jì)模型參數(shù)。給定混合模型

yit=a+xit^+£it,i=1,2,…,N"=1,2,T(19)

如果模型是正確設(shè)定的,且解釋變量與誤差項(xiàng)不相關(guān),即Cov(M?品)=0。

那么無論是Nf8,還是T-?00,模型參數(shù)的混合最小二乘估計(jì)量都具有一

致性。

對混合模型通常采用的是混合最小二乘(PooledOLS)估計(jì)法。

然而,在誤差項(xiàng)服從獨(dú)立同分布條件下由OLS法得到的方差協(xié)方差矩陣,

在這里通常不會(huì)成立。因?yàn)閷τ诿總€(gè)個(gè)體i及其誤差項(xiàng)來說通常是序列相關(guān)

的。NT個(gè)相關(guān)觀測值要比NT個(gè)相互獨(dú)立的觀測值包含的信息少。從而導(dǎo)

致誤差項(xiàng)的標(biāo)準(zhǔn)差常常被低估,估計(jì)量的精度被虛假夸大。

如果模型存在個(gè)體固定效應(yīng),即4與招相關(guān),那么對模型應(yīng)用混合OLS

估計(jì)方法,估計(jì)量不再具有一致性。解釋如下:

假定模型實(shí)為個(gè)體固定效應(yīng)模型M尸a+Xi/B+與,但卻當(dāng)作混合模型

來估計(jì)參數(shù),則模型可寫為

yit=a+Xit+(a,-a+sit)=a+Xit'p+uit(20)

其中即=(a-a+&)。因?yàn)閍與相關(guān),也即〃”與相關(guān),所以個(gè)體固定

效應(yīng)模型的參數(shù)若采用混合OLS估計(jì),估計(jì)量不具有一致性。

3.2平均(between)OLS估計(jì)

平均OLS估計(jì)法的步驟是首先對面板數(shù)據(jù)中的每個(gè)個(gè)體求平均數(shù),共

得到N個(gè)平均數(shù)(估計(jì)值)。然后利用為和居的N組觀測值估計(jì)參數(shù)。以

個(gè)體固定效應(yīng)回歸模型

為=a+x/夕+時(shí)(21)

為例,首先對面板中的每個(gè)個(gè)體求平均數(shù),從而建立模型

廠&+£/+弓,”1,2,…,N(22)

TTT

其中歹尸廠2小X=弓=廠*〃,其F2,...,M變換上式得

l=lt=\/=1

%=a+£/+(%-a+品),i=1,2,…,N(23)

上式稱作平均模型。對上式應(yīng)用OLS估計(jì),則參數(shù)估計(jì)量稱作平均OLS估

計(jì)量。此條件下的樣本容量為M(7=1)。

如果用與Q-a+品湘互獨(dú)立,a和微平均OLS估計(jì)量是一致估計(jì)量。

平均OLS估計(jì)法適用于短期面板的混合模型和個(gè)體隨機(jī)效應(yīng)模型。對于個(gè)

體固定效應(yīng)模型來說,由于4和X"相關(guān),也即a?和兄相關(guān),所以,回歸參

數(shù)的平均OLS估計(jì)量是非一致估計(jì)量。

3.3離差(within)OLS估計(jì)

對于短期面板數(shù)據(jù),離差OLS估計(jì)法的原理是先把面板數(shù)據(jù)中每個(gè)個(gè)

體的觀測值變換為對其平均數(shù)的離差觀測值,然后利用離差數(shù)據(jù)估計(jì)模型參

數(shù)。具體步驟是,對于個(gè)體固定效應(yīng)回歸模型

yit=ai+Xufi+Sit(24)

中的每個(gè)個(gè)體計(jì)算平均數(shù),可得到如下模型,

x=8+兄'。+弓

其中反、尺、品的定義見(22)式。上兩式相減,消去了得

%7,二(居?用)',+(廝-名)

此模型稱作離差數(shù)據(jù)模型。對上式應(yīng)用OLS估計(jì),所得微估計(jì)量稱作離差

OLS估計(jì)量。對于個(gè)體固定效應(yīng)回歸模型,£的離差OLS估計(jì)量是一致估

計(jì)量。如果“還滿足獨(dú)立同分布條件,微離差OLS估計(jì)量不但具有一致性

而且還具有有效性。

如果對固定效應(yīng)0?感興趣,也可按下式估計(jì)。

?,=x-x'P(27)

個(gè)體固定效應(yīng)回歸模型的估計(jì)通常采用的就是離差(within)OLS估計(jì)

法。

在短期面板條件下,即便4的分布、以及a和居的關(guān)系都已知到,a

的估計(jì)量仍不具有一致性。當(dāng)個(gè)體數(shù)N不大時(shí),可采用OLS虛擬變量估計(jì)

法估計(jì)0?和外

離差OLS估計(jì)法的主要缺點(diǎn)是不能估計(jì)非時(shí)變回歸變量構(gòu)成的面板數(shù)

據(jù)模型。比如瑞=乂(非時(shí)變變量),那么有%=乂,計(jì)算離差時(shí)有乂?兄=

Oo

3.4一階差分(firstdifference)OLS估計(jì)

在短期面板條件下,一階差分OLS估計(jì)就是對個(gè)體固定效應(yīng)模型中的

回歸量與被回歸量的差分變量構(gòu)成的模型的參數(shù)進(jìn)行OLS估計(jì)。具體步驟

是,對個(gè)體固定效應(yīng)回歸模型

yit=ai+Xit'P+£it

取其滯后一期關(guān)系式

yit-i=0+X"/£+%_i

上兩式相減,得一階差分模型(&被消去)

yu-yit-i=《讓-XitQ'0+(%-與“),i=1,2,N;t=1,2,T

對上式應(yīng)用OLS估計(jì)得到的燃估計(jì)量稱作一階差分OLS估計(jì)量。盡管a

不能被估計(jì),£的估計(jì)量是一致估計(jì)量。

在7>2,“獨(dú)立同分布條件下得到的P的一階差分OLS估計(jì)量不如離差

OLS估計(jì)量有效。

3.5隨機(jī)效應(yīng)(randomeffects)估計(jì)法(可行GLS(feasibleGLS)估計(jì)

法)

有個(gè)體固定效應(yīng)模型

yit=at+Xa'P+Si

國,“服從獨(dú)立同分布。對其作如下變換

%-粒=(1■力〃+(X"J%)'〃+Vit(29)

其中v=(1))0+(“J片)漸近服從獨(dú)立同分布,2=1-,應(yīng)用OLS

it商+叱

估計(jì),則所得估計(jì)量稱為隨機(jī)效應(yīng)估計(jì)量或可行GLS估計(jì)量。當(dāng)夕=0時(shí),

(29)式等同于混合OLS估計(jì);當(dāng),=1時(shí),(29)式等同于離差OLS估計(jì)。

對于隨機(jī)效應(yīng)模型,可行GLS估計(jì)量不但是一致估計(jì)量,而且是有效

估計(jì)量,但對于個(gè)體固定效應(yīng)模型,可行GLS估計(jì)量不是一致估計(jì)量。

面板數(shù)據(jù)模型估計(jì)量的穩(wěn)健統(tǒng)計(jì)推斷。在實(shí)際的經(jīng)濟(jì)面板數(shù)據(jù)中,N個(gè)

個(gè)體之間相互獨(dú)立的假定通常是成立的,但是每個(gè)個(gè)體本身卻常常是序列自

相關(guān)的,且存在異方差。為了得到正確的統(tǒng)計(jì)推斷,需要克服這兩個(gè)因素。

對于第i個(gè)個(gè)體,當(dāng)Nf8,乂?的方差協(xié)方差矩陣仍然是TxT有限階的,

所以可以用以前的方法克服異方差。采用GMM方法還可以得到更有效的估

計(jì)量。

EViwes中對隨機(jī)效應(yīng)回歸模型的估計(jì)采用的就是可行(feasible)GLS

估計(jì)法。

4.面板數(shù)據(jù)模型設(shè)定檢驗(yàn)方法

4.1F檢驗(yàn)

先介紹原理。方統(tǒng)計(jì)量定義為

F=(SSER-SSEu)m

?F(m1-k)

SSEu/(r-k)

其中SSEr表示施加約束條件后估計(jì)模型的殘差平方和,SSEU表示未施加

約束條件的估計(jì)模型的殘差平方和,機(jī)表示約束條件個(gè)數(shù),7表示樣本容量,

無表示未加約束的模型中被估參數(shù)的個(gè)數(shù)。在原假設(shè)“約束條件真實(shí)”條件

下,方統(tǒng)計(jì)量漸近服從自由度為(山,丁-4)的耳分布。

以檢驗(yàn)個(gè)體固定效應(yīng)回歸模型為例,介紹方檢驗(yàn)的應(yīng)用。建立假設(shè)

Ho:3=ao模型中不同個(gè)體的截距相同(真實(shí)模型為混合回歸模

型)。

Hi:模型中不同個(gè)體的截距項(xiàng)a?不同(真實(shí)模型為個(gè)體固定效應(yīng)回歸模

型)。

方統(tǒng)計(jì)量定義為:

p-(SSE-SSE)/[(NT(SSE-SSE^J/jN-I)

rUr(31)

SSE?/(NT-N-k)SS^/(NT-N-k)

其中SS耳表示約束模型,即混合估計(jì)模型的殘差平方和,SSE“表示非約束

模型,即個(gè)體固定效應(yīng)回歸模型的殘差平方和。非約束模型比約束模型多了

N-1個(gè)被估參數(shù)。

以案例1為例,已知SSEr=4824588,SSEU=2270386,

p_(SSE.-SS紇)/(N-l)=(4824588-227038軟15-1)

SS^,/(NT一N-1)227038^(105-15-1)

_182443_gI(32)

225105

F0.05(6,87)=1.8

因?yàn)閎=8.1>E).05(14,89)=L8,推翻原假設(shè),比較上述兩種模型,建立個(gè)體

固定效應(yīng)回歸模型更合理。

4.2Hausman檢驗(yàn)

對同一參數(shù)的兩個(gè)估計(jì)量差異的顯著性檢驗(yàn)稱作Hausman檢驗(yàn),簡稱

H檢驗(yàn)。H檢驗(yàn)由Hausmanl978年提出,是在Durbin(1914)和Wu(1973)

基礎(chǔ)上發(fā)展起來的。所以H檢驗(yàn)也稱作Wu-Hausman檢驗(yàn),和

Durbin-Wu-Hausman檢驗(yàn)。

先介紹Hausman檢驗(yàn)原理

例如在檢驗(yàn)單一方程中某個(gè)回歸變量(解釋變量)的內(nèi)生性問題時(shí)得到

相應(yīng)回歸參數(shù)的兩個(gè)估計(jì)量,一個(gè)是OLS估計(jì)量、一個(gè)是2SLS估計(jì)量。

其中2sLs估計(jì)量用來克服回歸變量可能存在的內(nèi)生性。如果模型的解釋變

量中不存在內(nèi)生性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論