面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題_第1頁(yè)
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題_第2頁(yè)
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題_第3頁(yè)
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題_第4頁(yè)
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題

面板數(shù)據(jù)作為計(jì)量經(jīng)濟(jì)學(xué)中的一個(gè)小分支,多數(shù)本科學(xué)校沒(méi)有學(xué)過(guò),此課程主要面向研

究生及以上,但是面板數(shù)據(jù)的實(shí)證分析在核心刊物上屢屢出現(xiàn)(例子:前天小編去市圖R館,

看某經(jīng)濟(jì)類核心期刊,一共有10篇文章,其中3篇用的是面板數(shù)據(jù),但不是簡(jiǎn)單的面板數(shù)

據(jù),主要面板數(shù)據(jù)和別的模型的結(jié)合)。

一、面板數(shù)據(jù)哪里好

一般而言,面板數(shù)據(jù)模型的誤差項(xiàng)由兩部分組成,一部分是與個(gè)體觀察單位有關(guān)的,它

概括了所有影響被解釋變吊,但不隨時(shí)間變化的因素,因此,面板數(shù)據(jù)模型也常常被成為非

觀測(cè)效應(yīng)模型:另外一部分概括了因截面因時(shí)間而變化的不可觀測(cè)因素,通常被成為特異性

誤差或特異擾動(dòng)項(xiàng)(事實(shí)上這第二部分誤差還可分成兩部分,一部分是不因截面變化但隨時(shí)

間變化的非觀測(cè)因素對(duì)應(yīng)的誤差項(xiàng)Vt,這一部分一般大家的處理辦法是通過(guò)在模型中引入

時(shí)間虛擬變量來(lái)加以剝離和控制,另一部分才是因截面因時(shí)間而變化的不可觀測(cè)因素。不過(guò)

一般計(jì)量經(jīng)濟(jì)學(xué)的面板數(shù)據(jù)分析中都主要討論兩部分,在更高級(jí)一點(diǎn)的統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)

中會(huì)討論誤差分量模型,它一般討論三部分誤差)。

非觀測(cè)效應(yīng)模型一般根據(jù)灼時(shí)不變非觀測(cè)效應(yīng)的不同假設(shè)可分為固定效應(yīng)模型和隨機(jī)

效應(yīng)模型。傳統(tǒng)上,大家都習(xí)慣這樣分類:如果把非觀測(cè)效應(yīng)看作是各個(gè)截面或個(gè)體特有的

可估計(jì)參數(shù),并且不隨時(shí)間而變化,則模型為固定效應(yīng)模型;如果把非觀測(cè)效應(yīng)看作隨機(jī)變

量,并且符合一個(gè)特定的分布,則模型為隨機(jī)效應(yīng)模型。

不過(guò),上述定義不是十分嚴(yán)謹(jǐn),而且一個(gè)非常容易讓人產(chǎn)生誤解的地方是似乎固定效應(yīng)

模型中的非觀測(cè)效應(yīng)是隨時(shí)間不變的,是固定的,而隨機(jī)效應(yīng)模型中的非觀測(cè)效應(yīng)則不是固

定的,而是隨時(shí)間變化的,

一個(gè)邏輯上比較一致和嚴(yán)謹(jǐn),并且越來(lái)越為大家所接受的假設(shè)是(參見(jiàn)Wooldridge的教

材和Mundlakl978年的論文),不論固定效應(yīng)還是隨機(jī)效應(yīng)都是隨機(jī)的,都是概括「那些沒(méi)

有觀測(cè)到的,不隨時(shí)間而變化的,但影響被解釋變量的因素(尤其當(dāng)截面?zhèn)€體比較大的時(shí)候,

這種假設(shè)是比較合理的)。非觀測(cè)效應(yīng)究竟應(yīng)假設(shè)為固定效應(yīng)還是隨機(jī)效應(yīng),關(guān)鍵看這部分

不隨時(shí)間變化的非觀測(cè)效應(yīng)對(duì)應(yīng)的因素是否與模型中控制的觀測(cè)到的解釋變量相關(guān),如果這

個(gè)效應(yīng)與可觀測(cè)的解釋變量不相關(guān),則這個(gè)效應(yīng)成為隨機(jī)效應(yīng)。這也正是HAUSMAN設(shè)定

檢驗(yàn)所需要檢驗(yàn)的假說(shuō)。

非觀測(cè)效應(yīng)模型因?yàn)?對(duì)非觀測(cè)效應(yīng)假設(shè)的不同,因?yàn)槭褂妹姘鍞?shù)據(jù)信息的不同,可以用

不同方法來(lái)估計(jì)并且得到不同的估計(jì)量,一般有四個(gè):

⑴組內(nèi)估計(jì)晟(WITHINESTIMATOR)(FE或FD:FirstDifference)

(2)組間估計(jì)量(BETWEENESTIMATOR)

(3)混合OLS估計(jì)量(POOLEDOLSESTIMATOR)

⑷隨機(jī)效應(yīng)估計(jì)量(RE,GLS或FGLS估計(jì)量)

這四個(gè)估計(jì)量因?yàn)榧僭O(shè)和使用信息的不同而不同,各有優(yōu)劣勢(shì),相互之間也有密切關(guān)系。

3和4分別是I和2的加權(quán)平均;4在特定的假設(shè)分別可以轉(zhuǎn)化成I和3;如果HAUSMAN

檢驗(yàn)表明4和1沒(méi)有區(qū)別的時(shí)候意味著1和2沒(méi)有區(qū)別。

RE假設(shè)未觀察因素與解釋變量是正交的,只不過(guò)在未觀察因素里有兩個(gè)部分,一是與

個(gè)體單位有關(guān)的,二是完全隨機(jī)的,RE在做估計(jì)的時(shí)候,是用這兩個(gè)部分的方差計(jì)算出一

個(gè)指數(shù)X,來(lái)做quasi-demcan,也就是說(shuō)在去平均的時(shí)候是用原值的y或x減去九乘以y或

x的均值,然后用GLS估計(jì)。極端地,當(dāng)人為0時(shí),非觀測(cè)效應(yīng)是一個(gè)常數(shù),并且所有個(gè)體

都一樣,就等價(jià)于PooledOLS,當(dāng)人為1時(shí),說(shuō)明完全隨機(jī)的部分可以忽略,所有未觀察

因素都是與單位有關(guān)的,于是就等價(jià)于FE。但FE不需要假定未觀察因素與解釋變量是正

交的,在做FE時(shí),固定效應(yīng)都被差分掉了,所以也可得到consistent的結(jié)果。

PANEL數(shù)據(jù)的好處之一是,如果未觀察到的是固定效應(yīng),那么在做DEMEAN時(shí),未觀

察因素就被差分掉了。這樣就可以減少由于未觀察的因素可能與解群變量相關(guān)而導(dǎo)致的內(nèi)生

性問(wèn)題。

二、那么PANEL的FE或者RE分析就避免了內(nèi)生性問(wèn)題嗎?

只能說(shuō)好?些,如果內(nèi)生的問(wèn)題只是由于與單位有關(guān)的并不隨時(shí)間變化的遺漏變量與解

釋變量有關(guān)造成的,這時(shí):數(shù)據(jù)的差分就解決了問(wèn)題,但是,別忘記還有一部分誤差,如果

這部分誤差里包含的因素也可能影響解釋變量,那么,差分只能解決前面講的問(wèn)題,由隨機(jī)

項(xiàng)里包括的因素與解釋變量之間的關(guān)系導(dǎo)致的內(nèi)生性問(wèn)題還可能存在。

三、如何處理內(nèi)生性問(wèn)題?

找IV解決。類似于在OLS基礎(chǔ)上找IV,但對(duì)PANEL的工具應(yīng)該具有PANEL結(jié)構(gòu),

除非你基礎(chǔ)的估計(jì)沒(méi)有使用PANEL的方法,比如說(shuō)對(duì)數(shù)據(jù)用了pooledOLS方法,但能夠用

pooledOLS方法分析PANELDATA的條件是很?chē)?yán)格的。

四、工具變量選擇問(wèn)題

1,IV應(yīng)該盡量是外生的(如歷史/自然/氣候/地理之類),它應(yīng)該在理論上對(duì)被解釋變量

(以下稱Y)沒(méi)有直接影響,但應(yīng)該通過(guò)影響被工具的變景(以下稱X)而間接影響被解釋變最

Y。

2,如果上述理論邏輯通的話,將內(nèi)生變量X作為解釋變量,IV和其他變量(X》作為解

釋變量,看IV是否顯著,它應(yīng)該顯著。如果選了多個(gè)IV,就用FTEST看其是否都不顯著。

同時(shí),如果在多個(gè)IV111,有一個(gè)是確定為外生的,那么,可以用Sargantestofoveridentifying

restrictions來(lái)檢驗(yàn)其他的IV是不是確實(shí)是外生的。

3,如果上述都沒(méi)有問(wèn)題,做一下IV回歸。完成后,用HAUSMAN檢驗(yàn),這個(gè)檢驗(yàn)的

原假說(shuō)是IV回歸與原回歸(不用IV的回歸)的變量的系數(shù)并沒(méi)有顯著的不同??匆幌翽值,

如果P小于比如說(shuō)0.1,或者0.05,那么,說(shuō)明IV回歸與原來(lái)的回歸顯著不同,原來(lái)的方程

的確有內(nèi)生性問(wèn)題導(dǎo)致的估計(jì)偏誤。反之,如果P很高,超過(guò)0.1,或0.05,那說(shuō)明IV回歸

與原來(lái)的回歸沒(méi)有顯著不同,無(wú)法拒絕原來(lái)的回歸沒(méi)有顯著的內(nèi)生問(wèn)題導(dǎo)致的估計(jì)偏誤的原

假設(shè)。

4,如果選擇的IV本身就影響Y,那它就不能被作為IV。例如,Y在左邊,右邊是X(被

工具的),Xz,IVo當(dāng)IV被放在方程右邊時(shí),它最好是不顯著影響Y的。在Acemogki(2001)

里.,他就檢驗(yàn)了他們的IV是否直接影響被解釋變量,結(jié)果說(shuō)明不直接影響,于是這個(gè)IV是

好的。當(dāng)然,一個(gè)好的IV在前面的回歸中也可能是顯著的(不過(guò)一般如果理論和邏輯上IV

是通過(guò)被工具的內(nèi)生解釋變顯間接影響被解釋變后的話,一般來(lái)說(shuō)應(yīng)該是被T具的內(nèi)生解釋

變量使得IV不顯著,或者由于兩者相關(guān)性很高,兩者都不顯著),但判斷的標(biāo)準(zhǔn)還只是t值。

這個(gè)變量顯著完全有可能是因?yàn)樗绊懥似渌@著的變量(比如被工具的變量),如果是這樣,

當(dāng)包括了IV在原方程中以后,其他變量(特別需要注意的是被工具的變量X)的系數(shù)可能發(fā)

生明顯變化。

五、關(guān)于HAUSMANTEST檢驗(yàn)的若干問(wèn)題

具體參見(jiàn)Statacorporation.2001,STATA7ReferenceH-P.StataPress

1,含義:“Thenullhypothesisisthattheefficientestimatorisaconsistentandefficient

estimatorofthetrueparameters.Ifitis,thereshouldbenosystematicdifferencebetweenthe

coefficientsoftheefficientestimatorandaconiparisonestimatorthatisknowntobeconsistentfor

(hetrueparameters.Ifthetwomodelsdisplayasystematicdifferenceintheestimatedcoefficients,

thenwehavereasontodoubttheassumptionsonwhichtheefficientestimatorisbased.”參見(jiàn)手冊(cè)

Statacorporation,2001,STATA7ReferenceH-P,StataPresso該方法是Hausman(1978)的程序

化。所以,HausmanTest的命令(hausman)假設(shè)使用者知道需要比較的兩個(gè)方程中哪一個(gè)是

“無(wú)論原假說(shuō)成立與否都是consistent",哪一個(gè)“在原假說(shuō)下不僅efficieni而且consistent,但

若原假說(shuō)不成立,則inconsistent”,[1]然后,在STATA8下,步驟是:

(1)obtainanestiniatcrthatisconsistentwhetherornotthehypothesisistrue;

(2)storetheestimationresultsunderaname-consistentusingestimatesstore;

(3)obtainanestimatorthatisefficient(andconsistent)underthehypothesisthatyouarc

testing,butinconsistentotherwise;

(4)storetheestimationresultsunderaname-efficientusingestimatesstore;

(5)usehausinantoperformthelest

hausmanname-consistentname-efficient[,options]

舉例:

(1)在關(guān)于是FE還是RE的檢驗(yàn)中,原假說(shuō)是非觀測(cè)效應(yīng)與解釋變量不相關(guān),備擇假說(shuō)

是兩者相關(guān)。FE是無(wú)論原假說(shuō)成立與否都是consistent,而RE在原假說(shuō)卜.是consistent,并

且Asymplolicallyefficient樣本越大越有效),但如果原假說(shuō)被拒絕,則RE不是consistent的

(Hausman,1978)。

所以做法應(yīng)該是(STATA8的命令):

sortcodeyear(排序)

tisyear(時(shí)間變量是year)

iiscode(表示單位的是code)

xtregyxx2,fe(假設(shè)其中x是需要被工具的變量)

eslslorefixed(在STATA8里命令有變化,不再是HAUSMAN,SAVE了,這里的fixed

實(shí)際上就是個(gè)變量名,用什么都行)

xtregyxx2,re

hausmanfixed

(2)比較OLS(或FE)和IV(或IVFE)

先做IV,因?yàn)?,它無(wú)論如何都是consistent的,但OLS只有在原假設(shè)成立,即OLS結(jié)

果與IV結(jié)果相同,內(nèi)生性問(wèn)題沒(méi)有時(shí),才是consistent的。所以,應(yīng)該先做IV。

在老版本的STATA里,如果不加特殊說(shuō)明,STATA就會(huì)默認(rèn)為先寫(xiě)的回歸命令得到的

是總是一致的估計(jì)結(jié)果,后寫(xiě)的得到的是備擇假設(shè)下不一致的估計(jì)結(jié)果?,F(xiàn)在HAUSMAN

命令規(guī)范了,而且擴(kuò)展了。先跑哪個(gè)不重要,關(guān)鍵在于寫(xiě)最后HAUSMAN命令時(shí)候的順序,

而且如果最近跑的一個(gè)沒(méi)有用EST存名字的話,要用代替。

2,注意:

(1)對(duì)以上檢驗(yàn)的理解的另一種方式是,我們先做一個(gè)假設(shè)條件要求更松的估計(jì),然后再

做?個(gè)假設(shè)條件更嚴(yán)格的,相比之下,IV(IVFE)比OLS(FE)要求更松。容易搞混的是FE比

RE假設(shè)條件更松。RE假設(shè)未觀察因素與解釋變量是正交的,只不過(guò)在未觀察因素里有兩個(gè)

部分,一是與個(gè)體單位有關(guān)的,二是完全隨機(jī)的,RE在做估計(jì)的時(shí)候,是用這兩個(gè)部分的

方差計(jì)算出一個(gè)指數(shù)人來(lái)做quasi-demean,也就是說(shuō)在去平均的時(shí)候是用原值的y或x減

去九乘以y或x的均值,然后用GLS估計(jì)。當(dāng)九為0時(shí),就等價(jià)于pooledOLS,當(dāng)X為1

時(shí),說(shuō)明完全隨機(jī)的部分可以忽略,所有未觀察因素都是與單位有關(guān)的,于是就等價(jià)FFE。

但FE不需要假定未觀察因素與解樣變量是正交的,在做FE時(shí),固定效應(yīng)都被差分掉了,

所以也可得到consistent的結(jié)果。當(dāng)我們先做假設(shè)更嚴(yán)格的估計(jì)時(shí),HT與一般檢驗(yàn)一樣,檢

驗(yàn)值大,P小,則原假說(shuō)拒絕,應(yīng)該接受假設(shè)更松的。在FE與RE的比較里,卡方大,接

受FE。在OLS(FE)與IV(或IVFE)的比較里,當(dāng)卡方值大時(shí),P小時(shí),拒絕原假說(shuō),IV結(jié)果

和OLS(或FE)有不同,于是接受IV結(jié)果。

(2)從以上討論可以看出,我們需要事先知道HT時(shí)兩個(gè)方程的順序和性質(zhì)。在STATA7

以下,當(dāng)使用hausman命令時(shí),它默認(rèn)的順利(缺省參數(shù)more)就是上面的順序。如果你做的

順序相反,就應(yīng)該加上參數(shù),命令為hausman,less,如果沒(méi)有寫(xiě)less,那么,STATA是不知

道誰(shuí)更efficient的,這時(shí),你本來(lái)應(yīng)該得到一個(gè)正的結(jié)果,就完全可能因?yàn)轫樞蝈e(cuò)了,又忘

記了參數(shù)less而得到一個(gè)相反的負(fù)數(shù)結(jié)果。

在STATA8里命令變化,可以變順序,但要使用者注意正確使用參數(shù):

Theorderofcomputing(hetwoestimatorsmaybereversed.Youhavelobecarefulthough

tospecifytohausmanthemodelsintheorder"alwaysconsistent"firstand"efficientunderHO"

second.Ilispossibletoskipstoringthesecondmodelandrefertothelastestimationresultsby

aperiod(.).

(3)在其他可比較的情況下,順序并不重要(如果沒(méi)有讒更有效的差別)

hausmanmaybeusedinanycontext.Theorderinwhichyouspecifytheregressorsineach

modeldocsnotmatter,butitisyourresponsibilitytoassurethattheestimatorsandmodelsarc

comparable,andsatisfythetheoreticalconditions(see(l)and(3)above).

(4)當(dāng)HT出現(xiàn)負(fù)值時(shí)

先看一下是不是方程順序錯(cuò)了。如果沒(méi)有錯(cuò),那么在小樣本數(shù)據(jù)下也并不是不可能得到

負(fù)值。當(dāng)HAUSMAN檢驗(yàn)的X2值是負(fù)的時(shí)候,意思是強(qiáng)烈地表明兩個(gè)被比較的回歸結(jié)果

系數(shù)相同(或者說(shuō)無(wú)顯著差異)的原假說(shuō)不能被拒絕,尤其是小樣本中很可能出現(xiàn)。這是

STATA7的使用手冊(cè)上的一個(gè)例子說(shuō)的。但在STATA8里,又說(shuō),出現(xiàn)負(fù)值這種情況時(shí),If

thisisthecase,theHausmantestisundefined.Unfortunately,thisisnotarareevent.Stata

supportsageneralizedHausmantestthatovercomesbolhofiheseproblems.Seesuestfordetails.可

以通過(guò)helpsuestY解。

3,STATA命令

⑴比較FE和RE

sortcodeyear(排序)

tisyear(時(shí)間變量是year)

iiscode(表示單位的是code)

xtregyxx2,fe(假設(shè)其中x是需要被工具的變量)

eststorefixed(在STATA8里命令有變化,不再是HAUSMAN,SAVE了,這里的fixed

實(shí)際上就是個(gè)變量名,用什么都行)

xtregyxx2,re

hausmanfixed

(2)比較IVFE和IVRE

xtivregy(x=iv)x2,fe

eststorefl

xtivregy(x=iv)x2,re

hausmanfl

一般來(lái)說(shuō)用不著這個(gè)比較,因?yàn)樵谶@之前,你已經(jīng)知道FE和RE誰(shuí)好了,就將好的結(jié)

果與它的IV結(jié)果比就行了。

⑶比較IVFE和FE

xtivregy(x=iv)x2,fe

esistoref2

xtregyxx2,fe

hausmanf2

再重復(fù)一遍,如果結(jié)果是P小,卡方大才說(shuō)明IV回歸是必要的,原來(lái)是有內(nèi)生問(wèn)題。

六、舉例

Acemoglu等人(2001)的文章是非常有代表性的使用工具變量的論文。他們?cè)噲D驗(yàn)證制

度對(duì)人均收入有影響,顯然,直接做回歸的話,制度就是內(nèi)生的,因?yàn)楹玫闹贫瓤赡茉谌司?/p>

收入高的地方產(chǎn)生。他們找的工具變量是殖民地時(shí)代一個(gè)國(guó)家的死亡率,死亡率高歐洲人就

不會(huì)定居下來(lái),于是就會(huì)在當(dāng)時(shí)建議掠奪性的制度,反之就會(huì)建立好

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論