下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
面板數(shù)據(jù)、工具變量選擇和HAUSMAN檢驗(yàn)的若干問(wèn)題
面板數(shù)據(jù)作為計(jì)量經(jīng)濟(jì)學(xué)中的一個(gè)小分支,多數(shù)本科學(xué)校沒(méi)有學(xué)過(guò),此課程主要面向研
究生及以上,但是面板數(shù)據(jù)的實(shí)證分析在核心刊物上屢屢出現(xiàn)(例子:前天小編去市圖R館,
看某經(jīng)濟(jì)類核心期刊,一共有10篇文章,其中3篇用的是面板數(shù)據(jù),但不是簡(jiǎn)單的面板數(shù)
據(jù),主要面板數(shù)據(jù)和別的模型的結(jié)合)。
一、面板數(shù)據(jù)哪里好
一般而言,面板數(shù)據(jù)模型的誤差項(xiàng)由兩部分組成,一部分是與個(gè)體觀察單位有關(guān)的,它
概括了所有影響被解釋變吊,但不隨時(shí)間變化的因素,因此,面板數(shù)據(jù)模型也常常被成為非
觀測(cè)效應(yīng)模型:另外一部分概括了因截面因時(shí)間而變化的不可觀測(cè)因素,通常被成為特異性
誤差或特異擾動(dòng)項(xiàng)(事實(shí)上這第二部分誤差還可分成兩部分,一部分是不因截面變化但隨時(shí)
間變化的非觀測(cè)因素對(duì)應(yīng)的誤差項(xiàng)Vt,這一部分一般大家的處理辦法是通過(guò)在模型中引入
時(shí)間虛擬變量來(lái)加以剝離和控制,另一部分才是因截面因時(shí)間而變化的不可觀測(cè)因素。不過(guò)
一般計(jì)量經(jīng)濟(jì)學(xué)的面板數(shù)據(jù)分析中都主要討論兩部分,在更高級(jí)一點(diǎn)的統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)
中會(huì)討論誤差分量模型,它一般討論三部分誤差)。
非觀測(cè)效應(yīng)模型一般根據(jù)灼時(shí)不變非觀測(cè)效應(yīng)的不同假設(shè)可分為固定效應(yīng)模型和隨機(jī)
效應(yīng)模型。傳統(tǒng)上,大家都習(xí)慣這樣分類:如果把非觀測(cè)效應(yīng)看作是各個(gè)截面或個(gè)體特有的
可估計(jì)參數(shù),并且不隨時(shí)間而變化,則模型為固定效應(yīng)模型;如果把非觀測(cè)效應(yīng)看作隨機(jī)變
量,并且符合一個(gè)特定的分布,則模型為隨機(jī)效應(yīng)模型。
不過(guò),上述定義不是十分嚴(yán)謹(jǐn),而且一個(gè)非常容易讓人產(chǎn)生誤解的地方是似乎固定效應(yīng)
模型中的非觀測(cè)效應(yīng)是隨時(shí)間不變的,是固定的,而隨機(jī)效應(yīng)模型中的非觀測(cè)效應(yīng)則不是固
定的,而是隨時(shí)間變化的,
一個(gè)邏輯上比較一致和嚴(yán)謹(jǐn),并且越來(lái)越為大家所接受的假設(shè)是(參見(jiàn)Wooldridge的教
材和Mundlakl978年的論文),不論固定效應(yīng)還是隨機(jī)效應(yīng)都是隨機(jī)的,都是概括「那些沒(méi)
有觀測(cè)到的,不隨時(shí)間而變化的,但影響被解釋變量的因素(尤其當(dāng)截面?zhèn)€體比較大的時(shí)候,
這種假設(shè)是比較合理的)。非觀測(cè)效應(yīng)究竟應(yīng)假設(shè)為固定效應(yīng)還是隨機(jī)效應(yīng),關(guān)鍵看這部分
不隨時(shí)間變化的非觀測(cè)效應(yīng)對(duì)應(yīng)的因素是否與模型中控制的觀測(cè)到的解釋變量相關(guān),如果這
個(gè)效應(yīng)與可觀測(cè)的解釋變量不相關(guān),則這個(gè)效應(yīng)成為隨機(jī)效應(yīng)。這也正是HAUSMAN設(shè)定
檢驗(yàn)所需要檢驗(yàn)的假說(shuō)。
非觀測(cè)效應(yīng)模型因?yàn)?對(duì)非觀測(cè)效應(yīng)假設(shè)的不同,因?yàn)槭褂妹姘鍞?shù)據(jù)信息的不同,可以用
不同方法來(lái)估計(jì)并且得到不同的估計(jì)量,一般有四個(gè):
⑴組內(nèi)估計(jì)晟(WITHINESTIMATOR)(FE或FD:FirstDifference)
(2)組間估計(jì)量(BETWEENESTIMATOR)
(3)混合OLS估計(jì)量(POOLEDOLSESTIMATOR)
⑷隨機(jī)效應(yīng)估計(jì)量(RE,GLS或FGLS估計(jì)量)
這四個(gè)估計(jì)量因?yàn)榧僭O(shè)和使用信息的不同而不同,各有優(yōu)劣勢(shì),相互之間也有密切關(guān)系。
3和4分別是I和2的加權(quán)平均;4在特定的假設(shè)分別可以轉(zhuǎn)化成I和3;如果HAUSMAN
檢驗(yàn)表明4和1沒(méi)有區(qū)別的時(shí)候意味著1和2沒(méi)有區(qū)別。
RE假設(shè)未觀察因素與解釋變量是正交的,只不過(guò)在未觀察因素里有兩個(gè)部分,一是與
個(gè)體單位有關(guān)的,二是完全隨機(jī)的,RE在做估計(jì)的時(shí)候,是用這兩個(gè)部分的方差計(jì)算出一
個(gè)指數(shù)X,來(lái)做quasi-demcan,也就是說(shuō)在去平均的時(shí)候是用原值的y或x減去九乘以y或
x的均值,然后用GLS估計(jì)。極端地,當(dāng)人為0時(shí),非觀測(cè)效應(yīng)是一個(gè)常數(shù),并且所有個(gè)體
都一樣,就等價(jià)于PooledOLS,當(dāng)人為1時(shí),說(shuō)明完全隨機(jī)的部分可以忽略,所有未觀察
因素都是與單位有關(guān)的,于是就等價(jià)于FE。但FE不需要假定未觀察因素與解釋變量是正
交的,在做FE時(shí),固定效應(yīng)都被差分掉了,所以也可得到consistent的結(jié)果。
PANEL數(shù)據(jù)的好處之一是,如果未觀察到的是固定效應(yīng),那么在做DEMEAN時(shí),未觀
察因素就被差分掉了。這樣就可以減少由于未觀察的因素可能與解群變量相關(guān)而導(dǎo)致的內(nèi)生
性問(wèn)題。
二、那么PANEL的FE或者RE分析就避免了內(nèi)生性問(wèn)題嗎?
只能說(shuō)好?些,如果內(nèi)生的問(wèn)題只是由于與單位有關(guān)的并不隨時(shí)間變化的遺漏變量與解
釋變量有關(guān)造成的,這時(shí):數(shù)據(jù)的差分就解決了問(wèn)題,但是,別忘記還有一部分誤差,如果
這部分誤差里包含的因素也可能影響解釋變量,那么,差分只能解決前面講的問(wèn)題,由隨機(jī)
項(xiàng)里包括的因素與解釋變量之間的關(guān)系導(dǎo)致的內(nèi)生性問(wèn)題還可能存在。
三、如何處理內(nèi)生性問(wèn)題?
找IV解決。類似于在OLS基礎(chǔ)上找IV,但對(duì)PANEL的工具應(yīng)該具有PANEL結(jié)構(gòu),
除非你基礎(chǔ)的估計(jì)沒(méi)有使用PANEL的方法,比如說(shuō)對(duì)數(shù)據(jù)用了pooledOLS方法,但能夠用
pooledOLS方法分析PANELDATA的條件是很?chē)?yán)格的。
四、工具變量選擇問(wèn)題
1,IV應(yīng)該盡量是外生的(如歷史/自然/氣候/地理之類),它應(yīng)該在理論上對(duì)被解釋變量
(以下稱Y)沒(méi)有直接影響,但應(yīng)該通過(guò)影響被工具的變景(以下稱X)而間接影響被解釋變最
Y。
2,如果上述理論邏輯通的話,將內(nèi)生變量X作為解釋變量,IV和其他變量(X》作為解
釋變量,看IV是否顯著,它應(yīng)該顯著。如果選了多個(gè)IV,就用FTEST看其是否都不顯著。
同時(shí),如果在多個(gè)IV111,有一個(gè)是確定為外生的,那么,可以用Sargantestofoveridentifying
restrictions來(lái)檢驗(yàn)其他的IV是不是確實(shí)是外生的。
3,如果上述都沒(méi)有問(wèn)題,做一下IV回歸。完成后,用HAUSMAN檢驗(yàn),這個(gè)檢驗(yàn)的
原假說(shuō)是IV回歸與原回歸(不用IV的回歸)的變量的系數(shù)并沒(méi)有顯著的不同??匆幌翽值,
如果P小于比如說(shuō)0.1,或者0.05,那么,說(shuō)明IV回歸與原來(lái)的回歸顯著不同,原來(lái)的方程
的確有內(nèi)生性問(wèn)題導(dǎo)致的估計(jì)偏誤。反之,如果P很高,超過(guò)0.1,或0.05,那說(shuō)明IV回歸
與原來(lái)的回歸沒(méi)有顯著不同,無(wú)法拒絕原來(lái)的回歸沒(méi)有顯著的內(nèi)生問(wèn)題導(dǎo)致的估計(jì)偏誤的原
假設(shè)。
4,如果選擇的IV本身就影響Y,那它就不能被作為IV。例如,Y在左邊,右邊是X(被
工具的),Xz,IVo當(dāng)IV被放在方程右邊時(shí),它最好是不顯著影響Y的。在Acemogki(2001)
里.,他就檢驗(yàn)了他們的IV是否直接影響被解釋變量,結(jié)果說(shuō)明不直接影響,于是這個(gè)IV是
好的。當(dāng)然,一個(gè)好的IV在前面的回歸中也可能是顯著的(不過(guò)一般如果理論和邏輯上IV
是通過(guò)被工具的內(nèi)生解釋變顯間接影響被解釋變后的話,一般來(lái)說(shuō)應(yīng)該是被T具的內(nèi)生解釋
變量使得IV不顯著,或者由于兩者相關(guān)性很高,兩者都不顯著),但判斷的標(biāo)準(zhǔn)還只是t值。
這個(gè)變量顯著完全有可能是因?yàn)樗绊懥似渌@著的變量(比如被工具的變量),如果是這樣,
當(dāng)包括了IV在原方程中以后,其他變量(特別需要注意的是被工具的變量X)的系數(shù)可能發(fā)
生明顯變化。
五、關(guān)于HAUSMANTEST檢驗(yàn)的若干問(wèn)題
具體參見(jiàn)Statacorporation.2001,STATA7ReferenceH-P.StataPress
1,含義:“Thenullhypothesisisthattheefficientestimatorisaconsistentandefficient
estimatorofthetrueparameters.Ifitis,thereshouldbenosystematicdifferencebetweenthe
coefficientsoftheefficientestimatorandaconiparisonestimatorthatisknowntobeconsistentfor
(hetrueparameters.Ifthetwomodelsdisplayasystematicdifferenceintheestimatedcoefficients,
thenwehavereasontodoubttheassumptionsonwhichtheefficientestimatorisbased.”參見(jiàn)手冊(cè)
Statacorporation,2001,STATA7ReferenceH-P,StataPresso該方法是Hausman(1978)的程序
化。所以,HausmanTest的命令(hausman)假設(shè)使用者知道需要比較的兩個(gè)方程中哪一個(gè)是
“無(wú)論原假說(shuō)成立與否都是consistent",哪一個(gè)“在原假說(shuō)下不僅efficieni而且consistent,但
若原假說(shuō)不成立,則inconsistent”,[1]然后,在STATA8下,步驟是:
(1)obtainanestiniatcrthatisconsistentwhetherornotthehypothesisistrue;
(2)storetheestimationresultsunderaname-consistentusingestimatesstore;
(3)obtainanestimatorthatisefficient(andconsistent)underthehypothesisthatyouarc
testing,butinconsistentotherwise;
(4)storetheestimationresultsunderaname-efficientusingestimatesstore;
(5)usehausinantoperformthelest
hausmanname-consistentname-efficient[,options]
舉例:
(1)在關(guān)于是FE還是RE的檢驗(yàn)中,原假說(shuō)是非觀測(cè)效應(yīng)與解釋變量不相關(guān),備擇假說(shuō)
是兩者相關(guān)。FE是無(wú)論原假說(shuō)成立與否都是consistent,而RE在原假說(shuō)卜.是consistent,并
且Asymplolicallyefficient樣本越大越有效),但如果原假說(shuō)被拒絕,則RE不是consistent的
(Hausman,1978)。
所以做法應(yīng)該是(STATA8的命令):
sortcodeyear(排序)
tisyear(時(shí)間變量是year)
iiscode(表示單位的是code)
xtregyxx2,fe(假設(shè)其中x是需要被工具的變量)
eslslorefixed(在STATA8里命令有變化,不再是HAUSMAN,SAVE了,這里的fixed
實(shí)際上就是個(gè)變量名,用什么都行)
xtregyxx2,re
hausmanfixed
(2)比較OLS(或FE)和IV(或IVFE)
先做IV,因?yàn)?,它無(wú)論如何都是consistent的,但OLS只有在原假設(shè)成立,即OLS結(jié)
果與IV結(jié)果相同,內(nèi)生性問(wèn)題沒(méi)有時(shí),才是consistent的。所以,應(yīng)該先做IV。
在老版本的STATA里,如果不加特殊說(shuō)明,STATA就會(huì)默認(rèn)為先寫(xiě)的回歸命令得到的
是總是一致的估計(jì)結(jié)果,后寫(xiě)的得到的是備擇假設(shè)下不一致的估計(jì)結(jié)果?,F(xiàn)在HAUSMAN
命令規(guī)范了,而且擴(kuò)展了。先跑哪個(gè)不重要,關(guān)鍵在于寫(xiě)最后HAUSMAN命令時(shí)候的順序,
而且如果最近跑的一個(gè)沒(méi)有用EST存名字的話,要用代替。
2,注意:
(1)對(duì)以上檢驗(yàn)的理解的另一種方式是,我們先做一個(gè)假設(shè)條件要求更松的估計(jì),然后再
做?個(gè)假設(shè)條件更嚴(yán)格的,相比之下,IV(IVFE)比OLS(FE)要求更松。容易搞混的是FE比
RE假設(shè)條件更松。RE假設(shè)未觀察因素與解釋變量是正交的,只不過(guò)在未觀察因素里有兩個(gè)
部分,一是與個(gè)體單位有關(guān)的,二是完全隨機(jī)的,RE在做估計(jì)的時(shí)候,是用這兩個(gè)部分的
方差計(jì)算出一個(gè)指數(shù)人來(lái)做quasi-demean,也就是說(shuō)在去平均的時(shí)候是用原值的y或x減
去九乘以y或x的均值,然后用GLS估計(jì)。當(dāng)九為0時(shí),就等價(jià)于pooledOLS,當(dāng)X為1
時(shí),說(shuō)明完全隨機(jī)的部分可以忽略,所有未觀察因素都是與單位有關(guān)的,于是就等價(jià)FFE。
但FE不需要假定未觀察因素與解樣變量是正交的,在做FE時(shí),固定效應(yīng)都被差分掉了,
所以也可得到consistent的結(jié)果。當(dāng)我們先做假設(shè)更嚴(yán)格的估計(jì)時(shí),HT與一般檢驗(yàn)一樣,檢
驗(yàn)值大,P小,則原假說(shuō)拒絕,應(yīng)該接受假設(shè)更松的。在FE與RE的比較里,卡方大,接
受FE。在OLS(FE)與IV(或IVFE)的比較里,當(dāng)卡方值大時(shí),P小時(shí),拒絕原假說(shuō),IV結(jié)果
和OLS(或FE)有不同,于是接受IV結(jié)果。
(2)從以上討論可以看出,我們需要事先知道HT時(shí)兩個(gè)方程的順序和性質(zhì)。在STATA7
以下,當(dāng)使用hausman命令時(shí),它默認(rèn)的順利(缺省參數(shù)more)就是上面的順序。如果你做的
順序相反,就應(yīng)該加上參數(shù),命令為hausman,less,如果沒(méi)有寫(xiě)less,那么,STATA是不知
道誰(shuí)更efficient的,這時(shí),你本來(lái)應(yīng)該得到一個(gè)正的結(jié)果,就完全可能因?yàn)轫樞蝈e(cuò)了,又忘
記了參數(shù)less而得到一個(gè)相反的負(fù)數(shù)結(jié)果。
在STATA8里命令變化,可以變順序,但要使用者注意正確使用參數(shù):
Theorderofcomputing(hetwoestimatorsmaybereversed.Youhavelobecarefulthough
tospecifytohausmanthemodelsintheorder"alwaysconsistent"firstand"efficientunderHO"
second.Ilispossibletoskipstoringthesecondmodelandrefertothelastestimationresultsby
aperiod(.).
(3)在其他可比較的情況下,順序并不重要(如果沒(méi)有讒更有效的差別)
hausmanmaybeusedinanycontext.Theorderinwhichyouspecifytheregressorsineach
modeldocsnotmatter,butitisyourresponsibilitytoassurethattheestimatorsandmodelsarc
comparable,andsatisfythetheoreticalconditions(see(l)and(3)above).
(4)當(dāng)HT出現(xiàn)負(fù)值時(shí)
先看一下是不是方程順序錯(cuò)了。如果沒(méi)有錯(cuò),那么在小樣本數(shù)據(jù)下也并不是不可能得到
負(fù)值。當(dāng)HAUSMAN檢驗(yàn)的X2值是負(fù)的時(shí)候,意思是強(qiáng)烈地表明兩個(gè)被比較的回歸結(jié)果
系數(shù)相同(或者說(shuō)無(wú)顯著差異)的原假說(shuō)不能被拒絕,尤其是小樣本中很可能出現(xiàn)。這是
STATA7的使用手冊(cè)上的一個(gè)例子說(shuō)的。但在STATA8里,又說(shuō),出現(xiàn)負(fù)值這種情況時(shí),If
thisisthecase,theHausmantestisundefined.Unfortunately,thisisnotarareevent.Stata
supportsageneralizedHausmantestthatovercomesbolhofiheseproblems.Seesuestfordetails.可
以通過(guò)helpsuestY解。
3,STATA命令
⑴比較FE和RE
sortcodeyear(排序)
tisyear(時(shí)間變量是year)
iiscode(表示單位的是code)
xtregyxx2,fe(假設(shè)其中x是需要被工具的變量)
eststorefixed(在STATA8里命令有變化,不再是HAUSMAN,SAVE了,這里的fixed
實(shí)際上就是個(gè)變量名,用什么都行)
xtregyxx2,re
hausmanfixed
(2)比較IVFE和IVRE
xtivregy(x=iv)x2,fe
eststorefl
xtivregy(x=iv)x2,re
hausmanfl
一般來(lái)說(shuō)用不著這個(gè)比較,因?yàn)樵谶@之前,你已經(jīng)知道FE和RE誰(shuí)好了,就將好的結(jié)
果與它的IV結(jié)果比就行了。
⑶比較IVFE和FE
xtivregy(x=iv)x2,fe
esistoref2
xtregyxx2,fe
hausmanf2
再重復(fù)一遍,如果結(jié)果是P小,卡方大才說(shuō)明IV回歸是必要的,原來(lái)是有內(nèi)生問(wèn)題。
六、舉例
Acemoglu等人(2001)的文章是非常有代表性的使用工具變量的論文。他們?cè)噲D驗(yàn)證制
度對(duì)人均收入有影響,顯然,直接做回歸的話,制度就是內(nèi)生的,因?yàn)楹玫闹贫瓤赡茉谌司?/p>
收入高的地方產(chǎn)生。他們找的工具變量是殖民地時(shí)代一個(gè)國(guó)家的死亡率,死亡率高歐洲人就
不會(huì)定居下來(lái),于是就會(huì)在當(dāng)時(shí)建議掠奪性的制度,反之就會(huì)建立好
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高考物理總復(fù)習(xí)專題三牛頓運(yùn)動(dòng)定律第2講牛頓第二定律、兩類動(dòng)力學(xué)問(wèn)題練習(xí)含答案
- 建筑場(chǎng)地土方運(yùn)輸填筑
- 外墻真石漆工程勞務(wù)分包
- 高中英語(yǔ) Unit 4 Wildlife protection Speaking and writing教案 新人教版必修2
- 八年級(jí)物理下冊(cè) 第十二章 簡(jiǎn)單機(jī)械12.2 滑輪第2課時(shí) 輪軸和斜面教案 (新版)新人教版
- 高中化學(xué) 第一冊(cè) 第一章 打開(kāi)原子世界的大門(mén) 1.2 同位素和相對(duì)原子質(zhì)量教案 滬科版
- 2024-2025版新教材高中語(yǔ)文 第三單元 7 短歌行 歸園田居(其一)教案 新人教版必修上冊(cè)
- 2023九年級(jí)數(shù)學(xué)下冊(cè) 第27章 圓27.3 圓中的計(jì)算問(wèn)題第1課時(shí) 弧長(zhǎng)和扇形面積的計(jì)算教案 (新版)華東師大版
- 2024年秋八年級(jí)歷史上冊(cè) 第六單元 中華民族的抗日戰(zhàn)爭(zhēng) 第18課 從九一八事變到西安事變教案 新人教版
- 有關(guān)圓周率的數(shù)學(xué)家
- ALeader 阿立得 ALD515使用手冊(cè)
- 城中村改造政策
- 文雅教育-步步高小學(xué)“六雅路徑”整體育人模式探索(尹鳳葵)
- 六年級(jí)上冊(cè)語(yǔ)文教案盼|部編版 全省一等獎(jiǎng)
- 臨床微生物學(xué)-變形桿菌屬和枸櫞酸桿菌屬
- 化工企業(yè)生產(chǎn)設(shè)備設(shè)施拆除和報(bào)廢管理制度
- GB/Z 39502-2020實(shí)驗(yàn)動(dòng)物新型冠狀病毒肺炎(COVID-19)動(dòng)物模型制備指南
- GB/T 4945-2002石油產(chǎn)品和潤(rùn)滑劑酸值和堿值測(cè)定法(顏色指示劑法)
- 廣東開(kāi)放大學(xué) 《大學(xué)英語(yǔ)B》形成性考核 參考答案
- 人選民主測(cè)評(píng)票
- 制造業(yè)的企業(yè)盡職調(diào)查總結(jié)范文
評(píng)論
0/150
提交評(píng)論