stata上機實驗第五講工具變量IV_第1頁
stata上機實驗第五講工具變量IV_第2頁
stata上機實驗第五講工具變量IV_第3頁
stata上機實驗第五講工具變量IV_第4頁
stata上機實驗第五講工具變量IV_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、stata上機實驗工具變量(iv)w什么情況下需要工具變量?w1。遺漏變量w2。變量內(nèi)生性問題w3。測量誤差w使用這種方法的困難之處在于工具變量的“搜尋”,而不是在技術(shù)方面。w工具變量選擇的要求: 1。相關(guān)性:工具變量與內(nèi)生解釋變量高度相關(guān),即cov(xt,pt) 0。 2。外生性:工具變量與擾動項不相關(guān),即cov(xt,ut) =0。 使用工具變量有兩種方法:二階段最小二乘法(2sls)和廣義矩估計法(gmm)。二階段最小二乘法:2sls w主要思想:進行兩階段回歸。w假設方程為: y=b1x1+b2x2+u 其中x1是外生變量,x2是內(nèi)生變量,找到兩個變量z1和z2,作為x2的工具變量。w

2、第一階段回歸:reg x2 x1 z1 z2 x2結(jié)合了z1和z2的信息,此時取出x2的擬合值x2_hat。w第二階段回歸: reg y x1 x2_hat廣義矩估計法:gmmw基本思想: 求解如下一般化目標函數(shù),使之最小化 j(b_gmm) = n*g(b_gmm)*w*g(b_gmm) 其中,w 為權(quán)重矩陣w在球型擾動項的假定下,2sls 是最有效的。但如果擾動項存在異方差或自相關(guān),則廣義矩估計方法效果更好。wgmm方法又分為兩步gmm法和迭代gmm方法。w使用grilic.dta估計教育投資的回報率。w變量說明:lw80(80年工資對數(shù)),s80(80年時受教育年限),expr80(80

3、年時工齡),tenure80(80年時在現(xiàn)單位工作年限), iq(智商),med(母親的教育年限),kww(在knowledge of the world of work測試中的成績),mrt(婚姻虛擬變量,已婚=1),age(年齡)。w建立方程: use grilic.dta,clear reg lw80 s80 expr80 tenure80 對方程進行分析:w1。遺漏變量問題:認為方程遺漏了“能力”這個變量,加入iq(智商)作為“能力”的代理變量。w2。測量誤差問題:iq(智商)對“能力”的測量存在誤差。w3。變量內(nèi)生性問題:s80可能與擾動項中除“能力”以外的其他因素相關(guān),因此是內(nèi)生變

4、量。 1238080exp 8080lwsrtenurew解決方法:使用med,kww,mrt,age作為內(nèi)生解釋變量iq與s80的工具變量。w1。使用2sls。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first w2。使用兩步gmm 。 ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age)w3。使用迭代gmm 。 ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age),igmmw

5、幾點注意事項:w1。2sls只能通過stata完成,利用定義手動計算的結(jié)果是錯誤的,因為殘差序列是錯誤的。w2。不可能單獨為每個內(nèi)生變量指定一組特定的工具變量, 所有外生變變量都作為自己的工具變量。w3。在大樣本下,iv 估計是一致的,但在小樣本下,iv 估計并非無偏估計量,有些情況下偏誤可能很嚴重。弱工具變量檢驗w工具變量z與 x 的相關(guān)性較低時,2sls 估計量存在偏誤,z 稱為“弱工具變量”。w檢驗方法: estat firststage 1。初步判斷可以用偏r2(partial r2) (剔除掉模型中原有外生變量的影響)。 2。 minimum eigenvalue statistic

6、(最小特征值統(tǒng)計量),經(jīng)驗上此數(shù)應該大于10。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat firststage過度識別檢驗 w檢驗工具變量是否與干擾項相關(guān),即工具變量是否為外生變量。目前僅限于在過度識別的情況下,進行過度識別檢驗。w2sls根據(jù)sargan統(tǒng)計量進行過度識別檢驗 ,gmm使用hansen j test進行過度識別檢驗。 命令均為: estat overid 檢驗工具變量的外生性 h0:所有工具變量都是外生的。 h1:至少有一個工具變量不是外生的,與擾動項相關(guān)。 ivregr

7、ess 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat overid ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) estat overid 究竟該用ols 還是ivw即解釋變量是否真的存在內(nèi)生性?w假設能夠找到方程外的工具變量。w1。如果所有解釋變量都是外生變量,則ols 比iv 更有效。在這種情況下使用iv,雖然估計量仍然是一致的,會增大估計量的方差。2。如果存在內(nèi)生解釋變量,則ols 是不一致的,而iv 是一致的。w豪斯曼檢驗(haus

8、man specification test)原假設:wh0 :所有解釋變量均為外生變量。wh1:至少有一個解釋變量為內(nèi)生變量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols一些面板數(shù)據(jù)教材w面板數(shù)據(jù)分析 (美)蕭政 著w橫截面與面板數(shù)據(jù)的經(jīng)濟計量分析 伍德里奇著,王忠玉譯wbaltagi. econometric analysis of p

9、anel dataw最新動態(tài)可關(guān)注期刊: journal of econometrics面板數(shù)據(jù)一些前沿問題 面板向量自回歸模型(panel var) 面板單位根檢驗(panel unit root test) 面板協(xié)整分析(panel cointegeration) 門檻面板數(shù)據(jù)模型(panel threshold) 面板聯(lián)立方程組 面板空間計量靜態(tài)面板數(shù)據(jù)w靜態(tài)面板數(shù)據(jù)模型,是指解釋變量中不包含被解釋變量的滯后項(通常為一階滯后項) 的情形。但嚴格地講,隨機干擾項服從某種序列相關(guān)的模型,如ar(1), ar(2), ma(1) 等,也不是靜態(tài)模型。靜態(tài)面板數(shù)據(jù)主要有兩種模型-固定效應模型和

10、隨機效應模型。面板數(shù)據(jù)的格式companycompanyyearyearinvestinvestmvaluemvalue11951755.9483311952891.24924.9119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.631954189.62759.9面板數(shù)據(jù)模型w考慮如下模型:w yit=xitb+uitw uit=ai+it其中, i=1,2,

11、n ; t=1, 2,tuit稱為復合擾動項。固定效應模型w對于特定的個體i而言,ai 表示那些不隨時間改變的影響因素,如個人的消費習慣、國家的社會制度、地區(qū)的特征、性別等,一般稱其為“個體效應” (individual effects)。如果把“個體效應”當作不隨時間改變的固定性因素, 相應的模型稱為“固定效應”模型。固定效應模型w固定效應模型的公式變?yōu)椋簑 yit=ai+xitb+itw回歸結(jié)果是每個個體都有一個特定的截距項。隨機效應模型w隨機效應模型將個體效應ai視為隨機因素,即把個體效應設定為干擾項的一部分。公式將變?yōu)椋簑 yit=xitb+(ai+it)w回歸的結(jié)果是隨機效應模型的所

12、有的個體具有相同的截距項,個體的差異主要反應在隨機干擾項的設定上。w怎樣選擇固定效應和隨機效應?w隨機效嚴格要求個體效應與解釋變量不相關(guān),即wcov(ai,xitb)=0w而固定效應模型并不需要這個假設條件。w這是兩種模型選擇的關(guān)鍵。面板數(shù)據(jù)基本命令w1。指定個體截面變量和時間變量:xtsetw2。對數(shù)據(jù)截面?zhèn)€數(shù)、時間跨度的整體描述:xtdes。w3。對每個個體分別顯示該變量的時間序列圖: xtline。w4。靜態(tài)面板數(shù)據(jù)基本回歸命令:xtreg。 use grunfeld,clear xtset company year xtdes xtline invest混合回歸:reg invest

13、mvalue kstock固定效應:xtreg invest mvalue kstock ,fe隨機效應:xtreg invest mvalue kstock ,re結(jié)果解讀w固定效應w隨機效應w特別注意:w1。三個r2哪個重要? w2。固定效應為什么有兩個f檢驗?w3。corr(u_i, xb) 的含義。w4。 sigma_u、sigma_e、rho的含義。模型選擇w固定效應還是混合ols? 可以直接觀測f值w隨機效應還是混合ols? 先用隨機效應回歸,然后運行xttest0w固定效應還是隨機效應? hausman檢驗whausman檢驗w基本思想:如果 corr(a_i,x_it) = 0

14、, fe 和 re 都是一致的,但re更有效。 如果 corr(a_i,x_it)!= 0, fe 仍然一致,但re是有偏的。 因此原假設是corr(a_i,x_it) = 0,即應該采用隨機效應。 xtreg invest mvalue kstock ,fe est store fixed xtreg invest mvalue kstock ,re est store random hausman fixed random本題接受原假設,即應該用隨機效應。幾個常見問題w1。既然固定效應每個個體都有單獨的截距項,如何獲得每個個體的截距項? xi:reg invest mvalue kstoc

15、k pany 即lsdv方法或者添加虛擬變量法。w2。非平衡面板如何處理? use nlswork,clear xtset idcode year xtdes 這是一份典型的大n小t型非平衡面板數(shù)據(jù)。 方法一:下載命令xtbalance提取成一個平衡面板數(shù)據(jù),但不推薦使用,因為會損失大量樣本。 方法二:利用算法填補缺失值,需要經(jīng)濟理論和算法的支撐。w3。面板數(shù)據(jù)格式不符合要求的處理。w例如如下表格格式該如何處理?w處理方法:w扁平數(shù)據(jù)變長條數(shù)據(jù)的命令:reshape use invest2,clear edit reshape long invest kstock, i(company) j(

16、year)companycompanyinvest2002invest2002invest2003invest2003invest2004invest2004kstock2002kstock2002kstock2003kstock2003kstock2004kstock20041 118.918.919.119.119.619.619.619.616.816.816.716.72 217.417.418.418.418.818.818.118.117.417.417173 3191919.619.620.120.120.220.2171717.117.14 4202020.420.420.32

17、0.320.420.417.517.517.317.35 518.118.118.318.318.418.418.518.516.416.416.116.16 619.719.7202019.919.917.217.216.316.316.316.3其他回歸方法w1。聚類穩(wěn)健的標準差w通??梢约僭O不同個體之間的擾動項相互獨立,但同一個體在不同時期的擾動項之間往往存在自相關(guān)。故須采用聚類穩(wěn)健的標準差。 use grunfeld,clear xtset company year reg invest mvalue kstock,vce(cluster company) 同理有: xtreg inv

18、est mvalue kstock,fe vce(cluster company) xtreg invest mvalue kstock,re vce(cluster company)w2。對于固定效應模型,可采用虛擬變量法。w基本思想:固定效應模型實質(zhì)上就是在傳統(tǒng)的線性回歸模型中加入 n-1 個虛擬變量,使得每個截面都有自己的截距項。由于固定效應模型假設存在著“個體效應”,每個個體都有其單獨的截距項。這就相當于在原方程中引入n1個虛擬變量(如果省略常數(shù)項,則引入n個虛擬變量)來代表不同的個體,獲得每個個體的截據(jù)項。 tab company,gen(dum) drop dum1 reg inv

19、est mvalue kstock dum* 與上述方法比較一下: xi:reg invest mvalue kstock pany 結(jié)果完全一樣。組間估計法w對于隨機效應模型,還可以采用“組間估計量”。對于那些每個個體的時間序列數(shù)據(jù)較不準確或“噪音”較大的數(shù)據(jù),可對每個個體取時間平均值,然后用平均值來回歸。 xtreg invest mvalue kstock ,be 由于損失了較多信息量,組間估計法并不常用。極大似然估計w如果隨機效應模型中假設擾動項服從正態(tài)分布,則可以使用最大似然估計法(mle)來進行估計。 xtreg invest mvalue kstock ,mlew與隨機效應模型的

20、估計比較結(jié)果幾乎完全一致。雙向固定效應模型w固定效應模型: yit=ai+xitb+itw雙向固定效應模型:yit=ai+ft+xitb+itw實際上添加了t-1個時間虛擬變量。主要反應隨著時間變化的一些特征。 tab year,gen(yr) edit drop yr1 xtreg invest mvalue kstock yr*,fe 大部分時間虛擬變量顯著,說明隨著時間的變動,invest有不斷變動的趨勢。w檢驗:可以使用似然比檢驗。w原假設:時間虛擬變量不顯著。 xtreg invest mvalue kstock ,fe est store fe1 xtreg invest mval

21、ue kstock yr*,fe est store fe2 lrtest fe1 fe2 整體來看時間虛擬變量不夠顯著。異方差、序列相關(guān)和截面相關(guān)w大n小t 重點關(guān)注異方差w大t小n 重點關(guān)注序列相關(guān)w由于面板數(shù)據(jù)中每個截面(公司、個人、地區(qū))之間還可能存在內(nèi)在的聯(lián)系,因此,截面相關(guān)性是面板數(shù)據(jù)的一個特有的特征。w三個假設:w1。vare_it = sigma2 同方差假設w2。corre_it, e_it-s = 0 序列無關(guān)假設w3。corre_it, e_jt = 0 截面不相關(guān)假設w1。異方差的檢驗(組間): findit xttest3 或者直接 ssc install xttest3 xtreg invest mvalue kstock ,fe xttest3w2。序列相關(guān)的檢驗:w基本思想:若無序列相關(guān),則一階差分后殘差相關(guān)系數(shù)應為-0.5。 findit xts

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論