第三講 內(nèi)生性專題 高級計量經(jīng)濟學(xué)及Stata應(yīng)用課件_第1頁
第三講 內(nèi)生性專題 高級計量經(jīng)濟學(xué)及Stata應(yīng)用課件_第2頁
第三講 內(nèi)生性專題 高級計量經(jīng)濟學(xué)及Stata應(yīng)用課件_第3頁
第三講 內(nèi)生性專題 高級計量經(jīng)濟學(xué)及Stata應(yīng)用課件_第4頁
第三講 內(nèi)生性專題 高級計量經(jīng)濟學(xué)及Stata應(yīng)用課件_第5頁
已閱讀5頁,還剩118頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2200119-90-70-178-18陳強計量及Stata應(yīng)用

(c)201411高級計量經(jīng)濟學(xué)及Stata應(yīng)用第三講內(nèi)生性專題陳強山東大學(xué)經(jīng)濟學(xué)院qiang2chen2@126.com2019-07-18陳強計量及Stata應(yīng)用

(c)20142內(nèi)生性專題IV2SLSGMM隨機實驗與自然實驗雙重差分法傾向得分匹配例:農(nóng)產(chǎn)品市場均衡模型令供給等于需要可得:2019-07-18陳強計量及Stata應(yīng)用

(c)20143需求函數(shù)還是供給函數(shù)?2019-07-18陳強計量及Stata應(yīng)用

(c)20144聯(lián)立方程偏差求解聯(lián)立方程可得: 故解釋變量與擾動項相關(guān),得不到一致估計,稱為“聯(lián)立方程偏差”(simultaneitybias)或“內(nèi)生性偏差”(endogenietybias)。2019-07-18陳強計量及Stata應(yīng)用

(c)201452019-07-18陳強計量及Stata應(yīng)用

(c)20146內(nèi)生變量 在計量經(jīng)濟學(xué)中,把所有與擾動項相關(guān)的解釋變量都稱為“內(nèi)生變量”(endogenousvariables)。 如果我們能夠?qū)?nèi)生變量分成兩部分,一部分與擾動項相關(guān),而另一部分與擾動項不相關(guān),則有希望用與擾動項不相關(guān)的那一部分得到一致估計。 對內(nèi)生變量的這種分離可以借助于另外一個“工具變量”(InstrumentalVariable,IV)來實現(xiàn)。工具變量的思想 假設(shè)存在某個因素(變量)使得供給曲線經(jīng)常移動,而需求曲線基本不動。此時,可以估計需求曲線。這個使供給曲線移動的變量就是工具變量。2019-07-18陳強計量及Stata應(yīng)用

(c)20147氣溫作為工具變量 假設(shè)影響供給方程擾動項的因素可以分解為兩部分,即可觀測的氣溫x與不可觀測的其他因素:氣溫為前定變量,與兩個擾動項都不相關(guān)。氣溫的變化使得供給函數(shù)沿著需求函數(shù)移動,故可估計出需求函數(shù)。2019-07-18陳強計量及Stata應(yīng)用

(c)201482019-07-18陳強計量及Stata應(yīng)用

(c)20149工具變量的定義一個有效(valid)的工具變量應(yīng)滿足以下兩個條件:相關(guān)性:工具變量與內(nèi)生解釋變量相關(guān)外生性:工具變量與擾動項不相關(guān)。也被稱為“排他性約束”(exclusionrestriction),因為外生性意味著,工具變量影響被解釋變量的唯一渠道是通過與其相關(guān)的內(nèi)生解釋變量,它排除了所有其他的可能影響渠道。2019-07-18陳強計量及Stata應(yīng)用

(c)201410氣溫滿足工具變量的定義氣溫滿足工具變量的兩個條件:相關(guān)性:氣溫影響供給,而供給影響價格(需求方程中的內(nèi)生解釋變量),故氣溫與價格相關(guān)外生性:氣溫為前定變量,故與擾動項不相關(guān)。二階段最小二乘法 傳統(tǒng)的工具變量法通過“二階段最小二乘法”(TwoStageLeastSquare,簡記2SLS或TSLS)來實現(xiàn)。 第一階段回歸:用內(nèi)生解釋變量p對工具變量回歸x,得到擬合值 。 第二階段回歸:用被解釋變量q對第一階段回歸的擬合值進行回歸 。2019-07-18陳強計量及Stata應(yīng)用

(c)2014112019-07-18陳強計量及Stata應(yīng)用

(c)2014122SLS的原理 第一階段回歸的擬合值為工具變量的線性函數(shù),故也是外生的(因為工具變量是外生的)。 因此,在第二階段回歸中,第一階段回歸的擬合值與擾動項不相關(guān),故可得到一致估計。 2SLS的實質(zhì)是把內(nèi)生解釋變量分成兩部分,即由工具變量所造成的外生部分,以及與擾動項相關(guān)的其余部分。把被解釋變量對此外生部分進行回歸,即得到一致估計。例:宏觀模型中的消費函數(shù) 其中,Y,C,I,G分別代表國民收入、總消費、總投資、政府凈支出與凈出口。第一個方程為消費方程,第二個方程為國民收入恒等式。 可以證明,如果單獨對消費方程進行OLS估計,將得到不一致的估計。2019-07-18陳強計量及Stata應(yīng)用

(c)2014132019-07-18陳強計量及Stata應(yīng)用

(c)201414多個內(nèi)生變量與多個工具變量可識別的階條件(必要條件): 不可識別(unidentified):工具變量個數(shù)小于內(nèi)生解釋變量個數(shù)恰好識別(justorexactlyidentified):工具變量個數(shù)等于內(nèi)生解釋變量個數(shù)過度識別(overidentified):工具變量個數(shù)大于內(nèi)生解釋變量個數(shù)2019-07-18陳強計量及Stata應(yīng)用

(c)201415弱工具變量 如果工具變量與內(nèi)生解釋變量僅微弱相關(guān),將導(dǎo)致工具變量法估計量的漸近方差變得很大。 由于工具變量中僅包含很少與解釋變量有關(guān)的信息,利用這部分信息進行的工具變量法估計就很不準(zhǔn)確,即使樣本容量很大也很難收斂到真實的參數(shù)值。這種工具變量稱為“弱工具變量”(weakinstruments)。 弱工具變量的后果類似于樣本容量過小,會導(dǎo)致的小樣本性質(zhì)變得很差,而的大樣本分布也可能離正態(tài)分布相去甚遠,致使統(tǒng)計推斷失效。2019-07-18陳強計量及Stata應(yīng)用

(c)201416弱工具變量的檢驗 在第一階段回歸中,檢驗所有工具變量的聯(lián)合顯著性,得到F統(tǒng)計量。 經(jīng)驗規(guī)則:如果F<10,則存在弱工具變量;反之,則不存在弱工具變量。 弱工具變量的解決方法:(1)尋找強工具變量;(2)如果工具變量足夠多,可舍棄弱工具變量。(3)使用有限信息最大似然估計(LimitedInformationMaximumLikelihoodEstimation,簡記LIML)2019-07-18陳強計量及Stata應(yīng)用

(c)201417工具變量的外生性 在恰好識別的情況下,無法檢驗工具變量的外生性。只能進行定性討論或依賴于專家的意見。 定性討論:如果工具變量是外生的,則其對被解釋變量發(fā)生影響的唯一渠道就是通過內(nèi)生變量,除此以外別無其他渠道。此條件被稱為“排他性約束”(exclusionrestriction)。 在實踐中,需要找出工具變量影響被解釋變量的所有其他可能渠道,然后一一排除,才能比較信服地說明工具變量的外生性。2019-07-18陳強計量及Stata應(yīng)用

(c)201418過度識別檢驗 在過度識別的情況下,則可進行“過度識別檢驗”(overidentificationtest)。 此檢驗的大前提(maintainedhypothesis)是該模型至少是恰好識別的,即有效工具變量至少與內(nèi)生解釋變量一樣多。 在此大前提下,過度識別檢驗的原假設(shè)為“所有工具變量都是外生的”。過度識別檢驗的步驟 把2SLS的殘差對工具變量及外生解釋變量進行回歸,檢驗工具變量的系數(shù)是否聯(lián)合為0。記此輔助回歸的擬合優(yōu)度為R2。Sargan統(tǒng)計量:其中,m為工具變量個數(shù),r為內(nèi)生解釋變量個數(shù) 如果恰好識別,則m-r=0(自由度為0),義,故無法使用“過度識別檢驗”。無定2019-07-18陳強計量及Stata應(yīng)用

(c)2014192019-07-18陳強計量及Stata應(yīng)用

(c)201420對解釋變量內(nèi)生性的檢驗究竟該用OLS還是工具變量法? “豪斯曼檢驗”(Hausmanspecificationtest)的原假設(shè)為“所有解釋變量均為外生變量”。如果原假設(shè)成立,則OLS比工具變量法更有效。此時使用IV,雖然是一致估計量,但“無病用藥”,反而增大估計量方差。反之,如果存在內(nèi)生解釋變量,則OLS不一致,而IV是一致的。豪斯曼檢驗的原理 如果原假設(shè)成立,則OLS與IV都一致,即在大樣本下 與 都收斂于真實的參數(shù)值 ,因此依概率收斂于0。反之,如果不成立,則IV一致而OLS不一致,故不會收斂于0。 如果二者距離很大,則傾向于拒絕原假設(shè)。以二次型度量此距離可得:2019-07-18陳強計量及Stata應(yīng)用

(c)201421矩估計傳統(tǒng)的矩估計(MethodofMoments,MM) 假設(shè)隨機變量 ,其中 為待估參數(shù)。因為有兩個待估參數(shù),故須使用兩個總體矩條件(populationmomentconditions):一階原點矩:二階原點矩:2019-07-18陳強計量及Stata應(yīng)用

(c)201422矩估計的求解 用對應(yīng)的樣本矩(samplemoments)替代總體矩條件可得以下聯(lián)立方程組,求解可得: 矩估計的缺點:更高階矩可能也包含有用信息,但被棄而不用。廣義矩估計(GMM)可彌補此缺點。2019-07-18陳強計量及Stata應(yīng)用

(c)201423IV法作為矩估計 假設(shè)最后一個解釋變量為內(nèi)生變量,其工具變量為w: 記工具向量為 ,其中外生解釋變量為自己的工具變量(符合工具變量的定義)。2019-07-18陳強計量及Stata應(yīng)用

(c)201424總體與樣本矩條件 “總體矩條件”或“正交條件”(orthogonalitycondition):以樣本矩代替上總體矩,即得到IV估計量:2019-07-18陳強計量及Stata應(yīng)用

(c)201425OLS也是IV矩估計 如果所有解釋變量都是前定變量,則可以將自己作為自己的工具變量。因此,X=Z。?2019-07-18陳強計量及Stata應(yīng)用

(c)2014262019-07-18陳強計量及Stata應(yīng)用

(c)201427IV矩估計的局限性傳統(tǒng)的IV矩估計僅適用于恰好識別的情形。在過度識別情況下,則一般使用2SLS。 在球型擾動項(同方差、無自相關(guān))的情況下,2SLS是最有效率的。 如果存在異方差或自相關(guān),則存在更有效率的方法,即廣義矩估計。矩條件的再考察與總體矩條件 相對應(yīng)的樣本矩條件為:將上式看成聯(lián)立方程組,則未知數(shù)共有K個,而方程個數(shù)為L個(的維度)。如果L<K,為不可識別,有無窮多解。如果L=K,為恰好識別,有唯一解,即 。如果L>K,為過度識別,無解;此時傳統(tǒng)的矩估計法行不通。2019-07-18陳強計量及Stata應(yīng)用

(c)201428廣義矩估計的定義腦筋急轉(zhuǎn)彎:雖然無法找到 使得但總可以讓向量 盡可能地接近0。定義最小化的目標(biāo)函數(shù)為, 其中,為根據(jù)數(shù)據(jù)估計的“權(quán)重矩陣”(weightingmatrix)。所得估計量就是廣義矩估計(GeneralizedMethodofMoments,GMM)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014292019-07-18陳強計量及Stata應(yīng)用

(c)201430廣義矩估計的優(yōu)點 可選擇最優(yōu)權(quán)重矩陣,使得估計量的漸近方差最??;稱為“最優(yōu)GMM”(optimalGMM)。但需要先估計最優(yōu)權(quán)重矩陣。 兩步最優(yōu)GMM:(1)進行2SLS估計(2SLS也是一致估計),得到殘差,估計最優(yōu)權(quán)重矩陣;(2)使用此最優(yōu)權(quán)重矩陣進行GMM估計。 迭代GMM:使用GMM殘差,估計最優(yōu)權(quán)重矩陣;重復(fù)以上步驟,直至收斂。2019-07-18陳強計量及Stata應(yīng)用

(c)201431GMM與2SLS在同方差情況下,GMM=2SLS。在恰好識別情況下,GMM=2SLS。 在異方差、過度識別情況下,GMM比2SLS更有效率。GMM的過度識別檢驗 在恰好識別的情況下,GMM的目標(biāo)函數(shù)=0。在過度識別的情況下,如果所有過度識別約束都成立,則目標(biāo)函數(shù)J應(yīng)該離0不遠。如果J大于0很多,則可傾向于認為某些過度識別約束不成立。 在原假設(shè)“所有矩條件均成立”的情況下,目標(biāo)函數(shù)本身就是檢驗統(tǒng)計量:在同方差的情況下,J統(tǒng)計量等于Sargan統(tǒng)計量。2019-07-18陳強計量及Stata應(yīng)用

(c)2014322019-07-18陳強計量及Stata應(yīng)用

(c)201433如何獲得工具變量尋找工具變量可大致分兩步:列出與內(nèi)生解釋變量相關(guān)的盡可能多的變量 的清單(這一步較容易);從這一清單中剔除與擾動項相關(guān)的變量(使用exclusionrestriction的邏輯)。2019-07-18陳強計量及Stata應(yīng)用

(c)201434例:滯后變量作為IV 對于時間序列或面板數(shù)據(jù),常使用內(nèi)生變量的滯后變量作為IV。顯然,內(nèi)生變量與其滯后值相關(guān)。另一方面,由于滯后變量已經(jīng)發(fā)生,故為“前定”,可能與當(dāng)期擾動項不相關(guān)。 Grovesetal(1994)考察國企改革(員工獎金激勵制度)對企業(yè)生產(chǎn)率的作用。一般地,獎金占員工中報酬比重越高,則越能促進生產(chǎn)率的提高。但,生產(chǎn)率越高的企業(yè)越有能力給員工發(fā)獎金,故存在雙向因果關(guān)系。使用獎金比重的滯后值作為當(dāng)期獎金比重的工具變量。二者的相關(guān)性是顯然的。另一方面,當(dāng)期的生產(chǎn)率不可能影響過去的獎金比重,故獎金比重的滯后值具有外生性。2019-07-18陳強計量及Stata應(yīng)用

(c)201435例:警察人數(shù)與犯罪率 一般認為,警察人數(shù)越多,執(zhí)法力度越大,則犯罪率應(yīng)該越低。但直接把犯罪率對警察人數(shù)進行回歸,以此度量警察人數(shù)對犯罪率的作用,就會出現(xiàn)內(nèi)生變量偏差。警察人數(shù)是內(nèi)生變量;某市犯罪率越高,市政府越會增加警察人數(shù)。 Levitt(1997)創(chuàng)造性地使用“市長選舉的政治周期”作為犯罪率的工具變量。在市長連任時,為了拉選票,會增加警察人數(shù),故滿足相關(guān)性。另一方面,選舉周期以機械方式確定,除了對警察人數(shù)有影響外,不會單獨地對犯罪率起作用,故滿足外生性。2019-07-18陳強計量及Stata應(yīng)用

(c)201436例:制度對經(jīng)濟增長的影響 好制度能促進增長,但制度變遷也依賴于經(jīng)濟增長。Acemogluetal(2001)使用“殖民者死亡率”(settlermortality)作為制度的工具變量。 近代歐洲殖民者在全世界殖民時,由于各地氣候及疾病環(huán)境不同,歐洲殖民者的死亡率十分不同。在死亡率高的地方(比如,非洲),殖民者難以定居,故在當(dāng)?shù)亟⒙訆Z性制度。而在死亡率低的地方(比如,北美),則建立有利于經(jīng)濟增長的制度(比如,較好的產(chǎn)權(quán)保護)。這種初始制度上的差異一直延續(xù)到今天。因此,殖民者死亡率與今天的制度相關(guān),滿足相關(guān)性。另一方面,殖民者死亡率除了對制度有影響外,不再對當(dāng)前的經(jīng)濟增長有任何直接影響,故滿足外生性。2019-07-18陳強計量及Stata應(yīng)用

(c)201437例:看電視過多引發(fā)小兒自閉癥? 在美國,電視的普及與小兒自閉癥(autism)發(fā)生率的攀升幾乎同步。Waldmanetal(2006,2008)研究過多觀看電視是否引發(fā)小兒自閉癥。但有自閉傾向的兒童更經(jīng)??措娨?而不喜戶外活動或與人交往;故存在雙向因果關(guān)系。 Waldmanetal(2006,2008)使用降雨量作為電視觀看時間的工具變量。二者存在相關(guān)性,即降雨越多的地區(qū),人們呆在室內(nèi)的時間越長,故看電視時間也越長;而降雨量很可能是外生的。研究結(jié)果支持多看電視為小兒自閉癥的誘因。2019-07-18陳強計量及Stata應(yīng)用

(c)201438實例:年輕男子的教育回報率 Mincer(1958)最早研究了工資與受教育年限的正相關(guān)關(guān)系,但遺漏了“能力”這個變量,導(dǎo)致遺漏變量偏差。 針對美國面板調(diào)查數(shù)據(jù)中的年輕男子組群(YoungMen’sCohortoftheNationalLongitudinalSurvey,簡記NLS-Y),Griliches(1976)采用工具變量法對遺漏變量問題進行了校正。 BlackburnandNeumark(1992)更新了Griliches(1976)的數(shù)據(jù),即本例的數(shù)據(jù)集“grilic.dta”。2019-07-18陳強計量及Stata應(yīng)用

(c)201439數(shù)據(jù)集grilic.dta中的變量 lw(工資對數(shù)),s(受教育年限),age(年齡),expr(工齡),tenure(在現(xiàn)單位的工作年數(shù)),iq(智商),med(母親的受教育年限),kww(在“knowledgeoftheWorldofWork”測試中的成績),mrt(婚姻虛擬變量,已婚=1),rns(美國南方虛擬變量,住在南方=1),smsa(大城市虛擬變量,住在大城市=1),year(有數(shù)據(jù)的最早年份,1966-1973年中的某一年)。 兩期面板數(shù)據(jù),初始期為當(dāng)以上變量有數(shù)據(jù)的最早年份,結(jié)束期為1980年。不帶“80”字樣的變量名為初始期,帶“80”字樣的變量名為1980年數(shù)據(jù)。比如,iq指的是初始期的智商,而lw80指的是1980年的工資對數(shù)。數(shù)據(jù)特征use

grilic.dta,clearsum2019-07-18陳強計量及Stata應(yīng)用

(c)201440智商與教育年限的相關(guān)關(guān)系pwcorr

iq

s,sig2019-07-18陳強計量及Stata應(yīng)用

(c)201441不考慮智商(能力的代理變量)的OLSreg

lw

s

expr

tenure

rns

smsa,r2019-07-18陳強計量及Stata應(yīng)用

(c)2014422019-07-18陳強計量及Stata應(yīng)用

(c)201443解讀(1) 回歸結(jié)果顯示,教育投資的年回報率為10.26%,而且在1%的水平上顯著地不為0。這意味著,多受一年教育,則未來的工資將高出10.26%,這個教育投資回報率似乎太高了。 可能的原因是,由于遺漏變量“能力”與受教育年限正相關(guān),故“能力”對工資的貢獻也被納入教育的貢獻,因此高估了教育的回報率。引入智商(iq)的OLSreg

lw

s

iq

expr

tenure

rns

smsa,r2019-07-18陳強計量及Stata應(yīng)用

(c)2014442019-07-18陳強計量及Stata應(yīng)用

(c)201445解讀(2) 加入“能力”的代理變量iq后,教育投資的回報率下降為9.28%,變得更為合理些,但仍然顯得過高。 由于用iq來度量能力存在“測量誤差”,故iq是內(nèi)生變量,考慮使用變量(med,kww)作為iq的工具變量,進行2SLS回歸,并使用穩(wěn)健標(biāo)準(zhǔn)誤。2SLSivregress

2sls

lw

s

expr

tenure

rns

smsa (iq=med

kww),r

first2019-07-18陳強計量及Stata應(yīng)用

(c)2014462019-07-18陳強計量及Stata應(yīng)用

(c)2014472019-07-18陳強計量及Stata應(yīng)用

(c)201448解讀(3) 上表顯示,教育投資回報率降為6.08%,比較合理。下面,進行過度識別檢驗。過度識別檢驗estat

overid2019-07-18陳強計量及Stata應(yīng)用

(c)2014492019-07-18陳強計量及Stata應(yīng)用

(c)201450弱工具變量檢驗 考察有效工具變量的第二個條件,即工具變量與內(nèi)生變量的相關(guān)性。從第一階段的回歸結(jié)果可以看出,工具變量(med,kww)對內(nèi)生變量iq均有較好的解釋力,p值都小于0.05。正式的檢驗可以通過如下命令進行:estatfirststageF統(tǒng)計量為13.40(超過10),故不存在弱工具變量。2019-07-18陳強計量及Stata應(yīng)用

(c)2014512019-07-18陳強計量及Stata應(yīng)用

(c)201452豪斯曼檢驗 工具變量法的前提是存在內(nèi)生解釋變量。為此須進行豪斯曼檢驗,其原假設(shè)為“所有解釋變量均為外生”,即不存在內(nèi)生變量。quietlyreglwiqsexprtenurernssmsaestimatesstoreolsquietlyivregress2slslwsexprtenurerns smsa(iq=medkww)estimatesstoreivhausmanivols,constantsigmamore 傳統(tǒng)的豪斯曼檢驗建立在同方差的前提下,故在此不使用穩(wěn)健標(biāo)準(zhǔn)誤。2019-07-18陳強計量及Stata應(yīng)用

(c)201453異方差穩(wěn)健的DWH檢驗 (接上頁)可在5%水平上拒絕“所有解釋變量均為外生”的原假設(shè),即認為iq為內(nèi)生變量。 由于傳統(tǒng)的豪斯曼檢驗在異方差情形下不成立,下面進行異方差穩(wěn)健的Durbin-Wu-Hausman檢驗:estatendogenous2019-07-18陳強計量及Stata應(yīng)用

(c)2014542019-07-18陳強計量及Stata應(yīng)用

(c)201455GMM估計 如果存在異方差,則GMM比2SLS更有效率。為此,進行如下最優(yōu)GMM估計。ivregressgmmlwsexprtenurernssmsa (iq=medkww)兩步最優(yōu)GMM的系數(shù)估計值與2SLS很接近。2019-07-18陳強計量及Stata應(yīng)用

(c)201456過度識別檢驗estat

overid由于p值為0.70,故認為所有工具變量均為外生。2019-07-18陳強計量及Stata應(yīng)用

(c)2014572019-07-18陳強計量及Stata應(yīng)用

(c)201458迭代GMMivregressgmmlwsexprtenurernssmsa (iq=medkww),igmm結(jié)果參見下頁。容易看出,迭代GMM與兩步 GMM的系數(shù)估計值相差無幾。2019-07-18陳強計量及Stata應(yīng)用

(c)2014592019-07-18陳強計量及Stata應(yīng)用

(c)201460存儲回歸結(jié)果quietly

reg

lw

s

expr

tenure

rns

smsa,restimates

store

ols_no_iqquietly

reg

lw

iq

s

expr

tenure

rns

smsa,restimates

store

ols_with_iqquietly

ivregress

2sls

lw

s

expr

tenure

rns smsa

(iq=med

kww),restimates

store

tslsquietly

ivregress

gmm

lw

s

expr

tenure

rns smsa

(iq=med

kww)estimates

store

gmmquietly

ivregress

gmm

lw

s

expr

tenure

rns smsa

(iq=med

kww),igmmestimates

store

igmm2019-07-18陳強計量及Stata應(yīng)用

(c)201461輸出回歸結(jié)果下載非官方命令estout。ssc

install

estoutesttab

ols_no_iq

ols_with_iq

tsls

gmm

igmm,se r2

mtitle

star(*

0.1

**

0.05

***

0.01)2019-07-18陳強計量及Stata應(yīng)用

(c)201462實驗與因果關(guān)系實驗方法是研究因果關(guān)系的有力工具。假設(shè)我們要研究變量是否導(dǎo)致y,以及因果關(guān)系的強弱假定包含所有可能影響y

的因素。 不同學(xué)科可能依條件的不同而采用不同的實驗方法,大致可以分為以下幾類。2019-07-18陳強計量及Stata應(yīng)用

(c)201463實驗的類別 (1)控制實驗(controlledexperiment):在理想的物理實驗中,對除 以外的因素全部控制不變,單獨讓 變化,然后觀察y變化的情況。 (2)隨機(控制)實驗(randomizedcontrolledexperiment):比如,醫(yī)學(xué)上對新藥療效的實驗。由于參加實驗者的體質(zhì)與生活方式不同,不可能完全控制所有其他因素。通常將實驗人群隨機分為兩組,“實驗組”或“處理組”(treatmentgroup)服用真藥,“控制組”(controlgroup,對照組)服用“安慰藥”(placebo)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014642019-07-18陳強計量及Stata應(yīng)用

(c)201465實驗的類別(續(xù)) 例:在農(nóng)學(xué)中將地塊隨機地分成三組(因為很難找到土壤條件完全一樣的地塊),分別給予不同的施肥量,然后考察施肥的效果。 (3)自然實驗或準(zhǔn)實驗(naturalexperimentorquasiexperiment):由于某些并非為了實驗?zāi)康亩l(fā)生的外部突發(fā)事件,使得當(dāng)事人仿佛被隨機地分在了實驗組或控制組。比如,一個州通過某法律,但相鄰州未通過此法律。兩州民眾事先不知道哪個州會通過此法,故無法自我選擇住在哪個州??山普J為民眾隨機選擇住在哪個州,或者被隨機地分在實驗組(通過法律)與控制組(沒通過法律)。理想的隨機實驗 實驗組與控制組的成員決定完全隨機,比如,通過拋硬幣或電腦隨機數(shù)來決定。因此,個體被分在哪一組或得到多大實驗“處理水平”(treatmentlevel),與個體特征或其他因素完全獨立。 故解釋變量“處理水平”與被遺漏的擾動項不相關(guān),可避免遺漏變量偏差(omittedvariablebias)或內(nèi)生變量偏差(endogenietybias)。例:由于 完全隨機,無論遺漏多少解釋變量,OLS都一致2019-07-18陳強計量及Stata應(yīng)用

(c)201466因果效應(yīng) 在隨機實驗中,因果效應(yīng)(causaleffect)有著清晰的定義。 在理想的隨機實驗中,X對y的因果效應(yīng)表現(xiàn)在條件期望的差別。 即 ,也稱“處理效應(yīng)”(treatmenteffect)。2019-07-18陳強計量及Stata應(yīng)用

(c)201467差分估計量 如果 為虛擬變量,方程的OLS估計量為?為實驗組的樣本均值, 為控制組的樣本均值。在回歸方程加入虛擬變量的效果相當(dāng)于給予實驗組與控制組不同的截距項。另一方面,對常數(shù)項回歸時,系數(shù)估計值便是樣本均值。故 ,?等于實驗組均值與控制組均值之差,故稱“差分估計量”(differencesestimator)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014682019-07-18陳強計量及Stata應(yīng)用

(c)201469例:班級規(guī)模與學(xué)習(xí)成績 美國田納西州進行了為期四年的隨機實驗(稱為ProjectSTAR,即Student-TeacherAchievementRatio),將幼兒園至小學(xué)三年級的學(xué)生隨機分為三組。 第一組為普通班,每班22-25名學(xué)生;第二組為小班,每班13-17名學(xué)生;第三組也為小班,但配備一名教學(xué)助理(teacher’saide)。教師也隨機分到這三類班級。 實驗結(jié)果發(fā)現(xiàn),盡管班級規(guī)模對學(xué)習(xí)成績的影響在統(tǒng)計上顯著,但在經(jīng)濟上并不顯著(即此效應(yīng)本身比較小,普通班與小班的成績差距類似于男生與女生的成績差距)。引入更多解釋變量 雖然在理想的隨機實驗條件下,OLS估計量(差分估計量)是一致的,但由于遺漏了較多變量,故的方差可能較大,OLS估計效率可能不高。如果引入某些遺漏變量,可提高估計效率。也提供了檢驗 是否完全隨機的機會。2019-07-18陳強計量及Stata應(yīng)用

(c)2014702019-07-18陳強計量及Stata應(yīng)用

(c)201471隨機實驗執(zhí)行過程中可能出現(xiàn)的問題內(nèi)部有效性問題(internal

validity)外部有效性問題(external

validity)2019-07-18陳強計量及Stata應(yīng)用

(c)201472內(nèi)部有效性問題未能完全隨機分組(failure

to

randomize)未能完全遵從實驗設(shè)計(partial

compliance)中途退出實驗(attrition)實驗效應(yīng)或霍桑效應(yīng)(experimental

effect或Hawthorne

effect)樣本過小2019-07-18陳強計量及Stata應(yīng)用

(c)201473外部有效性問題樣本的代表性不足(non-representative

sample)小型實驗的條件與大規(guī)模推廣時的現(xiàn)實條件不同一般均衡效應(yīng)(general

equilibrium

effect)自我選擇效應(yīng)2019-07-18陳強計量及Stata應(yīng)用

(c)201474自然實驗 隨機實驗說服力強,但成本高。自然實驗為自然發(fā)生(非為實驗?zāi)康亩l(fā)生),幾乎沒有成本,說服力類似于隨機實驗,為研究者青睞。 自然實驗可分為兩類。第一類:個體的分組或處理水平完全由自然實驗所決定,可直接用OLS估計因果效應(yīng)。 第二類:個體的分組或處理水平只是部分地由自然實驗所決定,此時應(yīng)以自然實驗所帶來的隨機變動作為工具變量進行估計。2019-07-18陳強計量及Stata應(yīng)用

(c)201475第一類自然實驗的例子最低工資如何影響對低技能工人的需求? CardandKrueger(1994):在1992年,美國新澤西州通過法律將最低工資從每小時$4.25提高到$5.05,但在相鄰的賓夕法尼亞州最低工資卻保持不變。 這兩個州的雇主仿佛被隨機地分配到實驗組(新澤西州)與控制組(賓夕法尼亞州) 收集了兩個州的快餐店在實施新法前后雇傭人數(shù)的數(shù)據(jù),發(fā)現(xiàn)提高最低工資對低技能工人的就業(yè)幾乎沒有影響。2019-07-18陳強計量及Stata應(yīng)用

(c)201476第二類自然實驗的例子服兵役是否影響退役后的長期收入? Angrist(1990)考察越戰(zhàn)期間的參軍者,當(dāng)時美國對全國年輕男子以生日抽簽的方式進行征兵。盡管抽簽結(jié)果完全隨機,但是否參軍還取決于體檢,且有些人得到豁免,另一些人未抽中卻自愿參軍。 個體分組僅部分地由自然實驗決定,應(yīng)使用抽簽結(jié)果作為參軍與否的工具變量進行估計。結(jié)果表明,服兵役會減少白人的長期收入,但不影響非白人的長期收入。雙重差分法做隨機實驗或自然實驗時,實驗效果常需一段時間才顯現(xiàn)??紤]兩期面板數(shù)據(jù)(t=1實驗前,t=2實驗后): 為實驗期虛擬變量(實驗后=1;實驗前=0), 為不可觀測的個體特征,政策虛擬變量(policydummy)為 如果實驗未能完全隨機化(如觀測數(shù)據(jù)),則 可能與被遺漏的個體特征 相關(guān),導(dǎo)致OLS不一致。2019-07-18陳強計量及Stata應(yīng)用

(c)201477雙重差分法(續(xù))對方程進行一階差分(第二期減第一期),以消掉 :OLS為一致估計。根據(jù)與差分估計量同樣的推理: 故稱為“雙重差分估計量”(Difference-in-Differencesestimator,簡記DD),即實驗組的平均變化與控制組的平均變化之差。2019-07-18陳強計量及Stata應(yīng)用

(c)201478雙重差分估計量示意圖2019-07-18陳強計量及Stata應(yīng)用

(c)201479擴展對于雙重差分估計量,也可引入其他解釋變量:用OLS估計上式。 以 為被解釋變量的雙重差分法不適用于多期的數(shù)據(jù),需回到以 為被解釋變量的面板模型。仍以兩期數(shù)據(jù)為例,并忽略其他解釋變量。2019-07-18陳強計量及Stata應(yīng)用

(c)201480DD的兩種形式方程與以下面板模型等價: 為實驗組虛擬變量(實驗組=1,控制組=0); 為實驗期虛擬變量(實驗后=1,實驗前=0),互動項(實驗組在實驗期取值為1,反之為0)。 分組虛擬變量 刻畫的是實驗組與控制組本身的差異(即使不進行實驗,也存在此差異),實驗期虛擬變量 刻畫的是實驗前后兩期本身的差異(即使不進行實驗,也存在此時間趨勢),互動項 度量實驗組的政策效應(yīng)。2019-07-18陳強計量及Stata應(yīng)用

(c)201481推導(dǎo)原方程:t=1時,方程可寫為t=2時,方程可寫為的系數(shù)就是雙重差分二者相減: 兩方程完全相同,故互動項估計量。2019-07-18陳強計量及Stata應(yīng)用

(c)201482推廣到多期假設(shè)共有4期數(shù)據(jù):?分別為第2-4期的時間虛擬變量(以捕捉即使沒有政策變化也可能存在的時間效應(yīng))。政策虛擬變量為 雙重差分法的優(yōu)點在于,同時控制了分組效應(yīng)(group-specificeffects)與時間效應(yīng)(time-specificeffects)。2019-07-18陳強計量及Stata應(yīng)用

(c)201483雙重差分的Stata命令sscinstalldiff (下載安裝命令diff)diffy,treat(varname)period(varname) cov(z1z2)robustreporttest “y”為結(jié)果變量( ),“treat(varname)”指定處理變量( ),“period(varname)”指定實驗期虛擬變量( )。 “robust”表示匯報穩(wěn)健標(biāo)準(zhǔn)誤?!癱ov(z1z2)”指定其他解釋變量,“cov”表示協(xié)變量(covariate);“report”表示匯報對協(xié)變量系數(shù)的估計結(jié)果?!皌est”表示檢驗在基期時,各變量在實驗組與控制組的均值是否相等。2019-07-18陳強計量及Stata應(yīng)用

(c)2014842019-07-18陳強計量及Stata應(yīng)用

(c)201485例:最低工資的自然實驗以數(shù)據(jù)集cardkrueger1994.dta為例被解釋變量:fte(fulltimeemployment人數(shù)) 實驗組虛擬變量treated(treated=1,快餐店在新澤西;treated=0,快餐店在賓州),實驗期虛擬變量t(t=1,1992年11月;t=0,1992年2月)。 其他解釋變量:bk(BurgerKing=1),kfc(KentuckyFriedChicken=1),roys(RoyRogers=1),wendys(Wendy’s=1)。手工計算雙重差分法use

cardkrueger1994,cleargen

gd=t*treated (定義交叉項gd)reg

fte

gd

treated

t,r處理效應(yīng)(互動項gd)系數(shù)為2.914,p值為0.0942019-07-18陳強計量及Stata應(yīng)用

(c)2014862019-07-18陳強計量及Stata應(yīng)用

(c)201487使用命令diffdifffte,t(treated)p(t)robust結(jié)果見下頁:處理效應(yīng)的系數(shù)估計值為2.914,p值為 0.094,與手工回歸的結(jié)果完全相同。 表中將“t=0”的時期稱為“Baseline”(基期),將“t=1”的時期稱為“Follow-up”(跟蹤期)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014882019-07-18陳強計量及Stata應(yīng)用

(c)201489引入快餐品牌虛擬變量regftegdtreatedtbkkfcroys,r結(jié)果見下頁:引入其他解釋變量(即快餐品牌虛擬變量)后,處理效應(yīng)的系數(shù)估計值增大為2.935,并接近5%的顯著性水平(p值為0.058)。difffte,t(treated)p(t)cov(bkkfcroys) robust結(jié)果見下頁:與手工回歸完全一樣。2019-07-18陳強計量及Stata應(yīng)用

(c)2014902019-07-18陳強計量及Stata應(yīng)用

(c)201491雙重差分法的局限性 將雙重差分法應(yīng)用于觀測數(shù)據(jù)時,如果政策虛擬變量 為內(nèi)生,則依然得不到一致估計。 比如,政府提供的就業(yè)培訓(xùn)項目,完全由個人決定是否參與。由于實際處理水平 存在自我選擇(selfselection),并非隨機分組,導(dǎo)致不一致估計 解決方法之一:傾向得分匹配(propensityscorematching),使實驗組與控制組在各方面特征盡可能接近。2019-07-18陳強計量及Stata應(yīng)用

(c)201492Rubin’s

counterfactual

framework “處理變量”(treatmentvariable)項目(1=參與,0=未參與)。表示個體i是否參與未來收入或其他感興趣的結(jié)果(outcomeofinterest)為個體i的未來收入有兩種狀態(tài),取決于是否參加項目:為未參加項目的未來收入,為參加項目的未來收入2019-07-18陳強計量及Stata應(yīng)用

(c)201493處理效應(yīng)個體i的處理效應(yīng)(treatmenteffect):平均處理效應(yīng)(AverageTreatmentEffect,簡記ATE): 參與者平均處理效應(yīng)(AverageTreatmentEffectontheTreated,簡記ATT): 非參與者平均處理效應(yīng)(AverageTreatmentEffectontheUntreated,簡記ATU):2019-07-18陳強計量及Stata應(yīng)用

(c)201494選擇難題 個體通常會根據(jù)參加項目的預(yù)期收益 而自我選擇是否參加項目,導(dǎo)致對平均處理效應(yīng)的估計帶來困難,稱為“選擇難題”(theselectionproblem)。 與樣本選擇問題(Heckman,1979)的區(qū)別:樣本選擇問題通常不考慮某項目或政策的效應(yīng),故個體間的差異不在于是否得到處理,而在于是否能進入樣本(即被解釋變量是否可觀測)隨機分組可解決選擇難題,但不適用于觀測數(shù)據(jù)。2019-07-18陳強計量及Stata應(yīng)用

(c)201495依可測變量選擇 除 外,還可觀測到其他個體特征,比如年齡、性別、培訓(xùn)前收入,記 ,也稱“協(xié)變量”(covariates)。 如果個體的選擇完全取決于可觀測的 ,稱為“依可測變量選擇”(selectiononobservables),則可進行傾向得分匹配。對于“依不可測變量選擇”(selectiononunobservables),處理更為困難。2019-07-18陳強計量及Stata應(yīng)用

(c)201496可忽略性假設(shè)RosenbaumandRubin(1983)引入“可忽略性”假設(shè):給定 ,則 獨立于 ,記 。 可忽略性也稱為“無混淆性”(unconfoundedness),“條件獨立假定”(ConditionalIndependenceAssumption,簡記CIA),或“依可測變量選擇”(selectiononobservables)。 可忽略性是個很強的假定,除非有較豐富的協(xié)變量(arichsetofcovariates)。2019-07-18陳強計量及Stata應(yīng)用

(c)201497匹配估計量的思想 假設(shè)個體i屬于處理組,找到屬于控制組的某個體j,使得個體j與個體i的可測變量取值盡可能相似(匹配),即 基于可忽略性假設(shè),則個體i與個體j進入處理組的概率相近,具有可比性;故可將 作為 的估計量,即將作為對個體i處理效應(yīng)的度量。 對控制組每位個體也進行匹配,然后對每位個體的處理效應(yīng)平均,即得到“匹配估計量”(matchingestimators)。2019-07-18陳強計量及Stata應(yīng)用

(c)201498傾向得分高維匹配不容易,希望用單一指標(biāo)進行匹配。 RosenbaumandRubin(1983)使用“傾向得分”(propensityscore)來度量 與 距離。 個體i的傾向得分為,在給定組的條件概率,即的情況下,個體i進入處理,簡記 使用傾向得分作為距離函數(shù)進行匹配,稱為“傾向得分匹配”(PropensityScoreMatching,簡記PSM)。2019-07-18陳強計量及Stata應(yīng)用

(c)201499傾向得分定理把高維數(shù)據(jù)壓縮為一維,通常會損失信息。但 傾向得分定理:如果可忽略性假定成立,則只須在給定 的情況下, 就獨立于 。2019-07-18陳強計量及Stata應(yīng)用

(c)2014100重疊假定 為了能夠進行匹配,需要在 的每個可能取值上都同時存在處理組與控制組的個體,即“重疊假定”(overlapassumption)或“匹配假定”(matchingassumption)。重疊假定:對于 的任何可能取值,都有 。 重疊假定保證處理組與控制組的傾向得分取值范圍有相同部分(commonsupport)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014101控制組處理組傾向得分共同取值范圍(Common

Support)2019-07-18陳強計量及Stata應(yīng)用

(c)20141022019-07-18陳強計量及Stata應(yīng)用

(c)2014103傾向得分匹配的步驟(1)選擇協(xié)變量 。盡量包括可能影響關(guān)變量,以滿足可忽略性假設(shè)。與 的相估計傾向得分,一般使用logit回歸。RosenbaumandRubin(1985)建議使用形式靈活的logit模型,比如包括的高次項與互動項。進行傾向得分匹配。匹配的具體方法見下頁。根據(jù)匹配后樣本(matchedsample)計算平均處理效應(yīng)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014104k近鄰匹配 “k近鄰匹配”(k-nearestneighbormatching),即尋找傾向得分最近的k個不同組個體。 如果k=1,則為“一對一匹配”(one-to-onematching)。 缺點:即使“最近鄰居”也可能相去甚遠,從而失去可比性。2019-07-18陳強計量及Stata應(yīng)用

(c)2014105卡尺匹配限制傾向得分的絕對距離。一般建議,為傾向得分的樣本標(biāo)準(zhǔn)差; 稱為“卡尺匹配”(calipermatching)或“半徑匹配”(radiusmatching)。2019-07-18陳強計量及Stata應(yīng)用

(c)2014106卡尺內(nèi)最近鄰匹配 “卡尺內(nèi)最近鄰匹配”(nearest-neighbormatchingwithincaliper),即在給定的卡尺范圍尋找最近匹配,此法較為流行。2019-07-18陳強計量及Stata應(yīng)用

(c)2014107傾向得分匹配的Stata命令sscinstallpsmatch2,replace選擇項“replace”表示以最新版命令替代可能的舊命令psmatch2Dx1x2x3,outcome(y)logittiesate commonoddspscore(varname)quietly “D”為處理變量(treatmentvariable),“x1x2x3”為協(xié)變量,“outcome(y)”來指定結(jié)果變量“y”。選擇項“l(fā)ogit”表示使用logit估計傾向得分,默認probit “ties”表示包括傾向得分相同的并列個體,默認按排序選擇其中一位個體。2019-07-18陳強計量及Stata應(yīng)用

(c)2014108傾向得分匹配的Stata命令(續(xù))“ate”表示同時匯報ATE,ATU與ATT,默認僅匯報ATT 選擇項“common”表示僅對共同取值范圍(commonsupport)內(nèi)個體進行匹配,默認對所有個體進行匹配。 選擇項“odds”表示使用幾率比(oddsratio,即)進行匹配;默認使用傾向得分p進行匹配。 選擇項“pscore(varname)”用來指定某變量作為傾向得分,默認通過“x1x2x3”來估計傾向得分。選擇項“quietly”表示不匯報對傾向得分的估計過程。2019-07-18陳強計量及Stata應(yīng)用

(c)2014109k近鄰匹配的Stata命令psmatch2Dx1x2x3,outcome(y)neighbor(k) noreplacement 選擇項“neighbor(k)”表示進行k近鄰匹配(k為正整數(shù));默認k=1,即一對一匹配。 選擇項“noreplacement”表示無放回匹配,默認為有放回;該選項只能用于一對一匹配。2019-07-18陳強計量及Stata應(yīng)用

(c)2014110卡尺匹配的Stata命令psmatch2Dx1x2x3,outcome(y)radius caliper(real)選擇項“radius”表示進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論