陳強(qiáng)合成控制法介紹_第1頁(yè)
陳強(qiáng)合成控制法介紹_第2頁(yè)
陳強(qiáng)合成控制法介紹_第3頁(yè)
陳強(qiáng)合成控制法介紹_第4頁(yè)
陳強(qiáng)合成控制法介紹_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、陳強(qiáng)教授合成控制法講解合成控制法(一)經(jīng)濟(jì)學(xué)家為何熱衷反事實(shí)經(jīng)濟(jì)學(xué)家常要評(píng)估某政策或事件的效應(yīng)。此政策可能實(shí)施于某國(guó)家或地區(qū) (省、州或城市)。最簡(jiǎn)單(天真)的方法是考察政策實(shí)施前后的時(shí)間序列,看 所關(guān)心的結(jié)果(outcome of interest)如何變化。但此結(jié)果還可能受其原有變 化趨勢(shì)的影響,或其他同時(shí)發(fā)生的混淆性事件(confounder)的作用。為此,常使用“魯賓的反事實(shí)框架” (Rubins counterfactual framework), 即假想該地區(qū)如未受政策干預(yù)將會(huì)怎樣,并與事實(shí)上受到干預(yù)的實(shí)際數(shù)據(jù)進(jìn)行對(duì) 比,二者之差即為“處理效應(yīng)” (treatment effect

2、,借用醫(yī)學(xué)術(shù)語(yǔ))。困難之 處在于,我們無(wú)法觀測(cè)到“該地區(qū)如未受政策干預(yù)將會(huì)怎樣”(反事實(shí))。選擇控制組是門(mén)藝術(shù)常用解決方法是,尋找適當(dāng)?shù)目刂平M(control group ),即在各方面 都與受干預(yù)地區(qū)相似卻未受干預(yù)的其他地區(qū),以作為處理組(treated group,即受到干預(yù)的地區(qū))的反事實(shí)替身(counterfactuals)。但通常 不易找到最理想的控制地區(qū)(control region),在各方面都接近于處理地 區(qū)(treated region)。比如,要考察僅在北京實(shí)施的某政策效果,自然會(huì)想到以上海作為控 制地區(qū);但上海畢竟與北京不完全相同?;蚩捎闷渌痪€城市(上海、廣 州、深圳)

3、構(gòu)成北京的控制組,比較上海、廣州、深圳與北京在政策實(shí)施 前后的差別,此方法也稱(chēng)“比較案例研究(comparative case studies)。 但如何選擇控制組通常存在主觀隨意性(ambiguity),而上海、廣州、深 圳與北京的相似度也不盡相同。為此,Abadie and Gardeazabal (2003)提出“合成控制法”(SyntheticControl Method)。其基本思想是,雖然無(wú)法找到北京的最佳控制地區(qū), 但通??蓪?duì)中國(guó)的若干大城市進(jìn)行適當(dāng)?shù)木€性組合,以構(gòu)造一個(gè)更為優(yōu)秀 的“合成控制地區(qū)“(synthetic control region ),并將“真實(shí)北京”與“合成

4、北京”進(jìn)行對(duì)比,故名“合成控制法”。合成控制法的一大優(yōu)勢(shì)是,可以根據(jù) 數(shù)據(jù)(data-driven)來(lái)選擇線性組合的最優(yōu)權(quán)重,避免了研究者主觀選擇 控制組的隨意性。西班牙恐怖活動(dòng)引發(fā)的計(jì)量方法Abadie and Gardeazabal (2003)的初衷是以合成控制法研究西班牙 巴斯克地區(qū)(Basque country)恐怖活動(dòng)的經(jīng)濟(jì)成本。MIT經(jīng)濟(jì)系教授Alberto Abadie (此前長(zhǎng)期任教于哈佛大學(xué)肯尼迪學(xué)院),正是來(lái)自于巴 斯克地區(qū),一個(gè)毗鄰法國(guó)的西班牙自治地區(qū)。巴斯克人長(zhǎng)期居住于巴斯克地區(qū),擁有獨(dú)特的語(yǔ)言與文化,在歷史上多次成功對(duì)抗強(qiáng)敵入侵。在1970年代初,巴斯克地區(qū)的人均

5、GDP在西班 牙17個(gè)地區(qū)中排第三。之后,由于民族獨(dú)立的訴求未獲滿(mǎn)足,從1975年開(kāi)始,巴斯克地區(qū)陷入有組織的恐怖活動(dòng)之中??植阑顒?dòng)重創(chuàng)巴斯克經(jīng)濟(jì), 至1990年代末,巴斯克地區(qū)的人均 GDP在西班牙排名降為第六。然而,70年代末至80年代初,西班牙整體經(jīng)濟(jì)也下行,故不易區(qū)分 恐怖活動(dòng)的單獨(dú)效應(yīng)。而且,巴斯克地區(qū)在恐怖活動(dòng)之前的經(jīng)濟(jì)增長(zhǎng)潛力 顯然與西班牙其他地區(qū)也不盡相同。為此,Abadie and Gardeazabal (2003)使用西班牙其他地區(qū)的線性組合來(lái)構(gòu)造合成的控制地區(qū),并使得合成控制地區(qū)的經(jīng)濟(jì)特征與60年代末恐怖活動(dòng)爆發(fā)前的巴斯克地區(qū)盡可能相似,然后把此后“合成巴斯克地區(qū)”(s

6、ynthetic Basques country )的人均 GDP演化與“真實(shí)巴斯克地區(qū)(actual Basque country )進(jìn)行對(duì)比。如何構(gòu)造合成控制具體而言,假設(shè)共有(1+J )個(gè)地區(qū),其中第1個(gè)地區(qū)為受到恐怖活動(dòng)沖擊的巴斯克地區(qū),而其余J個(gè)西班牙地區(qū)未受沖擊(在此J =16),構(gòu)成 潛在的控制組,稱(chēng)為“ donor pool ”(原意為“器官捐獻(xiàn)庫(kù)”,再次借用醫(yī)學(xué)術(shù) 語(yǔ))。一個(gè)潛在假定是,恐怖活動(dòng)僅影響巴斯克地區(qū),而未波及西班牙的 其他地區(qū)(事實(shí)上恐怖活動(dòng)也主要集中于巴斯克地區(qū))。將合成控制地區(qū)的權(quán)重記為以下J維列向量:其中,w2表示第2個(gè)地區(qū)在合成巴斯克地區(qū)所占的權(quán)重,以此類(lèi)

7、推;所有權(quán)重皆非負(fù),且權(quán)重之和為1。w的不同取值即構(gòu)成不同的合成控制地區(qū),簡(jiǎn)稱(chēng)“合成控制(synthetic control)。在此研究中,被解釋變量為人均GDP,記為y。影響y的解釋變量或 預(yù)測(cè)變量(predictors)包括投資率、人口密度、產(chǎn)業(yè)結(jié)構(gòu)、人力資本等, 詳見(jiàn)下表。Tarj r Pre-Tfrrdrism Characteristics, 1960sBasque Coumr Spain Synthetic Basque Countrv Real per capita GDP15.285.463,633.255,27680Invescnieni ratio(percentagejh

8、24.652L792I.5SPopulation densiLy246.8966.34兇6,竟Sect ora shares f percentageAgricullun?,砧化浦ry and fishing6,8416.346.18Energy diid wdtci4,114.322.76Industry45.0826.6037.64ConstrueLion and engineering6.157.256.96Marketable $erices33.7541.10NonrrLiirketable services4.076.97?37Hum ar capital (percemage/l

9、li terie33211.667.65Pnmary or without studies8597&。582.33High school7.465.49More than high school3.262.703.10Sources: Authors computations from Matilde Mas ct uL (I99S and Funducidn BBV fl 999). a 19S6 USD, average for I960-196 比h Gross Total inumenUGDK average for 1964-E%9.PersDns per square kiloni

10、eter, i 969.d Percentages over loial pmduciion, 1961-1Q69.c Pcrccnlagcs over working-Eigc population. 1964-1969.在巴斯克地區(qū)爆發(fā)恐怖活動(dòng)之前,記其各預(yù)測(cè)變量的平均值為向 量x1( K x 1維列向量,下標(biāo)1表示“treated region ”),即上表第(1) 列的數(shù)值(除了人均GDP )。將西班牙其他地區(qū)相應(yīng)預(yù)測(cè)變量的平均值記為矩陣X0 (K x J維矩陣,下標(biāo)0表示“ control region ”),其中第j列為第j個(gè)地區(qū)的相應(yīng)取值。顯然,我們希望選擇權(quán)重 w,使得X0w盡

11、可能地接近于x1,即經(jīng)過(guò) 加權(quán)之后,合成控制地區(qū)的經(jīng)濟(jì)特征應(yīng)盡量接近處理地區(qū)。為度量此距離,可使用二次型(類(lèi)似于歐幾里得空間中兩點(diǎn)之間的距離)。由于x1中的每個(gè)預(yù)測(cè)變量對(duì)于y的預(yù)測(cè)能力有大小之別,應(yīng)在距離函數(shù)中享有不同的 權(quán)重,故考慮以下有約束的最小化問(wèn)題:min (Xj-Xow)fV(x, -Xow) wJ+l0, J = 2,./ + 1; 工3產(chǎn)17=2,其中,V為(K x K )維對(duì)角矩陣,其對(duì)角線元素均為非負(fù)權(quán)重,反映相應(yīng)的預(yù)測(cè)變量對(duì)于人均GDP的相對(duì)重要性。此最小化問(wèn)題的目標(biāo)函數(shù)是二 次函數(shù),為“二次規(guī)劃(quadratic programming )問(wèn)題,一般進(jìn)行數(shù)值 求解。記此

12、約束最小化問(wèn)題的最優(yōu)解為 w*(V);顯然,它依賴(lài)于對(duì)角矩陣V。進(jìn)一步,選擇最優(yōu)的V,使得在恐怖活動(dòng)全面爆發(fā)之前,合成巴斯克 地區(qū)的人均GDP與真實(shí)巴斯克地區(qū)盡量接近。具體而言,記z 1為(10 x 1) 維列向量,包含巴斯克地區(qū)在1960-1969年間的人均GDP ;記Z0為(10 x J )維矩陣,其中每列為相應(yīng)控制地區(qū)在 1960-1969年間的人均GDP。用Z0w*(V)來(lái)預(yù)測(cè)z1 ,然后選擇V ,以最小化“均方預(yù)測(cè)誤差”(Mean Squared Prediction Error,簡(jiǎn)記MSPE ),即將每期的預(yù)測(cè)誤差平方后再求各期的平均:求解此最小化問(wèn)題,可得構(gòu)成合成巴斯克地區(qū)的最優(yōu)

13、權(quán)重,w* =w*(V*)。經(jīng)過(guò)計(jì)算,Abadie and Gardeazabal (2003)發(fā)現(xiàn),只有兩個(gè)地區(qū)的權(quán)重為正,即加泰羅尼亞(Catalonia權(quán)重0.8508 )與馬德里(Madrid ,權(quán)重0.1492 ),而其他地區(qū)的權(quán)重均為0。直觀上,Catalonia與Madrid 的經(jīng)濟(jì)特征也與巴斯克地區(qū)最為相似。合成控制法的“效果圖”得到合成巴斯克地區(qū)的權(quán)重之后,即可計(jì)算其人均 GDP在樣本期間的 演化過(guò)程。記巴斯克地區(qū)在樣本期間(假設(shè)為T(mén)期)的人均GDP為向量y1 (T x 1維列向量)。記其他地區(qū)在樣本期間的人均GDP為矩陣Y0 (T x J維矩陣),其中每列為相應(yīng)地區(qū)的人均G

14、DP。由此可得合成巴斯克 地區(qū)的人均GDP序列y 1 * = Y0w*。最直觀的方法是將y1與合成控制 的y 1*畫(huà)時(shí)間趨勢(shì)圖,參見(jiàn)下圖。Actual terrorism二Synthetic without teirorism1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 yearFigure L Per capita GDP for the Basque Country從上圖可知,在1975年大規(guī)??植阑顒?dòng)爆發(fā)之前,真實(shí)巴斯克(實(shí)線)與合成巴斯克(虛線)的人均 GDP十分接近。二者在1975年后即開(kāi)始分 岔;而在1980與1990年代,真實(shí)

15、巴斯克的人均GDP比合成巴斯克低約10%。換言之,巴斯克恐怖活動(dòng)的經(jīng)濟(jì)成本是損失了約10%的人均GDP。上述“合成控制估計(jì)量(Synthetic Control Estimator)的性質(zhì)怎樣? 如何進(jìn)行統(tǒng)計(jì)推斷?怎樣在Stata中實(shí)現(xiàn)?合成控制法有何優(yōu)缺點(diǎn)?敬請(qǐng) 期待本介紹的續(xù)篇合成控制法(二)。參考文獻(xiàn)Abadie, Alberto and Javier Gardeazabal, The Economic Costs of Conflict: A Case Study of the Basque Country, American Economic Review, 2003, 93(1),

16、 113-132.合成控制法(二)Abadie, Diamond, and Hainmueller (2010)首次證明了合成控制法 的基本性質(zhì),并將其應(yīng)用于研究美國(guó)加州1988年第99號(hào)控?zé)煼?(Proposition 99)的效果。反事實(shí)的分析框架假設(shè)共有(1+J )個(gè)地區(qū),其中第1個(gè)地區(qū)受到政策干預(yù)(如有多個(gè)地 區(qū)受到干預(yù),可合并為一個(gè)大地區(qū);或分別進(jìn)行估計(jì)),而其余J個(gè)地區(qū)未受沖擊(構(gòu)成donor pool )。記yit為地區(qū)i在第t期實(shí)際觀測(cè)到的結(jié)果變量,其中i = 1,J + 1,而 t = 1,,T。記yitN為地區(qū)i在第t期如果未受政策干預(yù)的結(jié)果變量(上標(biāo) N表示 未受干預(yù))。

17、記T0為政策干預(yù)開(kāi)始之前(preintervention )的時(shí)期數(shù),且 1 w T0 T0時(shí)的處理效應(yīng):% 三一墟二%熄(f = 痣+L-:T)在上式中,只要估計(jì)y1tN即可。引入因子模型假設(shè)yitN由以下“因子模型(factor model )所決定:J -V-1 (4)其中,上式右邊第(1)項(xiàng)6 t為時(shí)間固定效應(yīng)(time fixed effects) o第(2)項(xiàng)的zi為可觀測(cè)的向量(不受政策干預(yù)影響,也不隨時(shí)間而變; 比如,干預(yù)之前的預(yù)測(cè)變量之平均值)。zi對(duì)于yitN的作用隨時(shí)間而變, 故zi的系數(shù)et (未知參數(shù))帶時(shí)間下標(biāo)t。第項(xiàng)為不可觀測(cè)的“互動(dòng)固定效應(yīng)(Interactiv

18、e Fixed Effects ), 即個(gè)體固定效應(yīng) ui與時(shí)間固定效應(yīng) 入的乘積(Bai, 2009 )。第(4)項(xiàng) it為隨機(jī)擾動(dòng)項(xiàng)。根據(jù)“因子分析(factor analysis )的術(shù)語(yǔ),稱(chēng)第項(xiàng)中不可觀測(cè)的人 t為“共同因子” (common factors ),可理解為不同地區(qū)所面臨的共同 沖擊(common shocks ),比如它有兩個(gè)分量,分別表示技術(shù)沖擊(technological shocks )與金融危機(jī)(financial crises );而各地區(qū)對(duì)于 共同沖擊入的反應(yīng)并不相同,以u(píng)i來(lái)表示,稱(chēng)為“因子載荷”(factor loading )。如果A是一維且為常數(shù),則

19、上式簡(jiǎn)化為“雙向固定效應(yīng)模型(two-wayfixed effects model ),包含個(gè)體固定效應(yīng)ui與時(shí)間固定效應(yīng)5t。由此 可知,上式是雙向固定效應(yīng)模型的推廣,它允許不同個(gè)體對(duì)于共同沖擊的 異質(zhì)性反應(yīng)(heterogeneous impacts )。合成控制的誤差記構(gòu)造合成控制的權(quán)重向量為:W三(叫Wj+j其中,W2表示第2個(gè)地區(qū)在合成控制所占的權(quán)重,以此類(lèi)推;所有權(quán) 重皆為非負(fù),且權(quán)重之和為1。對(duì)于任意給定的w,可將合成控制地區(qū)的 結(jié)果變量寫(xiě)為: TOC o 1-5 h z J+lJ+1J=2j=2十1+紇Z嗎,+ 2嗎尸 2J=2將y1tN減去上式可得:顯然,如果能找到w,使得上

20、式右邊的式與(2)式均為0,則上式的期望為0,故合成控制為y1tN的無(wú)偏估計(jì)。但(2)式中的ui不可觀測(cè),故不可行。Abadie et al. (2010)證明,如果能找到 w使得則也會(huì)有J4-1(一 Z1片2即根據(jù)可觀測(cè)的經(jīng)濟(jì)特征與干預(yù)前結(jié)果變量所選擇的合成控制w,也會(huì)使得合成控制的不可觀測(cè)特征接近于處理地區(qū)。反之,如果無(wú)法找到w,使得合成控制能很好地復(fù)制(reproduce)處理地區(qū)的經(jīng)濟(jì)特征以及干預(yù)之 前的結(jié)果變量,則不建議使用合成控制法。合成控制法的基本性質(zhì)如果合成控制w*能很好地復(fù)制處理地區(qū)的經(jīng)濟(jì)特征與干預(yù)前的結(jié)果 變量(關(guān)于如何計(jì)算W*,參見(jiàn)首篇合成控制法(一),則可定義如 下合成

21、控制估計(jì)量(Synthetic Control Estimator ):J+l.三%f 一 Z w = 7; + L ,T) 尸2Abadie et al. (2010)證明,在一定的正則條件下,如果合成控制 w*能 完全地復(fù)制(perfectly reproduce)處理地區(qū)的經(jīng)濟(jì)特征與干預(yù)前的結(jié)果 變量,則當(dāng)干預(yù)前期數(shù)t0趨向無(wú)窮大時(shí),合成控制估計(jì)量是漸近無(wú)偏 (asymptotically unbiased )。反之,如果合成控制w*只是不完全地復(fù)制(imperfectly reproduce) 處理地區(qū)的經(jīng)濟(jì)特征與干預(yù)前的結(jié)果變量(更為常見(jiàn)的情形),則合成控 制估計(jì)量將是漸近有偏的。此

22、偏差被稱(chēng)為“內(nèi)插偏差”(interpolation bias), 因?yàn)槭褂脙?nèi)插法構(gòu)造的合成控制并不是處理地區(qū)的完美的反事實(shí)替身。因 此,在使用合成控制法時(shí),一個(gè)重要的模型設(shè)定檢驗(yàn)就是,考察合成控制 的經(jīng)濟(jì)特征與干預(yù)前的結(jié)果變量是否與處理地區(qū)足夠接近。合成控制法的Stata命令A(yù)badie et al. (2010)還提供了合成控制法的Stata程序synth,使得 估計(jì)十分方便。打開(kāi)Stata后,可輸入以下命令:.ssc install synth, replace(下載并安裝synth程序)其中,選擇項(xiàng)“replace ”表示如有此命令更新版本,可以新命令覆蓋 舊命令。命令synth的基本句

23、型為:synth y x1 x2 x3 , trunit(#) trperiod(#) counit(numlist) xperiod(numlist) mspeperi od() figure resultsperiod() nested allopt keep(filename)其中,“ y”為結(jié)果變量(outcome variable),“x1 x2 x3 ”為預(yù)測(cè)變 量(predictors)。必選項(xiàng)“trunit(#) ”用于指定處理地區(qū)(trunit表示treated unit)。必選項(xiàng)“trperiod的”用于指定政策干預(yù)開(kāi)始的時(shí)期(trperiod表示 treated peri

24、od)。選擇項(xiàng)“counit(numlist) ”用于指定潛在的控制地區(qū)(即donor pool, 其中counit表示control units),默認(rèn)為數(shù)據(jù)集中的除處理地區(qū)以外的 所有地區(qū)。選擇項(xiàng)“xperiod(numlist) ”用于指定將預(yù)測(cè)變量(predictors)進(jìn)行 平均的期間,默認(rèn)為政策干預(yù)開(kāi)始之前的所有時(shí)期(the entire pre-intervention period )。選擇項(xiàng)mspeperiod() ”用于指定最小化均方預(yù)測(cè)誤差(MSPE )的時(shí)期,默認(rèn)為政策干預(yù)開(kāi)始之前的所有時(shí)期。選擇項(xiàng)“figure ”表示將處理地區(qū)與合成控制的結(jié)果變量畫(huà)時(shí)間趨勢(shì) 圖,而選

25、擇項(xiàng)“resultsperiod() ”用于指定此圖的時(shí)間范圍(默認(rèn)為整個(gè)樣 本期間)。選擇項(xiàng)nested”表示使用嵌套的數(shù)值方法尋找最優(yōu)的合成控制(推 薦使用此選項(xiàng)),這比默認(rèn)方法更費(fèi)時(shí)間,但可能更精確。在使用選擇項(xiàng) nested”時(shí),如果再加上選擇項(xiàng) “allopt(即nested allopt”),則比 單獨(dú)使用“nested ”還要費(fèi)時(shí)間,但精確度可能更高。選擇項(xiàng)“keep(filename) ”將估計(jì)結(jié)果(比如,合成控制的權(quán)重、結(jié)果 變量)存為另一 Stata數(shù)據(jù)集(filename.dta),以便進(jìn)行后續(xù)計(jì)算。更多 選擇項(xiàng),詳見(jiàn)help synth。加州控?zé)煼ㄓ行??Abadie

26、et al. (2010)隨之將合成控制法應(yīng)用于研究美國(guó)加州 1988年 第99號(hào)控?zé)煼?Proposition 99第勺效果。1988年11月美國(guó)加州通過(guò)了 當(dāng)代美國(guó)最大規(guī)模的控?zé)煼?anti-tobacco legislation),并于1989年1 月開(kāi)始生效。該法將加州的香煙消費(fèi)稅(cigarette excise tax)提高了每包25美分,將所得收入專(zhuān)項(xiàng)用于控?zé)煹慕逃c媒體宣傳,并引發(fā)了一系列關(guān)于室內(nèi)清 潔空氣的地方立法(local clean indoor-air ordinances ),比如在餐館、封閉工作場(chǎng)所等禁煙。面板數(shù)據(jù)集Abadie et al. (2010)使用的數(shù)

27、據(jù)為美國(guó)1970-2000年的州際面板數(shù) 據(jù)。由于 Massachusetts, Arizona, Oregon 與 Florida 的州政府在 1989-2000期間也引入了正式的控?zé)熈⒎?,無(wú)法作為控制地區(qū),故將此四 州從donor pool中去掉。另外,還去掉了在1989-2000期間將香煙消費(fèi)稅提高了每包50美分 及以上的州(Alaska, Hawaii, Maryland, Michigan, New Jersey, New York, Washington),以及首都所在地華盛頓特區(qū)。最后剩下 38個(gè)州作 為潛在的控制地區(qū)(即使加上去掉的州,結(jié)果也依然穩(wěn)?。W兞拷榻B該研究的結(jié)果變量

28、為cigsale (人均香煙消費(fèi)量,包/年),預(yù)測(cè)變量 包括retprice(平均香煙零售價(jià)格)、lnincom(人均收入對(duì)數(shù))、age15to24 (15-24歲人口所占總?cè)丝诒戎?,年輕人為吸煙主力)、beer (人均啤酒消費(fèi)量,煙酒不分家)。這些預(yù)測(cè)變量均為1980-1988年的州平均值,另 外還使用1975、1980與1988年的人均香煙消費(fèi)量作為三個(gè)額外的預(yù)測(cè) 變量。另外,面板變量為state (州),而時(shí)間變量為year (年)。Stata操作Stata程序synth自帶了加州控?zé)煼ǖ臄?shù)據(jù)集 smoking.dta。安裝命 令synth后,輸入以下命令即可打開(kāi)此數(shù)據(jù)集,設(shè)為面板數(shù)據(jù),

29、然后進(jìn)行 合成控制法的估計(jì):.sysuse smoking.xtset state year(打開(kāi)數(shù)據(jù)集)(設(shè)為面板數(shù)據(jù)).synth cigsale retprice Inincome age15to24 beer cigsale(1975) cigsale(1980) cigsale(1988), trunit(3) trperiod(1989) xperiod(1980(1)1988) figure nested keep(smoking_synth)其中,“cigsale(1975) cigsale(1980) cigsale(1988) ” 分別表示人均香 煙消費(fèi)在1975、1980

30、與1988年的取值。必選項(xiàng)“trunit(3) ”表示第3個(gè)州(即加州)為處理 地區(qū);必選項(xiàng) “trperiod(1989) ”表示控?zé)煼ㄔ?989年開(kāi)始實(shí)施。選擇項(xiàng)“xperiod(1980(1)1988) ”表示將預(yù)測(cè)變量在1980-1988年期 間進(jìn)行平均,其中“ 1980(1)1988 ”表示始于1980年,以1年為間隔,而 止于 1988 年;其效果等價(jià)于 “ 1980 1981 1982 1983 1984 1985 1986 1987 1988 ”,而前者的寫(xiě)法顯然更為簡(jiǎn)潔。選擇項(xiàng)“keep(smoking_synth) ”將估計(jì)結(jié)果存為Stata數(shù)據(jù)集 smoking_synt

31、h.dta (放在Stata的當(dāng)前工作路徑)。估計(jì)結(jié)果如下。Unit Weights:Co_NoUnit_Wei ghtAlabama0Arkansas0Colorado.161Conrieeti cut. 068Delaware0Georgia0Idaho0Illinois通Indi ana0I owaKansas0Kentucky0Louisi ana0Maine0Minnesota0Mississippi0Missouri通:Montana,201Nebraska0Nevada.235New Hampshire0New MexicosNorth Carolina0Wotth Dakota

32、0Ohio0Oklahoma0Pennylva niaRhode Island0South Carolina0South Dakota0Tennessee0Texas0Utah. 335Ve rmont鬻Virginia0Vest Virginia濯Wisconsin曝Wyoming0上表顯示,大多數(shù)州的權(quán)重為0,而只有以下五個(gè)州的權(quán)重為正,即Colorado (0.161) , Connecticut (0.068) , Montana (0.201) , Nevada(0.235)與Utah (0.335),此結(jié)果與Abadie et al. (2010)匯報(bào)的結(jié)果非常接近(細(xì)微差別或由于

33、計(jì)算誤差)??疾旒又菖c合成加州的預(yù)測(cè)變量是否接近:T re-dic tor Palance !T atSyrit h-e ti cre tp rice Iningmu gg電15to24 beer cigsal.e (1575) dg施(196 0) eigsale C19SSj65.4222239-474610.076569.85B6g4.1735324,1T3S4442A.2824.21326127.1127.0633120,2120H&4590.191.6356從上表可知,加州與合成加州的預(yù)測(cè)變量均十分接近,故合成加州可以很好地復(fù)制加州的經(jīng)濟(jì)特征。然后比較二者的人均香煙消費(fèi)量在1989年

34、前后的表現(xiàn):10601990year2000California synthetic Cafifbrnia從上圖可知,在1989年控?zé)煼ㄖ?,合成加州的人均香煙消費(fèi)與真實(shí) 加州幾乎如影相隨,表明合成加州可以很好地作為加州如未控?zé)煹姆词聦?shí) 替身。在控?zé)煼▽?shí)施之后,加州與合成加州的人均香煙消費(fèi)量即開(kāi)始分岔, 而且此效應(yīng)越來(lái)越大。更直觀地,可打開(kāi)另一 Stata程序,調(diào)用已存的數(shù)據(jù)集 smoking_synth.dta,計(jì)算加州與合成加州人均香煙消費(fèi)之差(即處理效應(yīng)), 然后畫(huà)圖。.use smoking_synth.dta, clear(如不打開(kāi)另一 Stata程序,則此數(shù)據(jù)集將覆蓋原有的數(shù)據(jù)集

35、smoking.dta).gen effect= _Y_treated - _Y_synthetic(定義處理效應(yīng)為變量 effect其中_Y_treated ”與“_Y_synthetic ” 分別表示處理地區(qū)與合成控制的結(jié)果變量).label variable _time year.label variable effect gap in per-capita cigarette sales (in packs)(為了畫(huà)圖更漂亮,加上時(shí)間變量與處理效應(yīng)的標(biāo)簽,可使用變量管理器(variable manager)來(lái)方便地加標(biāo)簽).line effect _time, xline(1989,l

36、p(dash) yline(0,lp(dash)(畫(huà)處理效應(yīng)的時(shí)間趨勢(shì)圖,并在橫軸1989年處與縱軸0處分別畫(huà)虛上圖顯示,加州控?zé)煼▽?duì)于人均香煙消費(fèi)量有很大的負(fù)效應(yīng),而且此效應(yīng)隨著時(shí)間推移而變大。具體來(lái)說(shuō),在1989-2000年期間,加州的人均年香煙消費(fèi)減少了 20多包,大約下降了 25%之多,故其經(jīng)濟(jì)效應(yīng)十分顯著 (economically significant )。在使用合成控制法時(shí),如何進(jìn)行穩(wěn)健性檢驗(yàn)與統(tǒng)計(jì)推斷?合成控制法 與回歸法相比有何優(yōu)缺點(diǎn)?使用合成控制法有何注意事項(xiàng)?敬請(qǐng)期待本介 紹的完結(jié)篇合成控制法(三)。參考文獻(xiàn)Abadie, Alberto and Javier Gard

37、eazabal, The Economic Costs of Conflict: A Case Study of the Basque Country, American Economic Review, 2003, 93(1), 113-132.Abadie, Alberto, Alexis Diamond, and Jens Hainmueller, Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California s Tobacco Control Program, Jo

38、urnal of the American Statistical Association, 2010, 105(490), 493-505.(點(diǎn)擊底部“閱讀原文”,可下載)Bai, Jushan, Panel Data Models with Interactive Fixed Effects, Econometrica, 2009, 77(4), 1229-1279.合成控制法(三)合成控制法的穩(wěn)健性檢驗(yàn)為了檢驗(yàn)上述合成控制估計(jì)結(jié)果的穩(wěn)健性(參見(jiàn)合成控制法(二), Abadie et al. (2010)加入了更多的預(yù)測(cè)變量,比如失業(yè)率、收入不平等、 貧困率、福利轉(zhuǎn)移、犯罪率、毒品相關(guān)的逮

39、捕率、香煙稅、人口密度等; 發(fā)現(xiàn)結(jié)果依然穩(wěn)健。另外一個(gè)擔(dān)心是,地區(qū)之間無(wú)互相影響(no interference betweenunits)的假定可能不滿(mǎn)足,比如加州的反煙運(yùn)動(dòng)可能波及其他州,煙草行 業(yè)或?qū)⑵渌莸南銦煆V告預(yù)算投入到加州,甚至從其他州走私便宜香煙到 加州。Abadie et al. (2010)根據(jù)史實(shí)對(duì)此進(jìn)行了探討,認(rèn)為這些效應(yīng)均不大,至少不可能導(dǎo)致上文圖中如此大的處理效應(yīng)。安慰劑檢上述結(jié)果為對(duì)控?zé)煼ㄌ幚硇?yīng)的點(diǎn)估計(jì)。此點(diǎn)估計(jì)是否在統(tǒng)計(jì)上顯著(statistically significant )? Abadie et al. (2010)認(rèn)為,在比較案例研究 中,由于潛在的控制地區(qū)數(shù)目通常并不多,故不適合使用大樣本理論進(jìn)行 統(tǒng)計(jì)推斷。為此,Abadie et al. (2010)提出使用“安慰劑檢驗(yàn)”(placebo test) 來(lái)進(jìn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論