斷點回歸設(shè)計(RDD)_第1頁
斷點回歸設(shè)計(RDD)_第2頁
斷點回歸設(shè)計(RDD)_第3頁
斷點回歸設(shè)計(RDD)_第4頁
斷點回歸設(shè)計(RDD)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、讓“跳躍”更有意義:斷點回歸設(shè)計(RDD)原創(chuàng) 2016-09-24 張立龍 定量群學(xué)在一個高度依賴規(guī)則的世界里,有些規(guī)則的出現(xiàn)十分隨意,這種隨意性為我們提供了性質(zhì)良好的實驗(Angrist& Pischke,2009)。斷點回歸設(shè)計(RegressionDiscontinuity Design)是一種僅次于隨機實驗的能夠有效利用現(xiàn)實約束條件分析變量之間因果關(guān)系的實證方法。Lee(2008)認為在隨機實驗不可得的情況下,斷點回歸能夠避免參數(shù)估計的內(nèi)生性問題,從而真實反映出變量之間的因果關(guān)系。斷點回歸方法首先是由美國西北大學(xué)心理學(xué)家Campbell于1958

2、年提出的;并與1960年,與 Thistlethwaite正式發(fā)表了第一篇關(guān)于斷點回歸的論文,提出斷點回歸是在非實驗的情況下處理處置效應(yīng)(Treatment Effects)的一種有效的方法,主要應(yīng)用于心理學(xué)和教育學(xué)領(lǐng)域。1963年,Campbell and Stanley為斷點回歸提供了更加清晰化的概念,但由于當時還缺乏嚴密的統(tǒng)計證明,加之IV 方法在處理內(nèi)生性的思路和范式上具有更廣闊的適用范圍,因此在隨后的幾十年間,RD 方法一直沒有得到經(jīng)濟學(xué)者的重視。直到上世紀90 年代末,隨著該方法的理論基礎(chǔ)得到進一步發(fā)展,大量經(jīng)濟學(xué)文獻才開始使用RD 方法對變量之間的因果關(guān)系進行識別。斷點回歸可以分

3、為兩類,一類是模糊斷點回歸(Fuzzy RD),另一類是清晰斷點回歸(Sharp RD)。清晰斷點回歸可以看作是一種基于可觀察變量進行的選擇(selection-on-observablesstory),而模糊斷點回歸則常被視為一種工具變量的方法(instrumental-variables-type)。清晰斷點回歸(Sharp RD)當處理狀態(tài)是協(xié)變量確定型、不連續(xù)函數(shù)時,可以使用清晰間斷點回歸法。對于清晰斷點回歸,個體在臨界值的一邊接受處理效應(yīng)(treatment effect)的概率為0,而在臨界值另一邊的概率則為1。最早使用清晰斷點回歸方法的典型例子是:獲得國家杰出獎學(xué)金的學(xué)生是不是會

4、更愿意讀研究生(Thistlewaithe and Campbell,1960; Campbell, 1969)。清晰斷點回歸通過比較PSAT分數(shù)剛好高于或低于國家杰出獎學(xué)金分數(shù)線的那些高中生的研究生入學(xué)率來回答這一問題。一般情況下,在PAST考試中得分越高的學(xué)生,其將來讀研究生的概率也就越大。通過回歸來擬合研究生院入學(xué)率和PSAT之間的關(guān)系,可以控制這一趨勢,將分數(shù)線附近PSAT成績和大學(xué)入學(xué)率之間的關(guān)系中出現(xiàn)的跳躍視為存在處理效應(yīng)的證據(jù)。Imben and Limieux(2008)認為斷點回歸的有效性依賴于我們對協(xié)變量的外推,或者至少在協(xié)變量有不連續(xù)的那個領(lǐng)域內(nèi)外推,因此,條件期望函數(shù)的

5、具體形式的設(shè)定很重要。給予具體函數(shù)形式得到的斷點回歸估計值的有效性依賴于多項式模型能否精確的描述條件期望函數(shù)。如果不能,那么看上去由于個體被處理而發(fā)生的跳躍可能只不過是條件期望函數(shù)的某個點的不連續(xù),在設(shè)定期望函數(shù)之前我們并沒有預(yù)計到這種不連續(xù)。為了使得這種錯誤降低到最低,斷點回歸在實際操作中只去考察在不連續(xù)點的領(lǐng)域中的數(shù)據(jù),也就是考察區(qū)間x0-,x0+,其中為某個很小的正數(shù)。換言之,在x0左側(cè)和右側(cè)一個足夠小領(lǐng)域內(nèi)比較Y1i和Y0i的平均值之間的差別,就可估計出處理效應(yīng),而這種方法與條件期望函數(shù)的具體的形式無關(guān)。斷點回歸估計方法可以分為參數(shù)估計和非參數(shù)方法的估計。大部分利用斷點回歸進行的經(jīng)驗研

6、究中,仍然是參數(shù)型估計。參數(shù)估計方法內(nèi)涵一個思想是:賦予靠近臨界值的數(shù)據(jù)點更大的權(quán)重。隨著不連續(xù)樣本窗口的縮小,斷點回歸估計值會變得不精確,但是用來模型化函數(shù)f(xi)的多項式的階數(shù)也會下降。當以X0為中心不斷調(diào)整樣本窗口大小時,控制變量會逐漸變少,但Di的處理效應(yīng)會保持穩(wěn)定。非參數(shù)方法的應(yīng)用越來越廣泛。使用非參數(shù)方法對斷點回歸進行估計時,需要分別對x0左側(cè)和右側(cè)領(lǐng)域中的Yi的平均值做出精確估計,但這至少會遇到兩個問題:如果在臨界值很小的領(lǐng)域中進行估計,那么可用的數(shù)據(jù)就相對較少;在有界領(lǐng)域中對條件期望函數(shù)的估計是有偏的。針對這一問題,Hahn, Todd and van der Klaauw

7、在2001年提出了使用非參數(shù)的局部線性回歸,感興趣的讀者可以進一步閱讀。清晰斷點回歸的一個經(jīng)典例子是關(guān)于執(zhí)政黨地位對其再次當選的研究。在美國的議會政治中,執(zhí)政黨被再次高概率當選已經(jīng)成為美國議會政治中最為引人注目的事實。Lee在其<Randomized Experiments from Non-randomSelection in U.S. House Elections>一文中試圖回答的問題是:如果民主黨在上次競選中獲勝,那么是否會在本次競選中獲得優(yōu)勢。這項研究可能遇到的問題是:議會會員是否會利用他們的官方身份所帶來的權(quán)利和資源為他們自己的黨派謀取利益。也就說,執(zhí)政黨的成功并不必然

8、是反映真正的選舉優(yōu)勢,而是在滿足投票者或者換取選票方面更高明。為了尋求執(zhí)政黨地位所帶來的因果效應(yīng),Lee將民主黨候選人獲勝看作是由Di=1(xi>=0)決定,xi是選舉勝利者在邊際上的得票份額(民主黨和共和黨的得票之差)。Di是xi的確定性函數(shù),在xi之外并無其他變量干擾。Lee通過將民主黨獲勝的概率(Y軸)和在上一次選舉中民主黨與共和黨得票份額之差(X軸)在坐標抽中繪出,發(fā)現(xiàn)民主黨在0點處獲勝的概率大幅提高,民主黨得多數(shù)票,由于這一點跳躍,執(zhí)政黨大約可以將再次當選的概率提高40%。Lee的分析認為以往選舉中的獲勝率應(yīng)該與上次選舉中的獲勝的斷點沒有關(guān)系,這一檢驗符合了Sharp RD 識

9、別策略的假設(shè)。在給定的處理狀態(tài)下,協(xié)變量應(yīng)該是像在隨機實驗中一樣被處理平衡。然而需要解決的一個問題是,在選舉中存在私利的人可能會控制操縱處在臨界值附近的xi,從而使得臨界值兩邊的狀況不可比,但Lee通過計算接近x0處的xi的比例來考察不連續(xù)點附近的xi的分布密度發(fā)現(xiàn),這種情況不太可能出現(xiàn)。作者通過清晰斷點回歸設(shè)計,創(chuàng)造出“近似實驗(near-experimental)”方法,驗證了執(zhí)政黨的選舉優(yōu)勢。模糊斷點回歸(Fuzzy RD)作為一種工具變量法的模糊斷點回歸是在給定某個協(xié)變量的情況下,處理狀態(tài)的概率和期望值所發(fā)生的不連續(xù)變化。與清晰斷點回歸不同的是,處理狀態(tài)不再是變量Xi的確定函數(shù),而是一

10、種概率函數(shù)。由于個體被處理的概率會有一個跳躍,不連續(xù)性成了針對處理狀態(tài)的工具變量,不再和處理狀態(tài)有確定性的聯(lián)系。模糊斷點回歸設(shè)計提供了一個簡單的工具變量估計策略。模糊斷點回歸方法的第一個例子是關(guān)于助學(xué)金是否是高校爭奪優(yōu)質(zhì)生源的有效工具的研究。Van der Klaauw(2002)的<Estimatingthe Effect of Financial Aid Offers on College Enrollment: ARegression-Discontinuity Approach>,文中關(guān)注的是助學(xué)金是否是高校爭奪優(yōu)質(zhì)生源的有效工具?Van der Klaauw使用了Fuzz

11、 RD 設(shè)計估計了大學(xué)生資助學(xué)金對大學(xué)入學(xué)率的影響。學(xué)生的入學(xué)決策受到很多因素的影響,其中一些因素是學(xué)校管理者無法觀測的。正是由于遺漏變量的存在,當我們評估助學(xué)金對入學(xué)率的影響時,助學(xué)金常常很難被看作是外生變量。為了尋求能夠解決內(nèi)生性問題的辦法,作者對決策的規(guī)則進行了深入的分析。學(xué)校給予學(xué)生的資助金額受到很多客觀和主觀評價的影響,因此很難用一個簡單的公式進行描述。盡管有一些評價因素在學(xué)校的數(shù)據(jù)庫中能夠找到,如學(xué)生的學(xué)術(shù)能力,民族、父母的收入等。但其他的一些信息如學(xué)生的學(xué)習(xí)目的、已修課程、筆記是否工整、推薦信等在數(shù)據(jù)庫中則不能找到。然而,在很多學(xué)校,助學(xué)金的評判過程都是客觀和公平的。例如,學(xué)校x

12、通過SAT和GPA的成績構(gòu)建一個綜合指數(shù)S,通過這個構(gòu)建的指數(shù)將學(xué)生分為不同的等級。依據(jù)這一指數(shù),將學(xué)生分為四個不同等級。三個切點分別為S1、S2、S3,S3其中最高的一個等級。不同等級的學(xué)生可以得到不同等級的助學(xué)金。盡管助學(xué)金的評定并不僅僅看S的等級,這使得不同的等級內(nèi)部的助學(xué)金也會存在差異。在給定學(xué)生的指數(shù)是決定其能否得到助學(xué)金主要變量后,因此,學(xué)生得到的助學(xué)金是學(xué)生成績的函數(shù),并會在切點處出現(xiàn)跳躍。那些比切點處的綜合指數(shù)大的得到助學(xué)金較大,而比切點處的綜合指數(shù)小的得到助學(xué)金較小。由于學(xué)生得到助學(xué)金的多少是學(xué)生綜合指數(shù)S的函數(shù)且存在間斷點,這其實符合了模糊斷點方法的設(shè)定原則。因此,作者利用

13、模糊RD的方法,通過分析助學(xué)金在學(xué)生綜合指數(shù)的切點處的變化,得出助學(xué)金是高校爭奪優(yōu)質(zhì)生源的有效工具的結(jié)論。另外一篇相對更早的使用模糊斷點回歸設(shè)計進行因果效應(yīng)估計是Angrist & Lavy 在<Using Maimondides Rule to Estimate theEffect of Class Size on Scholastic Achievement>一文中完成的班級規(guī)模對學(xué)生成績影響的準實驗分析。在以色列,學(xué)校的班級規(guī)模方面,存在一個“邁蒙尼德”法則,認為班級規(guī)模不能超過40人。如果一個年級的學(xué)生不足40人,那么這些學(xué)生將被編入一個班級。而如果超過40人,如4

14、1人,那么這些學(xué)生將會被分為兩個班,81名學(xué)生時將會被分為3個班。Angrist & Lavy 對所選的兩個年級的學(xué)生的實際班級規(guī)模和用邁蒙尼德法則計算班級規(guī)模進行對比發(fā)現(xiàn),邁蒙尼德法則并沒有很好的預(yù)測班級規(guī)模,大部分是因為年級人數(shù)沒有超過40人,也被分為了兩個班;但總體來看,學(xué)生人數(shù)為40,80,120處發(fā)生的班級規(guī)模的劇降。作者認為可以運用模糊RD來進行研究設(shè)計。當不存在控制變量時,班級規(guī)模和考試成績存在強烈的正相關(guān)。當把學(xué)校中具有殘障或者貧困等不利背景的學(xué)生比例作為控制變量加入回歸后,班級規(guī)模和學(xué)生成績之間的相互關(guān)系不在顯著。但作者利用模糊斷點回歸的方法(將利用“邁蒙尼德”法則計

15、算的班級規(guī)模作為實際班級規(guī)模的工具變量)的估計得出班級規(guī)模對考試成績具有顯著影響,這與利用STAR實驗的相關(guān)研究得出的結(jié)論一致。 參考文獻:Lee, David S. (2008): “Randomized experimentsfrom non-random selection in U.S. House elections”, Journal of Econometrics,142, 675-697.Thistlethwaiite, D., and D. Campbell (1960): “Regression-DiscontinuityAnalysis: An Alternat

16、ive to the Ex Post Facto Experiment,” Journal of EducationalPsychology, 51, 309317.Campbell, Donald Thomas (1969): “Reforms asExperiments”, American Psychologist, 24, 409-429.Campbell, Donald Thomas, and Julian C. Stanley(1963): “Experimental and Quasi-experimental Designs for Research”. RandMcNally

17、, Chicago.Imbens, Guido, and Thomas Lemieux (2008): “RegressionDiscontinuity Designs: A Guide to Practice”, Journal of Econometrics, 142,615635Hahn, Jinyong, Petra Todd, and Wilbur van derKlaauw (2001): “Identification and Estimation of Treatment Effects with aRegression-Discontinuity Design”, Econometrica, 69, 201-209.Van der Klaauw, Wilbert (2002): “Estimating theEffect of Financial Aid Offers on College Enrollment: ARegression-Discontinuity Approach”, International Economic Review, 43.Angrist, Joshua D., and

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論