第一組-二階段最小二乘講義_第1頁
第一組-二階段最小二乘講義_第2頁
第一組-二階段最小二乘講義_第3頁
第一組-二階段最小二乘講義_第4頁
第一組-二階段最小二乘講義_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上2012-2013學年高級計量經(jīng)濟學分組名單第一組:潘琳、王超、倪遠棟、葉寅、李暢、吳超、卿劍、李珊、劉春梅、王巍、馬哲光、俞力群、田紀華題目:二階段最小二乘法(2SLS)內(nèi)容:適用的情況(或條件)估計原理步驟實例二階段最小二乘計量方法講義整理1.引例(引出問題和方法) 例一:有關(guān)工資收入和教育水平、個人能力之間的關(guān)系問題考慮成年勞動者的工資方程中存在未觀測到的能力的問題。一個簡單的模型為: (1)其中e是誤差項。在某些假定下,如何用諸如IQ的代理變量代替能力,從而通過以下回歸可得到一致性估計量 對 進行回歸 然而,假定不能得到適當?shù)拇碜兞浚ɑ蛩痪邆渥阋垣@取一致性

2、估計量所需的性質(zhì))。這樣一來,我們將abil放入誤差項中,留下來的就是簡單的回歸模型: (2)其中u包含了abil。當然,可以用OLS估計此方程,但是,如果educ與abil (即educ與隨機誤差項u)相關(guān),即educ為內(nèi)生解釋變量,則用OLS估計得到的結(jié)果將是的有偏、非一致性估計量。我們把簡單回歸模型寫成: (3)其中我們認為x與u相關(guān): 此時,假如我們能找到一個變量z,滿足兩個條件:一是與變量x存在高度相關(guān)關(guān)系,即;二是與隨機擾動項u不存在相關(guān)關(guān)系,即;從遺漏變量的角度看,這意味著z應(yīng)當對y無偏效應(yīng),也不應(yīng)當與其它影響y的因素相關(guān),此時變量z就稱作為變量x的工具變量(IV),則我們就利用

3、工具變量z可以根據(jù)上述方程(3)來進行估計,得到參數(shù)的無偏的一致估計,如勞動經(jīng)濟學家已在工資方程中使用的家庭背景變量作為教育的IV。例如,母親的教育(motheduc)與孩子的教育是正相關(guān)的,這一點通過收集勞動者數(shù)據(jù)樣本并做educ對motheduc的簡單回歸便可以看出來,因此,motheduc滿足相關(guān)性條件,但是,母親的教育也可能與孩子的能力相關(guān)(通過母親的能力和可能通過孩子幼年所受的教養(yǎng)的質(zhì)量)。另外,educ的另一個IV選擇是成長過程中兄弟姊妹的數(shù)目(sibs)。一般地說,較多的兄弟姊妹與較低的平均教育水平相聯(lián)系,而與個人能力的高低不存在直接關(guān)系,這樣,它就可以充當educ的工具變量,進

4、而進行工具變量發(fā)進行估計,得到參數(shù)的無偏、一致估計。我們利用方程(3):z與y之間的協(xié)方差為現(xiàn)在,在與的假定下,我們可以解出為:給定一個隨機樣本,我們用對應(yīng)樣本量來估計總體的量。在分子和分母中約去樣本容量后,我們得到的工具變量(IV)估計量(instrumental variables (IV) estimator): 例二:逃課對考試成績的因果影響問題考慮逃課對期末考試平均成績的因果影響的問題。在一個簡單的回歸框架中,我們有 (4) 其中,score是期末考試平均成績,skipped是該學期逃課的總數(shù)目。此時,在用OLS估計方程時,我們擔心skipped可能與u中其它因素相關(guān):比如,成績較好

5、(無法觀測的能力變量)的學生可能逃課較少等情況,因而score對skipped的簡單回歸可能不會給我們一個對逃課的因果影響的好的估計,因此,我們需要找到一個好的工具變量進行估計。什么可能是skipped的好的IV?我們所需要的是對score無直接效應(yīng),且與學生能力不相關(guān)的IV,同時,該IV必須與skipped相關(guān)。一個選擇是利用住宿區(qū)與教室之間的距離distance,這也許會增加逃課的可能性(由于惡劣的天氣、睡過頭等等)。因而,skipped可能與distance正相關(guān);這一點可通過skipped對distance的回歸并作一個t檢驗得以驗證。 distance是否與u不相關(guān)?在簡單回歸模型(

6、4)中,假如u中的一些因素不與distance相關(guān),那么,distance也許是skipped的一個好的IV,進而能良好估計模型(4)。如果學生能力有一個好的代理,例如以往學期的累積GPA,IV法可能根本就不需要。問題總結(jié): 例子存在的共同問題:1. 在簡單回歸模型中存在遺漏重要變量問題,運用OLS估計導致其得到估計結(jié)果不一致。2. 遺漏變量沒有良好的代理變量情況下,會導致解釋變量與擾動項的存在相關(guān)關(guān)系,即出現(xiàn)內(nèi)生解釋變量情況,導致估計結(jié)果有偏。解決的可行方法:1.在沒有良好代理變量情況下,通過尋找外生變量作為工具變量進行估計,解決了內(nèi)生解釋變量導致的有偏估計情況,得參數(shù)的到無偏、一致估計。2

7、二階段最小二乘簡單介紹(工具變量相關(guān)概念、使用的情況、解決的問題、主要的估計思想等)工具變量法:(1)由以上引例可以看出在解決內(nèi)生解釋變量問題時,通過需找一個滿足一定條件的外生變量,即工具變量來獲取無偏的一致估計,故為工具變量法。(2)何為工具變量(IV):在簡單回歸方程中,一個有效的工具變量應(yīng)滿足以下兩個條件: A相關(guān)性:工具變量與內(nèi)生解釋變量相關(guān),即 B外生性:工具變量與擾動項不相關(guān),即現(xiàn)在我們來證明可得到的工具變量能夠用于進行方程一致性參數(shù)估計。特別地,為了根據(jù)總體協(xié)方差寫出,我們對方程兩邊求與z的協(xié)方差,得到:現(xiàn)在,在與的假定下,我們可以解出為: 注意到如果z與x不相關(guān),即,該簡單代數(shù)

8、式不成立。 上式表明是z、y之間的總體協(xié)方差除以z、x之間的總體協(xié)方差的商,這說明了被識別。給定一個隨機樣本,我們用對應(yīng)樣本量來估計總體的量。在分子和分母中約去樣本容量后,我們得到的工具變量(IV)估計量(instrumental variables (IV) estimator): 給定x、y和z的樣本數(shù)據(jù),很容易獲得IV估計量。的IV估計量就為:,除了其中的斜率估計量現(xiàn)在為IV估計量,它看起來就像OLS中的截距估計量 傳統(tǒng)的工具變量法一般都通過“二階段最小二乘法”(2SLS或TSLS)來實現(xiàn),顧名思義,就是通過做兩個回歸來完成估計過程。 第一階段:用內(nèi)生解釋變量對工具變量回歸,即,得到擬合

9、值; 第二階段:用被解釋變量對第一階段回歸的擬合值進行回歸,即。二階段最小二乘法: 在前一節(jié)中,我們假定有單一的內(nèi)生解釋變量(),和的一個工具變量??赏覀冇胁恢灰粋€的外生變量,它們被排斥在結(jié)構(gòu)模型之外,且可能與相關(guān),這意味著它們是的有效的IV。在本節(jié)中,我們討論如何運用復工具變量。工具變量法作為矩估計方法,必須滿足矩法估計的階條件。一般的說,當我們在回歸模型中有不只一個的內(nèi)生解釋變量時,在若干復雜的情況下仍可能不能識別。但是,我們可以容易地表述識別的一個必要條件,叫做階條件(order condition)。根據(jù)是否滿足階條件分為三種情況:A 不可識別:工具變量的個數(shù)小于內(nèi)生解釋變量的個數(shù)

10、;B 恰好識別:工具變量的個數(shù)等于內(nèi)生解釋變量的個數(shù);C 過度識別:工具變量的個數(shù)大于內(nèi)生解釋變量的個數(shù)。 以上介紹的工具變量法僅適用于“恰好識別的情形”,但在實際中存在多個內(nèi)生解釋變量和工具變量的情況,就會出現(xiàn)“過度識別”的情況,解決方法之一就是扔掉“多余”的工具變量,但這種方法不是有效的,因為丟掉的工具變量包含著有用的信息,導致估計的結(jié)果不充分,此時運用二階段最小二乘為有效估計。 顯然,多個工具變量的線性組合仍然是工具變量,仍滿足工具變量的兩條件,如果能生成工具變量的線性組合數(shù)等于內(nèi)生解釋變量個數(shù),則又回到了恰好識別的情形。在球型擾動項的假定下,由二階段最小二乘法所提供的工具變量線性組合是

11、所有線性組合中最漸進有效的。所以能良好解決過度識別問題,使工具變量法最終得到有效地一致估計。3二階段最小二乘法估計的基本原理和主要步驟(重點思想和推到步驟)(1)估計的基本步驟:第一階段:將每個解釋變量分別對所有L個工具變量作OLS回歸,得到擬合值為:其中,為的投影矩陣。寫成矩陣形式,可以定義第二階段:由于是的線性組合(參見第一階段回歸),故恰好包含K個工具變量,使用為工具變量對原模型進行工具變量法估計:因此,可以看出,可以將視為把對進行OLS回歸而得到的,故名為“二階段最小二乘”。需要注意的是,第二階段回歸得到的殘差為,而原方程殘差確是,因此在進行2SLS最好不要自己去進行兩次手工回歸,而是

12、直接使用軟件(如STATA)進行回歸分析。將代入方程,可得到2SLS的最終表達式:(2)二階段最小二乘相關(guān)檢驗:在使用工具變量法估計的時候,必須對工具變量的有效性進行檢驗,否則,導致估計結(jié)果不一致或估計量的方差過大。A.檢驗工具變量與解釋變量的相關(guān)性前面在使用工具變量進行估計的時候,工具變臉必須與內(nèi)生解釋變量完全不相關(guān),否則就無法使用工具變量法估計,如果僅僅微弱的相關(guān),成為“若工具變量”,其后果類似于樣本容量較小,導致估計量性質(zhì)變得很差,統(tǒng)計推斷失效。判斷弱工具變量的方法之一為,在第一階段回歸中,檢驗原假設(shè)“”,一個經(jīng)驗規(guī)則,如果次檢驗的F統(tǒng)計量大于10,則可拒絕“存在弱工具變量”的原假設(shè),不

13、必擔心弱工具變量問題。在多個內(nèi)生解釋變量的情況下,將有多個第一階段回歸,固有多個F統(tǒng)計量,此時運用“最小特征值統(tǒng)計量”。STATA提供了最小特征值統(tǒng)計量的臨界值。B.檢驗工具變量的外生性舉例說明,假定我們有單一的被懷疑的內(nèi)生變量, 其中和是外生的。我們有另外兩個外生變量,和,它們不出現(xiàn)在方程中。我們在介紹簡單的工具變量估計量時,我們強調(diào)IV必須滿足兩個必需條件:它必須與誤差不相關(guān),與內(nèi)生解釋變量相關(guān)。我們在相當復雜的模型中已看到,如何判斷在誘導型回歸中是否能用一個t或F檢驗來檢驗第二個必需條件。我們聲稱第一個必需條件不能被檢驗,因為它涉及到IV與未觀測到的誤差之間的相關(guān)。然而,如果我們有不只一

14、個的工具變量,我們就能有效地檢驗它們中的一部分是否與結(jié)構(gòu)誤差不相關(guān)。作為一個例子,在有另外兩個工具變量和的條件下,重新考慮方程。我們知道僅用作為的IV,就能估計。給定IV估計值,我們就能計算殘差。因為在估計中根本沒用到,我們可以驗證與在樣本中是否相關(guān)。如果它們相關(guān),不是的有效IV。當然,這并沒有告訴我們與是否相關(guān);實際上,因為它是個有用的檢驗,我們必須假定與不相關(guān)。然而,如果和是用相同的邏輯來選擇的例如母親的教育和父親的教育發(fā)現(xiàn)與相關(guān)將使人對用作為IV產(chǎn)生懷疑。因為和的角色可以交換,若是假定與不相關(guān),我們也可以檢驗與是否相關(guān)。我們該用哪個檢驗呢?結(jié)果是,我們對檢驗的選擇是無關(guān)緊要的。我們必須假

15、定至少有一個IV是外生的。然后,我們可以對2SLS中所用的過度識別約束(overidentifying restrictions)進行檢驗。根據(jù)我們的用意,過度識別約束的數(shù)目簡單地就是額外的工具變量的數(shù)目。假定我們只有一個內(nèi)生解釋變量。如果我們只有的單一個IV,而沒有過度識別約束,也就沒什么可檢驗的。如果我們有的兩個IV,如同前面的例子中那樣,則我們有一個過度識別約束。如果我們有三個IV,則有兩個過度識別約束,等等。檢驗過度識別約束是相當簡單的。我們必須獲得2SLS殘差,然后做一個輔助回歸。檢驗(任意多個)過度識別約束(i)用2SLS估計結(jié)構(gòu)方程,獲得2SLS殘差。(ii)將對所有外生變量回歸

16、,獲得,即。(iii)在所有IV都與不相關(guān)的虛擬假設(shè)下,其中q是模型之外的工具變量的數(shù)目減去內(nèi)生解釋變量的總數(shù)目。如果超過了分布中的(例如)5%臨界值,我們拒絕:所有工具變量都是外生的,并推斷出至少部分的IV不是外生的。C.究竟該用OLS還是工具變量法:對解釋變量內(nèi)生性的檢驗當解釋變量是外生的時,2SLS估計量不如OLS有效;正如我們已看到的,2SLS估計值會有非常大的標準誤。因此,檢驗一個解釋變量的內(nèi)生性是有用的,它說明了2SLS甚至是否必要。獲取這樣的檢驗相當簡單。舉例說明,假定我們有單一的被懷疑的內(nèi)生變量, (1) 其中和是外生的。我們有另外兩個外生變量,和,它們不出現(xiàn)在方程(1)中。如

17、果與不相關(guān),我們該用OLS估計。對此我們?nèi)绾螜z驗呢?Hausman(1978)建議直接比較OLS和2SLS估計值,判斷其差異是否在統(tǒng)計上顯著。畢竟,如果所有變量外生,OLS和2SLS都是一致性的。如果2SLS與OLS的差異顯著,我們斷定必定是內(nèi)生的(保持外生性)。計算OLS和2SLS,看估計值是否實際上有差異,這是個好主意。為了判斷差異是否在統(tǒng)計上顯著,用回歸來檢驗更容易。這是以估計的誘導型為基礎(chǔ)的,此時誘導型為 (2)現(xiàn)在,因為各個與不相關(guān),所以與不相關(guān)當且僅當與不相關(guān);這是我們希望檢驗的。寫成,其中與不相關(guān),且有零均值。那么,與不相關(guān)當且僅當。檢驗這一點最容易的方法是將作為添加的回歸元包括

18、在(1)中,做t檢驗。這么做唯一的問題是:不能被觀測到,因為它是(2)中的誤差項??墒且驗槲覀兡苡肙LS估計的誘導型,我們可以獲取誘導型殘差。因此,我們用OLS估計 (3) 并用t統(tǒng)計量檢驗。如果我們以一個小的顯著水平拒絕,我們因與相關(guān)推斷出是內(nèi)生的,進而運用2SLS估計比OLS估計更有效。附:廣義距估計(GMM) 在擾動項存在異方差或自相關(guān)情況下,廣義距估計(GMM)比二階段最小二乘(2SLS)更有效率,即GMM之于2SLS,正如GLS之于OLS。4.軟件選擇和實例演示(1)軟件以及操作步驟: 運用STATA 進行二階段最小二乘估計 操作命令與步驟:主命令: ivregress 2sls depvar varlist1 (varlist2=instlist),r其中,“depvar”為被解釋變量,“varlist1”為外生解釋變量,“varlist2”為內(nèi)生解釋變量,而“instlist”為工具變量,“r”表示使用異方差穩(wěn)健標準差。檢驗命令:A.相關(guān)性檢驗: estat firststage,all forcenonrobust 該命令將顯示與弱工具變量有關(guān)的第一個階段回歸統(tǒng)計量及臨界值?!癮ll”表示顯示每個內(nèi)生解釋變量的統(tǒng)計量而非僅僅是所有內(nèi)生變量綜合的統(tǒng)計量?!癴or

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論