傾向值匹配與因果推斷:方法論述評(píng)_第1頁(yè)
傾向值匹配與因果推斷:方法論述評(píng)_第2頁(yè)
傾向值匹配與因果推斷:方法論述評(píng)_第3頁(yè)
傾向值匹配與因果推斷:方法論述評(píng)_第4頁(yè)
傾向值匹配與因果推斷:方法論述評(píng)_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、傾向值匹配與因果推論:方法論述評(píng)傾向值匹配:歷史、發(fā)展及其對(duì)調(diào)查研究的意義傾向值(propensity score)這一概念最早出現(xiàn)在1983年羅森鮑姆和 魯賓合 寫的一篇名為傾向值對(duì)于觀察研究中因果效應(yīng)的中心作用的論文中(Rosenbaum & Rubin, 1983)。傾向值指被研究的個(gè)體在控制可觀測(cè)到的 混淆變量(confounding variables)的情況下受到某種自變量 影響的條件概 率。在一般的實(shí)證研究中,由于存在很多其他變量混淆自變量和因變量之間的 關(guān)系,研究者很難直接探索二者之間的“凈效 果” (net effects)。例如, 大學(xué)教育的收入回報(bào)可能受到年齡、性別以及

2、地區(qū)差異這些混淆變量的影響。 因此,上大學(xué)的人的平均收入與沒(méi)有上大學(xué)的人的平均收入的差異有可能也反 映了混淆變量的作用。這些混淆變量的影響通常被稱為選擇性誤差(selection bias),而通過(guò)傾向值 匹配的方式來(lái)控制和消除選擇性誤差則是 羅森鮑姆和魯賓論文的題中之義。羅森鮑姆和魯賓用數(shù)理方法證明:通過(guò)將這 些混淆變量納入Logistic回歸模型來(lái)產(chǎn)生一個(gè)預(yù)測(cè)個(gè)體受到自變量影響的概 率(傾向值),研究者可以通過(guò)控制傾向值來(lái)遏制選擇性誤差對(duì)研究結(jié)論的影 響從而保證因果結(jié)論的可靠性。在各種控制傾向值的方法中,匹配(matching)比較簡(jiǎn)便易行。其基本邏輯是 將受到自變量影響的個(gè)體與沒(méi)有受到影

3、響的個(gè)體進(jìn)行配 對(duì)。而傾向值匹配就是 保證匹配起來(lái)的個(gè)體的傾向值相等或者近似。再次回到大學(xué)教育的例子,傾向 值匹配就是將沒(méi)有受過(guò)大學(xué)教育的人和受過(guò)大學(xué)教育的人配對(duì)并保證他們的傾 向值(即上大學(xué)的概率)相同或近似,這樣我們就得到了上過(guò)大學(xué)和沒(méi)上過(guò)大 學(xué)兩組個(gè)體。因?yàn)?已有的混淆變量已經(jīng)在基于傾向值的配對(duì)過(guò)程中被控制起來(lái) 了,兩組個(gè)體收入上的差異就只能歸因于大學(xué)教育的有無(wú),而不是其他混淆變 量,由此遏制了選擇性誤差。羅森鮑姆和魯賓的思想與計(jì)量經(jīng)濟(jì)學(xué)家赫克曼的想法不謀而合。從樣本選擇的 角度出發(fā),赫克曼認(rèn)為社會(huì)科學(xué)家在研究某個(gè)自變量效果的時(shí)候會(huì)不自覺(jué)地選 擇一些樣本而忽視另外一些。例如,針對(duì)某個(gè)研究

4、項(xiàng)目,不同的個(gè)體有不同的 參與意愿,或者研究者對(duì)于研究個(gè)體的選擇有特定的傾向。這些選擇效應(yīng) (selection effect)使得研究者真正 接觸的樣本是有一定偏向的”。而基 于一個(gè)帶有選擇性的樣本,我們 得出的結(jié)論也會(huì)由于選擇效應(yīng)的“污染”而出 現(xiàn)偏差(Heckman, 1979; Heckman & Smith, 1995)。面對(duì)這種情況,赫克 曼認(rèn)為在進(jìn)行研究時(shí)需要做兩步工作。第一步是建立模型來(lái)擬合個(gè)體參與到某 種研究項(xiàng)目中的可能性,第二步則是在控制這種參與可能性的前提下來(lái)考察我 們所關(guān)心的自變量對(duì)因變量的效果。因此,赫克曼的方法也被稱為“兩步估 計(jì)法 (twostep estimat

5、or) ( Heckman, 1978, 1979)。我們今天所探討的傾向值匹配可以說(shuō)是羅森鮑姆和魯賓的統(tǒng)計(jì)學(xué)傳統(tǒng)與赫克曼 的計(jì)量經(jīng)濟(jì)學(xué)傳統(tǒng)的結(jié)合。羅森鮑姆和魯賓通過(guò)邏輯回歸方法將混淆變量“總 結(jié)”成一個(gè)傾向值,而這也恰恰是赫克曼兩步估計(jì)法中的第一步所要做的,即 通過(guò)模型估算個(gè)體參與某項(xiàng)研究的概率,二者殊途同歸。然而,這兩個(gè)傳統(tǒng)的 一個(gè)不同點(diǎn)在于他們處理傾向值的方式有一定差異。在得到傾向值之后,羅森 鮑姆和魯賓提出了多種控制傾向值的方法:除了匹配之外,也可以將傾 向值分層(stratification)或細(xì)分(sub-classification),然后在每個(gè)層 次或類別內(nèi)探索因果關(guān)系;或者也

6、可以將傾向值作為新的變量進(jìn)行回歸分析。而在赫克曼的計(jì)量經(jīng)濟(jì)學(xué)傳統(tǒng)中,傾向值主要是作為一個(gè)新的變量被納入 到已有的計(jì)量經(jīng)濟(jì)模型中,例如選擇模型(selection model),工具變 量 (instrumental variable),或雙重差分方法(differencein-differences method)。需要指出的是,這種差異只是在處理傾向值的具體方式上的不同, 本質(zhì)上這兩個(gè)傳統(tǒng)的基本邏輯是一致的,即在考察自變量效果之前通過(guò)模型估 計(jì)并控制個(gè)體受到自變量影響的概率。在社會(huì)學(xué)領(lǐng)域,早在1997年,賓夕法尼亞大學(xué)社會(huì)學(xué)系的史密斯就已經(jīng)使用 傾向值匹配方法研究醫(yī)院改革對(duì)患者死亡率的影響(

7、Smith, 1997)。然而, 史密斯這篇文章的主要目的是展示傾向值匹配 方法,因此是作為方法論的論文 發(fā)表在社會(huì)學(xué)方法論(Sociological Methodology)期刊上的。兩年以 后,哈佛大學(xué)的溫希普和摩根在美國(guó)社會(huì)學(xué)年鑒(Annual Review of Sociology)上系統(tǒng)梳理了如何通過(guò)統(tǒng)計(jì) 方法進(jìn)行因果推論,其中也談到了傾 向值匹配(Winship & Morgan, 1999)。總體上來(lái)說(shuō),在2000年之前,社會(huì)學(xué)領(lǐng)域內(nèi)對(duì)傾向值匹配的主要關(guān)注點(diǎn)還是 在于熟悉傾向值匹配的基本邏輯,而將其作為一種普遍適用的統(tǒng)計(jì)方法去研究 實(shí)際問(wèn)題還要到21世紀(jì)才漸漸興起。2003年,當(dāng)

8、時(shí)還在哈佛大學(xué)學(xué)習(xí)的哈 丁在美國(guó)社會(huì)學(xué)雜志(American Journal of Sociology)上發(fā)表了一篇 論文研究社區(qū)貧困程度對(duì)社區(qū)少年輟學(xué)及 早孕的影響,其中傾向值匹配開始像 多元回歸那樣作為一種統(tǒng)計(jì)技術(shù)來(lái)驗(yàn)證和發(fā)展已有理論(Harding,2003)。 也正是在這一階段,傾向值匹配的軟件模塊開始被開發(fā)出來(lái)并嵌入到一般的統(tǒng) 計(jì)軟件中。例如,貝克爾和棟野在2002年發(fā)布了可以嵌入Stata的用于傾 向值匹配的模塊pscore ( Becker & Ichino, 2002)。魯汶及夏內(nèi)西也 在一年后發(fā)布了他們所編寫的用于傾向值匹配的模塊psmatch2” ( Leuven & Si

9、anesi,2003)。這些統(tǒng)計(jì)模塊的開發(fā)使傾向值匹配開始在社會(huì)學(xué)領(lǐng)域廣 泛應(yīng)用。根據(jù)哈佛大學(xué)社會(huì)學(xué)系安衛(wèi)華的梳理,截至2009年,在美國(guó)社會(huì) 學(xué)評(píng)論(American Sociological Review)和美國(guó)社會(huì)學(xué)雜志上發(fā)表的 論文中,利用傾向值匹配技術(shù)的超過(guò)了 200篇,內(nèi)容涉及教育社會(huì)學(xué)、互聯(lián) 網(wǎng)使用、失業(yè)問(wèn)題、健康問(wèn)題等諸多方面(An,2010)??梢哉f(shuō),在當(dāng)前的 社會(huì)學(xué)研究中,傾向值匹配已逐漸發(fā)展成為一個(gè)普適的統(tǒng)計(jì)研究方法,并得到 越來(lái)越多的重視。傾向值匹配在社會(huì)學(xué)領(lǐng)域的興起并非偶然,這是和社會(huì)學(xué)對(duì)大規(guī)模調(diào)查資料的 使用分不開的。與統(tǒng)計(jì)學(xué)領(lǐng)域的實(shí)驗(yàn)設(shè)計(jì)不同,調(diào)查資料無(wú)法對(duì)研究個(gè)

10、體進(jìn)行 人為控制。從這個(gè)意義上說(shuō),基于調(diào)查資料的研究也被稱為“觀察性研究” (observational studies) ( Rosenbaum, 2002)。在實(shí)驗(yàn)性研究中,選擇性 誤差可以通過(guò)隨機(jī)化(randomization)的方法來(lái)克服,但在觀察性研究中,類 似的隨機(jī)化是不可能的。因此,社會(huì)學(xué)家們基于調(diào)查資料去探究任何兩個(gè)變量 關(guān)系的時(shí)候都不可避免 地會(huì)受到其他混淆變量的影響。例如,布蘭德和謝宇在 2010年的一篇論文中列舉了在研究大學(xué)教育和收入關(guān)系時(shí)所存在的選擇性誤 差(Brand & Xie, 2010)。一方面,很多人之所以能夠上好大學(xué)就在于其 個(gè)人能力較其他人高,而這些人在未

11、來(lái)的工作中也很可能表現(xiàn)得更好從而收入 更高。如果我們的研究樣本大部分都是高智商群體,那么就會(huì)“顯得”大學(xué)教 育帶來(lái)高收入,但實(shí)際上,大學(xué)教育對(duì)收入的影響是被個(gè)人能力這個(gè)變量給“膨脹起來(lái)” (inflated)的。另一方面,很多人上大學(xué)概率低是由于他們 家庭貧困難以負(fù)擔(dān)教育費(fèi)用。對(duì)這些人,只要 他們完成了大學(xué)教育,即使畢業(yè) 后的收入只是達(dá)到平均水平,也已經(jīng)比之前有很大飛躍。在這種情況下如果我 們的樣本偏重于家境貧寒的人,我們就會(huì)發(fā)現(xiàn)大學(xué)教育再一次“顯得”對(duì)收入 提升有很大促進(jìn)作用,而此時(shí)的混淆變量就是家庭經(jīng)濟(jì)背景。對(duì)于這種選擇性 誤差,我們可以通過(guò)赫克曼誤差修正模型(selection corr

12、ection model)來(lái) 進(jìn)行控制,但這個(gè)模型實(shí)施起來(lái)較為復(fù)雜。相比而言,傾向值匹配為我們提供 了 一種更為直觀簡(jiǎn)便的處理選擇性誤差的方法。在下一節(jié),我將通過(guò)一個(gè)實(shí) 例來(lái)展示如何進(jìn)行傾向值匹配。傾向值匹配的實(shí)施過(guò)程:一個(gè)實(shí)例在這一部分,筆者將利用傾向值匹配的方法分析中國(guó)綜合社會(huì)調(diào)查2005年城 市問(wèn)卷(CGSS2005)的相關(guān)變量,并由此來(lái)估計(jì)中國(guó)城市居民大學(xué)教育的收入 回報(bào)。其中因變量是收入水平( 2004年全年總收入,包括工資、各種獎(jiǎng)金、 補(bǔ)貼、分紅、股息、保險(xiǎn)、退休金、經(jīng)營(yíng)性純收入、銀行利息、饋贈(zèng)等所有收 入),這里將其取自然對(duì)數(shù)。我們關(guān)心的自變量是被訪者教育水平(1二大學(xué) 本科教育

13、及以上;0二大學(xué)本科教育以下)。我們需要控制的混淆變量包括: 性別(1二女性;0二男性)、年齡、政治身份(1二黨員;0 =非黨員)、父 親教育水平(1二高中教育及以上;0二高中教育以下)、戶口類型(1二城市 戶口; 0二非城市戶口)、被訪者的單位性質(zhì)及父親的單位性質(zhì)(1二黨政機(jī) 關(guān);2二國(guó)有企業(yè);3二國(guó)有事業(yè);4二集體企事業(yè);5 =其他)。此處選取這些 變量是因?yàn)橐延醒芯勘砻鬟@些變量會(huì)混淆教育水平和收入之間的關(guān)系 一般我們會(huì)把這些混淆變量作為控制變量納入到回歸模型中,但這樣做有一些 潛在風(fēng)險(xiǎn)。首先,如果將這些混淆變量作為自變量放進(jìn)回歸模型,我們就潛在 假定了這些混淆變量對(duì)收入的效果與大學(xué)教育對(duì)

14、收入的效果之間存在一種線性 關(guān)系。然而這種線性假定缺乏理論和實(shí)踐依據(jù)(Morgan,2001)。也就是 說(shuō),我們不能簡(jiǎn)單認(rèn)為性別對(duì)收入的影響與教育對(duì)收入的影響是累加的 (additive)。其次,大學(xué)教育的回歸系數(shù)代表的是一種“平均”效果。這個(gè) 系數(shù)所回答的問(wèn)題是:在人口中任意選取一個(gè)人,如果他接受的是大學(xué)教育, 他的收入會(huì)是什么水平。然而,在探索因果關(guān)系時(shí)我們所關(guān)心的問(wèn)題則是:(1) 一個(gè)任意選取的大學(xué)生如果一開始沒(méi)上大學(xué)的話會(huì)是什么收入水平;(2) 一 個(gè)任意選取的非大學(xué)生如果上大學(xué)的話會(huì)是什么收入水平。(1)和(2)是 兩個(gè)不同的問(wèn)題,而回歸模型則沒(méi)有區(qū)分它們,只是取了它們的平均水平,這

15、 樣做無(wú)疑會(huì)帶來(lái)誤差。最后,由于混淆變量與我們關(guān)心的自變量之間存在相關(guān) 性,簡(jiǎn)單地將混淆變量納入多元回歸模型有可能產(chǎn)生共 線性問(wèn)題。傾向值匹配 有效地控制了這些混淆變量,同時(shí)還通過(guò)一種半非參數(shù)性(semi nonparametric) 方法避免了上面提到的三個(gè)風(fēng)險(xiǎn)。具體而言,運(yùn)用傾向值匹配 方法有以下幾步。步驟一:預(yù)測(cè)傾向值。這一步是利用已知的混淆變量使用Logistic或Probit 模型來(lái)預(yù)測(cè)個(gè)體進(jìn)入大學(xué)讀書的概率?;谏厦孀兞?,得到 的結(jié)果見(jiàn)表1。通過(guò)表1我們可以發(fā)現(xiàn),這些混淆變量加在一起對(duì)是否進(jìn)入大學(xué)學(xué)習(xí)有比較 強(qiáng)的解釋力,這一點(diǎn)可以從虛擬R2( Pseudo R2)的數(shù)值(超 過(guò)17

16、%)看出 來(lái)。對(duì)社會(huì)學(xué)研究而言,這個(gè)虛擬R2值并不低,由此可 以看出該模型中的 混淆變量能夠比較顯著地預(yù)測(cè)個(gè)體能否進(jìn)入大學(xué)讀書。步驟二:基于傾向值進(jìn)行匹配。有了上面的Probit模型,我們就能 夠預(yù)測(cè)每 個(gè)研究個(gè)體的傾向值。需要指出的是,雖然每個(gè)個(gè)體都有傾向值得分,但有 些人的傾向值太高或太低,因此無(wú)法找到相匹配的個(gè)體。這些傾向值取值非常 “極端”的人因?yàn)闆](méi)有與之匹配的個(gè)體存在往往無(wú)法為我們提供有用的信息, 所以在隨后的分析中也就沒(méi)有被考慮進(jìn)去,這就使得最后我們?cè)诜治龈叩冉逃?的收入回報(bào)時(shí)所采用的樣本量可能要比一開始的樣本量小。在這個(gè)最后使用的 “匹配樣本”中,我們能夠確保受過(guò)高等教育的個(gè)體和

17、沒(méi)有受過(guò)高等教育的個(gè) 體匹配起 來(lái)?!捌ヅ錁颖尽敝袃A向值的取值范圍被稱為“共同區(qū)間”(common support) o本研究中共同區(qū)間內(nèi)的樣本量為3164(其中上過(guò)大學(xué)的為229 人)。在這個(gè)共同區(qū)間內(nèi),我們有不同的匹配方法將受過(guò)大學(xué)教育的229人 和沒(méi)受過(guò)大學(xué)教育的2935人配對(duì)。對(duì)某個(gè)上過(guò)大學(xué)的個(gè)體A,比較常用的方 法包括鄰近匹配(找與A的傾向值得分最接近的未上大學(xué)的個(gè)體B匹配), 半徑匹配(以個(gè)體A的傾向值為中心,以某個(gè)數(shù)值為半徑,在這個(gè)范圍內(nèi)的 所有沒(méi)上過(guò)大學(xué)的個(gè)體與A匹配)以及核心匹配。步驟三:基于匹配樣本進(jìn)行因果系數(shù)估計(jì)。在這個(gè)匹配好的樣本中,我們只需 比較那些上過(guò)大學(xué)和沒(méi)上大學(xué)

18、的個(gè)體的平均收入差值就可以估計(jì)出大學(xué)教育本 身對(duì)收入的影響。由于配對(duì)樣本的傾向值近 似,配對(duì)個(gè)體在混淆變量上的取值 極為近似,這樣也就控制了混淆變量的影響。換句話說(shuō),我們得到的組間(上 大學(xué)和沒(méi)上大學(xué))差異就只能歸因于大學(xué)教育的有無(wú)。我們最后的結(jié)果如表2 所示。通過(guò)表2可以發(fā)現(xiàn),不同匹配方法下我們得到的因果關(guān)系系數(shù)不 完全相等, 這是因?yàn)槭苓^(guò)大學(xué)教育的個(gè)體在不同的匹配方式下可能和不同的未受大學(xué)教育 的個(gè)體進(jìn)行了匹配。然而這些不同的匹配方法得出的結(jié)論基本一致(系數(shù)在 0. 73到0. 77之間)。這些系數(shù)就是大學(xué)教育的收入回報(bào)。其可以解釋為 與沒(méi)有受過(guò)大學(xué)教育的人相比,大學(xué)教育帶來(lái)log(年收入

19、)的變化。需要說(shuō)明的是,在社會(huì)學(xué)定量研究中,在完成了匹配以后,通常會(huì) 比較每個(gè)混 淆變量在大學(xué)組與非大學(xué)組之間是否還存在顯著差異。理想情況是大學(xué)組與非 大學(xué)組的混淆變量均值沒(méi)有顯著差異,這時(shí)我們 可以說(shuō)這樣的配對(duì)樣本是“平 衡” (balanced)的。限于篇幅,這里未將均值比較結(jié)果展示出來(lái),但我們 上面的分析已通過(guò)了平衡性檢驗(yàn)。此夕卜,傾向值匹配通常配合敏感性分析 (sensitivity analysis)來(lái)檢驗(yàn)我們?cè)陬A(yù)測(cè)傾向值時(shí)是否忽略了某些關(guān)鍵的 混淆變量。在敏感性分析階段,我們假設(shè)存在一個(gè)或多個(gè)我們沒(méi)有能夠控制的 混淆變量,如果這些假 設(shè)的未控制變量對(duì)收入的影響的大范圍變動(dòng)都無(wú)法改變

20、 我們的結(jié)論,我們的結(jié)論就站得住腳。上面的研究就通過(guò)了相關(guān)的檢驗(yàn)。傾向值匹配與因果推論傾向值匹配后的結(jié)果不僅僅指出了變量之間有聯(lián)系,還進(jìn)一步確立了二者之間 的因果性。這種方法論上的優(yōu)勢(shì)可以從科技哲學(xué)和統(tǒng)計(jì) 學(xué)兩個(gè)方面予以闡釋。1科技哲學(xué)角度的闡釋傾向值匹配對(duì)因果性結(jié)論的支持首先依據(jù)的是科技哲學(xué)領(lǐng)域內(nèi)對(duì)因果關(guān)系的理 論探討。當(dāng)我們談及因果性的時(shí)候,我們往往會(huì)回歸到 密爾對(duì)求同法(method of agreement) 及求異法 (method of differences) 的討論( 彭玉生, 2011; Mill,2002/1984; Sobel, 1995, 1996)。求同法是 指在一個(gè)

21、群體 中所有人都在兩個(gè)變量上取值相同(例如所有人都上了大學(xué),同時(shí)所有人都是 高智商)而在其他變量上取值不同(他們不全是女性,不全是農(nóng)村居民,等 等),那么這兩個(gè)變量之間(大學(xué)教育和智力水平)就具有因果關(guān)系。求異法 是指兩個(gè)個(gè)體在因變量上的取值不同,而在某個(gè)自變量之外的其他自變量上的 取值相同,則那個(gè)取值不同的自變量和因變量之間存在因果關(guān)系。正如彭玉生 所論述的那樣,密爾的這兩種探索因果關(guān)系的方法對(duì)后來(lái)的統(tǒng)計(jì)實(shí)驗(yàn)設(shè)計(jì)有著 巨大影響(彭玉生,2011)。無(wú)論是求同法還是求異法,二者都要求對(duì)關(guān)鍵 自變 量之外的其他自變量進(jìn)行考察。只有其他自變量滿足特定的條件時(shí)(求 同法要求其他自變量的取值都不一樣,

22、而求異法要求其他自變量的取值都一 樣)我們才能夠確定某種因果關(guān)系。這實(shí)際上是引入了 “控制”的思想,即只 有“控制”了其他變量,我們才能夠真正確定我們關(guān)心的兩個(gè)變量之間存在因 果關(guān)系。從“控制”的角度出發(fā),傾向值匹配十分巧妙地完成了對(duì)多個(gè)混淆 變量的控 制。我們可以從一個(gè)混淆變量的情況談起:假定只有個(gè)人智力水平混淆了大 學(xué)教育和收入之間的關(guān)系。一個(gè)比較直觀的控制個(gè)人 智力的辦法是將個(gè)人智 力這一變量細(xì)分(sub-classification)成不同層次 以保證每一個(gè)層次中的 人的個(gè)人智力水平近似。然后我們?cè)诟鱾€(gè)層次內(nèi)部觀察大學(xué)教育和收入的關(guān) 系,最后將這些關(guān)系綜合起來(lái)(Rubin, 1997)

23、。如果存在兩個(gè)混淆變量 (例如家庭經(jīng)濟(jì)背景好壞和個(gè)人智力高低),我們可以將這兩個(gè)變量交互 分成2x2個(gè)小組,組內(nèi)個(gè)體在這兩 個(gè)變量上的取值都是一樣的(家庭背景 好且智力高、家庭背景好且智力低、家庭背景不好且智力高,以及家庭背景 不好且智力低),在每組內(nèi)部觀察大學(xué)教育和收入的關(guān)系然后綜合起來(lái)。至 此,通過(guò)細(xì)分的方法,我們完成了 “控制”混淆變量的工作。但隨著混淆變 量越來(lái)越多,這種細(xì)分法就變得十分不方便了。例如,如果我們要控制5個(gè)混淆變 量,每個(gè)變量有5個(gè)取值水平,我們就需要?jiǎng)澐?5 = 3125個(gè)小組。 很快我們的數(shù)據(jù)樣本量就不夠保證每一組都有個(gè)體。傾向值匹配的辦法巧 妙地解決了這個(gè)多混淆變量

24、下的“多維”(multipledimensional)問(wèn) 題:它不再關(guān)注每個(gè)需要控制的混淆變量的具體取值,而是 轉(zhuǎn)而關(guān)注將 這些變量納入Logistic回歸方程后預(yù)測(cè)出來(lái)的傾向值取值。只 要保證傾向值匹配,這些所有需要控制的混淆變量就都考慮到了(Rosenbaum & Rubin, 1983)。這樣做實(shí)際上是將對(duì)多個(gè)混淆變量的控制轉(zhuǎn)為對(duì)傾 向 值的控制從而達(dá)到“降維(dimension reduction)的目的。換句話 說(shuō), 無(wú)論有多少需要控制的混淆變量,我們都能夠通過(guò)傾向值匹配的方 法 將它們控制,從而幫助我們得出因果性結(jié)論。因此,從“控制”的角 度 出發(fā),傾向值匹配法很好地解決了多混淆變

25、量時(shí)的控制問(wèn)題,從而支 持了因果推論。2統(tǒng)計(jì)學(xué)角度的闡釋傾向值匹配的因果推論功能也能通過(guò)統(tǒng)計(jì)學(xué)視角進(jìn)行闡釋。這里我們需要引入 反事實(shí)框架(counterfactual framework) 這一統(tǒng)計(jì)學(xué)理論。 反事實(shí)(counter facts)是指相反情境下的某種狀態(tài)。例如,一群病人在 一個(gè)實(shí) 驗(yàn)中被分到實(shí)驗(yàn)組接受新藥物治療。這些人癥狀的減輕或加重是我們能夠觀 察到的“事實(shí)”。而“反事實(shí)”則是指“假設(shè)”這同一群病 人當(dāng)時(shí)不是被分 到實(shí)驗(yàn)組而是對(duì)照組,即沒(méi)有接受新藥物治療,那么他 們的癥狀會(huì)是什么樣 子。自變量(新藥)對(duì)于癥狀的因果性效果在統(tǒng)計(jì)學(xué)意義上就是指這“同 一群人”在實(shí)驗(yàn)組時(shí)的癥狀和在對(duì)

26、照組時(shí)的癥狀之間的差異。換句話說(shuō),統(tǒng) 計(jì)學(xué)上的因果關(guān)系是可觀察到的“事 實(shí)”與其“反事實(shí)”之間的差異。從反 事實(shí)的框架出發(fā),因果性的關(guān)系 可以表示為:T - 7TI W = 1) E ( I M? = 1) +(1-77)E (匕 I 皿=0) E ( % I頂二印=岳召(匕 1盟=1)+ 1 - 7T) ( f 1 W = 0)tt E ( n 1 w = 1) + ( 1 而 E (匕 I M =饑(反事實(shí)框架下的因果推論公式)在這個(gè)公式里,T是指因果關(guān)系;n是指所有調(diào)查對(duì)象中在實(shí)驗(yàn)組中 的比例,而1 n 也就表示了所有調(diào)查對(duì)象中在對(duì)照組的比例(例如 1/3是大學(xué)生,那么n = 1/3,而

27、沒(méi)上大學(xué)的人的比例就是1 n二2/ 3) ; w是一個(gè)二分變量,其中1代表個(gè)體在實(shí)驗(yàn)組而0代表個(gè)體在對(duì) 照 組;Y1和Y0分別指代實(shí)驗(yàn)組和對(duì)照組的成員在因變量上的取值。E則 是取平均值的意思。在上述公式中,E ( Y1 | w =1)或E ( Y0 | w = 0)是可觀測(cè)到的事實(shí),而E( Y1 |w =0)和E( Y0 |w =1)則是反事 實(shí)。 因 果關(guān)系T就表示為實(shí)驗(yàn)組中的個(gè)體其“事實(shí)”與“反事實(shí)”之 間的差 異即E( Y1 |w = 1) E( Y0 | w = 1)與對(duì)照組中的個(gè)體其“事實(shí)”與“反事實(shí)”之間的差異即E( Y1 |w =0) E( Y0|w =0)的加權(quán)平均值(權(quán)重分別

28、為 n 和1 n)。但問(wèn)題在于,我們永遠(yuǎn)也不可能觀測(cè)到反事實(shí)是什么,因?yàn)樵谀稠?xiàng)特定的研 究中,某一群人只可能在實(shí)驗(yàn)組或?qū)φ战M,而不能同時(shí)在兩組 中出現(xiàn)。這被 稱為“因果推論的基本問(wèn)題” (Holland, 1986)。為了做出因果推論,我 們需要用可觀測(cè)到的E( Y1 | w =1)和E( Y0 | w = 0)來(lái)簡(jiǎn) 化上面的因果推論公式。具體而言,我們希望能夠滿足以下條件,這在 統(tǒng)計(jì)學(xué)上稱為 “非混淆假設(shè)”(unconfoundedness assumption):E(匕 I it = 0)= E( yt I w = 1)以及( YG w = 0)= E Ya w = I) (非混淆假設(shè))不

29、難看出,如果滿足非混淆假設(shè),反事實(shí)框架下的因果推論公式就 簡(jiǎn)化為:r二瓦匕I切=1) - e( % I坷=o)(簡(jiǎn)化因果推論公式)如果簡(jiǎn)化因果推論公式右邊的兩項(xiàng)均能觀測(cè)到,我們就能做出因果性結(jié)論, 因此,從反事實(shí)框架出發(fā),能否做出因果推論主要取決于非 混淆假設(shè)是否滿 足。 隨機(jī)化是統(tǒng)計(jì)學(xué)中常用的辦法,由于實(shí)驗(yàn)個(gè)體 是通過(guò)隨機(jī)方式分 配到實(shí)驗(yàn)組和對(duì)照組中的,w本身就和最后的實(shí)驗(yàn) 結(jié)果Y1或Y0沒(méi)有關(guān)系 了。 換句話說(shuō),無(wú)論w =0還是w =1,E( Y1)或E( Y0)的值都 是固定的,進(jìn)而 E( Y1 |w =0) = E( Y1 |w =1)且 E( Y0 |w =0) = E( Y0 |w

30、 =1)。但是,對(duì)基于調(diào)查資料的社會(huì)學(xué)研究來(lái)講,我們做不到隨機(jī)化。 為了滿足非混淆假設(shè),我們能做的是盡可能控制混 淆變量,并保證這些變量 一旦被控制起來(lái),w就能夠近似地和Y1或Y0保持獨(dú)立,換句話說(shuō),我們 希望做到:( Yt w - 0=( I w = tX)以及 Y. 3 =0/) = ( Yq I = ) rX(非混淆假設(shè):控制變量)上式表明,只要能夠找到并控制混淆變量X,我們就能夠近似地做 到w獨(dú)立 于Y。在傾向值匹配中,所有的這些X通過(guò)Logistic回歸總 結(jié)成為一個(gè)特 定的傾向值?,而非混淆假設(shè)就是通過(guò)控制傾向值P來(lái) 滿足的。即:相匕 I 仲=0, P) = E( I w * 1

31、f P)以及/:(此 I 仲=OP) = w = ,P(非混淆假設(shè):控制傾向值)至此,通過(guò)控制傾向值,我們可以“近似地”滿足統(tǒng)計(jì)學(xué)反事實(shí)框架下的非混 淆假設(shè)從而做出因果推論。之所以說(shuō)“近似”,是因?yàn)榭刂?傾向值的效果畢竟 不是真正的隨機(jī)化。很多時(shí)候我們很難知道是否已經(jīng)控制了需要控制的“所 有”混淆變量。正因?yàn)槿绱?,在完成傾向值匹配以后我們通常需要進(jìn)行敏感性 分析。在這個(gè)意義上說(shuō),傾向值匹配只是努力地滿足反事實(shí)框架下的因果推論 條件,但即使如此,我們也已經(jīng)從統(tǒng)計(jì)學(xué)意義上理解了傾向值匹配為什么能夠 幫助我們得出因果性結(jié)論。傾向值匹配與其他社會(huì)科學(xué)方法的比較以上分析從科技哲學(xué)及統(tǒng)計(jì)學(xué)的角度闡釋了為什

32、么通過(guò)傾向值匹配可以得到因 果性結(jié)論。然而,因果性分析的方法并不局限于傾向值匹配,在教育學(xué)及計(jì)量 經(jīng)濟(jì)學(xué)領(lǐng)域中有很多其他的方法可以幫助我們建構(gòu)因果關(guān)系。在以下討論中, 我將把傾向值匹配與回歸中斷設(shè)計(jì)和工具變量進(jìn)行比較以展示傾向值匹配的優(yōu) 勢(shì)。1傾向值匹配和回歸中斷設(shè)計(jì)在教育學(xué)中應(yīng)用比較廣泛的因果推論方法是回歸中斷設(shè)計(jì)” (regression discontinuity design)。該方法最先由兩位美國(guó)學(xué)者在1960(Thistlethwaite & Campbell, I960)提出。在他們的研究中,兩位學(xué)者關(guān) 心的是學(xué)習(xí)上的榮譽(yù)獎(jiǎng)勵(lì)(原因)是否能夠提升學(xué)生未來(lái)的學(xué)術(shù)成就(結(jié) 果)。這里

33、的榮譽(yù)獎(jiǎng)勵(lì)是根據(jù)考試成績(jī)而定的:當(dāng)考試成績(jī)x超過(guò)一定分?jǐn)?shù) c,則給予獎(jiǎng)勵(lì)(D =1),否則(x V c時(shí))則沒(méi)有獎(jiǎng)勵(lì)(D =0)。通過(guò)這種 操作,我們就在我們所關(guān)心的自變量那里建立了一種“中斷” (c之上和之 下)。隨后如果學(xué)生的學(xué)術(shù)成就也發(fā)生了類似的中斷(例如考試成績(jī)?cè)赾以 下學(xué)生的學(xué)術(shù)成就低于考試成績(jī)?cè)赾以上的學(xué)生的學(xué)術(shù)成就),則可以認(rèn)為 獎(jiǎng)勵(lì)和學(xué)術(shù)成就之間有因果關(guān)系。圖1用圖示的方式表達(dá)了這種關(guān)系。0 1 I C hertv jghki X)注:橫坐標(biāo)(X)代表考試成縱機(jī)坐標(biāo)(Y代表學(xué)術(shù)成就 圖片來(lái)源門z A “引j 20OT.圖1回歸中斷設(shè)計(jì)的基本邏輯在圖1中,x在c處的中斷對(duì)應(yīng)于因變

34、量Y的中斷,這種中斷T代表了 x對(duì)于Y的效果。從反事實(shí)框架來(lái)看,回歸中斷設(shè)計(jì)滿足了非混 淆假設(shè)。在 上面的榮譽(yù)獎(jiǎng)勵(lì)例子中,一個(gè)人得到榮譽(yù)獎(jiǎng)勵(lì)可以理解為一個(gè)人進(jìn)入了實(shí)驗(yàn) 組,而這“完全”取決于學(xué)生的考試分?jǐn)?shù)x(分?jǐn)?shù)高就有獎(jiǎng)勵(lì)而分?jǐn)?shù)低則沒(méi)有 獎(jiǎng)勵(lì))。因此,只要我們控制了分?jǐn)?shù)X,w(是否 得到獎(jiǎng)勵(lì))就和因變量 Y1(得到獎(jiǎng)勵(lì)的學(xué)生的學(xué)術(shù)成就)以及Y0(沒(méi)有得到獎(jiǎng)勵(lì)的學(xué)生的學(xué)術(shù) 成就)獨(dú)立了。用公式可以表述如下:E( I w =I w = I fx)以及( Fo I w = 0fx) = ( h I w = 1, x)(非混淆假設(shè):回歸中斷設(shè)計(jì))這里我們可以將回歸中斷設(shè)計(jì)與傾向值匹配進(jìn)行一下比較。傾向

35、 值匹配將對(duì) 多個(gè)混淆變量的控制轉(zhuǎn)化為對(duì)“單一傾向值”的控制,以此 滿足非混淆假 設(shè)。而回歸中斷設(shè)計(jì)則是通過(guò)控制一個(gè)變量(如上例中 的考試成績(jī))就能 完成這一點(diǎn)?;貧w中斷設(shè)計(jì)之所以不需要考慮多個(gè)混淆變量就在于一個(gè)個(gè)體 是否能夠接受某個(gè)自變量的影響(即能否得到獎(jiǎng)勵(lì))完全取決于單一變量 x(考試成績(jī))。換句話說(shuō),回歸中斷設(shè)計(jì) 中只有一個(gè)混淆變量X。然而, 在社會(huì)學(xué)的調(diào)查研究中很難找到這種“單一混淆變量”的情況。正因?yàn)槿绱?,回歸中斷設(shè)計(jì)在社會(huì)學(xué)中的應(yīng) 用遠(yuǎn)不及在教育學(xué)中普遍(Angrist & Lavy, 1999; Black, 1999)。此外,回歸中斷設(shè)計(jì)的另一個(gè)缺陷在于:如果存在其他自變量也

36、出現(xiàn)某種 “中斷”的情況,我們就很難知道什么 原因造成了因變量取值的中斷。假設(shè)一個(gè)人是否獲獎(jiǎng)不僅僅與考試成績(jī)?cè)谂R界 點(diǎn)上下有關(guān)(x c或x V c),也和年齡有關(guān)(例如年齡大的人容易獲 獎(jiǎng),而年齡小的人很難 獲獎(jiǎng)),則回歸中斷設(shè)計(jì)就無(wú)法探究榮譽(yù)獎(jiǎng)勵(lì)本身對(duì) 未來(lái)學(xué)術(shù)成就的影響(因?yàn)閷W(xué)術(shù)成就的中斷也有可能是因?yàn)槟挲g不同) (Hahn et al. ,2001)。在社會(huì)學(xué)研究中,類似的多重中斷并不少見(jiàn), 這也使得回歸中 斷設(shè)計(jì)的應(yīng)用范圍受到限制。2傾向值匹配和工具變量除了回歸中斷設(shè)計(jì),在經(jīng)濟(jì)學(xué)及傳染病學(xué)領(lǐng)域應(yīng)用比較廣泛的另外一個(gè)方法是 工具變量(instrumental variable) ( An

37、grist et al.,1996; Angrist& Krueger, 2001; Greenland, 2000; Martens et al. , 2006;Newhouse & McClellan, 1998)。假定我們希望探索變量X對(duì)Y的因果關(guān) 系,混淆變量U的存在會(huì)影響我們的研究。這時(shí)我們尋找到一個(gè)工具變量 Z,該變量的特點(diǎn)在于和X相關(guān),但不和Y直接相關(guān)(除非是通過(guò)X),同 時(shí)Z也不與混淆變量U相關(guān)。這樣,我們就不直接考察X是否能影響Y,而 是轉(zhuǎn)而考察Z對(duì)Y的影響。如果Z很明顯地影響了 Y,我們就能得出X影 響了 Y的結(jié)論。工具變量的基本邏輯表示如圖2。通過(guò)圖2我們很容易理解工具變

38、量的基本邏輯,由于混淆變量U和X互相影 響,我們很難直接探索X對(duì)Y的“純”作用。所以我們找 到工具變量Z。Z 和Y的關(guān)系只能通過(guò)X,因此如果我們能夠發(fā)現(xiàn)Z對(duì)Y有作用,我們就能間 接得出結(jié)論說(shuō)X對(duì)Y有作用,從而確定了一種因果關(guān)系。圖2工具游的基本謖輯從嚴(yán)格的統(tǒng)計(jì)學(xué)意義上來(lái)說(shuō),利用工具變量進(jìn)行因果推論需要滿足很多假設(shè)條 件(Imbens & Angrist, 1994)。這里可以通過(guò)一個(gè)經(jīng)典實(shí)例來(lái)展示這些假 設(shè)。安格里斯特等人(Angrist et al. , 1996)使用工具變 量分析了服 兵役(X)是否會(huì)對(duì)士兵在退伍后的健康狀況(Y)產(chǎn)生因果 性影響。這 里,服兵役的工具變量是抽簽的結(jié)果(Z)。當(dāng)抽到的數(shù)字 低于某個(gè)值則服 兵役,而高于這個(gè)值則不需服兵役。在這個(gè)例子中,安 格里斯特及其同事闡 述了使用工具變量進(jìn)行因果推論的幾個(gè)關(guān)鍵假 設(shè)。第一個(gè)假設(shè)稱為“單位實(shí) 驗(yàn)效果值穩(wěn)定假設(shè)(stable unit treatment value assumption) 。這意味著每個(gè)人的抽簽結(jié)果不會(huì)對(duì)他人是否服兵役產(chǎn)生影響。第二個(gè)假設(shè)就是上 面提到的非混淆假設(shè),即抽簽的結(jié) 果和個(gè)體的健康之間相互獨(dú)立。由于這里 是隨機(jī)抽簽,因此這一條件得到滿足。第三個(gè)假設(shè)是“排除性假 設(shè)(exclusion restriction)。這一假設(shè)意味著在因果推論中排除兩 類人。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論