高級計量經濟學及Stata應用課件_第1頁
高級計量經濟學及Stata應用課件_第2頁
高級計量經濟學及Stata應用課件_第3頁
高級計量經濟學及Stata應用課件_第4頁
高級計量經濟學及Stata應用課件_第5頁
已閱讀5頁,還剩110頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Lecture-8-Dynamic-and-Nonlinear-Panels-高級計量經濟學及Stata應用課件2021-10-08陳強計量及Stata應用(c)

20142動態(tài)面板

有些經濟理論認為,由于慣性或部分調整,個體的當前行為取決于過去行為,比如資

本存量的調整。

如果在面板模型中,解釋變量包含了被解釋變量的滯后值,則稱之為“動態(tài)面板數據”(Dynamic

Panel

Data,簡記DPD)。對于動態(tài)面板,即使FE也不一致例:其離差形式為:其中,,由于 中包含 的信息,而后者與 相關,故FE不一致,稱為“動態(tài)面板偏差”(dynamic

panel

bias)。2021-10-08陳強計量及Stata應用(c)

20143一般的動態(tài)面板模型先作一階差分以消去個體效應:

但 依然與 相關,因此, 為內生變量,需要尋找適當的工具變量才能得到一致估計。2021-10-08陳強計量及Stata應用(c)

20144Anderson-Hsiao估計量作為Anderson

and

Hsiao(1981)提出使用

的工具變量,然后進行2SLS估計。顯然,二者相關,滿足相關性。

如果 不存在自相關(對此假設須進行檢驗),則

與 不相關,滿足外生性。2021-10-08陳強計量及Stata應用(c)

20145差分GMM根據同樣的邏輯,更高階的滯后變量也是有效工具變量,而Anderson-Hsiao估計量未加以利用,故不是最有效率的。

Arellano

and

Bond

(1991)使用所有可能的滯后變量作為工具變量(顯然工具變量個數多于內生變量個數),進行GMM估計。

這就是“差分GMM”(Difference

GMM)(因為是對差分后的方程進行GMM估計)。2021-10-08陳強計量及Stata應用(c)

201462021-10-08陳強計量及Stata應用(c)

20147差分GMM的缺點

如果T很大,則會有很多工具變量,容易出現弱工具變量(weak

instruments)問題(通常滯后越多期則相關性越弱),產生偏差。

解決方法是在使用Stata命令xtabond時,限制最多使用q階滯后變量作為工具變量,但文獻中對于如何選擇工具變量個數并無明確指南。差分GMM的缺點(續(xù))

如果 僅為前定變量而非嚴格外生,則經過差分后,就可能與導致內生性??墒褂孟嚓P,作為IV。

不隨時間變化的變量法估計 的系數。被消掉了,故差分GMM無2021-10-08陳強計量及Stata應用(c)

20148水平GMM

Arellano

and

Bover(1995)重新回到了差分之前的水平方程(level

equation),并使用作為 的工具變量。顯然,二者是相關的。且如果無自相關,則;但須假設 與個體效應 不相關,才能保證這些工具變量與水平方程的復合擾動項不相關。此假設意味著經濟離穩(wěn)態(tài)均衡不遠。2021-10-08陳強計量及Stata應用(c)

20149系統(tǒng)GMM

Blundell

and

Bond(1998)把差分GMM與水平

GMM結合在一起,將差分方程與水平方程作為一個方程系統(tǒng)進行GMM估計,稱為“系統(tǒng)

GMM”(System

GMM)。

系統(tǒng)GMM的優(yōu)點是可提高估計效率,且可估計不隨時間變化的變量的系數(系統(tǒng)GMM包含對水平方程的估計)。但必須額外地假定與 無關;否則,不能使用系統(tǒng)GMM。

在水平方程中,如果 也包括內生變量,則同樣可用其滯后值作為工具變量。2021-10-08陳強計量及Stata應用(c)

2014102021-10-08陳強計量及Stata應用(c)

201411差分GMM的Stata命令xtabond

depvar

indepvars,lags(p)

maxldep(q) twostep

vce(robust)

pre(varlist) endogenous(varlist)

inst(varlist)

“depvar”為被解釋變量,“indepvars”為解釋變量。

“l(fā)ags(p)”表示使用被解釋變量的p階滯后值作為解釋變量默認p=1;“maxldep(q)”表示最多使用q階被解釋變量的

滯后值作為工具變量,默認使用所有可能的滯后值。選擇

項“twostep”表示使用GMM,默認2SLS;“pre(varlist)”“endogenous

(varlist)”,“inst(varlist)”分別指定前量、內生變量與額外的工具變量。

“vce(robust)”表示使用穩(wěn)健標準誤,允許存在異方差,且針對兩步GMM估計進行調整,Stata稱為“WC-RobustStandard

Error”(Windmeijer,2005;WC表示“Windmeijer

bias-corrected”)2021-10-08陳強計量及Stata應用(c)

201412實例:美國工人的工資決定

以數據集mus08psidextract.dta為例。該面板數據集包含595名美國工人1976-1982年有關工資的以

下變量(n

=595,T

=7的短面板):

lwage(工資對數),ed(教育年限),exp(工齡),

exp2(工齡平方),wks(weeks

worked,工作周數),

occ(是否藍領工人),ind(是否在制造業(yè)工作),

ms(婚否),south(是否在美國南方),smsa(是否

住大城市),union(是否由工會合同確定工資),

fem(是否女性),blk(是否黑人)。待估計模型以差分GMM估計以下動態(tài)面板模型:

其中,occ,

south,

smsa,

ind為外生解釋變量,

wks及其一階滯后為前定解釋變量,而ms,union為內生解釋變量。2021-10-08陳強計量及Stata應用(c)

2014132021-10-08陳強計量及Stata應用(c)

201414差分GMM估計use

mus08psidextract.dta,clearxtabond

lwage

occ

south

smsa

ind,lags(2)

maxldep(3) pre(wks,

lag(1,2))

endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))

twostep

vce(robust)

選擇項“l(fā)ags(2)”表示解釋變量中包含被解釋變量的一階與二階滯后;“maxldep(3)”表示最多使用被解釋變量的三個滯后值作為工具變量;

選擇項“pre(wks,lag(1,2))”表示變量wks及其一階滯后L.wks為前定解釋變量,而使用其兩個更高階滯后值(即二階與三階)為工具變量;

選擇項“endogenous(ms,lag(0,2))”指定變量ms為內生解釋變量(其中的“0”表示內生解釋變量不包含ms的任何滯后),而最多使用其兩個更高階滯后值(即二階與三階)為工具變量。2021-10-08陳強計量及Stata應用(c)

201415擾動項的自相關檢驗

差分GMM成立的前提是,擾動項相關。即使原假設“擾動項不存在自無自相關”成立,“擾動項的一階差分”(first-differenced

errors)將存在一階自相關,因為

但擾動項的差分將不存在二階或更高階的自相關。為此,可以通過檢驗擾動項的差分是否存在一階

與二階自相關,來檢驗原假設。2021-10-08陳強計量及Stata應用(c)

201416擾動項的自相關檢驗(續(xù))estat

abond

結果顯示,擾動項的差分存在一階自相關,但不存在二階自相關,故接受原假設。2021-10-08陳強計量及Stata應用(c)

201417過度識別檢驗此差分GMM使用了40個工具變量,須進行過度識別檢驗。重新運行“xtabond”命令,但略去選擇項“vce(robust)”quietly

xtabond

lwage

occ

south

smsa ind,lags(2)

maxldep(3)

pre(wks,lag(1,2)) endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))

twostepestat

sargan2021-10-08陳強計量及Stata應用(c)

2014182021-10-08陳強計量及Stata應用(c)

201419系統(tǒng)GMM估計xtdpdsys

lwage

occ

south

smsa

ind,lags(2) maxldep(3)

pre(wks,

lag(1,2)) endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))

twostep vce(robust)結果參見下頁。系統(tǒng)GMM的系數估計值與差分

GMM很接近,但前者的標準誤比后者更小。也許 因為使用了更多的工具變量(共60個),系統(tǒng)GMM 估計得更準確些。2021-10-08陳強計量及Stata應用(c)

201420系統(tǒng)GMM的擾動項自相關檢驗estat

abond

可在5%的顯著性水平上拒絕“擾動項差分的二階自相關系數為0的假設”,故可拒絕“擾動項無自相關”的原假設。我們懷疑系統(tǒng)GMM是否適用。2021-10-08陳強計量及Stata應用(c)

201421系統(tǒng)GMM的過度識別檢驗quietly

xtdpdsys

lwage

occ

south

smsa ind,lags(2)

maxldep(3)

pre(wks,lag(1,2)) endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))

twostepestat

sargan強烈拒絕原假設2021-10-08陳強計量及Stata應用(c)

2014222021-10-08陳強計量及Stata應用(c)

201423改進的系統(tǒng)GMM估計

對于此數據集,雖然系統(tǒng)GMM可能更有效率,但成立前提不滿足;也可能模型設定不當。為解決自相關,在解釋變量中引入被解釋變量的三階滯后;

為改善工具變量有效性,對于內生解釋變量ms,union僅使用一個更高階滯后值(即二階滯后)為工具變量,但最多使用被解釋變量的五個滯后值作為工具變量,重新進行系統(tǒng)GMM估計與檢驗:xtdpdsys

lwage

occ

south

smsa

ind,lags(3) maxldep(5)

pre(wks,lag

(1,2)) endogenous(ms,lag(0,1)) endogenous(union,lag(0,1))

twostep vce(robust)2021-10-08陳強計量及Stata應用(c)

201424擾動項自相關檢驗estat

abond可接受擾動項無自相關的原假設。2021-10-08陳強計量及Stata應用(c)

201425過度識別檢驗quietly

xtdpdsys

lwage

occ

south

smsa

ind,lags(3) maxldep(5)

pre(wks,lag(1,2))

endogenous(ms,lag(0,1)) endogenous(union,lag(0,1))

twostepestat

sargan可在5%水平上接受“所有工具變量都有效”的原假設。2021-10-08陳強計量及Stata應用(c)

2014262021-10-08陳強計量及Stata應用(c)

201427非線性面板

對于面板數據,如果被解釋變量為虛擬變量、計數變量、受限變量等,則為非線性面板。非線性面板一般不適用線性面板的方法。

主要包括:面板二值選擇模型、面板計數模型、面板Tobit2021-10-08陳強計量及Stata應用(c)

201428面板二值選擇模型

對于面板數據,如果被解釋變量為虛擬變量,則稱為“面板二值選擇模型”(binarychoice

model

for

panel

data)。對于二值選擇行為,通常通過一個“潛變量”(latent

variable)來概括該行為的凈收益

(收益減去成本)。如果凈收益大于0,則選擇做;否則,選擇不做。面板二值模型的設定假設凈收益為

為不可觀測的潛變量, 為個體效應,而解釋變量 不含常數項。個體選擇規(guī)則為2021-10-08陳強計量及Stata應用(c)

201429面板Probit與面板Logit與Probit/Logit模型的推導類似:

如果擾動項 服從標準正態(tài),則為面板Probit;如果服從邏輯分布,則為面板Logit。2021-10-08陳強計量及Stata應用(c)

201430混合回歸

面板二值模型的主要估計方法包括混合回歸、隨機效應估計與固定效應估計。如果 ,則為混合回歸(pooledprobit或pooled

logit),可作為截面數據處理(無個體效應),使用截面數據的相關Stata命令即可。由于同一個體不同時期的擾動項可能存在自相關,故應使用以面板為聚類的聚類穩(wěn)健標準誤

(cluster-robust

standard

error)。2021-10-08陳強計量及Stata應用(c)

2014312021-10-08陳強計量及Stata應用(c)

201432混合回歸的Stata命令probit

y

x1

x2

x3,vce(cluster

id) (混合probit回歸)logit

y

x1

x2

x3,

vce(cluster

id) (混合logit回歸)id為用來確定面板單位的變量。面板二值模型的個體效應

更一般地,允許個體效應的存在,即不同個體擁有不同的。如果與所有解釋變量均不相關,稱為“隨機效應模型”(Random

Effects

Model,簡記RE)。 如果 與某解釋變量相關,稱為“固定效應模型”(Fixed

Effects

Model,簡記FE)。 對于線性面板的隨機效應模型,一般使用GLS。但非線性面板不便使用GLS,故進行MLE估計。2021-10-08陳強計量及Stata應用(c)

201433隨機效應的MLE估計假設 ,記其密度函數為

。以Logit為例。給定,個體i的條件分布為但 不可觀測。將聯合密度分解,然后積掉2021-10-08陳強計量及Stata應用(c)

201434隨機效應的MLE估計(續(xù))

最大化此似然函數即得到“隨機效應Logit估計量”(Random

Effect

Logit)。

如將邏輯分布改為正態(tài)分布,則為“隨機效應Probit估計量”(Random

Effect

Probit)。2021-10-08陳強計量及Stata應用(c)

2014352021-10-08陳強計量及Stata應用(c)

201436MLE的數值計算

上式積分無解析解,Butler

and

Moffitt

(1982)提出“Gauss-Hermite

quadrature”進行數值積分

(numerical

integration)。

Stata默認在12點上進行“adaptive

Gauss-Hermite

quadrature”計算。

Stata提供命令quadchk檢驗計算精度(取決于點數),即使用其他計算點數,比較結果的穩(wěn)定性。如結果不穩(wěn)健,應增加點數,直至穩(wěn)定。隨機效應模型的缺點 在進行隨機效應估計時,已將 積分積掉,故得不到對個體效應 的估計。因此,無法預測 的發(fā)生概率或計算解釋變量對 的邊際效應。解決方法之一是假設 =

0。2021-10-08陳強計量及Stata應用(c)

201437對個體隨機效應的檢驗同一個體不同時期擾動項之間的協方差:同一個體不同時期擾動項之間的自相關系數:越大,則復合擾動項中個體效應部分越重要。如果 ,則不存在個體隨機效應,應選擇混合回歸。對此可進行LR檢驗。2021-10-08陳強計量及Stata應用(c)

201438面板二值模型隨機效應的Stata命令xtprobit

y

x1

x2

x3(默認為隨機效應probit)xtlogit

y

x1

x2

x3(默認為隨機效應logit)

輸出結果包含對原假設“ ”的LR檢驗結果(Stata記為rho)。如拒絕原假設,則采用隨機效應模型;反之,支持混合回歸。2021-10-08陳強計量及Stata應用(c)

201439面板二值模型的固定效應估計其中,個體效應 與解釋變量 相關。

對于線性面板,一般通過組內變換或一階差分消去固定效應。但這些變換對非線性面板不起作用

即使加入個體虛擬變量(LSDV法),仍得不到一致估計,因為當 時,待估計的個體效應的個數隨之增加,稱為“伴生參數”(incidentalparameters)。2021-10-08陳強計量及Stata應用(c)

201440如何解決伴生參數問題

對于固定效應的面板Probit模型,目前尚無法解決此伴生參數問題。對于固定效應的面板Logit模型,可找到的“充分統(tǒng)計量”(sufficient

statistic)在給定此充分統(tǒng)計量的條件下進行“條件最大似然估計”(conditional

MLE)。2021-10-08陳強計量及Stata應用(c)

201441充分統(tǒng)計量的概念考慮總體參數與統(tǒng)計量W。如果統(tǒng)計量W包含了的信息,則稱W為參數樣本中所有可用來估計的充分統(tǒng)計量。

給定W之后,任何根據樣本計算的其他統(tǒng)計量都不可能提供關于 的額外信息。

樣本數據在給定充分統(tǒng)計量W后的條件分布將不再依賴于 (這正是充分統(tǒng)計量的嚴格定義)。2021-10-08陳強計量及Stata應用(c)

201442個體效應的充分統(tǒng)計量對于Logit模型,Chamberlain

(1980)使用作為 的充分統(tǒng)計量,并最大化在給定 情況下的條件似然函數。

以兩期模型為例,即T

=

2。對于個體i,只有三種可能情形,即 0,1,或

2。。必然有 ,故,對數似然函數為0,對樣本似然函數無貢獻,等于損失了這些觀測值。2021-10-08陳強計量及Stata應用(c)

201443條件最大似然估計(2) 。必有 。同樣道理,這些觀測值不包含任何有助于估計 的信息。(3)。或者 ,或者,分別計算條件概率:2021-10-08陳強計量及Stata應用(c)

201444條件最大似然估計(續(xù))2021-10-08陳強計量及Stata應用(c)

201445條件最大似然估計(續(xù)2)分子與分母的被同時消去;邏輯分布的方便。2021-10-08陳強計量及Stata應用(c)

201446固定效應模型的缺點無法估計不隨時間變化變量的系數

將損失所有

或 的觀測值,導致樣本容量減少。

使用條件MLE時消去 ,故無法估計個體效應 。解決方法之一是假設 =

0。2021-10-08陳強計量及Stata應用(c)

2014472021-10-08陳強計量及Stata應用(c)

201448個體固定效應的檢驗可使用豪斯曼檢驗,在固定效應與混合回歸之間選擇。

原假設為不存在個體固定效應。如原假設成立,則固定效應與混合回歸都一致,但混合回歸更有效率(固定效應模型未充分利用的信息,且可能損失樣本容量)。

如果原假設不成立,則固定效應一致,混合回歸不一致。如果二者的系數估計值相差較大,則應拒絕原假設。在固定效應與隨機效應之間選擇,也可進行豪斯曼檢驗。2021-10-08陳強計量及Stata應用(c)

201449固定效應面板Logit的Stata命令xtlogit

y

x1

x2

x3,fe選擇項“fe”表示固定效應,默認為隨機效應。2021-10-08陳強計量及Stata應用(c)

201450例:中國北方農民起義

Chen(2013)以數據集uprising.dta研究中國北方農民起義的決定因素,橫截面為王朝(dyn),時間為年(year)。被解釋變量:uprising(是否發(fā)生農民起義)

解釋變量:age(王朝年齡),pop(人口),temp(氣溫),sfamine(是否發(fā)生嚴重饑荒),sfamine1(sfamine一階滯后),sfamine2(sfamine二階滯后),sfamine3(sfamine三階滯后),relief(有否政府救濟),relief1

(relief一階滯后),r(relief的二階滯后),relief3

(relief的三階滯后)。2021-10-08陳強計量及Stata應用(c)

201451固定效應面板Logituse

uprising.dta,clearxtlogit

uprising

age

pop

temp

sfamine sfamine1

sfamine2

sfamine3

relief relief1

relief2

relief3,fe

nologestimates

store

FE2021-10-08陳強計量及Stata應用(c)

2014522021-10-08陳強計量及Stata應用(c)

201453解釋

有一個朝代(共43年觀測值)從未發(fā)生農民起義,在估計固定效應模型被去掉。為第二個朝代(dyn=2),曹魏。

變量age,pop,temp的系數至少在5%水平上顯著為正,這意味著王朝后期更易發(fā)生起義;人口壓力越大,起義概率越高;氣溫越高,越易發(fā)生起義。變量sfamine(嚴重饑荒)的當期系數在1%水平上顯著為正,前三階滯后的系數在10%水平上顯著為正,嚴重饑荒顯著地增加農民起義的發(fā)生概率。

變量relief(政府救災)的各期系數至少在5%水平上顯著為負,意味著政府救災有助于緩解農民起義。2021-10-08陳強計量及Stata應用(c)

201454混合回歸Logit

為保持與固定效應的樣本一致,在混合回歸中也去掉了“dyn=2”的那個朝代。logit

uprising

age

pop

temp

sfamine sfamine1

sfamine2

sfamine3

relief relief1

relief2

relief3

if dyn~=2,vce(cluster

dyn)

nolog2021-10-08陳強計量及Stata應用(c)

2014552021-10-08陳強計量及Stata應用(c)

201456豪斯曼檢驗

為在固定效應與混合回歸之間進行選擇,進行豪斯曼檢驗。但豪斯曼檢驗不允許混合回歸使用選擇項“vce(cluster

dyn)”,故重新進行混合回歸quietly

logit

uprising

age

pop

temp

sfamine sfamine1

sfamine2

sfamine3

relief

relief1 relief2

relief3

if

dyn~=2,nologestimates

store

POOLEDhausman

FE

POOLED豪斯曼檢驗結果強烈拒絕混合回歸的原假設,應使用固定效應模型。2021-10-08陳強計量及Stata應用(c)

2014572021-10-08陳強計量及Stata應用(c)

201458隨機效應面板Logitxtlogit

uprising

age

pop

temp

sfamine sfamine1

sfamine2

sfamine3

relief relief1

relief2

relief3

if

dyn~=2,re nologestimates

store

RE結果見下頁2021-10-08陳強計量及Stata應用(c)

201459解釋LR檢驗強烈拒絕原假設“效應模型,不宜進行混合回歸?!?,應使用面板隨機

隨機效應面板Logit的計算使用數值積分。下面使用命令quadchk檢驗此數值積分的穩(wěn)健性。quadchk,noout選擇項“noout”表示不顯示重估模型的結果。

結果見下頁:所有系數的相對差距均小于 ,故數值積分結果值得信賴。2021-10-08陳強計量及Stata應用(c)

2014602021-10-08陳強計量及Stata應用(c)

2014612021-10-08陳強計量及Stata應用(c)

201462豪斯曼檢驗(again)

為了在固定效應與隨機效應模型之間進行選擇,再次進行豪斯曼檢驗。hausman

FE

RE

結果見下頁:可在5%水平上拒絕隨機效應的原假設,應使用固定效應模型。2021-10-08陳強計量及Stata應用(c)

2014632021-10-08陳強計量及Stata應用(c)

201464面板Probit的隨機效應模型為了演示,估計面板Probit的隨機效應模型。xtprobit

uprising

age

pop

temp

sfamine sfamine1

sfamine2

sfamine3

relief

relief1 relief2

relief3

if

dyn~=2,re

nolog

結果見下頁:LR檢驗強烈拒絕混合Probit回歸,應使用隨機效應模型。

隨機效應面板Probit的結果與隨機效應面板Logit相似。2021-10-08陳強計量及Stata應用(c)

2014652021-10-08陳強計量及Stata應用(c)

201466面板計數模型考慮被解釋變量為計數變量的面板數據。例:若干企業(yè)在一段時間內每年獲得專利的個數例:全國各省在幾年內每年發(fā)生礦難的數目例:世界各國近幾十年每年發(fā)生示威游行的次數例:一些病人在一段時間內的每期發(fā)病次數面板泊松回歸

對于個體i,時期t,記被解釋變量為 ,假設的概率由參數為 的泊松分布所決定:為保證泊松到達率非負,假設

其中, 不含常數項,而 為乘積形式的個體效應

(multiplicative

individual

effects)。2021-10-08陳強計量及Stata應用(c)

201467混合泊松回歸

如果 ,則不存在個體效應,為混合泊松回歸(pooledPoisson)??勺鳛榻孛鏀祿幚?,直接使用截面數據的泊松回歸Stata命令,須使用聚類穩(wěn)健標準誤?;旌喜此苫貧w的Stata命令為,poisson

y

x1

x2

x3,vce(cluster

id)

irrid為用來確定面板單位的變量。選擇項“irr”表示匯報 發(fā)生率比(incidence

rate

ratio)。2021-10-08陳強計量及Stata應用(c)

201468面板計數模型的個體效應一般允許個體效應存在,即不同個體擁有不同的

。

如果 與所有解釋變量均不相關,則為“隨機效應模型”(Random

Effects

Model,簡記RE)。

如果 與某解釋變量相關,則為“固定效應模型”(FixedEffects

Model,簡記FE)。對于隨機效應模型,由于是非線性模型,故進行MLE估計2021-10-08陳強計量及Stata應用(c)

201469隨機效應的MLE估計

記 的密度函數為 。假設樣本為iid,則在給定

的情況下,個體i的條件分布為,而密度函數可寫為2021-10-08陳強計量及Stata應用(c)

201470隨機效應的MLE估計(續(xù))

由于 ,故常選擇 服從Gamma分布(指數分布與卡方分布為Gamma分布特例)。特別地,假設,其中 ,則

,

將 的概率密度代入上頁方程,可得到負二項分布的概率密度,然后進行MLE估計。

由于 為個體異質性 的方差,故可對“ ”進行LR檢驗來判斷是否存在個體異質性,即究竟應使用隨機效應泊松回歸還是混合泊松回歸。2021-10-08陳強計量及Stata應用(c)

201471隨機效應的MLE估計(續(xù)2) 另一方法假設 ,但無解析解,需用“Gauss-Hermite

quadrature”方法進行數值積分;使用命令quadchk檢驗數值積分的精確度 類似地,可通過檢驗“ ”

(Stata稱為“sigma_u

=

0”)來判斷是否存在個體異質性。2021-10-08陳強計量及Stata應用(c)

201472固定效應的面板泊松模型類似于固定效應的面板二值選擇模型,可使用 作為 的充分統(tǒng)計量。

計算在給定 情況下的條件似然函數,然后進行條件最大似然估計(conditional

MLE)。如果 ,則意味著,故個體i的觀測值對于條件似然函數的貢獻為0,將損失這部分樣本容量。2021-10-08陳強計量及Stata應用(c)

201473固定效應vs.隨機效應

固定效應模型的另一缺點是,無法估計不隨時間而變的變量系數。

固定效應泊松回歸的最大優(yōu)點在于,它允許個體異質性 與解釋變量 相關。

在固定效應與隨機效應泊松回歸之間進行選擇時,可使用豪斯曼檢驗。2021-10-08陳強計量及Stata應用(c)

2014742021-10-08陳強計量及Stata應用(c)

201475面板泊松回歸的Stata命令xtpoisson

y

x1

x2

x3,fe

irrxtpoisson

y

x1

x2

x3,normal選擇項“fe”表示固定效應,默認為隨機效應。選擇項“irr”表示匯報發(fā)生率比(incidence

rate

ratio)。

選擇項“normal”表示在估計隨機效應模型時,指定個體異質性服從正態(tài)分布,默認為Gamma分布。面板負二項回歸

泊松回歸的缺陷是,它假設方差等于期望。如果存在過度分散(方差大于期望),可考慮負二項回歸。

如果不存在個體異質性,則可直接進行混合負二項回歸,其Stata命令為nbreg

y

x1

x2

x3,

vce(cluster

id)id為用來確定面板單位的變量。Stata將輸出過度分散參 數

的95%置信區(qū)間。根據此置信區(qū)間,可以檢驗原假 設“

”(對應于泊松回歸)。2021-10-08陳強計量及Stata應用(c)

201476隨機效應的面板負二項模型對于隨機效應的面板負二項模型,假設個體異質性服從Beta(r,s)分布。將個體異質性 積分掉,再進行MLE估計處理方法類似隨機效應的面板泊松模型2021-10-08陳強計量及Stata應用(c)

201477固定效應的面板負二項模型

給定 (個體異質性的充分統(tǒng)計量),進行條件最大似然估計(conditional

MLE)。

固定效應負二項回歸的奇特之處在于,可以估計不隨時間而變的變量系數。

在固定效應與隨機效應負二項回歸之間選擇,可使用豪斯曼檢驗。

在泊松回歸與負二項回歸之間選擇,涉及穩(wěn)健性與有效性的權衡2021-10-08陳強計量及Stata應用(c)

2014782021-10-08陳強計量及Stata應用(c)

201479面板負二項回歸的Stata命令xtnbreg

y

x1

x2

x3,fe

irr

選擇項“fe”表示固定效應,默認為“re”(隨機效應)。

選擇項“irr”表示匯報發(fā)生率比(incidence

rateratio)。2021-10-08陳強計量及Stata應用(c)

201480例:共保率如何影響對醫(yī)療服務的使用

以數據集mus18data.dta為例,研究不同的共保率(coinsurancerate)如何影響對醫(yī)療服務的使用。如果共保率為25%,則意味著投保人支付25%的醫(yī)療費用,而保險公司支付75%。被解釋變量:mdu(個體看醫(yī)生的次數),為計數變量。

解釋變量:lcoins(共保率加1再取對數,即log(coinsurance+1)),ndisease(所患慢性病的數目),female(是否女性),age(年齡),lfam(家庭人數的對數),child(是否有孩子)?;旌喜此苫貧wuse

mus18data.dta,

clearxtset

id

yearpoisson

mdu

lcoins

ndisease

female

age

lfam child,vce(cluster

id)

nolog結果見下頁2021-10-08陳強計量及Stata應用(c)

2014812021-10-08陳強計量及Stata應用(c)

2014822021-10-08陳強計量及Stata應用(c)

201483解釋所有解釋變量至少在5%水平上顯著。

lcoins與lfam的系數顯著為負,表明共保率越高、家庭成員越多,則看醫(yī)生次數越少

ndisease,female,age與child的系數顯著為正,表明所患慢性病越多、女性、年齡越大、有子女,則看醫(yī)生次數越多。2021-10-08陳強計量及Stata應用(c)

201484隨機效應的面板泊松回歸

由于命令“xtpoisson,re”不提供聚類穩(wěn)健標準誤,故使用選擇項“vce(boot)”計算聚類自助標準誤。xtpoisson

mdu

lcoins

ndisease

female

age

lfam child,re

vce(boot,reps(50)

seed(10101) nodots)

“reps(50)”表示重復抽樣50次,“seed(10101)”表示以10101作為隨機數的種子,“nodots”表示不顯示重復抽樣過程的點(dots)。運行此命令將花費較長時間2021-10-08陳強計量及Stata應用(c)

201485解釋

上頁最后一行的LR檢驗結果強烈拒絕

“alpha=0”的原假設(對應于混合泊松回歸,其中 為個體異質性 的方差),

故拒絕混合泊松模型,認為應使用隨機效應的面板泊松模型。2021-10-08陳強計量及Stata應用(c)

2014862021-10-08陳強計量及Stata應用(c)

201487隨機效應的面板泊松回歸(續(xù))

命令“xtpoisson,re”默認假設個體異質性服從Gamma分布。下面使用選擇項“normal”指定個體異質性服從正態(tài)分布。為了提高速度,使用普通標準誤(不使用自助標準誤)。xtpoisson

mdu

lcoins

ndisease

female

age

lfam child,re

normal

nolog結果見下頁:估計系數與默認Gamma分布的結果接近。quadchk,nooutput(檢驗數值積分的準確度)2021-10-08陳強計量及Stata應用(c)

2014882021-10-08陳強計量及Stata應用(c)

201489重新估計對于某些系數,相對差距(relative

difference)超過

下面使用選擇項“intpoints(#)”將數值積分的計算點數增加到16(默認為12)。xtpoisson

mdu

lcoins

ndisease

female

age

lfam child,re

normal

nolog

intpoints(16)quadchk,nooutput(所有系數的相對差距均小于,故可信賴此結果)2021-10-08陳強計量及Stata應用(c)

2014902021-10-08陳強計量及Stata應用(c)

2014912021-10-08陳強計量及Stata應用(c)

2014922021-10-08陳強計量及Stata應用(c)

201493固定效應的面板泊松回歸

命令“xtpoisson,fe”不提供聚類穩(wěn)健標準誤。解決方法之一是使用自助標準誤的選擇項,比如“vce(boot,reps(50)seed(10101)nodots)”。

解決方法之二為下載非官方命令“xtpqml”(pqml表示Poisson

Quasi

Maximum

Likelihood),該命令的估計結果與“xtpoisson,fe”相同,但提供聚類穩(wěn)健標準誤。ssc

install

xtpqmlxtpqml

mdu

lcoins

ndisease

female

age

lfam child,i(id)必選項“i(id)”表示以變量id來確定面板單位。2021-10-08陳強計量及Stata應用(c)

2014942021-10-08陳強計量及Stata應用(c)

201495解釋

有265組數據由于僅有一期觀測值而被去掉,另有666組數據由于取值全為0而被去掉;

固定效應泊松模型無法識別不隨時間而變的變量系數(lcoins,ndisease,female),這些變量被去掉。

回歸結果的上半部提供普通標準誤(事實上,復制了命令“xtpoisson,fe”的估計結果);

下半部的標準誤則為聚類穩(wěn)健標準誤。聚類穩(wěn)健標準誤約是普通標準誤的兩倍,導致所有變量系數均不顯著。是否存在過度分散sum

mdu,detaildis

r(Var)/r(mean)7.093696

被解釋變量mdu的方差是平均值的7倍多,故可能存在過度分散。2021-10-08陳強計量及Stata應用(c)

201496混合負二項回歸進行混合負二項回歸,并使用聚類穩(wěn)健標準誤。nbreg

mdu

lcoins

ndisease

female

age lfam

child,vce(cluster

id)

nolog

結果見下表:過度分散參數

[1.24,

1.36],故拒絕“的95%置信區(qū)間為

”,認為存在過度分散,使用負二項回歸可以提高效率。2021-10-08陳強計量及Stata應用(c)

2014972021-10-08陳強計量及Stata應用(c)

2014982021-10-08陳強計量及Stata應用(c)

201499隨機效應的面板負二項回歸

進行隨機效應的面板負二項回歸,并使用自助標準誤。運行此命令須較長時間。xtnbreg

mdu

lcoins

ndisease

female

age

lfam child,nolog

vce(boot,reps(50)

seed(10101) nodots)

結果見下頁:最后一行的LR檢驗結果強烈拒絕了混合負二項回歸的原假設,認為應使用隨機效應的面板負二項回歸。2021-10-08陳強計量及Stata應用(c)

20141002021-10-08陳強計量及Stata應用(c)

2014101固定效應的面板負二項回歸

進行固定效應的面板負二項回歸,并使用自助標準誤;運行此命令須較長時間。xtnbreg

mdu

lcoins

ndisease

female

age

lfam child,fe

nolog

vce(boot,reps(50) seed(10101)

nodots)

結果見下頁:固定效應的面板負二項回歸可以估計不隨時間而變的變量系數,這是固定效應負二項回歸的優(yōu)點。2021-10-08陳強計量及Stata應用(c)

20141022021-10-08陳強計量及Stata應用(c)

2014103豪斯曼檢驗

使用豪斯曼檢驗在固定效應與隨機效應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論