2023年stata學(xué)習(xí)筆記大全_第1頁
2023年stata學(xué)習(xí)筆記大全_第2頁
2023年stata學(xué)習(xí)筆記大全_第3頁
2023年stata學(xué)習(xí)筆記大全_第4頁
2023年stata學(xué)習(xí)筆記大全_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1.一般檢查

假設(shè)系數(shù)為0,t比較大則拒絕假設(shè),認為系數(shù)不為0.

假設(shè)系數(shù)為O,P比較小則拒絕假設(shè),認為系數(shù)不為0.

假設(shè)方程不顯著,F(xiàn)比較大則拒絕假設(shè),認為方程顯著。

2.小樣本運用0LS進行估計的前提條件為:

(1)線性假定。即解釋變量與被解釋變量之間為線性關(guān)系。這一前提可以通過將非線性

轉(zhuǎn)換為線性方程來解決。

(2)嚴格外生性。即隨機擾動項獨立于所有解釋變量:與解釋變量之間所有時候都是正

交關(guān)系,隨機擾動項盼望為0。(工具變量法解決)

(3)不存在嚴格的多重共線性。一般在現(xiàn)實數(shù)據(jù)中不會出現(xiàn),但是設(shè)立過多的虛擬變量

時,也許會出現(xiàn)這種現(xiàn)象。Stata可以自動剔除。

(4)擾動項為球型擾動項,即隨即擾動項同方差,無自相關(guān)性。

3.大樣本估計時,一般規(guī)定數(shù)據(jù)在30個以上就可以稱為大樣本了。大樣本的前提是

⑴線性假定

(2)漸進獨立的平穩(wěn)過程

(3)前定解釋變量,即解釋變量與同期的擾動項正交。

(4)E(XiXit)為非退化矩陣。

(5)gt為鞅差分序列,且其協(xié)方差矩陣為非退化矩陣。

與小樣本相比,其不需要嚴格的外生性和正太隨機擾動項的規(guī)定。

4.命令

穩(wěn)健標準差回歸:regyxlx2x3,robust回歸系數(shù)與OLS同樣旭標準差存在差

異。假如認為存在異方差,則使用穩(wěn)健標準差。使用穩(wěn)健標準差可以對大樣本進行檢查。

只要樣本容量足夠大,在模型出現(xiàn)異方差的情況下,使用穩(wěn)健標準差時參數(shù)估計、假設(shè)

檢查等均可正常進行,即可以很大限度上消除異方差帶來的副作用

對單個系數(shù)進行檢查:test1nq=1

線性檢查:一…

5.假如回歸模型為非線性,不方便使用OLS,則可以采用最大似然估計法(MLE),或者非線性

最小二乘法(NLS)

6.違反經(jīng)典假設(shè),即存在異方差的情況。截面數(shù)據(jù)通常會出現(xiàn)異方差。

因此檢查異方差可以:

(1)看殘差圖,但只是直觀,也許并不準確。

rvfplot(residua|—versus-fittedplot)與擬合值的散點圖

rvpp1otvarname(residual-versus-predictorplot)與解釋變量的散點圖

擾動項的方差隨觀測值而變動,表達也許存在異方差。

(2)懷特檢查:

estatimtest,white(post-estimationinformationmatrixtest)

P比較小,則拒絕同方差假設(shè),表達存在異方差,不能用OLS。反之則證明為同方

差。

(3)BP檢查

estathe11est,iid(默認設(shè)立為使用擬合值y八)

estathettest,rhsiid(使用方程右邊的解釋變量,而不是y")

estathettest[varlist],iid(使用某個指定的解釋變量)

P小,則拒絕原假設(shè)。

假如存在異方差,則可以:

(1)使用0LS+穩(wěn)健標準差robust

(2)廣義最小二乘法(GLS)

(3)加權(quán)最小二乘法(WLS)

predictel,res(預(yù)測殘差)

ge2=elA2

輔助回歸:

g1ne2=log(e2)

regIne21nq,noc

Predict1ne2f計算輔助回歸的擬合值

ge2f=exp(lne2f)去掉對數(shù)即權(quán)重之倒數(shù)

regIntcInqInpIInpkInpf[aw=l/e2f]

regyxlx2x3[aw=l/var](aw表達analytica1weight,var表達隨即擾動項的方

差。)

或者:

predictu,residuals

predictyf,xb

genlnu2=ln(uA2)

genyf2=yfA2

quietIyreg1nu2yfyf2

predictnlu2f=exp(xb())

gensd=sqrt(u2f)

vw1sIntcInqInplInpfInpk,sd(sd)

(4)可行廣義最小二乘法(FGLS)

FGLS所做的過程和GLS同樣,只是GLS假設(shè)擾動項的方差已知,若要用GLS,必須

計算得到擾動項方差,而FGLS則是在未知方差的情況下求方差并最終通過將異方差轉(zhuǎn)換

為同方差后再運用OLS的結(jié)果。因此,GLS和FGLS在過程上是一致的。

6.自相關(guān)

時間序列中容易出現(xiàn)自相關(guān),而截面數(shù)據(jù)也也許存在空間自相關(guān)。人為解決數(shù)據(jù)如移動平

均等做法也也許導(dǎo)致自相關(guān)。

檢查自相關(guān)可以:

⑴作圖,但并不嚴格。

定義滯后算子L.(只有時間序列數(shù)據(jù)和面板數(shù)據(jù)才干定義時間變量。)

tssetyaear

一階差分:D.x=xt-xt-1D2.X=xt—xt-2

LD.表達一階差分的滯后值

畫圖:scatterelL.e1

acel(看自相關(guān)圖)

pace1(看偏相關(guān)圖)

(2)BG檢查

estatbgodfrey(默認p=l)

estatbgodfrey,lags(p)

estatbgodfrey,nomissO(使用不添加。的BG檢查)

使用命令ac查看自相關(guān)圖,或者設(shè)立較大的p值進行顯著性檢查,t期不顯著了,則選

擇P=T-1

記錄檢查P值小,則拒絕假設(shè)。

(3)box-pierceQ檢查/Ljung?BoxQ

regyx1x2x3

predicteI,resid

wntestqel(使用stata提供的默認滯后期)

wntestqel,lags(p)(使用自己設(shè)定的滯后期)

(4)DW檢查:現(xiàn)在已經(jīng)不常用,由于其只能檢查一階自相關(guān)。

estatdwatson

自相關(guān)的解決方法:

⑴使用OLS+異方差自相關(guān)穩(wěn)健的標準差(HeteroskedasticityandAutocorrelation

ConsistentStandardError,HAC)

neweyyxlx2x3,1ag(p)(HAC標準差,必須制定滯后階數(shù)p)

滯后期數(shù)選擇n7/4

(2)使用OLS+聚類穩(wěn)健的標準差(clusterrobuststandarderror)面板數(shù)據(jù)中經(jīng)常使用

聚類穩(wěn)健的標準差。

regyxlx2x3,cluster(state)(聚類穩(wěn)健標準差,假設(shè)"state”為聚類變量)

(3)使用可行廣義最小二乘法(FGLS)

praisyxlx2x3(使用默認的PW估計法)

praisyxlx2x3,core(使用CO估計法)

(4)修改模型設(shè)定,也許自相關(guān)是由于漏掉了自相關(guān)的解釋變量。

7多重共線性

在回歸后,使用命令VIF

estatvif經(jīng)驗表達,vif<10,則不存在多重共線性。

假如存在多重共線性,但是只關(guān)心整個方程預(yù)測被解釋變量的能力,或者只關(guān)心變量的

顯著性,則不必理睬多重共線性,由于多重共線性只是對單個解釋變量的解釋能力估計出

現(xiàn)了偏差。存在多重共線性,則逐個剔除。

8.漏掉變量(解決擾動項嚴格外生性的問題)

漏掉變量與解釋變量不相關(guān)時,擾動項與解釋變量不相關(guān)QLS估計仍然一致,但擾動項方

差過大,影響估計的精確度

假如漏掉變量與解釋變量相關(guān),擾動項與解釋變量則會相關(guān),導(dǎo)致OLS估計不再一致。

出現(xiàn)“漏掉變量偏差”。

所以可以不研究某些解釋變量而只對感愛好的解釋變量進行研究,但是重要的是漏掉解釋

變量不能與解釋變量相關(guān)。解決漏掉解釋變量的方法有:

(1)加入盡也許多的控制變量(controlvarible),從理論上說明漏掉變量與擾動項不

相關(guān),或很弱的相關(guān)

(2)使用代理變量(proxyvariable),這在控制變量不可得的時候采用,如用IQ代替

能力

(3)工具變量法

(4)使用面板數(shù)據(jù)(短面板、長面板、動態(tài)面板)

(5)隨即實驗和自然實驗

9.選擇解釋變量的個數(shù)的時候,要選擇適當?shù)姆绞健?/p>

⑴按照變量個數(shù)使得矯正可決系數(shù)最大的準則選擇個數(shù)(假如加入變量,反倒A-R變小,

則去掉加入的變量。)

(2)赤池信息準則(AICakaikeInformat!onCriteria)

(3)貝葉斯信息準則(BayesianInformationCriteria)

(4)漢南-昆信息準則(Hanan-QuinnInformationCriteria)但這一準則不常用

命令:estatic

取AICBIC最大時候的變量個數(shù)

1。.解決極端數(shù)據(jù):

regyxlx2x3

predictlev,leverage(列出所有解釋變量的影響力值)

gsort-1ev(將所有的觀測值按照lev的降序排列)

sum1ev(看LVE的最大值和平均值)

listlev必(列出影響力最大的三個值)

可以將極端數(shù)據(jù)加入和省略進行對比。

10虛擬變量

M個定性的量,最多可以有(M-1)個虛擬變量

設(shè)立虛擬變量:generated二(year>=1978)

如希望將每個省設(shè)立為虛擬變量,則需要:tabulateprovince,generate(pr)

回歸簡化為:regyxlx2x3pr2—pr31

11.工具變量法

這可以解決擾動項與自變量的相關(guān)問題,設(shè)立的工具變量需要與擾動項無關(guān)而與內(nèi)生解

釋變量相關(guān)。傳統(tǒng)的工具變量法一般通過兩階段最小二乘法TSLS、2SLS(twostageleas

tsquare)o第一階段,工具變量對內(nèi)生解釋變量回歸;第二階段,被解釋變量對工具變量的

擬合值進行回歸。多個工具變量的線性組合仍然可以作為工具變量。

命令:ivregress2slsdepvar[var1ist1](var1ist2=inslist)

Depvar為被解釋變量,varIist1為外生解釋變量,var1ist2為內(nèi)生解釋變

量,instlist為工具變量。如:

ivregress2s1syxl(x2=z1z2)

ivregress2s1syxl(x2x3=z1z2z3z4),rfirst

(r表達用異方差的標準差,first表達在結(jié)果中顯示第一階段的回歸。)

在面板數(shù)據(jù)中執(zhí)行2SLS可以用:xtivregdepvar[varlis11](varlist_2=varli

st_iv)(詳見heIpxtivreg)

檢查工具變量與解釋變量的相關(guān)性:即檢查工具變量是否為弱工具變量,

命令:estatfirststageza1Iforcenonrobust(a11表達顯示每個內(nèi)生變量的記

錄量,而非僅僅所有內(nèi)生變量綜合的記錄量,forcenonrobust表達及時在進行工具變量

法時用了穩(wěn)健標準差,也仍然允許計算estatfirststage)

解決弱工具變量的方法涉及

A.尋找更強的工具變量

B.弱工具變量較多,則舍棄弱工具變量,

C.用有限信息最大似然估計法(Limitedinformationmaximumlikelihoo

destimation,LIML)LIML與2sLs漸進等價,但在弱工具變量的情況下,LlM

L的小樣本性質(zhì)也許優(yōu)于2SLS.

命令為:ivregressIimldepvar[varlist1](varlist2=instIist)

過度辨認(即多余的工具變量的個數(shù))命令為:estatoverid但并不能告訴哪些工具變

量無效。

使用工具變量的前提是存在內(nèi)生解釋變量(即解釋變量與擾動項相關(guān)),這也需要檢

查。假如所有解釋變量都是外生變量則用OLS比用工具變量法更有效,反之應(yīng)當用工具

變量法。豪斯曼檢查就是假設(shè)所有解釋變量都為外生變量。

豪斯曼檢查的stata命令:

regyxlx2

estimatesstoreo1s(存儲OLS的結(jié)果)

ivregress2sIsyx1(x2=zlz2)(假設(shè)懷疑x2為內(nèi)生變量)

estimatesstoreiv(存儲2SLS的結(jié)果)

hausmanivols,constantsigmamore(根據(jù)存儲的結(jié)果進行豪斯曼檢查)

但uguo存在異方差,則OLS并不是最有效的,傳統(tǒng)額豪斯曼檢查不合用于異方差的情形,

解決方法是“自助法”;或者使用“杜賓?吳一豪斯曼DWH檢查”也可以合用于存在異方

差的情況。命令:estatendogenous

在球型擾動項的假定下,2SLS是最有效的,但是假如擾動項存在異方差或者自相關(guān),則

廣義矩估計(generalizedmethodofmomerits,GMM)更有效。GMM與2sLs的

關(guān)系就相稱于GLS與OLS之間的關(guān)系。

GMM過程:

seeinstallivreg2(安裝程序ivreg2)

seeinstal1ranktest(安裝此外一個在運營ivreg2時需要用到的輔助程序

ranktest)

usedata

xtsetpanelvartimevar(設(shè)立面板變量和時間變量)

ivreg2yxl(x2=z1z2),gmm2s

12.短面板:(固定效應(yīng)和隨機效應(yīng)模型)

N大T小的一般叫做短面板。面板數(shù)據(jù)的優(yōu)點為:可以解決漏掉變量的問題,可以提

供更多動態(tài)行為的信息,樣本較多從而估計更準確。但面板數(shù)據(jù)一般不滿足獨立同分布的

假設(shè)。

解決面板數(shù)據(jù)的一個方法是將面板數(shù)據(jù)當作橫截面數(shù)據(jù)解決進行OLS回歸,稱為“混

合回歸”,但它忽略了同一個聚類存在的相關(guān)問題。雖然通??梢约俣姘鍞?shù)據(jù)不同個體的

擾動項的獨立性,但是對于同一個體卻存在固定效應(yīng)和隨機效應(yīng)。

固定效應(yīng)模型通常可以采用組內(nèi)估計法(FE)和一階差分法(FD)。當T=2時,FD=FE;

當T>2,擾動項獨立同分布時,FE優(yōu)于FD。因此,實踐用FE較多,而對動態(tài)面板,則用FD

較多。

隨機效應(yīng)的存在使得OLS估計是一致但無效的??墒褂脧V義最小二乘法(FGLS)來

進行估計。也可以使用組間估計量(BE)

用豪斯曼檢查選擇是選用固定效應(yīng)模型還是隨機效應(yīng)模型,假如記錄量大于零界值,則

拒絕假設(shè)。假如假設(shè)成立,RE最有效,但是不合用于異方差的情形。解決方法是自助法和

輔助回歸。

非平衡面板經(jīng)常會損失數(shù)據(jù),導(dǎo)致破壞樣本的隨機性。

xtsetpaneIvatimevar(設(shè)定面板數(shù)據(jù)的面板個體變量和時間變量)

encodecountry,gen(entry)(為面板個體編號使得面板個體為整數(shù))

顯示面板數(shù)據(jù)記錄特性:

xtdes(顯示面板數(shù)據(jù)結(jié)構(gòu),是否為平衡面板)

xtsum(顯示組內(nèi)、組間和整體的記錄指標)

xttabvarname(顯示組內(nèi)、組間與政體的分布頻率)

xtlinevarname(對每個個體分別顯示該變量的時間序列圖,假如希望疊放,則選擇

overlay)

regyxlx2x3,vce(clusterid)(混合回歸,VCE是以id為cIuster

的聚類穩(wěn)健標準差,由于同一地區(qū)不同時間擾動項之間一般存在自相關(guān).)VCE是考慮到

了同一聚類之間的同方差現(xiàn)象。

xtregYX1X2X3,fevce(c1usterid)(使用固定效應(yīng)模型回歸)

得到的回歸中rh。表達來自個體效應(yīng)ui的比例。

XtregYX1X2X3,fe中的F檢查通過,則可以使用混合回歸模型。若拒絕假設(shè)

(P小),則FE更優(yōu),每個個體都有自己的固定效應(yīng)。但此時的由于沒有使用穩(wěn)健回歸,因此

F檢查并不有效,還需要進一步用LSDV法觀測。

LSDV法的stata命令為:

xi:xtregyxlx2x3i.id,vce(clusterid)(xi為增添互動項int

eractionexpansion,i.id表達根據(jù)擬定個體變量id生成的虛擬變量,在這里是state)(P

小,則說明個體虛擬變量很顯著,因此,不滿足無個體效應(yīng)的假設(shè),則不能用混合回歸模

型。)

對于固定效應(yīng)模型,也可以用一階差分法FD的命令:

xtserialyxlx2x31output(我的stata不能辨認xtserial咋回事?)一

般認為FE比FD有效,故較少使用FDo

也可以在固定效應(yīng)中考慮時間效應(yīng),即雙向固定效應(yīng):

tabyeargen(year)定義年度虛擬變量

xtregYX1X2X3year2-year7,fevce(c1usterid)(明明是statal2.為什么

說數(shù)據(jù)太多不能計算?要把前面的計算保存等清空,那后面怎么對比?)

testyearlyear2year3o?year7對年度虛擬變量的聯(lián)合檢查為

檢查存在時間效應(yīng)和固定效益后,還也許存在隨機效應(yīng),對隨機效應(yīng)進行檢查:

xtregyx1x2x3,revce(clusterid)(隨機效應(yīng)FGLS)

xtregyxlx2x3,mle(隨機效應(yīng)MLE)

檢查個體隨機效應(yīng)存在一個LM檢查,需要在隨機效應(yīng)估計之后進行:

.re—evce(clusersta.

estimatesstoreRE

xttest0

假如P很小,則拒絕假設(shè),認為在“隨即效應(yīng)”與“混合回歸”之間,應(yīng)當選擇“隨即效

應(yīng)”。

假如數(shù)據(jù)質(zhì)量不好,可以考慮使用組間估計量,但會損失較多信息量。

regyxlx2x3zbe

estimatesstoreBE

選用固定效應(yīng)模型還是隨機效應(yīng)模型運用豪斯曼檢查

xtregyx1x2x3zfe

estimatesstoreFE

xtregyx1x2x3zre

estimatesstoreRE

hausmanFERE,constantsigmamore

p小,則強烈拒絕使用隨機效應(yīng)模型,而應(yīng)采用固定效應(yīng)模型。

但是假如聚類穩(wěn)健標準差和普通標準差相差較大,則傳統(tǒng)的豪斯曼檢查并不合用。這

時需要進行輔助回歸。

為一航=國-包-祝8+(、/動+(跖—海)]

目前在stata中需要手動進行。環(huán)節(jié)如下:

quietlyxtregfata1beertaxspirconsunrateperinek,re

sealartheta=e(theata)(從回歸中得到THETA)

globa1yandxforhausmanfata1beertaxspirconsunrateperinek

(使用yandxforhausman時,代表了所有使用的變量)

foreachxofvarlist$yandxforhausman{

bystate:egenmean'x'=mean(zxz)到底用什么表達?

genmd'x'='x'-mean'x"

genred"x'='x'-theata*mean'x'

)

quietlyxtregredfatalredbeertaxredspirconsredunrateredperinck

mdbeertaxmdspirconsmdunratemdperinck,vce(clusterstate)

testmdbeertaxmdspirconsmdunratemdperinck

檢查發(fā)現(xiàn)P小,則拒絕r=0的假設(shè),應(yīng)當選用固定效應(yīng)模型。

(疑問:那中間那個式子呢?)

面板數(shù)據(jù)在回歸之前要通過平穩(wěn)性檢查,其解決環(huán)節(jié)簡化為:面板數(shù)據(jù)單位根檢查一協(xié)

整檢查一回歸。一般為了方便,采用相同單位根檢查LLC檢查和不同單位根檢查Fisher-

ADF檢查(非面板數(shù)據(jù)一般采用ADF檢查)。兩種檢查均拒絕存在單位根的元假設(shè),則認為

序列平穩(wěn)。

13.長面板和動態(tài)面板(不能像短面板那樣假定獨立同分布,而應(yīng)當運用廣義最小二乘法FGLS

進行估計,解決組內(nèi)和組間的自相關(guān)。)

解釋變量包含被解釋變量的滯后項,則為動態(tài)面板,反之為靜態(tài)面板.

(1)僅解決組內(nèi)自相關(guān)的FGLS

tabstate,gen(state)考慮個體效應(yīng),生成州虛擬變量。

gent=year-1962考慮時間趨勢,生成時間趨勢變量

regYX1X2X3State2-statel0t,vce(clusterstate)用LSDV估計雙向固定

效應(yīng)模型

estimatesstore0LS

考慮組內(nèi)自相關(guān)的情形:用命令stpcse

stpcseYX1X2X3state2-statelOt,corr(ar1)約束條件為自回歸系數(shù)都相同的

一階。

考慮各組自回歸系數(shù)不同的組內(nèi)自相關(guān)情形

stpcseYX1X2X3state2-state101,corr(psar1)

假如僅考慮不同個體擾動項存在異方差而忽略自相關(guān),則可以用

stpcseYXIX2X3state2-statel0t,hetonly

將以上各估計的系數(shù)及標準差列表便于比較:

究竟應(yīng)當采用OLS還是采用AR1,則需要檢查自相關(guān)。

(2)同時解決組內(nèi)自相關(guān)和組間同期相關(guān)的FGLS的命令xtg1s

xtglsYXIX2X3state2-state101,paneIs(iid/het/cor)corr(arl/psarl)

iid表達不同個體(組間)的擾動項獨立且具有相同的方差,het表達不同個體的擾動

項獨立但具有不同的方差,cor表達不同個體的擾動項同期相關(guān)且具有不同的方差。Corr

表達組內(nèi),解釋同前。假如加上igls則表達用的迭代FGLS,而非兩步FGLS.

若執(zhí)行xtgls或者xtpcse時沒有使用個體虛擬變量,則為隨機效應(yīng)模型,若使用了則為

固定效應(yīng)模型。

⑶長面板數(shù)據(jù)自相關(guān)和異方差檢查

組間異方差檢查,運用似然比檢查

XtglsYXlX2X3,iglspane1(het)(允許異方差的迭代式FGLS估計)

Estimatesstorehetro(將異方差條件下的估計結(jié)果儲存為hetero)

XtgIsyxlx2x2,igls(同方差條件下的FGLS)

Estimatesstorehomo(將同方差條件下的估計結(jié)果儲存為homo)

localdf=e(N_g)-1(計算自由度,即約束條件個數(shù),其中e(N_g)為個體個數(shù))

lrtestheterohomo,df(zdfz)(制定自由度,進行似然比檢查。)符號到底是如

何的?

P=0,則強烈拒絕LR檢查的“組間同方差”假設(shè)。

另一種檢查組間異方差的方法為xttest3,只能在xtreg,fe或者xtgls之后使用:

Sscinstallxttest3(安裝命令"xttest3")

Xttest3(進行組間異方差檢查)這個超級簡樸~~

組內(nèi)自相關(guān)檢查通過下載命令xtseriaI來實現(xiàn)這個檢查

netinstaIIstO039(安裝命令stserial)為什么下不了?

xtserialyxlx2x3,output(進行組內(nèi)組相關(guān)檢查,若P小,則強烈決絕不存在一

階組內(nèi)自相關(guān)的假設(shè)。)

組間截面相關(guān)檢查:非官方xttest2?其僅能在xtgls,ivreg2,和xtreg,fe后使用,

且能用于場面版

sscinstallx11est2(安裝xttest2)

xttest2(組間截面相關(guān)檢查)

當這一種方法無法檢查時,可以采用另一種方法,xtcsd命令,長短面板都能用,用在fe之

后?

sscinstallxtcsd(安裝命令"xtcsdn)

xtcsd,Pesaranabsshow(pesaran的檢查,服從正態(tài)分布)

xtcsd,friedmanabsshow(friedman的檢查,服從喀方分布)

xtcsd,freesabsshow(frees的檢查)

對于長面板除了可以讓不同個體擁有不同的截距項外還可以使其擁有不同的斜率,這成為

“變系數(shù)模型”,假如其系數(shù)為常數(shù),則可分別回歸,但假如各個體擾動項相關(guān),則應(yīng)當把所

有個體回歸方程疊放,然后使用“似不相關(guān)回歸"(SUR)旭由于參數(shù)估計較多,會損失自

由度。假如考慮“部分變系數(shù)模型",則SUR不再合用,而應(yīng)用LSDV法,引入虛擬變量,以

及虛擬變量與可變細數(shù)解釋變量的互動項(參見helpxi)

假如將系數(shù)看作是隨機的,則FGLS估計模型,即運用OLS殘差估計協(xié)方差矩陣中的參數(shù),

然后再使用GLS,命令為:

Xtrcyxlx2x3,betas(betas表達顯示對每一組系數(shù)的估計),其附帶參數(shù)穩(wěn)定

性檢查

雖然面板數(shù)據(jù)能在一定限度上解決漏掉變量問題,但假如存在內(nèi)生解釋變量,還是需要

用工具變量法,先解決漏掉問題,再使用2SLS

對于動態(tài)面板,就算是組內(nèi)估計量(FE)也是不一致的。

差分GMM和水平GMM結(jié)合就成了系統(tǒng)GMM估計。

差分GMM的stata命令為:

xtabonddepvar[indepvars],1ags(p)maxidep(q)pre(var1ist)endogen

ous(varlist)inst(varIist)twostepvce(robust)

如:xtabond1wageoccsouthsmsaind,1ags(2)maxldep(3)pre(wks,

Iag(l,2))endogenous(ms,Iag(0,2))endogenous(union,Iag(0,2))twostepvce(ro

bust)

差分GMM存在的前提是擾動項不存在自相關(guān),對此要進行檢查,需要擾動項的差分

不存在二階或更高階自相關(guān)即可。

命令為:estatabond,p小,則存在自相關(guān),P大,則不存在自相關(guān)。

更高階自相關(guān)的檢查為:estatabondartests(3)

由于使用過多的工具變量,還需要進行過度辨認檢查

先回歸,但要去掉最后的vce(robust)

estatsargan

系統(tǒng)GMM的stata命令為:

xtdpdsysdepvar[indepvars],Iags(p)maxIdep(q)pre(var1ist)endo

genous(varlist)inst(varlist)twostepvce(robust)

若要對比差分GMM和系統(tǒng)GMM的系數(shù)和標準差,則用命令:

estimatestableDGMMSGMM,bse

14.離散被解釋變量(通常不適合用OLS,而應(yīng)當用二值模型,probit1ogit和多值選擇模

型)

假如F為標準正態(tài)的累積分布函數(shù),則P模型為Probit模型,若F為邏輯分布的累積

分布函數(shù),則P模型為Logit模型。計算Logit模型通常比Probit模型更方便。

二值模型的Stata命令為:

probityx1x2x3

logityx1x2x3

probit和1ogit的分布函數(shù)不同,因此參數(shù)不能直接比較,需要分別計算兩者的邊際效

應(yīng),再進行比較,STATA進行解決的命令為:

mfx(計算在樣本均值處的邊際效應(yīng))

mfx,at(Xl=0)(計算在Xl=0時,X2,X3取值樣本均值處的邊際效應(yīng))

mfx,eyex(計算在樣本均值處的彈性)

predictyhat(計算發(fā)生概率的預(yù)測值,并記為yhat),對于Logit模型,系數(shù)表達解釋變

量x增長一個單位將引起的“對數(shù)幾率比”的邊際變化。

衡量二值模型的擬合優(yōu)度采用“準R2”,判斷擬合優(yōu)度還可以通過計算預(yù)測準確的比

例,相應(yīng)STAT命令為:

estatc1as

logti和probit模型雖然估計系數(shù)不同,但其估計系數(shù)沒有可比性,其mfx計算出的邊際

效應(yīng)及準R2與對的預(yù)測比幾乎一致。

假如接受似然比檢查(LR),則可用同方差probit模型估計。在存在異方差的情況下進

行probit模型估計為:

hetprobYX1X2X3,het(varIist)那自相關(guān)呢?

多值選擇模型:

多值選擇模型的stata命令為:

m1ogitYXIX2X3,base(#)(多值logit選擇模型,base的用來指定參照組)

mlogitYXIX2X3,rrrbase(#)(多值logit選擇模型,回報re1ativeriskratio)

mprobitYXIX2X3,base(#)(多值probit選擇模型)

排序數(shù)列模型的stata命令:orderedprobit/1ogit

oprobitYX1X2X3

ologitYXIX2X3

oprobit

預(yù)測:predictp2p3p4p5

列出第一個觀測值的預(yù)測結(jié)果:listp2p3p4p5in1/1,

ologit

預(yù)測:predictr2r3r4r5

列出第一個觀測值的預(yù)測結(jié)果:listr2r3r4r5in]/l,

計數(shù)模型

(1)有些被解釋變量僅能取非負整數(shù),如金牌數(shù)量,看病次數(shù)等,一般用泊松回歸。St

ata命令為

poissonyxlx2x2,r(穩(wěn)健標準差)

estatgof(goodnessoffitnes擬合優(yōu)度檢查)

泊松回歸的局限是其盼望和方差一定相等,但有些被解釋變量的方差明顯大于盼望,即

存在“過度分散”,則可以考慮“負二項回歸"(negativebinomiaIregression),使

用MLE估計。Nbregyxlx2x2,r

假如計數(shù)數(shù)據(jù)中具有大量的零值,則可以使用“零膨脹泊松回歸”。這可以Vuong記

錄量來檢查,假如Vuong記錄量很大,則選擇零膨脹泊松回歸或者零膨脹負二項泊松回歸。

零膨脹泊松回歸的stata命令為:

zipyx1x2x3,inflate(varlist)vuong(零膨脹泊松回歸)

zipnbyx1x2x3zinflate(varlist)vuong(零膨脹負二項回歸)

15.受限制的被解釋變量(斷尾回歸、截取回歸)

斷尾回歸stata命令:

truncregyx1x2x3,I1(#)(左邊斷尾)

truncregYXlX2X3,u1(#)(右邊斷尾)

truncregYXIX2X3,ll(#)ul(#)(雙邊斷尾)

截取回歸stata命令:tobit模型

tobityxlx2x3,11(#)

tobityx1x2x3,u1(#)

tobityx1x2x3,11(#)u1(#)

樣本選擇模型的stata命令:

Heckmanyx1x2x3,select(z1z2)(默認使用MLE,選擇方程的被解釋變量為y),

最下的似然比檢查P很小,則認為樣本選擇模型合用。

Heckmanyxlx2x3,seIect(zlz2)twostep(兩步法,選擇方程的被解釋變量

為y)

Heckmanyx1x2x3,se1ect(w=zlz2)(默認使用MLE,選擇方程的

被解釋變量為w)

16時間序列

(平穩(wěn)時間序列、非平穩(wěn)時間序列。AR自回歸模型、MA為移動平均模型結(jié)合起來為AR

MA模型、自回歸分布滯后模型ADL、向量自回歸模型VAR、向量移動平均過程VMA、

格蘭杰因果檢查:條件是變量協(xié)整)

⑴自相關(guān)和偏自相關(guān)

corrgramsy,1ags(#)第1至#階ACF和PACF

acy,1ags(#)

pacy,Iags(#)

(2JARIMA

arimay,ar(]/#),ma(1/#)或者

arimay,arima(#p,#d,#q)#P表達#階自回歸,#q表達#階移動平均,#d表達

#階差分達成平穩(wěn)過程。

檢查殘差是否存在自相關(guān):

predictel,res

corrgrameljags(#)(檢查殘差是否存在第1到第#階自相關(guān))

(3)ADL和ARMAX

ARMAX的stata命令

arimayx1x2x3,ar(#)ma(#)

對于時間序列,一方面要設(shè)立時間項,tsettimevar

對于非平穩(wěn)時間序列,一方面要用差分使其平穩(wěn):gdxl=d.x1(當然差分后會缺失一個變

量)

假如自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都存在斷尾,則考慮ARMA模型:理由

計算信息準則estatic(目的是什么?根據(jù)信息準則判斷哪一個模型更優(yōu))還可以

去掉不顯著的階,回歸后再運用信息準則比較。

(4)VAR

varsocxyz,maxlag(#)(計算信息準則,最大滯后期默認值為4),根據(jù)信息準則可以

估計VAR系統(tǒng)的階數(shù)

varxyz(進行VAR估計,默認滯后期為2)

varxyzjags(1/3)(滯后期為一至三期)

varxyz,1ags(3)(滯后期為第三期)

varxyz,dfk(假如樣本容量過小,可以用dfk進行自由度調(diào)整)

varxyz,small(顯示小樣本記錄量)

varxyz,exog(wl,w2)(引入外生變量w1,w2)

varbasicxyz,irf(估計VAR模型,畫脈沖響應(yīng)圖,未正交化)

varwle(進行VAR估計后,對每個方程及所有方程的各階系數(shù)聯(lián)合顯著性進行wald

檢查,wle表達waldlag-exc1usionstatistics)

var1mar(估計后,對殘差是否自相關(guān)進行LM檢查)

varnorm(檢查殘差是否服從正態(tài)分布)

varstable,graph(進行VAR估計后,檢查VAR系統(tǒng)是否為平穩(wěn)過程,假如平穩(wěn)則所

有特性值都在單位圓內(nèi)。)

vargranger(估計后,進行格蘭杰因果檢查)

irfcreatefilename,set(filename)step(#)replace(建立脈沖文獻,是

脈沖文獻"filename”成為當前的脈沖文獻,step表達考察兒期的脈沖響應(yīng)函數(shù),默認為

8,replace代表替代已有的文獻名)

irfgr叩hirf(畫脈沖響應(yīng)圖,未正交化)

irfgraphoirf(畫正交化的脈沖響應(yīng)圖)

fcastcomputeprefix,step(#)(估計VAR后,計算被解釋變量的未來#期的預(yù)測值,

并把預(yù)測值賦予被解釋變量加上前綴“prefix”之后的變量名,如可以加F-)

fcastgraphvarlist,observed(執(zhí)行命令ufcastcomputen后,將變量“va

rlist”所代表的預(yù)測值畫圖,其中“observed”表達與實際觀測值比較)

17非平穩(wěn)的時間序列

有擬定性趨勢存在的時候,則成為不平穩(wěn),去掉時間因素,則成為平穩(wěn)序列的我們叫

它為趨勢平穩(wěn)序列;存在結(jié)構(gòu)變動則為非平穩(wěn)序列;存在隨機趨勢則也為非平穩(wěn)序列。稱平

穩(wěn)時間序列為零階單整,假如時間序列的一階差分為平穩(wěn),則稱為一階單整,也稱為單位根過

程,D階差分為平穩(wěn),則成為“d階單整”。單位根是用來檢查是否平穩(wěn)的。假如時間序列

存在單位根,則為非平穩(wěn)序列。

假如序列非平穩(wěn),則也許帶來A.自回歸系數(shù)的估計值向左偏向于O;B.t檢查失效;C.兩

個互相獨立的變量也許出現(xiàn)偽回歸或偽相關(guān)?

進行單位根檢查的方法有:

(1)DF檢查,使用一階自回歸來檢查單位根,規(guī)定擾動項為獨立白噪聲,故擾動項無自相關(guān),

若有自相關(guān),則可以引入更高階的滯后項來控制。

(2)ADF檢查,多階。在進行ADF檢查時,擬定滯后階數(shù)P的大小,采用最大滯后階數(shù)P

max=[12.(T/100)”'],(stata命令為:di12*(t/10O)A(l/4)然后使用由大到小的序

貫t規(guī)則,看ADF檢查中最后一階回歸系數(shù)是否顯著,也可以使用信息準則。

ADF檢查的Stata命令為:

dfullery(DF檢查,不包含滯后差分項),若DF記錄量較小,則拒絕單位根存在

假設(shè)。

dfu1lery,lags(p)(包含p階滯后差分項)

dfu1leryfnoconstant(不帶常數(shù)項)

dfuI1ery,trend(帶時間趨勢項)

dful1ery,regress(顯示回歸結(jié)果)e

(3)phiIIips—perron單位根檢查(PP檢查)

PP檢查使用一階自回歸,但使用異方差自相關(guān)穩(wěn)健的標準差對DF記錄量進行修正。

pperrony(默認設(shè)立帶常數(shù)項,不帶時間趨勢項)

pperrony,|noc|onstant(不帶常數(shù)項)

pperrony,trend(帶時間趨勢項)

pperronv,regress(顯示回歸結(jié)果)

(4)DF-GLS單位根檢查,是去趨勢后再使用ADF檢查

dfglsy(默認帶時間趨勢項,自動根據(jù)信息準則選擇最佳滯后期數(shù))

dfgIsy,notrend(不帶時間趨勢項)

(5)KPSS單位根檢查,將假設(shè)改為“時間序列為平穩(wěn)”。

sscinsta11kpss(下載安裝KPSS程序)

kpssy(默認涉及時間趨勢)

kpssynotrend(不帶時間趨勢項)

假如進行單位根檢查認為是非平穩(wěn)的,則要判斷為I⑴或者是1(2)。

協(xié)整概念和stata操作:

協(xié)整檢查就是為了考察幾個變量之間的長期均衡關(guān)系

檢查協(xié)整秩的檢查,即擬定有多少個線性無關(guān)的協(xié)整向量,(檢查中打星號的是線性

無關(guān)的協(xié)整向量)。stata命令:

vecranky1y2...yn,Iags(#)(默認設(shè)立涉及常數(shù)項,但不涉及時間趨勢項)

vecranky1y2...yn,1ags(#)trend(none)(不涉及常數(shù)項,也不涉及時

間趨勢項)

vecranky1y2...yn,lags(#)trend(trend)(涉及常數(shù)項,也涉及時間趨勢

項)

vecrankyly2...yn,max(顯示最大特性值記錄量及其臨界值)

做完協(xié)整秩檢查,并確認h>=l后,就可以對VECM模型(誤差修正模型)進行最大似然

估計。做VECM模型的目的是?

vecyly2...yn,lags(#)(默認設(shè)立涉及常數(shù)項,但不涉及時間趨勢項)

vecyly2...yn,1ags(#)trend(none)(不涉及常數(shù)項,也不涉及時間趨勢項)

vecyly2...yn,lags(#)trend(trend)(涉及常數(shù)項,也涉及時間趨勢項)后面

加rank(1)表達什么?回歸后表格里面的數(shù)據(jù)的含義是什么?最后一列為協(xié)整方程代表的

長期均衡關(guān)系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論