離散選擇模型舉例122_第1頁(yè)
離散選擇模型舉例122_第2頁(yè)
離散選擇模型舉例122_第3頁(yè)
離散選擇模型舉例122_第4頁(yè)
離散選擇模型舉例122_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一.二元離散選擇模型1二元響應(yīng)模型(Binary response model)我們往往關(guān)心響應(yīng)概率y 1x yx Go ixi. kxkG z,其中x表示各種影響因素(各種解釋變量,包括虛擬變量)。根據(jù)不同的函 數(shù)形 式可以分為下面三類模型:線性概率模型( Linear probability model, LPM)、對(duì)數(shù)單位模型(logit)、概率單位模型(probit):三種模型估計(jì)的系數(shù)大約有以下的關(guān)系:logit 6 probit probitLPM2 偏效應(yīng)如果解釋變量是一個(gè)連續(xù)型變量, 可以通過(guò)求下面的偏導(dǎo)數(shù)得出來(lái):p x g0 x xjdz 號(hào)和該解釋變量對(duì)應(yīng)的系數(shù)的符號(hào)一致;

2、 各自的估計(jì)系數(shù)之比。如果解釋變量是一個(gè)離散性變量,那么他對(duì)p(x) = p(y=1|x)的偏效應(yīng)四ZdG z,偏效應(yīng)的符兩個(gè)解釋變量偏效應(yīng)之比等于它們則xk從ck變化到Ck+1時(shí)對(duì)概率影響大小為:1x1kCk1 G01x1上面的其他解釋變量的取值往往取其平均值。3 .估計(jì)方法與約束檢驗(yàn) 極大似然估計(jì);三種常見(jiàn)的大樣本檢驗(yàn):拉格朗日乘數(shù)檢驗(yàn)、比檢驗(yàn)。wald檢驗(yàn)、似然4Stata程序語(yǔ)法(以Probit為例)probit depvar indepvars weight if exp in range , level(#) nocoef noconstant robust cluster(var

3、name) score(newvar) asis offset(varname) maximize_options predict type newvarname if exp in range , statistic rules asif nooffset where statistic isppredicted probability of a positive outcome; the defaultxblinear predictionstdpstandard error of the prediction.具體的例子1 .數(shù)據(jù):美國(guó)1988年的CPS數(shù)據(jù)2.模型:估計(jì)成為工會(huì)成員的可

4、能性,模:是U四4 四 白幻 -rz Trf潛在經(jīng)驗(yàn)potexp、經(jīng)驗(yàn)的平萬(wàn)項(xiàng) married、工會(huì)化程度high);型形式如下:參加工會(huì)的概率=f ( potexp2、受教育年限grade、婚否unionCoef.Std. Err.zPz95% Conf.Intervalpotexp.0835091.01560875.350.000.0529166.1141016potexp2-.0015308.0003179-4.820.000-.0021538-.0009078grade-.042078.0189089-2.230.026-.0791388-.0050171married.0622516

5、.11258360.550.580-.1584083.2829115high.5612953.0996625.630.000.3659613.7566292cons-1.468412.2958112-4.960.000-2.048192-.8886332解釋變量:Potexp=年齡-受教育年限-5;grade=完成的受教育年限; married: 1表示婚,0未婚;high: 1表示高度工會(huì)化的行業(yè),否則為0。3估計(jì)的結(jié)果3.1 probit union potexp potexp2 grade married high3.2dprobit union potexp potexp2 grade

6、 married high給出了 gx,如果要求偏效應(yīng)還需要對(duì)其乘以估計(jì)的系?0?數(shù)beta ;uniondF/dxStd. Err. zPzx-bar 95% C.I.potexp.0226964.0041529 5.350.00018.884.014557. 030836potexp2-.000416.000085-4.820.000519.882 -.000583- .00025grade-.0114361 .0051379 -2.230.02613.014 -.021506-.001366married dF/dx is for discrete change of dummy var

7、iable from 0 to 1, 對(duì)離散變量。此 外,如果想針對(duì)某些解釋變量的特定取值進(jìn)行計(jì)算,可以用下面的語(yǔ)句: matrix myx= (8, 64,10,1, 1)dprobit, at ( myx.0167881.03011370.550.580.641 -.042234 .07581high*.1470987.02470055.630.000 .568 .098687 .195511obs. P.216pred. P.1904762 (at x-bar)uniondF/dxStd. Err.zPzx95%C.I.potexp.0261573.00443085.350.0008.0

8、17473.034841potexp2-.0004795.0000978-4.820.00064-.000671-.000288grade-.0131799.0065759-2.230.02610-.026068-.000291married*.0190706.03458370.550.5801-.048712.086853high*.1389514.02660335.630.0001.08681.191093obs. P .216pred. P.1904762 (at x-bar)pred. P.2433575 (at x)3.3 logit(1)logistic union potexp

9、potexp2 grade married high, coef(給出回歸系數(shù))unionCoef.Std. Err.zPz95% Conf.Intervalpotexp.1474021.0280975.250.000.0923329.2024712potexp2-.0026869.0005654-4.750.000-.0037951-.0015787grade-.0703209.032142-2.190.029-.1333181-.0073236married.115463.1967790.590.557-.2702167.5011427high.9801411.1800495.440.00

10、0.62725151.333031cons-2.581436.5186859-4.980.000-3.598041-1.56483等價(jià)于logit union potexp potexp2 grade married high2)給出發(fā)生比率(odds ratio )logistic union potexp potexp2 grade married high等價(jià)于logit union potexp potexp2 grade married high, orunionOddsRatioStd. Err.PzInterval95% Conf.potexp potexp21.15882.03

11、255945.250.0001.096731.224425.9973167.0005639-4.750.000.9962121.9984225grademarried.9320947.0299594-2.190.029.8751866.99270311.122393.22086330.590.557.76321411.6506062.664832high如果存在異方差,可采用穩(wěn)健估計(jì),在上面命令后面加上robust.47980055.440.0001.8724573.79252其他命令:1.有序模型ologit, oprobit2-多重選擇模型mlogit rrr給出發(fā)生比率;多重probit

12、模型設(shè)計(jì)復(fù)雜計(jì)算,目前尚無(wú)對(duì)應(yīng)的命令。3-工具變量如果在probit模型中有內(nèi)生變量,就要采用工具變量方法予以克服,ivprob命 令給出了結(jié)果。4.面板數(shù)據(jù)的離散選擇模型xtlogit,xtprobit, xttobitsas 相關(guān)過(guò)程:logistic,logit,probit;多重 logit 模型:proc catmod 三托賓模 型(Tobit) 和赫克曼修正模型 (Heckit)一.tobit 模型( censored model 截取回歸模型)實(shí)際上tobit模型是probit模型的推廣,(tobit意即Tobin的probit);在 嚴(yán)格為正值的時(shí)候大致連續(xù),但是有相當(dāng)部分取值

13、為0。模型:y* 0 x u,u| x 0, 2 ,y max 0,y*隱變量y*滿足經(jīng)典的線性假定,服從具有線性條件均值的正態(tài)同方差分布。由于y*正態(tài)分布,所以y在嚴(yán)格正值上連續(xù)分布2.估計(jì)和檢驗(yàn)極大似然估計(jì),檢驗(yàn)同上面的三種檢驗(yàn)3 偏效應(yīng)xj我們估計(jì)出的系數(shù)y|x,是隱變量做用)的偏效應(yīng),而我們關(guān)心的是對(duì)y (工作時(shí)間)的偏效應(yīng)c ,if z 0,1 c這表明對(duì)于那些具有正值的觀測(cè)值作OLS,由于忽略了逆米爾斯比0率 inverse yx p y 0 x y y 0,x p(y 0|x)?0 z z0,x x ccyy x cxu/xxx稱為逆米爾斯比率mills ratio)可能導(dǎo)致估計(jì)

14、結(jié)果的非一致性。從上面推導(dǎo)可以得出:yx x x x因此,當(dāng)y服從一個(gè)tobit模型時(shí),難以直接得出偏效應(yīng)(1)如果xj是一個(gè)連續(xù)變量,可以通過(guò)微分求出偏效應(yīng):d dc x,大括號(hào)中為一個(gè)調(diào)整因子可以通y y 0,x首先 xj.1 x xjy y 0,x 對(duì)過(guò)代入,的估計(jì)值,而且必須帶入解釋變量的有意義的值,一般用均值。p y 0 xyxP y 0 x xj Xj y y 0,xp y 0 x x偏效應(yīng)p y 0 xx jxyxxjTobit模型估計(jì)的結(jié)果并不能直接給出偏效應(yīng),但是估計(jì)系數(shù)的符號(hào)和偏效應(yīng) 的符號(hào)是一致的,而且統(tǒng)計(jì)顯著性也一致。如果要求具體的偏效應(yīng)大小, 需要將估計(jì)的參數(shù)值和解釋

15、變量的相應(yīng)取值代入進(jìn)行計(jì)算而得。Stata程序語(yǔ)法tobit depvar indepvar weightif exp in range,l1(#) u1(#)level(#) offset(varname) maximize_optionspredict type newvarname if exp in range,statistics nooffsetl1表示左截?cái)?,那些小于l1的y值被截?cái)?;那些大于u1的y值被右截 斷。Tobit命令默認(rèn)為他們分別為因變量的最小和最大值。其中 statistics:xb擬合值pr(a,b) Pr(ayj b)e(a,b) E(yj|a yjt95% C

16、onf.Intervalnwifeinc-8.815554.470889-1.970.049-17.59257-0.0385257educ80.7085321.640413.73038.22519123.1919exper131.93117.330087.61097.90948165.9525expersq-1.87070.53915-3.470.001-2.929127-0.8122632age-54.57217.440187-7.330-69.17827-39.96588kidslt6-896.038112.1955-7.990-1116.294-675.7811kidsge6-16.03

17、38.74414-0.410.679-92.090560.03055cons968.154447.62822.160.03189.393151846.915se | 1124.914 41.77934(Ancillary parameter)Obs. summary: 325 left-censored observations at hours=4950Obs. summary:3 25 left-censoredobservations at hours=4950其他回歸模型1 ,泊松回歸模型poisson (又稱為計(jì)數(shù)回歸,count regression)主要針對(duì)的 因變量是計(jì)數(shù)變量,

18、可以取非負(fù)整數(shù)值0, 1,2,例如某人在 某年被捕的次數(shù)、一個(gè)企業(yè)在某年申請(qǐng)的專利個(gè)數(shù)、婦女生育子女人數(shù)等等。對(duì)這 些變量采用普通的線性模型往往不能給出很好的擬合。模型:y X1,X2,.Xkexp 0 1X1. kXkexp (X ) 0,取對(duì)數(shù)后是線性的;以X為 條件,Y=h的概率是:pY hX exp exp X exp X h / h!,h 0,1.2,利用極大似然估計(jì)估旦 量。計(jì)出參數(shù)值,然后帶入上式就可以求出每一個(gè)條件概率值,無(wú)論泊松分布假 定成立與否,、仍然可以得到參數(shù)的一致和漸進(jìn)正態(tài)的估計(jì)Stata中的語(yǔ)句是:Poisson ;l,不觀測(cè)yi,2 截取正態(tài)回歸模型(censor

19、ed Normal regression mode)模型:ys 0 xiui,ui |xi,ci0, 2 , imin( 乂,q)只有在yi小于ci時(shí)才觀測(cè)到它,上式還包括了 ui獨(dú)立于ci的假定右端截取或從上截取的一個(gè)例子是頂端編碼(top coding) o當(dāng)一個(gè)變量超 過(guò)頂端編碼時(shí),我們只知道他達(dá)到了某個(gè)臨界值,對(duì)高于這個(gè)臨界值的回 答,我們只知道他和臨界值至少一樣大。例如調(diào)查家庭財(cái)富時(shí),我們可以 觀測(cè)到那些財(cái)富不足50萬(wàn)美元的受訪者的實(shí)際財(cái)富,但不能觀測(cè)到那些 財(cái)富高于50萬(wàn)美元的受訪者的實(shí)際財(cái)富。此時(shí),截取值ci對(duì)所有個(gè)體i 都一樣。Stata 程序:cnreg3 持續(xù)期模型( du

20、ration model) 持續(xù)期間是一個(gè)度量某事件發(fā)生之前持續(xù)時(shí) 間的度量。例如一個(gè)下崗工人再度 失業(yè)前的失業(yè)時(shí)間;一個(gè)從監(jiān)獄釋放的 罪犯下次被捕前持續(xù)的天數(shù)。Stata 程序 streg。4斷尾回歸(truncated regression)與截取模型類似,有一點(diǎn)不同:斷尾模型 中,不能觀測(cè)到總體某一段的所有信息包括解釋變量和被解釋變量;截取 模型只是觀測(cè)不到被解釋變量。Stata 程序:trunreg5附錄:間模型:開(kāi)關(guān)模型(sas過(guò)程(1)截取模型包括tobit模型:proc lifereg; 比例風(fēng)險(xiǎn)模型.cox|刈小1 也 1 天主 ;proc phregswitch model)

21、上面分析的選擇模型有這樣的特點(diǎn):(2)持續(xù)期有關(guān)的觀測(cè)之要么觀測(cè)得到,要么觀測(cè) 不到。這里兼具可觀測(cè)兩種的情形,在這種條件 下的選擇模型稱為開(kāi)關(guān)模型(switch model)。x1 1%; y2X2 2U2模型形式:y表示兩種體制yi,若y*2,若,引入虛擬變量d1,若0,若yi或?qū)懽鳎篤 *若 y1* ,0,若 尸2*,若 0,若,其中 u 0, ,v 0,1 ,corr u,v , 0 直接采0*;yx1 1 u10*0;y*2x2 2u2仍然利用極大似然估計(jì)方法估計(jì)(分兩種情況:一種d已知;另一種d 未知。)二.赫克曼兩步修正模型理性的經(jīng)濟(jì)人往往從效用極大化出發(fā)而做 出有意識(shí)的決策,比

22、如選擇不同的教育水平、接受培訓(xùn)、參加工作、移民、 進(jìn)入不同所有制的企業(yè)等等。由于研究 所用的樣本中只包括這些已經(jīng)做出了 決策的個(gè)體而不包括那些沒(méi)有作出這些選擇的個(gè)體,因此樣本就不是隨機(jī) 的,基于這樣的樣本作出的任何結(jié)論只能代表這部分作出相應(yīng)決策的個(gè)體行 為,而不是整個(gè)總體的行為,這就是樣本的選擇性誤差(Sample selectionbias) (Heckman,1979)。模型在總體回歸方程中加入行為選擇方程(selection equation):y x u, ux 0 s 1z v 0用回歸方程估計(jì)是有偏的;而heckman模型提供了一致和漸進(jìn)有效的估計(jì)。如果觀測(cè)到y(tǒng),則s=1,否則s=

23、0;樣本選擇校正步驟: 利用所有的觀測(cè)值,估計(jì)一個(gè)si對(duì)zi的probit模型,并得到估計(jì)值?,并計(jì)算逆米爾斯比率? z。從lamda的顯著性可以判斷 樣本選擇性偏誤的嚴(yán)重程度。利用選擇樣本,即si = 1的觀測(cè),作如下的回歸Yi對(duì)xi,則得到的參數(shù)估計(jì)?是一致的,并近似服從正態(tài)分布。注意:x應(yīng)該是z的一個(gè)嚴(yán)格子集。Stata 程序:heckman 語(yǔ)法:(1)基本語(yǔ)法 heckman depvar varlist, select(varlist_s) twostep或 heckman depvar varlist, select(depvar_s=varlist_s) twosteppred

24、ict type newvarname if exp in range,statistics nooffset,其中 statistics 是:xb擬合值(默認(rèn)項(xiàng)) ycond E(yj|yj observed)(又稱為米爾斯比率)yexpected E(yj*),觀測(cè)不到的y取零。nshazard or mills nonselection hazard psel p yj observed p(z v 0)xbsel選擇方程的線性估計(jì)stdpsel選擇方程線性估計(jì)值的標(biāo)準(zhǔn)差pr(a,b) p a xj b u be(a,b) E(yj|a yjz95% Conf.Intervallwage

25、educ.1090655.0155237.030.000.0786411.13949exper.0438873.01626112.700.007.0120163.0757584expersq-.0008591.0004389-1.960.050-.00171941.15e-06cons-.5781032.3050062-1.900.058-1.175904.019698selecteduc.1309047.02525425.180.000.0814074.180402exper.1233476.01871646.590.000.0866641.1600311expersq-.0018871.0

26、006-3.150.002-.003063-.0007111nwifeinc-.0120237.0048398-2.480.013-.0215096-.0025378age-.0528527.0084772-6.230.000-.0694678-.0362376kidslt6-.8683285.1185223-7.330.000-1.100628-.636029kidsge6.036005.04347680.830.408-.049208.1212179cons.2700768.5085930.530.595-.72674731.266901millslambda.0322619.133624

27、60.240.809-.2296376.2941613rho0.04861sigma.66362875lambda.03226186.1336246通過(guò)觀測(cè).的顯著性得知樣本選擇性偏誤不是很明顯,所以我們可以比 較放心地使用回歸方程。(2)極大似然估計(jì)要求知道y和s的聯(lián)合分布,更為復(fù)雜,如果采用前面的程序檢驗(yàn)發(fā)現(xiàn) 樣 本選擇問(wèn)題不大,就沒(méi)有必要繼續(xù);否則采用兩步估計(jì)值或是極大似然估 計(jì)同時(shí)估計(jì)回歸和選擇方程。heckman lwage educ exper expersq,select(educ exper expersq nwifeinc age kidslt6 kidsge6)Coef.S

28、td. Err.zPz95% Conf.Intervallwageeduc.1083502.01486077.290.000.0792238.1374767exper.0428369.01487852.880.004.0136755.0719983expersq-.0008374.0004175-2.010.045-.0016556-.0000192cons-.5526973.2603784-2.120.034-1.06303-.0423651selecteduc.1313415.02538235.170.000.0815931.1810899exper.1232818.01872426.580.000.0865831.1599806expersq-.0018863.0006004-3.140.002-.003063-.0007095nwifeinc-.0121321.0048767-

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論