第10章(離散選擇模型)_第1頁
第10章(離散選擇模型)_第2頁
第10章(離散選擇模型)_第3頁
第10章(離散選擇模型)_第4頁
第10章(離散選擇模型)_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

離散選擇模型第十章目錄虛擬解釋變量

線性概率模型

線性概率模型

Logit模型Probit模型

三者的比較例子:房地產(chǎn)類上市公司財(cái)務(wù)困境的預(yù)測

§10.1虛擬解釋變量一.測量截距的變動(dòng)假設(shè)農(nóng)民接受的教育水平以及性別是影響收入的主要因素,虛擬變量Di表示性別,對(duì)于女性Di=1,對(duì)于男性Di=0。同時(shí),以Yi表示農(nóng)民的收入,Xi表示農(nóng)民受教育的水平。農(nóng)民收入回歸模型:

(10.1.1)

如果我們假定模型(10.1.1)中隨機(jī)誤差項(xiàng)εi的條件期望為0,則男、女收入的總體回歸函數(shù)可表示為:

可以看出,女性收入方程的截距為β0+β2,男性收入方程的截距為β0,由于性別差異所導(dǎo)致男女收入的差異體現(xiàn)在截距上,因此,模型(10.1.1)的虛擬變量描述了男女收入方程中的截距的變化。

(10.1.2)對(duì)于類似模型(10.1.1)定義的虛擬變量,把虛擬變量取值為0的一組稱為基準(zhǔn)組,而把取值為1的組稱為對(duì)照組。對(duì)模型(10.1.1)也可以定義男性Di=1,女性Di=0。這樣變化后,請重寫模型(10.1.2),并解釋截距項(xiàng)的變化。模型中應(yīng)該引入幾個(gè)虛擬變量呢?能否在模型(10.1.1)中再引進(jìn)一個(gè)虛擬變量di,并將其定義為:女性di=0,男性di=1?這樣,回歸模型轉(zhuǎn)化為(10.1.3)

由于女性Di=1,男性Di=0,所以Di

+di=1。這樣將導(dǎo)致完全多重共線性?(提示:可認(rèn)為β0系數(shù)后面也有一個(gè)解釋變量,這個(gè)解釋變量的取值都為1)。(10.1.3)

當(dāng)模型存在截距項(xiàng)時(shí),如果定性虛擬變量含有m個(gè)分類,則在模型中應(yīng)引入m

-1個(gè)虛擬變量。如果引入m個(gè)虛擬變量,從而產(chǎn)生完全多重共線性,這就是所謂的虛擬變量陷阱問題。若將模型中的截距項(xiàng)去掉,如果定性虛擬變量含有m個(gè)分類,則在模型中應(yīng)引入m個(gè)虛擬變量。模型中應(yīng)該引入幾個(gè)虛擬變量呢?例10-1下面以我國2000-2007年季度GDP數(shù)據(jù)為例來說明虛擬變量如何度量截距的變化,圖10.1是關(guān)于GDP的序列圖。圖10.1.1GDP序列圖結(jié)合數(shù)據(jù)特征,我們首先定義季度虛擬變量。

設(shè)定回歸模型為:(10.1.3)估計(jì)結(jié)果如下:由于代表第二季度和第三季度的虛擬變量的回歸系數(shù)在5%的顯著性水平都不能拒絕零假設(shè),說明第二季度、第三季度的GDP與第一季度的GDP沒有顯著差異。因此,應(yīng)把第一季度、第二季度、第三季度的GDP歸并在一個(gè)組別中,僅需把季度因素分為第四季度和其他季度,這樣我們進(jìn)而在模型中引入一個(gè)虛擬變量D3t。(1.02)

t=(6.83)

(1.29)

(6.05)

(16.88)得到的回歸模型如下:t=(9.43)(6.50)(17.08)從回歸結(jié)果看,虛擬變量D3t對(duì)應(yīng)的回歸系數(shù)為11122.9與理論預(yù)期一致且統(tǒng)計(jì)顯著,其含義為,在其他條件不變前提下,平均來說,第4季度比其余季度的GDP高11122.9億。二.測量斜率的變動(dòng)使用虛擬變量也可以測量回歸模型中斜率系數(shù)的變化。例如,以國內(nèi)生產(chǎn)總值(GDP)代表收入,以居民消費(fèi)支出代表消費(fèi)(C)??紤]我國的居民收入對(duì)居民消費(fèi)支出的影響。我國居民的邊際消費(fèi)傾向可能大約在2000年開始發(fā)生顯著的變化。

定義虛擬變量:

設(shè)定回歸模型:2000年前后,我國消費(fèi)函數(shù)的回歸函數(shù)為:從(10.1.5)式可以看出,2000年以前的邊際消費(fèi)傾向?yàn)棣?+β2

,2000年以后的邊際消費(fèi)傾向?yàn)棣?,2000年前后消費(fèi)函數(shù)的差異體現(xiàn)在斜率系數(shù)上。因此,在回歸模型中以虛擬變量和數(shù)值型解釋變量相乘的方式引入虛擬變量,可以用來度量回歸模型斜率系數(shù)的變化。

(10.1.4)

(10.1.5)

估計(jì)模型(10.1.4),結(jié)果如下:t=(1.65)(70.10)

(2.99)回歸結(jié)果表明,估計(jì)的β2為0.05,其對(duì)應(yīng)的t統(tǒng)計(jì)量值為2.99,可以在5%的顯著性水平上拒絕零假設(shè),因此,我國2000以前的邊際消費(fèi)傾向顯著高于2000以后的邊際消費(fèi)傾向,平均來說高0.05。三.使用虛擬變量檢驗(yàn)?zāi)P偷姆€(wěn)定性以城鄉(xiāng)居民儲(chǔ)蓄存款余額代表居民儲(chǔ)蓄(S),以GDP代表居民收入。

我們以1990年為分割點(diǎn)設(shè)定虛擬變量:Dt=1(1990年以前),Dt=0(1990年以后)設(shè)定儲(chǔ)蓄函數(shù)回歸模型:1978-1989年和1990-2006年的儲(chǔ)蓄函數(shù)分別是:如果估計(jì)的β1顯著不為0,則表明儲(chǔ)蓄函數(shù)的截距發(fā)生結(jié)構(gòu)變化;如果估計(jì)的β3顯著不為0,表明儲(chǔ)蓄函數(shù)的斜率系數(shù)發(fā)生結(jié)構(gòu)變化;如果估計(jì)的β1,β3聯(lián)合不為零,則表明儲(chǔ)蓄函數(shù)的截距和斜率都發(fā)生結(jié)構(gòu)變化。

(10.1.5)

可以使用通常的t統(tǒng)計(jì)量檢驗(yàn)單個(gè)回歸系數(shù)β1或β3的顯著性,而對(duì)于β1,β3的聯(lián)合顯著性,則使用通常受約束的F統(tǒng)計(jì)量。模型(10.1.5)的估計(jì)結(jié)果如下:

t=(-9.65)(5.31)(57.83)(-2.18)

這一結(jié)果表明,分別來看,我國儲(chǔ)蓄函數(shù)的截距和斜率在1990年前后發(fā)生了結(jié)構(gòu)變化。對(duì)β1和β3的聯(lián)合為0的原假設(shè),我們使用約束的F檢驗(yàn)。其約束條件為β1=β3

=0。記RSSr為有約束的殘差平方和,RSSu為無約束的殘差平方和,構(gòu)造并計(jì)算F統(tǒng)計(jì)量:由于計(jì)算得到的F統(tǒng)計(jì)量值17.65>F0.05(2.25)=3.39,故拒絕原假設(shè),接受備擇假設(shè),我國儲(chǔ)蓄函數(shù)在1990年前后發(fā)生顯著結(jié)構(gòu)變化。1990年以前的邊際儲(chǔ)蓄傾向?yàn)?/p>

β2+β3=0.832-0.481=0.3511990年后的邊際儲(chǔ)蓄傾向?yàn)?.832

四.虛擬變量之間的交互作用如同定量變量一樣,虛擬變量也能產(chǎn)生交互作用,例如,如果認(rèn)為性別和學(xué)歷是影響保健支出的主要因素,則可以構(gòu)建以下模型:這里,Yi

表示居民的保健消費(fèi)支出,D1i

為性別虛擬變量,D2i為學(xué)歷虛擬變量。若為女性D1i

=1,否則,D1i=0;若為大學(xué)本科及以上,D2i=1,否則,D2i=0。Xi為其它影響保健支出的定量變量,如收入等。(10.1.6)該模型隱含的含義是:由于學(xué)歷差異,男性在保健支出的差別與女性在保健支出的差別是一樣的。在許多應(yīng)用中,這種假定很可能不成立。也許對(duì)于女性而言,學(xué)歷差異導(dǎo)致的保健支出的差異大于男性。也就是說,兩個(gè)虛擬變量D1

和D2

之間會(huì)相互影響??梢圆捎锰摂M變量的交互作用項(xiàng)來反映這種影響:參照虛擬變量的定義,你能分析虛擬變量的交互作用項(xiàng)如何保健支出的差異嗎?(10.1.7)Wooldridge(2000)的一個(gè)例子:若一個(gè)人在工作過程中使用了計(jì)算機(jī),則虛擬變量work=1,否則work=0;若一個(gè)人在家使用計(jì)算機(jī),則虛擬變量home=1,否則home=0。利用1989年人口普查中13379個(gè)樣本,得到回歸結(jié)果:t=(19.67)(3.68)(0.74)

結(jié)果表明:在工作中使用計(jì)算機(jī)但在家里不用計(jì)算機(jī)的人比一個(gè)什么時(shí)候都不使用計(jì)算機(jī)的人,平均工資高17.7%,一個(gè)在家里使用計(jì)算機(jī)但在工作中不使用計(jì)算機(jī)的人,平均工資比根本就不使用計(jì)算機(jī)的人高7%;在家里和在工作中都使用計(jì)算機(jī)的人,比兩種情況下都不使用計(jì)算機(jī)的人,平均工資高26.4%。

§10.2線性概率模型一.線性概率模型的定義為了說明問題,先建立一個(gè)簡單的回歸模型:其中,如果高中畢業(yè)后選擇上大學(xué),Yi=1;如果高中畢業(yè)后選擇不上大學(xué),Yi

=0,為簡化,這里僅寫出一個(gè)解釋變量Xi,它表示家庭收入。

(10.2.1)如果我們?nèi)匀患俣S機(jī)誤差項(xiàng)ε的條件期望為0,就可以得到:現(xiàn)在記pi為選擇上大學(xué)的概率,即“Yi=1”的概率,則1-pi為選擇不上大學(xué)的概率,即“Yi=0”的概率,這樣,Yi服從貝努里二項(xiàng)概率分布,即p(Yi=1)=pi

p(Yi=0)=1-pi。由數(shù)學(xué)期望的定義:如果我們稱Yi=1的條件概率為成功的概率,則成功的概率p(Yi=1|Xi)=E(Yi|Xi)是解釋變量的線性函數(shù),因此,模型(10.2.1)被稱為線性概率模型(linearprobabilitymodel,LPM)

(10.2.2)

=二.有關(guān)線性概率模型的問題

1、誤差項(xiàng)ε不服從正態(tài)分布在線性概率模型中,誤差項(xiàng)εi和Yi一樣,只取值0或1,εi服從正態(tài)分布的假定就不成立。εi服從貝努里分布。在小樣本下,不能使用通常的t統(tǒng)計(jì)量和F統(tǒng)計(jì)量對(duì)(10.2.1)的OLS估計(jì)量進(jìn)行統(tǒng)計(jì)推斷,但在大樣本下,仍可沿用正態(tài)性假定下的方法。

2、線性概率模型的誤差項(xiàng)εi也不滿足同方差的假定

由于εi的均值為,因此,誤差項(xiàng)εi的方差隨著解釋變量Xi的變化而變化,從而誤差項(xiàng)有異方差。使用加權(quán)最小二乘法校正異方差,選擇校正的權(quán)數(shù)為,得到:(10.2.4)

(10.2.5)(10.2.5)的誤差項(xiàng)是同方差的,但權(quán)重wi是未知的。因而,估計(jì)模型(10.2.5)之前必須先估計(jì)權(quán)重wi??梢允褂萌缦聝刹椒ǎ?1)直接使用普通最小二乘法估計(jì)(10.2.1),基于此得到,再求出的估計(jì)值。(2)按照(10.2.5)的方法,用估計(jì)的對(duì)原始模型(10.2.1)進(jìn)行數(shù)據(jù)變換,對(duì)變換后的模型做普通最小二乘估計(jì)。

3、0≤E(Yi|Xi)≤1

可能不滿足。

簡單的克服方法是令所有大于1的等于1,令所有負(fù)的值都等于0。另一種更為合理的處理無界限性的方法,是以非線性平滑和有意義的方式的迫使所有的落在0~1之間,這就是我們將在本章后面將要講述的二分應(yīng)變量Logit模型和Probit模型。

4、R2不是總體擬合優(yōu)度的一個(gè)精確度量R2的替代指標(biāo)

1、使用樣本中能夠被估計(jì)的方程正確解釋的Yt的觀測值所占樣本總量的百分比去代替R2。2、計(jì)算正確解釋1的百分?jǐn)?shù)和正確解釋0的百分?jǐn)?shù),然后報(bào)告這兩個(gè)百分?jǐn)?shù)的平均數(shù),我們定義為。

例10-4

Wooldridge(2000)研究了已婚婦女參與勞動(dòng)力市場工作影響因素的模型。如果已婚婦女為了工資而在家庭以外工作過,二值變量inlf=1,否則inlf

=0;已婚婦女進(jìn)入勞動(dòng)力市場受到如下因素的影響:丈夫的收入(has),過去在勞動(dòng)力市場工作的年數(shù)(exp),受教育的年數(shù)(edu)和年齡(age),年齡低于6歲的孩子數(shù)(kid6),年齡介于6歲-18歲的孩子數(shù)(kid)。使用1975年753個(gè)樣本的估計(jì)結(jié)果如下:

t=(3.81)(-2.43)(5.43)(6.50)

(-3.33)(-8.00)(-7.71)(1.00)

(10.2.6)從這個(gè)例子中可以很容易地看到線性概率模型的某些不足:1、如果在(10.2.6)中代入解釋變量的某些特定組合值,很可能得到預(yù)測的inlf大于1或小于0。實(shí)際上,在Wooldridge(2000)使用的753個(gè)樣本中,預(yù)測到inlf為負(fù)有16個(gè)樣本,預(yù)測到inlf大于1的樣本有17個(gè)。2、線性概率模型(10.2.6)意味著已婚婦女參與勞動(dòng)的概率是諸解釋變量的線性函數(shù),而現(xiàn)實(shí)中,已婚婦女參與勞動(dòng)的概率不應(yīng)該與解釋變量的所有可能值都是線性相關(guān)。

§10.3Logit模型一.Logit

模型的含義在線性概率模型中,選擇上大學(xué)的概率與家庭收入的線性關(guān)系為:使用累積邏輯斯蒂(cumulativeLogistic)分布函數(shù)描述選擇上大學(xué)的概率與家庭收入的關(guān)系:(Yi=1的概率落在0~1之間)(10.3.1)(10.3.2)為表述方便,模型(10.3.2)等價(jià)的改寫為:這里,使用Logit函數(shù)所描述的pi與Zi之間的關(guān)系是非線性的。(10.3.3)圖10.2.2:pi與zi的關(guān)系圖如果選擇上大學(xué)的概率由(10.3.3)表述,則選擇不上大學(xué)的概率為:現(xiàn)在,等式左邊的變量為pi/(1-pi),它表示一個(gè)高中畢業(yè)生選擇上大學(xué)與選擇不上大學(xué)的比率,我們把這個(gè)相對(duì)比率稱為機(jī)會(huì)比率。對(duì)(10.3.5)兩邊取自然對(duì)數(shù),得到:這里,Li被稱為Logit。這樣,就將初始模型(10.3.2)轉(zhuǎn)化為標(biāo)準(zhǔn)線性模型

(10.3.4)(10.3.5)(10.3.6)(10.3.6)具有如下特點(diǎn):(1)雖然L對(duì)X為線性,但概率p本身與X卻是非線性關(guān)系,與概率p隨X而線性變化的線性概率模型有很大不同。(2)若L為正數(shù),這意味著當(dāng)解釋變量的值增加時(shí),被解釋變量等于1的概率也增加;若L為負(fù)數(shù),表明隨著解釋變量的值增加,被解釋變量等于1的概率的機(jī)會(huì)下降。(3)式中斜率系數(shù)β1的含義是,X每單位變化所導(dǎo)致的L的變化。對(duì)于截距項(xiàng)β0,如同普通的線性模型,它沒有明顯的經(jīng)濟(jì)含義。(4)對(duì)于給定的解釋變量X,我們真正想估計(jì)的并不是機(jī)會(huì)比率的對(duì)數(shù),而是成功的概率(即Y=1的概率)。因?yàn)?,成功的概率有直觀的經(jīng)濟(jì)含義,而機(jī)會(huì)比率不容易直觀地說出其經(jīng)濟(jì)含義。但是,一旦有了β0+β1Xi的估計(jì)值,我們很容易根據(jù)(10.3.6)計(jì)算出成功的概率。二.Logit

模型的估計(jì)為估計(jì)目的,將(10.3.6)改寫為計(jì)量模型:為估計(jì)該模型,我們必須首先知道被解釋變量Li的值,那么,如何得到Li的值呢?:(1)個(gè)體水平數(shù)據(jù);(2)群組數(shù)據(jù)或重復(fù)觀察數(shù)據(jù)。

(10.3.7)

1、群組數(shù)據(jù)的估計(jì)方法表10.4高中畢業(yè)生的家庭收入與選擇上大學(xué)的假想群組數(shù)據(jù)對(duì)應(yīng)于每個(gè)收入水平Xi,有Ni個(gè)高中畢業(yè)生,其中有ni個(gè)選擇上大學(xué)(ni≤Ni)。根據(jù)表中數(shù)據(jù),可以使用每組家庭收入所對(duì)應(yīng)的選擇上大學(xué)的相對(duì)頻率作為在這一收入水平下高中生選擇上大學(xué)概率的估計(jì):(10.3.8)隨機(jī)誤差項(xiàng)服從均值為0,方差為的正態(tài)分布。顯然,如同線性概率模型,Logit模型的誤差項(xiàng)方差取決于pi,因此也是異方差。這樣,為了獲得有效估計(jì),就應(yīng)該使用加權(quán)的最小二乘法估計(jì)模型。我們用作為pi的估計(jì),用作為的估計(jì)量。這樣,使用加權(quán)最小二乘法估計(jì)Logit模型的步驟如下:(1)對(duì)于每一個(gè)收入水平,計(jì)算選擇上大學(xué)的概率;(2)對(duì)每一個(gè)收入水平Xi,求Logit:(3)為解決異方差,對(duì)數(shù)據(jù)變換:

其中,權(quán)重,經(jīng)過這樣變換后,誤差項(xiàng)為同方差。(4)用普通最小二乘法估計(jì)模型(10.3.10),并用線性模型時(shí)通常使用方式構(gòu)造置信區(qū)間和進(jìn)行假設(shè)檢驗(yàn)。(10.3.10)t=(0.016)(7.55)

記得,因此,取估計(jì)的Logit的反對(duì)數(shù),可得到pi/(1-pi),即選擇上大學(xué)的機(jī)會(huì)比率。這樣,對(duì)(10.3.11)取反對(duì)數(shù),得到:計(jì)算得到家庭收入對(duì)選擇上大學(xué)的加權(quán)機(jī)會(huì)比率的偏效應(yīng)為:。這意味著,家庭收入每增加一個(gè)單位,選擇上大學(xué)的加權(quán)機(jī)會(huì)比率平均大約增加1.8%。(10.3.11)當(dāng)有k個(gè)解釋變量時(shí),對(duì)斜率系數(shù)一般的解釋為:如果選取第j(j≤k)個(gè)斜率系數(shù)的反對(duì)數(shù),再從中減去1并乘以100,你將得到對(duì)應(yīng)于第j個(gè)解釋變量每增加1個(gè)單位導(dǎo)致的機(jī)會(huì)比率的百分比變化。

X=40時(shí),選擇上大學(xué)的概率是多少?將代入(10.3.11),計(jì)算得到:

求解得到:

計(jì)算解釋變量X對(duì)機(jī)會(huì)比率的偏效應(yīng)利用微積分的知識(shí),容易得到在家庭收入為40單位水平上,收入每增加增加一單位,選擇上大學(xué)的概率的變化是:2、個(gè)體數(shù)據(jù)的Logit模型如果僅有個(gè)體數(shù)據(jù),就不能直接使用普通最小二乘法對(duì)模型進(jìn)行估計(jì),我們采用極大似然估計(jì)(maximumlikelihood,ML)。(1)極大似然估計(jì)量具有一致性和漸近有效性,在大樣本情況下還具有無偏性和最小方差性。(2)在樣本很大時(shí),極大似然估計(jì)還具有系數(shù)估計(jì)量為正態(tài)分布的性質(zhì)。

(3)對(duì)于二值虛擬被解釋變量模型,通常所計(jì)算的擬合優(yōu)度R2沒有太多的現(xiàn)實(shí)意義。McFadden

R2的度量方法,簡記為,其中,LIFur是模型包含所有解釋變量時(shí)無約束對(duì)數(shù)似然函數(shù)值,LLFr是回歸模型中僅含有截距項(xiàng)時(shí)的有約束的對(duì)數(shù)似然函數(shù)值。另一種相對(duì)簡單的擬合優(yōu)度的度量方法就是計(jì)數(shù)R2,它的定義如下:

計(jì)數(shù)

(4)為了檢驗(yàn)所有斜率系數(shù)同時(shí)為零的虛擬假設(shè),這里使用似然比(LR)統(tǒng)計(jì)量。在虛擬假設(shè)下,LR統(tǒng)計(jì)量服從自由度為解釋變量個(gè)數(shù)(不含截距項(xiàng))的分布。例10-6:如果第i個(gè)婦女有工作或正在尋找工作,取Yi=1,否則Yi=0。Ai為婦女的年齡,Si為婦女受教育年限。這里L(fēng)ogit模型可以寫為:估計(jì)已婚婦女參與勞動(dòng)市場的模型,數(shù)據(jù)及結(jié)果如下:(10.3.12)表10.5婦女參與勞動(dòng)力市場數(shù)據(jù)回歸模型的總體顯著性檢驗(yàn),LR統(tǒng)計(jì)量的值為7.30>5.99,因此,所有解釋變量對(duì)婦女參與勞動(dòng)力市場有顯著影響。從單個(gè)變量看,年齡對(duì)婦女參與勞動(dòng)力市場沒有顯著影響,受教育的年限對(duì)婦女是否參與勞動(dòng)力市場有顯著影響。每個(gè)斜率系數(shù)都是一個(gè)偏斜率系數(shù),它度量了在其余回歸元不變的條件下,某個(gè)解釋變量的值變動(dòng)一個(gè)單位所引起的Logit估計(jì)值的變化。變量S的系數(shù)為0.53,意味著在其他變量不變的前提下,如果變量S增加一個(gè)單位,估計(jì)的Logit值平均增加0.53個(gè)單位,也表明兩者正相關(guān)。

通過對(duì)斜率系數(shù)取反對(duì)數(shù)從而可得到機(jī)會(huì)比率,這是一個(gè)比Logit更有直觀經(jīng)濟(jì)意義的解釋。以變量S為例,對(duì)其回歸系數(shù)取反對(duì)數(shù)得1.69(≈e0.53),這表明在控制其他變量不變的前提下,婦女多接受一年教育,其參與勞動(dòng)市場的機(jī)會(huì)比率就增加約69%。我們也可以計(jì)算出某地婦女參與勞動(dòng)市場的實(shí)際概率。考察表中第10個(gè)婦女的觀察值,將她的數(shù)據(jù)代入所估計(jì)的Logit模型,得到她的Logit的估計(jì)值為-1.64,計(jì)算得到其參與勞動(dòng)力市場的概率為0.162??匆幌卤?0.5,這位婦女的Y=1,說明她參與了勞動(dòng)市場,而我們估計(jì)的其參與勞動(dòng)市場的概率為0.162,遠(yuǎn)小于1,說明我們的模型錯(cuò)誤地預(yù)測了這位婦女。30個(gè)樣本中正確預(yù)測了21個(gè)樣本,不正確預(yù)測的樣本有9個(gè)。根據(jù)預(yù)測的結(jié)果,可以計(jì)算計(jì)數(shù)R2

=21/30=0.7,本例中McFaddenR2=0.18,當(dāng)然這兩者沒有可比性?!?0.4Probit

模型在線性概率模型中,虛擬被解釋變量的取值可能超過0~1區(qū)間,Logit模型是使用累積邏輯分布函數(shù)將被解釋變量取值限制在0~1區(qū)間?,F(xiàn)在我們考慮使用另一種方法克服線性概率模型的這一內(nèi)在缺陷。一個(gè)簡單而有效的途徑就是把模型的左邊(β0+β1Xt)轉(zhuǎn)化為概率的形式。也就是說,使用一個(gè)函數(shù)F,使得:(10.4.1)

我們采用分布函數(shù)或累計(jì)密度函數(shù)將轉(zhuǎn)化至0~1區(qū)間。Logit模型就是把函數(shù)選擇為邏輯斯蒂(Logistic)分布函數(shù),現(xiàn)在我們將函數(shù)F選擇為標(biāo)準(zhǔn)正態(tài)分布函數(shù),則形成一種新的具有吸引力的模型:這里,。標(biāo)準(zhǔn)正態(tài)函數(shù)就以概率的形式把zi限制在0~1之間,從而Yi=1的概率也在0~1之間。我們將(10.4.2)稱為Probit模型,有時(shí)也稱normit模型。(10.4.2)Probit模型看起來和我們在前面考察過的Logit模型不太一樣,但對(duì)(10.4.2)進(jìn)行簡單變換,看起來就會(huì)很熟悉:其中是正態(tài)累積分布函數(shù)的反函數(shù)。Probit模型是典型地對(duì)具有方程(10.4.2)形式的模型應(yīng)用極大似然估計(jì),但以形如(10.4.3)方程表示結(jié)果。

(10.4.3)

例10-7應(yīng)用前面Logit模型所使用過的婦女勞動(dòng)力數(shù)據(jù)來估計(jì)Probit模型。

總體顯著性檢驗(yàn)似然比統(tǒng)計(jì)量LR=7.48>5.99,故所有解釋變量對(duì)婦女參與勞動(dòng)力市場有顯著的影響。從斜率系數(shù)估計(jì)結(jié)果看,斜率系數(shù)估計(jì)的符號(hào)與理論預(yù)期一致,如年齡變量的系數(shù)為負(fù),表示年齡越大,婦女參與勞動(dòng)市場的可能性越低。從回歸系數(shù)的顯著性檢驗(yàn)看,年齡變量A的回歸系數(shù)z的統(tǒng)計(jì)量值為-0.25>-1.96,其p也約為0.80,意味著年齡對(duì)婦女參與勞動(dòng)力市場沒有顯著影響。變量S所對(duì)應(yīng)回歸系數(shù)z的統(tǒng)計(jì)量為2.27>1.96,其p也約為0.023,說明受教育的年限對(duì)婦女是否參與勞動(dòng)力市場有顯著影響。如何解釋Probit模型中斜率系數(shù)的含義呢?

回顧模型(10.4.2),我們需要求概率對(duì)解釋變量的偏導(dǎo)數(shù),結(jié)果為:其中,

是標(biāo)準(zhǔn)正態(tài)概率密度函數(shù)在處的取值,顯然,這個(gè)值的計(jì)算將取決于Xi的特定值。比如,第20個(gè)婦女的年齡A為27,接受教育的年數(shù)S為13,根據(jù)這些數(shù)據(jù)求得==0.302。將這個(gè)值乘以斜率系數(shù)的估計(jì)值0.324,得到0.302×0.324=0.098。(10.4.4)對(duì)于接受教育年數(shù)為13年的婦女,在其余變量不變的前提下,每增加一年接受教育的年數(shù),參與勞動(dòng)市場的概率約增加9.8%。根據(jù)上述說明,我們可以簡單總結(jié)k個(gè)解釋變量的Probit模型中,第j(j≤k)個(gè)解釋變量對(duì)被解釋變量的偏效應(yīng)由βjf(zi)給出。這里,f(zi)是標(biāo)準(zhǔn)正態(tài)分布變量的密度,zi代表分析中所用的回歸模型,即:§10.5線性概率模型、Logit模型與Probit模型的比較共同點(diǎn):線性概率模型、Logit模型和Probit模型都僅是未知的總體回歸模型E(Y|X)=p(Y=1|X)的近似不同點(diǎn):線性概率模型的應(yīng)用及解釋相對(duì)較簡單和方便,但它不能描述真實(shí)總體回歸函數(shù)的非線性,也不能將Y=1的概率限制在0~1之間;Logit模型和Probit模型雖然可以從概率上描述總體回歸函數(shù)的非線性,從而將Y=1的概率限制在0~1之間,但模型的估計(jì)和回歸系數(shù)的解釋相對(duì)更為困難。Logit模型和Probit模型的比較:邏輯分布有相對(duì)較平坦的尾部,也就是說,Logit的條件概率比Probit以更慢的速度趨近于0和1。但由于Logit使用相對(duì)簡單的數(shù)學(xué)形式,因此,實(shí)踐中常常選用它。盡管線性概率模型有明顯的不足,但當(dāng)解釋變量的觀察值中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論