第十章定性選擇模型與受限因變量模型_第1頁
第十章定性選擇模型與受限因變量模型_第2頁
第十章定性選擇模型與受限因變量模型_第3頁
第十章定性選擇模型與受限因變量模型_第4頁
第十章定性選擇模型與受限因變量模型_第5頁
已閱讀5頁,還剩53頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章定性選擇模型與受限因變量模型第一頁,共五十八頁,編輯于2023年,星期一對(duì)于被解釋變量而言,很多情況也會(huì)對(duì)其取值有所限制。有時(shí),因變量描述的是微觀個(gè)體的某種選擇、特征或所屬等,即因變量為定性變量,相應(yīng)的模型稱為定性選擇模型或定性響應(yīng)模型;另一些情況是,因變量的取值被限定在某個(gè)特殊范圍,一般我們稱這類取值范圍受到限制的因變量為受限因變量,相應(yīng)的模型稱為受限因變量模型。兩類模型樣本數(shù)據(jù)一般是橫截面數(shù)據(jù)。兩類模型被廣泛應(yīng)用于消費(fèi)者行為、勞動(dòng)經(jīng)濟(jì)學(xué)、農(nóng)業(yè)經(jīng)濟(jì)學(xué)等領(lǐng)域,大多屬于微觀計(jì)量經(jīng)濟(jì)學(xué)的研究范疇。本章介紹幾種常見的定性選擇模型與受限因變量模型。第二頁,共五十八頁,編輯于2023年,星期一第一節(jié)線性概率模型

因變量為虛擬變量的模型被稱為定性選擇模型或定性響應(yīng)模型。如果只有兩個(gè)選擇,我們可用0和1分別表示它們,如乘公交為0,自駕車為1,這樣的模型稱為二元選擇模型(binarychoiceModels),多于兩個(gè)選擇(如上班方式加上一種騎自行車)的定性選擇模型稱為多項(xiàng)選擇模型(Multinomialchoicemodels)。我們先從基礎(chǔ)的二元選擇模型入手,介紹定性選擇模型的設(shè)定和估計(jì)。最簡(jiǎn)單的二元選擇模型是線性概率模型(LinearProbabilityModels,LPM)。第三頁,共五十八頁,編輯于2023年,星期一一、線性概率模型的概念下面用一個(gè)關(guān)于是否讀研究生的例子來說明如何解釋線性概率模型的結(jié)果。模型為:其中:第四頁,共五十八頁,編輯于2023年,星期一

設(shè)回歸結(jié)果如下(所有系數(shù)值均在10%水平統(tǒng)計(jì)上顯著):

對(duì)每個(gè)觀測(cè)值,我們可根據(jù)(10.3)式計(jì)算因變量的擬合值或預(yù)測(cè)值。在常規(guī)OLS回歸中,因變量的擬合值或預(yù)測(cè)值的含義是,平均而言,我們可以預(yù)期的因變量的值。但在本例的情況下,這種解釋就不適用了。假設(shè)學(xué)生甲的平均分為3.5,家庭年收入為5萬美元,Y的擬合值為第五頁,共五十八頁,編輯于2023年,星期一

盡管因變量在這個(gè)二元選擇模型中只能取兩個(gè)值:0或1,可是該學(xué)生的的擬合值或預(yù)測(cè)值為0.8。我們將該擬合值解釋為該生決定讀研的概率的估計(jì)值。因此,該生決定讀研的可能性或概率的估計(jì)值為0.8。需要注意的是,這種概率不是我們能觀測(cè)到的數(shù)字,能觀測(cè)的是讀研還是不讀研的決定。對(duì)斜率系數(shù)的解釋也不同了。在常規(guī)回歸中,斜率系數(shù)代表的是其他解釋變量不變的情況下,該解釋變量的單位變動(dòng)引起的因變量的變動(dòng)。而在線性概率模型中,斜率系數(shù)表示其他解釋變量不變的情況下,該解釋變量的單位變動(dòng)引起的因變量等于1的概率的變動(dòng)。第六頁,共五十八頁,編輯于2023年,星期一CPA的系數(shù)估計(jì)值0.4意味著家庭收入不變的情況下,一個(gè)學(xué)生的增加一個(gè)點(diǎn)(如從3.0到4.0),該生決定去讀研的概率的估計(jì)值增加0.4。

INCOME的系數(shù)估計(jì)值0.002表明,一個(gè)學(xué)生的成績(jī)不變,而家庭收入增加1000美元(單位為千美元),該生決定去讀研的概率的估計(jì)值增加0.002。

LPM模型中,解釋變量的變動(dòng)與虛擬因變量值為1的概率線性相關(guān),因而稱為線性概率模型。第七頁,共五十八頁,編輯于2023年,星期一二、線性概率模型的估計(jì)和問題第一個(gè)問題是線性概率模型存在異方差性。擾動(dòng)項(xiàng)的方差是,這里p是因變量等于1的概率,此概率對(duì)于每個(gè)觀測(cè)值不同,因而擾動(dòng)項(xiàng)方差將不是常數(shù),導(dǎo)致異方差性??梢允褂肳LS法,但不是很有效,并且將改變結(jié)果的含義。第二個(gè)問題是擾動(dòng)項(xiàng)不是正態(tài)分布的。事實(shí)上,線性概率模型的擾動(dòng)項(xiàng)服從二項(xiàng)分布。第三個(gè)問題,它假定自變量與Y=1的概率之間存在線性關(guān)系,而此關(guān)系往往不是線性的。第八頁,共五十八頁,編輯于2023年,星期一

第四個(gè)問題是,擬合值可能小于0或大于1,而概率值必須位于0和1的閉區(qū)間內(nèi)?;氐接嘘P(guān)讀研的例子。假設(shè)學(xué)生乙的為4.0,家庭收入為20萬美元,則代入(10.3)式,Y的擬合值為

從而得到一個(gè)不可能的結(jié)果(概率值大于1)。假設(shè)另有一個(gè)學(xué)生丙的為1.0,家庭收入為5萬元,則其Y的擬合值為-0.2,表明讀研的概率為負(fù)數(shù),這也是一個(gè)不可能的結(jié)果。第九頁,共五十八頁,編輯于2023年,星期一

解決此問題的一種方法是,令所有負(fù)擬合值都等于0,所有大于1的擬合值都等于1。但也無法令人十分滿意,因?yàn)樵诂F(xiàn)實(shí)中很少會(huì)有決策前某人讀研的概率就等于1的情況,同樣,盡管某些人成績(jī)不是很好,但他去讀研的機(jī)會(huì)仍會(huì)大于0。線性概率模型傾向于給出過多的極端結(jié)果:估計(jì)的概率等于0或1。

第十頁,共五十八頁,編輯于2023年,星期一

第五個(gè)問題是在線性概率模型中,以及不再是合適的擬合優(yōu)度測(cè)度。事實(shí)上,此問題不僅是線性概率模型的問題,而是所有定性選擇模型的問題。較好一點(diǎn)的測(cè)度是模型正確預(yù)測(cè)的觀測(cè)值的百分比。首先,我們將每一預(yù)測(cè)歸類為1或0。如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測(cè)值為1。若小于0.5,則認(rèn)為因變量的預(yù)測(cè)值為0。然后,將這些預(yù)測(cè)值與實(shí)際發(fā)生的情況相比較,計(jì)算出正確預(yù)測(cè)的百分比:

第十一頁,共五十八頁,編輯于2023年,星期一

需要指出的是,這個(gè)測(cè)度也不是很理想,但預(yù)測(cè)結(jié)果的好壞,并非定性選擇模型唯一關(guān)心的事,這類模型常被用于研究影響人們進(jìn)行某個(gè)決策的因素。讓我們來看一個(gè)競(jìng)選的例子。假設(shè)候選人甲和乙二人競(jìng)選某市市長(zhǎng),我們可以用一個(gè)二元選擇模型來研究影響選民決策的因素,模型為:其中:第十二頁,共五十八頁,編輯于2023年,星期一VariableCoefficientStandarderrort-Statisticp-ValueConstant-0.510.19-2.650.01INCOME0.00980.0033.250.00AGE0.0160.00533.080.00MALE0.00310.130.020.98表10.2兩候選人選舉線性概率模型回歸結(jié)果Dependentvariable:CAND1Observations:30=0.58Adjusted=0.53ResidualSumofSquares=3.15F-statistic=11.87第十三頁,共五十八頁,編輯于2023年,星期一

如表所示,INCOME的斜率估計(jì)值為正,且在1%的水平上顯著。年齡和性別不變的情況下,收入增加1000元,選擇候選人甲的概率增加0.0098。

AGE的斜率估計(jì)值也在1%的水平上顯著。在收入和性別不變的情況下,年齡增加1歲,選擇候選人甲的概率增加0.016。的斜率系數(shù)統(tǒng)計(jì)上不顯著,因而沒有證據(jù)表明樣本中男人和女人的選票不同。我們可以得出如下結(jié)論:年老一些、富裕一些的選民更喜歡投票給候選人甲。表中給出CAND1的擬合值,每個(gè)大于等于0.5的擬合值計(jì)入CAND1為1的預(yù)測(cè),而小于0.5的擬合值則計(jì)入CAND1為0的預(yù)測(cè)。第十四頁,共五十八頁,編輯于2023年,星期一

從表可看出,30個(gè)觀測(cè)值中,27個(gè)(或90%)預(yù)測(cè)正確。選甲的14人中,12人(或85.7%)預(yù)測(cè)正確。選乙的16人中,15人(或93.8%)預(yù)測(cè)正確。是0.58,表明模型解釋了因變量的58%的變動(dòng),這與90%的正確預(yù)測(cè)比例相比,低了不少。注意表10-3中有一些擬合值大于1或小于0。這是我們前面指出的這類模型的缺點(diǎn)之一,這些擬合值是概率的估計(jì)值,而概率永遠(yuǎn)不可能大于1或小于0。第十五頁,共五十八頁,編輯于2023年,星期一第二節(jié)Probit模型和Logit模型

雖然估計(jì)和使用線性概率模型很簡(jiǎn)單,但存在上面討論的幾個(gè)問題,其中最嚴(yán)重的兩個(gè)問題是擬合值小于0或大于1的問題和假定自變量和的概率之間存在線性關(guān)系的假設(shè)不現(xiàn)實(shí)的問題。使用更為復(fù)雜的二元響應(yīng)模型可以克服這些缺陷第十六頁,共五十八頁,編輯于2023年,星期一一.Probit和Logit模型的設(shè)定估計(jì)二元選擇模型的另一類方法假定回歸模型為這里不可觀測(cè),通常稱為潛變量(latentvariable)。我們能觀測(cè)到的是虛擬變量:第十七頁,共五十八頁,編輯于2023年,星期一

這就是Probit和Logit方法的思路。Probit模型和Logit模型的區(qū)別在于對(duì)中擾動(dòng)項(xiàng)u的分布的設(shè)定,前者設(shè)定為正態(tài)分布,后者設(shè)定為logistic分布。與線性概率模型的區(qū)別是,這里假設(shè)潛變量的存在。例如,若被觀測(cè)的虛擬變量是某人買車還是不買車,將被定義為“買車的欲望或能力”,注意這里的提法是“欲望”和“能力”,因此解釋變量是解釋這些元素的??梢钥闯?,乘上任何正數(shù)都不會(huì)改變,因此這里習(xí)慣上假設(shè)Var(ui)=1,從而固定的規(guī)模。我們有第十八頁,共五十八頁,編輯于2023年,星期一其中F是u的累積分布函數(shù)。如果u的分布是對(duì)稱的,則,我們可以將上式寫成我們可寫出似然函數(shù):第十九頁,共五十八頁,編輯于2023年,星期一

上式中F的函數(shù)形式取決于有關(guān)擾動(dòng)項(xiàng)u的假設(shè),如果的累積分布是logistic分布,則我們得到的是logit模型。在這種情況下,累積分布函數(shù)為:因此第二十頁,共五十八頁,編輯于2023年,星期一請(qǐng)注意,對(duì)于logit模型:

上式的左端是機(jī)會(huì)(odds)的對(duì)數(shù),稱為對(duì)數(shù)機(jī)會(huì)比率(log-oddsratio),因而上式表明對(duì)數(shù)機(jī)會(huì)比率是各解釋變量的線性函數(shù),而對(duì)于線性概率模型,為各解釋變量的線性函數(shù)。如果服從正態(tài)分布,我們得到的是probit模型(或normit模型),在這種情況下,累積分布函數(shù)為:第二十一頁,共五十八頁,編輯于2023年,星期一

無論是probit模型還是logit模型,極大似然函數(shù)都伴隨著非線性估計(jì)方法,目前很多計(jì)量經(jīng)濟(jì)分析軟件已可用于probit和logit分析,用起來很方便。由于累積正態(tài)分布和累積logistic分布很接近,只是尾部有點(diǎn)區(qū)別,因此,我們無論logit法還是probit法,得到的結(jié)果都不會(huì)有很大不同??墒?,兩種方法得到的參數(shù)估計(jì)值不是直接可比的。由于logistic分布的方差為,因此,logit模型得到的的估計(jì)值必須乘以,才能與probit模型得到的估計(jì)值相比較(正態(tài)分布標(biāo)準(zhǔn)差為1)。第二十二頁,共五十八頁,編輯于2023年,星期一概率=F(Z)10ZProbit模型線性概率模型圖10-1線性概率模型和Probit模型第二十三頁,共五十八頁,編輯于2023年,星期一二、Probit模型和Logit模型的極大似然估計(jì)和假設(shè)檢驗(yàn)估計(jì)LPM,我們可以采用OLS或WLS。在Probit模型和Logit模型中,由于的非線性性質(zhì),OLS或WLS都不再適用。估計(jì)Probit模型和Logit模型,通常采用極大似然法。第二十四頁,共五十八頁,編輯于2023年,星期一極大似然估計(jì)量(MLE)即由極大化此對(duì)數(shù)似然函數(shù)得到。對(duì)于logit模型,G是標(biāo)準(zhǔn)logisticcdf,是logit估計(jì)量;對(duì)于probit模型,G是標(biāo)準(zhǔn)正態(tài)cdf,是probit估計(jì)量。由于此最大化問題的非線性性質(zhì),我們很難寫出Probit模型和Logit模型的參數(shù)的極大似然估計(jì)量的具體表達(dá)式??梢宰C明,在很一般的條件下,MLE是一致的、漸近正態(tài)和漸近有效的(一般性討論參見Woodridge(2002))。第二十五頁,共五十八頁,編輯于2023年,星期一伴隨每一個(gè)極大似然估計(jì)值,有一個(gè)與之對(duì)應(yīng)的標(biāo)準(zhǔn)誤差。支持Probit和Logit的軟件包在給出系數(shù)估計(jì)值的同時(shí)會(huì)給出與之對(duì)應(yīng)的標(biāo)準(zhǔn)誤差。一旦我們從軟件包的報(bào)告中得到了標(biāo)準(zhǔn)誤差,就可以構(gòu)造(漸近的)t檢驗(yàn)和置信區(qū)間,與應(yīng)用OLS、2SLS估計(jì)量做檢驗(yàn)時(shí)一樣。例如要檢驗(yàn),我們做法是,構(gòu)造t統(tǒng)計(jì)量,然后按通常的檢驗(yàn)程序進(jìn)行檢驗(yàn)。我們也可以對(duì)Probit模型和Logit模型的參數(shù)的多重約束(即關(guān)于的多個(gè)線性或非線性約束)進(jìn)行檢驗(yàn),可以采用沃爾德檢驗(yàn)、拉格朗日乘數(shù)檢驗(yàn)和似然比檢驗(yàn),詳細(xì)討論見第4、5章有關(guān)內(nèi)容。第二十六頁,共五十八頁,編輯于2023年,星期一三、偏效應(yīng)在二元響應(yīng)模型的大多數(shù)應(yīng)用中,首要的目標(biāo)是解釋對(duì)響應(yīng)概率的影響。在潛變量模型中,對(duì)潛變量的偏效應(yīng)是,我們下面將看到對(duì)響應(yīng)概率的偏效應(yīng)是,對(duì)正態(tài)分布和logistic分布而言,總有,因而上述兩個(gè)效應(yīng)的符號(hào)相同,影響的方向總是一致的。潛變量極少有一個(gè)確定的度量單位,因而本身的大小,往往不是很有用的(相對(duì)于線性概率模型而言)。對(duì)于大多數(shù)應(yīng)用而言,我們要估計(jì)的是解釋變量對(duì)響應(yīng)概率的影響。由于的非線性本質(zhì),使得這個(gè)工作相當(dāng)復(fù)雜,通常需要區(qū)分為連續(xù)變量和離散變量?jī)煞N情況。第二十七頁,共五十八頁,編輯于2023年,星期一(1)如果是一個(gè)大致連續(xù)的變量,則無論P(yáng)robit模型還是Logit模型,對(duì)響應(yīng)概率的偏效應(yīng)都在處取最大值:在Probit模型中,;在Logit模型中,(2)對(duì)于離散解釋變量,微分沒有實(shí)際意義。若離散解釋變量從變化到,則其對(duì)響應(yīng)概率的離散偏效應(yīng)可由下式表示第二十八頁,共五十八頁,編輯于2023年,星期一與LPM模型相比,偏效應(yīng)的值多出一個(gè)乘積項(xiàng),稱為比例因子(scalefactor)或調(diào)整因子(adjustmentfactor),它與全部解釋變量有關(guān),因而會(huì)隨的值而變。在計(jì)算偏效應(yīng)時(shí),為方便起見,通常希望有一個(gè)適用于模型中所有斜率的比例因子。有兩種方法解決這個(gè)問題:第一種方法是用解釋變量觀測(cè)值的均值計(jì)算偏效應(yīng)的表達(dá)式,比例因子為第二種方法是對(duì)每個(gè)觀測(cè)值計(jì)算偏效應(yīng),然后計(jì)算它們的樣本均值,這樣得到的是平均偏效應(yīng)(averagepartialeffect,APE)。第二十九頁,共五十八頁,編輯于2023年,星期一四、擬合優(yōu)度的測(cè)度從實(shí)際角度看,在現(xiàn)代計(jì)算機(jī)解決了復(fù)雜的計(jì)算問題之后,Probit和Logit模型最困難之處就落在模型結(jié)果的提供和解釋方面。支持Probit和Logit的軟件包都會(huì)報(bào)告系數(shù)估計(jì)值、它們的標(biāo)準(zhǔn)誤差和對(duì)數(shù)似然函數(shù)值。如同在線性概率模型中討論的一樣,Probit模型和Logit模型也可以計(jì)算正確預(yù)測(cè)的百分比這一指標(biāo)作為擬合優(yōu)度的測(cè)度。首先,我們將每一預(yù)測(cè)歸類為1或0。如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測(cè)值為1。若小于0.5,則認(rèn)為因變量的預(yù)測(cè)值為0。然后,將這些預(yù)測(cè)值與實(shí)際發(fā)生的情況相比較,計(jì)算出正確預(yù)測(cè)的百分比。第三十頁,共五十八頁,編輯于2023年,星期一盡管正確預(yù)測(cè)的百分比作為擬合優(yōu)度的測(cè)度是有用的,但它也可能造成誤導(dǎo),特別是在對(duì)小可能結(jié)果的預(yù)測(cè)非常糟糕的情況下仍能得到相當(dāng)高的正確預(yù)測(cè)的百分比。例如,假設(shè)n=200,160個(gè)觀測(cè)值為,這160個(gè)觀測(cè)值中,有140個(gè)預(yù)測(cè)值也是0,即使對(duì)于的那40個(gè)觀測(cè)值的預(yù)測(cè)都錯(cuò),正確預(yù)測(cè)全部結(jié)果的百分比仍高達(dá)70%!度量Probit和Logit模型的擬合優(yōu)度的測(cè)度還可以采用各種pseudo-R2

。pseudo-原意是偽(假),這里采用它,意思是與常規(guī)R2類似但不相同,而不是說它是假的。對(duì)于Probit模型和Logit模型,已經(jīng)開發(fā)了幾種有用的pseudo-R2測(cè)度,其中最常用的是McFadden(1974)提出的pseudo-R2測(cè)度第三十一頁,共五十八頁,編輯于2023年,星期一表10-4兩候選人選舉模型的Probit回歸結(jié)果Dependentvariable:CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-5.191.70-3.060.00INCOME0.0710.0342.100.04AGE0.0730.0342.180.03MALE-0.700.90-0.780.44Observations:30McFaddenpseudo-R2=0.61ResidualSumofSquares=2.62第三十二頁,共五十八頁,編輯于2023年,星期一

采用Probit模型估計(jì)的結(jié)果與前面用線性概率模型估計(jì)的結(jié)果有所不同。采用Probit模型的情況下,INCOME和AGE的系數(shù)估計(jì)值在5%的誤差水平上顯著,而在線性概率模型的情況下,在1%的水平上顯著。由于我們知道線性概率模型存在嚴(yán)重的問題,因此Probit結(jié)果可能更準(zhǔn)確一些??墒?,如果是實(shí)際研究的話,要有一個(gè)大得多的樣本。Probit模型的系數(shù)估計(jì)值不能像線性概率模型那樣,解釋成概率的變動(dòng)(有些計(jì)量經(jīng)濟(jì)分析軟件程序可以將系數(shù)估計(jì)值轉(zhuǎn)換為與線性概率模型相當(dāng)?shù)母怕首儎?dòng))。使用Probit模型的一種有意思的方式是求出擬合值進(jìn)行預(yù)測(cè),如我們用線性概率模型所做的一樣。第三十三頁,共五十八頁,編輯于2023年,星期一Probit模型中用McFadden的pseudo-R2作為擬合優(yōu)度的測(cè)度。pseudo-R2是用于虛擬因變量模型的擬合優(yōu)度的測(cè)度的名字。pseudo-原意是偽(假),這里采用它,意思是與常規(guī)R2類似但不相同,而不是說它是假的。對(duì)于定性選擇模型,已經(jīng)開發(fā)了幾種有用的pseudo-R2測(cè)度,這里所用的是McFadden開發(fā)的。很多估計(jì)Probit或Logit模型的計(jì)量經(jīng)濟(jì)程序計(jì)算pseudo-R2。本例中給出的0.61的含義是,Probit模型解釋了因變量61%的變動(dòng)。第三十四頁,共五十八頁,編輯于2023年,星期一

與probit模型一樣,logit模型也不能用OLS法估計(jì),而要用極大似然法估計(jì)。采用表10-1中的同樣數(shù)據(jù)估計(jì)logit模型,回歸結(jié)果如表10-5所示。表10-5兩候選人選舉模型的Logit回歸結(jié)果Dependentvariable:CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-8.963.23-2.770.01INCOME0.120.061.980.05AGE0.130.062.030.04MALE-1.031.54-0.670.51Observations:30McFaddenpseudo-R2=0.60ResidualSumofSquares=2.59第三十五頁,共五十八頁,編輯于2023年,星期一

McFaddenpseudo-R2和統(tǒng)計(jì)顯著性與probit模型的結(jié)果類似。INCOME和AGE的系數(shù)估計(jì)值亦在5%誤差水平上顯著。而MALE則在兩種模型回歸中均不顯著。而斜率系數(shù)估計(jì)值則不同,這是因?yàn)樗鼈兊囊饬x不一樣。例如,AGE的系數(shù)估計(jì)值0.13意味著收入和性別不變的情況下,年齡增大一歲,選舉候選人甲的機(jī)會(huì)的對(duì)數(shù)增加0.13。實(shí)際上,除了斜率系數(shù)的解釋不同,使用probit模型和logit模型并沒有多大區(qū)別。第三十六頁,共五十八頁,編輯于2023年,星期一六、多項(xiàng)選擇模型多項(xiàng)選擇模型是研究在多于兩個(gè)的選項(xiàng)中進(jìn)行決策的模型。一般可以依照選擇集分為有序和無序兩種寬泛的類型。比如,城市交通工具的選擇顯然是無序的,而投資者選擇公司債券(債券經(jīng)過評(píng)級(jí))是有序的。有關(guān)二元選擇的Logit模型可以推廣到因變量有兩個(gè)以上離散取值的情況,構(gòu)成多項(xiàng)Logit模型(multinomiallogitmodel),此模型的主要優(yōu)點(diǎn)是容易計(jì)算,選擇給定方案的概率易于被表示,并且極大似然函數(shù)可以用簡(jiǎn)單明了的方式產(chǎn)生和最大化。第三十七頁,共五十八頁,編輯于2023年,星期一該模型的缺點(diǎn)是它以所謂的不相干選擇的獨(dú)立性(independenceofirrelevantalternatives,IIA)性質(zhì)為特征。假設(shè)一個(gè)幾乎與一個(gè)已有選項(xiàng)相同的新選項(xiàng)被加進(jìn)選擇集中,我們期望的是,從此模型得到的選擇這兩個(gè)幾乎相同的選項(xiàng)(如乘公共汽車時(shí)選老車型還是新車型)的概率將被分成兩半,而選擇其它選項(xiàng)的概率不受影響。不幸的是,情況不是這樣。因此當(dāng)兩個(gè)或多個(gè)選項(xiàng)是相近替代方案時(shí),采用多項(xiàng)Logit模型不適合。在這種情況下,可考慮多項(xiàng)Probit模型(multinomialProbitmodel)。多項(xiàng)Probit模型允許擾動(dòng)項(xiàng)跨選項(xiàng)相關(guān),從而繞過IIA困境。它的缺點(diǎn)是計(jì)算困難,計(jì)算四個(gè)以上選項(xiàng)的問題幾乎不可行。隨著計(jì)算機(jī)能力和計(jì)算方法的改進(jìn),多項(xiàng)Probit模型的應(yīng)用前景會(huì)越來越好。第三十八頁,共五十八頁,編輯于2023年,星期一如果因變量本質(zhì)上是有序的,多項(xiàng)Logit模型和多項(xiàng)Probit模型均無法解釋解釋因變量的序數(shù)性質(zhì)。因?yàn)闆Q策者選擇不同的方案所得到的效用也是排序的,一般多元離散選擇模型中的效用關(guān)系不再適用。處理有序離散因變量的常用方法是有序Probit模型與有序Logit模型。第三十九頁,共五十八頁,編輯于2023年,星期一*第三節(jié)Censored模型Censored模型研究一類重要的受限因變量:在取正值時(shí)大致連續(xù),但總體中有一個(gè)不可忽略的部分取值為零??疾鞗Q定居民家庭用于耐用消費(fèi)品(如汽車等)支出的因素,或者研究居民每年用于慈善捐助支出的決定因素,或者研究居民每月用于特殊消費(fèi)品(如酒類等)支出的決定因素等等。這些研究都需要對(duì)總體進(jìn)行抽樣調(diào)查取得相關(guān)的數(shù)據(jù),而抽樣調(diào)查的結(jié)果有一個(gè)共同的特點(diǎn),那就是有相當(dāng)一部分個(gè)體用于這些方面支出的金額為零,同時(shí)不為零的支出數(shù)據(jù)會(huì)呈現(xiàn)出基本連續(xù)的形態(tài)。第四十頁,共五十八頁,編輯于2023年,星期一一、Censored模型的概念當(dāng)因變量在特定范圍內(nèi)的值都轉(zhuǎn)換成(或報(bào)告為)某個(gè)值時(shí),稱因變量被歸并(censoring),稱此變量為歸并變量(censoredvariable)。censored回歸模型的一般形式是第四十一頁,共五十八頁,編輯于2023年,星期一二、Tobit模型的估計(jì)為了計(jì)估模型參數(shù),我們推導(dǎo)Y的均值設(shè),稱為逆米爾斯比率(inverseMillsratio),它是標(biāo)準(zhǔn)正態(tài)pdf與標(biāo)準(zhǔn)正態(tài)cdf在c處的比值。則第四十二頁,共五十八頁,編輯于2023年,星期一有了上面的結(jié)果,我們可以計(jì)算從總體中隨機(jī)抽取的觀測(cè)值的均值因此,一旦有了的估計(jì)值,我們就可以確保Y的預(yù)測(cè)值為正。當(dāng)然,保證Y的預(yù)測(cè)值為正的代價(jià)是使用了更為復(fù)雜的非線性模型。第四十三頁,共五十八頁,編輯于2023年,星期一Censored模型通常采用極大似然估計(jì)。由Y的分布,可得模型的對(duì)數(shù)似然函數(shù)為該對(duì)數(shù)似然函數(shù)由兩部分組成:一部分對(duì)應(yīng)于沒有限制的觀測(cè)值,是經(jīng)典回歸部分;一部分對(duì)應(yīng)于受到限制的觀測(cè)值。因而上式是一個(gè)非標(biāo)準(zhǔn)的對(duì)數(shù)似然函數(shù),實(shí)際上是離散分布與連續(xù)分布的混合。最大化對(duì)數(shù)似然函數(shù),可得極大似然估計(jì)量。這一估計(jì)量的性質(zhì)與普通MLE的性質(zhì)相同。一般情況下,需采用數(shù)值方法來求極大似然估計(jì)值。第四十四頁,共五十八頁,編輯于2023年,星期一求標(biāo)準(zhǔn)誤差的矩陣表達(dá)式很復(fù)雜,詳細(xì)的討論見Wooldridge(2002)。利用Eviews軟件,很方便得到模型的參數(shù)估計(jì)值及標(biāo)準(zhǔn)誤差,因而可以進(jìn)行參數(shù)的假設(shè)檢驗(yàn)。我們還可以采用沃爾德統(tǒng)計(jì)量或似然比統(tǒng)計(jì)量同時(shí)檢驗(yàn)多個(gè)約束,其方法與一般的MLE相同。

Censored模型的MLE需要兩個(gè)基本假定:潛變量模型中隨機(jī)干擾項(xiàng)的同方差性和正態(tài)性。如果存在異方差性或非正態(tài)性,那么MLE估計(jì)量便是不一致的。第四十五頁,共五十八頁,編輯于2023年,星期一在實(shí)踐中,研究人員估計(jì)Censored模型時(shí)往往采用OLS法,盡管OLS估計(jì)值不一致。人們發(fā)現(xiàn)OLS估計(jì)值通常小于ML估計(jì)值,幾乎沒有例外。一個(gè)值得注意的經(jīng)驗(yàn)規(guī)律是,極大似然估計(jì)值通常約等于OLS估計(jì)值除以樣本中非受限觀測(cè)值的比例。這恐怕是人們估計(jì)Censored模型時(shí)采用OLS法的原因。第四十六頁,共五十八頁,編輯于2023年,星期一三、Tobit模型的偏效應(yīng)在潛變量模型中,參數(shù)的含義與線性模型相同,事實(shí)上但潛變量不可觀測(cè),因而這個(gè)結(jié)果通常沒有什么意義。我們更關(guān)心的是解釋變量如何影響可觀測(cè)變量??梢宰C明,在Tobit模型擾動(dòng)項(xiàng)正態(tài)分布的假設(shè)下,對(duì)的偏效應(yīng)為

第四十七頁,共五十八頁,編輯于2023年,星期一四、實(shí)例Wooldridge報(bào)告了一個(gè)美國已婚婦女工作時(shí)數(shù)的例子。樣本數(shù)據(jù)包括753個(gè)已婚婦女的年工作小時(shí)數(shù),其中有428個(gè)婦女小時(shí)數(shù)大于0,另外325個(gè)婦女的工作小時(shí)數(shù)為0。對(duì)工作時(shí)間為正的婦女而言,其工作時(shí)間范圍相當(dāng)寬,從12小時(shí)到4950小時(shí),可以看作連續(xù)變化。因此,年工作小時(shí)數(shù)很適合用Tobit模型,Wooldridge同時(shí)還用OLS估計(jì)了線性模型(使用全部753個(gè)數(shù)據(jù)),結(jié)果由下表給出。第四十八頁,共五十八頁,編輯于2023年,星期一因變量:hours自變量線性模型(OLS)Tobit模型(MLE)Nwifeinc-3.45(2.54)-8.81(4.46)Educ28.76(12.95)80.65(21.58)Exper65.67(9.96)131.56(17.28)Exper2-0.70(.325)-1.86(0.54)Age-30.51(4.36)-54.41(7.42)Kidslt6-442.09(58.85)-894.02(111.88)Kidsge6-32.78(23.18)-16.22(38.64)Constant1330.48(270.78)965.31(446.44)ConstantLog-likelihoodvalue-3819.09R-squared0.2660.275750.181122.02第四十九頁,共五十八頁,編輯于2023年,星期一我們對(duì)比OLS估計(jì)與Tobit估計(jì),可以看出:(1)Tobit系數(shù)估計(jì)值與OLS估計(jì)值具有相同的符號(hào),而且統(tǒng)計(jì)顯著性也類似。可能的例外的是nwifeinc與kidsge6的系數(shù),nwifeinc在OLS估計(jì)中的t統(tǒng)計(jì)量為-1.41,在Tobit估計(jì)中的t統(tǒng)計(jì)量為-1.98。kidsge6在OLS估計(jì)中的t統(tǒng)計(jì)量為-1.41,在Tobit估計(jì)中的t統(tǒng)計(jì)量為-0.42。(2)本例的結(jié)果可以驗(yàn)證我們前面介紹的經(jīng)驗(yàn)法則。樣本中非受限觀測(cè)值的比例為428/753=0.568,除個(gè)別例外(kidsge6),OLS估計(jì)值除以0.568得到的值與Tobit估計(jì)值大致相當(dāng)。如將Exper的OLS系數(shù)估計(jì)值65.67除以0.568,得到115.62。除了kidsge6外,換算后的OLS估計(jì)值的絕對(duì)值都小于對(duì)應(yīng)的Tobit估計(jì)值的絕對(duì)值。第五十頁,共五十八頁,編輯于2023年,星期一(3)線性模型和Tobit模型都報(bào)告了R-squared值,但其計(jì)算方法是不同的。線性模型的R-squared值是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論