第十章定性選擇模型與受限因變量模型

上傳人：卓*** IP屬地：廣東上傳時(shí)間：2023-06-05 格式：PPT 頁數(shù)：58 大?。?.55MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩53頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章定性選擇模型與受限因變量模型第一頁，共五十八頁，編輯于2023年，星期一對(duì)于被解釋變量而言，很多情況也會(huì)對(duì)其取值有所限制。有時(shí)，因變量描述的是微觀個(gè)體的某種選擇、特征或所屬等，即因變量為定性變量，相應(yīng)的模型稱為定性選擇模型或定性響應(yīng)模型；另一些情況是，因變量的取值被限定在某個(gè)特殊范圍，一般我們稱這類取值范圍受到限制的因變量為受限因變量，相應(yīng)的模型稱為受限因變量模型。兩類模型樣本數(shù)據(jù)一般是橫截面數(shù)據(jù)。兩類模型被廣泛應(yīng)用于消費(fèi)者行為、勞動(dòng)經(jīng)濟(jì)學(xué)、農(nóng)業(yè)經(jīng)濟(jì)學(xué)等領(lǐng)域，大多屬于微觀計(jì)量經(jīng)濟(jì)學(xué)的研究范疇。本章介紹幾種常見的定性選擇模型與受限因變量模型。第二頁，共五十八頁，編輯于2023年，星期一第一節(jié)線性概率模型

因變量為虛擬變量的模型被稱為定性選擇模型或定性響應(yīng)模型。如果只有兩個(gè)選擇，我們可用0和1分別表示它們，如乘公交為0，自駕車為1，這樣的模型稱為二元選擇模型（binarychoiceModels），多于兩個(gè)選擇（如上班方式加上一種騎自行車）的定性選擇模型稱為多項(xiàng)選擇模型（Multinomialchoicemodels）。我們先從基礎(chǔ)的二元選擇模型入手，介紹定性選擇模型的設(shè)定和估計(jì)。最簡(jiǎn)單的二元選擇模型是線性概率模型（LinearProbabilityModels,LPM）。第三頁，共五十八頁，編輯于2023年，星期一一、線性概率模型的概念下面用一個(gè)關(guān)于是否讀研究生的例子來說明如何解釋線性概率模型的結(jié)果。模型為：其中：第四頁，共五十八頁，編輯于2023年，星期一

設(shè)回歸結(jié)果如下（所有系數(shù)值均在10%水平統(tǒng)計(jì)上顯著）：

對(duì)每個(gè)觀測(cè)值，我們可根據(jù)（10.3）式計(jì)算因變量的擬合值或預(yù)測(cè)值。在常規(guī)OLS回歸中，因變量的擬合值或預(yù)測(cè)值的含義是，平均而言，我們可以預(yù)期的因變量的值。但在本例的情況下，這種解釋就不適用了。假設(shè)學(xué)生甲的平均分為3.5，家庭年收入為5萬美元，Y的擬合值為第五頁，共五十八頁，編輯于2023年，星期一

盡管因變量在這個(gè)二元選擇模型中只能取兩個(gè)值：0或1，可是該學(xué)生的的擬合值或預(yù)測(cè)值為0.8。我們將該擬合值解釋為該生決定讀研的概率的估計(jì)值。因此，該生決定讀研的可能性或概率的估計(jì)值為0.8。需要注意的是，這種概率不是我們能觀測(cè)到的數(shù)字，能觀測(cè)的是讀研還是不讀研的決定。對(duì)斜率系數(shù)的解釋也不同了。在常規(guī)回歸中，斜率系數(shù)代表的是其他解釋變量不變的情況下，該解釋變量的單位變動(dòng)引起的因變量的變動(dòng)。而在線性概率模型中，斜率系數(shù)表示其他解釋變量不變的情況下，該解釋變量的單位變動(dòng)引起的因變量等于1的概率的變動(dòng)。第六頁，共五十八頁，編輯于2023年，星期一CPA的系數(shù)估計(jì)值0.4意味著家庭收入不變的情況下，一個(gè)學(xué)生的增加一個(gè)點(diǎn)（如從3.0到4.0），該生決定去讀研的概率的估計(jì)值增加0.4。

INCOME的系數(shù)估計(jì)值0.002表明，一個(gè)學(xué)生的成績(jī)不變，而家庭收入增加1000美元（單位為千美元），該生決定去讀研的概率的估計(jì)值增加0.002。

LPM模型中，解釋變量的變動(dòng)與虛擬因變量值為1的概率線性相關(guān)，因而稱為線性概率模型。第七頁，共五十八頁，編輯于2023年，星期一二、線性概率模型的估計(jì)和問題第一個(gè)問題是線性概率模型存在異方差性。擾動(dòng)項(xiàng)的方差是，這里p是因變量等于1的概率，此概率對(duì)于每個(gè)觀測(cè)值不同，因而擾動(dòng)項(xiàng)方差將不是常數(shù)，導(dǎo)致異方差性?？梢允褂肳LS法，但不是很有效，并且將改變結(jié)果的含義。第二個(gè)問題是擾動(dòng)項(xiàng)不是正態(tài)分布的。事實(shí)上，線性概率模型的擾動(dòng)項(xiàng)服從二項(xiàng)分布。第三個(gè)問題，它假定自變量與Y=1的概率之間存在線性關(guān)系，而此關(guān)系往往不是線性的。第八頁，共五十八頁，編輯于2023年，星期一

第四個(gè)問題是，擬合值可能小于0或大于1，而概率值必須位于0和1的閉區(qū)間內(nèi)?；氐接嘘P(guān)讀研的例子。假設(shè)學(xué)生乙的為4.0，家庭收入為20萬美元，則代入（10.3）式，Y的擬合值為

從而得到一個(gè)不可能的結(jié)果（概率值大于1）。假設(shè)另有一個(gè)學(xué)生丙的為1.0，家庭收入為5萬元，則其Y的擬合值為-0.2，表明讀研的概率為負(fù)數(shù)，這也是一個(gè)不可能的結(jié)果。第九頁，共五十八頁，編輯于2023年，星期一

解決此問題的一種方法是，令所有負(fù)擬合值都等于0，所有大于1的擬合值都等于1。但也無法令人十分滿意，因?yàn)樵诂F(xiàn)實(shí)中很少會(huì)有決策前某人讀研的概率就等于1的情況，同樣，盡管某些人成績(jī)不是很好，但他去讀研的機(jī)會(huì)仍會(huì)大于0。線性概率模型傾向于給出過多的極端結(jié)果：估計(jì)的概率等于0或1。

第十頁，共五十八頁，編輯于2023年，星期一

第五個(gè)問題是在線性概率模型中，以及不再是合適的擬合優(yōu)度測(cè)度。事實(shí)上，此問題不僅是線性概率模型的問題，而是所有定性選擇模型的問題。較好一點(diǎn)的測(cè)度是模型正確預(yù)測(cè)的觀測(cè)值的百分比。首先，我們將每一預(yù)測(cè)歸類為1或0。如果擬合值大于等于0.5，則認(rèn)為因變量的預(yù)測(cè)值為1。若小于0.5，則認(rèn)為因變量的預(yù)測(cè)值為0。然后，將這些預(yù)測(cè)值與實(shí)際發(fā)生的情況相比較，計(jì)算出正確預(yù)測(cè)的百分比：

第十一頁，共五十八頁，編輯于2023年，星期一

需要指出的是，這個(gè)測(cè)度也不是很理想，但預(yù)測(cè)結(jié)果的好壞，并非定性選擇模型唯一關(guān)心的事，這類模型常被用于研究影響人們進(jìn)行某個(gè)決策的因素。讓我們來看一個(gè)競(jìng)選的例子。假設(shè)候選人甲和乙二人競(jìng)選某市市長(zhǎng)，我們可以用一個(gè)二元選擇模型來研究影響選民決策的因素，模型為：其中：第十二頁，共五十八頁，編輯于2023年，星期一VariableCoefficientStandarderrort-Statisticp-ValueConstant-0.510.19-2.650.01INCOME0.00980.0033.250.00AGE0.0160.00533.080.00MALE0.00310.130.020.98表10.2兩候選人選舉線性概率模型回歸結(jié)果Dependentvariable：CAND1Observations：30=0.58Adjusted=0.53ResidualSumofSquares=3.15F-statistic=11.87第十三頁，共五十八頁，編輯于2023年，星期一

如表所示，INCOME的斜率估計(jì)值為正，且在1%的水平上顯著。年齡和性別不變的情況下，收入增加1000元，選擇候選人甲的概率增加0.0098。

AGE的斜率估計(jì)值也在1%的水平上顯著。在收入和性別不變的情況下，年齡增加1歲，選擇候選人甲的概率增加0.016。的斜率系數(shù)統(tǒng)計(jì)上不顯著，因而沒有證據(jù)表明樣本中男人和女人的選票不同。我們可以得出如下結(jié)論：年老一些、富裕一些的選民更喜歡投票給候選人甲。表中給出CAND1的擬合值，每個(gè)大于等于0.5的擬合值計(jì)入CAND1為1的預(yù)測(cè)，而小于0.5的擬合值則計(jì)入CAND1為0的預(yù)測(cè)。第十四頁，共五十八頁，編輯于2023年，星期一

從表可看出，30個(gè)觀測(cè)值中，27個(gè)（或90%）預(yù)測(cè)正確。選甲的14人中，12人（或85.7%）預(yù)測(cè)正確。選乙的16人中，15人（或93.8%）預(yù)測(cè)正確。是0.58，表明模型解釋了因變量的58%的變動(dòng)，這與90%的正確預(yù)測(cè)比例相比，低了不少。注意表10－3中有一些擬合值大于1或小于0。這是我們前面指出的這類模型的缺點(diǎn)之一，這些擬合值是概率的估計(jì)值，而概率永遠(yuǎn)不可能大于1或小于0。第十五頁，共五十八頁，編輯于2023年，星期一第二節(jié)Probit模型和Logit模型

雖然估計(jì)和使用線性概率模型很簡(jiǎn)單，但存在上面討論的幾個(gè)問題，其中最嚴(yán)重的兩個(gè)問題是擬合值小于0或大于1的問題和假定自變量和的概率之間存在線性關(guān)系的假設(shè)不現(xiàn)實(shí)的問題。使用更為復(fù)雜的二元響應(yīng)模型可以克服這些缺陷第十六頁，共五十八頁，編輯于2023年，星期一一．Probit和Logit模型的設(shè)定估計(jì)二元選擇模型的另一類方法假定回歸模型為這里不可觀測(cè)，通常稱為潛變量（latentvariable）。我們能觀測(cè)到的是虛擬變量：第十七頁，共五十八頁，編輯于2023年，星期一

這就是Probit和Logit方法的思路。Probit模型和Logit模型的區(qū)別在于對(duì)中擾動(dòng)項(xiàng)u的分布的設(shè)定，前者設(shè)定為正態(tài)分布，后者設(shè)定為logistic分布。與線性概率模型的區(qū)別是，這里假設(shè)潛變量的存在。例如，若被觀測(cè)的虛擬變量是某人買車還是不買車，將被定義為“買車的欲望或能力”，注意這里的提法是“欲望”和“能力”，因此解釋變量是解釋這些元素的?？梢钥闯?，乘上任何正數(shù)都不會(huì)改變，因此這里習(xí)慣上假設(shè)Var(ui)=1，從而固定的規(guī)模。我們有第十八頁，共五十八頁，編輯于2023年，星期一其中F是u的累積分布函數(shù)。如果u的分布是對(duì)稱的，則，我們可以將上式寫成我們可寫出似然函數(shù)：第十九頁，共五十八頁，編輯于2023年，星期一

上式中F的函數(shù)形式取決于有關(guān)擾動(dòng)項(xiàng)u的假設(shè)，如果的累積分布是logistic分布，則我們得到的是logit模型。在這種情況下，累積分布函數(shù)為：因此第二十頁，共五十八頁，編輯于2023年，星期一請(qǐng)注意，對(duì)于logit模型：

上式的左端是機(jī)會(huì)（odds）的對(duì)數(shù)，稱為對(duì)數(shù)機(jī)會(huì)比率（log-oddsratio），因而上式表明對(duì)數(shù)機(jī)會(huì)比率是各解釋變量的線性函數(shù)，而對(duì)于線性概率模型，為各解釋變量的線性函數(shù)。如果服從正態(tài)分布，我們得到的是probit模型（或normit模型），在這種情況下，累積分布函數(shù)為：第二十一頁，共五十八頁，編輯于2023年，星期一

無論是probit模型還是logit模型，極大似然函數(shù)都伴隨著非線性估計(jì)方法，目前很多計(jì)量經(jīng)濟(jì)分析軟件已可用于probit和logit分析，用起來很方便。由于累積正態(tài)分布和累積logistic分布很接近，只是尾部有點(diǎn)區(qū)別，因此，我們無論logit法還是probit法，得到的結(jié)果都不會(huì)有很大不同?？墒?，兩種方法得到的參數(shù)估計(jì)值不是直接可比的。由于logistic分布的方差為，因此，logit模型得到的的估計(jì)值必須乘以，才能與probit模型得到的估計(jì)值相比較（正態(tài)分布標(biāo)準(zhǔn)差為1）。第二十二頁，共五十八頁，編輯于2023年，星期一概率=F(Z)10ZProbit模型線性概率模型圖10-1線性概率模型和Probit模型第二十三頁，共五十八頁，編輯于2023年，星期一二、Probit模型和Logit模型的極大似然估計(jì)和假設(shè)檢驗(yàn)估計(jì)LPM，我們可以采用OLS或WLS。在Probit模型和Logit模型中，由于的非線性性質(zhì)，OLS或WLS都不再適用。估計(jì)Probit模型和Logit模型，通常采用極大似然法。第二十四頁，共五十八頁，編輯于2023年，星期一極大似然估計(jì)量（MLE）即由極大化此對(duì)數(shù)似然函數(shù)得到。對(duì)于logit模型，G是標(biāo)準(zhǔn)logisticcdf，是logit估計(jì)量；對(duì)于probit模型，G是標(biāo)準(zhǔn)正態(tài)cdf，是probit估計(jì)量。由于此最大化問題的非線性性質(zhì)，我們很難寫出Probit模型和Logit模型的參數(shù)的極大似然估計(jì)量的具體表達(dá)式?？梢宰C明，在很一般的條件下，MLE是一致的、漸近正態(tài)和漸近有效的(一般性討論參見Woodridge（2002））。第二十五頁，共五十八頁，編輯于2023年，星期一伴隨每一個(gè)極大似然估計(jì)值，有一個(gè)與之對(duì)應(yīng)的標(biāo)準(zhǔn)誤差。支持Probit和Logit的軟件包在給出系數(shù)估計(jì)值的同時(shí)會(huì)給出與之對(duì)應(yīng)的標(biāo)準(zhǔn)誤差。一旦我們從軟件包的報(bào)告中得到了標(biāo)準(zhǔn)誤差，就可以構(gòu)造（漸近的）t檢驗(yàn)和置信區(qū)間，與應(yīng)用OLS、2SLS估計(jì)量做檢驗(yàn)時(shí)一樣。例如要檢驗(yàn)，我們做法是，構(gòu)造t統(tǒng)計(jì)量，然后按通常的檢驗(yàn)程序進(jìn)行檢驗(yàn)。我們也可以對(duì)Probit模型和Logit模型的參數(shù)的多重約束(即關(guān)于的多個(gè)線性或非線性約束)進(jìn)行檢驗(yàn)，可以采用沃爾德檢驗(yàn)、拉格朗日乘數(shù)檢驗(yàn)和似然比檢驗(yàn)，詳細(xì)討論見第4、5章有關(guān)內(nèi)容。第二十六頁，共五十八頁，編輯于2023年，星期一三、偏效應(yīng)在二元響應(yīng)模型的大多數(shù)應(yīng)用中，首要的目標(biāo)是解釋對(duì)響應(yīng)概率的影響。在潛變量模型中，對(duì)潛變量的偏效應(yīng)是，我們下面將看到對(duì)響應(yīng)概率的偏效應(yīng)是，對(duì)正態(tài)分布和logistic分布而言，總有，因而上述兩個(gè)效應(yīng)的符號(hào)相同，影響的方向總是一致的。潛變量極少有一個(gè)確定的度量單位，因而本身的大小，往往不是很有用的（相對(duì)于線性概率模型而言）。對(duì)于大多數(shù)應(yīng)用而言，我們要估計(jì)的是解釋變量對(duì)響應(yīng)概率的影響。由于的非線性本質(zhì)，使得這個(gè)工作相當(dāng)復(fù)雜，通常需要區(qū)分為連續(xù)變量和離散變量?jī)煞N情況。第二十七頁，共五十八頁，編輯于2023年，星期一（1）如果是一個(gè)大致連續(xù)的變量，則無論P(yáng)robit模型還是Logit模型，對(duì)響應(yīng)概率的偏效應(yīng)都在處取最大值：在Probit模型中，；在Logit模型中，（2）對(duì)于離散解釋變量，微分沒有實(shí)際意義。若離散解釋變量從變化到，則其對(duì)響應(yīng)概率的離散偏效應(yīng)可由下式表示第二十八頁，共五十八頁，編輯于2023年，星期一與LPM模型相比，偏效應(yīng)的值多出一個(gè)乘積項(xiàng)，稱為比例因子（scalefactor）或調(diào)整因子（adjustmentfactor），它與全部解釋變量有關(guān)，因而會(huì)隨的值而變。在計(jì)算偏效應(yīng)時(shí)，為方便起見，通常希望有一個(gè)適用于模型中所有斜率的比例因子。有兩種方法解決這個(gè)問題：第一種方法是用解釋變量觀測(cè)值的均值計(jì)算偏效應(yīng)的表達(dá)式，比例因子為第二種方法是對(duì)每個(gè)觀測(cè)值計(jì)算偏效應(yīng)，然后計(jì)算它們的樣本均值，這樣得到的是平均偏效應(yīng)（averagepartialeffect,APE）。第二十九頁，共五十八頁，編輯于2023年，星期一四、擬合優(yōu)度的測(cè)度從實(shí)際角度看，在現(xiàn)代計(jì)算機(jī)解決了復(fù)雜的計(jì)算問題之后，Probit和Logit模型最困難之處就落在模型結(jié)果的提供和解釋方面。支持Probit和Logit的軟件包都會(huì)報(bào)告系數(shù)估計(jì)值、它們的標(biāo)準(zhǔn)誤差和對(duì)數(shù)似然函數(shù)值。如同在線性概率模型中討論的一樣，Probit模型和Logit模型也可以計(jì)算正確預(yù)測(cè)的百分比這一指標(biāo)作為擬合優(yōu)度的測(cè)度。首先，我們將每一預(yù)測(cè)歸類為1或0。如果擬合值大于等于0.5，則認(rèn)為因變量的預(yù)測(cè)值為1。若小于0.5，則認(rèn)為因變量的預(yù)測(cè)值為0。然后，將這些預(yù)測(cè)值與實(shí)際發(fā)生的情況相比較，計(jì)算出正確預(yù)測(cè)的百分比。第三十頁，共五十八頁，編輯于2023年，星期一盡管正確預(yù)測(cè)的百分比作為擬合優(yōu)度的測(cè)度是有用的，但它也可能造成誤導(dǎo)，特別是在對(duì)小可能結(jié)果的預(yù)測(cè)非常糟糕的情況下仍能得到相當(dāng)高的正確預(yù)測(cè)的百分比。例如，假設(shè)n＝200，160個(gè)觀測(cè)值為，這160個(gè)觀測(cè)值中，有140個(gè)預(yù)測(cè)值也是0，即使對(duì)于的那40個(gè)觀測(cè)值的預(yù)測(cè)都錯(cuò)，正確預(yù)測(cè)全部結(jié)果的百分比仍高達(dá)70％！度量Probit和Logit模型的擬合優(yōu)度的測(cè)度還可以采用各種pseudo-R2

。pseudo-原意是偽(假)，這里采用它，意思是與常規(guī)R2類似但不相同，而不是說它是假的。對(duì)于Probit模型和Logit模型，已經(jīng)開發(fā)了幾種有用的pseudo-R2測(cè)度，其中最常用的是McFadden(1974)提出的pseudo-R2測(cè)度第三十一頁，共五十八頁，編輯于2023年，星期一表10－4兩候選人選舉模型的Probit回歸結(jié)果Dependentvariable：CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-5.191.70-3.060.00INCOME0.0710.0342.100.04AGE0.0730.0342.180.03MALE-0.700.90-0.780.44Observations：30McFaddenpseudo-R2=0.61ResidualSumofSquares=2.62第三十二頁，共五十八頁，編輯于2023年，星期一

采用Probit模型估計(jì)的結(jié)果與前面用線性概率模型估計(jì)的結(jié)果有所不同。采用Probit模型的情況下，INCOME和AGE的系數(shù)估計(jì)值在5%的誤差水平上顯著，而在線性概率模型的情況下，在1%的水平上顯著。由于我們知道線性概率模型存在嚴(yán)重的問題，因此Probit結(jié)果可能更準(zhǔn)確一些?？墒?，如果是實(shí)際研究的話，要有一個(gè)大得多的樣本。Probit模型的系數(shù)估計(jì)值不能像線性概率模型那樣，解釋成概率的變動(dòng)（有些計(jì)量經(jīng)濟(jì)分析軟件程序可以將系數(shù)估計(jì)值轉(zhuǎn)換為與線性概率模型相當(dāng)?shù)母怕首儎?dòng)）。使用Probit模型的一種有意思的方式是求出擬合值進(jìn)行預(yù)測(cè)，如我們用線性概率模型所做的一樣。第三十三頁，共五十八頁，編輯于2023年，星期一Probit模型中用McFadden的pseudo-R2作為擬合優(yōu)度的測(cè)度。pseudo-R2是用于虛擬因變量模型的擬合優(yōu)度的測(cè)度的名字。pseudo-原意是偽（假），這里采用它，意思是與常規(guī)R2類似但不相同，而不是說它是假的。對(duì)于定性選擇模型，已經(jīng)開發(fā)了幾種有用的pseudo-R2測(cè)度，這里所用的是McFadden開發(fā)的。很多估計(jì)Probit或Logit模型的計(jì)量經(jīng)濟(jì)程序計(jì)算pseudo-R2。本例中給出的0.61的含義是，Probit模型解釋了因變量61%的變動(dòng)。第三十四頁，共五十八頁，編輯于2023年，星期一

與probit模型一樣，logit模型也不能用OLS法估計(jì)，而要用極大似然法估計(jì)。采用表10-1中的同樣數(shù)據(jù)估計(jì)logit模型，回歸結(jié)果如表10-5所示。表10-5兩候選人選舉模型的Logit回歸結(jié)果Dependentvariable：CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-8.963.23-2.770.01INCOME0.120.061.980.05AGE0.130.062.030.04MALE-1.031.54-0.670.51Observations：30McFaddenpseudo-R2=0.60ResidualSumofSquares=2.59第三十五頁，共五十八頁，編輯于2023年，星期一

McFaddenpseudo-R2和統(tǒng)計(jì)顯著性與probit模型的結(jié)果類似。INCOME和AGE的系數(shù)估計(jì)值亦在5%誤差水平上顯著。而MALE則在兩種模型回歸中均不顯著。而斜率系數(shù)估計(jì)值則不同，這是因?yàn)樗鼈兊囊饬x不一樣。例如，AGE的系數(shù)估計(jì)值0.13意味著收入和性別不變的情況下，年齡增大一歲，選舉候選人甲的機(jī)會(huì)的對(duì)數(shù)增加0.13。實(shí)際上，除了斜率系數(shù)的解釋不同，使用probit模型和logit模型并沒有多大區(qū)別。第三十六頁，共五十八頁，編輯于2023年，星期一六、多項(xiàng)選擇模型多項(xiàng)選擇模型是研究在多于兩個(gè)的選項(xiàng)中進(jìn)行決策的模型。一般可以依照選擇集分為有序和無序兩種寬泛的類型。比如，城市交通工具的選擇顯然是無序的，而投資者選擇公司債券(債券經(jīng)過評(píng)級(jí))是有序的。有關(guān)二元選擇的Logit模型可以推廣到因變量有兩個(gè)以上離散取值的情況，構(gòu)成多項(xiàng)Logit模型(multinomiallogitmodel)，此模型的主要優(yōu)點(diǎn)是容易計(jì)算，選擇給定方案的概率易于被表示，并且極大似然函數(shù)可以用簡(jiǎn)單明了的方式產(chǎn)生和最大化。第三十七頁，共五十八頁，編輯于2023年，星期一該模型的缺點(diǎn)是它以所謂的不相干選擇的獨(dú)立性（independenceofirrelevantalternatives，IIA）性質(zhì)為特征。假設(shè)一個(gè)幾乎與一個(gè)已有選項(xiàng)相同的新選項(xiàng)被加進(jìn)選擇集中，我們期望的是，從此模型得到的選擇這兩個(gè)幾乎相同的選項(xiàng)（如乘公共汽車時(shí)選老車型還是新車型）的概率將被分成兩半，而選擇其它選項(xiàng)的概率不受影響。不幸的是，情況不是這樣。因此當(dāng)兩個(gè)或多個(gè)選項(xiàng)是相近替代方案時(shí)，采用多項(xiàng)Logit模型不適合。在這種情況下，可考慮多項(xiàng)Probit模型(multinomialProbitmodel)。多項(xiàng)Probit模型允許擾動(dòng)項(xiàng)跨選項(xiàng)相關(guān)，從而繞過IIA困境。它的缺點(diǎn)是計(jì)算困難，計(jì)算四個(gè)以上選項(xiàng)的問題幾乎不可行。隨著計(jì)算機(jī)能力和計(jì)算方法的改進(jìn)，多項(xiàng)Probit模型的應(yīng)用前景會(huì)越來越好。第三十八頁，共五十八頁，編輯于2023年，星期一如果因變量本質(zhì)上是有序的，多項(xiàng)Logit模型和多項(xiàng)Probit模型均無法解釋解釋因變量的序數(shù)性質(zhì)。因?yàn)闆Q策者選擇不同的方案所得到的效用也是排序的，一般多元離散選擇模型中的效用關(guān)系不再適用。處理有序離散因變量的常用方法是有序Probit模型與有序Logit模型。第三十九頁，共五十八頁，編輯于2023年，星期一*第三節(jié)Censored模型Censored模型研究一類重要的受限因變量：在取正值時(shí)大致連續(xù)，但總體中有一個(gè)不可忽略的部分取值為零?？疾鞗Q定居民家庭用于耐用消費(fèi)品(如汽車等)支出的因素，或者研究居民每年用于慈善捐助支出的決定因素，或者研究居民每月用于特殊消費(fèi)品(如酒類等)支出的決定因素等等。這些研究都需要對(duì)總體進(jìn)行抽樣調(diào)查取得相關(guān)的數(shù)據(jù)，而抽樣調(diào)查的結(jié)果有一個(gè)共同的特點(diǎn)，那就是有相當(dāng)一部分個(gè)體用于這些方面支出的金額為零，同時(shí)不為零的支出數(shù)據(jù)會(huì)呈現(xiàn)出基本連續(xù)的形態(tài)。第四十頁，共五十八頁，編輯于2023年，星期一一、Censored模型的概念當(dāng)因變量在特定范圍內(nèi)的值都轉(zhuǎn)換成（或報(bào)告為）某個(gè)值時(shí)，稱因變量被歸并(censoring)，稱此變量為歸并變量(censoredvariable)。censored回歸模型的一般形式是第四十一頁，共五十八頁，編輯于2023年，星期一二、Tobit模型的估計(jì)為了計(jì)估模型參數(shù)，我們推導(dǎo)Y的均值設(shè)，稱為逆米爾斯比率(inverseMillsratio)，它是標(biāo)準(zhǔn)正態(tài)pdf與標(biāo)準(zhǔn)正態(tài)cdf在c處的比值。則第四十二頁，共五十八頁，編輯于2023年，星期一有了上面的結(jié)果，我們可以計(jì)算從總體中隨機(jī)抽取的觀測(cè)值的均值因此，一旦有了的估計(jì)值，我們就可以確保Y的預(yù)測(cè)值為正。當(dāng)然，保證Y的預(yù)測(cè)值為正的代價(jià)是使用了更為復(fù)雜的非線性模型。第四十三頁，共五十八頁，編輯于2023年，星期一Censored模型通常采用極大似然估計(jì)。由Y的分布，可得模型的對(duì)數(shù)似然函數(shù)為該對(duì)數(shù)似然函數(shù)由兩部分組成：一部分對(duì)應(yīng)于沒有限制的觀測(cè)值，是經(jīng)典回歸部分；一部分對(duì)應(yīng)于受到限制的觀測(cè)值。因而上式是一個(gè)非標(biāo)準(zhǔn)的對(duì)數(shù)似然函數(shù)，實(shí)際上是離散分布與連續(xù)分布的混合。最大化對(duì)數(shù)似然函數(shù)，可得極大似然估計(jì)量。這一估計(jì)量的性質(zhì)與普通MLE的性質(zhì)相同。一般情況下，需采用數(shù)值方法來求極大似然估計(jì)值。第四十四頁，共五十八頁，編輯于2023年，星期一求標(biāo)準(zhǔn)誤差的矩陣表達(dá)式很復(fù)雜，詳細(xì)的討論見Wooldridge（2002）。利用Eviews軟件，很方便得到模型的參數(shù)估計(jì)值及標(biāo)準(zhǔn)誤差，因而可以進(jìn)行參數(shù)的假設(shè)檢驗(yàn)。我們還可以采用沃爾德統(tǒng)計(jì)量或似然比統(tǒng)計(jì)量同時(shí)檢驗(yàn)多個(gè)約束，其方法與一般的MLE相同。

Censored模型的MLE需要兩個(gè)基本假定：潛變量模型中隨機(jī)干擾項(xiàng)的同方差性和正態(tài)性。如果存在異方差性或非正態(tài)性，那么MLE估計(jì)量便是不一致的。第四十五頁，共五十八頁，編輯于2023年，星期一在實(shí)踐中，研究人員估計(jì)Censored模型時(shí)往往采用OLS法，盡管OLS估計(jì)值不一致。人們發(fā)現(xiàn)OLS估計(jì)值通常小于ML估計(jì)值，幾乎沒有例外。一個(gè)值得注意的經(jīng)驗(yàn)規(guī)律是，極大似然估計(jì)值通常約等于OLS估計(jì)值除以樣本中非受限觀測(cè)值的比例。這恐怕是人們估計(jì)Censored模型時(shí)采用OLS法的原因。第四十六頁，共五十八頁，編輯于2023年，星期一三、Tobit模型的偏效應(yīng)在潛變量模型中，參數(shù)的含義與線性模型相同，事實(shí)上但潛變量不可觀測(cè)，因而這個(gè)結(jié)果通常沒有什么意義。我們更關(guān)心的是解釋變量如何影響可觀測(cè)變量?？梢宰C明，在Tobit模型擾動(dòng)項(xiàng)正態(tài)分布的假設(shè)下，對(duì)的偏效應(yīng)為

第四十七頁，共五十八頁，編輯于2023年，星期一四、實(shí)例Wooldridge報(bào)告了一個(gè)美國已婚婦女工作時(shí)數(shù)的例子。樣本數(shù)據(jù)包括753個(gè)已婚婦女的年工作小時(shí)數(shù)，其中有428個(gè)婦女小時(shí)數(shù)大于0，另外325個(gè)婦女的工作小時(shí)數(shù)為0。對(duì)工作時(shí)間為正的婦女而言，其工作時(shí)間范圍相當(dāng)寬，從12小時(shí)到4950小時(shí)，可以看作連續(xù)變化。因此，年工作小時(shí)數(shù)很適合用Tobit模型，Wooldridge同時(shí)還用OLS估計(jì)了線性模型(使用全部753個(gè)數(shù)據(jù))，結(jié)果由下表給出。第四十八頁，共五十八頁，編輯于2023年，星期一因變量：hours自變量線性模型(OLS)Tobit模型(MLE)Nwifeinc-3.45(2.54)-8.81(4.46)Educ28.76(12.95)80.65(21.58)Exper65.67(9.96)131.56(17.28)Exper2-0.70(.325)-1.86(0.54)Age-30.51(4.36)-54.41(7.42)Kidslt6-442.09(58.85)-894.02(111.88)Kidsge6-32.78(23.18)-16.22(38.64)Constant1330.48(270.78)965.31(446.44)ConstantLog-likelihoodvalue-3819.09R-squared0.2660.275750.181122.02第四十九頁，共五十八頁，編輯于2023年，星期一我們對(duì)比OLS估計(jì)與Tobit估計(jì)，可以看出：(1)Tobit系數(shù)估計(jì)值與OLS估計(jì)值具有相同的符號(hào)，而且統(tǒng)計(jì)顯著性也類似。可能的例外的是nwifeinc與kidsge6的系數(shù)，nwifeinc在OLS估計(jì)中的ｔ統(tǒng)計(jì)量為-1.41,在Tobit估計(jì)中的ｔ統(tǒng)計(jì)量為-1.98。kidsge6在OLS估計(jì)中的ｔ統(tǒng)計(jì)量為-1.41,在Tobit估計(jì)中的ｔ統(tǒng)計(jì)量為-0.42。(2)本例的結(jié)果可以驗(yàn)證我們前面介紹的經(jīng)驗(yàn)法則。樣本中非受限觀測(cè)值的比例為428/753=0.568，除個(gè)別例外（kidsge6），OLS估計(jì)值除以0.568得到的值與Tobit估計(jì)值大致相當(dāng)。如將Exper的OLS系數(shù)估計(jì)值65.67除以0.568，得到115.62。除了kidsge6外，換算后的OLS估計(jì)值的絕對(duì)值都小于對(duì)應(yīng)的Tobit估計(jì)值的絕對(duì)值。第五十頁，共五十八頁，編輯于2023年，星期一(3)線性模型和Tobit模型都報(bào)告了R-squared值，但其計(jì)算方法是不同的。線性模型的R-squared值是

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第十章定性選擇模型與受限因變量模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第十章定性選擇模型與受限因變量模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔