版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
(優(yōu)選)經(jīng)濟計量方法導(dǎo)論第六講當(dāng)前1頁,總共54頁。限值因變量(limiteddependentvariable,LDV):即取值范圍明顯受到限制的因變量例:因變量值取1/0(是否購買)例:因變量為非負(fù)數(shù)(出險理賠次數(shù))等二值因變量的回歸建模線性概率模型、對數(shù)單位模型、概率單位模型不完整觀測樣本和非隨機樣本的回歸建模斷尾正態(tài)回歸模型、截取正態(tài)回歸模型、托賓模型泊松回歸模型概述當(dāng)前2頁,總共54頁。二值因變量回歸建模當(dāng)前3頁,總共54頁。二值因變量:因變量只取0/1兩個值二值響應(yīng)模型(binaryresponsemodels):用于二值因變量的回歸建模,目標(biāo):研究響應(yīng)概率給定自變量x條件下,因變量y取1的概率二值響應(yīng)模型主要包括線性概率模型對數(shù)單位模型概率單位模型二值因變量回歸建模響應(yīng)概率當(dāng)前4頁,總共54頁。線性概率模型(linearprobabilitymodel,LPM)(7.5節(jié))是一種最簡單的二值響應(yīng)模型源于一般線回歸模型模型形式為:系數(shù)的含義:j度量了因xj的變化導(dǎo)致y成功(取1)概率的平均變化:簡單的二值響應(yīng)模型
---線性概率模型當(dāng)前5頁,總共54頁。線性概率模型示例:分析影響婦女外出工作的因素(MROZ.WFL)是否工作,其他收入來源,受教育程度,工作經(jīng)歷,年齡,年齡小于6歲的子女?dāng)?shù),年齡在6-18歲之間的子女?dāng)?shù)當(dāng)前6頁,總共54頁。線性概率模型的問題:無法保證模型給出的概率值限制在0-1范圍內(nèi)前例中,當(dāng):解決方法:預(yù)測值小于0.5的取0,大于等于0.5的取1educ小于3.84時概率為負(fù)數(shù);本例中的educ均大于5,雖不必?fù)?dān)心,但仍為一個潛在問題當(dāng)前7頁,總共54頁。線性概率模型的問題:線性概率模型反映了概率與自變量取值之間的線性相關(guān),無法反映非線性關(guān)系例:家庭收入和購買商品房的概率違背了高斯-馬爾科夫假定,當(dāng)y為二值變量時:表明:除非概率與任何一個x都不相關(guān),否則一定存在異方差當(dāng)前8頁,總共54頁。復(fù)雜的二值響應(yīng)模型目的:克服線性概率模型的局限性策略:G(z)的函數(shù)值限制在0-1之間,一般為累積分布函數(shù)(cumulativedistributionfunction,CDF)種類:對數(shù)單位模型和概率單位模型差異:主要體現(xiàn)在G函數(shù)的具體形式上問題:G函數(shù)具體形式的選擇?復(fù)雜的二值響應(yīng)模型當(dāng)前9頁,總共54頁。選擇G函數(shù)具體形式策略的出發(fā)點以滿足經(jīng)典線性模型假設(shè)的潛變量模型為基礎(chǔ)潛變量:其值無法觀測到的變量(這里為y*,如購買帶來的效應(yīng))顯變量:其值能被觀測到的變量(這里為y,取1或0)y*大于0時,y=1;y*小于等于0時,y=0于是:G的具體形式取決于e的分布復(fù)雜的二值響應(yīng)模型x對潛變量均值的影響方向與對P(y=1|x)的影響方向相同當(dāng)前10頁,總共54頁。若e是邏輯斯蒂隨機變量,選用Logit模型概率密度函數(shù)(PDF)g為:G是邏輯斯蒂函數(shù),為標(biāo)準(zhǔn)邏輯斯蒂隨機變量的累積分布函數(shù)(CDF):對數(shù)單位模型(LogitModel)概率與自變量呈非線性關(guān)系與正態(tài)分布的形狀接近g(0)=0.25當(dāng)前11頁,總共54頁。若e服從正態(tài)分布,選用Probit模型G是標(biāo)準(zhǔn)正態(tài)的累積分布函數(shù)概率單位模型(ProbitModel)概率與自變量呈非線性關(guān)系(0)=1/sqrt(2)=0.4邏輯斯蒂函數(shù)與正態(tài)分布CDF的形狀接近,前者較平坦些,正態(tài)分布趨近更快些當(dāng)前12頁,總共54頁。極大似然估計(Maximumlikelihoodestimation,MLE):在所有可能的值中選擇使樣本有最大似然性的基本思路:在給定Xi下yi的概率合寫為:似然函數(shù)與聯(lián)合概率密度函數(shù)形式相同:對數(shù)似然函數(shù):模型的參數(shù)估計當(dāng)前13頁,總共54頁。Logit模型具體為:Probit模型具體為:求使對數(shù)似然函數(shù)達到最大時的β代入整理當(dāng)前14頁,總共54頁。解釋變量的偏效應(yīng)因為:二值響應(yīng)模型所以:βj表示xj變化一個單位引起的I的平均變化(圖中橫坐標(biāo)的變化),含義不直觀G的反函數(shù)關(guān)心圖中陰影面積的變化當(dāng)前15頁,總共54頁。解釋變量的偏效應(yīng)關(guān)心:xj變化一個單位引起的響應(yīng)概率P的變化當(dāng)xj取值是大致連續(xù),xj變化極小時響應(yīng)概率的變化近似為圖中紅色部分的面積xj的偏效應(yīng)不僅與βj有關(guān),還與比例因子(這里為概率密度函數(shù))有關(guān),即與xj的具體取值有關(guān),是非線性的比例因子當(dāng)前16頁,總共54頁。為方便量化x的偏效應(yīng),計算兩種偏效應(yīng):第一:平均個人偏效應(yīng)(partialeffectattheaverage,PEA)將x以均值代入,計算比例因子:乘以βj得到xj的平均個人偏效應(yīng)不足:有時x的均值是沒有意義的第二:平均偏效應(yīng)(averagepartialeffect,APE),常用以概率密度均值作為比例因子:乘以βj得到xj的平均偏效應(yīng)比例因子與概率密度函數(shù)有關(guān)Logit模型為:Probit模型為:當(dāng)前17頁,總共54頁。理論上,Logit和Probit的選擇取決于潛變量模型誤差項分布的假設(shè)Logit和Probit偏效應(yīng)的精確對比:不僅看βj,還需乘以各自的比例因子
Logit和Probit偏效應(yīng)的粗略對比:對數(shù)單位模型中:概率單位模型中:若兩模型給出大致相同的偏效應(yīng)估計,則兩βj的關(guān)系:(0)=1/sqrt(2)=0.4g(0)=0.25復(fù)雜二值響應(yīng)模型的比較概率單位模型的βj乘以0.4/0.25=1.6,或,對數(shù)單位模型的βj除以1.6,兩者才可對比當(dāng)前18頁,總共54頁。Logit模型和Probit模型的示例:分析影響婦女外出工作的因素(MROZ.WFL)當(dāng)前19頁,總共54頁。概率與自變量呈非線性Logit模型的較Probit模型,實際含義更直觀明顯Logit模型中:LogitP的取值范圍滿足一般線性模型的要求Logit變換,是一種連接函數(shù)當(dāng)前20頁,總共54頁。β的實際意義仍不明顯例:有x1,x2兩個自變量,x1是二值解釋變量。當(dāng)x1從0變化到1時:優(yōu)勢(odds)優(yōu)勢比自變量變化一個單位引起響應(yīng)概率比(相對風(fēng)險)近似為exp(β)Logit模型中:于是:自變量變化一個單位引起的優(yōu)勢比為exp(β)接近0時:當(dāng)前21頁,總共54頁。Logit模型中的示例:分析影響婦女外出工作的因素(MROZ.WFL)婦女受教育年份增加一年,平均外出工作的概率是原來的exp(0.22)=1.25倍當(dāng)前22頁,總共54頁。通常的預(yù)測依據(jù):概率閾值評價指標(biāo)1:通過混淆矩陣判斷閾值是否恰當(dāng)二值響應(yīng)模型的評價例:分析影響婦女外出工作的因素(MROZ.WFL)
實際值01預(yù)測值0
1
當(dāng)前23頁,總共54頁。評價指標(biāo)1:通過正確預(yù)測百分比判斷閾值是否恰當(dāng)例:分析影響婦女外出工作的因素(MROZ.WFL)y=0的325個觀測中,預(yù)測概率小于0.5的有207個,其余有118;0類預(yù)測正確率63.69%,總正確率73.57%;與常數(shù)模型相比,該模型對0類的預(yù)測性能較好,提升了63.69%,對1類的預(yù)測性能不好,下降了18.39%,總體提升了16.73%63.69/100、-18.93/0、16.73/43.16混淆矩陣的期望頻數(shù)分布不足:受樣本分布的影響,尤其在非平衡樣本中
01合計正確率01402016087.50%1400400%合計1802020070%當(dāng)前24頁,總共54頁。評價指標(biāo)2:麥克法登(McFadden)的偽R2(pseudoR-squared),分子為當(dāng)前模型的對數(shù)似然函數(shù)值,分母是只有截距項模型的對數(shù)似然函數(shù)值對數(shù)似然函數(shù)值越大,表明所在模型參數(shù)下得到特定樣本的的可能性越大,模型的擬和優(yōu)度高;反之;如果對數(shù)似然比與1無顯著差異,則說明自變量對LogitP的線性解釋無顯著貢獻;如果對數(shù)似然比遠遠小于1,與1有顯著差異,則說明解釋變量對LogitP的線性有顯著貢獻若現(xiàn)有解釋變量沒有解釋能力,則:越接近1越好(取不到1)等于1,偽R2等于0當(dāng)前25頁,總共54頁。McFadden偽R2示例:分析影響婦女外出工作的因素(MROZ.WFL)當(dāng)前26頁,總共54頁。非隨機樣本
不完整觀測樣本
的回歸建模當(dāng)前27頁,總共54頁。非隨機樣本:采用非概率抽樣方式獲得的樣本(9.5節(jié))外生樣本選擇(exendogenoussampleselection):以自變量為依據(jù),根據(jù)自變量取值范圍有針對性地進行樣本選擇例:研究年齡職業(yè)等因素對年收入(因變量)影響時,重點考察中年人群,即中年人群入樣基于外生樣本選擇方式獲得的非隨機樣本,采用OLS,估計量具有良好特性因為:目的是得到E(y|x),在由xi取值決定的任何一個子總體中研究E(y|x)都是一樣的非隨機樣本當(dāng)前28頁,總共54頁。非隨機樣本:采用非概率抽樣方式獲得的樣本內(nèi)生樣本選擇(endogenoussampleselection):以因變量為依據(jù),根據(jù)因變量取值范圍有針對性地進行樣本選擇例:研究年齡職業(yè)等因素對年收入(因變量)影響時,只考察到了低收入人群,即低收入人群入樣只觀測到5萬元以下的樣本。較總體中的真實回歸線平坦,且不知道誤差有多大!OLS估計存在偏差通常采用斷尾正態(tài)回歸模型當(dāng)前29頁,總共54頁。不完整觀測樣本:在隨機樣本中,有部分觀測的因變量的具體取值無法確定例:研究年收入(因變量)和受教育年份關(guān)系時,采用隨機抽樣方式調(diào)查。只獲得了年收入5萬元以下(或以上)人群的具體年收入值,其余人年收入的具體取值不確定,只知道其不低于(或不高于)5萬元調(diào)查中的“頂端編碼(topcoding)”例:頂端編碼是:5萬元以上特點:隨機樣本因變量取值不完整,受限制觀測不完整觀測樣本當(dāng)前30頁,總共54頁。問:不完整觀測樣本回歸建模時,可否忽略頂端編碼觀測;答:量大則不能忽略因變量取值特點:在大于(或小于)某值的區(qū)間上連續(xù)取值;有大量不可忽略的觀測,因變量取值集中在一個點上類似的應(yīng)用問題例:耐用消費品(汽車)支出yi,要么大于(表示該耐用消費品的最低支出水平),要么等于零雖然并非不完整觀測樣本,但性質(zhì)很類似:隨機樣本,因變量取值受限制OLS估計不恰當(dāng),通常采用截取正態(tài)回歸模型或托賓模型當(dāng)前31頁,總共54頁。斷尾正態(tài)回歸模型(Truncatednormalregressionmodel):針對基于內(nèi)生樣本選擇方式獲得的非隨機樣本例:研究年齡等因素對年收入(y)影響時重點考察高收入人群,即沒有觀測y小于的樣本斷尾類型:上斷尾(y大于的無觀測)、下斷尾(y小于的無觀測)斷尾正態(tài)回歸模型派生于滿足經(jīng)典線性模型假設(shè)的潛變量模型,以下斷尾為例:斷尾正態(tài)回歸模型當(dāng)前32頁,總共54頁。給定x下y*的概率密度函數(shù)為:截距放入x中,()為標(biāo)準(zhǔn)正態(tài)分布的PDF因僅有y*>的樣本(認(rèn)為截取了原來分布的一部分),密度函數(shù)下方的面積不再等于1。Greene2003年提出在y*>的PDF(歸一化處理),即給定x下y的概率密度函數(shù):斷尾正態(tài)分布當(dāng)前33頁,總共54頁。斷尾正態(tài)分布的參數(shù)估計采用極大似然法估計參數(shù)似然函數(shù)為:對數(shù)似然函數(shù)為:最大化對數(shù)似然函數(shù),得到β(潛變量模型中的斜率參數(shù))和σ的極大似然估計值當(dāng)前34頁,總共54頁。斷尾正態(tài)回歸模型斷尾正態(tài)回歸模型:描述了因變量的期望:直觀上:下斷尾中,E(y)大于E(y*);上斷尾中,E(y)小于E(y*)依據(jù):若x是服從均值為μ方差為σ2的正態(tài)分布的隨機變量,有:當(dāng)前35頁,總共54頁。因為:所以:因為:所以,對于任意c,都有:稱為逆米爾斯比率(inverseMillsratio),是標(biāo)準(zhǔn)正態(tài)PDF與標(biāo)準(zhǔn)正態(tài)CDF在c處的值之比可見:潛變量Y*的期望不是Y期望的一致性估計,偏誤為σ。對樣本采用OLS估計是有偏誤的(<0)下斷尾回歸模型當(dāng)前36頁,總共54頁。截取正態(tài)回歸模型截取正態(tài)回歸模型(censorednormalregressionmodel):針對不完整觀測樣本例:研究年收入(y)和受教育年份關(guān)系時,對y小于(或大于)的樣本,已知y的具體值,其余樣本y的具體值,只知道其不低于(或不高于)例:研究年收入(y)和受教育年份(x)關(guān)系時,部分人群的x被觀測到了而y缺失。簡單剔除存在缺失值的樣本會造成信息丟失處理方法:根據(jù)x確定y不低于(或不高于),并指定為某個特定的值y當(dāng)前37頁,總共54頁。截取正態(tài)回歸模型截取類型:上截取(y大于的無具體值)、下截取(y小于的無具體值)處理方法:對無具體值的y,令其為y例:下截取中特點:y以受限制方式被觀測:y*>時y等于y*(無限觀測值);y*<
時y等于y(受限觀測值)無限觀測值均取實際觀測值,受限觀測值均截取為y通常:=y當(dāng)前38頁,總共54頁。截取正態(tài)回歸模型派生于滿足經(jīng)典線性模型假設(shè)的潛變量模型下截取為:上截取為:該問題可分成兩個部分研究:無限觀測值部分受限觀測值部分截取正態(tài)回歸模型與Tobit模型類似,在Tobit模型中討論當(dāng)前39頁,總共54頁。托賓模型(Tobit)模型屬特殊的截取正態(tài)回歸模型Tobit模型是經(jīng)濟學(xué)家Tobin,1958年研究耐用消費品需求時首先提出的經(jīng)濟計量學(xué)模型例:耐用消費品支出yi要么大于(表示該耐用消費品的最低支出水平),要么等于零與截取正態(tài)回歸模型研究對象的不同:y是完整觀測的;在嚴(yán)格為正時大致連續(xù),但有相當(dāng)多的觀測其y=0(因比例較大不能忽略)。不可忽略的部分稱為角點解響應(yīng)(cornersolutionresponse)托賓模型當(dāng)前40頁,總共54頁。Tobit模型類似于截取正態(tài)回歸模型,派生于滿足經(jīng)典線性模型假設(shè)的潛變量模型特點:被解釋變量以受限制方式被觀測到y(tǒng)*>0時y等于y*(無限觀測值);y*<0時y等于0(受限觀測值)。無限制觀測值均取實際觀測值,受限觀測值均截取為0該問題可分成兩個部分研究=0y=0當(dāng)y*大于0時,y等于y*當(dāng)y*小于等于0時,y等于0托賓模型的思路當(dāng)前41頁,總共54頁。第一部分:y*大于0部分y在正值上連續(xù)分布,給定xi下yi的密度等于給定x下y*的密度,密度函數(shù)為:截距放入x中,()為標(biāo)準(zhǔn)正態(tài)分布的PDF第二部分:當(dāng)y*小于等于0部分y等于0的概率定義為y*小于0的概率u~N(0,2),u/服從標(biāo)準(zhǔn)正態(tài)分布當(dāng)前42頁,總共54頁。參數(shù)估計:極大似然估計似然函數(shù):d為示性變量,y*大于等于(這里為0)時取1,否則取0對數(shù)似然函數(shù)最大化對數(shù)似然函數(shù),得到β(潛變量模型中的斜率參數(shù))和σ的極大似然估計值托賓模型的參數(shù)估計當(dāng)前43頁,總共54頁。Tobit模型描述了因變量的期望期望由兩個部分組成:第二項:y=0時,第二項為0托賓模型斷尾正態(tài)回歸模型的期望當(dāng)前44頁,總共54頁。第一項:E(y|y>0)同斷尾正態(tài)回歸模型又因為:所以:簡寫為當(dāng)前45頁,總共54頁。Tobit模型(因變量的期望)為:E(y|x)是x和β的非線性函數(shù)托賓模型當(dāng)前46頁,總共54頁。因為:所以,xj的偏效應(yīng):結(jié)論:xj的偏效應(yīng)不僅與潛變量模型中的βj有關(guān),還與比例因子有關(guān).通常APE比例因子取:σ對偏效應(yīng)估計很重要對樣本采用OLS估計得到的偏效應(yīng)需乘以比例因子,才與Tobit模型的偏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高空考古挖掘服務(wù)合同
- 聯(lián)排別墅酒店租賃合同范本
- 高速公路土方施工合同范本
- 花卉市場租賃合同水電費
- 電力工程改造合同范本
- 小學(xué)節(jié)能改造施工合同
- 冶金工程中標(biāo)合作協(xié)議
- 礦山設(shè)備廠房施工合同
- 演出票務(wù)租賃合同
- 古城墻遺址修復(fù)工程合同
- GB/T 4208-2017外殼防護等級(IP代碼)
- GB/T 10836-2021船用多功能焚燒爐
- 部編版五年級語文上冊第八單元主題閱讀含答案
- 結(jié)直腸癌中西醫(yī)結(jié)合治療總論
- 第23課《范進中舉》課件(共27張PPT) 部編版語文九年級上冊
- 宋曉峰小品《宋鏢傳奇》劇本臺詞手稿
- 高考作文專題之?dāng)M標(biāo)題課件
- DB31T 634-2020 電動乘用車運行安全和維護保障技術(shù)規(guī)范
- 商業(yè)綜合體項目建設(shè)成本及經(jīng)營測算(自動計算)
- 尋覓沉睡的寶船 南海一號 華光礁一號
- 中藥材及飲片性狀鑒別1總結(jié)課件
評論
0/150
提交評論