經(jīng)濟計量方法導(dǎo)論第六講演示

上傳人：1*** IP屬地：廣東上傳時間：2023-03-30 格式：PPT 頁數(shù)：54 大小：10.72MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩49頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

（優(yōu)選）經(jīng)濟計量方法導(dǎo)論第六講當(dāng)前1頁，總共54頁。限值因變量(limiteddependentvariable,LDV):即取值范圍明顯受到限制的因變量例：因變量值取1/0(是否購買)例：因變量為非負(fù)數(shù)(出險理賠次數(shù))等二值因變量的回歸建模線性概率模型、對數(shù)單位模型、概率單位模型不完整觀測樣本和非隨機樣本的回歸建模斷尾正態(tài)回歸模型、截取正態(tài)回歸模型、托賓模型泊松回歸模型概述當(dāng)前2頁，總共54頁。二值因變量回歸建模當(dāng)前3頁，總共54頁。二值因變量：因變量只取0/1兩個值二值響應(yīng)模型(binaryresponsemodels):用于二值因變量的回歸建模，目標(biāo)：研究響應(yīng)概率給定自變量x條件下，因變量y取1的概率二值響應(yīng)模型主要包括線性概率模型對數(shù)單位模型概率單位模型二值因變量回歸建模響應(yīng)概率當(dāng)前4頁，總共54頁。線性概率模型(linearprobabilitymodel,LPM)(7.5節(jié))是一種最簡單的二值響應(yīng)模型源于一般線回歸模型模型形式為：系數(shù)的含義：j度量了因xj的變化導(dǎo)致y成功(取1)概率的平均變化:簡單的二值響應(yīng)模型

---線性概率模型當(dāng)前5頁，總共54頁。線性概率模型示例:分析影響婦女外出工作的因素(MROZ.WFL)是否工作，其他收入來源，受教育程度，工作經(jīng)歷，年齡，年齡小于6歲的子女?dāng)?shù)，年齡在6-18歲之間的子女?dāng)?shù)當(dāng)前6頁，總共54頁。線性概率模型的問題：無法保證模型給出的概率值限制在0-1范圍內(nèi)前例中，當(dāng)：解決方法：預(yù)測值小于0.5的取0，大于等于0.5的取1educ小于3.84時概率為負(fù)數(shù)；本例中的educ均大于5，雖不必?fù)?dān)心，但仍為一個潛在問題當(dāng)前7頁，總共54頁。線性概率模型的問題：線性概率模型反映了概率與自變量取值之間的線性相關(guān)，無法反映非線性關(guān)系例：家庭收入和購買商品房的概率違背了高斯－馬爾科夫假定，當(dāng)y為二值變量時：表明：除非概率與任何一個x都不相關(guān)，否則一定存在異方差當(dāng)前8頁，總共54頁。復(fù)雜的二值響應(yīng)模型目的：克服線性概率模型的局限性策略：G(z)的函數(shù)值限制在0-1之間，一般為累積分布函數(shù)(cumulativedistributionfunction,CDF)種類：對數(shù)單位模型和概率單位模型差異：主要體現(xiàn)在G函數(shù)的具體形式上問題：G函數(shù)具體形式的選擇？復(fù)雜的二值響應(yīng)模型當(dāng)前9頁，總共54頁。選擇G函數(shù)具體形式策略的出發(fā)點以滿足經(jīng)典線性模型假設(shè)的潛變量模型為基礎(chǔ)潛變量：其值無法觀測到的變量(這里為y*，如購買帶來的效應(yīng))顯變量：其值能被觀測到的變量(這里為y，取1或0)y*大于0時,y=1;y*小于等于0時,y=0于是：G的具體形式取決于e的分布復(fù)雜的二值響應(yīng)模型x對潛變量均值的影響方向與對P(y=1|x)的影響方向相同當(dāng)前10頁，總共54頁。若e是邏輯斯蒂隨機變量，選用Logit模型概率密度函數(shù)(PDF)g為：G是邏輯斯蒂函數(shù)，為標(biāo)準(zhǔn)邏輯斯蒂隨機變量的累積分布函數(shù)(CDF)：對數(shù)單位模型(LogitModel)概率與自變量呈非線性關(guān)系與正態(tài)分布的形狀接近g(0)=0.25當(dāng)前11頁，總共54頁。若e服從正態(tài)分布，選用Probit模型G是標(biāo)準(zhǔn)正態(tài)的累積分布函數(shù)概率單位模型(ProbitModel)概率與自變量呈非線性關(guān)系(0)=1/sqrt(2)=0.4邏輯斯蒂函數(shù)與正態(tài)分布CDF的形狀接近，前者較平坦些，正態(tài)分布趨近更快些當(dāng)前12頁，總共54頁。極大似然估計(Maximumlikelihoodestimation,MLE):在所有可能的值中選擇使樣本有最大似然性的基本思路：在給定Xi下yi的概率合寫為：似然函數(shù)與聯(lián)合概率密度函數(shù)形式相同：對數(shù)似然函數(shù)：模型的參數(shù)估計當(dāng)前13頁，總共54頁。Logit模型具體為：Probit模型具體為：求使對數(shù)似然函數(shù)達到最大時的β代入整理當(dāng)前14頁，總共54頁。解釋變量的偏效應(yīng)因為：二值響應(yīng)模型所以：βj表示xj變化一個單位引起的I的平均變化(圖中橫坐標(biāo)的變化)，含義不直觀G的反函數(shù)關(guān)心圖中陰影面積的變化當(dāng)前15頁，總共54頁。解釋變量的偏效應(yīng)關(guān)心：xj變化一個單位引起的響應(yīng)概率P的變化當(dāng)xj取值是大致連續(xù)，xj變化極小時響應(yīng)概率的變化近似為圖中紅色部分的面積xj的偏效應(yīng)不僅與βj有關(guān)，還與比例因子(這里為概率密度函數(shù))有關(guān)，即與xj的具體取值有關(guān)，是非線性的比例因子當(dāng)前16頁，總共54頁。為方便量化x的偏效應(yīng)，計算兩種偏效應(yīng)：第一：平均個人偏效應(yīng)(partialeffectattheaverage,PEA)將x以均值代入，計算比例因子：乘以βj得到xj的平均個人偏效應(yīng)不足：有時x的均值是沒有意義的第二：平均偏效應(yīng)(averagepartialeffect,APE)，常用以概率密度均值作為比例因子：乘以βj得到xj的平均偏效應(yīng)比例因子與概率密度函數(shù)有關(guān)Logit模型為：Probit模型為：當(dāng)前17頁，總共54頁。理論上，Logit和Probit的選擇取決于潛變量模型誤差項分布的假設(shè)Logit和Probit偏效應(yīng)的精確對比：不僅看βj，還需乘以各自的比例因子

Logit和Probit偏效應(yīng)的粗略對比：對數(shù)單位模型中：概率單位模型中：若兩模型給出大致相同的偏效應(yīng)估計，則兩βj的關(guān)系：(0)=1/sqrt(2)=0.4g(0)=0.25復(fù)雜二值響應(yīng)模型的比較概率單位模型的βj乘以0.4/0.25=1.6，或，對數(shù)單位模型的βj除以1.6，兩者才可對比當(dāng)前18頁，總共54頁。Logit模型和Probit模型的示例：分析影響婦女外出工作的因素(MROZ.WFL)當(dāng)前19頁，總共54頁。概率與自變量呈非線性Logit模型的較Probit模型，實際含義更直觀明顯Logit模型中：LogitP的取值范圍滿足一般線性模型的要求Logit變換，是一種連接函數(shù)當(dāng)前20頁，總共54頁。β的實際意義仍不明顯例：有x1,x2兩個自變量，x1是二值解釋變量。當(dāng)x1從0變化到1時：優(yōu)勢(odds)優(yōu)勢比自變量變化一個單位引起響應(yīng)概率比(相對風(fēng)險)近似為exp(β)Logit模型中：于是:自變量變化一個單位引起的優(yōu)勢比為exp(β)接近0時：當(dāng)前21頁，總共54頁。Logit模型中的示例：分析影響婦女外出工作的因素(MROZ.WFL)婦女受教育年份增加一年，平均外出工作的概率是原來的exp(0.22)=1.25倍當(dāng)前22頁，總共54頁。通常的預(yù)測依據(jù)：概率閾值評價指標(biāo)1：通過混淆矩陣判斷閾值是否恰當(dāng)二值響應(yīng)模型的評價例：分析影響婦女外出工作的因素(MROZ.WFL)

實際值01預(yù)測值0

當(dāng)前23頁，總共54頁。評價指標(biāo)1：通過正確預(yù)測百分比判斷閾值是否恰當(dāng)例：分析影響婦女外出工作的因素(MROZ.WFL)y=0的325個觀測中，預(yù)測概率小于0.5的有207個，其余有118;0類預(yù)測正確率63.69%,總正確率73.57%；與常數(shù)模型相比，該模型對0類的預(yù)測性能較好，提升了63.69%，對1類的預(yù)測性能不好，下降了18.39%，總體提升了16.73%63.69/100、-18.93/0、16.73/43.16混淆矩陣的期望頻數(shù)分布不足：受樣本分布的影響，尤其在非平衡樣本中

01合計正確率01402016087.50%1400400%合計1802020070%當(dāng)前24頁，總共54頁。評價指標(biāo)2：麥克法登(McFadden)的偽R2(pseudoR-squared)，分子為當(dāng)前模型的對數(shù)似然函數(shù)值，分母是只有截距項模型的對數(shù)似然函數(shù)值對數(shù)似然函數(shù)值越大，表明所在模型參數(shù)下得到特定樣本的的可能性越大，模型的擬和優(yōu)度高；反之；如果對數(shù)似然比與1無顯著差異，則說明自變量對LogitP的線性解釋無顯著貢獻；如果對數(shù)似然比遠遠小于1，與1有顯著差異，則說明解釋變量對LogitP的線性有顯著貢獻若現(xiàn)有解釋變量沒有解釋能力，則：越接近1越好（取不到1）等于1，偽R2等于0當(dāng)前25頁，總共54頁。McFadden偽R2示例：分析影響婦女外出工作的因素(MROZ.WFL)當(dāng)前26頁，總共54頁。非隨機樣本

不完整觀測樣本

的回歸建模當(dāng)前27頁，總共54頁。非隨機樣本：采用非概率抽樣方式獲得的樣本(9.5節(jié))外生樣本選擇(exendogenoussampleselection)：以自變量為依據(jù)，根據(jù)自變量取值范圍有針對性地進行樣本選擇例：研究年齡職業(yè)等因素對年收入(因變量)影響時，重點考察中年人群，即中年人群入樣基于外生樣本選擇方式獲得的非隨機樣本，采用OLS，估計量具有良好特性因為：目的是得到E(y|x)，在由xi取值決定的任何一個子總體中研究E(y|x)都是一樣的非隨機樣本當(dāng)前28頁，總共54頁。非隨機樣本：采用非概率抽樣方式獲得的樣本內(nèi)生樣本選擇(endogenoussampleselection)：以因變量為依據(jù)，根據(jù)因變量取值范圍有針對性地進行樣本選擇例：研究年齡職業(yè)等因素對年收入(因變量)影響時，只考察到了低收入人群，即低收入人群入樣只觀測到5萬元以下的樣本。較總體中的真實回歸線平坦,且不知道誤差有多大！OLS估計存在偏差通常采用斷尾正態(tài)回歸模型當(dāng)前29頁，總共54頁。不完整觀測樣本：在隨機樣本中，有部分觀測的因變量的具體取值無法確定例：研究年收入(因變量)和受教育年份關(guān)系時，采用隨機抽樣方式調(diào)查。只獲得了年收入5萬元以下(或以上)人群的具體年收入值，其余人年收入的具體取值不確定，只知道其不低于(或不高于)5萬元調(diào)查中的“頂端編碼(topcoding)”例：頂端編碼是：5萬元以上特點：隨機樣本因變量取值不完整，受限制觀測不完整觀測樣本當(dāng)前30頁，總共54頁。問：不完整觀測樣本回歸建模時，可否忽略頂端編碼觀測；答：量大則不能忽略因變量取值特點：在大于(或小于)某值的區(qū)間上連續(xù)取值；有大量不可忽略的觀測，因變量取值集中在一個點上類似的應(yīng)用問題例：耐用消費品(汽車)支出yi，要么大于(表示該耐用消費品的最低支出水平)，要么等于零雖然并非不完整觀測樣本，但性質(zhì)很類似：隨機樣本，因變量取值受限制OLS估計不恰當(dāng)，通常采用截取正態(tài)回歸模型或托賓模型當(dāng)前31頁，總共54頁。斷尾正態(tài)回歸模型(Truncatednormalregressionmodel)：針對基于內(nèi)生樣本選擇方式獲得的非隨機樣本例：研究年齡等因素對年收入(y)影響時重點考察高收入人群，即沒有觀測y小于的樣本斷尾類型：上斷尾(y大于的無觀測)、下斷尾(y小于的無觀測)斷尾正態(tài)回歸模型派生于滿足經(jīng)典線性模型假設(shè)的潛變量模型，以下斷尾為例：斷尾正態(tài)回歸模型當(dāng)前32頁，總共54頁。給定x下y*的概率密度函數(shù)為：截距放入x中，()為標(biāo)準(zhǔn)正態(tài)分布的PDF因僅有y*>的樣本(認(rèn)為截取了原來分布的一部分)，密度函數(shù)下方的面積不再等于1。Greene2003年提出在y*>的PDF(歸一化處理),即給定x下y的概率密度函數(shù)：斷尾正態(tài)分布當(dāng)前33頁，總共54頁。斷尾正態(tài)分布的參數(shù)估計采用極大似然法估計參數(shù)似然函數(shù)為：對數(shù)似然函數(shù)為：最大化對數(shù)似然函數(shù)，得到β(潛變量模型中的斜率參數(shù))和σ的極大似然估計值當(dāng)前34頁，總共54頁。斷尾正態(tài)回歸模型斷尾正態(tài)回歸模型：描述了因變量的期望：直觀上：下斷尾中，E(y)大于E(y*);上斷尾中，E(y)小于E(y*)依據(jù)：若x是服從均值為μ方差為σ2的正態(tài)分布的隨機變量，有：當(dāng)前35頁，總共54頁。因為：所以：因為：所以，對于任意c，都有：稱為逆米爾斯比率(inverseMillsratio)，是標(biāo)準(zhǔn)正態(tài)PDF與標(biāo)準(zhǔn)正態(tài)CDF在c處的值之比可見：潛變量Y*的期望不是Y期望的一致性估計，偏誤為σ。對樣本采用OLS估計是有偏誤的(<0)下斷尾回歸模型當(dāng)前36頁，總共54頁。截取正態(tài)回歸模型截取正態(tài)回歸模型(censorednormalregressionmodel)：針對不完整觀測樣本例：研究年收入(y)和受教育年份關(guān)系時，對y小于(或大于)的樣本，已知y的具體值，其余樣本y的具體值，只知道其不低于(或不高于)例：研究年收入(y)和受教育年份(x)關(guān)系時，部分人群的x被觀測到了而y缺失。簡單剔除存在缺失值的樣本會造成信息丟失處理方法：根據(jù)x確定y不低于（或不高于），并指定為某個特定的值y當(dāng)前37頁，總共54頁。截取正態(tài)回歸模型截取類型：上截取(y大于的無具體值)、下截取(y小于的無具體值)處理方法：對無具體值的y，令其為y例：下截取中特點：y以受限制方式被觀測:y*>時y等于y*(無限觀測值);y*<

時y等于y(受限觀測值)無限觀測值均取實際觀測值，受限觀測值均截取為y通常：=y當(dāng)前38頁，總共54頁。截取正態(tài)回歸模型派生于滿足經(jīng)典線性模型假設(shè)的潛變量模型下截取為：上截取為：該問題可分成兩個部分研究：無限觀測值部分受限觀測值部分截取正態(tài)回歸模型與Tobit模型類似，在Tobit模型中討論當(dāng)前39頁，總共54頁。托賓模型(Tobit)模型屬特殊的截取正態(tài)回歸模型Tobit模型是經(jīng)濟學(xué)家Tobin,1958年研究耐用消費品需求時首先提出的經(jīng)濟計量學(xué)模型例：耐用消費品支出yi要么大于(表示該耐用消費品的最低支出水平)，要么等于零與截取正態(tài)回歸模型研究對象的不同：y是完整觀測的；在嚴(yán)格為正時大致連續(xù)，但有相當(dāng)多的觀測其y=0(因比例較大不能忽略）。不可忽略的部分稱為角點解響應(yīng)(cornersolutionresponse)托賓模型當(dāng)前40頁，總共54頁。Tobit模型類似于截取正態(tài)回歸模型，派生于滿足經(jīng)典線性模型假設(shè)的潛變量模型特點：被解釋變量以受限制方式被觀測到y(tǒng)*>0時y等于y*(無限觀測值)；y*<0時y等于0(受限觀測值)。無限制觀測值均取實際觀測值，受限觀測值均截取為0該問題可分成兩個部分研究＝0y＝0當(dāng)y*大于0時，y等于y*當(dāng)y*小于等于0時，y等于0托賓模型的思路當(dāng)前41頁，總共54頁。第一部分：y*大于0部分y在正值上連續(xù)分布，給定xi下yi的密度等于給定x下y*的密度，密度函數(shù)為：截距放入x中，()為標(biāo)準(zhǔn)正態(tài)分布的PDF第二部分：當(dāng)y*小于等于0部分y等于0的概率定義為y*小于0的概率u~N(0,2),u/服從標(biāo)準(zhǔn)正態(tài)分布當(dāng)前42頁，總共54頁。參數(shù)估計：極大似然估計似然函數(shù)：d為示性變量，y*大于等于(這里為0)時取1，否則取0對數(shù)似然函數(shù)最大化對數(shù)似然函數(shù)，得到β(潛變量模型中的斜率參數(shù))和σ的極大似然估計值托賓模型的參數(shù)估計當(dāng)前43頁，總共54頁。Tobit模型描述了因變量的期望期望由兩個部分組成：第二項:y=0時，第二項為0托賓模型斷尾正態(tài)回歸模型的期望當(dāng)前44頁，總共54頁。第一項:E(y|y>0)同斷尾正態(tài)回歸模型又因為：所以：簡寫為當(dāng)前45頁，總共54頁。Tobit模型(因變量的期望)為：E(y|x)是x和β的非線性函數(shù)托賓模型當(dāng)前46頁，總共54頁。因為：所以，xj的偏效應(yīng)：結(jié)論：xj的偏效應(yīng)不僅與潛變量模型中的βj有關(guān)，還與比例因子有關(guān).通常APE比例因子取：σ對偏效應(yīng)估計很重要對樣本采用OLS估計得到的偏效應(yīng)需乘以比例因子，才與Tobit模型的偏

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

經(jīng)濟計量方法導(dǎo)論第六講演示

文檔簡介

溫馨提示

最新文檔

評論

經(jīng)濟計量方法導(dǎo)論第六講演示

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔