第八章 虛擬變量回歸模型_第1頁
第八章 虛擬變量回歸模型_第2頁
第八章 虛擬變量回歸模型_第3頁
第八章 虛擬變量回歸模型_第4頁
第八章 虛擬變量回歸模型_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第八章虛擬變量回歸模型§8.1虛擬變量§8.2虛擬解釋變量的回歸模型§8.3虛擬被解釋變量的回歸模型

§8.4案例分析

8.1

虛擬變量

兩大類變量:

1.定量變量(尺度變量,scalevariable)可以計(jì)算比率、也可以差分。如GDP、價(jià)格、產(chǎn)量、人口數(shù)、身高等。虛擬變量的概念2.定性變量(名義變量,nominalvariable)

不可計(jì)算比率、也不可差分。如性別、種族、國籍、黨派、企業(yè)類別等。虛擬變量(dummyvariable)就是定性變量。虛擬變量也可引入回歸模型,用符號D表示。其取值為“1”或“0”。8.2虛擬解釋變量的回歸模型【例】研究某企業(yè)的職工工資與工齡之間的線性回歸關(guān)系,并判斷該企業(yè)是否存在性別歧視。

設(shè)工資Y為被解釋變量;工齡X為解釋變量;性別為虛擬變量,用D表示。D=1,表示男性,D=0,表示女性。引入虛擬變量D的回歸模型:如果,說明存在性別歧視。虛擬變量的引入方式加法方式

特征:截距變,斜率不變。當(dāng)D=0(女性)當(dāng)D=1(男性)0XY男性女性(工齡)(工資)1加法方式(續(xù))特征:截距變,斜率不變。2乘法方式特征:截距不變,斜率變。當(dāng)D=0(女性)當(dāng)D=1(男性)0XY男性女性(工齡)(工資)乘法方式(續(xù))特征:截距不變,斜率變。3加法方式與乘法方式相結(jié)合特征:截距變,斜率變。當(dāng)D=0(女性)當(dāng)D=1(男性)加法方式與乘法方式相結(jié)合(續(xù))特征:截距變,斜率變。

0XY男性女性(工齡)(工資)【案例1】研究中國1979-2001年儲蓄與GNP之間的關(guān)系,請問:1990年前后,儲蓄-GNP的關(guān)系是否發(fā)生結(jié)構(gòu)性變化?年度儲蓄(Y)GNP(X)19792814038.21980399.54517.81981523.74860.31982675.45301.81983892.55957.419841214.77206.719851622.68989.119862237.610201.419873073.311954.519883801.514922.319895146.916917.819907034.218598.41991910721662.5199211545.426651.9199314762.434560.5199421518.846670199529662.357494.9199638520.866850.5199746279.873142.7199853407.576967.2199959621.880579.4200064332.488228.1200173762.494346.48.3案例分析1變量分析::設(shè)儲蓄為被解釋變變量Y;GNP為解釋變量量X;1990年前后這一時(shí)期屬屬性為虛擬擬變量D。D=0表示1990年前,D=1表示1990年后。2虛擬變量引引入方式::加法方式與乘法方式相結(jié)合3回歸模型::當(dāng)D=0(1990年前)當(dāng)D=1(1990年后)加法方式乘法方式為了考察結(jié)結(jié)構(gòu)性變化化,只要檢檢驗(yàn)β2或β4是否顯著地地不等于零零。Eviews中虛擬變量量的賦值操操作命令由于Eviews中不可用D作為變量名名,故用DM代替虛擬變變量D。SeriesDM定義虛擬變變量DMSmpl19791989指定樣本范范圍(1990前)DM=0將虛擬變量量賦值為0Smpl19902001指定樣本范范圍(1990后)DM=1將虛擬變量量賦值為1Smpl@all指定全范圍圍樣本虛擬變量項(xiàng)項(xiàng)的回歸系系數(shù)的t檢驗(yàn)結(jié)果表表明,回歸歸系數(shù)與零零有顯著性性差異,即即不等于零零。所以,,1990前后儲蓄-GNP的關(guān)系存在在結(jié)構(gòu)性變變化。也可用Eviews進(jìn)行結(jié)構(gòu)性變化化的檢驗(yàn),,即ChowTest(鄒至莊檢驗(yàn))鄒至莊(1929-),英文名GregoryC.Chow,著名美籍華華人經(jīng)濟(jì)學(xué)學(xué)家,美國普林斯斯頓大學(xué)教教授。1首先用命令令equationeq.lsycx進(jìn)行回歸分分析(不引引入虛擬變變量)。eq為回歸方程程名。2然后用命令令eq.chow1990進(jìn)行結(jié)構(gòu)性性變化檢驗(yàn)驗(yàn)。1990表示有待檢檢驗(yàn)的結(jié)構(gòu)構(gòu)性變化點(diǎn)點(diǎn)。ChowTest的步驟如果F-statistic的值大于F(2,19)的臨界值;;或者,如果果Prob.F<0.05,表明存在結(jié)構(gòu)性性變化。本例,F(xiàn)-statistic=7.259945>F(2,19)=3.52(查表表)Prob.F(2,19)=0.004548<0.05說明明1990年前前后后確確實(shí)實(shí)存存在在結(jié)結(jié)構(gòu)構(gòu)性性變變化化。也可可在在回回歸歸分分析析結(jié)結(jié)果果的的視視窗窗內(nèi)內(nèi),,通通過過View/StabilityTests/ChowBreakpointTest的視視窗窗操操作作,,進(jìn)進(jìn)行行結(jié)結(jié)構(gòu)構(gòu)性性檢檢驗(yàn)驗(yàn)((如下下圖圖所所示示)。?!景咐?】】研究究美美國國1978-1985年各各季季度度冰冰箱箱銷銷售售量量與與耐耐用用品品支支出出之之間間的的關(guān)關(guān)系系。。參見見古古扎扎拉拉蒂蒂教教材材p.290,表表9-4.)。季度冰箱銷售量(千臺)耐用品支出(10億美元)FRIGDUR1978(1)1317252.61978(2_1615272.41978(3)1662270.91978(4)1295273.91979(1)1271268.91979(2)1555262.91979(3)1639270.91979(4)1238263.41980(1)1277260.61980(2)1258231.91980(3)1417242.71980(4)1185248.61981(1)1196258.71981(2)1410248.41981(3)1417255.51981(4)919240.41982(1)943247.71982(2)1175249.11982(3)1269251.81982(4)973262.01983(1)1102263.31983(2)1344280.01983(3)1641288.51983(4)1225300.51984(1)1429312.61984(2)1699322.51984(3)1749324.31984(4)1117333.11985(1)1242344.81985(2)1684350.31985(3)1764369.11985(4)1328356.41變量量分分析析::將DUR作為為解解釋釋變變量量;;FRIG作為為被被解解釋釋變變量量;;引入入3個(gè)季季度度虛虛擬擬變變量量D1,D2,D3。(虛虛擬擬變變量量數(shù)數(shù)=屬性性數(shù)數(shù)–1)2季度度虛虛擬擬變變量量的的賦賦值值規(guī)規(guī)則則::D1=1(第1季度)0(其他季度)D2=1(第2季度)0(其他季度)D3=1(第3季度)0(其他季度)3季度度虛虛擬擬變變量量的的賦賦值值操操作作命命令令::seriesD1D1=@seas(1)seriesD2D2=@seas(2)seriesD3D3=@seas(3)4回歸歸分分析析操操作作命命令令::equationeq.lsFrigcDurD1D2D3提問問根據(jù)據(jù)回回歸歸分分析析結(jié)結(jié)果果,,發(fā)發(fā)現(xiàn)現(xiàn)存存在在什什么么問問題題??如如何何修修改改回回歸歸模模型型??8.4虛擬擬被被解解釋釋變變量量的的回回歸歸模模型型【例】研究究是否否購購買買住住房房與收入入水水平平的關(guān)關(guān)系系。設(shè)是否否購購房房為被被解解釋釋變變量量,,用用Y表示示;;收入入為解解釋釋變變量量,,用用X表示示。。Y就是是虛虛擬擬被被解解釋釋變變量量,,其其取取值值為為Y=1(購購買買));;Y=0(不不買買))1.線性性概概率率模模型型((LPM,LinearProbabilityModel)回歸模型:回歸方程:回歸歸方方程程::虛擬擬被被解解釋釋變變量量的的條條件件均均值值的的意意義義設(shè)被解釋變量的屬性(購房)發(fā)生概率為所以以,,虛虛擬擬被被解解釋釋變變量量的的條條件件均均值值即即購購房房概概率率,,它它是是收收入入的的線線性性函函數(shù)數(shù)。。約束條件LPM模型估計(jì)的問問題(1)隨機(jī)擾動(dòng)項(xiàng)項(xiàng)的非正態(tài)性性后果:對回歸參數(shù)數(shù)估計(jì)無影響響,但影響t檢驗(yàn)和區(qū)間估估計(jì)。在大樣本條件件下,都沒有有影響。(2)隨機(jī)擾動(dòng)項(xiàng)項(xiàng)的異方差性性可見,隨機(jī)擾擾動(dòng)項(xiàng)出現(xiàn)異異方差。為了了消除異方差差,采用WLS(加權(quán)最小二二乘法)??梢宰C明:第1步:用OLS,求第2步:用WLS,取解決方法1:(3)條件均值不滿足約束條件如果認(rèn)定;

認(rèn)定解決方法2:選擇非線性概概率模型,如如Logit模型、Probit模型。線性概率模型型與非線性概概率模型的特特征比較1LPM(a)線性概率模型1CDF(b)非線性概率模型2.Logit模型LPM模型:Logit模型:(非線性)如果Xp使用Mathematica軟件描出曲線線圖。令等式左邊為事事件發(fā)生概率與不發(fā)生概率之比,稱機(jī)會比率。將非線性轉(zhuǎn)化化為線性,稱為機(jī)會比率的對數(shù),機(jī)會比率對數(shù)數(shù)是解釋變量X的線性函數(shù)。。說明變動(dòng)一個(gè)單位,機(jī)會比率對數(shù)平均變化個(gè)單位,Logit模型的估計(jì)區(qū)分兩類數(shù)據(jù)據(jù):(1)個(gè)體水平數(shù)數(shù)據(jù)購房概率p收入X(千美元)0608110112如果,

,可見,Z表達(dá)式無意義義,無法用OLS,需用ML(最大似然法)最大似然法(MethodofMaximumLikelihood)也稱極大似然然法,最早由由德國數(shù)學(xué)家家高斯(1777-1855)提出,1912年由英國統(tǒng)計(jì)計(jì)學(xué)家費(fèi)歇(Fisher)證明與應(yīng)用。。它是建立在在最大似然原原理基礎(chǔ)上的的一種統(tǒng)計(jì)方方法。最大似然原理理【例】設(shè)有外形完全全相同的兩個(gè)個(gè)箱子,甲箱箱有99個(gè)白球1個(gè)黑球,乙箱箱有1個(gè)白球99個(gè)黑球。隨機(jī)機(jī)地從某箱中中抽取一球,,發(fā)現(xiàn)是白球球。請問此箱箱是甲箱還是是乙箱?分析:從邏輯上嚴(yán)嚴(yán)格地來說,,僅僅從取出出的球是白球球這一點(diǎn)是無無法判定該箱箱究竟是甲箱箱還是乙箱。。但是,如果果我們從統(tǒng)計(jì)計(jì)概率上來判判斷,看上去去最像是甲箱箱,而不是乙乙箱。因?yàn)榧准紫涞陌浊蚋鸥怕蕿?.99;乙箱的白球球概率僅僅0.01。其實(shí),如果我我們從“最大似然”的英文MaximumLikelihood來看,原始含含義就是“看起來最像”。“看起來最像”,在很多情況況下其實(shí)就是是我們的決策策依據(jù)。(2)群組數(shù)據(jù)((整理匯總數(shù)數(shù)據(jù))家庭收入(千美元)X群組內(nèi)家庭總數(shù)群組內(nèi)購房家庭數(shù)購房概率權(quán)重機(jī)會比率對數(shù)64080.26.4-1.386850120.249.12-1.1531060180.31

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論