八章 虛擬變量1577775632_第1頁
八章 虛擬變量1577775632_第2頁
八章 虛擬變量1577775632_第3頁
八章 虛擬變量1577775632_第4頁
八章 虛擬變量1577775632_第5頁
已閱讀5頁,還剩53頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八章虛擬變量1第一節(jié)虛虛擬變變量回顧:前前面各章章討論的的變量都都是可以以直接用數(shù)字計計量的,即可可以獲得得其實際際觀測值值(如收收入、支支出、產(chǎn)產(chǎn)量物價價水平等等等)。。這些變變量稱作作數(shù)量變量量。然而,影影響被解解釋變量量的不僅僅有量的的因素,,還有質(zhì)質(zhì)的因素素(如性別、民族、職業(yè)、季季節(jié)、政政策等等)2虛擬變量量是用以反反映質(zhì)的的屬性的的一個人人工變量量,取值值為0或1,通常記記為D(DummyVariable),又可稱之之為屬性變量量、雙值變量量、類型變量量、定性變量量、或二元型變變量。注意:虛虛擬變量量D只能取0或1兩個值,即屬性之間間不能運運算!對基礎(chǔ)類類型或否否定類型型設(shè)D=0對比較類類型或肯肯定類型型設(shè)D=1一、虛擬擬變量的的概念3例如如1男性D=0女性1“文革”時期D=0非“文革”時期4說明明虛擬變量量主要是是用來代代表質(zhì)的的因素,,但有些情況況下也可可以用來來代表數(shù)數(shù)量因素素。例如:在在建立儲儲蓄函數(shù)數(shù)時,““年齡””是一個個重要的的解釋變變量。雖雖然“年年齡”是是一個數(shù)數(shù)量因素素,但為為了方便便也可以以用虛擬擬變量表表示。例例如:可可以把居居民分為為兩個年年齡組::第一組::20~35歲的居民民第二組::35~60歲的居民民用“1”表示第一一年齡組組;“0”表示第二二年齡組組,就可可以估計計年齡對對儲蓄的的影響。。5二、虛擬擬變量的的設(shè)置規(guī)規(guī)則1.兩個屬性性的表示示法如性別有兩兩個屬性性:用Di表示即:兩個個屬性引引入一個個變量即即可!62.多個屬性性的表示示法假設(shè)學(xué)歷歷有四個個屬性::博士、碩士、本科、本科以下下等,則::為什么四四個屬性性只引入入3個變量呢呢?7變量屬性D1D2D3博士100碩士010本科001本科以下000即:m個屬性引引入(m-1)個變量即即可。83.多個因素素各兩個個屬性的的表示法法如需要同同時表示示城鄉(xiāng)差別別和性別差別別D1D2城市男性11城市女性10農(nóng)村男性01農(nóng)村女性009一般地,,若有m個因素,而每個個因素都都只有兩兩個不同同的屬性性類型,,則引入入m個虛擬變變量。思考:現(xiàn)有三三個定性性因素,,有兩個個因素各各有4個個不同的的屬性,,一個因因素有2個不同同的屬性性,應(yīng)設(shè)設(shè)多少個個虛擬變變量?(應(yīng)設(shè)3+3++1=7個虛擬擬變量))10三、虛擬擬變量的的作用1.可以描述述和測量量定性因因素的影影響2.分離異常常因素的的影響例如分析析我國GDP的時間序序列,必必須考慮慮“文革革”因素素對國民民經(jīng)濟的的破壞性性影響,,剔除不不可比的的“文革革”因素素。3.檢驗不同同屬性類類型對因因變量的的作用例如工資資模型中中的文化化程度、、季節(jié)對對銷售額額的影響響。4.提高模型型的精度度11四、虛擬擬變量模模型在計量經(jīng)經(jīng)濟模型型中,把把包含有有虛擬變變量的模模型稱為為虛擬變量量模型。常用的有有三種類類型:(1)解解釋變量量中只包包含虛擬擬變量;;(2)解解釋變量量中既含含有定量量變量,,又含有有虛擬變變量;(3)被被解釋變變量本身身為虛擬擬變量。。12一、加法法類型(截距變動動模型)第二節(jié)虛虛擬解解釋變量量的回歸歸1、解釋變變量中只只有虛擬擬變量如:調(diào)查查某地區(qū)區(qū)性別與與收入之之間的關(guān)關(guān)系,可可以用模模型表示示如下::Yi=α+βDi+uiYi代表收入入,Di為虛擬變變量:13代表女性性收入代表男性性與女性性收入之之間的差差額14如研究消消費水平平與居民民收入的的關(guān)系時時,還要要考慮城城鄉(xiāng)居民民消費水水平的差差異,消消費函數(shù)數(shù)可設(shè)為為:Yi=α0+α1Di+βXi+uiYi為消費水水平,Xi為居民收收入,Di為虛擬變變量。2、解釋變變量中既既有定量量變量又又有虛擬擬變量15表示農(nóng)村村居民的的消費水水平表示城市市居民的的消費水水平假設(shè)α1>0,可可得到下下圖:16XiYiα0α0+α1單變量變變截距模模型17對模型Yi=α0+α1Di+βXi+ui使用OLS法,,可得::對α1進行t檢驗,若若α1≠0,則說明明城市居居民與農(nóng)農(nóng)村居民民的消費費水平有有明顯差差異。18假如還要要考慮男男女消費費水平的的差異,,消費函函數(shù)為::Yi=α0+α1D1i+α2D2i+βXi+uiYi為消費水水平,Xi為家庭收收入,D1i和D2i為虛擬變變量。19表示城市市男性的的消費水水平表示城市市女性的的消費水水平表示農(nóng)村村男性的的消費水水平表示農(nóng)村村女性的的消費水水平20XiYiα0雙變量變變截距模模型α1α2α221虛擬變量量陷阱如某些商商品的銷銷售量有有季節(jié)性性,假設(shè)設(shè)銷售函函數(shù)為::=1(第一季)=0(其他季)=1(第二季)=0(其他季)=1(第三季)=0(其他季)=1(第四季)=0(其他季)如果引入入4個虛虛擬變量量會出現(xiàn)現(xiàn)什么問問題呢??22可視為截截距項的的解釋變變量,即即α0=α0×1所以引入入4個虛虛擬變量量出現(xiàn)了了完全多多重共線線性的問問題!OLS法不不能使用用!這就是虛擬變量量陷阱問題!23克服虛擬變量量陷阱的方法改為引入入虛擬變變量:24引入虛擬擬變量的的規(guī)則補補充說明明對于具有有m個屬性的的虛擬變變量:若模型中中含有截截距項,,引入m-1個虛擬變變量;若模型中中不含有有截距項項,引入入m個虛擬變變量。25二、乘法類型(斜率變動動模型)以乘法形形式引入入虛擬變變量,是是在所設(shè)設(shè)定的模模型中,,將虛擬擬解釋變變量與其其他解釋釋變量相相乘作為為新的解解釋變量量,以達達到調(diào)整整斜率系系數(shù)的目目的。主主要作用用在于::(1)比較兩個個回歸模模型;(2)分析因素素間的交交互影響響;(3)提高模型型的描述述精度。。261、回歸模模型的比比較例如,研研究改革革開放前前后儲蓄蓄、收入入的總量量關(guān)系,,分別設(shè)設(shè)定模型型如下::(1)改革開開放前(2)改革開開放后其中Yt為儲蓄總總額,Xt為收入總總額。27分別在各各自的時時間區(qū)間間內(nèi)作回回歸,可可能有如如下四種種結(jié)果::表明兩個個回歸模模型是相相同的,,稱為重合回歸歸;表明僅在在截距上上存在差差異,稱稱為平行回歸歸;表明截距距相同而而變化速速率不同同,稱為為共點回歸歸;表明兩個個回歸模模型完全全不同。。28XiYi重合回歸歸129XiYi平行回歸歸1130XiYi共點回歸歸1131XiYi不同的回回歸1132問題:當我們們分別運運用樣本本數(shù)據(jù)對對兩個模模型進行行回歸后后,如何何界定所所得結(jié)果果在統(tǒng)計計意義上上屬于那那種類型型呢?可采用乘乘法形式式引入虛虛擬變量量,可設(shè)設(shè)定為::其中上式等價價于模型型:(1)改革開開放前(2)改革開開放后33(1)改革開放放前(2)改革開放放后分別是等等價模型型的截距距和斜率率差異,,分別稱為截距差異異系數(shù)和斜率差異異系數(shù)。顯然,用用1950-2004年數(shù)據(jù)估估計(**)式,,比分別別用1950-1977年和1978-2004年的數(shù)據(jù)據(jù)估計(1)和(2)式更好。。估計結(jié)果果為:(0.3319)(0.4704)(0.0163)(0.0332)t=(-5.2733)(3.1545)(9.2270)(-3.1144)結(jié)果表明明,截距距和斜率率差異系系數(shù)在統(tǒng)統(tǒng)計意義義下均是顯著著的,說說明改革革開放前前后不同同。34從上面可可以看出出,以乘乘法形式式引入虛虛擬變量量做回歸歸模型的的比較的的優(yōu)點::(1)用用一個回回歸代替替多個回回歸,簡簡化過程程;(2)可可以對模模型結(jié)構(gòu)構(gòu)差異做做假設(shè)檢檢驗;(3)合合并的模模型增加加了自由由度,提提高了參參數(shù)估計的精精確性。。當然,也也應(yīng)注意意合并后后模型的的隨機擾擾動項應(yīng)應(yīng)服從基基本假定,,特別是是所比較較的方程程的方差差應(yīng)相同同,否則則會出現(xiàn)異異方差。。35在多元線線性回歸歸模型中中,通過過F檢驗驗,可以以判斷各各解釋變變量聯(lián)合合對被解解釋變量量是否有有顯著影影響。那那么在包包含兩個個定性變變量的虛虛擬變量量模型中中,兩個個定性變變量對被被解釋變變量的影影響也可可能存在在一定的的交互作作用,如如何描述述呢?例如,研研究農(nóng)副副產(chǎn)品生生產(chǎn)總收收益與農(nóng)農(nóng)副產(chǎn)品品生產(chǎn)投投入的關(guān)關(guān)系時,,設(shè)定模模型為2、交互效效應(yīng)分析析36虛擬變量量以加法法形式引引入暗含含著假設(shè)設(shè):油菜菜籽生產(chǎn)產(chǎn)和養(yǎng)蜂蜂生產(chǎn)是是分別獨獨立地影影響著農(nóng)農(nóng)副產(chǎn)品品總收益益。但實實際是在在發(fā)展油油菜籽生生產(chǎn)的同同時發(fā)展展養(yǎng)蜂生生產(chǎn),所所取得的的農(nóng)副產(chǎn)產(chǎn)品總收收益會高高于不發(fā)發(fā)展養(yǎng)蜂蜂生產(chǎn)的的情況。。即它們們之間存存在交互互作用。。其中Yi農(nóng)副產(chǎn)品品生產(chǎn)總總收益,,Xi為農(nóng)副產(chǎn)產(chǎn)品生產(chǎn)產(chǎn)總投入,而37為了描述述交互作作用對被被解釋變變量的影影響,在在模型中中引入虛虛擬變量量的乘積積,即稱為交互互效應(yīng)系系數(shù)。其中交互效應(yīng)應(yīng)是否存存在,可可借助于于交互效效應(yīng)系數(shù)數(shù)的顯著性檢檢驗加以以判斷。。38在經(jīng)濟關(guān)關(guān)系中常常有這樣樣的情況況:當解釋變變量X的值達到到某一水水平X*之前,與與被解釋釋變量Y之間存在在某種線線性關(guān)系系;當解解釋變量量X的值達到到或超過過X*之后,與與被解釋釋變量Y的關(guān)系就就會發(fā)生生變化。。此時,,如果已已知X的轉(zhuǎn)折點點X*,就可以以用虛擬擬變量來來估計每每一段的的斜率。。這就是是分段線性性回歸。3、分段線線性回歸歸39例如:1979年以前,,我國居居民的消消費支出出呈緩慢慢上升的的趨勢。。從1979年開始,,居民消消費支出出為快速速上升趨趨勢。顯然,1979年是一一個轉(zhuǎn)折折點,即即:X*=1979所以,可可用模型型描述我我國居民民在1955年至2009年消費支支出的變變動趨勢勢:40Yt=β0+β1t+β2(t-X*)Dt+ut其中Yt為消費支支出;t為年份(t=1955,,1956,……,2009);上面模型型等價于于:(1)1979年以前::Yt=β0+β1t+ut(2)1979年以后::Yt=β0-β2X*+(β1+β2)t+ut41t(年份))E(Yi)分段回歸歸模型1955x*(1979)E(Yt)=β0+β1tE(Yt)=β0-β2X*+(β1+β2)t42只要檢驗驗β2的統(tǒng)計顯顯著性,,就可以以判斷在在所設(shè)定定的臨界界水平X*處是否存存在“突突變”。??梢酝茝V廣到k段回歸的的情況,,只需用用k-1個虛擬變變量即可可。43第三節(jié)虛虛擬被被解釋變變量在計量經(jīng)經(jīng)濟模型型中,虛虛擬變量量還可以以作為被被解釋變變量,其其作用是是對某一一經(jīng)濟現(xiàn)現(xiàn)象或經(jīng)經(jīng)濟活動動作“是”與“否”的判斷斷與決策策。在計計量經(jīng)濟濟學(xué)中稱稱為“二元響應(yīng)應(yīng)”現(xiàn)象。。處理二二元型響響應(yīng)的模模型常用用有線性概率率模型和非線性概概率模型型。44一、線性性概率模模型1、什么是是線性概概率模型型例如,假假設(shè)住戶戶是否購購買商品品房主要要取決于于其收入水水平。考考慮下列列模型:其中Xi為住戶收收入,Yi為虛擬變變量,表表示住戶購買商商品房的的情況::(1)45則Yi是取值0或1的的隨機變變量,由由(1))式得::從而假設(shè)則P(Yi=1︱Xi)=pi,則P(Yi=0︱Xi)=1-pi于是這表明購購買商品品房的概概率是收收入的線線性函數(shù)數(shù),故模型((1)稱稱為線性概率率模型(LPM)。由于0≤pi≤1,所以((1)式式必須滿滿足約束束條件462、線性概概率模型型的估計計線性概率率模型雖雖然在形形式上與與普通線線性回歸歸模型很相相似,但但由于Yi是虛擬變變量,會會出現(xiàn)與普通回回歸模型型不同的的新問題題,不能能直接運運用OLS對其進進行估計計:(1)隨機擾擾動項不不服從正正態(tài)分布布;(2)隨機擾擾動項具具有異方方差性;;(3)條件0≤E(Yi︱Xi)≤1不一一定成立立。47因為OLS估計計的無偏偏性、有有效性與與擾動項項的分布布無關(guān),,所以第第一個問問題對參參數(shù)的估估計不會會產(chǎn)生影影響。但但進行參參數(shù)檢驗驗和區(qū)間間估計時時,要求求服從正正態(tài)分布布,根據(jù)據(jù)中心極極限定理理,二項項分布趨趨近于正正態(tài)分布布,所以以在大樣樣本情況況下,仍仍然可以以進行統(tǒng)統(tǒng)計推斷斷,即直直接運用用OLS對LPM模型型進行估估計,隨隨機擾動動項的非非正態(tài)性性對參數(shù)數(shù)的估計計不會產(chǎn)產(chǎn)生太大大的影響響。對于異方方差性的的問題,,可利用用第五章章的方法法解決::1、加加權(quán)最小小二乘法法;2、、模型的的對數(shù)變變換。48對于第三三個問題題,有兩兩種處理理辦法::一是當時,認為為當時,認為為二是選擇擇其他能能夠滿足足約束0≤E(Yi︱Xi)≤1的非線性性模型。。49二、非線線性概率率模型雖然可以以通過增增大樣本本容量忽忽略非正正態(tài)性問問題,運運用WLS解決決異方差差問題,,采取約約束使事事件Y發(fā)發(fā)生的概概率落入入0-1之間,,但LPM模型型往往與與實際經(jīng)經(jīng)濟意義義不相符符。例如,在在住戶購購買商品品房的例例子中::設(shè)當Xi有增量△Xi時,pi有增量△pi,于是從而50上式表明明Xi每增加一一個單位位,購買買住房的的概率恒恒等地增增加β2,這就是是說,無無論住戶戶的收入入水平是是1萬元元,還是是10萬萬元,購購買住房房的概率率都以相相同的增增量增加加。這與與現(xiàn)實情情況不符符,顯然然低收入入購買住住房的概概率增大大。因此此有必要要選擇表表現(xiàn)概率率平均變變化比較較理想的的模型。。主要有兩兩種:Logit模型型和Probit模型型。這里只介介紹Logit模型511、Logit模型Logit模型型也成Logistic模型型或單位對數(shù)數(shù)模型,由Verhulst于1945年年提出,,最早被被用來描描述生物物的生長長規(guī)律((邏輯成成長率)),現(xiàn)已已廣泛用用來描述述耐用消消費品的的銷售規(guī)規(guī)律。選擇如下下的Logistic分布布函數(shù)去設(shè)定二二元響應(yīng)應(yīng)計量經(jīng)經(jīng)濟模型型:52它的圖像像是一條條S型曲曲線,有有下列特特征:(1)概概率0≤pi=E(Yi︱Xi)≤1,解決了條條件概率率有可能能大于1或小于0的問題;;(2)當當Xi→+∞時,pi→1,當Xi→-∞時,pi→0,pi隨Xi變化而變變化,且且變化速速率不是是常數(shù),,更加符符合實際際情況;;Xipi01531、Logit模型的估估計由于pi不僅對Xi是非線性性關(guān)系,,而且對對β1和β2也是非線性關(guān)系系,不能能直接用用OLS估計參參數(shù),必必須設(shè)法法轉(zhuǎn)化為線性形形式。由由于所以比率稱為機會比率率或機會差異異化,而稱為對數(shù)單位位。54從計量經(jīng)經(jīng)濟的角角度引入入隨機擾擾動項,,記為::如何得到到β1和β2的估計量量呢?對對上式直直接估計計會遇到如下下困難::(1)當pi=0或1時,都無意義義;(2)Li的數(shù)據(jù)無無法觀測測;(3)隨機擾擾動項ui的為異方方差,可可以證明明:~這里的Ni是對應(yīng)于于Xi的樣本數(shù)數(shù)。55解決第一一個困難難可采用用極大似似然法(ML)估計參數(shù)數(shù),當樣樣本容量量較大時時,可采采用加權(quán)權(quán)最小二二乘法估估計;解決第二二個困難難是對應(yīng)應(yīng)于每個個Xi,樣本觀觀測值個個數(shù)Ni較大時,,利用匯匯總數(shù)據(jù)據(jù),用相相對頻率率作為對對pi的估計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論