虛擬變量案例_第1頁
虛擬變量案例_第2頁
虛擬變量案例_第3頁
虛擬變量案例_第4頁
虛擬變量案例_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、虛假變量(dummyvariable)在實質(zhì)建模過程中,被講解變量不僅受定量變量影響,同時還受定性變量影響。比方需要考慮性別、民族、不相同歷史時期、季節(jié)差異、企業(yè)所有制性質(zhì)不相同樣因素的影響。這些因素也應該包括在模型中。由于定性變量平常表示的是某種特色的有和無,所以量化方法可采用取值為1或0。這種變量稱作虛假變量,用D表示。虛假變量應用于模型中,對其回歸系數(shù)的估計與檢驗方法與定量變量相同。1截距搬動設有模型,yt=0+1xt+2D+ut,其中yt,xt為定量變量;D為定性變量。當D=0或1時,上述模型可表達為,0+1xt+ut,(D=0)yt=(0+2)+1xt+ut,(D=1)60YD=1D

2、=040200+20X00204060圖8.1測量截距不相同D=1或0表示某種特色的有無。反響在數(shù)學上是截距不相同的兩個函數(shù)。若2顯然不為零,說明截距不相同;若2為零,說明這種分類無顯然性差異。例:中國成年人體重y(kg)與身高x(cm)的回歸關系以下:105+xD=1(男)y=-100+x-5D=100+xD=0(女)注意:若定性變量含有m個種類,應引入m-1個虛假變量,否則會以致多重共線性,稱作虛假變量騙局(dummyvariabletrap)。關于定性變量中的哪個種類取0,哪個種類取1,是任意的,不影響檢驗結(jié)果。定性變量中取值為0所對應的種類稱作基礎種類(basecategory)。關于

3、多于兩個類其他定性變量可采用設一個虛假變量而對不相同種類采用賦值不相同的方法辦理。如:1(大學)D=0(中學)-1(小學)。1【案例1】中國季節(jié)GDP數(shù)據(jù)的擬合(虛假變量應用,及case1-solve)2.83.0GDP2.42.52.02.01.61.51.2GDPT1.096:196:397:197:398:198:399:199:300:100:30510152025GDP序列圖不用虛假變量的狀況若不采用虛假變量,得回概括果以下,GDP=1.5427+0.0405T(11.0)(3.5)R2=0.3991,DW=2.6,s.e.=0.3定義1(1季度)1(2季度)1(3季度)D1=D2=

4、D3=0(2,3,4季度)0(1,3,4季度)0(1,2,4季度)第4季度為基礎種類。GDP=2.0922+0.0315T0.8013D10.5137D20.5014D3(64.2)(15.9)(-24.9)(-16.1)(-15.8)R2=0.9863,DW=1.96,s.e.=0.052附數(shù)據(jù)以下:年GDPtD1D2D31996:11.315611001996:21.660020101996:31.591930011996:42.2209640001997:11.4685651001997:21.8494860101997:31.797270011997:42.362080001998:1

5、1.5899491001998:21.88316100101998:31.97044110011998:42.51176120001999:11.6784131001999:21.9405140101999:32.0611150011999:42.5254160002000:11.8173171002000:22.1318180102000:32.2633190012000:42.728020000數(shù)據(jù)本源:中國統(tǒng)計年鑒1998-20012斜率變化以上只考慮定性變量影響截距,未考慮影響斜率,即回歸系數(shù)的變化。當需要考慮時,可建立以下模型:yt=0+1xt+2D+3xtD+ut,其中xt為定量變

6、量;D為定性變量。當D=0或1時,上述模型可表達為,(0+2)+(1+3)xt+ut,(D=1)y=t0+1xt+ut,(D=0)經(jīng)過檢驗3可否為零,可判斷模型斜率可否發(fā)生變化。10070YY806050604040302020100X0T02040600204060圖8.5狀況1(不相同種類數(shù)據(jù)的截距和斜率不相同)圖8.6狀況2(不相同種類數(shù)據(jù)的截距和斜率不相同)例2:用虛假變量差異不相同歷史時期(file:case2及case2-solve)中國進出口貿(mào)易總數(shù)數(shù)據(jù)(1950-1984)見上表。試檢驗改革前后該時間序列的斜率是否發(fā)生變化。定義虛假變量D以下0(1950-1977)D=1(19

7、78-1984)3中國進出口貿(mào)易總數(shù)數(shù)據(jù)(1950-1984)(單位:百億元人民幣)年tradeTDT*D年tradeTDT*D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.904260019581.28790019762.641270019591.49310

8、0019772.725280019601.284110019783.5502912919610.908120019794.5463013019620.809130019805.6383113119630.857140019817.3533213219640.975150019827.7133313319651.184160019838.6013413419661.2711700198412.0103513519671.1221800以時間T=time為講解變量,進出口貿(mào)易總數(shù)用trade表示,估計結(jié)果以下:trade=0.37+0.066time-33.96D+1.20timeD(1.86)(

9、5.53)(-10.98)(12.42)0.37+0.066time(D=0,1950-1977)=(D=1,1978-1984)-33.59+1.27time上式說明,改革前后無論截距和斜率都發(fā)生了變化。進出口貿(mào)易總數(shù)的年平均增加量擴大了倍?!景咐?】香港季節(jié)GDP數(shù)據(jù)(單位:千億港元)的擬合(file:case3及case3-solve)4.04.0GDPGDP1.6952+0.0377*T3.53.53.03.02.52.52.02.01.51.51.01.09091929394959697989900010290919293949596979899000102419901997年香港季

10、度GDP呈線性增加。1997年由于受到東南亞金融危機的影響,經(jīng)濟發(fā)展處于阻滯狀態(tài),19982002年終GDP總量幾乎沒有增加(見上圖)。對這樣一種先增長后阻滯,且含有季節(jié)性周期變化的過程簡單地用一條直線去擬合顯然是不合適的。為差異不相同季節(jié),和不相同時期,定義季節(jié)虛假變量D2、D3、D4和差異不相同時期的虛假變量DT以下(數(shù)據(jù)見附錄):D2=1(第2季度)0(其他季度)D3=1(第3季度)0(其他季度)D4=1(第4季度)0(其他季度)DT=1(1998:12002:4)0(1990:11997:4)得估計結(jié)果以下:GDPt=1.1573+0.0668t+0.0775D2+0.2098D3+0

11、.2349D4+1.8338DT-0.0654DTt(50.8)(64.6)(3.7)(9.9)(11.0)(19.9)(-28.0)R2=0.99,DW=0.9,s.e.=0.05,F=1198.4,T=52,t0.05(52-7)=2.01關于1990:11997:4GDPt=1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4關于1998:12002:4GDPt=2.9911+0.0014t+0.0775D2+0.2098D3+0.2349D45若是不采用虛假變量擬合收效將很差:GDPt=1.6952+0.0377t(20.6)(13.9)R2=0.80,D

12、W=0.3,T=52,t0.05(52-2)=2.01【案例4】天津市糧食市場小麥批發(fā)價與面粉零售價的關系研究(file:xiezhiyong)第一看天津市糧食市場小麥批發(fā)價格的變化狀況(圖1)。1995年初,天津市糧食市場的小麥批發(fā)價格第一松開。在經(jīng)歷5個月的上揚此后,進入平穩(wěn)顛簸期。從1996年8月份開始小麥批發(fā)價格一路走低。至2002年12月份,小麥批發(fā)價格降至是1160元/噸。其次看面粉零售價的變化狀況。由于面粉零售價格直接關系到居民的平常生活,所以開始時沒有與小麥批發(fā)價格一起松開。當小麥批發(fā)價格一路看漲時,1995年1月至1996年6月面粉零售價格素來處于2.14元/千克的水平上。1

13、996年7月起,面粉零售價格也開始在市場上松開。受小麥批發(fā)價格上漲的影響,一個月內(nèi)面粉零售價格從2.14元/千克漲到2.74元/千克。在這個價位上堅持了11個月此后,面粉零售價格開始下降。與小麥批發(fā)價格的下降相一致,在經(jīng)歷了5年零7個月的變化此后,面粉零售價格又恢復到湊近開放前2.14元/千克的水平上(2.17元)。散點圖如圖2。準時間解析這些察看點的變化狀況(見圖3,逆時針方向運動)。見圖4,直接擬合這些數(shù)據(jù)收效將很差(R2=0.027,r=0.17)。20002.8retailpricewholesale1800retailprice16002.62.814002.612002.42.41

14、0002.22.22.02.0wholesale9596979899000102100012001400160018002000圖1圖22.82.8retailpriceretailprice2.62.62.42.42.22.22.0wholesale2.0wholesale100012001400160018002000100012001400160018002000圖3圖4利用虛假變量技術(shù),在模型中加入虛假變量。定義D=0,(1995:11996:6,面粉零售價格松開從前),D=1,(1996:72002:12,面粉零售價格松開此后)。取對數(shù)關系建立模型。6Lnsale的系數(shù)沒有顯然性(關于面粉零售價格松開從前的散點來說回歸直線是一條水平線)。剔出Lnsale變量,得估計結(jié)果PRICE=2.140+1.1215LnsaleD7.7458D(131.5)(23.9)(-23.0)R2=0.9054,PRICE=2.140,D=0PRICE=5.6058+1.1215Lnsale,D=1一條回歸直線的斜率為零,一條回歸直線的斜率為1.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論