![虛擬變量案例_第1頁(yè)](http://file4.renrendoc.com/view/3700b10358cee43172ec3b78a25b51fd/3700b10358cee43172ec3b78a25b51fd1.gif)
![虛擬變量案例_第2頁(yè)](http://file4.renrendoc.com/view/3700b10358cee43172ec3b78a25b51fd/3700b10358cee43172ec3b78a25b51fd2.gif)
![虛擬變量案例_第3頁(yè)](http://file4.renrendoc.com/view/3700b10358cee43172ec3b78a25b51fd/3700b10358cee43172ec3b78a25b51fd3.gif)
![虛擬變量案例_第4頁(yè)](http://file4.renrendoc.com/view/3700b10358cee43172ec3b78a25b51fd/3700b10358cee43172ec3b78a25b51fd4.gif)
![虛擬變量案例_第5頁(yè)](http://file4.renrendoc.com/view/3700b10358cee43172ec3b78a25b51fd/3700b10358cee43172ec3b78a25b51fd5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、虛假變量(dummyvariable)在實(shí)質(zhì)建模過(guò)程中,被講解變量不僅受定量變量影響,同時(shí)還受定性變量影響。比方需要考慮性別、民族、不相同歷史時(shí)期、季節(jié)差異、企業(yè)所有制性質(zhì)不相同樣因素的影響。這些因素也應(yīng)該包括在模型中。由于定性變量平常表示的是某種特色的有和無(wú),所以量化方法可采用取值為1或0。這種變量稱作虛假變量,用D表示。虛假變量應(yīng)用于模型中,對(duì)其回歸系數(shù)的估計(jì)與檢驗(yàn)方法與定量變量相同。1截距搬動(dòng)設(shè)有模型,yt=0+1xt+2D+ut,其中yt,xt為定量變量;D為定性變量。當(dāng)D=0或1時(shí),上述模型可表達(dá)為,0+1xt+ut,(D=0)yt=(0+2)+1xt+ut,(D=1)60YD=1D
2、=040200+20X00204060圖8.1測(cè)量截距不相同D=1或0表示某種特色的有無(wú)。反響在數(shù)學(xué)上是截距不相同的兩個(gè)函數(shù)。若2顯然不為零,說(shuō)明截距不相同;若2為零,說(shuō)明這種分類無(wú)顯然性差異。例:中國(guó)成年人體重y(kg)與身高x(cm)的回歸關(guān)系以下:105+xD=1(男)y=-100+x-5D=100+xD=0(女)注意:若定性變量含有m個(gè)種類,應(yīng)引入m-1個(gè)虛假變量,否則會(huì)以致多重共線性,稱作虛假變量騙局(dummyvariabletrap)。關(guān)于定性變量中的哪個(gè)種類取0,哪個(gè)種類取1,是任意的,不影響檢驗(yàn)結(jié)果。定性變量中取值為0所對(duì)應(yīng)的種類稱作基礎(chǔ)種類(basecategory)。關(guān)于
3、多于兩個(gè)類其他定性變量可采用設(shè)一個(gè)虛假變量而對(duì)不相同種類采用賦值不相同的方法辦理。如:1(大學(xué))D=0(中學(xué))-1(小學(xué))。1【案例1】中國(guó)季節(jié)GDP數(shù)據(jù)的擬合(虛假變量應(yīng)用,及case1-solve)2.83.0GDP2.42.52.02.01.61.51.2GDPT1.096:196:397:197:398:198:399:199:300:100:30510152025GDP序列圖不用虛假變量的狀況若不采用虛假變量,得回概括果以下,GDP=1.5427+0.0405T(11.0)(3.5)R2=0.3991,DW=2.6,s.e.=0.3定義1(1季度)1(2季度)1(3季度)D1=D2=
4、D3=0(2,3,4季度)0(1,3,4季度)0(1,2,4季度)第4季度為基礎(chǔ)種類。GDP=2.0922+0.0315T0.8013D10.5137D20.5014D3(64.2)(15.9)(-24.9)(-16.1)(-15.8)R2=0.9863,DW=1.96,s.e.=0.052附數(shù)據(jù)以下:年GDPtD1D2D31996:11.315611001996:21.660020101996:31.591930011996:42.2209640001997:11.4685651001997:21.8494860101997:31.797270011997:42.362080001998:1
5、1.5899491001998:21.88316100101998:31.97044110011998:42.51176120001999:11.6784131001999:21.9405140101999:32.0611150011999:42.5254160002000:11.8173171002000:22.1318180102000:32.2633190012000:42.728020000數(shù)據(jù)本源:中國(guó)統(tǒng)計(jì)年鑒1998-20012斜率變化以上只考慮定性變量影響截距,未考慮影響斜率,即回歸系數(shù)的變化。當(dāng)需要考慮時(shí),可建立以下模型:yt=0+1xt+2D+3xtD+ut,其中xt為定量變
6、量;D為定性變量。當(dāng)D=0或1時(shí),上述模型可表達(dá)為,(0+2)+(1+3)xt+ut,(D=1)y=t0+1xt+ut,(D=0)經(jīng)過(guò)檢驗(yàn)3可否為零,可判斷模型斜率可否發(fā)生變化。10070YY806050604040302020100X0T02040600204060圖8.5狀況1(不相同種類數(shù)據(jù)的截距和斜率不相同)圖8.6狀況2(不相同種類數(shù)據(jù)的截距和斜率不相同)例2:用虛假變量差異不相同歷史時(shí)期(file:case2及case2-solve)中國(guó)進(jìn)出口貿(mào)易總數(shù)數(shù)據(jù)(1950-1984)見(jiàn)上表。試檢驗(yàn)改革前后該時(shí)間序列的斜率是否發(fā)生變化。定義虛假變量D以下0(1950-1977)D=1(19
7、78-1984)3中國(guó)進(jìn)出口貿(mào)易總數(shù)數(shù)據(jù)(1950-1984)(單位:百億元人民幣)年tradeTDT*D年tradeTDT*D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.904260019581.28790019762.641270019591.49310
8、0019772.725280019601.284110019783.5502912919610.908120019794.5463013019620.809130019805.6383113119630.857140019817.3533213219640.975150019827.7133313319651.184160019838.6013413419661.2711700198412.0103513519671.1221800以時(shí)間T=time為講解變量,進(jìn)出口貿(mào)易總數(shù)用trade表示,估計(jì)結(jié)果以下:trade=0.37+0.066time-33.96D+1.20timeD(1.86)(
9、5.53)(-10.98)(12.42)0.37+0.066time(D=0,1950-1977)=(D=1,1978-1984)-33.59+1.27time上式說(shuō)明,改革前后無(wú)論截距和斜率都發(fā)生了變化。進(jìn)出口貿(mào)易總數(shù)的年平均增加量擴(kuò)大了倍?!景咐?】香港季節(jié)GDP數(shù)據(jù)(單位:千億港元)的擬合(file:case3及case3-solve)4.04.0GDPGDP1.6952+0.0377*T3.53.53.03.02.52.52.02.01.51.51.01.09091929394959697989900010290919293949596979899000102419901997年香港季
10、度GDP呈線性增加。1997年由于受到東南亞金融危機(jī)的影響,經(jīng)濟(jì)發(fā)展處于阻滯狀態(tài),19982002年終GDP總量幾乎沒(méi)有增加(見(jiàn)上圖)。對(duì)這樣一種先增長(zhǎng)后阻滯,且含有季節(jié)性周期變化的過(guò)程簡(jiǎn)單地用一條直線去擬合顯然是不合適的。為差異不相同季節(jié),和不相同時(shí)期,定義季節(jié)虛假變量D2、D3、D4和差異不相同時(shí)期的虛假變量DT以下(數(shù)據(jù)見(jiàn)附錄):D2=1(第2季度)0(其他季度)D3=1(第3季度)0(其他季度)D4=1(第4季度)0(其他季度)DT=1(1998:12002:4)0(1990:11997:4)得估計(jì)結(jié)果以下:GDPt=1.1573+0.0668t+0.0775D2+0.2098D3+0
11、.2349D4+1.8338DT-0.0654DTt(50.8)(64.6)(3.7)(9.9)(11.0)(19.9)(-28.0)R2=0.99,DW=0.9,s.e.=0.05,F=1198.4,T=52,t0.05(52-7)=2.01關(guān)于1990:11997:4GDPt=1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4關(guān)于1998:12002:4GDPt=2.9911+0.0014t+0.0775D2+0.2098D3+0.2349D45若是不采用虛假變量擬合收效將很差:GDPt=1.6952+0.0377t(20.6)(13.9)R2=0.80,D
12、W=0.3,T=52,t0.05(52-2)=2.01【案例4】天津市糧食市場(chǎng)小麥批發(fā)價(jià)與面粉零售價(jià)的關(guān)系研究(file:xiezhiyong)第一看天津市糧食市場(chǎng)小麥批發(fā)價(jià)格的變化狀況(圖1)。1995年初,天津市糧食市場(chǎng)的小麥批發(fā)價(jià)格第一松開(kāi)。在經(jīng)歷5個(gè)月的上揚(yáng)此后,進(jìn)入平穩(wěn)顛簸期。從1996年8月份開(kāi)始小麥批發(fā)價(jià)格一路走低。至2002年12月份,小麥批發(fā)價(jià)格降至是1160元/噸。其次看面粉零售價(jià)的變化狀況。由于面粉零售價(jià)格直接關(guān)系到居民的平常生活,所以開(kāi)始時(shí)沒(méi)有與小麥批發(fā)價(jià)格一起松開(kāi)。當(dāng)小麥批發(fā)價(jià)格一路看漲時(shí),1995年1月至1996年6月面粉零售價(jià)格素來(lái)處于2.14元/千克的水平上。1
13、996年7月起,面粉零售價(jià)格也開(kāi)始在市場(chǎng)上松開(kāi)。受小麥批發(fā)價(jià)格上漲的影響,一個(gè)月內(nèi)面粉零售價(jià)格從2.14元/千克漲到2.74元/千克。在這個(gè)價(jià)位上堅(jiān)持了11個(gè)月此后,面粉零售價(jià)格開(kāi)始下降。與小麥批發(fā)價(jià)格的下降相一致,在經(jīng)歷了5年零7個(gè)月的變化此后,面粉零售價(jià)格又恢復(fù)到湊近開(kāi)放前2.14元/千克的水平上(2.17元)。散點(diǎn)圖如圖2。準(zhǔn)時(shí)間解析這些察看點(diǎn)的變化狀況(見(jiàn)圖3,逆時(shí)針?lè)较蜻\(yùn)動(dòng))。見(jiàn)圖4,直接擬合這些數(shù)據(jù)收效將很差(R2=0.027,r=0.17)。20002.8retailpricewholesale1800retailprice16002.62.814002.612002.42.41
14、0002.22.22.02.0wholesale9596979899000102100012001400160018002000圖1圖22.82.8retailpriceretailprice2.62.62.42.42.22.22.0wholesale2.0wholesale100012001400160018002000100012001400160018002000圖3圖4利用虛假變量技術(shù),在模型中加入虛假變量。定義D=0,(1995:11996:6,面粉零售價(jià)格松開(kāi)從前),D=1,(1996:72002:12,面粉零售價(jià)格松開(kāi)此后)。取對(duì)數(shù)關(guān)系建立模型。6Lnsale的系數(shù)沒(méi)有顯然性(關(guān)于面粉零售價(jià)格松開(kāi)從前的散點(diǎn)來(lái)說(shuō)回歸直線是一條水平線)。剔出Lnsale變量,得估計(jì)結(jié)果PRICE=2.140+1.1215LnsaleD7.7458D(131.5)(23.9)(-23.0)R2=0.9054,PRICE=2.140,D=0PRICE=5.6058+1.1215Lnsale,D=1一條回歸直線的斜率為零,一條回歸直線的斜率為1.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國(guó)牙釉質(zhì)粘結(jié)劑行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年全球及中國(guó)塑料用群青紫行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球健康飲食膳食計(jì)劃應(yīng)用程序行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球大型掃描電子顯微鏡(SEM)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球螯合鋅鉀硼尿素行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)化學(xué)鍍化學(xué)品行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年全球及中國(guó)危險(xiǎn)區(qū)域軌道衡行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球磁性長(zhǎng)度和角度測(cè)量系統(tǒng)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球食用菌滅菌設(shè)備行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球軍用航空平視顯示器行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 電除顫并發(fā)癥的處理及預(yù)防
- 智慧體育場(chǎng)館建設(shè)方案
- 避暑旅游目的地評(píng)價(jià)指標(biāo)、閾值和評(píng)價(jià)等級(jí)表、人體舒適度、度假氣候指數(shù)和旅游氣候指數(shù)計(jì)算方法
- 允許一切發(fā)生:過(guò)不緊繃松弛的人生
- 注塑生產(chǎn)過(guò)程控制流程
- 教科版六年級(jí)科學(xué)下冊(cè) (廚房里的物質(zhì)與變化)教學(xué)課件
- 公務(wù)員面試應(yīng)急應(yīng)變題目大全及解析
- 浙江省炮制規(guī)范2015版電子版
- 冰心《童年的春節(jié)》
- 鄭州小吃詳細(xì)地點(diǎn)
- 上海高考英語(yǔ)詞匯手冊(cè)
評(píng)論
0/150
提交評(píng)論