第四節(jié)虛擬變量_第1頁
第四節(jié)虛擬變量_第2頁
第四節(jié)虛擬變量_第3頁
第四節(jié)虛擬變量_第4頁
第四節(jié)虛擬變量_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四節(jié)虛擬變量模型,1,虛擬變量的基本含義,4,虛擬變量,2,虛擬變量的引入,3,虛擬變量的設(shè)置原理,1,虛擬變量的基本含義,許多經(jīng)濟(jì)變量可以定量測量,例如商品需求,價格,收益,產(chǎn)量等,但是職業(yè),性別對收入的影響需要“量化”這些因素的影響,以反映在模型中并提高模型的精度,這些“量化”通常通過引入“虛擬變量”來實現(xiàn)。根據(jù)這些元素的屬性類型,配置僅使用 0 或 1 的手動變量。通常稱為虛擬變量(dummyvariables),以d形式記錄。例如,反映文本級別的虛擬變量如下:1、學(xué)士學(xué)位D=0,非學(xué)士學(xué)位,一般設(shè)置虛擬變量:基本類型,正類型值1;比較類型,否定類型值0。首先,虛擬變量及其職責(zé),1,定

2、義:反映質(zhì)量指標(biāo)更改,僅獲取數(shù)字0和1的人工變量。由符號d表示。如:城鎮(zhèn)居民農(nóng)村居民,銷售旺季銷售淡季,政策緊縮政策放寬,學(xué)士以上學(xué)歷以下,變量劃分應(yīng)遵循宮務(wù)和互斥的原則。2,作用:可以說明和測量定性因素的影響。這是計量經(jīng)濟(jì)學(xué)研究的重點。能正確反映經(jīng)濟(jì)變量之間的相互關(guān)系,提高模型的準(zhǔn)確性。在經(jīng)濟(jì)意義上,可以更好地說明現(xiàn)實的經(jīng)濟(jì)現(xiàn)象。很容易處理異常數(shù)據(jù)。如果范例資料包含例外資料,則通常有三種處理方式:一種是在樣本容量較大的情況下直接刪除異常數(shù)據(jù)。二是以平均的方式修復(fù)異常數(shù)據(jù)。第三,設(shè)置虛擬變量(將異常數(shù)據(jù)指定為特殊定性因素):異常期間,第二,設(shè)置虛擬變量,1。虛擬變量引入方法。在計量經(jīng)濟(jì)模型中,

3、設(shè)置虛擬變量的方法有兩種:加法和乘法。(1)加法方法虛擬變量d與其他解析變量在模型中是加法關(guān)系。Yi=a bxi Di i自下而上式如下:Di=0時:Yi=a bxi i Di=1時:Yi=(a ) bxi i,上圖顯示通過加法引入虛擬變量,以反映定性因素對節(jié)前的影響。換句話說,調(diào)整切片以區(qū)分異常。(2)乘法方法,虛擬變量d和其他解析變量在模型中是乘法關(guān)系。Yi=a bxi XDi i其中XDi=Xi*Di,自下而上為:當(dāng)Di=0時:Yi=a bxi i Di=1時:Yi=a (b )xi i,在上圖中,虛擬變量作為乘法引入,以反映定性因素對斜率的影響,系數(shù)描述定性因素的影響程度。(3)一般方

4、法將加法和乘法一起引入虛擬變量,然后利用t檢驗判斷,與0有很大區(qū)別,從而確定虛擬變量的具體引入方法。示例7。教材P136表3-8顯示了1998年我國城市居民人均收入和彩電100戶所有的統(tǒng)計。在EViews軟件的命令窗口中,依次輸入以下命令:構(gòu)建create u8作業(yè)文件DATAYX yx輸入需求,收入數(shù)據(jù)SCATXY繪制了使用相關(guān)圖表的演示。從相關(guān)圖片可以看出,前三個樣本點(低收入家庭)和最后五個樣本點(中高收入家庭)的支出情況存在很大差異,因此,為了反映稱為“收入層”的特定因素的影響,設(shè)置了虛擬變量:設(shè)置了我國城市居民的彩色電視需求功能:Yi=a bxi Di XDi i加和DATAD1輸入

5、虛擬變量的值(前三個為0,其馀五個為1)(d是EViews軟件的保留字,因此虛擬變量的名稱為D1;此外,可以使用SMPL和GENR命令直接創(chuàng)建D1變量)genrxd=x * D1生成變量XDLSYCXD1XD估計要求函數(shù)的結(jié)果如下圖所示。中等和高收入家庭低收入家庭,我國城市居民彩色電視要求函數(shù)估計結(jié)果如下。相應(yīng)的t統(tǒng)計值、R2值、調(diào)整后的R2值、SE值、的t檢驗都很重要。我國城市居民的低收入家庭和中高收入家庭的彩色電視消費需求被截獲,斜率有很大差異,各需求函數(shù)顯示:低收入家庭:事實上,現(xiàn)階段我國城市居民高收入家庭的彩色電視普及率達(dá)到了100%,因此對彩色電視的消費需求處于更換階段。此示例說明了

6、三個問題:如何在模型中設(shè)置和引入虛擬變量;衡量定性因素(即收入水平)影響的方法;區(qū)分不同類型模型(即需求函數(shù))的方法。中等和高收入家庭:2 .虛擬變量設(shè)置原則,一個元素對于具有多個類型m個不同屬性的定性元素,必須設(shè)置m-1個虛擬變量以反映該元素的影響。例:公司職員設(shè)立的年薪與服務(wù)及學(xué)歷有關(guān)。學(xué)歷分為??埔韵?、本科、研究生等三種類型。要反映“學(xué)歷”這一定性因素的影響,年薪模型必須設(shè)置兩個虛擬變量,如下所示:1=a bxi 1d1i 2d2i I,本科其他,研究生其他,相同:Yi=a bxi i大學(xué)以下(D1=D2=0)Yi=(a 1) bxi i本科(D1),(2)引入了m個虛擬變量,其中多個元

7、素有兩種類型,m個定性元素,每個元素有兩種不同的屬性類型。例如,在研究居民住房消費功能時,考慮到城鄉(xiāng)差別和不同收入水平的影響,按如下方法計算消費函數(shù):I=a bxi1 d1i2 d2d 2 II其中y,x分別反映了居民住房消費支出和可支配收入,虛擬變量,這樣就能反映每個居民家庭的住房消費情況。農(nóng)村居民村民、高收入家庭低收入家庭、城市低收入家庭(D1=0,D2=0)、Yi=a bxi i城市高收入家庭(D1=0,D2=1)Yi=(a 2)此外,定性因素的變化通常表示屬性或特征的存在,因此,可以使用僅獲取值1,0的虛擬變量“量化”定性因素的變化。通常,“1”表示此類屬性或要素存在,“0”表示此類屬

8、性或要素不存在。1,使用季節(jié)變動調(diào)整季節(jié)或月份數(shù)據(jù)建模時,經(jīng)常存在季節(jié)變動。使用虛擬變量可以反映季節(jié)因素的影響。例如,在使用季度數(shù)據(jù)分析公司利潤y和銷售收入x之間的關(guān)系時,為了研究第四季度的季節(jié)影響,我們引入了三個虛擬變量(基于第一季度的類型設(shè)置):利潤函數(shù)3360 yi=a bxi 1 d1i 2 d2i 3d 3iI將系數(shù)a、1、2、3分別為1、2、3,第一季度i=1,2,3其他季度,2,模型結(jié)構(gòu)的穩(wěn)定性檢查,模型結(jié)構(gòu)的穩(wěn)定性檢查主要有兩個用途。一種是分析模型結(jié)構(gòu)對樣品變更的敏感度,例如多重共線性檢查。二是比較兩個或多個回歸模型之間的差異,即模型結(jié)構(gòu)是否發(fā)生了重大變化。范例1: yi=a1

9、 b1xi I范例2: yi=a2 b2xi I設(shè)定虛擬變數(shù):預(yù)估模型:yi=a1 b1xi (a2-a1) di (B2-B1) xdi其中XDi=,利用樣品2樣品1,t檢驗確定d,XD系數(shù)的顯著性,可以得到4個檢驗結(jié)果。(1)兩個系數(shù)均等于0,即a2=a1,b2=b1,這表明兩個回歸模型之間沒有明顯差異,稱為“匹配回歸”。(2)D的系數(shù)不等于0,XD的系數(shù)等于0。即a2a1,b2=b1。指示兩個回歸模型之間的差異僅以節(jié)表示。這稱為“平行回歸”。(3)D的系數(shù)等于0,XD的系數(shù)不等于0。即a2=a1、b2b1。兩個回歸模型的截距相同,但坡率存在稱為“收斂回歸”的顯著差異。(4)D,XD的系數(shù)

10、均不為零。即a2a1、b2b1。指示兩個回歸模型完全不同。這稱為“其他回歸”,其中(1)表示模型結(jié)構(gòu)穩(wěn)定,其他表示模型結(jié)構(gòu)不穩(wěn)定。3,逐步回歸,部分經(jīng)濟(jì)關(guān)系必須用分段回歸來說明。如果解釋變量x低于已知臨界水平x*,則y和x是一種線性相關(guān)性,而xx*是另一種相關(guān)關(guān)系。使用虛擬變量可以很好地解決段回歸問題。虛擬變量包括:段回歸模型設(shè)置為:Yi=a bxi (xi-x*)Di i其中x*是已知臨界水平。如果Yi=a bxi ixx*,xx*x0,則這兩個函數(shù)具有相同的斜度,但截斷點不同。男女工人的平均工資對教齡的變動率相同,但平均工資的差異為2。通過傳統(tǒng)的回歸檢查,可以檢查2的統(tǒng)計顯著性,確定企業(yè)男

11、女勞動者的平均工資水平是否存在很大差異。0,2,另一個示例:基于橫斷面數(shù)據(jù)考慮個人醫(yī)療支出對個人收入和教育水平的返回。教育水平可以設(shè)置為高中以下、高中、大學(xué)及以上、模式如下:在e (I)=0的初始假設(shè)下,您還可以在高中、高中、大學(xué)及更高的教育級別將個人健康支出的函數(shù):高中:高中:大學(xué)及更高的:家庭32,其幾何意義:將多個虛擬變量引入模型中,以研究各種“定性”因素的影響。在上述員工薪金實例中,表示學(xué)歷的虛擬變量D2: (x根齡,D1性別)、本科以上學(xué)歷以下、員工薪金的回歸模型可以設(shè)計為:女性員工本和以下學(xué)歷的平均薪金:女性員工本和以上學(xué)歷的平均薪金:因此,具有不同性別和不同學(xué)歷的員工的平均薪金為

12、:男員工本和以下學(xué)歷的平均工資:男員工對學(xué)士以上學(xué)歷的平均工資:2,乘法方法,加法方法引入虛擬變量,調(diào)查:截距不同,大部分斜率也有變化,傾斜,截距同時變化。斜率的變化可以通過引入虛擬變量作為乘法來測量。例如:根據(jù)消費理論,消費水平c主要取決于收入水平y(tǒng),但長期以來人們的消費傾向變化,尤其是自然災(zāi)害、戰(zhàn)爭等非正常年份的消費傾向變化。這種消費傾向的變化可以通過在收益的系數(shù)中引入虛擬變量來觀察。其中,虛擬變量d可通過乘以x引入模型中,用于審查消費傾向的變化。假設(shè)E (I)=0,上述模型表示的函數(shù)可以設(shè)置為普通年:以上年:設(shè)置,消費模型為:切削和斜率發(fā)生變化時,必須引入加法和乘法形式的虛擬變量。考察1

13、990年前后中國居民的總儲蓄-收入關(guān)系是否發(fā)生了變化。下表是中國從1979年到2001年以城鄉(xiāng)儲蓄存款馀額為代表的居民儲蓄和以GNP為代表的居民收入的數(shù)字。,y作為儲蓄,x作為收入,1990年前:yi=1 2xi 1ii=1,2 ,n 1190年后:yi=1 2xi 2ii=1,2 ,N2可能出現(xiàn)以下四種情況之一(1) 1=1和2=2,即兩種回歸相同,稱為重合回歸。(2) 11,但2=2,即兩個回歸的差異僅在其子句中稱為平行回歸。(3) 1=1,但22的兩個回歸的差值僅為其斜率,稱為收斂回歸。(4) 11和22,即兩種回歸完全不同,稱為另一種回歸??梢允褂肸ou結(jié)構(gòu)的穩(wěn)定性測試。這個問題也可以通過引入乘法形式的虛擬變量來解決。用于合并n1和N2觀測值,并估算以下回歸:Di是引入的虛擬變量:也就是說,可以分別表示1990年下半年和前期的儲蓄函數(shù)。如果統(tǒng)計檢查拒絕對4=0的假設(shè),則儲蓄函數(shù)在兩個期間的斜率不同。具體的回歸結(jié)果如下:通過3和4的t檢驗可以看出:參數(shù)與0不太

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論