版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型:多元線性回歸模型
多元線性回歸模型多元線性回歸模型的參數(shù)估計(jì)多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)多元線性回歸模型的預(yù)測(cè)回歸模型的其他形式回歸模型的參數(shù)約束§3.1多元線性回歸模型
一、多元線性回歸模型
二、多元線性回歸模型的基本假定
一、多元線性回歸模型
多元線性回歸模型:表現(xiàn)在線性回歸模型中的解釋變量有多個(gè)。
一般表現(xiàn)形式:i=1,2…,n其中:k為解釋變量的數(shù)目,j(j=1,2…,k)稱(chēng)為回歸參數(shù)(regressioncoefficient)。Yi=b0+b1X1i
+b2X2i
+...+bkXki
+mi
總體回歸模型n個(gè)隨機(jī)方程的矩陣表達(dá)式為:
其中
j也被稱(chēng)為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個(gè)單位時(shí),Y的均值E(Y)的變化;或者說(shuō)j給出了Xj的單位變化對(duì)Y均值的“直接”或“凈”(不含其他變量)影響。用來(lái)估計(jì)總體回歸模型的樣本回歸函數(shù)為:其隨機(jī)表示式:
ei稱(chēng)為殘差或剩余項(xiàng)(residuals),可看成是總體回歸函數(shù)中隨機(jī)擾動(dòng)項(xiàng)i的近似替代。
樣本回歸函數(shù)的矩陣表達(dá):
或其中:ikikiiieXXXY+++++=bbbb????22110LkikiiiXXXYbbbb?????22110++++=L二、多元線性回歸模型的基本假定
假設(shè)1,解釋變量是非隨機(jī)的或固定的,且各X之間互不相關(guān)(無(wú)多重共線性)。
假設(shè)2,隨機(jī)誤差項(xiàng)具有零均值、同方差及不序列相關(guān)性。
假設(shè)3,解釋變量與隨機(jī)項(xiàng)不相關(guān)假設(shè)4,隨機(jī)項(xiàng)滿足正態(tài)分布
§3.2多元線性回歸模型的估計(jì)
一、普通最小二乘估計(jì)*二、最大或然估計(jì)*三、矩估計(jì)四、參數(shù)估計(jì)量的性質(zhì)五、樣本容量問(wèn)題六、估計(jì)實(shí)例
說(shuō)明估計(jì)方法:3大類(lèi)方法:OLS、ML或者M(jìn)M在經(jīng)典模型中多應(yīng)用OLS在非經(jīng)典模型中多應(yīng)用ML或者M(jìn)M在本節(jié)中,ML與MM為選學(xué)內(nèi)容一、普通最小二乘估計(jì)對(duì)于隨機(jī)抽取的n組觀測(cè)值如果樣本函數(shù)的參數(shù)估計(jì)值已經(jīng)得到,則有:
i=1,2…n根據(jù)最小二乘原理,參數(shù)估計(jì)值應(yīng)該是右列方程組的解
其中于是得到關(guān)于待估參數(shù)估計(jì)值的正規(guī)方程組:
解該(k+1)個(gè)方程組成的線性代數(shù)方程組,即可得到(k+1)個(gè)待估參數(shù)的估計(jì)值$,,,,,bjj=012L。k□正規(guī)方程組的矩陣形式即由于X’X滿秩,故有
例3.2.1:在例2.1.1的家庭收入-消費(fèi)支出例中,
可求得
于是
?隨機(jī)誤差項(xiàng)的方差的無(wú)偏估計(jì)
可以證明,隨機(jī)誤差項(xiàng)的方差的無(wú)偏估計(jì)量為:
四、參數(shù)估計(jì)量的性質(zhì)在滿足基本假設(shè)的情況下,其結(jié)構(gòu)參數(shù)的普通最小二乘估計(jì)、最大或然估計(jì)及矩估計(jì)仍具有:
線性性、無(wú)偏性、有效性。同時(shí),隨著樣本容量增加,參數(shù)估計(jì)量具有:
漸近無(wú)偏性、漸近有效性、一致性。
五、樣本容量問(wèn)題
所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下限。
⒈最小樣本容量
樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項(xiàng)),即
n
≥
k+1
2、滿足基本要求的樣本容量
從統(tǒng)計(jì)檢驗(yàn)的角度:
n30時(shí),Z檢驗(yàn)才能應(yīng)用;
n-k≥8時(shí),t分布較為穩(wěn)定
一般經(jīng)驗(yàn)認(rèn)為:
當(dāng)n≥30或者至少n≥3(k+1)時(shí),才能說(shuō)滿足模型估計(jì)的基本要求。
模型的良好性質(zhì)只有在大樣本下才能得到理論上的證明
六、多元線性回歸模型的參數(shù)估計(jì)實(shí)例
例3.2.2在例2.5.1中,已建立了中國(guó)居民人均消費(fèi)一元線性模型。這里我們?cè)倏紤]建立多元線性模型。解釋變量:人均GDP:GDPP前期消費(fèi):CONSP(-1)估計(jì)區(qū)間:1979~2000年Eviews軟件估計(jì)結(jié)果
§3.3多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)
一、擬合優(yōu)度檢驗(yàn)二、方程的顯著性檢驗(yàn)(F檢驗(yàn))
三、變量的顯著性檢驗(yàn)(t檢驗(yàn))四、模型的序列相關(guān)性檢驗(yàn)(DW法)
一、擬合優(yōu)度檢驗(yàn)1、可決系數(shù)與調(diào)整的可決系數(shù)則總離差平方和的分解由于:
=0所以有:
注意:一個(gè)有趣的現(xiàn)象????-+++=ikiikiiieYXeXeebbb???110L
可決系數(shù)該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。
問(wèn)題:在應(yīng)用過(guò)程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,R2往往增大(Why?)這就給人一個(gè)錯(cuò)覺(jué):要使得模型擬合得好,只要增加解釋變量即可?!?/p>
但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無(wú)關(guān),R2需調(diào)整。
調(diào)整的可決系數(shù)(adjustedcoefficientofdetermination)
在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。
*2、赤池信息準(zhǔn)則和施瓦茨準(zhǔn)則
為了比較所含解釋變量個(gè)數(shù)不同的多元回歸模型的擬合優(yōu)度,常用的標(biāo)準(zhǔn)還有:
赤池信息準(zhǔn)則(Akaikeinformationcriterion,AIC)施瓦茨準(zhǔn)則(Schwarzcriterion,SC)
這兩準(zhǔn)則均要求僅當(dāng)所增加的解釋變量能夠減少AIC值或SC值時(shí)才在原模型中增加該解釋變量。
nnknSClnln+¢=eeei2Eviews的估計(jì)結(jié)果顯示:中國(guó)居民消費(fèi)二元例中:AIC=9.523SC=9.671中國(guó)居民消費(fèi)一元例中:AIC=9.929SC=10.028從這點(diǎn)看,可以說(shuō)前期人均居民消費(fèi)CONSP(-1)應(yīng)包括在模型中。
二、方程的顯著性檢驗(yàn)(F檢驗(yàn))
方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。
1、方程顯著性的F檢驗(yàn)
即檢驗(yàn)?zāi)P蚘i=0+1X1i+2X2i++kXki+ii=1,2,,n中的參數(shù)j是否顯著不為0。
可提出如下原假設(shè)與備擇假設(shè):H0:1=2==k=0(注意0是否為0無(wú)關(guān)緊要)H1:j(j=1,…,k)不全為0F檢驗(yàn)的思想來(lái)自于總離差平方和的分解式:
TSS=ESS+RSS
如果ESS/RSS較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。
因此,可通過(guò)該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。
根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量
服從自由度為(k,n-k-1)的F分布。
給定顯著性水平,可得到臨界值F(k,n-k-1)由樣本求出統(tǒng)計(jì)量F的數(shù)值,則當(dāng)F
F(k,n-k-1)時(shí)拒絕原假設(shè)H0,接受備擇假設(shè)H1,認(rèn)為原方程總體上線性關(guān)系顯著成立;當(dāng)F≤F(k,n-k-1)時(shí)接受原假設(shè)H0,認(rèn)為原方程總體上線性關(guān)系不顯著,故該方程不能成立。對(duì)于中國(guó)居民人均消費(fèi)支出的例子:一元模型:F=2859.54二元模型:F=2056.89給定顯著性水平=0.05,查分布表,得到臨界值:一元例:F(1,21)=4.32二元例:
F(2,19)=3.52(這里的第二自由度為何是19?)顯然有F
F(k,n-k-1),即二個(gè)模型的線性關(guān)系在95%的水平下顯著成立。
2、關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論
由可推出:與同理:F與R2同方向變化:當(dāng)R2=0時(shí),F(xiàn)=0;R2越大,F(xiàn)值也越大;當(dāng)R2=1時(shí),F(xiàn)為無(wú)窮大。檢驗(yàn)H0:b1=b2=...=bk等價(jià)于檢驗(yàn)R2=0問(wèn)題:可決系數(shù)和調(diào)整的可決系數(shù)都是不大于1的非負(fù)實(shí)數(shù)嗎?在中國(guó)居民人均收入—消費(fèi)一元模型中(n=23),在中國(guó)居民人均收入—消費(fèi)二元模型中,由此可知,可決系數(shù)R2值即使很小,也不能就此斷定X與Y之間就沒(méi)有線性相關(guān)性。三、變量的顯著性檢驗(yàn)(t檢驗(yàn))
方程的總體線性關(guān)系顯著每個(gè)解釋變量對(duì)被解釋變量的影響都是顯著的。因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。這一檢驗(yàn)是由對(duì)變量的t檢驗(yàn)完成的。
1、t統(tǒng)計(jì)量
由于以cii表示矩陣(X’X)-1
主對(duì)角線上的第i個(gè)元素,于是參數(shù)估計(jì)量的方差為:
其中2為隨機(jī)誤差項(xiàng)的方差,在實(shí)際計(jì)算時(shí),用它的估計(jì)量代替:
因此,可構(gòu)造如下t統(tǒng)計(jì)量
2、t檢驗(yàn)設(shè)計(jì)原假設(shè)與備擇假設(shè):
H1:i0
給定顯著性水平,可得到臨界值t/2(n-k-1),由樣本求出統(tǒng)計(jì)量t的數(shù)值,通過(guò)|t|
t/2(n-k-1)或|t|≤t/2(n-k-1)來(lái)拒絕或接受原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。
H0:i=0
(i=1,2…k)
注意:一元線性回歸中,t檢驗(yàn)與F檢驗(yàn)一致
一方面,t檢驗(yàn)與F檢驗(yàn)都是對(duì)相同的原假設(shè)H0:1=0進(jìn)行檢驗(yàn);
另一方面,兩個(gè)統(tǒng)計(jì)量之間有如下關(guān)系:
在中國(guó)居民人均收入-消費(fèi)支出二元模型例中,由應(yīng)用軟件計(jì)算出參數(shù)的t值:給定顯著性水平=0.05,查得相應(yīng)臨界值:t0.025(19)=2.093??梢?jiàn),計(jì)算的所有t值都大于該臨界值,所以拒絕原假設(shè)。即:包括常數(shù)項(xiàng)在內(nèi)的3個(gè)解釋變量都在95%的水平下顯著,都通過(guò)了變量顯著性檢驗(yàn)。如何才能縮小置信區(qū)間?
增大樣本容量n,因?yàn)樵谕瑯拥臉颖救萘肯?,n越大,t分布表中的臨界值越小,同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小;提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型優(yōu)度越高,殘差平方和應(yīng)越小。提高樣本觀測(cè)值的分散度,一般情況下,樣本觀測(cè)值越分散,(X'X)-1的分母的|X'X|的值越大,致使區(qū)間縮小。1、序列相關(guān)性概念
如果對(duì)于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)之間不再是不相關(guān)的,而是存在某種相關(guān)性,則認(rèn)為出現(xiàn)了序列相關(guān)性。
對(duì)于模型
Yt=0+1X1t+2X2t+…+kXkt+t
t=1,2,…,n隨機(jī)項(xiàng)互不相關(guān)的基本假設(shè)表現(xiàn)為
Cov(t
,t)=0
tj,t,j=1,2,…,n四、模型的序列相關(guān)性檢驗(yàn)——杜賓-瓦森(Durbin-Watson)檢驗(yàn)法
或在其他假設(shè)仍成立的條件下,序列相關(guān)即意味著0)(1jtEmm稱(chēng)為一階列相關(guān),或自相關(guān)(autocorrelation)其中:被稱(chēng)為自協(xié)方差系數(shù)(coefficientofautocovariance)或一階自相關(guān)系數(shù)(first-ordercoefficientofautocorrelation)
i是滿足以下標(biāo)準(zhǔn)的OLS假定的隨機(jī)干擾項(xiàng):如果僅存在
E(t
t+1)0
t=1,2,…,n自相關(guān)往往可寫(xiě)成如下形式:
t=t-1+t-1<<1
由于序列相關(guān)性經(jīng)常出現(xiàn)在以時(shí)間序列為樣本的模型中,因此,本節(jié)將用下標(biāo)t代表i。2、實(shí)際經(jīng)濟(jì)問(wèn)題中的序列相關(guān)性
大多數(shù)經(jīng)濟(jì)時(shí)間數(shù)據(jù)都有一個(gè)明顯的特點(diǎn):慣性,表現(xiàn)在時(shí)間序列不同時(shí)間的前后關(guān)聯(lián)上。由于消費(fèi)習(xí)慣的影響被包含在隨機(jī)誤差項(xiàng)中,則可能出現(xiàn)序列相關(guān)性(往往是正相關(guān))。例如,絕對(duì)收入假設(shè)下居民總消費(fèi)函數(shù)模型:Ct=0+1Yt+tt=1,2,…,n(1)、經(jīng)濟(jì)變量固有的慣性(2)、模型設(shè)定的偏誤
所謂模型設(shè)定偏誤(Specificationerror)是指所設(shè)定的模型“不正確”。主要表現(xiàn)在模型中丟掉了重要的解釋變量或模型函數(shù)形式有偏誤。
例如,本來(lái)應(yīng)該估計(jì)的模型為
Yt=0+1X1t+2X2t+3X3t+t但在模型設(shè)定中做了下述回歸:
Yt=0+1X1t+1X2t+vt因此,vt=3X3t+t,如果X3確實(shí)影響Y,則出現(xiàn)序列相關(guān)。
但建模時(shí)設(shè)立了如下模型:Yt=0+1Xt+vt因此,由于vt=2Xt2+t,,包含了產(chǎn)出的平方對(duì)隨機(jī)項(xiàng)的系統(tǒng)性影響,隨機(jī)項(xiàng)也呈現(xiàn)序列相關(guān)性。又如:如果真實(shí)的邊際成本回歸模型應(yīng)為:Yt=0+1Xt+2Xt2+t其中:Y=邊際成本,X=產(chǎn)出,(3)、數(shù)據(jù)的“編造”例如:季度數(shù)據(jù)來(lái)自月度數(shù)據(jù)的簡(jiǎn)單平均,這種平均的計(jì)算減弱了每月數(shù)據(jù)的波動(dòng)性,從而使隨機(jī)干擾項(xiàng)出現(xiàn)序列相關(guān)。還有就是兩個(gè)時(shí)間點(diǎn)之間的“內(nèi)插”技術(shù)往往導(dǎo)致隨機(jī)項(xiàng)的序列相關(guān)性。
在實(shí)際經(jīng)濟(jì)問(wèn)題中,有些數(shù)據(jù)是通過(guò)已知數(shù)據(jù)生成的。因此,新生成的數(shù)據(jù)與原數(shù)據(jù)間就有了內(nèi)在的聯(lián)系,表現(xiàn)出序列相關(guān)性。
計(jì)量經(jīng)濟(jì)學(xué)模型一旦出現(xiàn)序列相關(guān)性,如果仍采用OLS法估計(jì)模型參數(shù),會(huì)產(chǎn)生下列不良后果:3、序列相關(guān)性的后果(1)、參數(shù)估計(jì)量非有效因?yàn)?,在有效性證明中利用了E(NN’)=2I
即同方差性和互相獨(dú)立性條件。(2)、變量的顯著性檢驗(yàn)失去意義
在變量的顯著性檢驗(yàn)中,統(tǒng)計(jì)量是建立在參數(shù)方差正確估計(jì)基礎(chǔ)之上的,這只有當(dāng)隨機(jī)誤差項(xiàng)具有同方差性和互相獨(dú)立性時(shí)才能成立。其他檢驗(yàn)也是如此。(3)、模型的預(yù)測(cè)失效
區(qū)間預(yù)測(cè)與參數(shù)估計(jì)量的方差有關(guān),在方差有偏誤的情況下,使得預(yù)測(cè)估計(jì)不準(zhǔn)確,預(yù)測(cè)精度降低。所以,當(dāng)模型出現(xiàn)序列相關(guān)性時(shí),它的預(yù)測(cè)功能失效。D-W檢驗(yàn)是杜賓(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一種檢驗(yàn)序列自相關(guān)的方法,該方法的假定條件是:(1)解釋變量X非隨機(jī);(2)隨機(jī)誤差項(xiàng)t為一階自回歸形式:
t=t-1+t(3)回歸模型中不應(yīng)含有滯后應(yīng)變量作為解釋變量,即不應(yīng)出現(xiàn)下列形式:Yt=0+1X1t+kXkt+Yt-1+t(4)回歸含有截距項(xiàng)4、序列相關(guān)性檢驗(yàn)——DW檢驗(yàn)法
該統(tǒng)計(jì)量的分布與出現(xiàn)在給定樣本中的X值有復(fù)雜的關(guān)系,因此其精確的分布很難得到。但是,他們成功地導(dǎo)出了臨界值的下限dL和上限dU,且這些上下限只與樣本的容量n和解釋變量的個(gè)數(shù)k有關(guān),而與解釋變量X的取值無(wú)關(guān)。杜賓和瓦森針對(duì)原假設(shè):H0:=0,即不存在一階自回歸,構(gòu)造如下統(tǒng)計(jì)量:
D.W.統(tǒng)計(jì)量D.W檢驗(yàn)步驟:(1)計(jì)算DW值(2)給定,由n和k的大小查DW分布表,得臨界值dL和dU(3)比較、判斷若0<D.W.<dL存在正自相關(guān)dL<D.W.<dU不能確定dU<D.W.<4-dU無(wú)自相關(guān)4-dU<D.W.<4-dL不能確定4-dL<D.W.<4存在負(fù)自相關(guān)
0dLdU24-dU4-dL4正相關(guān)不能確定無(wú)自相關(guān)不能確定負(fù)相關(guān)當(dāng)D.W.值在2左右時(shí),模型不存在一階自相關(guān)。
證明:展開(kāi)D.W.統(tǒng)計(jì)量:
(*)如果存在完全一階正相關(guān),即=1,則D.W.0
完全一階負(fù)相關(guān),即=-1,則D.W.4
完全不相關(guān),即=0,則D.W.2這里,為一階自回歸模型
t=t-1+t的參數(shù)估計(jì)?!?.4多元線性回歸模型的預(yù)測(cè)
一、Y0的預(yù)測(cè)值二、Y0的置信區(qū)間對(duì)于模型
給定樣本以外的解釋變量的觀測(cè)值X0=(1,X10,X20,…,Xk0),可以得到被解釋變量的預(yù)測(cè)值:它是Y0的預(yù)測(cè)。但嚴(yán)格地說(shuō),這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。
為了進(jìn)行科學(xué)預(yù)測(cè),還需求出預(yù)測(cè)值的置信區(qū)間,即Y0的置信區(qū)間。
Y0的置信區(qū)間如果已經(jīng)知道實(shí)際的預(yù)測(cè)值Y0,那么預(yù)測(cè)誤差為:容易證明
e0服從正態(tài)分布,即
構(gòu)造t統(tǒng)計(jì)量
可得給定(1-)的置信水平下Y0的置信區(qū)間:
中國(guó)居民人均收入-消費(fèi)支出二元模型例中:2001年人均GDP:4033.1元,于是人均居民消費(fèi)的預(yù)測(cè)值為
?2001=120.7+0.2213×4033.1+0.4515×1690.8=1776.726(元)
實(shí)測(cè)值(90年價(jià))=1782.2元,相對(duì)誤差:-0.31%,與一元模型相比,相對(duì)誤差降低了。預(yù)測(cè)的置信區(qū)間:一元模型:CONSP2001=201.107+0.38624033.1=1758.7(元)于是E(?2001)的95%的置信區(qū)間為:
或(1741.8,1811.7)X0(X'X)-1X'0
=0.3938(注意書(shū)上寫(xiě)錯(cuò)了!)或(1776.8-2.093*31.358,1776.8+2.093*31.358,)
同樣,易得?2001的95%的置信區(qū)間為或
(1711.1,1842.4)
比較:一元模型的置信區(qū)間為:(1680.62,1836.78)劉書(shū)P54頁(yè)應(yīng)用實(shí)例3.4.1快遞服務(wù)公司統(tǒng)計(jì)數(shù)據(jù)表編號(hào)工作時(shí)間Y投遞行程X2業(yè)務(wù)次數(shù)X319.3100424.850338.9100446.5100254.250266.280277.47538665497.6903106.1902合計(jì)6780029建立回歸模型用eviews計(jì)算:i=1,2…,nYi=b1+b2X2i
+b3X3i
+mi
當(dāng)X2
=60,X3i=2時(shí)Y的預(yù)測(cè)值為:4.6462(先把eviews里的X2和X3數(shù)列添加第11個(gè)值60和2,再進(jìn)入回歸計(jì)算結(jié)果頁(yè)面點(diǎn)工具欄上的“forecast”即可)由eviews計(jì)算結(jié)果可知,總體方差的樣本標(biāo)準(zhǔn)差(也稱(chēng)回歸標(biāo)準(zhǔn)誤差S.E.ofRegression)為0.5731由此按照公式不難把預(yù)測(cè)區(qū)間算出。(注意閱讀劉書(shū)P54 關(guān)于用S代替S0求解預(yù)測(cè)區(qū)間的解釋)Yi=-0.8687
+
0.0611X2i
+
0.9234X3i
+mi
回歸方程為:第5節(jié)虛擬變量模型
一、虛擬變量的基本含義二、虛擬變量的引入三、虛擬變量的設(shè)置原則一、虛擬變量的基本含義許多經(jīng)濟(jì)變量是可以定量度量的,如:商品需求量、價(jià)格、收入、產(chǎn)量等但也有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量,如:職業(yè)、性別對(duì)收入的影響,戰(zhàn)爭(zhēng)、自然災(zāi)害對(duì)GDP的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲)銷(xiāo)售的影響等等。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”,這種“量化”通常是通過(guò)引入“虛擬變量”來(lái)完成的。根據(jù)這些因素的屬性類(lèi)型,構(gòu)造只取“0”或“1”的人工變量,通常稱(chēng)為虛擬變量(dummyvariables),記為D。例如,反映文化程度的虛擬變量可取為:1,本科學(xué)歷D=0,非本科學(xué)歷一般地,在虛擬變量的設(shè)置中:基礎(chǔ)類(lèi)型、肯定類(lèi)型取值為1;比較類(lèi)型,否定類(lèi)型取值為0。概念:同時(shí)含有一般解釋變量與虛擬變量的模型稱(chēng)為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金,Xi為工齡,Di=1,若是男性,Di=0,若是女性。
二、虛擬變量的引入虛擬變量做為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。
企業(yè)男職工的平均薪金為:上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則
企業(yè)女職工的平均薪金為:
1、加法方式幾何意義:假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)教齡的變化率是一樣的,但兩者的平均薪金水平相差2??梢酝ㄟ^(guò)傳統(tǒng)的回歸檢驗(yàn),對(duì)2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。02
又例:在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保健支出對(duì)個(gè)人收入和教育水平的回歸。教育水平考慮三個(gè)層次:高中以下,高中,大學(xué)及其以上模型可設(shè)定如下:這時(shí)需要引入兩個(gè)虛擬變量:在E(i)=0的初始假定下,高中以下、高中、大學(xué)及其以上教育水平下個(gè)人保健支出的函數(shù):高中以下:高中:大學(xué)及其以上:假定3>2,其幾何意義:還可將多個(gè)虛擬變量引入模型中以考察多種“定性”因素的影響。
如在上述職工薪金的例中,再引入代表學(xué)歷的虛擬變量D2:本科及以上學(xué)歷本科以下學(xué)歷職工薪金的回歸模型可設(shè)計(jì)為:女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:于是,不同性別、不同學(xué)歷職工的平均薪金分別為:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:
2、乘法方式加法方式引入虛擬變量,考察:截距的不同,許多情況下:往往是斜率有變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過(guò)以乘法的方式引入虛擬變量來(lái)測(cè)度。例:根據(jù)消費(fèi)理論,消費(fèi)水平C主要取決于收入水平Y(jié),但在一個(gè)較長(zhǎng)的時(shí)期,人們的消費(fèi)傾向會(huì)發(fā)生變化,尤其是在自然災(zāi)害、戰(zhàn)爭(zhēng)等反常年份,消費(fèi)傾向往往出現(xiàn)變化。這種消費(fèi)傾向的變化可通過(guò)在收入的系數(shù)中引入虛擬變量來(lái)考察。這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來(lái)考察消費(fèi)傾向的變化。假定E(i)=0,上述模型所表示的函數(shù)可化為:
正常年份:
反常年份:如,設(shè)消費(fèi)模型可建立如下:
當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。例5.1.1,考察1990年前后的中國(guó)居民的總儲(chǔ)蓄-收入關(guān)系是否已發(fā)生變化。表5.1.1中給出了中國(guó)1979~2001年以城鄉(xiāng)儲(chǔ)蓄存款余額代表的居民儲(chǔ)蓄以及以GNP代表的居民收入的數(shù)據(jù)。以Y為儲(chǔ)蓄,X為收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n1
1990年后:Yi=1+2Xi+2ii=1,2…,n2
則有可能出現(xiàn)下述四種情況中的一種:(1)1=1,且2=2,即兩個(gè)回歸相同,稱(chēng)為重合回歸(CoincidentRegressions);(2)11,但2=2,即兩個(gè)回歸的差異僅在其截距,稱(chēng)為平行回歸(ParallelRegressions);(3)1=1,但22,即兩個(gè)回歸的差異僅在其斜率,稱(chēng)為匯合回歸(ConcurrentRegressions);(4)11,且22,即兩個(gè)回歸完全不同,稱(chēng)為相異回歸(DissimilarRegressions)??梢赃\(yùn)用鄒氏結(jié)構(gòu)變化的檢驗(yàn)。這一問(wèn)題也可通過(guò)引入乘法形式的虛擬變量來(lái)解決。將n1與n2次觀察值合并,并用以估計(jì)以下回歸:Di為引入的虛擬變量:于是有:可分別表示1990年后期與前期的儲(chǔ)蓄函數(shù)。在統(tǒng)計(jì)檢驗(yàn)中,如果4=0的假設(shè)被拒絕,則說(shuō)明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。具體的回歸結(jié)果為:(-6.11)(22.89)(4.33)(-2.55)由3與4的t檢驗(yàn)可知:參數(shù)顯著地不等于0,強(qiáng)烈示出兩個(gè)時(shí)期的回歸是相異的,
儲(chǔ)蓄函數(shù)分別為:1990年前:1990年后:=0.98363、臨界指標(biāo)的虛擬變量的引入在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過(guò)建立臨界指標(biāo)的虛擬變量模型來(lái)反映。例如,進(jìn)口消費(fèi)品數(shù)量Y主要取決于國(guó)民收入X的多少,中國(guó)在改革開(kāi)放前后,Y對(duì)X的回歸關(guān)系明顯不同。這時(shí),可以t*=1979年為轉(zhuǎn)折期,以1979年的國(guó)民收入Xt*為臨界值,設(shè)如下虛擬變量:則進(jìn)口消費(fèi)品的回歸模型可建立如下:
OLS法得到該模型的回歸方程為則兩時(shí)期進(jìn)口消費(fèi)品函數(shù)分別為:當(dāng)t<t*=1979年,當(dāng)tt*=1979年,三、虛擬變量的設(shè)置原則虛擬變量的個(gè)數(shù)須按以下原則確定:
每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性變量的類(lèi)別數(shù)少1,即如果有m個(gè)定性變量,只在模型中引入m-1個(gè)虛擬變量。
例。已知冷飲的銷(xiāo)售量Y除受k種定量變量Xk的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 油畫(huà)復(fù)古風(fēng)景課程設(shè)計(jì)
- 《四頻帶和寬輸入功率范圍的高效射頻能量收集電路設(shè)計(jì)》
- 幼兒園燈籠繪畫(huà)課程設(shè)計(jì)
- 童聲合唱現(xiàn)場(chǎng)課程設(shè)計(jì)
- 研學(xué)課程設(shè)計(jì)紅色
- 礦用本安電源課程設(shè)計(jì)
- 體育場(chǎng)館環(huán)衛(wèi)保潔實(shí)施方案
- 安全文明施工及保證措施
- 產(chǎn)品售后服務(wù)方案范文
- 2024年中國(guó)EASYFLOW軟件市場(chǎng)調(diào)查研究報(bào)告
- 10.1.2事件的關(guān)系和運(yùn)算(教學(xué)課件)高一數(shù)學(xué)(人教A版2019必修第二冊(cè))
- 2024-2030年中國(guó)天然靛藍(lán)行業(yè)市場(chǎng)規(guī)模預(yù)測(cè)及發(fā)展可行性分析報(bào)告
- DB37T 4548-2022 二氧化碳驅(qū)油封存項(xiàng)目碳減排量核算技術(shù)規(guī)范
- 2024年廣東省深圳市寶安區(qū)高一上學(xué)期期末數(shù)學(xué)試題及答案
- (CJJ-T308-2021)《濕地公園設(shè)計(jì)標(biāo)準(zhǔn)》
- 2024國(guó)家開(kāi)放大學(xué)基礎(chǔ)寫(xiě)作形考任務(wù)2試題及答案
- 2023-2024學(xué)年江蘇省蘇州市高一(上)期末地理試卷
- 安全風(fēng)險(xiǎn)防控培訓(xùn)
- 企業(yè)公司簡(jiǎn)介模板課件
- 第八版糖尿病教學(xué)
- 骨質(zhì)疏松的中醫(yī)中藥治療
評(píng)論
0/150
提交評(píng)論