多元線性回歸模型_第1頁(yè)
多元線性回歸模型_第2頁(yè)
多元線性回歸模型_第3頁(yè)
多元線性回歸模型_第4頁(yè)
多元線性回歸模型_第5頁(yè)
已閱讀5頁(yè),還剩88頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于多元線性回歸模型第1頁(yè),講稿共93頁(yè),2023年5月2日,星期三2第一節(jié)多元線性回歸模型的概念

在許多實(shí)際問(wèn)題中,我們所研究的因變量的變動(dòng)可能不僅與一個(gè)解釋變量有關(guān)。因此,有必要考慮線性模型的更一般形式,即多元線性回歸模型:

t=1,2,…,n

在這個(gè)模型中,Y由X1,X2,X3,…XK所解釋?zhuān)蠯+1個(gè)未知參數(shù)β0、β1、β2、…βK。

這里,“斜率”βj的含義是其它變量不變的情況下,Xj改變一個(gè)單位對(duì)因變量所產(chǎn)生的影響。第2頁(yè),講稿共93頁(yè),2023年5月2日,星期三3

例1:

其中,Y=在食品上的總支出

X=個(gè)人可支配收入

P=食品價(jià)格指數(shù)用美國(guó)1959-1983年的數(shù)據(jù),得到如下回歸結(jié)果(括號(hào)中數(shù)字為標(biāo)準(zhǔn)誤差):

Y和X的計(jì)量單位為10億美元(按1972不變價(jià)格計(jì)算).

第3頁(yè),講稿共93頁(yè),2023年5月2日,星期三4多元線性回歸模型中斜率系數(shù)的含義上例中斜率系數(shù)的含義說(shuō)明如下:價(jià)格不變的情況下,個(gè)人可支配收入每上升10億美元(1個(gè)billion),食品消費(fèi)支出增加1.12億元(0.112個(gè)billion)。收入不變的情況下,價(jià)格指數(shù)每上升一個(gè)點(diǎn),食品消費(fèi)支出減少7.39億元(0.739個(gè)billion)第4頁(yè),講稿共93頁(yè),2023年5月2日,星期三5例2:其中,Ct=消費(fèi),Dt=居民可支配收入

Lt=居民擁有的流動(dòng)資產(chǎn)水平

β2的含義是,在流動(dòng)資產(chǎn)不變的情況下,可支配收入變動(dòng)一個(gè)單位對(duì)消費(fèi)額的影響。這是收入對(duì)消費(fèi)額的直接影響。收入變動(dòng)對(duì)消費(fèi)額的總影響=直接影響+間接影響。(間接影響:收入影響流動(dòng)資產(chǎn)擁有量影響消費(fèi)額)但在模型中這種間接影響應(yīng)歸因于流動(dòng)資產(chǎn),而不是收入,因而,β2只包括收入的直接影響。

在下面的模型中:這里,β是可支配收入對(duì)消費(fèi)額的總影響,顯然β和β2的含義是不同的。第5頁(yè),講稿共93頁(yè),2023年5月2日,星期三6回到一般模型

t=1,2,…,n即對(duì)于n組觀測(cè)值,有第6頁(yè),講稿共93頁(yè),2023年5月2日,星期三7其矩陣形式為:

其中

第7頁(yè),講稿共93頁(yè),2023年5月2日,星期三8第二節(jié)多元線性回歸模型的估計(jì)多元線性回歸模型的估計(jì)與雙變量線性模型類(lèi)似,仍采用最小二乘法。當(dāng)然,計(jì)算要復(fù)雜得多,通常要借助計(jì)算機(jī)。理論推導(dǎo)需借助矩陣代數(shù)。下面給出最小二乘法應(yīng)用于多元線性回歸模型的假設(shè)條件、估計(jì)結(jié)果及所得到的估計(jì)量的性質(zhì)。一.假設(shè)條件(1)E(ut)=0,t=1,2,…,n

(2)E(uiuj)=0,i≠j

(3)E(ut2)=σ2,t=1,2,…,n

(4)Xjt是非隨機(jī)量,j=1,2,…kt=1,2,…n第8頁(yè),講稿共93頁(yè),2023年5月2日,星期三9

除上面4條外,在多個(gè)解釋變量的情況下,還有兩個(gè)條件需要滿足:(5)(K+1)<n;

即觀測(cè)值的數(shù)目要大于待估計(jì)的參數(shù)的個(gè)數(shù)(要有足夠數(shù)量的數(shù)據(jù)來(lái)擬合回歸線)。(6)各解釋變量之間不存在嚴(yán)格的線性關(guān)系。第9頁(yè),講稿共93頁(yè),2023年5月2日,星期三10上述假設(shè)條件可用矩陣表示為以下四個(gè)條件:(1)E(u)=0

(2)由于顯然,僅當(dāng)

E(uiuj)=0,i≠jE(ut2)=σ2,t=1,2,…,n

這兩個(gè)條件成立時(shí)才成立,因此,此條件相當(dāng)前面條件(2),(3)兩條,即各期擾動(dòng)項(xiàng)互不相關(guān),并具有常數(shù)方差。第10頁(yè),講稿共93頁(yè),2023年5月2日,星期三11

(3)X是 是一個(gè)非隨機(jī)元素矩陣。(4)Rank(X)=(K+1)<n.------相當(dāng)于前面(5)、(6)兩條即矩陣X的秩=(K+1)<n

當(dāng)然,為了后面區(qū)間估計(jì)和假設(shè)檢驗(yàn)的需要,還要加上一條:(5)~,t=1,2,…n第11頁(yè),講稿共93頁(yè),2023年5月2日,星期三12二.最小二乘估計(jì)我們的模型是:

t=1,2,…n問(wèn)題是選擇,使得殘差平方和最小。

殘差為:第12頁(yè),講稿共93頁(yè),2023年5月2日,星期三13要使殘差平方和

為最小,則應(yīng)有:我們得到如下K+1個(gè)方程(即正規(guī)方程):

第13頁(yè),講稿共93頁(yè),2023年5月2日,星期三14按矩陣形式,上述方程組可表示為:第14頁(yè),講稿共93頁(yè),2023年5月2日,星期三15=即第15頁(yè),講稿共93頁(yè),2023年5月2日,星期三16

上述結(jié)果,亦可從矩陣表示的模型出發(fā),完全用矩陣代數(shù)推導(dǎo)出來(lái)。殘差可用矩陣表示為:其中:第16頁(yè),講稿共93頁(yè),2023年5月2日,星期三17殘差平方和第17頁(yè),講稿共93頁(yè),2023年5月2日,星期三18注意到上式中所有項(xiàng)都是標(biāo)量,且故令用矩陣微分法,我們可得到與采用標(biāo)量式推導(dǎo)所得結(jié)果相同。由上述結(jié)果,我們有第18頁(yè),講稿共93頁(yè),2023年5月2日,星期三19三.最小二乘估計(jì)量的性質(zhì)我們的模型為估計(jì)式為

1.的均值第19頁(yè),講稿共93頁(yè),2023年5月2日,星期三20(由假設(shè)3)

(由假設(shè)1)即這表明,OLS估計(jì)量是無(wú)偏估計(jì)量。第20頁(yè),講稿共93頁(yè),2023年5月2日,星期三212.的方差為求Var(),我們考慮

這是一個(gè)(K+1)*(K+1)矩陣,其主對(duì)角線上元素即構(gòu)成

Var(),非主對(duì)角線元素是相應(yīng)的協(xié)方差,如下所示:第21頁(yè),講稿共93頁(yè),2023年5月2日,星期三22下面推導(dǎo)此矩陣的計(jì)算公式.第22頁(yè),講稿共93頁(yè),2023年5月2日,星期三23由上一段的結(jié)果,我們有因此,第23頁(yè),講稿共93頁(yè),2023年5月2日,星期三24

如前所述,我們得到的實(shí)際上不僅是的方差,而且是一個(gè)方差-協(xié)方差矩陣,為了反映這一事實(shí),我們用下面的符號(hào)表示之:展開(kāi)就是:第24頁(yè),講稿共93頁(yè),2023年5月2日,星期三253.2

的估計(jì)與雙變量線性模型相似,2的無(wú)偏估計(jì)量是

這是因?yàn)槲覀冊(cè)诠烙?jì)的過(guò)程中,失去了(K+1)個(gè)自由度。4.高斯-馬爾科夫定理對(duì)于以及標(biāo)準(zhǔn)假設(shè)條件(1)-(4),普通最小二乘估計(jì)量是最佳線性無(wú)偏估計(jì)量(BLUE)第25頁(yè),講稿共93頁(yè),2023年5月2日,星期三26

我們已在上一段中證明了無(wú)偏性,下面證明線性和最小方差性。證明的路子與雙變量模型中類(lèi)似,只不過(guò)這里我們采用矩陣和向量的形式。由OLS估計(jì)量的公式

可知,可表示為一個(gè)矩陣和應(yīng)變量觀測(cè)值向量的乘積:其中是一個(gè)(K+1)*n非隨機(jī)元素矩陣。因而顯然有是線性估計(jì)量。第26頁(yè),講稿共93頁(yè),2023年5月2日,星期三27

現(xiàn)設(shè)為的任意一個(gè)線性無(wú)偏估計(jì)量,即其中是一個(gè)(K+1)*n非隨機(jī)元素矩陣。則

顯然,若要為無(wú)偏估計(jì)量,即,只有,為(K+1)階單位矩陣。第27頁(yè),講稿共93頁(yè),2023年5月2日,星期三28

的方差為:

我們可將寫(xiě)成

從而將的任意線性無(wú)偏估計(jì)量與OLS估計(jì)量聯(lián)系起來(lái)。第28頁(yè),講稿共93頁(yè),2023年5月2日,星期三29由可推出:即

因而有由從而,因此上式中間兩項(xiàng)為0,我們有第29頁(yè),講稿共93頁(yè),2023年5月2日,星期三30

因此

最后的不等號(hào)成立是因?yàn)闉榘胝ň仃嚒_@就證明了OLS估計(jì)量是的所有線性無(wú)偏估計(jì)量中方差最小的。至此,我們證明了高斯-馬爾科夫定理。第30頁(yè),講稿共93頁(yè),2023年5月2日,星期三31第三節(jié)擬合優(yōu)度一.決定系數(shù)R2

對(duì)于雙變量線性模型

Y=α+βX+u我們有其中,=殘差平方和第31頁(yè),講稿共93頁(yè),2023年5月2日,星期三32對(duì)于多元線性模型

我們可用同樣的方法定義決定系數(shù):為方便計(jì)算,我們也可以用矩陣形式表示R2第32頁(yè),講稿共93頁(yè),2023年5月2日,星期三33

我們有:殘差,其中,殘差平方和:第33頁(yè),講稿共93頁(yè),2023年5月2日,星期三34而

將上述結(jié)果代入R2的公式,得到:這就是決定系數(shù)R2的矩陣形式。第34頁(yè),講稿共93頁(yè),2023年5月2日,星期三35二.修正決定系數(shù):殘差平方和的一個(gè)特點(diǎn)是,每當(dāng)模型增加一個(gè)解釋變量,并用改變后的模型重新進(jìn)行估計(jì),殘差平方和的值會(huì)減小。由此可以推論,決定系數(shù)是一個(gè)與解釋變量的個(gè)數(shù)有關(guān)的量:解釋變量個(gè)數(shù)增加減小R2增大也就是說(shuō),人們總是可以通過(guò)增加模型中解釋變量的方法來(lái)增大R2

的值。因此,用R2

來(lái)作為擬合優(yōu)度的測(cè)度,不是十分令人滿意的。為此,我們定義修正決定系數(shù)(Adjusted)如下:第35頁(yè),講稿共93頁(yè),2023年5月2日,星期三36

是經(jīng)過(guò)自由度調(diào)整的決定系數(shù),稱(chēng)為修正決定系數(shù)。我們有:(1)(2)僅當(dāng)K=0時(shí),等號(hào)成立。即(3)當(dāng)K增大時(shí),二者的差異也隨之增大。(4)可能出現(xiàn)負(fù)值。第36頁(yè),講稿共93頁(yè),2023年5月2日,星期三37三.例子下面我們給出兩個(gè)簡(jiǎn)單的數(shù)值例子,以幫助理解這兩節(jié)的內(nèi)容.

例1 Yt=1+2X2t+3X3t+ut

設(shè)觀測(cè)數(shù)據(jù)為:Y:31835X2:31524X3:54646

試求各參數(shù)的OLS估計(jì)值,以及。解:我們有第37頁(yè),講稿共93頁(yè),2023年5月2日,星期三38第38頁(yè),講稿共93頁(yè),2023年5月2日,星期三39第39頁(yè),講稿共93頁(yè),2023年5月2日,星期三40第40頁(yè),講稿共93頁(yè),2023年5月2日,星期三41第41頁(yè),講稿共93頁(yè),2023年5月2日,星期三42

例2.

設(shè)n=20,k=3,R2=0.70求。解:下面改變n的值,看一看的值如何變化。我們有若n=10,則=0.55

若n=5,則=-0.20

由本例可看出,有可能為負(fù)值。這與R2不同()。第42頁(yè),講稿共93頁(yè),2023年5月2日,星期三43

第四節(jié)非線性關(guān)系的處理迄今為止,我們已解決了線性模型的估計(jì)問(wèn)題。但在實(shí)際問(wèn)題中,變量間的關(guān)系并非總是線性關(guān)系,經(jīng)濟(jì)變量間的非線性關(guān)系比比皆是。如大家所熟悉的柯布-道格拉斯生產(chǎn)函數(shù):

就是一例。在這樣一些非線性關(guān)系中,有些可以通過(guò)代數(shù)變換變?yōu)榫€性關(guān)系處理,另一些則不能。下面我們通過(guò)一些例子來(lái)討論這個(gè)問(wèn)題。第43頁(yè),講稿共93頁(yè),2023年5月2日,星期三44一.線性模型的含義線性模型的基本形式是:其特點(diǎn)是可以寫(xiě)成每一個(gè)解釋變量和一個(gè)系數(shù)相乘的形式。線性模型的線性包含兩重含義:(1)變量的線性變量以其原型出現(xiàn)在模型之中,而不是以X2或Xβ之類(lèi)的函數(shù)形式出現(xiàn)在模型中。(2)參數(shù)的線性因變量Y是各參數(shù)的線性函數(shù)。第44頁(yè),講稿共93頁(yè),2023年5月2日,星期三45二.線性化方法對(duì)于線性回歸分析,只有第二種類(lèi)型的線性才是重要的,因?yàn)樽兞康姆蔷€性可通過(guò)適當(dāng)?shù)闹匦露x來(lái)解決。例如,對(duì)于

此方程的變量和參數(shù)都是線性的。如果原方程的擾動(dòng)項(xiàng)滿足高斯—馬爾可夫定理?xiàng)l件,重寫(xiě)的方程的擾動(dòng)項(xiàng)也將滿足。第45頁(yè),講稿共93頁(yè),2023年5月2日,星期三46

參數(shù)的非線性是一個(gè)嚴(yán)重得多的問(wèn)題,因?yàn)樗荒軆H憑重定義來(lái)處理??墒牵绻P偷挠叶擞梢幌盗械腦β或eβX項(xiàng)相乘,并且擾動(dòng)項(xiàng)也是乘積形式的,則該模型可通過(guò)兩邊取對(duì)數(shù)線性化。例如,需求函數(shù)

其中,Y=對(duì)某商品的需求

X=收入

P=相對(duì)價(jià)格指數(shù)

ν=擾動(dòng)項(xiàng)可轉(zhuǎn)換為:第46頁(yè),講稿共93頁(yè),2023年5月2日,星期三47

用X,Y,P的數(shù)據(jù),我們可得到logY,logX和logP,從而可以用OLS法估計(jì)上式。

logX的系數(shù)是β的估計(jì)值,經(jīng)濟(jì)含義是需求的收入彈性,logP的系數(shù)將是γ的估計(jì)值,即需求的價(jià)格彈性。

[注釋]

彈性(elasticity):一變量變動(dòng)1%所引起的另一變量變動(dòng)的百分比:

需求的收入彈性:收入變化1%,價(jià)格不變時(shí),所引起的商品需求量變動(dòng)的百分比。需求的價(jià)格彈性:價(jià)格變化1%,收入不變時(shí),所引起的商品需求量變動(dòng)的百分比。第47頁(yè),講稿共93頁(yè),2023年5月2日,星期三48三.例子例1需求函數(shù)本章§1中,我們?cè)o出一個(gè)食品支出為因變量,個(gè)人可支配收入和食品價(jià)格指數(shù)為解釋變量的線性回歸模型例子?,F(xiàn)用這三個(gè)變量的對(duì)數(shù)重新估計(jì)(采用同樣的數(shù)據(jù)),得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):回歸結(jié)果表明,需求的收入彈性是0.64,需求的價(jià)格彈性是0.48,這兩個(gè)系數(shù)都顯著異于0。第48頁(yè),講稿共93頁(yè),2023年5月2日,星期三49

例2.柯布-道格拉斯生產(chǎn)函數(shù)生產(chǎn)函數(shù)是一個(gè)生產(chǎn)過(guò)程中的投入及其產(chǎn)出之間的一種關(guān)系。著名的柯布-道格拉斯生產(chǎn)函數(shù)(C-D函數(shù))為

用柯布和道格拉斯最初使用的數(shù)據(jù)(美國(guó)1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過(guò)線性變換的模型得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):

從上述結(jié)果可以看出,產(chǎn)出的資本彈性是0.23,產(chǎn)出的勞動(dòng)彈性為0.81。第49頁(yè),講稿共93頁(yè),2023年5月2日,星期三50例3.貨幣需求量與利率之間的關(guān)系

M=a(r-2)b這里,變量非線性和參數(shù)非線性并存。對(duì)此方程采用對(duì)數(shù)變換

logM=loga+blog(r-2)

令Y=logM,X=log(r-2),β1=loga,β2=b

則變換后的模型為:

Yt=β1+β2Xt+ut

第50頁(yè),講稿共93頁(yè),2023年5月2日,星期三51

將OLS法應(yīng)用于此模型,可求得β1和β2的估計(jì)值從而可通過(guò)下列兩式求出a和b估計(jì)值:

應(yīng)當(dāng)指出,在這種情況下,線性模型估計(jì)量的性質(zhì)(如BLUE,正態(tài)性等)只適用于變換后的參數(shù)估計(jì)量,而不一定適用于原模型參數(shù)的估計(jì)量和。第51頁(yè),講稿共93頁(yè),2023年5月2日,星期三52

例4.上例在確定貨幣需求量的關(guān)系式時(shí),我們實(shí)際上給模型加進(jìn)了一個(gè)結(jié)束條件。根據(jù)理論假設(shè),在某一利率水平上,貨幣需求量在理論上是無(wú)窮大。我們假定這個(gè)利率水平為2%。假如不給這一約束條件,而是從給定的數(shù)據(jù)中估計(jì)該利率水平的值,則模型變?yōu)椋?/p>

M=a(r-c)b

式中a,b,c均為參數(shù)。仍采用對(duì)數(shù)變換,得到

log(Mt)=loga+blog(rt-c)+utt=1,2,…,n

我們無(wú)法將log(rt-c)定義為一個(gè)可觀測(cè)的變量X,因?yàn)檫@里有一個(gè)未知量c。也就是說(shuō),此模型無(wú)法線性化。在這種情況下,只能用估計(jì)非線性模型參數(shù)值的方法。第52頁(yè),講稿共93頁(yè),2023年5月2日,星期三53四.非線性回歸

模型

Y=a(X-c)b是一個(gè)非線性模型,a、b和c是要估計(jì)的參數(shù)。此模型無(wú)法用取對(duì)數(shù)的方法線性化,只能用非線性回歸技術(shù)進(jìn)行估計(jì),如非線性最小二乘法(NLS)。該方法的原則仍然是殘差平方和最小。計(jì)量經(jīng)濟(jì)軟件包通常提供這類(lèi)方法,這里給出有關(guān)非線性回歸方法的大致步驟如下:第53頁(yè),講稿共93頁(yè),2023年5月2日,星期三54非線性回歸方法的步驟1. 首先給出各參數(shù)的初始估計(jì)值(合理猜測(cè)值);2. 用這些參數(shù)值和X觀測(cè)值數(shù)據(jù)計(jì)算Y的各期預(yù)測(cè)值(擬合值);3.計(jì)算各期殘差,然后計(jì)算殘差平方和∑e2;4.對(duì)一個(gè)或多個(gè)參數(shù)的估計(jì)值作微小變動(dòng);

5.計(jì)算新的Y預(yù)測(cè)值、殘差平方和∑e2;

6.若新的∑e2小于老的∑e2,說(shuō)明新參數(shù)估計(jì)值優(yōu)于老估計(jì)值,則以它們作為新起點(diǎn);

7.重復(fù)步驟4,5,6,直至無(wú)法減小∑e2為止。

8.最后的參數(shù)估計(jì)值即為最小二乘估計(jì)值。第54頁(yè),講稿共93頁(yè),2023年5月2日,星期三55

第五節(jié)假設(shè)檢驗(yàn)一.系數(shù)的顯著性檢驗(yàn)1. 單個(gè)系數(shù)顯著性檢驗(yàn)?zāi)康氖菣z驗(yàn)?zāi)硞€(gè)解釋變量的系數(shù)βj是否為0,即該解釋變量是否對(duì)因變量有影響。原假設(shè):H0:

βj=0

備擇假設(shè):H1:

βj≠0

檢驗(yàn)統(tǒng)計(jì)量是自由度為n-K-1的t統(tǒng)計(jì)量:~t(n-K-1)第55頁(yè),講稿共93頁(yè),2023年5月2日,星期三56單個(gè)系數(shù)顯著性檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量是自由度為n-K-1的t統(tǒng)計(jì)量:~t(n-K-1)其中,為矩陣主對(duì)角線上第j+1個(gè)元素。而第56頁(yè),講稿共93頁(yè),2023年5月2日,星期三57例:柯布-道格拉斯生產(chǎn)函數(shù)用柯布和道格拉斯最初使用的數(shù)據(jù)(美國(guó)1899-1922年制造業(yè)數(shù)據(jù))估計(jì)經(jīng)過(guò)線性變換的模型得到如下結(jié)果(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差):請(qǐng)檢驗(yàn)“斜率”系數(shù)和的顯著性。解:(1)檢驗(yàn)的顯著性

原假設(shè):H0:

=0

備擇假設(shè):H1:

≠0第57頁(yè),講稿共93頁(yè),2023年5月2日,星期三58由回歸結(jié)果,我們有:t=0.23/0.06=3.83用=24-3=21查t表,5%顯著性水平下,tc=2.08.∵t=3.83tc=2.08,故拒絕原假設(shè)H0。結(jié)論:顯著異于0。(2)檢驗(yàn)

的顯著性原假設(shè):H0:

=0

備擇假設(shè):H1:

≠0由回歸結(jié)果,我們有:t=0.81/0.15=5.4∵t=5.4tc=2.08,故拒絕原假設(shè)H0。結(jié)論:顯著異于0。第58頁(yè),講稿共93頁(yè),2023年5月2日,星期三592.若干個(gè)系數(shù)的顯著性檢驗(yàn)(聯(lián)合假設(shè)檢驗(yàn))

有時(shí)需要同時(shí)檢驗(yàn)若干個(gè)系數(shù)是否為0,這可以通過(guò)建立單一的原假設(shè)來(lái)進(jìn)行。設(shè)要檢驗(yàn)g個(gè)系數(shù)是否為0,即與之相對(duì)應(yīng)的g個(gè)解釋變量對(duì)因變量是否有影響。不失一般性,可設(shè)原假設(shè)和備擇假設(shè)為:

H0:β1=β2=…=βg

=0H1:

H0不成立

(即X1,…Xg中某些變量對(duì)Y有影響)第59頁(yè),講稿共93頁(yè),2023年5月2日,星期三60分析:這實(shí)際上相當(dāng)于檢驗(yàn)g個(gè)約束條件

β1=0,β2=0,…,βg

=0是否同時(shí)成立。若H0為真,則正確的模型是:

據(jù)此進(jìn)行回歸(有約束回歸),得到殘差平方和

SR是H0為真時(shí)的殘差平方和。

若H1為真,正確的模型即原模型:第60頁(yè),講稿共93頁(yè),2023年5月2日,星期三61

據(jù)此進(jìn)行無(wú)約束回歸(全回歸),得到殘差平方和

S是H1為真時(shí)的殘差平方和。如果H0為真,則不管X1,…Xg這g個(gè)變量是否包括在模型中,所得到的結(jié)果不會(huì)有顯著差別,因此應(yīng)該有:

S≈SR如果H1為真,則由上一節(jié)中所討論的殘差平方和∑e2的特點(diǎn),無(wú)約束回歸增加了變量的個(gè)數(shù),應(yīng)有

S<SR

通過(guò)檢驗(yàn)二者差異是否顯著地大,就能檢驗(yàn)原假設(shè)是否成立。第61頁(yè),講稿共93頁(yè),2023年5月2日,星期三62所使用的檢驗(yàn)統(tǒng)計(jì)量是:

~F(g,n-K-1)其中,g為分子自由度,n-K-1為分母自由度。使用的作用是消除具體問(wèn)題中度量單位的影響,使計(jì)算出的F值是一個(gè)與度量單位無(wú)關(guān)的量。第62頁(yè),講稿共93頁(yè),2023年5月2日,星期三63例:給定20組Y,X1,X2,X3的觀測(cè)值,試檢驗(yàn)?zāi)P椭蠿1和X3對(duì)Y是否有影響?解:(1)全回歸估計(jì)得到:S=∑e2=25

(2)有約束回歸

估計(jì)得到:SR=∑e2=30第63頁(yè),講稿共93頁(yè),2023年5月2日,星期三64

原假設(shè)H0:β1=

β3=0

備擇假設(shè)H1:

H0不成立我們有:n=20,g=2,K=3

用自由度(2,16)查F分布表,5%顯著性水平下,F(xiàn)C=3.63∵F=1.6<FC=3.63,故接受H0。結(jié)論:X1和X3對(duì)Y無(wú)顯著影響第64頁(yè),講稿共93頁(yè),2023年5月2日,星期三653.全部斜率系數(shù)為0的檢驗(yàn)上一段結(jié)果的一個(gè)特例是所有斜率系數(shù)均為0的檢驗(yàn),即回歸方程的顯著性檢驗(yàn):

H0:

β1=β2=…=βK=0

也就是說(shuō),所有解釋變量對(duì)Y均無(wú)影響。注意到g=K,

則該檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量為:

第65頁(yè),講稿共93頁(yè),2023年5月2日,星期三66

分子分母均除以,有從上式不難看出,全部斜率為0的檢驗(yàn)實(shí)際是檢驗(yàn)R2的值是否顯著異于0,如果接受原假設(shè),則表明因變量的行為完全歸因于隨機(jī)變化。若拒絕原假設(shè),則表明所選擇模型對(duì)因變量的行為能夠提供某種程度的解釋。第66頁(yè),講稿共93頁(yè),2023年5月2日,星期三67二.檢驗(yàn)其他形式的系數(shù)約束條件上面所介紹的檢驗(yàn)若干個(gè)系數(shù)顯著性的方法,也可以應(yīng)用于檢驗(yàn)施加于系數(shù)的其他形式的約束條件,如

檢驗(yàn)的方法仍是分別進(jìn)行有約束回歸和無(wú)約束回歸,求出各自的殘差平方和SR和S,然后用F統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。當(dāng)然,單個(gè)系數(shù)的假設(shè)檢驗(yàn),如H0:3=1.0,亦可用t檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。第67頁(yè),講稿共93頁(yè),2023年5月2日,星期三68例:Cobb-Douglas生產(chǎn)函數(shù)

Y=AKαLβν

試根據(jù)美國(guó)制造業(yè)1899-1922年數(shù)據(jù)檢驗(yàn)規(guī)模效益不變的約束:α+β=1解:(1)全回歸

(2)有約束回歸:將約束條件代入,要回歸的模型變?yōu)椋?/p>

Y=AKαL1-αν

為避免回歸系數(shù)的不一致問(wèn)題,兩邊除以L,模型變換為:

Y/L=A(K/L)αν

第68頁(yè),講稿共93頁(yè),2023年5月2日,星期三69

回歸,得:

由軟件包可得到約束回歸和全回歸的殘差平方和分別為

SR=0.0716S=0.0710

(3)檢驗(yàn)原假設(shè)H0:α+β=1

備擇假設(shè)H1:α+β≠1

本例中,g=1,K=2,n=24

第69頁(yè),講稿共93頁(yè),2023年5月2日,星期三70

用自由度(1,21)查F表,5%顯著性水平下,F(xiàn)c=4.32∵F=0.18<Fc=4.32

故接受原假設(shè)H0:α+β=1

(4)結(jié)論我們的數(shù)據(jù)支持規(guī)模收益不變的假設(shè)。第70頁(yè),講稿共93頁(yè),2023年5月2日,星期三71第六節(jié)

預(yù)測(cè)我們用OLS法對(duì)多元回歸模型的參數(shù)進(jìn)行了估計(jì)之后,如果結(jié)果理想,則可用估計(jì)好的模型進(jìn)行預(yù)測(cè)。與雙變量模型的作法類(lèi)似,預(yù)測(cè)指的是對(duì)各自變量的某一組具體值

來(lái)預(yù)測(cè)與之相對(duì)應(yīng)的因變量值。當(dāng)然,要進(jìn)行預(yù)測(cè),有一個(gè)假設(shè)前提應(yīng)當(dāng)滿足,即擬合的模型在預(yù)測(cè)期也成立。

點(diǎn)預(yù)測(cè)值由與給定的諸X值對(duì)應(yīng)的回歸值給出,即

而預(yù)測(cè)期的實(shí)際Y值由下式給出:

其中u0是從預(yù)測(cè)期的擾動(dòng)項(xiàng)分布中所取的值。第71頁(yè),講稿共93頁(yè),2023年5月2日,星期三72預(yù)測(cè)誤差可定義為:兩邊取期望值,得

因此,OLS預(yù)測(cè)量是一個(gè)無(wú)偏預(yù)測(cè)量。第72頁(yè),講稿共93頁(yè),2023年5月2日,星期三73

預(yù)測(cè)誤差的方差為:

從的定義可看出,為正態(tài)變量的線性函數(shù),因此,它本身也服從正態(tài)分布。故第73頁(yè),講稿共93頁(yè),2023年5月2日,星期三74由于為未知,我們用其估計(jì)值代替它,有

則的95%置信區(qū)間為:(其中,)第74頁(yè),講稿共93頁(yè),2023年5月2日,星期三75例用書(shū)上P79例4.3的數(shù)據(jù),預(yù)測(cè)X2=10,X3=10的Y值。解:

由例4.3我們已得到:

因此

的95%置信區(qū)間為:或3.66至23.65之間.第75頁(yè),講稿共93頁(yè),2023年5月2日,星期三76

第七節(jié)虛擬變量(Dummyvariables)一.虛擬變量的概念在回歸分析中,常常碰到這樣一種情況,即因變量的波動(dòng)不僅依賴(lài)于那種能夠很容易按某種尺度定量化的變量(如收入、產(chǎn)出、價(jià)格、身高、體重等),而且依賴(lài)于某些定性的變量(如性別、地區(qū)、季節(jié))。在經(jīng)濟(jì)系統(tǒng)中,許多變動(dòng)是不能定量的。如政府的更迭(工黨-保守黨)、經(jīng)濟(jì)體制的改革、固定匯率變?yōu)楦?dòng)匯率、從戰(zhàn)時(shí)經(jīng)濟(jì)轉(zhuǎn)為和平時(shí)期經(jīng)濟(jì)等。這樣一些變動(dòng)都可以用大家所熟悉的0-1變量來(lái)表示,用1表示具有某一“品質(zhì)”或?qū)傩?,?表示不具有該“品質(zhì)”或?qū)傩浴_@種變量在計(jì)量經(jīng)濟(jì)學(xué)中稱(chēng)為“虛擬變量”。虛擬變量使得我們可以將那些無(wú)法定量化的變量引入回歸模型中。下面給出幾個(gè)可以引入虛擬變量的例子。第76頁(yè),講稿共93頁(yè),2023年5月2日,星期三77例1:你在研究學(xué)歷和收入之間的關(guān)系,在你的樣本中,既有女性又有男性,你打算研究在此關(guān)系中,性別是否會(huì)導(dǎo)致差別。例2:你在研究某省家庭收入和支出的關(guān)系,采集的樣本中既包括農(nóng)村家庭,又包括城鎮(zhèn)家庭,你打算研究二者的差別。例3:你在研究通貨膨脹的決定因素,在你的觀測(cè)期中,有些年份政府實(shí)行了一項(xiàng)收入政策。你想檢驗(yàn)該政策是否對(duì)通貨膨脹產(chǎn)生影響。上述各例都可以用兩種方法來(lái)解決,一種解決方法是分別進(jìn)行兩類(lèi)情況的回歸,然后看參數(shù)是否不同。另一種方法是用全部觀測(cè)值作單一回歸,將定性因素的影響用虛擬變量引入模型。第77頁(yè),講稿共93頁(yè),2023年5月2日,星期三78二.虛擬變量的使用方法1. 截距變動(dòng)設(shè)Y表示消費(fèi),X表示收入,我們有:

}假定β不變。對(duì)于5年戰(zhàn)爭(zhēng)和5年和平時(shí)期的數(shù)據(jù),我們可分別估計(jì)上述兩個(gè)模型,一般將給出的不同值?,F(xiàn)引入虛擬變量D,將兩式并為一式:

其中,

第78頁(yè),講稿共93頁(yè),2023年5月2日,星期三79

此式等價(jià)于下列兩式:

}截距變動(dòng),斜率不變

在包含虛擬變量的模型中,D的數(shù)據(jù)為0,0,0,0,0,1,1,1,1,1。估計(jì)結(jié)果如下圖所示:

應(yīng)用t檢驗(yàn),β2是否顯著可以表明截距項(xiàng)在兩個(gè)時(shí)期是否有變化。第79頁(yè),講稿共93頁(yè),2023年5月2日,星期三802. 斜率變動(dòng)如果我們認(rèn)為戰(zhàn)時(shí)和平時(shí)的消費(fèi)函數(shù)中,截距項(xiàng)不變,而斜率不同,即β變動(dòng),則可用下面的模型來(lái)研究?jī)蓚€(gè)時(shí)期邊際消費(fèi)傾向的差異:

其中,D={

不難看出,上式相當(dāng)于下列兩式:

同樣,包括虛擬變量的模型中,β2是否顯著可以表明斜率在兩個(gè)時(shí)期是否變化。第80頁(yè),講稿共93頁(yè),2023年5月2日,星期三813.斜率和截距都變動(dòng)在這種情況下,模型可設(shè)為:

其中,D={

此式等價(jià)于下列兩個(gè)單獨(dú)的回歸式:

引進(jìn)了虛擬變量的回歸模型對(duì)于檢驗(yàn)兩個(gè)時(shí)期中是否發(fā)生結(jié)構(gòu)性變化很方便。如上例中,相當(dāng)于檢驗(yàn)H0:β2=β4=0第81頁(yè),講稿共93頁(yè),2023年5月2日,星期三824.季節(jié)虛擬變量的使用許多變量展示出季節(jié)性的變異(如商品零售額、電和天然氣的消費(fèi)等),我們?cè)诮⒛P蜁r(shí)應(yīng)考慮這一點(diǎn),這有兩種方法:(1)在估計(jì)前對(duì)數(shù)據(jù)進(jìn)行季節(jié)調(diào)整;(2)采用虛擬變量將季節(jié)性差異反映在模型中。例:設(shè)Y=購(gòu)買(mǎi)汽車(chē)的實(shí)際支出額

X=實(shí)際總消費(fèi)支出用美國(guó)1973(1)-1980(2)的季度數(shù)據(jù)(按1975年價(jià)格計(jì)算),得回歸結(jié)果如下:第82頁(yè),講稿共93頁(yè),2023年5月2日,星期三83

這一結(jié)果很不理想,低R2值,低t值,X的符號(hào)也不對(duì)??紤]到可能是季節(jié)性變異的問(wèn)題,我們建立下面的模型:

其中,Q1={

Q2={

Q3={

請(qǐng)注意我們僅用了3個(gè)虛擬變量就可表示4個(gè)季度的情況。各季度的截距分別為:1季度:0+12季度:0+23季度:0+34季度:0第83頁(yè),講稿共93頁(yè),2023年5月2日,星期三84估計(jì)結(jié)果如下:

結(jié)果仍不理想,但好多了。四個(gè)季度的截距項(xiàng)分別為:

-1039.2,-1122.7,-1161.4,-1455.8。所得到的實(shí)際總支出的參數(shù)估計(jì)值(0.1044)是一個(gè)不受季節(jié)變動(dòng)影響的估計(jì)值。第84頁(yè),講稿共93頁(yè),2023年5月2日,星期三85第四章小結(jié)本章將雙變量模型的結(jié)果推廣到了多元線性回歸模型的一般情形。一、多元線性回歸模型的估計(jì)多元線性回歸模型的矩陣形式為Y=Xβ+μ若滿足以下四條假設(shè)條件:

1、E(μ)=02、E(μμ’)=2In3、X是一個(gè)非隨機(jī)元素矩陣

4、Rank(X)=k+1<n

則OLS估計(jì)量=(X’X)-1X’Y為最佳線性無(wú)偏估計(jì)量(BLUE)。其方差-協(xié)方差矩陣為

Var-cov()=(X’X)-12該矩陣主對(duì)角線元素為諸的方差。第85頁(yè),講稿共93頁(yè),2023年5月2日,星期三86二、擬合優(yōu)度多元線性回歸模型的決定系數(shù)為:R2=由于當(dāng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論