第四章-多元線性回歸模型

上傳人：精*** IP屬地：江西上傳時(shí)間：2024-09-29 格式：PPT 頁數(shù)：125 大?。?.58MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩120頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章多元線性回歸模型2

在許多實(shí)際問題中，我們所研究的因變量的變動可能不僅與一個(gè)解釋變量有關(guān)。例如，對某商品的需求量不僅與該商品的價(jià)格有關(guān)，而且與其它因素有關(guān)，如與消費(fèi)者的可支配收入和該商品的替代品的價(jià)格有關(guān)。因此，有必要考慮線性模型的更一般形式，即多元線性模型。

t=1,2,…,n

在這個(gè)模型中，Y由X1,X2,X3,…XK所解釋，有K+1個(gè)未知參數(shù)β0、β1、β2、…βK.其中，“斜率”βj的含義是其它變量不變的情況下，Xj改變一個(gè)單位對因變量所產(chǎn)生的影響，也稱為偏回歸系數(shù)。第一節(jié)多元線性回歸模型的概念34上例中斜率系數(shù)的含義說明如下：價(jià)格不變的情況下，個(gè)人可支配收入每增加1元，人均食品消費(fèi)支出增加0.152元。人均可支配收入不變的情況下，價(jià)格指數(shù)每上升一個(gè)點(diǎn)，人均食品消費(fèi)支出減少5.02元。多元線性回歸模型中斜率系數(shù)的含義5例2：

其中，Ct=消費(fèi)，Dt=居民可支配收入

Lt=居民擁有的流動資產(chǎn)水平

β2的含義是，在流動資產(chǎn)不變的情況下，可支配收入變動一個(gè)單位對消費(fèi)額的影響。這是收入對消費(fèi)額的直接影響。收入變動對消費(fèi)額的總影響=直接影響+間接影響。（間接影響：收入

流動資產(chǎn)擁有量

消費(fèi)額）但在模型中這種間接影響應(yīng)歸因于流動資產(chǎn)，而不是收入，因而，β2只包括收入的直接影響。在下面的模型中：這里，β是可支配收入對消費(fèi)額的總影響，顯然β和β2的含義是不同的。偏回歸系數(shù)bj就是xj本身變化對y的直接（凈）影響。

6即對于n組觀測值，有回到一般模型

t=1,2,…，7其矩陣形式為：

其中8

一、假設(shè)條件（1）E(ut)=0,t=1,2,…,n

（2）E(uiuj)=0,i≠j

（3）E(ut2)=σ2,t=1,2,…,n

（4）Xjt是非隨機(jī)量，j=1,2,…kt=1,2,…n第二節(jié)多元線性回歸模型的估計(jì)

多元線性回歸模型的估計(jì)與雙變量線性模型類似，仍采用最小二乘法。當(dāng)然，計(jì)算要復(fù)雜得多，通常要借助計(jì)算機(jī)。理論推導(dǎo)需借助矩陣代數(shù)。下面給出最小二乘法應(yīng)用于多元線性回歸模型的假設(shè)條件、估計(jì)結(jié)果及所得到的估計(jì)量的性質(zhì)。9

除上面4條外，在多個(gè)解釋變量的情況下，還有兩個(gè)條件需要滿足：（5）（K+1）<n;

即觀測值的數(shù)目要大于待估計(jì)的參數(shù)的個(gè)數(shù)（要有足夠數(shù)量的數(shù)據(jù)來擬合回歸線）。（6）各解釋變量之間不存在嚴(yán)格的線性關(guān)系。10上述假設(shè)條件可用矩陣表示為以下四個(gè)條件：

(1)E(u)=0

(2)

這兩個(gè)條件成立時(shí)才成立，因此，此條件相當(dāng)前面條件(2),(3)兩條，即各期擾動項(xiàng)互不相關(guān)，并具有常數(shù)方差。E(uiuj)=0,i≠jE(ut2)=σ2,t=1,2,…,n顯然，僅當(dāng)由于11

（3）X是一個(gè)非隨機(jī)元素矩陣。（4）Rank(X)=(K+1)<n.------相當(dāng)于前面(5)、(6)兩條即矩陣X的秩=（K+1)<n

當(dāng)然，為了后面區(qū)間估計(jì)和假設(shè)檢驗(yàn)的需要，還要加上一條：

（5）～，t=1,2,…n12我們的模型是：

二、最小二乘估計(jì)殘差為：問題是選擇，使得殘差平方和最小。t=1,2,…n13要使殘差平方和我們得到如下K+1個(gè)方程（即正規(guī)方程）：為最小，則應(yīng)有：14按矩陣形式，上述方程組可表示為：15即=16

我們的模型為

三、最小二乘估計(jì)量的性質(zhì)1．的均值估計(jì)式為17

這表明，OLS估計(jì)量是無偏估計(jì)量。（由假設(shè)3）

(由假設(shè)1)

即

182．的方差

這是一個(gè)（K+1）*(K+1)矩陣，其主對角線上元素即構(gòu)成Var(),非主對角線元素是相應(yīng)的協(xié)方差,如下所示:為求Var(),我們考慮19下面推導(dǎo)此矩陣的計(jì)算公式.20由上一段的結(jié)果，我們有因此，21

如前所述，我們得到的實(shí)際上不僅是的方差，而且是一個(gè)方差-協(xié)方差矩陣，為了反映這一事實(shí)，我們用下面的符號表示之：展開就是：22與雙變量線性模型相似，

2的無偏估計(jì)量是這是因?yàn)槲覀冊诠烙?jì)的過程中，失去了（K+1）個(gè)自由度。3．

的估計(jì)23

對于以及標(biāo)準(zhǔn)假設(shè)條件（1）-（4），普通最小二乘估計(jì)量是最佳線性無偏估計(jì)量（BLUE），具有無偏性、具有最小方差特性、具有一致性，漸近無偏性和漸近有效性。4．高斯-馬爾科夫定理24

我們已在上一段中證明了無偏性，下面證明最小方差性。證明的思路與雙變量模型中類似，只不過這里我們采用矩陣和向量的形式。25

現(xiàn)設(shè)為的任意一個(gè)線性無偏估計(jì)量，即其中是一個(gè)(K+1)*n非隨機(jī)元素矩陣。則顯然，若要為無偏估計(jì)量，即，只有，為（K+1）階單位矩陣。26

的方差為：

從而將的任意線性無偏估計(jì)量與OLS估計(jì)量聯(lián)系起來。我們可將寫成27由可推出：

由從而，因此上式中間兩項(xiàng)為0，我們有因而有即28

因此

最后的不等號成立是因?yàn)闉榘胝ň仃?。這就證明了OLS估計(jì)量是的所有線性無偏估計(jì)量中方差最小的。至此,我們證明了高斯-馬爾科夫定理。29

對于雙變量線性模型

Y=α+βX+u其中，=殘差平方和我們有第三節(jié)擬合優(yōu)度一、決定系數(shù)R230對于多元線性模型為方便計(jì)算，我們也可以用矩陣形式表示R2.我們可用同樣的方法定義決定系數(shù)：31

我們有：殘差，其中，殘差平方和：32而這就是決定系數(shù)R2的矩陣形式。將上述結(jié)果代入R2的公式，得到：33

殘差平方和的一個(gè)特點(diǎn)是，每當(dāng)模型增加一個(gè)解釋變量，并用改變后的模型重新進(jìn)行估計(jì)，殘差平方和的值會減小。由此可以推論，決定系數(shù)是一個(gè)與解釋變量的個(gè)數(shù)有關(guān)的量：

解釋變量個(gè)數(shù)增加

減小

增大也就是說，人們總是可以通過增加模型中解釋變量的方法來增大R2

的值。因此，用R2

來作為擬合優(yōu)度的測度，不是十分令人滿意的。為此，我們定義修正決定系數(shù)（Adjusted）如下：二、修正決定系數(shù)：34

是經(jīng)過自由度調(diào)整的決定系數(shù)，稱為修正決定系數(shù)。我們有：（1）（2）僅當(dāng)K=0時(shí)，等號成立。即（3）當(dāng)K增大時(shí)，二者的差異也隨之增大。（4）可能出現(xiàn)負(fù)值。35

下面我們給出兩個(gè)簡單的數(shù)值例子，以幫助理解這兩節(jié)的內(nèi)容.

例1 Yt=

2X2t+

3X3t+ut

設(shè)觀測數(shù)據(jù)為：Y：31835X2：31524X3：54646

試求各參數(shù)的OLS估計(jì)值，以及。解：我們有三、例子3637383940

例2.

設(shè)n=20,k=3,R2=0.10求。解：

由本例可看出，有可能為負(fù)值。這與R2不同（）。41

例2.

設(shè)n=20,k=3,R2=0.10求。解：

由本例可看出，有可能為負(fù)值。這與R2不同（）。

迄今為止，我們已解決了線性模型的估計(jì)問題。但在實(shí)際問題中，變量間的關(guān)系并非總是線性關(guān)系，經(jīng)濟(jì)變量間的非線性關(guān)系比比皆是。如大家所熟悉的柯布-道格拉斯生產(chǎn)函數(shù):

就是一例。在這樣一些非線性關(guān)系中，有些可以通過代數(shù)變換變?yōu)榫€性關(guān)系處理，另一些則不能。下面我們通過一些例子來討論這個(gè)問題。第四節(jié)非線性關(guān)系的處理一、線性模型的含義

線性模型的基本形式是:

其特點(diǎn)是可以寫成每一個(gè)解釋變量和一個(gè)系數(shù)相乘的形式。線性模型的線性包含兩重含義：（1）變量的線性變量以其原型出現(xiàn)在模型之中，而不是以X2或Xβ之類的函數(shù)形式出現(xiàn)在模型中。（2）參數(shù)的線性因變量Y是各參數(shù)的線性函數(shù)。

對于線性回歸分析，只有第二種類型的線性才是重要的，因?yàn)樽兞康姆蔷€性可通過適當(dāng)?shù)闹匦露x來解決。例如，對于

此方程的變量和參數(shù)都是線性的。如果原方程的擾動項(xiàng)滿足高斯—馬爾可夫定理?xiàng)l件，重寫的方程的擾動項(xiàng)也將滿足。二、線性化方法1.解釋變量非線性

參數(shù)的非線性是一個(gè)嚴(yán)重得多的問題，因?yàn)樗荒軆H憑重定義來處理?？墒牵绻Ｐ偷挠叶擞梢幌盗械腦β或eβX項(xiàng)相乘，并且擾動項(xiàng)也是乘積形式的，則該模型可通過兩邊取對數(shù)線性化。例如，需求函數(shù)

其中，Y=對某商品的需求

X=收入

P=相對價(jià)格指數(shù)

ν=擾動項(xiàng)可轉(zhuǎn)換為：2.參數(shù)非線性

用X,Y,P的數(shù)據(jù)，我們可得到logY,logX和logP,從而可以用OLS法估計(jì)上式。

logX的系數(shù)是β的估計(jì)值，經(jīng)濟(jì)含義是需求的收入彈性，logP的系數(shù)將是γ的估計(jì)值，即需求的價(jià)格彈性。

[注釋]

彈性（elasticity）：一變量變動1%所引起的另一變量變動的百分比：

需求的收入彈性：收入變化1%，價(jià)格不變時(shí)，所引起的商品需求量變動的百分比。

需求的價(jià)格彈性：價(jià)格變化1%，收入不變時(shí)，所引起的商品需求量變動的百分比。⒊不可以化為線性的包含參數(shù)非線性的問題

例1需求函數(shù)本章§1中，我們曾給出一個(gè)食品支出為因變量，個(gè)人可支配收入和食品價(jià)格指數(shù)為解釋變量的線性回歸模型例子。現(xiàn)用這三個(gè)變量的對數(shù)重新估計(jì)（采用同樣的數(shù)據(jù)），得到如下結(jié)果（括號內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差）：回歸結(jié)果表明，需求的收入彈性是0.64,需求的價(jià)格彈性是0.48，這兩個(gè)系數(shù)都顯著異于0。三、例子

例2．柯布-道格拉斯生產(chǎn)函數(shù)生產(chǎn)函數(shù)是一個(gè)生產(chǎn)過程中的投入及其產(chǎn)出之間的一種關(guān)系。著名的柯布-道格拉斯生產(chǎn)函數(shù)（C-D函數(shù)）為

用柯布和道格拉斯最初使用的數(shù)據(jù)（美國1899-1922年制造業(yè)數(shù)據(jù)）估計(jì)經(jīng)過線性變換的模型得到如下結(jié)果：

從上述結(jié)果可以看出，產(chǎn)出的資本彈性是0.23，產(chǎn)出的勞動彈性為0.81。50

上面討論了因變量和解釋變量都采用對數(shù)的雙對數(shù)模型，下面再介紹幾種比較常見的函數(shù)形式的模型，為讀者的回歸實(shí)踐多提供幾種選擇方案。這幾種模型是：

半對數(shù)模型雙曲函數(shù)模型多項(xiàng)式回歸模型四、幾種有用的變量非線性模型511.半對數(shù)模型半對數(shù)模型指的是因變量和解釋變量中一個(gè)為對數(shù)形式而另一個(gè)為線性的模型。因變量為對數(shù)形式的稱為對數(shù)-線性模型(log-linmodel)。解釋變量為對數(shù)形式的稱為線性-對數(shù)模型(lin-logmodel)。

52我們先介紹前者，其形式如下：對數(shù)-線性模型中，斜率的含義是Y的百分比變動，即解釋變量X變動一個(gè)單位引起的因變量Y的百分比變動。這是因?yàn)?，利用微分可以得出?3

這表明，斜率度量的是解釋變量X的單位變動所引起的因變量Y的相對變動。將此相對變動乘以100，就得到Y(jié)的百分比變動，或者說得到Y(jié)的增長率。由于對數(shù)-線性模型中斜率系數(shù)的這一含義，因而也叫增長模型(growthmodel)。增長模型通常用于測度所關(guān)心的經(jīng)濟(jì)變量（如GDP）的增長率。例如，我們可以通過估計(jì)下面的半對數(shù)模型

得到一國GDP的年增長率的估計(jì)值，這里t為時(shí)間趨勢變量。54例3測算1978-2010中國國內(nèi)生產(chǎn)總值的增長率

名義值不變價(jià)t

名義值不變價(jià)t19783645.2173645.2171199448197.8616480.331719794062.5793921.2642199560793.7318280.81819804545.6244228.7483199671176.5920110.441919814891.5614472.2764199778973.0321980.112019825323.3514877.3245199884402.2823701.892119835962.6525406.6596199989677.0525507.942219847208.0526227.1757200099214.5527658.582319859016.0377065.73882001109655.229954.3324198610275.187690.892002120332.732674.8125198712058.628581.645102003135822.835950.5826198815042.829549.705112004159878.339576.2127198916992.329937.729122005184937.444052.2928199018667.8210319.24132006216314.449636.629199121781.511194.06142007265810.356666.3330199226923.4812788.18152008314045.462125.9431199335333.9214573.96162009340902.867530.932

201040326074013.873355不變值56斜率0.095表示，中國GDP在1978-2010年間的平均年增長率為0.095，即以每年9.5％的速度增長。57例4

1949－2003年的中國人口增長率

斜率0.01685表示，樣本期間平均而言，中國人口的年增長率為0.01685，即人口以每年1.685％的速度增長。截距項(xiàng)10.924可解釋為：10.924＝log（Y0），即Y0

＝55475.68,可解釋為1948年的人口數(shù)。 58線性-對數(shù)模型的形式如下：與前面類似，我們可用微分得到這表明因此59

上式表明，Y的絕對變動量等于乘以X的相對變動量。因此,線性-對數(shù)模型通常用于研究解釋變量每變動1%引起的因變量的絕對變動量是多少這類問題。當(dāng)X變動1%時(shí)，y變動

1/100或0.011。2.雙曲函數(shù)模型雙曲函數(shù)模型的形式為:60

不難看出，這是一個(gè)僅存在變量非線性的模型，很容易用重新定義的方法將其線性化。雙曲函數(shù)模型的特點(diǎn)是，當(dāng)X趨向無窮時(shí)，Y趨向，反映到圖上，就是當(dāng)X趨向無窮時(shí)，Y將無限靠近其漸近線（Y=）。雙曲函數(shù)模型通常用于描述著名的恩格爾曲線和菲利普斯曲線。61

多項(xiàng)式回歸模型通常用于描述生產(chǎn)成本函數(shù)，其一般形式為：

其中Y表示長期平均成本LAC，Q表示產(chǎn)出，P為多項(xiàng)式的階數(shù)，一般不超過四階。多項(xiàng)式回歸模型中，解釋變量X以不同冪次出現(xiàn)在方程的右端。這類模型也僅存在變量非線性，因而很容易線性化，可用OLS法估計(jì)模型。3.多項(xiàng)式回歸模型62五、非線性回歸上面討論了如何將非線性模型轉(zhuǎn)換為線性模型的方法，僅有變量非線性的模型，只要將模型中的非線性變量重新定義即可，而存在參數(shù)非線性的模型，則除了很小一部分能通過方程兩端取對數(shù)線性化外，大多數(shù)都無法線性化。我們通過下面的兩個(gè)例子說明之。例5

貨幣需求量與利率之間的關(guān)系M=a(r-2)bu這里，變量非線性和參數(shù)非線性并存。對此方程采用對數(shù)變換logM=loga+blog(r-2)+logu

令Y=logM,X=log(r-2),β1=loga,β2=b

則變換后的模型為：

Yt=β1+β2Xt+Vt

將OLS法應(yīng)用于此模型，可求得β1和β2的估計(jì)值從而可通過下列兩式求出a和b估計(jì)值：

應(yīng)當(dāng)指出，在這種情況下，線性模型估計(jì)量的性質(zhì)（如BLUE,正態(tài)性等）只適用于變換后的參數(shù)估計(jì)量，而不一定適用于原模型參數(shù)的估計(jì)量和。

例6上例在確定貨幣需求量的關(guān)系式時(shí)，我們實(shí)際上給模型加進(jìn)了一個(gè)結(jié)束條件。根據(jù)理論假設(shè)，在某一利率水平上，貨幣需求量在理論上是無窮大。我們假定這個(gè)利率水平為2%。假如不給這一約束條件，而是從給定的數(shù)據(jù)中估計(jì)該利率水平的值，則模型變?yōu)椋?/p>

M=a(r-c)b

式中a,b,c均為參數(shù)。仍采用對數(shù)變換，得到

log(Mt)=loga+blog(rt-c)+utt=1,2,…,n

我們無法將log(rt-c)定義為一個(gè)可觀測的變量X,因?yàn)檫@里有一個(gè)未知量c。也就是說，此模型無法線性化。在這種情況下，只能用估計(jì)非線性模型參數(shù)值的方法。

模型

Y=a(X-c)b是一個(gè)非線性模型，a、b和c是要估計(jì)的參數(shù)。此模型無法用取對數(shù)的方法線性化，只能用非線性回歸技術(shù)進(jìn)行估計(jì)，如非線性最小二乘法（NLS）。該方法的原則仍然是殘差平方和最小。計(jì)量經(jīng)濟(jì)軟件包通常提供這類方法，這里給出有關(guān)非線性回歸方法的大致步驟如下：1．首先給出各參數(shù)的初始估計(jì)值（合理猜測值）;2．用這些參數(shù)值和X觀測值數(shù)據(jù)計(jì)算Y的各期預(yù)測值（擬合值）;3．計(jì)算各期殘差，然后計(jì)算殘差平方和∑e2;4．對一個(gè)或多個(gè)參數(shù)的估計(jì)值作微小變動；

5．計(jì)算新的Y預(yù)測值、殘差平方和∑e2；

6．若新的∑e2小于老的∑e2，說明新參數(shù)估計(jì)值優(yōu)于老估計(jì)值，則以它們作為新起點(diǎn)；

7．重復(fù)步驟4，5，6，直至無法減小∑e2為止。

8．最后的參數(shù)估計(jì)值即為最小二乘估計(jì)值。非線性回歸方法的步驟68一、系數(shù)的顯著性檢驗(yàn)1．單個(gè)系數(shù)顯著性檢驗(yàn)?zāi)康氖菣z驗(yàn)?zāi)硞€(gè)解釋變量的系數(shù)βj是否為0，即該解釋變量是否對因變量有影響。原假設(shè)：H0：

βj=0

備擇假設(shè)：H1：

βj≠0

檢驗(yàn)統(tǒng)計(jì)量是自由度為n-K-1的t統(tǒng)計(jì)量：～t(n-K-1)第五節(jié)假設(shè)檢驗(yàn)69其中，為矩陣主對角線上第j+1個(gè)元素。而70例7柯布-道格拉斯生產(chǎn)函數(shù)用柯布和道格拉斯最初使用的數(shù)據(jù)（美國1899-1922年制造業(yè)數(shù)據(jù)）估計(jì)經(jīng)過線性變換的模型得到如下結(jié)果（括號內(nèi)數(shù)字為標(biāo)準(zhǔn)誤差）：請檢驗(yàn)“斜率”系數(shù)和的顯著性。71解：(1)檢驗(yàn)的顯著性

原假設(shè)H0：

備擇假設(shè)H1：

≠0

由回歸結(jié)果，我們有：t＝0.23/0.06=3.83用=24－3＝21查t表，5%顯著性水平下，tc＝2.08.∵t＝3.83tc＝2.08，故拒絕原假設(shè)H0。結(jié)論：顯著異于0。72(2)檢驗(yàn)的顯著性原假設(shè)H0：

備擇假設(shè)H1：

≠0

由回歸結(jié)果，我們有：t＝0.81/0.15=5.4∵t＝5.4tc＝2.08，故拒絕原假設(shè)H0。結(jié)論：顯著異于0。73

有時(shí)需要同時(shí)檢驗(yàn)若干個(gè)系數(shù)是否為0，這可以通過建立單一的原假設(shè)來進(jìn)行。設(shè)要檢驗(yàn)g個(gè)系數(shù)是否為0，即與之相對應(yīng)的g個(gè)解釋變量對因變量是否有影響。不失一般性，可設(shè)原假設(shè)和備擇假設(shè)為：

H0:β1=β2=…=βg

=0H1:

H0不成立

(即X1,…Xg中某些變量對Y有影響)2．若干個(gè)系數(shù)的顯著性檢驗(yàn)（聯(lián)合假設(shè)檢驗(yàn)）74分析：這實(shí)際上相當(dāng)于檢驗(yàn)g個(gè)約束條件

β1=0，β2=0，…，βg

=0是否同時(shí)成立。若H0為真，則正確的模型是：

據(jù)此進(jìn)行回歸（有約束回歸），得到殘差平方和

SR是H0為真時(shí)的殘差平方和。

若H1為真，正確的模型即原模型：75

據(jù)此進(jìn)行無約束回歸（全回歸），得到殘差平方和

S是H1為真時(shí)的殘差平方和。如果H0為真，則不管X1,…Xg這g個(gè)變量是否包括在模型中，所得到的結(jié)果不會有顯著差別，因此應(yīng)該有：

S≈SR如果H1為真，則由上一節(jié)中所討論的殘差平方和∑e2的特點(diǎn)，無約束回歸增加了變量的個(gè)數(shù)，應(yīng)有

S<SR

通過檢驗(yàn)二者差異是否顯著地大，就能檢驗(yàn)原假設(shè)是否成立。76所使用的檢驗(yàn)統(tǒng)計(jì)量是：

～F(g,n-K-1)其中，g為分子自由度，n-K-1為分母自由度。使用的作用是消除具體問題中度量單位的影響，使計(jì)算出的F值是一個(gè)與度量單位無關(guān)的量。77例8給定20組Y,X1,X2,X3的觀測值，試檢驗(yàn)?zāi)Ｐ椭蠿1和X3對Y是否有影響？解：（1）全回歸估計(jì)得到：S=∑e2=25

（2）有約束回歸

估計(jì)得到：SR=∑e2=3078

原假設(shè)

H0:β1=

β3=0

備擇假設(shè)

H1:

H0不成立我們有：n=20,g=2,K=3

用自由度（2，16）查F分布表，5%顯著性水平下，F(xiàn)C=3.63∵F=1.6<FC=3.63,故接受H0。結(jié)論：X1和X3對Y無顯著影響79

上一段結(jié)果的一個(gè)特例是所有斜率系數(shù)均為0的檢驗(yàn)，即回歸方程的顯著性檢驗(yàn)：

H0：

β1=β2=…=βK=0

也就是說，所有解釋變量對Y均無影響。注意到g=K，

則該檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量為：

3．全部斜率系數(shù)為0的檢驗(yàn)80

分子分母均除以，有

從上式不難看出，全部斜率為0的檢驗(yàn)實(shí)際是檢驗(yàn)R2的值是否顯著異于0，如果接受原假設(shè)，則表明因變量的行為完全歸因于隨機(jī)變化。若拒絕原假設(shè)，則表明所選擇模型對因變量的行為能夠提供某種程度的解釋。81

上面所介紹的檢驗(yàn)若干個(gè)系數(shù)顯著性的方法，也可以應(yīng)用于檢驗(yàn)施加于系數(shù)的其他形式的約束條件，如

檢驗(yàn)的方法仍是分別進(jìn)行有約束回歸和無約束回歸，求出各自的殘差平方和SR和S，然后用F統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。當(dāng)然，單個(gè)系數(shù)的假設(shè)檢驗(yàn)，如H0：

3=1.0，亦可用t檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。二、檢驗(yàn)其他形式的系數(shù)約束條件82例9Cobb-Douglas生產(chǎn)函數(shù)

Y=AKαLβν

試根據(jù)美國制造業(yè)1899-1922年數(shù)據(jù)檢驗(yàn)規(guī)模效益不變的約束：α+β=1解：（1）全回歸

（2）有約束回歸：將約束條件代入，要回歸的模型變?yōu)椋?/p>

Y=AKαL1-αν

為避免回歸系數(shù)的不一致問題，兩邊除以L，模型變換為：

Y/L=A(K/L)αν

回歸，得：

由軟件包可得到約束回歸和全回歸的殘差平方和分別為

SR=0.0716S=0.0710

（3）檢驗(yàn)

原假設(shè)

H0:α+β＝1

備擇假設(shè)

H1:α+β≠1

本例中，g=1,K=2,n=24

用自由度（1，21）查F表，5%顯著性水平下，F(xiàn)c=4.32∵F=0.18<Fc=4.32

故接受原假設(shè)H0:α+β＝1

（4）結(jié)論我們的數(shù)據(jù)支持規(guī)模收益不變的假設(shè)。85

與雙變量模型的作法類似，預(yù)測指的是對各自變量的某一組具體值來預(yù)測與之相對應(yīng)的因變量值。當(dāng)然，要進(jìn)行預(yù)測，有一個(gè)假設(shè)前提應(yīng)當(dāng)滿足，即擬合的模型在預(yù)測期也成立。

點(diǎn)預(yù)測值由與給定的諸X值對應(yīng)的回歸值給出，即

而預(yù)測期的實(shí)際Y值由下式給出：

其中u0是從預(yù)測期的擾動項(xiàng)分布中所取的值。第六節(jié)

預(yù)測86預(yù)測誤差可定義為：87

從的定義可看出，為正態(tài)變量的線性函數(shù)，因此，它本身也服從正態(tài)分布。故預(yù)測誤差的方差為：88

由于為未知，我們用其估計(jì)值代替它，有

則的95%置信區(qū)間為：（其中，）89例10用書上例4.3的數(shù)據(jù)，預(yù)測X2=10，X3=10的Y值。

解：

由例4.3我們已得到：

90因此

的95%置信區(qū)間為：或3.66至23.65之間.91

1.虛擬變量的定義

在回歸分析中，常常碰到這樣一種情況，即因變量的波動不僅依賴于那種能夠很容易按某種尺度定量化的變量（如收入、產(chǎn)出、價(jià)格、身高、體重等），而且依賴于某些定性的變量（如性別、地區(qū)、季節(jié)等）。在經(jīng)濟(jì)系統(tǒng)中，許多變動是不能定量的。如政府的更迭（工黨-保守黨）、經(jīng)濟(jì)體制的改革、固定匯率變?yōu)楦訁R率、從戰(zhàn)時(shí)經(jīng)濟(jì)轉(zhuǎn)為和平時(shí)期經(jīng)濟(jì)等。

第七節(jié)虛擬變量（Dummyvariables）一、虛擬變量的概念92

這樣一些變動都可以用大家所熟悉的0-1變量來表示，用1表示具有某一“品質(zhì)”或?qū)傩裕?表示不具有該“品質(zhì)”或?qū)傩?。這種變量在計(jì)量經(jīng)濟(jì)學(xué)中稱為“虛擬變量”。虛擬變量是一用以反映質(zhì)的屬性的一個(gè)人工變量，通常記為D（Dummy）。下面給出幾個(gè)可以引入虛擬變量的例子。93例1：你在研究學(xué)歷和收入之間的關(guān)系，在你的樣本中，既有女性又有男性，你打算研究在此關(guān)系中，性別是否會導(dǎo)致差別。例2：你在研究某省家庭收入和支出的關(guān)系，采集的樣本中既包括農(nóng)村家庭，又包括城鎮(zhèn)家庭，你打算研究二者的差別。例3：你在研究通貨膨脹的決定因素，在你的觀測期中，有些年份政府實(shí)行了一項(xiàng)收入政策。你想檢驗(yàn)該政策是否對通貨膨脹產(chǎn)生影響。

上述各例都可以用兩種方法來解決，一種解決方法是分別進(jìn)行兩類情況的回歸，然后看參數(shù)是否不同。另一種方法是用全部觀測值作單一回歸，將定性因素的影響用虛擬變量引入模型。942.虛擬變量模型的定義

虛擬變量在模型中，可以作解釋變量，也可以作因變量。引入虛擬變量后，回歸方程中同時(shí)含有一般解釋變量和虛擬變量，稱這種變量結(jié)構(gòu)的模型為虛擬變量模型或斜方差分析模型。虛擬變量作因變量的模型又稱抉擇模型。

953.設(shè)置虛擬變量的原則在模型中引入多個(gè)虛擬變量時(shí)，虛擬變量的個(gè)數(shù)應(yīng)按下列原則確定：

在模型存在截距項(xiàng)的情況下，如果有m種互斥的屬性類型，在模型中引入m-1個(gè)虛擬變量。如果不如此，m個(gè)狀態(tài)引入m個(gè)虛擬變量來表示，虛擬變量間會造成多重共線。例如，性別有2個(gè)互斥的屬性，引用2-1=1個(gè)虛擬變量再如，文化程度分小學(xué)、初中、高中、大學(xué)、研究生5類，引用4個(gè)虛擬變量。961．截距變動設(shè)Y表示消費(fèi)，X表示收入，我們有：

}假定β不變。對于5年戰(zhàn)爭和5年和平時(shí)期的數(shù)據(jù)，我們可分別估計(jì)上述兩個(gè)模型，一般將給出的不同值?，F(xiàn)引入虛擬變量D,將兩式并為一式：

其中，

二、虛擬變量的使用方法D的數(shù)據(jù)為0，0，0，0，0，1，1，1，1，1。97

此式等價(jià)于下列兩式：

}截距變動，斜率不變

估計(jì)結(jié)果如下圖所示：

應(yīng)用t檢驗(yàn)，β2是否顯著可以表明截距項(xiàng)在兩個(gè)時(shí)期是否有變化。98斜率變動稱為系數(shù)虛擬，是為了反映結(jié)構(gòu)變化之前和之后的回歸系數(shù)（斜率）的差異（而不是常數(shù)項(xiàng)）而采取的虛擬變量處理方法：2．斜率變動0

結(jié)構(gòu)變化之前1

結(jié)構(gòu)變化之后

不難看出，上式相當(dāng)于下列兩式：其中，系數(shù)虛擬D＝99也就是說，結(jié)構(gòu)變化之后的回歸系數(shù)為β1+β2，結(jié)構(gòu)變化之前的回歸系數(shù)為β1。不論在哪種情形下，常數(shù)項(xiàng)均為α。同樣，包括虛擬變量的模型中，β2是否顯著可以表明斜率在兩個(gè)時(shí)期是否變化。100在這種情況下，模型可設(shè)為：

引進(jìn)了虛擬變量的回歸模型對于檢驗(yàn)兩個(gè)時(shí)期中是否發(fā)生結(jié)構(gòu)性變化很方便。如上例中，相當(dāng)于檢驗(yàn)

H0:β2=β4=0。3．斜率和截距都變動此式等價(jià)于下列兩個(gè)單獨(dú)的回歸式：其中，D={101

許多變量展示出季節(jié)性的變異(如商品零售額、電和天然氣的消費(fèi)等)，我們在建立模型時(shí)應(yīng)考慮這一點(diǎn)，這有兩種方法：（1）在估計(jì)前對數(shù)據(jù)進(jìn)行季節(jié)調(diào)整；（2）采用虛擬變量將季節(jié)性差異反映在模型中。4．季節(jié)虛擬變量的使用季度虛擬是通過回歸模型的常數(shù)項(xiàng)變化（斜率回歸系數(shù)一定）來掌握季度和月度等季節(jié)變化，因此，從“技術(shù)的角度”稱為“常數(shù)項(xiàng)虛擬”。102例11

我國天然氣消耗量模型設(shè)Y＝我國天然氣的消耗量（億立方米）t＝時(shí)間趨勢

用我國2014（1）-2017(4)的季度數(shù)據(jù)，得回歸結(jié)果如下：

這一結(jié)果不理想，低R2值，因?yàn)槭褂玫氖羌径葦?shù)據(jù)，考慮到可能是季節(jié)變異的問題，我們建立下面的模型：103各季度的截距分別為：1季度：

0+12季度：

0+23季度：

0+34季度：

0請注意我們僅用了3個(gè)虛擬變量就可表示4個(gè)季度的情況。104X=1

10011

01021

00131

00041

10051

106┆┆┆┆┆1………n

Q1Q2Q3X105重新回歸模型，結(jié)果如下：擬合度提高很多，模型結(jié)果得到改善。四個(gè)季度的截距項(xiàng)分別為：469.72，337.35，340.99，508.13。106*第八節(jié)極大似然法

與普通最小二乘法相比，一個(gè)具有更強(qiáng)的理論性質(zhì)的點(diǎn)估計(jì)方法是極大似然法（MaximumLikelihoodmethod，ML）。極大似然法的一般概念是，設(shè)是隨機(jī)變量X的密度函數(shù)，若有一隨機(jī)樣本X1，X2，…XN，則的極大似然估計(jì)值是具有產(chǎn)生該觀測樣本的最高概率的那個(gè)值，或者換句話說，的極大似然估計(jì)值是使密度函數(shù)達(dá)到最大的值。下面讓我們通過一個(gè)例子來進(jìn)一步說明極大似然法的概念。107一、似然的概念一個(gè)樣本發(fā)生的概率稱為該樣本的似然。例如，拋一枚不均衡的硬幣10次，得到4次正面。根據(jù)二項(xiàng)分布，我們有

其中X=出現(xiàn)正面的次數(shù)

p=一次拋擲中出現(xiàn)正面的概率，即P(正面)

根據(jù)似然的定義，P(X=4)是當(dāng)P(正面)=p時(shí)，X=4的似然。我們有：108

由于p是未知的，我們可以通過選擇一個(gè)值來估計(jì)它，這個(gè)使似然最大，或者說，這個(gè)值給出該樣本結(jié)果的可能性最大。我們可以通過下面兩種方法求得。（1）迭代法試不同的值，找出使似然最大的值。在本例中，由于p=0.4時(shí)P(X=4)=0.251為最大，即這個(gè)值最有可能給出10次拋擲中出現(xiàn)4次正面的結(jié)果，因此=0.4。（2）計(jì)算法設(shè),令，求得使L達(dá)到最大的p值。計(jì)算結(jié)果，=0.4。109二、正態(tài)分布參數(shù)的極大似然估計(jì)給定一個(gè)取自正態(tài)分布的隨機(jī)樣本X1，X2,…Xn，我們希望估計(jì)總體均值μ和總體方差。我們有該樣本的似然

L=P(樣本值為X1,X2,…Xn)110令我們可求得：我們有而這表明：111三、雙變量線性回歸模型的極大似然估計(jì)模型：假設(shè)（與最小二乘法相同）：由假設(shè)我們有因而~112故對于Y1,Y2,…Yn，有當(dāng)L被看作是參數(shù)的函數(shù)時(shí)，稱為似然函數(shù)，表示為，極大似然法要求我們選擇使似然函數(shù)達(dá)到最大的參數(shù)估計(jì)值。在很多情況下，極大化似然函數(shù)的對數(shù)要比極大化似然函數(shù)本身方便一些，并且結(jié)果相同，因?yàn)槎咴谙嗤狞c(diǎn)獲得最大值，因此我們寫出的對數(shù)：113令

得：不難看出，前兩式與用普通最小二乘法得出的正規(guī)方程相同，故。但最后一式表明，的極大似然估計(jì)量與最小二乘估計(jì)量不同。114最小二乘估計(jì)量是一個(gè)無偏估計(jì)量。而這表明是一個(gè)有偏估計(jì)量。不難看出，當(dāng)樣本容量趨向無窮時(shí)，

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第四章-多元線性回歸模型

文檔簡介

溫馨提示

最新文檔

評論

第四章-多元線性回歸模型

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔