版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第三章第三章 雙變量線性回歸模型雙變量線性回歸模型 (簡單線性回歸模型)(Simple Linear Regression Model)第一節(jié) 雙變量線性回歸模型的估計(jì)第二節(jié) 最小二乘估計(jì)量的性質(zhì)第三節(jié) 擬合優(yōu)度的測度第四節(jié) 雙變量回歸中的區(qū)間估計(jì)和假 設(shè)檢驗(yàn)第五節(jié) 預(yù)測第六節(jié) 有關(guān)最小二乘法的進(jìn)一步討論第一節(jié) 雙變量線性回歸模型的估計(jì) 一. 雙變量線性回歸模型的概念 設(shè) Y = 消費(fèi), X = 收入, 我們根據(jù)數(shù)據(jù)畫出散點(diǎn)圖 Y * 這意味著 * Y = + X (1) * 寫出計(jì)量經(jīng)濟(jì)模型 * Y = + X + u (2) * 其中 u = 擾動項(xiàng)或 誤差項(xiàng) Y為因變量或被解釋變量 圖1
2、 X X為自變量或解釋變量 和 為未知參數(shù) 設(shè)我們有Y和X的n對觀測值數(shù)據(jù),則根據(jù)(2)式,變量Y的每個觀測值應(yīng)由下式?jīng)Q定: Yi = + Xi + ui , i = 1, 2, .,n (3) (3)式稱為雙變量線性回歸模型雙變量線性回歸模型或簡單線性回歸模簡單線性回歸模型型。其中 和 為未知的總體參數(shù),也稱為回歸模型的系數(shù)(系數(shù)( coefficients)。)。下標(biāo) i是觀測值的序號。 當(dāng)數(shù)據(jù)為時(shí)間序列時(shí),往往用下標(biāo) t來表示觀測值的序號,從而(3)式變成 Yt = + Xt + ut , t = 1, 2, .,n (3)為何要在模型中包括擾動項(xiàng)為何要在模型中包括擾動項(xiàng)u 我們在上一章
3、中已初步介紹了為什么要在模型中包括擾動項(xiàng)u,下面進(jìn)一步說明之: (1)真正的關(guān)系是Y = f (X1, X2, ),但X2, X3, 相對不重要,用u代表之。 (2)兩變量之間的關(guān)系可能不是嚴(yán)格線性的,u反映了與直線的偏差。 (3)經(jīng)濟(jì)行為是隨機(jī)的,我們能夠用 Y=+X 解釋“典型”的行為,而用u來表示個體偏差。 (4)總會出現(xiàn)測量誤差, 使得任何精確的關(guān)系不可能存在。 XX二. 普通最小二乘法(OLS法, Ordinary Least squares)1.雙變量線性回歸模型的統(tǒng)計(jì)假設(shè)雙變量線性回歸模型的統(tǒng)計(jì)假設(shè) 我們的模型是: Yt = + Xt + ut , t = 1, 2, .,n 這
4、里 和 為未知總體參數(shù),下一步的任務(wù)是應(yīng)用統(tǒng)計(jì)學(xué)的方法,由Y和X的觀測值(即樣本數(shù)據(jù))來估計(jì)和 的總體值,常用的估計(jì)方法就是最小二乘法。為了應(yīng)用最小二乘法,得到好的估計(jì)量,雙變量線性回歸模型需要滿足一些統(tǒng)計(jì)假設(shè)條件,這些統(tǒng)計(jì)假設(shè)是:雙變量線性回歸模型的統(tǒng)計(jì)假設(shè) (1). E(ut) = 0, t= 1, 2, .,n 即各期擾動項(xiàng)的均值(期望值)為0. (2). E(uiuj) = 0 i j 即各期擾動項(xiàng)互不相關(guān). (3). E(ut2 ) = 2 , t= 1, 2, .,n 即各期擾動項(xiàng)方差是一常數(shù). (4). 解釋變量Xt 為非隨機(jī)量 即Xt的取值是確定的, 而不是隨機(jī)的. (5).
5、ut N( 0, 2 ) , t= 1, 2, .,n 即各期擾動項(xiàng)服從正態(tài)分布。 下面簡單討論一下上述假設(shè)條件。(1)E(ut) = 0, t=1,2,n 即各期擾動項(xiàng)的均值(期望值)均為0。 均值為0的假設(shè)反映了這樣一個事實(shí):擾動項(xiàng)被假定為對因變量的那些不能列為模型主要部分的微小影響。沒有理由相信這樣一些影響會以一種系統(tǒng)的方式使因變量增加或減小。因此擾動項(xiàng)均值為0的假設(shè)是合理的。(2)E(uiuj) = 0, ij 即各期擾動項(xiàng)互不相關(guān)。也就是假定它們之間無自相關(guān)或無序列相關(guān)。 實(shí)際上該假設(shè)等同于: cov( ui, uj) = 0, ij這是因?yàn)椋篶ov(ui, uj) = Eui -
6、E(ui)uj - E(uj) = E(uiuj) 根據(jù)假設(shè)(1)(3)E(ut2)= 2, t=1,2,n 即各期擾動項(xiàng)的方差是一常數(shù),也就是假定各擾動項(xiàng)具有同方差性。實(shí)際上該假設(shè)等同于: Var( ut) = 2, t=1,2,n這是因?yàn)椋?Var(ut)=Eut-E(ut)2= E(ut2) 根據(jù)假設(shè)(1)(4) Xt為非隨機(jī)量 即Xt的取值是確定的, 而不是隨機(jī)的。 事實(shí)上,我們后面證明無偏性時(shí)僅需要解釋變量X與擾動項(xiàng)u不相關(guān),但不容易驗(yàn)證之,因而通常采用非隨機(jī)量的假設(shè)。 (5)ut N( 0, 2 ) , t= 1, 2, .,n 即擾動項(xiàng)服從正態(tài)分布。 滿足條件(1)(4)的線性回
7、歸模型稱為古典線性回歸模型(CLR模型)。 2.最小二乘原理 我們的任務(wù)是, 在給定X和Y的一組觀測值 (X1 , Y1), (X2 , Y2) , ., (Xn , Yn) 的情況下, 求出 Yt = + Xt + ut 中 和 的估計(jì)值 和 , 使得擬合的直線為最佳。 直觀上看,也就是要求在X和Y的散點(diǎn)圖上穿過各觀測點(diǎn)畫出一條“最佳”直線,如下圖所示。 * * * * * et * * * * * * * * * * * * YXXt 圖 2 YttYXY殘差殘差 擬合的直線 稱為擬合的回歸線. 對于任何數(shù)據(jù)點(diǎn) (Xt, Yt), 此直線將Yt 的總值 分成兩部分。 第一部分是Yt的擬合值
8、或預(yù)測值 : , t=1,2,n第二部分,et ,代表觀測點(diǎn)對于回歸線的誤差,稱為擬合或預(yù)測的殘差殘差 (residuals):): t=1,2,n 即 t=1,2,ntYttXYtttXYe tttYYeXY15殘差平方和 我們的目標(biāo)是使擬合出來的直線在某種意義上是最佳的,直觀地看,也就是要求估計(jì)直線盡可能地靠近各觀測點(diǎn),這意味著應(yīng)使殘差總體上盡可能地小。要做到這一點(diǎn),就必須用某種方法將每個點(diǎn)相應(yīng)的殘差加在一起,使其達(dá)到最小。理想的測度是殘差平方和,即22)(tttYYe最小二乘法 最小二乘法就是選擇一條直線,使其殘差平方和達(dá)到最小值的方法。即選擇 和 ,使得222)()(tttttXYYY
9、eS達(dá)到最小值。 運(yùn)用微積分知識,使上式達(dá)到最小值的必要條件為:即)2(0)(2) 1 (0)(1(20tttttXYXSXYSSS整理,得:此二式稱為正規(guī)方程。解此二方程,得:其中: 樣本均值 離差)4()3(2ttttttXXYXXnY)6()5()()(22XYxyxXXYYXXttttttYYyXXxnXXnYYtttttt,(5)式和(6)式給出了OLS法計(jì)算 和 的公式, 和 稱為線性回歸模型 Yt = + Xt + ut 的參數(shù) 和 的普通最小二乘估計(jì)量 (OLS estimators)。 這兩個公式可用于任意一組觀測值數(shù)據(jù),以求出截距和斜率的OLS估計(jì)值(estimates),
10、估計(jì)值是從一組具體觀測值用公式計(jì)算出的數(shù)值。 一般說來,好的估計(jì)量所產(chǎn)生的估計(jì)值將相當(dāng)接近參數(shù)的真值,即好的估計(jì)值??梢宰C明,對于CLR模型,普通最小二乘估計(jì)量正是這樣一個好估計(jì)量。3 例子 例1 對于第一段中的消費(fèi)函數(shù),若根據(jù)數(shù)據(jù)得到: n = 10 , =23, =20XY(),()()XXXX YY26437 則有()()(). ().XX YYXXYXYXiiiii2376405820 058 23670670 058因而例2 設(shè)Y和X的5期觀測值如下表所示,試估計(jì)方程 Yt = + Xt + ut 序號 1 2 3 4 5 Yt 14 18 23 25 30 Xt 10 20 30
11、40 50 解:我們采用列表法計(jì)算。計(jì)算過程如下:54321YYyttXXxttttyx2txtYtX50304025302320181014225110nYY305150nXX831-4-81603004016039.010003902tttxyx3.103039.022XYttXY39. 03 .1011015020100-10-200039010004001000100400估計(jì)方程為0)(XnXnXXXXxttt第二節(jié) 最小二乘估計(jì)量的性質(zhì)一. 和 的均值2222)(tttttttttttxxYxYxxYYxxyx22)(tttttttxuXxxYx由于從而)(12ttttttuxXx
12、xx)(12tttttuxXxx)(122tttttuxxXxx)(122ttttuxxx22)(tttttttxuXxxYx即兩邊取期望值,有: 假設(shè)(4) = 假設(shè)(1)這表明, 是的無偏估計(jì)量。在證明 無偏性的過程中, 我們僅用到(1)和(4)兩條假設(shè)條件。2)()(tttxuExE2tttxux由 ,我們有: XY)()(XYEE)(XuXE)()(EXuEXXX 即 是 的無偏估計(jì)量。二二. 和和 的方差的方差 根據(jù)定義 由無偏性由上段結(jié)果:2tttxux即 2tttxux22()() ()VarEEE( )E我們有:222)()(tttxux2221122).()(1nntuxux
13、uxx22221()()iiijijijtx ux x uux兩邊取期望值,得:222221()()()()iiijijijtEx E ux x E uux由于 根據(jù)假設(shè)(3) 根據(jù)假設(shè)(2)所以2222222)0()(1)(titxxxE22)(txVar22(),1,2,.,()0,tijE utnE uuij即與此類似,可得出222) (ttxnXVar22), (txXCov三. 高斯-馬爾柯夫定理(Gauss-Markov Theorem) 對于滿足統(tǒng)計(jì)假設(shè)條件(1)-(4)的線性回歸模型 Yt = + Xt + ut , ,普通最小二乘估計(jì)量 ( OLS估計(jì)量) 是最佳線性無偏估計(jì)
14、量(BLUE, The Best Linear Unbiased Estimator)。)?;?對于古典線性回歸模型(CLR模型) Yt= + Xt + ut ,普通最小二乘估計(jì)量(OLS估計(jì)量)是最佳線性無偏估計(jì)量(BLUE)。我們已在前面證明了無偏性,此外,由于: 由上段結(jié)果, =其中 這表明, 是諸樣本觀測值Yt(t=1,2,n)的線性函數(shù),故 是線性估計(jì)量。剩下的就是最佳性了,即 的方差小于等于的其他任何線性無偏估計(jì)量的方差,我們可以證明這一點(diǎn),但由于時(shí)間關(guān)系,從略。有興趣的同學(xué)請參見教科書 P46-47。ttYk2tttxxk2tttxYx四、 和 的分布我們在前面列出的假設(shè)條件(5
15、)表明, ut N( 0, 2 ) , t= 1, 2, .,n 即各期擾動項(xiàng)服從均值為0、方差為2的正態(tài)分布??紤]到假設(shè)條件(4),即Xt為非隨機(jī)量,則由前面結(jié)果: =其中,ttuk2tttxxk2tttxux這表明, 是N個正態(tài)分布變量u1,u2,,un的線性函數(shù),因而亦為正態(tài)分布變量,即 類似的有: ),(22txN),(222ttxnXN第三節(jié) 擬合優(yōu)度的測度 一、擬合優(yōu)度(Goodness of fit)的概念 用最小二乘法得到的回歸直線 至少從殘差平方和為最小這一意義上來說是所有可能直線中最佳的擬合線。它是對Y和X之間關(guān)系的一種描述,但該直線是不是Y和X之間關(guān)系的一種恰當(dāng)?shù)拿枋瞿兀?/p>
16、如果各觀測點(diǎn)緊密地聚集在這條直線的周圍,則表明該直線對Y和X之間關(guān)系的描述是好的;否則,用直線來描述這兩個變量之間的關(guān)系就未必恰當(dāng),如下圖所示:ttXY (a)恰當(dāng)描述 (b)不恰當(dāng)描述 圖2-3 應(yīng)該指出,對于任意兩個變量的一組觀測值,我們總是可以運(yùn)用最小二乘法得到一條直線,問題是該直線能否較好地?cái)M合所給定的觀測值,這就是擬合優(yōu)度問題。擬合優(yōu)度是兩變量之間關(guān)系強(qiáng)度的測度。在這里,指的是兩變量間線性關(guān)系強(qiáng)度的測度。 如果所有觀測值都落在回歸直線上,則稱為“完全擬合”,這種情況是罕見的。在一般情況下,總會出現(xiàn)正負(fù)殘差(et),通過對這些殘差的分析,有助于衡量回歸直線擬合樣本數(shù)據(jù)點(diǎn)的程度。二、Y的
17、變差的組成 讓我們來考察一下Y的變差的組成情況。我們有Y的N個觀測值,Y的總變差的一個測度是 ,Y的變差( )中有一部分是可以由X的取值變動所解釋的。還有一部分是不能由X所解釋的變差,如下圖所示:2)(YYtYYt對于第t個觀測值,有: 對于全部N項(xiàng)觀測值平方求和,有: )()(ttttYYYYYYtteYY)(ttttteYYeYYYY)(2)()(222(7)由于ttXYXY )(XXYYtt(7)式中最后一項(xiàng)變?yōu)椋簍ttteXXeYY)(2)(2)(2ttteXeX由(1)式、(2)式(書P41 3.8 和3.9式)和殘差的定義,顯然有: 和 因此,(7)式中最后一項(xiàng)為0,我們得到如下結(jié)
18、果: (8) 即 總變差 = 由X解釋的變差 + 未解釋變差0te0tteX222)()(ttteYYYY三. 擬合優(yōu)度的測度 1. 決定系數(shù) 不難看出,總變差中由X解釋的變差比例越大,則 就越小,各觀測值聚集在回歸直線周圍的緊密程度就越大,說明直線與觀測值的擬合越好。我們將(8)式兩端都除以總變差 ,得:并定義決定系數(shù)(coefficient of determination) 為: = = =2te2)(YYt1)()()(2222YYeYYYYtttt2R總變差解釋變差2R22)()(YYYYtt22)(1YYett2R用符號表示為:其中,ESSExplained Sum of Squa
19、res RSSResidual Sum of Squares TSSTotal Sum of Squares 決定系數(shù) R2 計(jì)量了Y的總變差中可以歸因于X和Y之間關(guān)系的比例,或者說Y的變動中可以由X的變動來解釋的比例。它是回歸線對各觀測點(diǎn)擬合緊密程度的測度。2R=TSSESS=TSSRSS1 我們有: R2 =1:完全擬合, R2 =0:X與Y完全不存在線性關(guān)系, R2的值越高,擬合得越好。但什么是高?并沒有絕對的標(biāo)準(zhǔn),要根據(jù)具體問題而定。此外,回歸中使用時(shí)間序列數(shù)據(jù)還是橫截面數(shù)據(jù)也有不同的標(biāo)準(zhǔn)。對時(shí)間序列數(shù)據(jù)來說,R2 的值在0.8、0.9 以上是很常見的事, 而在橫截面數(shù)據(jù)的情況下,0.
20、4、0.5的 R2 值也不能算低。102 R 02te2te2)(YYt2. 相關(guān)系數(shù) r 由 R2 很容易聯(lián)想到我們在統(tǒng)計(jì)中學(xué)過的相關(guān)系數(shù)。相關(guān)系數(shù)r與決定系數(shù)的關(guān)系為: R2 =(r)2,相關(guān)系數(shù)的計(jì)算公式為: 相關(guān)系數(shù)r也是擬合優(yōu)度的測度,其符號取決于的符號(即 的符號) 我們有:-1 r 1 r = 1:完全正相關(guān) r = -1:完全負(fù)相關(guān) r = 0:無線性關(guān)系22ttttyxyxrttyx 相關(guān)系數(shù)和決定系數(shù)的計(jì)算很簡單,事實(shí)上,我們只要在原列表計(jì)算 的表格中加上一個計(jì)算 的欄目就行了。對于我們前面的例子,列表計(jì)算得:因此: r = R2 =(0.9938)2 = 0.9876 它
21、表明,在我們的例子中,X與Y存在著很強(qiáng)的線性關(guān)系,擬合甚佳。2ty1542ty9938. 01541000390第四節(jié) 雙變量回歸中的區(qū)間估計(jì)和假設(shè)檢驗(yàn)一、的置信區(qū)間我們在第二節(jié)中已得出,在5條假設(shè)條件成立的情況下,有 與估計(jì)量相聯(lián)系的概率分布的標(biāo)準(zhǔn)差(standard deviation),通常稱為標(biāo)準(zhǔn)誤差(standard error),用Se或SE表示。 的標(biāo)準(zhǔn)誤差為:),(22txN2( )tSex 如果為已知,則我們可以立即給出總體參數(shù)的95%的置信區(qū)間為: 1.96 或 1.96 Se( ) 但實(shí)際上,我們一般無法知道擾動項(xiàng)分布的方差2 ,而必須根據(jù)樣本數(shù)據(jù)估計(jì)出2 ,然后再來考慮
22、的置信區(qū)間的計(jì)算問題。2tx1、2 的估計(jì)我們可以用殘差來估計(jì)擾動項(xiàng) ut 的方差2 :可以證明, 是2的無偏估計(jì)量.上式中的 ,我們可以直接從殘差的定義式 計(jì)算得到,也可以通過下面的公式求出: 222net2tttXYe ttttyxye222te(推導(dǎo)從略, 參見教材P52-53)2、的置信區(qū)間我們重新定義 的標(biāo)準(zhǔn)誤差為:則檢驗(yàn)統(tǒng)計(jì)量 t = = t(n-2)故的置信區(qū)間為:即 )()(SeE2/tx)(2/Set22/txt2( )tSex 即為0.10至1.06。也就是說,我們有95%的把握說在0.10至1.06之間。例 設(shè)回歸方程為: ttXY58. 070. 6且 2x=64, x
23、y=37, 2y=44, n=10求的 95%置信區(qū)間解:222net=22nyxyttt=21037*58. 044=2.82 Se()=2tx=6482. 2=0.21的 95%置信區(qū)間為:)() 8 (025. 0Set=0.582.306*0.2152二、假設(shè)檢驗(yàn)1. 假設(shè)檢驗(yàn)的邏輯和步驟 假設(shè)檢驗(yàn)始于一個給定的假設(shè),即所謂“原假設(shè)”,亦稱“零假設(shè)”,然后計(jì)算檢驗(yàn)統(tǒng)計(jì)量,這個檢驗(yàn)統(tǒng)計(jì)量在原假設(shè)成立的假定下的概率分布是已知的。 下一步是判斷計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的值是否不大可能來自此分布,如果判斷是不大可能,則表明原假設(shè)不大可能成立。 我們用一個例子來說明上述有關(guān)假設(shè)檢驗(yàn)的思路。設(shè)有一個原假
24、設(shè)規(guī)定的值 為 ,這里 是研究人員選擇的一個值,如果這個原假設(shè)(H0: )成立,我們知道統(tǒng)計(jì)量000530(2)( )tt nSe如果原假設(shè)不成立,則備擇假設(shè)H1: 成立。 用于計(jì)算t的所有的量都是已知的,可以用估計(jì)值 及其標(biāo)準(zhǔn)誤差Se( )算出t的值,因此t可作為檢驗(yàn)統(tǒng)計(jì)量用于假設(shè)檢驗(yàn),如果算出的t值絕對值過大,落入t分布的尾部,意味著原假設(shè)不大可能成立,因?yàn)樵谠僭O(shè)成立的情況下,得到這樣一個t值的概率很小。00()tSe應(yīng)服從自由度為 (n-2) 的t分布,即54 由上面的說明不難看出,假設(shè)檢驗(yàn)可以說就是檢驗(yàn)是否出現(xiàn)了小概率事件,如果出現(xiàn)小概率事件,則拒絕原來關(guān)于總體參數(shù)的假設(shè);如果檢驗(yàn)表
25、明得到的樣本值并不屬于小概率事件,即若我們的假設(shè)成立,得到該樣本值的概率不算小,則我們不能拒絕原來的假設(shè),或者說,我們“接受”原假設(shè)。 問題是,我們上面提到的概率究竟應(yīng)該小到什么程度才算小。一般說來,這取決于我們愿意承擔(dān)的拒絕一個正確的假設(shè)和接受一個錯誤的假設(shè)這兩方面的風(fēng)險(xiǎn)。在實(shí)踐中,一般習(xí)慣于取5%作為拒絕假設(shè)的臨界水平,稱為5%的顯著性水平。假設(shè)檢驗(yàn)的具體步驟是:(1)建立關(guān)于總體參數(shù)的原假設(shè)和備擇假設(shè);(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)原假設(shè)(是否出現(xiàn)小概率事件);(3)得出關(guān)于原假設(shè)是否合理的結(jié)論。例1:仍用上一段例中的數(shù)據(jù),我們要檢驗(yàn)的是: 原假設(shè): H0:=0.8 備擇假設(shè):H1:0.8
26、這是一個單側(cè)檢驗(yàn)的問題。 我們有: t = = = - 1.05 用=n-2=10-2=8查t表,截?cái)嘧髠?cè)5%面積的 t 臨界值 tc = 1.86 t = 1.05 ct= 2.306 故拒絕原假設(shè) H0。 結(jié)論:顯著異于 0,X 對 Y有影響。 圖2-6三、回歸結(jié)果的提供和分析我們已得到原假設(shè)H0:=0的t值:t= = =2.76同樣可得出原假設(shè)H0: =0的t值:t= = =1.381、回歸結(jié)果的提供提供回歸分析結(jié)果一般有兩種方式:(1) = 6.70 + 0.58X R2 =0.49 (1.38)(2.76) 這里6.70和0.58分別為和的估計(jì)值 和 。 括號中數(shù)字是H0 : =0和
27、H0 :=0 為真時(shí)的 t 值。21. 058. 086.470.6)(Se) (SeY(2) = 6.70 + 0.58X R2 =0.49 (4.86)(0.21) 括號中提供的是 和 的標(biāo)準(zhǔn)誤差。 由于存在這兩種格式,使得回歸結(jié)果的讀者難以判斷出括號中數(shù)字究竟是t 值還是標(biāo)準(zhǔn)誤差。因此,要求在提供回歸結(jié)果時(shí),應(yīng)予以說明。通常的作法有兩種。一種是文字說明,另一種是用符號標(biāo)示。 提供回歸分析結(jié)果的標(biāo)準(zhǔn)格式中一般還包括檢驗(yàn)一階自相關(guān)的DW檢驗(yàn)值,我們將在后面介紹。 Y2、回歸結(jié)果的分析 結(jié)果的分析主要包括以下內(nèi)容: (1)系數(shù)的說明。首先是說明系數(shù)的符號和大小是否正確,是否符合經(jīng)濟(jì)理論和常識。
28、其次是說明系數(shù)的含義,本例中斜率系數(shù)為0.58,表明X增加一個單位,Y增加0.58個單位(如收入X增加1元,消費(fèi)Y增加0.58元)。截距項(xiàng)有時(shí)有經(jīng)濟(jì)意義,大多數(shù)情況下無,因此通常無需說明。 (2)擬合情況。 如本例中R2不高,作為時(shí)間序列數(shù)據(jù),擬合不理想。 (3)系數(shù)的顯著性。本例中斜率系數(shù)的t值為2.76,表明該系數(shù)顯著異于0,X對Y有影響。 (4)是否存在擾動項(xiàng)的自相關(guān)。第五節(jié) 預(yù)測 一、預(yù)測的概念 預(yù)測通常指利用現(xiàn)有信息預(yù)測未來。在這里,預(yù)測指的是對自變量的某一具體值X0 ,來預(yù)測與它相對應(yīng)的因變量值Y0 。它既可以指對未來某個時(shí)期因變量值的預(yù)測,也可以是對未包括在橫截面樣本之中的某個實(shí)
29、體數(shù)值的預(yù)測。 通常情況下,我們要預(yù)測的是與樣本觀測值范圍之外的X值對應(yīng)的Y值,如觀測值為1985-2011年,預(yù)測2012-2015年的居民消費(fèi)。但X0也可以在樣本X值的范圍內(nèi)。二、預(yù)測的隱含假設(shè) 要進(jìn)行預(yù)測,有一個假設(shè)前提應(yīng)當(dāng)滿足。即對于樣本觀測值數(shù)據(jù)成立的X和Y之間的關(guān)系對于新的觀測值也成立。即若雙變量模型的原設(shè)定是: Yt = +Xt+ ut , t=1,2,n 則要使此模型可以用來作為預(yù)測的依據(jù),還應(yīng) 有: Y0 = +X0+ u0 也成立。 三. 預(yù)測的誤差 我們可以得到兩種類型的預(yù)測值:點(diǎn)預(yù)測值和區(qū)點(diǎn)預(yù)測值和區(qū)間預(yù)測值。間預(yù)測值。在實(shí)踐中,如果沒有某種精度指標(biāo)的話,點(diǎn)預(yù)測值是沒有
30、多大用處的。所以,我們必須提供點(diǎn)預(yù)測值的預(yù)測誤差。 點(diǎn)預(yù)測值由與X0對應(yīng)的回歸值給出,即 而預(yù)測期的實(shí)際Y值由下式給出: 其中 u0 是從預(yù)測期的擾動項(xiàng)分布中所取的值。00XY000uXY預(yù)測誤差的來源 由此不難看出,預(yù)測誤差產(chǎn)生于兩個來源: (1) 模型中包含擾動項(xiàng),點(diǎn)預(yù)測值是假定預(yù)測期擾 動項(xiàng) u0 為 0,而實(shí)際上一般不為0。 (2) 點(diǎn)預(yù)測值公式中用的是和的估計(jì)值 和 , 樣本估計(jì)值 和 一般不等于總體參數(shù) 和。預(yù)測誤差可定義為: 兩邊取期望值,得 因此,OLS 預(yù)測量 是一個無偏預(yù)測量。000YYe00)()(Xu)()()()(000EXEuEeE)()(00X00XY0 預(yù)測誤差的方差為: 其它兩項(xiàng)協(xié)方差等于0。這是因?yàn)閡0獨(dú)立于u1, u2 , un, 而 和 均為 u1, u2 , un 的線性函數(shù),因此它們與u0的協(xié)方差均為0。 將我們在前面得到的 和 的方差及協(xié)方差代入上式,得:)()(), (2)() ()(0200CovXVarXVaruVar)()()(000XuVareVar2202220222202)(xXXxXxnXeVar2202220222222)(xXXxXxnXnXX22022202222
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第19課 科學(xué)技術(shù)的重大成果課件
- 2024年專業(yè)電工施工協(xié)議典范
- 中國特色社會主義基本原理(上)
- 2024年度層電梯廳裝潢協(xié)議模板
- 2024年無薪實(shí)習(xí)勞動協(xié)議
- 2024年倉庫租賃法律協(xié)議細(xì)則
- 2024年型車輛采購協(xié)議
- 2024屆安徽省合肥高升學(xué)校高三八校第一次適應(yīng)性考試數(shù)學(xué)試題試卷
- 2024建筑業(yè)勞務(wù)施工協(xié)議文本
- 2024年全職勞務(wù)雇傭協(xié)議范本
- (完整版)病例演講比賽PPT模板
- 社科類課題申報(bào)工作輔導(dǎo)報(bào)告課件
- 2023-2024學(xué)年廣東省廣州市小學(xué)語文六年級期末高分試卷詳細(xì)參考答案解析
- 比尾巴(全國一等獎)
- 如何做好船舶成本管理
- 沙利文-內(nèi)窺鏡行業(yè)現(xiàn)狀與發(fā)展趨勢藍(lán)皮書
- 比亞迪e6說明書
- 渠道管理PPT(第3版)完整全套教學(xué)課件
- 《新時(shí)代勞動教育》-02新時(shí)代勞動價(jià)值觀課件
- 2023年口腔醫(yī)學(xué)期末復(fù)習(xí)-牙周病學(xué)(口腔醫(yī)學(xué))考試歷年真題薈萃帶答案
- 【典型案例】長江流域浙江的歷史發(fā)展:人民群眾是社會物質(zhì)財(cái)富的創(chuàng)造者
評論
0/150
提交評論