第五章 誤設(shè)定_第1頁
第五章 誤設(shè)定_第2頁
第五章 誤設(shè)定_第3頁
第五章 誤設(shè)定_第4頁
第五章 誤設(shè)定_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章第五章 設(shè)定檢驗(yàn)與模型選擇設(shè)定檢驗(yàn)與模型選擇本章內(nèi)容本章內(nèi)容第一節(jié)第一節(jié) 模型誤設(shè)定:類型及后果模型誤設(shè)定:類型及后果第二節(jié)第二節(jié) 誤設(shè)定的檢驗(yàn)誤設(shè)定的檢驗(yàn)第三節(jié)第三節(jié) 模型選擇模型選擇 前面有關(guān)章節(jié)介紹了經(jīng)典線性模型的建立、前面有關(guān)章節(jié)介紹了經(jīng)典線性模型的建立、參數(shù)估計(jì)方法、假設(shè)檢驗(yàn)以及對于違背經(jīng)典假參數(shù)估計(jì)方法、假設(shè)檢驗(yàn)以及對于違背經(jīng)典假設(shè)情況的技術(shù)處理方法等內(nèi)容,在實(shí)際建模的設(shè)情況的技術(shù)處理方法等內(nèi)容,在實(shí)際建模的過程中,我們還將遇到解釋變量篩選與模型選過程中,我們還將遇到解釋變量篩選與模型選擇等方面問題,本章將具體介紹模型誤設(shè)定檢擇等方面問題,本章將具體介紹模型誤設(shè)定檢驗(yàn)方法、解

2、釋變量的篩選原則以及備選模型間驗(yàn)方法、解釋變量的篩選原則以及備選模型間的選擇標(biāo)準(zhǔn)。的選擇標(biāo)準(zhǔn)。 第一節(jié)第一節(jié) 模型誤設(shè)定:類型及后果模型誤設(shè)定:類型及后果 采用采用OLS法估計(jì)模型時(shí),實(shí)際上有一個(gè)隱含法估計(jì)模型時(shí),實(shí)際上有一個(gè)隱含的假設(shè),即模型是正確設(shè)定的。這包括兩方面的的假設(shè),即模型是正確設(shè)定的。這包括兩方面的含義:函數(shù)形式正確和解釋變量選擇正確。含義:函數(shù)形式正確和解釋變量選擇正確。在實(shí)在實(shí)踐中,這樣一個(gè)假設(shè)或許從來也不現(xiàn)實(shí)。踐中,這樣一個(gè)假設(shè)或許從來也不現(xiàn)實(shí)。我們可我們可能犯下列三個(gè)方面的錯(cuò)誤:能犯下列三個(gè)方面的錯(cuò)誤: 選擇錯(cuò)誤的函數(shù)形式選擇錯(cuò)誤的函數(shù)形式遺漏有關(guān)的解釋變量遺漏有關(guān)的解釋

3、變量包括無關(guān)的解釋變量包括無關(guān)的解釋變量從而造成所謂的從而造成所謂的“誤設(shè)定誤設(shè)定”問題,誤設(shè)定問題,誤設(shè)定(misspecification)亦稱設(shè)定誤差()亦稱設(shè)定誤差(specification error)。)。 這類錯(cuò)誤中比較常見的是將非線性關(guān)系作為線這類錯(cuò)誤中比較常見的是將非線性關(guān)系作為線性關(guān)系處理。函數(shù)形式選擇錯(cuò)誤,所建立的模型當(dāng)性關(guān)系處理。函數(shù)形式選擇錯(cuò)誤,所建立的模型當(dāng)然無法反映所研究現(xiàn)象的實(shí)際情況,后果是顯而易然無法反映所研究現(xiàn)象的實(shí)際情況,后果是顯而易見的。因此,我們應(yīng)當(dāng)根據(jù)實(shí)際問題,選擇正確的見的。因此,我們應(yīng)當(dāng)根據(jù)實(shí)際問題,選擇正確的函數(shù)形式。函數(shù)形式。 一、選擇錯(cuò)誤

4、的函數(shù)形式一、選擇錯(cuò)誤的函數(shù)形式 選擇正確的函數(shù)形式是計(jì)量經(jīng)濟(jì)學(xué)家的任務(wù),選擇正確的函數(shù)形式是計(jì)量經(jīng)濟(jì)學(xué)家的任務(wù),這是因?yàn)?,?jīng)濟(jì)理論通常不會告訴我們因變量和解這是因?yàn)椋?jīng)濟(jì)理論通常不會告訴我們因變量和解釋變量之間的具體函數(shù)形式是什么。解決這個(gè)問題,釋變量之間的具體函數(shù)形式是什么。解決這個(gè)問題,很大程度上要靠計(jì)量經(jīng)濟(jì)工作者在實(shí)踐中不斷摸索。很大程度上要靠計(jì)量經(jīng)濟(jì)工作者在實(shí)踐中不斷摸索。下面介紹幾種比較常見的函數(shù)形式的模型:下面介紹幾種比較常見的函數(shù)形式的模型: 半對數(shù)模型半對數(shù)模型 雙曲函數(shù)模型雙曲函數(shù)模型 多項(xiàng)式回歸模型多項(xiàng)式回歸模型1. 半對數(shù)模型半對數(shù)模型 半對數(shù)模型指的是因變量和解釋變量

5、中一個(gè)為半對數(shù)模型指的是因變量和解釋變量中一個(gè)為對數(shù)形式而另一個(gè)為線性的模型。因變量為對數(shù)形對數(shù)形式而另一個(gè)為線性的模型。因變量為對數(shù)形式的稱為式的稱為對數(shù)對數(shù)-線性模型線性模型(log-lin model)。解釋變量。解釋變量為對數(shù)形式的稱為為對數(shù)形式的稱為線性線性-對數(shù)模型對數(shù)模型(lin-log model)。 我們先介紹前者,其形式如下:我們先介紹前者,其形式如下: 對數(shù)對數(shù)-線性模型中,斜率的含義是線性模型中,斜率的含義是Y的百的百分比變動(dòng),即解釋變量分比變動(dòng),即解釋變量X變動(dòng)一個(gè)單位引起變動(dòng)一個(gè)單位引起的因變量的因變量Y的百分比變動(dòng)。這是因?yàn)椋玫陌俜直茸儎?dòng)。這是因?yàn)椋梦⒎挚?/p>

6、以得出:微分可以得出:tttuXY10ln) 1(1ln1dXYdYdXdYYdXYd 這表明,斜率度量的是這表明,斜率度量的是解釋變量解釋變量X的單位變動(dòng)的單位變動(dòng)所引起的因變量所引起的因變量Y的相對變動(dòng)的相對變動(dòng)。將此相對變動(dòng)乘以。將此相對變動(dòng)乘以100,就得到,就得到Y(jié)的百分比變動(dòng),或者說得到的百分比變動(dòng),或者說得到Y(jié)的增長的增長率。由于對數(shù)率。由于對數(shù)-線性模型中斜率系數(shù)的這一含義,線性模型中斜率系數(shù)的這一含義,因而也叫增長模型因而也叫增長模型 (growth model)。增長模型通常。增長模型通常用于測度所關(guān)心的經(jīng)濟(jì)變量(如用于測度所關(guān)心的經(jīng)濟(jì)變量(如GDP)的增長率。)的增長率。

7、例如,我們可以通過估計(jì)下面的半對數(shù)模型例如,我們可以通過估計(jì)下面的半對數(shù)模型 得到一國得到一國GDP的年增長率的估計(jì)值,這里的年增長率的估計(jì)值,這里t為時(shí)間為時(shí)間趨勢變量。趨勢變量。ttutGDP10)ln(案例案例5.1 測算測算1978-2010中國國內(nèi)生產(chǎn)總值的增長率中國國內(nèi)生產(chǎn)總值的增長率名義值名義值不變價(jià)不變價(jià)t t名義值名義值不變價(jià)不變價(jià)t t197819783645.2173645.2173645.2173645.2171 11994199448197.8648197.8616480.3316480.331717197919794062.5794062.5793921.26439

8、21.2642 21995199560793.7360793.7318280.818280.81818198019804545.6244545.6244228.7484228.7483 31996199671176.5971176.5920110.4420110.441919198119814891.5614891.5614472.2764472.2764 41997199778973.0378973.0321980.1121980.112020198219825323.3515323.3514877.3244877.3245 51998199884402.2884402.2823701.89

9、23701.892121198319835962.6525962.6525406.6595406.6596 61999199989677.0589677.0525507.9425507.942222198419847208.0527208.0526227.1756227.1757 72000200099214.5599214.5527658.5827658.582323198519859016.0379016.0377065.7387065.7388 820012001109655.2109655.229954.3329954.3324241986198610275.1810275.18769

10、0.87690.89 920022002120332.7120332.732674.8132674.8125251987198712058.6212058.628581.6458581.645101020032003135822.8135822.835950.5835950.5826261988198815042.8215042.829549.7059549.705111120042004159878.3159878.339576.2139576.2127271989198916992.3216992.329937.7299937.729121220052005184937.4184937.4

11、44052.2944052.2928281990199018667.8218667.8210319.2410319.24131320062006216314.4216314.449636.649636.629291991199121781.521781.511194.0611194.06141420072007265810.3265810.356666.3356666.3330301992199226923.4826923.4812788.1812788.18151520082008314045.4314045.462125.9462125.9431311993199335333.923533

12、3.9214573.9614573.96161620092009340902.8340902.867530.967530.932322010201040326040326074013.8774013.8733330100,000200,000300,000400,000500,0001980198519901995200020052010GDP名義值名義值)66.61()32.164(:99. 0153. 094. 7lg2tRtpd010,00020,00030,00040,00050,00060,00070,00080,0001980198519901995200020052010GDPR

13、不變值不變值)11.144()82.629(:998. 0095. 0068. 8lg2tRtpd案例案例5.2 19492003年的中國人口增長率年的中國人口增長率)15.56)(29.1131(:983. 0t2R0.01685t 10.924 POLP 斜率斜率0.01685表示,平均而言,中國人口的年增長率為表示,平均而言,中國人口的年增長率為0.01685,即人口以每年,即人口以每年1.685的速度增長。的速度增長。 截距項(xiàng)截距項(xiàng)10.924可解釋為:可解釋為: 10.924log(Y0),即),即Y0 55475.68,可解釋為可解釋為1948年的人口數(shù)。年的人口數(shù)。線性線性-對數(shù)

14、模型的形式如下:對數(shù)模型的形式如下:tttuXYln10XdXdY11XdXdYdXdYX1XXYXY的相對變動(dòng)的絕對變動(dòng)1XXY1與前面類似,我們可用微分得到與前面類似,我們可用微分得到 上式可改寫為上式可改寫為這表明這表明 上式表明,上式表明,Y的絕對變動(dòng)量等于的絕對變動(dòng)量等于 乘以乘以X的相的相對變動(dòng)量。對變動(dòng)量。若將后者乘以若將后者乘以100,則上式給出了,則上式給出了X每每變動(dòng)一個(gè)百分點(diǎn)所引起的變動(dòng)一個(gè)百分點(diǎn)所引起的Y的變動(dòng)量。的變動(dòng)量。 因此因此, 線性線性-對數(shù)模型通常用于研究解釋變量每對數(shù)模型通常用于研究解釋變量每變動(dòng)變動(dòng)1%引起的因變量的絕對變動(dòng)量是多少這類問引起的因變量的絕

15、對變動(dòng)量是多少這類問題。題。12.雙曲函數(shù)模型雙曲函數(shù)模型 雙曲函數(shù)模型的形式為雙曲函數(shù)模型的形式為:tttuXY110 不難看出,這是一個(gè)僅存在變量非線性的模型,不難看出,這是一個(gè)僅存在變量非線性的模型,很容易用重新定義的方法將其線性化。很容易用重新定義的方法將其線性化。 雙曲函數(shù)模型的特點(diǎn)是,當(dāng)雙曲函數(shù)模型的特點(diǎn)是,當(dāng)X趨向無窮時(shí),趨向無窮時(shí),Y趨趨向向 ,反映到圖上,就是當(dāng),反映到圖上,就是當(dāng)X趨向無窮時(shí),趨向無窮時(shí),Y將無將無限靠近其漸近線(限靠近其漸近線(Y= )。)。 雙曲函數(shù)模型通常用于描述著名的雙曲函數(shù)模型通常用于描述著名的恩格爾曲線和恩格爾曲線和菲利普斯曲線菲利普斯曲線。00

16、 多項(xiàng)式回歸模型通常用于描述多項(xiàng)式回歸模型通常用于描述生產(chǎn)成本函數(shù)生產(chǎn)成本函數(shù),其,其一般形式為:一般形式為: 其中其中Y表示總成本,表示總成本,X表示產(chǎn)出,表示產(chǎn)出,p為多項(xiàng)式的階為多項(xiàng)式的階數(shù),一般不超過四階。數(shù),一般不超過四階。 多項(xiàng)式回歸模型中,解釋變量多項(xiàng)式回歸模型中,解釋變量X以以不同冪次不同冪次出現(xiàn)出現(xiàn)在方程的右端。這類模型也僅存在變量非線性,因在方程的右端。這類模型也僅存在變量非線性,因而很容易線性化,可用而很容易線性化,可用OLS法估計(jì)模型。法估計(jì)模型。3. 多項(xiàng)式回歸模型多項(xiàng)式回歸模型2012.piiiPiiYXXXu 例例5.1 總成本函數(shù) 假設(shè)存在如下假想數(shù)據(jù)來描述某種

17、成本-產(chǎn)出關(guān)系,見表5-1。用這些數(shù)據(jù),我們來說明多項(xiàng)式模型。表表5-1 成本成本-產(chǎn)出數(shù)據(jù)產(chǎn)出數(shù)據(jù)產(chǎn)出產(chǎn)出x12345678910總成本總成本Y($) 193193193193193193193193193193 從下面的散點(diǎn)圖可以看出二者是非線性關(guān)系,因從下面的散點(diǎn)圖可以看出二者是非線性關(guān)系,因此試用多項(xiàng)式模型進(jìn)行線性回歸。此試用多項(xiàng)式模型進(jìn)行線性回歸。圖圖 5-1 成本成本-產(chǎn)出數(shù)據(jù)散點(diǎn)圖產(chǎn)出數(shù)據(jù)散點(diǎn)圖 回歸結(jié)果如下(括號中數(shù)字為回歸結(jié)果如下(括號中數(shù)字為t值):值):從估計(jì)結(jié)果可以看出,模型的決定系數(shù)為從估計(jì)結(jié)果可以看出,模型的決定系數(shù)為0.998,擬合很好,所有參,擬合很好,所有參數(shù)

18、都顯著。可見,采用三次多項(xiàng)式模型比較理想,擬合效果見下圖:數(shù)都顯著。可見,采用三次多項(xiàng)式模型比較理想,擬合效果見下圖:圖圖 5-2 三次多項(xiàng)式模型擬合效果三次多項(xiàng)式模型擬合效果 232141.7763.4812.960.940.99822.2413.2813.1515.90iiiiYXXXR() ()() ()二、二、 模型中遺漏有關(guān)的解釋變量模型中遺漏有關(guān)的解釋變量 模型中遺漏了對因變量有顯著影響的解釋變量模型中遺漏了對因變量有顯著影響的解釋變量的后果是:將使模型參數(shù)估計(jì)量不再是無偏估計(jì)量的后果是:將使模型參數(shù)估計(jì)量不再是無偏估計(jì)量。下面用一個(gè)簡單例子說明。下面用一個(gè)簡單例子說明。設(shè)正確模型

19、為:設(shè)正確模型為: (5-9)而實(shí)際估計(jì)的模型是:而實(shí)際估計(jì)的模型是: (5-10)也就是說,我們忽略了也就是說,我們忽略了X2 ,而,而X2是一個(gè)對是一個(gè)對Y有影響的重要有影響的重要變量。變量。 估計(jì)(估計(jì)(5-10)式,可得:)式,可得: (5-11)而由(而由(5-9)有:)有: (5-12)uXXY22110011YXv211111)()(XXYYXX)()()(222111uuXXXXYY (5-12)代入()代入(5-11),得:),得:21111211221121211222111111)()()()( )()()()()()(XXuuXXXXXXXXXXuuXXXXXX取期望值

20、,得:取期望值,得: 211112112211211)()()()()( )()(XXuuEXXXXXXXXEE 上式中右邊第三項(xiàng)等于上式中右邊第三項(xiàng)等于0,而第二項(xiàng)方括號中內(nèi),而第二項(xiàng)方括號中內(nèi)容可以看作是回歸方程中斜率系數(shù)容可以看作是回歸方程中斜率系數(shù) 的估計(jì)量,可的估計(jì)量,可以預(yù)期,以預(yù)期,X1和和X2之間存在一定程度的相關(guān),從而之間存在一定程度的相關(guān),從而第二項(xiàng)不等于第二項(xiàng)不等于0,故:,故: 事實(shí)上,可以證明:事實(shí)上,可以證明: (5-13) 11)(E112()=+E 同樣道理,可以證明同樣道理,可以證明 ,因此,因此,如果遺漏變量與模型中的變量相關(guān),則如果遺漏變量與模型中的變量相

21、關(guān),則 和和 都都是真實(shí)參數(shù)的有偏估計(jì)量,還可以進(jìn)一步證明是真實(shí)參數(shù)的有偏估計(jì)量,還可以進(jìn)一步證明 和和 都是不一致的,即無論樣本容量有多大,偏差都不都是不一致的,即無論樣本容量有多大,偏差都不會消失。同時(shí),根據(jù)式會消失。同時(shí),根據(jù)式5-10得到的誤差方差是真實(shí)得到的誤差方差是真實(shí)誤差方差的有偏估計(jì)量,從而,的方差也是真實(shí)估誤差方差的有偏估計(jì)量,從而,的方差也是真實(shí)估計(jì)量的方差的有偏估計(jì)量。因此,參數(shù)估計(jì)的置信計(jì)量的方差的有偏估計(jì)量。因此,參數(shù)估計(jì)的置信區(qū)間和假設(shè)檢驗(yàn)過程都不再可靠。區(qū)間和假設(shè)檢驗(yàn)過程都不再可靠。 結(jié)論:遺漏有關(guān)解釋變量將使參數(shù)估計(jì)量有偏,可結(jié)論:遺漏有關(guān)解釋變量將使參數(shù)估計(jì)量

22、有偏,可能產(chǎn)生非常嚴(yán)重的后果,因此,模型設(shè)定時(shí)必須格能產(chǎn)生非常嚴(yán)重的后果,因此,模型設(shè)定時(shí)必須格外謹(jǐn)慎。外謹(jǐn)慎。01321()EXX01例例5.2 進(jìn)口支出函數(shù)進(jìn)口支出函數(shù) 我們通過一個(gè)實(shí)例對上面討論的模型中遺漏有關(guān)解釋變量問我們通過一個(gè)實(shí)例對上面討論的模型中遺漏有關(guān)解釋變量問題做一說明。表題做一說明。表5-2給出了給出了19681987年間美國的進(jìn)口支出年間美國的進(jìn)口支出及個(gè)人可支配收入(及個(gè)人可支配收入(PDI)(稅后收入)的數(shù)據(jù)。以)(稅后收入)的數(shù)據(jù)。以1982年年的美元價(jià)為基準(zhǔn)度量單位,以消除通貨膨脹的影響。的美元價(jià)為基準(zhǔn)度量單位,以消除通貨膨脹的影響。表表5-2 U.S進(jìn)口商品支出

23、(進(jìn)口商品支出(Y)與個(gè)人可支配收入()與個(gè)人可支配收入(X),),19681987年份YX年份YX1968196919701971197219731974197519761977135.7144.6150.9166.2190.7218.2211.8187.9229.9259.41551.31599.81668.11728.41797.41916.31896.91931.72001.02066.61978197919801981198219831984198519861987274.1277.9253.6258.7249.5282.2351.1367.9412.3439.02167.42212

24、.62214.32248.62261.52331.92469.82542.82640.92686.3資料來源:經(jīng)濟(jì)計(jì)量學(xué)精要,達(dá)莫達(dá)爾 N. 古亞拉提著。單位為億美元(1982年價(jià)) 凱恩斯消費(fèi)函數(shù)理論表明:個(gè)人的消費(fèi)支出與個(gè)人可支配凱恩斯消費(fèi)函數(shù)理論表明:個(gè)人的消費(fèi)支出與個(gè)人可支配收入正相關(guān)。由于對外國物品的消費(fèi)是總消費(fèi)支出的一部收入正相關(guān)。由于對外國物品的消費(fèi)是總消費(fèi)支出的一部分,因此,可以認(rèn)為進(jìn)口支出與個(gè)人可支配收入正相關(guān)。分,因此,可以認(rèn)為進(jìn)口支出與個(gè)人可支配收入正相關(guān)。模型的形式為:模型的形式為: 其中,其中,Y表示進(jìn)口的消費(fèi)支出,表示進(jìn)口的消費(fèi)支出,X表示個(gè)人可支配收入,表示個(gè)人可

25、支配收入,擬合表擬合表5-2給出的數(shù)據(jù),得到如下回歸結(jié)果(括號中數(shù)字給出的數(shù)據(jù),得到如下回歸結(jié)果(括號中數(shù)字為為t值):值): 現(xiàn)在,假定現(xiàn)在,假定“真實(shí)真實(shí)”的進(jìn)口支出函數(shù)如下:的進(jìn)口支出函數(shù)如下: 其中,其中,Y表示進(jìn)口支出,表示進(jìn)口支出, 為個(gè)人可支配收入(為個(gè)人可支配收入(PDI),是是時(shí)間或趨勢變量,它代表人口、偏好和技術(shù)變動(dòng)等其它影時(shí)間或趨勢變量,它代表人口、偏好和技術(shù)變動(dòng)等其它影響進(jìn)口的因素,取值為響進(jìn)口的因素,取值為1, 2, 20。12tttYXu2t2261.090.250.939( 8.33(16.57)tYXR )12233ttttYXXu2X 仍用表仍用表5-2的數(shù)據(jù)

26、,對加了時(shí)間趨勢變量的式進(jìn)行的數(shù)據(jù),對加了時(shí)間趨勢變量的式進(jìn)行回歸,結(jié)果如下:回歸,結(jié)果如下: 注意兩個(gè)回歸結(jié)果的幾個(gè)特點(diǎn):注意兩個(gè)回歸結(jié)果的幾個(gè)特點(diǎn): (1)錯(cuò)誤設(shè)定式表明:)錯(cuò)誤設(shè)定式表明:PDI每增加一美元,平均每增加一美元,平均而言,用于進(jìn)口商品上的支出將會增加而言,用于進(jìn)口商品上的支出將會增加25美分;美分;也就是說,進(jìn)口支出的邊際傾向?yàn)橐簿褪钦f,進(jìn)口支出的邊際傾向?yàn)?5美分。而真美分。而真實(shí)模型表明:由于考慮到趨勢變量的影響,因而,實(shí)模型表明:由于考慮到趨勢變量的影響,因而,PDI每增加一美元,平均而言,用于進(jìn)口商品的每增加一美元,平均而言,用于進(jìn)口商品的支出將會增加大約支出將會增

27、加大約65美分。在這個(gè)例子中,錯(cuò)誤美分。在這個(gè)例子中,錯(cuò)誤設(shè)定方程低估了真實(shí)的邊際進(jìn)口支出傾向,也就設(shè)定方程低估了真實(shí)的邊際進(jìn)口支出傾向,也就是說,它有一個(gè)向下的偏差。是說,它有一個(gè)向下的偏差。 2t23859.920.6523.200.978( 7.68)(8.68)( 5.43)ttYXXR (2)截距也是有偏的,在這里它高估了真實(shí)的)截距也是有偏的,在這里它高估了真實(shí)的截距值(注意截距值(注意-261是大于是大于-859的)。的)。 (3)從兩個(gè)模型中所估計(jì)的擾動(dòng)項(xiàng)方差也明顯)從兩個(gè)模型中所估計(jì)的擾動(dòng)項(xiàng)方差也明顯不同,分別是不同,分別是184和和475。 (4)截距和斜率()截距和斜率(

28、 )的標(biāo)準(zhǔn)差也明顯不同。)的標(biāo)準(zhǔn)差也明顯不同。 所有的這些結(jié)果都與前面的討論一致。如果根據(jù)所有的這些結(jié)果都與前面的討論一致。如果根據(jù)錯(cuò)誤設(shè)定的方程來進(jìn)行假設(shè)檢驗(yàn)的話,則得出的錯(cuò)誤設(shè)定的方程來進(jìn)行假設(shè)檢驗(yàn)的話,則得出的結(jié)論是令人懷疑的。毫無疑問,從模型中略去相結(jié)論是令人懷疑的。毫無疑問,從模型中略去相關(guān)變量可能產(chǎn)生非常嚴(yán)重的后果。因此,在建立關(guān)變量可能產(chǎn)生非常嚴(yán)重的后果。因此,在建立模型時(shí),必須小心謹(jǐn)慎。需要對研究現(xiàn)象中所蘊(yùn)模型時(shí),必須小心謹(jǐn)慎。需要對研究現(xiàn)象中所蘊(yùn)含的經(jīng)濟(jì)理論作深入的了解,從而把相關(guān)的變量含的經(jīng)濟(jì)理論作深入的了解,從而把相關(guān)的變量都包括進(jìn)模型中。都包括進(jìn)模型中。2X三、三、 模

29、型中包括無關(guān)的解釋變量模型中包括無關(guān)的解釋變量模型中包括無關(guān)的解釋變量,參數(shù)估計(jì)量仍無偏,但會增大模型中包括無關(guān)的解釋變量,參數(shù)估計(jì)量仍無偏,但會增大估計(jì)量的方差,即增大誤差。估計(jì)量的方差,即增大誤差。我們同樣用一個(gè)簡單例子說明之。我們同樣用一個(gè)簡單例子說明之。 設(shè)正確模型為:設(shè)正確模型為: (5-19)而實(shí)際估計(jì)的模型是:而實(shí)際估計(jì)的模型是: (5-20) 也就是說,也就是說,X2 與與Y無關(guān),因而應(yīng)有無關(guān),因而應(yīng)有 。可以證明可以證明 ,即,即 是真實(shí)參數(shù)是真實(shí)參數(shù) 的無偏估計(jì)量。的無偏估計(jì)量。但是但是uXY11001122YXXv0211)(E1121121221)()1 ()(XXrV

30、ar21121)()(XXVar)1 ()()(21211rVarVar)()(11VarVar由于由于r12一般不等于一般不等于0,因此我們有:,因此我們有: 結(jié)論:模型中包括無關(guān)的解釋變量,參數(shù)估計(jì)量結(jié)論:模型中包括無關(guān)的解釋變量,參數(shù)估計(jì)量仍無偏,但會增大估計(jì)量的方差,即增大誤差。估仍無偏,但會增大估計(jì)量的方差,即增大誤差。估計(jì)參數(shù)的置信區(qū)間進(jìn)而變寬,從而使得我們無法認(rèn)計(jì)參數(shù)的置信區(qū)間進(jìn)而變寬,從而使得我們無法認(rèn)識到被解釋變量與解釋變量之間的顯著關(guān)系。識到被解釋變量與解釋變量之間的顯著關(guān)系。而:而:第二節(jié)第二節(jié) 誤設(shè)定的檢驗(yàn)誤設(shè)定的檢驗(yàn) 針對第一節(jié)介紹的各種誤設(shè)定類型,本節(jié)給針對第一節(jié)介

31、紹的各種誤設(shè)定類型,本節(jié)給出幾種常用的檢驗(yàn)方法。出幾種常用的檢驗(yàn)方法。 一、包含無關(guān)變量檢驗(yàn)一、包含無關(guān)變量檢驗(yàn) 二、遺漏重要變量檢驗(yàn)二、遺漏重要變量檢驗(yàn) 三、檢驗(yàn)誤設(shè)定的三、檢驗(yàn)誤設(shè)定的RESET方法方法 四、拉格朗日乘數(shù)(四、拉格朗日乘數(shù)(LM)檢驗(yàn))檢驗(yàn)一、包含無關(guān)變量檢驗(yàn)一、包含無關(guān)變量檢驗(yàn) 對于模型中是否包含無關(guān)變量的情況,最直接的一對于模型中是否包含無關(guān)變量的情況,最直接的一個(gè)檢驗(yàn)方法就是個(gè)檢驗(yàn)方法就是t檢驗(yàn),即檢驗(yàn)單個(gè)變量前系數(shù)估計(jì)檢驗(yàn),即檢驗(yàn)單個(gè)變量前系數(shù)估計(jì)值的顯著性。針對不能確定幾個(gè)變量是否真的屬于值的顯著性。針對不能確定幾個(gè)變量是否真的屬于模型的情況,也可以使用第二章介紹

32、的若干個(gè)系數(shù)模型的情況,也可以使用第二章介紹的若干個(gè)系數(shù)聯(lián)合顯著性的聯(lián)合顯著性的F檢驗(yàn)。檢驗(yàn)。 需要特別注意的是,在許多個(gè)自變量中查找是否存需要特別注意的是,在許多個(gè)自變量中查找是否存在無關(guān)變量時(shí),一定不能脫離模型的理論基礎(chǔ),不在無關(guān)變量時(shí),一定不能脫離模型的理論基礎(chǔ),不要輕易將理論上很重要但未通過顯著性檢驗(yàn)的變量要輕易將理論上很重要但未通過顯著性檢驗(yàn)的變量刪除。實(shí)際建模中經(jīng)常會使用逐步回歸的方法,即刪除。實(shí)際建模中經(jīng)常會使用逐步回歸的方法,即從一個(gè)較小模型開始,逐步篩選可以進(jìn)入模型的變從一個(gè)較小模型開始,逐步篩選可以進(jìn)入模型的變量。量。 實(shí)踐中我們可以使用逐步回歸的思想以避免實(shí)踐中我們可以使

33、用逐步回歸的思想以避免無關(guān)變量進(jìn)入模型,同時(shí)要結(jié)合所研究問題的重?zé)o關(guān)變量進(jìn)入模型,同時(shí)要結(jié)合所研究問題的重點(diǎn),最終目標(biāo)是得到有理論支持的好模型:其所點(diǎn),最終目標(biāo)是得到有理論支持的好模型:其所有估計(jì)系數(shù)都具有有估計(jì)系數(shù)都具有“正確的正確的”符號、基于符號、基于t和和F檢檢驗(yàn)都是統(tǒng)計(jì)顯著的、值足夠高、驗(yàn)都是統(tǒng)計(jì)顯著的、值足夠高、DW統(tǒng)計(jì)量的值統(tǒng)計(jì)量的值可以接受等等。可以接受等等。二、遺漏重要變量檢驗(yàn)二、遺漏重要變量檢驗(yàn)考慮一個(gè)雙變量線性回歸模型考慮一個(gè)雙變量線性回歸模型假設(shè)要檢驗(yàn)?zāi)P褪欠襁z漏了一個(gè)解釋變量,則要做的是估計(jì)下面的模型假設(shè)要檢驗(yàn)?zāi)P褪欠襁z漏了一個(gè)解釋變量,則要做的是估計(jì)下面的模型并檢驗(yàn)

34、并檢驗(yàn) 是否為零。是否為零。另外一種做法是先估計(jì)原模型,得到殘差另外一種做法是先估計(jì)原模型,得到殘差et,然后將其對,然后將其對 和和 進(jìn)進(jìn)行回歸,檢驗(yàn)變量行回歸,檢驗(yàn)變量 前的系數(shù)是否為零。請注意是將殘差對所有解釋前的系數(shù)是否為零。請注意是將殘差對所有解釋變量進(jìn)行回歸估計(jì),而并非僅僅針對疑似遺漏的變量。因?yàn)閮H對疑似遺漏變量進(jìn)行回歸估計(jì),而并非僅僅針對疑似遺漏的變量。因?yàn)閮H對疑似遺漏變量估計(jì)得到的變量估計(jì)得到的 的系數(shù)估計(jì)量是非一致估計(jì)量(除非系數(shù)真實(shí)值為的系數(shù)估計(jì)量是非一致估計(jì)量(除非系數(shù)真實(shí)值為零),且其分布較復(fù)雜,使用最小二乘估計(jì)得到的標(biāo)準(zhǔn)誤差不正確。零),且其分布較復(fù)雜,使用最小二乘估

35、計(jì)得到的標(biāo)準(zhǔn)誤差不正確。uXY11001122YXX21X2X2X2X 此外,可以通過殘差圖的變化進(jìn)行判定,如果模型遺漏了一此外,可以通過殘差圖的變化進(jìn)行判定,如果模型遺漏了一個(gè)重要變量,殘差圖將會顯示出較明顯的變動(dòng)趨勢或不同的個(gè)重要變量,殘差圖將會顯示出較明顯的變動(dòng)趨勢或不同的形狀。我們以第一節(jié)中提到的生產(chǎn)成本函數(shù)為例,假定真實(shí)形狀。我們以第一節(jié)中提到的生產(chǎn)成本函數(shù)為例,假定真實(shí)的總成本函數(shù)可表示為的總成本函數(shù)可表示為 但研究者擬合為二次函數(shù):但研究者擬合為二次函數(shù): 而另一研究者則擬合為線性函數(shù):而另一研究者則擬合為線性函數(shù): 230123iiiiiYXXXu20122iiiiYXXu01

36、3iiiYXu例例5.3 不同多項(xiàng)式模型擬合效果的比較不同多項(xiàng)式模型擬合效果的比較 我們?nèi)砸岳覀內(nèi)砸岳?.1的數(shù)據(jù)為例,考慮短期內(nèi)某商品產(chǎn)出與其總的數(shù)據(jù)為例,考慮短期內(nèi)某商品產(chǎn)出與其總生產(chǎn)成本的關(guān)系,對以上三個(gè)模型進(jìn)行估計(jì),得到回歸結(jié)果生產(chǎn)成本的關(guān)系,對以上三個(gè)模型進(jìn)行估計(jì),得到回歸結(jié)果如下(括號中數(shù)字為如下(括號中數(shù)字為t值):值):2166.47+19.930.8418.756.50 iiYXR()()22222.388.032.540.928(9.47) (0.82) (2.92) iiiYXXR回顧例回顧例5.1中對三次多項(xiàng)式模型的回歸結(jié)果,如下:中對三次多項(xiàng)式模型的回歸結(jié)果,如下:

37、232141.7763.4812.960.940.99822.2413.2813.1515.90iiiiYXXXR() ()() () 以上三個(gè)回歸模型,決定系數(shù)依次提高,即表明模型越來越以上三個(gè)回歸模型,決定系數(shù)依次提高,即表明模型越來越接近真實(shí)。下面從殘差變動(dòng)角度來看,三組殘差圖如下:接近真實(shí)。下面從殘差變動(dòng)角度來看,三組殘差圖如下: 從上圖看出,在逐漸接近真實(shí)模型的過程中,隨著殘差絕對值的變小,從上圖看出,在逐漸接近真實(shí)模型的過程中,隨著殘差絕對值的變小,殘差變動(dòng)呈現(xiàn)的周期趨勢也逐漸消失。由此可見,利用對殘差圖的定性分殘差變動(dòng)呈現(xiàn)的周期趨勢也逐漸消失。由此可見,利用對殘差圖的定性分析也可

38、對模型是否遺漏重要變量作出判斷。析也可對模型是否遺漏重要變量作出判斷。三、三、 檢驗(yàn)誤設(shè)定的檢驗(yàn)誤設(shè)定的RESET方法方法 RESET檢驗(yàn)法的思路是在要檢驗(yàn)的回歸方程中加檢驗(yàn)法的思路是在要檢驗(yàn)的回歸方程中加進(jìn)進(jìn) 等項(xiàng)作為解釋變量,然后看結(jié)果是否有等項(xiàng)作為解釋變量,然后看結(jié)果是否有顯著改善。如有,則可判斷原方程存在遺漏有關(guān)變顯著改善。如有,則可判斷原方程存在遺漏有關(guān)變量的問題或其它的誤設(shè)定問題。量的問題或其它的誤設(shè)定問題。 直觀地看,這些添加的項(xiàng)是任何可能的遺漏變量直觀地看,這些添加的項(xiàng)是任何可能的遺漏變量或錯(cuò)誤的函數(shù)形式的替身,如果這些替身能夠通過或錯(cuò)誤的函數(shù)形式的替身,如果這些替身能夠通過F

39、檢驗(yàn)檢驗(yàn), 表明它們改善了原方程的擬合狀況,則我們表明它們改善了原方程的擬合狀況,則我們有理由說原方程存在誤設(shè)定問題。有理由說原方程存在誤設(shè)定問題。 等項(xiàng)形成多項(xiàng)式函數(shù)形式,多項(xiàng)式是一等項(xiàng)形成多項(xiàng)式函數(shù)形式,多項(xiàng)式是一種強(qiáng)有力的曲線擬合裝置,因而如果存在誤設(shè)定,種強(qiáng)有力的曲線擬合裝置,因而如果存在誤設(shè)定,則用這樣一個(gè)裝置可以很好地代表它們則用這樣一個(gè)裝置可以很好地代表它們。432,YYY和432,YYY和RESET檢驗(yàn)法的步驟檢驗(yàn)法的步驟 拉姆齊拉姆齊RESET檢驗(yàn)的具體步驟是:檢驗(yàn)的具體步驟是:(1) 用用OLS法估計(jì)要要檢驗(yàn)的方程,得到法估計(jì)要要檢驗(yàn)的方程,得到 (2) 由上一步得到的值由

40、上一步得到的值 (i=1,2,n),計(jì)算),計(jì)算 ,然后用然后用OLS法估計(jì):法估計(jì): (3) 用用F檢驗(yàn)比較兩個(gè)方程的擬合情況(類似于上一章中檢驗(yàn)比較兩個(gè)方程的擬合情況(類似于上一章中聯(lián)合假設(shè)檢驗(yàn)采用的方法),如果兩方程總體擬合情況聯(lián)合假設(shè)檢驗(yàn)采用的方法),如果兩方程總體擬合情況顯著不同,則我們得出原方程可能存在誤設(shè)定的結(jié)論。顯著不同,則我們得出原方程可能存在誤設(shè)定的結(jié)論。使用的檢驗(yàn)統(tǒng)計(jì)量為:使用的檢驗(yàn)統(tǒng)計(jì)量為: iiiXXY22110432,YYY和iYiiiiiiiuYYYXXY45342322110) 1/(/ )(knRSSMRSSRSSFM其中:其中:RSSM為第一步中回歸(有約束

41、回歸)的殘差為第一步中回歸(有約束回歸)的殘差平方和,平方和,RSS為第二步中回歸(無約束回歸)的殘差為第二步中回歸(無約束回歸)的殘差平方和,平方和,M為約束條件的個(gè)數(shù),這里是為約束條件的個(gè)數(shù),這里是M=3。 應(yīng)該指出的是,應(yīng)該指出的是,拉姆齊拉姆齊RESET檢驗(yàn)僅能檢驗(yàn)誤設(shè)檢驗(yàn)僅能檢驗(yàn)誤設(shè)定的存在,而不能告訴我們到底是哪一類的誤設(shè)定定的存在,而不能告訴我們到底是哪一類的誤設(shè)定,或者說,不能告訴我們正確的模型是什么。但該方法或者說,不能告訴我們正確的模型是什么。但該方法畢竟能給出模型誤設(shè)定的信號,以便我們?nèi)ミM(jìn)一步查畢竟能給出模型誤設(shè)定的信號,以便我們?nèi)ミM(jìn)一步查找問題。另一方面,如果模型設(shè)定正

42、確,找問題。另一方面,如果模型設(shè)定正確,RESET檢驗(yàn)檢驗(yàn)使我們能夠排除誤設(shè)定的存在,轉(zhuǎn)而去查找其它方面使我們能夠排除誤設(shè)定的存在,轉(zhuǎn)而去查找其它方面的問題。的問題。在在Eview中,回歸出方程中,中,回歸出方程中,reset檢驗(yàn)的命令如下:檢驗(yàn)的命令如下: ViewStability TestsRamsey RESET Test 例例5.4 誤設(shè)定檢驗(yàn)誤設(shè)定檢驗(yàn)在本例中,我們使用中國在本例中,我們使用中國19922009年城鎮(zhèn)居民人年城鎮(zhèn)居民人均食品消費(fèi)和人均可支配收入的實(shí)際數(shù)據(jù)來估計(jì)凱恩均食品消費(fèi)和人均可支配收入的實(shí)際數(shù)據(jù)來估計(jì)凱恩斯消費(fèi)函數(shù)。斯消費(fèi)函數(shù)。方程形式:方程形式: 其中:其中:

43、C代表食品消費(fèi),代表食品消費(fèi),Y代表收入。原始數(shù)據(jù)如下代表收入。原始數(shù)據(jù)如下表所示。表所示。tttCYu表表5-3 我國我國1992-2009年城鎮(zhèn)居民人均食品消費(fèi)和人均可支配收入年城鎮(zhèn)居民人均食品消費(fèi)和人均可支配收入 年份實(shí)際人均食品消費(fèi)(元)實(shí)際人均可支配收入(元)1992883.652026.601993908.332219.961994926.422408.751995944.382526.331996942.542623.401997961.292713.471998987.912869.9819991037.283137.4920001081.163338.9720011111.1

44、23622.0520021250.984108.3820031287.114478.2120041322.624821.1520051379.815285.0820061437.395835.9920071500.256546.7020081538.437096.4420091601.407793.80資料來源:根據(jù)資料來源:根據(jù)中國統(tǒng)計(jì)年鑒中國統(tǒng)計(jì)年鑒2010數(shù)據(jù)計(jì)算得到。數(shù)據(jù)計(jì)算得到。2622.790.1350.975(26.16) (25.08)0.41ttCYRDW 從回歸結(jié)果來看,方程的擬合優(yōu)度很高,斜率系數(shù)顯著,從回歸結(jié)果來看,方程的擬合優(yōu)度很高,斜率系數(shù)顯著,但但DW值低。值低。

45、 為了檢驗(yàn)?zāi)P驮O(shè)定是否正確,采用為了檢驗(yàn)?zāi)P驮O(shè)定是否正確,采用RESET方法。方法。由于由于P=0.00005.991所以拒絕原假設(shè),表明式(所以拒絕原假設(shè),表明式(5-23)存在誤設(shè)定。)存在誤設(shè)定。 23224.7043.5412.960.94=0.9896-3.879.11-13.1515.90iiiieXXXR ()()()()210 0.98969.896n R22第三節(jié)第三節(jié) 模型選擇模型選擇 現(xiàn)實(shí)中,模型擬合的過程其實(shí)主要就是變現(xiàn)實(shí)中,模型擬合的過程其實(shí)主要就是變量篩選的過程,在相關(guān)理論的基礎(chǔ)上,同時(shí)考慮量篩選的過程,在相關(guān)理論的基礎(chǔ)上,同時(shí)考慮變量的數(shù)據(jù)可得性以及替代變量適用性

46、等問題,變量的數(shù)據(jù)可得性以及替代變量適用性等問題,哪些變量應(yīng)引入模型,哪些變量應(yīng)剔除,應(yīng)結(jié)合哪些變量應(yīng)引入模型,哪些變量應(yīng)剔除,應(yīng)結(jié)合研究問題的重點(diǎn)綜合考慮。同樣的問題,十個(gè)計(jì)研究問題的重點(diǎn)綜合考慮。同樣的問題,十個(gè)計(jì)量經(jīng)濟(jì)學(xué)家有可能最終給出十個(gè)不同的模型結(jié)果。量經(jīng)濟(jì)學(xué)家有可能最終給出十個(gè)不同的模型結(jié)果?!敖?jīng)驗(yàn)經(jīng)驗(yàn)”和和“藝術(shù)藝術(shù)”在建模中非常重要,實(shí)際操在建模中非常重要,實(shí)際操作中的一些技術(shù)因素也有一定規(guī)律可循,接下來作中的一些技術(shù)因素也有一定規(guī)律可循,接下來將介紹一些模型選擇中的技術(shù)方法。將介紹一些模型選擇中的技術(shù)方法。 一、一、 變量選擇的一般原則變量選擇的一般原則 根據(jù)第一節(jié)中對各類誤

47、設(shè)定后果的分析,我們根據(jù)第一節(jié)中對各類誤設(shè)定后果的分析,我們知道在模型設(shè)定中的一般原則是盡量不遺漏有關(guān)的知道在模型設(shè)定中的一般原則是盡量不遺漏有關(guān)的解釋變量。因?yàn)楣烙?jì)量有偏比增大誤差更嚴(yán)重。但解釋變量。因?yàn)楣烙?jì)量有偏比增大誤差更嚴(yán)重。但如果方差很大,得到的無偏估計(jì)量也就沒有多大意如果方差很大,得到的無偏估計(jì)量也就沒有多大意義了,因此也不宜隨意亂增加解釋變量。在回歸實(shí)義了,因此也不宜隨意亂增加解釋變量。在回歸實(shí)踐中,有時(shí)要對某個(gè)變量是否應(yīng)該作為解釋變量包踐中,有時(shí)要對某個(gè)變量是否應(yīng)該作為解釋變量包括在方程中做出準(zhǔn)確的判斷確實(shí)不是一件容易的事,括在方程中做出準(zhǔn)確的判斷確實(shí)不是一件容易的事,因?yàn)槟壳?/p>

48、還沒有行之有效的方法可供使用。因?yàn)槟壳斑€沒有行之有效的方法可供使用。 選擇解釋變量的四條準(zhǔn)則選擇解釋變量的四條準(zhǔn)則2R2R1.理論:理論: 從理論上看,該變量是否應(yīng)該作為解釋變從理論上看,該變量是否應(yīng)該作為解釋變量包括在方程中?量包括在方程中?2. t檢驗(yàn):該變量的系數(shù)估計(jì)值是否顯著檢驗(yàn):該變量的系數(shù)估計(jì)值是否顯著?3. :該變量加進(jìn)方程中后,:該變量加進(jìn)方程中后, 是否增大?是否增大?4. 偏倚:偏倚: 該變量加進(jìn)方程中后,其它變量的系數(shù)估該變量加進(jìn)方程中后,其它變量的系數(shù)估計(jì)值是計(jì)值是否顯著變化?否顯著變化?如果對四個(gè)問題的回答都是肯定的,則該變量應(yīng)該包如果對四個(gè)問題的回答都是肯定的,則該

49、變量應(yīng)該包括在方程中;如果對四個(gè)問題的回答都是括在方程中;如果對四個(gè)問題的回答都是“否否”, 則該變則該變量是無關(guān)變量,可以安全地從方程中刪掉它。量是無關(guān)變量,可以安全地從方程中刪掉它。 但根據(jù)以上準(zhǔn)則判斷并不總是這么簡單。在很多情況下,但根據(jù)以上準(zhǔn)則判斷并不總是這么簡單。在很多情況下,這四項(xiàng)準(zhǔn)則的判斷結(jié)果會出現(xiàn)不一致。例如,有可能某個(gè)變這四項(xiàng)準(zhǔn)則的判斷結(jié)果會出現(xiàn)不一致。例如,有可能某個(gè)變量加進(jìn)方程后,量加進(jìn)方程后, 增大,但該變量不顯著。增大,但該變量不顯著。 因此,當(dāng)這四項(xiàng)用于判斷一個(gè)變量是否應(yīng)加進(jìn)回歸方程的因此,當(dāng)這四項(xiàng)用于判斷一個(gè)變量是否應(yīng)加進(jìn)回歸方程的準(zhǔn)則出現(xiàn)不一致的情況時(shí),應(yīng)當(dāng)特別

50、小心。在這種情況下,準(zhǔn)則出現(xiàn)不一致的情況時(shí),應(yīng)當(dāng)特別小心。在這種情況下,作出正確判斷不是一件容易的事,但可以讓事情變得容易一作出正確判斷不是一件容易的事,但可以讓事情變得容易一些,辦法是將理論準(zhǔn)則放在第一位,再多的統(tǒng)計(jì)證據(jù)也不能些,辦法是將理論準(zhǔn)則放在第一位,再多的統(tǒng)計(jì)證據(jù)也不能將一個(gè)理論上很重要的變量變成將一個(gè)理論上很重要的變量變成“無關(guān)無關(guān)”變量。變量。 在選擇變量的問題上,應(yīng)當(dāng)堅(jiān)定不移地在選擇變量的問題上,應(yīng)當(dāng)堅(jiān)定不移地根據(jù)理論而不是滿根據(jù)理論而不是滿意的擬合結(jié)果來作決定意的擬合結(jié)果來作決定,對于是否將一個(gè)變量包括在回歸方,對于是否將一個(gè)變量包括在回歸方程中的問題,理論是最重要的判斷準(zhǔn)則

51、。如果不這樣做,產(chǎn)程中的問題,理論是最重要的判斷準(zhǔn)則。如果不這樣做,產(chǎn)生不正確結(jié)果的風(fēng)險(xiǎn)很大。生不正確結(jié)果的風(fēng)險(xiǎn)很大。2R 實(shí)踐中,要解決的一個(gè)問題是如何從大量的潛在實(shí)踐中,要解決的一個(gè)問題是如何從大量的潛在解釋變量的集合中選擇一個(gè)最合適的子集,以得到一解釋變量的集合中選擇一個(gè)最合適的子集,以得到一個(gè)正確設(shè)定的模型。個(gè)正確設(shè)定的模型。 上個(gè)世紀(jì)六十年代后相當(dāng)一段時(shí)間,人們使用逐上個(gè)世紀(jì)六十年代后相當(dāng)一段時(shí)間,人們使用逐步回歸法來解決解釋變量的選擇問題。這種由計(jì)算機(jī)步回歸法來解決解釋變量的選擇問題。這種由計(jì)算機(jī)機(jī)械挑選變量的做法如今已不流行了。目前比較通行機(jī)械挑選變量的做法如今已不流行了。目前比

52、較通行的做法是從少量精心設(shè)定的備選模型中選擇一個(gè)。的做法是從少量精心設(shè)定的備選模型中選擇一個(gè)。 計(jì)量經(jīng)濟(jì)學(xué)家就此提出了很多基于統(tǒng)計(jì)學(xué)的選擇計(jì)量經(jīng)濟(jì)學(xué)家就此提出了很多基于統(tǒng)計(jì)學(xué)的選擇標(biāo)準(zhǔn),我們這里討論其中幾種,如表標(biāo)準(zhǔn),我們這里討論其中幾種,如表54所示所示。二、二、 有關(guān)模型選擇的幾個(gè)判斷準(zhǔn)則有關(guān)模型選擇的幾個(gè)判斷準(zhǔn)則 令RSSj表示第j個(gè)模型(有kj個(gè)解釋變量)的殘差平方和,并定義 為第j個(gè)模型的的 估計(jì)值。我們 用表示包含全部k個(gè)解釋變量的模型的 估計(jì)值。2jjjRSSnk2m2222/()/()(1)2()/()exp2(1)/ jjjjjjjmjjjjjppRRSSnkSRSSnknk

53、CRSSkPCRSSnknkAICRSSkn表54 選擇回歸模型的準(zhǔn)則準(zhǔn)則 計(jì)算公式 1. 準(zhǔn)則準(zhǔn)則 希爾(希爾(Theil)的)的 準(zhǔn)則基于如下假設(shè):所考慮的準(zhǔn)則基于如下假設(shè):所考慮的模型中有一個(gè)是正確模型。對于正確模型,模型中有一個(gè)是正確模型。對于正確模型, ,對于不正確模型,對于不正確模型, 。因此。因此,選擇選擇 最小的模型最小的模型一般就能選出正確模型。由于一般就能選出正確模型。由于 最小化與最小化與 最大化是最大化是一回事,我們習(xí)慣上稱該準(zhǔn)則為一回事,我們習(xí)慣上稱該準(zhǔn)則為 最大準(zhǔn)則。最大準(zhǔn)則。 這個(gè)準(zhǔn)則的主要問題是,一個(gè)包括正確模型的所有這個(gè)準(zhǔn)則的主要問題是,一個(gè)包括正確模型的所有

54、解釋變量但同時(shí)也包括一些無關(guān)變量的模型也會給出解釋變量但同時(shí)也包括一些無關(guān)變量的模型也會給出 ,在這種情況下,我們所選擇的其實(shí)并非,在這種情況下,我們所選擇的其實(shí)并非正確模型。當(dāng)備選模型包含大量無關(guān)變量時(shí),選出正正確模型。當(dāng)備選模型包含大量無關(guān)變量時(shí),選出正確模型的概率較低。確模型的概率較低。2R2R222R2R22()jE22()jE22()jE 在一個(gè)實(shí)際問題的回歸建模中,在一個(gè)實(shí)際問題的回歸建模中, 越大,所對越大,所對應(yīng)的回歸方程越好。如果我們僅從擬合的角度追求應(yīng)的回歸方程越好。如果我們僅從擬合的角度追求“最優(yōu)最優(yōu)”,則所有回歸子集中,則所有回歸子集中 最大者對應(yīng)的回最大者對應(yīng)的回歸模

55、型就是歸模型就是“最優(yōu)最優(yōu)”模型。模型。2R2R 2. 基于預(yù)測的均方誤差最小的三個(gè)準(zhǔn)則基于預(yù)測的均方誤差最小的三個(gè)準(zhǔn)則 希爾的準(zhǔn)則是基于回歸的標(biāo)準(zhǔn)誤差最小,下列三個(gè)準(zhǔn)則則是基于預(yù)測的均方誤差(MSE)最小。這三個(gè)準(zhǔn)則是: 馬婁斯(Mallows)的 準(zhǔn)則 霍金(Hocking)的 準(zhǔn)則 阿美米亞(Amemiya)的PC準(zhǔn)則 假設(shè)正確的方程有k個(gè)解釋變量,我們考慮的方程有 個(gè)解釋變量,問題是如何選擇k1以及具體的k1個(gè)解釋變量的集合。在上述三個(gè)預(yù)測準(zhǔn)則中,這是通過使的均方誤差 達(dá)到最小實(shí)現(xiàn)的,其中 是Y的未來值,而 是預(yù)測值。 1()kkfYfY2()ffE YYpCpS 另一件要注意之事是,

56、另一件要注意之事是, 最大準(zhǔn)則與預(yù)測準(zhǔn)則最大準(zhǔn)則與預(yù)測準(zhǔn)則 、 或或PC回答的是兩個(gè)回答的是兩個(gè)不同不同的問題。的問題。 在在 最大準(zhǔn)則的情況下,假定備選模型中有一個(gè)最大準(zhǔn)則的情況下,假定備選模型中有一個(gè)是是正確正確的,我們要做的是挑出的,我們要做的是挑出“正確正確”模型。模型。 而在三個(gè)預(yù)測準(zhǔn)則的情況下,我們感興趣的是改而在三個(gè)預(yù)測準(zhǔn)則的情況下,我們感興趣的是改善預(yù)測的善預(yù)測的MSE,只要能改善,可以去掉某些變量,即只要能改善,可以去掉某些變量,即便是正確模型中包括它們也在所不惜。便是正確模型中包括它們也在所不惜。 pCpS2R2R 3. 赤池信息準(zhǔn)則(赤池信息準(zhǔn)則(AIC) 赤池信息準(zhǔn)則(

57、赤池信息準(zhǔn)則(Akaikes Information Criterion,AIC)是一個(gè)更一般的準(zhǔn)則,它可以應(yīng)用)是一個(gè)更一般的準(zhǔn)則,它可以應(yīng)用于任何一個(gè)可用極大似然法估計(jì)的模型。對于我們于任何一個(gè)可用極大似然法估計(jì)的模型。對于我們這里的應(yīng)用,這里的應(yīng)用,AIC的計(jì)算公式為的計(jì)算公式為 與赤池信息準(zhǔn)則類似的還有施瓦茨信息準(zhǔn)則(與赤池信息準(zhǔn)則類似的還有施瓦茨信息準(zhǔn)則(Schwarz information criterion,SIC):): 上述兩個(gè)準(zhǔn)則與前述準(zhǔn)則上述兩個(gè)準(zhǔn)則與前述準(zhǔn)則 一樣,可用于模型選擇一樣,可用于模型選擇,其值也是越小越好。,其值也是越小越好。2(1)/knRSSAICen

58、(1)/knRSSSICnn 在回歸分析的建模過程中,對每一個(gè)回歸子集在回歸分析的建模過程中,對每一個(gè)回歸子集計(jì)算計(jì)算AIC,其中,其中AIC最小者所對應(yīng)的模型是最小者所對應(yīng)的模型是“最優(yōu)最優(yōu)”回歸模型。回歸模型。 AIC準(zhǔn)則只能用于比較準(zhǔn)則只能用于比較同一種方法同一種方法擬合得到的擬合得到的回歸模型?;貧w模型。71 下面用一個(gè)實(shí)際經(jīng)濟(jì)例子,對所有回歸子集計(jì)算下面用一個(gè)實(shí)際經(jīng)濟(jì)例子,對所有回歸子集計(jì)算上述四個(gè)統(tǒng)計(jì)量,綜合比較一下上述四個(gè)統(tǒng)計(jì)量,綜合比較一下“最優(yōu)最優(yōu)”回歸子集回歸子集的選擇。的選擇?!纠?.5】用用y表示某種消費(fèi)品的銷售額,表示某種消費(fèi)品的銷售額,x1表示居表示居民可支配收入,民可支配收入,x2表示該類消費(fèi)品的價(jià)格指數(shù),表示該類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論