第13章模型設(shè)定和診斷檢驗_第1頁
第13章模型設(shè)定和診斷檢驗_第2頁
第13章模型設(shè)定和診斷檢驗_第3頁
第13章模型設(shè)定和診斷檢驗_第4頁
第13章模型設(shè)定和診斷檢驗_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1第十三章計量經(jīng)濟建模:模型設(shè)定和診斷檢驗2 經(jīng)濟學(xué)家多年來對“真理”的尋求曾給人一種觀感:經(jīng)濟學(xué)家們就好像在一間黑房子里搜尋一直原本并不存在的黑貓;而計量經(jīng)濟學(xué)家還經(jīng)常聲稱找到了一只。3 經(jīng)典線性回歸模型的假定之一(假定9)是,分析中所使用的模型被“正確地”設(shè)定;如果模型并未被明確設(shè)定,我們就遇到了這樣的問題:模型設(shè)定誤差模型設(shè)定誤差(model specification error)或者模型設(shè)定偏誤模型設(shè)定偏誤(model specification bias)。4尋找正確的模型就像尋找圣杯一樣。具體而言,我們需要考慮如下問題:l我們?nèi)绾稳ふ乙粋€“正確”的模型?換言之,在經(jīng)驗分析中選擇

2、一個模型的準則有哪些?l在實踐中,容易遇到哪些類型的模型設(shè)定誤差?l設(shè)定誤差的后果有哪些?l如何偵查設(shè)定誤差?換言之,我們可以使用哪些診斷工具?l一旦偵查出設(shè)定誤差,我們能采取哪些補救措施?l如何評價幾個表現(xiàn)不相上下的備選模型?513.1 模型選擇準則根據(jù)亨得利和理查德的觀點,一個被選用于經(jīng)驗分析的模型應(yīng)滿足如下準則:l數(shù)據(jù)容納性;即從模型做出的預(yù)測必須有邏輯上的可能性。l與理論一致;即必須有好的經(jīng)濟含義。l回歸元的弱外生性;即解釋變量或回歸元必須與誤差項不相關(guān)。6l表現(xiàn)出參數(shù)的不變性;即參數(shù)的值必須穩(wěn)定,否則預(yù)測 就很困難。l表現(xiàn)出數(shù)據(jù)的協(xié)調(diào)性;即從模型中估計的殘差必須完全隨機(從技術(shù)上而言

3、必須是白噪音)。l模型有一定的包容性;即模型應(yīng)該包容或包括所有與之競爭的模型。713.2 設(shè)定誤差的類型1、漏掉一個有關(guān)變量(、漏掉一個有關(guān)變量(1.Omitting A Relevant Variable)為了簡明起見,令這個模型為: (13.2.1) 其中,Yi = 生產(chǎn)的總成本,Xi = 產(chǎn)量。等式(13.2.1)是立方總成本函數(shù)。2312341iiiiiYXXXu8但是,假設(shè)出于某種原因,研究者決定使用以下模型: (13.2.2)由于(13.2.1)被認為是真實的,采用(13.2.2)就構(gòu)成了一種設(shè)定誤差,即漏掉了一個有關(guān)變量(Xi3)的誤差。因此,(13.2.2)中的誤差項u2i事實

4、上是:21232iiiiYXXu3214iiiuuX9 2、包含了一個無需或無關(guān)的變量、包含了一個無需或無關(guān)的變量 (Including an unnecessary or irrelevant variable)假定另一個研究者使用了以下模型: (13.2.4)新的誤差項是: (13.2.5) 因為真模型中5 = 0234123453iiiiiiYXXXXu43151iiiiuuXu103、錯誤的函數(shù)形式(、錯誤的函數(shù)形式(Wrong functional form)再假定又一研究者擬定以下模型: (13.2.6) 23i12i3i4i4ilnYXXXu114、測量偏誤的誤差(、測量偏誤的誤

5、差(Errors of measurement bias)考慮有研究者使用如下模型:(13.2.7) 其中, , ,i和i均為測量誤差。(13.2.7)所表明的是,研究者沒有使用真正的Yi和Xi,卻用了含有測量誤差的替代變量Yi*和Xi*。*2*3*i12i3i4iiYXXXu*iiiYY*iiiXX125、對隨機誤差項、對隨機誤差項ui不正確的設(shè)定不正確的設(shè)定 (Specification errors to the stochastic error )如果真實的、正確的模型是: (13.2.8) 并且lnui滿足CLRM的假定 誤設(shè)為: (13.2.9)iiiYX uiiiYXu1313.

6、3 模型設(shè)定誤差的后果1、模型擬合不足(漏掉一個相關(guān)變量)、模型擬合不足(漏掉一個相關(guān)變量)真實的模型: (13.3.1)但出于某種原因,我們擬合了如下模型: (13.3.2) 后果將會如何?i122i33iiYXXui1122iiYbbX三變量回歸模型的離差形式:(1)有: (2)(3)兩邊分別除以X2i2:(4)回到前面,有 (X3對X2回歸)142233iiiiYXXuu22223232()iiiiiiiY XXX XXuu23332233()iiiiiiiY XXX XXuu233222biiiXXX232322222222()iiiiiiiiiY XX XXuuXXX2i1222Yb

7、iiXX15于是,等式(4)變換為: (5)分別取等式兩邊的期望值 (6)(其中,2和3都是常數(shù),ui與X2i和X3i不相關(guān))1223 32()E bb212233222()bbiiiXuuX16于是,漏掉變量X3的后果如下:1、如果X3與X2相關(guān),r23 0,那么 和 是有偏誤且非一致的。也就是說, 2、如果X3與X2不相關(guān),r23 = 0,那么 ,盡管 現(xiàn)在無偏,但 是無偏的。3、干擾的方差2將被不正確地估計。4、 的方差 ( )是真實估計量的方差的一個有偏誤的估計值。5、通常的置信區(qū)間和假設(shè)檢驗程序容易給出錯誤的結(jié)論。6、所作出的預(yù)測不可靠。1b12b11E ( b)1 22E ( b)

8、32b012b1b12b222 iX17 結(jié)論:一旦根據(jù)相關(guān)理論把模型建立起來,切忌從中再忽略掉一個變量。182、包含一個無關(guān)變量(模型擬合過度)、包含一個無關(guān)變量(模型擬合過度)現(xiàn)在讓我們假定 (13.3.6) 是真實模型,而我們擬合了一下模型: (13.3.7) 122iiiYXu12233iiiiYXXv19我們知道: 22332322222323()()()() 2()yxxyxx xxxx x 2222 1 iiiy xx真實模型的離差形式為:20將(3)代入(2): 因此, 仍是無偏的。我們發(fā)現(xiàn):將 (3) 代入 (5): 22223232222222323()()()() 4()

9、xxx xExxx x 23222332222323()()()() (5)()yxxyxx xxxx x 222 322 3232222232 3()() ()()()0 6()x xxx xxExxx x 2x3在真實模型中不存在,它的系數(shù)為0。因此,這一設(shè)定誤差(擬合過度)將導(dǎo)致如下后果:(1)所有參數(shù)的OLS估計量都是無偏且一致的,即,(2)誤差方差2的估計是正確的。(3)通常的置信區(qū)間和假設(shè)檢驗仍然有效。21112233()() ()0EEE22(4)但是,一般而言,諸 系數(shù)的估計值將不是有效的,也就是說,它們的方差一般都大于真實模型中 的方差。例如:22222222223var()

10、 , var()(1)iixxr而22232322 0r1,011var()var()r 一個無益的結(jié)論似乎是:與其忽略有關(guān)變量,不如含有無關(guān)變量。23但是,這種理論是不值得維護的,因為增加不必要的變量將導(dǎo)致:1、估計量的效率損失2、多重共線性問題3、自由度的損失 一般而言,最好的方法是,根據(jù)理論,僅僅包含那些直接影響因變量,而又不能由已被引進的其他變量來代替的解釋變量。2413.4 設(shè)定誤差的檢驗一、對過度擬合的偵察一、對過度擬合的偵察假設(shè),為了解釋某一現(xiàn)象,我們提出一個k變量模型: (13.4.1)若要判斷變量Xk是否真的屬于這個模型,一個簡單的方法是用 t 檢驗:12233.iiikki

11、iYXXXu()kkts e25我們可以用F檢驗來判斷X3和X4是否真的屬于這個模型。034:0H問題:問題:1、能否反復(fù)使用 t 檢驗,首先是 的顯著性,然后是 等等的顯著性,最后是 的顯著性?34k26 這種建模策略被稱為自下而上的方法(bottom-up approach)(從一個較小的模型開始,然后逐漸擴大模型) 或者多少帶有輕薄口吻地稱之為: 數(shù)據(jù)開采(date mining)方法 回歸捕捉(regression fishing)方法 數(shù)據(jù)窺探(data snooping)方法 數(shù)字斟酌(number crunching)方法。27 本專業(yè)的純化論者很看不起數(shù)據(jù)開采的實踐。譴責(zé)“數(shù)據(jù)

12、開采”的原因之一如下: 在數(shù)據(jù)開采情況下的名義的與真實的顯著性水平是不在數(shù)據(jù)開采情況下的名義的與真實的顯著性水平是不同的。同的。一種數(shù)據(jù)開采的危險是,諸如1%、5%、10%的常用的顯著性水平并非是真實的顯著性水平。28 洛弗爾(Lovell,1983)曾指出,如果有c個備用的回歸元,根據(jù)數(shù)據(jù)開采的情況,從中最后選出k個(k c),則真實的顯著性水平(*)和名義上的顯著性水平()有如下關(guān)系:(13.4.2)或近似地為 (13.4.3) 例如,若 c = 15,k = 5, = 5%, 由(13.4.3),真實的顯著性水平為 (155)(5%) = 15%29 在實踐中,多數(shù)研究者都僅報告其“最終

13、”回歸結(jié)果,而不透露此前是如何通過大量數(shù)據(jù)開采或預(yù)檢驗而得到這些結(jié)果的詳情。 這與個人升遷有關(guān)! 但是,在應(yīng)用計量經(jīng)濟學(xué)家看來,純粹主義者(即非數(shù)據(jù)開采者)的建模方法也存在問題。30 查曼(Zaman,1995)的觀點: 如果我們從一個更開闊的視角來看待數(shù)據(jù)開采,把它看成一種尋求經(jīng)驗規(guī)律的過程,并能從這些經(jīng)驗規(guī)律中判斷現(xiàn)有理論模型中是否存在錯誤或紕漏,那么它將起到一個非常大的作用。 肯尼迪(Kennedy,1992)認為,“應(yīng)用計量經(jīng)濟學(xué)家的藝術(shù)在于,容許數(shù)據(jù)驅(qū)動理論進展而又不致陷入太大的數(shù)據(jù)開采的危險?!?1 二、對遺漏變量和不正確函數(shù)形式的檢驗二、對遺漏變量和不正確函數(shù)形式的檢驗 1. 殘

14、差分析 P518-519 和 figure 13.1 結(jié)論: 如果有設(shè)定誤差,殘差圖必定展現(xiàn)出明顯的樣式。32 2. 再次使用德賓-沃森 d 統(tǒng)計量 德賓-沃森 d 統(tǒng)計量的定義: 由于 和 只在一次觀察中有區(qū)別,因而它們近似相等。因此:2tu21tu33由于若 = 1,d = 0,表明殘差存在完全的正相關(guān)關(guān)系;若 = -1,d = 4,殘差存在完全負相關(guān)關(guān)系;若 = 0,d = 2,殘差不存在一階的自相關(guān)。如果真實的模型是:而擬合的模型是:或者則 d 值表明存在正向的自回歸。參見P519 Table13.1的d 值3435 為了用德賓-沃森檢驗來偵察模型設(shè)定誤差,我們以如下方式進行: (1)

15、從假定的模型求得OLS殘差。 (2)如果認為假定的模型因排除了一個有關(guān)的解釋變量,比如說Z而是誤設(shè)的,則將第1步中所得的殘差按Z值的遞增次序排列。 注意:Z變量可以是假定模型所含的X變量之一,或該變量的某一函數(shù),如23XX 或 36(3)由這樣排列的殘差計算d統(tǒng)計量。注意:t 在這里是觀測次數(shù),并不一定指時間序列數(shù)據(jù)。(4)根據(jù)德賓-沃森表,如果估計的 d 值是顯著的,就可接受模型誤設(shè)的假設(shè)。 問:如何補救?n2tt 1t 2n2tt 1(uu)d u373. 拉姆齊的RESET檢驗 拉姆齊(Ramsey)曾指出一種稱為RESET(regression specification error

16、test)的一般性設(shè)定誤差檢驗。答:增加解釋變量。38 拉姆齊的RESET檢驗: 我們?nèi)匀皇褂贸杀井a(chǎn)出的例子,并假定成本是產(chǎn)出的線性函數(shù): (13.4.6)其中,Y = 總成本,X = 產(chǎn)出123iiiYXu39 如果用此回歸的殘差 對 描圖,就會得到一個如下所示的圖形:3iuiY40 雖然 和 都是零,圖中的殘差仍表明其均值系統(tǒng)地隨 而變化的模式。 這提示我們,如果以某種形式將 當(dāng)做回歸元引入(13.4.6),則應(yīng)使 增大。 而如果 的增大是統(tǒng)計上顯著的,就表明線性成本函數(shù)(13.4.6)是誤設(shè)的。iuiiuYiYiY2R2R41RESET的操作步驟如下:(1)從所選的模型,例如(13.4.

17、6)得到 的估計值 。iYiY42 (2)將某種形式的 作為增補的回歸元引入,重做(13.4.6)。 由圖13.2,我們觀察到 與 之間存在曲線關(guān)系,表明可引進 和 作為增補的回歸元。作回歸:(3)記來自(13.4.7)的R2為 R2新 ,得自(13.4.6)的為R2舊,然后引入F檢驗: (8.5.18)iYi uiY231234(13.4.7)iiiiiYXYYu2iY3iY43(4)如果所計算的F值是顯著的,就可接受模型(13.4.6)被誤設(shè)的虛擬假設(shè)。 即: H0:模型被誤設(shè) 若 ,則接受H0 P522 例題 FF44 RESET的優(yōu)點之一是,它不要求設(shè)定對立模型,故易于應(yīng)用。 但這同時

18、也是它的缺點,因為即使知道了模型誤設(shè),也不一定有助于另外選出一個更好的模型。454. 對于增補變量的拉格朗日乘數(shù)(LM)檢驗 為了說明此檢驗,我們繼續(xù)應(yīng)用前述的說明性例子。如果將線性成本函數(shù)(13.4.6)同立方成本函數(shù)(13.4.4)相比,前者就是后者的一個受約束形式。約束條件:340123(13.4.6)iiiYXu46LM檢驗進行如下:(1)用OLS法估計受約束回歸(13.4.6),并求得殘差 。(2)如果無約束的回歸(13.4.4)實際上是真實回歸,則得自(13.4.6)的殘差應(yīng)與平方產(chǎn)出 和立方產(chǎn)出 有關(guān)。2iX3iXiu47(3)用 對全部回歸元作回歸: vi 是具有通常性質(zhì)的一個

19、誤差項。(4)恩格爾曾證明,對于大樣本,從(輔助)回歸 (13.4.11) 估計出來的R2的n倍遵循自由度等于受約束回歸中約束個數(shù)的 分布 231234iiiiiuXXX(13.4.11)222nR約束個數(shù)iu48(5)作出判斷: P524 例22, nR拒絕受限回歸;22 nR, 不拒絕受限回歸。49一、因變量一、因變量 Y 中的測量誤差中的測量誤差 考慮以下模型: (13.5.1) 其中,Yi* = 永久性消費支出 Xi = 當(dāng)前收入 ui = 隨機干擾項 *iiiYXu13.5 測量誤差50 可觀測的變量 Yi i 表示測量誤差 于是,我們估計的不是(13.5.1),而是: (13.5.

20、3)*(13.5.2)iiiYYiiiiYXuiiX51 其中, 是一個合成誤差項,包含著總體干擾項。 為了簡單起見,假定:iiivu ( )( )0iiE uEcov(,)0iiX ucov(,)0iiXcov( ,)0iiu52有了這些假設(shè),我們可以證明: 1、從(13.5.1)和(13.5.3)估計出來的 是一個無偏估計量。 2、從(13.5.1)和(13.5.3)估計出來的 的方差和標準差是不同的。 模型(13.5.1): (13.5.4) 模型(13.5.3): (13.5.5)22var()uix22222var( )vuiixx53二、解釋變量二、解釋變量 X 中的測量誤差中的測

21、量誤差 考慮如下的模型: 其中,Yi = 當(dāng)前消費支出 Xi* = 永久性收入 ui = 干擾項(方程誤差)*(13.5.6)iiiYXu54 假設(shè)我們不能觀測到 Xi* ,于是便用 Xi 來代替 (13.5.7) wi 代表 Xi* 中的測量誤差,從而我們估計的不是(13.5.6),而是: 其中, 是方程與測量兩種誤差的一個混合。 *iiiXXw () ()(13.5.8) iiiiiiiiiYXwuXuwXziiizuw55為了簡便,假定:iiE wE u0ijE w w0ijijcov w ,w0 iiiE zE uw0合成誤差項 zi 是否獨立于解釋變量 Xi ?56答案:iE w0*

22、iiE XX iiiiiicov z ,XE zE zXE Xiii2i2wE uwwEw 13.5.957 因此,(13.5.8)中的解釋變量與誤差項是相關(guān)的,這違背了經(jīng)典線性回歸模型中的關(guān)鍵假定:解釋變量與隨機干擾項無關(guān)。 如果這一假定被破壞,則可以證明,OLS估計量不僅是有偏誤的而且是非一致的。 其中, 和 分別是 和 的方差, 指 的概率極限。 解釋見 附錄13 A.3*22w1Plim13.5.101/X2w*2Xiw*XPlim58什么是概率極限?例: 是 的估計值,若:nlimP10 P 代表概率。 上式表明, 和 之差的絕對值小于任意小的正數(shù) 的概率趨向于1。 在這里, 是 的

23、一個一致估計量。用公式表示: 或者nPlimPlim59 根據(jù)(13.5.10),我們可以假定,如果 2W 相對 2X 而言較小, ,我們可以使用通常的OLS估計。但是,在實際情形中,要觀測到哪一個較大很困難。因此我們使用通常的OLS估計時要小心。Plim 補救方法: IV 或 PV代理變量 見第十七章6013.6 對隨機誤差項不正確的設(shè)定 真實的模型: 回歸模型:iiiYX u(13.2.8)iiiYXu(13.2.9)假定 滿足新的OLS的假定。根據(jù)過原點的回歸方程,的估計量為:iulnii2iXYX(1)61將Y替換為真實模型(13.2.8)中的Y,有:2iiiii22iiXX uX u

24、XX(2)統(tǒng)計理論表明,如果 ,則有:2ilnu N(0,)有: ,22iE ue22ivar(u )e(e1)例如,在 Black-Scholes 期權(quán)定價中,假設(shè)股票價格服從ui 對數(shù)正態(tài)ST log normallnST 62因此,2222ii1122nn22iiX uX uX uX uE( )EEXX222221122nn2i2i22i2X EuX EuX EuXXXeeE( ), 是 的一個有偏估計量。6313.7 嵌套與非嵌套模型考慮以下模型:模型 A: 模型 B:i122i33i44i55iiYXXXXui122i33iiYXXu我們說模型 B 被嵌套在模型 A 中,因為它是模型

25、 A 的一個特殊情形:如果我們估計模型 A ,然后檢驗假設(shè):45064 我們前面討論過的設(shè)定誤差檢驗和第8章中討論過的約束 F 檢驗在本質(zhì)上都屬于這種嵌套假設(shè)檢驗,只是我們沒有這么稱呼而已。 現(xiàn)在,考慮以下的模型: 模型 C: 模型 D:比如財政變量比如金融變量65 其中,X 和 Z 各代表不同的變量。我們說模型 C 和 D 是非嵌套的,因為不能把一個作為另一個的特殊情形推導(dǎo)出來。 模型 D 中可以包含 X3 ,模型 C 中可以包含 Z2 。盡管如此,它們?nèi)允欠乔短啄P?,因為模?C 沒有包含 Z3 ,模型 D 中沒有包含 X2 。66 即使進入模型的變量完全一樣,函數(shù)形式不同也可能使兩個模型

26、稱為非嵌套模型。考慮如下模型: 模型 E: 模型 D 和 E 是非嵌套的,因為不能把其中一個作為另外一個的特殊情形而推導(dǎo)出來。6713.8 非嵌套假設(shè)的檢驗非嵌套假設(shè)的檢驗 哈維(Harvey)將檢驗非嵌套假設(shè)的方法分成兩種: (1)判別方法(discrimination approach):給定兩個或多個相競爭的模型,根據(jù)某些擬合優(yōu)度準則選擇其一。 (2)辨識方法(discerning approach ):在考察一個模型時同時顧及其他模型所提供的信息。68 一、判別方法一、判別方法 就是使用: ,赤池信息準則( Akaikes Information Criterion , AIC),施瓦

27、茨信息準則( Schwarizs Information Criterion , SIC),或馬婁斯的 準則 (Mallowss Criterion ) 來選擇模型。 2RpCpC 二、辨識方法二、辨識方法 1. 非嵌套 F 檢驗或包容 F 檢驗 考慮前面介紹的模型 C 和 D 。如何在這兩個模型之間進行選擇呢?為此,假設(shè)我們估計如下的嵌套或混合模型: 模型F:70 注意模型 F 嵌套或包含了模型 C 和 D。但 C 和 D 是非嵌套模型。 現(xiàn)在,如果模型 C 是正確的,則 ,而如果模型 D 是正確的,則 。 問:如何檢驗? 答:F 檢驗。45023071 然而,這種檢驗程序卻帶來一些問題。

28、(1)如果 X 與 Z 高度相關(guān),則很可能一個或多個 系數(shù)在統(tǒng)計上不顯著,盡管我們有可能拒絕所有斜率系數(shù)同時為零的假設(shè)。在這種情形中,我們無法決定到底是模型 C 還是模型 D 才是正確的。 (2)可能出現(xiàn)矛盾的情況: 選擇模型 C 檢驗所有系數(shù)都是顯著的 加入一個或兩個 Z 變量 t 或 F 檢驗不顯著 C正確 選擇模型 D 檢驗 所有系數(shù)都顯著 加入一個或兩個 X 變量 t 或 F 檢驗 不顯著 D正確72 因此,參考假設(shè)的選擇能夠決定模型選擇的結(jié)果(類似于“先入為主”),特別是在相互爭持的回歸元中有多重共線性的情況下。 (3)人為地嵌套模型可能缺乏經(jīng)濟意義。73 2. 戴維森-麥金農(nóng) J

29、檢驗(Davidson-Mackinnon J Test) 我們要比較模型 C 和 D ,步驟如下:(1)估計模型 D ,得到 Y 的估計值 。(2)將 作為回歸元放進模型 C 中,得:DiYDiYDi122i33i4iiYXXYu(13.8.5)(3)用 t 檢驗對 進行檢驗。(4)如果 ,不被拒絕 H0 ,不拒絕模型 C 為真模型 因為 代表模型 C 所含變量以外的其它變量的影響。 不顯著,說明其它變量并沒有增加模型C原有的解釋。 即:模型 D 不含有足以改進模型 C 的表現(xiàn)的任何額外信息,故模型 C 兼容了模型 D。 類似地推理,如果虛擬假設(shè)被拒絕,則模型 C 就不是真模型。04:0H

30、ttDiY475(5)把模型 C 和 D 的換位。先估計模型 C,并使用 ,估計如下模型: (13.8.6) 現(xiàn)在假設(shè)檢驗 。 如果 H0 不被拒絕,我們選擇模型 D 而非 C。如果被拒絕,則模型 D 不是真模型。 雖然在直觀上比較可取,但 J 檢驗也存在一些問題:CiYCi122i33i4iiYZZYu04H : 076(1)有下述可能的結(jié)果:假設(shè):4 = 0 假設(shè):4 = 0不拒絕拒絕不拒絕同時接受C和D接受D而拒絕C拒絕接受C而拒絕D同時拒絕C和D77 根據(jù)上表所示,如果 J 檢驗程序?qū)е峦瑫r接受或同時拒絕兩個模型,我們就得不到一個正確的答案。 (2)t 統(tǒng)計量只是漸進地,即只在大樣本中

31、遵從標準正態(tài)分布。因此,在小樣本中,J 檢驗會過多地拒絕真實假設(shè)或真實模型,因而不是(在統(tǒng)計意義上)很有功效的。7813.9 模型選擇準則模型選擇準則 一、 R2 準則越接近1,擬合得越好。 問題: 1. 它度量的是樣本內(nèi)擬合優(yōu)度,即度量了給定樣本中所估計的Y值與其實際值有多么接近。它不能保證對樣本外觀測也能很好地預(yù)測。2. 在比較兩個或多個 R2 時,因變量或回歸子必須相同。3. 模型中的變量越多,R2 越大。2ESSRSSR1TSSTSS 79二、校正 R2 準則從這個公式中可以看出, ,表明校正 R2 是如何對增加更多的回歸元進行懲罰的。校正 R2 只有在所添加的變量的 t 值的絕對值大

32、于1時才會增加。因此它比 R2 更好。但在比較時,回歸子必須相同。22RSS/(n-k)n 1R11 (1 R )TSS/(n-1) nk 22RR80三、三、 赤池信息準則(赤池信息準則(AIC)由日本統(tǒng)計學(xué)教授 H. Akaike 從信息論出發(fā)提出的綜合考慮模 型的擬合優(yōu)度(適用性)和復(fù)雜程度的準則。在AIC準則中,對模型中增加回歸元進行了懲罰。AIC 的定義為: 2i2k/n2k/n uRSSAIC(13.9.3)nnee81其中 k 為回歸元的個數(shù)(包括截距項),n 為觀測次數(shù)。為了數(shù)學(xué)計算上方便起見,把(13.9.3)寫成:其中,lnAIC為AIC的自然對數(shù),2k/n為懲罰因子。 2

33、kRSSlnAIC=ln()(13.9.4)nn82 在比較兩個或多個模型時,具有最低的AIC值的模型優(yōu)先。 AIC應(yīng)用廣泛。它不僅適用于樣本內(nèi)預(yù)測,還適用于預(yù)測一個回歸模型在樣本外的表現(xiàn)。此外,它對嵌套和非嵌套模型都適用,甚至還可以用于決定 AR(p) 模型的滯后長度。83 直觀含義:直觀含義: 代表了估計的模型與真實模型之間的差別。k 越大,模型越復(fù)雜,偏差就越小。同時,我們必須估計更多的變量,并且擁有一個更大的 。 階數(shù)k越小,模型越簡化,待估參數(shù)越少, 。但是,與真實模型之間的偏差越大。2kn越小RSSln()n2kn84 總之,當(dāng)我們選擇k,如分布滯后模型的滯后長度,我們應(yīng)該權(quán)衡模型的擬合優(yōu)度和復(fù)雜程度以最小化AIC。85其中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論