計量經(jīng)濟學(xué)1617章模型設(shè)定和診斷檢驗_第1頁
計量經(jīng)濟學(xué)1617章模型設(shè)定和診斷檢驗_第2頁
計量經(jīng)濟學(xué)1617章模型設(shè)定和診斷檢驗_第3頁
計量經(jīng)濟學(xué)1617章模型設(shè)定和診斷檢驗_第4頁
計量經(jīng)濟學(xué)1617章模型設(shè)定和診斷檢驗_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第章 計量經(jīng)濟學(xué)建模模型設(shè)定和檢驗博士 教授經(jīng)濟學(xué)院: :133-6603-5111第一節(jié) 概述問題回顧:經(jīng)典線性回歸模型假定9分析中所使用的模型被“正確地”設(shè)定了。問題:經(jīng)驗分析中選擇一個模型的準(zhǔn)則有哪些?在實踐中容易遇到哪些類型的模型設(shè)定誤差?設(shè)定誤差的有哪些?如何一旦設(shè)定誤差?出設(shè)定誤差,能采取哪些補救措施?如何評價幾個人表現(xiàn)不相上下的備選模型?計量經(jīng)濟建模的傳統(tǒng)觀點:平均經(jīng)濟回歸(AER)構(gòu)造計量經(jīng)濟模型是進行計量經(jīng)濟分析的基礎(chǔ)和前提,它就像是一座的基石,發(fā)揮著舉足輕重的作用。因此,在經(jīng)典線性回歸模型(CLRM)的假定中明確提出了“正確地設(shè)定了回歸模型”這一假設(shè),使得我們之后對模型參數(shù)

2、的估計和檢驗有了牢固的根基。若某些統(tǒng)計量不能讓人滿意,則需要去偵察是否存在多重共線性或自相關(guān)等問題,并利用一些方法去解決它們。但有時在做完這些工作后,檢驗結(jié)果仍然不能令就可以懷疑是模型的設(shè)定有誤差或偏誤。滿意時,模型的設(shè)定誤差,就廣義而言,指的是在建立回 歸模型的過程中,因為錯誤設(shè)定模型結(jié)構(gòu)以及任 何一個不正確的基本假定而產(chǎn)生的誤會差。就狹 義而言,僅指因錯誤設(shè)定模型結(jié)構(gòu)所導(dǎo)致的誤差。那么如何才能正確設(shè)定模型呢?傳統(tǒng)的計量經(jīng)濟建模方法是自下而上方法(bottom-up approach),或平均經(jīng)濟回歸(AverageEconomic Regres,簡記AER),即為避免自變量的疏漏,先設(shè)定一

3、個包含若干回歸元的模型,然后通過檢驗確定需要加入的其他回歸元。而我們最初設(shè)定的回歸遵循以下幾個準(zhǔn)則:首先,模型應(yīng)是所的現(xiàn)實問題的抽象且精簡的描述?,F(xiàn)實問題總是復(fù)雜而多變的,因此在設(shè)定模型時,不可能也不應(yīng)將所有的情況和都考慮進去,而是應(yīng)該抓住問題的關(guān)鍵,確定哪些是必不可少的變量,從而構(gòu)建一個既有實際意義又精簡的模型。第二,所估計的模型的參數(shù)應(yīng)有唯一的值,即我們所構(gòu)造的模型是可識別的。第三,擬合優(yōu)度應(yīng)盡可能的高,這代表解釋變量可以盡可能多地解釋應(yīng)變量。第四,所設(shè)立的的模型應(yīng)與事實相符,例如好商品的需求與價格應(yīng)成反比,若算出的價格系數(shù)為正,即使再高也不能使人相信。第五,所設(shè)立的模型應(yīng)有很好的功效。只

4、能說明樣本內(nèi)的功效,而構(gòu)造的模型應(yīng)盡量地能對樣本時期外的變量情況作出解釋。傳統(tǒng)經(jīng)濟建模的理論認(rèn)為在建模中遵循這幾條準(zhǔn)則就基本上可以設(shè)定誤差的可能性將的最小。但在某些情況下,設(shè)定誤差仍然存在,因此一些統(tǒng)的計量經(jīng)濟學(xué)方法論提出了對傳,他們的理論將在后面的章節(jié)中進行介紹。第二節(jié) 模型的選擇準(zhǔn)則1、數(shù)據(jù)的容納性:即從模型做出必須有邏輯上的可能性。2、與理論一致:即必須有好的經(jīng)濟含義。如的收入假說成立,則消費對收入的回歸中,預(yù)期截距項的值應(yīng)為零。3、回歸元的弱外生性:即解釋變量或回歸元必須與誤差項不相關(guān)。4、參數(shù)估計的不變性:即參數(shù)值的穩(wěn)定性。5、表現(xiàn)出數(shù)據(jù)的協(xié)調(diào)性:即從模型中估計出的殘差必須完全隨機。

5、6、模型具有一定包容性:即模型從能解釋其結(jié)論的意義上講應(yīng)該包容或包括所有與之相競爭的模型。第三節(jié) 設(shè)定誤差的類型區(qū)分:模型設(shè)定誤差與模型設(shè)定誤差模型設(shè)定誤差腦海中有一個真實的模型,只是出于種種原因沒有估計這個正確的模型 漏掉一個有關(guān)變量包含一個無需變量采用錯誤的函數(shù)形式測量誤差模型誤設(shè)誤差不知道真實的模型是什么 對隨機誤差項不正確的設(shè)定第四節(jié) 模型設(shè)定誤差的1、模型擬合不足(漏掉一個變量)假如真實的模型是Yi但出于種種原因擬合 1 2 X 2i 3 X 3i ui成了如下模型:Y X ui122ii:1、如果漏掉的變量X 與包含進來的變量X 相關(guān),則 和 是有設(shè)定3212偏誤且非一致的。2、即

6、使X1與X2不相關(guān),盡管現(xiàn)在是無偏的,但仍有偏誤。3、誤差(干擾)的方差 2將不正確地被估計。4、上計算的 的方差( / 222i)是真實估計量的方差的一個x2有偏誤的估計量。5、通常的置信區(qū)間和假設(shè)檢驗程序,對于所估計參數(shù)的統(tǒng)計顯著性,容易導(dǎo)出誤導(dǎo)性的結(jié)論。6、基于不正確模型做出的及(置信)區(qū)間都是不可靠的。期望和方差的分析 3b3(2證明見p519附錄13A.1)E( 2 ) 2回歸的斜率。除非3 或其中b32是漏去的變量X3對包含進來的變量Xb32或兩者同時為零,否則 2 就是有偏誤的。排除了3為零的可能性,因為如果那樣的話就不存在設(shè)定誤差的問題。系數(shù)b32在X2與X3無關(guān)時為零,這在大

7、多數(shù)經(jīng)濟數(shù)據(jù)中都不太可能。一般而言,偏誤程度取決于偏誤項3 b32。比方說,3為正(即X3對Y有正的影響),并且b32也是正的(即X2與X3正相關(guān))。那么,總了真實的 2。因為X 不僅代表了其對Y的直接影響,體而言, 將2還包括了其(通過X )對Y的間接2影響。3再來分析 和的方差 2 2 2 ) var(22x2i 2 2var( ) *VIF222i22i2x(1 r)x23其中VIF為方差膨脹因子,而r23為變量X2和X3的相關(guān)系數(shù)。var( )var( )根據(jù)以上公式, 2 一般不同于。知道var( 是) 無偏的,因此var()222就存在偏誤。但是由于0r21,所以var()小于。所

8、以var( )2322一個兩難選擇:盡管 2有偏,但其方差比無偏估計量 2的方差小。同時,由于兩個模型的RSS和度不一樣,所以所得估計的 也2不相同。得到 2的一個估計值為 2 RSS/df,其大小取決于模型中度。如果在模型中增加變量,RSS通常會包含的回歸元個數(shù)和度下降,凈影響取決于RSS下降是減小,但待估參數(shù)增加也使否足以抵消增加回歸元所導(dǎo)致的度損失??紤]r23=0的特殊情為了給這種做出個結(jié)論,讓X 和Xb=0形,即無關(guān)的情形。這時,從而 現(xiàn)在是23232無偏的,而且2和 2 的方差相等。那么,是否從模型中略去X3,盡管理論上它是個有關(guān)變量,也不至于有什么害處呢?一般來說,回答是否定的。因

9、為這時估計出來的var( 2 ) 仍是有偏誤的,只是說,大多數(shù)經(jīng)濟 以上的問題。的假設(shè)檢驗程序仍值得懷疑。再中,X2和X3都會相關(guān),從而產(chǎn)生了論點已十分清楚:一旦根據(jù)相關(guān)理論把模型建立起來,切忌從中再忽略掉一個變量。2、包含一個無關(guān)變量(模型擬合過度)假定ui 是真實模型,而擬合了一下模型:Yi 1 2 X 2i從而導(dǎo)致模型中引入了一個無需變量的設(shè)定誤差。Yi 1 2 X 2i 3 X 3i ui1、“不正確”的模型中全部參數(shù)的OLS估計量都是無偏又一致的,即E() ,E(和 E( 0 。 2 ) 3 ) 11232、誤差方差的估計是正確的。23、通常的置信區(qū)間和假設(shè)檢驗程序仍有效。4、然而,

10、一般諸系數(shù)的估計量是非有效的,也就是說它們的方差一般都大于真實模型中 的方差。的相對無效性證明2由通常使用的OLS估計式得var(2 ) 22ix2 ) var(和222i2x(1 1r)23var( 2 ) 因此,223(1 r)var(2 )由于0r21,推知var(2 ) var(。2 )也就是說,雖然平均23 而言, = ,即E() ,但 的方差一般都大于 的方222222差。這一發(fā)現(xiàn)的含義是包含無關(guān)變量X 將使 的方差不必要32地增大,從而使 的精度減小。這對也是成立的。 21設(shè)定偏誤的不對稱性:如果略去了一個有關(guān)變量,則留在模型中的變量的系數(shù)一般地說既有偏誤又非一致,誤差的估計也是

11、不正確的,從而通常的假設(shè)檢驗是無效的。而另一方面,模型中含有無關(guān)變量,雖然仍能給出真實模型中系數(shù)的無偏且一致的估計,而且通常的假設(shè)檢驗方法也仍有效;但引入變量的唯一代價是,系數(shù)方差的估計值變大了,致使對參數(shù)進行概率推斷的精度降低了。一個無益的結(jié)論是:與其忽略掉有關(guān)變量,不如含有無關(guān)變量。但是這種哲理是不值得的,因為增加無關(guān)變量將導(dǎo)致估計量的效率損失,并且還可能引起多重共線性的問題,更不用說度的損失了。因此,一般而言的最好辦法是,根據(jù)理論,僅僅包含那些直接影響因變量、而又不能由已被引入的其它變量替代的解釋變量。第五節(jié) 設(shè)定誤差的檢驗實際問題中,關(guān)心的不是為什么會造成這種錯誤,而是如何發(fā)現(xiàn)這種錯誤

12、。一旦發(fā)現(xiàn)存在設(shè)定誤差,也就常常能找出解決的方法。設(shè)定誤差的出現(xiàn)常常不是人們有意為之的,而是由于理論基礎(chǔ)或是數(shù)據(jù)資料的缺乏所導(dǎo)致的,因此在設(shè)定模型時出現(xiàn)這樣的錯誤在客觀上是不可避免的。但是,當(dāng)設(shè)定好一個模型卻可以通過檢驗來判斷模型是否存在設(shè)定誤差,并采取相應(yīng)補救措施。這有些像“亡羊補牢”,但的確“猶未為晚”對過度擬合模型的對遺漏變量和不正確的函數(shù)形式的檢驗對過度擬合模型的假設(shè)設(shè)定的模型為Y X X X ui122i33ikkii若檢驗解釋變量X ki 是否應(yīng)該包含在模型內(nèi),可以采用通常的t檢驗,即t k/ se(k )去檢驗估計的 k的顯著性。,是否應(yīng)該包含在模型內(nèi),可以通過F檢若要檢驗X 3

13、 、X 4驗3 0 對是否進行檢驗。 4值得注意的是,這些檢驗進行的前提是已經(jīng)根據(jù)理論建立了一個被自己認(rèn)為是正確的模型,而這些檢驗的用處是幫助判斷模型里是否有多余的變量,而不是建立模型。也就是說,k 在統(tǒng)計上顯著是Y與X k 相幫關(guān)的必要而非充分條件,不能因為k 是統(tǒng)計上顯著的,就把本來不被包括在模型中的 X k 引入到模型中。因此,在建立模型時,的經(jīng)濟學(xué)含義。還是應(yīng)以理論為基礎(chǔ),注重它也就是說,不可以說Y之所以與X2有關(guān)只是因為是統(tǒng)計顯著的。然后又因為是統(tǒng)計顯著的便把X3包含在模型中。這種建模策略被稱為自下而上的方法,或數(shù)據(jù)開采方法、回歸捕捉方法、數(shù)據(jù)琢磨方法等等。數(shù)據(jù)開采的主要目標(biāo)是在進行

14、一些檢驗之后,提出一個“最好”的模型 (所有估計系數(shù)都具 有“正確”的符號、基于t和F的檢驗都是統(tǒng)計顯著的。R2值足夠高、d統(tǒng)計量值可以接受等等)。是諸如1%、5%、10%等常用的顯著性水?dāng)?shù)據(jù)開采的平并非真正的顯著性水平,從而名義顯著性水平的結(jié)果說明其結(jié)果在統(tǒng)計上顯著是難以令人信服的。(Lovell)的理論,如果有個回歸元,在根據(jù)進行數(shù)據(jù)開采時,從中選出個( k n),則真實的顯著性水平 *和名義的顯著性水平 的關(guān)系是:* 1 (1 )n / k* n / k或近似地為:對遺漏變量和不正確的函數(shù)形式的檢驗雖然盡量使設(shè)定的模型達(dá)到真實模型的情況,但遺憾的是卻并不能保證這個經(jīng)過深思熟慮的模型就是正

15、確的。所以在設(shè)定好模型后,要進行一系列的檢驗,例如 R 2 值,估計的t比率,估計的系數(shù)符號是否與事先預(yù)期的一致,德賓-統(tǒng)計量,等等。如果這些的結(jié)果都比較理想,那么模型便可以被認(rèn)為是正確的。若反之,則模型的設(shè)定就可能有某些設(shè)定偏誤,例如遺漏了某個有關(guān)變量、采用了不正確的函數(shù)形式,或是沒有差分消除序列相關(guān),等等。偵察是否存在這些設(shè)定偏誤有以下幾種方法:(1)殘差分析;(2)德賓-d統(tǒng)計量;(3)的RESET檢驗;(4)為增補變量的日乘數(shù)(LM)檢驗。殘差分析法殘差分析除了可以偵察自相關(guān)和異方差性外,還可以幫助進行設(shè)定誤差的探測,而且尤其適用于橫截面數(shù)據(jù)。若模型的殘差圖呈現(xiàn)明顯的變動趨勢,則模型可

16、能存在設(shè)定誤差,如遺漏某個解釋變量或采用了不正確的函數(shù)形式。Y u假設(shè)真實模型為3ii12i其中Y=總成本,X=產(chǎn)量。錯誤地擬合了以下兩種形式的模型:假設(shè)Y X X u2i12i3i2i和Yi 1 2 Xi u3i從以下殘差圖中可以看出逐漸接近真實模型的過程中,不僅殘差在絕對值上減小了,而且與錯用模型聯(lián)系在一起的突出的周期擺動也逐漸。由此看到殘差分析圖的效用:如果有設(shè)定誤差,殘差圖必定展現(xiàn)出明顯的樣式。德賓-d統(tǒng)計量使用德賓-在自相關(guān)一章中,檢驗來偵察序列相關(guān),而本章中知道若模型遺漏了某個解釋變量則很有可能導(dǎo)致序列相關(guān),因此可以使用德賓-檢驗通過偵察新序列相關(guān)的形式來判斷模型是否有設(shè)定誤差。操

17、作步驟:從假定的模型中計算出OLS殘差;假設(shè)模型遺漏的變量為Z,將上一步中得到的殘差按照Z的升序排列;(3) 計算該排列的d統(tǒng)計量:n(ut 2ut 1 )d t 2nu2tt為重排后的順序,而不一定是時間順序。 t1(4)根據(jù)德賓-d統(tǒng)計量表判斷d統(tǒng)計量是否顯著。若其顯著則接受模型存在設(shè)定誤差的假設(shè),反之則反。的RESET檢驗擬合的模型為線性函數(shù):假設(shè)Yi 1 2 Xi u3i其中Y=總成本,X=產(chǎn)量。它的殘差圖如下:u i0Y150200250300350400由圖可以看出,殘差的均值Y 隨呈現(xiàn)系統(tǒng)的變化。因而,若將當(dāng)作解釋變量Yii引入回歸方程,則會使R 2顯著地增大,表明模型存在設(shè)定誤

18、差。RESET檢驗的操作步驟如下:(1)從所檢測的模型中得到 的值。Yi(2)將 以某種形式作為解釋變量引入模型。例如將 和 引入回23YYYiii歸方程,得到:Y X Y Y u23i12i3 iii(3)記原回歸方程的R 為F檢驗:,新回歸方程的為 新 ,然后引入2222RRR舊(R 2 R 2 ) 新回歸元的個數(shù)F 舊新(1 R 2 ) (n 新模型中的參數(shù)個數(shù))新判斷是否因為將 和 的引入而顯著地增大。23YYii(4)R 2設(shè)定顯著性水平,若F在此水平上顯著,則可接受原模型存在設(shè)定誤差的假設(shè)。優(yōu)點:不要求設(shè)立對立模型,故易于應(yīng)用。缺點:即使知道了模型誤設(shè),也不一定有助于另外選出一個更

19、好的模型。日乘數(shù)(LM)檢驗為增補變量的面的例子中,可以看出若新回歸方程中的平方項和立方項的系數(shù)為零,則它與原方程就沒有實際的差別,所以可以將原方程看作是新方程的一個受約束形式。采用LM檢驗,操作步驟如下:為了檢驗該假定,(1)采用OLS估計法得到原受約束回歸的殘差ui 。(2)因為假定新模型是真實的模型,所以原模型的殘差 i 應(yīng)與和有關(guān)。X 2X 3ii(3)因此做 ui 對所有回歸元的回歸(輔助回歸),如:u v4ii其中vi(4)服從12i為滿足經(jīng)典假設(shè)的誤差項。曾證明在輔助回歸中,對于大樣本(設(shè)樣本容量為n),nR 2 2度為受約束回歸中的約束個數(shù)的 分布,即:nR2 2(約束個數(shù))度

20、為2。本例中,(5)設(shè)定顯著性水平,若 2 值大于在此水平上的 2 的臨界值,則拒絕收約束回歸,否則不。第六節(jié) 測量誤差對因變量Y和諸在之前的分析中隱含地假設(shè)解釋變量X的觀測無任何誤差。但是在實際觀測時,我們往往因為客觀條件的限制得不到真實準(zhǔn)確的數(shù)據(jù),這便了又一類設(shè)定誤差。一、因變量Y中的測量誤差(1) X uY *考慮一下模型: iii其中 =Y *性消費支出i=當(dāng)前收入=隨機干擾項X iui由于不可直接觀測,可以利用這樣的一個可觀測變量:*YiY Y * iii其中 為 的觀測誤差。于是估計的模型實際上為:*YiiYi ( Xi Xiui ) i (ui i )(2) Xi vi i 是一

21、個 ui其中vi項。誤差項,包含著方程誤差項和測量誤差假設(shè)誤差 i 和 i 分別滿足經(jīng)典線性回歸中的假設(shè),即零均值,同方差,無序列相關(guān),且觀測誤差分別與方程誤差和 X i 也無相關(guān)關(guān)系。這些假定使得從上述模型估計出的 都是無偏的,因此應(yīng)變量中的觀測誤差不會破壞OLS估計的無偏性。但從方程(1)得到的方差和標(biāo)準(zhǔn)差將不同于從(2)得到的方差和標(biāo)準(zhǔn)差。從(1)得到的方差是:var而從(2)得到的方差是:2u i2xvar2v2ix 22 u i2x顯然后者大于前者。二、解釋變量X中的測量誤差 X u*假設(shè)模型為:Yiii其中 =當(dāng)前消費支出Yii =性收入X *=干擾項(方程誤差)ui假令觀測到的不

22、是,而是具有觀測誤差的:X *X iiX X * wiii其中代表中的測量誤差,則的估計是:wiX *iYi ( Xi wi ) ui Xi (ui i wi ) Xi i,是方程與觀測兩種誤差的一個混合。其中 i i wi現(xiàn)在仍假設(shè)誤差ui 和wi分別滿足經(jīng)典線性回歸中的假設(shè),即零均值,同方差,無序列相關(guān),但卻不能再假定誤差項與解釋變X i量相互獨立,因為covi , Xi Ei Ei X i EXi Eui wi wi E w 2i 2w由于誤差項與解釋變量Xi 相關(guān)不符合經(jīng)典線性回歸模型的假定,所以O(shè)LS估計量是有偏誤且非一致的,而且即使令樣本含量無限地增大也無法改變。如果觀測誤差出現(xiàn)在

23、應(yīng)變量中,所得的估計量仍然是無偏的且一致的,但如果觀測誤差出現(xiàn)在解釋變量中,應(yīng)怎么辦呢?(proxy)變量,可以采取這樣的補救措施:找一個這個變量與原始X變量高度相關(guān),但與方程誤差就能得到 的一 個測誤差項都不相關(guān)。因此通過它一致性估計量。但實際上這種變量是很難找到的,就找到了也很難確定它是否與方程誤差 由于補救措施的高難度,測誤差項都不相關(guān)。所以有時便假定模型的的解釋變量不存在觀測誤差,以繼續(xù)使用OLS估計。習(xí)題十三1.假設(shè)真實模型為:Yi Xi ui 01 Xi ui若擬合的模型是: Yi那么設(shè)定誤差的如何?2.假定上題中的(2)為真實模型,則擬合誤差模型(1)的是什么?3.假定真實模型為

24、: Y X ui011ii(1)若擬合的模型加入了一個無關(guān)的解釋變量 X 2的真實系數(shù) 2 為零):X 2(“無關(guān)”指Yi 0 1 Xi 2 X 2i vi(2)(1)模型(2)的 R 2和 R 2矯正會不會比模型(1)的大?(2)模型(2)的參數(shù)估計 0 和 是無偏估計1嗎?(3)無關(guān)變量 X 2 的引入對0 和響嗎?的方差有影14.考慮“真實”(生產(chǎn)函數(shù)模型為:lnYi-)的 0 1 ln L1i 2 ln L2i 3 ln Ki ui其中 Y 產(chǎn)出, 生產(chǎn)性勞動,L2L1非生產(chǎn)性勞動,K 資本。假若經(jīng)驗研究省去了 L2 ,使實際回歸為:ln Yi 0 1 ln L1i 3 ln Ki v

25、i基于橫斷面數(shù)據(jù),回答下面的問題:(1)OLS估計和是和的無偏估計嗎? (2)若為無關(guān)變量,則(1)的結(jié)論是否成立?請推導(dǎo)。第七節(jié) 對隨機誤差項不正確的設(shè)定由于誤差項不能直接觀測到,所以就不容易確定它進入模型的形式。假定Yi Xiui是“正確”的模型,但估計的是Yi Xi ui附錄13A.4證明了若,則ln ui N(0, )2u log 正態(tài)e 2 / 2 , e 2 (e 2 1)i結(jié)果: ) e 2 / 2E(其中e為自然對數(shù)的底。則是一個有偏的估計量,因為其均值不等于真實的。第八節(jié) 嵌套與非嵌套模型嵌套模型:存在關(guān)于B的參數(shù)的約束,使得在這些約束之下,模型A就簡化為模型B。嵌套模型:若

26、這種約束不存在,則稱A與B為非嵌套模型。例如,模型A: Yi考慮以下模型: 14 X 4i ui3i模型B: 1 2 X 2i 3 X 3i uiYi估計模型A,然后檢驗假設(shè)H 0如果:4 0。若不H 0,則模型A就簡化為了模型B,即模型B嵌套在模型A中。再考慮下面的模型:模型C:Yi 1 2 X 2i ui模型D: Yi 1 2 Z2i vi其中X和Z是兩組不同的變量集合。因為模型C和D中的一個不能做為另 個的簡化模型,因此模型C和D是非嵌套的。第九節(jié) 非嵌套假設(shè)的檢驗一、判別方法判別法是通過比較擬合優(yōu)度的大小來選擇模型的方法。反映擬合優(yōu)度的準(zhǔn)則有:數(shù)值越大越好的校正 R(2即)值,數(shù)R 2

27、值越小越好的Hocking的 度量,MS pallow的 度量,AmCep miya的PC度量,Akaike的AIC度量,還有Schwarz準(zhǔn)則,Hannan-Quinn準(zhǔn)則和Shibata準(zhǔn)則等。但必須牢記,在比較兩(或多個)模型時,回歸子必須相同。二、辨識方法非嵌套F檢驗或包容F檢驗要在上一節(jié)的模型C和D中作出選擇。首先做一個嵌套或例如,混合模型E:Yi 1 2 X 2i 3 Z2i ui模型E嵌套了模型C和D,但C和D彼此是非嵌套的。所以,若C是正確的,則3 0 ,而若D是正確的,則2 0。對此來檢驗2和3 的統(tǒng)計顯著性??梢酝ㄟ^F檢驗問題:1)如果 X與Z高度相關(guān),很可能一個或多個 系

28、數(shù)在統(tǒng)計上不顯著,盡管設(shè)。有可能所有斜率系數(shù)同時為零的(聯(lián)合)假參考假設(shè)的選擇有時能決定模型選擇的結(jié)果,尤其是在相互爭持的多回歸元中有嚴(yán)重多重共線性的情況下。人為的嵌套模型F可能缺乏經(jīng)濟意義。-J檢驗(Davidson-Mackinnon J test )為了彌補F檢驗的不足,計量們又提出了其他檢驗方法,-J檢驗。為了說明這種檢驗方法,其中就有再次上面的模型C和模型D這種J檢驗的步驟如下:1)對模型D進行估計,得到Y(jié)(的估計值Y。Di2)將得到的 作為另一回歸無增補到模型C(中,并估計下面的模DYi型: Y X Y uDi122i3 ii(3)用t檢驗對3 0假設(shè)進行檢驗。(4)若上面的假設(shè)不

29、被,則可接受模型CD為真模型。因為 代Yi表不被模型C所含有的變量影響,因此模型D不含有能改進模型C的,則模型C就不是真模型。其他信息。反之,若虛擬假設(shè)不被(5)現(xiàn)在將假設(shè)或模型C和D顛倒過來,重復(fù)上面步驟,即估計下面模型:Y X Y uCi122i3 iiC中得到的Y 0。若假設(shè)不被其中 是從模型的估計值。檢驗假設(shè)CYi3,則選擇模型D,若假設(shè)被,則由于模型D沒有改進模型C,所以選擇C。問題:J檢驗雖然在直觀上比較可取,但卻也存在一些問題。首先,由于兩個檢驗是獨立操作的,故有下述可能結(jié)局:如果J檢驗程序?qū)е峦瑫r接受或兩模型,就得不到明確的。其次,用t 統(tǒng)計量檢驗顯著性時,t統(tǒng)計量只能漸進地記

30、載大樣本中遵從標(biāo)準(zhǔn)正態(tài)分布。所以在小樣本的情況下,J檢驗會過多地真假設(shè)或真模型,因此它不是統(tǒng)計上有功效的。假設(shè) 3 0假設(shè) 3 0不不模型C 和D 均被接受接受模型D,模型C接受模型C,模型D模型C 和D 均被第十節(jié) 模型選擇準(zhǔn)則樣本內(nèi)與樣本外樣本內(nèi)本質(zhì)上告訴,所選擇的模型在給定樣本中對數(shù)據(jù)擬合得如何。樣本外則考慮到一個擬合模型在給定回歸元值情況下對回歸子未來值的。具體準(zhǔn)則 R 2準(zhǔn)則校正 R 2(= R 2)準(zhǔn)則赤池信息準(zhǔn)則信息準(zhǔn)則Cp 準(zhǔn)則 2所有準(zhǔn)則都是為了最小化殘差平方和(RSS)。在模型的擬合優(yōu)度與其復(fù)雜性之間有一種權(quán)衡取舍的關(guān)系。R 2 準(zhǔn)則對一個回歸模型擬合優(yōu)度的度量指標(biāo)之一就是

31、R 2 ,其定義為: ESS/RSS 1- RSS/TSSR 2如此定義的R 2 必介于0和1之間,越接近1,擬得越好。問題:它度量的是樣本內(nèi)擬合優(yōu)度,不能對樣本外觀測做出很好的預(yù)測。在將兩個或多個R 2進行比較時,因變量或回歸子必須相同。當(dāng)模型中添加越來越多的變量時, R 2總不會變小,但同時也使誤差的方差變大。校正R 2準(zhǔn)則作為對增加回歸元來提高值的一種懲罰,校正R 2。提出_2n 1RSS/(n - k) 1- 1 (1 R )2Rn kTSS/(n -1)_從該公式可以看出R 2 R 2。與R 2不同, 校正R 2只有在所添加的變量的t值的絕對值大于1時才會增加。同樣,進行比較時,被比

32、較模型的回歸子必須相同。赤池信息準(zhǔn)則(AIC)在AIC準(zhǔn)則中,進一步對模型中增加回歸元進行了懲罰,AIC的定義為: i2uRSSAIC e2k / n e2k / n nn其中k為回歸元的個數(shù),n為觀測次數(shù)。取對數(shù)得:ln AIC 2k ln( RSS )n其中2k/n為懲罰因子。n在比較兩個模型時,具有最低AIC值的模型優(yōu)先。AIC 的優(yōu)越性之一在于,它不僅適用于樣本內(nèi),還適用于一個回歸模型的樣本外的表現(xiàn)。此外,它對嵌套和非嵌套模型都適用,甚至還可以用于決定AR(p)模型的滯后長度。信息準(zhǔn)則(SIC)與AIC類似,SIC定義為:u 2SIC n k / n或以對數(shù)表現(xiàn)為nnln SIC k

33、ln)nn其中(k/n)lnn為懲罰因子。通過比較可以看出,SIC施加的懲罰比AIC更加嚴(yán)厲。與AIC類似,SIC值越低的模型就越好。而且與AIC一樣,SIC可以用于比較一個模型在樣本內(nèi)或樣本外的現(xiàn)。表的Cp準(zhǔn)則有一個包括家具在內(nèi)k假設(shè)個回歸元的模型, 為真實 2 的估2只選擇其中的p (pk) 個回歸元,并從適用這p個計量。假設(shè)回歸元的回歸中得到RSS。令RSSP表示使用p個回歸元的殘差平方和。CP準(zhǔn)則表現(xiàn)如下: RSS p (n 2 p)Cp2其中n為觀測次數(shù)。假設(shè)擬合足夠充分,則可以證明: p) 2E(R(n p)2E(CP ) (n 2 p) p2想找到一個CP 值很低(約為p)的模型

34、。換句話說,根據(jù)節(jié)儉原選擇一個含有p個回歸元(pk)并相當(dāng)好地擬合數(shù)據(jù)的則,模型。對p進行描點。一個“充分的”模型實踐中,人們通常將計算出的CP將作為一個與CP =p線接近的點而出現(xiàn)。如圖,A點顯然比B點更優(yōu)。CPABCP =PP對模型選擇的一句忠告以上的各種準(zhǔn)則只是純粹描述性的,或許沒有什么很強的理論性,其中還有一些易于受到數(shù)據(jù)開采的指控。快盡管如此,這些準(zhǔn)則仍頻繁地被實踐者所使用。這些準(zhǔn)則中沒有哪一個肯定優(yōu)于其它準(zhǔn)則。第十一章 計量經(jīng)濟建模的其它專題一、異常數(shù)據(jù)、杠桿數(shù)據(jù)和有的數(shù)據(jù)在回歸背景下,一個異常數(shù)據(jù)可定義為一個具有“很大殘差”的觀測。如果一個數(shù)據(jù)點不成比例地遠(yuǎn)離絕大部分回歸元值,那

35、就認(rèn)為它表現(xiàn)出(高度)杠桿性。一個杠桿數(shù)據(jù)點能把回歸線向自己拉近,由此改變回歸線的斜率。如果這種情況真的發(fā)生了,那就稱這樣一個杠桿數(shù)據(jù)點為一個與數(shù)據(jù)點、從樣本中刪去這樣一個數(shù)據(jù)點會顯著地影響回歸線。的二、遞推最小二乘法在已知轉(zhuǎn)折點的情況下,可使用檢驗時間序列的穩(wěn)定性問題。但在未知轉(zhuǎn)折點的情況下又會怎樣呢?此時可使用遞推最小二乘法。以儲蓄收入回歸為例。Yt 1 2 Xt ut其中Y=儲蓄,X=收入,樣本期間為1970-1995年。使用1970年-1974年的數(shù)據(jù)并估計了這個儲蓄函數(shù),得到 1假設(shè)和 2 的估計值。然后使用1970-1975年的數(shù)據(jù)再次進行估計并得到這兩個參數(shù)的估計值。再使用197

36、0-1976年的數(shù)據(jù)再次估計。以此類推直至用完全部樣本。1和 2可以想象,每組回歸都將給出的一組新估計值。如果把這些參數(shù)估計值依次描點,將會看出估計參數(shù)是如何變化的。如果所考慮的模型結(jié)構(gòu)是穩(wěn)定的,這兩個參數(shù)的估計值變化會很小,而且基本上是隨機的。如果這兩個人參數(shù)值變化明顯,則意味著存在結(jié)構(gòu)轉(zhuǎn)折。當(dāng)橫截面數(shù)據(jù)按照某種“規(guī)格”或“規(guī)?!弊兞颗判驎r,遞推最小二乘法也是一個有用的工具。三、在第八章失靈檢驗檢驗。過結(jié)構(gòu)穩(wěn)定性的還證明了他的檢驗方法略加修改后還可用于對回歸模型功效的檢驗。對1970-1981年期間估計了儲蓄-收入回歸,并得到基于假設(shè)1970-1981年期間的數(shù)據(jù)估計的截距和斜率系數(shù)和,現(xiàn)在

37、我1,70812,7081們利用1982-1995年期間收入的實際值和1970-1981年期間的截距1982-1995和斜率值,來每一年的出須知。邏輯:若參數(shù)值沒有發(fā)生嚴(yán)重的結(jié)構(gòu)變化,則基于前一期間系數(shù)估計值而估計出來的1982-1995的儲蓄估計值,不應(yīng)該與后一期間儲蓄的實際值與值有很大不同,若實際值與值之間存在巨大差異,則整個數(shù)據(jù)期間儲蓄-收入關(guān)系的穩(wěn)定性就值得懷疑。儲蓄的實際值與估計值之間的差別是大是小可以通過F檢驗判斷: t t2u ) / n2(u2F t1u /(n k)2其中n1=初始回歸所基于的第一期間(1970-1981)中觀測次數(shù),n2=第二期間或期間的觀測次數(shù), t=對所

38、2un +n )估計出的RSS=對前你個觀測估計 t有觀測(,2u12出來的RSS,k為待估參數(shù)的個數(shù)。若誤差是獨立同正態(tài)分布的,則F統(tǒng)計量服從和n2的F分布。度為n1非線性回歸模型博士 教授經(jīng)濟學(xué)院: :133-6603-5111第一節(jié) 本質(zhì)上的線性和非線性回歸模型本質(zhì)非線性回歸模型(NLRM):不能通過變換使模型線性于參數(shù)。例:不同形式的C-D函數(shù)Y=產(chǎn)出 X2=勞動投入 X3=資本投入1) Yln Yi 2 ln X 2i 3 ln X 3i ui XXeu或23ii12i3i ln 。1其中所以這個模型是本質(zhì)線性的。ln Yi 2 ln X 2i 3 ln X 3i ln ui2) Y

39、 X或Xu23i12i3ii ln 。1其中這個模型也是線性于參數(shù)的。Y XX u3)23i12i3ii不可通過變換轉(zhuǎn)化為線性于參數(shù),故該模型是非線性回歸模型。Y AK (1 )L1/ 4)常替產(chǎn)函數(shù)()iii它是C-D生產(chǎn)函數(shù)的一個特例,也是本質(zhì)上非線性的回歸模型。第二節(jié) 線性和非線性回歸模型的估計考慮以下兩個模型 線性模型(1)Yi 1 2 Xi ui(2)非線性模型Y e Xu2 ii1i對應(yīng)于線性情況,最小化(2)中的殘差(附錄14A.1),得到的正規(guī)方程組為:Y e X2 Xi e22 ii1Y X e X2 Xi 22 iX eii1i可以發(fā)現(xiàn)與線性模型正規(guī)方程組不同,非線性模型正規(guī)方程組左右兩側(cè)都有未知量(諸 )。因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論