第五章多重共線性_第1頁
第五章多重共線性_第2頁
第五章多重共線性_第3頁
第五章多重共線性_第4頁
第五章多重共線性_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計量經(jīng)濟學

—理論·方法·EViews應用

郭存芝杜延軍李春吉編著電子教案

第五章多重共線性◆學習目的了解多重共線性的概念,掌握在建立計量經(jīng)濟學模型時如何避免發(fā)生多重共線性,以及在存在多重共線性情況下,如何正確建立計量經(jīng)濟學模型?!艋疽?)了解多重共線性的概念及多重共線性產(chǎn)生的原因;2)存在多重共線性對計量經(jīng)濟學模型的危害;3)掌握多重共線性的檢驗方法以及修正多重共線性的方法;4)學會利用EViews軟件進行逐步回歸分析,建立正確的計量經(jīng)濟學模型。◆多重共線性及其產(chǎn)生原因◆多重共線性的影響◆多重共線性的檢驗第五章多重共線性◆多重共線性的修正◆案例分析第一節(jié)多重共線性及其產(chǎn)生原因—、多重共線性的概念指模型解釋變量之間存在完全線性或近似線性相關(guān)的一類問題。對模型(5-1)如果存在不全為零的,使得(5-2)成立,則稱解釋變量之間存在完全共線性(perfectmulticollinearity);第一節(jié)多重共線性及其產(chǎn)生原因—、多重共線性的概念指模型解釋變量之間存在完全線性或近似線性相關(guān)的一類問題。對模型(5-1)成立,則稱解釋變量之間存在近似共線性(approximatemulticollinearity)。如果存在不全為零的,使得(5-3)在矩陣表示的線性回歸模型完全共線性指矩陣X的秩即近似共線性意味著c)情況是不完全相關(guān)即解釋變量之間的相關(guān)系數(shù)介于0和1之間。

需要強調(diào),解釋變量之間不存在線性關(guān)系,并非不存在非線性關(guān)系,當解釋變量之間存在非線性關(guān)系時,并不違反無多重共線性假定。一般來說,解釋變量之間的關(guān)系可概括為三種情況:a)情況是完全相關(guān),即解釋變量之間的相關(guān)系數(shù)為1;b)情況是完全不相關(guān),即解釋變量之間的相關(guān)系數(shù)為0;在建立計量經(jīng)濟學模型中,大量的問題是屬于第三種情況。二、產(chǎn)生多重共線性的主要原因1.經(jīng)濟變量之間的內(nèi)在聯(lián)系,是產(chǎn)生多重共線性的根本原因。2.經(jīng)濟變量在時間上有同方向變動的趨勢,這也是造成多重共線性的重要原因。3.模型中滯后變量的引入,也是造成解釋變量多重共線的原因之一。4.在模型參數(shù)的估計過程中,樣本之間的相關(guān)是不可避免的,這是造成多重共線性的客觀原因。第二節(jié)多重共線性的影響對存在多重共線性的模型直接用普通最小二乘法估計參數(shù),就會給模型帶來嚴重的不良后果。1.如果解釋變量存在完全共線性,則模型的參數(shù)無法估計;2.如果解釋變量之間存在近似共線性,則參數(shù)OLS估計量的方差隨著多重共線程度的提高而增加;3.變量的顯著性檢驗和模型的預測功能失去意義;4.參數(shù)估計量經(jīng)濟意義不合理。1.如果解釋變量存在完全共線性,則模型的參數(shù)無法估計;多元回歸模型(5-4)的OLS估計量為(5-5)如果出現(xiàn)完全共線性,則不存在,無法得到參數(shù)的估計量。2.如果解釋變量之間存在近似共線性,則參數(shù)OLS估計量的方差隨著多重共線程度的提高而增加;在近似共線性下,雖然可以由式(5-5)得到參數(shù)OLS估計量,但由于此時,引起主對角線元素較大,且隨著逼近于0而增大。這就使得參數(shù)估計量的方差增大,從而不能對總體參數(shù)做出準確推斷。以二元回歸模型為例,

的方差為(5-6)其中是X1與X2線性相關(guān)系數(shù)的平方,≤1。例:當完全共線性時,可以看出,越大,越大,多重共線性使得參數(shù)估計量為方差膨脹因子。其增大趨勢如下表所示。方差增大,稱當X1與X2線性無關(guān)時,當X1與X2近似共線時,0<r<1,Var(1)=>3.變量的顯著性檢驗和模型的預測功能失去意義;存在多重共線性的模型,其參數(shù)估計量方差的變大,使得計算的t統(tǒng)計量變小,從而檢驗接受原假設(shè)影響很大的重要因素誤判為不顯著,結(jié)果使模型失去可靠性。其次,由于參數(shù)估計量的方差變大,因而對樣本值的反映十分敏感,即當樣本觀測值稍有變化時,模型參數(shù)就有很大差異,致使模型難以應用。另外,由于參數(shù)估計量的方差增大,使模型的精度大大下降,求出的預測值難以置信。的可能性增大,這樣會使本來4.參數(shù)估計量經(jīng)濟意義不合理。如果模型中兩個解釋變量X1和X2具有線性相關(guān)性,那么它們中的一個變量就可以由另一個變量表征。這時X1和X2的參數(shù)并不反映各自與被解釋變量之間的結(jié)構(gòu)關(guān)系,而是反映它們對被解釋變量的共同影響,所以各自的參數(shù)已失去了應有的經(jīng)濟意義,于是經(jīng)常表現(xiàn)出似乎反常的現(xiàn)象,例如估計結(jié)果本來應該是正的,結(jié)果卻是負的。經(jīng)驗告訴我們,在多元線性回歸模型的估計中,如果出現(xiàn)參數(shù)估計值的經(jīng)濟意義明顯不合理的情況,應該首先懷疑是否存在多重共線性。嚴重的多重共線性常常會導致下列情形出現(xiàn):使得用普通最小二乘法得到的回歸參數(shù)估計值很不穩(wěn)定,回歸系數(shù)的方差隨著多重共線性強度的增加而加速增長,對參數(shù)難以做出精確的估計;造成回歸方程高度顯著的情況下,有些回歸系數(shù)通不過顯著性檢驗;甚至可能出現(xiàn)回歸系數(shù)的正負號得不到合理的經(jīng)濟解釋。但是應注意,如果研究的目的僅在于預測被解釋變量Y,而各個解釋變量X之間的多重共線性關(guān)系的性質(zhì)在未來將繼續(xù)保持,這時雖然無法精確估計個別的回歸系數(shù),但可估計這些系數(shù)的某些線性組合,因此多重共線性可能并不是嚴重問題。綜上所述第三節(jié)多重共線性的檢驗1)檢驗多重共線性是否存在;多重共線性檢驗的任務是:2)估計多重共線性的范圍,即判斷哪些變量之間存在共線性。一、檢驗多重共線性是否存在1.簡單相關(guān)系數(shù)檢驗法利用解釋變量之間的線性相關(guān)程度去判斷是否存在嚴重多重共線性的一種簡便方法。一般而言,如果每兩個解釋變量的簡單相關(guān)系數(shù)比較高,如大于0.8,則可認為存在著較嚴重的多重共線性。解釋變量的相關(guān)矩陣中,解釋變量之間的相關(guān)系數(shù)較大時,可能會存在多重共線性問題。較高的簡單相關(guān)系數(shù)只是多重共線性存在的充分條件,而不是必要條件。特別是在多于兩個解釋變量的回歸模型中,有時較低的簡單相關(guān)系數(shù)也可能存在多重共線性。因此并不能簡單地依據(jù)相關(guān)系數(shù)進行多重共線性的準確判斷。注意一、檢驗多重共線性是否存在2.直觀判斷法根據(jù)經(jīng)驗,通常以下情況的出現(xiàn)可能提示存在多重共線性的影響:(2)從定性分析認為,一些重要的解釋變量的回歸系數(shù)的標準誤差較大,在回歸方程中沒有通過顯著性檢驗時,可初步判斷可能存在嚴重的多重共線性。(1)當增加或刪除一個解釋變量,或者改變一個觀測值時,回歸參數(shù)的估計值發(fā)生較大變化,回歸方程可能存在嚴重的多重共線性。(3)有些解釋變量的回歸系數(shù)所帶正負號與定性分析結(jié)果違背時,很可能存在多重共線性。一、檢驗多重共線性是否存在3.行列式檢驗法由于回歸模型參數(shù)估計量的方差協(xié)方差矩陣為而所以這說明(1)當較大時,較小,說明參數(shù)估計的精度較高,因而多重共線性不嚴重(2)當較小時,較大,則說明參數(shù)估計的誤差較大,因此表明模型的多重共線性嚴重。(3)當時,,這說明模型解釋變量之間完全相關(guān),因此多重共線性最為嚴重,即為完全多重共線性。這種方法雖簡便易行,但由于無法找到值大小的標準,這樣就使檢驗精度受到影響。因此,這種方法常被用來檢驗和比較兩個或兩個以上含有相同個數(shù)解釋變量模型的多重共線性問題,為選擇建模的樣本觀測值提供信息。一、檢驗多重共線性是否存在4.綜合統(tǒng)計檢驗法R2與F值較大,但各參數(shù)估計量的t檢驗值較小,說明各解釋變量對Y的聯(lián)合線性作用顯著,但各解釋變量間存在共線性而使得它們對Y的獨立作用不能分辨,故t檢驗不顯著。對于多個解釋變量(2個以上)的回歸模型若在OLS法下:二、估計多重共線性的范圍1.決定系數(shù)檢驗法

2.方差膨脹(擴大)因子法3.逐步回歸法1.決定系數(shù)檢驗法例:設(shè)多元回歸模型的解釋變量為X1、X2、…、Xk,為分析研究它們之間的相關(guān)關(guān)系,需將每個解釋變量與其他解釋變量進行回歸,可得出k個回歸方程式并計算相應的擬合優(yōu)度,即判定系數(shù)。如果某一回歸方程的判定系數(shù)較大(接近于1),說明Xj與其他解釋變量X間存在多重共線性。如果求出的判定系數(shù)都比較小,沒有一個是接近于1的,則可認為模型的解釋變量之間不存在嚴重的多重共線問題。析:可進一步對上述出現(xiàn)較大判定系數(shù)的回歸方程作F檢驗:(5-7)

若存在較強的共線性,則較大且接近于1,這時較小,從而的值較大。因此,可以給定顯著性水平,通過計算的值,并與相應的臨界與其他解釋變量X間不,拒絕,即認為Xj與其他解釋,即認為Xj與其他解釋變量X間不值比較來進行檢驗,判定是否存在相關(guān)性。此時存在顯著的共線性。如果變量X間存在多重共線性,否則,接受存在多重共線性。1.判定系數(shù)檢驗法例:設(shè)多元回歸模型的解釋變量為X1、X2、…、Xk,為分析研究它們之間的相關(guān)關(guān)系,需將每個解釋變量與其他解釋變量進行回歸,可得出k個回歸方程式并計算相應的擬合優(yōu)度,即判定系數(shù)。另一等價的檢驗是:在模型中排除某一個解釋變量Xj,估計模型,如果擬合優(yōu)度與包含Xj時十分接近,則說明Xj與其它解釋變量之間存在共線性。

2.方差膨脹(擴大)因子法

對于多元線性回歸模型來說,如果分別以每個解釋變量為被解釋變量,做對其他解釋變量的回歸,這稱為輔助回歸。Var()=以Xj為被解釋變量做對其他解釋變量輔助線性回歸的可決系數(shù),用RjJ的方差可表示,則可以證明(證明過程從略),解釋變量Xj參數(shù)估計量表示為其中,VIFj是變量Xj的方差膨脹因子,即由于Rj度量了Xj與其他解釋變量的線性相關(guān)程度,這種相關(guān)程度越強,說明變量間多重共線性越嚴重,VIFj也就越大。反之,Xj與其他解釋變量的線性相關(guān)程度越弱,說明變量間的多重共線性越弱,VIFj也就越接近于1。由此可見,VIFj的大小反映了解釋變量之間是否存在多重共線性,可用它來度量多重共線性的嚴重程度。經(jīng)驗表明,VIFj≥10時,說明解釋變量Xj與其余解釋變量之間有嚴重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。3.逐步回歸法

以Y為被解釋變量,逐個引入解釋變量,構(gòu)成回歸模型,進行模型估計。根據(jù)擬合優(yōu)度的變化決定新引入的變量是否可以用其他變量的線性組合代替,而不是作為獨立的解釋變量。

如果擬合優(yōu)度變化顯著,則說明新引入的變量是一個獨立的解釋變量;如果擬合優(yōu)度變化很不顯著,則說明新引入的變量不是一個獨立的解釋變量,它可以用其他變量的線性組合代替,也就是說它與其他變量之間存在多重共線性。第四節(jié)多重共線性的修正常用的幾種修正方法:一、省略變量法二、利用已知信息克服多重共線性三、通過變換模型形式克服多重共線性四、用增加樣本容量來克服多重共線性五、逐步回歸法一、省略變量法找出引起多重共線性的解釋變量,將其省略掉——最為有效的修正多重共線問題的方法。

當省略了某個或某些變量后,保留在模型中的變量的系數(shù)的估計值及其經(jīng)濟意義均將發(fā)生變化。這種方法雖然簡單,但是當解釋變量較多時,往往很難選準在模型中比較次要的解釋變量以便省略。因此,在用這種方法克服多重共線問題時,又可能會犯遺漏重要解釋變量的錯誤,以致使模型出現(xiàn)新的問題。所以,在從模型中去掉某一解釋變量時,一定要全面考慮、慎重從事,避免顧此失彼。定義:注意:缺點:二、利用已知信息克服多重共線性已知信息——就是指在建模之前根據(jù)經(jīng)濟理論、統(tǒng)計資料或經(jīng)驗分析,已知的解釋變量之間存在的某種關(guān)系。例:為了克服多重共線性,可將解釋變量按已知關(guān)系加以合并。設(shè)消費函數(shù)(5-8)其中,Y為消費支出,X1為消費者的年平均收入,X2為消費者的年平均儲蓄額。

顯然,X1和X2都是消費者可以支配的個人收入,因而高度相關(guān),這樣(5-8)式必然會有多重共線性。為于克服這一問題,可以通過省略一個解釋變量的辦法來解決,但是X1和X2對Y的影響及貢獻很難分清,以致無法確定對解釋變量的取舍。在這種情況下,經(jīng)過對解釋變量的進一步分析研究,發(fā)現(xiàn)消費者的收入和儲蓄呈3:2的關(guān)系,即二、利用已知信息克服多重共線性這樣,把(5-9)式代入(5-8)式,就可將二元線性回歸模型轉(zhuǎn)換成一元線性回歸模型,即

(5-10)

這時,用普遍最小二乘法對(5-10)式進行參數(shù)估計,求出

,再將

代入(5-9)式求出

,就可得到克服了多重共線性問題的消費函數(shù),即

(5-11)

(5-9)三、通過變換模型形式克服多重共線性不需要分析每個解釋變量對被解釋變量影響大小的模型:例:設(shè)需求函數(shù)(5-12)其中Y為需求量,X1為居民收入,X2為商品價格,X3為代用品價格。以時間序列數(shù)據(jù)為樣本的模型:

把模型變?yōu)橐浑A差分形式三、通過變換模型形式克服多重共線性(5-14)

一般可以有效地消除存在于原模型中的多重共線性。這是由經(jīng)濟時間序列數(shù)據(jù)的內(nèi)在性質(zhì)決定的。一般講,增量間的線性關(guān)系遠比總量之間的線性關(guān)系弱一些。

以一階差分的形式(5-14)來進行參數(shù)估計,可以克服解釋變量多重共線性問題。但是,如果原模型的隨機擾動項是同方差的,則經(jīng)一階差分變換后的模型其隨機擾動項可能出現(xiàn)異方差問題。因此,在把原模型變換為差分形式時,要注意防止新模型的異方差性,這是用一階差分形式來克服多重共線性的不足之處。四、用增加樣本容量來克服多重共線性樣本容量越大,出現(xiàn)多重共線性的可能性越小。另外,多重共線性的主要問題在于使參數(shù)估計量的方差變大,隨機干擾項的方差、變量的變異程度與方差膨脹因子一起決定著參數(shù)估計量的方差。如果存在多重共線性,但隨機干擾項的方差很小,或變量的變異程度很大都可能得到較小的參數(shù)估計量的方差。這時,即使有較嚴重的多重共線性,也不會帶來不良后果。因此,只要回歸方程估計的參數(shù)標準差較小,t統(tǒng)計值較大,就沒有必要過于關(guān)心是否存在多重共線性的問題。五、逐步回歸法具體步驟

1)先用被解釋變量對每一個所考慮的解釋變量做簡單回歸;2)以對被解釋變量貢獻最大的解釋變量所對應的回歸方程為基礎(chǔ);3)逐個引入其余的解釋變量。好處將統(tǒng)計上不顯著的解釋變量剔除,最后保留在模型中的解釋變量之間多重共線性不明顯,而且對被解釋變量有較好的解釋貢獻。第五節(jié)案例分析考慮糧食需求函數(shù)(1)應用EView

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論