計(jì)量經(jīng)濟(jì)學(xué)第四章多重共線性_第1頁
計(jì)量經(jīng)濟(jì)學(xué)第四章多重共線性_第2頁
計(jì)量經(jīng)濟(jì)學(xué)第四章多重共線性_第3頁
計(jì)量經(jīng)濟(jì)學(xué)第四章多重共線性_第4頁
計(jì)量經(jīng)濟(jì)學(xué)第四章多重共線性_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1第四章第四章 多重共線性多重共線性計(jì)量經(jīng)濟(jì)學(xué)計(jì)量經(jīng)濟(jì)學(xué)2引子:引子:發(fā)展農(nóng)業(yè)和建筑業(yè)會(huì)減少財(cái)政收入嗎?發(fā)展農(nóng)業(yè)和建筑業(yè)會(huì)減少財(cái)政收入嗎? 為了分析各主要因素對(duì)財(cái)政收入的影響,建立財(cái)政收為了分析各主要因素對(duì)財(cái)政收入的影響,建立財(cái)政收入模型入模型:其中其中: CS財(cái)政收入財(cái)政收入(億元億元) ; NZ農(nóng)業(yè)增加值農(nóng)業(yè)增加值(億元億元); GZ工業(yè)增加值工業(yè)增加值(億元億元); JZZ建筑業(yè)增加值建筑業(yè)增加值(億元億元); TPOP總?cè)丝诳側(cè)丝?萬人萬人); CUM最終消費(fèi)最終消費(fèi)(億元億元); SZM受災(zāi)面積受災(zāi)面積(萬公頃萬公頃) 數(shù)據(jù)樣本時(shí)期數(shù)據(jù)樣本時(shí)期1978年年-2003年(資料來源:年(

2、資料來源:中國統(tǒng)計(jì)年鑒中國統(tǒng)計(jì)年鑒2004,中國統(tǒng)計(jì)出版社,中國統(tǒng)計(jì)出版社2004年版)年版) 采用普通最小二乘法得到以下估計(jì)結(jié)果采用普通最小二乘法得到以下估計(jì)結(jié)果iiiiiiiiuSZMCUMTPOPJZZGZNZCS65432103 VariableCoefficientStd. Errort-StatisticProb. 農(nóng)業(yè)增加值農(nóng)業(yè)增加值NZ-1.5350900.129778-11.828610.0000工業(yè)增加值工業(yè)增加值GZ0.8987880.2454663.6615580.0017建筑業(yè)增加值建筑業(yè)增加值JZZ-1.5270891.206242-1.2659890.2208總?cè)?/p>

3、口總?cè)丝赥POP0.1511600.0337594.4776460.0003最終消費(fèi)最終消費(fèi)CUM0.1015140.1053290.9637830.3473受災(zāi)面積受災(zāi)面積SZM-0.0368360.018460-1.9953820.0605截距項(xiàng)截距項(xiàng)-11793.343191.096-3.6957040.0015R-squared0.995015 Mean dependent var5897.824Adjusted R-squared0.993441 S.D. dependent var5945.854S.E. of regression481.5380 Akaike info crit

4、erion15.41665Sum squared resid4405699. Schwarz criterion15.75537Log likelihood-193.4165 F-statistic632.0999Durbin-Watson stat1.873809 Prob(F-statistic)0.000000財(cái)政收入模型的財(cái)政收入模型的EViewsEViews估計(jì)結(jié)果估計(jì)結(jié)果4 可決系數(shù)為可決系數(shù)為0.9950.995,校正的可決系數(shù)為,校正的可決系數(shù)為0.9930.993,模型,模型擬合很好。模型對(duì)財(cái)政收入的解釋程度高達(dá)擬合很好。模型對(duì)財(cái)政收入的解釋程度高達(dá)99.5%99.5%。 F

5、 F統(tǒng)計(jì)量為統(tǒng)計(jì)量為632.10632.10,說明,說明0.050.05水平下回歸方程整體水平下回歸方程整體上顯著。上顯著。 t t 檢驗(yàn)結(jié)果表明,除了工業(yè)增加值和總?cè)丝谝酝?,檢驗(yàn)結(jié)果表明,除了工業(yè)增加值和總?cè)丝谝酝?,其他因素?duì)財(cái)政收入的影響均不顯著。其他因素對(duì)財(cái)政收入的影響均不顯著。 農(nóng)業(yè)增加值和建筑業(yè)增加值的回歸系數(shù)是負(fù)數(shù)。農(nóng)業(yè)增加值和建筑業(yè)增加值的回歸系數(shù)是負(fù)數(shù)。 農(nóng)業(yè)和建筑業(yè)的發(fā)展反而會(huì)使財(cái)政收入減少嗎?農(nóng)業(yè)和建筑業(yè)的發(fā)展反而會(huì)使財(cái)政收入減少嗎?! 這樣的異常結(jié)果顯然與理論分析和實(shí)踐經(jīng)驗(yàn)不相符。這樣的異常結(jié)果顯然與理論分析和實(shí)踐經(jīng)驗(yàn)不相符。 若模型設(shè)定和數(shù)據(jù)真實(shí)性沒問題,問題出在哪里呢

6、?若模型設(shè)定和數(shù)據(jù)真實(shí)性沒問題,問題出在哪里呢?模型估計(jì)與檢驗(yàn)結(jié)果分析模型估計(jì)與檢驗(yàn)結(jié)果分析5第四章第四章 多重共線性多重共線性 本章討論四個(gè)問題:本章討論四個(gè)問題: 什么是多重共線性什么是多重共線性 多重共線性產(chǎn)生的后果多重共線性產(chǎn)生的后果 多重共線性的檢驗(yàn)多重共線性的檢驗(yàn) 多重共線性的補(bǔ)救措施多重共線性的補(bǔ)救措施6第一節(jié)第一節(jié) 什么是多重共線性什么是多重共線性 本節(jié)基本內(nèi)容本節(jié)基本內(nèi)容: : 多重共線性的含義多重共線性的含義 產(chǎn)生多重共線性的背景產(chǎn)生多重共線性的背景 7一、多重共線性的含義一、多重共線性的含義對(duì)于模型 i=1,2,n其基本假設(shè)之一是解釋變量是互相獨(dú)立的。n如果某兩個(gè)或多個(gè)解

7、釋變量之間出現(xiàn)了相如果某兩個(gè)或多個(gè)解釋變量之間出現(xiàn)了相關(guān)性,則稱為關(guān)性,則稱為多重共線性多重共線性12233.iiikkiiYXXXu8不完全的多重共線性不完全的多重共線性: 在計(jì)量經(jīng)濟(jì)學(xué)中所謂的多重共線性在計(jì)量經(jīng)濟(jì)學(xué)中所謂的多重共線性(Multi-Collinearity),不僅包括完全的多重共線性,還,不僅包括完全的多重共線性,還包括不完全的多重共線性。包括不完全的多重共線性。 對(duì)于解釋變量對(duì)于解釋變量 ,如果存在不全為,如果存在不全為0的的 數(shù)數(shù) ,使得,使得 則稱解釋變量則稱解釋變量 之間存在著完全的多重之間存在著完全的多重 共線性。共線性。23,kX XX12k, ,.12233.0

8、1,2,., iikkiXXXin 23,kXXX9當(dāng)當(dāng) 時(shí),表明在數(shù)據(jù)矩陣時(shí),表明在數(shù)據(jù)矩陣 中,中,至少有一個(gè)列向量可以用其余的列向量線至少有一個(gè)列向量可以用其余的列向量線性表示,則說明存在完全的多重共線性。性表示,則說明存在完全的多重共線性。矩陣表示為矩陣表示為不存在即10XXXX()RankkX10不完全的多重共線性不完全的多重共線性 實(shí)際中,常見的情形是解釋變量之間存在不完實(shí)際中,常見的情形是解釋變量之間存在不完全的多重共線性。全的多重共線性。 對(duì)于解釋變量對(duì)于解釋變量,存在不全為存在不全為0的數(shù)的數(shù),使得使得 為隨機(jī)變量。這表明解釋變量為隨機(jī)變量。這表明解釋變量只是一種近似的線性關(guān)

9、系只是一種近似的線性關(guān)系。其中其中,23,kXXX12,k12233.01, 2,., iikkiiXXXuin23,kXXXiu11無多重共線性無多重共線性n如果解釋變量之間不存在上述關(guān)系,則稱解釋變量之間無多重共線性此時(shí):n注意:個(gè)解釋變量不存在多重共線性(線性相關(guān))并不能說明它們之間無關(guān),不存在非線性關(guān)系()RankkX()RankKX X存在即10XXXX12 ,解釋變量間毫無線性關(guān)系,變量間相互正交。這時(shí)已不需要作多元回歸,每個(gè)參數(shù)j都可以通過Y 對(duì) Xj 的一元回歸來估計(jì)?;貧w模型中解釋變量的關(guān)系回歸模型中解釋變量的關(guān)系 可能表現(xiàn)為三種情形:可能表現(xiàn)為三種情形:(1) ,解釋變量間

10、完全共線性。此時(shí)模型參數(shù)將無法確定。 ,解釋變量間存在一定程度的線性關(guān)系。實(shí)際中常遇到的情形。(2)(3) 0ijx xr1ijx xr01ijx xr13 二、產(chǎn)生多重共線性的原因二、產(chǎn)生多重共線性的原因 多重共線性產(chǎn)生的經(jīng)濟(jì)背景主要有幾種情形:1.經(jīng)濟(jì)變量之間往往存在同方向的變化趨勢(shì)。當(dāng)他們被引入同一個(gè)模型成為解釋變量時(shí),會(huì)出現(xiàn)多重共線性2.模型中包含滯后變量,變量各期值之間有可能高度相關(guān)。 3.利用截面數(shù)據(jù)建立模型也可能出現(xiàn)多重共線性。4.經(jīng)濟(jì)變量之間往往存在著密切的內(nèi)在關(guān)聯(lián)度,要素之間互相制約,互相依存。5.樣本數(shù)據(jù)自身的原因,數(shù)據(jù)收集的范圍過窄,造成某些解釋變量之間似乎有相同或相反變

11、化趨勢(shì)的假象。.在建模過程中由于解釋變量選擇不當(dāng),引起變量之間的多重共線性注:解釋變量之間的多重共線性不可避免,只可能使多重共線性的程度盡可能地減弱14第二節(jié)第二節(jié) 多重共線性產(chǎn)生的后果多重共線性產(chǎn)生的后果 本節(jié)基本內(nèi)容本節(jié)基本內(nèi)容: : 完全多重共線性產(chǎn)生的后果完全多重共線性產(chǎn)生的后果 不完全多重共線性產(chǎn)生的后果不完全多重共線性產(chǎn)生的后果15一、完全多重共線性產(chǎn)生的后果一、完全多重共線性產(chǎn)生的后果無法估計(jì)導(dǎo)致)(而不存在即011YXXXXXXX161.參數(shù)的估計(jì)值不確定參數(shù)的估計(jì)值不確定當(dāng)解釋變量當(dāng)解釋變量完全線性相關(guān)完全線性相關(guān)時(shí)時(shí) OLS 估計(jì)式不確定估計(jì)式不確定 從偏回歸系數(shù)意義看:在

12、從偏回歸系數(shù)意義看:在 和和 完全共線性時(shí),無法保完全共線性時(shí),無法保持持 不變,去單獨(dú)考慮不變,去單獨(dú)考慮 對(duì)對(duì) 的影響(的影響( 和和 的影響的影響不可區(qū)分)不可區(qū)分) 從從OLS估計(jì)式看:可以證明此時(shí)估計(jì)式看:可以證明此時(shí)2.參數(shù)估計(jì)值的方差無限大參數(shù)估計(jì)值的方差無限大OLS估計(jì)式的方差成為無窮大:估計(jì)式的方差成為無窮大: 2X3X3X200 =2X2X3X2Var() Y17二、不完全多重共線性產(chǎn)生的后果二、不完全多重共線性產(chǎn)生的后果估計(jì)值方差將很大。共線變量的參數(shù),。中對(duì)角線元素值將很大)()(,而最小方差性。仍滿足線性,無偏性和)(則OLSXXCovVarXXYXXXXX12100

13、18 如果模型中存在不完全的多重共線性,可以得到參數(shù)的估計(jì)如果模型中存在不完全的多重共線性,可以得到參數(shù)的估計(jì)值,但是對(duì)計(jì)量經(jīng)濟(jì)分析可能會(huì)產(chǎn)生一系列的影響。值,但是對(duì)計(jì)量經(jīng)濟(jì)分析可能會(huì)產(chǎn)生一系列的影響。 1.參數(shù)估計(jì)值的方差增大參數(shù)估計(jì)值的方差增大為對(duì)其他解釋變量做輔助回歸模型的決定系數(shù)為對(duì)其他解釋變量做輔助回歸模型的決定系數(shù)其中:其中: 稱為方差膨脹因子稱為方差膨脹因子當(dāng)與其他解釋變量存在嚴(yán)重的多重共線性時(shí):當(dāng)與其他解釋變量存在嚴(yán)重的多重共線性時(shí):22211.)(iiiRxVar2iR2iX211iiRVIF2iX)(,12iiiVarVIFR192.對(duì)參數(shù)區(qū)間估計(jì)時(shí),對(duì)參數(shù)區(qū)間估計(jì)時(shí),置信

14、區(qū)間趨于變大區(qū)間估計(jì)失去可靠性;預(yù)測(cè)區(qū)間變大,置信區(qū)間趨于變大區(qū)間估計(jì)失去可靠性;預(yù)測(cè)區(qū)間變大,降低預(yù)測(cè)精度降低預(yù)測(cè)精度3.假設(shè)檢驗(yàn)容易作出錯(cuò)誤的判斷,檢驗(yàn)的可靠性降低,假設(shè)檢驗(yàn)容易作出錯(cuò)誤的判斷,檢驗(yàn)的可靠性降低,可能導(dǎo)致在假設(shè)檢驗(yàn)中舍去重要的解釋變量可能導(dǎo)致在假設(shè)檢驗(yàn)中舍去重要的解釋變量因?yàn)椋夯貧w參數(shù)顯著性檢驗(yàn)因?yàn)椋夯貧w參數(shù)顯著性檢驗(yàn)變大。12)()(XXCovVar發(fā)生棄真錯(cuò)誤。而變小增大,增大,2/)()()()(tttESVarkntEStiiii204.可能造成可決系數(shù)較高,但對(duì)各個(gè)參數(shù)單獨(dú)的可能造成可決系數(shù)較高,但對(duì)各個(gè)參數(shù)單獨(dú)的 t 檢驗(yàn)檢驗(yàn)卻可能不顯著,甚至可能使估計(jì)的回歸系

15、數(shù)符號(hào)相反,卻可能不顯著,甚至可能使估計(jì)的回歸系數(shù)符號(hào)相反,得出完全錯(cuò)誤的結(jié)論。得出完全錯(cuò)誤的結(jié)論。無法正確反映每個(gè)解釋變無法正確反映每個(gè)解釋變量對(duì)被解釋變量的單獨(dú)影響。量對(duì)被解釋變量的單獨(dú)影響?;貧w模型缺乏穩(wěn)定性回歸模型缺乏穩(wěn)定性當(dāng)樣本觀測(cè)數(shù)據(jù)發(fā)生微小變化時(shí),模型參數(shù)的估計(jì)值會(huì)當(dāng)樣本觀測(cè)數(shù)據(jù)發(fā)生微小變化時(shí),模型參數(shù)的估計(jì)值會(huì)有很大的變化(氏檢驗(yàn))有很大的變化(氏檢驗(yàn)) 21 第三節(jié)第三節(jié) 多重共線性的檢驗(yàn)多重共線性的檢驗(yàn) 本節(jié)基本內(nèi)容:本節(jié)基本內(nèi)容: 簡單相關(guān)系數(shù)檢驗(yàn)法簡單相關(guān)系數(shù)檢驗(yàn)法 方差擴(kuò)大(膨脹)因子法方差擴(kuò)大(膨脹)因子法 直觀判斷法直觀判斷法 逐步回歸法逐步回歸法22一、簡單相關(guān)

16、系數(shù)檢驗(yàn)法一、簡單相關(guān)系數(shù)檢驗(yàn)法 含義:含義:簡單相關(guān)系數(shù)檢驗(yàn)法是利用解釋變量之間簡單相關(guān)系數(shù)檢驗(yàn)法是利用解釋變量之間的線性相關(guān)程度去判斷是否存在嚴(yán)重多重共線性的線性相關(guān)程度去判斷是否存在嚴(yán)重多重共線性的一種簡便方法。的一種簡便方法。 判斷規(guī)則:判斷規(guī)則:一般而言,如果每兩個(gè)解釋變量的簡一般而言,如果每兩個(gè)解釋變量的簡單相關(guān)系數(shù)單相關(guān)系數(shù)(零階相關(guān)系數(shù)零階相關(guān)系數(shù))比較高,例如大于比較高,例如大于0.8,則可認(rèn)為存在著較嚴(yán)重的多重共線性。則可認(rèn)為存在著較嚴(yán)重的多重共線性。23Klein判別公式:22)()()(jjiijjiiijjiXXXXXXXXrXX之間的相關(guān)系數(shù)與為對(duì)稱矩陣相關(guān)系數(shù)矩陣

17、jiijrr 之間的共線性較為嚴(yán)重與則兩變量若jiijXXRr,2224 注意:注意: 1.較高的簡單相關(guān)系數(shù)只是多重共線性存在的充分條件,較高的簡單相關(guān)系數(shù)只是多重共線性存在的充分條件,而不是必要條件。而不是必要條件。 2.只適用于兩個(gè)解釋變量之間存在線性相關(guān)檢驗(yàn)只適用于兩個(gè)解釋變量之間存在線性相關(guān)檢驗(yàn),對(duì)于三個(gè)對(duì)于三個(gè)或更多的解釋變量之間存在的線性相關(guān)關(guān)系不適用或更多的解釋變量之間存在的線性相關(guān)關(guān)系不適用 3.相關(guān)系數(shù)很大則必存在多重共線性相關(guān)系數(shù)很大則必存在多重共線性,而相關(guān)系數(shù)很小卻未而相關(guān)系數(shù)很小卻未必沒有多重共線性必沒有多重共線性.特別是在多于兩個(gè)解釋變量的回歸模型特別是在多于兩個(gè)

18、解釋變量的回歸模型中,有時(shí)較低的簡單相關(guān)系數(shù)也可能存在多重共線性。因中,有時(shí)較低的簡單相關(guān)系數(shù)也可能存在多重共線性。因此并不能簡單地依據(jù)相關(guān)系數(shù)進(jìn)行多重共線性的準(zhǔn)確判斷。此并不能簡單地依據(jù)相關(guān)系數(shù)進(jìn)行多重共線性的準(zhǔn)確判斷。25二、輔助回歸檢驗(yàn)法二、輔助回歸檢驗(yàn)法kkkkkkiFRXXXfXFRXXXfXFRXXXfXKX和和和個(gè)回歸方程進(jìn)行回歸。得對(duì)其他的解釋變量將每個(gè)解釋變量2121222312121321),(),(),(變量存在多重共線性。與其余解釋顯著的大于臨界值,則,越接近重共線性與其余解釋變量存在多則顯著的大于臨界值,接近其中的iiikiiiiXFRRRRRMaxRXFR22222

19、2122),(.21.126 三、方差擴(kuò)大(膨脹)因子法三、方差擴(kuò)大(膨脹)因子法 統(tǒng)計(jì)上可以證明,解釋變量統(tǒng)計(jì)上可以證明,解釋變量的參數(shù)估計(jì)式的參數(shù)估計(jì)式的方差可表示為的方差可表示為 其中的其中的是變量是變量(Variance Inflation Factor),即,即的方差擴(kuò)大因子的方差擴(kuò)大因子其中其中 是多個(gè)解釋變量輔助回歸的可決系數(shù)是多個(gè)解釋變量輔助回歸的可決系數(shù) 21VIF =1-jjR222221Var() =VIF1-jjjjjxRxVIFjjXjXj2jR27經(jīng)驗(yàn)規(guī)則經(jīng)驗(yàn)規(guī)則方差膨脹因子越大,表明解釋變量之間的多重共方差膨脹因子越大,表明解釋變量之間的多重共性越嚴(yán)重。反過來,方

20、差膨脹因子越接近于性越嚴(yán)重。反過來,方差膨脹因子越接近于1,多重共線性越弱。多重共線性越弱。經(jīng)驗(yàn)表明,方差膨脹因子經(jīng)驗(yàn)表明,方差膨脹因子10時(shí),說明解釋變量時(shí),說明解釋變量與其余解釋變量之間有嚴(yán)重的多重共線性,且這與其余解釋變量之間有嚴(yán)重的多重共線性,且這種多重共線性可能會(huì)過度地影響最小二乘估計(jì)。種多重共線性可能會(huì)過度地影響最小二乘估計(jì)。28四、直觀判斷法四、直觀判斷法 根據(jù)回歸結(jié)果判斷也叫不顯著系數(shù)檢驗(yàn)法根據(jù)回歸結(jié)果判斷也叫不顯著系數(shù)檢驗(yàn)法1.從定性分析認(rèn)為,一些重要的解釋變量的回歸系數(shù)從定性分析認(rèn)為,一些重要的解釋變量的回歸系數(shù)的標(biāo)準(zhǔn)誤差較大,在回歸方程中沒有通過顯著性檢的標(biāo)準(zhǔn)誤差較大,在

21、回歸方程中沒有通過顯著性檢驗(yàn)時(shí),可初步判斷可能存在嚴(yán)重的多重共線性。驗(yàn)時(shí),可初步判斷可能存在嚴(yán)重的多重共線性。F檢驗(yàn)大于給定顯著性水平下的臨界值檢驗(yàn)大于給定顯著性水平下的臨界值.但模型中的全但模型中的全部或部分參數(shù)估計(jì)值卻不顯著部或部分參數(shù)估計(jì)值卻不顯著,或系數(shù)估計(jì)值的符號(hào)或系數(shù)估計(jì)值的符號(hào)不對(duì)不對(duì),則模型自變量之間存在多重共線性則模型自變量之間存在多重共線性.8.0)(222RRR很大,一般或如果292. 當(dāng)增加或剔除一個(gè)解釋變量,或者改變一個(gè)觀當(dāng)增加或剔除一個(gè)解釋變量,或者改變一個(gè)觀測(cè)值時(shí),回歸參數(shù)的估計(jì)值發(fā)生較大變化,回歸測(cè)值時(shí),回歸參數(shù)的估計(jì)值發(fā)生較大變化,回歸方程可能存在嚴(yán)重的多重共

22、線性。方程可能存在嚴(yán)重的多重共線性。3. 有些解釋變量的回歸系數(shù)所帶正負(fù)號(hào)與定性分有些解釋變量的回歸系數(shù)所帶正負(fù)號(hào)與定性分析結(jié)果違背時(shí),很可能存在多重共線性。析結(jié)果違背時(shí),很可能存在多重共線性。4. 解釋變量的相關(guān)矩陣中,自變量之間的相關(guān)系解釋變量的相關(guān)矩陣中,自變量之間的相關(guān)系數(shù)較大時(shí),可能會(huì)存在多重共線性問題。數(shù)較大時(shí),可能會(huì)存在多重共線性問題。30五、逐步回歸檢測(cè)法五、逐步回歸檢測(cè)法 也稱也稱Frisch綜合分析法其綜合分析法其基本思想:基本思想: 將變量逐個(gè)的引入模型,每引入一個(gè)解釋變量后,將變量逐個(gè)的引入模型,每引入一個(gè)解釋變量后,都要進(jìn)行檢驗(yàn),并對(duì)已經(jīng)選入的解釋變量逐個(gè)進(jìn)都要進(jìn)行檢

23、驗(yàn),并對(duì)已經(jīng)選入的解釋變量逐個(gè)進(jìn)行行t 檢驗(yàn),當(dāng)原來引入的解釋變量由于后面解釋變量檢驗(yàn),當(dāng)原來引入的解釋變量由于后面解釋變量的引入而變得不再顯著時(shí),則將其剔除。以確保每的引入而變得不再顯著時(shí),則將其剔除。以確保每次引入新的變量之前回歸方程中只包含顯著的變量。次引入新的變量之前回歸方程中只包含顯著的變量。 在逐步回歸中,高度相關(guān)的解釋變量,在引入時(shí)會(huì)在逐步回歸中,高度相關(guān)的解釋變量,在引入時(shí)會(huì)被剔除。因而也是一種檢測(cè)多重共線性的有效方法。被剔除。因而也是一種檢測(cè)多重共線性的有效方法。31第四節(jié)第四節(jié) 多重共線性的補(bǔ)救措多重共線性的補(bǔ)救措施施 本節(jié)基本內(nèi)容本節(jié)基本內(nèi)容: : 修正多重共線性的經(jīng)驗(yàn)方

24、法修正多重共線性的經(jīng)驗(yàn)方法 逐步回歸法逐步回歸法32一、修正多重共線性的經(jīng)驗(yàn)方法一、修正多重共線性的經(jīng)驗(yàn)方法 1. 剔除變量法剔除變量法 是降低多重共線性最簡便的方法是降低多重共線性最簡便的方法.把方差擴(kuò)大因子最大者所對(duì)應(yīng)的自變量首先把方差擴(kuò)大因子最大者所對(duì)應(yīng)的自變量首先剔除再重新建立回歸方程,直至回歸方程中剔除再重新建立回歸方程,直至回歸方程中不再存在嚴(yán)重的多重共線性。不再存在嚴(yán)重的多重共線性。注意注意: 若剔除了重要變量,可能引起模型的設(shè)若剔除了重要變量,可能引起模型的設(shè)定誤差。定誤差。33 2. 增大樣本容增大樣本容樣本容量增加,會(huì)減小回歸參數(shù)的方差,標(biāo)準(zhǔn)誤差也同樣會(huì)樣本容量增加,會(huì)減小

25、回歸參數(shù)的方差,標(biāo)準(zhǔn)誤差也同樣會(huì)減小。因此盡可能地收集足夠多的樣本數(shù)據(jù)可以改進(jìn)模減小。因此盡可能地收集足夠多的樣本數(shù)據(jù)可以改進(jìn)模型參數(shù)的估計(jì)。型參數(shù)的估計(jì)。 樣本容量越小有近似多重共線性的可能性就越大樣本容量越小有近似多重共線性的可能性就越大,反之反之,樣本樣本容量越大容量越大,多重共線性的可能性就越小多重共線性的可能性就越小問題:問題:增加樣本數(shù)增加樣本數(shù)據(jù)在實(shí)際計(jì)量分析中常面臨許多困難據(jù)在實(shí)際計(jì)量分析中常面臨許多困難,受制于實(shí)際情況。受制于實(shí)際情況。增大樣本容量并不必然降低近似的多重共線性增大樣本容量并不必然降低近似的多重共線性,如增加的數(shù)如增加的數(shù)據(jù)也有類似的共線性據(jù)也有類似的共線性,就

26、不起作用就不起作用如果變量總體中本來就有共線性問題如果變量總體中本來就有共線性問題,再增大樣本容量也無再增大樣本容量也無濟(jì)于事濟(jì)于事.34 3. 變換模型形式變換模型形式一般而言,差分后變量之間的相關(guān)性要比差分一般而言,差分后變量之間的相關(guān)性要比差分前弱得多,所以差分后的模型可能降低出現(xiàn)共前弱得多,所以差分后的模型可能降低出現(xiàn)共線性的可能性,此時(shí)可直接估計(jì)差分方程。線性的可能性,此時(shí)可直接估計(jì)差分方程。問題:問題:差分會(huì)丟失一些信息,差分模型的誤差差分會(huì)丟失一些信息,差分模型的誤差項(xiàng)可能存在序列相關(guān),可能會(huì)違背經(jīng)典線性回項(xiàng)可能存在序列相關(guān),可能會(huì)違背經(jīng)典線性回歸模型的相關(guān)假設(shè),在具體運(yùn)用時(shí)要慎

27、重。歸模型的相關(guān)假設(shè),在具體運(yùn)用時(shí)要慎重。35 4. 利用非樣本先驗(yàn)信息利用非樣本先驗(yàn)信息通過經(jīng)濟(jì)理論分析能夠得到某些參數(shù)之間的關(guān)通過經(jīng)濟(jì)理論分析能夠得到某些參數(shù)之間的關(guān)系,可以將這種關(guān)系作為約束條件,將此約束系,可以將這種關(guān)系作為約束條件,將此約束條件和樣本信息結(jié)合起來進(jìn)行約束最小二乘估條件和樣本信息結(jié)合起來進(jìn)行約束最小二乘估計(jì)。計(jì)。36 5. 橫截面數(shù)據(jù)與時(shí)序數(shù)據(jù)并用橫截面數(shù)據(jù)與時(shí)序數(shù)據(jù)并用首先利用橫截面數(shù)據(jù)估計(jì)出部分參數(shù),再利用首先利用橫截面數(shù)據(jù)估計(jì)出部分參數(shù),再利用時(shí)序數(shù)據(jù)估計(jì)出另外的部分參數(shù),最后得到整時(shí)序數(shù)據(jù)估計(jì)出另外的部分參數(shù),最后得到整個(gè)方程參數(shù)的估計(jì)。個(gè)方程參數(shù)的估計(jì)。 注意

28、:注意:這里包含著假設(shè),即參數(shù)的橫截面估計(jì)和這里包含著假設(shè),即參數(shù)的橫截面估計(jì)和從純粹時(shí)間序列分析中得到的估計(jì)是一樣的。從純粹時(shí)間序列分析中得到的估計(jì)是一樣的。 37 6. 變量變換變量變換變量變換的主要方法:變量變換的主要方法:(1)計(jì)算相對(duì)指標(biāo)計(jì)算相對(duì)指標(biāo) (2)將名義數(shù)據(jù)轉(zhuǎn)換為實(shí)際數(shù)據(jù)將名義數(shù)據(jù)轉(zhuǎn)換為實(shí)際數(shù)據(jù) (3)將小類指標(biāo)合并成大類指標(biāo)將小類指標(biāo)合并成大類指標(biāo) 變量數(shù)據(jù)的變換有時(shí)可得到較好的結(jié)果,但無變量數(shù)據(jù)的變換有時(shí)可得到較好的結(jié)果,但無法保證一定可以得到很好的結(jié)果。法保證一定可以得到很好的結(jié)果。38 二、逐步回歸法二、逐步回歸法(1)用被解釋變量對(duì)每一個(gè)所考慮的解釋變量做簡)用被

29、解釋變量對(duì)每一個(gè)所考慮的解釋變量做簡單回歸。單回歸。(2)以對(duì)被解釋變量貢獻(xiàn)最大的解釋變量所對(duì)應(yīng)的)以對(duì)被解釋變量貢獻(xiàn)最大的解釋變量所對(duì)應(yīng)的回歸方程為基礎(chǔ),按對(duì)被解釋變量貢獻(xiàn)大小的順回歸方程為基礎(chǔ),按對(duì)被解釋變量貢獻(xiàn)大小的順序逐個(gè)引入其余的解釋變量。序逐個(gè)引入其余的解釋變量。若新變量的引入改進(jìn)了若新變量的引入改進(jìn)了 和和 檢驗(yàn),且回歸參檢驗(yàn),且回歸參數(shù)的數(shù)的t t 檢驗(yàn)在統(tǒng)計(jì)上也是顯著的,則在模型中保檢驗(yàn)在統(tǒng)計(jì)上也是顯著的,則在模型中保留該變量。留該變量。F2R39若新變量的引入未能改進(jìn)若新變量的引入未能改進(jìn) 和和 檢驗(yàn),且對(duì)其他回檢驗(yàn),且對(duì)其他回歸參數(shù)估計(jì)值的歸參數(shù)估計(jì)值的t t 檢驗(yàn)也未帶

30、來什么影響,則認(rèn)為該檢驗(yàn)也未帶來什么影響,則認(rèn)為該變量是多余變量。變量是多余變量。若新變量的引入未能改進(jìn)若新變量的引入未能改進(jìn) 和和 檢驗(yàn),且顯著地影檢驗(yàn),且顯著地影響了其他回歸參數(shù)估計(jì)值的數(shù)值或符號(hào),同時(shí)本身的響了其他回歸參數(shù)估計(jì)值的數(shù)值或符號(hào),同時(shí)本身的回歸參數(shù)也通不過回歸參數(shù)也通不過t t 檢驗(yàn),說明出現(xiàn)了嚴(yán)重的多重共檢驗(yàn),說明出現(xiàn)了嚴(yán)重的多重共線性。線性。2RFF2R40三、其他方法三、其他方法(了解).1.嶺回歸法2.主成分回歸.YXkIXXk1)()(41 第五節(jié)第五節(jié) 案例分析案例分析一、研究的目的要求一、研究的目的要求提出研究的問題提出研究的問題為了規(guī)劃中國未來國內(nèi)旅游產(chǎn)業(yè)為了

31、規(guī)劃中國未來國內(nèi)旅游產(chǎn)業(yè)的發(fā)展,需要定量地分析影響中國國內(nèi)旅游市場(chǎng)發(fā)展的發(fā)展,需要定量地分析影響中國國內(nèi)旅游市場(chǎng)發(fā)展的主要因素。的主要因素。二、模型設(shè)定及其估計(jì)二、模型設(shè)定及其估計(jì)影響因素分析與確定影響因素分析與確定影響因素主要有國內(nèi)旅游影響因素主要有國內(nèi)旅游人數(shù)人數(shù) ,城鎮(zhèn)居民人均旅游支出,城鎮(zhèn)居民人均旅游支出 ,農(nóng)村居民人,農(nóng)村居民人均均旅游支出旅游支出 ,并以公路里程次,并以公路里程次 和鐵路里程和鐵路里程 作為相關(guān)基礎(chǔ)設(shè)施的代表作為相關(guān)基礎(chǔ)設(shè)施的代表 理論模型的設(shè)定理論模型的設(shè)定其中其中 : 第第 t 年全國國內(nèi)旅游收入年全國國內(nèi)旅游收入23456123456tttttttYXXXXX

32、u2X3XtY4X5X6X42數(shù)據(jù)的收集與處理年年份份國內(nèi)旅游國內(nèi)旅游收入收入Y Y(億元)(億元)國內(nèi)旅國內(nèi)旅游人數(shù)游人數(shù)X2X2(萬人次)(萬人次)城鎮(zhèn)居民人城鎮(zhèn)居民人均旅游支出均旅游支出X3X3(元)(元)農(nóng)村居民人農(nóng)村居民人均旅游支出均旅游支出X4 X4 (元)(元)公路里公路里程程 X5X5(萬公里)萬公里)鐵路里鐵路里程程X6X6(萬公里)萬公里)199419941023.51023.55240052400414.7414.754.954.9111.78111.785.905.90199519951375.71375.76290062900464.0464.061.561.5115

33、.70115.705.975.97199619961638.41638.46390063900534.1534.170.570.5118.58118.586.496.49199719972112.72112.76440064400599.8599.8145.7145.7122.64122.646.606.60199819982391.22391.26945069450607.0607.0197.0197.0127.85127.856.646.64199919992831.92831.97190071900614.8614.8249.5249.5135.17135.176.746.7420002

34、0003175.53175.57440074400678.6678.6226.6226.6140.27140.276.876.87200120013522.43522.47840078400708.3708.3212.7212.7169.80169.807.017.01200220023878.43878.48780087800739.7739.7209.1209.1176.52176.527.197.19200320033442.33442.38700087000684.9684.9200.0200.0180.98180.987.307.30數(shù)據(jù)來源:中國統(tǒng)計(jì)年鑒200443該模型,可決系數(shù)

35、很高,F(xiàn)檢驗(yàn)值173.3525,明顯顯著。但是當(dāng)時(shí)、不僅 、 系數(shù)的t檢驗(yàn)不顯著,而且 系數(shù)的符號(hào)與預(yù)期的相反,這表明很可能存在嚴(yán)重的多重共線性。 6X20.9954R 20.025()(106)2.776tnkt6X2X20.9897R 0.05OLS OLS 法估計(jì)的結(jié)果法估計(jì)的結(jié)果44計(jì)算各解釋變量的相關(guān)系數(shù)計(jì)算各解釋變量的相關(guān)系數(shù) 表明各解釋變量間確實(shí)存在嚴(yán)重的多重共線性表明各解釋變量間確實(shí)存在嚴(yán)重的多重共線性45三、消除多重共線性三、消除多重共線性采用逐步回歸法檢驗(yàn)和解決多重供線性問題。采用逐步回歸法檢驗(yàn)和解決多重供線性問題。分別作分別作Y 對(duì)對(duì)X2、X3、X4、X5、X6的一元回歸的一元回歸 變量變量X2X3X4X5X6參數(shù)估計(jì)值參數(shù)估計(jì)值0.08429.052311.667334.3324 2014.146t 統(tǒng)計(jì)量統(tǒng)計(jì)量8.665913.15985.19676.46758.74870.90370.95580.77150.83940.9054的大小排序?yàn)椋旱拇笮∨判驗(yàn)椋篨3、X6、X2、X5、X4。以以X3為基礎(chǔ),順次加入其他變量逐步回歸,過程從略為基礎(chǔ),順次加入其他變量逐步回歸,過程從略(見教材)(見教材) 2R2R46 最后消除多重共線性的結(jié)果最后消除多重共線性的結(jié)果 這說明,在其他因素不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論