在逐步回歸中高度相關(guān)的解釋變量_第1頁
在逐步回歸中高度相關(guān)的解釋變量_第2頁
在逐步回歸中高度相關(guān)的解釋變量_第3頁
在逐步回歸中高度相關(guān)的解釋變量_第4頁
在逐步回歸中高度相關(guān)的解釋變量_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

在逐步回歸中高度相關(guān)的解釋變量引子:

國內(nèi)生產(chǎn)總值增加會減少財政收入嗎?為了分析各主要因素對國家財政收入的影響,建立財政收入(億元)(CZSR)為被解釋變量,財政支出(億元)(CZZC)、國內(nèi)生產(chǎn)總值(億元)(GDP)、稅收總額(億元)(SSZE)等為解釋變量的計量模型。數(shù)據(jù)樣本時期:1978年-2011年的統(tǒng)計數(shù)據(jù)。設(shè)定的理論模型為:

采用普通最小二乘法得到以下估計結(jié)果財政收入模型的EViews估計結(jié)果VariableCoefficient

Std.Error

t-Statistic

Prob.

截距119.0786107.12361.1116000.2751財政支出0.1223550.0488462.5049100.0179國內(nèi)生產(chǎn)總值-0.0341040.005068-6.7291010.0000稅收總額1.1811570.06967616.952040.0000R-squared0.999791Meandependentvar18185.17AdjustedR-squared0.999770

S.D.dependentvar26129.67S.E.ofregression395.9401

Akaikeinfocriterion14.91053Sumsquaredresid4703056.

Schwarzcriterion15.09011Loglikelihood-249.4791

Hannan-Quinncriter.14.97177F-statistic47897.29

Durbin-Watsonstat1.025140Prob(F-statistic)

0.000000

●可決系數(shù)為

,校正的可決系數(shù)為,模型擬合很好。模型對財政收入的解釋程度高達(dá)99.9%?!馞統(tǒng)計量為,說明水平下回歸方程整體上很顯著?!駎檢驗(yàn)結(jié)果表明,各個解釋變量對財政收入的影響均顯著,但是國內(nèi)生產(chǎn)總值對財政收入的回歸系數(shù)的符號為負(fù),即經(jīng)濟(jì)增長反而會使財政收入減少。這顯然與理論分析和實(shí)踐經(jīng)驗(yàn)不相符。為什么會出現(xiàn)這樣的異常結(jié)果?如果模型設(shè)定和數(shù)據(jù)真實(shí)性沒問題,問題會出在哪里呢?模型估計與檢驗(yàn)結(jié)果分析第四章多重共線性

本章討論四個問題:

●什么是多重共線性●多重共線性產(chǎn)生的后果●多重共線性的檢驗(yàn)●多重共線性的補(bǔ)救措施第一節(jié)什么是多重共線性

本節(jié)基本內(nèi)容:

●多重共線性的含義●產(chǎn)生多重共線性的背景

在計量經(jīng)濟(jì)學(xué)中所謂的多重共線性(Multi-Collinearity),

不僅包括完全的多重共線性,還包括不完全的多重共線性。

在有截距項(xiàng)的模型中,截距項(xiàng)可以視為其對應(yīng)的解釋變量總

是為1。對于解釋變量,如果存在不全為0的

數(shù),使得則稱解釋變量之間存在著完全的多重共

線性。一、多重共線性的含義或者說,當(dāng)時,表明在數(shù)據(jù)矩陣中,至少有一個列向量可以用其余的列向量線性表示,則說明存在完全的多重共線性。不完全的多重共線性

實(shí)際中,常見的情形是解釋變量之間存在不完全的多重共線性。

對于解釋變量,存在不全為0的數(shù),使得

為隨機(jī)變量。這表明解釋變量只是一種近似的線性關(guān)系。其中,

,解釋變量間毫無線性關(guān)系,變量間相互正交。這時已不需要作多元回歸,每個參數(shù)j都可以通過Y對Xj的一元回歸來估計?;貧w模型中解釋變量的關(guān)系

可能表現(xiàn)為三種情形:(1)

,解釋變量間完全共線性。此時模型參數(shù)將無法確定。

,解釋變量間存在一定程度的線性關(guān)系。實(shí)際中常遇到的情形。(2)(3)

二、產(chǎn)生多重共線性的背景

多重共線性產(chǎn)生的經(jīng)濟(jì)背景主要有幾種情形:

1.經(jīng)濟(jì)變量之間具有共同變化趨勢。

2.模型中包含滯后變量。

3.利用截面數(shù)據(jù)建立模型也可能出現(xiàn)多重共線性。

4.樣本數(shù)據(jù)自身的原因。

第二節(jié)多重共線性產(chǎn)生的后果

本節(jié)基本內(nèi)容:●完全多重共線性產(chǎn)生的后果●不完全多重共線性產(chǎn)生的后果一、完全多重共線性產(chǎn)生的后果1.參數(shù)的估計值不確定當(dāng)解釋變量完全線性相關(guān)時——OLS估計式不確定▲從偏回歸系數(shù)意義看:在和完全共線性時,無法保持不變,去單獨(dú)考慮對的影響(和的影響不可區(qū)分)▲從OLS估計式看:可以證明此時2.參數(shù)估計值的方差無限大OLS估計式的方差成為無窮大:

二、不完全多重共線性產(chǎn)生的后果

如果模型中存在不完全的多重共線性,可以得到參數(shù)的估計值,但是對計量經(jīng)濟(jì)分析可能會產(chǎn)生一系列的影響。

1.參數(shù)估計值的方差增大

當(dāng)增大時也增大

2.對參數(shù)區(qū)間估計時,置信區(qū)間趨于變大3.假設(shè)檢驗(yàn)容易作出錯誤的判斷4.可能造成可決系數(shù)較高,但對各個參數(shù)單獨(dú)的t檢驗(yàn)卻可能不顯著,甚至可能使估計的回歸系數(shù)符號相反,得出完全錯誤的結(jié)論。

第三節(jié)多重共線性的檢驗(yàn)

本節(jié)基本內(nèi)容:

●簡單相關(guān)系數(shù)檢驗(yàn)法●方差擴(kuò)大(膨脹)因子法●直觀判斷法●逐步回歸法一、簡單相關(guān)系數(shù)檢驗(yàn)法

含義:簡單相關(guān)系數(shù)檢驗(yàn)法是利用解釋變量之間的線性相關(guān)程度去判斷是否存在嚴(yán)重多重共線性的一種簡便方法。判斷規(guī)則:一般而言,如果每兩個解釋變量的簡單相關(guān)系數(shù)(零階相關(guān)系數(shù))比較高,例如大于,則可認(rèn)為存在著較嚴(yán)重的多重共線性。

注意:較高的簡單相關(guān)系數(shù)只是多重共線性存在的充分條件,而不是必要條件。特別是在多于兩個解釋變量的回歸模型中,有時較低的簡單相關(guān)系數(shù)也可能存在多重共線性。因此并不能簡單地依據(jù)相關(guān)系數(shù)進(jìn)行多重共線性的準(zhǔn)確判斷。

二、方差擴(kuò)大(膨脹)因子法

統(tǒng)計上可以證明,解釋變量的參數(shù)估計式的方差可表示為

其中的是變量(VarianceInflationFactor),即的方差擴(kuò)大因子其中是多個解釋變量輔助回歸的可決系數(shù)

經(jīng)驗(yàn)規(guī)則●方差膨脹因子越大,表明解釋變量之間的多重共性越嚴(yán)重。反過來,方差膨脹因子越接近于1,多重共線性越弱?!窠?jīng)驗(yàn)表明,方差膨脹因子≥10時,說明解釋變量與其余解釋變量之間有嚴(yán)重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。三、直觀判斷法1.當(dāng)增加或剔除一個解釋變量,或者改變一個觀測值時,回歸參數(shù)的估計值發(fā)生較大變化,回歸方程可能存在嚴(yán)重的多重共線性。

2.從定性分析認(rèn)為,一些重要的解釋變量的回歸系數(shù)的標(biāo)準(zhǔn)誤差較大,在回歸方程中沒有通過顯著性檢驗(yàn)時,可初步判斷可能存在嚴(yán)重的多重共線性。3.有些解釋變量的回歸系數(shù)所帶正負(fù)號與定性分析結(jié)果違背時,很可能存在多重共線性。4.解釋變量的相關(guān)矩陣中,自變量之間的相關(guān)系數(shù)較大時,可能會存在多重共線性問題。四、逐步回歸檢測法

逐步回歸的基本思想將變量逐個的引入模型,每引入一個解釋變量后,都要進(jìn)行F檢驗(yàn),并對已經(jīng)選入的解釋變量逐個進(jìn)行t檢驗(yàn),當(dāng)原來引入的解釋變量由于后面解釋變量的引入而變得不再顯著時,則將其剔除。以確保每次引入新的變量之前回歸方程中只包含顯著的變量。在逐步回歸中,高度相關(guān)的解釋變量,在引入時會被剔除。因而也是一種檢測多重共線性的有效方法。第四節(jié)多重共線性的補(bǔ)救措施

本節(jié)基本內(nèi)容:

●修正多重共線性的經(jīng)驗(yàn)方法●逐步回歸法嶺回歸法在本科教學(xué)中只是供選擇使用的內(nèi)容。

一、修正多重共線性的經(jīng)驗(yàn)方法1.剔除變量法把方差擴(kuò)大因子最大者所對應(yīng)的自變量首先剔除再重新建立回歸方程,直至回歸方程中不再存在嚴(yán)重的多重共線性。注意:若剔除了重要變量,可能引起模型的設(shè)定誤差。2.增大樣本容量如果樣本容量增加,會減小回歸參數(shù)的方差,標(biāo)準(zhǔn)誤差也同樣會減小。因此盡可能地收集足夠多的樣本數(shù)據(jù)可以改進(jìn)模型參數(shù)的估計。問題:增加樣本數(shù)據(jù)在實(shí)際計量分析中常面臨許多困難。3.變換模型形式一般而言,差分后變量之間的相關(guān)性要比差分前弱得多,所以差分后的模型可能降低出現(xiàn)共線性的可能性,此時可直接估計差分方程。問題:差分會丟失一些信息,差分模型的誤差項(xiàng)可能存在序列相關(guān),可能會違背經(jīng)典線性回歸模型的相關(guān)假設(shè),在具體運(yùn)用時要慎重。4.利用非樣本先驗(yàn)信息通過經(jīng)濟(jì)理論分析能夠得到某些參數(shù)之間的關(guān)系,可以將這種關(guān)系作為約束條件,將此約束條件和樣本信息結(jié)合起來進(jìn)行約束最小二乘估計。5.橫截面數(shù)據(jù)與時序數(shù)據(jù)并用首先利用橫截面數(shù)據(jù)估計出部分參數(shù),再利用時序數(shù)據(jù)估計出另外的部分參數(shù),最后得到整個方程參數(shù)的估計。注意:這里包含著假設(shè),即參數(shù)的橫截面估計和從純粹時間序列分析中得到的估計是一樣的。

6.變量變換變量變換的主要方法:(1)計算相對指標(biāo)(2)將名義數(shù)據(jù)轉(zhuǎn)換為實(shí)際數(shù)據(jù)(3)將小類指標(biāo)合并成大類指標(biāo)變量數(shù)據(jù)的變換有時可得到較好的結(jié)果,但無法保證一定可以得到很好的結(jié)果。

二、逐步回歸法(1)用被解釋變量對每一個所考慮的解釋變量做簡單回歸。(2)以對被解釋變量貢獻(xiàn)最大的解釋變量所對應(yīng)的回歸方程為基礎(chǔ),按對被解釋變量貢獻(xiàn)大小的順序逐個引入其余的解釋變量。若新變量的引入改進(jìn)了

和檢驗(yàn),且回歸參數(shù)的t檢驗(yàn)在統(tǒng)計上也是顯著的,則在模型中保留該變量。若新變量的引入未能改進(jìn)和檢驗(yàn),且對其他回歸參數(shù)估計值的t檢驗(yàn)也未帶來什么影響,則認(rèn)為該變量是多余變量。若新變量的引入未能改進(jìn)和檢驗(yàn),且顯著地影響了其他回歸參數(shù)估計值的數(shù)值或符號,同時本身的回歸參數(shù)也通不過t檢驗(yàn),說明出現(xiàn)了嚴(yán)重的多重共線性。

第五節(jié)案例分析一、研究的目的要求提出研究的問題——為了規(guī)劃中國未來國內(nèi)旅游產(chǎn)業(yè)的發(fā)展,需要定量地分析影響中國國內(nèi)旅游市場發(fā)展的主要因素。二、模型設(shè)定及其估計影響因素分析與確定——影響因素主要有國內(nèi)旅游人數(shù),城鎮(zhèn)居民人均旅游支出,農(nóng)村居民人均旅游支出,并以鐵路里程作為相關(guān)基礎(chǔ)設(shè)施的代表

理論模型的設(shè)定其中:——第t年全國國內(nèi)旅游收入數(shù)據(jù)的收集與處理1994年—2011年中國旅游收入及相關(guān)數(shù)據(jù)

年份國內(nèi)旅游收入Y(億元)國內(nèi)旅游人數(shù)X2(萬人次)城鎮(zhèn)居民人均旅游花費(fèi)X3(元)農(nóng)村居民人均旅游花費(fèi)X4(元)鐵路里程X5(萬公里)19941023.552400414.754.95.9019951375.762900464.061.55.9719961638.463900534.170.56.4919972112.764400599.8145.76.6019982391.269450607.0197.06.6419992831.971900614.8249.56.7420003175.574400678.6226.66.8720013522.478400708.3212.77.0120023878.487800739.7209.17.1920033442.387000684.9200.07.3020044710.7110200731.8210.27.4420055285.9121200737.1227.67.5420066229.74139400766.4221.97.7120077770.62161000906.9222.57.8020088749.3171200849.4275.38.0200910183.7190200801.1295.38.6201012579.8210300883.0306.09.1201119305.4264100877.8471.49.3該模型,可決系數(shù)較高,F(xiàn)檢驗(yàn)值225.85,明顯顯著。但是當(dāng)時、

OLS估計的結(jié)果不僅X5的系數(shù)不顯著,而且X3、X5的符號與預(yù)期相反,這表明可能存在嚴(yán)重的多重共線性。計算各解釋變量的相關(guān)系數(shù)

表明各解釋變量間確實(shí)存在嚴(yán)重的線性關(guān)系X2X3X4X5X2

1.000000

0.837135

0.846417

0.962193X3

0.837135

1.000000

0.824165

0.902770X4

0.846417

0.824165

1.000000

0.884279X5

0.962193

0.902770

0.884279

1.000000將每個解釋變量分別作為被解釋變量對其余的解釋變量進(jìn)行輔助回歸,回歸所得到的可決系數(shù)和方差擴(kuò)大因子的數(shù)值見下表。被解釋變量可決系數(shù)

的值方差擴(kuò)大因子X20.931214.5349X30.83105.9172X40.78564.6642X50.961826.1780經(jīng)驗(yàn)表明,方差擴(kuò)大因子VIFj≥10時,通常說明該解釋變量與其余解釋變量之間有嚴(yán)重的多重共線性,這里X2、X5的方差擴(kuò)大因子遠(yuǎn)大于10,表明存在嚴(yán)重多重共線性問題。三、消除多重共線性將各變量進(jìn)行對數(shù)變換,再對以下模型進(jìn)行估計將、、、、等數(shù)據(jù)取自然對數(shù)后,采用OLS方法估計模型參數(shù),得到的回歸結(jié)果

最后消除多重共線性的結(jié)果四、回歸結(jié)果的解釋與分析該模型,可決系數(shù)很高,F(xiàn)檢驗(yàn)值,明顯顯著。當(dāng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論