




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第1 1頁頁 多重共線性(Multicollinearity)一詞由弗里希(Ragnar Frisch,18951973)于1934年引入。 第四章第四章 多重共線性多重共線性 原意是指回歸模型中的部分或全部解釋變量之間存在完全的線性關系,是對假定MLR.3的違背,后來人們將這個概念擴展到近似的線性關系。 多重共線性是多元回歸建模過程中最常遇到的問題。本章中我們首先分析與界定完全多重共線性與多重共線性,探討多重共線性可能引起的后果,然后介紹多重共線性的診斷與
2、緩解多重共線性的補救措施。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第2 2頁頁學習目標:1、了解多重共線性的概念、能區(qū)分完全的多重共線性與多重共線性;2、了解多重共線性產生的原因;3、理解多重共線性引起的后果;4、理解并掌握多重共線性的診斷;5、掌握緩解多重共線性問題的處理方法。重點與難點: 理解多重共線性是一種樣本現(xiàn)象; 深刻理解多重共線性的理論后果與實際后果; 掌握多重共線性的診斷及多重共線性問題的 處理方法。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計
3、學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3 3頁頁 第一節(jié)第一節(jié) 多重共線性問題及其對建模的影響多重共線性問題及其對建模的影響 一、多重共線性的含義一、多重共線性的含義 廣義的多重共線性包括完全多重共線性和近似多重共線性。狹義的的多重共線性指的是近似多重共線性。如果不特加說明,本章使用的是狹義的多重共線性。(一)完全多重共線性 多元線性回歸模型的古典假定MLR.3是,模型中解釋變量之間不存在完全的線性相關關系,此機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4 4頁頁對于模型對于模型
4、yi= 0+ 1x1i+ 2x2i+ kxki+ui i=1,2,n時就稱解釋變量(1,2,., )jxjk之間不存在完全的多重共線性。 即:若存在一組不全為零的常數(shù)012,k 0 如果存在某解釋變量是其他解釋變量的線性組合,則稱為存在完全多重共線性(Complete Multicollinearity, Exact Multicollinearity)使得:01 1220kkxxx機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5 5頁頁用矩陣表示,解釋變量的觀測值矩陣為)1(211221212111
5、111knknnnkkxxxxxxxxxX當存在完全共線性時: rank(X) R2,則xl,xj間的多重共線性對回歸模型是有害的。例例4.2 建立電信業(yè)務總量的計量經濟模型。經初步分析,認為影響電信業(yè)務總量變化的主要因素是郵政業(yè)務總量、總人口數(shù)、市鎮(zhèn)人口占總人口的比重、人均GDP、居民人均消費水平。9個地區(qū)的樣本數(shù)據。試檢驗解釋變量之間的多重共線性。 機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3333頁頁樣本標號電信業(yè)務總量y郵政業(yè)務總量x1總人口數(shù)x2市鎮(zhèn)人口比重x3人均GDPx4人均消費水平
6、x511.51630.527511.58230.26371.8790.89622.26570.636711.71710.27632.2871.07033.82450.802611.85170.28142.9391.33145.92300.958911.98500.28623.9231.74658.75511.133412.11210.29044.8542.236612.08751.332912.23890.29375.5762.641712.68951.443412.36260.29926.0532.834822.64941.662812.48100.30406.3072.972931.323
7、81.984412.59090.30896.5343.143 電信業(yè)務總量及相關指標數(shù)據機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3434頁頁CoefficientStd. Errort-StatisticProb.C-124.5040456.2935-0.2728590.8027X135.7397216.047402.2271350.1123X216.9699847.308530.3587090.7436X3-300.2670390.8775-0.7681870.4983X4-5.3169439
8、.897531-0.5371990.6284X5-0.26962919.74999-0.0136520.9900R-squared0.991815Mean dependent var11.22609Adjusted R-squared0.978173S.D. dependent var10.00546S.E. of regression1.478215Akaike info criterion3.854269Sum squared resid6.555361Schwarz criterion3.985752Log likelihood-11.34421Hannan-Quinn criter.3
9、.570529F-statistic72.70254Durbin-Watson stat2.969320Prob(F-statistic)0.002496 EViews輸出結果機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3535頁頁(2)R2 = 0.9918,擬合優(yōu)度很高,但而每個回歸參數(shù)的t檢驗在統(tǒng)計上都不顯著,這符合多重共線性的“經典”特征,說明模型中可能存在嚴重的多重共線性。從EViews輸出結果看:(1)從經濟理論角度講,影響電信業(yè)務總量變化的主要因素中郵政業(yè)務總量與電信業(yè)務總量負相關;而
10、總人口數(shù)、市鎮(zhèn)人口占總人口的比重、人均GDP、居民人均消費水平應與電信業(yè)務總量正相關。但模型變量郵政業(yè)務總量、市鎮(zhèn)人口占總人口的比重、人均GDP、居民人均消費水平的系數(shù)估計出現(xiàn)符號錯誤,與預期不一致。根據經驗判別法,說明模型中可能存在嚴重的多重共線性。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3636頁頁(3)下面用Klein判別法進行分析。首先計算出解釋變量間的簡單相關系數(shù)矩陣: 因為其中x4與x5之間的簡單相關系數(shù)(0.9986)大于模型的樣本決定系數(shù)(0.9918),所以根據Klein判別法
11、,斷定模型中存在嚴重的多重共線性。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3737頁頁二、輔助回歸法二、輔助回歸法01 1221111)jjjjjkkxxxxxx1, 2,jk 設解釋變量為k個,即x1,x2, , xk。我們分別以其中的一個對其它所有的解釋變量進行回歸,得 k個回歸方程: 每個回歸方程求其決定系數(shù),不妨設為: 222212,jkRRRR 對于多元線性回歸模型來說,如果分別以每個解釋變量為被解釋變量,作與其他解釋變量的回歸,這稱為輔助回歸。 機動 目錄 上頁 下頁 返回 結束 2
12、022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第3838頁頁 在這些決定系數(shù)中尋其最大者,不妨設 Rj2最大,由第一節(jié)分析我們知道:多元線性回歸模型01 122iiikikiyxxxuxj的系數(shù)估計量的方差為2222221var()() (1)()(1)uujjijjjijjxxRxxR jxjx2jjRx由于度量了與其他解釋變量的線性相關程度,這var()j 增大的趨勢越快,說明變量間種相關程度越強,機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第
13、3939頁頁(1-Rj2)為自變量xj的容忍度(Tolerance)。211jjVIFR 多重共線性越嚴重,反之, 與其他解釋變量的線性相關程度越弱,說明變量間的多重共線性越弱。 為此,我們定義:jx 其倒數(shù)稱為方差擴大因子(Variance Inflation Factor)簡記為VIF),即: 經驗表明,當VIFj10時,自變量xj與其它自變量之間的多重共線性程度就非常大了,以至于足以影響到OLSE的穩(wěn)定性(方差增大) 。 機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4040頁頁注:注: 也可以
14、用k個自變量所對應的方差擴大因子的平均數(shù)來度量多重共線性。當模型中全部k個自變量所對應的方差擴大因子的平均數(shù)大于10時,就表明存在嚴重的多重共線性。用VIF去度量共線性也難免受到批評。如(4.5)所示, (jVar 2u與21() ,njijixx21(1)jjVIFR依賴于3個因子:21()njijixx2u一個高的VIF可被一個低的 或一個高的 所抵消。換句話說,一個高的VIF既不是導致高多重共線性和高的標準誤的必要條件,也不是其充分條件。因此,一個高的VIF度量出來的高多重共線性不一定是高的標準誤的原因。在所有這些討論中,高和低這兩個用語都是機動 目錄 上頁 下頁 返回 結束 2022-
15、3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4141頁頁相對而言的。在實際應用中,最好把 作為一個參考指標,與直觀判斷法中的其他特征聯(lián)合起來綜合判定。jVIF 在EViews中,不能直接計算解釋變量的方差擴大因子,而是需要根據VIF的定義式計算得到。55xVIF的對例4.2,計算解釋變量值的過程如下: 輔助回歸方程FZHG 的EViews輸出結果首先建立一個以x5為被解釋變量,其余解釋變量為解釋變量的輔助回歸方程,命名為“FZHG”:機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大
16、學統(tǒng)計學院計量經濟教研室第第4242頁頁Dependent Variable: X5CoefficientStd. Errort-StatisticProb. C4.61359311.319070.4075950.7044X10.4135410.3497081.1825300.3025X2-0.2789941.189533-0.2345410.8261X3-6.0041799.429268-0.6367600.5589X40.4716950.0846265.5738500.0051R-squared0.999055 Mean dependent var2.096556Adjusted R-sq
17、uared0.998109 S.D. dependent var0.860614S.E. of regression0.037423 Akaike info criterion-3.432872Sum squared resid0.005602 Schwarz criterion-3.323303Log likelihood20.44792 Hannan-Quinn criter.-3.669322F-statistic1056.707 Durbin-Watson stat1.817349Prob(F-statistic)0.000003機動 目錄 上頁 下頁 返回 結束 2022-3-620
18、22-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4343頁頁然后在主窗口命令行輸入:scalar vif =1/(1-FZHG.R2),該命令的含義是建立一個取值為此式的變量vif,其中R2就是2R 執(zhí)行后在主窗口的左下角狀態(tài)欄上會出現(xiàn)“vif succes-sfully created”的字樣,同時工作表中產生一個叫做vif的新變量,雙擊此變量,主窗口左下角的狀態(tài)欄上便會出現(xiàn):Scalar VIF =1057.707,這個數(shù)值很大,根據前面的準則可以認為解釋變量之間存在嚴重的多重共線性。三、特征值與病態(tài)指數(shù)三、特征值與病態(tài)指數(shù)k個自變量(不包含常數(shù)項)的樣
19、本數(shù)據構成一個nk的矩陣X,若自變量間存在共線性,則稱X為病態(tài)的。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4444頁頁 經驗判斷法則是:若K100,則認為多重共線性的程度很小;若100K1000,則認為多重共線性的程度中等或比較嚴重;若K1000,則認為多重共線性的程度非常嚴重。 為一個kk的方陣,其特征根由大到小排列 X X就存在非常小的特征根(并且有幾個共線關系,就有幾個很小的特征根)。則X X12,.,k 依次快速遞減,如果X為病態(tài)的,1kK定義病態(tài)數(shù)為:以及病態(tài)指數(shù):1kCIK機動 目錄
20、 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4545頁頁另一準則是,如果病態(tài)指數(shù)10CI30,認為多重共線性的程度中等,而如果CI30,則認為多重共線性的程度非常嚴重。四、法勒格勞伯(FarrarGlauber)檢驗 FarrarGlauber提出的檢驗是三種檢驗的結合提出的檢驗是三種檢驗的結合。第一種檢驗是。第一種檢驗是2 2檢驗,它檢驗多元回歸模型中所有檢驗,它檢驗多元回歸模型中所有解釋變量之間存在共線性及共線性的程度。第二種檢解釋變量之間存在共線性及共線性的程度。第二種檢驗是驗是F檢驗,用來確定哪些解釋
21、變量是多重共線的。檢驗,用來確定哪些解釋變量是多重共線的。第三種檢驗是第三種檢驗是t檢驗,用來找出造成解釋變量多重共檢驗,用來找出造成解釋變量多重共線性原因的是哪些變量。線性原因的是哪些變量。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4646頁頁第一,第一, 2 檢驗檢驗若若k個變量個變量x1, x2, xk滿足滿足rij=0, ij,i,j=1,2,k,則則說這說這k個變量是個變量是正交正交的。的?;舅枷耄夯舅枷耄?1121221112kkkkrrrrrrA設相關系數(shù)矩陣為:設相關系數(shù)矩陣為
22、:其中:其中:), 2 , 1,(kjiLLLrjjiiijij 由A可以看出,當解釋變量存在完全共線性時,|A|=0;當解釋變量互相正交時,|A|=1。因此可以認為當解釋變機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第4747頁頁量存在多重共線性時,0|A| t /2 ,則認為,則認為xj和和xi的偏相關系數(shù)是顯著的,也就是的偏相關系數(shù)是顯著的,也就是xj和和xi是是引起多重共線的原因。若引起多重共線的原因。若t t /2,則認為,則認為xj和和xi不是引起多不是引起多重共線的原因。重共線的原因。
23、構造統(tǒng)計量:構造統(tǒng)計量:計算計算xj與其余每一個解釋變量的偏相關系數(shù)與其余每一個解釋變量的偏相關系數(shù):), 2 , 1,()1)(1()1)(1(1kijirkiijjji機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5050頁頁 在結束我們關于偵察多重共線性的討論之際,我們強調指出,本節(jié)所討論的各種方法實質上都類似于垂釣,我們無法知道一種方法在任一特定的應用中是否靈驗,而且沒有更為有效的方法。因為多重共線性問題就出現(xiàn)在研究者對于一個給定的樣本施加不了多少控制的場合之中。機動 目錄 上頁 下頁 返回
24、結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5151頁頁第三節(jié)第三節(jié) 多重共線性問題的處理多重共線性問題的處理 如果通過檢驗,發(fā)現(xiàn)模型中存在嚴重的多重共線性,是不是一定不好呢?這要視模型的具體用途而定。如果模型只是用來進行預測,只要多重樣本決定系數(shù)(R2, )足夠大即可,無需消除多重共線性。但如果模型是用來進行結構分析和政策評價,由于多重共線性影響到每個自變量系數(shù)估計的正確性和有效性,所以應設法消除多重共線性的影響,確保模型的可用性。 2R下面介紹幾種常用的處理多重共線性問題的方法。 機動 目錄 上頁 下頁 返回 結束 2022
25、-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5252頁頁一、增加樣本觀測值一、增加樣本觀測值 如果多重共線性是由樣本引起的(例如測量誤差或偶然的樣本),但解釋變量的總體不存在多重共線性,則可以通過收集更多的觀測值增加樣本容量,避免或減弱多重共線性。對于時間序列資料就是增大觀測次數(shù),對于截面數(shù)據資料就是增加觀測對象,或者把時間序列資料與截面數(shù)據資料結合起來使用?,F(xiàn)利用兩個解釋變量的線性回歸模型 01 122iiiiyxxu作一說明。 由(4.8)可知,該模型參數(shù)的OLSE方差為:機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-
26、6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5353頁頁 將增加,將增加,r12趨向于總體相關系數(shù),是某一個趨向于總體相關系數(shù),是某一個確定的值,從而確定的值,從而 將會減少,這樣就會提將會減少,這樣就會提高估計值高估計值 的精度。的精度。從上兩式可以看出,當增大樣本容量時,則從上兩式可以看出,當增大樣本容量時,則,)(211 xxi222)(xxi)(),(21VarVar21,注意:注意: 當解釋變量總體存在多重共線性時,增加樣本容量當解釋變量總體存在多重共線性時,增加樣本容量也無助于減輕多重共線的程度。也無助于減輕多重共線的程度。 )1 ()()(21221
27、121rxxVariu)1()()(21222222rxxVariu機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5454頁頁二、刪去不重要的解釋變量二、刪去不重要的解釋變量 對待嚴重的多重共線性問題,一個最簡單的解決辦法就是刪去那些產生多重共線性、對因變量影響不大且人們認為不重要的解釋變量,使模型中剩下那些對因變量起重要作用的解釋變量,然后對僅包含重要解釋變量的模型應用普通最小二乘法。但應注意的是,由于把刪去的解釋變量對因變量的影響歸入隨機項中,有可能使隨機項不滿足零均值的假設,這時所得的參數(shù)估計值
28、可能是有偏的,即產生確定性偏倚。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5555頁頁三、利用三、利用“先驗先驗”信息信息 先驗信息既包括從經濟理論也包括從實際統(tǒng)先驗信息既包括從經濟理論也包括從實際統(tǒng)計資料中獲得的解釋變量之間關系的信息。如果計資料中獲得的解釋變量之間關系的信息。如果我們研究的回歸模型存在多重共線性,而線性相我們研究的回歸模型存在多重共線性,而線性相關的解釋變量之間的關系可由事前信息得到。則關的解釋變量之間的關系可由事前信息得到。則只要把事前知道的關系包含進回歸模型中,多重只要把事
29、前知道的關系包含進回歸模型中,多重共線性就會消失。共線性就會消失。例如柯布例如柯布道格拉斯生產函數(shù)為:道格拉斯生產函數(shù)為:其中,其中,Q為產出,為產出,K為資本,為資本,L為勞動力,為勞動力,A,為參數(shù)。將上式轉化為對數(shù)形式:為參數(shù)。將上式轉化為對數(shù)形式:uQAL K elnQ = lnA +lnK +lnL + u機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5656頁頁 因為資本和勞動力之間是高度相關的,所以因為資本和勞動力之間是高度相關的,所以lnK和和 lnL之間也是高度相關的,對數(shù)模型存在著
30、高度的多重之間也是高度相關的,對數(shù)模型存在著高度的多重共線性。共線性。 若根據先驗信息知道該地區(qū)規(guī)模報酬不變,則根據經濟學理論,知: 1利用利用 + =1將對數(shù)模型轉化為:將對數(shù)模型轉化為:uLKALylnlnln式中,式中,y/L為人均產出,為人均產出,K/L為人均資本量。上式即為為人均資本量。上式即為人均單位產出對人均資本量的一元回歸模型,多元回歸人均單位產出對人均資本量的一元回歸模型,多元回歸存在的多重共線性就被消除了。存在的多重共線性就被消除了。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5
31、757頁頁又如,消費函數(shù)為:又如,消費函數(shù)為: 01 122yxxu01122()3yxxu1223zxx01yzuy為消費支出,為消費支出,x1為收入,為收入,x2為財富。為財富。 就變?yōu)橐辉貧w模型,多重共線性就消除了。就變?yōu)橐辉貧w模型,多重共線性就消除了。1232從收入與財富的關系來看,是高度相關的。但根據大從收入與財富的關系來看,是高度相關的。但根據大量的統(tǒng)計數(shù)據可以總結出:量的統(tǒng)計數(shù)據可以總結出:將該關系式代入,則上式可化為:將該關系式代入,則上式可化為:令:令:則:則:機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大
32、學統(tǒng)計學院計量經濟教研室第第5858頁頁 這是先驗信息法的一個變種。其基本做法是:首先利用橫截面數(shù)據估計出部分參數(shù),再利用時序數(shù)據估計出另外的部分參數(shù),最后得到整個方程參數(shù)的估計。例:例:對于中國家用轎車需求模型012lnlnlnttttypIu四、橫截面數(shù)據與時間序列數(shù)據并用四、橫截面數(shù)據與時間序列數(shù)據并用目的是要估計價格彈性 和收入彈性 。12機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第5959頁頁 在時間序列分析中,價格和收入變量一般都有高度共線性的趨勢。托賓提出了解決此問題的一種方法:即如果
33、擁有關于消費者定點追蹤的橫截面數(shù)據,如城鎮(zhèn)或農村居民住戶調查數(shù)據,就可能可靠地估計收入彈性 。令收入彈性的橫截面估計為 ,就可以將前述時間序列回歸寫成2*2*01lntttypu*2lnlnttyyI其中 這樣就可以得到價格彈性的估計值。值得注意的是這里包含著假設:收入彈性的橫截面估計和從純粹時間序列分析中得到的估計是一樣的。當橫截面估計在不同截面之間沒有大的變化時這是一個值得考慮的方法。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6060頁頁 五、變量變換五、變量變換 有時可以通過對模型中變量進行
34、變換能夠實現(xiàn)降低共線性的目的。常用的變量變換方式有:1.使用相對指標。如原來的變量性質是總量指標,可轉換為人均指標或結構相對數(shù)(比重)指標等。經過這樣處理的數(shù)據有時可以降低共線性。2.將名義數(shù)據轉換為實際數(shù)據。將名義數(shù)據剔除價格影響后反映的信息在統(tǒng)計上常常是指純的物量的變化,不包含價格變動的影響,有助于描述現(xiàn)象之間真實的數(shù)量變化關系。因此在多數(shù)經濟分析中采用“實際”數(shù)據而不機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6161頁頁是名義數(shù)據,將名義數(shù)據轉換為實際數(shù)據有助于降低多重共線性。 需要指出,變
35、量數(shù)據的變換有時可得到較好的結果,但誰也無法保證一定可以得到很好的結果。3.將小類指標合并成大類指標。例如,如果模型中自變量包括工業(yè)增加值、建筑業(yè)增加值,由于二者之間呈現(xiàn)高度線性相關,可將其合并成第二產業(yè)增加值。這一合并有助于消除多重共線性。六、變換模型的形式六、變換模型的形式 有時作為解釋變量的某些經濟變量之間出現(xiàn)了高度相關,但當我們的研究目的是為了預測,并不需要區(qū)分機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6262頁頁 這些相關的解釋變量單獨對因變量的影響時,我們可以根據問題的需要對原模型加以
36、變形,使新的模型不再出現(xiàn)多重共線性。 例如,例如,某產品的銷售量y取決于其出廠價格x1、市場價格x2和市場總供應量x3,設定模型為:0112233lnlnlnlniiiiiyxxxu通常通常 x1 、 x2 是高度相關的,如果研究的目的主要是是高度相關的,如果研究的目的主要是為了預測某廠該產品銷售量,則可以用相對價格為了預測某廠該產品銷售量,則可以用相對價格x1/x2 代替代替x1 、 x2 對對y的影響,的影響, 采用采用機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6363頁頁ln(x1/x2)為
37、解釋變量,建立如下對數(shù)回歸模型:從而克服了x1與x2的相關性。101232lnlnlnxyxux 另外,也可以采用差分法,將原模型變形為差分模型形式進而減低多重共線性。因為一般而言,差分后變量之間的相關性要比差分前要弱得多,所以差分后的模型可以有效地降低出現(xiàn)共線性的可能性,此時可直接估計差分方程。但因為差分常常會丟失一些信息,差分模型的誤差項可能是序列相關的,會違背經典線性回歸模型的相關假設,在具體運用時要慎重。機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6464頁頁七、逐步回歸法七、逐步回歸法 為
38、了選出所有系數(shù)具有顯著性而且相互之間不存在嚴重多重共線性的自變量進入回歸方程,可以采用對所有子集回歸方程進行“全局比較”,尋找“最優(yōu)子集回歸”。 在實際應用中,我們經常使用的是一種簡化的方法,即“局部比較”方法,包括逐步剔除法、逐步添加法和逐步回歸法。局部比較”方法得到的回歸方程不一定是“最優(yōu)”的,而只是較好的。但由于需要的計算量遠遠小于“全局比較”方法,這些方法(尤其是逐步回歸法)所以還是得到了廣泛應用。 機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6565頁頁1.逐步剔除法(后退法,Backwa
39、rd Regression)。先建立一個包括所有可能自變量的回歸方程,然后逐個剔除作用不顯著的自變量,直到方程中所包括的自變量都有顯著作用為止。這種方法的缺點是,先剔除的變量不一定總是不顯著的,在剔除別的變量后,其作用有可能變得顯著,但整個過程是“只出不進”,最終有可能漏掉起重要作用的變量;2.逐步添加法(前進法,F(xiàn)orward Regression)。先從一個自變量開始,再將顯著變量逐個引入回歸方程。這個方法有一個問題是,先期引入的自變量,隨著其他變量的引人,由于多重共線性其作用可能變得不顯著了,但整個過程是“只進不出”,最終會引入作用不顯著的自變量;機動 目錄 上頁 下頁 返回 結束 20
40、22-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6666頁頁3.逐步回歸法(Stepwise Regression)。逐步回歸可以克服逐步剔除法和逐步添加法的缺陷。其基本思想是“有進有出”,根據各個自變量重要性的大小,每次選一個重要自變量進入回歸方程,同時將不顯著的變量剔除掉。這種方法要求首先估計被解釋變量對每一個解釋變量的回歸方程,這些回歸方程叫做基本回歸方程。對每一個基本回歸方程進行統(tǒng)計檢驗,并根據經濟理論分析這些回歸方程,從中選出最合適的基本回歸方程,然后再逐一加入其它的解釋變量,重新再作回歸。根據這個新加的解釋變量的邊際貢獻(樣本決定
41、系數(shù)的增加量)和標準差,并考察對每個回歸系數(shù)的影響,作如下的分析判斷:機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6767頁頁 第一,如果新加進的解釋變量改進了R2,并且其它回歸系數(shù)在統(tǒng)計上仍是顯著的,那么,就可以認為新加進去的解釋變量是有用的,作為模型中的解釋變量予以保留。 第二,如果加進去的解釋變量未能改進R2,對其它回歸系數(shù)也沒有影響,則不作為解釋變量。 第三、如果新加進的解釋變量不僅改進了R2,并且主要是顯著地影響了回歸系數(shù)的符號或數(shù)值,致使某些回歸系數(shù)達到不能接受的地步,則可斷言產生了嚴重
42、的多重共線性。 這個新加進的變量在經濟理論上可能十分重要,但由于它與其它解釋變量存在線性相關關系,使得普通最小機動 目錄 上頁 下頁 返回 結束 2022-3-62022-3-6山東財經大學統(tǒng)計學院計量經濟教研室山東財經大學統(tǒng)計學院計量經濟教研室第第6868頁頁二乘法估計失效。但舍棄的結果往往會不利于全面地、盡可能精確地描述經濟現(xiàn)象,而且還可能會帶來隨機項與模型中的解釋變量相關。這時再進行進一步檢驗,若相關的兩個解釋變量中一個可由另一個來解釋,則可以略去其中對因變量影響較小的一個,保留影響較大的一個。 如此繼續(xù)下去。一般地說,第t步是在未選的自變量中,選一個自變量與其他已經選擇的自變量一起所組成t元回歸方程,并使該方程有更大的2R個選入回歸方程的自變量是真正重要的,需要對每一個進入回歸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國脫水設備行業(yè)發(fā)展研究與產業(yè)戰(zhàn)略規(guī)劃分析評估報告
- 2025至2030中國脂質調節(jié)劑行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 重磅資訊!盲盒行業(yè)的下一個增長點:城市記憶產品解析
- 2025至2030中國羊毛角蛋白行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 2025至2030中國網絡訪問控制軟件行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 2025至2030中國網板行業(yè)深度研究及發(fā)展前景投資評估分析
- 2025至2030中國綠砂鑄造行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 2025至2030中國經導管二尖瓣修復裝置行業(yè)產業(yè)運行態(tài)勢及投資規(guī)劃深度研究報告
- 人教版六年級上冊數(shù)學提分復習計劃
- 彈性排班制度在提升醫(yī)院運營效率中的作用
- 【南通】2025年江蘇省通州區(qū)西亭鎮(zhèn)招聘民政協(xié)理員1人筆試歷年典型考題
- 2025年商務英語(BEC)中級考試真題卷:商務英語模擬面試與應對策略試題
- 光伏電站安全管理課件
- 編輯校對員筆試試題及答案
- 廣西玉林職業(yè)技術學院招聘教職人員考試真題2024
- 耳鼻喉護理教學查房
- 2025年七一黨課-作風建設永遠在路上學習教育黨課
- 遼寧省文體旅集團所屬兩家企業(yè)招聘筆試題庫2025
- 2025年江蘇省惠隆資產管理有限公司招聘筆試參考題庫含答案解析
- 消除“艾梅乙”醫(yī)療歧視-從我做起
評論
0/150
提交評論