版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第12章多重共線性Multi-Collinearity一、多重共線性的概念二、多重共線性的性質三、多重共線性的后果四、多重共線性的測定五、案例——1960至1982年期間美國的雞肉需求六、消除多重共線性的彌補措施多重共線性一、多重共線性的概念對于模型Yi=b0+b1X1i+b2X2i+…
+bkXki+mii=1,2,…,n其基本假設之一是解釋變量是互相獨立的。如果某兩個或多個解釋變量之間出現了相關性,則稱為多重共線性(Multicollinearity)。如果存在c1X1i+c2X2i+…+ckXki=0
i=1,2,…,n其中:ci不全為0,則稱為解釋變量間存在完全共線性(perfect
multicollinearity)。如果存在c1X1i+c2X2i+…+ckXki+vi=0
i=1,2,…,n其中ci不全為0,vi為隨機誤差項,則稱為近似共線性(
approximate
multicollinearity)或交互相關(intercorrelated)。注意:完全共線性的情況并不多見,一般出現的是在一定程度上的共線性,即近似共線性。對widgets的需求491298297.5452296294.9443294293.5394292292.8385290290.2376288289.7347286285.8338284284.6309282281.12910280278.8Y(數量)X2
X3
X4(價格/美元)
(每周收入/美元)(每周收益/美元)二、多重共線性的性質Yi=A1+A2X2i+A3X3i+miYi=B1+B2X2i+B3X4i+mi(12-1)(12-2)(12-1)中,計算機拒絕估計回歸。因為X3i=300-2X2i,
R2=
r2
=1.00
(12-3)收入變量X3與價格變量X2完全線性相關,也即存在完全共線性。(12-3)代入(12-1),Yi=A1+A2X2i+A3X3i+mi=(A1+300A3)
+
(A2-
2A3)
X2i+mi=
C1+C2X2i
+mi
(12-4)1、完全多重共線性的情況這是Y對X2的一個簡單的雙變量回歸,雖然可以估計
方程并獲得C1和C2的估計值,但無法求得原始參數A1,A2和A3的估計值。^Yi
=
4.9667
-
2.1576
X
2ise=(0.746)(0.1203)t=(66.538)(-17.935)r2=0.9757(10-7)求得C1
=4.9667,C2
=-2.1576結論:當解釋變量之間存在完全線性相關或者完全多重共線性時,我們不可能獲得所有參數的惟一估計值,也不能根據某一樣本做任何統(tǒng)計推論(假設檢驗)。(12-8)(1)與預期相同,價格系數為負,且(12-7)與(12-8)之間數值差異不大。(2)從(12-7)R2=0.9757
到(10-8)R2
=0.9778,R2增加量只有0.0021,是統(tǒng)計不顯著的。(3)收入(收益)變量是統(tǒng)計不顯著的,且符號錯誤。對于大多數商品來說,收入對商品需求有正面影響。(4)價格和收益集體地或聯合地對商品的需求有顯著影響。(12-2)中回歸結果如下:^Yi
=14.537
-
2.7975X
2i
-
0.3191X
4ise=(120.06)(0.8122)(0.4003)t=(1.2107)(-3.4444)(-0.7971)R2=0.9778結果分析:2、接近或者不完全多重共線性的情形如何解釋這些現象:作X2
、X4關系圖從下面的回歸方程可更清楚看出上面結果X4i=299.92-2.0055X2i
+
eise=(0.6748)(0.1088)t=(444.44)(-18.44)r2=0.9770從圖中可以看到:盡管價格和收益不完全相關,兩個變量間卻存在著高度依賴關系二、多重共線性的后果1、多重共線性的理論后果(僅考慮不完全多重共線性)(1)即使在接近共線性的情況下,普通最小二乘法估計量仍然是無偏的。雖然是無偏的,但無偏性是一個重復抽樣的性質。即保持X不變,如果得到一些樣本并用普通最小二乘法計算這些樣本估計量,則其平均值收斂于估計量的真實值,但這并不是某個樣本估計值的性質。(2)接近共線性也并未破壞普通最小二乘估計量的最小方差性。在所有線性無偏估計量中,普通最小二乘法估計量的方差最小,但這并不意味著任何給定的樣本中普通最小二乘法估計量的方差會很?。ㄅc估計量的值本身相比而言)。(3)即使變量X與總體不線性相關,但卻可能與某一樣本線性相關多重共線性本質上是一個樣本(回歸)現象,在假定概率分布函數時,模型中所有變量Xs都對應變量Y有獨立的或單獨的影響。但在用某個樣本估計總體PRF時,部分或者所有變量Xs高度線性以至于無法區(qū)分其對于對應變量Y的影響。普通最小二乘法估計量的方差和標準差較大,從而普通最小二乘法估計量的精確度下降。置信區(qū)間變寬。由于標準差較大,所以總體參數的置信區(qū)間變大。t值不顯著。當存在高度共線時,由于估計的標準差急劇增加,因而使得t值變小。因此,我們會自然接受零假設,即真實的總體系數為零。2、多重共線性的實際后果(僅考慮不完全多重共線性)R2值較高,但t值并不都是統(tǒng)計顯著的。普通最小二乘估計量及其標準差對出數據的微小變化非常敏感,它們趨于不穩(wěn)定。回歸系數符號有誤。難以衡量各個解釋變量對回歸平方和(ESS)或者R2貢獻。多重共線性檢驗的任務是:檢驗多重共線性是否存在;測度任何給定樣本的多重共線性程度。三、多重共線性的測定測定多重共線性存在與否的線索:R2較高但t值顯著的不多。這是多重共線性的“經典”特征。解釋變量兩兩高度相關。這一標準并不十分可靠,因為解釋變量兩兩相關系數可能較低(表明無高度共線性),但是卻有可能存在共線性,因為t值很少是統(tǒng)計顯著的。檢驗解釋變量相互之間的樣本相關系數。解釋兩兩相關系數和偏相關系數。(4)從屬(subsidiary)或者輔助(auxiliary)回歸。多重共線性是由于一個或多個解釋變量是其他解釋變量的線性(或接近線性)組合,那么檢驗模型中哪個變量與其他變量高度共線性的方法就是作每個變量對其他剩余變量的回歸并計算相應的R2
值。其中每一個回歸都被稱作是從屬或者輔助回歸,從屬于Y對所有變量的回歸。(5)方差膨脹因素(the
variance
inflationfactor)Var(b2
)=
σ2/[∑x2i
(1-
R2
)]2
2Var(b3
)=
σ2/[∑x3i
22
(1-
R
2
)]2
2膨脹因素(VIF),VIF=1/(1-R
2
),b
的方差不僅僅取決于VIF,2i而且還取決于ui的方差s
2和X2的方差∑x
2。所以,輔助回歸方程中的Ri2可能只是多重共線性的一個表面指示器。較高的Ri2既不是較高標準差的必要條件也不是充分條件。多重共線性的好與壞取決于研究目的:如果研究是為了用模型來預測解釋變量的未來均值,則多重共線性本身未必是一件壞事。如果研究不僅僅是為了預測,而且還要可靠地估計所選模型的各個參數,則嚴重的共線性將是一件壞事,因為它將導致估計量的標準差增大。多重共線性的好與壞四、案例——1960至1982年期間美國的雞肉需求表11-9給出了1960至1982年期間的有關數據:平均每人雞肉雞肉消費量(y),每人實際(既通貨膨脹調整后的)可支配收入(X2
),雞肉的實際零售價格(X3
),豬肉的實際零售價格(X4),豬肉的實際零售價格(X5)從理論上說,商品的需求通常是消費者實際收入、該商品實際價格以及競爭商品或互補商品的實際價格函數。估計的實際需求如下:應變量(y)是平均每人雞肉消費量的自然對數。由于我們擬合的是對數-線性需求函數,因此,所有的系數都是y對應x變量的偏彈性(partialelasticities).因而,需求的收入彈性約為0.34,需求的自價彈性約為-0.51,需求(豬肉)的交叉彈性約為0.15,需求(牛肉)的交叉彈性約為0.09?;貧w結果表明:需求的收入和自身價格彈性各自都是統(tǒng)計顯著的,但兩個交叉彈性則不是顯著的。由于收入彈性小于1,所以雞肉并非是奢侈消費品。雞肉的需求對于其
自身價格是缺乏彈性的,因為其彈性系數的絕對值小于1。盡管兩個交叉價格彈性是正的,表明其它兩種肉類與雞肉是相互競爭的,但是它們卻不是統(tǒng)計顯著的。因而,看來雞肉的需求并不受豬肉和牛肉價格變化的影響。相關矩陣:盡管解釋變量之間兩兩相關系數值較高,但并不表明需求函數中一定存在著共線性,只是有可能存在。雞肉需求需求函數共線性的檢驗輔助回歸:在對每個解釋變量與其他剩余解釋變量進行回歸時,所有值都是統(tǒng)計顯著的,表明回歸方程中的每個解釋變量都與其它解釋變量高度共線性。因此,很有可能我們在方程(10-15)中沒有發(fā)現豬肉和牛肉價格變量的系數在統(tǒng)計上是顯著的。但是,這與我們先前討論過的高度多重共線性的理論后果是一致的。注意,盡管存在高度共線性,但是實際收入和自身價格變量的系數卻是統(tǒng)計上顯著的。這一例子表明,在存在高度共線性的情形下,判斷一個解釋變量是否獨自顯著時,我們應該特別小心。我們將把這一例子帶入下一節(jié),在該節(jié)我們將考慮多重共線性的補救措施。找出引起多重共線性的解釋變量,將它從模型中刪掉。以逐步回歸法得到最廣泛的應用。注意:這時,剩余解釋變量參數的經濟含義和數值都發(fā)生了變化。建議不要僅僅因為共線性很重就從一個經濟上可行的模型中刪除變量。五、消除多重共線性的彌補措施1、從模型中刪掉不重要的解釋變量2、獲取額外的數據或者新的樣本通過獲得額外的數據——增加樣本的容量——就能夠削減共線性的程度。例如,Var(b3
)=
σ2/[∑x3i
(1-
R2
)]2
2對于給定的σ2和R2,如果X3樣本容量增加,3i
3∑x
2通常將會增加,結果b
的方差將會減小,標準差也隨之減小。3、重新考慮模型有些時候,所選模型并未加以仔細考慮——或許是一些重要的變量被省略了,或許是沒有正確地
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 渾源縣2024-2025學年數學六上期末教學質量檢測模擬試題含解析
- 雞西市麻山區(qū)2024-2025學年四年級數學第一學期期末質量檢測試題含解析
- 員工績效管理中的PDCA循環(huán)方法研究
- 初中作文:這一次我沒有留戀
- 合同法 課件全套 曾憲義 第1-31章 合同與合同法導論-思考題
- 部編版二年級語文上冊《葡萄溝》教學課件2篇9
- 大班科學鳥類課件
- 怎么下載課件步驟
- 2021-2022學年上海市寶山區(qū)新華實驗學校八年級(上)月考數學試卷(10月份) (含解析)
- 江西省高安市重點名校2024年中考數學全真模擬試卷含解析
- 2024-2030年中國對香豆酸市場運行監(jiān)測及發(fā)展行情走勢預測研究報告
- 湖北省省直轄縣級行政單位仙桃、天門、潛江九年級聯考協(xié)作體聯考2024-2025學年九年級上學期9月月考數學試題
- 2024年江西省高考地理試卷真題(含答案)
- 河南省信陽市2024-2025學年八年級上學期數學第一次月考試卷1
- 軟件系統(tǒng)維護服務合同范本2024年
- 玉蘭花開香滿園(2023年四川瀘州中考語文試卷散文閱讀題及答案)
- 電動汽車充電樁安裝檢修賽項考試題庫500題(含答案)
- 新生兒常見的生理現象2
- 愛國主義教育法答題題庫
- 2024年中考物理試題分類匯編:作圖題(含解析)
- 《小網兜 我來編》(教學設計)浙教版四年級上冊綜合實踐活動
評論
0/150
提交評論