現(xiàn)代統(tǒng)計分析方法與應(yīng)用課件 第六章 違背基本假設(shè)的回歸分析_第1頁
現(xiàn)代統(tǒng)計分析方法與應(yīng)用課件 第六章 違背基本假設(shè)的回歸分析_第2頁
現(xiàn)代統(tǒng)計分析方法與應(yīng)用課件 第六章 違背基本假設(shè)的回歸分析_第3頁
現(xiàn)代統(tǒng)計分析方法與應(yīng)用課件 第六章 違背基本假設(shè)的回歸分析_第4頁
現(xiàn)代統(tǒng)計分析方法與應(yīng)用課件 第六章 違背基本假設(shè)的回歸分析_第5頁
已閱讀5頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心1第6章違背根本假設(shè)的回歸分析§6.1關(guān)于異方差性問題§6.2關(guān)于自相關(guān)性問題§6.3關(guān)于多重共線性問題§6.4異常值與強影響值目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心2第6章違背根本假設(shè)的回歸分析目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心3§6.1關(guān)于異方差性問題一、異方差產(chǎn)生的原因由于實際問題是錯綜復(fù)雜的,因而在建立具體問題的回歸分析模型時,經(jīng)常會出現(xiàn)某一因素或一些因素隨著解釋變量觀測值的變化而對被解釋變量產(chǎn)生不同的影響,導(dǎo)致隨機誤差項產(chǎn)生不同方差。通過下面的幾個例子,我們可以了解產(chǎn)生異方差性的背景和原因。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心4§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心5§6.1關(guān)于異方差性問題利用平均數(shù)作為樣本數(shù)據(jù),也容易出現(xiàn)異方差性。因為正態(tài)分布的普遍性,許多經(jīng)濟變量之間的關(guān)系遵從正態(tài)分布。引起異方差的原因很多,但樣本數(shù)據(jù)為截面數(shù)據(jù)時容易出現(xiàn)異方差性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心6§6.1關(guān)于異方差性問題二、異方差性帶來的問題

當(dāng)一個回歸問題存在異方差性時,如果仍用普通最小二乘法估計未知參數(shù),將引起嚴重后果,特別是最小二乘估計量不再具有最小方差的優(yōu)良性,即最小二乘估計的有效性被破壞了。

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心7§6.1關(guān)于異方差性問題當(dāng)存在異方差時,普通最小二乘估計存在以下問題:(1)參數(shù)估計值雖是無偏的,但不是最小方差線性無偏估計;(2)參數(shù)的顯著性檢驗失效;(3)回歸方程的應(yīng)用效果極不理想。

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心8§6.1關(guān)于異方差性問題

三、異方差性的檢驗關(guān)于異方差性的檢驗,統(tǒng)計學(xué)家們進行了大量的研究,提出的診斷方法已有十多種,但沒有一個公認的最優(yōu)方法。本書介紹殘差圖分析法與等級相關(guān)系數(shù)檢驗法二種常用方法。〔一〕殘差圖分析法目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心9§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心10§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心11§6.1關(guān)于異方差性問題

〔二〕等級相關(guān)系數(shù)法等級相關(guān)系數(shù)檢驗法又稱斯皮爾曼(Spearman)檢驗〔見參考文獻[5]〕,是一種應(yīng)用較廣泛的方法。這種檢驗方法在樣本容量大或小時都可應(yīng)用。進行等級相關(guān)系數(shù)檢驗通常有三個步驟。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心12§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心13§6.1關(guān)于異方差性問題

例6.3設(shè)某地區(qū)一些企業(yè)的廣告投入與銷售收入的橫截面樣本數(shù)據(jù)〔單位:萬元〕如表6.1所示。(1)用普通最小二乘法建立銷售收入y與廣告投入x的回歸方程,并畫出殘差散點圖;(2)診斷該問題是否存在異方差;目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心14§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心15§6.1關(guān)于異方差性問題

從殘差圖看出,誤差項具有明顯的異方差性,誤差隨著x的增加而增加。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心16§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心17§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心18§6.1關(guān)于異方差性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心19§6.1關(guān)于異方差性問題

對一般情況,等級相關(guān)系數(shù)可以如實反映呈單調(diào)趨勢變動的變量間的相關(guān)性,而簡單相關(guān)系數(shù)只能反映呈直線趨勢變動的變量間的相關(guān)性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心20§6.1關(guān)于異方差性問題四、加權(quán)最小二乘估計當(dāng)我們所研究的問題存在異方差性時,線性回歸模型的根本假定就被違反了。此時,就不能用普通最小二乘法進行參數(shù)估計,必須尋求適當(dāng)?shù)难a救方法,對原來的模型進行變換,使變換后的模型滿足同方差性假設(shè),然后進行模型參數(shù)的估計,就可得到較為理想的回歸模型。消除異方差性的方法通常有加權(quán)最小二乘法,Box-Cox變換法,方差穩(wěn)定化變換法(參見參考文獻[6])。下面結(jié)合例6.3介紹加權(quán)最小二乘法。加權(quán)最小二乘法(WeightedLeastSquare,簡記為WLS)是一種最常用的消除異方差性的方法。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心21§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心22§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心23§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心24§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心25§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心26§6.1關(guān)于異方差性問題五、尋找最優(yōu)權(quán)函數(shù)利用SPSS軟件可以確定〔6.6〕式冪指數(shù)m的最優(yōu)取值。對例6.3的數(shù)據(jù),依次點選Statistics-Regression-WeightEstimation進入估計權(quán)函數(shù)對話框,默認的冪指數(shù)m的取值為m=-2.0,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0,這一默認值可以更改。先將因變量y與自變量x選入各自的變量框,再把x選入Weight變量框,冪指數(shù)〔Power〕取默認值,計算結(jié)果如下〔格式略有變動〕:目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心27§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心28§6.1關(guān)于異方差性問題對異方差問題的處理至今沒有什么更好的方法,一些方法的處理效果往往不甚明顯,所以此例能有所改進也就不錯了。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心29§6.1關(guān)于異方差性問題六、多元加權(quán)最小二乘〔1〕多元加權(quán)最小二乘法目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心30§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心31§6.1關(guān)于異方差性問題〔2〕權(quán)函數(shù)確實定方法目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心32§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心33§6.1關(guān)于異方差性問題仿照例6.3,用WeightEstimate估計冪指數(shù)m,得m的最優(yōu)值為m=1.5,局部輸出結(jié)果為目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心34§6.1關(guān)于異方差性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心35§6.2

關(guān)于自相關(guān)性問題這里的自相關(guān)現(xiàn)象不是指兩個或兩個以上的變量之間的相關(guān)關(guān)系,而指的是一個變量前后期數(shù)值之間存在的相關(guān)關(guān)系。本節(jié)主要討論自相關(guān)現(xiàn)象產(chǎn)生的背景和原因,自相關(guān)現(xiàn)象對回歸分析帶來的影響,診斷自相關(guān)是否存在的方法,以及如何克服自相關(guān)現(xiàn)象帶來的影響。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心36§6.2關(guān)于自相關(guān)性問題

一、自相關(guān)的背景及其原因在實際問題的研究中,經(jīng)常遇到的時間序列出現(xiàn)正的序列相關(guān)的情形。產(chǎn)生序列自相關(guān)的背景及其原因通常有以下幾個方面。

1.遺漏關(guān)鍵變量時會產(chǎn)生序列的自相關(guān)性。2.經(jīng)濟變量的滯后性會給序列帶來自相關(guān)性。3.采用錯誤的回歸函數(shù)形式也可能引起自相關(guān)性。4.蛛網(wǎng)現(xiàn)象(Cobwebphenomenon)可能帶來序列的自相關(guān)性。5.因?qū)?shù)據(jù)加工整理而導(dǎo)致誤差項之間產(chǎn)生自相關(guān)性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心37§6.2關(guān)于自相關(guān)性問題二、自相關(guān)性帶來的問題當(dāng)一個線性回歸模型的隨機誤差項存在序列相關(guān)時,就違背了線性回歸方程的根本假設(shè),如果仍然直接用普通最小二乘法估計未知參數(shù),將會產(chǎn)生嚴重后果,一般情況下序列相關(guān)性會帶來以下問題。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心38§6.2關(guān)于自相關(guān)性問題1.參數(shù)的估計值不再具有最小方差線性無偏性。2.均方誤差MSE可能嚴重低估誤差項的方差。3.容易導(dǎo)致對t值評價過高,常用的F檢驗和t檢驗失效。如果無視這一點,可能導(dǎo)致得出回歸參數(shù)統(tǒng)計檢驗為顯著,但實際上并不顯著的嚴重錯誤結(jié)論。5.如果不加處理地運用普通最小二乘法估計模型參數(shù),用此模型進行預(yù)測和結(jié)構(gòu)分析將會帶來較大的方差甚至錯誤的解釋。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心39§6.2關(guān)于自相關(guān)性問題三、自相關(guān)性的診斷由于隨機擾動項存在序列相關(guān)時給普通最小二乘法的應(yīng)用帶來了非常嚴重的后果,因此,如何診斷隨機擾動項是否存在序列相關(guān)就成為一個極其重要的問題?!惨弧硤D示檢驗法目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心40§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心41§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心42§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心43§6.2關(guān)于自相關(guān)性問題〔二〕自相關(guān)系數(shù)法目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心44§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心45§6.2關(guān)于自相關(guān)性問題〔三〕D.W檢驗D.W檢驗是J.Durbin和于1951年提出的一種適用于小樣本量的一種檢驗方法。D.W檢驗驗只能用于檢驗隨機擾動項具有一階自回歸形式的序列相關(guān)問題。這種檢驗方法是建立計量經(jīng)濟學(xué)模型中最常用的方法,一般的計算機軟件都可自動產(chǎn)生出D.W值。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心46§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心47§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心48§6.2關(guān)于自相關(guān)性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心49§6.2關(guān)于自相關(guān)性問題上述判別準那么可用圖6.4表示,可看到D.W=2的左右,有一個較大的無自相關(guān)區(qū)域,所以,通常當(dāng)D.W的值在2左右時,那么無須查表,即可放心地認為模型不存在序列的自相關(guān)性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心50§6.2關(guān)于自相關(guān)性問題D.W檢驗的缺點和局限性。檢驗有一個不能確定的區(qū)域,一旦D.W值落在這個區(qū)域,就無法判斷。這時,只有增大樣本容量或選取其他方法。統(tǒng)計量的上、下界表要求n>15,這是因為樣本如果再小,利用殘差就很難對自相關(guān)的存在性作出比較正確的診斷。檢驗不適應(yīng)隨機項具有高階序列相關(guān)的檢驗。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心51§6.2關(guān)于自相關(guān)性問題

四、自相關(guān)問題的處理方法當(dāng)一個回歸模型存在序列相關(guān)性時,首先要查明序列相關(guān)產(chǎn)生的原因。如果是回歸模型選用不當(dāng),那么應(yīng)改用更適當(dāng)?shù)幕貧w模型;如果是缺少重要的自變量,那么應(yīng)增加自變量;如果以上兩種方法不能消除序列相關(guān)性,那么需采用差分法、自回歸法、移動平均法,或者這些方法的綜合運用等方法處理.本書在此介紹兩種簡單的方法,迭代法和差分法。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心52§6.2關(guān)于自相關(guān)性問題

〔一〕迭代法以一元線性回歸模型為例,設(shè)一元線性回歸模型的誤差項存在一階自相關(guān)目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心53§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心54§6.2關(guān)于自相關(guān)性問題

模型〔6.24〕式有獨立隨機誤差項,它已滿足線性回歸模型的根本假設(shè),用普通最小二乘法估計的參數(shù)估計量具有通常的優(yōu)良性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心55§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心56§6.2關(guān)于自相關(guān)性問題

〔二〕差分法差分法就是用增量數(shù)據(jù)代替原來的樣本數(shù)據(jù),將原來的回歸模型變?yōu)椴罘中问降哪P?。一階差分法通常適用于原模型存在較高程度的一階自相關(guān)的情況。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心57§6.2關(guān)于自相關(guān)性問題

對〔6.26〕式這樣不帶有常數(shù)項的回歸方程仍用最小二乘法,但它與前邊的帶有常數(shù)項的情形稍有不同,它是回歸直線過原點的回歸方程。根據(jù)第4章習(xí)題過原點的回歸的最小二乘估計得:一階差分法的應(yīng)用條件是自相關(guān)系數(shù)ρ=1,在實際應(yīng)用中,ρ接近1時我們就采用差分法而不用迭代法,這有兩個原因。第一,迭代法需要用樣本估計自相關(guān)系數(shù)ρ,對ρ的估計誤差會影響迭代法的使用效率;第二,差分法比迭代法簡單,人們在建立時序數(shù)據(jù)的回歸模型時,更習(xí)慣于用差分法。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心58§6.2關(guān)于自相關(guān)性問題

〔三〕實例分析目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心59§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心60§6.2關(guān)于自相關(guān)性問題

1.用迭代法消除自相關(guān)。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心61§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心62§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心63§6.2關(guān)于自相關(guān)性問題

2.用一階差分法消除自相關(guān)。

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心64§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心65§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心66§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心67§6.2關(guān)于自相關(guān)性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心68§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心69§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心70§6.3關(guān)于多重共線性問題

一、多重共線性產(chǎn)生的背景解釋變量之間完全不相關(guān)的情形是非常少見的,尤其是研究某個經(jīng)濟問題時,涉及的自變量較多,我們很難找到一組自變量,它們之間互不相關(guān),而且它們又都對因變量有顯著影響。這樣的一組自變量甚至是找不到的??陀^地說,某一經(jīng)濟現(xiàn)象,涉及到多個影響因素時,這多個影響因素之間大都有一定的相關(guān)性。當(dāng)它們之間的相關(guān)性較弱時,我們一般就認為符合多元線性回歸模型設(shè)計矩陣的要求;當(dāng)這一組變量間有較強的相關(guān)性時,我們就認為是一種違背多元線性回歸模型根本假設(shè)的情形。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心71§6.3關(guān)于多重共線性問題

當(dāng)我們所研究的經(jīng)濟問題涉及到時間序列資料時,由于經(jīng)濟變量隨時間往往存在共同的變化趨勢,使得它們之間就容易出現(xiàn)共線性。例如,我國近年來的經(jīng)濟增長態(tài)勢很好,經(jīng)濟增長對各種經(jīng)濟現(xiàn)象都產(chǎn)生影響,使得多種經(jīng)濟指標相互密切關(guān)聯(lián)。如果我們要研究我國居民消費狀況,影響居民消費的因素很多,一般有職工平均工資、農(nóng)民平均收入、銀行利率、全國零售物價指數(shù)、國債利率、貨幣發(fā)行量、儲蓄額、前期消費額等,這些因素顯然既對居民消費產(chǎn)生重要影響,它們之間又有著很強的相關(guān)性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心72§6.3關(guān)于多重共線性問題

對于許多利用截面數(shù)據(jù)建立回歸方程的問題常常也存在自變量高度相關(guān)的情形。例如,我們以企業(yè)的截面數(shù)據(jù)為樣本估計生產(chǎn)函數(shù),由于投入要素資本K,勞動力投入L,科技投入S,能源供給E等都與企業(yè)的生產(chǎn)規(guī)模有關(guān),所以它們之間存在較強的相關(guān)性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心73§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心74§6.3關(guān)于多重共線性問題

在研究社會、經(jīng)濟問題時,因為問題本身的復(fù)雜性,涉及的因素很多,但在建立回歸模型時,往往由于研究者認識水平的局限性,很難在眾多因素中找到一組互不相關(guān)又對因變量y有顯著影響的變量,不可防止地出現(xiàn)所選自變量相關(guān)的情形。當(dāng)自變量之間有較強相關(guān)性時,會給回歸模型的參數(shù)估計帶來什么樣的后果?二、多重共線性對回歸模型的影響目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心75§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心76§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心77§6.3關(guān)于多重共線性問題

當(dāng)自變量間的相關(guān)性從小到大增加時,估計量的方差會增大得更快。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心78§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心79§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心80§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心81§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心82§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心83§6.3關(guān)于多重共線性問題

以上的分析說明,如果利用模型去作經(jīng)濟結(jié)構(gòu)分析,要盡可能防止多重共線性;如果是利用模型去作經(jīng)濟預(yù)測,只要保證自變量的相關(guān)類型在未來時期中保持繼續(xù)不變,即未來時期自變量間仍具有當(dāng)初建模時數(shù)據(jù)的聯(lián)系特征,即使回歸模型中包含有嚴重多重共線性的變量也可以得到較好的預(yù)測結(jié)果;如果不能保證自變量的相關(guān)類型在未來時期中保持繼續(xù)不變,那么多重共線性就會對回歸預(yù)測產(chǎn)生嚴重的影響。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心84§6.3關(guān)于多重共線性問題

三、多重共線性的診斷一般情況下,當(dāng)回歸方程的解釋變量之間存在著很強的線性關(guān)系,回歸方程的檢驗高度顯著時,有些與因變量y的簡單相關(guān)系數(shù)絕對值很高的自變量,其回歸系數(shù)不能通過顯著性檢驗,甚至出現(xiàn)有的回歸系數(shù)所帶符號與實際經(jīng)濟意義不符,這時就認為變量間存在著多重共線性。近年來,關(guān)于關(guān)于多重共線性問題及多重共線性嚴重程度的度量是統(tǒng)計學(xué)家們討論的熱點,已經(jīng)提出了許多可行的判斷方法,下面我們只介紹兩種主要方法:方差擴大因子法;特征根判定法目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心85§6.3關(guān)于多重共線性問題(1)方差擴大因子法

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心86§6.3關(guān)于多重共線性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心87§6.3關(guān)于多重共線性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心88§6.3關(guān)于多重共線性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心89§6.3關(guān)于多重共線性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心90§6.3關(guān)于多重共線性問題以下用SPSS軟件診斷例5.3中國民航客運量一例中的多重共線性問題。在線性回歸對話框的Statitics選項框中點選Collinearitydiagnostic共線性診斷選項,然后做回歸。輸出以下結(jié)果:目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心91§6.3關(guān)于多重共線性問題一般情況下,當(dāng)一個回歸方程存在嚴重的多重共線性時,有假設(shè)干個自變量所對應(yīng)的方差擴大因子大于10,這個回歸方程多重共線性的存在就是方差擴大因子超過10的這幾個變量引起的,說明這幾個自變量間有一定的多重共線性的關(guān)系存在。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心92§6.3關(guān)于多重共線性問題(2)特征根判定法1、特征根分析2、條件數(shù)

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心93§6.3關(guān)于多重共線性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心94§6.3關(guān)于多重共線性問題對例5.3中國民航客運量的例子,用SPSS軟件計算出特征根與條件數(shù)如下:目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心95§6.3關(guān)于多重共線性問題目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心96§6.3關(guān)于多重共線性問題(3)直觀判定法

上述方法是為了診斷共線性是否存在的專門方法,相對這幾種方法,還有一些在建模過程中順便直觀判斷的非正規(guī)方法。

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心97§6.3關(guān)于多重共線性問題1.當(dāng)增加或剔除一個自變量,或者改變一個觀測值時,回歸系數(shù)的估計值發(fā)生較大變化,我們就認為回歸方程存在嚴重的多重共線性。2.從定性分析認為,一些重要的自變量在回歸方程中沒有通過顯著性檢驗時,可初步判斷存在著嚴重的多重共線性。3.有些自變量的回歸系數(shù)所帶正負號與定性分析結(jié)果違背時,我們認為存在多重共線性問題。4.自變量的相關(guān)矩陣中,自變量間的相關(guān)系數(shù)較大時,我們認為可能會出現(xiàn)多重共線性問題。5.一些重要的自變量的回歸系數(shù)的標準誤差較大時,我們認為可能存在多重共線性。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心98§6.3關(guān)于多重共線性問題

四、消除多重共線性的方法當(dāng)通過某種檢驗,發(fā)現(xiàn)解釋變量中存在嚴重的多重共線性時,我們就要設(shè)法消除這種共線性。消除多重共線性的方法很多,常用的有下面幾種?!?〕剔除一些不重要的解釋變量通常在經(jīng)濟問題的建模中,由于我們認識水平的局限,容易考慮過多的自變量。當(dāng)涉及自變量較多時,大多數(shù)回歸方程都受到多重共線性的影響。這時,最常用的方法是首先用第五章的方法做自變量的選元,舍去一些自變量。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心99§6.3關(guān)于多重共線性問題

當(dāng)回歸方程中的全部自變量都通過顯著性檢驗后,回歸方程中仍然存在嚴重的多重共線性,有幾個變量的方差擴大因子大于10,我們可把方差擴大因子最大者所對應(yīng)的自變量首先剔除,再重新建立回歸方程,如果仍然存在嚴重的多重共線性,那么再繼續(xù)剔除方差擴大因子最大者所對應(yīng)的自變量,直到回歸方程中不再存在嚴重的多重共線性為止。有時,根據(jù)所研究的問題的需要,當(dāng)回歸方程中仍然存在嚴重的多重共線性時,也可以首先剔除方差擴大因子最大者所對應(yīng)的自變量,依次剔除,直到消除了多重共線性為止,然后再做自變量的選元。或者根據(jù)所研究問題的經(jīng)濟意義,決定保存或剔除某自變量。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心100§6.3關(guān)于多重共線性問題

在選擇回歸模型時,可以將回歸系數(shù)的顯著性檢驗、方差擴大因子VIF的多重共線性檢驗與自變量的經(jīng)濟含義結(jié)合起來考慮,以引進或剔除變量。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心101§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心102§6.3關(guān)于多重共線性問題

目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心103§6.3關(guān)于多重共線性問題

〔2〕增大樣本容量建立一個實際經(jīng)濟問題的回歸模型,如果所收集的樣本數(shù)據(jù)太少,也容易產(chǎn)生多重共線性。增大樣本容量也是消除多重共線性的一個途徑。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心104§6.3關(guān)于多重共線性問題

在實踐中,當(dāng)我們所選的變量個數(shù)接近樣本容量n時,自變量間就容易產(chǎn)生共線性。所以我們在運用回歸分析研究經(jīng)濟問題時,要盡可能使樣本容量n遠大于自變量個數(shù)p。增大樣本容量的方法在有些經(jīng)濟問題中是不現(xiàn)實的,因為在經(jīng)濟問題中,許多自變量是不受控制的,或由于種種原因不可能再得到一些新的樣本數(shù)據(jù)。在有些情況下,雖然可以增大一些樣本數(shù)據(jù),但自變量個數(shù)較多時,我們往往難以確定增加什么樣的數(shù)據(jù),才能克服多重共線性。有時,增加了樣本數(shù)據(jù),但可能新數(shù)據(jù)距離原來樣本數(shù)據(jù)的平均值較大,會產(chǎn)生一些新的問題,使模型擬合變差,沒有收到增加樣本數(shù)據(jù)期望的效果。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心105§6.3關(guān)于多重共線性問題

〔3〕回歸系數(shù)的有偏估計消除多重共線性對回歸模型的影響是近40年來統(tǒng)計學(xué)家們關(guān)注的熱點課題之一,除以上方法被人們應(yīng)用外,統(tǒng)計學(xué)家還致力于改進古典的最小二乘法,提出以采用有偏估計為代價來提高估計量穩(wěn)定性的方法,如嶺回歸法,主成分法,偏最小二乘法等,這些方法已有不少應(yīng)用效果很好的經(jīng)濟例子,而且在計算機如此興旺的今天,具體計算也不難實現(xiàn)。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心106§6.4異常值與強影響值在回歸分析的應(yīng)用中,數(shù)據(jù)時常包含著一些異常的或極端的觀察值,這些觀察值與其他數(shù)據(jù)遠遠分開,可能引起較大的殘差,極大地影響回歸擬合的效果。在一元回歸的情況下,用散點圖或殘差圖就可以方便地識別出異常值,而在多元回歸的情況下,用簡單畫圖法識別異常值就很困難,需要更有效的方法。異常值分為兩種情況,一種是關(guān)于因變量y異常,另一種是關(guān)于自變量x異常。以下分別討論著兩種情況。目錄上頁下頁返回結(jié)束2024/1/29中國人民大學(xué)六西格瑪質(zhì)量管理研究中心107§

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論