異方差 自相關(guān)_第1頁(yè)
異方差 自相關(guān)_第2頁(yè)
異方差 自相關(guān)_第3頁(yè)
異方差 自相關(guān)_第4頁(yè)
異方差 自相關(guān)_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 多元線(xiàn)性回歸 南開(kāi)大學(xué)商學(xué)院周寶源 回歸模型診斷),.,2 , 1(0.2211nixwxwxwikkii第一節(jié) 多重共線(xiàn)性),.,2 , 1(0.2211nixwxwxwikkii一、基本概念一、基本概念(一)完全多重共線(xiàn)性(一)完全多重共線(xiàn)性n指線(xiàn)性回歸模型中的若干解釋變量或全部指線(xiàn)性回歸模型中的若干解釋變量或全部解釋變量的樣本觀察值之間具有某種嚴(yán)格解釋變量的樣本觀察值之間具有某種嚴(yán)格的線(xiàn)性關(guān)系。的線(xiàn)性關(guān)系。(二)近似多重共線(xiàn)性(二)近似多重共線(xiàn)性n指線(xiàn)性回歸模型中的若干解釋變量或全部指線(xiàn)性回歸模型中的若干解釋變量或全部解釋變量的樣本觀察值之間存在著近似的解釋變量的樣本觀察值之間存在著近

2、似的線(xiàn)性關(guān)系。線(xiàn)性關(guān)系。二、多重共線(xiàn)性的產(chǎn)生原因n1、經(jīng)濟(jì)變量間的內(nèi)在關(guān)系、經(jīng)濟(jì)變量間的內(nèi)在關(guān)系n2、經(jīng)濟(jì)變量在時(shí)間上有同方向變動(dòng)的趨、經(jīng)濟(jì)變量在時(shí)間上有同方向變動(dòng)的趨勢(shì)勢(shì)n3、分布滯后變量模型的廣泛應(yīng)用、分布滯后變量模型的廣泛應(yīng)用n4、模型設(shè)定的偏誤、模型設(shè)定的偏誤n5、其他、其他三、多重共線(xiàn)性的后果n隨著多重共線(xiàn)性程度的提高,參數(shù)方差會(huì)急劇上升到很大的水平,理論上使最小二乘法估計(jì)的有效性、可靠性和價(jià)值都受到影響,實(shí)踐中參數(shù)估計(jì)的穩(wěn)定性和可靠程度下降n1、具有較大的方差與協(xié)方差,難以得到精確、具有較大的方差與協(xié)方差,難以得到精確的估計(jì)的估計(jì)n2、使得參數(shù)估計(jì)值很不穩(wěn)定、使得參數(shù)估計(jì)值很不穩(wěn)定

3、n3、使得、使得t檢驗(yàn)得出誤導(dǎo)性的結(jié)果檢驗(yàn)得出誤導(dǎo)性的結(jié)果n4、產(chǎn)生有偏的預(yù)測(cè)置信區(qū)間,使預(yù)測(cè)失效、產(chǎn)生有偏的預(yù)測(cè)置信區(qū)間,使預(yù)測(cè)失效。四、四、多重共線(xiàn)性的診斷(一)方差擴(kuò)大因子(二)容忍度(三)狀態(tài)指數(shù)(一)方差擴(kuò)大因子(一)方差擴(kuò)大因子方差擴(kuò)大因子VIFn對(duì)每個(gè)解釋變量Xk,可以計(jì)算VIFkn通常認(rèn)為方差擴(kuò)大因子大于10時(shí),第 個(gè)解釋變量存在較強(qiáng)的、必須加以處理的多重共線(xiàn)性。k(二)容忍度容忍度(tolerance),也稱(chēng)為容許度,它是方差膨脹因子的倒數(shù)。因此,一般認(rèn)為容忍度小于0.1時(shí)(對(duì)應(yīng)于VIF大于10),相應(yīng)自變量存在較強(qiáng)的、必須加以處理的多重共線(xiàn)性。(二)狀態(tài)指數(shù)(二)狀態(tài)指數(shù)狀

4、態(tài)指數(shù)(condition index):通常簡(jiǎn)稱(chēng)為CI。n通常認(rèn)為:nCI值介于10與30之間時(shí),認(rèn)為存在中等程度的多重共線(xiàn)性。nCI值在30以上時(shí),認(rèn)為存在嚴(yán)重多重共線(xiàn)性。 例:分析以Y為因變量,X1和X2為自變量的回歸模型是否存在多重共線(xiàn)性問(wèn)題。SSS操作n從Analyze Regression Linear 打開(kāi)Linear 線(xiàn)性回歸主對(duì)話(huà)框n將自變量與因變量分別選入相應(yīng)框中。n點(diǎn)擊“Statistics”按鈕,在新打開(kāi)的對(duì)話(huà)框中選中“Collinearity diagnostic”,n點(diǎn)擊“Continue”n點(diǎn)擊“OK”兩個(gè)自變量對(duì)應(yīng)的VIF均顯著超過(guò)10( tolerance 均

5、小于0.1),所以回歸模型存在嚴(yán)重的多重共線(xiàn)性。Coefficientsa24.7756.7523.669.008.942.8231.8141.144.290.002482.128-4.24E-02.081-.834-.526.615.002482.128(Constant)X1X2Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.ToleranceVIFCollinearity StatisticsDependent Variable: Ya. 最大的CI顯著超過(guò)30,表明回歸模型模型存在嚴(yán)

6、重的多重共線(xiàn)性。 Collinearity Diagnosticsa2.9301.000.01.00.006.971E-026.483.98.00.001.060E-04166.245.001.001.00Dimension123Model1EigenvalueConditionIndex(Constant)X1X2Variance ProportionsDependent Variable: Ya. 多重共線(xiàn)性的其他診斷方法多重共線(xiàn)性的其他診斷方法n1. R2很高,Y與各自變量的相關(guān)系數(shù)也很高,但自變量的回歸系數(shù)均不顯著或顯著不為零的回歸系數(shù)較少;n2.某兩個(gè)自變量的相關(guān)系數(shù)較高;n3.從直

7、觀上知,某自變量與其他自變量存在函數(shù)關(guān)系n4.回歸系數(shù)估計(jì)結(jié)果在符號(hào)上與有關(guān)理論或經(jīng)驗(yàn)相反。n5 . 其他方法第二節(jié) 異方差性 一、異方差的概念一、異方差的概念二、異方差產(chǎn)生的原因二、異方差產(chǎn)生的原因n(一)數(shù)據(jù)質(zhì)量原因(一)數(shù)據(jù)質(zhì)量原因n(二)模型設(shè)定原因(二)模型設(shè)定原因n1、因變量的測(cè)量誤差、因變量的測(cè)量誤差n2、省略某些自變量、省略某些自變量n3、模型數(shù)學(xué)形式設(shè)定錯(cuò)誤、模型數(shù)學(xué)形式設(shè)定錯(cuò)誤n4、隨機(jī)系數(shù)模型、隨機(jī)系數(shù)模型n5、異常值的出現(xiàn)、異常值的出現(xiàn) 三、異方差性的后果三、異方差性的后果 1 1、回歸系數(shù)估計(jì)結(jié)果誤差較大、回歸系數(shù)估計(jì)結(jié)果誤差較大 2 2、有關(guān)統(tǒng)計(jì)檢驗(yàn)失去意義、有關(guān)統(tǒng)

8、計(jì)檢驗(yàn)失去意義 3 3、模型的預(yù)測(cè)失效、模型的預(yù)測(cè)失效n例:變量例:變量X、Y的部分的部分?jǐn)?shù)據(jù)如右表所示。數(shù)據(jù)如右表所示。n下面運(yùn)用圖示法進(jìn)行下面運(yùn)用圖示法進(jìn)行分析模型是否存在嚴(yán)分析模型是否存在嚴(yán)重的異方差現(xiàn)象。重的異方差現(xiàn)象。n從Analyze Regression Linear 打開(kāi)Linear 線(xiàn)性回歸主對(duì)話(huà)框n將自變量與因變量分別選入相應(yīng)框中。n點(diǎn)擊“Plot”按鈕,在新打開(kāi)的對(duì)話(huà)框中將“DEPENDNT”選入“X”框中,將“*ZRESID”選入“Y”框中.n點(diǎn)擊“Continue”n點(diǎn)擊“OK”ScatterplotDependent Variable: YY220200180160

9egression Standardized Residual3210-1-2n該圖表明本回歸模型存在嚴(yán)重的已方差問(wèn)題。n方差越來(lái)越小ScatterplotDependent Variable: YY22020018016014012010080Regression Standardized Residual3210-1-2第三節(jié)第三節(jié) 自相關(guān)自相關(guān)一、問(wèn)題和原因一、問(wèn)題和原因 (一)自相關(guān)概念(一)自相關(guān)概念n各隨機(jī)誤差項(xiàng)之間不獨(dú)立,則稱(chēng)其存在自相關(guān)或序列各隨機(jī)誤差項(xiàng)之間不獨(dú)立,則稱(chēng)其存在自相關(guān)或序列相關(guān)性。相關(guān)性。(二)原因(二)原因n1、經(jīng)濟(jì)變量的慣性、經(jīng)濟(jì)變量的

10、慣性n2、模型設(shè)定偏琦:省略解釋變量的影響、模型設(shè)定偏琦:省略解釋變量的影響n(yōu)3、模型設(shè)定偏琦:錯(cuò)誤的函數(shù)形式的影響、模型設(shè)定偏琦:錯(cuò)誤的函數(shù)形式的影響n(yōu)4、滯后效應(yīng)、滯后效應(yīng)n5、其他原因、其他原因二、自相關(guān)主要后果二、自相關(guān)主要后果n很可能高估很可能高估R2。nt-檢驗(yàn)與檢驗(yàn)與F-檢驗(yàn)結(jié)果都變得無(wú)效。檢驗(yàn)結(jié)果都變得無(wú)效。n其他其他三、三、杜賓-瓦森檢驗(yàn)檢驗(yàn)誤差序列正自相關(guān)性D-W檢驗(yàn)區(qū)域圖 一階自相關(guān) 無(wú)法判斷無(wú)法判斷 無(wú)一階自相關(guān)性無(wú)一階自相關(guān)性 無(wú)法判斷無(wú)法判斷 一階負(fù)自相關(guān)DW024Ud4Ld4UdLd粗略地說(shuō):當(dāng)D-W指標(biāo)在2附近,即可認(rèn)為模型不存在明顯的(一階)自相關(guān)。四、自相關(guān)診斷舉例n自變量X與因變量Y如右表所示。n從Analyze Regression Linear 打開(kāi)Linear 線(xiàn)性回歸主對(duì)話(huà)框n將自變量與因變量分別選入相應(yīng)框中。n點(diǎn)擊“Statistics”按鈕,在新打開(kāi)的對(duì)話(huà)框中選中“Durbin-Watson”,n點(diǎn)擊“Continue”n點(diǎn)擊“OK”Model Summaryb.987a.975.9744.51.353Model1RR SquareAdjustedR SquareStd. Erro

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論