第四章 異方差問題_第1頁
第四章 異方差問題_第2頁
第四章 異方差問題_第3頁
第四章 異方差問題_第4頁
第四章 異方差問題_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章異方差問題【學(xué)習(xí)目標(biāo)】1.知識(shí)目標(biāo):異方差的概念、產(chǎn)生原因與后果;異方差的各種檢驗(yàn)方式;修正異方差的方法與應(yīng)用

2.能力目標(biāo):對(duì)比GQ檢驗(yàn)、White檢驗(yàn)、Glejser檢驗(yàn)等方法;掌握加權(quán)最小二乘法中權(quán)重的選擇;掌握Eviews軟件操作方法,能應(yīng)用Eviews軟件解決異方差分析?!厩榫皩憣?shí)】我們?nèi)菀装l(fā)現(xiàn),收入越高的家庭,往往對(duì)食品選擇的范圍越大,消費(fèi)者消費(fèi)行為的隨意性更大,消費(fèi)者個(gè)體之間的食品支出額的差異也越大;收入較低的家庭受收入水平的限制,消費(fèi)者消費(fèi)行為隨意性較小,消費(fèi)者個(gè)體之間的食品支出額的差異也越小。通常在分析人均年收入對(duì)人均年食品支出額的影響時(shí)會(huì)假定不同收入階層的食品支出額的差異性是相同的因?yàn)閼?yīng)用普通最小二乘法估計(jì)多元線性回歸模型的參數(shù)時(shí),有一個(gè)重要的假定Var(i)=2,即隨機(jī)誤差項(xiàng)i具有相同的方差。顯然從實(shí)際情況來看,隨著收入水平的提高,消費(fèi)者個(gè)之間的消費(fèi)行為的隨機(jī)誤差項(xiàng)i的方差會(huì)越來越大,那么隨機(jī)誤差項(xiàng)i滿足同方差的假定不成立,即存在所謂的異方差問題。第一節(jié)異方差問題概述一、異方差的概念多元線性回歸模型中,如果有此時(shí),我們認(rèn)為該模型存在異方差問題。即【相關(guān)鏈接】4-1現(xiàn)實(shí)中的異方差問題下表列出了某年我國制造工業(yè)銷售收入與銷售利潤(rùn)的統(tǒng)計(jì)資料(單位:萬元)行業(yè)名稱銷售利潤(rùn)(Y)銷售收入(X)行業(yè)名稱銷售利潤(rùn)(Y)銷售收入(X)食品加工業(yè)187.253180.44醫(yī)藥制造業(yè)238.711264.1食品制造業(yè)111.421119.88化學(xué)纖維制品81.57779.46飲料制造業(yè)205.421489.89橡膠制品業(yè)77.84692.08煙草加工業(yè)183.871328.59塑料制品業(yè)144.341345紡織業(yè)316.793862.9非金屬礦制品339.262866.14服裝制品業(yè)157.71779.1黑色金屬冶煉367.473868.28皮革羽絨制品81.71081.77有色金屬冶煉144.291535.16木材加工業(yè)35.67443.74金屬制品業(yè)201.421948.12家具制造業(yè)31.06226.78普通機(jī)械制造354.692351.68造紙及紙品業(yè)134.41124.94專用設(shè)備制造238.161714.73印刷業(yè)90.12499.83交通運(yùn)輸設(shè)備511.944011.53文教體育用品54.4504.44電子機(jī)械制造409.833286.15石油加工業(yè)194.452363.8電子通訊設(shè)備508.154499.19化學(xué)原料紙品502.614195.22儀器儀表設(shè)備72.46663.68以銷售收入為橫坐標(biāo),銷售利潤(rùn)為縱坐標(biāo),將各制造工業(yè)數(shù)據(jù)描入二維坐標(biāo),得到圖4-1。圖4-1我國制造工業(yè)銷售收入與銷售利潤(rùn)散點(diǎn)圖從圖4-1中可以看出,隨著工業(yè)銷售收入的增加,銷售利潤(rùn)的平均水平不斷提高,同時(shí)離散程度也逐步擴(kuò)大,Var(μi)與Xi成正比,即常數(shù),說明我國制造工業(yè)銷售收入與銷售利潤(rùn)之間存在嚴(yán)重的異方差問題。二、異方差類型異方差通常有三種主要類型:1.遞增型,即Var(μi)隨的增大而增大(如圖4-2)例如,以截面數(shù)據(jù)研究消費(fèi)與收入之間的聯(lián)系:。高收入消費(fèi)主體的消費(fèi)呈現(xiàn)出較大的隨意性,低收入者的消費(fèi)受收入約束而具有較小的隨意性,其消費(fèi)變動(dòng)是很小的。體現(xiàn)在模型中μi的方差隨的增大而增大。2.遞減型,即Var(μi)隨的增大而減?。ㄈ鐖D4-3)例如,研究印刷工人的錯(cuò)誤密度(Y)與從事工作時(shí)間(T)的關(guān)系。人們不斷學(xué)習(xí),其知識(shí)積累將與日俱增,而行動(dòng)中犯錯(cuò)誤的密度隨時(shí)間增加而減少。印刷工人從事印刷工作的時(shí)間越長(zhǎng),錯(cuò)誤密度越小,而且錯(cuò)誤密度的隨機(jī)漲落也越小。體現(xiàn)在模型中便是的方差隨的增大而減小。如圖4.5所示。3.復(fù)雜型,即Var(μi)隨的變化呈現(xiàn)復(fù)雜形式(如圖4-4)例如,以某一行業(yè)的企業(yè)為樣本建立企業(yè)生產(chǎn)函數(shù)模型,產(chǎn)出為被解釋變量,資本、勞動(dòng)、技術(shù)等投入要素為解釋變量,那么每個(gè)企業(yè)所處的外部環(huán)境對(duì)產(chǎn)出的影響則包含在隨機(jī)誤差項(xiàng)中。由于每個(gè)企業(yè)所處的外部環(huán)境對(duì)產(chǎn)出的影響程度不同,造成了隨機(jī)誤差項(xiàng)的異方差性。這時(shí),隨機(jī)誤差項(xiàng)的方差并不隨某一個(gè)解釋變量觀測(cè)值的變化而呈規(guī)律性變化,為復(fù)雜型的一種。如圖4.6所示。三、異方差產(chǎn)生的原因1.略去了某些重要解釋變量模型遺漏了重要解釋變量,那么這些變量的影響將歸入隨機(jī)誤差項(xiàng)中,如果這些解釋變量的變化具有異方差性,這種情況下隨機(jī)誤差項(xiàng)會(huì)表現(xiàn)出和那些被遺漏的解釋變量相同的變化趨勢(shì),從而呈現(xiàn)異方差性?!鞠嚓P(guān)鏈接】服裝需求模型的建立研究人們的服裝需求模型:以服裝需求量為被解釋變量,收入I、服裝價(jià)格P和其他商品價(jià)格為解釋變量,于是有:在該模型中,氣候因素的影響并沒有作為解釋變量,其影響則包含在隨機(jī)誤差項(xiàng)中,而對(duì)于不同收入的消費(fèi)者,氣候變化帶來的對(duì)服裝需求量的影響是不同的。高收入者資金比較充足,氣候變化時(shí)可以拿出來較多的錢購買服裝以適應(yīng)氣候的變化,不同人的偏差可以較大,而低收入者的購買能力則很有限,偏差較小。于是不同收入的消費(fèi)者的服裝需求量偏離的均值的程度是不同的,也就是說不同收入的消費(fèi)者的服裝需求量具有不同的方差,這就產(chǎn)生了異方差。2.模型設(shè)定錯(cuò)誤引起的異方差很多情況下,解釋變量與被解釋變量之間的關(guān)系比較復(fù)雜的非線性關(guān)系。如果在構(gòu)造模型時(shí)用線性模型表達(dá)工資收入的關(guān)系。理論上認(rèn)為,隨著年齡的增長(zhǎng),工作經(jīng)驗(yàn)積累,工資慢慢增加,達(dá)到頂峰后又慢慢減少,整體工資隨年齡呈現(xiàn)倒“U”型,因此正確設(shè)定的模型為非線性關(guān)系,或者用簡(jiǎn)單的非線性模型表達(dá)復(fù)雜的非線性關(guān)系,就會(huì)造成函數(shù)形式的設(shè)定誤差,進(jìn)而出現(xiàn)異方差。模型來研究年齡和,理論上認(rèn)為,隨著年齡的增長(zhǎng),工作經(jīng)驗(yàn)積累,工資慢慢增加,達(dá)到頂峰后又慢慢減少,整體工資隨年齡呈現(xiàn)倒“U”型,因此正確設(shè)定的模型為建立工資收入的關(guān)系。分別表示工資收入和年齡。如果在設(shè)定模型時(shí)將模型錯(cuò)誤的設(shè)定為此時(shí)隨機(jī)誤差項(xiàng)實(shí)際上包含了丟失變量,因此,

方差可能隨變量的變化而變化,出現(xiàn)異方差。3.經(jīng)濟(jì)數(shù)據(jù)本身存在的異方差經(jīng)濟(jì)數(shù)據(jù)本身的異方差是指當(dāng)因變量數(shù)據(jù)樣本來自于不同類型的個(gè)體時(shí),樣本方差的差異。例如上面所提到的消費(fèi)之間的模型:

消費(fèi)規(guī)律是不一樣的。高收入消費(fèi)主體的消費(fèi)呈現(xiàn)出較大的隨意性,低收入者的消費(fèi)受收入約束而具有較小的隨意性,如靠最低生活保障收入維持生計(jì)的消費(fèi)者,其消費(fèi)變動(dòng)是很小的。體現(xiàn)在模型中便是誤差項(xiàng)的異方差。對(duì)于不同收入層次的家庭其4.測(cè)量誤差一方面,測(cè)量誤差常常隨著時(shí)間逐漸積累,所以擾動(dòng)項(xiàng)的方差,趨向于隨時(shí)間增加;另一方面,隨著抽樣技術(shù)和其他數(shù)據(jù)采集技術(shù)的不斷改進(jìn),測(cè)量誤差以及擾動(dòng)項(xiàng)的方差也可能隨時(shí)間減少。例如相對(duì)于沒有精確數(shù)據(jù)處理裝備的銀行,有這種裝備的銀行在每月或每季的賬戶收支說明書中會(huì)出現(xiàn)更少的差錯(cuò)。當(dāng)然,這兩種情況最容易出現(xiàn)在時(shí)間序列數(shù)據(jù)中,故由于測(cè)量誤差的影響,時(shí)間序列數(shù)據(jù)建立的模型的項(xiàng)也容易出現(xiàn)異方差。四、異方差的后果1.參數(shù)估計(jì)值仍是無偏的,但不再具有最小方差性

(4-3)由上式(4-3)可以看出,只要模型滿足誤差項(xiàng)零從OLS估計(jì)值的最小方差性證明可以看出,參數(shù)估計(jì)值具有最小方差性的前提之一就是隨機(jī)誤差的同方差性,如果存在異方差,將不能保證OLS估計(jì)值的方差最小

均值和解釋變量的非隨機(jī)性,異方差的存在并不影響估計(jì)值的無偏性。。2.參數(shù)顯著性檢驗(yàn)失效在變量的顯著性檢驗(yàn)中,構(gòu)造了t統(tǒng)計(jì)量:

如果存在異方差,OLS估計(jì)式不再具有最小方差,如果從而增大了t統(tǒng)計(jì)值,使拒絕原假設(shè)的可能性增加,因而t檢驗(yàn)失去意義。F檢驗(yàn)也是如此。在這種情況下,建立在t分布和F分布之上的參數(shù)置信區(qū)間和顯著性檢驗(yàn)也是不可靠的。仍然用不存在異方差時(shí)的OLS方式估計(jì)其方差,將會(huì)低估,3.模型的預(yù)測(cè)失效由于隨機(jī)誤差項(xiàng)樣本觀測(cè)值的變化而變化,將導(dǎo)致預(yù)測(cè)區(qū)間變大或者變小,預(yù)測(cè)功能失效。的異方差性,參數(shù)估計(jì)量的方差隨著第二節(jié)異方差問題的檢驗(yàn)

異方差性,即相對(duì)于不同的樣本點(diǎn),也就是相對(duì)于不同的解釋變量觀測(cè)值,隨機(jī)誤差項(xiàng)具有不同的方差,那么檢驗(yàn)異方差性,也就是檢驗(yàn)隨機(jī)誤差項(xiàng)的方差與解釋變量觀測(cè)值之間的相關(guān)性。各種檢驗(yàn)方法就是在這個(gè)思路下發(fā)展起來的。問題在于用什么來表示隨機(jī)誤差項(xiàng)的方差。一般的處理方法是首先采用普通最小二乘法估計(jì)模型,以求得隨機(jī)誤差項(xiàng)的估計(jì)量,用ei表示。于是有一、圖形檢驗(yàn)法由于異方差指隨機(jī)擾動(dòng)項(xiàng)的方差隨著解釋變量的變化而變化,因此異方差反映在散點(diǎn)圖上,就是殘差平方隨解釋變量Xi的變化而改變。圖4.7列出四種不同的散點(diǎn)圖。其中圖4.7a表示沒有異方差性,圖4.7b,4.7c,4.7d表示有異方差性,分別為遞增型、遞減型、復(fù)雜型。圖4.7a同方差圖4.7b遞增型異方差圖示檢驗(yàn)法只能進(jìn)行大概的判斷,其它檢驗(yàn)方法則更為準(zhǔn)確。【相關(guān)鏈接】異方差的圖形檢驗(yàn)法【相關(guān)鏈接】GQ檢驗(yàn)方法Eviews6.0軟件操作步驟(數(shù)據(jù)見表4.2):第一步:首先將變量按從小到大進(jìn)行排序。在Procs菜單里選SortCurrentPage命令,出現(xiàn)排序?qū)υ捒颍绻赃f增型排序,選Ascenging,如果以遞減型排序,則應(yīng)選Descending,鍵入X,點(diǎn)ok。本例選遞增型排序,這時(shí)變量Y與X將以X按遞增型排序。如圖4.9.3,4.9.4。第二步:構(gòu)造子樣本區(qū)間,建立回歸模型。在本例中,樣本容量n=31,刪除中間1/4的觀測(cè)值,即大約7個(gè)觀測(cè)值,余下部分平分得兩個(gè)樣本區(qū)間:1—12和20—31,它們的樣本個(gè)數(shù)均是12個(gè),即。對(duì)后12個(gè)樣本進(jìn)行回歸。在Sample菜單里,將區(qū)間定義為20—31,再用OLS方法求得如下結(jié)果,見圖4.9.10圖4.10.3white檢驗(yàn)結(jié)果從圖4.10.3white檢驗(yàn)結(jié)果可以看出此外在下,查分布表,得臨界值比較計(jì)算的統(tǒng)計(jì)量與臨界值,因?yàn)椋?,所以拒絕原假設(shè),接受備擇假設(shè),表明。模型存在異方差。四、Glejser檢驗(yàn)

Glejser檢驗(yàn)由H.Glejser于1969年提出。檢驗(yàn)原回歸式的殘差的絕對(duì)值若有,則說明存在異方差;若無,則說明不存在異方差。通常應(yīng)檢驗(yàn)的幾種形式:

是否與解釋變量xi存在函數(shù)關(guān)系。如果哪一種形式通過了顯著性檢驗(yàn),則說明存在該種形式的異方差。該檢驗(yàn)要求變量的觀測(cè)值為大樣本。第三節(jié)異方差性的修正經(jīng)檢驗(yàn)如果發(fā)現(xiàn)模型中存在異方差,就要對(duì)模型進(jìn)行適當(dāng)?shù)奶幚恚驗(yàn)楫惙讲铍m然不影響OLS估計(jì)的線性性和無偏性,但是它不再具有最小方差性,從而t檢驗(yàn)不可靠,預(yù)測(cè)精度下降。因此,必須采取相應(yīng)的修正補(bǔ)救方法以克服異方差的不利影響,下面介紹最常用的加權(quán)最小二乘法和對(duì)數(shù)變換法。一、加權(quán)最小二乘法

在該模型中,存在

。即滿足同方差性。于是可以用普通最小二乘法估計(jì)其參數(shù),得到關(guān)于參數(shù)的無偏的、有效的估計(jì)量。這就是加權(quán)最小二乘法,在這里權(quán)數(shù)就是底下我們以一元模型為例,給出幾種常見的f(x)形式,看模型異方差的具體修正過程?!鞠嚓P(guān)鏈接】異方差性的修正由上面的各種異方差檢驗(yàn)結(jié)果可知,表4.2農(nóng)業(yè)種植面積(X)對(duì)農(nóng)業(yè)總產(chǎn)值(Y)的影響模型存在異方差,接下來將結(jié)合Eviews6.0軟件操作說明如何用加權(quán)最小二乘法修正異方差。在實(shí)際Eviews操作中,我們選用三個(gè)常用的權(quán)數(shù)在EquationEstimation窗口中輸入YCX,然后選擇Options選項(xiàng)卡。在WeightedLS/TSLS前復(fù)選框上打勾,依此輸入,可得3個(gè)回歸結(jié)果。圖4.11.1回歸窗口

圖4.11.2權(quán)重選項(xiàng)框經(jīng)估計(jì)檢驗(yàn)發(fā)現(xiàn)用權(quán)數(shù)模型的擬合優(yōu)度最高,模型回歸效果最好。下面僅給出用權(quán)數(shù)的結(jié)果。對(duì)加權(quán)最小二乘法處理后的模型殘差項(xiàng)進(jìn)行異方差檢驗(yàn),即在圖4.11.3的回歸窗口。例如選擇White檢驗(yàn),檢驗(yàn)結(jié)果如圖4.11.5所示。由圖4.11.5可知<,所以接受原假設(shè),模型不存在異方差,經(jīng)過加權(quán)后,模型消除了異方差。圖4.11.5White檢驗(yàn)結(jié)果從圖4.11.4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論