第五章 異方差性_第1頁
第五章 異方差性_第2頁
第五章 異方差性_第3頁
第五章 異方差性_第4頁
第五章 異方差性_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第五章異方差性1

本章討論四個問題:●異方差的實質(zhì)和產(chǎn)生的原因●異方差產(chǎn)生的后果●異方差的檢測方法●異方差的補救2第一節(jié)異方差性的概念一、什么是異方差性在簡單線性回歸模型和多元線性回歸模型的基本假定中,有同方差假定:如果Var(ui)對不同的解釋變量的觀測值彼此不同,則稱隨機誤差項具有異方差性。3

方差度量的是被解釋變量觀測值圍繞回歸線的分散程度,所以異方差性就是指被解釋變量觀測值的分散程度隨解釋變量的變化而變化。4在復(fù)雜的實際經(jīng)濟現(xiàn)象中異方差性是大量存在的。例如儲蓄函數(shù)再如服裝需求函數(shù)這里Q為服裝的需求量,Y為消費者的收入、P為服裝價格、P1為其它商品的價格。這里Yi表示第i個家庭的儲蓄額,Xi為收入。5二、產(chǎn)生異方差的原因

(一)模型中省略了某些重要的解釋變量假設(shè)正確的模型是:假如略去了重要的解釋變量X3,而采用

這時會導(dǎo)致X3對Y的影響反映在vi中,而這些影響具有差異性,從而產(chǎn)生異方差性。所以在用剔除變量法消除共線性時,又有可能引起異方差性,應(yīng)注意。6(二)模型的設(shè)定誤差模型的設(shè)定主要包括變量的選擇和模型形式的確定。模型中略去了重要解釋變量常常導(dǎo)致異方差,實際就是模型設(shè)定問題。除此而外,模型的函數(shù)形式不正確,如把變量間本來為非線性的關(guān)系設(shè)定為線性,也可能導(dǎo)致異方差。(三)數(shù)據(jù)的測量誤差

樣本數(shù)據(jù)的觀測誤差有可能隨研究范圍的擴大而增加,或隨時間的推移逐步積累,也可能隨著觀測技術(shù)的提高而逐步減小。如儲蓄函數(shù),假如用的是1980年至2010年的數(shù)據(jù),前些年工資較透明,現(xiàn)在灰色收入較多,測量誤差有變化。7(四)截面數(shù)據(jù)中總體各單位的差異例如利用截面數(shù)據(jù)研究消費與收入的關(guān)系時,不同地區(qū)收入有差距,低收入地區(qū)家庭用于生活必需品的比例較大,消費的分散程度不大,而高收入地區(qū)家庭有更多自由支配的收入,家庭消費有更廣泛的選擇范圍,消費的分散程度較大,而出現(xiàn)異方差性。通常認(rèn)為,截面數(shù)據(jù)較時間序列數(shù)據(jù)更容易產(chǎn)生異方差。這是因為同一時點不同對象的差異,一般說來會大于同一對象不同時間的差異。不過,在時間序列數(shù)據(jù)發(fā)生較大變化的情況下,也可能出現(xiàn)比截面數(shù)據(jù)更嚴(yán)重的異方差。8第二節(jié)異方差性的后果一、對參數(shù)估計統(tǒng)計特性的影響如果隨機誤差項具有異方差性,當(dāng)我們?nèi)杂肙LS進行參數(shù)估計時,估計式仍具有線性性和無偏性,但已不再具有最小方差性。設(shè)回歸模型為9與同方差假定無關(guān),所以存在異方差時仍能保持線性性。因為用OLS估計10推導(dǎo)也僅用到零均值假定,表明無偏性也成立。P37(2.36)11為了說明最小方差性不再成立,將回歸方程改寫成離差形式:}由于Var(vi)=Var(ui),若(1)式存在異方差,則(2)式也存在異方差,為討論方便,不妨設(shè):(1)(2)將(2)變?yōu)椋浩渲酗@然wi已具有同方差。(3)12對(1)采用OLS法估計得:(1)于是(3)對(3)采用OLS法(也即對(2)采用WLS法)估計得:P37(2.36)P38(2.40)13于是由于所以即14二、對參數(shù)顯著性檢驗的影響在同方差假定下,作t檢驗,用無偏估計仍以模型為例代替s2,這里在異方差情況下,不妨設(shè)作OLS估計,參數(shù)方差為15于是代替s2時,如果當(dāng)用無偏估計則16若仍用作為統(tǒng)計量的值,由于低估由于高估了真實方差,導(dǎo)致降低t統(tǒng)計量的值,本應(yīng)拒絕的原假設(shè)可能被錯誤地接受,從而降低了所估計參數(shù)的顯著性。則了真實方差,導(dǎo)致夸大t統(tǒng)計量的值,本應(yīng)接受的原假設(shè)可能被錯誤地拒絕,從而夸大了所估計參數(shù)的顯著性。反之,如果17

當(dāng)u存在異方差時,表明方差與解釋變量的變化有關(guān),雖然參數(shù)的估計量仍然無偏,并且基于此的預(yù)測也是無偏的,但是方差會增大,參數(shù)估計量不是有效的,從而對Y的預(yù)測也將不是有效的,Y的預(yù)測值的精度會下降。

三、對預(yù)測的影響18第三節(jié)異方差性的檢驗常用檢驗方法:●圖示檢驗法●Goldfeld-Quanadt檢驗●White檢驗●Glejser檢驗19一、圖示檢驗法

(一)相關(guān)圖形分析方差描述的是隨機變量取值的(與其均值的)離散程度。因為被解釋變量Y與隨機誤差項u有相同的方差,所以分析Y與X的相關(guān)圖,可以初略地看到Y(jié)的離散程度與X之間是否有相關(guān)關(guān)系。如果隨著X的增加,Y的離散程度為逐漸增大(或減?。┑淖兓厔荩瑒t認(rèn)為存在遞增型(或遞減型)的異方差。20用1998年四川省各地市州農(nóng)村居民家庭消費支出與家庭純收入的數(shù)據(jù),繪制出消費支出對純收入的散點圖,其中用Y1表示農(nóng)村家庭消費支出,X1表示家庭純收入。圖形舉例21雖然隨機誤差項無法觀測,但樣本回歸的殘差一定程度反映了隨機誤差的某些分布特征,可通過殘差的圖形對異方差進行觀察。

(二)殘差圖形分析

對于一元回歸模型,繪制出ei2對Xi的散點圖,對于多元回歸模型,繪制出ei2對Yi的散點圖或ei2與認(rèn)為和異方差有關(guān)的X的散點圖?!羧绻鹐i2不隨Xi或Yi而變化,則表明不存在異方差;◆如果ei2隨Xi或Yi而變化,則表明存在異方差。22二、Goldfeld-Quanadt檢驗基本思想:將樣本分為兩部分,然后分別對兩個樣本進行回歸,并計算兩個子樣的殘差平方和所構(gòu)成的比,以此為統(tǒng)計量來判斷是否存在異方差。(一)檢驗的前提條件1、要求檢驗使用的為大樣本容量,一般樣本容量不低于參數(shù)個數(shù)的兩倍。2、除了同方差假定不成立外,其它假定均滿足。23(二)檢驗步驟1.將觀測值按某個解釋變量的取值按從小到大排序。2.將排列在中間的c個(取樣本容量約1/4)觀察值刪除掉,再將剩余的分為兩個部分,每部分觀察值的個數(shù)為(n-c)/2。3.提出假設(shè)

H0:兩部分?jǐn)?shù)據(jù)的方差相等

H1:兩部分?jǐn)?shù)據(jù)的方差相等244.構(gòu)造F統(tǒng)計量

分別對兩個部分的觀察值作回歸,得到兩個部分的殘差平方和,設(shè):

Se1i2為前一部分樣本回歸產(chǎn)生的殘差平方和,

Se2i2為后一部分樣本回歸產(chǎn)生的殘差平方和。它們的自由度均為(n-c)/2-k,k為參數(shù)的個數(shù)。則

25給定顯著性水平a,查F分布表,得臨界值Fa。若F>Fa,則拒絕H0,接受H1,認(rèn)為存在異方差;若F<Fa,則接受H0,拒絕H1,認(rèn)為不存在異方差。5.判斷

如果沒有異方差,則Se1i2與Se2i2為比較接近,F(xiàn)值接近于1;如果存在遞增性方差,則Se1i2應(yīng)明顯大于Se2i2,此時F值應(yīng)比1大;對遞減性方差,可考慮26●要求大樣本●異方差的表現(xiàn)既可為遞增型,也可為遞減型●檢驗結(jié)果與選擇數(shù)據(jù)刪除的個數(shù)的大小有關(guān)●只能判斷異方差是否存在,在多個解釋變量的情況下,無法判斷是哪個變量引起的異方差。(三)檢驗的特點27三、White檢驗(一)基本思想:

不需要關(guān)于異方差的任何先驗信息,只需要在大樣本的情況下,將OLS估計后的殘差平方對常數(shù)、解釋變量、解釋變量的平方及其交叉乘積等構(gòu)成一個輔助回歸,利用輔助回歸建立相應(yīng)的檢驗統(tǒng)計量來判斷異方差性。

28(二)檢驗步驟:以一個二元線性回歸模型為例,設(shè)模型為:

1.用OLS估計上式,計算殘差ei;2.用ei2作為異方差si2的估計,作輔助回歸:

其中是的估計值;293.計算輔助回歸函數(shù)的可決系數(shù)R2;4.提出假設(shè)

H0:

a2=a3=a4=a5=a6=0

H0:

a2,a3,a4,a5,a6不全為0,在無異方差的假設(shè)下,nR2近似服從自由度等于輔助回歸中回歸元個數(shù)的c2分布,即這里m=5,n為樣本容量。305.檢驗

給定顯著性水平a,查c2分布表的臨界值ca2(5),若nR2>

ca2(5),則拒絕零假設(shè),接受備擇假設(shè),表明存在異方差;反之,則不存在異方差。(二)檢驗的特點要求變量的取值為大樣本;不僅能夠檢驗異方差的存在性,同時在多變量的情況下,還能判斷出是哪一個變量引起的異方差。缺點是引進回歸元太多,容易消耗自由度,有時可把交叉項去掉。31(一)基本思想

尋找殘差與某個解釋變量之間的顯著成立的關(guān)系,將殘差的絕對值同時去擬合解釋變量的若干種函數(shù),若其中有顯著成立的關(guān)系,則認(rèn)為存在異方差性。于1969年提出。

四、Glejser檢驗(格萊澤,戈里瑟)32(二)檢驗步驟:1.根據(jù)樣本數(shù)據(jù)建立估計模型,計算殘差ei;2.分別建立殘差絕對值對每個解釋變量的一系列函數(shù)形式,進行回歸,如:333.用t檢驗,若參數(shù)b,顯著地不為零,則認(rèn)為存在異方差。(二)檢驗的特點不僅能對異方差的存在作出判斷,而且還能得到異方差的隨某個解釋變量變化的形式。要求大樣本。缺點是函數(shù)形式不易確定,檢驗量太大。34第四節(jié)異方差性的補救措施

主要方法:

●模型變換法

加權(quán)最小二乘法

●模型的對數(shù)變換35一、對模型進行變換假定經(jīng)檢驗,存在異方差,并且已知以一元線性回歸模型為例其中s2為常數(shù),f(Xi)是Xi的已知函數(shù)。將模型作適當(dāng)變換,用去除模型兩邊,得36記則有此時可見,隨機擾動項已沒有異方差了。f(Xi)可以有不同的形式,Glejser檢驗提供了相應(yīng)的信息。37二、加權(quán)最小二乘法普通最小二乘法的目標(biāo),是使殘差平方和最小,在同方差假定下,普通最小二乘法是把每個殘差的平方都同等對待,賦予相同的權(quán)數(shù)1。但存在異方差時,方差越小,其樣本值偏離均值程度越小,其觀測值越應(yīng)受到重視,其作用越大。所以對較小的ei給予較大的權(quán)數(shù),對較大的ei給予較小的權(quán)數(shù),從而使殘差平方和更好地反映si2對它的影響。仍以一元線性回歸模型為例38通常取權(quán)數(shù)得加權(quán)的殘差平方和:根據(jù)最小二乘原理,使得加權(quán)的殘差平方和最小。3940其中于是這樣估計的參數(shù)稱為加權(quán)最小二乘估計。41可以證明,對原模型變換的方法與加權(quán)最小二乘法實際是等價的。所以常常是采用加權(quán)最小二乘法來消除異方差性,而用對原模型變換的方法來說明加權(quán)最小二乘法可以消除異方差性,注意前提是方差si2的函數(shù)形式是已知的。42對數(shù)變換后的模型通??梢越档彤惙讲钚缘挠绊懀骸暨\用對數(shù)變換能使測定變量值的尺度縮小?!艚?jīng)過對數(shù)變換后的線性模型,其殘差表示相對誤差,往往比絕對誤差有較小的差異。

當(dāng)si2未知時,可采用對數(shù)變換,變量Yi和Xi分別用lnYi和lnXi代替,即注意:1、取對數(shù)后變量的經(jīng)濟意義。2、解釋變量之間是否呈對數(shù)線性關(guān)系。三、模型的對數(shù)變換43第五節(jié)案例分析44【例1】表1列出了1998年我國主要制造工業(yè)銷售收入與銷售利潤的統(tǒng)計資料,請利用數(shù)據(jù)資料,檢驗異方差性。表1我國制造工業(yè)1998年銷售利潤與銷售收入情況行業(yè)名稱銷售利潤銷售收入行業(yè)名稱銷售利潤銷售收入食品加工業(yè)187.253180.44醫(yī)藥制造業(yè)238.711264.1食品制造業(yè)111.421119.88化學(xué)纖維制品81.57779.46飲料制造業(yè)205.421489.89橡膠制品業(yè)77.84692.08煙草加工業(yè)183.871328.59塑料制品業(yè)144.341345紡織業(yè)316.793862.9非金屬礦制品339.262866.14服裝制品業(yè)157.71779.1黑色金屬冶煉367.473868.28皮革羽絨制品81.71081.77有色金屬冶煉144.291535.16木材加工業(yè)35.67443.74金屬制品業(yè)201.421948.12家具制造業(yè)31.06226.78普通機械制造354.692351.68造紙及紙品業(yè)134.41124.94專用設(shè)備制造238.161714.73印刷業(yè)90.12499.83交通運輸設(shè)備511.944011.53文教體育用品54.4504.44電子機械制造409.833286.15石油加工業(yè)194.452363.8電子通訊設(shè)備508.154499.19化學(xué)原料紙品502.614195.22儀器儀表設(shè)備72.46663.6845一、圖示檢驗法1、相關(guān)圖形分析觀察銷售利潤Y與銷售收入X的相關(guān)圖:SCATXY

從圖中可以看出,隨著銷售收入的增加,銷售利潤的平均水平不斷提高,但離散程度也逐步擴大。這說明變量之間可能存在遞增的異方差性。462、殘差圖形分析

首先將數(shù)據(jù)排序,然后建立回歸方程。在方程窗口中點擊Resids按鈕可以得到模型的殘差分布圖。47從殘差分布圖和散點圖可以看出,隨機誤差項存在明顯的擴大趨勢,即表明存在異方差性。

再分別作出散點圖:48二、Goldfeld-Quandt檢驗

1、將樣本按解釋變量X排序:SORTX2、將排列在中間的8個觀測數(shù)據(jù)去掉,再將剩余的20個觀測值分成1到10共10個樣本和19到28共10個樣本3、利用樣本1建立回歸模型1(回歸結(jié)果如圖1):SMPL110LSYCX其殘差平方和為RSS=2579.587利用樣本2建立回歸模型2(回歸結(jié)果如圖2):SMPL1928LSYCX其殘差平方和為RSS=63769.6749圖1樣本1回歸結(jié)果

50圖2樣本2回歸結(jié)果

514、計算F統(tǒng)計量:F=63769.67/2579.59=24.725、取a=0.05時,查F分布表得Fa(8,8)=3.44,而F=24.72>Fa(8,8)=3.44所以存在異方差性。三、White檢驗1、建立回歸模型:LSYCX由于本例是一元回歸模型,輔助回歸模型中只有X和X2項,沒有交叉項:2、檢驗異方差性:點擊View\Residual\Test\WhiteHeteroskedastcity輔助回歸模型的估計結(jié)果如下:52533、輔助回歸的可決系數(shù)R2=0.2239444、給定顯著性水平a=0.05,這里輔助回歸中回歸元的個數(shù)m=2,由于所以存在異方差性。實際上,由輸出結(jié)果的概率(p值)可以看出,只要取顯著性水平a>0.04349,就可以認(rèn)為存在異方差性。實際應(yīng)用中可以直接觀察p值的大小,若p值較小,則認(rèn)為存在異方差性。反之,則認(rèn)為不存在異方差性。54四、Glejser檢驗

1、建立回歸模型:LSYCX殘差的絕對值︱ei︱:GENRE=ABS(RESID)

2、分別建立序列(E)對如下解釋變量的回歸模型:X,X^2,X^(1/2),X^(-1),X^(-1/2)回歸結(jié)果如圖所示

55563、由上述各回歸結(jié)果可知,各回歸模型中解釋變量的系數(shù)估計值顯著不為0且均能通過顯著性檢驗。所以認(rèn)為存在異方差性。

通過可決系數(shù)R2可以確定異方差的具體形式。本例中,圖X^(1/2)中所示的回歸方程中R2最大,可以據(jù)此來確定異方差的形式。異方差性的補救一、加權(quán)最小二乘法1、生成權(quán)數(shù)變量根據(jù)Glejser檢驗,得到是的函

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論