




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第四講 異方差一、 為什么要關(guān)注異方差問題?對(duì)于模型,同方差假定即:。在實(shí)踐中這個(gè)假定經(jīng)常被違背,即出現(xiàn)異方差問題。例一,在上述模型中,如果y代表消費(fèi),x代表收入,則給定收入,消費(fèi)的期望值,而實(shí)際消費(fèi)y將分布在這個(gè)期望值左右。對(duì)于高收入家庭,由于其可以選擇高消費(fèi)也可以選擇低消費(fèi),因此關(guān)于實(shí)際消費(fèi)量的不確定性較大;但對(duì)于低收入家庭,由于在消費(fèi)上選擇余地小,因此關(guān)于實(shí)際消費(fèi)量的不確定性也較小。給定收入,我們可用y的方差來衡量消費(fèi)的不確定性。注意到,而按照前面的分析,隨著收入增加而遞增,因此也是收入的增函數(shù),而不會(huì)是一個(gè)常數(shù)。例二,在上述模型中,如果y代表班級(jí)在計(jì)量經(jīng)濟(jì)學(xué)考試上的平均成績,x代表這門
2、課任課老師的授課時(shí)間。按照基本的統(tǒng)計(jì)學(xué)知識(shí),大班級(jí)的平均成績波動(dòng)應(yīng)該小于小班級(jí)的平均成績波動(dòng)。在這個(gè)例子中,隨著班級(jí)規(guī)模的增加而遞減,不會(huì)是一個(gè)常數(shù)。注意到班級(jí)規(guī)模在這里并不是模型中的解釋變量。筆記:在例二中,我們不僅要注意到異方差問題,還要注意到解釋變量遺漏問題。一個(gè)被遺漏的變量是學(xué)生平均能力。學(xué)生平均能力與平均成績正相關(guān),當(dāng)授課時(shí)間與平均能力負(fù)相關(guān)時(shí),則OLS估計(jì)平均來看將低估授課時(shí)間對(duì)平均成績的正向作用。異方差問題是普遍的,尤其對(duì)橫截面數(shù)據(jù)而言。然而如果異方差問題不會(huì)導(dǎo)致嚴(yán)重后果,那么關(guān)注這個(gè)問題的意義就不大。異方差問題到底會(huì)產(chǎn)生什么樣的后果呢?(一) 理論意義上的后果在證明高斯-馬爾科
3、夫定理時(shí),我們僅僅在證明OLS估計(jì)量具有有效性時(shí)涉及到了同方差假定,而在證明線性、無偏性并沒有用到該假定,因此異方差并不影響OLS估計(jì)量所具有的線性與無偏性這兩個(gè)性質(zhì)(實(shí)際上也不影響OLS估計(jì)量的一致性,一致性只涉及到高斯-馬爾科夫假定一、二、三),而只影響OLS估計(jì)量的有效性。具體來說,當(dāng)異方差問題存在時(shí),在所有線性無偏估計(jì)量中,OLS估計(jì)量再也不是最有效的估計(jì)量了。換句話說,還有其他線性無偏估計(jì)量其估計(jì)精度要高于OLS估計(jì)量。直覺上如何理解這一點(diǎn)?注意到在進(jìn)行模型估計(jì)時(shí),如果利用的信息越多,則估計(jì)精度將越高。異方差本身是信息,如果在模型估計(jì)時(shí)利用這個(gè)信息而不是像OLS估計(jì)那樣不考慮異方差信
4、息,則模型估計(jì)的有效性將提高。本章后面我們將介紹如何利用異方差信息進(jìn)行模型估計(jì)。(二) 實(shí)踐意義上的后果計(jì)量軟件包在默認(rèn)狀態(tài)下總是認(rèn)為同方差假定成立,進(jìn)而依據(jù)一些常規(guī)公式來計(jì)算參數(shù)估計(jì)的標(biāo)準(zhǔn)誤。例如,在默認(rèn)狀態(tài)下標(biāo)準(zhǔn)誤的計(jì)算公式是,其中是對(duì)誤差方差的估計(jì)。然而我們知道,在序列無關(guān)假定下,有:在同方差假定下,進(jìn)而有:如果同方差假定不成立,則故試圖以來估計(jì)從而達(dá)到估計(jì)的目的顯然是錯(cuò)誤的。因此,異方差問題在實(shí)踐意義上的后果就是,計(jì)量軟件包在默認(rèn)狀態(tài)下計(jì)算出的參數(shù)估計(jì)量的標(biāo)準(zhǔn)誤是無意義的,進(jìn)而基于這種標(biāo)準(zhǔn)誤所進(jìn)行的假設(shè)檢驗(yàn)也是無意義的。筆記:當(dāng)誤差項(xiàng)具有異方差性時(shí),誤差項(xiàng)的方差隨著腳標(biāo)i 的變化而發(fā)生
5、變化。如果用去估計(jì)誤差方差,這必然是誤導(dǎo)的,因?yàn)榻o定樣本,這個(gè)估計(jì)量的值是一個(gè)常數(shù),其不會(huì)隨著腳標(biāo)i 的變化而發(fā)生變化。 (三) 哪一種后果更值得重視?就統(tǒng)計(jì)推斷而言,實(shí)踐意義上的后果是致命的,因?yàn)榛阱e(cuò)誤標(biāo)準(zhǔn)誤所進(jìn)行的假設(shè)檢驗(yàn)毫無意義。我們能不能獲得正確的標(biāo)準(zhǔn)誤?在大樣本下,這個(gè)問題可以解決,因?yàn)閃hite(1980)證明,的一個(gè)一致估計(jì)量是,我們把稱為White穩(wěn)健標(biāo)準(zhǔn)誤。在大樣本下,我們可以基于White穩(wěn)健標(biāo)準(zhǔn)誤進(jìn)行統(tǒng)計(jì)推斷。筆記:1、在異方差情況下,每一個(gè)誤差項(xiàng)可能有不同的方差,而每一個(gè)誤差項(xiàng)又只有一個(gè)殘差觀測值相對(duì)應(yīng)。僅僅依靠唯一的殘差觀測值是無法對(duì)誤差項(xiàng)方差進(jìn)行一致性估計(jì)的。然而
6、我們的目的是估計(jì)而不是估計(jì)。White(1980)發(fā)現(xiàn),如果用殘差的平方代替誤差的方差,則是對(duì)的一致估計(jì)。2、在實(shí)際應(yīng)用中,White穩(wěn)健標(biāo)準(zhǔn)誤往往還進(jìn)行自由度調(diào)整,例如一種調(diào)整方式是。 不幸的是,在小樣本下,我們?cè)僖膊荒芾梅€(wěn)健標(biāo)準(zhǔn)誤了。那么當(dāng)出現(xiàn)異方差問題時(shí),小樣本下的統(tǒng)計(jì)推斷如何進(jìn)行?一個(gè)解決辦法是利用異方差信息把原模型轉(zhuǎn)化為同方差模型再進(jìn)行OLS估計(jì),這一方面提高了估計(jì)精度,另一方面也使得統(tǒng)計(jì)推斷是正確的。然而,異方差信息往往并不那么精確。例如,在例一中,我們知道是收入的增函數(shù),但我們并不知道具體的函數(shù)形式。因此,小樣本情況下異方差問題的解決是非常困難的。就估計(jì)精度而言,理論意義上的后
7、果在大樣本下是不重要的。因?yàn)镺LS估計(jì)量是一致估計(jì)量,當(dāng)樣本容量足夠大時(shí),OLS估計(jì)仍然會(huì)達(dá)到很高的精度。理論意義上的后果在小樣本下是重要的。然而我們知道,提高估計(jì)精度需要利用異方差信息,而異方差信息往往并不那么精確,從而這給提高估計(jì)精度帶來了挑戰(zhàn)??偠灾诖髽颖厩闆r下,異方差問題在理論意義和實(shí)踐意義上的后果是容易處理的;在小樣本情況下,異方差問題才是真正的挑戰(zhàn)。二、 發(fā)現(xiàn)異方差(一)圖示法圖示法是非正規(guī)的方法。以例一為例,我們或許得到如下的散點(diǎn)圖: 圖一 異方差情況下的散點(diǎn)圖 在圖一中,隨著x的增加,y看起來越來越離散。因此我們把圖一視為異方差存在的證據(jù)。筆記:1、縱坐標(biāo)可以是殘差;如果
8、是多元線性回歸,則橫坐標(biāo)可以是y的擬合值。2、應(yīng)該注意的是,如果第一個(gè)高斯-馬爾科夫假定被違背,即模型設(shè)定有誤,那么也可能出現(xiàn)異方差癥狀。例如,假定在簡單線性回歸模型中y是工資,x是受教育程度。如果受教育程度對(duì)工資的影響存在性別差異,則在模型中斜率參數(shù)并不是常數(shù)。此時(shí)如果對(duì)工資和受教育程度描圖,則我們可能發(fā)現(xiàn)異方差癥狀。事實(shí)上在很多情況下,異方差癥狀被認(rèn)為是模型錯(cuò)誤設(shè)定的一個(gè)表現(xiàn)。如果產(chǎn)生異方差癥狀的原因是模型設(shè)定有誤,那么我們首先應(yīng)該要做的事情是正確設(shè)定模型,而不是基于錯(cuò)誤設(shè)定的模型來解決異方差問題。在本講中,當(dāng)我們考慮異方差問題時(shí),我們假定其他所有的高斯-馬爾科夫假定成立,此時(shí)的異方差可以
9、稱為純粹的異方差。而模型設(shè)定有誤帶來的異方差癥狀被稱為非純粹的異方差。(二)Breusch-Pagan檢驗(yàn)該方法假定誤差項(xiàng)的方差是一些變量的線性函數(shù)(這些變量可以是解釋變量也可以不是解釋變量),即定義,則上式是一個(gè)回歸模型,然而一個(gè)問題是誤差項(xiàng)平方作為被解釋變量是不可觀測的。為克服這個(gè)問題,我們用殘差的平方來代替誤差的平方,從而得到一個(gè)可操作的回歸模型即輔助回歸模型:在上述回歸模型基礎(chǔ)上,我們對(duì)原假設(shè)進(jìn)行假設(shè)檢驗(yàn),如果拒絕原假設(shè),則我們認(rèn)為存在異方差問題,反之則相反。在檢驗(yàn)上述原假設(shè)時(shí),被利用的統(tǒng)計(jì)量是拉格朗日乘數(shù)(LM)統(tǒng)計(jì)量:在這里,N是樣本容量,是輔助回歸模型的判定系數(shù)。當(dāng)原假設(shè)為真時(shí),
10、漸進(jìn)服從自由度為s的卡方分布。既然提到漸進(jìn)二字,于是我們知道上述檢驗(yàn)屬于大樣本檢驗(yàn)。 對(duì)于Breusch-Pagan檢驗(yàn),我們或許會(huì)問如下一些問題:第一,為什么不直接用F檢驗(yàn)而是首選LM檢驗(yàn)?zāi)??這是因?yàn)椋覀冇脷埐畹钠椒絹泶娣讲顝亩玫捷o助回歸模型。當(dāng)原假設(shè)為真時(shí),的分布在大樣本情況下與足夠近似,而與F分布的近似卻不夠好。不過,利用F檢驗(yàn)也是漸進(jìn)合理的,見Wooldridge(fourth edition,p.275)。第二,為什么漸進(jìn)服從自由度為s的卡方分布?這是因?yàn)椋寒?dāng)原假設(shè)為真時(shí),近似為零;當(dāng)樣本容量很大時(shí),近似為。于是 第三,Breusch-Pagan檢驗(yàn)假定誤差項(xiàng)方差是一些變量的線
11、性函數(shù)。這個(gè)假定合理嗎?這個(gè)假定并不一定合理,然而令人驚訝的是,即使誤差項(xiàng)方差是一些變量的非線性函數(shù),但Breusch-Pagan檢驗(yàn)仍然有效(Hill,Griffiths and Lim,fourth edition,p.305)。(三)White檢驗(yàn)Breusch-Pagan檢驗(yàn)要求我們預(yù)先確定這些變量,而有時(shí)這是困難的。在White檢驗(yàn)下,解釋變量的水平項(xiàng)、平方項(xiàng)與交互項(xiàng)被用來代替這些變量。例如,假如我們要檢驗(yàn)?zāi)P停菏欠翊嬖诋惙讲顔栴},則我們可以建立如下輔助回歸模型:然后檢驗(yàn)原假設(shè)。我們?nèi)匀皇褂肔M統(tǒng)計(jì)量,在這。當(dāng)樣本容量不夠大時(shí),輔助模型中的交互項(xiàng)有時(shí)不得不被省略以節(jié)約自由度。不過有文
12、獻(xiàn)指出,若White檢驗(yàn)沒有出現(xiàn)交叉項(xiàng),則是純粹的異方差檢驗(yàn),若出現(xiàn)了交叉項(xiàng),則該檢驗(yàn)既是異方差檢驗(yàn)又是模型設(shè)定偏誤檢驗(yàn),見Gujarati(fourth edition,p.414)。另外,為了解決在估計(jì)輔助回歸時(shí)可能面臨的自由度不足問題,Wooldridge(fourth edition,p.275)建議建立輔助模型:然后再利用LM或者F檢驗(yàn)來檢驗(yàn)原假設(shè):。與Breusch-Pagan檢驗(yàn)相比,在White檢驗(yàn)中,誤差方差到底是哪些變量的函數(shù)這樣的先驗(yàn)信息是不需要的。這一點(diǎn)是White檢驗(yàn)的優(yōu)勢所在。然而事物往往具有兩面性,由于White檢驗(yàn)幾乎沒有利用任何有關(guān)異方差的先驗(yàn)信息,結(jié)果導(dǎo)致該
13、檢驗(yàn)的勢很低,即很容易不拒絕錯(cuò)誤的原假設(shè)。正因如此,當(dāng)White檢驗(yàn)表明不拒絕同方差的原假設(shè)時(shí),我們應(yīng)該對(duì)該結(jié)果保持足夠的警惕。另一方面,當(dāng)White檢驗(yàn)表明拒絕同方差的原假設(shè)時(shí),我們可以認(rèn)為這是異方差存在的強(qiáng)烈證據(jù)。筆記:1、理解White檢驗(yàn)的一個(gè)簡單方法是,首先假設(shè)誤差方差是解釋變量的一個(gè)連續(xù)可微函數(shù),然而函數(shù)形式未知。然后對(duì)這個(gè)函數(shù)進(jìn)行二階泰勒展開,則該函數(shù)將被近似表達(dá)為解釋變量、解釋變量平方及其交叉項(xiàng)的線性函數(shù)。2、White檢驗(yàn)法是普適的。普適的方法往往也是粗糙的。3、一個(gè)高度近視的人沒有發(fā)現(xiàn)一只小螞蟻是非常可能的,然而,如果他竟然也發(fā)現(xiàn)了一只螞蟻,那么那只螞蟻很可能還不小。(四)
14、Goldfeld-Quandt檢驗(yàn)情景一:樣本可以分割為兩個(gè)子樣本。在每一個(gè)子樣本中,誤差項(xiàng)是同方差的,但不同子樣本所對(duì)應(yīng)的誤差項(xiàng)方差可能是不同的。在此種情景下,首先建立原假設(shè):兩個(gè)子樣本所對(duì)應(yīng)的誤差項(xiàng)方差相同,然后構(gòu)建F統(tǒng)計(jì)量:在這里與分別是利用子樣本1和子樣本2進(jìn)行回歸得到的殘差平方和;與分別是利用子樣本1和子樣本2的樣本容量;是同方差情況下誤差項(xiàng)的方差。當(dāng)經(jīng)典線性模型假定成立時(shí),有:在顯著水平a下,如果計(jì)算的F值大于Fa/2或者小于F1-a/2,則拒絕原假設(shè)。筆記:1、當(dāng)誤差項(xiàng)不服從正態(tài)分布或者誤差項(xiàng)序列相關(guān)時(shí),與并不服從卡方分布,從而所構(gòu)建的F統(tǒng)計(jì)量并不服從F分布。因此,在利用Gold
15、feld-Quandt檢驗(yàn)法之前,誤差項(xiàng)是否服從正態(tài)分布和誤差項(xiàng)是否序列無關(guān)應(yīng)該先檢驗(yàn),如果誤差項(xiàng)不服從正態(tài)分布或者誤差項(xiàng)序列相關(guān),則Goldfeld-Quandt檢驗(yàn)無效。對(duì)于大樣本而言,誤差項(xiàng)是否服從正態(tài)分布并不重要,但誤差項(xiàng)仍需序列無關(guān)。事實(shí)上Breusch-Pagan檢驗(yàn)與White檢驗(yàn)也需誤差項(xiàng)序列無關(guān)假設(shè)成立(White穩(wěn)健標(biāo)準(zhǔn)誤的使用也需這個(gè)假設(shè))。因此嚴(yán)格說來,誤差項(xiàng)序列相關(guān)應(yīng)該先于異方差檢驗(yàn)進(jìn)行。只有當(dāng)序列相關(guān)問題得到解決后,才能進(jìn)行White檢驗(yàn)。然而在實(shí)踐中,對(duì)于隨機(jī)抽樣的橫截面數(shù)據(jù),序列相關(guān)問題在理論上是不存在的,此時(shí)我們主要關(guān)注異方差問題。但對(duì)于時(shí)間序列數(shù)據(jù),序列相關(guān)
16、問題就值得重視了。不過對(duì)于平穩(wěn)時(shí)間序列,異方差問題在理論上是不存在的(參見本講義第五講)。2、在原假設(shè)為真時(shí),與都是對(duì)的無偏、一致估計(jì),故兩者相差應(yīng)該不大,因此此時(shí)F與1近似。這也解釋了為何在這里的F檢驗(yàn)是一個(gè)雙尾檢驗(yàn)。3、在構(gòu)建F統(tǒng)計(jì)量時(shí),一些人習(xí)慣先比較與的大小,然后把兩者中較大的一個(gè)作為分子,較小的一個(gè)作為分母。在顯著水平下,注意此時(shí)的拒絕域是而不是。情景二:誤差方差可能是某個(gè)變量Z的函數(shù)。Goldfeld-Quandt檢驗(yàn)的步驟是:1、對(duì)N個(gè)觀測值按z升序排列,并拋棄中間的N-2N*個(gè)觀測值,形成兩個(gè)容量都為N*的子樣本;2、就兩個(gè)子樣本分別進(jìn)行回歸,記RSS1、RSS2分別為兩次回歸
17、的殘差平方和。3、計(jì)算RSS2/RSS1。在同方差的原假設(shè)下有:在顯著水平a下,如果計(jì)算的F值大于Fa/2或者小于F1-a/2,則拒絕原假設(shè)。筆記:1、為了提高檢驗(yàn)的勢,即降低不拒絕錯(cuò)誤原假設(shè)的概率,中間被拋棄的觀測值數(shù)目約為總樣本容量的3/8,以使如果存在異方差,則RSS1與RSS2的差異顯得更明顯。2、如果我們認(rèn)為誤差方差可能是某個(gè)變量Z的增函數(shù),則上述檢驗(yàn)就修正為單尾檢驗(yàn)。在顯著水平a下,如果計(jì)算的F值大于Fa則拒絕原假設(shè)。三、 利用異方差信息提高估計(jì)精度情景一:異方差的函數(shù)形式已知對(duì)于線性模型,假定異方差形式已知:,則原模型可轉(zhuǎn)化為:現(xiàn)在,因此,轉(zhuǎn)換后的模型滿足同方差假定,于是得到所謂
18、的加權(quán)最小二乘估計(jì)量(WLS)為什么稱為WLS?對(duì)轉(zhuǎn)化后的模型利用OLS,即求:也即由于,因此上式不過是使加權(quán)殘差的平方和最小。不難發(fā)現(xiàn),越大,則相應(yīng)的權(quán)重越小。WLS是廣義最小二乘法(GLS)的一個(gè)特例。關(guān)于GLS可參見第五講附錄。筆記:關(guān)于WLS的直覺。是我們所關(guān)注的總體回歸函數(shù),然而我們無法確定它,因?yàn)樗宋粗恼鎸?shí)參數(shù)。我們的任務(wù)是,利用觀測值擬合一條直線以近似總體回歸函數(shù)。假設(shè)與對(duì)應(yīng)的誤差項(xiàng)其方差很大,則很可能偏離較遠(yuǎn)。從而在使殘差平方和最小的過程中,點(diǎn)很可能造成樣本回歸直線與總體回歸函數(shù)相去甚遠(yuǎn)。為了降低這種可能性,一個(gè)簡單的辦法是,在樣本中刪除觀測值。然而,這種辦法并不是好辦法,因?yàn)槠骄鶃砜?,將落在總體回歸函數(shù)上(這也解釋了異方差為何不影響估計(jì)量的無偏性)。換句話說,還是具有一定的信息價(jià)值,而刪除它意味著我們未充分利用信息。假設(shè)與對(duì)應(yīng)的誤差項(xiàng)其方差較小,則與相比較,在估計(jì)總體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 地瓜換購活動(dòng)方案
- 太原打卡跨年活動(dòng)方案
- 大運(yùn)河保護(hù)活動(dòng)方案
- 大學(xué)生接力誦讀活動(dòng)方案
- 多參加運(yùn)動(dòng)活動(dòng)方案
- 大型祭祖活動(dòng)方案
- 大學(xué)圖書角活動(dòng)方案
- 外出采摘活動(dòng)方案
- 夜場春節(jié)活動(dòng)方案
- 夏季工會(huì)活動(dòng)方案
- 2024年3月2日湖北遴選筆試真題及解析(地市級(jí)卷)
- 能源經(jīng)營產(chǎn)品技術(shù)規(guī)范-三輪兩輪電動(dòng)車鋰電池組技術(shù)規(guī)范V1.0
- 大學(xué)專業(yè)選擇演講課件
- 茂名酒店行業(yè)報(bào)告
- 富士康大過管理制度
- 一汽大眾質(zhì)量控制體系培訓(xùn)手冊(cè)2
- 學(xué)校桌椅采購?fù)稑?biāo)方案(技術(shù)標(biāo))
- 十典九章宣貫(終)
- 用人單位評(píng)價(jià)調(diào)查表
- 江蘇開放大學(xué)2023年秋《公共關(guān)系原理與實(shí)務(wù)050010》過程性考核作業(yè)三參考答案
- 2023年上海市普通高中學(xué)業(yè)水平合格性考試物理試(含答案解析)
評(píng)論
0/150
提交評(píng)論