分位數(shù)回歸方法及其應(yīng)用_第1頁
分位數(shù)回歸方法及其應(yīng)用_第2頁
分位數(shù)回歸方法及其應(yīng)用_第3頁
分位數(shù)回歸方法及其應(yīng)用_第4頁
分位數(shù)回歸方法及其應(yīng)用_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

分位數(shù)回歸(QR)方法及其應(yīng)用陳建寶廈門大學(xué)經(jīng)濟學(xué)院計統(tǒng)系廈門大學(xué)宏觀經(jīng)濟研究中心第一部分:方法介紹

主要包括分位數(shù)回歸的概念,分位數(shù)回歸系數(shù)的估計方法及其性質(zhì)、分位數(shù)回歸系數(shù)的檢驗方法、模型的擬合優(yōu)度檢驗、分位數(shù)回歸的優(yōu)良性(與最小二乘法做比較)。分位數(shù)回歸(QR)產(chǎn)生的根源MostellerandTukey’s(1977)remark:Whattheregressioncurvedoesisgiveagrandsummaryfortheaveragesofthedistributionscorrespondingtothesetofxs.Wecouldgofurtherandcomputeseveraldifferentregressioncurvescorrespondingtothevariouspercentagepointsofthedistributionsandthusgetamorecompletepictureoftheset.Ordinarilythisisnotdone,andsoregressionoftengivesaratherincompletepicture.Justasthemeangivesanincompletepictureofasingledistribution,sotheregressioncurvegivesacorrespondinglyincompletepictureforasetofdistribution.

分位數(shù)回歸的思想Howto“gofurther”?分位數(shù)回歸的思想最早是由KoenkerandBassett(1978)提出的。它是對古典條件均值模型為基礎(chǔ)的最小二乘的拓展。普通最小二乘法是利用因變量的條件均值來建模,通過使殘差平方和達到最小來獲得回歸參數(shù)的估計。分位數(shù)回歸則利用因變量的條件分位數(shù)來建模,通過最小化加權(quán)的殘差絕對值之和來估計回歸參數(shù)。它可以稱之為“加權(quán)的最小一乘回歸法”。分位數(shù)的概念定義:設(shè)隨機變量

Y的分布函數(shù)為

Y的第

分位數(shù)為

其中中位數(shù)可以表示為

。分位數(shù)回歸思想的數(shù)學(xué)公式化對于

Y的一組隨機樣本

,樣本均

值是

的最優(yōu)解。樣本中位數(shù)是最小化殘差絕對值和的解,即對于其他的第

分位數(shù),我們可以求解下式:等價的表示為:其中,為示性函數(shù)。對于一般線性條件均值函數(shù)

,通過求解

得到參數(shù)估計值。而一般線性條件分位數(shù)函數(shù)為

,通過求解

得到參數(shù)估計值對于任意的

,估計

稱為第分位數(shù)下的回歸系數(shù)估計。分位數(shù)回歸參數(shù)的估計方法(點估計)求解等價于求解以下個線性規(guī)劃問題:其中

e為單位向量。目前對上式的算法主要有如下幾種:1.單純形算法(SimplexMethod):該算法估計出來的參數(shù)具有很好的穩(wěn)定性,但是在處理大型數(shù)據(jù)時運算的速度會顯著的降低(見Koenker

andOrey,1993)。2.內(nèi)點算法(InteriorPointMethod):內(nèi)點算法對于那些具有大量觀察值和少量變量的數(shù)據(jù)集運算效率很高(見Portnoy

andKoenker,1997)。3.平滑算法(SmoothingMethod):平滑算法在理論上比較簡單,它適合處理具有大量觀察值以及很多變量的數(shù)據(jù)集(見Chen,2004)。

其他方法:如adaptivemethod等。依據(jù)目前的文獻,區(qū)間估計方法也可分為三種:1.直接估計法(DirectEstimationMethod),見Koenker和Bassett

(1982)以及Koenker和Machado(1999)。該方法依據(jù)估計出來的回歸分位系數(shù)的漸進正態(tài)性來計算置信區(qū)間。比較有代表性的是Sparsity算法,它是一種最直接且運算速度也最快的算法,但該算法得到的估計值對于隨機項為獨立同分布這一假設(shè)十分敏感。2.秩得分法(RankScoreMethod),見Koenker(1994)。秩得分法算法比較簡單,但是對于大型數(shù)據(jù)處理效率較慢。3.重復(fù)抽樣法(Resamplingmethod),見He和Hu

(2002)。該方法使用了MCMB(MarkovChainMarginalBootstrap)算法,這種算法能夠進行高效率的運算,大大節(jié)省了運算時間。重復(fù)抽樣法能夠克服直接法和秩得分法的缺陷,但是對于小樣本時計算出的參數(shù)估計值不夠穩(wěn)定。分位數(shù)回歸參數(shù)的估計方法(區(qū)間估計)分位數(shù)回歸參數(shù)的顯著性檢驗方法在分位數(shù)回歸模型中,設(shè)Koenker與Machado(1999)提出了檢驗假設(shè)(其中)的兩個統(tǒng)計量:

和在原假設(shè)下都服從

從而,它們都可能用來檢驗回歸系數(shù)的顯著性。分位數(shù)回歸模型的擬合優(yōu)度Koenker與Machado(1999)依據(jù)最小二乘回歸中擬合優(yōu)度

的計算思想,提出了分位數(shù)回歸中擬合優(yōu)度的計算方法,定義為

,且

。最小二乘回歸中的

依據(jù)殘差平方和度量了回歸平方和占總離差平方和的比重,而

則按照殘差絕對值的加權(quán)和,度量了在某個分位數(shù)

下分位數(shù)回歸的擬合效果。因此不像

反映的是整個分布的擬合情況,

描述的是在某個分位數(shù)下的局部擬合效果。線性分位數(shù)回歸模型的估計

分位數(shù)回歸的基本性質(zhì)分位數(shù)回歸的漸近性質(zhì)

分位數(shù)回歸的漸近性質(zhì)與普通線性最小二乘回歸方法的比較1.在模型假設(shè)方面:OLS法要求滿足經(jīng)典假設(shè)的幾個條件;QR法只要求擾動項的條件下。2.在計算方面:OLS法求解簡單;QR法復(fù)雜,但由于計算機技術(shù)的發(fā)展,其不難完成。3.在估計的優(yōu)良性方面:兩者都有各自的優(yōu)良性。由于QR法在模型的假設(shè)方面要求較少,較容易得到滿足。特別是其估計方法(加權(quán)最小一乘估計方法)決定了其估計具有較強的穩(wěn)鍵性。第二部分:應(yīng)用實例分析主要結(jié)合應(yīng)用實例,介紹如何利用統(tǒng)計軟件實現(xiàn)分位數(shù)回歸,如何對研究結(jié)果進行解釋和分析。分位數(shù)回歸模型的軟件計算目前,計算分位數(shù)回歸的統(tǒng)計軟件主要有SAS以及R。EstimationinSAS:EstimationinR()Example—RiskfactorsforlowbirthweightLowbirthweightisknowntobeassociatedwith*Higherinfantmortality(Abreveya,2001).*Higherhealth-carecost(Lewitetal.1995).*aWiderangeofsubsequenthealthproblems(Hacketal.,1995).*long-termeducationalattainmentandevenlabormarketoutcomes(CormanandChaikind,1998).Investigatethefacotrsinfluencingbirthweight,especiallytheonesthatmayhelpreducetheincidenceoflowbirthweightinfants.Example—Riskfactorsforlowbirthweight

?

Theresearchquestioncanberephrasedasexploringthecovariateeffectsonthelowerquantilesofbirthweight.

?

Potentialcovariatesinclude?Mother’seducation?Mother’sprenatalcare?Mother’sage?Mother’sweightgain?...

?

Covariateeffectsonlowerquantilesmaydifferfromthoseonthemeanormedianbirthweight.

?

Reference:Abreveya(2001)andKoenkerandHallock(2001).Example:Exploringtheriskfactorsoflow

birthweightExample--ExploringtheriskfactorsoflowbirthweightAquantileregressionmodelforbirthweightSAScodesforthebirthweightmodelSomeconclusionsforexampleAnEngelCurvesforFood:ThisfigureplotsdatatakenfromErnstEngel's(1857)studyofthedependenceofhouseholds'foodexpenditureonhouseholdincome

第三部分:分位數(shù)回歸的發(fā)展和應(yīng)用分位數(shù)回歸的發(fā)展最小二乘方法最早是由Adrien-Marie(1806)提出的。QR法最早是由Koenker和Bassett(1978)提出的。

從1978-1994年,

從1994-1997年,

從1997-2004年,Lessthan370articlesonQRpublished446articlesonQRpublished506articlesonQRpublishedHeteroscedasticityRobustnessCensoringSampleselectionBinaryresponsemodelsPaneldataTimeseries分位數(shù)回歸的發(fā)展分位數(shù)回歸的發(fā)展NoparametricmodelsNon-linearmodelsExtremesMultivariatequantileregression…………..分位數(shù)回歸的應(yīng)用在環(huán)境科學(xué)研究方面:Chock,Winkler和Chen(2000)使用非參數(shù)分位數(shù)回歸法研究了匹茲堡這座城市中日死亡率和空氣污染集中度的相互關(guān)系;Hilary和Andrzej(2002)運用分位數(shù)回歸對天氣數(shù)據(jù)進行了分析。在生態(tài)學(xué)研究方面:KoenkerandSchorfheide(1994)分析了上世紀全球氣候改變的過程;Dunham,Cade和Terrell(2002)研究了不同的河流對鮭魚密度的影響。在生存分析研究方面:Koenker和Hallock(2001)研究了諸多因數(shù)對于新生兒出體重的影響;Cole和Green(1992)以及Royston和Altman(1994)還討論了分位數(shù)回歸在醫(yī)學(xué)上的應(yīng)用。分位數(shù)回歸的應(yīng)用在勞動力市場研究方面:Buchinsky(1996)研究了美國的勞動力市場;Schultz和Mwabu(1998)研究了南非的勞動力市場;Montenegro(1998)分析了智利的情況;Fithzenberger、Hujer、Macurdy和

Schnabe(2001)討論了德國勞動力市場的情況;值得一提的是Machado與Mata(2001)擴展了Oaxaca的分解法,并提出了一種依據(jù)分位數(shù)回歸過程來模擬邊際分布的方法來研究葡萄牙的勞動力市場;Yu,Philippe和Zhang(2005)使用貝葉斯分位數(shù)回歸研究了英國1991-2001年間的工資結(jié)構(gòu)的分布情況;Angrist,Chernozhukov和Fernandez-val(2006)使用分位數(shù)回歸方法研究了美國的工資結(jié)構(gòu)的分布情況;Papapetrou(2006)則研究了希臘公私企業(yè)中的工資差距情況。分位數(shù)回歸的應(yīng)用在需求分析研究方面:Deaton(1997)利用分位數(shù)回歸分析了巴基斯坦的Engel曲線;Hendricks與Koenker(1992)使用分位數(shù)回歸研究了電力消費需求情況;Manning,BlumbergandMoulton(1995)討論了酒精使用的需求情況;Taylor

(2007)運用指數(shù)加權(quán)分位數(shù)回歸來預(yù)測超級市場的日銷售情況。分位數(shù)回歸的應(yīng)用在收入不平等問題研究方面:Gosling,MachinandMeghir(1996)研究了英國家庭的收入和財富的分布狀況;ConleyandGalenson(1998)探討了美國的幾個城市在19世紀中期財富的累積情況;Trede(1998)andMorillo(2000)比較了美國與德國的收入機動性。分位數(shù)回歸的應(yīng)用在金融資產(chǎn)組合研究方面:BassettandChen(2000,2001)運用分位數(shù)回歸來評估共同基金的投資類型;Barnes和Hughes(2002)研究了美國資本市場的CAMP模型;Ma和Pohlman(2005)運用分位數(shù)回歸討論了資產(chǎn)收益預(yù)測與最優(yōu)資產(chǎn)組合的構(gòu)造。分位數(shù)回歸的應(yīng)用在金融風(fēng)險研究方面:在金融市場的風(fēng)險管理中,VaR已經(jīng)成為其標志性指標。VaR能夠?qū)⒔鹑跈C構(gòu)面臨的所有種類各異、形式多樣的風(fēng)險加總成為一個簡單的數(shù)字。EngleandManganell(2004)首次在VaR的基礎(chǔ)上提出了條件VaR模型(CAViaR),并使用分位數(shù)回歸的方法來估計參數(shù),通過對數(shù)據(jù)的模擬得出了這一模型對于厚尾數(shù)據(jù)的表現(xiàn)為最優(yōu)的結(jié)論;Taylor(1999)使用分位數(shù)回歸的方法來估計多期收益的風(fēng)險值VaR;ChernozhukovandUmantsev(2001)使用分位數(shù)回歸深入研究了CVaR的模型與估計方面的問題;Chen和Chen(2003)分別用分位數(shù)回歸方法和方差-協(xié)方差法計算日經(jīng)225指數(shù)的VaR值,實證結(jié)果為前者很大程度上優(yōu)于后者;GeorgiosandLeonidas(2005)使用CAViaR模型估計了美國和希臘證券市場中的市場風(fēng)險值。我們在分位數(shù)研究方面發(fā)表的論文1.陳建寶、段景輝:中國性別工資差異的分位數(shù)回歸分析,數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2009.10,pp.87-97.2.段景輝、陳建寶:城鄉(xiāng)家庭收入差異影響因素的分位數(shù)回歸解析,經(jīng)濟學(xué)家,2009.9.No.129,pp.46-53.3.陳建寶、杜小敏:基于分位數(shù)回歸的我國居民收入和消費的實證分析,統(tǒng)計與信息論壇,2009,Vol.24,No.7,pp.44-50.4.丁軍軍、陳建寶:基于CAViaR模型的股票風(fēng)險實證分析.數(shù)據(jù)分析(臺灣),2007,Vol.2,No.4:65-78.5.陳建寶、丁軍軍:分位數(shù)回歸技術(shù)綜述.統(tǒng)計與信息論壇,200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論