基于穩(wěn)健主成分回歸的統(tǒng)計(jì)數(shù)據(jù)可靠性評(píng)估方法_第1頁(yè)
基于穩(wěn)健主成分回歸的統(tǒng)計(jì)數(shù)據(jù)可靠性評(píng)估方法_第2頁(yè)
基于穩(wěn)健主成分回歸的統(tǒng)計(jì)數(shù)據(jù)可靠性評(píng)估方法_第3頁(yè)
基于穩(wěn)健主成分回歸的統(tǒng)計(jì)數(shù)據(jù)可靠性評(píng)估方法_第4頁(yè)
基于穩(wěn)健主成分回歸的統(tǒng)計(jì)數(shù)據(jù)可靠性評(píng)估方法_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于穩(wěn)健主成分回歸的統(tǒng)計(jì)數(shù)據(jù)可靠性評(píng)估方法

一、引言準(zhǔn)確可靠的統(tǒng)計(jì)數(shù)據(jù)是把握經(jīng)濟(jì)運(yùn)行情況、進(jìn)行科學(xué)決策的基礎(chǔ)。近年來(lái),社會(huì)公眾對(duì)中國(guó)官方公布的統(tǒng)計(jì)數(shù)據(jù)的關(guān)注度越來(lái)越高,其中不乏諸多質(zhì)疑。一些學(xué)者從指標(biāo)的相關(guān)性角度來(lái)檢驗(yàn)政府統(tǒng)計(jì)數(shù)據(jù)的可靠性,如Klein和Ozmucur(2002)選取了中國(guó)1981-2000年15個(gè)有代表性的相關(guān)指標(biāo),使用經(jīng)典的主成分回歸方法,對(duì)中國(guó)經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)的可靠性進(jìn)行了評(píng)估[1]。闕里、鐘笑寒(2005)進(jìn)一步將Klein和Ozmucur(2002)的評(píng)估方法運(yùn)用到了地區(qū)面板數(shù)據(jù)[2]。但這些研究存在如下不足:①這些研究沒(méi)有考慮相關(guān)指標(biāo)數(shù)據(jù)的可靠性。如果這些相關(guān)指標(biāo)本身存在異常值或者可靠性問(wèn)題,那么經(jīng)典的主成分回歸方法得到的估計(jì)結(jié)果將是不可靠的;②這些研究主要從總體上考察了經(jīng)濟(jì)增長(zhǎng)與各相關(guān)指標(biāo)的相關(guān)關(guān)系是否匹配,但沒(méi)有對(duì)主成分回歸擬合得到的異常值進(jìn)行診斷。而經(jīng)典的主成分回歸方法并不能有效地診斷出數(shù)據(jù)集中的異常值;③經(jīng)濟(jì)增長(zhǎng)率與各相關(guān)指標(biāo)間的關(guān)系在經(jīng)濟(jì)發(fā)展的不同階段可能是不穩(wěn)定的,因此基于時(shí)間序列數(shù)據(jù)或面板數(shù)據(jù)的主成分回歸對(duì)統(tǒng)計(jì)數(shù)據(jù)可靠性做出推斷可能會(huì)出現(xiàn)偏差。文獻(xiàn)中用經(jīng)典的擬合方法(如主成分分析、最小二乘回歸估計(jì))得到的診斷工具去檢測(cè)異常值。但經(jīng)典的方法可能受到異常值的影響,以致模型擬合結(jié)果并不能檢測(cè)出真正的異常值,這就是所謂的掩蓋(masking)現(xiàn)象;并且經(jīng)典的擬合方法還會(huì)使得一些正常的數(shù)據(jù)點(diǎn)表現(xiàn)為異常值,這就是所謂的淹沒(méi)(swamping)現(xiàn)象。為避免這些現(xiàn)象,可以使用穩(wěn)健統(tǒng)計(jì)方法。穩(wěn)健統(tǒng)計(jì)的目的就是試圖找到類(lèi)似于當(dāng)數(shù)據(jù)中沒(méi)有異常值時(shí)的擬合結(jié)果,進(jìn)而,從穩(wěn)健擬合得到的大的殘差中識(shí)別出異常值。本文將首次使用Hubert和Verboven(2003)提出的穩(wěn)健主成分回歸及相應(yīng)的異常值診斷方法[3],對(duì)我國(guó)地區(qū)經(jīng)濟(jì)增長(zhǎng)橫截面數(shù)據(jù)的可靠性進(jìn)行評(píng)估。穩(wěn)健主成分分析可以克服相關(guān)指標(biāo)中的異常值對(duì)主成分的影響;穩(wěn)健回歸試圖使求出的估計(jì)結(jié)果不受異常值的強(qiáng)烈影響,擬合的殘差可以更好地識(shí)別出異常值。二、異常值診斷方法關(guān)于主成分回歸的穩(wěn)健估計(jì)和異常點(diǎn)診斷,國(guó)外已有學(xué)者進(jìn)行了研究。Hubert和Verboven(2003)提出了一種新的穩(wěn)健主成分回歸方法RPCR[3],并提供了相應(yīng)的Matlab程序,該程序包含于穩(wěn)健分析工具庫(kù)LIBRA中①。RPCR方法的第一階段是將穩(wěn)健主成分分析方法ROBPCA應(yīng)用于自變量x,并得到穩(wěn)健主成分得分t;第二階段是以穩(wěn)健主成分得分t作為自變量,將因變量y對(duì)其進(jìn)行回歸,使用的回歸方法是穩(wěn)健的LTS(Leasttrimmedsqured)估計(jì)。使用RPCR方法,還可以根據(jù)有關(guān)的診斷圖有效地識(shí)別出正常觀察測(cè)值、主成分的異常值和回歸異常值。本文主要使用RPCR方法對(duì)我國(guó)地區(qū)經(jīng)濟(jì)增長(zhǎng)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行診斷,該方法簡(jiǎn)要介紹如下。(一)穩(wěn)健主成分分析RPCR的第一階段是進(jìn)行穩(wěn)健主成分分析,使得到的主成分不受異常值的影響。RPCR使用的穩(wěn)健主成分方法是Hubertetal.(2005)提出的ROBPCA方法[4],該方法組合了兩種穩(wěn)健主成分分析方法的思想,一種是基于MCD估計(jì)的穩(wěn)健的協(xié)方差矩陣方法,另一種是基于投影尋蹤(Projectionpursuit,下稱PP)技術(shù)的方法。在ROBPCA中,PP部分被用于初始數(shù)據(jù)空間的降維,而基于MCD估計(jì)的一些思想則被用于這一低維數(shù)據(jù)空間。模擬結(jié)果表明,這一組合方法可以產(chǎn)生比投影尋蹤方法更為精確的結(jié)果。ROBPCA方法的一個(gè)重要參數(shù)是允許數(shù)據(jù)集中未被污染的觀測(cè)值的最高比例α,該方法默認(rèn)α取值75%,即當(dāng)數(shù)據(jù)集中至多包含25%的異常值時(shí),該方法也能給出正確的分析結(jié)果。當(dāng)懷疑數(shù)據(jù)集中所包含的異常值比例更高時(shí),α最低可取50%。(二)穩(wěn)健回歸為估計(jì)式(2)的參數(shù),一般使用重復(fù)加權(quán)的LTS估計(jì)方法[5],該方法非常穩(wěn)健,具有高達(dá)50%的破壞點(diǎn)(Breakdownpoint)。模型參數(shù)的LTS估計(jì)定義如下:(三)RPCR中主成分?jǐn)?shù)目的選擇RPCR的另一個(gè)重要問(wèn)題是主成分?jǐn)?shù)目的選擇,最受歡迎的一種準(zhǔn)則是交叉驗(yàn)證的最小化誤差均方根,公式如下:式(5)中,是將第i個(gè)觀察值作為驗(yàn)證樣本,先從數(shù)據(jù)集中刪除第i個(gè)觀察值,使用k個(gè)主成分得分進(jìn)行主成分回歸,再對(duì)其進(jìn)行預(yù)測(cè)得到的預(yù)測(cè)值。具有最小的所對(duì)應(yīng)的k就是最優(yōu)的主成分的數(shù)目。然而,統(tǒng)計(jì)量并不適合于被污染的數(shù)據(jù)集,因?yàn)檫@個(gè)統(tǒng)計(jì)量也包含了對(duì)異常值的預(yù)測(cè)。為此,Hubert和Verboven(2003)建議使用穩(wěn)健的RMSECV統(tǒng)計(jì)量(R-RMSECV)進(jìn)行主成分?jǐn)?shù)目的選擇[3]。R-RMSECV是一種關(guān)于模型對(duì)新觀測(cè)值預(yù)測(cè)能力的穩(wěn)健度量。如果想察看模型對(duì)給定觀測(cè)值的擬合情況,可以定義另一種類(lèi)似的擬合程度準(zhǔn)則——均方根誤(RMSE)。RMSE準(zhǔn)則是將式(5)中的替換為使用包括第i個(gè)觀測(cè)值在內(nèi)的所有觀測(cè)值得到的擬合值。同樣的,為避免異常值的影響,可計(jì)算不包括異常值在內(nèi)的穩(wěn)健的RMSE(RRMSE)。據(jù)此,Engelen和Hubert(2005)定義了另一種穩(wěn)健的主成分選擇統(tǒng)計(jì)量(RCS)如下[7]:式(6)中,γ∈[0,1]為調(diào)節(jié)參數(shù)。如果更看重?cái)M合能力,則選擇較小的γ(接近于0);如果更看重預(yù)測(cè)的質(zhì)量,則選擇較大的γ(接近于1)。繪制對(duì)k的曲線圖,可以輕易地選擇最合適的k。(四)異常值的診斷方法1.主成分異常值的診斷在第一階段的ROBPCA分析過(guò)程中,可以使用正交距離OD對(duì)得分距離SD診斷圖識(shí)別出主成分得分空間(x空間)的異常值。該圖的橫軸繪制了每個(gè)p維觀察值x的穩(wěn)健得分距離SD,該圖的縱軸是各個(gè)觀察測(cè)值到其映射到k維主成分子空間的正交距離OD。為對(duì)主成分子空間的觀測(cè)值進(jìn)行分類(lèi),可畫(huà)出SD和OD兩條臨界線。橫軸的得分距離SD的臨界值為,超過(guò)這一臨界值的觀測(cè)值可看作是主成分子空間的異常值。由于正交距離OD的精確分布未知,其臨界值較難確定,Hubert等(2005)提供了該統(tǒng)計(jì)量的近似分布及臨界值[4]。根據(jù)穩(wěn)健主成分診斷圖,可將x空間的觀測(cè)值劃分為四種類(lèi)型:正常觀測(cè)值(SD和OD均小)、好的主成分杠桿點(diǎn)(SD大,OD?。?、正交異常值(SD小,OD大)以及壞的主成分杠桿點(diǎn)(SD大,OD大),后兩種觀測(cè)值是對(duì)經(jīng)典的主成分分析結(jié)果有很大危害的異常值。2.回歸異常值的診斷根據(jù)回歸模型以及殘差診斷圖,可畫(huà)出SD和RD的兩條臨界線,將觀測(cè)值分為四類(lèi):正常觀測(cè)值(SD小,RD絕對(duì)值?。?、好的杠桿點(diǎn)(SD大,RD絕對(duì)值?。?、縱向異常值(SD小,RD絕對(duì)值大)以及壞的杠桿點(diǎn)(SD大,RD絕對(duì)值大),縱向異常點(diǎn)和壞的杠桿點(diǎn)是對(duì)經(jīng)典的OLS估計(jì)危害最大的異常值,因?yàn)樗鼈兣で俗兞块g的線性關(guān)系。三、指標(biāo)選擇和數(shù)據(jù)處理(一)指標(biāo)選擇在上述所選指標(biāo)中,固定資產(chǎn)投資、消費(fèi)品零售總額、出口額等3個(gè)指標(biāo)是與支出法GDP各組成部分直接相關(guān)的;貨運(yùn)量是體現(xiàn)工業(yè)增長(zhǎng)的良好指標(biāo);郵電業(yè)務(wù)量反映了作為服務(wù)業(yè)重要方面的信息化產(chǎn)業(yè)的發(fā)展?fàn)顩r;財(cái)政支出作為政府分配的重要組成部分,對(duì)經(jīng)濟(jì)增長(zhǎng)有著不可低估的作用;稅收收入是建立在增加值的活動(dòng)基礎(chǔ)上的,應(yīng)該是個(gè)能較好地反映經(jīng)濟(jì)增長(zhǎng)狀況的指標(biāo);中國(guó)的經(jīng)濟(jì)增長(zhǎng)嚴(yán)重依賴于信貸擴(kuò)張,經(jīng)濟(jì)增長(zhǎng)情況很有可能從這一指標(biāo)中顯現(xiàn)出來(lái);就業(yè)和收入增長(zhǎng)是經(jīng)濟(jì)增長(zhǎng)的必然結(jié)果,其與經(jīng)濟(jì)增長(zhǎng)應(yīng)該有緊密的聯(lián)系,因此,本研究還選取了農(nóng)民人均純收入、城鎮(zhèn)居民可支配收入和城鎮(zhèn)從業(yè)人員等指標(biāo);最后,能源消費(fèi)特別是電力消費(fèi)是經(jīng)濟(jì)發(fā)展的同步指標(biāo),應(yīng)該能直接反映經(jīng)濟(jì)運(yùn)行狀況。這些指標(biāo)與Klein和Ozmucur(2002)研究中相同的有等4個(gè)指標(biāo),與闕里和鐘笑寒(2005)的研究中相同的有等5個(gè)指標(biāo),與上述研究均不相同的有等5個(gè)指標(biāo)。(二)數(shù)據(jù)處理本文以2008年我國(guó)地區(qū)橫截面數(shù)據(jù)為例,說(shuō)明穩(wěn)健主成分回歸方法在數(shù)據(jù)可靠性評(píng)估方面的應(yīng)用。為此,本文搜集了2007年和2008年各地區(qū)的經(jīng)濟(jì)增長(zhǎng)以及前文所述的12個(gè)指標(biāo)的數(shù)據(jù),除銀行信貸數(shù)據(jù)來(lái)源于相應(yīng)年份的《中國(guó)金融年鑒》外,其他的數(shù)據(jù)都來(lái)源于《中國(guó)統(tǒng)計(jì)年鑒》。由于西藏缺失電力消費(fèi)數(shù)據(jù),未列入本文的分析,因此,實(shí)際列入本文分析的有30個(gè)地區(qū),各地區(qū)及其相應(yīng)的編號(hào)見(jiàn)下頁(yè)表1。對(duì)于搜集到的數(shù)據(jù),還需要將其轉(zhuǎn)化為增長(zhǎng)率的形式。對(duì)于2008年各地區(qū)的環(huán)比地區(qū)生產(chǎn)總值指數(shù),本文直接將其減100,即得到各地區(qū)的經(jīng)濟(jì)增長(zhǎng)率數(shù)據(jù);對(duì)于其他表現(xiàn)為絕對(duì)數(shù)的總量指標(biāo),本文用2008年的數(shù)據(jù)除以2007年的數(shù)據(jù)減去1再乘以100的方法②。由于按現(xiàn)價(jià)計(jì)算的價(jià)值指標(biāo)所求得的增長(zhǎng)率都是名義增長(zhǎng)率,因此,有必要對(duì)其調(diào)整,消除數(shù)據(jù)中通貨膨脹的影響。本文用美國(guó)的消費(fèi)價(jià)格指數(shù)(CPI)對(duì)各地區(qū)出口額的名義增長(zhǎng)率進(jìn)行調(diào)整,用各地區(qū)的生產(chǎn)者價(jià)格指數(shù)(PPI)對(duì)銀行信貸名義增長(zhǎng)率進(jìn)行調(diào)整,用各地區(qū)的CPI指數(shù)對(duì)其他價(jià)值指標(biāo)的名義增長(zhǎng)率進(jìn)行了調(diào)整。最終整理出各地區(qū)各指標(biāo)相對(duì)應(yīng)的增長(zhǎng)率數(shù)據(jù)(單位:%),各地區(qū)經(jīng)濟(jì)增長(zhǎng)率(y)以及相關(guān)指標(biāo)增長(zhǎng)率()。四、診斷結(jié)果及分析根據(jù)前文所選的2008年30個(gè)地區(qū)的橫截面數(shù)據(jù)集,本文以地區(qū)經(jīng)濟(jì)增長(zhǎng)(y)為因變量,以12個(gè)相關(guān)指標(biāo)的增長(zhǎng)率()為自變量,運(yùn)用基于穩(wěn)健主成分回歸(RPCR)的異常值診斷方法對(duì)地區(qū)經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)的可靠性進(jìn)行評(píng)估,并與經(jīng)典的主成分回歸分析(CPCR)診斷結(jié)果進(jìn)行比較。在分析的過(guò)程中,由于事先并不知道數(shù)據(jù)集中異常數(shù)據(jù)的可能比例,本研究直接將可能包含的異常值的比例設(shè)為允許的最高限50%。利用Matlab軟件穩(wěn)健分析工具箱LIBRA,進(jìn)行穩(wěn)健主成分回歸及診斷的步驟如下。(一)穩(wěn)健主成分分析及主成分空間異常值診斷結(jié)果1.穩(wěn)健主成分分析及主成分?jǐn)?shù)目的選擇穩(wěn)健主成分回歸分析的第一步是進(jìn)行穩(wěn)健主成分分析(ROBPCA),并選擇最優(yōu)數(shù)目的主成分。如果研究的目的只是進(jìn)行主成分分析,可以直接根據(jù)主成分的方差貢獻(xiàn)率和碎石圖來(lái)選擇主成分的數(shù)目。然而,本文的目的是進(jìn)行穩(wěn)健主成分回歸,還要考慮所選主成分對(duì)因變量的預(yù)測(cè)能力和擬合能力。因此,本文根據(jù)前文介紹的穩(wěn)健主成分選擇統(tǒng)計(jì)量(下稱RCS)選擇最優(yōu)主成分?jǐn)?shù)目。根據(jù)前文提供的各相關(guān)指標(biāo)增長(zhǎng)率的數(shù)據(jù)集,使用Matlab軟件的RPCR函數(shù)可直接繪制當(dāng)γ=0,0.5和1時(shí)的RCS曲線圖,見(jiàn)圖1。由圖1可見(jiàn),當(dāng)k=6時(shí),RCS曲線變得較為平緩,并且當(dāng)k=6時(shí)與k=10時(shí)的預(yù)測(cè)誤差差異很小。為了避免維度詛咒問(wèn)題,一般建議n>5k[8],因此,在ROBPCA中本文選擇保留6個(gè)穩(wěn)健主成分,這6個(gè)穩(wěn)健主成分的方差貢獻(xiàn)達(dá)97.57%。同時(shí),為便于對(duì)比,在CPCA中也選擇保留了6個(gè)主成分。2.主成分空間異常值的診斷在ROBPCA以及CPCA分析過(guò)程中,可以使用正交距離OD對(duì)得分距離SD診斷圖識(shí)別出主成分空間的異常值,兩種方法得分距離SD的臨界值都為=3.80;但正交距離OD的臨界值不同,ROBPCA分析中正交距離OD的臨界值為8.63,CPCA分析中正交距離的臨界值為11.21。超過(guò)這些臨界值的點(diǎn)可被診斷為主成分異常點(diǎn)。ROBPCA以及CPCA診斷圖見(jiàn)圖2(a)、(b)。由圖2(a)ROBPCA診斷圖可見(jiàn),四川(23)、青海(28)等省份的相關(guān)指標(biāo)增長(zhǎng)率數(shù)據(jù)被診斷為壞的主成分杠桿點(diǎn),這些觀測(cè)值對(duì)CPCA有很大的破壞作用;寧夏(29)的相關(guān)指標(biāo)數(shù)據(jù)被診斷為正交異常值,這一數(shù)據(jù)點(diǎn)距主成分子空間的正交距離很大,但對(duì)CPCA沒(méi)有影響;而北京(1)、天津(2)、山西(4)、海南(21)、甘肅(27)和新疆(30)等省份的數(shù)據(jù)被診斷為好的主成分杠桿點(diǎn),這些觀測(cè)值雖然遠(yuǎn)離正常觀測(cè)值,但其距主成分子空間的距離很近;除此之外,其他省份的數(shù)據(jù)都是正常觀察測(cè)值。與之相比,由于受異常值本身的影響,CPCA診斷圖僅識(shí)別出四川(23)的數(shù)據(jù)為好的主成分杠桿點(diǎn)(見(jiàn)圖2(b)),而其他省份相關(guān)指標(biāo)的數(shù)據(jù)都為正常觀測(cè)值。可見(jiàn),ROBPCA方法能更好地診斷出主成分空間的異常值。(二)穩(wěn)健主成分回歸及異常值診斷結(jié)果1.穩(wěn)健主成分回歸結(jié)果及分析穩(wěn)健主成分回歸分析(RPCR方法)的第二步是在由ROBPCA提取的穩(wěn)健主成分的基礎(chǔ)上,進(jìn)一步運(yùn)用穩(wěn)健的LTS估計(jì)方法,將因變量對(duì)主成分得分進(jìn)行回歸,以克服異常值對(duì)估計(jì)結(jié)果的影響。根據(jù)上文所選的6個(gè)穩(wěn)健主成分,可計(jì)算穩(wěn)健主成分得分變量,并進(jìn)一步運(yùn)用穩(wěn)健的LTS估計(jì)方法,將經(jīng)濟(jì)增長(zhǎng)率(y)與這些主成分得分變量()進(jìn)行回歸分析,并得到穩(wěn)健回歸結(jié)果,見(jiàn)表2③。作為比較,表2同時(shí)給出了由CPCA保留6個(gè)主成分時(shí),進(jìn)一步使用OLS估計(jì)方法得到的CPCR估計(jì)結(jié)果。由表2可見(jiàn),由LTS估計(jì)得到的穩(wěn)健達(dá)0.9666,穩(wěn)健LTS回歸模型擬合效果很好,說(shuō)明這些主成分得分對(duì)經(jīng)濟(jì)增長(zhǎng)率有很強(qiáng)的解釋能力。相比之下,受可能存在的異常值的影響,由OLS估計(jì)得到的只有0.6688④。為了驗(yàn)證經(jīng)濟(jì)增長(zhǎng)率與各相關(guān)指標(biāo)是否匹配,根據(jù)穩(wěn)健主成分特征向量及上述回歸系數(shù),將這些系數(shù)還原為各相關(guān)指標(biāo)增長(zhǎng)率的系數(shù)(即經(jīng)濟(jì)增長(zhǎng)率對(duì)各相關(guān)指標(biāo)的偏導(dǎo)數(shù),也是地區(qū)生產(chǎn)總值對(duì)各相關(guān)指標(biāo)的彈性),具體見(jiàn)表3。作為比較,表3也列出了使用CPCR方法且保留6個(gè)主成分時(shí),最后還原得到的各相關(guān)指標(biāo)增長(zhǎng)率的系數(shù)。由RPCR分析結(jié)果可見(jiàn),除等指標(biāo)外,其余各指標(biāo)增長(zhǎng)率的系數(shù)均為正,符合經(jīng)濟(jì)學(xué)的規(guī)律。出口增長(zhǎng)率的系數(shù)為負(fù),反映了2008年我國(guó)受?chē)?guó)際金融危機(jī)影響,外部需求顯著減少、出口明顯下滑,經(jīng)濟(jì)增長(zhǎng)主要靠?jī)?nèi)需拉動(dòng)的現(xiàn)實(shí);郵電業(yè)務(wù)增長(zhǎng)率的系數(shù)為負(fù),可能是由于該指標(biāo)存在測(cè)量誤差,近年來(lái),隨著現(xiàn)代信息技術(shù)的快速發(fā)展,郵電業(yè)務(wù)的形式發(fā)生了很大改變,而郵電業(yè)務(wù)的統(tǒng)計(jì)口徑卻仍保持不變;財(cái)政支出增長(zhǎng)率的系數(shù)為負(fù),可能原因是2008年重大自然災(zāi)害頻繁發(fā)生,為應(yīng)對(duì)災(zāi)害,受災(zāi)地區(qū)財(cái)政支出增長(zhǎng)較快,而災(zāi)害對(duì)地區(qū)經(jīng)濟(jì)增長(zhǎng)也具有一定負(fù)面影響;電力消費(fèi)增長(zhǎng)率的系數(shù)為負(fù),說(shuō)明2008年我國(guó)地區(qū)電力消費(fèi)增長(zhǎng)與經(jīng)濟(jì)增長(zhǎng)率出現(xiàn)不同步現(xiàn)象,這也是包括華爾街日?qǐng)?bào)、國(guó)際能源署在內(nèi)的一些境內(nèi)外媒體和國(guó)際組織對(duì)中國(guó)經(jīng)濟(jì)數(shù)據(jù)可信度質(zhì)疑的原因之一,國(guó)家能源局(2009)從產(chǎn)業(yè)結(jié)構(gòu)變化、高載能產(chǎn)品“去庫(kù)存化”、產(chǎn)業(yè)能耗下降等方面對(duì)此現(xiàn)象做了解釋說(shuō)明[9]??傊?,基本可以認(rèn)為地區(qū)經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)與相關(guān)指標(biāo)數(shù)據(jù)是匹配的。CPCR的分析結(jié)果中,除電力消費(fèi)增長(zhǎng)率之外,其余各指標(biāo)增長(zhǎng)率系數(shù)的符號(hào)都與RPCR的分析結(jié)果相同。然而,這些系數(shù)的大小不盡相同,有些差異還比較大,如等。相比之下,由于RPCR考慮了數(shù)據(jù)中可能存在的異常值的影響,其分析結(jié)果相對(duì)更加可靠。2.穩(wěn)健主成分回歸中異常值診斷結(jié)果及分析由圖3(a)RPCR殘差診斷圖可得如下結(jié)論:北京(1)、天津(2)、山西(4)、海南(21)、四川(23)、甘肅(27)等地區(qū)的得分距離都超出了臨界值,但其標(biāo)準(zhǔn)化殘差絕對(duì)值很小,這些地區(qū)的數(shù)據(jù)被診斷為好的杠桿點(diǎn);內(nèi)蒙古(5)、青海(28)、新疆(30)等地區(qū)的得分距離和標(biāo)準(zhǔn)化殘差絕對(duì)值都很大,因此可看作是壞的杠桿點(diǎn);吉林(7)、黑龍江(8)、安徽(12)、江西(14)、寧夏(29)等地區(qū)的得分距離雖然很小,但其標(biāo)準(zhǔn)化殘差絕對(duì)值都很大,因此可看作是縱向異常點(diǎn);其余地區(qū)的數(shù)據(jù)可看作是正常觀測(cè)值。相比之下,由圖3(b)CPCR診斷圖可見(jiàn),只有四川(23)被診斷為好的杠桿點(diǎn),內(nèi)蒙古(5)被診斷為縱向異常點(diǎn)??梢?jiàn),由穩(wěn)健的RPCR方法克服了異常值的影響,診斷出了更多的異常值,可以有效地解決基于經(jīng)典的CPCR的診斷方法容易出現(xiàn)的多個(gè)異常點(diǎn)的掩蓋現(xiàn)象。結(jié)合異常值產(chǎn)生的背景,對(duì)2008年各地區(qū)經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)的可靠性進(jìn)行判斷。根據(jù)穩(wěn)健的RPCR的診斷結(jié)果,北京(1)、天津(2)、山西(4)、海南(21)、四川(23)、甘肅(27)等地區(qū)的穩(wěn)健得分距離雖然被診斷為異常點(diǎn),但這些地區(qū)的數(shù)據(jù)對(duì)模型擬合得很好,因此,可以認(rèn)為這些地區(qū)的經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)是可靠的;內(nèi)蒙古(5)、青海(28)、新疆(30)等地區(qū)的數(shù)據(jù)被診斷為壞的杠桿點(diǎn),這些地區(qū)的得分距離和標(biāo)準(zhǔn)化殘差都表現(xiàn)為異常,這一方面可能是這些地區(qū)的經(jīng)濟(jì)增長(zhǎng)及相關(guān)指標(biāo)數(shù)據(jù)的可靠性存在問(wèn)題。另一方面有可能與這些地區(qū)的特殊發(fā)展背景有關(guān),如自2002年以來(lái)內(nèi)蒙古經(jīng)濟(jì)增速蟬聯(lián)我國(guó)第一,“內(nèi)蒙古現(xiàn)象”全國(guó)矚目。2008年內(nèi)蒙古經(jīng)濟(jì)增速達(dá)17.2%,與其能牢牢抓住產(chǎn)業(yè)轉(zhuǎn)移機(jī)遇,把自然資源稟賦比較優(yōu)勢(shì)化為競(jìng)爭(zhēng)優(yōu)勢(shì)等多方面的因素有關(guān);吉林(7)、黑龍江(8)、安徽(12)、江西(14)、寧夏(29)等地區(qū)的數(shù)據(jù)被診斷為縱向異常點(diǎn),說(shuō)明在現(xiàn)有的數(shù)據(jù)集中,這些地區(qū)經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)的可靠性可能存在問(wèn)題。其中,吉林(7)、黑龍江(8)等地區(qū)的經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù)可能被高估,而安徽(12)、江西(14)、寧夏(29)等地區(qū)的經(jīng)濟(jì)增長(zhǎng)速度數(shù)據(jù)反而有被低估的可能。五、結(jié)論總結(jié)全文,本

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論