面板數(shù)據(jù)的主成分分析及其應用_第1頁
面板數(shù)據(jù)的主成分分析及其應用_第2頁
面板數(shù)據(jù)的主成分分析及其應用_第3頁
面板數(shù)據(jù)的主成分分析及其應用_第4頁
面板數(shù)據(jù)的主成分分析及其應用_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第26卷第1期2009年2胃貴州大學學報(自然科學版)JournalofGuizhouUniversityCNaturalSciences)V01.26No.1Feb.2009文章編號1000—5269(2009)01-0021-03面板數(shù)據(jù)的主成分分析及其應用王培,王焱鑫(貴州大學理學院,貴州貴陽550025)摘要:主要翅多元統(tǒng)詩孛魏主成分分析方法,將各地區(qū)生產(chǎn)效率層次進行分類,驗證聚類分析結(jié)果的同時指出影響我國工業(yè)企業(yè)生產(chǎn)效率的主要原因。關鍵詞:面板數(shù)據(jù)結(jié)構(gòu);主成分分析方法;多元統(tǒng)計分析牽圖分類譬:0212。1文獻標識碼:B面板數(shù)據(jù)是同一截面單元數(shù)據(jù)集上對不同時闖段上的重復觀測值,是對聞序列和截而數(shù)據(jù)的混合數(shù)據(jù)。因此筒板數(shù)據(jù)麟時具有時間維度和截而維度的特征,從截面維度上看,是有若干個體往某一爨寸刻形成的截囂觀測煎;從對聞維度上看是溆某一個體在同一截面上形成的時間序列。由予面板數(shù)據(jù)的獨特優(yōu)點,使面板數(shù)據(jù)模型在理論及應用領域都得到了長足的發(fā)展。然{囂,這些研究戇出發(fā)點都是從計量建模的角度考慮的,且研究成果大多集中于計量經(jīng)濟學及社會學等領域。很少有學者考慮囂板數(shù)據(jù)在多元統(tǒng)計巾的分折。放BortzeD.C和HermosiUaA.Y開創(chuàng)性的將多元統(tǒng)計的方法引入到面板數(shù)據(jù)的分析中來,并用概率連接函數(shù)和遺傳算法改進了聚類分橇的算法,我恁,國外對裰關問題的研究一直停滯不前;國內(nèi)學者朱建平、鄭兵云分別對單指標面板數(shù)據(jù)及多指標面板數(shù)據(jù)的聚類分析進行了?定的騷究,并徽了實證分析H強引,為面板數(shù)據(jù)的多元統(tǒng)計分析開創(chuàng)了新的局面。然而,聚類分析只是將已知數(shù)據(jù)、觀測樣本或變挺進行分類,兩不熊告訴我船哪一個變燕是影1蠢分櫥的主要因素,這就要求我們進一步進行面板數(shù)據(jù)的主成分分析。在困內(nèi),面板數(shù)據(jù)在主成分分析中的研究尚淄空自。本文嘗試了對囂板數(shù)據(jù)的主成分分析作了一些基礎性的研究和簡單的實證分析。1面板數(shù)據(jù)的數(shù)據(jù)格式及數(shù)字特征面板數(shù)據(jù)因同時含有時闖序夢11數(shù)據(jù)和截而數(shù)據(jù),所以其統(tǒng)計特性既帶有時間序列的性質(zhì)又具有一定的橫截露特點,是一辯較為復雜魏數(shù)據(jù)結(jié)構(gòu)。在進行下面的分析之前。需要對面板數(shù)據(jù)的數(shù)據(jù)格式及數(shù)字特征有一個充分的認識,了解其基本的統(tǒng)計特性,這對我翻即將進行的主成分分析建立基礎。1?1單指標面板數(shù)據(jù)單指標面板數(shù)據(jù)的數(shù)據(jù)格式與截面數(shù)據(jù)的數(shù)據(jù)格式頗為相似。對于面板數(shù)據(jù)X°,i=1,2…。N;t=1,2….r來說,如果從橫截而上看,每一個變量都有觀測值;從縱割而上看,每一期都有觀測值,這樣的面板數(shù)據(jù)可以又一張二維表摻顯示。而對于截面數(shù)據(jù)Yd,i=1,2….N;j=1,2....P而言,從橫截廄上看,每一個指標都有觀測傣;跌指標維度看每一個截蘧也郝有觀測值,顯這樣的截而數(shù)據(jù)同樣可以用一張二維表格照示。比較發(fā)現(xiàn),當單指標面板數(shù)據(jù)的時間維度轉(zhuǎn)換為指標維度是,魏耪數(shù)據(jù)無論跌數(shù)據(jù)終槐還是統(tǒng)計特征都是相同的。在主成分分析中兩者的樣本協(xié)方差陣$及樣本相關陣冠都是相同的,因此單指標的面板數(shù)據(jù)主成分分析可以瓚鑒截而數(shù)據(jù)主成分分折結(jié)暴,這里不再贅述。1?2多指標面板數(shù)據(jù)多措探囂板數(shù)據(jù)懿數(shù)據(jù)結(jié)構(gòu)程對于單指標覆板數(shù)據(jù)要復雜的多,不同于單指標面板數(shù)據(jù)的二維表格而言,多指標面板數(shù)據(jù)除了具有截面維度和時闕維度外,逐灌加了籀標維度,因越多指標囂板數(shù)據(jù)實際上是一張三維表格。在平面上的而表示如表1【1J。設總體由W個體組成,每個個體的特征禽有P頊捺標,時闊長度為寺,殿Xij(£),i=1,2….凡;—『=1,2….P;£=I,2….r表示第i個個體第—『個指標在時刻t的數(shù)值。數(shù)璃瓣麓:2009一激一26作者簡介:王墻(1987一),女,江蘇淮安人,磷士研究生,研究方向:應饜數(shù)理統(tǒng)計。萬方數(shù)據(jù)。9。922。9。9貴捐大學警報(鑫然秘擎版)第26卷表1測量露溺與鍪指標溺鼙煎樣本1tr編號X一.鼉…墨X1_Xr..XPXt_Xr..x^1Xti(1)_^(1)_Xx,(1)X1I(班..Xu五...Xblf)X11(T)...Xb(妁…X坤(T)}Xd(l)..?《(1)…墨(1)鼉,(1)…蠢(£)…墨(£)X|1(F).Xv(r).^(T),1X一(1)..?X《(1).X,(1)以1(£).X嘻(1)…X,(£>X砒(F).X,(?).Xo(r)2面板數(shù)據(jù)的主成分分析瑟板數(shù)據(jù)的主成分分析相對于多元統(tǒng)計中的總體及樣本的主成分分析要復雜很多,目前沒有現(xiàn)成的軟件可供使用,本文試圖尋求一種途徑將多指標面板數(shù)據(jù)的結(jié)構(gòu)轉(zhuǎn)換為現(xiàn)有軟件能夠處理的數(shù)據(jù)類型。這是一種''降維〃的思想,鼯當我們多研究問題的要求不是非常嚴格時,我們可以通過取均值的方法將多指標面板數(shù)據(jù)的三維表格降為二維表格。其體的徽法如下,對每一個指櫞在時間維度上取均值,抽象為某一個特定時刻的情形,從而消去時間維度的影響,退化成截而數(shù)據(jù)。顯然地,這種''降維〃的處理方法主要存在兩個缺陷。第一,信息損失,均值只能描述平均動態(tài),不能反映其他統(tǒng)計特征,如方差等;第二,這樣的方法存在一種潛在的假設,即各個體在每一相同指標在時聞維度上的變化方向相同,否則會出現(xiàn)錯誤【1J。2.1主成分分橋的基本思想主成分分析是將多指標化為少數(shù)幾個綜合指標的一種統(tǒng)計分析方法【2J。由于指標(變量)的個數(shù)太多,并且彼此聞存在一定戇耜關性,使褒測篡在很大程度上反映著重復信息。而且變量較多,在高維空間中研究樣本的分布規(guī)律是很難實現(xiàn)的。自然她,入們希望腐較少的綜合變量采代替較多的原始變量,而這幾個綜合變量又足夠多的反映了原始變量包含的信息并且彼此相互獨立。2。2樣本主成分豹求法及性質(zhì)定理設X(;)=(XI1…,X°)7(t=l....,攙)是來自總體x的樣本.D(X)=S,S的特征值為左12A22…》Ap20,a1,a2,..°ap力穗應懿鼙位正交向量,則第i個主成分為Zi=聰1X(i=I,…。,P){入一~性質(zhì)12=+>Z(1)=(而…,,~)=0,而z,Z—fO,當i/J,?。【(rt一1)A;,當1=_『,墨i/歹時,第i個主成分的毒囂分向量五與第歹個燕成分的得分向量Z,相互正交。P1性質(zhì)2SA;=「。稱等為樣本生成分Zk酶貢i=1r獻率;又稱巫土』上生X些為樣本主成分「五….,Z°?(mV尹)懿累積貢獻率以上的定理1為我們接下來的實證分析提供了依托,性質(zhì)1主要用來對樣本進行分類,性質(zhì)2為我們確定主成分酶個數(shù)提供依據(jù)。在本文我們是按累積貢獻率答案達到一定程度(90%)來確定主成分的數(shù)目的。關于主成分分析的其他慮容覓參考文獻〔2】。2.3實證分析國有及規(guī)模以上的葛}國有企蠛在工業(yè)經(jīng)濟中占有絕對眈重,國家每年都對這類企監(jiān)進行詳細的調(diào)查。本文仍將選取這類企業(yè)作為研究對象;選取全員勞動生產(chǎn)搴、固定資本占有率、流動資本占有率三個指標考察囂有及規(guī)模以上非國有企業(yè)的生產(chǎn)效率。本文使用的數(shù)據(jù)來自中國統(tǒng)計年鑒(2001年一2006年)。具體的分析結(jié)果見熙1及表1.2001年一2006年各地區(qū)生產(chǎn)效率愈形圖圈1分析結(jié)桑萬方數(shù)據(jù)第1期王培等:面板數(shù)據(jù)的主成分分析及其應用。9。923。9。9表2固定資產(chǎn)占有率與流動資產(chǎn)占有率從圖1中可以看出,六年以來,我國工業(yè)企業(yè)中固定資產(chǎn)占有率與流動資本占有率變化較全員勞動生產(chǎn)率大,這與現(xiàn)實相符。下面我們針對主成分分析結(jié)果表2作進一步的解釋。從相關陣的特征值可以看出,第一主成分了的貢獻率已高達97.64%,前兩個主成分的累計貢獻率已達99.84%.因此只需一個主成分就能很好的概括統(tǒng)計年鑒中六年以來相關指標的數(shù)據(jù)。由最大特征值對應的特征向量可以寫出第一主成分:Z1=0.008836X1〃一0.938207Xf一0.345963X;輸出圖2是第二主成分得分對第一主成分得分的散點圖,從圖中可以看出,按生產(chǎn)效率指標可以將全國31個地區(qū)大致分成三類。表中的結(jié)果與文獻〔1)結(jié)果相似,主要表現(xiàn)為經(jīng)濟發(fā)達地區(qū)的工業(yè)企業(yè)生產(chǎn)效率一般較高(云南和新疆例外,盡管二者經(jīng)濟不發(fā)達,但生產(chǎn)效率卻與北京等發(fā)達城市歸屬一類)。然而,產(chǎn)生該分類結(jié)果除了文獻〔1)中提到的外部環(huán)境因素外,由表1知,主要由于各地區(qū)的資本占有率不同造成的。當然,還有其他如各地區(qū)的稟賦差異,競爭機制等原因綜合作用的結(jié)果。圖2輸出圖4結(jié)束語面板數(shù)據(jù)的主成分分析與聚類分析都是面板數(shù)據(jù)在多元統(tǒng)計分析應用中的一個方而,本文在文獻的基礎上對面板數(shù)據(jù)的主成分分析做了研究,相關的內(nèi)容還有很多,如各類面板數(shù)據(jù)的因子分析、判別分析等。甚至可以將面板數(shù)據(jù)與應用統(tǒng)計中的實驗數(shù)據(jù)如退化數(shù)據(jù)等結(jié)合,得到面板數(shù)據(jù)全新的應用領域,進一步的研究有待探討!參考文獻:〔1)鄭云兵.多指標而板數(shù)據(jù)的聚類分析及其應用〔J)?數(shù)理統(tǒng)計與管理,2008,27(2):265—270.〔2)商惠璇.應用多元統(tǒng)計分析〔M).北京:背景大學出版社.2006265—290.(3)ChengHsiao.AnalysisofPanelData〔M).Cambridge:CambridgeUniversityPI'L镕8,1986.〔4)朱建平,陳民肯.而板數(shù)據(jù)的聚類分析及其應用〔J)?統(tǒng)計研究。2007(4):11—14.ThePrincipalComponentAnalysisofMultivariablePaneldataanditsApplicationWANGPei,WANGYan.xin(TheScienceCollegeofGuizhouUniversing,Guiyang550025,China)Abstract:Thisarticlemainlyusedtheprincipalcomponentanalysisofthemultivariatestatisticaltoclassifytheregionalproductivitylevelsandverifytheresultsoftheclusteranalysis.Thenthemainreasonsforproductionet—ficicnc)rofChinawerepointedout.Keywords:paneldata;principalcomponentanalysis;multivariatestatistical萬方數(shù)據(jù)面板數(shù)據(jù)的主成分分析及其應用作者:王培,王焱鑫,WANGPei,WANGYan-xin作者單位:貴州大學理學院,貴州,貴陽,550025刊名:貴州大學學報(自然科學版)英文刊名:JOURNALOFGUIZHOUUNIVERSITY(NATURALSCIENCE)年,卷(期):2009,26(1)被引用次數(shù):0次參考文獻(4條)1.鄭云兵多指標面板數(shù)據(jù)的聚類分析及其應用[期刊論文]-數(shù)理統(tǒng)計與管理2008(02)2.高惠璇應用多元統(tǒng)計分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論