主成分分析和因子分析在評(píng)價(jià)區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用_第1頁
主成分分析和因子分析在評(píng)價(jià)區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用_第2頁
主成分分析和因子分析在評(píng)價(jià)區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用_第3頁
主成分分析和因子分析在評(píng)價(jià)區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用_第4頁
主成分分析和因子分析在評(píng)價(jià)區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、年第期現(xiàn)代管理科學(xué)名家觀察主成分分析和因子分析在評(píng)價(jià)區(qū)域經(jīng)濟(jì)發(fā)展水平中的應(yīng)用賈萬敬何建敏摘要:文章從主成分分析、因子分析的發(fā)展過程、基本原理、應(yīng)用等方面出發(fā)來全面地介紹多元數(shù)據(jù)處理的主要方法。文章以江蘇省各地市經(jīng)濟(jì)發(fā)展水平為例,根據(jù)江蘇省各市年的國民經(jīng)濟(jì)主要統(tǒng)計(jì)指標(biāo),利用軟件處理的結(jié)果來說明上述方法在評(píng)價(jià)江蘇省各地市的經(jīng)濟(jì)發(fā)展水平中的應(yīng)用。關(guān)鍵詞:主成分分析;因子分析;區(qū)域經(jīng)濟(jì)一、引言我國是一個(gè)經(jīng)濟(jì)與社會(huì)發(fā)展水平,資源與環(huán)境稟賦情況在各區(qū)域間差異非常大的國家。自科學(xué)發(fā)展觀提出以來,區(qū)域經(jīng)濟(jì)協(xié)調(diào)發(fā)展的研究得到了充分的重視。要制訂出促進(jìn)區(qū)域經(jīng)濟(jì)協(xié)調(diào)發(fā)展的有效政策,首先,必需對(duì)區(qū)域經(jīng)濟(jì)發(fā)展的水平做出

2、合理的評(píng)價(jià),從中找出形成區(qū)域經(jīng)濟(jì)發(fā)展水平差異的關(guān)鍵因素。主成分分析和因子分析是多元統(tǒng)計(jì)中十分常用的兩種方法,本文將著重介紹這兩種方法的基本原理、數(shù)學(xué)模型以便從根本上揭示出這兩種方法的區(qū)別。本文還將介紹主成分分析和因子分析的發(fā)展歷程和應(yīng)用領(lǐng)域。結(jié)合江蘇省區(qū)域經(jīng)濟(jì)發(fā)展的現(xiàn)狀,選取反映的,而協(xié)方差矩陣對(duì)劣點(diǎn)值相當(dāng)敏感,為了增強(qiáng)主成分分析的穩(wěn)健性,對(duì)協(xié)方差進(jìn)行算法改進(jìn),從而提高主成分分析的穩(wěn)健性。主成分綜合評(píng)價(jià)應(yīng)用中也存在很大爭議,有的學(xué)者就提出了究竟應(yīng)選取多少個(gè)主成分來對(duì)樣本進(jìn)行排序的問題。一般來說,主要有兩種觀點(diǎn):一是只用第一主成分,英國統(tǒng)計(jì)學(xué)家肯德爾認(rèn)為:第一主成分能夠最大限度地反映樣本間的差異

3、,是概括指標(biāo)差異信息的最佳線性函數(shù)。因此,只能用第一主成分對(duì)樣本綜合排序。我國也有部分學(xué)者持這種觀點(diǎn),南開大學(xué)孟生旺老師從幾何投影角度闡明,在多指標(biāo)綜合評(píng)價(jià)中,只有第一主成分結(jié)合原始數(shù)據(jù)的信息最多,因而也就只能以第一主成分值作為綜合評(píng)價(jià)值才合理。另一種觀點(diǎn)則認(rèn)為,不僅要充分重視第一主成分,而且也要顧及其它主成分在綜合評(píng)價(jià)中所起的作用,否則,損失的信息較多,有時(shí)甚至回歪曲樣本間的實(shí)際相對(duì)地位。提出的改進(jìn)辦法是:先按累積方差貢獻(xiàn)率不低于某個(gè)閥值(比如)的原則確定前幾個(gè)主成分,然后以每個(gè)主成分各自的貢獻(xiàn)率為權(quán)數(shù)將選定主成分線性加權(quán)求和來綜合評(píng)價(jià)樣本的優(yōu)劣。()主成分分析的原理。主成分分析是一種通過降

4、維技術(shù)把多個(gè)變量把多個(gè)變量化為少數(shù)幾個(gè)主成分的統(tǒng)計(jì)分析分析方法。這些主成分能夠反映原始變量的絕大部分信息,它們通常表示為原始變量的某種線形組合。當(dāng)原來年江蘇省個(gè)地級(jí)市經(jīng)濟(jì)發(fā)展水平的個(gè)主要統(tǒng)計(jì)指標(biāo),運(yùn)用因子分析方法對(duì)江蘇省各地級(jí)市的經(jīng)濟(jì)發(fā)展的基本狀況進(jìn)行綜合評(píng)價(jià)。二、分析方法簡介統(tǒng)計(jì)推斷的理論工作大多數(shù)都是基于總體為多元正態(tài)的假定,然而在高于一維的情況下,要說明一組樣本來自多元正態(tài)總體是非常困難的,而且多個(gè)變量使用的測量單位也可能各不相同或者變量間的數(shù)值大小相差很大。因此,要對(duì)多元數(shù)據(jù)進(jìn)行處理,通常將初始變量標(biāo)準(zhǔn)化。主成分分析。()主成分綜合評(píng)價(jià)的產(chǎn)生和發(fā)展。主成分分析()的概念最早在年由皮爾遜

5、()首先引入,對(duì)非隨機(jī)變量討論,年數(shù)學(xué)家霍特林()把它推廣到隨機(jī)向量。和對(duì)主成分分析進(jìn)行了較為系統(tǒng)地分析和闡述,而郭亞軍教授系統(tǒng)地論述了綜合評(píng)價(jià)的理論和方法,雖然目前還沒有關(guān)于主成分綜合評(píng)價(jià)方法的專著,但很多專家學(xué)者對(duì)其進(jìn)行了探討和研究。一些學(xué)者從不同的角度提出的穩(wěn)健性問題,對(duì)此進(jìn)行了研究,并且提出了各自的改進(jìn)算法。有學(xué)者提出了獨(dú)立主成分分析()的概念,引入非線性算法。也有學(xué)者從如何去除或減弱有限的樣本集中少量“劣點(diǎn)”樣本的影響從而獲得準(zhǔn)確主方向。常用的主成分分析是從樣本協(xié)方差矩陣來計(jì)算個(gè)變量的總變差能夠由少數(shù)幾個(gè)線形組合來概括的話,那么這些線形組合中包含的信息與原來個(gè)變量幾乎一樣多,可以用這

6、些線形組合替代原來的個(gè)變量,這樣會(huì)是觀測數(shù)據(jù)從高維降到低維,簡化了數(shù)據(jù)。主成分就是個(gè)變量,的一些特殊線形組合,這些線形組合把,構(gòu)成的坐標(biāo)系旋轉(zhuǎn)產(chǎn)生新的坐標(biāo)系,在新坐標(biāo)系中提供了協(xié)差陣的簡潔表示。以(,)表示標(biāo)準(zhǔn)化的原變量,(,)表示主成分,(,;,)表示組合系數(shù),主成分分析的模型為:名家觀察現(xiàn)代管理科學(xué)年第期主成分分析一般不是目的,而()主成分分析的應(yīng)用。是研究的某個(gè)中間環(huán)節(jié),通過這一處理來發(fā)現(xiàn)重要的變量和變量間的某種關(guān)系。在因子分析法中,通常用主成分分析法來確定公共因子。當(dāng),表示個(gè)指標(biāo)時(shí)該模型為型模型,當(dāng),表示個(gè)樣品時(shí)該模型為型模型。式中:(,)是可測個(gè)指標(biāo)構(gòu)成的維隨機(jī)向量;(,)是不可觀測

7、的向量,稱為的公共因子;稱為因子載荷,它是第個(gè)變量在第個(gè)公共因子上的負(fù)荷,矩陣稱為因子載荷矩陣;稱為的特殊因中包括了隨機(jī)誤差。因子分析可以分解為確定因子載子,荷、因子旋轉(zhuǎn)及計(jì)算因子得分三個(gè)步驟。系數(shù)陣是初始因子載荷陣,因子載荷的統(tǒng)計(jì)意義就是第個(gè)變量與第個(gè)公共因子之間的相關(guān)系數(shù)。估計(jì)主軸因子法、最小二有多種方法,如主成分分析法、乘法、極大似然法、因子提取法等。其中主成分法應(yīng)用最為廣泛,因子分析與主成分分析并沒有原理上的實(shí)質(zhì)聯(lián)系,主要是外觀的聯(lián)系。因?yàn)橛弥鞒煞址ǖ玫匠跏驾d荷陣因子分析。()因子分析方法的產(chǎn)生和發(fā)展。因子分析()方法最早是在年由斯皮爾曼(對(duì)智)和皮爾遜()在一篇著名論文力測驗(yàn)得分進(jìn)行

8、統(tǒng)計(jì)分析中提出,之后被用于解決心理學(xué)和教育學(xué)方面的問題。由于這種方法計(jì)算量大,到了世紀(jì)年代得益于計(jì)算機(jī)的應(yīng)用才有新的發(fā)展。型因子分析認(rèn)為變量中存在一些不可觀測的共同因素同時(shí)對(duì)原始變量產(chǎn)生影響,需要通過一定的方法提取“重要”的公重要性”取決于因子對(duì)變量的影響程度,用二者共因子;“之間的相關(guān)系數(shù)(因子載荷)表示。根據(jù)變量與各因子的緊密”程度,把原始變量歸結(jié)到各因子中,通過這些“精“煉”的因子認(rèn)識(shí)復(fù)雜現(xiàn)象。因子分析的目的是用幾個(gè)不可觀測的隱變量來解釋原始變量間的協(xié)方差關(guān)系。()因子分析的原理。因子分析是假定個(gè)變量的變異主要是一些共同的因子引起的,希望用少數(shù)幾個(gè)公共因子來解釋變量中的主要變化。由于樣本

9、內(nèi)含樣品和指標(biāo)的兩維性,因子分析分為型和型,前者是基于指標(biāo)的分析,而后者是基于樣品的分析。因子分析的數(shù)學(xué)模型(正交因子模型)為:(,),是的特征根對(duì)應(yīng)的單位特征向量,它也是主成分分析系數(shù)陣第個(gè)系數(shù)向量,所以第列系數(shù)向量與第行系數(shù)向量僅相差倍數(shù)。用主成分法確定因子載荷的方法比較簡單,但是這種方法所得到的特殊因子,之間并不相互獨(dú)立,因此,用主成分法確定因子載荷不完全符合因子模型的假設(shè)前提,也就是說所得的因子載荷并不完全正確。但是當(dāng)共同度較大時(shí),特殊因子所引起的作用較小,因而特殊因子之間的相關(guān)性所帶來的影響就幾乎可以忽略。由于滿足上述模型的系數(shù)陣不唯一,這成為因子載荷陣旋轉(zhuǎn)的理論依據(jù)。一般情況下,初

10、始因子載荷陣中各變量對(duì)因子的系數(shù)沒有靠近兩極數(shù)值“和“,說明各變量在每個(gè)因子”上“分量”差不多,各因子并不“偏向”某些變量,這樣很難提煉公共因子的意義,因此要旋轉(zhuǎn),改變它的坐標(biāo)系,使變量“偏向”不同的因子,并根據(jù)系數(shù)絕對(duì)值對(duì)變量歸類指標(biāo)人均表年江蘇省各市國民經(jīng)濟(jì)主要統(tǒng)計(jì)指標(biāo)高新技術(shù)第二產(chǎn)第三產(chǎn)第三產(chǎn)城鎮(zhèn)固定地方財(cái)政規(guī)模以規(guī)模以上社會(huì)消費(fèi)消費(fèi)品總收入(億元)上工業(yè)工業(yè)利稅品零售總零售總增加值(億元)總額(億元)額(億元)額增長率()增長率產(chǎn)業(yè)產(chǎn)業(yè)產(chǎn)值業(yè)產(chǎn)值業(yè)產(chǎn)值資產(chǎn)投資值(億元)(億元)(億元)增長率(億元)(元人)()()城市南京無錫徐州常州蘇州南通連云港淮安鹽城揚(yáng)州鎮(zhèn)江泰州宿遷年第期命名,最

11、常用的旋轉(zhuǎn)方法是最大方差正交旋轉(zhuǎn)。現(xiàn)代管理科學(xué)名家觀察驗(yàn)?zāi)康氖谴_定所要求的數(shù)據(jù)是否取自多元正態(tài)分布的總體,若差異檢驗(yàn)的值顯著,表示所取的數(shù)據(jù)來自正態(tài)分布總體,可以做進(jìn)一步分析;檢驗(yàn)?zāi)康氖欠治鲇^測變量之間的簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對(duì)大小來確定該數(shù)據(jù)是否適合進(jìn)行因子分析,取值變化在之間,若過小,說明變量之間的相關(guān)不能被其他變量解釋,進(jìn)行因子分析不適合。通過軟件計(jì)算得到以上數(shù)據(jù)的檢驗(yàn)的值等于,表明所取的數(shù)據(jù)來自正態(tài)分布的總體;檢驗(yàn)值為,因此適合做因子分析。本文使用對(duì)數(shù)據(jù)進(jìn)行因子分析,采用主成分法提取特征值大于的主成分作為公共因子,得到方差最大正交旋轉(zhuǎn)后的因子載荷矩陣、特征值、貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。

12、特征值大于的前兩個(gè)公因子的累計(jì)貢獻(xiàn)率已達(dá)到,可見提取個(gè)因子后,它們反映了原始變量的大部分信息。從旋轉(zhuǎn)后的因子載荷矩陣可以得到個(gè)原始變量與這個(gè)因子之間的表達(dá)式如下:近年來,隨著現(xiàn)代高速電子計(jì)算()因子分析的應(yīng)用。機(jī)的出現(xiàn),人們將因子分析的理論成功地應(yīng)用于心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、人口學(xué)、地質(zhì)學(xué),甚至在化學(xué)和物理學(xué)中也得到成功地運(yùn)用,這使得因子分析的理論和方法更加豐富。三、實(shí)證研究本文選取年江蘇省各地級(jí)市的個(gè)國民經(jīng)濟(jì)主要統(tǒng)計(jì)指標(biāo)(資料來源:江蘇省統(tǒng)計(jì)局,),相關(guān)數(shù)據(jù)見表。利用統(tǒng)計(jì)軟件對(duì)表的數(shù)據(jù)進(jìn)行處理,在因子分析的過程中使用主成分法提取公共因子。(注:表示原始變量,表示標(biāo)準(zhǔn)化后的變量)表因子旋轉(zhuǎn)后的

13、載荷矩陣、特征值貢獻(xiàn)率和累計(jì)貢獻(xiàn)率變量()人均增長率高新技術(shù)產(chǎn)值第二產(chǎn)業(yè)產(chǎn)值第三產(chǎn)業(yè)產(chǎn)值第三產(chǎn)業(yè)產(chǎn)值增長率城市固定資產(chǎn)投資地方財(cái)政總收入規(guī)模以上工業(yè)增加值規(guī)模以上利稅總額社會(huì)消費(fèi)品零售總額社會(huì)消費(fèi)品零售總額增長率特征值貢獻(xiàn)率()累計(jì)貢獻(xiàn)率()城市南京無錫徐州常州蘇州南通連云港淮安鹽城揚(yáng)州鎮(zhèn)江泰州宿遷因子得分綜合因子得分綜合排名從表可以看出,第一主因子在規(guī)模以上工業(yè)利稅總額、地方財(cái)政總收入、第二產(chǎn)業(yè)產(chǎn)值、第三產(chǎn)業(yè)產(chǎn)值等指標(biāo)上具有較大的載荷,這些指標(biāo)均反映了地區(qū)的經(jīng)濟(jì)總量,因此可以將第一主因子命名為“經(jīng)濟(jì)總量因子”而第二主。因子在第三產(chǎn)業(yè)產(chǎn)值增長率上具有較大的載荷,這是反映經(jīng)濟(jì)增長速度的指標(biāo),因此可以將第二主因子命名為“經(jīng)濟(jì)增長速度因子”從表三的綜合因子的分的數(shù)值來看,得。分值大的三個(gè)地區(qū)為蘇州、南京、無錫,它們的綜合因子得分值大于,可見這三個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展水平居于前列,明顯好于其它地區(qū)的經(jīng)濟(jì)發(fā)展?fàn)顩r。而位于蘇北地區(qū)的宿遷、淮安、連云港三個(gè)地區(qū),其綜合因子得分的分值很低,說明它們的經(jīng)濟(jì)發(fā)展水平與蘇州、南京、無錫三個(gè)地區(qū)相比要落后很多,屬于經(jīng)濟(jì)欠發(fā)達(dá)地區(qū),其它地區(qū)的經(jīng)濟(jì)發(fā)展處于居中水平。參考文獻(xiàn):表因子得分及綜合排名,?,():,葉其孝,沈永歡應(yīng)用數(shù)學(xué)手

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論