




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、【本章學(xué)習(xí)目的】 通過對本章的學(xué)習(xí)理解主成分分析的基本理論;掌握用 SPSS 軟件求解主成分的方法; 了解因子分析的基本理論;掌握求解因子的方法步驟;能夠用 SPSS 軟件進(jìn)行因子分析, 并能正確理解系統(tǒng)輸出結(jié)果。 第十一章 主成分分析與因子分析第一節(jié) 主成分分析與因子分析概述 第二節(jié) 主成分分析與因子分析的統(tǒng)計(jì)原理 第三節(jié) 主成分分析與因子分析實(shí)例主要內(nèi)容第一節(jié)主成分分析與因子分析概述 問題發(fā)現(xiàn):在對某一事物進(jìn)行實(shí)證研究時(shí),為了更全面、準(zhǔn)確地反映事物的特征及其發(fā)展規(guī)律,人們往往要考慮與其有關(guān)系的多個(gè)指標(biāo),這些指標(biāo)在多元統(tǒng)計(jì)中也稱為變量。這樣就產(chǎn)生了如下問題:一方面人們?yōu)榱吮苊膺z漏重要的信息而
2、考慮盡可能多的指標(biāo),另一方面考慮指標(biāo)的增多增加了問題的復(fù)雜性,同時(shí)由于各指標(biāo)均是對同事物的反映,不可避免地造成信息的大量重疊,這種信息的重疊有時(shí)甚至?xí)⑹挛锏恼嬲卣髋c內(nèi)在規(guī)律。主成分分析正是研究如何通過原來變量的少數(shù)幾個(gè)線性組合來解釋原來變量絕大多數(shù)信息的一種多元統(tǒng)計(jì)方法。一、主成分分析的基本思想第一節(jié)主成分分析與因子分析概述 主成分:通過對原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線性組合形成幾個(gè)綜合指標(biāo)(主成分),在保留原始變量主要信息的前提下起到降維與簡化問題的作用,使得在研究復(fù)雜問題時(shí)更容易抓住主要矛盾。主成分與原始變量之間有如下基本關(guān)系:1.每個(gè)主成分都是各原
3、始變量的線性組合;2.主成分的數(shù)目大大少于原始變量的數(shù)目;3.主成分保留了原始變量絕大多數(shù)信息;4.各主成分之間互不相關(guān)。一、主成分分析的基本思想第一節(jié)主成分分析與因子分析概述 問題發(fā)現(xiàn):人們在研究實(shí)際問題時(shí),往往希望盡可能多地收集相關(guān)變量,以期望對問題有比較全面、完整的把握和認(rèn)識。例如,企業(yè)綜合評價(jià)研究中,可能會收集諸如盈利能力、負(fù)債能力、運(yùn)營能力等方面的經(jīng)濟(jì)指標(biāo)數(shù)據(jù)。這些數(shù)據(jù)在帶來有關(guān)信息的同時(shí),也給數(shù)據(jù)的分析帶來了一定的困難:這眾多的變量之間可能存在著或多或少的相關(guān)性,實(shí)際觀測到的數(shù)據(jù)包含的信息有一部分可能是重復(fù)的。因子分析:在盡可能不損失信息或者少損失信息的情況下,將多個(gè)變量減少為少數(shù)
4、幾個(gè)因子的方法。這幾個(gè)因子可以高度概括大量數(shù)據(jù)中的信息,這樣,既減少了變量個(gè)數(shù),又同樣能再現(xiàn)變量之間的內(nèi)在聯(lián)系。二、因子分析的基本思想第一節(jié)主成分分析與因子分析概述 主成分分析(principal component analysis, PCA)是把原來多個(gè)變量轉(zhuǎn)換為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法。因子分析(factor analysis)是一種數(shù)據(jù)簡化的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想因子來表示其基本的數(shù)據(jù)結(jié)構(gòu)。主成分分析不要求明確的理論指導(dǎo),屬于探索性工具;而因子分析常常是在有明確理論指導(dǎo)或明確假設(shè)時(shí)對理論進(jìn)行驗(yàn)證,故屬于驗(yàn)證性工具
5、。三、主成分分析與因子分析的概念第二節(jié)主成分分析與因子分析的的基本原理一、主成分分析的統(tǒng)計(jì)原理 主成分分析的本質(zhì)是坐標(biāo)的旋轉(zhuǎn)變換,將原始的 n 個(gè)變量進(jìn)行重新的線性組合,生成 n 個(gè)新的變量,它們之間互不相關(guān),稱為 n 個(gè)“成 分”。同時(shí)按照方差最大化的原則,保證第一個(gè) 成分的方差最大,然后依次遞減。這 n 個(gè)成分是 按照方差從大到小排列的,其中前 m 個(gè)成分可能 就包含了原始變量的大部分方差(及變異信息)。 那么這 m 個(gè)成分就成為原始變量的“主成分”, 它們包含了原始變量的大部分信息。 注意:得到的主成分不是原始變量篩選后的 剩余變量,而是原始變量經(jīng)過重新組合后的“綜 合變量”。第二節(jié)主成
6、分分析與因子分析的的基本原理案例:用最簡單的二維數(shù)據(jù)來直觀的解釋主成分分析的原理。假設(shè)現(xiàn)在有兩個(gè)變量X1、X2,在坐標(biāo)上畫出散點(diǎn)圖如下:可見,x1、x2之間存在相關(guān)關(guān)系,如果我們將坐標(biāo)軸整體逆時(shí)針旋轉(zhuǎn)45度,變成新的坐標(biāo)系Y1、Y2。第二節(jié)主成分分析與因子分析的的基本原理案例:根據(jù)坐標(biāo)變化的原理,我們可以算出:Y1=sqrt(2)/2* X1+sqrt(2)/2* X2Y2=sqrt(2)/2* X1-sqrt(2)/2* X2其中sqrt(x)為x的平方根。通過對X1、X2的重新進(jìn)行線性組合,得到了兩個(gè)新的變量Y1、Y2。此時(shí),Y1、Y2變得不再相關(guān),而且Y1方向變異(方差)較大,Y2方向的
7、變異(方差)較小,這時(shí)我們可以提取Y1作為X1、X2的主成分,參與后續(xù)的統(tǒng)計(jì)分析,因?yàn)樗鼣y帶了原始變量的大部分信息。至此我們解決了兩個(gè)問題:降維和消除共線性。對于二維以上的數(shù)據(jù),就不能用上面的幾何圖形直觀的表示了,只能通過矩陣變換求解,但是本質(zhì)思想是一樣的。第二節(jié)主成分分析與因襲分析的的基本原理二、因子分析的統(tǒng)計(jì)原理 原理:對原始變量間的內(nèi)在相關(guān)結(jié)構(gòu)進(jìn)行分組,相關(guān)性強(qiáng)的分在一組, 組間相關(guān)性較弱,各組變量代表一個(gè)基本要素(公共因子)。通過原始變量之間的復(fù) 雜關(guān)系分解原始變量,得到公共因子和特殊因子。原始變量被表示成公共因子的線性組合。 其中公共因子是所有原始變量所共同具有的特征,而特殊因子則是
8、原始變量所特有的部分。因子分析強(qiáng)調(diào)對新變量(因子)的實(shí)際意義的解釋。因子分析的過程:(1)確認(rèn)待分析的原變量是否適合做因子分析;(2)構(gòu)造因子變量;(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性;(4)計(jì)算因子變量得分。第二節(jié)主成分分析與因子分析的的基本原理三、主成分分析與因子分析的聯(lián)系與區(qū)別 (一)聯(lián)系 兩者都是降維和信息濃縮的方法。生成的新變量均代表了原始變量的大部分信息且互 相獨(dú)立,都可以用于后續(xù)的回歸分析、判別分析、聚類分析等。(二)區(qū)別 (1)主成分分析是按照方差最大化的方法生成的新變量,強(qiáng)調(diào)新變量貢獻(xiàn)了多大比 例的方差,不關(guān)心新變量是否有明確的實(shí)際意義; (2)因子分析著重要求新變量具
9、有實(shí)際意義,能解釋原始變量間的內(nèi)在結(jié)構(gòu)。第三節(jié)主成分分析與因子分析實(shí)例一、主成分分析實(shí)例SPSS沒有提供單獨(dú)的主成分分析方法,而是混在因子分析當(dāng)中,下面通過一個(gè)例子來討論主成分分析與因子分析的實(shí)現(xiàn)方法及相關(guān)問題。案例:某市為全面分析機(jī)械類企業(yè)的經(jīng)濟(jì)效益,選擇了8個(gè)不同的利潤指標(biāo),14家企業(yè)關(guān)于這8個(gè)指標(biāo)的統(tǒng)計(jì)數(shù)據(jù)如下表所示,試進(jìn)行主成分分析。企業(yè)序號凈資產(chǎn)利潤率(%)Xi1固定資產(chǎn)利潤率(%)Xi2總資產(chǎn)利潤率(%)Xi3銷售收入利潤率(%)Xi4產(chǎn)品成本利潤率(%)Xi5物耗利潤率(%)Xi6人均利潤率(千元/人)(%)Xi7流動資金利潤率(%)Xi812345678910111213144
10、0.425.013.222.334.335.622.048.440.624.812.51.832.338.524.712.73.36.711.812.57.813.419.18.09.70.613.99.17.211.23.95.67.116.49.910.919.89.84.20.79.411.36.111.04.33.77.116.710.29.919.08.94.20.78.39.58.312.94.46.08.022.812.610.929.711.94.60.89.812.28.720.25.57.48.929.317.613.939.616.26.51.113.316.42.4423.5420.5780.1761.7263.0170.8471.7722.4490.7890.8740.0562.1261.32720.09.13.67.327.526.610.617.835.813.73.91.017.111.6第三節(jié)主成分分析與因子分析實(shí)例第三節(jié)主成分分析與因子分析實(shí)例二、因子分析實(shí)例在企業(yè)經(jīng)濟(jì)效益的評價(jià)中,設(shè)計(jì)的指標(biāo)往往很多。為了簡化系統(tǒng)結(jié)構(gòu),抓住經(jīng)濟(jì)效益評 價(jià)中的主要問題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。我國部分省、直轄市、自治區(qū)獨(dú)立 核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益的評價(jià)中,涉及 9 項(xiàng)指標(biāo),即樣品數(shù) n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 機(jī)織物的性能與運(yùn)動服要求考核試卷
- 體育會展物流與供應(yīng)鏈管理優(yōu)化考核試卷
- 國際物流與跨境交通運(yùn)輸考核試卷
- 礦業(yè)信息安全培訓(xùn)課件
- 服務(wù)可持續(xù)性考核試卷
- 信托項(xiàng)目的合同管理與履行考核試卷
- 電子垃圾回收利用項(xiàng)目投資合同
- 工程項(xiàng)目擔(dān)保合同
- 國際融資租賃合同
- 中學(xué)生閱讀后的思考征文
- 2023年第27屆希望杯〞八年級全國數(shù)學(xué)邀請賽試卷與參考答
- 世界著名童話故事英文繪本故事丑小鴨
- 四年級科學(xué)下冊課件 第四課 河流和湖泊 冀人版 25張
- 綠色簡約墻體商務(wù)風(fēng)PPT模板
- GB/T 462-2003紙和紙板水分的測定
- QC演示:提高檢查井周邊密實(shí)度
- 年度應(yīng)急演練計(jì)劃表
- 英語板書設(shè)計(jì)(課件)
- 智能中臺數(shù)據(jù)底座解決方案
- 《財(cái)政與金融》課程教學(xué)大綱
- 《國際稅收》教案
評論
0/150
提交評論