SPSS數(shù)據(jù)的主成分分析報告_第1頁
SPSS數(shù)據(jù)的主成分分析報告_第2頁
SPSS數(shù)據(jù)的主成分分析報告_第3頁
SPSS數(shù)據(jù)的主成分分析報告_第4頁
SPSS數(shù)據(jù)的主成分分析報告_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

?理解主成分分析的基本思想和幾何意義?理解并掌握基于協(xié)方差矩陣或相關(guān)系數(shù)矩陣求解主成分?如

數(shù)

?如

?掌

用SPSS

分對軟件輸出結(jié)果進行正確分析zf主

(Principal

Components

Analysis)知識點主成分分析在綜合評價中的應(yīng)用:□

蔣亮,羅漢《我國東西部城市經(jīng)濟實力比較的主成分

分析》,《經(jīng)濟數(shù)學(xué)》,2003年3期田波平等《主成分分析在中國上市公司綜合評價中的作用》,《數(shù)學(xué)的實踐與認(rèn)識》,2004年4期江冬明《主成份分析在證券市場個股評析中的應(yīng)用》,

《數(shù)理統(tǒng)計與管理》,2001年3期2019/9/10

2zf主成分用于成因分析:□陳耀輝,景?!稖罟墒惺袌鍪找媛食梢虻闹鞒煞莘?/p>

析》,《南京航空航天大學(xué)學(xué)報》,2000年2期。2019/9/103zf主成分回歸分析:王冬:《我國外匯儲備增長因素主成分分析》,《北

京工商大學(xué)學(xué)報(社會科學(xué)版)》,2006年4期。主成分用于判別分析等統(tǒng)計方法中.....2019/9/104zf多個指標(biāo)的問題:1、

指標(biāo)與指標(biāo)可能存在相關(guān)關(guān)系信息重疊,分析偏誤2、

指標(biāo)太多,

增加問題的復(fù)雜性和分析難度2019/9/105zf主

想一項十分著名的工作是美國的統(tǒng)計學(xué)家斯通(stone)在

1947年關(guān)于國民經(jīng)濟的研究。他曾利用美國1929—1938

年各年的數(shù)據(jù),得到了17個反映國民收入與支出的變量

要素,例如雇主補貼、消費資料和生產(chǎn)資料、純公共支

出、凈增庫存、股息、利息外貿(mào)平衡等等。在進行主成分分析后,竟以97.4%的精度,用三新變量就取代了

原17個變量。根據(jù)經(jīng)濟學(xué)知識,斯通給這三個新變量分別命名為總收入F1、總收入變化率F2和經(jīng)濟發(fā)展或衰退的趨勢F3。2019/9/106zfF1F2F3iitF11F201F3001i0.995-0.0410.0571△

i-0.0560.948-0.124-0.1021t-0.369-0.282-0.836-0.414-0.1121更有意思的是,這三個變量其實都是可以直接測量的。斯通將他得到的主成分與實際測量的總收入I、

總收入變

化率△I以及時間t

因素做相關(guān)分析,得到下表:2019/9/10zf主成分分析:將原來具有相關(guān)關(guān)系的多個指標(biāo)簡化為少數(shù)幾個

新的綜合指標(biāo)的多元統(tǒng)計方法。主成分:由原始指標(biāo)綜合形成的幾個新指標(biāo)。依據(jù)主成分所含

信息量的大小成為第一主成分,第二主成分等等。主成分與原始變量之間的關(guān)系:(1)主成分保留了原始變量絕大多數(shù)信息。(2)主成分的個數(shù)大大少于原始變量的數(shù)目。

(3)各個主成分之間互不相關(guān)。(4)每個主成分都是原始變量的線性組合。2019/9/108zf數(shù)

學(xué)

達(dá)

式主成分分析通常的做法:尋求原指標(biāo)的線性組合F;;OF?=u?X?+u??X?+…+upX,F?=u??X?+u??X?+…+u?,X,F,=up?X?+up?X?+…+uppX,2019/9/10

9zf幾

標(biāo)

轉(zhuǎn)

換假設(shè)有n個樣品,每個樣品有兩個觀測變量x?和x?,在由

變量x?和x?

所確定的二維平面中,n個樣本點所散布的情平移、旋轉(zhuǎn)坐標(biāo)軸2019/9/1011zf平移、旋轉(zhuǎn)坐標(biāo)軸zf由圖可以看出這n個樣本點無論是沿著x?軸方向或x?

軸方向都具有較大的離散性,其離散的程度可以分別用觀

量x?

和x?的方差定量地表示。顯然,如果只考慮x?和x?

中的任何一個,那么包含在原始數(shù)據(jù)中的經(jīng)

濟信息將會有較大的損失。如果我們將x?

軸和x?

軸先平移,再同時按逆時針方向旋

轉(zhuǎn)θ角度,得到新坐標(biāo)軸E

和F?

。F?和F?是兩個新變量。F?軸方向上的離散程度最大,即F

的方差最大。說明變量F?代表了原始

數(shù)據(jù)的絕大部分信息,即使不考慮變量F2也無損大局。其優(yōu)點:

(1)可達(dá)到簡化數(shù)據(jù)結(jié)構(gòu)的目的。

(2)新產(chǎn)生的綜合變量

Fl,F2

具有不相關(guān)的性質(zhì),從而避免了信息重疊所帶來的虛假性。主成分分析的幾何意義:

主成分分析的過程也就是坐標(biāo)旋轉(zhuǎn)的

過程,各主成分表達(dá)式就是新坐標(biāo)系與原坐標(biāo)系的轉(zhuǎn)換關(guān)系,

新坐標(biāo)系中各坐標(biāo)軸的方向就是原始數(shù)據(jù)方差最大的方向。2019/9/10

14zf旋轉(zhuǎn)變換的目的:

將原始數(shù)據(jù)的大部分信息集中到F

軸上,對

數(shù)據(jù)中包含的信息起到了濃縮作用。了解了主成分分析的基本思想、數(shù)學(xué)和幾何意

義后,問題的關(guān)鍵:>

1、如何求解主成分?>

2

、

數(shù)

?>3、如何解釋主成分所包含的經(jīng)濟意義?2019/9/10

15zf如

?

?

一(1)基于協(xié)方差矩陣求解主成分假設(shè)有n個樣本,每個樣本有p

個觀測變量。運用主成

分分析構(gòu)造以下p

個主成分關(guān)于原始變量的線性組合

模型:2019/9/1016zf對角線上的元素O?,σ??…σp分別代表xj,x?…x,的方差;對角線外的元素σ??=σ?i,C?=G?

1,…,Gp?=σ?,…,

且不全為0;O假設(shè)p個原始變量的協(xié)方差陣為:對角線外的元素不為0意味著:原始變量之間有相關(guān)關(guān)系2019/9/1017zf如何運用主成分分析將這些具有相關(guān)關(guān)系的變量轉(zhuǎn)化

為沒有相關(guān)關(guān)系的新變量(主成分)呢??新變量(即主成分)之間沒有相關(guān)關(guān)系,其協(xié)方差陣對角線上的元素λ?

、

λ?…λp分

、二…第p個主成分方

差;

同時也是原始變

量協(xié)方差陣的特征根主成分表達(dá)式的系數(shù)項即

是λ?、λ2…λp的特征向量為對角矩陣:18

zf協(xié)

質(zhì)1

、主成分的協(xié)方差陣為對角矩陣;2、λ=Var(F),λ≥λ?≥λ?…≥λ,3

、A+z+λs…+λ,=Var(X?)+Var(X?)+Var(X?)+·

。+Var(Xp)=tr(2.)4、

j個

:十

j=1,2,…,p.該比率為第j個主成分方差與原

始變量的總方差之比。19zf2019/9/10k個主成分的累積方差貢獻率為:

累積方差貢獻率越接近1,表示k個主成分包含原始變量的信息越多。5.

主成分載荷:

6.

主成分F;與原始變量X;

相關(guān)系數(shù)的平方:

·

(1)可看作為第j

個主成分可解釋X;多少比率的信息

·(2)可看作為X;在第j

個主成分中的相對重要性2019/9/1020

zf

(

1

)

:相關(guān)系數(shù)矩陣可看作原始變量協(xié)方差陣的標(biāo)準(zhǔn)化形式,即:原始變量標(biāo)準(zhǔn)化的協(xié)方差矩陣。注

(

2

)

:運用主成分分析法時,若原始變量量綱不一致時,

需對變量進行標(biāo)準(zhǔn)化處理基于協(xié)方差陣求解主成分;若不標(biāo)準(zhǔn)

化則基于相關(guān)系數(shù)矩陣求解主成分。2019/9/10

21zf主

一(2)基于相關(guān)系數(shù)矩陣求解主成分假設(shè)p個原始變量的相關(guān)系數(shù)矩陣陣為:O對角線外元素不全

0

:原始變量間有相關(guān)關(guān)系轉(zhuǎn)

關(guān)

關(guān)

(

)

的協(xié)

方差陣為對角矩陣:對角線

的元素λ、

λ?

···λp分別為

、、二···第p

個主成分方差;

同時

也是原始變量相關(guān)系

數(shù)矩陣的特征根主成分表達(dá)式的系數(shù)項即

是λ1、λ2…λp的特征向量22

zf1、

協(xié)

.2.Letλ*=Var(F),thenA*≥X?≥a?…≥a,”3、A++A;

·

+A,'=Var(X?)+Var(X?)+Var(X?)+

+Var(X?)=

p4、

第k個主成分的方差貢獻率為:

*/

p前k個主成分的累積方差貢獻率為:

(

A*++A*)/p5、

:p(xj,F))=a√a,^。

O

第意j6、

主成分載荷的平方:

P2,,r)=a?λ;"起著重要作用上主義個的釋分解成在·(

1)可看作為第j個主成分可解釋X;多少比率的信息(或:

X,

的信息有多

少可被第j個主成分解釋);·(2)可看作為X;在第j個主成分中的相對重要性。相

關(guān)

數(shù)

質(zhì)累積方差貢獻率

(Cumulative

variance

explained

bycomponents):

通常要求累積方差貢獻率達(dá)到85%以上

來確定主成分個數(shù)。

特征根

(eigenvalue):根據(jù)特征根來確定λ>π;

數(shù)碎

石圖

(Screeplot):

依據(jù)村征值的變化來確定,即特

征值變化趨勢圖由陡坡變?yōu)槠教沟霓D(zhuǎn)折點即為主成分選擇的最佳個數(shù)。2019/9/10據(jù)標(biāo)準(zhǔn)化情況下:

數(shù)

定課區(qū)雪

雪國主

釋運用主成分載荷解釋主成分:陳耀輝,景?!稖罟墒惺袌鍪找媛食梢虻闹鞒煞莘治觥?《南京航

空航天大學(xué)學(xué)報》,2000年2期。蔣亮,羅漢《我國東西部城市經(jīng)濟實力比較的主成分分析》,《經(jīng)濟

數(shù)學(xué)》,2003年3期。運用主成分得分系數(shù)矩陣解釋主成分:王冬《我國外匯儲備增長因素主成分分析》,《北京工商大學(xué)學(xué)報》,

2006年4期。田波平等《主成分分析在中國上市公司綜合評價中的作用》,《數(shù)學(xué)的實踐與認(rèn)識》,2004年4期2019/9/10

25zfWeek.AltedChemicalDu:PamtUmionCarbzdeExxonTexaco3CO0000000000000000.039473-000000027027一

.

044855-.003030—.014466.04347899-050167.036380004082-011961.009216100019108一.033303-008362033898004566基于相關(guān)系數(shù)矩陣的主成分分析。對美國紐約上市的有關(guān)化學(xué)產(chǎn)業(yè)的三支股票(Allied

Chemical,du

Pont,Union

Carbide)

和石油產(chǎn)業(yè)的2支股票

(Exx

onand

Texaco)

做了100周的收益率調(diào)查(1975年1月—

1976年10月)。1)利用相關(guān)系數(shù)矩陣做主成分分析。2)決定要保留的主成分個數(shù),并解釋意義。2019/9/10

26zf主

析10.5770.5090.3870.4620.57710.5990.3890.3220.5090.59910.4360.4260.3870.3890.43610.5230.4620.3220.4260.5231運用主成分分析法進行分析得到以下結(jié)果:(1)相關(guān)系數(shù)矩陣:2019/9/10

27zfPRIN5

0.34295

0.068590

1.00000口

(3)特征根所對應(yīng)的特征向量:EigenvectorsPRIN1PRIN2PRIN3PRIN4PRIN5X10.463605-.240339-.611705

0.386635-.451262X20.457108

-.509305

0.178189

0.206474

0.676223X3

0.470176

-.260448

0.335056

-.662445

-.400007X40.4214590.525665

0.540763

0.472006

-100.421224

0.5819705

176

-.382439

0.385024PKTINT2.85072.047530.5713420.57134PRIN20.809160.269490.1618330.73317PRIN30.539680.088180.1079350.84111PRIN40.451500.108550.0903000.93141(2)相關(guān)系數(shù)矩陣的特征根:Eigenvaluesof

theCorrelationMatrixEigenvalue

Difference

Proportion

CumulativePRIN1=.464x+457z?+470zg+-42l?+42lz;PRIN2=-.240x?-.509x?-.260x?+526x+582xs2019/9/10

29zf口

(

4

)

前兩大主成分的累積方差貢獻率:The

first

two

components

accownts

for口(5)前兩大主成分的表達(dá)式:ofthetotal(standardized)samplevariance.2019/9/10

30zf口

(

6

)

圖:PRIN1=.464x+457z?+-470zg+-42l?+42lzsPRIN2=-.240z-.509x?-.260zg+520x+582rs主

:1、第一大主成分PRIN1幾乎是5只股票的等權(quán)平均;可將它看做股票收益率的“市場影響因素”(

market

component)

2、

第二大主成分PRIN2

系數(shù)在AC,DP,UC(chemical

stocks)等3只股票上表現(xiàn)為負(fù),而在

EX,TE(oil

stocks)等兩只股票的系數(shù)表現(xiàn)為正;可將它看作為股票收益率的“行業(yè)影響

”(industry

component)2019/9/10

31zf主

圖>

:·

1.根據(jù)研究問題選取初始分析變量;·

2.根據(jù)初始變量特性判斷由協(xié)方差陣求主成分還是由相關(guān)陣求

主成分;·

3.求協(xié)差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量;·

4.判斷是否存在明顯的多重共線性,若存在,則回到第一步;

·

5.得到主成分的表達(dá)式并確定主成分個數(shù),選取主成分;·

6.結(jié)合主成分對研究問題進行分析并深入研究。2019/9/10

32zf選擇初始變量度量或取值

范圍相同?是分析協(xié)方差陣主成分分析框圖:特征值是否有接近0

的情況否主成分業(yè)對主成分進行分析標(biāo)準(zhǔn)正交特征向量2019/9/10分析相關(guān)陣其他處理深入分析對比(否)否33

zf是主

現(xiàn)

SPSS

作1

、analyze-descriptionstatistic-description-savestandardized

asvariables(若需要數(shù)據(jù)標(biāo)準(zhǔn)化,

則進行該操作,一般在主成分分析過程中軟件已自動進行了此操作)>

2

、analyze-datareduction-Factor>3、指定參與分析的變量>

4、運行factor

過程2019/9/10

34zf案例1:某分析師試圖對汽車銷量進行預(yù)測,選擇了汽車

品牌、汽車外觀、油耗等10個變量作為影響變量(即

自變量)

(

數(shù)

據(jù)car

sales.sav)。

但是,這些影響

變量之間存在相關(guān)關(guān)系,分析師擔(dān)心直接進行回歸預(yù)

測會引起分析結(jié)果偏誤。分析師首先對10個影響變量進行主成分分析,將其轉(zhuǎn)

化少數(shù)幾個無相關(guān)關(guān)系的新變量。(1)可用新變量與銷量進行回歸預(yù)測(2)依據(jù)新變量,對各品牌汽車進行評價2019/9/10

35zf變量(Y)模述(D)…Manufacturer[manu..Model

[madel]Sales

in

thousands

[

…4-year

resale

valus

[

…Yehicletype

[lype]Pricein

trousands

[

…Engyire

size[engine_s]Horsepower

horse.

…Wheellbase

[wheellk

.Wicth

[witth]Length

[length]硝定

黏貼(D)

重置(R)取

幫助car_sales-sav[數(shù)起集6]-SPsS

St

atistics因子分析文任(E)

編域(E)

圖()

數(shù)

據(jù)(

)

缺(

T

)分圻(△)

H

()

交用民序

(U)附

內(nèi)

(

)

(W)

幫功國報告楊述統(tǒng)計志(T)E

F

M

析比

M

D一

型(

G

)廣文

型滿合

X

)相

(

C

)回

(E)對數(shù)

線性

(

Q

)神經(jīng)網(wǎng)絡(luò)分類(D1:manufact

Acuramanufact03resaletγpepAcurgIntegra6.91916.360O2AcuraTL39.38419.875O3AcuraCL4.11418.225口4AcuraRL8.58829.725O5Aud

A420.39722.255O6Aud

A68.78023.555O7Audi

AB1.38039.000o8BMW

323i9.747口9BMW

323i9.23128.675O10BMW

528降集因

析(

E

)…O11Buick

Cantury度

(

S

)非

數(shù)

檢險

(

N

)預(yù)測(D生存

函數(shù)

≤)多

應(yīng)

)區(qū)

圖缺失

值分

(

Y

)多

(D算

)原

(

Q

)R

O

C

(Y

),對應(yīng)分析(二).最

優(yōu)

度(

Q

)

.O12Buick

Regal□13Buick

ParkAve14Buick

LeSabre27.85T83.25763.729201322O口15Cadillac

DeVille16Cadillac

Saville5.943

6.53617Cadillac

Eldorado18Cadillac

Catera1.18518.225□O19Cadilac

Escalade4.78545.51920Chevrolet

Cavalier9.250O21Chevrolet(01)選擇分析變量——選SPSS

[分析Analyze]菜單中的(降維Data

Reduction)→

(Factor),出現(xiàn)【因子分析

Factor

Analysis】對話框;——在【因子Factor

Analysis】對話框中左邊的原始變量中,

選擇將進行因子分析的變量選入(變量Variables)

欄。插取(E)…戰(zhàn)轉(zhuǎn)(I)

…得分(S)選項(Q)

…27.1[25.725選朵變量(C值(L)

…135.126Malibu11.225Or(02)設(shè)置描述性統(tǒng)計量述【

ac計t

e

ilpyt

】框?qū)χ?/p>

框【;描述Descriptives】按鈕,

出——選擇‘原始分析結(jié)果

Initial

solution’選項

,息——選擇‘系數(shù)Coefficients’

選項

新變量提取了有多反映的信度表原始變顯示共scAnDor現(xiàn)—5

0

=

E類在計F五

上 卡第

毛C與門成

結(jié)

(

山FRI

E

車茅

數(shù)(C)

至號

七∈?K

P

(

)爺子否

式(D)FCF1七

tle

=tt蛙

取——

點擊(繼續(xù)Contiue)按鈕確是姓

r)斗

生R)

)F<)顯示相關(guān)系數(shù)矩陣:檢驗

原始變量有無相關(guān)關(guān)系青

E37zf2019/9/10計.Descriptive

框提

統(tǒng)

關(guān)

關(guān)

統(tǒng)

:(1)Statistics

:·Univariatedescriptives:顯

量的

標(biāo)

準(zhǔn)

差-Initialsolution:顯

、

、

方差

例(2)Correlation

Matrix

:-Coefficients:觀

關(guān)

數(shù)

陣-Significancelevels:

關(guān)

數(shù)

平-Determinant:

關(guān)

數(shù)

式·Inverse:

關(guān)

數(shù)

陣-Reproduced:由

關(guān)

數(shù)

差-Anti-image:

反映象相關(guān)矩陣-KMOandBartlett’stestofsphericity:KMO

測度和巴特利特球體檢驗2019/9/10

38zf主

關(guān)

析:分析方法主要有:·

1

)

關(guān)系

數(shù)

陣(correlationcoefficientsmatrix)如果相關(guān)系數(shù)矩陣中的大部分相關(guān)系數(shù)值均小于0.3,

即各

變量間大多為弱相關(guān),原則上這些變量不適合進行因子分析?!?/p>

2

)計算反映象相關(guān)矩陣(Anti-imagecorrelationmatrix)如果其主對角線外的元素大多絕對值較小,對角線上的元素

值較接近1,則說明這些變量的相關(guān)性較強,

適合進行因子分析。2019/9/1039zfr,是變量

x;

和變量

X;(i≠i)間的簡單相關(guān)系數(shù);

P是變量

x,

和變量

x,(j≠i)在控制了其他變量影響下的偏相關(guān)系數(shù),即凈相關(guān)系數(shù)。MSA,

取值在0和1之間,越接

近1,意味著變量

x,

與其他變量間的相關(guān)性越強,越接近0

則相關(guān)性越弱。2019/9/10

40zf其中主對角線上的元素為某變量的MSA(Measure

of

Sample

Adequacy):·3)巴特利特球度檢驗

(Bartlett

test

of

sphericity)該檢驗以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點,其零假設(shè)HO是:

相關(guān)系數(shù)矩陣為單位矩陣,

即相關(guān)系數(shù)矩陣主對角元素均為1,

非主對角元素均為0。

(即原始變量之間無相關(guān)關(guān)系)。依據(jù)相關(guān)系數(shù)矩陣的行列式計算可得其近似服從卡方分布。如

果統(tǒng)計量卡方值較大且對應(yīng)的sig

值小于給定的顯著性水平a

時,

零假設(shè)不成立。即說明相關(guān)系數(shù)矩陣不太可能是單位矩陣,

量之間存在相關(guān)關(guān)系,適合做因子分析。2019/9/10

41zf4)KMO(Kaiser-Meyer-Olkin)

驗KMO檢驗的統(tǒng)計量是用于比較變量間簡單相關(guān)系數(shù)矩陣和偏相關(guān)系數(shù)的指標(biāo),數(shù)學(xué)定義為:

KMO

與MSA

區(qū)別是它將相關(guān)系數(shù)矩陣中的所有元素都加入到

了平方和計算中。

KMO值越接近1,意味著變量間的相關(guān)性

越強,原有變量適合做因子分析;越接近0,意味變量間的相

關(guān)性越弱,越不適合作因子分析。

Kaiser

給出的KMO

度量標(biāo)

準(zhǔn):0.9以上非常適合;0.8表示適合;0.7表示一般;0.6表示

不太適合;0.5以下表示極不適合。2019/9/10

42zf(03)設(shè)置對主成分或因子的提取選項——在【因子分析FactorAnalysis】

框中點擊【抽取Extraction】按鈕,出現(xiàn)【因

子分析:抽取Factor

Analysis:Extraction】對話框;——在‘方法Method’

欄中選擇(主成分Principal

components)

選項;——在分析Analyze

欄中選擇‘相關(guān)性矩陣’Correlation

matrix選項(基于相關(guān)

系數(shù)求解主成分)

;——在‘輸出Display’

欄中選擇‘未旋轉(zhuǎn)的因子解Unrotated

factor

solution’選項(主成分載荷矩陣);——在‘抽取Extract’

欄中選擇‘基于特征根Eigenvalues

over’并填上1(依據(jù)特征根大于1的原則提取主成分);——

點擊(繼續(xù)Continue

)

按鈕確定,回到【因子分析FactorAnalysis】

對話框中。

取取◎

基于怖證伯(E)特證值大于(蘭):

因子的園定數(shù)量(N)要提取的因子(T):聯(lián)大收做性地代的數(shù)(C):車命出

未旋錢的因子解(F)

1碎石區(qū)(S)方

法(rw):

主成份分

析◎相關(guān)比矩陣(R)〇

協(xié)方簽矩陣CV)2019/9/10續(xù)絲取

消鉛目力.Extraction

框提

關(guān)

,

:(1)

Method:選

法有以下七種方法可供選

:-Principalcomponemts主

析-Jnweighted

leastsquare普

法·Generalizedleastsquares

法-Maximumlikelihood最大似

法·PrincipalAxisfactoring主

法-Alpha

α

因子

法-Image

法(2)

Extract:

數(shù)有兩種方法可供選擇:-Eigenvalue

over:

,

統(tǒng)

認(rèn)

值為

1-Number

of

factors:

取的

數(shù)(3)

Display:

關(guān)

項-

Unrotatedfactorsolution顯

經(jīng)

轉(zhuǎn)

-Scree

plot顯

圖(4)

MIaximum

iterations

for

Convergence指

次數(shù)。系統(tǒng)

認(rèn)

25

。2019/9/10

44zf(04)設(shè)置主成分得分(或因子得分)——在【因子分析

FactorAnalysis】

對話框中,

點擊【得分Scores】按鈕,出現(xiàn)【因子分析:

因子得分Factor

Analysis:Scores

對話框。

——選擇‘保存為變量’saveasvariable(將新變量得分值保存到

數(shù)據(jù)文件)

。——選擇‘displayfactorscorecoefficientmatrix(顯示主成分表達(dá)式的系

數(shù)

陣)

’—

點擊(繼續(xù)Contiue)按鈕確定,Analysis】對話框。

世告日

=F50回到【因子分析

Factor=

醫(yī)

產(chǎn)分2019/9/10蛙E(

)礦

去LaR求

數(shù)

陣O)青丹

E力Sartl=ttcEnler=Qm-RIbinC示節(jié)計耳

段一

)子因.FactorScores對話框提供和因子值有關(guān)的選項,有三部分:(1)Method:

指定計算因子值的方法

有以下三種選項:

·Regression

回歸法·Bartlett

巴特利特法·Anderson-Rubin安德森一魯賓法(2)Saveas

variables:將因子值作為新變量保存在數(shù)據(jù)文件中(3)Display

factor

score

coefficient

matrix:

顯示因子值系數(shù)矩陣2019/9/10

46zf為

上Suppress

absolute

values

less

em

內(nèi)

于分

。

項于

0

.

1

數(shù)

?!蛄?/p>

表作

來(L)<

-1-ξ

(P

)它

越(R

)疾

數(shù)

式良

序(S)取

數(shù)(LD對

5

0

F(A):

-1

□2019/9/10(

0

5

)

設(shè)

(

)

項——

在【因子分析FactorAnalysis】

對話框中,單擊【選項Options】

鈕,出現(xiàn)【因子分析:選項

Factor

Analysis:Options

對話框?!笔е礛issing

Values

欄中的‘Exclude

cases

listwise按列表排除個

案’——‘Coefficient

Display

Format(系數(shù)顯示格式)’中的‘按大小排序

Sorted

by

size’表示依據(jù)主成分(因子)載荷量排序;

“取消小系數(shù)繼

助缺

值.Options

對話框提供有關(guān)缺失值處理及數(shù)據(jù)顯示格式的選項。(1)Missing

Values:缺失值處理方式選項(2)Cnefficient

Display

Format:因子負(fù)載的顯示方式·Sorted

by

size;

按絕對值的大小排列·Suppress

absolute

values

less

than:

不顯示絕對值小于指定值的因子負(fù)載2019/9/10

48zfMeanStd.DeviationAnalysis

NVehicle

type

.26

.442

152Price

in

thousands

27.33182

14.418669

152Engine

size

3.049

1.0498

152Horsepower

184.81

56.823

152Wheelbase

107.414

7.7178

152Width

71.089

3.4647

152Length

187.05g

13.4712

152Curb

weight

3.37618

.636593

152Fuel

capacity

17.959

3.9376

152Fuel

efficiency23.844.305152分

結(jié)

:1.描述性統(tǒng)計——均值、標(biāo)準(zhǔn)差等的描述2019/9/10

49zfDescriptive

StatisticsVehicle

typePrice

in

thousandsEngine

sizeHorsepowerWheelbaseWidthLengthCurb

weahtFuel

capacityFuelefficiencyCorrelationVehicletype1.000-.042.269.017.397.260.150.526.599-.577Price

inthousands-.0421.000.624.841.108.328.155.527.424-.492Engine

size.269.6241.000.837.473.692.542.761.667-.737Horsepower.017.841.8371.000.282.535.385.611.505-.616Wheelbase.397.108.473.2821.000.681.840.651.657-.497Width.260.328.692.535.6811.000.706.723.663-.602Length.150.155.542.385.840.7061.000.629.571-.448Curb

weight.526.527.761.611.651.723.6291.000.865-.820Fuel

capacity.599.424.667.505.657.663.571.8651.000-.802Fuel

efficiency-.577-.492-.737-.616497-.602-.448-.820-.8021.000相關(guān)系數(shù)矩陣眾對角線外的元素不全為0,

而且很

多的相關(guān)系數(shù)大于0.5,

這表明原始變量之間有相

關(guān)關(guān)系,

適合進行主成分分析。50zf2.相

關(guān)

數(shù)

陣———描述原始變量之間是否存在相關(guān)關(guān)系2019/9/10CorrelationMatrix3.共同度表CommunalitiesInitial

ExtOractionVehicletype1.000

.930Price

inthousands

1.000

.876Enginesize

1.000

.843Horsepower1.000

.933Wheelbase

1.000

.881Width

1.000

.776Length

1.000

.919Curbweight1.000

.891Fuelcapacity1.000

.861Fuel

efficiency

1.000

.860Extraction

Method:PrincipalComponentAnalysis如果共同度中extraction值越高,這意味著提取的主成分能很好

的代表原始變量。如果extraction值很低,我們則需要再提取一

個或多個主成分Communalities

(

共同度)每個原始變量的變異(信息)

有多少可被主成分解釋.Initial

:

每個原始變量的變異(信息)有多少可被所有的主

成分解釋?;谙嚓P(guān)系數(shù)進行

分析時,該值都為1。Extraction

:

每個原始變量的

信息有多少被提取的主成分給

提取了。

(

提取的主成分包含

了每個原始變量的信息多少)0.930,0.87

6

分別代表原始變量vehicle

type和price等有93%和87.6%被我們提取的主成分提取了?;趨f(xié)方差進行分析時,

每個變量

的Initial

是如何呢??4.碎石圖(陡坡檢查)——除去坡線平坦部分的主成分(因子)圖中第三個因子以后較為平坦,故保留3個因子碎石圖有助于我們確定最優(yōu)的主成分

個數(shù)。橫軸代表第幾主成分,縱軸代表相

應(yīng)主成分的特征值(方差)。通常,提取碎石圖較為陡峭部分的主

成分;斜坡處的主成分的方差貢獻較小,

考慮,原始變量的信息遺漏也較少。Scree

Plot76

中5|4|3|2|1|

口012

3Component

Number2019/9/10陡坡與斜坡的轉(zhuǎn)折點在第3和第4主

成分之間,從第4至第10主成分的方差很

小且差別不大,所以該例提取3個主成分較為合適。日4

567

891052zf5.方差貢獻率表——取特征值大于1的因子,共有3個,分別(5.994)

(1.654)(1.123);—

(

5

9

.

9

4

%

)

(16.54%)

(11.23%)Total這欄給出的是特征根,

即每個

主成分的方差

(或者說,所有原始

變量的信息有多少落到各個主成分

上去).%ofVariance

這欄代表主成分的方

差貢獻率,

即每個主成分方差占原

始變量總方差的比率.Cumulative

%

這欄代表累積方差貢

獻率

,即為前

n

個主成分的方差貢

獻率之和。如累積貢獻率76.482%=

第一主成分的方差貢獻59.938%+第二主成分的方差貢獻16.545%.ComponentInitial

EigenvaluesExtraction

Sums

of

Squared

LoadingsTotalo

ofVarianceCumulativeTotal%ofVarianceCumulativeo1235.9941.6541.12359.93816.54511.22759.93876.48287.7095.9941.6541.12359.93816.54511.22759.93876.48287.7097

.155

1.547

97.1818

.130

1.299

98.4809

.091

.905

99.38510.061.615100.000原始變量有10個,提取了10個主成分,且10個主成分的方差之和=10個原始變量的方差之和;依據(jù)特征根大于1,

我們提取了3個主成分。TotalvarianceexplainedExtraction

Method:Principal

Component

Analysis.91.09893.64095.6333.3892.541

1.994.339.254

.199456Component123Vehicle

typePrice

in

thousandsEngine

sizeHorsepowerWheelbaseWidthLengthCurb

weightFuel

capacity.471.580.871.740.732.821.719.934.885.533-.729-.290-.618

.480

.114

.304

.063

.184-.651-.092.018

.058

.340

.298

.556

-.121

-.210Fuel

efficiency-.863.004.339主成分載荷矩陣表主要反映原始變量

和主成分的相關(guān)關(guān)系,有助于我們進

行主成分

的解釋。.其中:

第一主成分與Engine

size,

Horsepower,

Wheelbase,width,length

,curbweight,Fuelcapacity,Fuelefficiency等高度相關(guān).第二主成分與

Price

in

thousands

高度相關(guān).第三主成分與

Vehicle

type高度相關(guān).Extraction

Method:Principal

Component

Anab從該表我們也可看到原始變量的信息如何被各個主成分提取的。如:Varvehictetspe)=0.4712+0.5332+(-0.651)2Var(Fuelercieney*,=(-0.863)2+0.0042+0.3392從該表也可得到每個主成分方差是如何從各原始變量中

提取的:Var(f)=0.4712+0.5802+0.8712+……+(-0.863)2Var(?)=0.5332+(-0.729)2+(-0.290)2+……+(0.004)2

Var

(?)=(-0.651)2+(-0.092)2+0.0182+……+(0.339)2根據(jù)該表我們可寫出因子分析模型:Vehicletype*=0.471fl+0.533f2-0.651f3Fuelefficiency*=-0.863fl+0.004f2-0.339f36

.

(

因子

荷)

表Component

Matrix(a)a3components

extracted.54zf1VehicletypePrice

infhaucandcEnginesizeHorsepowerWheelbaseWidthLengthCurb

weightFuelcapacityFuelefficiency.079.097145.124.122.137.120.156.148-.1442.322-.440-.175-.373.290.069.184.038.111.0023-.579-.082

.016

.052

.302

.266

.495-.108-.181.301每個樣本的原始變量信息帶入以上模型我們則可得到每個樣本:

f?*,fz*,f?”的取值。依據(jù)該取值我們可評價哪些品牌汽車在外觀及油耗性能

(f,*)

上占優(yōu)或

劣勢

;

在f,*

(

)

上占優(yōu)或處于劣勢;

,要提升各品牌汽車應(yīng)從何著手。7.主成

(

因子)得分系數(shù)表ComponentScoreCoefficient

Matrix綜合f,*,fz?*,f?*的信息對各種品牌汽車的

進行綜合評價,依據(jù)各主成分的方差貢獻產(chǎn)生新變量:f=0.5999f?*+0.165f?+0.112f?

"依據(jù)該表,我們可寫出主成分分析模型:

f?*=0.079Vehicletype*+0.097Price*+Engine

size*+……-0.144Fuel

efficiency*…

…Extraction

Method:PrincipalComponentAnalysis.Component0.145zt

Component1231

1.000

.000

.0002

.000

1.000

.0003.000.0001.0008.主成分(因子

)得分協(xié)方差矩陣ComponentScoreCovariance

Matrix2019/9/10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論