版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
因子分析法預(yù)測第1頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第一節(jié)引言第二節(jié)主成分分析第三節(jié)因子分析第四節(jié)對應(yīng)分析主要內(nèi)容第2頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第一節(jié)引言第3頁,共112頁,2023年,2月20日,星期六YOURSITEHERE回歸分析因果因子分析由因索果執(zhí)果析因第4頁,共112頁,2023年,2月20日,星期六YOURSITEHERE方陣的特征值和特征向量對于n階方陣AAx=lx特征值實數(shù)(也可以是復(fù)數(shù))特征向量n維非零向量可以用從一點指向另一點的箭頭來表示縮放因子矩陣乘法對應(yīng)了一個變換,把一個向量變成同維數(shù)的另一個向量第5頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一個變換的特征向量是這樣一種向量,它經(jīng)過這種特定的變換后保持方向不變,只是進行長度上的伸縮而已。特征向量所指示的方向是更本質(zhì)的東西,特征值只不過反映了特征向量在變換時的伸縮倍數(shù)。特征方程|A-lI|=0的解為特征值l;滿足(A-liI)xi=0的向量xi為li的特征量。第6頁,共112頁,2023年,2月20日,星期六YOURSITEHEREn階方陣A有且恰有n個特征值;AT與A有相同的特征值;n階方陣A=(aij)nxn的跡等于其特征值之和;實對稱矩陣A的特征值都是實數(shù);實對稱矩陣A的不同特征值所對應(yīng)的特征向量都正交。因此,其特征值可以排序:l1≥l2≥…≥lp因此,存在正交矩陣P,使得P-1AP=∧
(以A的n個特征值為對角元素的對角陣)第7頁,共112頁,2023年,2月20日,星期六YOURSITEHERE地質(zhì)成因是地質(zhì)學(xué)研究的根本問題之一。理性認識↑感性認識內(nèi)在本質(zhì)↑外在表象從定量角度對各地質(zhì)變量進行成因分析,所建立的數(shù)學(xué)模型一般有主成分分析(又稱主分量分析)因子分析(R型、Q型)對應(yīng)分析第8頁,共112頁,2023年,2月20日,星期六YOURSITEHERE在如此多的地質(zhì)變量之中,有很多是相關(guān)的。人們希望能夠找出它們的少數(shù)“代表”來對它們進行描述。需要把這種有很多變量的數(shù)據(jù)進行高度概括。一般情形下,每個變量都會提供一定的信息,但其重要程度與側(cè)重有所不同,且這些變量所提供的信息在一定程度上有所重疊。把所有指標(biāo)和數(shù)字都原封不動地擺出去嗎?第9頁,共112頁,2023年,2月20日,星期六YOURSITEHERE利用相關(guān)性來對所涉及的變量加以“改造”和“組合”。用為數(shù)較少的、互不相關(guān)(或基本不相關(guān))的新變量來“代表”原來多個變量所提供的信息。通過對新變量的分析達到合理分析和數(shù)據(jù)解釋的目的。相關(guān)→互不相關(guān)第10頁,共112頁,2023年,2月20日,星期六YOURSITEHERE潛在的、可導(dǎo)出的(latent、derived)少量不相關(guān)取主舍次識別、分離隱性的基因的可觀測的(observed)大量相關(guān)主次雜亂混合、疊加顯性的多樣化的地質(zhì)資料觀測變量因子兩類變量的不同特性執(zhí)果析因第11頁,共112頁,2023年,2月20日,星期六YOURSITEHERE最早提出:J.Person(皮爾遜),主成分分析,1901、S.Spearman(斯卑爾曼),真因子分析,1904年,用于心理學(xué)研究;Benzeci(貝爾凱斯),對應(yīng)分析,1970。因子分析最早引入地質(zhì)領(lǐng)域:W.C.Krumbren(克倫賓),1957年,研究沉積學(xué)。應(yīng)用發(fā)展的重要地質(zhì)人物:J.Imbrie(英布里)發(fā)展簡史已成為地質(zhì)學(xué)等領(lǐng)域中傳播最快、應(yīng)用最廣的多元統(tǒng)計方法之一。第12頁,共112頁,2023年,2月20日,星期六YOURSITEHERE基本概念是一種常用的處理高維數(shù)據(jù)的多元統(tǒng)計分析方法。是一種化繁為簡,將指標(biāo)盡可能壓縮的降維(即空間壓縮)技術(shù)。把數(shù)目較多的變量作線性組合,組合成幾個主要的新變量——主成分,少數(shù)幾個主成分代表了原有變量變化的主要信息。又稱主分量分析。主成分分析(PrincipalComponentAnalysis)作用:降維第13頁,共112頁,2023年,2月20日,星期六YOURSITEHERE信息的大小如何度量?從統(tǒng)計分析角度看,一個指標(biāo)(看作隨機變量)或一串?dāng)?shù)據(jù)所包含的信息,可以用差異的大小——方差來度量。方差越大,所包含的信息量就越大;方差越小,所包含的信息量就越小。數(shù)學(xué)物理化學(xué)總分甲807060210乙707060200丙607060200第14頁,共112頁,2023年,2月20日,星期六YOURSITEHEREx1x2y2y1第15頁,共112頁,2023年,2月20日,星期六YOURSITEHERE是一種常用的處理高維數(shù)據(jù)的多元統(tǒng)計分析方法。是一種探索不易觀測或不能觀測的潛在因素,用有限個隱變量來解釋原始變量之間相關(guān)關(guān)系的技術(shù)。是通過對地質(zhì)觀測數(shù)據(jù)的分析來建立一個成因系統(tǒng)。它能把原來具有一定程度相關(guān)聯(lián)系的地質(zhì)變量轉(zhuǎn)換為數(shù)量較少的由原始地質(zhì)變量組合而成的新變量——因子,用它們來代替原始變量,各因子之間基本上是不相關(guān)的(基本獨立)。又稱析因分析。因子分析(FactorAnalysis)基本概念第16頁,共112頁,2023年,2月20日,星期六YOURSITEHERE相關(guān)性度量:變量間的方差-協(xié)方差、相關(guān)系數(shù)相關(guān)性度量:夾角余弦和各種距離系數(shù)R型因子分析R型因子分析是主成分分析的發(fā)展Q型因子分析研究變量之間的成因分類研究樣品之間的成因分類因子分析分類第17頁,共112頁,2023年,2月20日,星期六YOURSITEHERECIMFEABDKLGJN形狀因子1因子2因子3=2+0+0CHH=2+1+1第18頁,共112頁,2023年,2月20日,星期六YOURSITEHERE沉積盆地與剝蝕區(qū)示意圖F1F2F3xj=f(F1,F2,F3,ε)第19頁,共112頁,2023年,2月20日,星期六YOURSITEHEREMgCO3SiO2CaCO3COMgCaSi碳酸鹽演示分類三角圖解第20頁,共112頁,2023年,2月20日,星期六YOURSITEHERER2R1R1=[4Si-11(Na+K)-2(Fe+Ti)]R2=(Al+2Mg+6Ca)侵入巖分類R1-R2圖解(DelaRoche等,1980)第21頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子分析典型應(yīng)用問題沉積盆地蝕源區(qū)的研究沉積物粒度分析沉積相研究地層分析古生物與古環(huán)境的研究巖石化學(xué)成分的研究變質(zhì)巖原巖恢復(fù)礦床成因研究礦物的類質(zhì)同象研究地球化學(xué)等識別礦化活動的階段和類型分析成礦控制因素識別地層剖面上發(fā)生的氣候、水體深度、物質(zhì)來源,水動力學(xué)條件等沉積環(huán)境因素的細微變化。識別在同一時間點上不同空間過程的疊加過程;識別蝕源區(qū)的個數(shù)、巖石類型、分布識別巖漿巖的形成過程,諸如巖漿的異源疊加,或同源多期侵入,分異作用,交代作用,同化作用,交代識別作用,礦化活動等;巖漿巖的分類識別在同一空間點上不同時間過程的疊加過程第22頁,共112頁,2023年,2月20日,星期六YOURSITEHERE作用:用最精煉的形式描述地質(zhì)對象(壓縮原始數(shù)據(jù),降維技術(shù))指示成因推理方向(探索潛在因素、進行成因分類、思考成因結(jié)論)分解疊加的地質(zhì)過程(例如:得到礦物共生組合變量→劃分不同成礦階段→不同地質(zhì)過程分解、時空分解)等第23頁,共112頁,2023年,2月20日,星期六YOURSITEHERE是在R型因子分析和Q型因子分析的基礎(chǔ)上發(fā)展起來的,能夠揭示變量與樣品之間雙重關(guān)系的一種多元統(tǒng)計方法。又稱R-Q型因子分析。對應(yīng)分析(CorrespondenceAnalysis)基本概念第24頁,共112頁,2023年,2月20日,星期六因子分析是研究系統(tǒng)分類、成因分類的重要手段,在地質(zhì)研究中的作用:
第一、壓縮原始數(shù)據(jù)。
第二、指示成因推理方向。
第三、分解疊加的地質(zhì)過程。
第25頁,共112頁,2023年,2月20日,星期六因子分析是研究變量間相關(guān)關(guān)系、樣品間相似關(guān)系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關(guān)系之內(nèi)在原因的一些多元統(tǒng)計分析方法的總稱.根據(jù)它們的的研究對象可分為:(1)、主成分分析;(2)、R型因子分析;(3)、Q型因子分析;(4)、對應(yīng)分析;第26頁,共112頁,2023年,2月20日,星期六因子分析在地質(zhì)研究中的應(yīng)用:第27頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第二節(jié)主成分分析第28頁,共112頁,2023年,2月20日,星期六2主成分分析地質(zhì)中經(jīng)常要作多變量的綜合分析,這些變量經(jīng)常是不獨立的,存在復(fù)雜的相關(guān)關(guān)系。為了化繁為簡,用一種數(shù)學(xué)方法把數(shù)目較多的變量作線性組合,組合成幾個主要的新變量——主成分。第29頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一、主成分分析的基本思想構(gòu)造關(guān)于原始變量的適當(dāng)?shù)木€性組合,形成幾個新變量(即所謂的主成分),它們是我們用來代替原始變量進行資料解釋的綜合性指標(biāo)。這一分析過程應(yīng)使得每個新變量都是各原始變量的線性組合新變量的數(shù)目大大少于原始變量的數(shù)據(jù)新變量保留了原始變量所包含的絕大部分信息新變量之間互不相關(guān),即各自含義的信息不重疊。第30頁,共112頁,2023年,2月20日,星期六主成分的幾何意義:
(1)N個點的新坐標(biāo)F1和F2的相關(guān)很小,幾乎為零。
(2)在新坐標(biāo)系中N個點的波動(方差)大部分歸結(jié)為F1的波動,F(xiàn)2的波動很小,故用F1就可以反映變化的大部分信息。
(3)由于是正交坐標(biāo)系,坐標(biāo)(F1,F(xiàn)2)與(x1,x2)間的關(guān)系可用下式表示:
x1x2F1F2A是正交矩陣,滿足第31頁,共112頁,2023年,2月20日,星期六第32頁,共112頁,2023年,2月20日,星期六計算步驟:
(1)作數(shù)據(jù)標(biāo)準(zhǔn)化。
(2)計算變量之間的相關(guān)系數(shù)矩陣
(3)用Jacobi法計算相關(guān)系數(shù)矩陣R的特征值λj及對應(yīng)的特征向量uj(j=1,2,…,p)即可得主成分Fj,其表達式為:
第33頁,共112頁,2023年,2月20日,星期六(4)計算前m個特征值所占的累計百分比:
(5)計算各個樣品在m個主成分上的得分,第i個樣品的第j個主成分為:
(6)利用前m個主成分作地質(zhì)解釋或利用樣品在主成分上的得分對樣品進行分類。
第34頁,共112頁,2023年,2月20日,星期六第35頁,共112頁,2023年,2月20日,星期六第36頁,共112頁,2023年,2月20日,星期六第37頁,共112頁,2023年,2月20日,星期六第38頁,共112頁,2023年,2月20日,星期六第39頁,共112頁,2023年,2月20日,星期六第40頁,共112頁,2023年,2月20日,星期六第41頁,共112頁,2023年,2月20日,星期六YOURSITEHERE二、主成分分析的數(shù)學(xué)提法觀測資料矩陣x1 x2xpCaseVar.12n確定應(yīng)該構(gòu)造多少個綜合指標(biāo)(主成分),并如何構(gòu)造出各主成分的表達式(用x1,x2,…,xp表示)第42頁,共112頁,2023年,2月20日,星期六YOURSITEHEREx1x2y2y1方差越大,所包含的信息量就越大主成分分析第43頁,共112頁,2023年,2月20日,星期六YOURSITEHERE我們希望用y1來代替原來p個變量x1,x2,…,xp,這就要求在向量l1的正則化條件下,y1的方差盡可能大,由此確定的隨機變量y1稱為第一主成分。如果第一主成分還不足以反映原來p個變量的信息,那么考慮第二主成分。為了有效反映原變量的信息,新變量y1和y2所包含的信息不應(yīng)重疊,即要求y1和y2不相關(guān)。前述兩個約束條件下求l2使Var(y2)達到最大,從而得到第二主成分。第44頁,共112頁,2023年,2月20日,星期六YOURSITEHERE以此類推,我們最多可以找出p個yi出來。然而我們最多只選擇k個yi(i=1,2,…,k,k<p),并希望主成分數(shù)量較少,但解釋能力卻能達到約85%以上。推導(dǎo)表明:變量x1,x2,…,xp的主成分是以協(xié)方差矩陣S(或相關(guān)矩陣R)的特征向量為系數(shù)的線性組合,它們互不相關(guān),方差為S(或R)的特征根。而S(或R)的特征根l1≥
l2≥…≥
lp,所以有:Var(y1)≥Var(y2)≥…≥Var(yp)>0。第45頁,共112頁,2023年,2月20日,星期六YOURSITEHERE對p個指標(biāo),經(jīng)過適當(dāng)線性組合,p個新變量為這里y1,y2,…,yp——分別稱為第一主成分、第二主成分、第p主成分。lij——稱為第i個主成分yi
在第j個原始變量xj
上的載荷(主成分載荷),是第i個特征向量的第j個分量
。第46頁,共112頁,2023年,2月20日,星期六YOURSITEHERE其中,樣本協(xié)方差矩陣樣本相關(guān)矩陣對標(biāo)準(zhǔn)化數(shù)據(jù)矩陣:新變量(隨機變量)yi的方差與協(xié)方差第47頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一般地,在約束條件(向量l的正則化)(yi和yk所包含的信息不應(yīng)重疊,即yi和yk不相關(guān))之下求向量li,使Var(yi)達到最大,由此向量li所確定的稱為x1,x2,…,xp的第i個主成分。第48頁,共112頁,2023年,2月20日,星期六YOURSITEHERE三、主成分的性質(zhì)①Y=L’X,L’L=I。這里,L為X的協(xié)差陣的特征向量(單位化的)組成的正交陣。②y的各分量之間是互不相關(guān)的。③y的p個分量是按方差大小、由大到小排列的。④
y的協(xié)差陣為對角陣。第49頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第k個主成分的方差貢獻率前k個主成分的累積方差貢獻率(一般取80%,85%)⑤⑥這里,a(yi,xj)表示第i個主成分yi
和第j個原始變量xj
之間的線性相關(guān)系數(shù),稱為因子載荷。矩陣A=(aij)稱為因子載荷矩陣標(biāo)準(zhǔn)化:消除量綱和數(shù)量級上的影響,sii=1(k<p)系統(tǒng)總方差不變(i,j=1,2…,p)⑦⑧第50頁,共112頁,2023年,2月20日,星期六YOURSITEHERE①對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化變換②計算個變量間的相關(guān)系數(shù),形成相關(guān)系數(shù)矩陣R。③求出R的特征值并按大小排列及相應(yīng)于的單位特征向量。即可得主成分的表達式。④將特征值按大小降序排列,計算前k個特征值之和占特征值總和的百分數(shù),一般按累積方差貢獻率大于85%(或80%)的準(zhǔn)則,來確定k,從而建立前k個主成分:四、主成分的計算步驟第51頁,共112頁,2023年,2月20日,星期六YOURSITEHERE⑤計算各個樣品在k個主成分上的得分。第i個樣品的第j個主成分得分為:從而可得新指標(biāo)(主成分)樣本值(yij)nxk以代替原樣本值(xij)nxp作統(tǒng)計分析。⑥對前k個主成分進行地質(zhì)解釋并對樣品進行分類。四、主成分的計算步驟第52頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(A)Sn,(B)As,(C)Cu,(D)Pb,(E)Zn,(E)Cd.三角符號表示錫礦床,粗黑線條表示斷層四、應(yīng)用實例第53頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第54頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第一主成分第55頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第三節(jié)因子分析第56頁,共112頁,2023年,2月20日,星期六YOURSITEHERE一、因子分析的基本思想對于直接可觀測的隨機變量,根據(jù)其相關(guān)性大小,使得同組內(nèi)的變量之間相關(guān)性較高,不同組的變量相關(guān)性較低。每組變量代表一個基本結(jié)構(gòu),用一個不可觀測的綜合變量表示,這個基本結(jié)構(gòu)稱為公因子。于是,原始觀測的隨機變量X可分解為不可觀測(或未做觀測)的兩個隨機向量的線性組合:一是對整個X有影響的公共因素——公因子;二是只對各對應(yīng)分量有影響的特殊因素——特殊因子。第57頁,共112頁,2023年,2月20日,星期六YOURSITEHEREF1F2第58頁,共112頁,2023年,2月20日,星期六YOURSITEHERE建立因子載荷矩陣給出各公共因子的合理解釋及命名若有必要(當(dāng)難以招到合理解釋的公共因子)時,進一步作因子旋轉(zhuǎn)。因子分析的基本任務(wù)是:因子分析就是尋找這些公共因子的模型分析方法,它是在主成分的基礎(chǔ)上構(gòu)筑若干意義較為明確的公因子,以它們?yōu)榭蚣芊纸庠兞?,以此考察原變量間的聯(lián)系與區(qū)別。第59頁,共112頁,2023年,2月20日,星期六百米跑成績X1跳遠成績X2鉛球成績X3跳高成績X4400米跑成績X5百米跨欄X6鐵餅成績X7撐桿跳遠成績X8標(biāo)槍成績X91500米跑成績X10
奧運會十項全能運動項目得分數(shù)據(jù)的因子分析
第60頁,共112頁,2023年,2月20日,星期六
因子載荷矩陣可以看出,除第一因子在所有的變量在公共因子上有較大的正載荷,可以稱為一般運動因子。其他的3個因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉(zhuǎn)因子,得下表第61頁,共112頁,2023年,2月20日,星期六
通過旋轉(zhuǎn),因子有了較為明確的含義:
X1百米跑,X2跳遠和X5400米跑,需要爆發(fā)力的項目在F1有較大的載荷,F1可以稱為短跑速度因子;
X3鉛球,X7鐵餅和X9
標(biāo)槍在F2上有較大的載荷,可以稱為爆發(fā)性臂力因子;
X6百米跨欄,X8撐桿跳遠,X2跳遠和X4跳高在F3上有較大的載荷,F(xiàn)3爆發(fā)腿力因子;F4
長跑耐力因子第62頁,共112頁,2023年,2月20日,星期六設(shè)對研究對象的n個樣品測試了p個變量x1,x2,…,xp,可認為這p個變量共同起因于m因子(即因素)F1,F2,…,Fm.假定這m個公因子(可理解為新的變量)對每個指標(biāo)(變量)的影響或作用是線性的(我們總是討論線性模型),那么,因子分析模型可以表示為:
二、R型因子分析的數(shù)學(xué)提法第63頁,共112頁,2023年,2月20日,星期六YOURSITEHERE稱為因子模型。矩陣形式第64頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(1)x=(x1,x2,…,xp)'是可觀測隨機向量,均值向量E(x)=0,協(xié)方差陣Cov(X)=∑,且協(xié)方差陣∑與相關(guān)矩陣R相等(因子分析通常要先對觀測資料數(shù)據(jù)作標(biāo)準(zhǔn)化處理);(2)F=(F1,F2,…,Fm)’(m<p)是不可測的向量,其均值向量E(F)=0,協(xié)方差矩陣Cov(F)=I,即向量的各分量是相互獨立的;(3)ε=(ε1,ε2,…,εp)’與F相互獨立Cov(F,ε)=0,且E(ε)=0,e的協(xié)方差陣∑是對角陣,即各分量e之間是相互獨立的。假定條件第65頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子載荷第i個變量在第j個公因子上的載荷A中元素aij稱為第66頁,共112頁,2023年,2月20日,星期六YOURSITEHERE主成分模型特征向量約束條件從而,每個原始變量亦可用各主成分F1,F2,…,Fp的線性組合來表示實際上,我們不需要p個主成分,按累積方差貢獻取前m個主成分。從主成分分析模型到因子分析模型第67頁,共112頁,2023年,2月20日,星期六YOURSITEHERE這m個主成分對應(yīng)的數(shù)據(jù)矩陣就是將特征向量矩陣剖分成:(i=1,2,…,p)于是使得模型中FA和FB因子中各變量都是標(biāo)準(zhǔn)化,即均值為0,方差為1,可得R型因子模型:從主成分分析模型到因子分析模型第68頁,共112頁,2023年,2月20日,星期六YOURSITEHERE稱為因子模型。矩陣形式因子分析——二、R型因子分析的數(shù)學(xué)提法公因子、公共因子或潛因子特殊因子唯一因子原始觀測變量共性個性第69頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子載荷第i個變量在第j個公因子上的載荷A中元素aij稱為略去特殊因子部分,因子分析的簡化模型(m<p)第70頁,共112頁,2023年,2月20日,星期六YOURSITEHERE三、因子載荷矩陣的求解方法一:主成分法方法二:極大似然法(在多元正態(tài)分布的假定下)第71頁,共112頁,2023年,2月20日,星期六YOURSITEHERE四、與因子載荷矩陣的統(tǒng)計意義(1)因子載荷aij的統(tǒng)計意義aij——第i個變量在第j個公因子上的載荷;lij——由相關(guān)矩陣R提取的第j個公因子之特征值(j=1,2,...,m)所對應(yīng)的特征向量在第i個分量。因子載荷求解公式:(注意:E(Fj)=0,Var(Fj)=1)aij——是變量xi與Fj的協(xié)方差,也是xi與Fj的相關(guān)系數(shù)(依賴程度)。第i個變量在第j個公因子上的重要性(權(quán)重)。aij
的絕對值越大(|aij|≤1),表明xi
與Fj的相依程度越大,或稱公共因子Fj
對于xi的載荷量越大。公因子F的實際含義,這可以通過各變量在公因子上載荷的符號與絕對值的大小來描述。第72頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(2)變量共同度hi2的統(tǒng)計意義(也稱公因子方差、共性方差、公共方差)因子載荷矩陣中各行元素的平方和F1F2Fm公因子方差hi2代表所有m個公因子對原始變量xi的總方差的貢獻。反映了xi對于F1,F2,…,Fm的共同依賴程度。如果公因子方差近于1,則說明該變量xi的幾乎全部原始信息都被所選取的因子說明了。公因子方差的意義在于提供轉(zhuǎn)化為因子空間后,保留原來各變量的信息有多少。 注意:(特殊方差個性方差)第73頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(3)公因子Fj的方差貢獻的統(tǒng)計意義因子載荷矩陣中各列元素的平方和F1F2Fm公因子Fj對所有原始變量所提供方差貢獻的總和。它是衡量公因子相對重要性的指標(biāo)。gj2
越大,表明公因子Fj
對
x的貢獻越大,或者說對x的影響和作用就越大。如果將因子載荷矩陣A的所有g(shù)j2(j=1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。注意:第74頁,共112頁,2023年,2月20日,星期六YOURSITEHERE五、因子旋轉(zhuǎn)1.旋轉(zhuǎn)的目的建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出的主因子解后,各個主因子的“典型變量”不很突出,還需要進行因子旋轉(zhuǎn)。使因子載荷兩極分化,因子載荷的平方值要么接近于0,要么接近于1。通過適當(dāng)?shù)男D(zhuǎn)得到比較滿意的因子。第75頁,共112頁,2023年,2月20日,星期六YOURSITEHERE(2)常用的旋轉(zhuǎn)方法①方差最大正交旋轉(zhuǎn)(varimaxorthogonalrotation)——因子對應(yīng)軸相互正交②斜交旋轉(zhuǎn)(obliquerotation)——因子對應(yīng)軸相互間不正交第76頁,共112頁,2023年,2月20日,星期六YOURSITEHERE②斜交旋轉(zhuǎn)因子斜交旋轉(zhuǎn)后,各因子負荷發(fā)生了較大變化,出現(xiàn)了兩極分化。各因子間不再相互獨立,而彼此相關(guān)。各因子對各變量的貢獻的總和也發(fā)生了改變。適用于大數(shù)據(jù)集的因子分析。①方差最大正交旋轉(zhuǎn)基本思想以使各因子載荷值的方差達到最大作為因子載荷矩陣簡化的準(zhǔn)則,且保持原公因子的正交性和變量共同度hi2不變,此時公因子的方差貢獻則不再與原來相同??墒姑總€因子上的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。第77頁,共112頁,2023年,2月20日,星期六YOURSITEHERE因子旋轉(zhuǎn)的操作對于二維因子來說好辦,而多維因子的旋轉(zhuǎn)就復(fù)雜多了,每次只調(diào)整兩個因子軸,讓其它的軸固定,這樣不斷反復(fù)地進行,直到獲得最大方差為止。bij為旋轉(zhuǎn)后因子載荷中第i行第j列的元素,使用平方是為了避免負值?!_到極大第78頁,共112頁,2023年,2月20日,星期六YOURSITEHEREF1F1F2F2Factor1 Factor2 x1 0.5 0.5x2 0.7 0.7x3 -0.6 0.6x4 -0.5 -0.5 Factor1 Factor2 x1 0 0.6x2 0 0.9x3 -0.9 0x4 0 -0.9 21342134正交旋轉(zhuǎn)及樣品點投影第79頁,共112頁,2023年,2月20日,星期六YOURSITEHERE六、因子得分因子分析模型建立后,還有一個重要的作用是應(yīng)用因子分析模型去評價每個樣品(或變量)在整個模型中的地位,即進行綜合評價。由于公因子能充分反映原始變量的相關(guān)關(guān)系,用公因子代表原始變量時,將更有利于描述研究對象的特征。通常,所選取的公因子數(shù)總是少于原始變量數(shù)。對于每一個樣品,利用其原始變量觀測值去計算相應(yīng)因子Fi的估計值,這便稱為因子得分或因子計量。第80頁,共112頁,2023年,2月20日,星期六YOURSITEHERE變成F=bx
或Fj=bj1x1+…+bjpxpj=1,…,m.
稱為因子得分(函數(shù)).由簡化的因子模型可用Thomson法,即回歸法等來求?;貧w法得分是由Bayes思想導(dǎo)出的,得到的因子得分是有偏的,但計算結(jié)果誤差較小。第81頁,共112頁,2023年,2月20日,星期六YOURSITEHERE根據(jù)最小二乘估計得因為變量和因子均已標(biāo)準(zhǔn)化,所以bj0=0第82頁,共112頁,2023年,2月20日,星期六第83頁,共112頁,2023年,2月20日,星期六YOURSITEHERE七、Q型因子分析(自學(xué))第84頁,共112頁,2023年,2月20日,星期六YOURSITEHERE輸入原始數(shù)據(jù)xn*p,計算樣本均值和方差,進行標(biāo)準(zhǔn)化計算(處理);求樣本相關(guān)系數(shù)矩陣R=(rij)p*p;求相關(guān)系數(shù)矩陣的特征根λi(λ1,λ2,…,λp>0)和相應(yīng)的標(biāo)準(zhǔn)正交的特征向量li;八、因子分析的步驟第85頁,共112頁,2023年,2月20日,星期六YOURSITEHERE確定公共因子數(shù)m(按前m個特征值之和占特征值總和的百分比來確定);求出主因子載荷矩陣A=[aij];計算公共因子的共性方差hi2,是否接近于1;對載荷矩陣進行旋轉(zhuǎn),以求能更好地解釋公共因子;計算因子得分;對公共因子作出專業(yè)性的解釋。第86頁,共112頁,2023年,2月20日,星期六YOURSITEHERE相關(guān)性度量:變量間的方差-協(xié)方差、相關(guān)系數(shù)相關(guān)性度量:夾角余弦和各種距離系數(shù)R型因子分析——控礦地質(zhì)因素分析R型因子分析是主成分分析的發(fā)展Q型因子分析——圈定遠景區(qū)研究變量之間的成因分類研究樣品之間的成因分類第87頁,共112頁,2023年,2月20日,星期六焦家金礦礦化元素因子分析地質(zhì)找礦論叢,2008年02期焦家金礦位于膠東西北部,是“焦家式破碎帶熱液蝕變巖型”金礦的命名地。它以規(guī)模巨大、礦體形態(tài)簡單、礦化連續(xù)、穩(wěn)定等特點明顯有別于石英脈金礦。第88頁,共112頁,2023年,2月20日,星期六在水平上,以斷面為中心向外依次出現(xiàn)絹英巖化帶、鉀化-絹英巖化-硅化帶、硅化-鉀化帶、正?;◢弾r帶;在垂向上,蝕變分帶不是很發(fā)育,隨著深部韌性變形作用加強,蝕變的強度和規(guī)模都逐漸減小。第89頁,共112頁,2023年,2月20日,星期六第90頁,共112頁,2023年,2月20日,星期六第91頁,共112頁,2023年,2月20日,星期六第92頁,共112頁,2023年,2月20日,星期六第93頁,共112頁,2023年,2月20日,星期六第94頁,共112頁,2023年,2月20日,星期六第95頁,共112頁,2023年,2月20日,星期六第96頁,共112頁,2023年,2月20日,星期六第97頁,共112頁,2023年,2月20日,星期六第98頁,共112頁,2023年,2月20日,星期六第99頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第四節(jié)對應(yīng)分析第100頁,共112頁,2023年,2月20日,星期六YOURSITEHERE對應(yīng)分析是在R型因子分析和Q型因子分析的基礎(chǔ)上發(fā)展起來的、能夠揭示變量與樣品之間雙重關(guān)系的一種多元統(tǒng)計方法。第101頁,共112頁,2023年,2月20日,星期六YOURSITEHERE可提供以下信息:①變量間的關(guān)系:空間上鄰近的一些變量點,表示這些變量緊密相關(guān),即它們具有成因上的聯(lián)系,指示某一特定的地質(zhì)作用;②樣品間的關(guān)系:鄰近的樣品點具有相似的性質(zhì),屬同一類型,是同樣地質(zhì)作用的產(chǎn)物;③變量與樣品之間的關(guān)系:同一類型的樣品點將為鄰近的變量點所表征。也就是說,同類樣品點為其鄰近變量點所指示的地質(zhì)作用下的產(chǎn)物。更重要的是,可在同一圖上表示出上述三種信息,從而可同時進行分類及地質(zhì)推斷解釋。第102頁,共112頁,2023年,2月20日,星期六YOURSITEHERER型和Q型對應(yīng)關(guān)系的對偶定理第103頁,共112頁,2023年,2月20日,星期六YOURSITEHERE第104頁,共112頁,2023年,2月20日,星期六YOURSITEHEREG2F2G2
F200.2-0.20.20.4-0.2-0.41.2.3.4.5.6.7.8.11.10.12.9.13.1△2△3△4△5△6△7△
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司勞務(wù)派遣協(xié)議書七篇
- 公司協(xié)議書大全
- 萬能施工安全協(xié)議書
- 面部發(fā)紅發(fā)熱病因介紹
- 進行性球麻痹病因介紹
- 29化學(xué)中考真題匯編《溶液》及答案
- 中考政治第一部分知識闖關(guān)能力提升第5課時平等禮貌待人理解寬容他人復(fù)習(xí)課獲
- (范文)卷板機項目立項報告
- (2024)吸痰管項目可行性研究報告寫作范本(一)
- 2023年電子陶瓷材料項目融資計劃書
- 主要農(nóng)作物(糧食作物)課件
- 百詞斬-定語從句課件-(;)
- 珍惜時間主題班會-做時間的主人課件
- 市政工程施工總體部署
- 護士準(zhǔn)入申請表
- 三年級上冊英語課件-Unit3 Look at me-人教(PEP) (6)(共30張PPT)
- 西方音樂史課程大綱
- 糖皮質(zhì)激素在呼吸科的應(yīng)用課件
- 合法離婚協(xié)議書(2篇)
- 2022年廣東南方報業(yè)傳媒集團有限公司招聘筆試題庫及答案解析
- 20m29.6m30.4m20m鋼箱梁橋?qū)嵗O(shè)計內(nèi)容與表達
評論
0/150
提交評論