因子分析概述和應(yīng)用簡(jiǎn)例

上傳人：b*** IP屬地：廣東上傳時(shí)間：2022-07-23 格式：PPT 頁(yè)數(shù)：70 大?。?86.50KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩65頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1因子分析概述和應(yīng)用簡(jiǎn)例1 因子分析概述4 方差最大正交旋轉(zhuǎn)5 因子得分6 對(duì)應(yīng)分析5 應(yīng)用簡(jiǎn)例2 R型因子分析3 主因子的解7 Q型因子分析21 因子分析概述一、因子分析的基本概念 1900年C.斯皮爾曼發(fā)表了對(duì)學(xué)生考試成績(jī)分析的著名文章，可認(rèn)為是因子分析的開(kāi)始。1957年由Krumbein把該方法引入到地質(zhì)學(xué)研究，后來(lái)，又由Imbrie對(duì)該方法在地質(zhì)學(xué)中的應(yīng)用和發(fā)展作了大量的基礎(chǔ)工作。因子分析是研究變量間相關(guān)關(guān)系、樣品間相似關(guān)系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關(guān)系之內(nèi)在原因的一些多元統(tǒng)計(jì)分析方法的總稱。根據(jù)它們的研究對(duì)象，因子分析大致可分為R型因子分析、Q型因子分析和對(duì)應(yīng)

2、分析三種類型。在此僅介紹基于相關(guān)系數(shù)和相似系數(shù)統(tǒng)計(jì)量下的因子分析。3(一)變量的相關(guān)矩陣設(shè)n個(gè)樣品m個(gè)變量觀測(cè)值標(biāo)準(zhǔn)化后的矩陣形式如下（在因子分析后續(xù)的討論中，若無(wú)特殊說(shuō)明，數(shù)據(jù)均約定是標(biāo)準(zhǔn)化的）：對(duì)于任意兩個(gè)變量xi(xi1, xi2, , xin)和xj(xj1, xj2, , xjn)，它們的相關(guān)系數(shù)為： 4m個(gè)變量的相關(guān)系數(shù)構(gòu)成的mm的矩陣為：且rij=rji，r11r22rmm1，并稱R為變量的相關(guān)矩陣 5(二)樣品的相似矩陣任意兩個(gè)樣品xi(x1i, x2i, , xmi)和xj(x1j, x2j, , xmj)的相似系數(shù)為 n個(gè)樣品的相似系數(shù)矩陣形式為且q11q22qnn1

3、，qijqji，稱Q為樣品的相似矩陣 6(三) R型因子分析 R型因子分析是從研究變量的相關(guān)(相似)系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā)，找出m個(gè)控制變量相關(guān)性的主因子fi (i=1,2,m)，由此把 xi 表示為fi的線性組合，即：在進(jìn)行綜合地質(zhì)研究時(shí)，如果用前p(p m)個(gè)主因子就能解釋原始數(shù)據(jù)8090%以上的信息，那么上式可改寫(xiě)為：7 用上式可極大地化簡(jiǎn)研究系統(tǒng)(降維分析問(wèn)題，特別是當(dāng)p=2時(shí)，可以在二維空間中繪圖)進(jìn)一步探索變量的成因聯(lián)系及空間變化規(guī)律的控制因素。通常稱上式為R型因子分析模型。 Q型因子分析是從研究樣品相似(相關(guān))系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā)，找出n個(gè)控制樣品相似性的主因子，若用前

4、p( pn)個(gè)主因子化簡(jiǎn)樣品研究系統(tǒng)，得到如下Q型因子分析模型:（四） Q型因子分析8f1, f2, f3,稱為公因子, ei稱為特殊因子。因子分析模型中,各變量(或樣品)中共同出現(xiàn)的因子fi (i=1,2, p)稱公因子, 是相互獨(dú)立的理論變量,可將其理解為p 維空間中相互垂直的p個(gè)坐標(biāo)軸。單一變量(或樣品)中特有的ei(i=1,2,m或n)叫做特殊因子,它們之間以及它們與所有公因子之間都是相互獨(dú)立的。它是把上述兩種因子分析方法結(jié)合起來(lái)，在同一個(gè)空間里研究樣品和變量的分布規(guī)律，更有利于進(jìn)行地質(zhì)解釋的一種多元統(tǒng)計(jì)分析方法。（五）對(duì)應(yīng)分析9二. 因子分析在地質(zhì)研究中的作用第二，指示成因

5、推理方向。因子分析能夠把龐雜紛亂的原始數(shù)據(jù)按成因上的聯(lián)系進(jìn)行歸納、整理、精煉和分類，理出幾條客觀的成因線索，為地質(zhì)人員提供邏輯推理方向，啟發(fā)思考相應(yīng)的成因結(jié)論。第三，分解疊加的地質(zhì)過(guò)程?，F(xiàn)實(shí)觀測(cè)到的地質(zhì)現(xiàn)象往往是多種成因過(guò)程疊加的產(chǎn)物，因子分析提供了一個(gè)分解疊加過(guò)程進(jìn)而識(shí)別每個(gè)單一地質(zhì)過(guò)程的手段。第一，壓縮原始數(shù)據(jù)。因子分析能在數(shù)量上大大精簡(jiǎn)原始數(shù)據(jù)但又不損失數(shù)據(jù)中包含的成因信息。從而有利于地質(zhì)人員進(jìn)行綜合分析。10三、因子分析在地質(zhì)研究中的應(yīng)用沉積盆地物源區(qū)的研究、沉積物的粒度分析、沉積相研究、地層分析、古環(huán)境與古生態(tài)的研究、石油與天然氣的成因研究、油田水的化學(xué)研究、有機(jī)地球化學(xué)研究

6、及石油、天然氣物化探資料分析等各個(gè)方面。11 假設(shè)有n個(gè)樣品，每個(gè)樣品有m個(gè)變量，它們的觀測(cè)值記為數(shù)據(jù)矩陣：1 因子分析概述一、主因子當(dāng)m=2時(shí)，在x1、x2坐標(biāo)系內(nèi)作出樣品的散點(diǎn)圖如圖9-1所示。(9-1)12x1x2圖9-1 主因子示意圖由圖可見(jiàn), 在x1、x2坐標(biāo)系內(nèi), x1、x2的方差幾乎沒(méi)有差別。若將坐標(biāo)系旋轉(zhuǎn)一個(gè)角度，得到新坐標(biāo)系 f1、f2 , 這時(shí)f1、f2的方差具有明顯差別, f1的方差占了總方差的絕大部分。因此新變量f1能夠反映原始數(shù)據(jù)所包含的絕大部分信息。由坐標(biāo)旋轉(zhuǎn)變換知新老變量間的關(guān)系為:或(9-2)f2f113 若f2的方差小于允許誤差時(shí),它就失去了存在的必

7、要,此時(shí)就可用f1代替兩個(gè)原始變量,而式(9-2)改為:或(9-3)其中ei服從均值為0，方差為2的正態(tài)分布。 (9-4)(i=1,2,m) 如果每個(gè)樣品有m個(gè)變量，仿照式(9-2)可以寫(xiě)出m個(gè)新變量：可以證明，上式系數(shù)的平方和滿足：14 把m個(gè)原始變量表示為p個(gè)主因子的線性組合，當(dāng)p小于m，特別是 p=2時(shí)，可以在二維空間對(duì)變量作圖，進(jìn)而對(duì)變量的相關(guān)性及成因聯(lián)系進(jìn)行研究。在此條件下，由原始變量經(jīng)線性組合而得到的新變量fi叫做主因子或綜合變量。組合成新變量有什么用途呢？15二、因子分析因子分析是研究變量間的相關(guān)性、樣品間的相似性、兩者成因聯(lián)系、探索它們之間產(chǎn)生相關(guān)(相似)關(guān)系之內(nèi)因的一

8、些多元統(tǒng)計(jì)分析方法的總稱。因子分析的任務(wù)之一是找出p( pm)個(gè)主因子，以此化簡(jiǎn)研究系統(tǒng)。根據(jù)研究對(duì)象不同,將因子分析分為R型、Q型因子分析和對(duì)應(yīng)分析三種方法。161. R型因子分析 (9-5) R型因子分析是從研究變量的相關(guān)(相似)系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā)，找出m個(gè)控制變量相關(guān)性的主因子fi (i=1,2,m)，由此把 xi 表示為fi的線性組合，即：其中稱因子載荷矩陣。17(9-6) 在進(jìn)行綜合地質(zhì)研究時(shí)，如果用前p(p m)個(gè)主因子就能解釋原始數(shù)據(jù)8090%以上的信息，那么式(9-5)可改寫(xiě)為：用上式可極大地化簡(jiǎn)研究系統(tǒng)(降維分析問(wèn)題，特別是當(dāng)p=2時(shí)，可以在二維空間中繪圖)進(jìn)

9、一步探索變量的成因聯(lián)系及空間變化規(guī)律的控制因素。通常稱式(9-6)為R型因子分析模型。18 Q型因子分析是從研究樣品相似(相關(guān))系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā)，找出n個(gè)控制樣品相似性的主因子，若用前p( pn)個(gè)主因子化簡(jiǎn)樣品研究系統(tǒng)，得到如下Q型因子分析模型:3.公因子2. Q型因子分析因子分析模型中,各變量(或樣品)中共同出現(xiàn)的因子fi (i=1,2, p)稱公因子, 是相互獨(dú)立的理論變量,可將其理解為p 維空間中相互垂直的p個(gè)坐標(biāo)軸。(9-7)f1, f2, f3,稱為公因子, ei稱為特殊因子。19 單一變量(或樣品)中特有的ei(i=1,2,m或n)叫做特殊因子,它們之間以及它們與所有公

10、因子之間都是相互獨(dú)立的。它是把上述兩種因子分析方法結(jié)合起來(lái)，在同一個(gè)空間里研究樣品和變量的分布規(guī)律，更有利于進(jìn)行地質(zhì)解釋的一種多元統(tǒng)計(jì)分析方法。因子載荷矩陣中的aij是第i個(gè)變量(或樣品)在第j 個(gè)因子軸上的負(fù)荷。如果把xi視為p維空間的一個(gè)向量，那么aij 則是xi在fj軸上的投影。 4.對(duì)應(yīng)分析20 由上述可知，進(jìn)行因子分析的關(guān)鍵是確定主因子載荷矩陣，在它的基礎(chǔ)上選定前p個(gè)主因子則可得到因子分析模型。21四、基本定理及主因子解因子分析的一個(gè)基本問(wèn)題是要由變量之間的相關(guān)系數(shù)矩陣R去確定因子載荷矩陣A。由前所述有 1.主因子解 222324 R*叫做約相關(guān)矩陣。因子分析的基本問(wèn)題之一就是

11、在已知約相關(guān)矩陣R*的條件下求解因子載荷矩陣A，使得R*AA。這也是因子分析的基本定理。實(shí)際中a1,a2,am很難確定，R*也不知道。因此常常用R代替R*，即由RAA求解因子載荷矩陣A。滿足RAA的因子解很多,如果A是它的解，那么A與正交矩陣T的乘積矩陣AT也是它的解，這是因?yàn)?這就告訴我們有許許多多的因子解。25 按下面的方法求得的因子解稱作主因子解。其做法是:根據(jù)變量的相關(guān)選出第一個(gè)因子 F1，使其在各變量的公因子方差中所作的方差貢獻(xiàn)最大，然后消去該因子影響，再?gòu)氖Ｓ嗟南嚓P(guān)中選出與F1不相關(guān)的因子F2，使其在各變量的剩余公因子方差中方差貢獻(xiàn)最大，如此繼續(xù)挑選直至各變量公因子方差分解完

12、畢為止。比如，選取第一個(gè)主因子F1，要使它的方差貢獻(xiàn)S1ai12(i=1,2,.,m)在R=AA之下達(dá)到最大，可用條件極值中的拉格朗日乘數(shù)法求出。這里不詳細(xì)給出其求解過(guò)程，只給出它的結(jié)果如下： 26 設(shè)變量相關(guān)系數(shù)矩陣R的特征值12, , p p+1 , m 0 對(duì)應(yīng)的特征向量為如果選定前p個(gè)主因子，那么可以證明前p個(gè)主因子載荷矩陣為:27相應(yīng)的R型因子分析模型為：282.主因子個(gè)數(shù) 用Jacobi法可求出相關(guān)(相似)系數(shù)矩陣的全部特征值和單位特征向量。若m個(gè)特征值從大到小排列為1,2,m，計(jì)算特征值累計(jì)百分比：然后根據(jù)C確定主因子數(shù)p。293.例在冀北坳陷東部某烴源巖層采得烴源巖樣品4個(gè)，每

13、個(gè)樣品測(cè)得3個(gè)地化指標(biāo)，共12個(gè)原始數(shù)據(jù)，將原始數(shù)據(jù)的各指標(biāo)變量標(biāo)準(zhǔn)化，得到標(biāo)準(zhǔn)化數(shù)據(jù)陣為:要求對(duì)上述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行主成分分析，考查各指標(biāo)變量間關(guān)系，計(jì)算各主因子的因子計(jì)量和因子貢獻(xiàn)。 30解：1、計(jì)算三個(gè)變量的相關(guān)系數(shù)矩陣2、計(jì)算主因子解，首先求得R的特征值為，方差貢獻(xiàn)的累計(jì)百分?jǐn)?shù)分別為、1。 313、確定公因子數(shù)p=2 前兩個(gè)特征值所對(duì)應(yīng)的特征向量為如下矩陣的兩個(gè)行向量得到主因子荷載矩陣為32二、Q型主因子載荷矩陣及主因子個(gè)數(shù) 設(shè)相似系數(shù)矩陣Q的特征值12p+1n對(duì)應(yīng)的特征向量為V1V2Vp+1Vn。如果選定前p個(gè)主因子，那么可以得到與R型主因子載荷類似的Q型主因子載荷矩陣為:相應(yīng)的Q型

14、因子分析模型為：1. 主因子載荷矩陣332.主因子個(gè)數(shù) 用Jacobi法可求出相似(相關(guān))系數(shù)矩陣的全部特征值和單位特征向量。若n個(gè)特征值從大到小排列為1,2,n, 計(jì)算特征值累計(jì)百分比：然后根據(jù)C確定主因子數(shù)p。343 方差最大正交旋轉(zhuǎn)與因子得分一、R型因子分析方差最大正交旋轉(zhuǎn) 確定了p 個(gè)主因子后，為便于解釋主因子的地質(zhì)意義，還要對(duì)主因子軸進(jìn)行旋轉(zhuǎn),使第j個(gè)公因子的代表性變量在fj軸上的系數(shù)等于或趨近于1，在其它公因子軸上的系數(shù)等于或趨近于0。1.方差最大正交旋轉(zhuǎn)的實(shí)現(xiàn)方法從數(shù)學(xué)上看,上述即對(duì)主因子矩陣A1實(shí)施正交變換。常用的方法是方差最大正交旋轉(zhuǎn),這種旋轉(zhuǎn)方法使p個(gè)因子保持彼此正交,并

15、且使因子載荷矩陣中的各因子載荷平方后的方差達(dá)最大。對(duì)于R型因子載荷矩陣A1來(lái)說(shuō),對(duì)因子fj的簡(jiǎn)化效果,用因子載荷平方的方差進(jìn)行描述:35當(dāng)V 達(dá)到最大時(shí)，p個(gè)因子都得到了最優(yōu)簡(jiǎn)化。(9-8) 其中bij是經(jīng)過(guò)正交旋轉(zhuǎn)后的因子載荷矩陣B的元素,為避免負(fù)值取bij2。若Vj為最大,即第j個(gè)因子得到了最優(yōu)簡(jiǎn)化,此時(shí)第j個(gè)公因子的代表性變量在fj軸上的系數(shù)等于或趨近1,而在其他公因子軸上的系數(shù)等于或趨近于0。對(duì)p個(gè)因子的簡(jiǎn)化效果用因子載荷平方的方差之和進(jìn)行度量：36 考慮到各個(gè)研究對(duì)象的公因子方差間的差異,可以用(bij2/hi2)代替bij2,并對(duì)式(9-8)兩邊乘以m，記為：(9-9) 實(shí)際是要求

16、V*達(dá)到最大。于是問(wèn)題歸結(jié)為求一個(gè)正交矩陣Tpp, 使B=A1T 滿足V* 為最大的條件。對(duì)于因子平面fg fq可以對(duì)A1作如下正交變換:1 . . . cos -sin . . . sin cos . . . 100Tgq=gqgq37B中的元素分別為：對(duì)A1進(jìn)行一次正交旋轉(zhuǎn)變換,相當(dāng)于對(duì)因子平面fgfq旋轉(zhuǎn)了一個(gè)角度,每次旋轉(zhuǎn)必須滿足使式(9-9)的值為最大,得到矩陣: 對(duì)于選定的p個(gè)主因子,必須對(duì)A1中所有p列配對(duì)旋轉(zhuǎn),總共需要旋轉(zhuǎn)p(p-1)/2次,全部旋轉(zhuǎn)完畢得到載荷矩陣:(9-10)38 由B2計(jì)算出V2* 重復(fù)循環(huán)旋轉(zhuǎn)，可以得到一個(gè)有界序列： V1*V2* 對(duì)于任意小正數(shù)，當(dāng)

17、|Vk*-Vk+1*|時(shí),結(jié)束計(jì)算,最后得到: 經(jīng)過(guò)一個(gè)循環(huán)旋轉(zhuǎn)得到B1 ,由此可按式(9-9)計(jì)算V1*。在上個(gè)循環(huán)旋轉(zhuǎn)的基礎(chǔ)上，從B1出發(fā)完成下個(gè)旋轉(zhuǎn)循旋轉(zhuǎn)得到B2, 即:39 前面介紹了實(shí)現(xiàn)方差最大正交旋轉(zhuǎn)的的基本思想，但在任何一次旋轉(zhuǎn)變換中，都涉及旋轉(zhuǎn)角度的問(wèn)題。確定旋轉(zhuǎn)角度的具體步驟如下：2.旋轉(zhuǎn)角度(不講) (1)把式(9-10)代入式(9-9)，得到函數(shù)V*();式中:; (2)求V*對(duì)的一階導(dǎo)數(shù)并令其為0，可以解得:(9-11)40 (3)將函數(shù)V*()展開(kāi)化簡(jiǎn)，剩下包含sin4、sin22 的項(xiàng)，使V*()成為以/2位周期的函數(shù)，因而4在/2范圍內(nèi)，通常在-/4 /4之間。

18、 (4)由V*對(duì)的二階導(dǎo)數(shù)小于0，可得：由(9-12)可知,與E同號(hào)。 Q型因子分析方差最大正交旋轉(zhuǎn)與R型中的旋轉(zhuǎn)方法類似,不同之處是因子載荷矩陣A1=(aij)n p，因此,只要將上述公式中的m改為n即可。(9-12)41二、因子得分因子分析是將變量(或樣品)表示為公因子的線性組合。當(dāng)然,也可以將公因子表示為變量(或樣品)的線性組合,即:(9-13) 稱fj為因子得分函數(shù),表示對(duì)原始變量信息量的聚集量。如果取p=2,則可將每個(gè)樣品的m個(gè)變量代入(9-13),計(jì)算出因子得分fi、fj ( ij , i,j=1,2, p),在二維空間作圖對(duì)樣品進(jìn)行分類或者進(jìn)行地質(zhì)解釋。1. 因子得分函數(shù)422

19、.因子得分函數(shù)的確定若公因子已提取全部信息的80%以上，則可采用簡(jiǎn)化因子模型計(jì)算：F=(AA)-1AX有些情況下(如公因子相對(duì)較少，提取的信息比較少)，直接計(jì)算因子得分的不完全適用，可以采用回歸估計(jì)的方法可以采用。rij是原始變量的相關(guān)系數(shù)。43三、因子分析的步驟以R型因子分析為例說(shuō)明因子分析計(jì)算步驟(1)建原始數(shù)據(jù)矩陣。(2)對(duì)原始數(shù)據(jù)作數(shù)據(jù)標(biāo)準(zhǔn)化變換。(3)計(jì)算m個(gè)變量間的相關(guān)系數(shù)，建相關(guān)系數(shù)矩陣R。(4)求出R的特征值(12,m0并按大小排列)及相應(yīng)于j的單位特征向量uj (j=1,2,m)。(5)確定公因子個(gè)數(shù)p。 (6)求出主因子載荷矩陣A=aij , (7)計(jì)算諸公因子方差hi2

20、。(8)將因子載荷矩陣A作方差最大正交旋轉(zhuǎn)，求出旋轉(zhuǎn)后的因子載荷矩陣，仍記為B。(9)計(jì)算因子得分。444 對(duì)應(yīng)分析 R或Q型因子分析用最少的公因子提取研究對(duì)象的絕大部分信息，簡(jiǎn)化研究系統(tǒng)，從而在低維空間中研究樣品的空間分布規(guī)律和變量成因聯(lián)系，進(jìn)行地質(zhì)解釋和推斷。因此這兩種因子分析在地質(zhì)學(xué)中有著廣泛的應(yīng)用。但它畢竟存在以下不足： R型和Q型因子分析把研究樣品空間分布規(guī)律和研究變量共生組合關(guān)系分隔開(kāi)來(lái)。事實(shí)上，樣品的特征經(jīng)常由變量來(lái)揭示。如儲(chǔ)層的滲透性問(wèn)題，既要研究滲透性地質(zhì)成因的空間分布規(guī)律，又要研究?jī)?chǔ)層樣品的特征，那么前者一、對(duì)應(yīng)分析的概念不能在同一空間研究樣品和變量45就要研究樣品，而后者

21、就要利用變量來(lái)解釋。這說(shuō)明樣品和變量的研究是不可分割的，也就是說(shuō)應(yīng)該找出一種把兩種因子分析統(tǒng)一起來(lái)的研究方法。地質(zhì)研究中，樣品數(shù)量通常遠(yuǎn)比變量數(shù)目多，計(jì)算樣品相似系數(shù)時(shí)既讓費(fèi)機(jī)時(shí)，又占用大量的內(nèi)存空間。為了使地質(zhì)數(shù)據(jù)在同一尺度下參與地質(zhì)分析，往往是將變量進(jìn)行標(biāo)準(zhǔn)化處理，然而對(duì)樣品就不好作標(biāo)準(zhǔn)化了。因此對(duì)變量和樣品的非對(duì)等標(biāo)準(zhǔn)化處理，造成地質(zhì)數(shù)據(jù)的尺度不同，影響對(duì)地質(zhì)規(guī)律的認(rèn)識(shí)。占機(jī)時(shí)和內(nèi)存多地質(zhì)數(shù)據(jù)的尺度不同46 鑒于上述原因，在兩種因子分析的基礎(chǔ)上又發(fā)展了一種新的多元統(tǒng)計(jì)分析方法對(duì)應(yīng)分析。它采用一種數(shù)據(jù)處理方法,把兩種因子分析結(jié)合起來(lái)，在同一空間內(nèi)對(duì)變量和樣品進(jìn)行劃類，由此既可研究樣品

22、的分布規(guī)律，又可通過(guò)變量對(duì)樣品進(jìn)行地質(zhì)解釋。二、對(duì)應(yīng)分析的數(shù)據(jù)變換假設(shè)有n個(gè)樣品,每個(gè)樣品有m個(gè)變量,它們的觀測(cè)值記為:47 其中xij0(i=1,2,m; j=1,2,n),并且每一行和每一列上至少有一個(gè)數(shù)不為0。1.原始數(shù)據(jù)的總和標(biāo)準(zhǔn)化矩陣X中各元素之和為對(duì)矩陣X中各元素除以T,稱數(shù)據(jù)總和標(biāo)準(zhǔn)化。結(jié)果如:48記P中第j列元素之和為第j列上的每個(gè)元素再除以p. j ，得:2.樣品坐標(biāo)的相對(duì)比例49 3. 樣品點(diǎn)間的加權(quán)距離上式表示m維空間中的n個(gè)樣品點(diǎn)，每個(gè)樣品點(diǎn)的坐標(biāo)是樣品中各變量的相對(duì)比例。考慮到指標(biāo)數(shù)量級(jí)的差異，采用加權(quán)距離表示樣品點(diǎn)l與k之間的距離,以此表示它們之間的差異。(

23、第i行的和) 由上可知，為了計(jì)算樣品點(diǎn)之間的加權(quán)距離，只要將坐標(biāo)改為：50(9-14)4.變量坐標(biāo)的相對(duì)比例矩陣P中第i行元素之和：第i行上的每個(gè)元素再除以pi.，得:51其中上式表示n維空間中的m個(gè)變量點(diǎn)，每個(gè)變量點(diǎn)的坐標(biāo)是樣品中變量的相對(duì)比例。 52 5.變量點(diǎn)間的加權(quán)距離上式表示n維空間中的m個(gè)變量點(diǎn)，任意兩點(diǎn)l與k之間的加權(quán)距離為：由上可知，為了計(jì)算變量點(diǎn)之間的距離，只要將坐標(biāo)改為：(9-15)即可。53 為了對(duì)樣品進(jìn)行地質(zhì)解釋，利用式(9-14)和(9-15)進(jìn)一步研究樣品和變量的關(guān)系。(9-14)(9-15)54三、協(xié)方差矩陣1. 變量的協(xié)方差矩陣(1) 變量的均值若將矩陣

24、P中的元素pij視為概率,那么pi. 、p.j 就是邊緣概率,因此m維空間中樣品點(diǎn)第i個(gè)變量的概率均值為： 55 (2)變量的協(xié)方差矩陣第i與第j個(gè)變量的協(xié)方差為其中56那么m個(gè)變量的協(xié)方差矩陣為：其中Z=(zik)mn 2.樣品的協(xié)方差矩陣 (1)樣品的均值在n維空間中，第k樣品的概率均值為：57 (2)樣品的協(xié)方差矩陣第l和第k個(gè)樣品的協(xié)方差為其中58那么n個(gè)樣品的協(xié)方差矩陣為：其中四、因子載荷矩陣由線性代數(shù)可知，矩陣ZZ與ZZ有相同的非零特征值12p(pm)，并且每個(gè)j(1jp)，若對(duì)應(yīng)的 uj是ZZ的單位特征向量，那么vj=Zuj 是ZZ 相應(yīng)的單位特征向量；反之，若vj是Z

25、Z的特征值j對(duì)應(yīng)的單位特征向量，那么uj=Zvj則是ZZ 所相應(yīng)的單位特征向量。59 上述結(jié)果表明，當(dāng)求得變量的協(xié)方差矩陣S的特征值j (j=1,2,., p)和與其對(duì)應(yīng)的特征向量uj(j=1,2,., p)后，便可得到R型因子分析的因子載荷矩陣，再由vj=Zuj可直接求得Q型因子分析的因子載荷矩陣。此外，S與S*有相同的特征值,這些特征值表示各公因子所提供的方差,因而變量空間中的p個(gè)因子與樣品空間中的p個(gè)因子在總方差中所占的百分比完全相同，因此用同樣的因子軸既可以表示變量，又可以表示樣品，把R型和Q型因子分析統(tǒng)一起來(lái)。60 1. R型因子分析因子載荷矩陣若取S 的前p個(gè)特征值j( j=1

26、,2,p)，與之對(duì)應(yīng)的特征向量為uj( j=1,2,p)，那么因子載荷矩陣為： 2. Q型因子載荷矩陣 Q型因子載荷矩陣為：61其中：五、對(duì)應(yīng)分析計(jì)算步驟 1. 求Z矩陣把原始數(shù)據(jù)矩陣X變換為Z矩陣62 2. R型因子分析求變量的協(xié)方差矩陣S的特征值j(j=1,2,m) ，按其累計(jì)百分比取前p個(gè)主因子，計(jì)算因子載荷矩陣。 4. 制作對(duì)應(yīng)分析圖在因子平面內(nèi)以因子載荷為坐標(biāo)所做的變量和樣品散點(diǎn)圖。其中：根據(jù)vj=Zuj 計(jì)算Q型因子載荷矩陣。3. Q型因子分析63樣品號(hào)石英含量%長(zhǎng)石含量%巖屑含量%其他含量%鑒定命名123456789101112131415161718828386887

27、8847661605857554746585361508878759262529273027257171217995121211131315131615262935302533102230200000000020石英砂巖石英砂巖石英砂巖硬砂質(zhì)石英砂巖硬砂質(zhì)石英砂巖硬砂質(zhì)石英砂巖硬砂質(zhì)石英砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖混合砂巖混合砂巖硬砂巖長(zhǎng)石質(zhì)硬砂巖長(zhǎng)石質(zhì)硬砂巖長(zhǎng)石質(zhì)硬砂巖5 應(yīng) 用簡(jiǎn) 例例1 砂巖分類圖9-2砂巖樣品與碎屑對(duì)應(yīng)分析平面圖石英長(zhǎng)石巖屑石英砂巖硬砂巖雜砂巖長(zhǎng)石砂巖f2f164 例2 古潛山油氣藏與成油地質(zhì)參數(shù)分析對(duì)已探明的一些古潛山油氣藏進(jìn)行劃類，研究它們的資

28、源量與成油地質(zhì)參數(shù)的關(guān)系，是評(píng)價(jià)未知古潛山油氣資源量的基礎(chǔ)。與其它類型的油氣藏一樣，油源、供油、儲(chǔ)集、圈閉和保存條件等是形成古潛山油氣藏的基本條件，將其擬定為8項(xiàng)成油地質(zhì)參數(shù)：由于存在同一個(gè)生油凹陷向不同古潛山圈閉提供油氣的問(wèn)題，因此本例未把油源條件列入成油地質(zhì)參數(shù)。對(duì)已探明的26個(gè)古潛山油氣藏及其的成油地質(zhì)參數(shù)進(jìn)行對(duì)應(yīng)分析，結(jié)果如下：序號(hào)地質(zhì)參數(shù)名稱1古潛山到凹陷生油區(qū)中心的距離，km;2儲(chǔ)集體的總孔隙度，%;3古潛山上伏蓋層的厚度，km;4供油窗口，km2;5生油巖與不整合面的接觸面積，km2;6圈閉閉合高度，km;7圈閉閉合面積，km2;8古潛山最淺埋藏深度，km.65圖9-3 油氣藏

29、與成油地質(zhì)參數(shù)對(duì)應(yīng)分析平面圖距生油中心遠(yuǎn)，古潛山不整合面與生油巖接觸面積小，斷層供油，總孔隙度低(5百萬(wàn)噸)。距生油中心近、靠不整合面輸導(dǎo)形成的油氣藏(500百萬(wàn)噸)距生油中心較近，古潛山不整合面與生油巖接觸面積較小，總孔隙度高 (10百萬(wàn)噸) f2f166 例3 云南某地鉀鹽礦床水化學(xué)資料對(duì)應(yīng)分析1. 目的 2. 資料 20個(gè)三種類型的鹽泉樣品,每個(gè)鹽泉有7項(xiàng)水化學(xué)分析指標(biāo),分別是:礦化度(g/l)、Br/CI(103)、K/鹽(103)、K/CI(103)、Na/K、Mg/CI(102)、Na/CI。原始數(shù)據(jù)見(jiàn)下表。對(duì)應(yīng)分析圖如圖9-4。了解樣品和變量的關(guān)系,合理評(píng)價(jià)鹽泉及其成因聯(lián)系。6

30、7鹽泉序號(hào)礦化度/g/l(Br/Cl)103(K/鹽)103（K/Cl）103Na/K(Mg/Cl)102Na/Cl123456789101112131415161718192011.85345.5963.5253.681 48.28 17.9567.370 4.2236.44216.234 10.585 23.5355.398 283.148316.604 307.310 322.515256.580304.092240.4460.4800.5260.0860.3700.386 0.2800.506 0.340 0.1900.3900.420 0.2300.1200.1480.3170.1730.3120.2970.2830.04214.36013.85024.40013.57014.5009.75013.6003.8004.7003.4002.4002.6002.8001.7631.4531.6271.3820.8990.7890

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

因子分析概述和應(yīng)用簡(jiǎn)例

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

因子分析概述和應(yīng)用簡(jiǎn)例

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔