因子分析概述和應(yīng)用簡(jiǎn)例_第1頁(yè)
因子分析概述和應(yīng)用簡(jiǎn)例_第2頁(yè)
因子分析概述和應(yīng)用簡(jiǎn)例_第3頁(yè)
因子分析概述和應(yīng)用簡(jiǎn)例_第4頁(yè)
因子分析概述和應(yīng)用簡(jiǎn)例_第5頁(yè)
已閱讀5頁(yè),還剩65頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1因子分析概述和應(yīng)用簡(jiǎn)例1 因子分析概述4 方差最大正交旋轉(zhuǎn)5 因子得分6 對(duì)應(yīng)分析5 應(yīng)用簡(jiǎn)例2 R型因子分析3 主因子的解7 Q型因子分析21 因子分析概述一、因子分析的基本概念 1900年C.斯皮爾曼發(fā)表了對(duì)學(xué)生考試成績(jī)分析的著名文章,可認(rèn)為是因子分析的開(kāi)始。1957年由Krumbein把該方法引入到地質(zhì)學(xué)研究,后來(lái),又由Imbrie對(duì)該方法在地質(zhì)學(xué)中的應(yīng)用和發(fā)展作了大量的基礎(chǔ)工作。 因子分析是研究變量間相關(guān)關(guān)系、樣品間相似關(guān)系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關(guān)系之內(nèi)在原因的一些多元統(tǒng)計(jì)分析方法的總稱。 根據(jù)它們的研究對(duì)象,因子分析大致可分為R型因子分析、Q型因子分析和對(duì)應(yīng)

2、分析三種類型。在此僅介紹基于相關(guān)系數(shù)和相似系數(shù)統(tǒng)計(jì)量下的因子分析。3(一)變量的相關(guān)矩陣設(shè)n個(gè)樣品m個(gè)變量觀測(cè)值標(biāo)準(zhǔn)化后的矩陣形式如下(在因子分析后續(xù)的討論中,若無(wú)特殊說(shuō)明,數(shù)據(jù)均約定是標(biāo)準(zhǔn)化的):對(duì)于任意兩個(gè)變量xi(xi1, xi2, , xin)和xj(xj1, xj2, , xjn),它們的相關(guān)系數(shù)為: 4m個(gè)變量的相關(guān)系數(shù)構(gòu)成的mm的矩陣為: 且rij=rji,r11r22rmm1,并稱R為變量的相關(guān)矩陣 5(二)樣品的相似矩陣 任意兩個(gè)樣品xi(x1i, x2i, , xmi)和xj(x1j, x2j, , xmj)的相似系數(shù)為 n個(gè)樣品的相似系數(shù)矩陣形式為 且q11q22qnn1

3、,qijqji,稱Q為樣品的相似矩陣 6(三) R型因子分析 R型因子分析是從研究變量的相關(guān)(相似)系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā),找出m個(gè)控制變量相關(guān)性的主因子fi (i=1,2,m),由此把 xi 表示為fi的線性組合,即 : 在進(jìn)行綜合地質(zhì)研究時(shí),如果用前p(p m)個(gè)主因子就能解釋原始數(shù)據(jù)8090%以上的信息,那么上式可改寫(xiě)為:7 用上式可極大地化簡(jiǎn)研究系統(tǒng)(降維分析問(wèn)題,特別是當(dāng)p=2時(shí),可以在二維空間中繪圖)進(jìn)一步探索變量的成因聯(lián)系及空間變化規(guī)律的控制因素。通常稱上式為R型因子分析模型。 Q型因子分析是從研究樣品相似(相關(guān))系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā),找出n個(gè)控制樣品相似性的主因子,若用前

4、p( pn)個(gè)主因子化簡(jiǎn)樣品研究系統(tǒng),得到如下Q型因子分析模型:(四) Q型因子分析8f1, f2, f3,稱為公因子, ei稱為特殊因子。 因子分析模型中,各變量(或樣品)中共同出現(xiàn)的因子fi (i=1,2, p)稱公因子, 是相互獨(dú)立的理論變量,可將其理解為p 維空間中相互垂直的p個(gè)坐標(biāo)軸。 單一變量(或樣品)中特有的ei(i=1,2,m或n)叫做特殊因子,它們之間以及它們與所有公因子之間都是相互獨(dú)立的。 它是把上述兩種因子分析方法結(jié)合起來(lái),在同一個(gè)空間里研究樣品和變量的分布規(guī)律,更有利于進(jìn)行地質(zhì)解釋的一種多元統(tǒng)計(jì)分析方法。 (五)對(duì)應(yīng)分析9二. 因子分析在地質(zhì)研究中的作用 第二,指示成因

5、推理方向。因子分析能夠把龐雜紛亂的原始數(shù)據(jù)按成因上的聯(lián)系進(jìn)行歸納、整理、精煉和分類,理出幾條客觀的成因線索,為地質(zhì)人員提供邏輯推理方向,啟發(fā)思考相應(yīng)的成因結(jié)論。 第三,分解疊加的地質(zhì)過(guò)程?,F(xiàn)實(shí)觀測(cè)到的地質(zhì)現(xiàn)象往往是多種成因過(guò)程疊加的產(chǎn)物,因子分析提供了一個(gè)分解疊加過(guò)程進(jìn)而識(shí)別每個(gè)單一地質(zhì)過(guò)程的手段。 第一,壓縮原始數(shù)據(jù)。因子分析能在數(shù)量上大大精簡(jiǎn)原始數(shù)據(jù)但又不損失數(shù)據(jù)中包含的成因信息。從而有利于地質(zhì)人員進(jìn)行綜合分析。10三、 因子分析在地質(zhì)研究中的應(yīng)用 沉積盆地物源區(qū)的研究、沉積物的粒度分析、沉積相研究、地層分析、古環(huán)境與古生態(tài)的研究、石油與天然氣的成因研究、油田水的化學(xué)研究、有機(jī)地球化學(xué)研究

6、及石油、天然氣物化探資料分析等各個(gè)方面。11 假設(shè)有n個(gè)樣品,每個(gè)樣品有m個(gè)變量,它們的觀測(cè)值記為數(shù)據(jù)矩陣:1 因子分析概述 一、主因子 當(dāng)m=2時(shí),在x1、x2坐標(biāo)系內(nèi)作出樣品的散點(diǎn)圖如圖9-1所示。(9-1)12x1x2圖9-1 主因子示意圖 由圖可見(jiàn), 在x1、x2坐標(biāo)系內(nèi), x1、x2的方差幾乎沒(méi)有差別。 若將坐標(biāo)系旋轉(zhuǎn)一個(gè)角度,得到新坐標(biāo)系 f1、f2 , 這時(shí)f1、f2的方差具有明顯差別, f1的方差占了總方差的絕大部分。 因此新變量f1能夠反映原始數(shù)據(jù)所包含的絕大部分信息。由坐標(biāo)旋轉(zhuǎn)變換知新老變量間的關(guān)系為:或(9-2)f2f113 若f2的方差小于允許誤差時(shí),它就失去了存在的必

7、要,此時(shí)就可用f1代替兩個(gè)原始變量,而式(9-2)改為:或(9-3)其中ei服從均值為0,方差為2的正態(tài)分布。 (9-4)(i=1,2,m) 如果每個(gè)樣品有m個(gè)變量,仿照式(9-2)可以寫(xiě)出m個(gè)新變量: 可以證明,上式系數(shù)的平方和滿足:14 把m個(gè)原始變量表示為p個(gè)主因子的線性組合,當(dāng)p小于m,特別是 p=2時(shí),可以在二維空間對(duì)變量作圖,進(jìn)而對(duì)變量的相關(guān)性及成因聯(lián)系進(jìn)行研究。 在此條件下,由原始變量經(jīng)線性組合而得到的新變量fi叫做主因子或綜合變量。 組合成新變量有什么用途呢?15二、因子分析 因子分析是研究變量間的相關(guān)性、樣品間的相似性、兩者成因聯(lián)系、探索它們之間產(chǎn)生相關(guān)(相似)關(guān)系之內(nèi)因的一

8、些多元統(tǒng)計(jì)分析方法的總稱。 因子分析的任務(wù)之一是找出p( pm)個(gè)主因子,以此化簡(jiǎn)研究系統(tǒng)。 根據(jù)研究對(duì)象不同,將因子分析分為R型、Q型因子分析和對(duì)應(yīng)分析三種方法。161. R型因子分析 (9-5) R型因子分析是從研究變量的相關(guān)(相似)系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā),找出m個(gè)控制變量相關(guān)性的主因子fi (i=1,2,m),由此把 xi 表示為fi的線性組合,即 : 其中稱因子載荷矩陣。17(9-6) 在進(jìn)行綜合地質(zhì)研究時(shí),如果用前p(p m)個(gè)主因子就能解釋原始數(shù)據(jù)8090%以上的信息,那么式(9-5)可改寫(xiě)為: 用上式可極大地化簡(jiǎn)研究系統(tǒng)(降維分析問(wèn)題,特別是當(dāng)p=2時(shí),可以在二維空間中繪圖)進(jìn)

9、一步探索變量的成因聯(lián)系及空間變化規(guī)律的控制因素。通常稱式(9-6)為R型因子分析模型。18 Q型因子分析是從研究樣品相似(相關(guān))系數(shù)矩陣R的內(nèi)部結(jié)構(gòu)出發(fā),找出n個(gè)控制樣品相似性的主因子,若用前p( pn)個(gè)主因子化簡(jiǎn)樣品研究系統(tǒng),得到如下Q型因子分析模型:3.公因子2. Q型因子分析 因子分析模型中,各變量(或樣品)中共同出現(xiàn)的因子fi (i=1,2, p)稱公因子, 是相互獨(dú)立的理論變量,可將其理解為p 維空間中相互垂直的p個(gè)坐標(biāo)軸。(9-7)f1, f2, f3,稱為公因子, ei稱為特殊因子。19 單一變量(或樣品)中特有的ei(i=1,2,m或n)叫做特殊因子,它們之間以及它們與所有公

10、因子之間都是相互獨(dú)立的。 它是把上述兩種因子分析方法結(jié)合起來(lái),在同一個(gè)空間里研究樣品和變量的分布規(guī)律,更有利于進(jìn)行地質(zhì)解釋的一種多元統(tǒng)計(jì)分析方法。 因子載荷矩陣中的aij是第i個(gè)變量(或樣品)在第j 個(gè)因子軸上的負(fù)荷。如果把xi視為p維空間的一個(gè)向量,那么aij 則是xi在fj軸上的投影。 4.對(duì)應(yīng)分析20 由上述可知,進(jìn)行因子分析的關(guān)鍵是確定主因子載荷矩陣,在它的基礎(chǔ)上選定前p個(gè)主因子則可得到因子分析模型。21四、基本定理及主因子解 因子分析的一個(gè)基本問(wèn)題是要由變量之間的相關(guān)系數(shù)矩陣R去確定因子載荷矩陣A。由前所述有 1.主因子解 222324 R*叫做約相關(guān)矩陣。因子分析的基本問(wèn)題之一就是

11、在已知約相關(guān)矩陣R*的條件下求解因子載荷矩陣A,使得R*AA。這也是因子分析的基本定理。 實(shí)際中a1,a2,am很難確定,R*也不知道。因此常常用R代替R*, 即由RAA求解因子載荷矩陣A。滿足RAA的因子解很多,如果A是它的解,那么A與正交矩陣T的乘積矩陣AT也是它的解,這是因?yàn)?這就告訴我們有許許多多的因子解。25 按下面的方法求得的因子解稱作主因子解。 其做法是:根據(jù)變量的相關(guān)選出第一個(gè)因子 F1,使其在各變量的公因子方差中所作的方差貢獻(xiàn)最大,然后消去該因子影響,再?gòu)氖S嗟南嚓P(guān)中選出與F1不相關(guān)的因子F2,使其在各變量的剩余公因子方差中方差貢獻(xiàn)最大,如此繼續(xù)挑選直至各變量公因子方差分解完

12、畢為止。比如,選取第一個(gè)主因子F1,要使它的方差貢獻(xiàn)S1ai12(i=1,2,.,m)在R=AA之下達(dá)到最大,可用條件極值中的拉格朗日乘數(shù)法求出。這里不詳細(xì)給出其求解過(guò)程,只給出它的結(jié)果如下: 26 設(shè)變量相關(guān)系數(shù)矩陣R的特征值12, , p p+1 , m 0 對(duì)應(yīng)的特征向量為如果選定前p個(gè)主因子,那么可以證明前p個(gè)主因子載荷矩陣為:27相應(yīng)的R型因子分析模型為:282.主因子個(gè)數(shù) 用Jacobi法可求出相關(guān)(相似)系數(shù)矩陣的全部特征值和單位特征向量。若m個(gè)特征值從大到小排列為1,2,m,計(jì)算特征值累計(jì)百分比:然后根據(jù)C確定主因子數(shù)p。293.例在冀北坳陷東部某烴源巖層采得烴源巖樣品4個(gè),每

13、個(gè)樣品測(cè)得3個(gè)地化指標(biāo),共12個(gè)原始數(shù)據(jù),將原始數(shù)據(jù)的各指標(biāo)變量標(biāo)準(zhǔn)化,得到標(biāo)準(zhǔn)化數(shù)據(jù)陣為:要求對(duì)上述標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行主成分分析,考查各指標(biāo)變量間關(guān)系,計(jì)算各主因子的因子計(jì)量和因子貢獻(xiàn)。 30解:1、計(jì)算三個(gè)變量的相關(guān)系數(shù)矩陣2、計(jì)算主因子解,首先求得R的特征值為,方差貢獻(xiàn)的累計(jì)百分?jǐn)?shù)分別為、1。 313、確定公因子數(shù)p=2 前兩個(gè)特征值所對(duì)應(yīng)的特征向量為如下矩陣的兩個(gè)行向量 得到主因子荷載矩陣為32二、Q型主因子載荷矩陣及主因子個(gè)數(shù) 設(shè)相似系數(shù)矩陣Q的特征值12p+1n對(duì)應(yīng)的特征向量為V1V2Vp+1Vn。如果選定前p個(gè)主因子,那么可以得到與R型主因子載荷類似的Q型主因子載荷矩陣為:相應(yīng)的Q型

14、因子分析模型為:1. 主因子載荷矩陣332.主因子個(gè)數(shù) 用Jacobi法可求出相似(相關(guān))系數(shù)矩陣的全部特征值和單位特征向量。若n個(gè)特征值從大到小排列為1,2,n, 計(jì)算特征值累計(jì)百分比:然后根據(jù)C確定主因子數(shù)p。343 方差最大正交旋轉(zhuǎn)與因子得分一、R型因子分析方差最大正交旋轉(zhuǎn) 確定了p 個(gè)主因子后,為便于解釋主因子的地質(zhì)意義,還要對(duì)主因子軸進(jìn)行旋轉(zhuǎn),使第j個(gè)公因子的代表性變量在fj軸上的系數(shù)等于或趨近于1,在其它公因子軸上的系數(shù)等于或趨近于0。1.方差最大正交旋轉(zhuǎn)的實(shí)現(xiàn)方法 從數(shù)學(xué)上看,上述即對(duì)主因子矩陣A1實(shí)施正交變換。常用的方法是方差最大正交旋轉(zhuǎn),這種旋轉(zhuǎn)方法使p個(gè)因子保持彼此正交,并

15、且使因子載荷矩陣中的各因子載荷平方后的方差達(dá)最大。對(duì)于R型因子載荷矩陣A1來(lái)說(shuō),對(duì)因子fj的簡(jiǎn)化效果,用因子載荷平方的方差進(jìn)行描述:35當(dāng)V 達(dá)到最大時(shí),p個(gè)因子都得到了最優(yōu)簡(jiǎn)化。(9-8) 其中bij是經(jīng)過(guò)正交旋轉(zhuǎn)后的因子載荷矩陣B的元素,為避免負(fù)值取bij2。若Vj為最大,即第j個(gè)因子得到了最優(yōu)簡(jiǎn)化,此時(shí)第j個(gè)公因子的代表性變量在fj軸上的系數(shù)等于或趨近1,而在其他公因子軸上的系數(shù)等于或趨近于0。對(duì)p個(gè)因子的簡(jiǎn)化效果用因子載荷平方的方差之和進(jìn)行度量:36 考慮到各個(gè)研究對(duì)象的公因子方差間的差異,可以用(bij2/hi2)代替bij2,并對(duì)式(9-8)兩邊乘以m,記為:(9-9) 實(shí)際是要求

16、V*達(dá)到最大。于是問(wèn)題歸結(jié)為求一個(gè)正交矩陣Tpp, 使B=A1T 滿足V* 為最大的條件。 對(duì)于因子平面fg fq可以對(duì)A1作如下正交變換:1 . . . cos -sin . . . sin cos . . . 100Tgq=gqgq37B中的元素分別為: 對(duì)A1進(jìn)行一次正交旋轉(zhuǎn)變換,相當(dāng)于對(duì)因子平面fgfq旋轉(zhuǎn)了一個(gè)角度,每次旋轉(zhuǎn)必須滿足使式(9-9)的值為最大,得到矩陣: 對(duì)于選定的p個(gè)主因子,必須對(duì)A1中所有p列配對(duì)旋轉(zhuǎn),總共需要旋轉(zhuǎn)p(p-1)/2次,全部旋轉(zhuǎn)完畢得到載荷矩陣:(9-10)38 由B2計(jì)算出V2* 重復(fù)循環(huán)旋轉(zhuǎn),可以得到一個(gè)有界序列: V1*V2* 對(duì)于任意小正數(shù),當(dāng)

17、|Vk*-Vk+1*|時(shí),結(jié)束計(jì)算,最后得到: 經(jīng)過(guò)一個(gè)循環(huán)旋轉(zhuǎn)得到B1 ,由此可按式(9-9)計(jì)算V1*。 在上個(gè)循環(huán)旋轉(zhuǎn)的基礎(chǔ)上,從B1出發(fā)完成下個(gè)旋轉(zhuǎn)循旋轉(zhuǎn)得到B2, 即:39 前面介紹了實(shí)現(xiàn)方差最大正交旋轉(zhuǎn)的的基本思想,但在任何一次旋轉(zhuǎn)變換中,都涉及旋轉(zhuǎn)角度的問(wèn)題。確定旋轉(zhuǎn)角度的具體步驟如下:2.旋轉(zhuǎn)角度(不講) (1)把式(9-10)代入式(9-9),得到函數(shù)V*();式中:; (2)求V*對(duì)的一階導(dǎo)數(shù)并令其為0,可以解得:(9-11)40 (3)將函數(shù)V*()展開(kāi)化簡(jiǎn),剩下包含sin4、sin22 的項(xiàng),使V*()成為以/2位周期的函數(shù),因而4在/2范圍內(nèi),通常在-/4 /4之間。

18、 (4)由V*對(duì)的二階導(dǎo)數(shù)小于0,可得:由(9-12)可知,與E同號(hào)。 Q型因子分析方差最大正交旋轉(zhuǎn)與R型中的旋轉(zhuǎn)方法類似,不同之處是因子載荷矩陣A1=(aij)n p,因此,只要將上述公式中的m改為n即可。(9-12)41二、因子得分 因子分析是將變量(或樣品)表示為公因子的線性組合。當(dāng)然,也可以將公因子表示為變量(或樣品)的線性組合,即:(9-13) 稱fj為因子得分函數(shù),表示對(duì)原始變量信息量的聚集量。如果取p=2,則可將每個(gè)樣品的m個(gè)變量代入(9-13),計(jì)算出因子得分fi、fj ( ij , i,j=1,2, p),在二維空間作圖對(duì)樣品進(jìn)行分類或者進(jìn)行地質(zhì)解釋。1. 因子得分函數(shù)422

19、.因子得分函數(shù)的確定若公因子已提取全部信息的80%以上,則可采用簡(jiǎn)化因子模型計(jì)算:F=(AA)-1AX有些情況下(如公因子相對(duì)較少,提取的信息比較少),直接計(jì)算因子得分的不完全適用,可以采用回歸估計(jì)的方法可以采用。rij是原始變量的相關(guān)系數(shù)。43三、 因子分析的步驟以R型因子分析為例說(shuō)明因子分析計(jì)算步驟(1)建原始數(shù)據(jù)矩陣。(2)對(duì)原始數(shù)據(jù)作數(shù)據(jù)標(biāo)準(zhǔn)化變換。(3)計(jì)算m個(gè)變量間的相關(guān)系數(shù),建相關(guān)系數(shù)矩陣R。(4)求出R的特征值(12,m0并按大小排列)及相應(yīng)于j的單位特征向量uj (j=1,2,m)。(5)確定公因子個(gè)數(shù)p。 (6)求出主因子載荷矩陣A=aij , (7)計(jì)算諸公因子方差hi2

20、。(8)將因子載荷矩陣A作方差最大正交旋轉(zhuǎn),求出旋轉(zhuǎn)后的因子載荷矩陣,仍記為B。(9)計(jì)算因子得分。444 對(duì)應(yīng)分析 R或Q型因子分析用最少的公因子提取研究對(duì)象的絕大部分信息,簡(jiǎn)化研究系統(tǒng),從而在低維空間中研究樣品的空間分布規(guī)律和變量成因聯(lián)系,進(jìn)行地質(zhì)解釋和推斷。因此這兩種因子分析在地質(zhì)學(xué)中有著廣泛的應(yīng)用。但它畢竟存在以下不足: R型和Q型因子分析把研究樣品空間分布規(guī)律和研究變量共生組合關(guān)系分隔開(kāi)來(lái)。事實(shí)上,樣品的特征經(jīng)常由變量來(lái)揭示。如儲(chǔ)層的滲透性問(wèn)題,既要研究滲透性地質(zhì)成因的空間分布規(guī)律,又要研究?jī)?chǔ)層樣品的特征,那么前者一、對(duì)應(yīng)分析的概念不能在同一空間研究樣品和變量45就要研究樣品,而后者

21、就要利用變量來(lái)解釋。這說(shuō)明樣品和變量的研究是不可分割的,也就是說(shuō)應(yīng)該找出一種把兩種因子分析統(tǒng)一起來(lái)的研究方法。 地質(zhì)研究中,樣品數(shù)量通常遠(yuǎn)比變量數(shù)目多,計(jì)算樣品相似系數(shù)時(shí)既讓費(fèi)機(jī)時(shí),又占用大量的內(nèi)存空間。 為了使地質(zhì)數(shù)據(jù)在同一尺度下參與地質(zhì)分析,往往是將變量進(jìn)行標(biāo)準(zhǔn)化處理,然而對(duì)樣品就不好作標(biāo)準(zhǔn)化了。 因此對(duì)變量和樣品的非對(duì)等標(biāo)準(zhǔn)化處理,造成地質(zhì)數(shù)據(jù)的尺度不同,影響對(duì)地質(zhì)規(guī)律的認(rèn)識(shí)。占機(jī)時(shí)和內(nèi)存多地質(zhì)數(shù)據(jù)的尺度不同46 鑒于上述原因,在兩種因子分析的基礎(chǔ)上又發(fā)展了一種新的多元統(tǒng)計(jì)分析方法對(duì)應(yīng)分析。它采用一種數(shù)據(jù)處理方法,把兩種因子分析結(jié)合起來(lái),在同一空間內(nèi)對(duì)變量和樣品進(jìn)行劃類,由此既可研究樣品

22、的分布規(guī)律,又可通過(guò)變量對(duì)樣品進(jìn)行地質(zhì)解釋。二、對(duì)應(yīng)分析的數(shù)據(jù)變換 假設(shè)有n個(gè)樣品,每個(gè)樣品有m個(gè)變量,它們的觀測(cè)值記為:47 其中xij0(i=1,2,m; j=1,2,n),并且每一行和每一列上至少有一個(gè)數(shù)不為0。1.原始數(shù)據(jù)的總和標(biāo)準(zhǔn)化矩陣X中各元素之和為 對(duì)矩陣X中各元素除以T,稱數(shù)據(jù)總和標(biāo)準(zhǔn)化。結(jié)果如:48記P中第j列元素之和為第j列上的每個(gè)元素再除以p. j ,得:2.樣品坐標(biāo)的相對(duì)比例49 3. 樣品點(diǎn)間的加權(quán)距離 上式表示m維空間中的n個(gè)樣品點(diǎn),每個(gè)樣品點(diǎn)的坐標(biāo)是樣品中各變量的相對(duì)比例。 考慮到指標(biāo)數(shù)量級(jí)的差異,采用加權(quán)距離表示樣品點(diǎn)l與k之間的距離,以此表示它們之間的差異。(

23、第i行的和) 由上可知,為了計(jì)算樣品點(diǎn)之間的加權(quán)距離,只要將坐標(biāo)改為:50(9-14)4.變量坐標(biāo)的相對(duì)比例矩陣P中第i行元素之和:第i行上的每個(gè)元素再除以pi.,得:51其中 上式表示n維空間中的m個(gè)變量點(diǎn),每個(gè)變量點(diǎn)的坐標(biāo)是樣品中變量的相對(duì)比例。 52 5.變量點(diǎn)間的加權(quán)距離 上式表示n維空間中的m個(gè)變量點(diǎn),任意兩點(diǎn)l與k之間的加權(quán)距離為: 由上可知,為了計(jì)算變量點(diǎn)之間的距離,只要將坐標(biāo)改為:(9-15)即可。53 為了對(duì)樣品進(jìn)行地質(zhì)解釋,利用式(9-14)和(9-15)進(jìn)一步研究樣品和變量的關(guān)系。(9-14)(9-15)54三、協(xié)方差矩陣1. 變量的協(xié)方差矩陣(1) 變量的均值 若將矩陣

24、P中的元素pij視為概率,那么pi. 、p.j 就是邊緣概率,因此m維空間中樣品點(diǎn)第i個(gè)變量的概率均值為: 55 (2)變量的協(xié)方差矩陣 第i與第j個(gè)變量的協(xié)方差為其中56那么m個(gè)變量的協(xié)方差矩陣為:其中Z=(zik)mn 2.樣品的協(xié)方差矩陣 (1)樣品的均值 在n維空間中,第k樣品的概率均值為:57 (2)樣品的協(xié)方差矩陣 第l和第k個(gè)樣品的協(xié)方差為其中58那么n個(gè)樣品的協(xié)方差矩陣為:其中 四、因子載荷矩陣 由線性代數(shù)可知,矩陣ZZ與ZZ有相同的非零特征值12p(pm),并且每個(gè)j(1jp),若對(duì)應(yīng)的 uj是ZZ的單位特征向量,那么vj=Zuj 是ZZ 相應(yīng)的單位特征向量;反之,若vj是Z

25、Z的特征值j對(duì)應(yīng)的單位特征向量,那么uj=Zvj則是ZZ 所相應(yīng)的單位特征向量。59 上述結(jié)果表明,當(dāng)求得變量的協(xié)方差矩陣S的特征值j (j=1,2,., p)和與其對(duì)應(yīng)的特征向量uj(j=1,2,., p)后,便可得到R型因子分析的因子載荷矩陣,再由vj=Zuj可直接求得Q型因子分析的因子載荷矩陣。 此外,S與S*有相同的特征值,這些特征值表示各公因子所提供的方差,因而變量空間中的p個(gè)因子與樣品空間中的p個(gè)因子在總方差中所占的百分比完全相同,因此用同樣的因子軸既可以表示變量,又可以表示樣品,把R型和Q型因子分析統(tǒng)一起來(lái)。60 1. R型因子分析因子載荷矩陣 若取S 的前p個(gè)特征值j( j=1

26、,2,p),與之對(duì)應(yīng)的特征向量為uj( j=1,2,p),那么因子載荷矩陣為: 2. Q型因子載荷矩陣 Q型因子載荷矩陣為:61其中: 五、對(duì)應(yīng)分析計(jì)算步驟 1. 求Z矩陣 把原始數(shù)據(jù)矩陣X變換為Z矩陣62 2. R型因子分析 求變量的協(xié)方差矩陣S的特征值j(j=1,2,m) ,按其累計(jì)百分比取前p個(gè)主因子,計(jì)算因子載荷矩陣。 4. 制作對(duì)應(yīng)分析圖 在因子平面內(nèi)以因子載荷為坐標(biāo)所做的變量和樣品散點(diǎn)圖。其中: 根據(jù)vj=Zuj 計(jì)算Q型因子載荷矩陣。3. Q型因子分析63樣品號(hào)石英含量%長(zhǎng)石含量%巖屑含量%其他含量%鑒定命名123456789101112131415161718828386887

27、8847661605857554746585361508878759262529273027257171217995121211131315131615262935302533102230200000000020石英砂巖石英砂巖石英砂巖硬砂質(zhì)石英砂巖硬砂質(zhì)石英砂巖硬砂質(zhì)石英砂巖硬砂質(zhì)石英砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖長(zhǎng)石砂巖混合砂巖混合砂巖硬砂巖長(zhǎng)石質(zhì)硬砂巖長(zhǎng)石質(zhì)硬砂巖長(zhǎng)石質(zhì)硬砂巖5 應(yīng) 用 簡(jiǎn) 例 例1 砂巖分類圖9-2砂巖樣品與碎屑對(duì)應(yīng)分析平面圖石英長(zhǎng)石巖屑石英砂巖硬砂巖雜砂巖長(zhǎng)石砂巖f2f164 例2 古潛山油氣藏與成油地質(zhì)參數(shù)分析 對(duì)已探明的一些古潛山油氣藏進(jìn)行劃類,研究它們的資

28、源量與成油地質(zhì)參數(shù)的關(guān)系,是評(píng)價(jià)未知古潛山油氣資源量的基礎(chǔ)。與其它類型的油氣藏一樣,油源、供油、儲(chǔ)集、圈閉和保存條件等是形成古潛山油氣藏的基本條件,將其擬定為8項(xiàng)成油地質(zhì)參數(shù): 由于存在同一個(gè)生油凹陷向不同古潛山圈閉提供油氣的問(wèn)題,因此本例未把油源條件列入成油地質(zhì)參數(shù)。對(duì)已探明的26個(gè)古潛山油氣藏及其的成油地質(zhì)參數(shù)進(jìn)行對(duì)應(yīng)分析,結(jié)果如下:序號(hào)地質(zhì)參數(shù)名稱1古潛山到凹陷生油區(qū)中心的距離,km;2儲(chǔ)集體的總孔隙度,%;3古潛山上伏蓋層的厚度,km;4供油窗口,km2;5生油巖與不整合面的接觸面積,km2;6圈閉閉合高度,km;7圈閉閉合面積,km2;8古潛山最淺埋藏深度,km.65圖9-3 油氣藏

29、與成油地質(zhì)參數(shù)對(duì)應(yīng)分析平面圖距生油中心遠(yuǎn),古潛山不整合面與生油巖接觸面積小,斷層供油,總孔隙度低(5百萬(wàn)噸)。距生油中心近、靠不整合面輸導(dǎo)形成的油氣藏(500百萬(wàn)噸)距生油中心較近,古潛山不整合面與生油巖接觸面積較小,總孔隙度高 (10百萬(wàn)噸) f2f166 例3 云南某地鉀鹽礦床水化學(xué)資料對(duì)應(yīng)分析1. 目的 2. 資料 20個(gè)三種類型的鹽泉樣品,每個(gè)鹽泉有7項(xiàng)水化學(xué)分析指標(biāo),分別是:礦化度(g/l)、Br/CI(103)、K/鹽(103)、K/CI(103)、Na/K、Mg/CI(102)、Na/CI。原始數(shù)據(jù)見(jiàn)下表。對(duì)應(yīng)分析圖如圖9-4。 了解樣品和變量的關(guān)系,合理評(píng)價(jià)鹽泉及其成因聯(lián)系。6

30、7鹽泉序號(hào)礦化度/g/l(Br/Cl)103(K/鹽)103(K/Cl)103Na/K(Mg/Cl)102Na/Cl123456789101112131415161718192011.85345.5963.5253.681 48.28 17.9567.370 4.2236.44216.234 10.585 23.5355.398 283.148316.604 307.310 322.515256.580304.092240.4460.4800.5260.0860.3700.386 0.2800.506 0.340 0.1900.3900.420 0.2300.1200.1480.3170.1730.3120.2970.2830.04214.36013.85024.40013.57014.5009.75013.6003.8004.7003.4002.4002.6002.8001.7631.4531.6271.3820.8990.7890

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論