《主成分分析與》PPT課件.ppt_第1頁
《主成分分析與》PPT課件.ppt_第2頁
《主成分分析與》PPT課件.ppt_第3頁
《主成分分析與》PPT課件.ppt_第4頁
《主成分分析與》PPT課件.ppt_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

主成分分析與 因子分析,山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計教研室 劉桂芬 ,多變量大樣本分析中,變量間存在共線性,增加了分析的復(fù)雜性。若分別分析各個指標(biāo),分析有可能是孤立的,而不是綜合的;盲目地減少指標(biāo)又有可能損失很多信息,得出錯誤結(jié)論。欲采用較少指標(biāo),反映原資料大部分信息,可采用主成分分析和因子分析。,主成分分析,概 念,主成分分析(principal component analysis)是將分散在一組變量上的信息,集中到某幾個綜合指標(biāo)(主成分)上的一種探索性統(tǒng)計分析方法。它利用降維的思想,將多個變量化為少數(shù)幾個互不相關(guān)的主成分,從而描述數(shù)據(jù)集的內(nèi)部結(jié)構(gòu)。,主成分的幾何意義,x1,x2,p1,p2,x1,對應(yīng)m個變量的q個主成分如下:,其中( )分別是變量相關(guān)陣的前q個特征根對應(yīng)的特征向量。 的方差分別是q個特征根12q。( )是第i個變量在各個主成分上的載荷。而實際上載荷往往是指 ,它是第i個 變量在各個標(biāo)準(zhǔn)化主成分上的載荷。據(jù)此可用最小二乘法解得標(biāo)準(zhǔn)主成分得分。標(biāo)準(zhǔn)化主成分的方差為1。,PCA 常用統(tǒng)計量: .特征根 i .各成分貢獻率 .前各成分累計貢獻率 .特征向量 各成分表達式中標(biāo)準(zhǔn)化原始變量的系數(shù)向量,就是各成分的特征向量。,因子分析,一、因子分析模型,設(shè)X=(x1, x2, ,xp)為可觀測的隨機變量,且有 f=(f1,f2,fm)為公共(共性)因子(common factor),簡稱因子(factor),e=(e1,e2,ep)為特殊因子(specific factor) f和e均為不可直接觀測的隨機變量 =(1,2,p)為總體x的均值 A=(aij)p*m為因子負(fù)荷(載荷)(factor loading)矩陣,通常先對x作標(biāo)準(zhǔn)化處理,使其均值為零,方差為這樣就有 假定()fi的均數(shù)為,方差為; ()ei的均數(shù)為,方差為i; () fi與ei相互獨立 則稱x為具有m個公共因子的因子模型,如果再滿足()fi與fj相互獨立(ij),則稱該因子模型為正交因子模型。 正交因子模型具有如下特性: x的方差可表示為 設(shè),()hi2是m個公共因子對第i個變量的貢獻,稱為第i個共同度(communality)或共性方差,公因子方差(common variance) ()i稱為特殊方差(specific variance),是不能由公共因子解釋的部分,因子載荷(負(fù)荷)aij是隨機變量xi與公共因子fj的相關(guān)系數(shù)。 設(shè) 稱gj2為公共因子fj對x的“貢獻”,是衡量公共因子fj重要性的一個指標(biāo)。,二、因子分析的步驟,1.輸入原始數(shù)據(jù)xn*p,計算樣本均值和方 差,進行標(biāo)準(zhǔn)化計算(處理); 2.求樣本相關(guān)系數(shù)矩陣R=(rij)p*p; 3.求相關(guān)系數(shù)矩陣的特征根i (1,2,p0)和相應(yīng)的標(biāo)準(zhǔn)正交的特征向量li;,4.確定公共因子數(shù); 5.計算公共因子的共性方差hi2; 6.對載荷矩陣進行旋轉(zhuǎn),以求能更好地解釋公共因子; 7.對公共因子作出專業(yè)性的解釋。,三、因子分析提取因子的方法,主成分法(principal component factor),每一個公共因子的載荷系數(shù)之平方和等于對應(yīng)的特征根,即該公共因子的方差。,極大似然法(maximum likelihood factor) 假定原變量服從正態(tài)分布,公共因子和特殊因子也服從正態(tài)分布,構(gòu)造因子負(fù)荷和特殊方差的似然函數(shù),求其極大,得到唯一解。,主因子法(principal factor) 設(shè)原變量的相關(guān)矩陣為R=(rij),其逆矩陣為R-1=(rij)。各變量特征方差的初始值取為逆相關(guān)矩陣對角線元素的倒數(shù),i=1/rii。則共同度的初始值為(hi) 。,以(hi)2代替相關(guān)矩陣中的對角線上的元素,得到約化相關(guān)矩陣R 。,R的前m個特征根及其對應(yīng)的單位化特征向量 就是主因子解。,迭代主因子法(iterated principal factor) 主因子的解很不穩(wěn)定。因此,常以估計的共同度為初始值,構(gòu)造新的約化矩陣,再計算其特征根及其特征向量,并由此再估計因子負(fù)荷及其各變量的共同度和特殊方差,再由此新估計的共同度為初始值繼續(xù)迭代,直到解穩(wěn)定為止。,因子載荷(負(fù)荷)aij是隨機變量xi與公共因子fj的相關(guān)系數(shù)。 設(shè) 稱gj2為公共因子fj對x的“貢獻”,是衡量公共因子fj重要性的一個指標(biāo)。,四、因子旋轉(zhuǎn),目的:使因子負(fù)荷兩極分化,要么接近于0,要么接近于1。 常用的旋轉(zhuǎn)方法:,(1)方差最大正交旋轉(zhuǎn)(varimax orthogonal rotation) 基本思想:使公共因子的相對負(fù)荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和公共方差總和不變。 可使每個因子上的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。,(2)斜交旋轉(zhuǎn)(oblique rotation) 因子斜交旋轉(zhuǎn)后,各因子負(fù)荷發(fā)生了較大變化,出現(xiàn)了兩極分化。各因子間不再相互獨立,而彼此相關(guān)。各因子對各變量的貢獻的總和也發(fā)生了改變。 適用于大數(shù)據(jù)集的因子分析。,五、因子得分,Thomson法,即回歸法 回歸法得分是由Bayes思想導(dǎo)出的,得到的因子得分是有偏的,但計算結(jié)果誤差較小。,Bartlett法 Bartlett因子得分是極大似然估計,也是加權(quán)最小二乘回歸,得到的因子得分是無偏的,但計算結(jié)果誤差較大。 因子得分可用于模型診斷,也可用作進一步分析的原始資料。,六、因子分析應(yīng)用的注意事項,應(yīng)用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論