版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第16章 主成分分析中國(guó)疾病預(yù)防控制中心學(xué)習(xí)目標(biāo)了解主成分分析的數(shù)學(xué)模型;熟悉主成分分析的方法步驟;掌握主成分分析的作用和應(yīng)用領(lǐng)域;掌握PRINCOMP過(guò)程并運(yùn)用此過(guò)程進(jìn)行數(shù)據(jù)分析。概述主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)。在實(shí)證問(wèn)題研究中,為了全面、系統(tǒng)地分析問(wèn)題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標(biāo),在統(tǒng)計(jì)分析中也稱為變量。因?yàn)槊總€(gè)變量都不同程度地反映了所研究問(wèn)題的某些信息,并且指標(biāo)之間有一定的相關(guān)性,因而所得的統(tǒng)計(jì)數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計(jì)方法研究多變量問(wèn)題時(shí),變量太多會(huì)增加計(jì)算量和增加分析問(wèn)題的復(fù)雜性,人們希望在進(jìn)
2、行定量分析的過(guò)程中,涉及的變量較少,得到的信息量較多。 概述科學(xué)研究所涉及的課題往往比較復(fù)雜,是因?yàn)橛绊懣陀^事物的因素多,需要考察的變量多。例如,糖尿病、動(dòng)脈硬化等疾病的病因是多種多樣的,收集的資料中包含的信息是豐富多彩的。再如,在心理學(xué)研究中,描述兒童氣質(zhì)的指標(biāo)可以有9個(gè),描述兒童活動(dòng)能力的指標(biāo)可以有6個(gè),;在臨床醫(yī)學(xué)研究中,描述兒童生長(zhǎng)發(fā)育的的可以有12個(gè)指標(biāo),鑒別闌尾炎病型的可以有27個(gè)指標(biāo)。然而,重疊的、低質(zhì)量的信息越多,越不利于醫(yī)生作出診斷。指標(biāo)較多時(shí),給資料分析帶來(lái)很多麻煩,增加了分析問(wèn)題的復(fù)雜性和難度。例如,在線性回歸分析中,要求模型中的自變量是相互獨(dú)立的,否則,估計(jì)的結(jié)果是不準(zhǔn)
3、確的,甚至是相反的結(jié)論,產(chǎn)生誤導(dǎo)。概述在大部分實(shí)際問(wèn)題中,變量之間是有一定的相關(guān)性的,人們自然希望找到較少的幾個(gè)彼此不相關(guān)的綜合指標(biāo)盡可能多地反映原來(lái)眾多變量的信息。比如描述兒童生長(zhǎng)發(fā)育的指標(biāo)中,身高、腿長(zhǎng)和臂長(zhǎng)這三個(gè)指標(biāo)可能是相關(guān)的,而胸圍、大腿圍和臂圍這三個(gè)圍度指標(biāo)也會(huì)有一定的相關(guān)性。如果分別用每一個(gè)指標(biāo)對(duì)兒童的生長(zhǎng)發(fā)育做出評(píng)價(jià),那么這種評(píng)價(jià)就是孤立的、片面的,而不是綜合的。僅選用幾個(gè)“重要的”或“有代表性”的指標(biāo)來(lái)評(píng)價(jià),就失去了許多有用的信息,容易得出片面的結(jié)論。所以,我們需要一種綜合性的分析方法,既可減少指標(biāo)變量的個(gè)數(shù),又盡量不損失原指標(biāo)變量所包含的信息,對(duì)資料進(jìn)行全面的綜合分析。主成
4、分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具。概述主成份分析的基本思想就是將彼此相關(guān)的一組指標(biāo)變量轉(zhuǎn)化為彼此獨(dú)立的一組新的指標(biāo)變量,并用其中較少的幾個(gè)新指標(biāo)變量就能綜合反應(yīng)原多個(gè)指標(biāo)變量中所包含的主要信息,符合專業(yè)含義。何為主成分?簡(jiǎn)而言之,主成分實(shí)際上就是由原變量X1Xm線性組合出來(lái)的個(gè)互不相關(guān)、且未丟失任何信息的新變量,也稱為綜合變量。多指標(biāo)的主成分分析常被用來(lái)尋找判斷某種事物或現(xiàn)象的綜合指標(biāo),并給綜合指標(biāo)所蘊(yùn)藏的信息以恰當(dāng)解釋,以便更深刻地揭示事物內(nèi)在的規(guī)律。主成分分析簡(jiǎn)介 主成分分析法是一種數(shù)學(xué)變換的方法, 它把給定的一組相關(guān)變量通過(guò)線性變換轉(zhuǎn)成另一組不相關(guān)的變量,這些新的變量
5、按照方差依次遞減的順序排列。在數(shù)學(xué)變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關(guān),稱為第二主成分。依次類推,I個(gè)變量就有I個(gè)主成分。主成分分析是把原來(lái)多個(gè)變量劃為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,是一種降維處理技術(shù)。主成分分析的方法步驟 主成分分析的過(guò)程,就是確定原來(lái)變量xj( )在各主成分zi( )上的載荷lij。從主成分分析的基本原理和數(shù)學(xué)模型可以看出,主成分分析的任務(wù)是估計(jì)主成分,確定主成分的個(gè)數(shù),解釋主成分的實(shí)際意義和計(jì)算主成分得分。假設(shè)有k個(gè)指標(biāo)x1,x2,xk,每一個(gè)指標(biāo)有n個(gè)觀測(cè)值,它們的標(biāo)準(zhǔn)化指標(biāo)變量是 ,主成分
6、分析的方法步驟對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換:將原始數(shù)據(jù)標(biāo)準(zhǔn)化,然后利用標(biāo)準(zhǔn)化的數(shù)據(jù)計(jì)算主成分。X為標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣,則:主成分分析的方法步驟計(jì)算相關(guān)系數(shù)矩陣:其中,主成分分析的方法步驟計(jì)算相關(guān)矩陣的特征值和特征值所對(duì)應(yīng)的特征向量:求主成分的問(wèn)題,實(shí)際上就是要求出標(biāo)準(zhǔn)化指標(biāo)變量X的協(xié)方差矩陣Cov(X)的特征值和特征向量。X的協(xié)方差矩陣為:主成分分析的方法步驟求得k個(gè)非負(fù)特征值 ,將這些特征值按從小到大的順序排列為:再由解得每一特征值對(duì)應(yīng)的特征向量,從而求得各主成分:主成分分析的方法步驟計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率各主成分互不相關(guān),即的相關(guān)系數(shù):于是,各主成分間的相關(guān)系數(shù)矩陣為單位矩陣。一般地
7、,主成分Zi的貢獻(xiàn)率為:主成分分析的方法步驟確定主成分的個(gè)數(shù)當(dāng)?shù)玫搅薻個(gè)主成分后,要根據(jù)確定主成分個(gè)數(shù)的準(zhǔn)則和主成分的實(shí)際意義來(lái)確定主成分的個(gè)數(shù)。一般說(shuō),確定主成分個(gè)數(shù)的準(zhǔn)則有兩個(gè):以累積貢獻(xiàn)率來(lái)確定:當(dāng)前P個(gè)主成分的累積貢獻(xiàn)率達(dá)到某一特定值時(shí)(一般采用70%85%為準(zhǔn)則),則保留前P個(gè)主成分。根據(jù)特征值大小來(lái)確定,一般地,取特征值大于或等于1為準(zhǔn)則。若有s個(gè)特征值大于或等于1,那么就可以確定主成分的個(gè)數(shù)為s個(gè)。一般可以將兩種確定主成分個(gè)數(shù)的方法結(jié)合起來(lái),選出有實(shí)際意義的主成分。主成分分析的方法步驟計(jì)算主成分載荷第i個(gè)主成分Zi的特征值的平方根與第j原始指標(biāo)Xj的系數(shù)lij的乘積為因子載荷。由
8、因子載荷所構(gòu)成的矩陣為因子載荷陣。實(shí)際數(shù),因子載荷qij就是第i主成分Zi與第j原始指標(biāo)Xj之間的相關(guān)系數(shù),它反映了主成分Zi與原始指標(biāo)Xj之間聯(lián)系的密切程度與作用方向。主成分分析的方法步驟計(jì)算主成分得分如果標(biāo)準(zhǔn)化指標(biāo)變量 的第i個(gè)主成分是:其中, ,是xj的標(biāo)準(zhǔn)化指標(biāo)變量。那么,第i個(gè)主成分可以轉(zhuǎn)換為原始指標(biāo)變量的線性組合: 主成分分析的應(yīng)用 研究多個(gè)指標(biāo)變量之間的依存關(guān)系,是醫(yī)學(xué)研究中很重要的一件事情。但是,在研究多個(gè)指標(biāo)變量之間的依存關(guān)系時(shí),經(jīng)常會(huì)遇到兩個(gè)問(wèn)題:指標(biāo)變量過(guò)多,使得分析難度增加;變量之間的共線性存在,即變量之間不完全獨(dú)立,這種情況造成分析結(jié)果不穩(wěn)定或不正確。因此,解決自變量
9、之間的多重共線性和減少變量個(gè)數(shù)對(duì)依存關(guān)系的分析就很重要了。主成分分析的應(yīng)用根據(jù)主成分分析原理,它一方面可以將k個(gè)不獨(dú)立的指標(biāo)變量通過(guò)線性變換變成k個(gè)相互獨(dú)立的新變量,這是解決多重共線性問(wèn)題的一個(gè)重要方法。另一方面,主成分分析可以用較少的變量取代較多的不獨(dú)立的原變量,減少分析中變量的個(gè)數(shù)。概括地說(shuō),主成分分析有以下幾方面的應(yīng)用:主成分分析的應(yīng)用對(duì)原始指標(biāo)進(jìn)行綜合:主成分分析的主要作用是在基本保留原始指標(biāo)信息的前提下,以互不相關(guān)的較少個(gè)數(shù)的綜合指標(biāo)來(lái)反映原來(lái)指標(biāo)所提供的信息。探索多個(gè)原始指標(biāo)對(duì)個(gè)體特征的影響:對(duì)于多個(gè)原始指標(biāo),求出主成分后,可以利用因子載荷陣的結(jié)構(gòu),進(jìn)一步探索各主成分與多個(gè)原始指標(biāo)
10、之間的相互關(guān)系,分析各原始指標(biāo)對(duì)各主成分的影響作用。對(duì)樣本進(jìn)行分類:求出主成分后,如果各主成分的專業(yè)意義較為明顯,可以利用各樣品的主成分得分來(lái)進(jìn)行樣品的分類。主成份分析SAS程序 SAS系統(tǒng)中利用PRINCOMP過(guò)程對(duì)數(shù)據(jù)進(jìn)行主成分分析。PRINCOMP過(guò)程的語(yǔ)法格式如下:PROC PRINCOMP DATA= OUT= OUTSTAT= NOINT COV N STD VARDEF 選項(xiàng);VAR 變量/選項(xiàng);PARTIAL 變量;RUN;主成份分析SAS程序DATA語(yǔ)句指定要分析的數(shù)據(jù)集名及一些選項(xiàng),它可以是原SAS數(shù)據(jù)集,也可以是corr、cov、ucorr、ucov等矩陣。OUT選擇項(xiàng)指
11、定統(tǒng)計(jì)量的輸出數(shù)據(jù)集名,該數(shù)據(jù)集保存的是樣本的原始指標(biāo)變量和主成分得分變量。OUTSTAT指定輸出結(jié)果的SAS數(shù)據(jù)集名,該數(shù)據(jù)集保存的是每一個(gè)指標(biāo)的均值、標(biāo)準(zhǔn)差、樣本數(shù)、相關(guān)系數(shù)矩陣、特征值和得分系數(shù)。NOINT選擇項(xiàng)指令系統(tǒng)使用未對(duì)均值校正的相關(guān)系數(shù)矩陣或方差協(xié)方差矩陣進(jìn)行主成分分析,它等價(jià)于主成分模型中不含常數(shù)項(xiàng)。主成份分析SAS程序COV選擇項(xiàng)指令系統(tǒng)用方差協(xié)方差矩陣計(jì)算主成分,如果該選擇項(xiàng)缺省,系統(tǒng)用相關(guān)系數(shù)矩陣計(jì)算主成分。N選擇項(xiàng)給出主成分的個(gè)數(shù)。STD選擇項(xiàng)指令系統(tǒng)在輸出數(shù)據(jù)集中,主成分得分變量的方差被標(biāo)準(zhǔn)化為1。VAR語(yǔ)句用于列出要分析的原始變量。如果該語(yǔ)句缺省,系統(tǒng)分析其它語(yǔ)句
12、中未涉及到的所有指標(biāo)變量。PARTIAL語(yǔ)句用于列出混雜變量,指定系統(tǒng)使用偏相關(guān)系數(shù)或偏方差、協(xié)方差來(lái)計(jì)算主成分。例如,PARTIAL X;它表示偏相關(guān)系數(shù)或偏方差、協(xié)方差是以變量X為混雜變量的,即所有的相關(guān)系數(shù)都表示的是在X不變的情況下,兩個(gè)變量之間的關(guān)聯(lián)程度。但是,該語(yǔ)句列出的變量不能出現(xiàn)在VAR語(yǔ)句中。本章小節(jié) 在大部分實(shí)際問(wèn)題中,變量之間是有一定的相關(guān)性的,人們自然希望找到較少的幾個(gè)彼此不相關(guān)的綜合指標(biāo)盡可能多地反映原來(lái)眾多變量的信息。本章介紹了主成分分析的數(shù)學(xué)模型、方法步驟以及主成分分析的應(yīng)用。我們需要一種綜合性的分析方法,既可減少指標(biāo)變量的個(gè)數(shù),又盡量不損失原指標(biāo)變量所包含的信息,
13、對(duì)資料進(jìn)行全面的綜合分析。主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具。主成份分析的基本思想就是將彼此相關(guān)的一組指標(biāo)變量轉(zhuǎn)化為彼此獨(dú)立的一組新的指標(biāo)變量,并用其中較少的幾個(gè)新指標(biāo)變量就能綜合反應(yīng)原多個(gè)指標(biāo)變量中所包含的主要信息,符合專業(yè)含義。本章小節(jié)本章對(duì)主成分分析的數(shù)學(xué)模型、分析方法步驟以及應(yīng)用問(wèn)題進(jìn)行了詳細(xì)地闡述。我們?cè)趯W(xué)習(xí)的過(guò)程中,要熟悉主成分分析的方法步驟:對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換、計(jì)算相關(guān)系數(shù)矩陣、計(jì)算相關(guān)矩陣的特征值和特征值所對(duì)應(yīng)的特征向量、計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率、確定主成分的個(gè)數(shù)、計(jì)算主成分載荷和計(jì)算主成分得分。本章小節(jié)主成分分析有以下幾方面的應(yīng)用:對(duì)原始指
14、標(biāo)進(jìn)行綜合:主成分分析的主要作用是在基本保留原始指標(biāo)信息的前提下,以互不相關(guān)的較少個(gè)數(shù)的綜合指標(biāo)來(lái)反映原來(lái)指標(biāo)所提供的信息。探索多個(gè)原始指標(biāo)對(duì)個(gè)體特征的影響:對(duì)于多個(gè)原始指標(biāo),求出主成分后,可以利用因子載荷陣的結(jié)構(gòu),進(jìn)一步探索各主成分與多個(gè)原始指標(biāo)之間的相互關(guān)系,分析各原始指標(biāo)對(duì)各主成分的影響作用。對(duì)樣本進(jìn)行分類:求出主成分后,如果各主成分的專業(yè)意義較為明顯,可以利用各樣品的主成分得分來(lái)進(jìn)行樣品的分類。本章小節(jié)SAS系統(tǒng)中利用PRINCOMP過(guò)程對(duì)數(shù)據(jù)進(jìn)行主成分分析。并利用兩個(gè)實(shí)例講解主成分分析的應(yīng)用。第一個(gè)實(shí)例說(shuō)明主成分減少指標(biāo)變量個(gè)數(shù)的作用。第二個(gè)實(shí)例闡述了主成分分析可以用來(lái)解決自變量共線
15、性的問(wèn)題,并詳細(xì)講解了主成分分析解決自變量共線性問(wèn)題的具體方法步驟。第17章 因子分析中國(guó)疾病預(yù)防控制中心學(xué)習(xí)目標(biāo)熟悉因子分析的基本思想;熟悉因子分析的基本原理;了解因子分析的數(shù)學(xué)模型;掌握因子模型的性質(zhì)以及一些基本概念:公共度和方差貢獻(xiàn)。熟悉估計(jì)因子載荷的分析步驟、因子旋轉(zhuǎn)和因子得分等;掌握因子分析的步驟以及FACTOR過(guò)程實(shí)例。因子分析基本思想 前面章節(jié)討論了多元線性回歸分析、主成分分析等,它們的共同特點(diǎn)是討論內(nèi)容為可測(cè)量變量之間的相互關(guān)系,即所分析的這些變量是可以直接觀察或測(cè)量得到的。但是,在醫(yī)學(xué)研究中,很多情況下我們所要研究的變量是不能直接測(cè)量的。例如,研究家庭環(huán)境、社會(huì)環(huán)境和學(xué)校環(huán)境
16、對(duì)兒童智商的影響,這四個(gè)變量都是不能或不易直接觀測(cè)得到的。我們稱這種不能或不易直接觀測(cè)得到的變量為潛在變量或潛在因子。雖然這些潛在變量不能直接測(cè)量,但是它們是一種抽象的客觀存在,因此一定與某些可測(cè)量變量有著某種程度的關(guān)聯(lián)。例如,腦部疾病患者的意識(shí)清醒狀態(tài)是一個(gè)不可測(cè)變量,但可以通過(guò)患者的語(yǔ)言能力、辨識(shí)能力、記憶能力、理解能力等一系列可觀測(cè)的指標(biāo)來(lái)反映。 因子分析基本思想對(duì)于多指標(biāo)數(shù)據(jù)中呈現(xiàn)出的相關(guān)性,是否存在對(duì)這種相關(guān)性起支配作用的潛在變量?如果存在,如何找出這些潛在因素?這些潛在因素是怎樣對(duì)原始指標(biāo)起支配作用的?這些問(wèn)題都可以通過(guò)因子分析來(lái)解決。因子分析是一種旨在尋找隱藏在多變量數(shù)據(jù)中、無(wú)法
17、直接觀察到卻影響或支配可測(cè)變量的潛在因子、并估計(jì)潛在因子對(duì)可測(cè)變量的影響程度以及潛在因子之間的相關(guān)性的一種多元統(tǒng)計(jì)分析方法。因子分析基本思想其基本思想是從分析多變量數(shù)據(jù)的相關(guān)關(guān)系人手,找到支配這種相關(guān)關(guān)系的少數(shù)幾個(gè)相關(guān)獨(dú)立的潛在因子,并通過(guò)建立起這些潛在因子與原變量之間的數(shù)量關(guān)系來(lái)預(yù)測(cè)潛在因子的狀態(tài),幫助發(fā)現(xiàn)隱藏在原變量之間的某種客觀規(guī)律性。因子分析和主成分分析都能夠起到清理多個(gè)原始變量?jī)?nèi)在結(jié)構(gòu)關(guān)系的作用,但主成分分析重在綜合原始變量的信息,而因子分析重在解釋原始變量間的關(guān)系,是比主成分分析更深入的一種多元統(tǒng)計(jì)方法。因子分析基本思想因子分析最初用于心理、智力測(cè)驗(yàn)的統(tǒng)計(jì)分析,隨著計(jì)算技術(shù)的不斷發(fā)
18、展,如今已廣泛應(yīng)用于醫(yī)學(xué)、氣象、經(jīng)濟(jì)學(xué)等其他研究領(lǐng)域,在中醫(yī)辨證論治研究中也有了初步成果。如李文林等利用因子分析法建立隱結(jié)構(gòu)在慢性胃炎辨證中應(yīng)用的初步分析,確定了28個(gè)原始變量中隱含的12個(gè)因子,并利用因子載荷最終分析出這12個(gè)因子(隱節(jié)點(diǎn))所對(duì)應(yīng)的癥狀信息。陳啟光等在中醫(yī)證候規(guī)范研究中以468例高脂血癥的40個(gè)四診信息指標(biāo)進(jìn)行因子分析,結(jié)果表明:提取的5個(gè)公因子能包含四診信息指標(biāo)中8392的信息,并提供所有測(cè)量指標(biāo)在不同公因子載荷的大小,為醫(yī)師評(píng)價(jià)該指標(biāo)在不同證候中的主次關(guān)系提供了定量的分析手段。因子分析基本思想因子分析法就是尋找這些潛在因子的模型分析方法,它是在主成分的基礎(chǔ)上構(gòu)筑若干意義較
19、為明確的潛在因子,以它們?yōu)榭蚣芊纸庠兞?,以此考察原變量間的聯(lián)系與區(qū)別。例如,隨著年齡的增長(zhǎng),兒童的身高、體重會(huì)隨著變化,具有一定的相關(guān)性,身高和體重之間為何會(huì)有相關(guān)性呢?因?yàn)榇嬖谥粋€(gè)同時(shí)支配或影響著身高與體重的生長(zhǎng)因子。那么,我們能否通過(guò)對(duì)多個(gè)變量的相關(guān)系數(shù)矩陣的研究,找出同時(shí)影響或支配所有變量的共性因子呢?因子分析就是從大量的數(shù)據(jù)中“由表及里”、“去粗取精”,尋找影響或支配變量的多變量統(tǒng)計(jì)方法。因子分析基本思想可以說(shuō),因子分析是主成分分析的推廣,也是一種把多個(gè)變量化為少數(shù)幾個(gè)綜合變量的多變量分析方法,其目的是用有限個(gè)不可觀測(cè)的隱變量來(lái)解釋原始變量之間的相關(guān)關(guān)系。因子分析主要用于:1、減少
20、分析變量個(gè)數(shù);2、通過(guò)對(duì)變量間相關(guān)關(guān)系探測(cè),將原始變量進(jìn)行分類。即將相關(guān)性高的變量分為一組,用共同的潛在因子代替該組變量。因子分析基本思想可以說(shuō),因子分析是主成分分析的推廣,也是一種把多個(gè)變量化為少數(shù)幾個(gè)綜合變量的多變量分析方法,其目的是用有限個(gè)不可觀測(cè)的隱變量來(lái)解釋原始變量之間的相關(guān)關(guān)系。因子分析主要用于:1、減少分析變量個(gè)數(shù);2、通過(guò)對(duì)變量間相關(guān)關(guān)系探測(cè),將原始變量進(jìn)行分類。即將相關(guān)性高的變量分為一組,用共同的潛在因子代替該組變量。因子分析基本思想因子分析法是從研究變量?jī)?nèi)部相關(guān)的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。它的基本思想是將觀測(cè)變
21、量進(jìn)行分類,將相關(guān)性較高,即聯(lián)系比較緊密的分在同一類中,而不同類變量之間的相關(guān)性則較低,那么每一類變量實(shí)際上就代表了一個(gè)基本結(jié)構(gòu),即公共因子。對(duì)于所研究的問(wèn)題就是試圖用最少個(gè)數(shù)的不可測(cè)的所謂公共因子的線性函數(shù)與特殊因子之和來(lái)描述原來(lái)觀測(cè)的每一分量。因子分析的基本原理 下表給出了三個(gè)指標(biāo)之間的相關(guān)系數(shù),其中,x1是孩子的數(shù)學(xué)成績(jī),x2是孩子的語(yǔ)文成績(jī),x3是孩子的英語(yǔ)成績(jī)。求影響支配這三個(gè)成績(jī)指標(biāo)變量的潛在因子。 三個(gè)指標(biāo)之間的相關(guān)系數(shù)x1x2x3x11.00 x20.771.00 x30.720.861.00因子分析的基本原理令 是影響這三個(gè)指標(biāo)變量的潛在因子。顯然,每個(gè)成績(jī)指標(biāo)變量除了受這個(gè)
22、潛在因子的影響外,可能還受其它因子的影響。把 以外的影響因子記為 ,從數(shù)學(xué)角度看,它們之間的關(guān)系可以表示為:因子分析的基本原理如果假設(shè) 是方差為1,、 、 、 相互獨(dú)立,并且假設(shè)指標(biāo)變量被標(biāo)準(zhǔn)化為方差為1的變量 ,那么,因子分析的基本原理同理可以得到,也就得到了a1、a2和a3的一個(gè)方程組:因子分析的基本原理解上述方程組,得到一組解為:a1=0.897,a2=0.959,a3=0.803從而得到三個(gè)標(biāo)準(zhǔn)指標(biāo)Xi與潛在因子以及誤差項(xiàng)之間的關(guān)系表達(dá)式,即:從這個(gè)關(guān)系表達(dá)式可以看出這個(gè)潛在因子對(duì)孩子的三門(mén)課的成績(jī)都有影響,而且,影響程度比較均衡。因子分析的基本原理再看下面這組表達(dá)式,其中X1-X5是
23、五個(gè)指標(biāo)變量,它們分別表示收縮壓、舒張壓、心跳間隔、呼吸間隔和舌下溫度。從醫(yī)學(xué)知識(shí)可知,這5個(gè)指標(biāo)是受自主神經(jīng)的交感神經(jīng)和副交感神經(jīng)支配的,而交感神經(jīng)和副交感神經(jīng)狀態(tài)又不能直接測(cè)定。用F1、F2分別表示交感神經(jīng)和副交感神經(jīng)這2個(gè)因子,則可測(cè)指標(biāo)Xi是不可測(cè)因子Fj的線性函數(shù),因子分析的基本原理由于F1、F2與每一個(gè)Xi都有關(guān),因此,研究這5個(gè)指標(biāo)變量之間的關(guān)系可以轉(zhuǎn)化為研究這兩個(gè)潛在因子之間的關(guān)系。因子分析的基本原理就是依據(jù)可測(cè)指標(biāo)變量之間的相關(guān)關(guān)系,從中尋找出合理的有實(shí)際意義的潛在因子,并估計(jì)出潛在因子對(duì)可測(cè)指標(biāo)變量的影響程度。因子分析的基本原理Fj對(duì)各Xi的影響是線性的,再加上其它影響因子
24、ei,則各Xi與F1、F2的關(guān)系可表示為:因子分析的步驟 因子分析的核心問(wèn)題有兩個(gè):一是如何構(gòu)造因子變量;二是如何對(duì)因子變量進(jìn)行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個(gè)核心問(wèn)題展開(kāi)的。因子分析的步驟因子分析常常有以下四個(gè)基本步驟:確認(rèn)待分析的原變量是否適合作因子分析;構(gòu)造因子變量;利用旋轉(zhuǎn)方法使因子變量更具有可解釋性;計(jì)算因子變量得分。因子分析的步驟因子分析的計(jì)算過(guò)程:將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級(jí)和量綱上的不同;求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)矩陣;求相關(guān)矩陣的特征值和特征向量;計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率;確定因子:設(shè)F1,F(xiàn)2, Fp為p個(gè)因子,其中前m個(gè)因子包含的數(shù)據(jù)信息
25、總量(即其累積貢獻(xiàn)率)不低于80%時(shí),可取前m個(gè)因子來(lái)反映原指標(biāo);因子分析的步驟因子旋轉(zhuǎn)若所得的m個(gè)因子無(wú)法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。用原指標(biāo)的線性組合來(lái)求各因子得分采用回歸估計(jì)法,Bartlett估計(jì)法或Thomson估計(jì)法計(jì)算因子得分。綜合得分以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。F=(w1F1+w2F2+wmFm)(w1+w2+wm)此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻(xiàn)率。因子分析的應(yīng)用在采用多元統(tǒng)計(jì)分析技術(shù)進(jìn)行數(shù)據(jù)處理、建立宏觀或微觀系統(tǒng)模型時(shí),需要研究以下幾個(gè)方面的問(wèn)題:簡(jiǎn)化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核??刹捎弥鞒煞址治?、因子分析、對(duì)應(yīng)分析等方法,在眾多因素中找出各個(gè)變量最佳的子集合,從子集合所包含的信息描述多變量的系統(tǒng)結(jié)果及各個(gè)因子對(duì)系統(tǒng)的影響。“從樹(shù)木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡(jiǎn)化系統(tǒng)的結(jié)構(gòu),認(rèn)識(shí)系統(tǒng)的內(nèi)核。因子分析的應(yīng)用構(gòu)造預(yù)測(cè)模型,進(jìn)行預(yù)報(bào)控制。在自然和社會(huì)科學(xué)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 設(shè)備維護(hù)助理工作總結(jié)
- XXX電子科技有限公司員工安全手冊(cè)(安全操作規(guī)程)
- 2025-2030全球汽車主動(dòng)夜視系統(tǒng)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)臺(tái)式振動(dòng)臺(tái)行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球監(jiān)視雷達(dá)系統(tǒng)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球碳納米粉行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)三重四級(jí)桿液質(zhì)聯(lián)用儀行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球DRM數(shù)字版權(quán)保護(hù)技術(shù)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)細(xì)胞活力檢測(cè)試劑盒行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球可重復(fù)使用墊料氣囊行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 麥當(dāng)勞市場(chǎng)調(diào)研
- 芯片可靠性分析
- 2023年貴州省畢節(jié)市中考物理試題(原卷+解析版)真題含答案
- 口腔種植技術(shù)臨床應(yīng)用能力評(píng)估報(bào)告范本
- 從中國(guó)制造到中國(guó)創(chuàng)造(優(yōu)秀課件)
- 新華字典第12版電子版
- 【考試版】蘇教版2022-2023學(xué)年四年級(jí)數(shù)學(xué)下冊(cè)開(kāi)學(xué)摸底考試卷(五)含答案與解析
- 血液透析個(gè)案護(hù)理兩篇
- 第八章 客戶關(guān)系管理
- 新版人教版高中英語(yǔ)選修一、選修二詞匯表
- 2022年河北邯鄲世紀(jì)建設(shè)投資集團(tuán)有限公司招聘筆試試題及答案解析
評(píng)論
0/150
提交評(píng)論