




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于因子分析與對(duì)應(yīng)分析第1頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月主成分分析是將多個(gè)指標(biāo)化為少數(shù)相互無(wú)關(guān)的綜合指標(biāo)的統(tǒng)計(jì)方法,通常數(shù)學(xué)上的處理就是將原來(lái)的p個(gè)指標(biāo)做線(xiàn)性組合,作為新的綜合指標(biāo),記第一個(gè)綜合指標(biāo)為F1。選取這個(gè)線(xiàn)性組合的原則是令F1的方差最大,稱(chēng)F1為第一主成分;然后選取第二主成分F2,且F1與F2的協(xié)方差為0,類(lèi)似構(gòu)造其余的主成分。主成分分析——【Factor】過(guò)程對(duì)觀測(cè)量數(shù)目沒(méi)有嚴(yán)格要求第2頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月第一節(jié)因子分析——【Factor】過(guò)程
主成分分析的推廣和發(fā)展,對(duì)觀測(cè)量數(shù)目要求至少是變量的5倍以上,且越多越好
一、因子分析簡(jiǎn)介做什么?因子分析是多元統(tǒng)計(jì)分析中處理降維的一種統(tǒng)計(jì)方法,它主要將具有錯(cuò)綜復(fù)雜關(guān)系的變量或者樣品綜合為數(shù)量較少的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系。基本思想:(1)首先,通過(guò)變量(或樣品)的相關(guān)系數(shù)矩陣(或相似系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個(gè)隨機(jī)變量(常稱(chēng)為因子)去描述多個(gè)變量(或樣品)之間的相關(guān)(相似)關(guān)系;(2)然后,根據(jù)相關(guān)性(或相似性)的大小把變量(或樣品)分組,使得同組內(nèi)的變量(或樣品)之間的相關(guān)性(或相似性)較高,但不同組的變量相關(guān)性(或相似性)較低。第3頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月依據(jù)處理的對(duì)象不同,可以分為兩類(lèi):
R型因子分析,對(duì)變量做降維處理
Q型因子分析,對(duì)樣本做降維處理R型因子分析第4頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月第5頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月因子分析的幾個(gè)概念:1、因子載荷第6頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月2、變量共同度
第7頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月3、公因子Fj的方差貢獻(xiàn)第8頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月4、因子旋轉(zhuǎn)因子旋轉(zhuǎn)的目的是為了使得因子載荷陣的結(jié)構(gòu)簡(jiǎn)化,便于對(duì)公共因子進(jìn)行解釋。這里所謂的結(jié)構(gòu)簡(jiǎn)化是使每個(gè)變量?jī)H在一個(gè)公共因子上有較大的載荷,而在其余公共因子上載荷比較小。這種變換因子載荷陣的方法稱(chēng)為因子軸的旋轉(zhuǎn)。旋轉(zhuǎn)的方法有很多種,如正交旋轉(zhuǎn),斜交旋軸等。第9頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月5、因子得分第10頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月因子分析的一般步驟第11頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月二、引例(練習(xí)一)例1利用因子分析過(guò)程分析各個(gè)城市的市政設(shè)施建設(shè)情況。數(shù)據(jù)文件:“各地區(qū)城市市政設(shè)施.sav”,下表是部分?jǐn)?shù)據(jù)。第12頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月【Analyze】/【DataReduction】/【Factor】要求:選入分析變量(因子分析的變量)(定義記錄旋轉(zhuǎn)條件)第13頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:輸出相關(guān)系數(shù)矩陣;進(jìn)行因子分析適用條件的檢驗(yàn)Descriptives:選擇需要輸出的統(tǒng)計(jì)量(統(tǒng)計(jì)量)單變量描述統(tǒng)計(jì)量:各分析變量的均值、標(biāo)準(zhǔn)差及觀測(cè)數(shù)原始分析結(jié)果:原變量的公因子方差、與變量相同個(gè)數(shù)的因子、各因子的特征根及其所占總方差的百分比和累計(jì)百分比(相關(guān)矩陣)所有變量間的相關(guān)系數(shù)矩陣顯著性水平相關(guān)系數(shù)矩陣的行列式值KMO檢驗(yàn)和Bartlett球形檢驗(yàn)相關(guān)系數(shù)矩陣的逆矩陣再生相關(guān)系數(shù)矩陣反映像協(xié)方差陣和相關(guān)陣第14頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:輸出碎石圖Extraction:選擇因子提取的方法(選擇公共因子的提取方法)公共因子的提取方法:(1)主成分分析法(默認(rèn));(2)不加權(quán)最小二乘法;(3)廣義最小二乘法;(4)極大似然法;(5)主軸因子法;(6)因子法;(7)影像因子法相關(guān)矩陣協(xié)方差矩陣(設(shè)定公共因子提取標(biāo)準(zhǔn))顯示未經(jīng)旋轉(zhuǎn)變換的因子提取結(jié)果顯示碎石圖,體現(xiàn)各因子重要程度自定義提取因子的數(shù)量以特征根大于指定數(shù)值為提取標(biāo)準(zhǔn)(收斂時(shí)的最大迭代次數(shù))第15頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月Rotation:選擇因子旋轉(zhuǎn)的方法方差最大化正交旋轉(zhuǎn)斜交旋轉(zhuǎn)法四分旋轉(zhuǎn)法平均正交旋轉(zhuǎn)法斜交旋轉(zhuǎn)法(設(shè)置旋轉(zhuǎn)解的輸出)(因子旋轉(zhuǎn)的方法)輸出主成分轉(zhuǎn)換矩陣輸出二維或三維的因子載荷圖第16頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:輸出因子得分系數(shù)矩陣FactorScores:因子得分(在數(shù)據(jù)文件中建立一個(gè)新變量,用于保存各觀測(cè)量的因子得分)(因子得分計(jì)算方法)回歸法巴特列特法安德森-魯賓法(輸出因子得分系數(shù)矩陣及因子協(xié)方差矩陣)第17頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:用均值代替缺失值Options對(duì)話(huà)框(選擇缺失值處理方法)(選擇系數(shù)的輸出方式)因子載荷矩陣和結(jié)構(gòu)矩陣按數(shù)值大小排序不顯示絕對(duì)值小于指定數(shù)的載荷系數(shù)第18頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月變量間相關(guān)性很高結(jié)果解讀:1、相關(guān)系數(shù)矩陣表第19頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月接近0.9,適合做因子分析拒絕原假設(shè),認(rèn)為各變量之間不獨(dú)立2、KMO檢驗(yàn)和Bartlett球形檢驗(yàn)結(jié)果表注:
KMO檢驗(yàn)用于檢驗(yàn)變量間的偏相關(guān)系數(shù)是否過(guò)小,一般,KMO大于0.9時(shí)效果最佳,小于0.5時(shí)不適宜做因子分析。
Bartlett球形檢驗(yàn)用于檢驗(yàn)相關(guān)系數(shù)矩陣是否是單位陣,如果結(jié)論是不拒絕該假設(shè),則表示各個(gè)變量都是各自獨(dú)立的。第20頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月該變量95.4%的信息已經(jīng)被提取3、變量共同度表給出了提取公共因子前后各變量的共同度(衡量公共因子的相對(duì)重要性指標(biāo))說(shuō)明:比如變量X1的共同度位0.954,即提取的公共因子對(duì)變量X1的方差做出了95.4%的貢獻(xiàn)。第21頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月4、主成分表列出了所有的主成分,且按照特征根從大到小次序排列。說(shuō)明:第一主成分特征根為5.280,方差貢獻(xiàn)率為88.001%,前兩個(gè)主成分的累計(jì)貢獻(xiàn)率為94.504%,根據(jù)提取因子的條件——特征值大于1,本例只選出一個(gè)因子。第22頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月提取一個(gè)主成分即可5、碎石圖按照特征根大小排列的主成分散點(diǎn)圖??v坐標(biāo)為特征值,橫坐標(biāo)為因子數(shù)。第23頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月6、因子負(fù)荷矩陣用來(lái)反映各個(gè)變量的變異主要由哪些因子解釋。第24頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月7、因子得分系數(shù)矩陣得出用各個(gè)變量的線(xiàn)性組合表達(dá)的主成分。第25頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月8、因子得分的協(xié)方差矩陣反映各因子間的聯(lián)系程度。注:本例只提取了一個(gè)公共因子,故表格內(nèi)容無(wú)實(shí)際意義。第26頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月例2利用因子分析過(guò)程分析一年內(nèi)各個(gè)城市的日照情況。數(shù)據(jù)文件:“主要城市日照數(shù).sav”?!続nalyze】/【DataReduction】/【Factor】要求:選入分析變量第27頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:輸出因子分析適用條件的檢驗(yàn)第28頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:輸出碎石圖第29頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:輸出因子得分系數(shù)陣第30頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月要求:采用方差最大化正交旋轉(zhuǎn);輸出因子載荷圖第31頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月結(jié)果解讀:1、KMO檢驗(yàn)和Bartlett球形檢驗(yàn)結(jié)果表說(shuō)明:KMO檢驗(yàn)結(jié)果為0.798,大于0.5,比較適合作因子分析;Bartlett球形檢驗(yàn)的Sig.值為0,各變量不獨(dú)立。第32頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月2、變量共同度表說(shuō)明:變量“Jan”的共同度為0.915,即選取的公共因子提取了變量“Jan”91.5%的信息。第33頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月3、主成分表說(shuō)明:第一主成分特征根為6.854,方差貢獻(xiàn)率為57.041%,前3個(gè)主成分的累積貢獻(xiàn)率為84.421%,根據(jù)提取因子的條件——特征值大于1,本例選出3個(gè)因子。第34頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月4、碎石圖說(shuō)明:前3個(gè)主成分的特征根都在1以上。第35頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月5、因子載荷矩陣給出各變量的因子表達(dá)式。第36頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月6、旋轉(zhuǎn)后因子載荷矩陣經(jīng)過(guò)正交旋轉(zhuǎn)后的因子載荷矩陣,給出旋轉(zhuǎn)后的各變量的因子表達(dá)式。說(shuō)明:第一主因子主要由前5個(gè)變量決定,第二主因子主要由中間4個(gè)變量決定,第三主因子主要由最后3個(gè)變量決定。第37頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月7、因子轉(zhuǎn)換矩陣旋轉(zhuǎn)前的因子載荷矩陣乘以因子轉(zhuǎn)換矩陣等于旋轉(zhuǎn)后的因子載荷矩陣。第38頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月8、因子旋轉(zhuǎn)后的因子載荷圖圖中的坐標(biāo)軸就是各個(gè)主因子。第39頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月9、因子得分系數(shù)矩陣得到因子得分表達(dá)式。第40頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月10、因子得分的協(xié)方差矩陣說(shuō)明:因子得分的協(xié)方差矩陣為單位陣,得出提取的3個(gè)公共因子之間是不相關(guān)的。第41頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月第二節(jié)簡(jiǎn)單對(duì)應(yīng)分析
——【CorrespondebceAnalysis】過(guò)程
又稱(chēng)列聯(lián)表對(duì)應(yīng)分析一、對(duì)應(yīng)分析簡(jiǎn)介對(duì)應(yīng)分析是通過(guò)進(jìn)行主成分分析來(lái)描述兩個(gè)或多個(gè)分類(lèi)變量各水平間相關(guān)性的分析方法,它的分析結(jié)果主要采用反映變量間相互關(guān)系的對(duì)應(yīng)分析圖來(lái)表示。對(duì)應(yīng)分析在SPSS中分為兩類(lèi):
簡(jiǎn)單對(duì)應(yīng)分析——【CorrespondebceAnalysis】過(guò)程:主要研究?jī)蓚€(gè)分類(lèi)變量之間的關(guān)系。
多元對(duì)應(yīng)分析——【OptimalScaling】過(guò)程第42頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月對(duì)應(yīng)分析表(列聯(lián)表):第43頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月
最后分別對(duì)行剖面點(diǎn)集和列剖面點(diǎn)集做主成分分析,以判斷兩個(gè)變量的聯(lián)系情況。第44頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月例2利用簡(jiǎn)單對(duì)應(yīng)分析過(guò)程分析不同年齡段選民的傾向。數(shù)據(jù)文件:voter.sav二、引例(練習(xí)二)第45頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月【Analyze】/【DimensionReduction】/【CorrespondenceAnalysis】要求:選入行變量(取值范圍為1~3)與列變量(取值范圍為1~4)(行變量)定義行變量取值范圍(列變量)定義列變量取值范圍第46頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月Model:模式子對(duì)話(huà)框(設(shè)置分析結(jié)果維數(shù))(選擇距離測(cè)量方式)卡方距離歐氏距離,主要用于連續(xù)變量(變量的標(biāo)準(zhǔn)化方式)(正則化方法)對(duì)稱(chēng)法(默認(rèn))第47頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月Satistics:設(shè)置需要輸出的統(tǒng)計(jì)量輸出對(duì)應(yīng)分析表(列聯(lián)表)輸出行點(diǎn)概述表輸出列點(diǎn)概述表輸出行輪廓表輸出列輪廓表指定的前n個(gè)維度輸出基于行列得分的原始表格(輸出行點(diǎn)和列點(diǎn)的標(biāo)準(zhǔn)差、以及各維度坐標(biāo)間的相關(guān)系數(shù))第48頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月Plots:設(shè)置需要輸出圖形(輸出對(duì)應(yīng)分析圖)雙變量散點(diǎn)圖行點(diǎn)圖列點(diǎn)圖限制標(biāo)簽長(zhǎng)度輸出各行變量分類(lèi)對(duì)應(yīng)于行得分的散點(diǎn)圖輸出各列變量分類(lèi)對(duì)應(yīng)于列得分的散點(diǎn)圖(圖形維度)輸出分析結(jié)果的所有維度限制輸出維度的數(shù)目第49頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月結(jié)果解讀:1、對(duì)應(yīng)分析表給出不同年齡階段的人群分別投票給三位總統(tǒng)候選人的人數(shù)。第50頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月2、結(jié)果匯總表列出維數(shù)、奇異值(慣量的平方根)、慣量(又指特征根)、總的卡方檢驗(yàn)及Sig.值維數(shù)奇異值特征根總的卡方檢驗(yàn)注:慣量用于說(shuō)明對(duì)應(yīng)分析各個(gè)維度的結(jié)果能夠解釋列聯(lián)表中兩個(gè)變量聯(lián)系的程度。說(shuō)明:表中兩個(gè)維度分別解釋了總信息量的99.6%和0.4%,說(shuō)明二維圖形完全可以表示兩個(gè)變量間的信息,且觀察時(shí)以第一維度為主。第51頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月3、行點(diǎn)概述表給出行變量的3個(gè)分組在兩個(gè)維度中的分值每組所占百分比每組所對(duì)各個(gè)維度的貢獻(xiàn)量(點(diǎn)對(duì)維度慣量的貢獻(xiàn)量)(維度對(duì)點(diǎn)慣量的貢獻(xiàn)量)分組在第一、第二維度的坐標(biāo)值第52頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月4、列點(diǎn)概述表給出列變量的4個(gè)分組在兩個(gè)維度中的分值每組所占百分比分組在第一、第二維度的坐標(biāo)值每組所對(duì)各個(gè)維度的貢獻(xiàn)量(點(diǎn)對(duì)維度慣量的貢獻(xiàn)量)(維度對(duì)點(diǎn)慣量的貢獻(xiàn)量)第53頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月5、對(duì)應(yīng)分析圖首先看同一變量的不同分組在某一側(cè)維度上靠的遠(yuǎn)近程度,較近表示這些分組在該維度上區(qū)別不大,比如第二維度;然后看不同變量的各分組間的位置,從圖形中心(0,0)出發(fā),相同方位上大致相同的區(qū)域內(nèi)的不同變量的分組彼此有聯(lián)系。說(shuō)明:可看出45~64歲這個(gè)階段的選民都傾向于克林頓,其他的沒(méi)有明顯的傾向性。第54頁(yè),課件共58頁(yè),創(chuàng)作于2023年2月第三節(jié)最優(yōu)尺度分析
——【OptimalScaling】過(guò)程初步認(rèn)識(shí)【Analyze】/【DimensionReduction】/【OptimalScaling】多元對(duì)應(yīng)分析分類(lèi)變量主成分分析非線(xiàn)性典型相關(guān)分析分析變量中存
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 汽車(chē)機(jī)械維修技術(shù)案例分析題庫(kù)
- 農(nóng)業(yè)生產(chǎn)智慧化發(fā)展趨勢(shì)與前景展望方案
- 外科總論復(fù)習(xí)試題及答案
- 品牌策劃及推廣方案集錦
- 包裝容器覆膜密封性檢測(cè)
- 高效種植與養(yǎng)殖綜合作業(yè)指導(dǎo)書(shū)
- 辦公活動(dòng)策劃與執(zhí)行手冊(cè)
- 企業(yè)宣傳策劃與執(zhí)行指南
- 關(guān)于大學(xué)生打游戲調(diào)查
- 跨部門(mén)協(xié)作項(xiàng)目推進(jìn)工作計(jì)劃
- 最實(shí)用的渣土系數(shù)表
- 重癥病人營(yíng)養(yǎng)支持ICU
- 工會(huì)組建工作實(shí)務(wù)課件
- 外浮頂儲(chǔ)罐·內(nèi)浮頂儲(chǔ)罐泡沫堰PPT
- 甘肅省平?jīng)鍪懈骺h區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)及行政區(qū)劃代碼
- (完整版)初中道德與法治課程標(biāo)準(zhǔn)
- 自動(dòng)化腹膜透析(APD)的臨床應(yīng)用課件
- 滌綸長(zhǎng)絲生產(chǎn)標(biāo)準(zhǔn)工藝簡(jiǎn)介
- 數(shù)字圖像處理-6第六章圖像去噪課件
- 監(jiān)理施工設(shè)計(jì)圖紙簽發(fā)表
- DB43∕T 801-2013 二次張拉低回縮鋼絞線(xiàn)豎向預(yù)應(yīng)力短索錨固體系設(shè)計(jì)、施工和驗(yàn)收規(guī)范
評(píng)論
0/150
提交評(píng)論