因子分析解析課件_第1頁
因子分析解析課件_第2頁
因子分析解析課件_第3頁
因子分析解析課件_第4頁
因子分析解析課件_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章因子分析Factor Analysis一、因子分析的作用最重要的作用:減少變量,縮減數(shù)據(jù)。通過研究多個(gè)變量間的內(nèi)部關(guān)系,探尋變量中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來表示基本的數(shù)據(jù)結(jié)構(gòu)。這些假想變量即是因子factors,它們能夠反映原來多個(gè)基礎(chǔ)變量所表示的主要信息。因子出現(xiàn)后,即可代表原來的多個(gè)基礎(chǔ)變量使用,以達(dá)到減少變量數(shù)的目的。(意義:獨(dú)立用,做單變量;做雙變量)因子分析獨(dú)立使用時(shí)通過少量的因子可以更清楚地把握諸多變量的本質(zhì),另外它常是一種數(shù)據(jù)整理或準(zhǔn)備。具體作用:1)有些變量實(shí)際觀察不到,但又確實(shí)發(fā)揮影響,如價(jià)值觀、能力、愛好等,只能使用抽象的因子來測量;2)變量太多,需要簡化;3

2、)多元回歸(毛?。鹤宰兞康南嚓P(guān)性不能太強(qiáng))中常出現(xiàn)多重共線性,需要去掉一些變量,但無法有充分理由選擇去除某個(gè)變量,故可將這些變量合并成因子,使用因子代替原有變量進(jìn)行回歸分析,即無多重共線性。如將收入和受教育程度合并為社會(huì)經(jīng)濟(jì)地位(SES)一個(gè)變量;4)評價(jià)問卷的結(jié)構(gòu)效度;例,結(jié)構(gòu)效度情緒及情緒應(yīng)對量表:1=完全沒有 2=很少有 3=有時(shí)有 4=經(jīng)常有 5=每天都有1 我感到愉快2 我感到郁悶3 我情緒不好時(shí)會(huì)想辦法讓自己高興起來4 我感到自己不知怎么做才好5 我感到有壓力6 我想哭就哭,我哭出來感覺好多了7 我感到?jīng)]人能幫助我8 我感到精力旺盛9 我感到輕松10 我會(huì)把煩心的事情放在心里11

3、我遇到不高興的事總是難以忘掉12 我把煩心事說給別人聽,之后感覺好多了13 我感到緊張14 我感到疲乏 積極情緒:1、8、9 消極情緒:2、4、5、7、13、14 外向應(yīng)對:3、6、12 內(nèi)向應(yīng)對:10、115)在路徑分析模型(缺乏總的解釋力)向結(jié)構(gòu)方程模型Lisrel(可以有總解釋力)轉(zhuǎn)化中,潛在變量的影響作用常需作因子處理(因?yàn)樘嗔?,結(jié)構(gòu)分析因此由回歸和因子分析組成。如經(jīng)典的研究子女收入的路徑分析中,子女教育程度被單向認(rèn)為是決定子女收入的,但實(shí)際上子女收入也會(huì)反過來影響子女教育程度,且在子女收入上除教育程度外,個(gè)人各種能力也會(huì)影響收入,這時(shí)只能使用結(jié)構(gòu)分析模型,個(gè)人能力影響部分就需先作

4、因子分析。二、因子分析的數(shù)據(jù)要求和基本步驟1、數(shù)據(jù)要求:1)進(jìn)行因子分析的各基礎(chǔ)變量應(yīng)是定距變量,虛擬變量可以同時(shí)引入,但結(jié)果可能不好(Why?數(shù)量級的影響);2)各基礎(chǔ)變量間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系。 可以計(jì)算各變量的相關(guān)矩陣(兩兩變量之間的相關(guān)系數(shù)),最好相關(guān)矩陣中的所有相關(guān)系數(shù)大于0.3;SPSS提供巴雷特球體檢驗(yàn)和KMO值,要求檢驗(yàn)通過且KMO值大于0.5,否則不能進(jìn)行因子分析,KMO值大于0.9時(shí)效果最好 。3)數(shù)據(jù)樣本量應(yīng)達(dá)到一定水平一般要求樣本量至少是變量數(shù)的5倍以上,最好達(dá)到10倍以上;理論上要求樣本量不應(yīng)該少于100。樣本量越大越好。4)社會(huì)學(xué)中多見李克特量表(五級)用于因子分析

5、,使用時(shí)應(yīng)注意該量表應(yīng)具有一定的鑒別力(鑒別力不強(qiáng)的要?jiǎng)h掉,即某一問題的回答基本一致),否則因子分析效果不佳。2、基本步驟:1)選擇基礎(chǔ)變量,并對基礎(chǔ)變量的適合狀況進(jìn)行分析(相關(guān)關(guān)系測量);2)從基礎(chǔ)變量中提取因子(公共因子法與主成分法),涉及因子個(gè)數(shù)判別,因子個(gè)數(shù)應(yīng)少于基礎(chǔ)變量;3)進(jìn)行因子旋轉(zhuǎn),即通過坐標(biāo)變換使因子兩兩獨(dú)立,以得到更合理的因子解。不旋轉(zhuǎn),因子負(fù)荷有時(shí)可能過分偏低??勺⒁鈱Ρ绒D(zhuǎn)軸前后的因子負(fù)荷矩陣;4)計(jì)算每個(gè)樣本在各個(gè)因子上的因子得分,該得分即是每個(gè)樣本在各因子變量上的取值。重要概念:因子負(fù)荷是一個(gè)矩陣,表示公因子與基礎(chǔ)變量間的相關(guān)系數(shù)。負(fù)荷大,表示該公因子與某基礎(chǔ)變量間存

6、在較大關(guān)系。觀察負(fù)荷矩陣,可以看出公因子在哪些變量上有較大負(fù)荷,可以據(jù)此說明公因子的實(shí)際含義。若矩陣缺乏規(guī)律,不能看出某個(gè)含義,還需要進(jìn)行因子旋轉(zhuǎn),(增加因子變量)以求得更好的解釋。三、SPSS因子分析操作與結(jié)果解釋analyzedata reductionfactor1、選擇并描述基礎(chǔ)變量,并對基礎(chǔ)變量進(jìn)行檢驗(yàn)判斷:Descriptives 對話框Univariate descriptives:單變量描述統(tǒng)計(jì)量,輸出各基礎(chǔ)變量的均值和標(biāo)準(zhǔn)差;coefficients:輸出基礎(chǔ)變量間的相關(guān)系數(shù)矩陣,注意各值是否大于0.3;KMO and Bartletts test of sphericity

7、:輸出檢驗(yàn)顯著度及KMO值。2、提取因子兩種方法:主成分法與公共因子法(數(shù)學(xué)原理完全不同,具體的差異可見郭P101-102)。早期人們使用主成分法,它對變量的分布沒有要求。后期發(fā)展出因子法,更靈活有效。Extraction因子提取對話框Method中的principal components即為主成分法,為系統(tǒng)默認(rèn);如果數(shù)據(jù)良好,則各個(gè)方法提取因子的結(jié)果相同;若樣本數(shù)超過1500,極大似然法會(huì)更精確;若數(shù)據(jù)不好,后兩種方法更適用;如果條件不明,仍用主成分法。Extract:控制提取過程和提取結(jié)果。Eigenvalues over中默認(rèn)值為1,即提取特征值(根)大于1的因子(小于1,說明該因子解

8、釋力度還不如直接引入一個(gè)原變量的平均解釋力度大);利用number of factors可指定提取因子的數(shù)目。Display:結(jié)果顯示。Unrotated factor solution默認(rèn)輸出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。命令執(zhí)行后輸出:Communalities變量共同度表(公因子方差比):表示各變量中所含信息被K個(gè)公因子所表示的程度,取值0-1,值越大說明該變量被因子說明的程度越高;Total variance explained總方差解釋表:表示提取因子在總方差中的貢獻(xiàn)率,注意特征值在1以上的各因子的累積貢獻(xiàn)率。特征值大于1的因子被默認(rèn)為提取的公因子,但同時(shí)還可以觀察累積貢獻(xiàn)率,一般最好高于

9、80%時(shí)為止。特征值與累積貢獻(xiàn)率常綜合考慮;Component Matrix因子負(fù)荷矩陣:即各因子對各變量的影響度,根據(jù)此矩陣可初步判斷各基礎(chǔ)變量與公因子的關(guān)系,并以此說明公因子的性質(zhì),是公因子命名的根據(jù)。3、進(jìn)行因子旋轉(zhuǎn),進(jìn)一步明確因子組合。旋轉(zhuǎn)并不改變因子分析的整體結(jié)果,只是影響各因子在各個(gè)變量上的載荷分布,并影響各因子的貢獻(xiàn)率。Rotation對話框。SPSS提供5種旋轉(zhuǎn)方法。最常用的是Varimax方差最大正交旋轉(zhuǎn),其次為Quartimax四次方最大正交旋轉(zhuǎn)。斜交旋轉(zhuǎn)需要指明角度,一般不用。正交表示各變量間兩兩獨(dú)立,斜交則有一定相關(guān)性。確定旋轉(zhuǎn)后將輸出旋轉(zhuǎn)后的因子負(fù)荷表。4、計(jì)算每個(gè)樣

10、本在各個(gè)因子上的因子得分Scores對話框Save as variables (regression方法)。即可在數(shù)據(jù)庫中將因子存為單獨(dú)的變量,每個(gè)樣本在該變量上的取值為因子得分,是根據(jù)因子得分矩陣的線性方程計(jì)算得出的。這些因子變量及其取值存儲在數(shù)據(jù)庫中,以便在其他分析中直接使用。對話框中選擇display factor score coefficient matrix將輸出:Component score coefficient matrix因子得分函數(shù)系數(shù)矩陣,據(jù)此矩陣可寫出各公因子的線性表達(dá)式。四、因子分析結(jié)果與其他分析方法的結(jié)合主要依賴因子變量。注意因子變量是標(biāo)準(zhǔn)化的變量。因子變量成為

11、因變量;因子變量成為自變量;因子變量成為分析變量,如根據(jù)因子變量進(jìn)行聚類。(因子分析是下一步分析的起點(diǎn),不是終點(diǎn),而聚類是終點(diǎn))五、因子分析應(yīng)用范例1、問卷題目刪留情況:問卷的第三部分關(guān)于“群體身份認(rèn)同”的調(diào)查采用里克特五等級尺度總加量表,在問卷錄入時(shí),根據(jù)回答強(qiáng)態(tài)度的強(qiáng)弱對回答結(jié)果進(jìn)行賦值,具體賦值情況是:完全不同意為1,有點(diǎn)不同意為2,說不清為3,基本同意為4,完全同意為5。項(xiàng)目分析的目的是為了對項(xiàng)目進(jìn)行篩選和修訂,項(xiàng)目的選擇采用雙重標(biāo)準(zhǔn),首先計(jì)算項(xiàng)目鑒別系數(shù),然后計(jì)算單項(xiàng)與總分的相關(guān)系數(shù)。項(xiàng)目鑒別度的計(jì)算公式為:項(xiàng)目鑒別指數(shù)=(RH-RL)/N在此公式中,RH表示高分組在每個(gè)項(xiàng)目上的平均

12、得分(高分組之和除以N),RL表示低分組在每個(gè)項(xiàng)目上的平均得分(低分組之和除以N),N表示抽出的項(xiàng)目數(shù)。從數(shù)據(jù)分析結(jié)果看,有2項(xiàng)的鑒別指數(shù)達(dá)不到0.25(第21題和第26題),首先刪除;再進(jìn)行單項(xiàng)與總分的相關(guān)系數(shù)計(jì)算(本量表采用Pearson相關(guān)系數(shù)),結(jié)果顯示有一項(xiàng)(第25題)相關(guān)系數(shù)達(dá)不到顯著性程度(P0.05),最后保留8項(xiàng)。 2、因子特征值及百分比ComponerInitial EigenvaluesCraction Sums ofSquared LoadingsRotation Sums ofSquared LoadingsTotal% of VarianceCumula-tive

13、%Total% of VarianceCumula-tive %Total% of VarianceCumula-tive %12.55231.90031.9002.55231.90031.9002.23827.97227.97221.27515.93347.8331.27515.93347.8331.51318.91446.88631.07213.40261.2351.07213.40261.2351.14814.34961.23540.81110.13971.374-50.6838.53679.911-60.6428.02487.935-70.5486.85694.791-80.4175.

14、209100.90-3、旋轉(zhuǎn)與解釋將因子負(fù)荷矩陣進(jìn)行正交旋轉(zhuǎn)(Component Matrix),通過改變坐標(biāo)軸位置,重新分配各因子所解釋方差的比例,使因子結(jié)構(gòu)更簡單,更易于解釋。 題號及因子名題項(xiàng)因子1(身份區(qū)隔感):C5若條件允許,我也想跟其他同學(xué)一樣買昂貴的信息產(chǎn)品C6我們青年人在購買產(chǎn)品時(shí)總是首先考慮它的時(shí)尚元素C7有錢人有有錢人的玩法,窮人有窮人的玩法(例如,有錢人旅游或度假,窮人看電視或打牌)因子2(身份符合感):C1花錢消費(fèi)應(yīng)當(dāng)與大學(xué)生的身份相符合C2人的生活和消費(fèi)要有自己的特點(diǎn)C8我買這個(gè)產(chǎn)品是因?yàn)橹車娜硕加靡蜃?(身份緊張感):C3我喜歡模仿周圍朋友的消費(fèi)方式,買和他們一樣

15、的東西C4我會(huì)因?yàn)椴荒軗碛泻推渌瑢W(xué)一樣的品牌或高檔信息技術(shù)產(chǎn)品而心情不愉快第一個(gè)因子命名為身份區(qū)隔感,主要強(qiáng)調(diào)個(gè)體在休閑消費(fèi)方式中對于群體差異的感受性。第二個(gè)因子命名為身份符合感,主要是通過消費(fèi)方式來融入群體形象的心理感受性,它追求的不是個(gè)體所屬感,而是集體所屬感。第三個(gè)因子命名為身份緊張感,身份緊張感是一種擔(dān)心自己比不上他人或者自己的身份和地位得不到群體的承認(rèn),而試圖通過炫耀性消費(fèi)或攀比性消費(fèi)方式,從而在心理上獲得一種群體隸屬來消除內(nèi)部的身份緊張感。 4、從因子分析結(jié)果出發(fā)形成的路徑分析圖身份區(qū)隔感品牌考慮廣告興趣外觀設(shè)計(jì)流行時(shí)尚身份符合感身份緊張感w0.818uv0.2790.4330.

16、2810.120=0.516=0.5020.3970.3100.2140.7460.7550.860結(jié)果表明,身份區(qū)隔感對大多數(shù)消費(fèi)符號存在影響,而且是直接性的,它對品牌、廣告以及時(shí)尚的作用強(qiáng)度分別達(dá)到0.310、0.397和0.279,這說明大學(xué)生在進(jìn)行電子產(chǎn)品消費(fèi)時(shí)受到所在群體的影響,他們消費(fèi)的欲望更多的來源于符號價(jià)值的需求而不是使用價(jià)值的需要。一件商品,越是能體現(xiàn)消費(fèi)者的社會(huì)品味和身份,越是能將消費(fèi)者與他人區(qū)分開來,就越是受到大學(xué)生們的喜愛。身份符合感和身份區(qū)隔感存在相關(guān),達(dá)到0.502,身份符合感與廣告興趣和外觀設(shè)計(jì)兩者的相關(guān)系數(shù)分別為0.433和0.281,通過廣告的宣傳渲染、外觀設(shè)計(jì)的強(qiáng)化的推動(dòng),這種對于融入群體的身份符合感也就越強(qiáng),因此,在身份符合方面,大學(xué)生們更多的把目光轉(zhuǎn)向了外觀設(shè)計(jì)和流行時(shí)尚。在身份緊張感方面,由于身份緊張感在某種程度上可以看作是身份區(qū)隔感和身份緊張感的縮影,因此相關(guān)系數(shù)僅為0.120和0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論