版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
關(guān)于因子分析在CSI項(xiàng)目中的應(yīng)用第一頁,共三十一頁,2022年,8月28日因子分析的定義
在社會、政治、經(jīng)濟(jì)和醫(yī)學(xué)等領(lǐng)域的研究中往往需要對反映事物的多個(gè)變量進(jìn)行大量的觀察,收集大量的數(shù)據(jù)以便進(jìn)行分析,尋找規(guī)律。在大多數(shù)情況下,許多變量之間存在一定的相關(guān)關(guān)系。因此,有可能用較少的綜合指標(biāo)分析存在于各變量中的各類信息,而各綜合指標(biāo)之間彼此是不相關(guān)的,代表各類信息的綜合指標(biāo)稱為因子。因子分析就是用少數(shù)幾個(gè)因子來描述許多指標(biāo)或因素之間的聯(lián)系,以較少幾個(gè)因子反映原資料的大部分信息的統(tǒng)計(jì)學(xué)方法。對高維變量空間進(jìn)行降維處理。第二頁,共三十一頁,2022年,8月28日
(1)因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量,對因子變量的分析能夠減少分析中的計(jì)算工作量。(2)因子變量不是對原有變量的取舍,而是根據(jù)原始變量的信息進(jìn)行重新組構(gòu),它能夠反映原有變量大部分的信息。
(3)因子變量之間不存在線性相關(guān)關(guān)系,對變量的分析比較方便。(4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。因子分析的特點(diǎn)第三頁,共三十一頁,2022年,8月28日
因子分析有兩個(gè)核心問題:一是如何構(gòu)造因子變量;二是如何對因子變量進(jìn)行命名解釋。因子分析有下面4個(gè)基本步驟。(1)確定待分析的原有若干變量是否適合于因子分析。(2)構(gòu)造因子變量。(3)利用旋轉(zhuǎn)使得因子變量更具有可解釋性。(4)確定因子權(quán)重。因子分析的4個(gè)基本步驟第四頁,共三十一頁,2022年,8月28日
因子分析是從眾多的原始變量中構(gòu)造出少數(shù)幾個(gè)具有代表意義的因子變量,這里面有一個(gè)潛在的要求,即原有變量之間要具有比較強(qiáng)的相關(guān)性。如果原有變量之間不存在較強(qiáng)的相關(guān)關(guān)系,那么就無法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量來。因此,在因子分析時(shí),需要對原有變量作相關(guān)分析。第一步:確定待分析變量是否適合于因子分析
第五頁,共三十一頁,2022年,8月28日
如果相關(guān)系數(shù)矩陣在進(jìn)行統(tǒng)計(jì)檢驗(yàn)中,大部分相關(guān)系數(shù)都小于0.3,并且未通過統(tǒng)計(jì)檢驗(yàn),那么這些變量就不適合于進(jìn)行因子分析。(1)相關(guān)系數(shù)
r的取值在-1和+1之間。
r>0,正相關(guān);r<0,負(fù)相關(guān);r=0,不相關(guān)。
|r|>0.8,相關(guān)關(guān)系較強(qiáng);|r|<0.3,相關(guān)關(guān)系較弱。(2)統(tǒng)計(jì)假設(shè)檢驗(yàn)即顯著性檢驗(yàn)顯著性差異就是實(shí)際樣本統(tǒng)計(jì)量的取值和假設(shè)的總體參數(shù)的差異超過了通常的偶然因素的作用范圍,說明還有系統(tǒng)性的因素發(fā)生作用,因而就可以否定某種條件不起作用的假設(shè)。如果從相關(guān)系數(shù)r=0的總體中取得某r值的概率P>0.05,我們就接受假設(shè),認(rèn)為此r值的很可能是從此總體中取得的。因此判斷兩變量間無顯著關(guān)系;如果取得r值的概率P≤0.05或P≤0.01,我們就在α=0.05或α=0.01水準(zhǔn)上拒絕檢驗(yàn)假設(shè),認(rèn)為該r值不是來自ρ=0的總體,而是來自ρ≠0的另一個(gè)總體,因此就判斷兩變量間有顯著關(guān)系。
SPSS將自動計(jì)算簡單相關(guān)系數(shù)、t檢驗(yàn)統(tǒng)計(jì)量得觀測值和對應(yīng)的概率P值方法一:簡單相關(guān)系數(shù)第六頁,共三十一頁,2022年,8月28日1.巴特利特球形檢驗(yàn)(BartlettTestofSphericity)如果統(tǒng)計(jì)量的觀測值比較大,且對應(yīng)的P值小于給定的顯著性水平r,則相關(guān)系數(shù)矩陣原有變量存在相關(guān)性,適合因子分析;
2.KMO(Kaiser-Meyer-Olkin)檢驗(yàn)KMO統(tǒng)計(jì)量的取值范圍為0—1,KMO大于等于0.9,非常適合,0.8適合,0.7一般,0.6不太適合,0.5以下,極不適合。方法二:KMO和巴特利球形檢驗(yàn)統(tǒng)計(jì)值的觀測值對應(yīng)的概率PKMO統(tǒng)計(jì)量第七頁,共三十一頁,2022年,8月28日
因子分析中有多種確定因子變量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主軸因子法、極大似然法、最小二乘法等。其中基于主成分模型的主成分分析法是使用最多的因子分析方法之一。第二步:構(gòu)造因子變量第八頁,共三十一頁,2022年,8月28日第三步:決定旋轉(zhuǎn)方法
在因子提取時(shí)通常提取初始因子后,對因子無法做有效的解釋,(因子Fi不能典型代表任何一個(gè)原有變量Xi)為了更好的解釋因子,可通過因子旋轉(zhuǎn)的方式使一個(gè)變量只在盡可能少的因子上有比較高的載荷(Aij)。因子旋轉(zhuǎn)方式有兩種:正交旋轉(zhuǎn)和斜交選擇。為能繼續(xù)保持新生成的因子的不相關(guān)性,一般選擇正旋轉(zhuǎn)。
方差最大法、四次方最大法、等量最大法第九頁,共三十一頁,2022年,8月28日第四步:確定因子權(quán)重
每個(gè)公共因子對原始數(shù)據(jù)的解釋能力,稱為該因子的貢獻(xiàn)率,常用該因子所解釋的總方差來衡量,它等于和該因子有關(guān)的因子負(fù)荷的平方和,實(shí)際中常用相對指標(biāo)來表示,相對指標(biāo)體現(xiàn)公共因子的相對重要性,即每個(gè)公共因子所解釋的方差占所有變量總方差的比例。第十頁,共三十一頁,2022年,8月28日因子分析的定義和數(shù)學(xué)模型9.1SPSS中實(shí)現(xiàn)過程9.2SPSS結(jié)果解釋9.2目錄第十一頁,共三十一頁,2022年,8月28日
實(shí)現(xiàn)步驟選擇命令:Analyze->DataReducation->Factor圖1在菜單中選擇“Factor”命令打開命令窗口第十二頁,共三十一頁,2022年,8月28日
圖2“FactorAnalysis”對話框
實(shí)現(xiàn)步驟:把參與因子分析的變量選到Variable框中選擇參與因子分析的樣本,把作為條件變量的變量指定到該處,只有滿足條件的樣本數(shù)據(jù)才能參與因子分析選擇參與因子分析的變量第十三頁,共三十一頁,2022年,8月28日
圖3“FactorAnalysis:Descriptives”對話框
實(shí)現(xiàn)步驟:在圖2窗口中單擊Descriptives(輸出結(jié)果)按鈕打開如下對話框1.指定輸出哪些基本統(tǒng)計(jì)量(1).各個(gè)變量的基本描述統(tǒng)計(jì)量(均值、標(biāo)準(zhǔn)差、樣本量)(2).初始因子分析結(jié)果(因子提取前分析變量的公因子方差)2.檢驗(yàn)變量是否適合因子分析,列舉了三種常用方法確定待分析的原有若干變量是否適合于因子分析第十四頁,共三十一頁,2022年,8月28日圖4“FactorAnalysis:Extraction”對話框
實(shí)現(xiàn)步驟:在圖2窗口中單擊Extraction
按鈕打開如下對話框因子提取選擇項(xiàng)1.因子提取方法選擇項(xiàng)2.因子提取的依據(jù)Correlationmatrix相關(guān)系數(shù)矩陣Covariancematrix協(xié)方差陣3.輸出與因子提取有關(guān)的信息Unratotedfactorsolution輸出未旋轉(zhuǎn)的因子載荷矩陣Screeplot輸出因子的碎石圖4.選擇如何確定因子數(shù)目Eigenvaluseover大于該值得特征根Numberoffactors提取因子的數(shù)目第十五頁,共三十一頁,2022年,8月28日
圖5“FactorAnalysis:Rotation”對話框因子旋轉(zhuǎn)方法的選擇
實(shí)現(xiàn)步驟:在圖2窗口中單擊Rotation按鈕打開如下對話框1.選擇因子旋轉(zhuǎn)方法None不旋轉(zhuǎn)Varimax方差最大法Quartimax四次方最大法Exqumax等量最大法其他為斜交旋轉(zhuǎn)法2.指定輸出與因子旋轉(zhuǎn)相關(guān)的信息Rotatedsolution表示輸出旋轉(zhuǎn)后的因子載荷矩陣Loadingplot(s)表示輸出旋轉(zhuǎn)后的因子載荷散點(diǎn)圖第十六頁,共三十一頁,2022年,8月28日圖6“FactorAnalysis:FacforScores”對話框計(jì)算因子得分的方法
實(shí)現(xiàn)步驟:在圖2窗口中單擊Scores按鈕打開如下對話框1.表示將因子得分保存到spss變量中,生成幾個(gè)因子便產(chǎn)生幾個(gè)spss變量。在Method中指定計(jì)算因子得分的方法Regression為回歸法,系統(tǒng)默認(rèn)2.輸出因子得分系數(shù)矩陣第十七頁,共三十一頁,2022年,8月28日圖7“FactorAnalysis:Options”對話框缺失值的處理方式及因子載荷矩陣的輸出方法2.指定因子載荷矩陣的輸出方式Sortedbysize表示以第一因子得分的降序輸出因子載荷矩陣Suppressabsolutevalueslessthan輸入一個(gè)數(shù)值,表示只輸出大于該值的因子載荷第十八頁,共三十一頁,2022年,8月28日因子分析的定義和數(shù)學(xué)模型9.1SPSS中實(shí)現(xiàn)過程9.2SPSS結(jié)果解釋9.2目錄第十九頁,共三十一頁,2022年,8月28日結(jié)果1:原有變量的相關(guān)系數(shù)矩陣結(jié)果2:巴特利特球檢驗(yàn)和KMO檢驗(yàn)結(jié)果3:因子分析的初始解結(jié)果4:因子解釋原有變量方差的情況結(jié)果5:因子碎石圖結(jié)果6:因子載荷矩陣結(jié)果7:旋轉(zhuǎn)后的因子載荷矩陣輸出結(jié)果列表按照第二部分的操作命令,得到如上7個(gè)結(jié)果,下面將分別對7個(gè)結(jié)果進(jìn)行解讀第二十頁,共三十一頁,2022年,8月28日案例分析:影響網(wǎng)點(diǎn)業(yè)務(wù)發(fā)展的因素對影響網(wǎng)點(diǎn)業(yè)務(wù)發(fā)展的24個(gè)指標(biāo)進(jìn)行因子分析,樣本來源:243個(gè)網(wǎng)點(diǎn)評價(jià)第二十一頁,共三十一頁,2022年,8月28日考察原有變量是否適合進(jìn)行因子分析(1)具體操作如圖2和圖3:借助于相關(guān)系數(shù)矩陣、巴特利特球狀檢驗(yàn)和KMO檢驗(yàn)大部分的相關(guān)系數(shù)值大于0.3大部分的檢驗(yàn)值小于0.05(結(jié)果1:原有變量的相關(guān)系數(shù)矩陣)第二十二頁,共三十一頁,2022年,8月28日結(jié)果2:巴特利特球檢驗(yàn)和KMO檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)值的觀察值較大概率P小于0.05假設(shè)檢驗(yàn)顯著性水平KMO大于0.8考察原有變量是否適合進(jìn)行因子分析(2)由此得出原有變量適合進(jìn)行因子分析第二十三頁,共三十一頁,2022年,8月28日結(jié)果3:因子分析的初始解(一)按照圖4操作,得到因子分析的初始解如右表所示,Initial列表示如果對原有24個(gè)變量提取所有特征根,原有變量的所有方差都可被解釋,變量的共同方差均為1,第二列表示采用主成分分析法提取因子并選取特征根值大于1的特征根,可以看到大部分的變量有60%左右的信息可被因子解釋,網(wǎng)點(diǎn)周邊資源變量的信息丟失較為嚴(yán)重(接近60%)因此,本次因子提取的總體效果并不理想,該結(jié)果未達(dá)到因子分析的目標(biāo)(降維)重新制定提取特征根的標(biāo)準(zhǔn),指定提取8個(gè)因子(Numberoffactors處輸入8),分析結(jié)果如下表:第二十四頁,共三十一頁,2022年,8月28日結(jié)果3:因子分析的初始解(二)重新制定提取特征根的標(biāo)準(zhǔn),在圖4中指定提取8個(gè)因子(Numberoffactors處輸入8),分析結(jié)果右表:由表可知,此時(shí)24個(gè)變量的共同方差均較高,各個(gè)變量的信息丟失都較少,因此本次因子提取的總體效果較理想。第二十五頁,共三十一頁,2022年,8月28日結(jié)果4:因子解釋原有變量方差的情況第一列為因子編號,以后三列組成一組,每組中數(shù)據(jù)項(xiàng)的含義依次是特種根值、方差貢獻(xiàn)率、累計(jì)方差貢獻(xiàn)率初始因子解的情況因子解的情況最終因子解的情況(因子旋轉(zhuǎn)后所得)因子旋轉(zhuǎn)后,累計(jì)方差比沒有改變(76.174),重新分配了各個(gè)因子解釋原有變量的方差,改變了各因子方差貢獻(xiàn),使得因子更容易理解。(比如:第一個(gè)因子旋轉(zhuǎn)前后對總方差的解釋度由42.031變?yōu)?5.602)按照圖5操作,按照方差最大法旋轉(zhuǎn)第二十六頁,共三十一頁,2022年,8月28日結(jié)果5:因子碎石圖右圖中,橫坐標(biāo)為因子數(shù)目,縱坐標(biāo)為特征值。由圖可見,第一個(gè)因子的特征值很高,對解釋原有變量的貢獻(xiàn)最大,第8個(gè)以后的因子特征值都較小,對解釋原有變量的貢獻(xiàn)很小,已經(jīng)成為可被忽略的碎石,因此提取8個(gè)因子是適合的。第二十七頁,共三十一頁,2022年,8月28日結(jié)果6:因子載荷矩陣從表中可以看到,變量在第1個(gè)因子上的負(fù)荷都很高,意味著它們與第1個(gè)因子的相關(guān)程度高,其余因子與變量的相關(guān)性相對較小,另外可以看到,這8個(gè)因子的實(shí)際含義比較模糊,所以采用了方差最大法對因子載荷矩陣進(jìn)行旋轉(zhuǎn),得到結(jié)果7,如下頁所示:第二十八頁,共三十一頁,2022年,8月28日結(jié)果7:旋轉(zhuǎn)后的因子載荷矩陣分別將在每個(gè)因子上的載荷較高的變量歸為一起。因?yàn)檩敵鰰r(shí)使用了以第一因子得分的降序輸出因子載荷矩陣,所以前6個(gè)變量為第一個(gè)因子的變量,依次類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度建筑分公司承包經(jīng)營合作協(xié)議細(xì)則3篇
- 二零二五年度個(gè)體工商戶合伙經(jīng)營借款合同2篇
- 解讀《紅樓夢》模板
- 寒假最后一課安全教育
- 二零二五年CFG樁施工合同履約績效評價(jià)合同協(xié)議2篇
- 2025年度版權(quán)許可協(xié)議針對影視作品播放權(quán)
- 種植之路模板
- 2025年度消防安全設(shè)施改造與責(zé)任合同2篇
- 二零二五年度商業(yè)辦公空間按季度租金及配套設(shè)施租賃合同3篇
- 2023-2024學(xué)年仁愛版七上期末考試英語(試題)
- 無人機(jī)表演服務(wù)合同
- 2024年醫(yī)院培訓(xùn)計(jì)劃
- 呼吸內(nèi)科臨床診療指南及操作規(guī)范
- 學(xué)生管理教育課件
- 物業(yè)經(jīng)理轉(zhuǎn)正述職
- 貿(mào)易崗位招聘面試題及回答建議(某大型國企)2025年
- 世界職業(yè)院校技能大賽高職組“關(guān)務(wù)實(shí)務(wù)組”賽項(xiàng)參考試題及答案
- 高中歷史教師資格考試面試試題及解答參考(2024年)
- 銀行貸款房產(chǎn)抵押合同樣本
- 北師大版(2024新版)生物七年級上冊期末考點(diǎn)復(fù)習(xí)提綱
評論
0/150
提交評論