




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、市場研究 2005 在社會經(jīng)濟(jì)統(tǒng)計(jì)綜合評價(jià)中主成分分析和因子分析 是兩個(gè)常被使用的統(tǒng)計(jì)分析方法 。 現(xiàn)在 SPSS 、 SAS 等統(tǒng)計(jì) 軟件使用越來越普遍 , 但 SPSS 并未像 SAS 一樣 , 將 主 成 分分析與因子分析作為兩個(gè)獨(dú)立的方法并列處理 注 :主 成分分析與因子分析二者是又有著區(qū)別與聯(lián)系 , 最主要 的不同在于它們的數(shù)學(xué)模型的構(gòu)建上 , 具體區(qū)別請見參 考文獻(xiàn) 2, 而是根 據(jù) 二 者 之 間 的 關(guān) 系 有 機(jī) 地 將 主 成 分 分 析嵌入到因子分析之中 , 這樣雖然簡化了分析程序 , 卻為 主成分分析的計(jì)算帶來不便 。 且國內(nèi)許多 SPSS 教程并沒 有詳細(xì)講解如何應(yīng)用
2、 SPSS 進(jìn)行主成分分析 , 那到底如何 使用 SPSS 進(jìn) 行 主 成 分 分 析 呢 ? 為 使 讀 者 能 夠 正 確 使 用SPSS 軟件進(jìn)行主成分分析 , 本文將通過一個(gè)實(shí)例來詳細(xì)介紹如何用 SPSS 進(jìn)行主成分分析 。 接下來先簡單介紹主 成分分析原理與模型 , 以便讀者對主成分分析有個(gè)大致 的了解 。(一 主成分分析原理主成分分析是設(shè)法將原來眾多具有一定相關(guān)性 (比 如 P 個(gè)指標(biāo) , 重新組合成一組新的互相無關(guān)的綜合指標(biāo) 來代替原來的指標(biāo) 。 通常數(shù)學(xué)上的處理就是將原來 P 個(gè) 指標(biāo)作線性組合 , 作為新的綜合指標(biāo) 。 最經(jīng)典的做法就是 用 F 1(選取的第一個(gè)線性組合 ,
3、即 第 一 個(gè) 綜 合 指 標(biāo) 的 方 差來表達(dá) , 即 Var(F 1 越大 , 表示 F 1包含的信息越多 。 因此在所有的線性組合中選取的 F 1應(yīng)該是方差最大的 , 故稱F 1為第一主成分 。 如果第一主成分不足以代表原來 P 個(gè)指標(biāo)的信息 , 再考慮選取 F 2即選第二個(gè)線性組合 , 為了有 效地反映原來信息 , F 1已 有 的 信 息 就 不 需 要 再 出 現(xiàn) 在 F 2中 , 用數(shù)學(xué)語言表達(dá)就是要求 Cov(F 1, F 2=0, 則稱 F 2為第 二主成分 , 依此類推可以構(gòu)造出第三 、 第四 , , 第 P 個(gè) 主成分 。(二 主成分分析數(shù)學(xué)模型F 1=a 11ZX 1+
4、a 21ZX 2+ +a p1ZX p F 2=a 12ZX 1+a 22ZX 2 +a p2ZX pF p =a 1m ZX 1+a 2m ZX 2+ +a pm ZX p其 中 a 1i , a 2i , ,a pi (i=1, ,m 為 X 的 協(xié) 方 差 陣 的特征值多對應(yīng)的特征向量 , ZX 1, ZX 2, , ZX p 是原始 變量經(jīng)過標(biāo)準(zhǔn)化處理的值 , 因?yàn)樵趯?shí)際應(yīng)用中 , 往往存在 指標(biāo)的量綱不同 , 所以在計(jì)算之前須先消除量綱的影響 , 而將原始數(shù)據(jù)標(biāo)準(zhǔn)化 , 本文所采用的數(shù)據(jù)就存在量綱影 響 注 :本文指的數(shù)據(jù)標(biāo)準(zhǔn)化是指 Z 標(biāo)準(zhǔn)化 。A=(a ij p m =(a 1,
5、a 2, a m , , Ra i =i a i , R 為相關(guān)系數(shù)矩陣 , i 、a i 是相應(yīng)的特征值和單位特征向量 , 12 p 0。進(jìn)行主成分分析主要步驟如下 :1. 根據(jù)研究問題選取指標(biāo)與數(shù)據(jù) ;2. 進(jìn) 行 指 標(biāo) 數(shù) 據(jù) 標(biāo) 準(zhǔn) 化 (SPSS 軟 件 Factor 過 程 自 動(dòng)執(zhí)行 ;3. 進(jìn)行指標(biāo)之間的相關(guān)性判定 ; 4. 確定主成分個(gè)數(shù) m ; 5. 確定主成分 F i 表達(dá)式 ; 6. 進(jìn)行主成分 F i 命名 ;主成分分析在 SPSS 中的操作應(yīng)用#慧聰國際行業(yè)研究院廣州分公司張文霖理論與方法一 、 引言二 、 主成分分析原理和模型 1#$200512 7. 計(jì)算綜合
6、主成分值并進(jìn)行評價(jià)與研究 。 (一 指標(biāo)選取原則本 文 所 選 取 的 數(shù) 據(jù) 來 自 中 國 統(tǒng) 計(jì) 年 鑒 2003 中2002年的統(tǒng)計(jì)數(shù)據(jù) , 在沿海 10個(gè)省市經(jīng)濟(jì)狀況主要指標(biāo)體系中選取了 10個(gè)指標(biāo) :X 1 GDP X 2 人均 GDP X 3 農(nóng)業(yè)增加值 X 4 工業(yè)增加值 X 5 第三產(chǎn)業(yè)增加值 X 6 固定資產(chǎn)投資 X 7 基本建設(shè)投資 X 8 國內(nèi)生產(chǎn)總值占全國比重 (% X 9 海關(guān)出口總額 X 10 地方財(cái)政收入 (二 主成分分析在 SPSS 中的具體操作步驟運(yùn) 用 SPSS 統(tǒng) 計(jì) 分 析 軟 件 Factor 過 程 2對 沿 海 10個(gè) 省市經(jīng)濟(jì)綜合指標(biāo)進(jìn)行主成分
7、分析 。 具體操作步驟如下 :1.Analyze Data Reduction Factor Analysis , 彈 出 Factor Analysis 對話框2. 把 X 1X 10選入 Variables 框3.Descriptives:Correlation Matrix 框 組 中 選 中 Coeffi-cients , 然后點(diǎn)擊 Continue , 返回 Factor Analysis 對話框4. 點(diǎn)擊“ OK ” 地方財(cái) 政收入第三產(chǎn)業(yè) 增加值表 1沿海 10個(gè)省市經(jīng)濟(jì)數(shù)據(jù)遼寧 山東 河北 天津 江蘇 上海 浙江 福建 廣東 廣西地區(qū) GDP 人均 GDP農(nóng)業(yè)增加值 工業(yè)增加值
8、固定資 產(chǎn)投資基本建 設(shè)投資社會消費(fèi)品 零售總額海關(guān)出 口總額表 2Factor Analyze 對話框與 Descriptives 子對話框理 論 與 方 法三 、 對沿海 10個(gè)省市經(jīng)濟(jì)綜合指標(biāo)進(jìn) 行主成分分析市場研究 2005 SPSS 在調(diào)用 Factor Analyze 過 程 進(jìn) 行 分 析 時(shí) , SPSS 會自動(dòng)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理 , 所以在得到計(jì)算結(jié)果 后的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量 , 但 SPSS 并不直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù) , 如需要得到標(biāo)準(zhǔn)化數(shù)據(jù) , 則需 調(diào)用 Descriptives 過程進(jìn)行計(jì)算 。從表 3可知 GDP 與工業(yè)增加值 , 第三產(chǎn)業(yè)增加
9、值 、 固定資產(chǎn)投資 、 基本建 設(shè) 投 資 、 社 會 消 費(fèi) 品 零 售 總 額 、 地 方財(cái)政收入這幾個(gè)指標(biāo)存在著極其顯著的關(guān)系 , 與海關(guān) 出口總額存在著顯著關(guān)系 。 可見許多變量之間直接的相 關(guān)性比較強(qiáng) , 證明他們存在信息上的重疊 。主成分個(gè)數(shù)提取原則為主成分對應(yīng)的特征值大 于 1的前 m 個(gè)主成分 。 特征值在某種程度上可以被看成是表 示主成分影響力度大小的指標(biāo) , 如果特征值小于 1, 說明 該主成分的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大 , 因此一般可以用特征值大于 1作為納入標(biāo) 準(zhǔn) 。 通過表 4(方差分解主成分提取分析 可知 , 提取 2個(gè) 主成分 , 即 m
10、=2, 從表 5(初始因子載荷矩陣 可知 GDP 、 工 業(yè)增加值 、 第三產(chǎn) 業(yè) 增 加 值 、 固 定 資 產(chǎn) 投 資 、 基 本 建 設(shè) 投 資 、 社會消費(fèi)品零 售 總 額 、 海 關(guān) 出 口 總 額 、 地 方 財(cái) 政 收 入 在第一主成分上有較高載荷 , 說明第一主成分基本反映 了這些指標(biāo)的信息 ; 人均 GDP 和農(nóng)業(yè)增加值指標(biāo)在第二 主成分上有較高載荷 , 說明第二主成分基本反映了人均GDP 和農(nóng)業(yè)增加值兩個(gè)指標(biāo)的信息 。 所以提取兩個(gè)主成表 3相關(guān)系數(shù)矩陣GDP人均 GDP 農(nóng)業(yè)增加值 工業(yè)增加值 第三產(chǎn)業(yè)增加值 固定資產(chǎn)投資 基本建設(shè)投資 社會消費(fèi)品零售總額 海關(guān)出口總額
11、地方財(cái)政收入地方 財(cái)政 收入第三 產(chǎn)業(yè) 增加值GDP農(nóng)業(yè)增加值 工業(yè)增加值固定 資產(chǎn) 投資基本 建設(shè) 投資社會消 費(fèi)品零 售總額海關(guān) 出口 總額人均GDP 表 4方差分解主成分提取分析表Component Total %of Variance Cumulative %Total %of Variance Cumulative %Initial EigenvaluesExtraction Sums of Squared Loadings Extraction Method:Principal Component Analysis.GDP人均 GDP農(nóng)業(yè)增加值 工業(yè)增加值 第三產(chǎn)業(yè)增加值 固定資產(chǎn)
12、投資 基本建設(shè)投資 社會消費(fèi)品零售總額 海關(guān)出口總額 地方財(cái)政收入Extraction Method:Principal Component Analysis.a. 2components extracted.Component 12表 5初始因子載荷矩陣Correlation MatrixTotal Variance Explained 理論與方法Component Matrix a! 200512參考文獻(xiàn)1于秀林 , 任雪松 . 多元統(tǒng)計(jì)分析 M. 北京 :中國統(tǒng)計(jì)出版社 , 1999.8. P154.2林海明 , 張文霖 . 主成分分析與因 子分析詳細(xì)的異同和 SPSS 軟件 J. 統(tǒng)
13、計(jì)研究 2005(3 .表 6Compute Variable 對話框分是可以基本反映全部指標(biāo)的信息 , 所以決定用兩個(gè)新 變量來代替原來的十個(gè)變量 。 但這兩個(gè)新變量的表達(dá)還 不能從輸出窗口中 直 接 得 到 , 因 為 “ Component Matrix ” 是 指初始因子載荷矩陣 , 每一個(gè)載荷量表示主成分與對應(yīng) 變量的相關(guān)系數(shù) 。用表 5(主成分載荷矩陣 中的數(shù)據(jù)除以主成分相對 應(yīng)的特征值開平方根便得到兩個(gè)主成分中每個(gè)指標(biāo)所對 應(yīng)的系數(shù) 2。 將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入 (可 用復(fù)制粘貼的方法 到數(shù)據(jù)編輯窗口 (為變量 B1、 B 2 , 然后 利 用 “ Transform
14、 Compute Variable ” , 在 Compute Variable 對 話 框 中 輸 入 “ A1=B1/SQR(7.22 ” 注 :第 二 主 成 分 SQR 后的括號中填 1.235, 即可得到特征向量 A1(見表 6 。 同 理 , 可得到特征向量 A2。 將得到的特征向量與標(biāo)準(zhǔn)化后的 數(shù)據(jù)相乘 , 然后就可以得出主成分表達(dá)式 注 :因本例只是 為了說明如何在 SPSS 進(jìn)行主成分分析 , 故在此不對提取 的主成分進(jìn)行命名 , 有興趣的讀者可自行命名 :F 1=0.353ZX 1+0.042ZX 2-0.041ZX 3+0.364ZX 4+ 0.367ZX 5+0.366
15、ZX 6+0.352ZX 7+0.364ZX 8+0.298ZX 9+ 0.355ZX 10F 2=0.175ZX 1-0.741ZX 2+0.609ZX 3-0.004ZX 4+ 0.063ZX 5-0.061ZX 6-0.022ZX 7+0.158ZX 8-0.046ZX 9-0.115ZX 10前文提到 SPSS 會自動(dòng)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化 , 但不會直 接給出 , 需要我們自己另外算 , 我們可以通過 Analyze Descriptive Statistics Descriptives 對 話 框 來 實(shí) 現(xiàn) :彈 出 Descriptives 對 話 框 后 , 把 X 1X 10選
16、入 Variables 框 , 在 Save standardized values as variables 前 的 方 框 打 上 鉤 , 點(diǎn) 擊 “ OK ” , 經(jīng)標(biāo)準(zhǔn)化的數(shù)據(jù)會自動(dòng)填入數(shù)據(jù)窗口中 , 并以 Z 開頭命名 。以每個(gè)主成分所對應(yīng)的特征值占所提取主成分總的 特征值之和的比例作為權(quán)重計(jì)算主成分綜合模型 :即可得到主成分綜合模型 :F=0.327ZX 1-0.072ZX 2+0.054ZX 3+0.310ZX 4+0.323ZX 5+ 0.304ZX 6+0.297ZX 7+0.334ZX 8+0.248ZX 9+0.286ZX 10根據(jù)主成分綜合模型即可計(jì)算綜合主成分值 , 并對其 按綜合主成分值進(jìn)行排序 , 即可對各地區(qū)進(jìn)行綜合評價(jià) 比較 , 結(jié)果見表 8。對得出的綜合主成 分 (評 價(jià) 值 , 我 們 可 用 實(shí) 際 結(jié) 果 、 經(jīng)驗(yàn)與原始數(shù)據(jù)做聚類分析進(jìn)行檢驗(yàn) , 對有爭議的結(jié)果 , 可用原始數(shù)據(jù)做判別分析解決爭議 , 具體評價(jià)與檢驗(yàn)本 文不做論述 , 如讀者有興趣可自行進(jìn)行檢驗(yàn)論述 。本 文 旨 在 闡 述 如 何 利 用 SPSS 軟 件 進(jìn) 行 正 確 的 主 成 分分析 , 使 讀 者 能 正 確 使 用 SPSS 進(jìn) 行 主 成 分 分 析 ,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中式面點(diǎn)考試題及答案
- 市政供水排水管網(wǎng)功能提升項(xiàng)目可行性研究報(bào)告
- 英語三級試題及答案
- 土方基坑開挖施工方案
- 跨境電商品控年終總結(jié)
- 揭短會安全教育
- 2025至2031年中國鉑熱電阻采集模塊行業(yè)投資前景及策略咨詢研究報(bào)告
- 項(xiàng)目策略管理協(xié)議書(2篇)
- 《跨境電商》課件-銷售規(guī)則
- 2025至2031年中國交流馬達(dá)運(yùn)轉(zhuǎn)電容器行業(yè)投資前景及策略咨詢研究報(bào)告
- 污水處理廠改造拆除工程施工方案
- 小米公司招聘測試題目
- 人教版二年級數(shù)學(xué)下冊 3 圖形的運(yùn)動(dòng)(一)1.軸對稱圖形(教學(xué)課件)
- 心肌梗死的臨床護(hù)理
- 中國居民膳食指南(全)
- 多發(fā)性肌炎的基本知識
- 血細(xì)胞分析報(bào)告規(guī)范化指南解讀
- 橋梁與地下工程上崗資格考試題庫(濃縮500題)
- 《大學(xué)物理學(xué)》精美課件(全)
- 政府投資項(xiàng)目立項(xiàng)申請表-正面
- me實(shí)驗(yàn)2 電位、電壓的測定及電路電位圖的繪制
評論
0/150
提交評論