版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第部分多元統(tǒng)計(jì)分析的實(shí)現(xiàn)詳解演示文稿目前一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)優(yōu)選第部分多元統(tǒng)計(jì)分析的實(shí)現(xiàn)目前二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表4.1各地區(qū)死亡概率表目前三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) (一)操作步驟
1.在SPSS窗口中選擇Analyze→Classify→Discriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將—變量選入自變量中,并選擇Enterindependentstogether單選按鈕,即使用所有自變量進(jìn)行判別分析。圖4.2判別分析主界面目前四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.點(diǎn)擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。
3.單擊Statistics…按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher’s和Unstandardized。這兩個(gè)選項(xiàng)的含義如下:Fisher’s:給出Bayes判別函數(shù)的系數(shù)。(注意:這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這個(gè)復(fù)選框的名字之所以為Fisher’s,是因?yàn)榘磁袆e函數(shù)值最大的一組進(jìn)行歸類這種思想是由Fisher提出來(lái)的。這里極易混淆,請(qǐng)讀者注意辨別。)Unstandardized:給出未標(biāo)準(zhǔn)化的Fisher判別函數(shù)(即典型判別函數(shù))的系數(shù)(SPSS默認(rèn)給出標(biāo)準(zhǔn)化的Fisher判別函數(shù)系數(shù))。目前五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)單擊Continue按鈕,返回主界面。圖4.3Statistics子對(duì)話框目前六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 4.單擊Classify…按鈕,定義判別分組參數(shù)和選擇輸出結(jié)果。選擇Display欄中的Casewiseresults,輸出一個(gè)判別結(jié)果表,包括每個(gè)樣品的判別分?jǐn)?shù)、后驗(yàn)概率、實(shí)際組和預(yù)測(cè)組編號(hào)等。其余的均保留系統(tǒng)默認(rèn)選項(xiàng)。單擊Continue按鈕。圖4.4Classify…子對(duì)話框目前七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 5.單擊Save按鈕,指定在數(shù)據(jù)文件中生成代表判別分組結(jié)果和判別得分的新變量,生成的新變量的含義分別為:Predictedgroupmembership:存放判別樣品所屬組別的值;
Discriminantscores:存放Fisher判別得分的值,有幾個(gè)典型判別函數(shù)就有幾個(gè)判別得分變量;Probabilitiesofgroupmembership:存放樣品屬于各組的Bayes后驗(yàn)概率值。將對(duì)話框中的三個(gè)復(fù)選框均選中,單擊Continue按鈕返回。目前八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 6.返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。圖4.5Save子對(duì)話框目前九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)主要運(yùn)行結(jié)果解釋
1.StandardizedCanonicalDiscriminantFunctionCoefficients(給出標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù))標(biāo)準(zhǔn)化的典型判別函數(shù)是由標(biāo)準(zhǔn)化的自變量通過(guò)Fisher判別法得到的,所以要得到標(biāo)準(zhǔn)化的典型判別得分,代入該函數(shù)的自變量必須是經(jīng)過(guò)標(biāo)準(zhǔn)化的。
2.CanonicalDiscriminantFunctionCoefficients(給出未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù))未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)由于可以將實(shí)測(cè)的樣品觀測(cè)值直接代入求出判別得分,所以該系數(shù)使用起來(lái)比標(biāo)準(zhǔn)化的系數(shù)要方便一些。見表4.2(a)。目前十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)由此表可知,兩個(gè)Fisher判別函數(shù)分別為:實(shí)際上兩個(gè)函數(shù)式計(jì)算的是各觀測(cè)值在各個(gè)維度上的坐標(biāo),這樣就可以通過(guò)這兩個(gè)函數(shù)式計(jì)算出各樣品觀測(cè)值的具體空間位置。目前十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表4.2(a)未標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)目前十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.FunctionsatGroupCentroids(給出組重心處的Fisher判別函數(shù)值)如表4.2(b)所示,實(shí)際上為各類別重心在空間中的坐標(biāo)位置。這樣,只要在前面計(jì)算出各觀測(cè)值的具體坐標(biāo)位置后,再計(jì)算出它們分別離各重心的距離,就可以得知它們的分類了。表4.2(b)組重心處的Fisher判別函數(shù)值目前十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 4.ClassificationFunctionCoefficients(給出Bayes判別函數(shù)系數(shù))如表4.3所示,GROUP欄中的每一列表示樣品判入相應(yīng)列的Bayes判別函數(shù)系數(shù)。在本例中,各類的Bayes判別函數(shù)如下: 第一組: 第二組: 第三組:
目前十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可以判斷該樣品判入哪一類。例如,將第一個(gè)待判樣品的自變量值分別代入函數(shù),得到:
F1=3793.77,F(xiàn)2=3528.32,F(xiàn)3=3882.48比較三個(gè)值,可以看出最大,據(jù)此得出第一個(gè)待判樣品應(yīng)該屬于第三組。目前十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表4.3Bayes判別法的輸出結(jié)果目前十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 5.CasewiseStatistics(給出個(gè)案觀察結(jié)果)在CasewiseStatistics輸出表針對(duì)每個(gè)樣品給出了了大部分的判別結(jié)果,其中包括:實(shí)際類(ActualGroup)、預(yù)測(cè)類(PredictedGroup)、Bayes判別法的后驗(yàn)概率、與組重心的馬氏距離(SquaredMahalanobisDistancetoCentroid)以及Fisher判別法的每個(gè)典型判別函數(shù)的判別得分(DiscriminantScores)。出于排版要求,這里給出結(jié)果表的是經(jīng)過(guò)加工的,隱藏了其中的一些項(xiàng)目,如表4.4所示。從表中可以看出四個(gè)待判樣本依次被判別為第三組、第一組、第二組和第三組。目前十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表4.4個(gè)案觀察結(jié)果表目前十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 6.由于我們?cè)赟ave子對(duì)話框中選擇了生成表示判別結(jié)果的新變量,所以在數(shù)據(jù)編輯窗口中,可以觀察到產(chǎn)生的新變量。其中,變量dis-1存放判別樣品所屬組別的值,變量dis1-1和dis2-1分別代表將樣品各變量值代入第一個(gè)和第二個(gè)判別函數(shù)所得的判別分?jǐn)?shù),變量dis1-2、dis2-2和dis3-2分別代表樣品分別屬于第1組、第2組和第3組的Bayes后驗(yàn)概率值。目前十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)本章結(jié)束目前二十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)聚類分析SPSS實(shí)現(xiàn)一在SPSS中利用系統(tǒng)聚類法進(jìn)行聚類分析
二在SPSS中利用K均值法進(jìn)行聚類分析
目前二十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)一、在SPSS中利用系統(tǒng)聚類法進(jìn)行
聚類分析設(shè)有20個(gè)土壤樣品分別對(duì)5個(gè)變量的觀測(cè)數(shù)據(jù)如表5.16所示,試?yán)孟到y(tǒng)聚類法對(duì)其進(jìn)行樣品聚類分析。表5.16土壤樣本的觀測(cè)數(shù)據(jù)目前二十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前二十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(一)操作步驟
1.在SPSS窗口中選擇Analyze→Classify→HierachicalCluster,調(diào)出系統(tǒng)聚類分析主界面,并將變量X1~X5移入Variables框中。在Cluster欄中選擇Cases單選按鈕,即對(duì)樣品進(jìn)行聚類(若選擇Variables,則對(duì)變量進(jìn)行聚類)。在Display欄中選擇Statistics和Plots復(fù)選框,這樣在結(jié)果輸出窗口中可以同時(shí)得到聚類結(jié)果統(tǒng)計(jì)量和統(tǒng)計(jì)圖。目前二十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖5.15K均值聚類分析主界面目前二十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.點(diǎn)擊Iterate按鈕,對(duì)迭代參數(shù)進(jìn)行設(shè)置。MaximumIterations參數(shù)框用于設(shè)定K-means算法迭代的最大次數(shù),ConvergenceCriterion參數(shù)框用于設(shè)定算法的收斂判據(jù),其值應(yīng)該介于0和1之間。例如判據(jù)設(shè)置為0.02,則當(dāng)一次完整的迭代不能使任何一個(gè)類中心距離的變動(dòng)與原始類中心距離的比小于2時(shí),迭代停止。設(shè)置完這兩個(gè)參數(shù)之后,只要在迭代的過(guò)程中先滿足了其中的參數(shù),則迭代過(guò)程就停止。這里我們選擇系統(tǒng)默認(rèn)的標(biāo)準(zhǔn)。單擊Continue,返回主界面。圖5.16Iterate子對(duì)話框目前二十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.點(diǎn)擊Save按鈕,設(shè)置保存在數(shù)據(jù)文件中的表明聚類結(jié)果的新變量。其中Clustermembership選項(xiàng)用于建立一個(gè)代表聚類結(jié)果的變量,默認(rèn)變量名為qcl_1;Distancefromclustercenter選項(xiàng)建立一個(gè)新變量,代表各觀測(cè)量與其所屬類中心的歐氏距離。我們將兩個(gè)復(fù)選框都選中,單擊Continue按鈕返回。圖5.17Save子對(duì)話框目前二十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 4.點(diǎn)擊Options按鈕,指定要計(jì)算的統(tǒng)計(jì)量。選中Initialclustercenters和Clusterinformationforeachcase復(fù)選框。這樣,在輸出窗口中將給出聚類的初始類中心和每個(gè)觀測(cè)量的分類信息,包括分配到哪一類和該觀測(cè)量距所屬類中心的距離。單擊Continue返回。
5.點(diǎn)擊OK按鈕,運(yùn)行K均值聚類分析程序。圖5.18Options子對(duì)話框目前二十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)主要運(yùn)行結(jié)果解釋
1.InitialClusterCenters(給出初始類中心)
2.IterationHistory(給出每次迭代結(jié)束后類中心的變動(dòng)) 從表5.18中可以看到本次聚類過(guò)程共經(jīng)歷了三次迭代。由于我們?cè)贗terate子對(duì)話框中使用系統(tǒng)默認(rèn)的選項(xiàng)(最大迭代次數(shù)為10和收斂判據(jù)為0),所以在第三次迭代后,類中心的變化為0,從而迭代停止。目前二十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.ClusterMembership(給出各觀測(cè)量所屬的類及與所屬類中心的距離) 表5.19中Cluster列給出了觀測(cè)量所屬的類別,Distance列給出了觀測(cè)量與所屬類中心的距離。(出于排版要求,此表經(jīng)過(guò)加工,因此與原始輸出表形態(tài)有一定差異)。表5.18迭代過(guò)程中類中心的變化量目前三十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表5.19各觀測(cè)量所屬類成員表目前三十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 4.FinalClusterCenters(給出聚類結(jié)果形成的類中心的各變量值)表5.20最終的類中心表目前三十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)結(jié)合表5.19和表5.20,我們可以看出31個(gè)地區(qū)被分成3類。第一類包括:江蘇、浙江、山東和廣東4個(gè)省。這一類的類中心三個(gè)產(chǎn)業(yè)的產(chǎn)值分別為1102.14億元、6423.01億元和4454.26億元,屬于三個(gè)產(chǎn)業(yè)都比較發(fā)達(dá)的地區(qū)。第二類包括:天津、山西、內(nèi)蒙古、吉林、江西、廣西、海南、重慶、貴州、云南、西藏、陜西、甘肅、青海、寧夏和新疆16個(gè)地區(qū)。這一類的類中心三個(gè)產(chǎn)業(yè)的產(chǎn)值分別為307.61億元、795.41億元和673.63億元,屬于欠發(fā)達(dá)地區(qū)。剩下的11個(gè)地區(qū)為第三類。這一類的類中心三個(gè)產(chǎn)業(yè)的產(chǎn)值分別為713.28億元、2545.20億元和212.87億元,屬于中等發(fā)達(dá)地區(qū)。
5.由于我們已經(jīng)在Save子對(duì)話框中設(shè)置了在數(shù)據(jù)文件中生成新的分類變量,所以,在數(shù)據(jù)編輯窗口中,我們可以看到生成的兩個(gè)表示分類結(jié)果的新變量。變量qcl_1和變量qcl_2分別代表分類號(hào)和觀測(cè)量距所屬類中心的距離。目前三十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)本章結(jié)束目前三十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)主成分分析SPSS實(shí)現(xiàn)一主成分分析實(shí)例
二利用SPSS進(jìn)行主成分分析
目前三十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)一、主成分分析實(shí)例表6.1是某市工業(yè)部門13個(gè)行業(yè)的8項(xiàng)重要經(jīng)濟(jì)指標(biāo)的數(shù)據(jù),這8項(xiàng)經(jīng)濟(jì)指標(biāo)分別是:
X1:年末固定資產(chǎn)凈值,單位:萬(wàn)元;
X2:職工人數(shù)據(jù),單位:人;
X3:工業(yè)總產(chǎn)值,單位:萬(wàn)元;
X4:全員勞動(dòng)生產(chǎn)率,單位:元/人年;
X5:百元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值,單位:元;
X6:資金利稅率,單位:%;
X7:標(biāo)準(zhǔn)燃料消費(fèi)量,單位:噸;
X8:能源利用效果,單位:萬(wàn)元/噸。目前三十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.1某市工業(yè)部門13個(gè)行業(yè)8項(xiàng)指標(biāo)目前三十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)我們要考慮的是:如何從這些經(jīng)濟(jì)指標(biāo)出發(fā),對(duì)各工業(yè)部門進(jìn)行綜合評(píng)價(jià)與排序?我們先計(jì)算這些指標(biāo)的主成分,然后通過(guò)主成分的大小進(jìn)行排序。表6.2和表6.3分別是特征根(累計(jì)貢獻(xiàn)率)和特征向量的信息。利用主成分得分進(jìn)行綜合評(píng)價(jià)時(shí),從特征向量我們可以寫出所有8個(gè)主成分的具體形式:目前三十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.2特征根和累計(jì)貢獻(xiàn)率目前三十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.3特征向量目前四十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.4各行業(yè)主成分得分及排序目前四十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)我們以特征根為權(quán),對(duì)8個(gè)主成分進(jìn)行加權(quán)綜合,得出各工業(yè)部門的綜合得分,具體數(shù)據(jù)見表6.4。綜合得分的計(jì)算公式是: 根據(jù)上式可計(jì)算出各工業(yè)部門的綜合得分,并可據(jù)此排序。從上表可以看出,機(jī)器行業(yè)在該地區(qū)的綜合評(píng)價(jià)排在第一,原始數(shù)據(jù)也反映出機(jī)器行業(yè)存在明顯的規(guī)模優(yōu)勢(shì),另外從前兩個(gè)主成分得分上看,該行業(yè)也排在第一位,同樣存在效益優(yōu)勢(shì);而排在最后三位的分別是皮革行業(yè)、電力行業(yè)和煤炭行業(yè)。目前四十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)二、利用SPSS進(jìn)行主成分分析SPSS沒有提供主成分分析的專用功能,只有因子分析的功能。但是因子分析和主成分分析有著密切的聯(lián)系。因子分析的重要步驟——因子的提取最常用的方法就是“主成分法”。利用因子分析的結(jié)果,可以很容易地實(shí)現(xiàn)主成分分析。具體來(lái)講,就是利用因子載荷陣和相關(guān)系數(shù)矩陣的特征根來(lái)計(jì)算特征向量。即:其中,zij為第j個(gè)特征向量的第i個(gè)元素;aij為因子載荷陣第i
行第j列的元素;λj為第j個(gè)因子對(duì)應(yīng)的特征根。然后再利用 計(jì)算出的特征向量來(lái)計(jì)算主成分。以下是我國(guó)2005年第1、2季度分地區(qū)城鎮(zhèn)居民家庭收支基本情況。通過(guò)這個(gè)例子,介紹如何利用SPSS軟件實(shí)現(xiàn)主成分分析。目前四十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.5分地區(qū)城鎮(zhèn)居民家庭收支基本情況
目前四十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.5分地區(qū)城鎮(zhèn)居民家庭收支基本情況
目前四十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(一)利用SPSS進(jìn)行因子分析將原始數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,將5個(gè)變量分別命名為X1~X5。在SPSS窗口中選擇Analyze→DataReduction→Factor菜單項(xiàng),調(diào)出因子分析主界面,并將變量X1~X5移入Variables框中,其他均保持系統(tǒng)默認(rèn)選項(xiàng),單擊OK按鈕,執(zhí)行因子分析過(guò)程(關(guān)于因子分子在SPSS中實(shí)現(xiàn)的詳細(xì)過(guò)程,參見第7章實(shí)例)。得到如表6.6所示的特征根和方差貢獻(xiàn)率表和表6.7所示的因子載荷陣。表6.6中Total列為各因子對(duì)應(yīng)的特征根,本例中共提取兩個(gè)公因子;%ofVariance列為各因子的方差貢獻(xiàn)率;Cumulative%列為各因子累積方差貢獻(xiàn)率,由表中可以看出,前兩個(gè)因子已經(jīng)可以解釋79.31%的方差目前四十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖6.2因子分析主界面目前四十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表6.6特征根和方差貢獻(xiàn)率表目前四十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)利用因子分析結(jié)果進(jìn)行主成分分析
1.將表6.7中因子載荷陣中的數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,分別命名為a1和a2。表6.7因子載荷陣目前四十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.為了計(jì)算第一個(gè)特征向量,點(diǎn)擊菜單項(xiàng)中的Transform→Compute,調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:
z1=a1/SQRT(2.576)
點(diǎn)擊OK按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量。 再次調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:
z2=a2/SQRT(1.389)
點(diǎn)擊OK按鈕,得到以z2為變量名第二特征向量。這樣,我們得到了如表6.8所示的特征向量矩陣。目前五十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖6.3Computevariable對(duì)話框目前五十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)根據(jù)表6.8可以得到主成分的表達(dá)式:
3.再次使用Compute命令,就可以計(jì)算得到兩個(gè)主成分。表6.8特征向量矩陣目前五十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)本章結(jié)束目前五十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)因子分析SPSS實(shí)現(xiàn)一利用SPSS進(jìn)行因子分析二因子分析在市場(chǎng)研究中的應(yīng)用目前五十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)一、利用SPSS進(jìn)行因子分析
目前五十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(一)操作步驟
1.在SPSS窗口中選擇Analyze→DataReduction→Factor,調(diào)出因子分析主界面圖(7.1),并將變量X1—X13移入Variables框中。圖7.1因子分析主界面目前五十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.點(diǎn)擊Descriptives按鈕,展開相應(yīng)對(duì)話框,見圖7.2。選擇Initialsolution復(fù)選項(xiàng)。這個(gè)選項(xiàng)給出各因子的特征值、各因子特征值占總方差的百分比以及累計(jì)百分比。單擊Continue按鈕,返回主界面。圖7.2Descriptives子對(duì)話框目前五十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.點(diǎn)擊Extraction按鈕,設(shè)置因子提取的選項(xiàng),見圖7.3。在Method下拉列表中選擇因子提取的方法,SPSS提供了七種提取方法可供選擇,一般選擇默認(rèn)選項(xiàng),即“主成分法”。在Analyze欄中指定用于提取因子的分析矩陣,分別為相關(guān)矩陣和協(xié)方差矩陣。在Display欄中指定與因子提取有關(guān)的輸出項(xiàng),如未旋轉(zhuǎn)的因子載荷陣和因子的碎石圖。在Extract欄中指定因子提取的數(shù)目,有兩種設(shè)置方法:一種是在Eigenvaluesover后的框中設(shè)置提取的因子對(duì)應(yīng)的特征值的范圍,系統(tǒng)默認(rèn)值為1,即要求提取那些特征值大于1的因子;第二種設(shè)置方法是直接在Numberoffactors后的矩形框中輸入要求提取的公因子的數(shù)目。這里我們均選擇系統(tǒng)默認(rèn)選項(xiàng),單擊Continue按鈕,返回主界面。目前五十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖7.3Extraction子對(duì)話框目前五十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 4.點(diǎn)擊Rotation按鈕,設(shè)置因子旋轉(zhuǎn)的方法。這里選擇Varimax(方差最大旋轉(zhuǎn)),并選擇Display欄中的Rotatedsolution復(fù)選框,在輸出窗口中顯示旋轉(zhuǎn)后的因子載荷陣。單擊Continue按鈕,返回主界面。圖7.4Rotation子對(duì)話框目前六十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 5.點(diǎn)擊Scores按鈕,設(shè)置因子得分的選項(xiàng)。選中Saveasvariables復(fù)選框,將因子得分作為新變量保存在數(shù)據(jù)文件中。選中Displayfactorscorecoefficientmatrix復(fù)選框,這樣在結(jié)果輸出窗口中會(huì)給出因子得分系數(shù)矩陣。單擊Continue按鈕返回主界面。
6.單擊OK按鈕,運(yùn)行因子分析過(guò)程。圖7.5Scores子對(duì)話框目前六十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)主要運(yùn)行結(jié)果解釋
1.Communalities(給出變量共同度)變量共同度反映每個(gè)變量對(duì)所提取的所有公共因子的依賴程度,此數(shù)值是因子載荷陣中每一行的因子載荷量的平方和,提取的因子個(gè)數(shù)不同,變量共同度也不同。
2.TotalVarianceExplained(給出各公因子方差貢獻(xiàn)表)InitialEigenvalues給出初始相關(guān)矩陣或協(xié)差陣矩陣的特征值,用于確定哪些因子應(yīng)該被提取,共有三項(xiàng):Total列為各因子對(duì)應(yīng)的特征值,本例中共有四個(gè)因子對(duì)應(yīng)的特征值大于1,因此應(yīng)提取相應(yīng)的四個(gè)公因子;%ofVariance列為各因子的方差貢獻(xiàn)率;Cumulative%列為各因子的累積方差貢獻(xiàn)率,由表7.1可以看出,前四個(gè)因子已經(jīng)可以解釋89.651%的方差。RotationSumsofSquaredLoadings給出提取出的公因子經(jīng)過(guò)旋轉(zhuǎn)后的方差貢獻(xiàn)情況。目前六十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表7.1特征根與方差貢獻(xiàn)率表
目前六十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
目前六十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表7.2旋轉(zhuǎn)前因子載荷陣目前六十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前六十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表7.3旋轉(zhuǎn)后因子載荷陣
目前六十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前六十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)注意:在因子表達(dá)式中的各變量為進(jìn)行標(biāo)準(zhǔn)化變換后的標(biāo)準(zhǔn)變量,均值為0,標(biāo)準(zhǔn)差為1。
7.由于我們已經(jīng)在Scores子對(duì)話框中選擇了Saveasvariables復(fù)選框,因此,因子得分已經(jīng)作為新的變量保存在數(shù)據(jù)文件中,變量名分別為fac1_1、fac2_1、fac3_1和fac4_1。此后,我們還可以利用因子得分進(jìn)行其他的統(tǒng)計(jì)分析。目前六十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表7.4因子得分系數(shù)矩陣
目前七十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)二、因子分析在市場(chǎng)研究中的應(yīng)用表7.5是研究消費(fèi)者對(duì)購(gòu)買牙膏偏好的調(diào)查數(shù)據(jù)。通過(guò)市場(chǎng)的攔截訪問(wèn),用7級(jí)量表詢問(wèn)受訪者對(duì)以下陳述的認(rèn)同程度(1表示非常不同意,7表示非常同意)。
V1:購(gòu)買預(yù)防蛀牙的牙膏是重要的;
V2:我喜歡使牙齒亮澤的牙膏;
V3:牙膏應(yīng)當(dāng)保護(hù)牙齦;
V4:我喜歡使口氣清新的牙膏;
V5:預(yù)防壞牙不是牙膏提供的一項(xiàng)重要利益;
V6:購(gòu)買牙膏時(shí)最重要的考慮是富有魅力的牙齒。目前七十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表7.5牙膏屬性評(píng)分得分表目前七十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前七十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)將表7.5中的數(shù)據(jù)通過(guò)SPSS進(jìn)行因子分析,得到相關(guān)結(jié)果是:
1.特征根和累計(jì)貢獻(xiàn)率表7.6方差貢獻(xiàn)率表目前七十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)從表7.6可以看出,提取兩個(gè)因子累計(jì)方差貢獻(xiàn)率就達(dá)到82%,第三個(gè)特征根相比下降較快,因此我們選取兩個(gè)公共因子。
2.因子的含義為了得到意義明確的因子含義,我們將因子載荷陣進(jìn)行方差最大法旋轉(zhuǎn),得到旋轉(zhuǎn)后的因子載荷矩陣如下表7.7。表7.7旋轉(zhuǎn)后因子載荷矩陣
目前七十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)從因子載荷陣可以看出:因子1與V1(預(yù)防蛀牙),V3(保護(hù)牙齦),V5(預(yù)防壞牙)相關(guān)性強(qiáng),其中V5的載荷是負(fù)數(shù),是由于這個(gè)陳述是反向詢問(wèn)的;因子2與V2(牙齒亮澤),V4(口氣清新),V6(富有魅力)的相關(guān)系數(shù)相對(duì)較高。因此,我們命名因子1為“護(hù)牙因子”,是人們對(duì)牙齒的保健態(tài)度;因子2是“美牙因子”,說(shuō)明人們“‘通過(guò)牙膏美化牙齒’影響社交活動(dòng)”的重視。從這兩方面分析,對(duì)牙膏生產(chǎn)企業(yè)開發(fā)新產(chǎn)品都富有啟發(fā)意義。目前七十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)本章結(jié)束目前七十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)相應(yīng)分析SPSS實(shí)現(xiàn)一利用SPSS進(jìn)行相應(yīng)分析——實(shí)例1
二利用SPSS進(jìn)行相應(yīng)分析——實(shí)例2
目前七十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)一、利用SPSS進(jìn)行相應(yīng)分析——
實(shí)例1數(shù)據(jù)來(lái)自SPSS軟件自帶數(shù)據(jù)集voter.sav,為1992年美國(guó)大選的部分?jǐn)?shù)據(jù)。要求對(duì)選民的最高學(xué)歷水平(degree)和所支持的總統(tǒng)候選人(pres92)進(jìn)行相應(yīng)分析。 (一)操作步驟
1.正確打開數(shù)據(jù)集voter.sav后,由Analyze→DataReduction→CorrespondenceAnalysis可進(jìn)入相應(yīng)分析的主對(duì)話框(圖8.1)。圖8.1相應(yīng)分析主界面目前七十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.從左側(cè)變量列表中選擇兩個(gè)變量作為相應(yīng)分析的兩個(gè)維度。這里我們選擇pres92作為行維度,點(diǎn)擊Row左側(cè)的三角箭頭就可以看到在Row項(xiàng)下出現(xiàn)了pres92(??),這時(shí)用鼠標(biāo)選中該變量,其下方的DefineRange子對(duì)話框激活,點(diǎn)擊后出現(xiàn)變量水平設(shè)置窗口(圖8.2)。分為上下兩個(gè)部分:Categoryrangeforrowvariable:pres92和CategoryConstraints。這里要分析所有的三位總統(tǒng)候選人和選民的學(xué)歷水平的關(guān)系,所以在Minimumvalue中填入1,在Maximumvalue中填入3,之后點(diǎn)擊Update按鈕。就可以在下方的CategoryConstraints欄中看到,后續(xù)分析中的行變量?jī)H包含3個(gè)類目,分別是1、2和3。目前八十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.2DefineRowRange子對(duì)話框目前八十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)在右側(cè)還有三個(gè)單選項(xiàng):None表示沒有任何約束;Categoriesmustbeequal可用于指定某些類目的得分必須相同,最多可以設(shè)置有效類目的個(gè)數(shù)減1個(gè)得分相等的類目,如本例中最多可以設(shè)置2個(gè)類目得分相等;Categoryissupplemental表示某些類目不參加相應(yīng)分析但是會(huì)在圖形中標(biāo)示。這里我們不對(duì)分類進(jìn)行任何約束,點(diǎn)擊Continue按鈕后回到主對(duì)話框。類似的可以指定degree的有效類目最小值為0,最大值為4。
3.點(diǎn)擊Model按鈕,指定相應(yīng)分析結(jié)果的維數(shù)。(圖8.3)
(1)Dimensionsinsolution。默認(rèn)為2,最大可以設(shè)置為各變量中的最少類目數(shù)減1。 (2)選擇距離測(cè)度的方式DistanceMeasure。有Chisquare 和Euclidean兩種,定性變量應(yīng)該用Chisquare。 (3)標(biāo)準(zhǔn)化方法StandardizationMethod。目前八十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.3Model子對(duì)話框目前八十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(4)正態(tài)化方法NormalizationMethod。需要比較行列變量的類目差異時(shí)選擇Symmetrical,需要比較行列變量中任意兩個(gè)類目的差異時(shí)選擇Principal,比較行變量的類目差異時(shí)選擇Rowprincipal,而比較列變量的類目差異時(shí)選擇Columnprincipal,也可以在Customize中指定[-1,1]之間的任意實(shí)數(shù),特別的,如果輸入-1則為Columnprincipal,輸入1為Rowprincipal,輸入0為Symmetrical。而一般該對(duì)話框中的選項(xiàng)無(wú)需改動(dòng)。
4.點(diǎn)擊Statistics按鈕,設(shè)定輸出的相應(yīng)分析統(tǒng)計(jì)量,如圖8.4??梢灾付ㄝ敵鱿鄳?yīng)分析表Correspondencetable,行點(diǎn)總覽表Overviewofrowpoints,列點(diǎn)總覽表Overviewofcolumnpoints,行輪廓Rowprofiles,列輪廓Columnprofiles。默認(rèn)只輸出前三項(xiàng)。而Permutationsofthecorrespondencetable是用于指定前n個(gè)維度的行列得分表。如果該項(xiàng)選中,下方的Maximumdimensionforpermutations被激活,用于指定維度n。此外,還可以在ConfidenceStatisticsfor復(fù)選項(xiàng)中選擇計(jì)算行點(diǎn)和列點(diǎn)的標(biāo)準(zhǔn)差以及相關(guān)系數(shù)。
目前八十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.4Statistics子對(duì)話框目前八十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 5.點(diǎn)擊Plots按鈕,設(shè)定輸出的統(tǒng)計(jì)圖,如圖8.5。可以指定輸出相應(yīng)分析的散點(diǎn)圖Scatterplots,默認(rèn)只輸出包含行列變量的雙變量散點(diǎn)圖Biplot。也可指定輸出行點(diǎn)圖Rowpoints和列點(diǎn)圖Columnpoints。而IDlabelwidthforScatterplots是指定散點(diǎn)標(biāo)簽的長(zhǎng)度,默認(rèn)20。下方的Lineplots項(xiàng)中,可以輸出行/列點(diǎn)對(duì)應(yīng)于行/列得分的線圖,和散點(diǎn)圖類似。
6.我們?cè)贛odel,Statistics,Plots三個(gè)子對(duì)話框中都使用默認(rèn)設(shè)定,點(diǎn)擊主對(duì)話框的OK按鈕,即得到相應(yīng)分析的結(jié)果。目前八十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.5Plots子對(duì)話框目前八十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)結(jié)果分析:
SPSS運(yùn)行相應(yīng)分析后會(huì)產(chǎn)生以下四張表(表8.4到表8.7)。
1.CorrespondenceTable(相應(yīng)分析表),如表8.4,即列聯(lián)表。ActiveMargin為邊際頻數(shù)。大致可以看出Clinton在各個(gè)學(xué)歷層次都有最高的票數(shù)。表8.4列聯(lián)表
目前八十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.Summary(總覽表),如表8.5。表中從左到右依次是維度編號(hào)、奇異值、慣量、卡方統(tǒng)計(jì)量、顯著性、慣量所占總慣量比例、每個(gè)維度的奇異值的標(biāo)準(zhǔn)差和相關(guān)系數(shù)。SingularValue為特征值的平方根,根據(jù)總慣量和特征值求和相等,有0.1392+0.0162=0.019+0.000=0.019。第一個(gè)維度慣量0.019,占總慣量的98.7%,第二個(gè)維度慣量接近0,僅占總慣量1.3%。因此可以認(rèn)為只要用一個(gè)維度就可以解釋行列變量之間所有的關(guān)系,但為了說(shuō)明分析過(guò)程,仍然保留兩個(gè)維度。總慣量35.867÷1844=0.19,滿足總慣量和卡方統(tǒng)計(jì)量的關(guān)系式。同時(shí)卡方統(tǒng)計(jì)量的自由度8=(3-1)×(5-1),數(shù)值為0.000,說(shuō)明行列變量之間存在顯著的相關(guān)性,相應(yīng)分析是有意義的。目前八十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表8.5總覽表目前九十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.OverviewRowPoints與OverviewColumnPoints(行/列點(diǎn)總覽表),如表8.6,表8.7?,F(xiàn)以表8.6為例,Mass項(xiàng)表示行變量中每個(gè)類目的邊際概率。Scoreindimension下面則是行點(diǎn)在兩個(gè)維度的坐標(biāo)(SPSS稱為得分),即有坐標(biāo)點(diǎn)Bush(0.194,-0.156),Perot(0.663,0.198),Clinton(-0.346,0.053)。Inertia項(xiàng)為慣量,即每個(gè)行點(diǎn)與行重心的加權(quán)距離的平方。而行慣量為行點(diǎn)與行重心的加權(quán)距離平方和,即0.19=0.002+0.009+0.008。比較表8.6和表8.7的總慣量,可以發(fā)現(xiàn)行慣量與列慣量相等。Contribution項(xiàng)有兩個(gè)部分,分別是行變量的每個(gè)類目對(duì)維度(公共因子)特征值的貢獻(xiàn),每一個(gè)維度對(duì)每個(gè)類目的特征值的貢獻(xiàn)。目前九十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表8.6行點(diǎn)總覽表目前九十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表8.7列點(diǎn)總覽表目前九十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 4.相應(yīng)分析圖,如圖8.6??梢园l(fā)現(xiàn)研究生層次的選民(Graduatedegree)傾向于具有實(shí)干精神的Clinton,而較Clinton更為激進(jìn)的Bush更受highschool和Bachelor層次的選民歡迎,Perot僅和juniorcollege層次的選民較近。圖8.6相應(yīng)分析的二維圖目前九十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 5.如果在Statistics子對(duì)話框中選中了Rowprofile和Columnprofile,SPSS還會(huì)輸出以下兩張表(表8.8,表8.9)。表8.8行輪廓表目前九十五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表8.9列輪廓表目前九十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 6.行/列點(diǎn)圖(圖8.7,圖8.8)。如果要單獨(dú)考察行/列變量的各個(gè)水平在兩個(gè)公共因子維度上的分布情況,可在Plots子對(duì)話框中選中Rowpoints和Columnpoints。運(yùn)行后即得下圖:圖8.7行點(diǎn)在兩個(gè)公共因子維度上的分布目前九十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.8列點(diǎn)在兩個(gè)公共因子維度上的分布目前九十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)二、利用SPSS進(jìn)行相應(yīng)分析——
實(shí)例2
目前九十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表8.104只股票的財(cái)務(wù)數(shù)據(jù)目前一百頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(一)操作步驟:
1.首先由SPSS的因子分析過(guò)程(詳細(xì)步驟參見因子分析一章),通過(guò)主成分法估計(jì)和最大方差旋轉(zhuǎn)法進(jìn)行因子旋轉(zhuǎn),發(fā)現(xiàn)需要3個(gè)公共因子才能解釋83%以上的方差??傻靡蜃拥梅值挠?jì)算公式為(加上*號(hào)的變量和因子表示都已經(jīng)標(biāo)準(zhǔn)化):目前一百零一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)因此factor1可以稱為股票規(guī)模因子,factor2稱為股票收益因子,factor3稱為個(gè)股價(jià)值因子。將這三個(gè)因子劃分為5個(gè)等級(jí):低于-0.5,-0.5~0,0~0.5,0.5~1,大于1,分別編碼為1,2,3,4,5。這樣就可以利用相應(yīng)分析來(lái)詳細(xì)的研究這三個(gè)因子之間的關(guān)系。
2.在相應(yīng)分析的主對(duì)話框中,我們以factor1和factor2為例說(shuō)明。設(shè)置好類目(圖8.9),在Model子對(duì)話框中仍然選擇維數(shù)2,其他設(shè)置不變,點(diǎn)擊OK后,就得到相應(yīng)分析的結(jié)果。目前一百零二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.9相應(yīng)分析主界面目前一百零三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)結(jié)果分析:這里僅列出相應(yīng)分析表(表8.11)、總覽表(表8.12)以及相應(yīng)分析圖(圖8.10),其余圖表的分析與前一例題類似。表8.11列聯(lián)表目前一百零四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表8.12總覽表目前一百零五頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)從表8.12中可以看出,卡方檢驗(yàn)是顯著相關(guān)的,因此相應(yīng)分析是有意義的,而且只需要兩個(gè)公共因子就可以解釋92.7%的總慣量。所以使用二維圖就可以充分的反映行列變量之間的關(guān)系了。在圖8-10上可以發(fā)現(xiàn),規(guī)模因子為1和5,個(gè)股價(jià)值因子為5,這表明“小股票”和“大股票”都可能實(shí)現(xiàn)最高的個(gè)股價(jià)值,并且“小股票”似乎更有可能。而股票規(guī)模因子中略高于平均水平的取值為3,4,這兩個(gè)檔次較為接近可以將其合并為一個(gè)檔次,相應(yīng)的個(gè)股價(jià)值因子也略高于平均水平。讀者應(yīng)該可以發(fā)現(xiàn)相應(yīng)分析實(shí)際是對(duì)兩組高維空間的點(diǎn)的二維投影進(jìn)行分析。有時(shí)在高維空間中相隔很近的點(diǎn)投影后卻顯的很遠(yuǎn),因此有時(shí)需要進(jìn)一步分析每個(gè)類目對(duì)公共因子的貢獻(xiàn)大小。同時(shí)相應(yīng)分析主要是建立在圖形分析的基礎(chǔ)上,而沒有給出足夠充分的統(tǒng)計(jì)量來(lái)度量這種相關(guān)程度,因此相應(yīng)分析的結(jié)果帶有一定的主觀性。目前一百零六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖8.10二維相應(yīng)分析圖目前一百零七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)本章結(jié)束目前一百零八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)典型相關(guān)分析SPSS實(shí)現(xiàn)一利用SPSS進(jìn)行典型相關(guān)分析實(shí)例1二利用SPSS進(jìn)行典型相關(guān)分析實(shí)例2目前一百零九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)一、利用SPSS進(jìn)行典型相關(guān)分析
實(shí)例1測(cè)量15名受試者的身體形態(tài)以及健康情況指標(biāo),如9.2表。第一組是身體形態(tài)變量,有年齡、體重、胸圍和日抽煙量;第二組是健康狀況變量,有脈搏、收縮壓和舒張壓。要求測(cè)量身體形態(tài)以及健康狀況這兩組變量之間的關(guān)系。表9.2兩組身體素質(zhì)的典型變量
目前一百一十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前一百一十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(一)操作步驟在SPSS中沒有提供典型相關(guān)分析的專門菜單項(xiàng),要想利用SPSS實(shí)現(xiàn)典型相關(guān)分析,必須在語(yǔ)句窗口中調(diào)用SPSS的Canonicalcorrelation.sps宏。具體方法如下:
1.按File→New→Syntax的順序新建一個(gè)語(yǔ)句窗口。在語(yǔ)句窗口中輸入下面的語(yǔ)句:(圖9.1)
INCLUDE'Canonicalcorrelation.sps'. CANCORRSET1=x1x2x3x4/ SET2=y1y2y3/.目前一百一十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 2.點(diǎn)擊語(yǔ)句窗口Run菜單中的All子菜單項(xiàng),運(yùn)行典型相關(guān)宏命令,得出結(jié)果。圖9.1語(yǔ)句窗口目前一百一十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)主要運(yùn)行結(jié)果解釋
1.CorrelationsforSet-1、CorrelationsforSet-2、CorrelationsBetweenSet-1andSet-2(分別給出兩組變量?jī)?nèi)部以及兩組變量之間的相關(guān)系數(shù)矩陣)
2.CanonicalCorrelations(給出典型相關(guān)系數(shù))從表9.3中可以看出第一典型相關(guān)系數(shù)達(dá)到0.957,第二典型相關(guān)系數(shù)為0.582,第三典型相關(guān)系數(shù)為0.180。表9.3典型相關(guān)系數(shù)目前一百一十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.Testthatremainingcorrelationsarezero(給出典型相關(guān)的顯著性檢驗(yàn))表9.4中從左至右分別為Wilks的統(tǒng)計(jì)量、卡方統(tǒng)計(jì)量、自由度和伴隨概率。從表中可以看出,在0.05的顯著性水平下,三對(duì)典型變量中只有第一對(duì)典型相關(guān)是顯著的。
表9.4典型相關(guān)系數(shù)的顯著性檢驗(yàn)?zāi)壳耙话僖皇屙?yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
目前一百一十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表9.5兩組典型變量的標(biāo)準(zhǔn)化系數(shù)
目前一百一十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
由于Y1(脈搏)的系數(shù)-0.721絕對(duì)值最大,說(shuō)明健康狀況的典型變量主要由脈搏所決定。同時(shí),由于兩個(gè)典型變量中抽煙量和脈搏的系數(shù)是同號(hào)的(都為負(fù)),反映抽煙量和脈搏的正相關(guān),即日抽煙越多則每分鐘的脈搏跳動(dòng)次數(shù)也越多。抽煙對(duì)身體健康有害,這和客觀事實(shí)是相符的。6.RedundancyAnalysis(分別給出兩組典型變量的冗余分析)表9.6中給出的四組數(shù)據(jù)分別是身體形態(tài)變量被自身的典型變量解釋的方差比例、身體形態(tài)變量被健康狀況的典型變量解釋的方差比例、健康狀況變量被自身的典型變量解釋的方差比例和健康狀況變量被身體形態(tài)的典型變量解釋的方差比例。目前一百一十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表9.6典型冗余分析目前一百一十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前一百二十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)二、利用SPSS進(jìn)行典型相關(guān)分析
實(shí)例2利用SPSS軟件對(duì)(1952)關(guān)于典型相關(guān)的經(jīng)典例子進(jìn)行分析。表9.7列舉了25個(gè)家庭的成年長(zhǎng)子和次子的頭長(zhǎng)和頭寬。利用典型相關(guān)分析法分析長(zhǎng)子和次子頭型的相關(guān)性。 (一)操作步驟
1.按File→New→Syntax的順序新建一個(gè)語(yǔ)句窗口。在語(yǔ)句窗口中輸入下面的語(yǔ)句:
INCLUDE'Canonicalcorrelation.sps'. CANCORRSET1=x1x2/ SET2=y1y2/. 2.點(diǎn)擊語(yǔ)句窗口Run菜單中的All子菜單項(xiàng),運(yùn)行典型相關(guān)宏命令,得出結(jié)果。目前一百二十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表9.7長(zhǎng)子和次子的頭長(zhǎng)與頭寬
目前一百二十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)目前一百二十三頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
(二)主要運(yùn)行結(jié)果解釋
1.典型相關(guān)系數(shù)和典型相關(guān)的顯著性檢驗(yàn)(表9.8、表9.9)從表二可以看出,兩隊(duì)典型變量中,第一對(duì)的典型相關(guān)系數(shù)達(dá)到0.788,屬于強(qiáng)相關(guān),而第二對(duì)典型變量的相關(guān)則比較弱。這一點(diǎn)從表3可以更清楚的看到。顯著性檢驗(yàn)的結(jié)果表明,在0.05的顯著性水平下,只有第一對(duì)典型相關(guān)是顯著的。表9.8典型相關(guān)系數(shù)目前一百二十四頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表9.9典型相關(guān)的顯著性檢驗(yàn)?zāi)壳耙话俣屙?yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)
目前一百二十六頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.冗余分析從表9.11可以看到,長(zhǎng)子的頭型變量被自身的第一典型變量解釋了86.7%,次子的頭型變量被自身的第一典型變量解釋了91.8%。表9.10兩組典型變量的未標(biāo)準(zhǔn)化系數(shù)目前一百二十七頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)表9.11冗余分析目前一百二十八頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)本章結(jié)束目前一百二十九頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)多維標(biāo)度法SPSS實(shí)現(xiàn)
一多維標(biāo)度法在SPSS中的實(shí)現(xiàn)二利用SPSS對(duì)本章美國(guó)十城市的例子進(jìn)行多維標(biāo)度
目前一百三十頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)一、多維標(biāo)度法在SPSS中的實(shí)現(xiàn)
——實(shí)例1以SPSS自帶文件World95.sav為例,對(duì)亞洲國(guó)家和地區(qū)的17個(gè)國(guó)家的人口壽命情況進(jìn)行分析。(一)操作步驟:
1.在Data→Selectcase對(duì)話框的If過(guò)濾條件中輸入過(guò)濾條件“region=3”。得到17個(gè)國(guó)家和地區(qū)。
2.主菜單中選擇Analyze→Scale→MultidimensionalScaling(ALSCAL)。就進(jìn)入多維標(biāo)度法的主對(duì)話框(圖10.3)。在左上方是變量列表選擇以下變量:urban(城市人口比例),lifeexpf(女性平均壽命),lifeexpm(男性平均壽命),gdp_cap(人均GDP),death_rt(千人死亡率),birth_rt(千人出生率),literacy(受教育人口比例)。由于原始數(shù)據(jù)不是距離陣,因此需要在下方Distances單選項(xiàng)中選擇Createdistancesfromdata,這時(shí)Measure子對(duì)話框被激活,默認(rèn)計(jì)算Euclideandistance,即歐氏距離。目前一百三十一頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn)圖10.3多維標(biāo)度法的主對(duì)話框目前一百三十二頁(yè)\總數(shù)一百四十六頁(yè)\編于十八點(diǎn) 3.點(diǎn)擊進(jìn)入Measure子對(duì)話框,對(duì)距離陣進(jìn)行設(shè)定,(圖10.4)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年工作趨勢(shì)報(bào)告+Work+Trends+Report+2025
- 臨時(shí)平房出售合同范例
- 作品展合同范本
- 公司經(jīng)理合同范例
- fob條款進(jìn)口合同范例
- 兄弟間合伙做生意合同范例
- 內(nèi)賬報(bào)稅合同范例
- 共同開廠合同范例
- 出口產(chǎn)品退回合同范例
- 借用戶頭合同范例
- 【學(xué)前教育小學(xué)化成因分析及其對(duì)策10000字(論文)】
- 腕管綜合征課件
- 事業(yè)單位工作人員年度考核登記表(通用模板)
- 人教版七年級(jí)數(shù)學(xué)下冊(cè)《垂線》
- 公開選拔村級(jí)后備干部報(bào)名登記表
- 2022年湖南公務(wù)員考試《申論》真題套卷(鄉(xiāng)鎮(zhèn)卷)2
- 【薪酬】國(guó)有企業(yè)中長(zhǎng)期股權(quán)激勵(lì)課件
- 《新聞攝影教程(第五版)》第三章 新聞攝影工作者的職責(zé)與素養(yǎng)
- 學(xué)前兒童行為觀察第一章觀察概述課件
- 化學(xué)品防范說(shuō)明編碼
- 帕金森病(英文版)課件
評(píng)論
0/150
提交評(píng)論