對應(yīng)分析原理_第1頁
對應(yīng)分析原理_第2頁
對應(yīng)分析原理_第3頁
對應(yīng)分析原理_第4頁
對應(yīng)分析原理_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多元統(tǒng)計分析2021/6/271§7.1列聯(lián)表及列聯(lián)表分析§7.2對應(yīng)分析的基本理論§7.3對應(yīng)分析的步驟及邏輯框圖§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)第七章對應(yīng)分析

2021/6/272中國人民大學(xué)六西格瑪質(zhì)量管理研究中心2024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心3目錄上頁下頁返回結(jié)束第七章對應(yīng)分析對應(yīng)分析是R型因子分析與Q型因子分析的結(jié)合,它也是利用降維的思想以達(dá)到簡化數(shù)據(jù)結(jié)構(gòu)的目的,不過,與因子分析不同的是,它同時對數(shù)據(jù)表中的行與列進(jìn)行處理,尋求以低維圖形表示數(shù)據(jù)表中行與列之間的關(guān)系。對應(yīng)分析的思想首先由(Richardson)和(Kuder)在1933年提出,后來法國統(tǒng)計學(xué)家(Jean-PaulBenzécri)和日本統(tǒng)計學(xué)家林知己夫(ChikioHayashi)對該方法進(jìn)行了詳細(xì)的論述而使其得到了發(fā)展。對應(yīng)分析方法廣泛用于對由屬性變量構(gòu)成的列聯(lián)表數(shù)據(jù)的研究,利用對應(yīng)分析可以在一張二維圖上同時畫出屬性變量不同取值的情況,列聯(lián)表的每一行及每一列均以二維圖上的一個點(diǎn)來表示,以直觀、簡潔的形式描述屬性變量各種狀態(tài)之間的相互關(guān)系及不同屬性變量之間的相互關(guān)系。2021/6/273目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析在討論對應(yīng)分析之前,我們先簡要回顧一下列聯(lián)表及列聯(lián)表分析的有關(guān)內(nèi)容。在實(shí)際研究工作中,人們常常用列聯(lián)表的形式來描述屬性變量(定類尺度或定序尺度)的各種狀態(tài)或是相關(guān)關(guān)系,這在某些調(diào)查研究項目中運(yùn)用得尤為普遍。比如,公司的管理者為了了解消費(fèi)者對自己產(chǎn)品的滿意情況,需要針對不同職業(yè)的消費(fèi)者進(jìn)行調(diào)查,而調(diào)查數(shù)據(jù)很自然的就以列聯(lián)表的形式提交出來。見表7-1所示。2021/6/274中國人民大學(xué)六西格瑪質(zhì)量管理研究中心2024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心5目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析以上是兩變量列聯(lián)表的一般形式,橫欄與縱欄交叉位置的數(shù)字是相應(yīng)的頻數(shù)。這樣表露數(shù)據(jù)就可以清楚地看到不同職業(yè)的人對該公司產(chǎn)品的評價,以及所有被調(diào)查者對該公司產(chǎn)品的整體評價、被調(diào)查者的職業(yè)構(gòu)成情況等信息;通過這張列聯(lián)表,還可以看出職業(yè)分布與各種評價之間的相關(guān)關(guān)系,如管理者與比較滿意交叉單元格的數(shù)字相對較大(“相對”指應(yīng)抵消不同職業(yè)在總的被調(diào)查對象中的比例的影響),則說明職業(yè)欄的管理者這一部分與評價欄的比較滿意這一部分有較強(qiáng)的相關(guān)性。由此可以看到,借助列聯(lián)表,人們可以得到很多有價值的信息。2021/6/2752024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心6目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析在研究經(jīng)濟(jì)問題的時候,研究者也往往用列聯(lián)表的形式把數(shù)據(jù)呈現(xiàn)出來。比如說橫欄是不同規(guī)模的企業(yè),縱欄是不同水平的獲利能力,通過這樣的形式,可以研究企業(yè)規(guī)模與獲利能力之間的關(guān)系。更為一般的,可以對企業(yè)進(jìn)行更廣泛的分類,如按上市與非上市分類,按企業(yè)所屬的行業(yè)分類,按不同所有制關(guān)系分類等。同時用列聯(lián)表的格式來研究企業(yè)的各種指標(biāo),如企業(yè)的盈利能力、企業(yè)的償債能力、企業(yè)的發(fā)展能力等。這些指標(biāo)即可以是簡單的,也可以是綜合的,甚至可以是用因子分析或主成分分析提取的公因子;把這些指標(biāo)按一定的取值范圍進(jìn)行分類,就可以很方便地用列聯(lián)表來研究。

2021/6/2762024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心7目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/2772024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心8目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/2782024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心9目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/2792024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心10目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/27102024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心11目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/27112024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心12目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/27122024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心13目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/27132024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心14目錄上頁下頁返回結(jié)束§7.1列聯(lián)表及列聯(lián)表分析2021/6/27142024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心15目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27152024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心16目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

假定我們下面討論的都是形如表7-3的規(guī)格化的列聯(lián)表數(shù)據(jù)。為了論述方便,先對有關(guān)概念進(jìn)行說明。

2021/6/27162024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心17目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

7.2.1有關(guān)概念1.行剖面與列剖面2021/6/27172024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心18目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27182024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心19目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27192024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心20目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27202024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心21目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2.距離與總慣量

2021/6/27212024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心22目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27222024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心23目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27232024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心24目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27242024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心25目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27252024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心26目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

因此,此處總慣量也反映了兩個屬性變量各狀態(tài)之間的相關(guān)關(guān)系。對應(yīng)分析就是在對總慣量信息損失最小的前提下,簡化數(shù)據(jù)結(jié)構(gòu)以反映兩屬性變量之間的相關(guān)關(guān)系。實(shí)際上,總慣量的概念類似于主成分分析或因子分析中方差總和的概念,在SPSS軟件中進(jìn)行對應(yīng)分析時,系統(tǒng)會給出對總慣量信息的提取情況。2021/6/27262024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心27目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

7.2.2對應(yīng)分析的基本理論經(jīng)過以上數(shù)據(jù)變換,在引入加權(quán)距離函數(shù)之后,或是對行剖面集的各點(diǎn)進(jìn)行式(7.8)的變換,對列剖面的各點(diǎn)進(jìn)行類似變換之后,就可以直接計算屬性變量各狀態(tài)之間的距離,通過距離的大小來反映各狀態(tài)之間的接近程度,同類型的狀態(tài)之間距離應(yīng)當(dāng)較短,而不同類型的狀態(tài)之間的距離應(yīng)當(dāng)較長,據(jù)此可以對各種狀態(tài)進(jìn)行分類以簡化數(shù)據(jù)結(jié)構(gòu)。但是,這樣做不能對兩個屬性變量同時進(jìn)行分析,因此不計算距離,代之求協(xié)方差矩陣,進(jìn)行因子分析,提取主因子,用主因子所定義的坐標(biāo)軸作為參照系,對兩個變量的各狀態(tài)進(jìn)行分析。2021/6/27272024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心28目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27282024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心29目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27292024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心30目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27302024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心31目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27312024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心32目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27322024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心33目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27332024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心34目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27342024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心35目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

7.2.3對應(yīng)分析應(yīng)用于定量變量的情況上面對對應(yīng)分析方法的描述都是以屬性變量數(shù)據(jù)為例展開的,這是因為在實(shí)際中對應(yīng)分析廣泛地應(yīng)用于對屬性變量列聯(lián)表數(shù)據(jù)的研究,實(shí)際上,對應(yīng)分析方法也適用于定距尺度與定比尺度的數(shù)據(jù)。

2021/6/27352024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心36目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

其實(shí),對于定距尺度與定比尺度的情況,完全可以把每一個觀測都分別看成是一類,這也是對原始數(shù)據(jù)進(jìn)行的最細(xì)的分類;同時把每一個變量都看成是一類。這樣,對定距尺度數(shù)據(jù)與定比尺度數(shù)據(jù)的處理問題就變成與上面分析屬性變量相同的問題了,自然可以運(yùn)用對應(yīng)分析來研究行與列之間的相關(guān)關(guān)系。

2021/6/27362024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心37目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

7.2.4需要注意的問題需要注意的是,同對應(yīng)分析生成的二維圖上的各狀態(tài)點(diǎn),實(shí)際上是兩個多維空間上的點(diǎn)的二維投影,在某些特殊的情況下,在多維空間中相隔較遠(yuǎn)的點(diǎn),在二維平面上的投影卻很接近。此時,我們需要對二維圖上的各點(diǎn)做更深的了解,即哪些狀態(tài)對公因子的貢獻(xiàn)較大,這與在因子分析中判斷原始變量對公因子貢獻(xiàn)的方法類似。2021/6/27372024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心38目錄上頁下頁返回結(jié)束§7.2對應(yīng)分析的基本理論

2021/6/27382024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心39目錄上頁下頁返回結(jié)束§7.3對應(yīng)分析的步驟及邏輯框圖

7.3.1對應(yīng)分析的步驟2021/6/27392024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心40目錄上頁下頁返回結(jié)束§7.3對應(yīng)分析的步驟及邏輯框圖

7.3.2對應(yīng)分析的邏輯框圖

2021/6/27402024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心41目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)

SPSS軟件的CorrespondenceAnalysis模塊是專門進(jìn)行對應(yīng)分析的模塊。下面我們舉例說明用CorrespondenceAnalysis模塊進(jìn)行對應(yīng)分析的方法?!纠?-1】選用SPSS軟件自帶的GSS93subset.sav數(shù)據(jù),該數(shù)據(jù)在SPSS軟件的安裝目錄下可以找到,該數(shù)據(jù)共包括1500個觀測,67個變量。我們僅借助它來說明CorrespondenceAnalysis模塊的使用方法,不對其具體意義作過多的分析。選用該數(shù)據(jù)集中Degree(學(xué)歷)與Race(人種)變量為例來說明。其中Degree變量是定類尺度的,其各個取值的含義如下:0—中學(xué)以下(lessthanhighschool),1—中學(xué)(highschool),2—???juniorcollege),3—本科(bachelor),4—研究生(graduate),7,8,9—缺失;Race變量是定名尺度的,其各個取值的含義如下:1—白種人(white),2—黑種人(black),3—其他(other)。2021/6/27412024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心42目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)打開GSS93subset.sav數(shù)據(jù),對變量Degree與變量Race進(jìn)行對應(yīng)分析,依次點(diǎn)選Analyze→DataReduction→CorrespondenceAnalysis…進(jìn)入CorrespondenceAnalysis對話框。數(shù)據(jù)集中所有的變量名(標(biāo)簽)均已出現(xiàn)左邊的窗口中,將Degree變量選入右側(cè)行變量(Row)的小窗口中,此時該窗口顯示的Degree變量形如:Degree(??),同時,其下方的DefineRange按鈕被擊活,點(diǎn)擊該按鈕,進(jìn)入DefineRowRange對話框,在該對話框中需要確定Degree變量的取值范圍,此處我們不研究缺失值,最小值(minimumvalue)與最大值(maximumvalue)處分別填上0和4,按右側(cè)的update(更新)按鈕,可以看到Degree的取值0—4已出現(xiàn)在CategoryConstraints框架左側(cè)的窗口中,該框架的作用是對Degree的各狀態(tài)加以限定條件的,保持默認(rèn)值none不變,即對Degree的取值不加以限定條件。2021/6/27422024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心43目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)點(diǎn)擊Continue繼續(xù),回到CorrespondenceAnalysis對話框,可以看到,此時行變量Degree的顯示變?yōu)镈egree(04),按同樣的方法把Race選為列變量且設(shè)定其取值范圍為1—3,點(diǎn)擊OK按鈕運(yùn)行,則可以得到如下輸出結(jié)果7-1:2021/6/27432024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心44目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27442024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心45目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27452024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心46目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27462024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心47目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27472024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心48目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27482024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心49目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)在同一變量內(nèi)部,最高學(xué)歷為Highschool及以上的各狀態(tài)之間距離相近,而lessthanhighschool可以單獨(dú)歸為一類;對于人種,Black、white、other之間的距離均很大,很明顯形成三大類。同時考查兩變量各狀態(tài),可以看到白種人(white)受教育程度一般較高,其與學(xué)歷較高的點(diǎn)比較接近,而黑種人明顯學(xué)歷較低,與lessthanhighschool比較靠近。Other的最高學(xué)歷沒有顯著特點(diǎn)。2021/6/27492024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心50目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)以上是SPSS默認(rèn)設(shè)置得到的結(jié)果,實(shí)際研究時,可以根據(jù)不同的研究目的對有關(guān)設(shè)置進(jìn)行修改。下面對SPSS提供的有關(guān)選項進(jìn)行簡要說明。在CorrespondenceAnalysis對話框中點(diǎn)擊下方的Model按鈕進(jìn)入Model對話框,在該對話框中,可以設(shè)定進(jìn)行對應(yīng)分析的有關(guān)方法:在上部DimensionsinSolution處可以規(guī)定對應(yīng)分析的最大維數(shù),默認(rèn)維數(shù)是2,由該章的論述知,最大維數(shù)應(yīng)該是min(n,p)-1,此處保留默認(rèn)值即可。

2021/6/27502024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心51目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)DistanceMeasure對話框中可以規(guī)定距離量度方法,默認(rèn)為卡方距離,也就是加權(quán)的歐氏距離,還可以規(guī)定用歐氏距離(Euclidean),在StandardizationMethod對話框中可以規(guī)定標(biāo)準(zhǔn)化方法,若距離的量度使用卡方距離,則應(yīng)使用默認(rèn)的標(biāo)準(zhǔn)化方法,即對行與列均進(jìn)行中心化處理,若選擇歐氏距離,則有不同的標(biāo)準(zhǔn)化方法可以選擇,此處不再詳述。2021/6/27512024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心52目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)最下方NormalizationMethod框架中可以規(guī)定不同的正態(tài)化方法,默認(rèn)為Symmetrical方法,當(dāng)我們進(jìn)行分析的目的是考查兩變量各狀態(tài)之間的差異性或相似性時,應(yīng)選擇此方法。當(dāng)我們的目的是考查兩個屬性變量之間各狀態(tài)及同一變量內(nèi)部各狀態(tài)之間的差異性時,則應(yīng)當(dāng)選擇principal方法,當(dāng)我們的目的是考查不同行(列)之間的差異性或相似性時,則當(dāng)選擇Rowprincipal(Columnprincipal),而選中Custom并自己設(shè)定一個-1——1之間的值,則可能輸出更容易解釋的二維圖。2021/6/27522024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心53目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)在CorrespondenceAnalysis對話框中點(diǎn)擊Statistics按鈕,進(jìn)入Statistics對話框,選中Rowprofiles和Columnprofiles交由程序運(yùn)行則除上面的結(jié)果外還可以輸出行剖面與列剖面,見輸出結(jié)果7.3:2021/6/27532024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心54目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)在Statistics對話框中選擇其他選項,可以輸出一些有用的統(tǒng)計量,這些統(tǒng)計量有助于檢驗對應(yīng)分析的效果,此處不再詳述。在CorrespondenceAnalysis對話框中,點(diǎn)擊Plots按鈕進(jìn)入Plots對話框,看到在Scatterplots框架中,系統(tǒng)默認(rèn)輸出Biplot,即在同一張二維圖上同時輸出兩個屬性變量的各個狀態(tài),為了考查列聯(lián)表各行(列)之間的相關(guān)性,有時候有必要輸出僅包括一個變量各種狀態(tài)參數(shù)的二維圖,選擇Rowpoints及Columnpoints可以實(shí)現(xiàn)。同時選中Rowpoints與Columnpoints并交由程序運(yùn)行,則可以得到如下輸出結(jié)果:2021/6/27542024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心55目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27552024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心56目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)這樣可以更清楚地考查每一變量各個狀態(tài)之間的距離或接近程度。SPSS軟件還提供了許多其他有用的選項,可以針對不同的研究問題及研究目的選擇這些選項以得到更多的結(jié)果,此處我們不再詳細(xì)說明。因為對應(yīng)分析所需的數(shù)據(jù)是原始列聯(lián)表數(shù)據(jù),所以SPSS軟件也提供了直接讀入列聯(lián)表數(shù)據(jù)的功能,對上例,就不用從原始1500條觀測開始進(jìn)行分析,也更提高了分析的效率。由分析結(jié)果7.1對列聯(lián)表作如下變換:2021/6/27562024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心57目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)在SPSS的數(shù)據(jù)窗口輸入以上數(shù)據(jù),然后依次點(diǎn)選Data→WeightCases…進(jìn)入WeightCases對話框,系統(tǒng)默認(rèn)是對觀測不使用權(quán)重,選中WeightCasesby選項,此時下面的Frequencyvariable被擊活,選中freq并點(diǎn)擊向右的箭頭,使變量freq充當(dāng)權(quán)數(shù)的作用,點(diǎn)擊OK。然后按上面所述方法選擇變量,設(shè)定取值范圍并進(jìn)行分析(此處行變量為Row,取值范圍為0—4;列變量為Column,取值范圍為1—3),可以得到與上面一致的結(jié)果,為了比較,此處僅給出所輸出的列聯(lián)表,如下:2021/6/27572024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心58目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)可以看到,列聯(lián)表與上面輸出結(jié)果7.1是相同的,但此處由于沒有對Row與Column的取值設(shè)定標(biāo)簽,所以顯示的是其實(shí)際取值,這可以在VariableView窗口進(jìn)行設(shè)定,此處不再進(jìn)行說明。這樣讀入數(shù)據(jù)仍然有些麻煩,利用SPSS的語法可以讀入按列聯(lián)表分布形式的數(shù)據(jù),實(shí)際上,利用SPSS語法可以靈活地讀入以上各種格式的數(shù)據(jù)。我們給出上例的情況所用的程序,但不再詳細(xì)說明:2021/6/27582024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心59目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2021/6/27592024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心60目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)前面的例子是關(guān)于利用對應(yīng)分析對交叉表數(shù)據(jù)進(jìn)行分析,下面通過例題講述如何利用對應(yīng)分析對分類匯總數(shù)據(jù)進(jìn)行對應(yīng)分析。分類匯總的數(shù)據(jù)單元格內(nèi)不再是頻數(shù),而是相應(yīng)的統(tǒng)計指標(biāo),如均數(shù)等。對匯總數(shù)據(jù)由于單元格內(nèi)不再是頻數(shù),不存在行、列合計頻數(shù),也就不能再像交叉表時一樣基于無效假設(shè)計算標(biāo)化殘差,而是使用歐氏距離來代表相應(yīng)單元格數(shù)值偏離無關(guān)聯(lián)假設(shè)的程度,由于指標(biāo)量綱以及量級的差異,對應(yīng)分析中針對歐氏距離提供了5種標(biāo)準(zhǔn)化方法,含義如下:(1)RowandColumnMeansRemoved:為缺省設(shè)置,在數(shù)據(jù)標(biāo)準(zhǔn)化時將行合計均數(shù)以及列合計均數(shù)的影響都移去,這樣行、列類別間均數(shù)的差異不再對結(jié)果產(chǎn)生影響,在結(jié)果中呈現(xiàn)的只是行、列變量類別間的交互作用。2021/6/27602024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心61目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)(2)Row/ColumnMeansRemoved:在數(shù)據(jù)標(biāo)準(zhǔn)化時只移除行/列變量合計均數(shù)差異的影響,這樣行/列均數(shù)的差異不再對結(jié)果產(chǎn)生影響,在結(jié)果中呈現(xiàn)的只是列/行變量類別間的差異。(3)Row/ColumnTotalsareEqualizedandRow/ColumnMeansRemoved:在數(shù)據(jù)標(biāo)準(zhǔn)化時首先將原始數(shù)據(jù)除以行/列合計,然后再移除行、列均數(shù)的影響。距離測量方式以及相應(yīng)的距離標(biāo)準(zhǔn)化方法均在Model子對話框中選擇,在對歐氏距離進(jìn)行標(biāo)準(zhǔn)化后,剩余的步驟就與普通的對應(yīng)分析完全相同。對一個具體問題,如何選擇以上五種標(biāo)準(zhǔn)化方法有賴于具體的研究目的,一般是在對問題進(jìn)行定性分析基礎(chǔ)上,選擇合適的方法以便對定性分析的結(jié)論進(jìn)行實(shí)證分析。下面通過一個具體問題說明該方法的應(yīng)用。2021/6/27612024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心62目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)【例7-2】按現(xiàn)行統(tǒng)計報表制度,農(nóng)民家庭人均純收入主要由四部分構(gòu)成,即工資性收入、家庭經(jīng)營純收入、財產(chǎn)性收入、轉(zhuǎn)移性收入。表7-6列出了2005年我國31省、市、自治區(qū)農(nóng)民家庭純收入的數(shù)據(jù)。試進(jìn)行對應(yīng)分析,揭示全國農(nóng)民人均純收入的特征以及各省、市、自治區(qū)與各收入指標(biāo)間的關(guān)系。2021/6/27622024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心63目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)軟件SPSS進(jìn)行實(shí)際操作和分析,如下操作步驟:1.打開SPSS文件,在表格下方有兩個選項分別是DataView和VariableView,點(diǎn)擊VariableView選項,將各選項改為如下形式。2021/6/27632024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心64目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)其中Values項需要作如下設(shè)置:在彈出的對話框里,對北京至新疆的31省市以及工資等四項收入進(jìn)行數(shù)字附值。然后點(diǎn)擊DataView進(jìn)行如下數(shù)據(jù)的輸入

2021/6/27642024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心65目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)在SPSS的數(shù)據(jù)窗口輸入以上數(shù)據(jù),然后依次點(diǎn)選Data→WeightCases…進(jìn)入WeightCases對話框,系統(tǒng)默認(rèn)是對觀測不使用權(quán)重,選中WeightCasesby選項,此時下面的Frequencyvariable被擊活,選中money并點(diǎn)擊向右的箭頭,使變量money充當(dāng)權(quán)數(shù)的作用,點(diǎn)擊OK。2021/6/27652024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心66目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)2.數(shù)據(jù)輸入完成后,選擇Analyze—DataReduction—CorrespondenceAnalysis,然后把“省區(qū)”選入“Row”,在點(diǎn)擊DefineRange來定義范圍為1(Minimumvalue)到31(Maximumvalue),之后點(diǎn)擊Update,再點(diǎn)擊Continue。之后同樣地,把“收入類別”選入Column,并定義其范圍為1到4。如下圖2021/6/27662024/12/26中國人民大學(xué)六西格瑪質(zhì)量管理研究中心67目錄上頁下頁返回結(jié)束§7.4對應(yīng)分析的上機(jī)實(shí)現(xiàn)然后點(diǎn)選Model,在出現(xiàn)的對話框中選擇數(shù)據(jù)標(biāo)準(zhǔn)化方法,本例DistanceMeasure點(diǎn)選Euclidean,下面的Stan

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論