第9章對應分析_第1頁
第9章對應分析_第2頁
第9章對應分析_第3頁
第9章對應分析_第4頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第9章 對應分析v對應分析(correspondence analysis)是用于尋求列聯(lián)表的行和列之間聯(lián)系的一種低維圖形表示法,它可以從直覺上揭示出同一分類變量的各個類別之間的差異,以及不同分類變量各個類別之間的對應關系。v對應分析是由法國人Benzecri于1970年提出的,起初在法國和日本最為流行,然后引入美國。v在對應分析中,列聯(lián)表的每一行對應(通常是二維)圖中的一點,每一列也對應同一圖中的一點。本質(zhì)上,這些點都是列聯(lián)表的各行各列向一個二維歐式空間的投影,這種投影最大限度地保持了各行(或各列)之間的關系。第九章 對應分析v9.1 行輪廓和列輪廓v9.2 獨立性的檢驗和總慣性v9.3 行

2、、列輪廓的坐標v9.4 對應分析圖9.1 行輪廓和列輪廓v一、列聯(lián)表v二、對應矩陣v三、行、列輪廓一、列聯(lián)表v其中, 是第 行、第 列類別組合的頻數(shù), ; 為第 行的頻數(shù)之 和, ; 為第 列的頻數(shù)之和, ; 為所有類別組 合的頻數(shù)總和。 ijnij1,2, ,1,2,ip jq1qiijjnni1,2,ip1pjijinn1,2,jqj1111pqpqijijijijnnnn二、對應矩陣v這里, 。v顯然有 。 1111,qqppijijijijiijjijjjiinnnpppppnnn111pqijijppv稱 為對應矩陣。將對應矩陣表中的最后一列用 表示,即 其中 是元素均為1的 維向量

3、,最后一行用 表示,即 v其中 是元素均為1的 維向量,向量 和 的元素有時稱為行和列密度(masses)。 ijijpnnPr12,pppprP11,1,11q c12,qpppc1 P1,1,11prc三、行、列輪廓v第 行輪廓: 其各元素之和等于1 ,即 。v第 列輪廓: 其各元素之和等于1 ,即 。i1212,iqiqiiiiiiiiiiipnppnnpppnnnr1,1,2,iip r1j1212,jjpjjjpjjjjjjjjpppnnnpppnnnc1,1,2,jjq1 c行輪廓矩陣 v其中 。111121111221222122212qqrppppqpppppppppppppp

4、ppppppprrRD Pr12diag,rppppD列輪廓矩陣 v其中 。111121222122112121212,qqqqcqpppqqppppppppppppppppppCPDc cc12diag,cqpppD 可見, 可以表示成各列輪廓的加權平均。類似地, 即 可以表示成各行輪廓的加權平均。 121121,qccqjjjqpppprP1PDD 1c cccr11prriiipc1 P1 DD Pr c例9.1.1v將由個人組成的樣本按心理健康狀況與社會經(jīng)濟狀況進行交叉分類,分類結果見表9.1.3。 v 將表9.1.3中的數(shù)據(jù)除以,得到對應矩陣,列于表9.1.4中。表9.1.4給出的行

5、密度和列密度向量為0.1850.363,0.305,0.173,0.231,0.160,0.1310.2180.234rc 行輪廓矩陣為 列輪廓矩陣為10.3940.1860.2350.1170.0680.3120.1740.2340.1610.1180.3090.1800.2130.1490.1490.2210.1540.2420.2010.183rRD P10.2390.1990.1880.1360.0970.3710.3660.3670.3660.3270.2210.2260.2010.2040.2490.1700.2090.2450.2940.327cCPD兩個馬賽克圖 對心理健康的每

6、一種狀況,A、B、C、D、E五個小方塊的寬度顯示了行輪廓,0、1、2、3四種心理健康狀況的小方塊高度顯示了行密度。 對社會經(jīng)濟的每一種狀況,0、1、2、3四個小方塊的高度顯示了列輪廓,A、B、C、D、E五種社會經(jīng)濟狀況的小方塊寬度顯示了列密度。9.2 獨立性的檢驗和總慣量v一、行、列獨立的檢驗 v二、總慣量一、行、列獨立的檢驗v在列聯(lián)表中,檢驗行變量和列變量相互獨立假設的統(tǒng)計量為 當獨立性的原假設為真,且樣本容量 充分大,期望頻數(shù) 時, 近似服從自由度為 的卡方分布。拒絕規(guī)則為 若 ,則拒絕獨立性的原假設 其中 是 的上分位點。2211pqijijijijpp pnp pn5,1,2, ,1,

7、2,ijnp pipjq211pq221,1pq221,1pq21,1pq21,1pq二、總慣量 總慣量還可以行輪廓和列輪廓的形式表達如下:2211pqijijijijpp pnp p總慣量21111pqpijijiiiciijijpppppp rc Drc總慣量21111qpqijjijjjrjjijippppppcrDcr總慣量 其中 稱為第 行輪廓 到行輪廓中心 的卡方( )距離,它可看作是一個加權的平方歐氏距離。同樣, 是第 列輪廓 到列輪廓中心 的卡方距離。故總慣量可看成是行輪廓到其中心的卡方距離的加權平均,也可看成是列輪廓到其中心的卡方距離的加權平均。它既度量了行輪廓之間的總變差,

8、也度量了列輪廓之間的總變差。211qijijicijjpppprc Drcic2211pijjijrjiippppcrDcrjjcrir總慣量為零的等價情形 v總慣量為零與以下三種情形的任一種等價: (1) ,或表示為 ; (2)所有的行輪廓相等,即 ; (3)所有的列輪廓相等,即 。v所以,如果行變量與列變量相互獨立,則我們可以期望(由樣本數(shù)據(jù)構成的)列聯(lián)表中所有的行有相近的輪廓,所有的列亦有相近的輪廓。,1,2, ,1,2,ijijpp pip jqPrc12prrrc12qcccr9.3 行、列輪廓的坐標9.4 對應分析圖v一、行、列輪廓的逼近 v二、行(列)點之間的距離 v三、行點和列

9、點相近的意涵一、行、列輪廓的逼近二、行(列)點之間的距離v如果兩個行(列)點接近,則表明相應的兩個行(列)輪廓是類似的;反之,如果兩個行(列)點遠離,則表明相應的兩個行(列)輪廓是非常不同的。需要指出的是,行點與列點之間并沒有直接的距離關系。三、行點和列點相近的意涵v如果一個行點和一個列點相近,則表明行、列兩個變量的相應類別組合發(fā)生的頻數(shù)會高于這兩個變量相互獨立情形下的期望值。例9.4.1v 在例9.1.1中,經(jīng)計算,奇異值、主慣性以及貢獻率等的計算結果列于表9.4.1中??倯T量的94.75%可由第一維來解釋,前二維解釋了高達99.76%的總慣量,幾乎解釋了列聯(lián)表數(shù)據(jù)的所有變差。例9.4.1 行點和列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論