




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)學(xué)─從數(shù)據(jù)到結(jié)論第十三章典型相關(guān)分析13.1兩組變量的相關(guān)問(wèn)題
我們知道如何衡量?jī)蓚€(gè)變量之間是否相關(guān)的問(wèn)題;這是一個(gè)簡(jiǎn)單的公式就可以解決的問(wèn)題(Pearson相關(guān)系數(shù)、Kendall’st、Spearman秩相關(guān)系數(shù))。公式如果我們有兩組變量,如何能夠表明它們之間的關(guān)系呢?
例子(數(shù)據(jù)tv.txt)
業(yè)內(nèi)人士和觀眾對(duì)于一些電視節(jié)目的觀點(diǎn)有什么樣的關(guān)系呢?該數(shù)據(jù)是不同的人群對(duì)30個(gè)電視節(jié)目所作的平均評(píng)分。觀眾評(píng)分來(lái)自低學(xué)歷(led)、高學(xué)歷(hed)和網(wǎng)絡(luò)(net)調(diào)查三種,它們形成第一組變量;而業(yè)內(nèi)人士分評(píng)分來(lái)自包括演員和導(dǎo)演在內(nèi)的藝術(shù)家(arti)、發(fā)行(com)與業(yè)內(nèi)各部門主管(man)三種,形成第二組變量。人們對(duì)這樣兩組變量之間的關(guān)系感到興趣。尋找代表
如直接對(duì)這六個(gè)變量的相關(guān)進(jìn)行兩兩分析,很難得到關(guān)于這兩組變量之間關(guān)系的一個(gè)清楚的印象。希望能夠把多個(gè)變量與多個(gè)變量之間的相關(guān)化為兩個(gè)變量之間的相關(guān)?,F(xiàn)在的問(wèn)題是為每一組變量選取一個(gè)綜合變量作為代表;而一組變量最簡(jiǎn)單的綜合形式就是該組變量的線性組合。13.2典型相關(guān)分析由于一組變量可以有無(wú)數(shù)種線性組合(線性組合由相應(yīng)的系數(shù)確定),因此必須找到既有意義又可以確定的線性組合。典型相關(guān)分析(canonicalcorrelationanalysis)就是要找到這兩組變量線性組合的系數(shù)使得這兩個(gè)由線性組合生成的變量(和其他線性組合相比)之間的相關(guān)系數(shù)最大。
典型變量假定兩組變量為X1,X2…,Xp和Y1,Y2,…,Yq,那么,問(wèn)題就在于要尋找系數(shù)a1,a2…,ap和b1,b2,…,bq,和使得新的綜合變量(亦稱為典型變量(canonicalvariable))之間的相關(guān)關(guān)系最大。這種相關(guān)關(guān)系是用典型相關(guān)系數(shù)(canonicalcorrelationcoefficient)來(lái)衡量的。典型相關(guān)系數(shù)
這里所涉及的主要的數(shù)學(xué)工具還是矩陣的特征值和特征向量問(wèn)題。而所得的特征值與V和W的典型相關(guān)系數(shù)有直接聯(lián)系。由于特征值問(wèn)題的特點(diǎn),實(shí)際上找到的是多組典型變量(V1,W1),(V2,W2),…,其中V1和W1最相關(guān),而V2和W2次之等等,典型相關(guān)系數(shù)
而且V1,V2,V3,…之間及而且W1,W2,W3,…之間互不相關(guān)。這樣又出現(xiàn)了選擇多少組典型變量(V,W)的問(wèn)題了。實(shí)際上,只要選擇特征值累積總貢獻(xiàn)占主要部分的那些即可。軟件還會(huì)輸出一些檢驗(yàn)結(jié)果;于是只要選擇顯著的那些(V,W)。對(duì)實(shí)際問(wèn)題,還要看選取的(V,W)是否有意義,是否能夠說(shuō)明問(wèn)題才行。至于得到(V,W)的計(jì)算,則很簡(jiǎn)單,下面就tv.txt數(shù)據(jù)進(jìn)行分析。數(shù)學(xué)原理?計(jì)算結(jié)果第一個(gè)表為判判斷這兩組變變量相關(guān)性的的若干檢驗(yàn),,包括Pillai跡檢檢驗(yàn),Hotelling-Lawley跡檢檢驗(yàn),Wilksl檢驗(yàn)和Roy的最大根檢檢驗(yàn);它們都都是有兩個(gè)自自由度的F檢檢驗(yàn)。該表給給出了每個(gè)檢檢驗(yàn)的F值,,兩個(gè)自由度度和p值(均為0.000)。。計(jì)算結(jié)果下面一個(gè)表給給出了特征根根(Eigenvalue),特征征根所占的百百分比(Pct)和累積積百分比(Cum.Pct)和典典型相關(guān)系數(shù)數(shù)(CanonCor)及其平方方(Sq.Cor)。??磥?lái),頭兩兩對(duì)典型變量量(V,W)的累積特征征根已經(jīng)占了了總量的99.427%。它們的典典型相關(guān)系數(shù)數(shù)也都在0.95之上。。計(jì)算結(jié)果對(duì)于眾多的計(jì)計(jì)算機(jī)輸出挑挑出一些來(lái)介介紹。下面表表格給出的是是第一組變量量相應(yīng)于上面面三個(gè)特征根根的三個(gè)典型型變量V1、V2和V3的系數(shù),即典典型系數(shù)(canonicalcoefficient)。注意,,SPSS把把第一組變量量稱為因變量量(dependentvariables),而把第第二組稱為協(xié)協(xié)變量(covariates);;顯然,這兩兩組變量是完完全對(duì)稱的。。這種命名僅僅僅是為了敘敘述方便。這些系數(shù)以兩兩種方式給出出;一種是沒(méi)沒(méi)有標(biāo)準(zhǔn)化的的原始變量的的線性組合的的典型系數(shù)(rawcanonicalcoefficient),一種是是標(biāo)準(zhǔn)化之后的典型系系數(shù)(standardizedcanonicalcoefficient)。標(biāo)準(zhǔn)準(zhǔn)化的典型系系數(shù)直觀上對(duì)對(duì)典型變量的的構(gòu)成給人以以更加清楚的的印象??梢钥闯?,頭頭一個(gè)典型變變量V1相應(yīng)于前面第第一個(gè)(也是是最重要的))特征值,主主要代表高學(xué)學(xué)歷變量hed;而相應(yīng)應(yīng)于前面第二二個(gè)(次要的的)特征值的的第二個(gè)典型型變量V2主要代表低學(xué)學(xué)歷變量led和部分的的網(wǎng)民變量net,但高高學(xué)歷變量在在這里起負(fù)面面作用。計(jì)算結(jié)果類似地,也可可以得到被稱稱為協(xié)變量(covariate)的標(biāo)準(zhǔn)化的的第二組變量量的相應(yīng)于頭頭三個(gè)特征值值得三個(gè)典型型變量W1、W2和W2的系數(shù):。。例子結(jié)論從這兩個(gè)表中中可以看出,,V1主要和變量hed相關(guān),,而V2主要和led及net相相關(guān);W1主要和變量arti及man相關(guān),,而W2主要和com相關(guān);這和和它們的典型型系數(shù)是一致致的。由于V1和W1最相關(guān),這說(shuō)說(shuō)明V1所代表的高學(xué)學(xué)歷觀眾和W1所主要代表的的藝術(shù)家(arti)及及各部門經(jīng)理理(man)觀點(diǎn)相關(guān);;而由于V2和W2也相關(guān),這說(shuō)說(shuō)明V2所代表的低學(xué)學(xué)歷(led)及以年輕輕人為主的網(wǎng)網(wǎng)民(net)觀眾和W2所主要代表的的看重經(jīng)濟(jì)效效益的發(fā)行人人(com)觀點(diǎn)相關(guān),,但遠(yuǎn)遠(yuǎn)不如如V1和W1的相關(guān)那么顯顯著(根據(jù)特特征值的貢獻(xiàn)獻(xiàn)率)。SPSS的實(shí)現(xiàn)對(duì)例tv.sav,首先先打開(kāi)例14.1的SPSS數(shù)據(jù)tv.sav,通過(guò)File-New--Syntax打開(kāi)一個(gè)個(gè)空白文件((默認(rèn)文件名名為Syntax1.sps),再再在其中鍵入入下面命令行行:MANOVAledhednetWITHarticomman/DISCRIMALLALPHA(1)/PRINT=SIG(EIGENDIM).再點(diǎn)擊一個(gè)向向右的三角形形圖標(biāo)(運(yùn)行目前程序序,Runcurrent),就可以得到到所需結(jié)果了了。還可以把Syntax1.sps另以其他名名字(比如tv.sps)存入一個(gè)個(gè)文件夾。下下次使用時(shí)就就可以通過(guò)File-Open-Syntax來(lái)打開(kāi)這個(gè)個(gè)文件了。SPSS的實(shí)現(xiàn)注意1:典型型相關(guān)分析是是本書內(nèi)容中中唯一不能用用SPSS的的點(diǎn)擊鼠標(biāo)的的“傻瓜”方方式,而必須須用寫入程序序行來(lái)運(yùn)行的的模型。讀者者不必要再去去研究語(yǔ)法的的細(xì)節(jié),只要要能夠舉一反反三,套用這這個(gè)例子的程程序即可。當(dāng)然,如果讀讀者愿意學(xué)習(xí)習(xí)SPSS的的語(yǔ)法,則在在處理數(shù)據(jù)時(shí)時(shí),肯定會(huì)更更方便。SPSS的實(shí)現(xiàn)注意2:一些些SPSS的的輸出很長(zhǎng),,這時(shí)輸出窗窗口截去了一一些內(nèi)容沒(méi)有有顯示(這有有些隨意性))。這時(shí)輸出出窗口(SPSSViewer)中結(jié)果的左左下角有一個(gè)個(gè)紅色的三角角型。如果想要看全全部?jī)?nèi)容,可可以先點(diǎn)擊鼠鼠標(biāo)左鍵,選選中輸出結(jié)果果,然后從點(diǎn)點(diǎn)右鍵得到的的菜單中選擇擇Export,就可以以把全部結(jié)果果(包括截去去的部分)存存入一個(gè)htm形式的文文件了供研究究和打印之用用。附錄兩個(gè)變量時(shí),用線性相關(guān)關(guān)系數(shù)研究?jī)蓚€(gè)變量量之間的線性性相關(guān)性:返回典型相關(guān)分析析目的:研究多個(gè)變量量之間的相關(guān)關(guān)性方法:利用主主成分思想,可以把多個(gè)個(gè)變量與多個(gè)個(gè)變量之間的的相關(guān)化為兩兩個(gè)變量之間間的相關(guān).即即找一組系系數(shù)(向量)l和m,使新變量量U=l’X(1)和V=m’X(2)有最大可能的的相關(guān)關(guān)系.數(shù)學(xué):設(shè)兩組隨機(jī)變變量而的協(xié)方差陣S>0,均值向向量m=0,S的剖分為:對(duì)于前面的新新變量U=l’X(1)和V=m’X(2)Var(U)=Var(l’X(1))=l’S11lVar(V)=Var(m’X(2))=m’S22mCov(U,V)=l’’S12m,rUV=l’S12m/[(l’’S11l)(m’S22m)]?我們?cè)噲D在約約束條件Var(U)=1,Var(V)=1下尋求l和m使rUV=Cov(U,V)=l’S12m達(dá)到最大.這是Lagrange乘乘數(shù)法求下面面f的極大值經(jīng)過(guò)求偏導(dǎo)數(shù)數(shù)和解方程,得到l=n=l’S12m=Cov(U,V),及及因此l2既是A又是B的特征值,而相應(yīng)的的特征向量為為l,m可得到p1對(duì)線性組合Ui=l(i)’X(1),Vi=m(i)’X(2),稱每一對(duì)變變量為典型變量.其極大值稱為第一典型相關(guān)關(guān)系數(shù).一般只取前幾幾個(gè)影響大的的典型變量和和典型相關(guān)系系數(shù)來(lái)分析.A和B的特征征根有如下性性質(zhì):(1)A和B有相同的非非零特征根,(2)其其數(shù)目為p1.A和B的的特征根非負(fù)負(fù).(3)A和B的的特征根均在在0和1之間間.我們表示這些些稱為典型相關(guān)系數(shù)數(shù)的非零特征值值和相應(yīng)的特特征向量為典型變量的性性質(zhì):(1)X(1)和X(2)中的一切典型型變量都不相相關(guān).(2)X(1)和X(2)的同一對(duì)典型型變量Ui和Vi之間的相關(guān)系系數(shù)為li,不同對(duì)的的Ui和Vj(i≠j)之間不相關(guān)關(guān).樣本情況,只只要把S用樣本協(xié)差陣陣或樣本相關(guān)關(guān)陣R代替.下面回到我們們的例子。典型相關(guān)系數(shù)數(shù)的顯著性檢檢驗(yàn):首先看X(1)和X(2)是否相關(guān),如如不相關(guān),就就不必討論論.如果這是為檢驗(yàn)第第1個(gè)典型相相關(guān)系數(shù)的顯顯著性檢驗(yàn)統(tǒng)計(jì)量為為其中為為的的特征根.如果H0為檢驗(yàn)第r(r<k)個(gè)個(gè)典型相關(guān)系系數(shù)的顯著性性檢驗(yàn)統(tǒng)計(jì)量為為當(dāng)然在實(shí)際例例子中一般并并不知道S。因此在只有有樣本數(shù)據(jù)的的情況下,只只要把S用樣本協(xié)差陣陣或樣本相關(guān)關(guān)陣代替就行行了。但是這這時(shí)的特征根根可能不在0和1的范圍圍,因此會(huì)出出現(xiàn)軟件輸出出中的特征根根(比如大于于1)不等于于相關(guān)系數(shù)的的平
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能化系統(tǒng)安裝工程合同書
- 水利水電工程勞務(wù)承包合同
- 土地使用權(quán)征收補(bǔ)償合同協(xié)議
- 影視劇本供應(yīng)與購(gòu)買合同書版
- 規(guī)范化離婚合同文本范文
- 采購(gòu)合同簡(jiǎn)版-鋼材專項(xiàng)
- 婦科培訓(xùn)課件模板
- 小學(xué)生唱音階課件圖片
- 公證員網(wǎng)絡(luò)知識(shí)產(chǎn)權(quán)考核試卷
- 墨水制備實(shí)驗(yàn)室建設(shè)與管理考核試卷
- 中小學(xué)領(lǐng)導(dǎo)班子包級(jí)包組包班制度
- 汽車掛靠經(jīng)營(yíng)合同協(xié)議書模板
- 基坑土方開(kāi)挖專項(xiàng)施工方案(完整版)
- 電網(wǎng)工程設(shè)備材料信息參考價(jià)(2024年第四季度)
- 2025年江蘇農(nóng)牧科技職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年常考版參考題庫(kù)含答案解析
- 數(shù)據(jù)中心運(yùn)維服務(wù)投標(biāo)方案(技術(shù)標(biāo))
- 2024-2025學(xué)年山東省濰坊市高一上冊(cè)1月期末考試數(shù)學(xué)檢測(cè)試題(附解析)
- 電玩城培訓(xùn)課件
- 2024年湖南鐵道職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及答案解析word版
- 2023年蘇州衛(wèi)生職業(yè)技術(shù)學(xué)院高職單招(數(shù)學(xué))試題庫(kù)含答案解析
- 4D現(xiàn)場(chǎng)管理培訓(xùn)ppt課件(PPT 45頁(yè))
評(píng)論
0/150
提交評(píng)論