《典型相關(guān)分析》_第1頁
《典型相關(guān)分析》_第2頁
《典型相關(guān)分析》_第3頁
《典型相關(guān)分析》_第4頁
《典型相關(guān)分析》_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

典型相關(guān)分析研究多個變量與多個變量之間的相關(guān)性CanonicalCorrelation

1整理課件要點典型相關(guān)分析的數(shù)學(xué)表達方式,約束條件;典型相關(guān)系數(shù)的數(shù)學(xué)含義;典型變量的數(shù)學(xué)含義;典型相關(guān)系數(shù)的顯著性檢驗;冗余分析;典型相關(guān)的應(yīng)用2整理課件第一節(jié)典型相關(guān)分析的根本思想

當研究兩個變量x與y之間的相關(guān)關(guān)系時,相關(guān)系數(shù)是最常用的度量。如何研究兩組變量之間的相關(guān)關(guān)系呢?如何進一步確定兩組變量在整體上的相關(guān)程度呢?3整理課件通常情況下,為了研究兩組變量的相關(guān)關(guān)系,可以用最原始的方法,分別計算兩組變量之間的全部相關(guān)系數(shù),一共有pq個簡單相關(guān)系數(shù),這樣既煩瑣又不能抓住問題的本質(zhì)。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個線性組合,討論線性組合之間的相關(guān)關(guān)系,那么更簡捷。4整理課件典型相關(guān)分析〔CanonicalCorrelation〕是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。它能夠揭示出兩組變量之間的內(nèi)在聯(lián)系。5整理課件根本概念A(yù)nalyzetherelationshipsbetweentwosetsofvariablesCanonicalcorrelation(rc):CorrelationbetweentwocompositionofvariablesX1X2X3X4X5Y1Y2Y3Y4Y5rcRxxRyyRyxRxy6整理課件1936年霍特林〔Hotelling〕最早就“大學(xué)表現(xiàn)〞和“入學(xué)前成績〞的關(guān)系、政府政策變量與經(jīng)濟目標變量的關(guān)系等問題進行了研究,提出了典型相關(guān)分析技術(shù)。之后,Cooley和Hohnes(1971),Tatsuoka(1971)及Mardia,Kent和Bibby(1979)等人對典型相關(guān)分析的應(yīng)用進行了討論,Kshirsagar(1972)那么從理論上給出了最好的分析。7整理課件在解決實際問題中,這種方法有廣泛的應(yīng)用。如居民生活環(huán)境與健康狀況的關(guān)系;考察一些與財政政策有關(guān)的指標:財政支出總額增長率、財政赤字增長率、稅率降低,與經(jīng)濟開展的一系列指標如GDP增長率、就業(yè)增長率、物價上漲率等,來研究擴張性財政政策實施后對宏觀經(jīng)濟開展的影響。這些多變量間的相關(guān)性如何分析?

8整理課件典型相關(guān)分析的目的是識別并量化兩組變量之間的聯(lián)系,將兩組變量相關(guān)關(guān)系的分析,轉(zhuǎn)化為一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系分析。目前,典型相關(guān)分析已被應(yīng)用于心理學(xué)、市場營銷等領(lǐng)域。如用于研究個人性格與職業(yè)興趣的關(guān)系,市場促銷活動與消費者響應(yīng)之間的關(guān)系等問題的分析研究。9整理課件

利用主成分分析的思想,可以把多個變量與多個變量之間的相關(guān)轉(zhuǎn)化為兩個變量之間的相關(guān)。主成分綜合變量找出系數(shù)和使得新變量和之間有最大可能的相關(guān)系數(shù)?!驳湫拖嚓P(guān)系數(shù)〕即使10整理課件例家庭特征與家庭消費之間的關(guān)系

為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。11整理課件

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣RxxR21R22R1212整理課件y2y3y1x2x113整理課件

典型相關(guān)分析的思想:

首先分別在每組變量中找出第一對線性組合,使其具有最大相關(guān)性,

14整理課件

然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對本身具有次大的相關(guān)性。

u2和v2與u1和v1相互獨立,但u2和v2相關(guān)。如此繼續(xù)下去,直至進行到r步,兩組變量的相關(guān)性被提取完為止。r

min(p,q),可以得到r組變量。15整理課件二、典型相關(guān)的數(shù)學(xué)描述

考慮兩組變量的向量其協(xié)方差陣為〔一〕想法

其中

11是第一組變量的協(xié)方差矩陣;22是第二組變量的協(xié)方差矩陣;是X和Y的協(xié)方差矩陣。16整理課件如果我們記兩組變量的第一對線性組合為:

其中:所以,典型相關(guān)分析就是求a1和b1,使uv到達最大。17整理課件〔二〕典型相關(guān)系數(shù)和典型變量的求法

在約束條件:下,求a1和b1,使uv到達最大。令18整理課件根據(jù)數(shù)學(xué)分析中條件極值的求法,引入Lagrange乘數(shù),求極值問題,那么可以轉(zhuǎn)化為求的極大值,其中

Lagrange乘數(shù)。19整理課件

將上面的3式分別左乘和20整理課件將左乘(3)的第二式,得

并將第一式代入,得

的特征根是,相應(yīng)的特征向量為21整理課件將左乘(3)的第一式,并將第二式代入,得

的特征根是,相應(yīng)的特征向量為22整理課件

結(jié)論:既是M1又是M2的特征根,和是相應(yīng)于M1和M2的特征向量。

至此,典型相關(guān)分析轉(zhuǎn)化為求M1和M2特征根和特征向量的問題。第一對典型變量提取了原始變量X與Y之間相關(guān)的主要局部,如果這局部還不能足以解釋原始變量,可以在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù)。23整理課件

在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù)。設(shè)第二對典型變量為:

在約束條件:求使到達最大的和。24整理課件例家庭特征與家庭消費之間的關(guān)系

為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。25整理課件

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣26整理課件典型相關(guān)分析

典型相關(guān)系數(shù)調(diào)整典型相關(guān)系數(shù)近似方差

典型相關(guān)系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491927整理課件X組典型變量的系數(shù)

U1U2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)

V1V2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.295628整理課件三、典型變量的性質(zhì)

1、同一組變量的典型變量之間互不相關(guān)

X組的典型變量之間是相互獨立的:Y組的典型變量之間是相互獨立的:因為特征向量之間是正交的。故29整理課件2、不同組變量的典型變量之間的相關(guān)性不同組內(nèi)一對典型變量之間的相關(guān)系數(shù)為:同對相關(guān)系數(shù)為

,不同對則為零。30整理課件3、原始變量與典型變量之間的相關(guān)系數(shù)

〔典型載荷分析〕原始變量相關(guān)系數(shù)矩陣X典型變量系數(shù)矩陣31整理課件y典型變量系數(shù)矩陣32整理課件33整理課件34整理課件35整理課件36整理課件例家庭特征與家庭消費之間的關(guān)系

為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。37整理課件

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣38整理課件典型相關(guān)分析

典型相關(guān)系數(shù)調(diào)整典型相關(guān)系數(shù)近似方差

典型相關(guān)系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491939整理課件X組典型變量的系數(shù)

U1U2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)

V1V2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.295640整理課件典型變量的結(jié)構(gòu)(相關(guān)系數(shù))

U1U2X10.9866-0.1632X20.88720.4614

V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型載荷分析

41整理課件典型變量的結(jié)構(gòu)(相關(guān)系數(shù))

V1V2X10.6787-0.0305X20.61040.0862

U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.0563Crossloadings42整理課件

兩個反映消費的指標與第一對典型變量中u1的相關(guān)系數(shù)分別為0.9866和0.8872,可以看出u1可以作為消費特性的指標,第一對典型變量中v1與Y2之間的相關(guān)系數(shù)為0.9822,可見典型變量v1主要代表了了家庭收入,u1和v1的相關(guān)系數(shù)為0.6879,這就說明家庭的消費與家庭的收入之間其關(guān)系是很密切的;43整理課件

第二對典型變量中u2與x2的相關(guān)系數(shù)為0.4614,可以看出u2可以作為文化消費特性的指標,第二對典型變量中v2與Y1和Y3之間的分別相關(guān)系數(shù)為0.8464和0.3013,可見典型變量v2主要代表了家庭成員的年齡特征和教育程度,u2和v2的相關(guān)系數(shù)為0.1869,說明文化消費與年齡和受教育程度之間的相關(guān)性。44整理課件4、各組原始變量被典型變量所解釋的方差

〔典型冗余分析〕X組原始變量被ui解釋的方差比例X組原始變量被vi解釋的方差比例y組原始變量被ui解釋的方差比例y組原始變量被vi解釋的方差比例45整理課件

被典型變量解釋的X組原始變量的方差

被本組的典型變量解釋被對方Y(jié)組典型變量解釋比例累計比例典型相關(guān)系數(shù)平方比例累計比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.420846整理課件

被典型變量解釋的Y組原始變量的方差

被本組的典型變量解釋被對方X組典型變量解釋比例累計比例典型相關(guān)系數(shù)平方比例累計比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.231547整理課件五、樣本典型相關(guān)系數(shù)

在實際應(yīng)用中,總體的協(xié)方差矩陣常常是未知的,類似于其他的統(tǒng)計分析方法,需要從總體中抽出一個樣本,根據(jù)樣本對總體的協(xié)方差或相關(guān)系數(shù)矩陣進行估計,然后利用估計得到的協(xié)方差或相關(guān)系數(shù)矩陣進行分析。48整理課件

1、假設(shè)有X組和Y組變量,樣本容量為n。假設(shè)(X1,Y1),(X2,Y2),…,(Xn,Yn),觀測值矩陣為:49整理課件2、計算特征根和特征向量求M1和M2的特征根,對應(yīng)的特征向量。那么特征向量構(gòu)成典型變量的系數(shù),特征根為典型變量相關(guān)系數(shù)的平方。50整理課件職業(yè)滿意度典型相關(guān)分析某調(diào)查公司從一個大型零售公司隨機調(diào)查了784人,測量了5個職業(yè)特性指標和7個職業(yè)滿意度變量。討論兩組指標之間是否相聯(lián)系。X組:Y組:X1—用戶反響Y1—主管滿意度X2—任務(wù)重要性Y2—事業(yè)前景滿意度X3—任務(wù)多樣性Y3—財政滿意度X4—任務(wù)特殊性Y4—工作強度滿意度X5—自主權(quán)Y5—公司地位滿意度Y6—工作滿意度Y7—總體滿意度51整理課件

X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.0052整理課件CanonicalCorrelationAnalysis

AdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardError

CanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.00328053整理課件

U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X組的典型變量54整理課件

V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y組的典型變量55整理課件

U1U2U3U4U5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246

V1V2V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始變量與本組典型變量之間的相關(guān)系數(shù)56整理課件

V1V2V3V4V5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071

U1U2U3U4U5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始變量與對應(yīng)組典型變量之間的相關(guān)系數(shù)57整理課件

可以看出,所有五個表示職業(yè)特性的變量與u1有大致相同的相關(guān)系數(shù),u1視為形容職業(yè)特性的指標。第一對典型變量的第二個變量v1與Y1,Y2,Y5,Y6有較大的相關(guān)系數(shù),說明v1主要代表了主管滿意度、事業(yè)前景滿意度、公司地位滿意度和工種滿意度。而u1和v1之間的相關(guān)系數(shù)0.5537。58整理課件

CanonicalRedundancyAnalysisRawVarianceofthe'VAR'VariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.58180.58180.17840.178420.10800.68980.00600.184430.09600.78580.00140.1858

40.12230.90810.00060.186450.09191.00000.00030.1867RawVarianceofthe'WITH'VariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.37210.37210.11410.114120.12220.49430.00680.120930.07400.56830.00110.1220

40.12890.69720.00070.122650.10580.80300.00030.123059整理課件u1和v1解釋的本組原始變量的比率:X組的原始變量被u1到u5解釋了100%Y組的原始變量被v1到v5解釋了80.3%X組的原始變量被u1到u4解釋了90.81%Y組的原始變量被v1到v4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論