典型相關分析_第1頁
典型相關分析_第2頁
典型相關分析_第3頁
典型相關分析_第4頁
典型相關分析_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

典型相關分析研究多個變量與多個變量之間的相關性CanonicalCorrelation2021/6/271要點典型相關分析的數(shù)學表達方式,約束條件;典型相關系數(shù)的數(shù)學含義;典型變量的數(shù)學含義;典型相關系數(shù)的顯著性檢驗;冗余分析;典型相關的應用2021/6/272第一節(jié)典型相關分析的基本思想

當研究兩個變量x與y之間的相關關系時,相關系數(shù)是最常用的度量。如何研究兩組變量之間的相關關系呢?如何進一步確定兩組變量在整體上的相關程度呢?2021/6/273通常情況下,為了研究兩組變量的相關關系,可以用最原始的方法,分別計算兩組變量之間的全部相關系數(shù),一共有pq個簡單相關系數(shù),這樣既煩瑣又不能抓住問題的本質。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個線性組合,討論線性組合之間的相關關系,則更簡捷。2021/6/274典型相關分析(CanonicalCorrelation)是研究兩組變量之間相關關系的一種多元統(tǒng)計方法。它能夠揭示出兩組變量之間的內在聯(lián)系。2021/6/275基本概念AnalyzetherelationshipsbetweentwosetsofvariablesCanonicalcorrelation(rc):CorrelationbetweentwocompositionofvariablesX1X2X3X4X5Y1Y2Y3Y4Y5rcRxxRyyRyxRxy2021/6/2761936年霍特林(Hotelling)最早就“大學表現(xiàn)”和“入學前成績”的關系、政府政策變量與經(jīng)濟目標變量的關系等問題進行了研究,提出了典型相關分析技術。之后,Cooley和Hohnes(1971),Tatsuoka(1971)及Mardia,Kent和Bibby(1979)等人對典型相關分析的應用進行了討論,Kshirsagar(1972)則從理論上給出了最好的分析。2021/6/277在解決實際問題中,這種方法有廣泛的應用。如居民生活環(huán)境與健康狀況的關系;考察一些與財政政策有關的指標:財政支出總額增長率、財政赤字增長率、稅率降低,與經(jīng)濟發(fā)展的一系列指標如GDP增長率、就業(yè)增長率、物價上漲率等,來研究擴張性財政政策實施后對宏觀經(jīng)濟發(fā)展的影響。這些多變量間的相關性如何分析?

2021/6/278典型相關分析的目的是識別并量化兩組變量之間的聯(lián)系,將兩組變量相關關系的分析,轉化為一組變量的線性組合與另一組變量線性組合之間的相關關系分析。目前,典型相關分析已被應用于心理學、市場營銷等領域。如用于研究個人性格與職業(yè)興趣的關系,市場促銷活動與消費者響應之間的關系等問題的分析研究。2021/6/279

利用主成分分析的思想,可以把多個變量與多個變量之間的相關轉化為兩個變量之間的相關。主成分綜合變量找出系數(shù)和使得新變量和之間有最大可能的相關系數(shù)。(典型相關系數(shù))即使2021/6/2710例家庭特征與家庭消費之間的關系

為了了解家庭的特征與其消費模式之間的關系。調查了70個家庭的下面兩組變量:分析兩組變量之間的關系。2021/6/2711

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關系數(shù)矩陣RxxR21R22R122021/6/2712y2y3y1x2x12021/6/2713

典型相關分析的思想:

首先分別在每組變量中找出第一對線性組合,使其具有最大相關性,

2021/6/2714

然后再在每組變量中找出第二對線性組合,使其分別與本組內的第一線性組合不相關,第二對本身具有次大的相關性。

u2和v2與u1和v1相互獨立,但u2和v2相關。如此繼續(xù)下去,直至進行到r步,兩組變量的相關性被提取完為止。r

min(p,q),可以得到r組變量。2021/6/2715二、典型相關的數(shù)學描述

考慮兩組變量的向量其協(xié)方差陣為(一)想法

其中

11是第一組變量的協(xié)方差矩陣;22是第二組變量的協(xié)方差矩陣;是X和Y的協(xié)方差矩陣。2021/6/2716如果我們記兩組變量的第一對線性組合為:

其中:

所以,典型相關分析就是求a1和b1,使

uv達到最大。2021/6/2717(二)典型相關系數(shù)和典型變量的求法

在約束條件:下,求a1和b1,使uv達到最大。令2021/6/2718根據(jù)數(shù)學分析中條件極值的求法,引入Lagrange乘數(shù),求極值問題,則可以轉化為求的極大值,其中

Lagrange乘數(shù)。2021/6/2719

將上面的3式分別左乘和2021/6/2720將左乘(3)的第二式,得

并將第一式代入,得

的特征根是,相應的特征向量為2021/6/2721將左乘(3)的第一式,并將第二式代入,得

的特征根是,相應的特征向量為2021/6/2722

結論:既是M1又是M2的特征根,和是相應于M1和M2的特征向量。

至此,典型相關分析轉化為求M1和M2特征根和特征向量的問題。

第一對典型變量提取了原始變量X與Y之間相關的主要部分,如果這部分還不能足以解釋原始變量,可以在剩余的相關中再求出第二對典型變量和他們的典型相關系數(shù)。2021/6/2723

在剩余的相關中再求出第二對典型變量和他們的典型相關系數(shù)。設第二對典型變量為:

在約束條件:

求使達到最大的和。2021/6/2724例家庭特征與家庭消費之間的關系

為了了解家庭的特征與其消費模式之間的關系。調查了70個家庭的下面兩組變量:分析兩組變量之間的關系。2021/6/2725

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關系數(shù)矩陣2021/6/2726典型相關分析

典型相關系數(shù)調整典型相關系數(shù)近似方差

典型相關系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.0349192021/6/2727X組典型變量的系數(shù)

U1U2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)

V1V2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.29562021/6/2728三、典型變量的性質

1、同一組變量的典型變量之間互不相關

X組的典型變量之間是相互獨立的:Y組的典型變量之間是相互獨立的:因為特征向量之間是正交的。故2021/6/27292、不同組變量的典型變量之間的相關性不同組內一對典型變量之間的相關系數(shù)為:同對相關系數(shù)為

,不同對則為零。2021/6/27303、原始變量與典型變量之間的相關系數(shù)

(典型載荷分析

)原始變量相關系數(shù)矩陣X典型變量系數(shù)矩陣2021/6/2731y典型變量系數(shù)矩陣2021/6/27322021/6/27332021/6/27342021/6/27352021/6/2736例家庭特征與家庭消費之間的關系

為了了解家庭的特征與其消費模式之間的關系。調查了70個家庭的下面兩組變量:分析兩組變量之間的關系。2021/6/2737

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關系數(shù)矩陣2021/6/2738典型相關分析

典型相關系數(shù)調整典型相關系數(shù)近似方差

典型相關系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.0349192021/6/2739X組典型變量的系數(shù)

U1U2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)

V1V2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.29562021/6/2740典型變量的結構(相關系數(shù))

U1U2X10.9866-0.1632X20.88720.4614

V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型載荷分析

2021/6/2741典型變量的結構(相關系數(shù))

V1V2X10.6787-0.0305X20.61040.0862

U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.0563Crossloadings2021/6/2742

兩個反映消費的指標與第一對典型變量中u1的相關系數(shù)分別為0.9866和0.8872,可以看出u1可以作為消費特性的指標,第一對典型變量中v1與Y2之間的相關系數(shù)為0.9822,可見典型變量v1主要代表了了家庭收入,u1和v1的相關系數(shù)為0.6879,這就說明家庭的消費與家庭的收入之間其關系是很密切的;2021/6/2743

第二對典型變量中u2與x2的相關系數(shù)為0.4614,可以看出u2可以作為文化消費特性的指標,第二對典型變量中v2與Y1和Y3之間的分別相關系數(shù)為0.8464和0.3013,可見典型變量v2主要代表了家庭成員的年齡特征和教育程度,u2和v2的相關系數(shù)為0.1869,說明文化消費與年齡和受教育程度之間的相關性。2021/6/27444、各組原始變量被典型變量所解釋的方差

(典型冗余分析)X組原始變量被ui解釋的方差比例X組原始變量被vi解釋的方差比例y組原始變量被ui解釋的方差比例y組原始變量被vi解釋的方差比例2021/6/2745

被典型變量解釋的X組原始變量的方差

被本組的典型變量解釋被對方Y組典型變量解釋比例累計比例典型相關系數(shù)平方比例累計比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.42082021/6/2746

被典型變量解釋的Y組原始變量的方差

被本組的典型變量解釋被對方X組典型變量解釋比例累計比例典型相關系數(shù)平方比例累計比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.23152021/6/2747五、樣本典型相關系數(shù)

在實際應用中,總體的協(xié)方差矩陣常常是未知的,類似于其他的統(tǒng)計分析方法,需要從總體中抽出一個樣本,根據(jù)樣本對總體的協(xié)方差或相關系數(shù)矩陣進行估計,然后利用估計得到的協(xié)方差或相關系數(shù)矩陣進行分析。2021/6/2748

1、假設有X組和Y組變量,樣本容量為n。假設(X1,Y1),(X2,Y2),…,(Xn,Yn),觀測值矩陣為:2021/6/27492、計算特征根和特征向量求M1和

M2的特征根,對應的特征向量。則特征向量構成典型變量的系數(shù),特征根為典型變量相關系數(shù)的平方。2021/6/2750職業(yè)滿意度典型相關分析

某調查公司從一個大型零售公司隨機調查了784人,測量了5個職業(yè)特性指標和7個職業(yè)滿意度變量。討論兩組指標之間是否相聯(lián)系。X組:Y組:X1—用戶反饋Y1—主管滿意度X2—任務重要性Y2—事業(yè)前景滿意度X3—任務多樣性Y3—財政滿意度X4—任務特殊性Y4—工作強度滿意度X5—自主權Y5—公司地位滿意度

Y6—工作滿意度

Y7—總體滿意度2021/6/2751

X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.002021/6/2752CanonicalCorrelationAnalysis

AdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardError

CanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.0032802021/6/2753

U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X組的典型變量2021/6/2754

V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y組的典型變量2021/6/2755

U1U2U3U4U5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246

V1V2V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始變量與本組典型變量之間的相關系數(shù)2021/6/2756

V1V2V3V4V5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071

U1U2U3U4U5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始變量與對應組典型變量之間的相關系數(shù)2021/6/2757

可以看出,所有五個表示職業(yè)特性的變量與u1有大致相同的相關系數(shù),u1視為形容職業(yè)特性的指標。第一對典型變量的第二個變量v1與Y1,Y2,Y5,Y6有較大的相關系數(shù),說明v1主要代表了主管滿意度、事業(yè)前景滿意度、公司地位滿意度和工種滿意度。而u1和v1之間的相關系數(shù)0.5537。2021/6/2758

CanonicalRedundancyAnalysisRawVarianceofthe'VAR'VariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.58180.58180.17840.178420.10800.68980.00600.184430.09600.78580.00140.1858

40.12230.90810.00060.186450.09191.00000.00030.1867RawVarianceofthe'WITH'VariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.37210.37210.11410.114120.12220.49430.00680.120930.07400.56830.00110.1220

40.12890.69720.00070.122650.10580.80300.00030.12302021/6/2759u1和v1解釋的本組原始變量的比率:X組的原始變量被u1到u5解釋了100%Y組的原始變量被v1到v5解釋了80.3%X組的原始變量被u1到u4解釋了90.81%Y組的原始變量被v1到v4解釋了69.72%2021/6/2760六、典型相關

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論