![典型相關(guān)分析及其應(yīng)用實(shí)例_第1頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-4/16/5a69b0c0-fddf-4d1a-8744-92813750e46a/5a69b0c0-fddf-4d1a-8744-92813750e46a1.gif)
![典型相關(guān)分析及其應(yīng)用實(shí)例_第2頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-4/16/5a69b0c0-fddf-4d1a-8744-92813750e46a/5a69b0c0-fddf-4d1a-8744-92813750e46a2.gif)
![典型相關(guān)分析及其應(yīng)用實(shí)例_第3頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-4/16/5a69b0c0-fddf-4d1a-8744-92813750e46a/5a69b0c0-fddf-4d1a-8744-92813750e46a3.gif)
![典型相關(guān)分析及其應(yīng)用實(shí)例_第4頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-4/16/5a69b0c0-fddf-4d1a-8744-92813750e46a/5a69b0c0-fddf-4d1a-8744-92813750e46a4.gif)
![典型相關(guān)分析及其應(yīng)用實(shí)例_第5頁(yè)](http://file3.renrendoc.com/fileroot_temp3/2022-4/16/5a69b0c0-fddf-4d1a-8744-92813750e46a/5a69b0c0-fddf-4d1a-8744-92813750e46a5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上摘 要典型相關(guān)分析是多元統(tǒng)計(jì)分析的一個(gè)重要研究課題.它是研究?jī)山M變量之間相關(guān)的一種統(tǒng)計(jì)分析方法,能夠有效地揭示兩組變量之間的相互線性依賴關(guān)系.它借助主成分分析降維的思想,用少數(shù)幾對(duì)綜合變量來反映兩組變量間的線性相關(guān)性質(zhì).目前它已經(jīng)在眾多領(lǐng)域的相關(guān)分析和預(yù)測(cè)分析中得到廣泛應(yīng)用.本文首先描述了典型相關(guān)分析的統(tǒng)計(jì)思想,定義了總體典型相關(guān)變量及典型相關(guān)系數(shù),并簡(jiǎn)要概述了它們的求解思路,然后深入對(duì)樣本典型相關(guān)分析的幾種算法做了比較全面的論述.根據(jù)典型相關(guān)分析的推理,歸納總結(jié)了它的一些重要性質(zhì)并給出了證明,接著推導(dǎo)了典型相關(guān)系數(shù)的顯著性檢驗(yàn).最后通過理論與實(shí)例分析兩個(gè)層面論證了典
2、型相關(guān)分析的應(yīng)用于實(shí)際生活中的可行性與優(yōu)越性.【關(guān)鍵詞】 典型相關(guān)分析,樣本典型相關(guān),性質(zhì),實(shí)際應(yīng)用ABSTRACTThe Canonical Correlation Analysis is an important studying topic of the Multivariate Statistical Analysis. It is the statistical analysis method which studies the correlation between two sets of variables. It can work to reveal the mutual li
3、ne dependence relation availably between two sets of variables. With the help of the thought about the Principal Components, we can use a few comprehensive variables to reflect the linear relationship between two sets of variables. Nowadays It has already been used widely in the correlation analysis
4、 and forecasted analysis. This text describes the statistical thought of the Canonical Correlation Analysis firstly, and then defines the total canonical correlation variables and canonical correlation coefficient, and sum up their solution method briefly. After it I go deep into discuss some algori
5、thm of the sample canonical correlation analysis thoroughly. According to the reasoning of the Canonical Correlation Analysis, sum up some of its important properties and give the identification, following it, I infer the significance testing about the canonical correlation coefficient. According to
6、 the analysis from the theories and the application, we can achieve the possibility and the superiority from canonical correlation analysis in the real life.【Key words】Canonical Correlation Analysis,Sample canonical correlation,Character,Practical applications專心-專注-專業(yè)目 錄前 言典型相關(guān)分析(Canonical Correlati
7、on Analysis ,CCA)作為多元統(tǒng)計(jì)學(xué)的一個(gè)重要部分,是相關(guān)分析研究的一個(gè)主要內(nèi)容.典型相關(guān)分析不僅其方法本身具有重要的理論意義,而且它還可以作為其他分析方法,如多重回歸、判別分析和相應(yīng)分析的工具,因此在多元分析方法中占有特殊的地位.典型相關(guān)的概念是在兩個(gè)變量相關(guān)的基礎(chǔ)上發(fā)展起來的.我們知道,兩個(gè)隨機(jī)變量的相關(guān)關(guān)系可以用它們的簡(jiǎn)單相關(guān)系數(shù)來衡量;一個(gè)隨機(jī)變量與一組隨機(jī)變量之間的相關(guān)關(guān)系可以用復(fù)相關(guān)系數(shù)來衡量.但考慮一組隨機(jī)變量與另一組隨機(jī)變量的關(guān)系時(shí),如果運(yùn)用兩個(gè)變量的相關(guān)關(guān)系,分別考慮第一組每個(gè)變量和第二組中每個(gè)變量的相關(guān),或者運(yùn)用復(fù)相關(guān)關(guān)系,考慮一組變量中的每個(gè)變量和另一組變量的
8、相關(guān),這樣做比較繁瑣,抓不住要領(lǐng).因此,為了用比較少的變量來反映兩組變量之間的相關(guān)關(guān)系,一種考慮的思路就是類似主成分分析,考慮兩組變量的線性組合,從這兩個(gè)線性組合中找出最相關(guān)的綜合變量,通過少數(shù)幾個(gè)綜合變量來反映兩組變量的相關(guān)性質(zhì),這樣便引出了典型相關(guān)分析.典型相關(guān)分析的基本思想是首先在每組變量中找出變量的線性組合,使其具有最大相關(guān)性,然后再在每組變量中找出第二對(duì)線性組合,使其分別與第一對(duì)線性組合不相關(guān),而第二對(duì)本身具有最大的相關(guān)性,如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為止.有了這樣線性組合的最大相關(guān),則討論兩組變量之間的相關(guān),就轉(zhuǎn)化為只研究這些線性組合的最大相關(guān),從而減少研究變量
9、的個(gè)數(shù).典型相關(guān)分析是由Hotelling于1936年提出的.就目前而言,它的理論己經(jīng)比較完善,計(jì)算機(jī)的發(fā)展解決了典型相關(guān)分析在應(yīng)用中計(jì)算方面的困難,成為普遍應(yīng)用的進(jìn)行兩組變量之間相關(guān)性分析技術(shù).如在生態(tài)環(huán)境方面,用典型相關(guān)理論對(duì)預(yù)報(bào)場(chǎng)與因子場(chǎng)進(jìn)行分析,實(shí)現(xiàn)了短期氣象預(yù)測(cè);借助典型相關(guān),分析了植被與環(huán)境的關(guān)系;在社會(huì)生活領(lǐng)域,應(yīng)用典型相關(guān)分析了物價(jià)指標(biāo)和影響物價(jià)因素的相關(guān)關(guān)系等等.第1章 典型相關(guān)分析的數(shù)學(xué)描述一般地,假設(shè)有一組變量與另一組變量,我們要研究這兩組變量之間的相關(guān)關(guān)系,如何給兩組變量之間的相關(guān)性以數(shù)量的描述.當(dāng)1時(shí),就是我們常見的研究?jī)蓚€(gè)變量與之間的簡(jiǎn)單相關(guān)關(guān)系,其相關(guān)系數(shù)是最常見
10、的度量,定義為:當(dāng)(或)時(shí),維隨機(jī)向量,設(shè),其中,是第一組變量的協(xié)方差陣,是第一組與第二組變量的協(xié)方差陣,是第二組變量的協(xié)方差陣.則稱為與的全相關(guān)系數(shù),全相關(guān)系數(shù)用于度量一個(gè)隨機(jī)變量與另一組隨機(jī)變量的相關(guān)系數(shù).當(dāng)時(shí),利用主成分分析的思想,可以把多個(gè)變量與多個(gè)變量之間的相關(guān)化為兩個(gè)新的綜合變量之間的相關(guān).也就是做兩組變量的線性組合即其中,和為任意非零向量,于是我們把研究?jī)山M變量之間的問題化為研究?jī)蓚€(gè)變量之間的相關(guān)問題,希望尋求,使,之間最大可能的相關(guān),我們稱這種相關(guān)為典型相關(guān),基于這種原則的分析方法就是典型相關(guān)分析.第2章 典型變量與典型相關(guān)系數(shù)2.1 總體典型相關(guān)設(shè)有兩組隨機(jī)變量,分別為隨機(jī)向
11、量,根據(jù)典型相關(guān)分析的思想,我們用和的線性組合和之間的相關(guān)性來研究?jī)山M隨機(jī)變量和之間的相關(guān)性.我們希望找到,使得最大.由相關(guān)系數(shù)的定義易得出對(duì)任意常數(shù),均有這說明使得相關(guān)系數(shù)最大的并不唯一.因此,為避免不必要的結(jié)果重復(fù),我們?cè)谇缶C合變量時(shí)常常限定 , 于是,我們就有了下面的定義:設(shè)有兩組隨機(jī)變量,維隨機(jī)向量 的均值向量為零,協(xié)方差陣(不妨設(shè)).如果存在和,使得在約束條件 ,下, 則稱是的典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為典型相關(guān)系數(shù);其他典型相關(guān)變量定義如下:定義了前對(duì)典型相關(guān)變量之后,第對(duì)典型相關(guān)變量定義為:如果存在和,使得 和前面的對(duì)典型相關(guān)變量都不相關(guān); ,; 的相關(guān)系數(shù)最大,則稱是的
12、第對(duì)(組)典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為第個(gè)典型相關(guān)系數(shù)().2.2 樣本典型相關(guān)以上是根據(jù)總體情況已知的情形進(jìn)行,而實(shí)際研究中,總體均值向量和協(xié)方差陣通常是未知的,因而無法求得總體的典型相關(guān)變量和典型相關(guān)系數(shù),首先需要根據(jù)觀測(cè)到的樣本數(shù)據(jù)陣對(duì)進(jìn)行估計(jì).2.2.1 第一對(duì)典型相關(guān)變量的解法設(shè)總體,已知總體的次觀測(cè)數(shù)據(jù)為: (),于是樣本數(shù)據(jù)陣為若假定則由參考文獻(xiàn)【2】中定理2.5.1知協(xié)方差陣的最大似然估計(jì)為 其中=,樣本協(xié)方差矩陣為: 式中 , 令,則樣本的相關(guān)系數(shù)為又因?yàn)椋?所以 由于,乘以任意常數(shù)并不改變他們之間的相關(guān)系數(shù),即不妨限定取標(biāo)準(zhǔn)化的與,即限定及的樣本方差為1,故有: (
13、2.2.1)則 (2.2.2)于是我們要求的問題就是在(2.2.1)的約束條件下,求,使得式(2.2.2)達(dá)到最大.這是條件極值的問題,由拉格朗日乘子法,此問題等價(jià)于求,使 (2.2.3)達(dá)到最大.式中,為拉格朗日乘數(shù)因子.對(duì)上式分別關(guān)于,求偏導(dǎo)并令其為0,得方程組: (2.2.4)分別用,左乘方程(2.2.4)得 又 所以 也就是說,正好等于線性組合與之間的相關(guān)系數(shù),于是(2.2.4)式可寫為: 或 (2.2.5) 而式(2.2.5)有非零解的充要條件是: (2.2.6)該方程左端是的次多項(xiàng)式,因此有個(gè)根.求解的高次方程(2.2.6),把求得的最大的代回方程組(2.2.5),再求得和,從而得
14、出第一對(duì)典型相關(guān)變量.具體計(jì)算時(shí),因的高次方程(2.2.6)不易解,將其代入方程組(2.2.5)后還需求解階方程組.為了計(jì)算上的方便,我們做如下變換:用左乘方程組(2.2.5)的第二式,則有 -即 =又由(2.2.5)的第一式,得 代入上式: (2.2.7) 再用左乘式(2.2.7),得 (2.2.8) 因此,對(duì)有個(gè)解,設(shè)為,對(duì)也有個(gè)解.類似地,用左乘式(2.2.5)中的第一式,則有 (2.2.9) 又由(2.2.5)中的第二式,得 代入到(2.2.8)式,有 再以左乘上式,得 (2.2.10) 因此對(duì)有個(gè)解,對(duì)也有個(gè)解,因此為的特征根,是對(duì)應(yīng)于的特征向量.同時(shí)也是的特征根,為相應(yīng)特征向量.而
15、式(2.2.8)和(2.2.10)有非零解的充分必要條件為: (2.2.11)對(duì)于(2.2.11)式的第一式,由于,所以,故有:而與有相同的特征根.如果記 則 =類似的對(duì)式(2.2.11)的第二式,可得 而與有相同的非零特征根,從而推出(2.2.8)和(2.2.10)的非零特征根是相同的.設(shè)已求得的個(gè)特征根依次為: 則的個(gè)特征根中,除了上面的個(gè)外,其余的個(gè)都為零.故個(gè)特征根排列是,因此,只要取最大的,代入方程組(2.2.5)即可求得相應(yīng)的,.令=與為第一對(duì)典型相關(guān)變量,而為第一典型相關(guān)系數(shù).可見求典型相關(guān)系數(shù)及典型相關(guān)變量的問題,就等價(jià)于求解的最大特征值及相應(yīng)的特征向量.2.2.2 典型相關(guān)變
16、量的一般解法從樣本典型相關(guān)變量的解法中,我們知道求典型相關(guān)變量和典型相關(guān)系數(shù)的問題,就是求解的最大特征值及相應(yīng)的特征向量.不僅如此,求解第對(duì)典型相關(guān)變量和典型相關(guān)系數(shù),類似的也是求的第大的特征值和相應(yīng)的特征向量.下面引用參考文獻(xiàn)【2】中定理10.1.1 來得出樣本典型相關(guān)的一般求法.設(shè)總體的次觀測(cè)數(shù)據(jù)為: ()不妨設(shè),樣本均值為0,協(xié)方差矩陣為: 記,并設(shè)階方陣的特征值依次為();而為相應(yīng)的單位正交特征向量.令 ,則,為第對(duì)典型相關(guān)變量,為第典型相關(guān)系數(shù). 由上述分析不難看出,典型相關(guān)系數(shù)越大說明相應(yīng)的典型變量之間的關(guān)系越密切,因此一般在實(shí)際中忽略典型相關(guān)系數(shù)很小的那些典型變量,按的大小只取前
17、個(gè)典型變量及典型相關(guān)系數(shù)進(jìn)行分析.2.2.3 從相關(guān)矩陣出發(fā)計(jì)算典型相關(guān)以上我們從樣本協(xié)方差陣出發(fā),導(dǎo)出了樣本典型相關(guān)變量和樣本典型相關(guān)系數(shù).下面我們從樣本相關(guān)陣出發(fā)來求解樣本典型相關(guān)變量和樣本典型相關(guān)系數(shù).設(shè)樣本相關(guān)陣為,其中,為樣本協(xié)方差陣的行列元素.把相應(yīng)剖分為 有時(shí),的各分量的單位不全相同,我們希望在對(duì)各分量作標(biāo)準(zhǔn)化變換之后再做典型相關(guān).記, 則 , ,,對(duì)的各分量作標(biāo)準(zhǔn)化變換,即令,現(xiàn)在來求和的典型相關(guān)變量,. 于是 因?yàn)?所以 式中,有 同理: 式中,有,由此可見,為的第對(duì)典型系數(shù),其第個(gè)典型相關(guān)系數(shù)為,在標(biāo)準(zhǔn)化變換下具有不變性. 第3章 典型相關(guān)變量的性質(zhì)根據(jù)典型相關(guān)分析的統(tǒng)計(jì)思
18、想及推導(dǎo),我們歸納總結(jié)了典型相關(guān)變量的一些重要性質(zhì)并對(duì)總體與樣本分別給出證明.性質(zhì)1 同一組的典型變量互不相關(guān)總體典型相關(guān)設(shè)的第對(duì)典型變量為 ,則有 證明詳見參考文獻(xiàn)【5】.樣本典型相關(guān)設(shè)的第對(duì)典型變量為 ,因?yàn)?, , ,表明由組成的第一組典型變量互不相關(guān),且均有相同的方差1;同樣,由組成的第二組典型變量也互不相關(guān),且也有相同的方差1.性質(zhì)2 不同組的典型變量之間的相關(guān)性總體典型相關(guān) 證明詳見參考文獻(xiàn)【5】.樣本典型相關(guān), 表明不同組的任意兩個(gè)典型變量,當(dāng)時(shí),相關(guān)系數(shù)為;當(dāng)時(shí)是彼此不相關(guān)的.記,則上述性質(zhì)可用矩陣表示為 或 其中性質(zhì)3 原始變量與典型變量之間的關(guān)系求出典型變量后,進(jìn)一步計(jì)算原
19、始變量與典型變量之間的相關(guān)系數(shù)矩陣,也稱為典型結(jié)構(gòu).下面我們分別對(duì)總體與樣本進(jìn)行討論.總體典型相關(guān)的原始變量與典型變量的相關(guān)性詳見參考文獻(xiàn)【2】.樣本典型相關(guān)記 =則 所以利用協(xié)方差進(jìn)一步可以計(jì)算原始變量與典型變量之間的相關(guān)關(guān)系.若假定原始變量均為標(biāo)準(zhǔn)化變量,則通過以上計(jì)算所得到的原始變量與典型變量的協(xié)方差陣就是相關(guān)系數(shù)矩陣. , , 性質(zhì)4 設(shè)分別為隨機(jī)向量,令,其中為階非退化矩陣,為維常數(shù)向量,為階非退化矩陣,維常數(shù)向量.則:對(duì)于總體典型相關(guān)有: 的典型相關(guān)變量為和,其中,();而是的第對(duì)典型相關(guān)變量的系數(shù). ,即線性變換不改變相關(guān)性.證明詳見參考文獻(xiàn)【2】.對(duì)于樣本典型相關(guān)有: 的典型相
20、關(guān)變量為和,其中,();而是的第對(duì)典型相關(guān)變量的系數(shù). ,即線性變換不改變相關(guān)性.證明: 設(shè)的典型相關(guān)變量分別為, 由于 , , 所以 即有是的第對(duì)典型相關(guān)變量的系數(shù). 由的證明可知由于與都是常數(shù),所以 即有線性變換不改變相關(guān)性.性質(zhì)5 簡(jiǎn)單相關(guān)、復(fù)相關(guān)和典型相關(guān)之間的關(guān)系當(dāng),之間的(惟一)典型相關(guān)就是它們之間的簡(jiǎn)單相關(guān);當(dāng)之間的(惟一)典型相關(guān)就是它們的復(fù)相關(guān).復(fù)相關(guān)是典型相關(guān)的一個(gè)特例,而簡(jiǎn)單相關(guān)又是復(fù)相關(guān)的一個(gè)特例.從第一個(gè)典型相關(guān)的定義可以看出,第一個(gè)典型相關(guān)系數(shù)至少同的任一分量與的復(fù)相關(guān)系數(shù)一樣大,即使所有這些復(fù)相關(guān)系數(shù)都很小,第一個(gè)典型相關(guān)系數(shù)仍可能很大;同樣,從復(fù)相關(guān)的定義也可以
21、看出,當(dāng)(或)時(shí),之間的復(fù)相關(guān)系數(shù)也不會(huì)小于的任一分量之間的相關(guān)系數(shù),即使所有這些相關(guān)系數(shù)都很小,復(fù)相關(guān)系數(shù)仍可能很大.第4章 典型相關(guān)系數(shù)的顯著性檢驗(yàn)設(shè)總體的兩組變量,且,在做兩組變量,的典型相關(guān)分析之前,首先應(yīng)該檢驗(yàn)兩組變量是否相關(guān),如果不相關(guān),則討論兩組變量的典型相關(guān)就毫無意義.1 考慮假設(shè)檢驗(yàn)問題: : :至少有一個(gè)不為零其中.若檢驗(yàn)接受,則認(rèn)為討論兩組變量之間的相關(guān)性沒有意義;若檢驗(yàn)拒絕,則認(rèn)為第一對(duì)典型變量是顯著的.上式實(shí)際上等價(jià)于假設(shè)檢驗(yàn)問題:, :用似然比方法可導(dǎo)出檢驗(yàn)的似然比統(tǒng)計(jì)量其中階樣本離差陣是的最大似然估計(jì),且=,分別是,的最大似然估計(jì).該似然比統(tǒng)計(jì)量的精確分布已由霍特
22、林(1936),Girshik(1939)和Anderson(1958)給出,但表達(dá)方式很復(fù)雜,又不易找到該分布的臨界值表,下面我們采用的近似分布.利用矩陣行列式及其分塊行列式的關(guān)系,可得出:=所以其中是的特征值(),按大小次序排列為,當(dāng)時(shí),在成立下近似服從分布,這里,因此在給定檢驗(yàn)水平之下,若由樣本算出的臨界值,則否定,也就是說第一對(duì)典型變量,具有相關(guān)性,其相關(guān)系數(shù)為,即至少可以認(rèn)為第一個(gè)典型相關(guān)系數(shù)為顯著的.將它除去之后,再檢驗(yàn)其余個(gè)典型相關(guān)系數(shù)的顯著性,這時(shí)用提出的大樣本檢驗(yàn)計(jì)算統(tǒng)計(jì)量:則統(tǒng)計(jì)量 近似地服從()()個(gè)自由度的分布,如果,則認(rèn)為顯著,即第二對(duì)典型變量,相關(guān),以下逐個(gè)進(jìn)行檢驗(yàn)
23、,直到某一個(gè)相關(guān)系數(shù)檢驗(yàn)為不顯著時(shí)截止.這時(shí)我們就找出了反映兩組變量相互關(guān)系的對(duì)典型變量.2 檢驗(yàn): 當(dāng)否定時(shí),表明相關(guān),進(jìn)而可以得出至少第一個(gè)典型相關(guān)系數(shù),相應(yīng)的第一對(duì)典型相關(guān)變量可能已經(jīng)提取了兩組變量相關(guān)關(guān)系的絕大部分信息.兩組變量余下的部分可認(rèn)為不相關(guān),這時(shí),故在否定后,有必要再檢驗(yàn),即第個(gè)及以后的所有典型相關(guān)系數(shù)均為.為了減少計(jì)算量,下面我們采用二分法來減少檢驗(yàn)次數(shù),取檢驗(yàn)統(tǒng)計(jì)量為它近似服從個(gè)自由度的分布.在檢驗(yàn)水平下,若,則拒絕,即認(rèn)為第對(duì)典型相關(guān)系數(shù)在顯著性水平下是顯著的,否則不顯著.從第2個(gè)典型相關(guān)系數(shù)到第個(gè)典型相關(guān)系數(shù),共個(gè)數(shù),所以根據(jù)二分法的原理,將它們分為一個(gè)區(qū)間,然后先檢
24、驗(yàn)第個(gè)典型相關(guān)系數(shù)即中位數(shù),當(dāng)時(shí),即認(rèn)為第個(gè)典型相關(guān)系數(shù)不相關(guān),否定原假設(shè),接著檢驗(yàn);若當(dāng)時(shí),則檢驗(yàn).如此劃分區(qū)間依次檢驗(yàn)下去,由數(shù)學(xué)分析上的區(qū)間套定理,一定存在第個(gè)數(shù),使得,而.以上的一系列檢驗(yàn)實(shí)際上是一個(gè)序貫檢驗(yàn),檢驗(yàn)直到對(duì)某個(gè)值未被拒絕為止.事實(shí)上,檢驗(yàn)的總顯著性水平已不是了,且難以確定.還有,檢驗(yàn)的結(jié)果易受樣本容量大小的影響.因此,檢驗(yàn)的結(jié)果只宜作為確定典型變量個(gè)數(shù)的重要參考依據(jù),而不宜作為惟一的依據(jù).第5章 典型相關(guān)分析的計(jì)算步驟及應(yīng)用實(shí)例5.1 典型相關(guān)分析的計(jì)算步驟設(shè)為取自正態(tài)總體的樣本(實(shí)際上,相當(dāng)廣泛的情況下也對(duì)),每個(gè)樣品測(cè)量?jī)山M指標(biāo),分別記為,原始資料矩陣為: 第一步 計(jì)
25、算相關(guān)矩陣,并將剖分為 其中,分別為第一組變量和第二組變量之間的相關(guān)系數(shù)矩陣,為第一組與第二組變量之間的相關(guān)系數(shù).第二步 求典型相關(guān)系數(shù)及典型變量首先求的特征根,特征向量;的特征根,特征向量.,寫出樣本的典型變量為 , , ,第三步 典型相關(guān)系數(shù)的顯著性檢驗(yàn)首先,檢驗(yàn)第一對(duì)典型變量的相關(guān)系數(shù),即:,:它的似然比統(tǒng)計(jì)量為 則統(tǒng)計(jì)量 給定顯著性水平,查表得,若,則否定,認(rèn)為第一對(duì)典型變量相關(guān),否則不相關(guān).如果相關(guān)則依次逐個(gè)檢驗(yàn)其余典型相關(guān)系數(shù),直到某一個(gè)相關(guān)系數(shù)檢驗(yàn)為不顯著時(shí)截止.5.2 實(shí)例分析例1:某康復(fù)俱樂部對(duì)20名中年人測(cè)量了三個(gè)生理指標(biāo):體重、腰圍()、脈搏()和三個(gè)訓(xùn)練指標(biāo):引體向上(
26、)、起坐次數(shù)()、跳躍次數(shù)().數(shù)據(jù)如附錄1:解:記,其中樣本容量.附錄1中的數(shù)據(jù)用SPSS統(tǒng)計(jì)軟件計(jì)算得六個(gè)變量之間的相關(guān)矩陣如下:Correlations X1X2X3Y1Y2Y3X1Pearson Correlation1.870(*)-.366-.390-.493(*)-.226Sig. (2-tailed).000.113.089.027.337N202020202020X2Pearson Correlation.870(*)1-.353-.552(*)-.646(*)-.191Sig. (2-tailed).000.127.012.002.419N202020202020X3Pea
27、rson Correlation-.366-.3531.151.225.035Sig. (2-tailed).113.127.526.340.884N202020202020Y1Pearson Correlation-.390-.552(*).1511.696(*).496(*)Sig. (2-tailed).089.012.526.001.026N202020202020Y2Pearson Correlation-.493(*)-.646(*).225.696(*)1.669(*)Sig. (2-tailed).027.002.340.001.001N202020202020Y3Pearso
28、n Correlation-.226-.191.035.496(*).669(*)1Sig. (2-tailed).337.419.884.026.001.N202020202020* Correlation is significant at the 0.01 level (2-tailed).* Correlation is significant at the 0.05 level (2-tailed).即樣本相關(guān)矩陣為:=于是特征方程 用求得矩陣的特征值分別為0.6630、0.0402和0.0053,于是 ,下面我們進(jìn)行典型相關(guān)系數(shù)的顯著性檢驗(yàn),先檢驗(yàn)第一對(duì)典型變量的相關(guān)系數(shù),欲檢驗(yàn):
29、 : , : 它的似然比統(tǒng)計(jì)量為=查分布表得,因此在的顯著性水平下,所以拒絕原假設(shè),也即認(rèn)為第一對(duì)典型相關(guān)變量是顯著相關(guān)的.然后檢驗(yàn)第二對(duì)典型變量的相關(guān)系數(shù),即進(jìn)一步檢驗(yàn): , :它的似然比統(tǒng)計(jì)量為所以無法否定原假設(shè),故接受:,即認(rèn)為第二對(duì)典型相關(guān)變量不是顯著相關(guān)的.由以上檢驗(yàn)可知只需求第一對(duì)典型變量即可.于是求的特征向量,而,解得, ,因此,第一對(duì)樣本典型變量為 第一對(duì)典型變量的相關(guān)系數(shù)為,可見兩者的相關(guān)性較為密切,即可認(rèn)為生理指標(biāo)與訓(xùn)練指標(biāo)之間存在顯著相關(guān)性.例2:為了研究某企業(yè)不同部門人員工作時(shí)間的關(guān)系,隨機(jī)選取25個(gè)企業(yè)進(jìn)行入戶調(diào)查,達(dá)到25個(gè)被訪企業(yè)業(yè)務(wù)部門和技術(shù)部門經(jīng)理每月工作時(shí)間
30、和員工每月工作時(shí)間(單位為小時(shí)),具體數(shù)據(jù)如附表2分析:設(shè)業(yè)務(wù)部門經(jīng)理和員工每月工作時(shí)間為(),技術(shù)部門經(jīng)理和員工每月工作時(shí)間為(),利用典型相關(guān)分析研究企業(yè)業(yè)務(wù)部門和技術(shù)部門人員工作時(shí)間的關(guān)系.解:樣本容量為,分別為隨機(jī)變量的維數(shù). 標(biāo)準(zhǔn)化隨機(jī)變量與.根據(jù)樣本均值與標(biāo)準(zhǔn)差,依照公式,對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化. 求解的相關(guān)矩陣,并將其分塊.將數(shù)據(jù)輸入SPSS軟件求得相關(guān)系數(shù)矩陣如下:Correlations X1X2Y1Y2X1Pearson Correlation1.735(*).711(*).705(*)Sig. (2-tailed).000.000.000N25252525X2Pearson Cor
31、relation.735(*)1.693(*).705(*)Sig. (2-tailed).000.000.000N25252525Y1Pearson Correlation.711(*).693(*)1.834(*)Sig. (2-tailed).000.000.000N25252525Y2Pearson Correlation.705(*).705(*).834(*)1Sig. (2-tailed).000.000.000.N25252525* Correlation is significant at the 0.01 level (2-tailed).所以樣本相關(guān)矩陣 分塊后 求解的兩
32、個(gè)非零特征根,解得兩個(gè)非零特征根為,. 進(jìn)行相關(guān)系數(shù)的顯著性檢驗(yàn),取個(gè)顯著性檢驗(yàn)不為0的特征根.第一對(duì)典型變量的相關(guān)系數(shù)為,第二對(duì)典型變量的相關(guān)系數(shù)為.先檢驗(yàn)第一對(duì)典型變量的相關(guān)系數(shù),假設(shè):(即第一對(duì)典型變量不相關(guān)),由典型相關(guān)系數(shù)的值可得計(jì)算統(tǒng)計(jì)量對(duì)于給定的顯著性水平 所以否定零假設(shè).:,即第一對(duì)典型變量是顯著相關(guān)的.然后檢驗(yàn)第二對(duì)典型變量的相關(guān)系數(shù),假設(shè):(即第二對(duì)典型變量不相關(guān)),由典型相關(guān)系數(shù)的值可得 計(jì)算統(tǒng)計(jì)量 對(duì)于給定的顯著性水平所以無法否定假設(shè).:,即第二對(duì)典型變量不是顯著相關(guān)的.由以上檢驗(yàn)可知,只需求第一對(duì)典型變量即可. 求個(gè)顯著性檢驗(yàn)不為0的特征根的特征向量,而,解得,. 求
33、出對(duì)典型相關(guān)變量,根據(jù)上面求得的特征向量,得第一對(duì)典型相關(guān)變量為 第一對(duì)典型變量的相關(guān)系數(shù)為,可見其相關(guān)性較為密切. 由于,與業(yè)務(wù)部門經(jīng)理和員工每月工作時(shí)間都成正比,而且系數(shù)差不多,所以可以解釋為業(yè)務(wù)部門人員工作時(shí)間.同理可以解釋為技術(shù)部門人員的工作時(shí)間.可見一個(gè)企業(yè)技術(shù)部門和業(yè)務(wù)部門人員月工作時(shí)間存在顯著的相關(guān)性.結(jié) 語典型相關(guān)分析是一種采用類似主成分分析的做法,在每一組變量中都選擇若干個(gè)有代表性的綜合指標(biāo)(變量的線性組合),通過研究?jī)山M的綜合指標(biāo)之間的關(guān)系來反映兩組變量之間的相關(guān)關(guān)系.在實(shí)際中,只須著重研究相關(guān)關(guān)系較大的那幾對(duì)典型相關(guān)變量.本文首先根據(jù)典型相關(guān)分析的統(tǒng)計(jì)理論,初步探討了總體
34、典型相關(guān)變量和典型相關(guān)系數(shù),然后重點(diǎn)討論了樣本典型相關(guān)分析,以及它們的一系列性質(zhì)與顯著性檢驗(yàn),并做了相應(yīng)的實(shí)例分析.通過實(shí)例分析,我們進(jìn)一步明確了典型相關(guān)分析是研究?jī)山M變量之間相關(guān)性的一種降維技術(shù)的統(tǒng)計(jì)分析方法.而復(fù)相關(guān)是典型相關(guān)的一個(gè)特例,簡(jiǎn)單相關(guān)是復(fù)相關(guān)的一個(gè)特例.第一對(duì)典型相關(guān)包含有最多的有關(guān)兩組變量間相關(guān)的信息,第二對(duì)其次,其他對(duì)依次遞減.各對(duì)典型相關(guān)變量所含的信息互不重復(fù).并且經(jīng)標(biāo)準(zhǔn)化的兩組變量之間的典型相關(guān)系數(shù)與原始的兩組變量間的相應(yīng)典型相關(guān)系數(shù)是相同的.致 謝本文是在我的指導(dǎo)老師吳可法教授的精心指導(dǎo)和悉心關(guān)懷下完成的,在我的學(xué)習(xí)生涯和論文工作中無不傾注著老師的辛勤汗水和殷切關(guān)懷.
35、吳老師寬厚的人格、敏捷的思維、嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、淵博的知識(shí)、積極向上的人生態(tài)度、平易近人的師長(zhǎng)風(fēng)范和兩年來的諄諄教導(dǎo),使我深受啟迪,并永遠(yuǎn)銘記在心.從吳老師身上,我不僅學(xué)到了扎實(shí)的專業(yè)知識(shí)和技能,更學(xué)到了做人的道理,這些教誨必將成為惠及一生的寶貴財(cái)富.在此謹(jǐn)向吳老師致以最衷心的感謝和美好的祝愿! 論文期間,我得到了許多老師和同學(xué)的幫助,本人在這里對(duì)他們致以衷心的感謝. 我還要感謝我的家人,是他們的理解、支持和鼓勵(lì),使我的學(xué)習(xí)能夠順利進(jìn)行.最后衷心感謝在百忙之中評(píng)審論文和參加答辯的各位專家、教授!參考文獻(xiàn)【1】 何曉群.多元統(tǒng)計(jì)分析M.北京:中國(guó)人民大學(xué)出版社,2004 【2】 高惠璇.應(yīng)用多元統(tǒng)計(jì)分析M.北京:北京大學(xué)出版社,2005【3】 方開泰.實(shí)用多元統(tǒng)計(jì)分析M.上海:華東師范大學(xué)出版社,1989【4】 王方.城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)影響因素的典型相關(guān)分析J .統(tǒng)計(jì)與決策,2007,(03)【5】 施錫銓,范正綺.數(shù)據(jù)分析方法M.上海:上海財(cái)經(jīng)大學(xué)出版社,1997【6】 王學(xué)仁.多個(gè)變量集合的典型相關(guān)分析J .云南大學(xué)學(xué)報(bào)(自然科學(xué)版),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 春節(jié)停工停產(chǎn)方案
- 腳手架鋼管購(gòu)銷合同
- 信息行業(yè)大數(shù)據(jù)與人工智能應(yīng)用方案
- 政府機(jī)構(gòu)政務(wù)服務(wù)平臺(tái)建設(shè)及優(yōu)化方案設(shè)計(jì)
- 法院的離婚協(xié)議書
- 房地產(chǎn)中介服務(wù)合同中介住房合同
- 安裝工程勞動(dòng)合同
- 連帶責(zé)任保證擔(dān)保合同
- 交通物流業(yè)貨物追蹤系統(tǒng)建設(shè)方案
- 購(gòu)買公司股份協(xié)議書十
- 學(xué)校辦公室衛(wèi)生制度
- 醫(yī)學(xué)生理學(xué)智慧樹知到答案2024年德州學(xué)院
- GB/T 44412-2024船舶與海上技術(shù)液化天然氣燃料船舶加注規(guī)范
- 小學(xué)三年級(jí)數(shù)學(xué)上冊(cè)口算題卡(加換算)
- 機(jī)械制造HSE協(xié)議書
- 2024-2030年中國(guó)靜脈血栓栓塞癥(VTE)防治行業(yè)市場(chǎng)全景監(jiān)測(cè)及投資策略研究報(bào)告
- 2024年國(guó)家保密法知識(shí)競(jìng)賽經(jīng)典題庫(kù)及完整答案【必刷】
- 抑郁癥病例分享
- 《子路、曾皙、冉有、公西華侍坐》課件()
- 青島版(五四制)四年級(jí)數(shù)學(xué)下冊(cè)全冊(cè)課件
- 人教鄂教版小學(xué)科學(xué)三年級(jí)下冊(cè)全冊(cè)教案教學(xué)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論