多元統(tǒng)計分析-典型相關(guān)分析_第1頁
多元統(tǒng)計分析-典型相關(guān)分析_第2頁
多元統(tǒng)計分析-典型相關(guān)分析_第3頁
多元統(tǒng)計分析-典型相關(guān)分析_第4頁
多元統(tǒng)計分析-典型相關(guān)分析_第5頁
已閱讀5頁,還剩70頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第1頁,共75頁,2022年,5月20日,19點37分,星期三第一節(jié) 引言典型相關(guān)分析(Canonical Correlation)是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。它能夠揭示出兩組變量之間的內(nèi)在聯(lián)系。相關(guān)系數(shù)可以衡量兩個隨機變量之間的線性相關(guān)關(guān)系;復相關(guān)系數(shù)衡量一個隨機變量和多個隨機變量的線性相關(guān)關(guān)系兩組變量之間的相關(guān)關(guān)系研究生理指標與訓練指標的關(guān)系居民生活環(huán)境與健康狀況的關(guān)系閱讀能力變量(閱讀速度、閱讀才能)與數(shù)學運算能力變量(數(shù)學運算速度、數(shù)學運算才能)是否相關(guān)?第2頁,共75頁,2022年,5月20日,19點37分,星期三第一節(jié) 引言1936年霍特林(Hotelling)最

2、早就“大學表現(xiàn)”和“入學前成績”的關(guān)系、政府政策變量與經(jīng)濟目標變量的關(guān)系等問題進行了研究,提出了典型相關(guān)分析技術(shù)Cooley和Hohnes(1971),Tatsuoka(1971)及Mardia,Kent和Bibby(1979)等人對典型相關(guān)分析的應(yīng)用進行了討論,Kshirsagar(1972)則從理論上給出了最好的分析 典型相關(guān)分析的目的是識別并量化兩組變量之間的聯(lián)系,將兩組變量相關(guān)關(guān)系的分析,轉(zhuǎn)化為一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系分析第3頁,共75頁,2022年,5月20日,19點37分,星期三第二節(jié) 典型相關(guān)的基本理論 一 典型相關(guān)分析的基本思想 二 典型相關(guān)分析原理

3、及方法 第4頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。然后選取和最初挑選的這對線性組合不相關(guān)的線性組合,使其配對,并選取相關(guān)系數(shù)最大的一對,如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為止被選出的線性組合配對稱為典型變量,它們的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)典型相關(guān)系數(shù)度量了這兩組變量之間聯(lián)系的強度第5頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想設(shè)是兩個相互關(guān)聯(lián)的隨機向量,分別在兩組變量中選取若干有代表性的綜合變量Ui、Vi,使得每一個綜

4、合變量是原變量的線性組合,即 第6頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第7頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)分析原理及方法 第8頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第9頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第10頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第11頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第12頁,共75頁,202

5、2年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第13頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第14頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第15頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第16頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第17頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相關(guān)分析的基本思想 第18頁,共75頁,2022年,5月20日,19點37分,星期三一、典型相

6、關(guān)分析的基本思想 第19頁,共75頁,2022年,5月20日,19點37分,星期三第三節(jié) 樣本典型相關(guān)分析一 樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算 二 典型相關(guān)系數(shù)的顯著性檢驗 第20頁,共75頁,2022年,5月20日,19點37分,星期三一、樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算 第21頁,共75頁,2022年,5月20日,19點37分,星期三一、樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算 第22頁,共75頁,2022年,5月20日,19點37分,星期三一、樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算 第23頁,共75頁,2022年,5月20日,19點37分,星期三一、樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算

7、 第24頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第25頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第26頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第27頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第28頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第29頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗第30頁,共75頁,2022年,5月

8、20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗【例9.1】康復俱樂部對20名中年人測量了三個生理指標:體重(x1),腰圍(x2),脈搏(x3);三個訓練指標:引體向上次數(shù)(y1),起坐次數(shù)(y2),跳躍次數(shù)(y3)。分析生理指標與訓練指標的相關(guān)性。數(shù)據(jù)詳見表9.1。 表9.1 康復俱樂部數(shù)據(jù)第31頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗第32頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第33頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗第34頁,共75頁,

9、2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗第35頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗第36頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第37頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗第38頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第39頁,共75頁,2022年,5月20日,19點37分,星期三二、典型相關(guān)系數(shù)的顯著性檢驗 第40頁,共75頁,2022年,5月20日,19點37分,星期

10、三第四節(jié) 典型相關(guān)分析應(yīng)用中的 幾個問題一 從相關(guān)矩陣出發(fā)計算典型相關(guān) 二 典型載荷分析 三 典型冗余分析 第41頁,共75頁,2022年,5月20日,19點37分,星期三一、從相關(guān)矩陣出發(fā)計算典型相關(guān)典型相關(guān)分析涉及多個變量,不同的變量往往具有不同的量綱及不同的數(shù)量級別。在進行典型相關(guān)分析時,由于典型變量是原始變量的線性組合,具有不同量綱變量的線性組合顯然失去了實際意義。其次,不同的數(shù)量級別會導致“以大吃小”,即數(shù)量級別小的變量的影響會被忽略,從而影響了分析結(jié)果的合理性。因此,為了消除量綱和數(shù)量級別的影響,必須對數(shù)據(jù)先做標準化變換處理,然后再做典型相關(guān)分析。顯然,經(jīng)標準化變換之后的協(xié)差陣就是

11、相關(guān)系數(shù)矩陣,因而,也即通常應(yīng)從相關(guān)矩陣出發(fā)進行典型相關(guān)分析。第42頁,共75頁,2022年,5月20日,19點37分,星期三【例9.2】對于例9.1從相關(guān)系數(shù)矩陣出發(fā)進行典型相關(guān)分析。 第43頁,共75頁,2022年,5月20日,19點37分,星期三第44頁,共75頁,2022年,5月20日,19點37分,星期三第45頁,共75頁,2022年,5月20日,19點37分,星期三二、典型載荷分析 第46頁,共75頁,2022年,5月20日,19點37分,星期三第47頁,共75頁,2022年,5月20日,19點37分,星期三第48頁,共75頁,2022年,5月20日,19點37分,星期三 第49頁

12、,共75頁,2022年,5月20日,19點37分,星期三以上結(jié)果說明生理指標的第一典型變量與體重的相關(guān)系數(shù)為-0.621,與腰圍的相關(guān)系數(shù)為-0.925,與脈搏的相關(guān)系數(shù)為0.333。從另一方面說明生理指標的第一對典型變量與體重、腰圍負相關(guān),而與脈搏正相關(guān)。其中與腰圍的相關(guān)性最強。第一對典型變量主要反映了體形的胖瘦。 第50頁,共75頁,2022年,5月20日,19點37分,星期三三、典型冗余分析 第51頁,共75頁,2022年,5月20日,19點37分,星期三第52頁,共75頁,2022年,5月20日,19點37分,星期三第53頁,共75頁,2022年,5月20日,19點37分,星期三 第5

13、4頁,共75頁,2022年,5月20日,19點37分,星期三前2個典型變量解釋的方差比例0.451+0.2460.697同樣的方法可求得訓練指標樣本方差由自身3個典型變量解釋的方差比例分別為:0.408、0.434、0.157。 第55頁,共75頁,2022年,5月20日,19點37分,星期三第五節(jié) 實例分析與計算實現(xiàn)一 利用SPSS進行典型相關(guān)分析實例1 二 利用SPSS進行典型相關(guān)分析實例2 第56頁,共75頁,2022年,5月20日,19點37分,星期三一、利用SPSS進行典型相關(guān)分析實例1測量15名受試者的身體形態(tài)以及健康情況指標,如9.2表。第一組是身體形態(tài)變量,有年齡、體重、胸圍和

14、日抽煙量;第二組是健康狀況變量,有脈搏、收縮壓和舒張壓。要求測量身體形態(tài)以及健康狀況這兩組變量之間的關(guān)系。 表9.2 兩組身體素質(zhì)的典型變量 第57頁,共75頁,2022年,5月20日,19點37分,星期三第58頁,共75頁,2022年,5月20日,19點37分,星期三(一)操作步驟在SPSS中沒有提供典型相關(guān)分析的專門菜單項,要想利用SPSS實現(xiàn)典型相關(guān)分析,必須在語句窗口中調(diào)用SPSS的 Canonical correlation.sps 宏。具體方法如下:1. 按FileNewSyntax的順序新建一個語句窗口。在語句 窗口中輸入下面的語句:(圖9.1)INCLUDE Canonical

15、 correlation.sps.CANCORR SET1=x1 x2 x3 x4 /SET2=y1 y2 y3 / . 第59頁,共75頁,2022年,5月20日,19點37分,星期三2. 點擊語句窗口Run菜單中的All子菜單項,運行典型相關(guān)宏命令,得出結(jié)果。 圖9.1 語句窗口 第60頁,共75頁,2022年,5月20日,19點37分,星期三(二)主要運行結(jié)果解釋1. Correlations for Set-1、Correlations for Set-2、Correlations Between Set-1 and Set-2(分別給出兩組變量內(nèi)部以及兩組變量之間的相關(guān)系數(shù)矩陣)2.

16、 Canonical Correlations(給出典型相關(guān)系數(shù))從表9.3中可以看出第一典型相關(guān)系數(shù)達到0.957,第二典型相關(guān)系數(shù)為0.582,第三典型相關(guān)系數(shù)為0.180。 表9.3 典型相關(guān)系數(shù) 第61頁,共75頁,2022年,5月20日,19點37分,星期三3. Test that remaining correlations are zero(給出典型相關(guān)的顯著性檢驗)表9.4中從左至右分別為Wilks的統(tǒng)計量、卡方統(tǒng)計量、自由度和伴隨概率。從表中可以看出,在0.05的顯著性水平下,三對典型變量中只有第一對典型相關(guān)是顯著的。 表9.4 典型相關(guān)系數(shù)的顯著性檢驗第62頁,共75頁,2

17、022年,5月20日,19點37分,星期三 第63頁,共75頁,2022年,5月20日,19點37分,星期三表9.5 兩組典型變量的標準化系數(shù) 第64頁,共75頁,2022年,5月20日,19點37分,星期三由于Y1(脈搏)的系數(shù)-0.721絕對值最大,說明健康狀況的典型變量主要由脈搏所決定。同時,由于兩個典型變量中抽煙量和脈搏的系數(shù)是同號的(都為負),反映抽煙量和脈搏的正相關(guān),即日抽煙越多則每分鐘的脈搏跳動次數(shù)也越多。抽煙對身體健康有害,這和客觀事實是相符的。 6. Redundancy Analysis(分別給出兩組典型變量的冗余分析)表9.6中給出的四組數(shù)據(jù)分別是身體形態(tài)變量被自身的典型

18、變量解釋的方差比例、身體形態(tài)變量被健康狀況的典型變量解釋的方差比例、健康狀況變量被自身的典型變量解釋的方差比例和健康狀況變量被身體形態(tài)的典型變量解釋的方差比例。 第65頁,共75頁,2022年,5月20日,19點37分,星期三表9.6 典型冗余分析 第66頁,共75頁,2022年,5月20日,19點37分,星期三第67頁,共75頁,2022年,5月20日,19點37分,星期三二、利用SPSS進行典型相關(guān)分析實例2利用SPSS軟件對C.R.Rao(1952)關(guān)于典型相關(guān)的經(jīng)典例子進行分析。表9.7列舉了25個家庭的成年長子和次子的頭長和頭寬。利用典型相關(guān)分析法分析長子和次子頭型的相關(guān)性。(一)操作步驟1. 按FileNewSyntax的順序新建一個語句窗口。在語句窗口中輸入下面的語句: INCLUDE Canonical correlation.sps.CANCORR SET1=x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論