《應(yīng)用多元統(tǒng)計分析》第09章_典型相關(guān)分析_第1頁
《應(yīng)用多元統(tǒng)計分析》第09章_典型相關(guān)分析_第2頁
《應(yīng)用多元統(tǒng)計分析》第09章_典型相關(guān)分析_第3頁
《應(yīng)用多元統(tǒng)計分析》第09章_典型相關(guān)分析_第4頁
《應(yīng)用多元統(tǒng)計分析》第09章_典型相關(guān)分析_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第九章第九章 典型相關(guān)分析典型相關(guān)分析 第一節(jié)第一節(jié) 引言引言 第二節(jié)第二節(jié) 典型相關(guān)的基本理論典型相關(guān)的基本理論 第三節(jié)第三節(jié) 樣本典型相關(guān)分析樣本典型相關(guān)分析 第四節(jié)第四節(jié) 典型相關(guān)分析應(yīng)用中的幾典型相關(guān)分析應(yīng)用中的幾 個問題個問題 第五節(jié)第五節(jié) 實例分析與計算實現(xiàn)實例分析與計算實現(xiàn) 第一節(jié)第一節(jié) 引言引言n典型相關(guān)分析(典型相關(guān)分析(Canonical Correlation)是研究兩組變量之)是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。它能夠揭示出兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。它能夠揭示出兩組變量之間的內(nèi)在聯(lián)系。間的內(nèi)在聯(lián)系。n我們知道,在一元統(tǒng)計分析中,用相關(guān)系數(shù)來衡量兩

2、個隨機我們知道,在一元統(tǒng)計分析中,用相關(guān)系數(shù)來衡量兩個隨機變量之間的線性相關(guān)關(guān)系;用復(fù)相關(guān)系數(shù)研究一個隨機變量變量之間的線性相關(guān)關(guān)系;用復(fù)相關(guān)系數(shù)研究一個隨機變量和多個隨機變量的線性相關(guān)關(guān)系。然而,這些統(tǒng)計方法在研和多個隨機變量的線性相關(guān)關(guān)系。然而,這些統(tǒng)計方法在研究兩組變量之間的相關(guān)關(guān)系時卻無能為力。比如要研究生理究兩組變量之間的相關(guān)關(guān)系時卻無能為力。比如要研究生理指標與訓練指標的關(guān)系,居民生活環(huán)境與健康狀況的關(guān)系,指標與訓練指標的關(guān)系,居民生活環(huán)境與健康狀況的關(guān)系,人口統(tǒng)計變量(戶主年齡、家庭年收入、戶主受教育程度)人口統(tǒng)計變量(戶主年齡、家庭年收入、戶主受教育程度)與消費變量(每年去餐館

3、就餐的頻率、每年出外看電影的頻與消費變量(每年去餐館就餐的頻率、每年出外看電影的頻率)之間是否具有相關(guān)關(guān)系?閱讀能力變量(閱讀速度、閱率)之間是否具有相關(guān)關(guān)系?閱讀能力變量(閱讀速度、閱讀才能)與數(shù)學運算能力變量(數(shù)學運算速度、數(shù)學運算才讀才能)與數(shù)學運算能力變量(數(shù)學運算速度、數(shù)學運算才能)是否相關(guān)?這些多變量間的相關(guān)性如何分析?能)是否相關(guān)?這些多變量間的相關(guān)性如何分析? n1936年霍特林(年霍特林(Hotelling)最早就)最早就“大學表現(xiàn)大學表現(xiàn)”和和“入學前入學前成績成績”的關(guān)系、政府政策變量與經(jīng)濟目標變量的關(guān)系等問題的關(guān)系、政府政策變量與經(jīng)濟目標變量的關(guān)系等問題進行了研究,提出

4、了典型相關(guān)分析技術(shù)。之后,進行了研究,提出了典型相關(guān)分析技術(shù)。之后,Cooley和和Hohnes(1971),Tatsuoka(1971)及及Mardia,Kent和和Bibby(1979)等人對典型相關(guān)分析的應(yīng)用進行了討論,等人對典型相關(guān)分析的應(yīng)用進行了討論,Kshirsagar(1972)則從理論上給出了最好的分析。則從理論上給出了最好的分析。 n典型相關(guān)分析的目的是識別并量化兩組變量之間的聯(lián)系,將典型相關(guān)分析的目的是識別并量化兩組變量之間的聯(lián)系,將兩組變量相關(guān)關(guān)系的分析,轉(zhuǎn)化為一組變量的線性組合與另兩組變量相關(guān)關(guān)系的分析,轉(zhuǎn)化為一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系分析。一

5、組變量線性組合之間的相關(guān)關(guān)系分析。n目前,典型相關(guān)分析已被應(yīng)用于心理學、市場營銷等領(lǐng)域。目前,典型相關(guān)分析已被應(yīng)用于心理學、市場營銷等領(lǐng)域。如用于研究個人性格與職業(yè)興趣的關(guān)系,市場促銷活動與消如用于研究個人性格與職業(yè)興趣的關(guān)系,市場促銷活動與消費者響應(yīng)之間的關(guān)系等問題的分析研究。費者響應(yīng)之間的關(guān)系等問題的分析研究。 第二節(jié)第二節(jié) 典型相關(guān)的基本理論典型相關(guān)的基本理論 一一 典型相關(guān)分析的基本思想典型相關(guān)分析的基本思想 二二 典型相關(guān)分析原理及方法典型相關(guān)分析原理及方法 一、典型相關(guān)分析的基本思想一、典型相關(guān)分析的基本思想n典型相關(guān)分析由典型相關(guān)分析由Hotelling提出,其基本思想和主成分分

6、析非提出,其基本思想和主成分分析非常相似。首先在每組變量中找出變量的線性組合,使得兩組常相似。首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。然后選取和最初挑選的線性組合之間具有最大的相關(guān)系數(shù)。然后選取和最初挑選的這對線性組合不相關(guān)的線性組合,使其配對,并選取相關(guān)的這對線性組合不相關(guān)的線性組合,使其配對,并選取相關(guān)系數(shù)最大的一對,如此繼續(xù)下去,直到兩組變量之間的相關(guān)系數(shù)最大的一對,如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為此。被選出的線性組合配對稱為典型變量,性被提取完畢為此。被選出的線性組合配對稱為典型變量,它們的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)。典型相關(guān)系數(shù)度

7、量了這它們的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)。典型相關(guān)系數(shù)度量了這兩組變量之間聯(lián)系的強度。兩組變量之間聯(lián)系的強度。n一般情況,設(shè)一般情況,設(shè)是兩個相互關(guān)聯(lián)的隨機向量,分別在兩組變量中選取若干有是兩個相互關(guān)聯(lián)的隨機向量,分別在兩組變量中選取若干有代表性的綜合變量代表性的綜合變量Ui、Vi,使得每一個綜合變量是原變量的,使得每一個綜合變量是原變量的線性組合,即線性組合,即 n 二、典型相關(guān)分析原理及方法二、典型相關(guān)分析原理及方法n n n n n n n n n n n n n 第三節(jié)第三節(jié) 樣本典型相關(guān)分析樣本典型相關(guān)分析一一 樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算 二

8、二 典型相關(guān)系數(shù)的顯著性檢驗典型相關(guān)系數(shù)的顯著性檢驗 一、樣本典型相關(guān)變量及典型相關(guān)系一、樣本典型相關(guān)變量及典型相關(guān)系數(shù)的計算數(shù)的計算n n n n n n 二、典型相關(guān)系數(shù)的顯著性檢驗二、典型相關(guān)系數(shù)的顯著性檢驗n n n n n n nn【例例9.1】康復(fù)俱樂部對康復(fù)俱樂部對20名中年人測量了三個生理指標:名中年人測量了三個生理指標:體重體重(x1),腰圍腰圍(x2),脈搏,脈搏(x3);三個訓練指標:引體向上次數(shù);三個訓練指標:引體向上次數(shù)(y1),起坐次數(shù),起坐次數(shù)(y2),跳躍次數(shù),跳躍次數(shù)(y3)。分析生理指標與訓練指。分析生理指標與訓練指標的相關(guān)性。數(shù)據(jù)詳見表標的相關(guān)性。數(shù)據(jù)詳見

9、表9.1。 表表9.1 康復(fù)俱樂部數(shù)據(jù)康復(fù)俱樂部數(shù)據(jù)n n n n 第四節(jié)第四節(jié) 典型相關(guān)分析應(yīng)用中的典型相關(guān)分析應(yīng)用中的 幾個問題幾個問題一一 從相關(guān)矩陣出發(fā)計算典型相關(guān)從相關(guān)矩陣出發(fā)計算典型相關(guān) 二二 典型載荷分析典型載荷分析 三三 典型冗余分析典型冗余分析 一、從相關(guān)矩陣出發(fā)計算典型相關(guān)一、從相關(guān)矩陣出發(fā)計算典型相關(guān)n典型相關(guān)分析涉及多個變量,不同的變量往往具有不同的量典型相關(guān)分析涉及多個變量,不同的變量往往具有不同的量綱及不同的數(shù)量級別。在進行典型相關(guān)分析時,由于典型變綱及不同的數(shù)量級別。在進行典型相關(guān)分析時,由于典型變量是原始變量的線性組合,具有不同量綱變量的線性組合顯量是原始變量的

10、線性組合,具有不同量綱變量的線性組合顯然失去了實際意義。其次,不同的數(shù)量級別會導致然失去了實際意義。其次,不同的數(shù)量級別會導致“以大吃以大吃小小”,即數(shù)量級別小的變量的影響會被忽略,從而影響了分,即數(shù)量級別小的變量的影響會被忽略,從而影響了分析結(jié)果的合理性。因此,為了消除量綱和數(shù)量級別的影響,析結(jié)果的合理性。因此,為了消除量綱和數(shù)量級別的影響,必須對數(shù)據(jù)先做標準化變換處理,然后再做典型相關(guān)分析。必須對數(shù)據(jù)先做標準化變換處理,然后再做典型相關(guān)分析。顯然,經(jīng)標準化變換之后的協(xié)差陣就是相關(guān)系數(shù)矩陣,因而,顯然,經(jīng)標準化變換之后的協(xié)差陣就是相關(guān)系數(shù)矩陣,因而,也即通常應(yīng)從相關(guān)矩陣出發(fā)進行典型相關(guān)分析。

11、也即通常應(yīng)從相關(guān)矩陣出發(fā)進行典型相關(guān)分析。n【例例9.2】對于例對于例9.1從相關(guān)系數(shù)矩陣出發(fā)進行典型相關(guān)分析。從相關(guān)系數(shù)矩陣出發(fā)進行典型相關(guān)分析。 二、典型載荷分析二、典型載荷分析n n n以上結(jié)果說明生理指標的第一典型變量與體重的相關(guān)系數(shù)為以上結(jié)果說明生理指標的第一典型變量與體重的相關(guān)系數(shù)為-0.621,與腰圍的相關(guān)系數(shù)為,與腰圍的相關(guān)系數(shù)為-0.925,與脈搏的相關(guān)系數(shù)為,與脈搏的相關(guān)系數(shù)為0.333。從另一方面說明生理指標的第一對典型變量與體重、。從另一方面說明生理指標的第一對典型變量與體重、腰圍負相關(guān),而與脈搏正相關(guān)。其中與腰圍的相關(guān)性最強。腰圍負相關(guān),而與脈搏正相關(guān)。其中與腰圍的相

12、關(guān)性最強。第一對典型變量主要反映了體形的胖瘦。第一對典型變量主要反映了體形的胖瘦。 三、典型冗余分析三、典型冗余分析n n n n 前前2個典型變量解釋的方差比例個典型變量解釋的方差比例0.451+0.2460.697n同樣的方法可求得訓練指標樣本方差由自身同樣的方法可求得訓練指標樣本方差由自身3個典型變量解個典型變量解釋的方差比例分別為:釋的方差比例分別為:0.408、0.434、0.157。 第五節(jié)第五節(jié) 實例分析與計算實現(xiàn)實例分析與計算實現(xiàn)一一 利用利用SPSS進行典型相關(guān)分析實例進行典型相關(guān)分析實例1 二二 利用利用SPSS進行典型相關(guān)分析實例進行典型相關(guān)分析實例2 一、利用一、利用S

13、PSS進行典型相關(guān)分析進行典型相關(guān)分析實例實例1n測量測量15名受試者的身體形態(tài)以及健康情況指標,如名受試者的身體形態(tài)以及健康情況指標,如9.2表。表。第一組是身體形態(tài)變量,有年齡、體重、胸圍和日抽煙量;第一組是身體形態(tài)變量,有年齡、體重、胸圍和日抽煙量;第二組是健康狀況變量,有脈搏、收縮壓和舒張壓。要求測第二組是健康狀況變量,有脈搏、收縮壓和舒張壓。要求測量身體形態(tài)以及健康狀況這兩組變量之間的關(guān)系。量身體形態(tài)以及健康狀況這兩組變量之間的關(guān)系。 表表9.2 兩組身體素質(zhì)的典型變量兩組身體素質(zhì)的典型變量 (一)操作步驟(一)操作步驟n在在SPSS中沒有提供典型相關(guān)分析的專門菜單項,要想利用中沒有

14、提供典型相關(guān)分析的專門菜單項,要想利用SPSS實現(xiàn)典型相關(guān)分析,必須在語句窗口中調(diào)用實現(xiàn)典型相關(guān)分析,必須在語句窗口中調(diào)用SPSS的的 Canonical correlation.sps 宏。具體方法如下:宏。具體方法如下:1. 按按Syntax的順序新建一個語句窗口。在語句的順序新建一個語句窗口。在語句 窗口窗口中輸入下面的語句:(圖中輸入下面的語句:(圖9.1)INCLUDE Canonical correlation.sps.CANCORR SET1=x1 x2 x3 x4 /SET2=y1 y2 y3 / . 2. 點擊語句窗口點擊語句窗口Run菜單中的菜單中的All子菜單項,運行典型

15、相關(guān)宏子菜單項,運行典型相關(guān)宏命令,得出結(jié)果。命令,得出結(jié)果。 圖圖9.1 語句窗口語句窗口 (二)主要運行結(jié)果解釋(二)主要運行結(jié)果解釋1. Correlations for Set-1、Correlations for Set-2、Correlations Between Set-1 and Set-2(分別給出兩組變量內(nèi)(分別給出兩組變量內(nèi)部以及兩組變量之間的相關(guān)系數(shù)矩陣)部以及兩組變量之間的相關(guān)系數(shù)矩陣)2. Canonical Correlations(給出典型相關(guān)系數(shù))(給出典型相關(guān)系數(shù))從表從表9.3中可以看出第一典型相關(guān)系數(shù)達到中可以看出第一典型相關(guān)系數(shù)達到0.957,第二典型

16、相,第二典型相關(guān)系數(shù)為關(guān)系數(shù)為0.582,第三典型相關(guān)系數(shù)為,第三典型相關(guān)系數(shù)為0.180。 表表9.3 典型相關(guān)系數(shù)典型相關(guān)系數(shù) 3. Test that remaining correlations are zero(給出典型相關(guān)(給出典型相關(guān)的顯著性檢驗)的顯著性檢驗)表表9.4中從左至右分別為中從左至右分別為Wilks的統(tǒng)計量、卡方統(tǒng)計量、自由度的統(tǒng)計量、卡方統(tǒng)計量、自由度和伴隨概率。從表中可以看出,在和伴隨概率。從表中可以看出,在0.05的顯著性水平下,三對的顯著性水平下,三對典型變量中只有第一對典型相關(guān)是顯著的。典型變量中只有第一對典型相關(guān)是顯著的。 表表9.4 典型相關(guān)系數(shù)的顯著

17、性檢驗典型相關(guān)系數(shù)的顯著性檢驗n 表表9.5 兩組典型變量的標準化系數(shù)兩組典型變量的標準化系數(shù) 由于由于Y1(脈搏)的系數(shù)(脈搏)的系數(shù)-0.721絕對值最大,說明健康狀況的典絕對值最大,說明健康狀況的典型變量主要由脈搏所決定。型變量主要由脈搏所決定。同時,由于兩個典型變量中抽煙量和脈搏的系數(shù)是同號的(都同時,由于兩個典型變量中抽煙量和脈搏的系數(shù)是同號的(都為負),反映抽煙量和脈搏的正相關(guān),即日抽煙越多則每分鐘為負),反映抽煙量和脈搏的正相關(guān),即日抽煙越多則每分鐘的脈搏跳動次數(shù)也越多。抽煙對身體健康有害,這和客觀事實的脈搏跳動次數(shù)也越多。抽煙對身體健康有害,這和客觀事實是相符的。是相符的。 n

18、6. Redundancy Analysis(分別給出兩組典型變量的冗余分(分別給出兩組典型變量的冗余分析)析)表表9.6中給出的四組數(shù)據(jù)分別是身體形態(tài)變量被自身的典型變中給出的四組數(shù)據(jù)分別是身體形態(tài)變量被自身的典型變量解釋的方差比例、身體形態(tài)變量被健康狀況的典型變量解釋量解釋的方差比例、身體形態(tài)變量被健康狀況的典型變量解釋的方差比例、健康狀況變量被自身的典型變量解釋的方差比例的方差比例、健康狀況變量被自身的典型變量解釋的方差比例和健康狀況變量被身體形態(tài)的典型變量解釋的方差比例。和健康狀況變量被身體形態(tài)的典型變量解釋的方差比例。 表表9.6 典型冗余分析典型冗余分析 二、利用二、利用SPSS進

19、行典型相關(guān)分析進行典型相關(guān)分析實例實例2n利用利用SPSS軟件對軟件對C.R.Rao(1952)關(guān)于典型相關(guān)的經(jīng)典例子)關(guān)于典型相關(guān)的經(jīng)典例子進行分析。表進行分析。表9.7列舉了列舉了25個家庭的成年長子和次子的頭長個家庭的成年長子和次子的頭長和頭寬。利用典型相關(guān)分析法分析長子和次子頭型的相關(guān)性。和頭寬。利用典型相關(guān)分析法分析長子和次子頭型的相關(guān)性。(一)操作步驟(一)操作步驟1. 按按Syntax的順序新建一個語句窗口。在語句窗口中輸入的順序新建一個語句窗口。在語句窗口中輸入下面的語句:下面的語句: INCLUDE Canonical correlation.sps.CANCORR SET1=x1 x2 /SET2=y1 y2 / .2. 點擊語句窗口點擊語句窗口Run菜單中的菜單中的All子菜單項,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論