




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第六章第六章 相關分析相關分析一、相關分析的概念一、相關分析的概念相關分析是研究變量間密切程度的一種常用統(tǒng)計方法。線性相關分析研究兩個變量間線性關系的程度。相關系數(shù)是描述這種線性關系程度和方向的統(tǒng)計量,通常用r表示。相關系數(shù)r沒有單位;其值在-1+1之間。當數(shù)值愈接近-l或+1之間時,關系愈緊密,接近于0時,關系愈不緊密。 對其數(shù)值可以從小到大排列的數(shù)據(jù)才能計算其相關系數(shù)。例如不能計算宗教信仰與顏色喜好之間的關系。 二、相關系數(shù)二、相關系數(shù)積矩相關系數(shù)(Pearson相關系數(shù)) Spearman和Kendall秩相關系數(shù) 偏相關系數(shù) 1、積矩相關系數(shù)(、積矩相關系數(shù)(Pearson相關系數(shù))相
2、關系數(shù))積矩相關系數(shù)(又稱積差相關系數(shù))適用于等間隔測度,相關系數(shù)采用Pearson積矩相關。 nininiiixyyyxxyxRiiyx11221)()()(2、Spearman和和Kendall秩相關系數(shù)秩相關系數(shù) Spearman和Kendall秩相關系數(shù)是一種非參測度,是根據(jù)秩而不是根據(jù)實際值計算的秩相關適用于下列資料不服從雙變量正態(tài)分布;總體分布型未知;用等級表示的資料。 Spearman和和Kendall秩相關系數(shù)秩相關系數(shù)Spearman相關系數(shù)是Pearson相關系數(shù)的非參形式。是根據(jù)數(shù)據(jù)的秩而不是根據(jù)實際值計算的。也就是說,先對原始變量的數(shù)據(jù)排秩,根據(jù)各秩使用相關系數(shù)公式進行
3、計算。它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設的等間隔數(shù)據(jù)的等間隔數(shù)據(jù)。相關系數(shù)的值范圍也是在-1+1之間。絕對值越大表明相關越強。相關系數(shù)的符號也表示相關的方向。這兩種相關系數(shù)的計算必須對連續(xù)變量值排秩,對離散變量排序。Spearman和和Kendall秩相關系數(shù)秩相關系數(shù)例如,我們可以將一組學生按入學考試成績和第一學年結(jié)業(yè)成績的順序排隊。如果將入學考試成績的評秩記為X1,X2,Xn,而學年結(jié)業(yè)成績的評秩記為Y1,Y2,Yn,我們就可以用秩相關度量來決定X和Y之間的相關性。 nininiiiSSRRSRiiSR11221)()()(Ri為第i個X值的秩,Si為第i
4、個Y值的秩。Spearman和和Kendall秩相關系數(shù)秩相關系數(shù)Kendalls tau-b也是一種對兩個有序變量或兩個秩變量間的關系程度的測度,因此也屬于一種非參測度 。以一個例子來進行Kendall秩相關系數(shù)的計算。如果兩位鑒定家各自以吸引力的大小將7幅抽象派畫評定了秩,那么可能知道這些秩評定之間的相符的程度。 依次取觀測2(鑒別家2)給出的秩,數(shù)出每一個右面在秩次上比自己小的個數(shù),并將這些個數(shù)加起來。例如抽象畫2的秩為2,其個數(shù)是1,因為其右邊的只有抽象畫5的秩比它小。6個數(shù)依次為1,1,0,0,1和0,所以總和為Q3,Kendall秩相關系數(shù)則為: R=1-4Q/n(n-1)=1-1
5、2/42=0.714 畫 號2651437鑒別家11234567鑒別家223146573、偏相關系數(shù)、偏相關系數(shù)偏相關系數(shù)描述的是當控制了一個或幾個另當控制了一個或幾個另外的變量的影響條件下兩個變量間的相關性外的變量的影響條件下兩個變量間的相關性。例如:可以控制年齡和工作經(jīng)驗兩個變量的影響,估計工資收入與受教育程度之間的相關關系??刂屏俗兞縕,變量X與 Y之間的偏相關,和控制了兩個變量 Z1、Z2,變量 X與Y之間的偏相關系數(shù)計算公式不同。 相似性與不相似性相似性與不相似性 兩個或若干變量之間或兩組觀測量之間的關系有時也可以用相似性或不相似性來描述。相似性測度相似性測度用大數(shù)值表示很相似,較小
6、的數(shù)值表明相似性小。不相似性不相似性使用距離或不相似性來描述。大值表示相差甚遠。 三、相關系數(shù)統(tǒng)計意義的檢驗三、相關系數(shù)統(tǒng)計意義的檢驗四、相關分析的四、相關分析的 SPSS過程過程 Bivarate(相關分析)命令項調(diào)用Correlations過程,按指定項顯示變量的描述統(tǒng)計量。計算指定的兩個變量間的相關系數(shù),可以選擇Pearson相關、Spearman和Kendalls tau-b 相關;同時對相關系數(shù)進行檢驗。檢驗的零假設是:相關系數(shù)為0??梢詫z驗進行單尾或雙尾的選擇。給出相關系數(shù)為0的概率。 Partial(偏相關分析)命令項調(diào)用Partial Corr過程,計算兩個變量間在控制了其他
7、變量的影響下的相關系數(shù)。可以選擇單尾或雙尾顯著性檢驗。檢驗的零假設是:偏相關系數(shù)為零。還可以要求計算其他描述統(tǒng)計量。 相關分析的相關分析的 SPSS過程過程Distance(距離分析)命令項調(diào)用Proximities 過程,對變量或觀測量進行相似性或不相似性測度。因此分析的變量可以是連續(xù)變量、表示頻數(shù)分布的變量,某些測度還可以適用于二值變量??梢詫υ紨?shù)據(jù)和計算出的距離數(shù)據(jù)進行標準化。 相關分析的相關分析的 SPSS過程過程說明說明如果需要確定兩個變量或若干自變量與因變量具體的函數(shù)關系,使用相關分析不能達到目的,必須使用回歸分析。如果要將觀測量或變量歸到確定的類中,必須使用聚類分析中的觀測量聚
8、類或變量聚類的相應過程。 (一)兩個變量間的相關分析(一)兩個變量間的相關分析 本節(jié)介紹兩變量間的相關。包括兩個連續(xù)變量間的相關和兩個等級變量間的秩相關。這兩種相關使用同一個命令項Bivarate調(diào)用,通過選擇不同的分析方法調(diào)用不同的分析過程。選擇哪一種分析方法要看具體的數(shù)據(jù)類型。對于連續(xù)變量和等級變量選擇不同的分析方法。 兩個變量間的相關分析兩個變量間的相關分析Pearson調(diào)用correlation過程計算連續(xù)變量或等間隔測量的變量間的相關系數(shù)。Kendalls tau-b調(diào)用Nonpar corr過程計算分類變量間的秩相關。Spearman調(diào)用Nonpar corr過程計算斯皮爾曼秩相關
9、。如果參與分析的變量是連續(xù)變量,選擇Kendalls tau-b或Spearman相關,則系統(tǒng)自動對連續(xù)變量的值先求秩,再計算其秩分數(shù)間的相關系數(shù)。使用系統(tǒng)默認值進行相關分析使用系統(tǒng)默認值進行相關分析 l9621988年安徽省國民收入與城鄉(xiāng)居民儲蓄存款余額兩個變量間的相關分析為例,說明使用系統(tǒng)默認值進行連續(xù)變量相關分析的方法。數(shù)據(jù)編號數(shù)據(jù)編號data1001。 變量包括:income國民收入(億元),deposit城鄉(xiāng)居民儲蓄存款余額, number序號,year年份。 例一例一Data09-03是銀行雇員數(shù)據(jù),要求分析起始工資、當前工資、與雇員年齡、受教育水平、工作經(jīng)驗職務等之間是否存在線性
10、關系。例二例二10名學生兩科課程的名次排列,要求求出其等級相關系數(shù),檢驗其顯著性。Data1003練習題練習題某婦幼保健醫(yī)院對33名產(chǎn)婦進行產(chǎn)前檢查并得到嬰兒體重的原始觀測值包括髂前上棘間徑(x1),髂脊間徑(x2),恥骶外徑(x3),坐骨間徑(x4),血紅蛋白(x5),嬰兒體重(X6)等6個指標。試分析各指標的相關系數(shù)。Hong1.sav練習題練習題從下表所給資料分析血小板和出血癥的關系。試分析上述資料有無相關關系。病例號123456789101112血小板數(shù)12013016031042054074010601260123014402000出血癥狀Spearman.sav(二)偏相關分析(二
11、)偏相關分析相關分析計算兩個變量間的相關系數(shù),分析兩個變量間線性關系的程度。往往因為第三個變量的作用,使相關系數(shù)不能真正反映兩個變量間線性程度。偏相關分析偏相關分析例如身高、體重與肺活量之間的關系。使用使用Pearson相關計算其相關系數(shù),可以得出肺活量與身高和體相關計算其相關系數(shù),可以得出肺活量與身高和體重均存在較強的線重均存在較強的線性關系。關系。但實際上實際上,如果對體重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?是否身高值越大,肺活量越大呢?結(jié)論是否定的。正是因為身高與體重有著線性關系,體重與肺活量存在線性關系,因此,得出身高與肺活量之間存在較強的線性關系的錯誤結(jié)論。偏相
12、關分析的任務就是在研究兩個變量之間的線性相關關系時控制可能對其產(chǎn)生影響的變量。例一分析身高、體重、肺活量間的關系分析身高、體重、肺活量間的關系數(shù)據(jù)編號數(shù)據(jù)編號data1004分別調(diào)用分別調(diào)用bivariate和和partial過程,比較其結(jié)過程,比較其結(jié)Correlations1.741*.600*.000.001292929.741*1.751*.000.000292929.600*.751*1.001.000.292929Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson Correla
13、tionSig. (2-tailed)N身高體重肺活量身高體重肺活量Correlation is significant at the 0.01 level (2-tailed).*. CorrelationsCorrelations1.000.098.619026.0981.000.619.260CorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)df身高肺活量Control Variables體重身高肺活量例二四川綿陽地區(qū)四川綿陽地區(qū)3年生中山柏的數(shù)據(jù)。年生中山柏的數(shù)據(jù)。分析月生長量與月平均氣溫、月降雨量、月平均日照時數(shù)、月平均濕度四個氣候因素哪個因素有關。Month:月份,hgrow:生長量,temp:月平均氣溫,rain: 月降雨量,hsun: 月平均日照時數(shù),humi: 月平均濕度。數(shù)據(jù)編號數(shù)據(jù)編號data10-05分析變量:hgrow(生長量)與hsun(月平均日照時數(shù))控制變量:humi(月平均濕度)、rain(月降雨量)、temp(月平均氣溫) 練習題練習題289名肝炎患者的檢測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電廠運行管理標準化操作指南與實踐探索
- 誘變劑增強納米載體穿透-洞察及研究
- 小學班級德育課程化實踐研究
- 檢測公司績效管理辦法
- 園林綠化人員崗位職責
- 智能電網(wǎng)數(shù)據(jù)傳輸優(yōu)化:面向未來的設計方案
- 安全生產(chǎn)月活動情況匯報
- 名家語文教學示范
- 根據(jù)安全法的規(guī)定
- 安全生產(chǎn)雙重預防機制建設規(guī)范
- 林規(guī)發(fā)防護林造林工程投資估算指標
- 四年級上冊 口算題 1000題
- 九上道法知識點梳理(全冊)-九年級道德與法治上冊必備知識梳理總結(jié)(部編版)
- GB/T 23821-2022機械安全防止上下肢觸及危險區(qū)的安全距離
- YB/T 5202.1-2003不定形耐火材料試樣制備方法第1部分:耐火澆注料
- GB/T 700-2006碳素結(jié)構(gòu)鋼
- GB/T 41419-2022數(shù)字化試衣虛擬人體用術語和定義
- GB/T 24218.1-2009紡織品非織造布試驗方法第1部分:單位面積質(zhì)量的測定
- 《病毒學》(研究生)全冊配套完整課件
- 第十七章其他熔化焊接與熱切割作業(yè)課件
- 腧穴總論 2特定穴課件
評論
0/150
提交評論