SPSS課件第八章相關分析_第1頁
SPSS課件第八章相關分析_第2頁
SPSS課件第八章相關分析_第3頁
SPSS課件第八章相關分析_第4頁
SPSS課件第八章相關分析_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章相關分析一、相關分析的概念相關分析是研究變量間密切程度的一種常用統計方法。線性相關分析研究兩個變量間線性關系的程度。相關系數是描述這種線性關系程度和方向的統計量,通常用r表示。相關系數r沒有單位;其值在-1~+1之間。當數值愈接近-l或+1之間時,關系愈緊密,接近于0時,關系愈不緊密。對其數值可以從小到大排列的數據才能計算其相關系數。例如不能計算宗教信仰與顏色喜好之間的關系。

二、相關系數積矩相關系數(Pearson相關系數)Spearman和Kendall秩相關系數偏相關系數1、積矩相關系數(Pearson相關系數)積矩相關系數(又稱積差相關系數)適用于等間隔測度,相關系數采用Pearson積矩相關。2、Spearman和Kendall秩相關系數

Spearman和Kendall秩相關系數是一種非參測度,是根據秩而不是根據實際值計算的秩相關適用于下列資料不服從雙變量正態(tài)分布;總體分布型未知;用等級表示的資料。Spearman和Kendall秩相關系數Spearman相關系數是Pearson相關系數的非參形式。是根據數據的秩而不是根據實際值計算的。也就是說,先對原始變量的數據排秩,根據各秩使用相關系數公式進行計算。它適合有序數據或不滿足正態(tài)分布假設的等間隔數據。相關系數的值范圍也是在-1~+1之間。絕對值越大表明相關越強。相關系數的符號也表示相關的方向。這兩種相關系數的計算必須對連續(xù)變量值排秩,對離散變量排序。Spearman和Kendall秩相關系數例如,我們可以將一組學生按入學考試成績和第一學年結業(yè)成績的順序排隊。如果將入學考試成績的評秩記為X1,X2,Xn,而學年結業(yè)成績的評秩記為Y1,Y2,Yn,我們就可以用秩相關度量來決定X和Y之間的相關性。Ri為第i個X值的秩,Si為第i個Y值的秩。Spearman和Kendall秩相關系數Kendall‘stau-b也是一種對兩個有序變量或兩個秩變量間的關系程度的測度,因此也屬于一種非參測度。以一個例子來進行Kendall秩相關系數的計算。如果兩位鑒定家各自以吸引力的大小將7幅抽象派畫評定了秩,那么可能知道這些秩評定之間的相符的程度。依次取觀測2(鑒別家2)給出的秩,數出每一個右面在秩次上比自己小的個數,并將這些個數加起來。例如抽象畫2的秩為2,其個數是1,因為其右邊的只有抽象畫5的秩比它小。6個數依次為1,1,0,0,1和0,所以總和為Q=3,Kendall秩相關系數則為:

R=1-4Q/n(n-1)=1-12/42=0.714

畫號2651437鑒別家11234567鑒別家223146573、偏相關系數偏相關系數描述的是當控制了一個或幾個另外的變量的影響條件下兩個變量間的相關性。例如:可以控制年齡和工作經驗兩個變量的影響,估計工資收入與受教育程度之間的相關關系??刂屏俗兞縕,變量X與Y之間的偏相關,和控制了兩個變量Z1、Z2,變量X與Y之間的偏相關系數計算公式不同。相似性與不相似性

兩個或若干變量之間或兩組觀測量之間的關系有時也可以用相似性或不相似性來描述。相似性測度用大數值表示很相似,較小的數值表明相似性小。不相似性使用距離或不相似性來描述。大值表示相差甚遠。三、相關系數統計意義的檢驗四、相關分析的SPSS過程Bivarate(相關分析)命令項調用Correlations過程,按指定項顯示變量的描述統計量。計算指定的兩個變量間的相關系數,可以選擇Pearson相關、Spearman和Kendall'stau-b

相關;同時對相關系數進行檢驗。檢驗的零假設是:相關系數為0??梢詫z驗進行單尾或雙尾的選擇。給出相關系數為0的概率。

Partial(偏相關分析)命令項調用PartialCorr過程,計算兩個變量間在控制了其他變量的影響下的相關系數??梢赃x擇單尾或雙尾顯著性檢驗。檢驗的零假設是:偏相關系數為零。還可以要求計算其他描述統計量。相關分析的SPSS過程Distance(距離分析)命令項調用Proximities過程,對變量或觀測量進行相似性或不相似性測度。因此分析的變量可以是連續(xù)變量、表示頻數分布的變量,某些測度還可以適用于二值變量??梢詫υ紨祿陀嬎愠龅木嚯x數據進行標準化。相關分析的SPSS過程說明如果需要確定兩個變量或若干自變量與因變量具體的函數關系,使用相關分析不能達到目的,必須使用回歸分析。如果要將觀測量或變量歸到確定的類中,必須使用聚類分析中的觀測量聚類或變量聚類的相應過程。(一)兩個變量間的相關分析

本節(jié)介紹兩變量間的相關。包括兩個連續(xù)變量間的相關和兩個等級變量間的秩相關。這兩種相關使用同一個命令項Bivarate調用,通過選擇不同的分析方法調用不同的分析過程。選擇哪一種分析方法要看具體的數據類型。對于連續(xù)變量和等級變量選擇不同的分析方法。兩個變量間的相關分析Pearson調用correlation過程計算連續(xù)變量或等間隔測量的變量間的相關系數。Kendall'stau-b調用Nonpar

corr過程計算分類變量間的秩相關。Spearman調用Nonpar

corr過程計算斯皮爾曼秩相關。如果參與分析的變量是連續(xù)變量,選擇Kendall'stau-b或Spearman相關,則系統自動對連續(xù)變量的值先求秩,再計算其秩分數間的相關系數。使用系統默認值進行相關分析

l962~1988年安徽省國民收入與城鄉(xiāng)居民儲蓄存款余額兩個變量間的相關分析為例,說明使用系統默認值進行連續(xù)變量相關分析的方法。數據編號data10-01。

變量包括:income國民收入(億元),deposit城鄉(xiāng)居民儲蓄存款余額,number序號,year年份。例一Data09-03是銀行雇員數據,要求分析起始工資、當前工資、與雇員年齡、受教育水平、工作經驗職務等之間是否存在線性關系。例二10名學生兩科課程的名次排列,要求求出其等級相關系數,檢驗其顯著性。Data10-03練習題某婦幼保健醫(yī)院對33名產婦進行產前檢查并得到嬰兒體重的原始觀測值包括髂前上棘間徑(x1),髂脊間徑(x2),恥骶外徑(x3),坐骨間徑(x4),血紅蛋白(x5),嬰兒體重(X6)等6個指標。試分析各指標的相關系數。Hong1.sav練習題從下表所給資料分析血小板和出血癥的關系。試分析上述資料有無相關關系。病例號123456789101112血小板數12013016031042054074010601260123014402000出血癥狀++++++--++----++-Spearman.sav(二)偏相關分析相關分析計算兩個變量間的相關系數,分析兩個變量間線性關系的程度。往往因為第三個變量的作用,使相關系數不能真正反映兩個變量間線性程度。偏相關分析例如身高、體重與肺活量之間的關系。使用Pearson相關計算其相關系數,可以得出肺活量與身高和體重均存在較強的線性關系。但實際上,如果對體重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?結論是否定的。正是因為身高與體重有著線性關系,體重與肺活量存在線性關系,因此,得出身高與肺活量之間存在較強的線性關系的錯誤結論。偏相關分析的任務就是在研究兩個變量之間的線性相關關系時控制可能對其產生影響的變量。例一分析身高、體重、肺活量間的關系數據編號data10-04分別調用bivariate和partial過程,比較其結例二四川綿陽地區(qū)3年生中山柏的數據。分析月生長量與月平均氣溫、月降雨量、月平均日照時數、月平均濕度四個氣候因素哪個因素有關。Month:月份,hgrow:生長量,temp:月平均氣溫,rain:月降雨量,hsun:月平均日照時數,humi:月平均濕度。數據編號data10-05分析變量:hgrow(生長量)與hsun(月平均日照時數)控制變量:humi(月平均濕度)、rain(月降雨量)、temp(月平均氣溫)練習題289名肝炎患者的檢測結果見數據文件“patial_corr.sav",5個變量分別為:“group'’(肝硬化分類)、“ha'’(透明質酸)、“l(fā)n”(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論