




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第六章第六章 相關(guān)分析相關(guān)分析一、相關(guān)分析的概念一、相關(guān)分析的概念相關(guān)分析是研究變量間密切程度的一種常用統(tǒng)計(jì)方法。線性相關(guān)分析研究?jī)蓚€(gè)變量間線性關(guān)系的程度。相關(guān)系數(shù)是描述這種線性關(guān)系程度和方向的統(tǒng)計(jì)量,通常用r表示。相關(guān)系數(shù)r沒有單位;其值在-1+1之間。當(dāng)數(shù)值愈接近-l或+1之間時(shí),關(guān)系愈緊密,接近于0時(shí),關(guān)系愈不緊密。 對(duì)其數(shù)值可以從小到大排列的數(shù)據(jù)才能計(jì)算其相關(guān)系數(shù)。例如不能計(jì)算宗教信仰與顏色喜好之間的關(guān)系。 二、相關(guān)系數(shù)二、相關(guān)系數(shù)積矩相關(guān)系數(shù)(Pearson相關(guān)系數(shù)) Spearman和Kendall秩相關(guān)系數(shù) 偏相關(guān)系數(shù) 1、積矩相關(guān)系數(shù)(、積矩相關(guān)系數(shù)(Pearson相關(guān)系數(shù))相
2、關(guān)系數(shù))積矩相關(guān)系數(shù)(又稱積差相關(guān)系數(shù))適用于等間隔測(cè)度,相關(guān)系數(shù)采用Pearson積矩相關(guān)。 nininiiixyyyxxyxRiiyx11221)()()(2、Spearman和和Kendall秩相關(guān)系數(shù)秩相關(guān)系數(shù) Spearman和Kendall秩相關(guān)系數(shù)是一種非參測(cè)度,是根據(jù)秩而不是根據(jù)實(shí)際值計(jì)算的秩相關(guān)適用于下列資料不服從雙變量正態(tài)分布;總體分布型未知;用等級(jí)表示的資料。 Spearman和和Kendall秩相關(guān)系數(shù)秩相關(guān)系數(shù)Spearman相關(guān)系數(shù)是Pearson相關(guān)系數(shù)的非參形式。是根據(jù)數(shù)據(jù)的秩而不是根據(jù)實(shí)際值計(jì)算的。也就是說,先對(duì)原始變量的數(shù)據(jù)排秩,根據(jù)各秩使用相關(guān)系數(shù)公式進(jìn)行
3、計(jì)算。它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)的等間隔數(shù)據(jù)。相關(guān)系數(shù)的值范圍也是在-1+1之間。絕對(duì)值越大表明相關(guān)越強(qiáng)。相關(guān)系數(shù)的符號(hào)也表示相關(guān)的方向。這兩種相關(guān)系數(shù)的計(jì)算必須對(duì)連續(xù)變量值排秩,對(duì)離散變量排序。Spearman和和Kendall秩相關(guān)系數(shù)秩相關(guān)系數(shù)例如,我們可以將一組學(xué)生按入學(xué)考試成績(jī)和第一學(xué)年結(jié)業(yè)成績(jī)的順序排隊(duì)。如果將入學(xué)考試成績(jī)的評(píng)秩記為X1,X2,Xn,而學(xué)年結(jié)業(yè)成績(jī)的評(píng)秩記為Y1,Y2,Yn,我們就可以用秩相關(guān)度量來決定X和Y之間的相關(guān)性。 nininiiiSSRRSRiiSR11221)()()(Ri為第i個(gè)X值的秩,Si為第i
4、個(gè)Y值的秩。Spearman和和Kendall秩相關(guān)系數(shù)秩相關(guān)系數(shù)Kendalls tau-b也是一種對(duì)兩個(gè)有序變量或兩個(gè)秩變量間的關(guān)系程度的測(cè)度,因此也屬于一種非參測(cè)度 。以一個(gè)例子來進(jìn)行Kendall秩相關(guān)系數(shù)的計(jì)算。如果兩位鑒定家各自以吸引力的大小將7幅抽象派畫評(píng)定了秩,那么可能知道這些秩評(píng)定之間的相符的程度。 依次取觀測(cè)2(鑒別家2)給出的秩,數(shù)出每一個(gè)右面在秩次上比自己小的個(gè)數(shù),并將這些個(gè)數(shù)加起來。例如抽象畫2的秩為2,其個(gè)數(shù)是1,因?yàn)槠溆疫叺闹挥谐橄螽?的秩比它小。6個(gè)數(shù)依次為1,1,0,0,1和0,所以總和為Q3,Kendall秩相關(guān)系數(shù)則為: R=1-4Q/n(n-1)=1-1
5、2/42=0.714 畫 號(hào)2651437鑒別家11234567鑒別家223146573、偏相關(guān)系數(shù)、偏相關(guān)系數(shù)偏相關(guān)系數(shù)描述的是當(dāng)控制了一個(gè)或幾個(gè)另當(dāng)控制了一個(gè)或幾個(gè)另外的變量的影響條件下兩個(gè)變量間的相關(guān)性外的變量的影響條件下兩個(gè)變量間的相關(guān)性。例如:可以控制年齡和工作經(jīng)驗(yàn)兩個(gè)變量的影響,估計(jì)工資收入與受教育程度之間的相關(guān)關(guān)系。控制了變量Z,變量X與 Y之間的偏相關(guān),和控制了兩個(gè)變量 Z1、Z2,變量 X與Y之間的偏相關(guān)系數(shù)計(jì)算公式不同。 相似性與不相似性相似性與不相似性 兩個(gè)或若干變量之間或兩組觀測(cè)量之間的關(guān)系有時(shí)也可以用相似性或不相似性來描述。相似性測(cè)度相似性測(cè)度用大數(shù)值表示很相似,較小
6、的數(shù)值表明相似性小。不相似性不相似性使用距離或不相似性來描述。大值表示相差甚遠(yuǎn)。 三、相關(guān)系數(shù)統(tǒng)計(jì)意義的檢驗(yàn)三、相關(guān)系數(shù)統(tǒng)計(jì)意義的檢驗(yàn)四、相關(guān)分析的四、相關(guān)分析的 SPSS過程過程 Bivarate(相關(guān)分析)命令項(xiàng)調(diào)用Correlations過程,按指定項(xiàng)顯示變量的描述統(tǒng)計(jì)量。計(jì)算指定的兩個(gè)變量間的相關(guān)系數(shù),可以選擇Pearson相關(guān)、Spearman和Kendalls tau-b 相關(guān);同時(shí)對(duì)相關(guān)系數(shù)進(jìn)行檢驗(yàn)。檢驗(yàn)的零假設(shè)是:相關(guān)系數(shù)為0??梢詫?duì)檢驗(yàn)進(jìn)行單尾或雙尾的選擇。給出相關(guān)系數(shù)為0的概率。 Partial(偏相關(guān)分析)命令項(xiàng)調(diào)用Partial Corr過程,計(jì)算兩個(gè)變量間在控制了其他
7、變量的影響下的相關(guān)系數(shù)??梢赃x擇單尾或雙尾顯著性檢驗(yàn)。檢驗(yàn)的零假設(shè)是:偏相關(guān)系數(shù)為零。還可以要求計(jì)算其他描述統(tǒng)計(jì)量。 相關(guān)分析的相關(guān)分析的 SPSS過程過程Distance(距離分析)命令項(xiàng)調(diào)用Proximities 過程,對(duì)變量或觀測(cè)量進(jìn)行相似性或不相似性測(cè)度。因此分析的變量可以是連續(xù)變量、表示頻數(shù)分布的變量,某些測(cè)度還可以適用于二值變量??梢詫?duì)原始數(shù)據(jù)和計(jì)算出的距離數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。 相關(guān)分析的相關(guān)分析的 SPSS過程過程說明說明如果需要確定兩個(gè)變量或若干自變量與因變量具體的函數(shù)關(guān)系,使用相關(guān)分析不能達(dá)到目的,必須使用回歸分析。如果要將觀測(cè)量或變量歸到確定的類中,必須使用聚類分析中的觀測(cè)量聚
8、類或變量聚類的相應(yīng)過程。 (一)兩個(gè)變量間的相關(guān)分析(一)兩個(gè)變量間的相關(guān)分析 本節(jié)介紹兩變量間的相關(guān)。包括兩個(gè)連續(xù)變量間的相關(guān)和兩個(gè)等級(jí)變量間的秩相關(guān)。這兩種相關(guān)使用同一個(gè)命令項(xiàng)Bivarate調(diào)用,通過選擇不同的分析方法調(diào)用不同的分析過程。選擇哪一種分析方法要看具體的數(shù)據(jù)類型。對(duì)于連續(xù)變量和等級(jí)變量選擇不同的分析方法。 兩個(gè)變量間的相關(guān)分析兩個(gè)變量間的相關(guān)分析Pearson調(diào)用correlation過程計(jì)算連續(xù)變量或等間隔測(cè)量的變量間的相關(guān)系數(shù)。Kendalls tau-b調(diào)用Nonpar corr過程計(jì)算分類變量間的秩相關(guān)。Spearman調(diào)用Nonpar corr過程計(jì)算斯皮爾曼秩相關(guān)
9、。如果參與分析的變量是連續(xù)變量,選擇Kendalls tau-b或Spearman相關(guān),則系統(tǒng)自動(dòng)對(duì)連續(xù)變量的值先求秩,再計(jì)算其秩分?jǐn)?shù)間的相關(guān)系數(shù)。使用系統(tǒng)默認(rèn)值進(jìn)行相關(guān)分析使用系統(tǒng)默認(rèn)值進(jìn)行相關(guān)分析 l9621988年安徽省國民收入與城鄉(xiāng)居民儲(chǔ)蓄存款余額兩個(gè)變量間的相關(guān)分析為例,說明使用系統(tǒng)默認(rèn)值進(jìn)行連續(xù)變量相關(guān)分析的方法。數(shù)據(jù)編號(hào)數(shù)據(jù)編號(hào)data1001。 變量包括:income國民收入(億元),deposit城鄉(xiāng)居民儲(chǔ)蓄存款余額, number序號(hào),year年份。 例一例一Data09-03是銀行雇員數(shù)據(jù),要求分析起始工資、當(dāng)前工資、與雇員年齡、受教育水平、工作經(jīng)驗(yàn)職務(wù)等之間是否存在線性
10、關(guān)系。例二例二10名學(xué)生兩科課程的名次排列,要求求出其等級(jí)相關(guān)系數(shù),檢驗(yàn)其顯著性。Data1003練習(xí)題練習(xí)題某婦幼保健醫(yī)院對(duì)33名產(chǎn)婦進(jìn)行產(chǎn)前檢查并得到嬰兒體重的原始觀測(cè)值包括髂前上棘間徑(x1),髂脊間徑(x2),恥骶外徑(x3),坐骨間徑(x4),血紅蛋白(x5),嬰兒體重(X6)等6個(gè)指標(biāo)。試分析各指標(biāo)的相關(guān)系數(shù)。Hong1.sav練習(xí)題練習(xí)題從下表所給資料分析血小板和出血癥的關(guān)系。試分析上述資料有無相關(guān)關(guān)系。病例號(hào)123456789101112血小板數(shù)12013016031042054074010601260123014402000出血癥狀Spearman.sav(二)偏相關(guān)分析(二
11、)偏相關(guān)分析相關(guān)分析計(jì)算兩個(gè)變量間的相關(guān)系數(shù),分析兩個(gè)變量間線性關(guān)系的程度。往往因?yàn)榈谌齻€(gè)變量的作用,使相關(guān)系數(shù)不能真正反映兩個(gè)變量間線性程度。偏相關(guān)分析偏相關(guān)分析例如身高、體重與肺活量之間的關(guān)系。使用使用Pearson相關(guān)計(jì)算其相關(guān)系數(shù),可以得出肺活量與身高和體相關(guān)計(jì)算其相關(guān)系數(shù),可以得出肺活量與身高和體重均存在較強(qiáng)的線重均存在較強(qiáng)的線性關(guān)系。關(guān)系。但實(shí)際上實(shí)際上,如果對(duì)體重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?是否身高值越大,肺活量越大呢?結(jié)論是否定的。正是因?yàn)樯砀吲c體重有著線性關(guān)系,體重與肺活量存在線性關(guān)系,因此,得出身高與肺活量之間存在較強(qiáng)的線性關(guān)系的錯(cuò)誤結(jié)論。偏相
12、關(guān)分析的任務(wù)就是在研究?jī)蓚€(gè)變量之間的線性相關(guān)關(guān)系時(shí)控制可能對(duì)其產(chǎn)生影響的變量。例一分析身高、體重、肺活量間的關(guān)系分析身高、體重、肺活量間的關(guān)系數(shù)據(jù)編號(hào)數(shù)據(jù)編號(hào)data1004分別調(diào)用分別調(diào)用bivariate和和partial過程,比較其結(jié)過程,比較其結(jié)Correlations1.741*.600*.000.001292929.741*1.751*.000.000292929.600*.751*1.001.000.292929Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson Correla
13、tionSig. (2-tailed)N身高體重肺活量身高體重肺活量Correlation is significant at the 0.01 level (2-tailed).*. CorrelationsCorrelations1.000.098.619026.0981.000.619.260CorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)df身高肺活量Control Variables體重身高肺活量例二四川綿陽地區(qū)四川綿陽地區(qū)3年生中山柏的數(shù)據(jù)。年生中山柏的數(shù)據(jù)。分析月生長量與月平均氣溫、月降雨量、月平均日照時(shí)數(shù)、月平均濕度四個(gè)氣候因素哪個(gè)因素有關(guān)。Month:月份,hgrow:生長量,temp:月平均氣溫,rain: 月降雨量,hsun: 月平均日照時(shí)數(shù),humi: 月平均濕度。數(shù)據(jù)編號(hào)數(shù)據(jù)編號(hào)data10-05分析變量:hgrow(生長量)與hsun(月平均日照時(shí)數(shù))控制變量:humi(月平均濕度)、rain(月降雨量)、temp(月平均氣溫) 練習(xí)題練習(xí)題289名肝炎患者的檢測(cè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保設(shè)施施工安全責(zé)任協(xié)議
- 電力行業(yè)污染物排放總量控制保證協(xié)議
- 《手機(jī)游戲賬號(hào)及虛擬財(cái)產(chǎn)授權(quán)與轉(zhuǎn)讓協(xié)議》
- 影視拍攝現(xiàn)場(chǎng)電力系統(tǒng)設(shè)計(jì)與備用電源配置合同
- 私人游艇衛(wèi)星通訊系統(tǒng)租賃與安裝服務(wù)合同
- 藝人演藝作品收益分配經(jīng)紀(jì)合同
- 股票市場(chǎng)證券分析師助理派遣與市場(chǎng)動(dòng)態(tài)監(jiān)測(cè)協(xié)議
- 航空器維修基地空域申請(qǐng)補(bǔ)充協(xié)議
- 寵物連鎖加盟店會(huì)員體系與積分管理協(xié)議
- DB42-T 2012-2023 土家族吊腳樓營造規(guī)程
- GB/T 1633-2000熱塑性塑料維卡軟化溫度(VST)的測(cè)定
- GB/T 11032-2020交流無間隙金屬氧化物避雷器
- 煤礦爆破工培訓(xùn)
- 液化石油氣安全標(biāo)簽
- 水車租賃合同范本(3篇)
- 空港新城特勤消防站施工組織設(shè)計(jì)
- 北師大版三年級(jí)數(shù)學(xué)下冊(cè)競(jìng)賽卷
- 2022山東歷史高考答題卡word版
- 中醫(yī)醫(yī)院兒科建設(shè)與管理指南(試行)
- Q∕SY 1143-2008 三維地質(zhì)建模技術(shù)要求
- 大地構(gòu)造學(xué)派及其構(gòu)造單元匯總
評(píng)論
0/150
提交評(píng)論