統(tǒng)計(jì)相關(guān)分析_第1頁(yè)
統(tǒng)計(jì)相關(guān)分析_第2頁(yè)
統(tǒng)計(jì)相關(guān)分析_第3頁(yè)
統(tǒng)計(jì)相關(guān)分析_第4頁(yè)
統(tǒng)計(jì)相關(guān)分析_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Linear correlation線性相關(guān)兩指標(biāo)間的關(guān)系分析陳濤Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University直線相關(guān)分析(linear correlation analysis)1 問(wèn)題的提出 the Relationship 2 確定性關(guān)系與相關(guān)關(guān)系3 相關(guān)關(guān)系4 散點(diǎn)圖5 Pearson相關(guān)系數(shù)6 相關(guān)系數(shù)的計(jì)算7 相關(guān)系數(shù)的性質(zhì)8 相關(guān)關(guān)系示意圖9 相關(guān)系數(shù)的含義10 相關(guān)系數(shù)的假設(shè)檢驗(yàn)11 總體相關(guān)系數(shù)的區(qū)間估計(jì)12 相關(guān)分析的正確應(yīng)用問(wèn)題的

2、提出以往方法的局限僅限于考察一個(gè)觀察指標(biāo)問(wèn)題的提出人的體重往往隨著身高的增加而增加。二者之間是否存在某種關(guān)聯(lián)?如果存在,可否用身高來(lái)推測(cè)體重的多少?人的肺活量往往隨著胸圍的增加而增加。舉重運(yùn)動(dòng)員所能舉起的最大重量是否與他的體重有關(guān)?聯(lián)系與相互影響是普遍的現(xiàn)象受教育的水平工作后的收入預(yù)防疾病支出疾病的發(fā)病率1 the RelationshipCould you give me some examples about the relationship between two variables? R1R1R2R1R2R31 the Relationship Type One1 the Relati

3、onship Type Two2 確定性關(guān)系與相關(guān)關(guān)系確定性的函數(shù)關(guān)系:兩變量間的函數(shù)關(guān)系 。 隨機(jī)性的相關(guān)關(guān)系:兩變量在宏觀上存在關(guān)系,但并未精確到可以用函數(shù)關(guān)系來(lái)表達(dá)。 圓的周長(zhǎng)與半徑的關(guān)系: C2R 速度、時(shí)間與路程的關(guān)系:LST 青少年身高與年齡的關(guān)系; 體重與體表面積的關(guān)系;相關(guān)關(guān)系與確定性關(guān)系(2)當(dāng)對(duì)事物的規(guī)律了解加深時(shí),相關(guān)關(guān)系可以轉(zhuǎn)變?yōu)榇_定性關(guān)系。父親患白化病X, (X=是,否);子女患白化病Y, (Y=是,否);X與Y的關(guān)系不確定。當(dāng)母親患白化病時(shí),X與Y的關(guān)系確定: X=是,則Y=是; X=否,則Y=否。 (父親為異?;虻臄y帶者出外。)3 相關(guān)關(guān)系當(dāng)一個(gè)變量增大,另一個(gè)

4、也隨之增大(或減少),我們稱(chēng)這種現(xiàn)象為共變,或相關(guān)(correlation)。兩個(gè)變量有共變現(xiàn)象,稱(chēng)為有相關(guān)關(guān)系。 若兩個(gè)變量同時(shí)增加或減少,變化趨勢(shì)是同向的,則兩變量之間的關(guān)系為正相關(guān)(positive correlation);若一個(gè)變量增加時(shí),另一個(gè)變量減少,變化趨勢(shì)是反向的,則稱(chēng)為負(fù)相關(guān)(negative correlation)。3 相關(guān)關(guān)系直線相關(guān)(linear correlation),又稱(chēng)簡(jiǎn)單相關(guān),用以描述兩個(gè)呈正態(tài)分布的變量之間的線性共變關(guān)系,常簡(jiǎn)稱(chēng)為相關(guān)。直線相關(guān)的概念3 相關(guān)關(guān)系 The story Sir Francis Galton 1822-1911 an expl

5、orer and anthropologist half-cousin of Charles Darwin Heredity experiments lead to initial concepts of correlation and regression. Sweet peas experiment (1875) Symmetric studies of Stature (1885)3 相關(guān)關(guān)系 The storyTable 1 Data on Diameters of Parent and Daughter Seeds Generated from Galton (1894) Table

6、 2 in Natural Inheritance .Diameter of Parent Seed(inch) Diameter of Daughter Seed(inch) 1516.771617.281716.921817.351917.692018.282118.29Correlation exists between two variables when one of them is related to the other in some way.3 相關(guān)關(guān)系 The story4 Scatter plot (or scatter diagram)is a graph in whi

7、ch the paired (x,y) sample data are plotted with a horizontal x axis and a vertical y axis. Each individual (x,y) pair is plotted as a single point.散點(diǎn)圖(Scatter plot )在平面直角坐標(biāo)系上標(biāo)識(shí)兩變量(x,y)間關(guān)系的統(tǒng)計(jì)圖。16.51717.51818.515161718192021Figue 1 Plot of Diameter of Daughter Seed versus Diameter of Parent Seed from

8、 the data in Table 1. 反映兩定量指標(biāo)間的相關(guān)關(guān)系用 Pearson 相關(guān)系數(shù),r。 (Pearson correlation coefficient) 用以說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)關(guān)系的密切程度和相關(guān)方向的指標(biāo).Correlation analysis Analysis of the degree to which changes in one variable are associated with changes in another variable.5 Pearson相關(guān)系數(shù)5 Pearson相關(guān)系數(shù)X 的離均差平方和:Y 的離均差平方和:X與Y 間的離均

9、差積和: 以下資料選自Galton的一項(xiàng)研究,目的是探討成年時(shí)身高是否與兩歲時(shí)的身高(單位:英寸)有關(guān)。兩歲時(shí)的身高(英寸)3930323435363630成年身高(英寸)71636367686870646 相關(guān)系數(shù)的計(jì)算繪制散點(diǎn)圖Y 成年后身高(單位:英寸)X 2歲時(shí)的身高(單位:英寸)30323436384063656769716 相關(guān)系數(shù)的計(jì)算6 相關(guān)系數(shù)的計(jì)算Table 1 Data on Diameters of Parent and Daughter Seeds Generated from Galton (1894) Table 2 in Natural Inheritance

10、.Diameter of Parent Seed Diameter of Daughter Seed 1516.771617.281716.921817.351917.692018.282118.296 相關(guān)系數(shù)的計(jì)算6 相關(guān)系數(shù)的計(jì)算7 相關(guān)系數(shù)的性質(zhì)-1 r 1r0為正相關(guān)r0為負(fù)相關(guān)r0為零相關(guān)或無(wú)相關(guān)相關(guān)系數(shù)絕對(duì)值越大,兩變量間相關(guān)程度越密切;相關(guān)系數(shù)越接近于0,表示相關(guān)越不密切。r = 0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)8 相關(guān)關(guān)系示意圖r =-1-1r 0r =0直線相

11、關(guān)的圖示與相關(guān)系數(shù)的關(guān)系0r 1r =1體重(kg),X肺活量Y(L)40424446485052545658602.22.42.62.83.03.23.43.6相關(guān)系數(shù)的大小示意圖r = 1 0 r 1r = 0XY10 相關(guān)系數(shù)的假設(shè)檢驗(yàn)0H 0:0,親代種子直徑與子代無(wú)相關(guān)關(guān)系;H 1: 0,親代種子直徑與子代有相關(guān)關(guān)系。 = 0.05。t 服從自由度為n-2的 t 分布。10 相關(guān)系數(shù)的假設(shè)檢驗(yàn)Table 1 資料相關(guān)系數(shù)的假設(shè)檢驗(yàn)自由度102,P=0.0020拒絕H0,接受H1??梢哉J(rèn)為親代種子直徑與子代之間有正相關(guān)關(guān)系,相關(guān)系數(shù)為0.93。11 總體相關(guān)系數(shù)的區(qū)間估計(jì)從相關(guān)系數(shù)不等

12、于0的總體中抽樣,樣本相關(guān)系數(shù)的分布是偏態(tài)的。 相關(guān)系數(shù)的抽樣分布( = - 0.8)-0.8-0.6-0.4-0.20.00100200300-1.0相關(guān)系數(shù)的抽樣分布( = 0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相關(guān)系數(shù)的抽樣分布( =0.8) 00.20.40.60.81.00100200300R.A. Fisher(1921) 的 z 變換 z 近似服從均數(shù)為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。 相關(guān)系數(shù)的z 值的抽樣分布( = - 0.8)00.51.01.52.0050100150200相關(guān)系數(shù)的z 值的抽樣分布( = 0)-2-

13、1012050100150200相關(guān)系數(shù)的z 值的抽樣分布( = 0.8) 01234050100150200相關(guān)系數(shù)的可信區(qū)間估計(jì)將 r 變換為 z ;根據(jù) z 服從正態(tài)分布,估計(jì) z 的可信區(qū)間;再將 z 變換回 r 。相關(guān)系數(shù)的可信區(qū)間估計(jì) Fishers 變換 r z 正態(tài)近似 Fishers 反變換 的95CI z的95CI 該可信區(qū)間有什么含義? 相關(guān)關(guān)系不等于因果關(guān)系; 相關(guān)系數(shù)只度量變量間的線性關(guān)系,因此,弱相關(guān)不一定表明變量間沒(méi)有關(guān)系; 極端值可能影響相關(guān)系數(shù); 注意相關(guān)關(guān)系成立的數(shù)據(jù)范圍; 警惕虛假相關(guān)。12 相關(guān)分析的正確應(yīng)用定量資料在進(jìn)行相關(guān)分析(Pearson相關(guān))前,需作散點(diǎn)圖,從散點(diǎn)圖的趨勢(shì)判斷是否可以作線性相關(guān)分析;12 相關(guān)分析的正確應(yīng)用某地160名20歲男子身高與體重散點(diǎn)圖(雙變量正態(tài)分布) 成都市男中小學(xué)生12個(gè)年齡組的平均身高 紫外光對(duì)新生小鼠背皮ATP酶陽(yáng)性的郎格漢斯細(xì)胞(LC)照射不同時(shí)間的細(xì)胞密度(個(gè)/mm3)某腫瘤病人的生存率大白鼠進(jìn)食量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論