統(tǒng)計相關(guān)分析_第1頁
統(tǒng)計相關(guān)分析_第2頁
統(tǒng)計相關(guān)分析_第3頁
統(tǒng)計相關(guān)分析_第4頁
統(tǒng)計相關(guān)分析_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Linear correlation線性相關(guān)兩指標間的關(guān)系分析陳濤Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University直線相關(guān)分析(linear correlation analysis)1 問題的提出 the Relationship 2 確定性關(guān)系與相關(guān)關(guān)系3 相關(guān)關(guān)系4 散點圖5 Pearson相關(guān)系數(shù)6 相關(guān)系數(shù)的計算7 相關(guān)系數(shù)的性質(zhì)8 相關(guān)關(guān)系示意圖9 相關(guān)系數(shù)的含義10 相關(guān)系數(shù)的假設(shè)檢驗11 總體相關(guān)系數(shù)的區(qū)間估計12 相關(guān)分析的正確應(yīng)用問題的

2、提出以往方法的局限僅限于考察一個觀察指標問題的提出人的體重往往隨著身高的增加而增加。二者之間是否存在某種關(guān)聯(lián)?如果存在,可否用身高來推測體重的多少?人的肺活量往往隨著胸圍的增加而增加。舉重運動員所能舉起的最大重量是否與他的體重有關(guān)?聯(lián)系與相互影響是普遍的現(xiàn)象受教育的水平工作后的收入預(yù)防疾病支出疾病的發(fā)病率1 the RelationshipCould you give me some examples about the relationship between two variables? R1R1R2R1R2R31 the Relationship Type One1 the Relati

3、onship Type Two2 確定性關(guān)系與相關(guān)關(guān)系確定性的函數(shù)關(guān)系:兩變量間的函數(shù)關(guān)系 。 隨機性的相關(guān)關(guān)系:兩變量在宏觀上存在關(guān)系,但并未精確到可以用函數(shù)關(guān)系來表達。 圓的周長與半徑的關(guān)系: C2R 速度、時間與路程的關(guān)系:LST 青少年身高與年齡的關(guān)系; 體重與體表面積的關(guān)系;相關(guān)關(guān)系與確定性關(guān)系(2)當對事物的規(guī)律了解加深時,相關(guān)關(guān)系可以轉(zhuǎn)變?yōu)榇_定性關(guān)系。父親患白化病X, (X=是,否);子女患白化病Y, (Y=是,否);X與Y的關(guān)系不確定。當母親患白化病時,X與Y的關(guān)系確定: X=是,則Y=是; X=否,則Y=否。 (父親為異常基因的攜帶者出外。)3 相關(guān)關(guān)系當一個變量增大,另一個

4、也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)(correlation)。兩個變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。 若兩個變量同時增加或減少,變化趨勢是同向的,則兩變量之間的關(guān)系為正相關(guān)(positive correlation);若一個變量增加時,另一個變量減少,變化趨勢是反向的,則稱為負相關(guān)(negative correlation)。3 相關(guān)關(guān)系直線相關(guān)(linear correlation),又稱簡單相關(guān),用以描述兩個呈正態(tài)分布的變量之間的線性共變關(guān)系,常簡稱為相關(guān)。直線相關(guān)的概念3 相關(guān)關(guān)系 The story Sir Francis Galton 1822-1911 an expl

5、orer and anthropologist half-cousin of Charles Darwin Heredity experiments lead to initial concepts of correlation and regression. Sweet peas experiment (1875) Symmetric studies of Stature (1885)3 相關(guān)關(guān)系 The storyTable 1 Data on Diameters of Parent and Daughter Seeds Generated from Galton (1894) Table

6、 2 in Natural Inheritance .Diameter of Parent Seed(inch) Diameter of Daughter Seed(inch) 1516.771617.281716.921817.351917.692018.282118.29Correlation exists between two variables when one of them is related to the other in some way.3 相關(guān)關(guān)系 The story4 Scatter plot (or scatter diagram)is a graph in whi

7、ch the paired (x,y) sample data are plotted with a horizontal x axis and a vertical y axis. Each individual (x,y) pair is plotted as a single point.散點圖(Scatter plot )在平面直角坐標系上標識兩變量(x,y)間關(guān)系的統(tǒng)計圖。16.51717.51818.515161718192021Figue 1 Plot of Diameter of Daughter Seed versus Diameter of Parent Seed from

8、 the data in Table 1. 反映兩定量指標間的相關(guān)關(guān)系用 Pearson 相關(guān)系數(shù),r。 (Pearson correlation coefficient) 用以說明具有直線關(guān)系的兩個變量間相關(guān)關(guān)系的密切程度和相關(guān)方向的指標.Correlation analysis Analysis of the degree to which changes in one variable are associated with changes in another variable.5 Pearson相關(guān)系數(shù)5 Pearson相關(guān)系數(shù)X 的離均差平方和:Y 的離均差平方和:X與Y 間的離均

9、差積和: 以下資料選自Galton的一項研究,目的是探討成年時身高是否與兩歲時的身高(單位:英寸)有關(guān)。兩歲時的身高(英寸)3930323435363630成年身高(英寸)71636367686870646 相關(guān)系數(shù)的計算繪制散點圖Y 成年后身高(單位:英寸)X 2歲時的身高(單位:英寸)30323436384063656769716 相關(guān)系數(shù)的計算6 相關(guān)系數(shù)的計算Table 1 Data on Diameters of Parent and Daughter Seeds Generated from Galton (1894) Table 2 in Natural Inheritance

10、.Diameter of Parent Seed Diameter of Daughter Seed 1516.771617.281716.921817.351917.692018.282118.296 相關(guān)系數(shù)的計算6 相關(guān)系數(shù)的計算7 相關(guān)系數(shù)的性質(zhì)-1 r 1r0為正相關(guān)r0為負相關(guān)r0為零相關(guān)或無相關(guān)相關(guān)系數(shù)絕對值越大,兩變量間相關(guān)程度越密切;相關(guān)系數(shù)越接近于0,表示相關(guān)越不密切。r = 0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相關(guān)正相關(guān)負相關(guān)完全正相關(guān)完全負相關(guān)零相關(guān)零相關(guān)零相關(guān)8 相關(guān)關(guān)系示意圖r =-1-1r 0r =0直線相

11、關(guān)的圖示與相關(guān)系數(shù)的關(guān)系0r 1r =1體重(kg),X肺活量Y(L)40424446485052545658602.22.42.62.83.03.23.43.6相關(guān)系數(shù)的大小示意圖r = 1 0 r 1r = 0XY10 相關(guān)系數(shù)的假設(shè)檢驗0H 0:0,親代種子直徑與子代無相關(guān)關(guān)系;H 1: 0,親代種子直徑與子代有相關(guān)關(guān)系。 = 0.05。t 服從自由度為n-2的 t 分布。10 相關(guān)系數(shù)的假設(shè)檢驗Table 1 資料相關(guān)系數(shù)的假設(shè)檢驗自由度102,P=0.0020拒絕H0,接受H1??梢哉J為親代種子直徑與子代之間有正相關(guān)關(guān)系,相關(guān)系數(shù)為0.93。11 總體相關(guān)系數(shù)的區(qū)間估計從相關(guān)系數(shù)不等

12、于0的總體中抽樣,樣本相關(guān)系數(shù)的分布是偏態(tài)的。 相關(guān)系數(shù)的抽樣分布( = - 0.8)-0.8-0.6-0.4-0.20.00100200300-1.0相關(guān)系數(shù)的抽樣分布( = 0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相關(guān)系數(shù)的抽樣分布( =0.8) 00.20.40.60.81.00100200300R.A. Fisher(1921) 的 z 變換 z 近似服從均數(shù)為 ,標準差為 的正態(tài)分布。 相關(guān)系數(shù)的z 值的抽樣分布( = - 0.8)00.51.01.52.0050100150200相關(guān)系數(shù)的z 值的抽樣分布( = 0)-2-

13、1012050100150200相關(guān)系數(shù)的z 值的抽樣分布( = 0.8) 01234050100150200相關(guān)系數(shù)的可信區(qū)間估計將 r 變換為 z ;根據(jù) z 服從正態(tài)分布,估計 z 的可信區(qū)間;再將 z 變換回 r 。相關(guān)系數(shù)的可信區(qū)間估計 Fishers 變換 r z 正態(tài)近似 Fishers 反變換 的95CI z的95CI 該可信區(qū)間有什么含義? 相關(guān)關(guān)系不等于因果關(guān)系; 相關(guān)系數(shù)只度量變量間的線性關(guān)系,因此,弱相關(guān)不一定表明變量間沒有關(guān)系; 極端值可能影響相關(guān)系數(shù); 注意相關(guān)關(guān)系成立的數(shù)據(jù)范圍; 警惕虛假相關(guān)。12 相關(guān)分析的正確應(yīng)用定量資料在進行相關(guān)分析(Pearson相關(guān))前,需作散點圖,從散點圖的趨勢判斷是否可以作線性相關(guān)分析;12 相關(guān)分析的正確應(yīng)用某地160名20歲男子身高與體重散點圖(雙變量正態(tài)分布) 成都市男中小學(xué)生12個年齡組的平均身高 紫外光對新生小鼠背皮ATP酶陽性的郎格漢斯細胞(LC)照射不同時間的細胞密度(個/mm3)某腫瘤病人的生存率大白鼠進食量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論