




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Medical Statistics 醫(yī)學(xué)統(tǒng)計學(xué)相關(guān)分析Correlation Analysis主要內(nèi)容引言數(shù)值變量的相關(guān)相關(guān)的定義(掌握)相關(guān)的圖示(掌握)相關(guān)系數(shù)的計算(掌握)相關(guān)系數(shù)的假設(shè)檢驗(掌握)相關(guān)系數(shù)的區(qū)間估計(了解)兩樣本相關(guān)系數(shù)的比較(了解)分類和等級變量的相關(guān)行列表資料的關(guān)聯(lián)性(熟悉)等級資料的關(guān)聯(lián)性(熟悉)相關(guān)分析的正確應(yīng)用(掌握)一個分析實例:3歲男童體重與體表面積編號體重X體表面積Y111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016
2、.06.411合計133.457.266分析方法之一將10名兒童按體重分為兩組(三組)結(jié)論:體重較重的一組3歲男童,體表面積也較大。體重分組體表面積均數(shù)組間比較13.5Kg5.37 103cm2t=-6.0413.5Kg6.09 103cm2P0.001分析方法之二如果想得到的結(jié)論為:體重越重,體表面積越大。關(guān)聯(lián)的密切程度 相關(guān)分析體重為X時,體表面積估計為多少?數(shù)量依存關(guān)系 回歸分析相關(guān)關(guān)系與確定性關(guān)系所謂確定性關(guān)系是指兩變量間的關(guān)系是函數(shù)關(guān)系。已知一個變量的值,另一個變量的值可以通過這種函數(shù)關(guān)系精確計算出來。C =2Ry=ax2+bx+c非確定性關(guān)系是指兩變量在宏觀上存在關(guān)系,但并未精確到
3、可以用函數(shù)關(guān)系來表達(dá)。青少年身高隨年齡增長而增高;體表面積與體重有關(guān)數(shù)值變量的相關(guān)相關(guān)的定義(掌握)相關(guān)的圖示(掌握)相關(guān)系數(shù)的計算(掌握)相關(guān)系數(shù)的假設(shè)檢驗(掌握)相關(guān)系數(shù)的區(qū)間估計(熟悉)兩樣本相關(guān)系數(shù)的比較(了解)相關(guān)的定義當(dāng)兩個數(shù)值變量之間出現(xiàn)如下情況:當(dāng)一個變量增大,另一個也隨之增大(或減少),我們稱這種現(xiàn)象為共變,也就是有相關(guān)關(guān)系(correlation) 。若兩個變量同時增加或減少,變化趨勢是同向的,則兩變量之間的關(guān)系為正相關(guān)(positive correlation);若一個變量增加時,另一個變量減少,變化趨勢是反向的,則稱為負(fù)相關(guān)(negative correlation)。
4、直線相關(guān)(linear correlation),又稱簡單相關(guān),用以描述兩個呈正態(tài)分布的變量之間的線性共變關(guān)系,常簡稱為相關(guān)。 相關(guān)系數(shù)用以說明具有直線關(guān)系的兩個變量間相關(guān)關(guān)系的密切程度和相關(guān)方向的指標(biāo),稱為相關(guān)系數(shù)(correlation coefficient),又稱為積差相關(guān)系數(shù)(coefficient of product-moment correlation),Pearson相關(guān)系數(shù) 。總體相關(guān)系數(shù)用希臘字母表示,而樣本相關(guān)系數(shù)用r表示,取值范圍均為-1,1。繪制散點圖!體重 X體表面積Y1112131415165.05.56.06.5X(1)Y(2)11.05.28311.85.2
5、9912.05.35812.35.29213.15.60213.76.01414.45.83014.96.10215.26.07516.06.411r=0r=0r-1r1完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)0r1-1r0r=0 r=0零相關(guān)正相關(guān)負(fù)相關(guān)零相關(guān)直線相關(guān)的圖示r =-1-1r 0r =0直線相關(guān)的圖示與相關(guān)系數(shù)的關(guān)系0r 1r =1直線相關(guān)系數(shù)的計算22XYXX YYXXYYlrllXXYY離均差積和離均差平方和體重(kg),X體表面積(103cm2)Y1112131415165.05.56.06.5繪制散點圖相關(guān)系數(shù)的計算9579. 05439. 19040.249396. 5r13
6、.445.7229.90401.54395.9396XXYYXYXYlll相關(guān)系數(shù)的假設(shè)檢驗H0:0,兩變量間無直線相關(guān)的關(guān)系;H1:0,兩變量間有直線相關(guān)的關(guān)系。20,212rrrtnsrn例 試對例10.1資料相關(guān)關(guān)系是否存在進(jìn)行假設(shè)檢驗,并估計總體相關(guān)系數(shù)。H0:體重與體表面積無相關(guān)關(guān)系;H1:體重與體表面積有相關(guān)關(guān)系。=0.05。 = n-2=10-2=8按自由度 =8查附表2 t界值表,得P0.001。按=0.05水準(zhǔn),拒絕H0,接受H1,故可認(rèn)為3歲男童的體重與體表面積之間有正相關(guān)關(guān)系。4369. 92109579. 019579. 02122nrrt總體相關(guān)系數(shù)的區(qū)間估計從相關(guān)系
7、數(shù)不等于0的總體中抽樣,樣本相關(guān)系數(shù)的分布是偏態(tài)的。 相關(guān)系數(shù)的抽樣分布( = - 0.8)-0.8-0.6-0.4-0.20.00100200300-1.0在一個總體相關(guān)系數(shù)為-0.8的總體中,進(jìn)行隨機抽樣,每次抽取10個個體,測量其X和Y值,并計算樣本相關(guān)系數(shù),重復(fù)1000次,將所得的相關(guān)系數(shù)繪制成頻數(shù)圖。相關(guān)系數(shù)的抽樣分布( = 0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相關(guān)系數(shù)的抽樣分布( =0.8) 00.20.40.60.81.00100200300R.A. Fisher(1921) 的 z 變換1111ln2122zzee
8、rrrz z 近似服從均數(shù)為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。 )1/()1(ln21rr3/1n相關(guān)系數(shù)的z 值的抽樣分布( = - 0.8)00.51.01.52.0050100150200相關(guān)系數(shù)的z 值的抽樣分布( = 0)-2-1012050100150200相關(guān)系數(shù)的z 值的抽樣分布( = 0.8) 01234050100150200相關(guān)系數(shù)的可信區(qū)間估計將 r 變換為 z ;根據(jù) z 服從正態(tài)分布,估計 z 的可信區(qū)間;再將 z 變換回 r 。31nuzsuzz相關(guān)系數(shù)的可信區(qū)間估計 Fishers 變換 r z 正態(tài)近似 Fishers 反變換 的95CI z的95CI 2z2 1.1
9、7892z2 1.17892z2 2.66072z2 2.660711 0.9579ln()1.919821 0.95791.9198 1.96/ 103 =(1.1789,2.6607)e110.8271e +11e110.9903e +11lowupzeleele兩樣本相關(guān)系數(shù)的比較 某醫(yī)院分別測定正常成年男子12人和正常成年女子12人的心率(X,次/分)與心臟左室電機械收縮時間QS(Y,毫秒) ,試比較男子和女子的心率(次/分)與心臟左室電機械收縮時間QS(毫秒)的相關(guān)是否相同。 男子女子心率,X(次/分)收縮時間,Y(毫秒)心率,X(次/分)收縮時間,Y(毫秒)574055639161
10、393594106339763387664006737467380673856838368376693767037870382723847538875370793667935083370873578634594329Step 1: 散點圖 5060708090100300350400450心率(次/分)收縮時間(毫秒)5060708090300350400450100收縮時間(毫秒)心率(次/分)男女Step 2: 計算樣本相關(guān)系數(shù)男子的相關(guān)系數(shù):女子的相關(guān)系數(shù):8827. 09167.30446667.8583333.14271r9179. 02500.49009167.133825.235
11、12rStep 3: 檢驗兩總體相關(guān)系數(shù)是否為0=122=10,則P10.001,P20.20,故尚不能認(rèn)為男子和女子的心率與心臟左室電機械收縮時間間的相關(guān)系數(shù)不等。-1.57559179. 019179. 01ln21 -1.38798827. 018827. 01ln2121zz,3980. 031213121)5755. 1(3879. 1u分類和等級變量的相關(guān)定性資料的關(guān)聯(lián)性(熟悉)四格表資料的列聯(lián)相關(guān)系數(shù)RC表資料的列聯(lián)相關(guān)系數(shù)等級資料的關(guān)聯(lián)性(熟悉)定性資料的關(guān)聯(lián)性分析(association)定性指標(biāo)間的相關(guān)程度和方向常用列聯(lián)系數(shù)(contingency coefficient)
12、來表示。例:四格表資料的相關(guān)分析 某中醫(yī)師采用兩種方法觀察舌象200例,試分析兩種觀察方法的結(jié)果有無聯(lián)系?乙法甲法合計84(a)16(b)100(a+b)20(c)80(d)100(c+d)合計104(a+c)96(b+d)200(n)相關(guān)系數(shù)計算0.6405nadbcrabcdacbd列聯(lián)相關(guān)系數(shù)的假設(shè)檢驗乙法(分組)甲法合計組1000100組0100100合計100100200乙法甲法合計01001001000100合計10496200列聯(lián)相關(guān)系數(shù)的假設(shè)檢驗乙法(分組)甲法合計組5050100組5050100合計100100200乙法甲法合計60401006040100合計10496200
13、列聯(lián)相關(guān)系數(shù)的假設(shè)檢驗 如果兩法沒有相關(guān)性,那么在乙法判斷為陽性和陰性的病例中,甲法判斷為陽性的比例應(yīng)該相同!即a/(a+b)=c/(c+d) 檢驗行間的構(gòu)成比或者率!2檢驗乙法甲法合計aba+bcdc+d合計a+cb+dn H0:兩種方法觀察舌象的結(jié)果無相關(guān); H1:兩種方法觀察舌象的結(jié)果有相關(guān)。=0.05。 =1 查附表3 2界值表,得P0.005,按=0.05水準(zhǔn),拒絕H0,接受H1,認(rèn)為甲乙兩種方法觀察舌象的結(jié)果有相關(guān)關(guān)系。222()()()()()(84 80 16 20)20082.05100 100 104 96adbcnab ac bd cd 當(dāng)用0、1分別編碼“”、“”時,點
14、相關(guān)系數(shù)等于Pearson系數(shù)。id甲法結(jié)果X乙法結(jié)果Y11(+)1 (+)21 (+)1 (+)841 (+)1 (+)850(-)1 (+)1000 (-)1 (+)1011 (+)0 (-)1201 (+)0 (-)1210 (-)0 (-)2000 (-)0 (-)0.500.5049.9250.0032.0032.0049.92 50.000.6405XXYYXYXYXX YYxyllllrll行列表資料的相關(guān)分析 Cramr修正列聯(lián)系數(shù)C較適合于定性資料的相關(guān)C的取值范圍在01之間,0表示不相關(guān);越接近于1表示關(guān)系越密切;1表示完全相關(guān)。C只表示兩指標(biāo)間的相關(guān)程度,并不表示相關(guān)方向
15、。 ) 1, 1min(2CRnC 某人按兩種血型系統(tǒng)統(tǒng)計某地6094人的血型分布,結(jié)果見表10.5,問兩種血型的分布間有無關(guān)系? ABO血型MN血型合計MNMNO4314909021823A3884108001598B4955879502032AB137179325641合計1451166629776094注意: Cramr修正列聯(lián)系數(shù)對行或者列的順序信息是不敏感的!0266. 0) 13 , 14min(60945952. 8C等級資料的相關(guān)Spearman等級相關(guān)將各變量X,Y分別編秩RX, RY;計算RX與RY的Pearson相關(guān);所得結(jié)果即為Spearman等級相關(guān)rS。-1rs1例
16、 抗白指數(shù)與臨床療效的關(guān)系 某研究所用野百合治療白血病,并作抗白血病指數(shù)(簡稱抗白指數(shù))及療效的分析,問抗白指數(shù)與臨床療效間有無關(guān)系? 病例號 抗白指數(shù)X 臨床療效Y(1)(2)12+23+39+410+511+630735845955+1070+11881290RX(3)123456789101112RY(4)99911.511.53336.56.533將X,Y分別由小到大編秩。其中Y有相同等級,分別取平均秩次。計算等級相關(guān)系數(shù)rs。/)(/)(/)()()()(222222nRRnRRnRRRRRRRRRRRRrYYXXYXYXYYXXYYXXs等級相關(guān)的假設(shè)檢驗H 0:S0,抗白指數(shù)與療
17、效無相關(guān)關(guān)系;H 1: S0,抗白指數(shù)與療效有相關(guān)關(guān)系。 = 0.05。 當(dāng)n50時,用查“等級相關(guān)界值表”; 當(dāng)n50時,用 t 檢驗:t t 服從自由度為n-2的 t t 分布。)2()1 (2nrrtSS本例,n=12,查附表15 rs界值表得,雙側(cè) (0.05,12) =0.587,P50,計算t值查附表2 t界值表,P0.05,說明兒童智力等級與母親文化程度間存在正等級相關(guān)關(guān)系。8552857787. 62857/2261. 012261. 02,t等級相關(guān)的含義 等級相關(guān)反映的是兩變量等級間的相關(guān),并不反映兩變量間的數(shù)值關(guān)系。例1 XY1122334455例2 XY1124394
18、165 25例3XY112 1.13 1.24 1.35 1.4例4XY1 12 103 1004 10005 10000相關(guān)分析的正確應(yīng)用相關(guān)關(guān)系是一種共變關(guān)系,不一定是因果關(guān)系。謹(jǐn)防多個變量間的相關(guān)性所帶來的虛假關(guān)系充分利用散點圖判斷線性趨勢判斷離群值排除資料的間雜性 直線相關(guān)分析對資料本身的要求:雙變量正態(tài)分布當(dāng)樣本含量較大時,統(tǒng)計學(xué)檢驗的作用減小;多個變量間的相關(guān)分析要使用多重相關(guān)。(multiple correlation)關(guān)聯(lián)性和差異性是辨證統(tǒng)一的!散點圖的作用 飛行員的著陸次數(shù)(x)與焦慮程度(Y)0XYr散點圖的作用識別離群值;PQ離群值對相關(guān)的影響排除間雜性(a)(b) 樣本甲觀察點 樣本乙觀察點樣本的間雜性對相關(guān)和回歸的誤導(dǎo)二元正態(tài)分布二元正態(tài)分布的密度函數(shù)為:122112222112211222112211221( ,)2(1)1exp22(1)f x xxxxx 二元正態(tài)分布曲面(11=1,22=1,12=0) 二元正態(tài)分布曲面(11=1,22=1,12=0) 二元正態(tài)分布曲面(11=2,22=4,12=0.75)二元正態(tài)分布曲面(11=2,22=4,12=0.75)二元正態(tài)分布曲面(11=2,22=4,12=0.75)二元正態(tài)分布曲面剖面(11=1,22=1/2,12=0.75)XZY多個變量間的相關(guān)因此,談到多個變量間的相關(guān)性時,往往要說
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于演化算法及改進(jìn)詞袋模型的病蟲害分類識別技術(shù)研究
- 中文影視材料在中高級對外漢語聽說課中的應(yīng)用研究
- 單晶生產(chǎn)爐相關(guān)行業(yè)投資規(guī)劃報告范本
- 酸腐蝕對煤拉伸力學(xué)特性影響研究
- 碩士論文之路
- 幼兒園安全教育工作總結(jié)
- 家庭教育培訓(xùn)
- 四川地區(qū)三線建設(shè)調(diào)整改造及對城市發(fā)展的影響研究
- 光動力療法聯(lián)合膽道支架與125I粒子支架在不可切除肝外膽管癌的療效對比研究
- 鎳基金屬有機框架及其衍生物的合成及電化學(xué)性能研究
- 代理商區(qū)域保護協(xié)議書范本
- 2024年包頭鋼鐵職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案解析
- 2024年南京鐵道職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫及答案解析
- 英語定位紙模板
- 中外政治思想史-形成性測試四-國開(HB)-參考資料
- 小學(xué)語文中高年級單元整體教學(xué)設(shè)計的實踐研究(中期報告)
- 國家安全教育國土安全
- 機電系統(tǒng)綜合調(diào)試方案
- 《合理調(diào)節(jié)情緒-做自己情緒的主人》班會課件
- 中國高等教育的歷史演進(jìn)課件
- 2024年徐州地鐵集團有限公司招聘筆試參考題庫含答案解析
評論
0/150
提交評論