第五章 相關(guān)與偏相關(guān)_第1頁
第五章 相關(guān)與偏相關(guān)_第2頁
第五章 相關(guān)與偏相關(guān)_第3頁
第五章 相關(guān)與偏相關(guān)_第4頁
第五章 相關(guān)與偏相關(guān)_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

相關(guān)與偏相關(guān)相關(guān)與偏相關(guān)1醫(yī)學上,許多現(xiàn)象之間也都有相互聯(lián)系,例如:身高與體重、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。這里,體溫和脈搏的關(guān)系就比產(chǎn)前檢查與嬰兒體重之間的關(guān)系密切得多,而體重和身高的關(guān)系則介與二者之間。另外,可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;但是,有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說有因果關(guān)系。相關(guān)就是用于研究和解釋兩個變量之間相互關(guān)系的。

相關(guān)與偏相關(guān)2主要內(nèi)容第一節(jié)直線相關(guān)第二節(jié)偏相關(guān)第三節(jié)小結(jié)相關(guān)與偏相關(guān)3第一節(jié)直線相關(guān)LinearCorrelation相關(guān)與偏相關(guān)4為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個點所形成的圖形是一個散點圖。它的形狀象一塊橄欖狀的云,中間的點密集,邊沿的點稀少,其主要部分是一個橢圓。

相關(guān)與偏相關(guān)5一、相關(guān)的類型★正相關(guān)★負相關(guān)★完全正相關(guān)★完全負相關(guān)★稱零相關(guān)

相關(guān)與偏相關(guān)6二、相關(guān)系數(shù)

樣本的相關(guān)系數(shù)用r(correlationcoefficient)相關(guān)系數(shù)r的值在-1和1之間,但可以是此范圍內(nèi)的任何值。正相關(guān)時,r值在0和1之間,散點云圖是斜向上的,這時一個變量增加,另一個變量也增加;負相關(guān)時,r值在-1和0之間,散點云圖是斜向下的,此時一個變量增加,另一個變量將減少。r的絕對值越接近1,兩變量的關(guān)聯(lián)程度越強,r的絕對值越接近0,兩變量的關(guān)聯(lián)程度越弱。相關(guān)與偏相關(guān)7三、相關(guān)系數(shù)的計算公式r的計算結(jié)果說明了兩個變量X與Y之間關(guān)聯(lián)的密切程度(絕對值大?。┡c關(guān)聯(lián)的性質(zhì)(正負號)。相關(guān)與偏相關(guān)8一個產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過測量待產(chǎn)婦尿中雌三醇含量,可以預測產(chǎn)兒體重,以便對低出生體重進行預防。因此收集了31例待產(chǎn)婦24小時的尿,測量其中的雌三醇含量,同時記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間相關(guān)系數(shù)是多少?是正相關(guān)還是負相關(guān)?分析問題:目的、變量、關(guān)系

相關(guān)與偏相關(guān)9編號

(1)尿雌三醇mg/24h(2產(chǎn)兒體重kg(3)編號

(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系

相關(guān)與偏相關(guān)10計算結(jié)果從計算結(jié)果可以知道,31例待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是0.61。相關(guān)與偏相關(guān)11問題:我們能否得出結(jié)論說明待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是0.61?為什么?相關(guān)與偏相關(guān)12四、相關(guān)系數(shù)的假設(shè)檢驗

上例中的相關(guān)系數(shù)r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個樣本,由此得到的相關(guān)系數(shù)會存在抽樣誤差。因為,總體相關(guān)系數(shù)(

)為零時,由于抽樣誤差,從總體抽出的31例,其r可能不等于零。所以,要判斷該樣本的r是否有意義,需與總體相關(guān)系數(shù)

=0進行比較,看兩者的差別有無統(tǒng)計學意義。這就要對r進行假設(shè)檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關(guān)關(guān)系。

相關(guān)與偏相關(guān)13對相關(guān)系數(shù)的假設(shè)檢驗,常用t檢驗,選用統(tǒng)計量t的計算公式如下:

=n-2

相關(guān)與偏相關(guān)14H0:

=0

H1:

≠0

=0.05r=0.61,n=31,

代入公式

t=

=n-2=31-2=29

t=4.14查t值表,=2.756,查t值表,=2.756,上述計算t=4.14>2.756,由t所推斷的P值小于0.01,按

=0.05水準拒絕,接受,認為臨產(chǎn)婦24小時內(nèi)尿中雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。

相關(guān)與偏相關(guān)15SPSS計算1.做散點圖:標題、標目、散點GRAPHS-SCATTERT-SIMPLE-DEFIND雙擊TITLE加標題、標目2.相關(guān)分析ANALYZE--CORRELATION–BIVARIATE-VARIABLES相關(guān)與偏相關(guān)16相關(guān)與偏相關(guān)17五、直線相關(guān)的應(yīng)用

前面我們已經(jīng)講過,相關(guān)是研究兩個變量間的相互關(guān)系,而且這種相互關(guān)系是用相關(guān)系數(shù)反應(yīng)的。在確實存在相關(guān)關(guān)系的前提下,如果r的絕對值越大,說明兩個變量之間的關(guān)聯(lián)程度越強,那么,已知一個變量對預測另一個變量越有幫助;如果r絕對值越小,則說明兩個變量之間的關(guān)系越弱,一個變量的信息對猜測另一個變量的值無多大幫助。一般說來,當樣本量較大(n>100),并對r進行假設(shè)檢驗,有統(tǒng)計學意義時,r的絕對值大于0.7,則表示兩個變量高度相關(guān);r的絕對值大于0.4,小于等于0.7時,則表示兩個變量之間中度相關(guān);r的絕對值大于0.2,小于等于0.4時,則兩個變量低度相關(guān)。

相關(guān)與偏相關(guān)18例題:某地29名13歲男童身高X1(cm)、體重X2(kg)和肺活量Y(ml),請用該資料計算身高與肺活量,體重與肺活量的相關(guān)關(guān)系。相關(guān)與偏相關(guān)19第二節(jié)偏相關(guān)相關(guān)與偏相關(guān)20一、概念當有多個變量存在時,為了研究任何兩個變量之間的關(guān)系,而使與這兩個變量有聯(lián)系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計算兩個變量的相關(guān)性。二、偏相關(guān)系數(shù)偏相關(guān)系數(shù)是用來衡量任何兩個變量之間的關(guān)系的大小。相關(guān)與偏相關(guān)21三、選擇不同的方法計算相關(guān)系數(shù)

Pearson:雙變量正態(tài)分布資料,連續(xù)變量

Kendall:資料不服從雙變量正態(tài)分布或

總體分布未知,等級資料。

Spearman:等級資料。相關(guān)與偏相關(guān)22

Analyze-----Correlation-----Partial把分析變量選入Variable框把控制變量選入Controllingfor框點擊Options點擊Statistics:選擇MeanandstandarddeviationZero-ordercorrelationContinueOK四、SPSS操作步驟相關(guān)與偏相關(guān)23VariableMeanStandardDevCasesX1(身高)152.57598.362229Y(肺活量)2206.8966448.554129X2(體重)37.30695.670429結(jié)果:相關(guān)與偏相關(guān)24身高與肺活量的簡單相關(guān)系數(shù)1、身高與肺活量的簡單相關(guān)系數(shù)相關(guān)與偏相關(guān)252、體重與肺活量的簡單相關(guān)系數(shù)相關(guān)與偏相關(guān)263、身高與體重的簡單相關(guān)系數(shù)相關(guān)與偏相關(guān)274、體重為控制變量,身高與肺活量的偏相關(guān)系數(shù)PARTIALCORRELATIONCOEFFICIENTSControllingfor..X2(體重)Y(肺活量)X1(身高)Y(肺活量)1.0000.2361(0)(26)P=.P=.226X1(身高).23611.0000(26)(0)P=.226P=.相關(guān)與偏相關(guān)28PARTIALCORRELATIONCOEFFICIENTSControllingfor..X1(身高)Y(肺活量)X2(體重)Y1.0000.4152(0)(26)P=.P=.028X2.41521.0000(26)(0)P=.028P=.5、身高作為控制變量,肺活量與體重的偏相關(guān)系數(shù)相關(guān)與偏相關(guān)29應(yīng)用相關(guān)注意事項

1.實際意義進行相關(guān)回歸分析要有實際意義,不可把毫無關(guān)系的兩個事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有人說,孩子長,公園里的小樹也在長。求孩子和小樹之間的相關(guān)關(guān)系就毫無意義,用孩子的身高推測小樹的高度則更加慌謬。2.相關(guān)關(guān)系相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系,例如,有人發(fā)現(xiàn),對于在校兒童,鞋的大小與閱讀技能有很強的相關(guān)關(guān)系。然而,學會新詞并不能使腳變大,而是涉及到第三個因素??年齡。當兒童長大一些,他們的閱讀能力會提高而且由于長大也穿不下原來的鞋。

相關(guān)與偏相關(guān)303.利用散點圖對于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點圖,在圖上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負相關(guān),然后再進行相關(guān)分析。4.變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系。相關(guān)與偏相關(guān)31第三節(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論