衛(wèi)生統(tǒng)計學-回歸與相關(guān)_第1頁
衛(wèi)生統(tǒng)計學-回歸與相關(guān)_第2頁
衛(wèi)生統(tǒng)計學-回歸與相關(guān)_第3頁
衛(wèi)生統(tǒng)計學-回歸與相關(guān)_第4頁
衛(wèi)生統(tǒng)計學-回歸與相關(guān)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

回歸與相關(guān)

兩個隨機變量之間關(guān)系的量化研究

相關(guān)分析:確定兩變量之間是否有聯(lián)系以及聯(lián)系的程度如何回歸分析:確定兩變量之間的相互依存關(guān)系

相關(guān)分析(correlation)

按照是否線性直線相關(guān)曲線相關(guān)

按照分析變量的數(shù)目

?簡單相關(guān)(兩個變量間)?多元相關(guān)(一個變量與一組變量或一組變量與另一組變量間)

直線相關(guān)(linearcorrelation)

——簡單線性相關(guān)

探討服從正態(tài)分布的兩個隨機變量X和Y間有無線性相關(guān)關(guān)系的一種統(tǒng)計分析方法測得某地15名正常成年人的血鉛X(μmoL/L)和24小時的尿鉛Y(μmoL/L)如下表所示,試分析血鉛與24小時尿鉛之間的相關(guān)性

㈠散點圖

絕大多數(shù)對象的散點在一條直線附近,并且兩變量值呈伴隨增大或伴隨減小的直線變化趨勢。㈡

線性相關(guān)系數(shù)

(linearcorrelationcoefficient)

描述呈線性關(guān)系的兩變量之間相關(guān)關(guān)系的密切程度和相關(guān)方向的指標叫線性相關(guān)系數(shù),又稱為pearson積差相關(guān)系數(shù)。沒有單位,介于-1和1之間,用r表示,總體相關(guān)系數(shù)用表示。

r越接近于1或-1,相關(guān)性越好;越接近于0,相關(guān)性越差。

相關(guān)系數(shù)的統(tǒng)計推斷

分析的數(shù)據(jù)是樣本值,因此計算出來的相關(guān)系數(shù)只是總體相關(guān)系數(shù)的估計值。由于存在抽樣誤差,可能即使總體相關(guān)系數(shù)為0,樣本相關(guān)系數(shù)也不一定為0㈣

線性相關(guān)應用中的注意事項

1.正確理解相關(guān)系數(shù)

樣本的線性相關(guān)系數(shù)接近于0不意味著兩變量之間一定無相關(guān)性

⑵r很大,對相關(guān)系數(shù)做假設檢驗,若P值大于檢驗水準,也沒有統(tǒng)計學意義

2變量都是呈正態(tài)分布的隨機變量時才做相關(guān)分析,當變量是人為選定或嚴格控制時莫做相關(guān)

3相關(guān)分析前要做散點圖,出現(xiàn)異常點(outlier)時慎做相關(guān),直線趨勢不明顯時應根據(jù)情況做曲線擬合(curvingfitting)進行回歸分析

4不能把毫無實際意義的變量強作相關(guān),即使有統(tǒng)計學意義,也無實際意義5相關(guān)關(guān)系不一定是因果關(guān)系,可能是表面上的伴隨關(guān)系白發(fā)是癌癥的危險因素?

大明在游泳館內(nèi)售票,小明在游泳館外賣冷飲,大明門票賣得多,小明冷飲賣得也多,一個月下來,游泳人數(shù)與冷飲銷售量呈正相關(guān),是不是愛吃冷飲的人喜歡游泳或愛游泳的人喜歡冷飲呢?

相關(guān)分析應用中的誤區(qū)

⑴照貓畫虎——不論變量如何,直接進行線性相關(guān)分析

⑵若研究某變量Y與一組變量X1~Xn的相關(guān)性,是否可以計算n次線性相關(guān)系數(shù)呢?⑶

若研究一組變量X=(X1、X2、……Xi)與另一組變量Y=(Y1、Y2、……Yj)之間的相關(guān)性,做i*j次線性相關(guān)分析

為了探討鎘對機體免疫功能的影響,分別對每組20只lace小鼠以劑量為0.3、1.2、2.4mg/kg/d的氯化鎘灌胃染毒14天,另設20只未染毒的小鼠為對照,分別測定小鼠脾臟淋巴細胞內(nèi)的鈣調(diào)素含量(ng/kg)如下表所示,研究人員作了鈣調(diào)素與染毒劑量的相關(guān)分析(r=-0.9996,P<0.05),結(jié)論為染毒劑量與鈣調(diào)素含量呈負相關(guān)

某人收集樣本含量n=100的樣本,對A、B變量做相關(guān)分析,r=0.10,假設檢驗P<0.05,他的結(jié)論為兩變量之間有較為密切的相關(guān)關(guān)系

按照檢驗水準=0.05,可以認為≠0,認為兩變量間存在著相關(guān)關(guān)系。r2稱為決定系數(shù),r2=0.01,表示A變量的變化僅由1%可以用B變量的變化來解釋,那么,兩變量的線性相關(guān)關(guān)系實際意義不大。

只計算Y與Xn的相關(guān)系數(shù),很可能存在其它相關(guān)變量的影響從而掩蓋了Y與Xn之間的真正聯(lián)系,出現(xiàn)謬誤。計算復相關(guān)系數(shù)(multiplecorrelationcoefficient),描述與其余變量X1~Xn之間的相關(guān)性;固定某個變量Xp(p≠n),計算偏相關(guān)系數(shù)(partialcorrelationcoefficient)描述某變量Xn與Y的相關(guān)關(guān)系。用某個Xi與某個Yj的簡單相關(guān)系數(shù)顯然不妥,一方面未考慮到X變量組內(nèi)部變量間和Y變量組內(nèi)部變量間的相關(guān),另一方面兩變量組間存在著i*j個簡單相關(guān)系數(shù),從而使問題顯得復雜且缺乏綜合的描述

典型相關(guān)分析(canonicalcorrelation)根據(jù)變量間的相關(guān)關(guān)系,尋找少數(shù)幾個關(guān)系簡單的綜合變量對(實際觀察變量的線性組合),計算典型相關(guān)系數(shù)簡單回歸分析

(simplelinearregression)描述自變量與反應變量之間的依存關(guān)系

簡單線性回歸模型

包括了反應變量、自變量、截距參數(shù)、斜率參數(shù)和誤差

回歸方程(Regressionequation)通常情況下,研究者只能獲得樣本值,用該樣本數(shù)據(jù)獲得的有關(guān)應變量隨著自變量變化的線性表達式

回歸系數(shù)(RegressionCoefficient)b為樣本回歸系數(shù),總體回歸系數(shù)用表示,它說明當自變量每改變1個單位,應變量改變b個單位,大于0時,說明兩變量同向變化,它的符號與相關(guān)系數(shù)r相同。最小二乘法

(leastsquaredestimation,LSE)可以確定不同ab取值的不同回歸直線,能使數(shù)據(jù)點到回歸直線的縱向距離的平方和最小的原理,就是LSE。也就是說剩余的平方和最小剩余=總體回歸系數(shù)的統(tǒng)計推斷

剩余標準差

又稱為殘差(Residual),反映因變量Y對回歸直線的離散程度,是表示回歸直線精度的指標,它也反映了實際散點圍繞回歸直線的離散程度

回歸方程的應用

1描述兩個變量之間的依存關(guān)系2利用回歸方程進行預測3利用回歸方程進行控制。

直線回歸與相關(guān)的區(qū)別與聯(lián)系

1區(qū)別

⑴資料要求⑵應用⑶意義⑷計算

⑸取值范圍

單位

2聯(lián)系

⑴回歸系數(shù)和相關(guān)系數(shù)的符號相同⑵回歸系數(shù)和相關(guān)系數(shù)的假設檢驗等價⑶回歸解釋相關(guān)

應用回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論