版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
醫(yī)學(xué)統(tǒng)計(jì)學(xué)一元相關(guān)與回歸第一頁,共五十四頁,編輯于2023年,星期五掌握:積差相關(guān)等級(jí)相關(guān)線性回歸的概念線性回歸方程的計(jì)算回歸系數(shù)的假設(shè)檢驗(yàn)相關(guān)與回歸的區(qū)別與聯(lián)系了解:曲線擬合教學(xué)目的和要求第二頁,共五十四頁,編輯于2023年,星期五重點(diǎn)講解積差相關(guān)等級(jí)相關(guān)線性回歸的概念回歸系數(shù)的假設(shè)檢驗(yàn)相關(guān)與回歸的區(qū)別與聯(lián)系介紹曲線擬合教學(xué)內(nèi)容提要
第三頁,共五十四頁,編輯于2023年,星期五第一節(jié)兩變量相關(guān)相關(guān)分析是研究客觀事物或現(xiàn)象之間關(guān)系的密切程度(不存在函數(shù)關(guān)系)。線性相關(guān)是研究兩變量之間是否存在線性關(guān)系。線性相關(guān)的類型積差相關(guān)等級(jí)相關(guān)第四頁,共五十四頁,編輯于2023年,星期五為研究父親與成年兒子身高之間的關(guān)系,皮爾遜測(cè)量了1078對(duì)父子的身高。把1078對(duì)數(shù)字表示在坐標(biāo)上。X上的數(shù)代表父親身高,Y上的數(shù)代表兒子的身高。1078個(gè)點(diǎn)形成圖形是一個(gè)散點(diǎn)圖。一、積差相關(guān)1、散點(diǎn)圖第五頁,共五十四頁,編輯于2023年,星期五一、積差相關(guān)
1、散點(diǎn)圖第六頁,共五十四頁,編輯于2023年,星期五2、
積差相關(guān)系數(shù)
定量描述X與Y兩變量間直線相關(guān)方向和相關(guān)密切程度的統(tǒng)計(jì)指標(biāo)。
積差相關(guān)系數(shù)(參數(shù)檢驗(yàn)法)r,ρ
等級(jí)相關(guān)系數(shù)(非參數(shù)檢驗(yàn)法)
Pearson相關(guān)系數(shù),簡稱相關(guān)系數(shù),適用于x、y都服從正態(tài)分布(稱為雙變量正態(tài)分布)的資料。
第七頁,共五十四頁,編輯于2023年,星期五積差相關(guān)系數(shù)的計(jì)算r沒有單位取值范圍:-1≤r≤1Lxy=∑XY-(∑X)(∑Y)/nLxx=∑X2-(∑X)2/nLyy=∑Y2-(∑Y)2/n協(xié)方差第八頁,共五十四頁,編輯于2023年,星期五
r的特點(diǎn)沒有單位-1≤r≤1
r=-1完全負(fù)相關(guān),-1≤r
<0負(fù)相關(guān)
r=1完全正相關(guān),0<r≤1正相關(guān)
r=0零相關(guān)第九頁,共五十四頁,編輯于2023年,星期五散點(diǎn)圖第十頁,共五十四頁,編輯于2023年,星期五
【例9-1】一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過測(cè)量待產(chǎn)婦尿中雌三醇含量,可以預(yù)測(cè)產(chǎn)兒體重,以便對(duì)低出生體重進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦24小時(shí)的尿,測(cè)量其中的雌三醇含量,同時(shí)記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間是否存在相關(guān)關(guān)系?是正相關(guān)還是負(fù)相關(guān)?3、積差相關(guān)分析第十一頁,共五十四頁,編輯于2023年,星期五編號(hào)
(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)編號(hào)
(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2
待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系
第十二頁,共五十四頁,編輯于2023年,星期五1)繪制散點(diǎn)圖第十三頁,共五十四頁,編輯于2023年,星期五2)積差相關(guān)系數(shù)的計(jì)算∑X=534;∑Y=99.2;∑X2=9876∑Y2=324.8;∑XY=1750;第十四頁,共五十四頁,編輯于2023年,星期五3)相關(guān)系數(shù)的假設(shè)檢驗(yàn)上例中r=0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差。=0時(shí),由于抽樣誤差,可能導(dǎo)致r≠0。對(duì)r進(jìn)行假設(shè)檢驗(yàn),判斷r≠0是由于抽樣誤差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。
第十五頁,共五十四頁,編輯于2023年,星期五3)相關(guān)系數(shù)的假設(shè)檢驗(yàn)
總體相關(guān)系數(shù)ρ=0表示總體中兩變量x和y無直線相關(guān)關(guān)系a.用t作檢驗(yàn)統(tǒng)計(jì)量
b.直接用r作檢驗(yàn)統(tǒng)計(jì)量
r的標(biāo)準(zhǔn)誤為sr=根據(jù)t分布性質(zhì)來檢驗(yàn)樣本相關(guān)系數(shù)r是否來自ρ=0的總體:tr=(r-ρ)/sr=(r-0)/sr=r/=r
用r和自由度v=n-2,查附表18,相關(guān)系數(shù)界值表第十六頁,共五十四頁,編輯于2023年,星期五H0:ρ=0H1:ρ≠0
ν=n-2=31-2=29查附表7,t0.0005/2,28=3.9351,t0.0002/2,28=4.2754,0.0002<
P<0.0005,拒絕H0,接受H1,認(rèn)為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間有正相關(guān)關(guān)系。第十七頁,共五十四頁,編輯于2023年,星期五第二節(jié)直線回歸一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗(yàn)四、直線回歸的應(yīng)用一個(gè)人的快樂,不是因?yàn)樗麚碛械亩?,而是因?yàn)樗?jì)較的少休息第十八頁,共五十四頁,編輯于2023年,星期五二、等級(jí)相關(guān)(秩相關(guān))
①不服從正態(tài)分布的資料;②總體分布類型不知的資料;③用等級(jí)或相對(duì)數(shù)表示的資料;④數(shù)據(jù)一端或兩端有不確定值的資料用等級(jí)相關(guān)(或稱秩相關(guān))分析(屬非參數(shù)統(tǒng)計(jì)法)。
第十九頁,共五十四頁,編輯于2023年,星期五秩相關(guān)系數(shù)Spearman相關(guān)系數(shù)(rs)Kendall相關(guān)系數(shù)(rk)用等級(jí)相關(guān)系數(shù)表示兩個(gè)變量間直線關(guān)系密切程度和方向。第二十頁,共五十四頁,編輯于2023年,星期五先分別將兩個(gè)變量按原始數(shù)值由小到大編秩(遇相同觀察值時(shí)取平均秩),計(jì)算每對(duì)觀察值的秩之差d。
n為對(duì)子數(shù);d為配對(duì)秩次之差;Tx(或Ty)=Σ(tj3-tj)/12;tj為x(或y)中第j個(gè)相同秩次的個(gè)數(shù)。查附表19確定P的大小。
1)Spearman相關(guān)系數(shù)(rs)第二十一頁,共五十四頁,編輯于2023年,星期五【例9-2】12名2~7歲急性白血病患兒的血小板數(shù)與出血癥狀資料見下表,分析兩者之間有無直線關(guān)系:第二十二頁,共五十四頁,編輯于2023年,星期五H0:ρ=0,H1:ρ≠0
rsc==-0.4222
查統(tǒng)計(jì)用附表19,r0.05/2(12)=0.587,P>0.05不能以=0.05水準(zhǔn)拒絕H0,不能認(rèn)為2~7歲急性白血病患兒的血小板數(shù)與出血癥狀之間有直線相關(guān)關(guān)系。第二十三頁,共五十四頁,編輯于2023年,星期五2)Kendall相關(guān)系數(shù)在X的秩從小到大排列后,計(jì)算配對(duì)的Y每個(gè)秩下面更大者的個(gè)數(shù),合計(jì)值記為S,計(jì)算rK并在相同秩次較多時(shí)校正:其中,n為對(duì)子數(shù),Ux或Uy=∑(tj2-tj)/2,tj為第j個(gè)相同秩次的個(gè)數(shù)。查附表20確定P的大小。第二十四頁,共五十四頁,編輯于2023年,星期五三、相關(guān)系數(shù)應(yīng)用注意事項(xiàng)有實(shí)際意義在兩個(gè)變量的變化范圍內(nèi)進(jìn)行相關(guān)不是因果關(guān)系,但可做為進(jìn)一步考證有無因果關(guān)系的基礎(chǔ)第二十五頁,共五十四頁,編輯于2023年,星期五四、直線相關(guān)的應(yīng)用
一般說來,當(dāng)n>100,并對(duì)r進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí):∣r∣>0.7,則表示兩個(gè)變量高度相關(guān);0.4<∣r∣≤0.7時(shí),則表示兩個(gè)變量之間中度相關(guān);0.2<∣r∣≤0.4時(shí),則兩個(gè)變量低度相關(guān)。
第二十六頁,共五十四頁,編輯于2023年,星期五
待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體重之間成正相關(guān)。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出產(chǎn)兒的體重嗎?或產(chǎn)兒的體重可能在什么范圍內(nèi)呢?身高與體重之間也成正相關(guān)關(guān)系。那么,身高每增加1厘米,體重增加多少克呢?上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來解決。
第二十七頁,共五十四頁,編輯于2023年,星期五某保險(xiǎn)公司承保汽車5萬量,平均每量保費(fèi)收入為1000元,則該保險(xiǎn)公司汽車承??偸杖霝?000萬元。承??偸杖耄篩
承保汽車量數(shù):XY=1000XX與Y兩個(gè)變量間完全表現(xiàn)為一種確定性關(guān)系,即函數(shù)關(guān)系。第二節(jié)一元回歸第二十八頁,共五十四頁,編輯于2023年,星期五第二十九頁,共五十四頁,編輯于2023年,星期五銀行的1年期存款利息年息為2.25%,存入的本金用X表示,到期的本息用Y表示,則
Y=X+2.25%X
這里Y與X仍表現(xiàn)為一種線性函數(shù)關(guān)系。第三十頁,共五十四頁,編輯于2023年,星期五另外一種情況:兩事物之間有著密切的聯(lián)系,但密切的程度并沒有達(dá)到由一個(gè)可以完全確定另一個(gè)的程度。例如:
?生長發(fā)育階段動(dòng)物體重增量與食量
?
廣告費(fèi)支出與商品銷售額第三十一頁,共五十四頁,編輯于2023年,星期五由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為一元回歸方程,這種關(guān)系為一元回歸。第三十二頁,共五十四頁,編輯于2023年,星期五第二節(jié)一元回歸一、直線回歸分析繪制散點(diǎn)圖求直線回歸方程繪制回歸直線回歸系數(shù)的假設(shè)檢驗(yàn)用直線方程描述兩個(gè)變量間的數(shù)量依存關(guān)系。第三十三頁,共五十四頁,編輯于2023年,星期五①一般形式:
a:截距b:回歸系數(shù)(回歸直線斜率)1.直線回歸方程的求法
b>0x↑y↑;b<0x↑y↓
b:意義為x每變化一個(gè)單位,y變化的平均值
x:自變量,要求容易測(cè)定、容易控制:y
的估計(jì)值,y稱因變量,要求在不同的x的時(shí)候其分布為正態(tài)分布第三十四頁,共五十四頁,編輯于2023年,星期五y②a、b的計(jì)算(用最小二乘法原理估計(jì)b)n:對(duì)子數(shù)(數(shù)據(jù)對(duì))剩余誤差,殘差:各實(shí)測(cè)值y至回歸直線縱向距離。剩余平方和或殘差平方和最小。SSe=Σ(y-)2SS總=SSR+SSe
第三十五頁,共五十四頁,編輯于2023年,星期五決定系數(shù)(determiningcoefficient,R2):回歸平方和在總平方和中所占的比例。R2=SS回
/SS總R2=(n-1)sy2r2/
(n-1)sy2
=r2
R2是評(píng)價(jià)回歸強(qiáng)度的一個(gè)重要指標(biāo)。0≤R2
≤1,→1,回歸效果越好,強(qiáng)度↑。臨床研究中,R2≥0.7認(rèn)為回歸效果不錯(cuò)。2.回歸方程擬合效果評(píng)價(jià)(決定系數(shù))第三十六頁,共五十四頁,編輯于2023年,星期五編號(hào)
(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)編號(hào)
(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2
第三十七頁,共五十四頁,編輯于2023年,星期五尿雌三醇x(mg/24h)(1)X2
(2)產(chǎn)兒體重Y(kg)(3)
Y2
(4)XY
(5)7492.56.2517.59812.56.2522.59812.56.2522.5121442.77.2932.4141962.77.2937.8162562.77.2943.2…………………………224844.016.0288.0256253.915.2197.5245764.318.49103.2
534
987699.2324.181750.0第三十八頁,共五十四頁,編輯于2023年,星期五(1)繪制散點(diǎn)圖(2)求直線回歸方程第三十九頁,共五十四頁,編輯于2023年,星期五第四十頁,共五十四頁,編輯于2023年,星期五(3)繪制回歸直線
在自變量的變化范圍內(nèi)選兩點(diǎn)做直線(0,a)(X,Y)這兩點(diǎn)可以用來核對(duì)圖線繪制是否正確。例題中得到的直線回歸方程一定經(jīng)過(0,2.15)(17.23,3.2)兩點(diǎn)。第四十一頁,共五十四頁,編輯于2023年,星期五第四十二頁,共五十四頁,編輯于2023年,星期五直線回歸方程從樣本資料計(jì)算而得,有抽樣誤差。需要對(duì)樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),以判斷b是否從回歸系數(shù)為零的總體中抽得??傮w的回歸系數(shù)一般用β表示。
是否能說明雌三醇與產(chǎn)兒體重之間一定存在回歸關(guān)系?
第四十三頁,共五十四頁,編輯于2023年,星期五t-檢驗(yàn)
H0:β=0
(直線回歸方程不成立)
H1:β≠0(直線回歸方程成立)進(jìn)行β=0的假設(shè)檢驗(yàn)(即X與Y間無直線回歸關(guān)系)
t檢驗(yàn)或F檢驗(yàn)相關(guān)系數(shù)的檢驗(yàn)代替(4)回歸系數(shù)的假設(shè)檢驗(yàn)第四十四頁,共五十四頁,編輯于2023年,星期五υ=n-2第四十五頁,共五十四頁,編輯于2023年,星期五H0:β=0H1:β≠0α=0.05第四十六頁,共五十四頁,編輯于2023年,星期五υ=31-2=29,查表t0.0005/2,28=3.9351,P<0.0005拒絕H0,接受H1,認(rèn)為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間存在直線回歸關(guān)系。第四十七頁,共五十四頁,編輯于2023年,星期五二、直線回歸方程的應(yīng)用估計(jì):描述兩變量間的依存關(guān)系
通過回歸系數(shù)的假設(shè)檢驗(yàn),若認(rèn)為兩變量之間存在直線回歸關(guān)系,則可用直線回歸來描述。
利用回歸方程進(jìn)行預(yù)測(cè)把自變量代入回歸方程,對(duì)應(yīng)變量進(jìn)行估計(jì)。例如,已知某待產(chǎn)婦的尿雌三醇濃度,估計(jì)產(chǎn)兒的體重范圍。利用回歸方程進(jìn)行統(tǒng)計(jì)控制胰島素與血糖制定正常值范圍血細(xì)胞,血紅蛋白等第四十八頁,共五十四頁,編輯于2023年,星期五三、曲線擬合對(duì)呈曲線關(guān)系的資料,可用散點(diǎn)圖分析曲線的類型,建立曲線回歸方程。常用曲線的類型:對(duì)數(shù):=a+blnX
指數(shù):ln=a+bX
冪函數(shù):ln=a+blnX
Logistic:第四十九頁,共五十四頁,編輯于2023年,星期五四、相關(guān)與回歸分析注意事項(xiàng)
1.實(shí)際意義進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)系的兩個(gè)事物或現(xiàn)象用來作相關(guān)回歸分析。
2.相關(guān)關(guān)系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 體育場(chǎng)館外來觀眾管理辦法
- 城市綠化苗木供應(yīng)保障書
- 旅游景區(qū)設(shè)施招投標(biāo)規(guī)程
- 福州市停車場(chǎng)緊急醫(yī)療救助
- 電子產(chǎn)品招投標(biāo)技巧題
- 商標(biāo)授權(quán)協(xié)議書范本
- 博物館租賃合同:文物展覽
- 冰球館木地板安裝協(xié)議
- 建筑拆除安全合同范本
- 環(huán)保工程招投標(biāo)法定時(shí)間表
- 友善教育主題班會(huì)省公開課一等獎(jiǎng)全國示范課微課金獎(jiǎng)?wù)n件
- 醫(yī)院崗前法律法規(guī)培訓(xùn)
- MOOC 機(jī)械原理-西北工業(yè)大學(xué) 中國大學(xué)慕課答案
- (2024年)生態(tài)環(huán)境保護(hù)課件
- 2024年醫(yī)院內(nèi)窺鏡室護(hù)理工作計(jì)劃
- 高效的跨部門協(xié)作與溝通
- 基于PLC飲用水源初處理控制系統(tǒng)設(shè)計(jì)
- 單位工程施工組織設(shè)計(jì)實(shí)例樣本
- 平面設(shè)計(jì)工作室計(jì)劃書
- 貧血及低蛋白血癥的護(hù)理
- 人教版(2019)選擇性必修第三冊(cè)Unit 1 Art 詞形變化課件
評(píng)論
0/150
提交評(píng)論