回歸分析重點(diǎn)難點(diǎn)詳解演示文稿_第1頁
回歸分析重點(diǎn)難點(diǎn)詳解演示文稿_第2頁
回歸分析重點(diǎn)難點(diǎn)詳解演示文稿_第3頁
回歸分析重點(diǎn)難點(diǎn)詳解演示文稿_第4頁
回歸分析重點(diǎn)難點(diǎn)詳解演示文稿_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

回歸分析重點(diǎn)難點(diǎn)詳解演示文稿目前一頁\總數(shù)六十頁\編于八點(diǎn)優(yōu)選回歸分析重點(diǎn)難點(diǎn)目前二頁\總數(shù)六十頁\編于八點(diǎn)第一節(jié)非條件Logistic回歸分析第二節(jié)條件Logistic回歸分析教學(xué)內(nèi)容第三節(jié)Logistic回歸分析的應(yīng)用及注意事項(xiàng)流行病學(xué)概念回顧DepartmentofHealthStatistics*目前三頁\總數(shù)六十頁\編于八點(diǎn)掌握了解1.Logistic回歸參數(shù)估計(jì)的基本思想2.Logistic回歸系數(shù)的假設(shè)檢驗(yàn)和區(qū)間估計(jì)方法教學(xué)目標(biāo)1.Logistic回歸分析結(jié)果及解釋2.Logistic回歸變量篩選方法3.Logistic回歸系數(shù)的流行病學(xué)意義4.Logistic回歸的應(yīng)用及注意事項(xiàng)理解非條件Logistic回歸和條件Logistic回歸的區(qū)別DepartmentofHealthStatistics*目前四頁\總數(shù)六十頁\編于八點(diǎn)幾個(gè)重要的流行病學(xué)概念目前五頁\總數(shù)六十頁\編于八點(diǎn)

病因分析(預(yù)后分析)的目的:找出影響疾病發(fā)生(或預(yù)后好壞)的影響因素及其影響的強(qiáng)度。如果某因素對(duì)疾病發(fā)生有影響,就稱該因素與疾病的發(fā)生有關(guān)聯(lián),關(guān)聯(lián)的強(qiáng)度則反映其對(duì)疾病發(fā)生影響的大小。DepartmentofHealthStatistics*目前六頁\總數(shù)六十頁\編于八點(diǎn)幾個(gè)重要的流行病學(xué)概念隊(duì)列研究(cohortstudy)病例對(duì)照研究(case-controlstudy)危險(xiǎn)度(risk)相對(duì)危險(xiǎn)度(relativerisk,RR)比數(shù)比或優(yōu)勢比(oddsratio,OR)DepartmentofHealthStatistics*目前七頁\總數(shù)六十頁\編于八點(diǎn)隊(duì)列研究

隊(duì)列研究(cohortstudy):對(duì)“因”分類上的人群作追蹤隨訪,觀察其“果”,然后對(duì)資料進(jìn)行比較分析,從而判斷“因”與“果”之間有無關(guān)聯(lián)及關(guān)聯(lián)的強(qiáng)度。患病未患病暴露組非暴露組DepartmentofHealthStatistics*目前八頁\總數(shù)六十頁\編于八點(diǎn)病例對(duì)照研究

病例對(duì)照研究(case-controlstudy):是對(duì)“果”分類上的人群作回顧性調(diào)查,觀察其“因”,然后對(duì)資料進(jìn)行比較分析,從而判斷“果”與“因”間關(guān)聯(lián)有無統(tǒng)計(jì)學(xué)意義及關(guān)聯(lián)的強(qiáng)度。暴露未暴露病例對(duì)照DepartmentofHealthStatistics*目前九頁\總數(shù)六十頁\編于八點(diǎn)危險(xiǎn)度危險(xiǎn)度(risk):通常指某個(gè)不幸事件發(fā)生的概率。危險(xiǎn)度大表示發(fā)生的可能性大。某病發(fā)病危險(xiǎn)度:觀察對(duì)象在觀察期間內(nèi)發(fā)生某病的概率,即某病發(fā)病率。DepartmentofHealthStatistics*目前十頁\總數(shù)六十頁\編于八點(diǎn)相對(duì)危險(xiǎn)度RR>1:表示該因素為危險(xiǎn)因素,使發(fā)病危險(xiǎn)度增大。RR<1:表示該因素為保護(hù)因素,使發(fā)病危險(xiǎn)度減小。RR=1:表示該因素對(duì)疾病的發(fā)病無影響。相對(duì)危險(xiǎn)度(relativerisk,RR):暴露于某種危險(xiǎn)因子的發(fā)病率pe與不暴露于該種危險(xiǎn)因子的發(fā)病率p0之比。DepartmentofHealthStatistics*目前十一頁\總數(shù)六十頁\編于八點(diǎn)相對(duì)危險(xiǎn)度患病未患病暴露組非暴露組隊(duì)列研究病例對(duì)照研究一般不能計(jì)算RR。病例對(duì)照研究DepartmentofHealthStatistics*目前十二頁\總數(shù)六十頁\編于八點(diǎn)比數(shù)(odds):發(fā)生率與未發(fā)生率之比,即p/(1-p),即陽性率/陰性率。比數(shù)比(oddsratio,OR):兩個(gè)比數(shù)之比,即,通常在流行病研究中p1為病例組的暴露率,p2為對(duì)照組的暴露率。比數(shù)比對(duì)發(fā)病率較低的疾病,一般有RR≈ORDepartmentofHealthStatistics*目前十三頁\總數(shù)六十頁\編于八點(diǎn)比數(shù)比患病未患病暴露組非暴露組暴露未暴露病例對(duì)照(對(duì)發(fā)病率較低的疾病)病例對(duì)照研究隊(duì)列研究病例對(duì)照研究一般用OR替代RR。DepartmentofHealthStatistics*目前十四頁\總數(shù)六十頁\編于八點(diǎn)一個(gè)病例對(duì)照研究資料ORDepartmentofHealthStatistics*目前十五頁\總數(shù)六十頁\編于八點(diǎn)

醫(yī)學(xué)研究中常碰到應(yīng)變量的可能取值僅有兩個(gè)(即二分類變量),如發(fā)病與未發(fā)病、陽性與陰性、死亡與生存、治愈與未治愈、暴露與未暴露等,顯然這類資料不滿足多重回歸的條件。什么情況下采用Logistic回歸目前十六頁\總數(shù)六十頁\編于八點(diǎn)目的:作出以多個(gè)自變量(危險(xiǎn)因素)估計(jì)應(yīng)變量(結(jié)果因素)的logistic回歸方程。屬于概率型非線性回歸。資料:1.應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;2.自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化。什么情況下采用Logistic回歸DepartmentofHealthStatistics*目前十七頁\總數(shù)六十頁\編于八點(diǎn)用途:研究某種疾病或現(xiàn)象發(fā)生和多個(gè)危險(xiǎn)因素(或保護(hù)因子)的數(shù)量關(guān)系。用檢驗(yàn)(或u檢驗(yàn))的局限性:1.只能研究1個(gè)危險(xiǎn)因素;2.只能得出定性結(jié)論。什么情況下采用Logistic回歸DepartmentofHealthStatistics*目前十八頁\總數(shù)六十頁\編于八點(diǎn)

種類:1.成組(非條件)logistic回歸方程。2.配對(duì)(條件)logistic回歸方程。什么情況下采用Logistic回歸DepartmentofHealthStatistics*目前十九頁\總數(shù)六十頁\編于八點(diǎn)第一節(jié)Logistic回歸分析

LogisticRegression目前二十頁\總數(shù)六十頁\編于八點(diǎn)實(shí)例表16-1膀胱癌患者及對(duì)照吸煙史資料DepartmentofHealthStatistics*目前二十一頁\總數(shù)六十頁\編于八點(diǎn)例16-2為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對(duì)26例冠心病病人和28例對(duì)照者進(jìn)行病例對(duì)照研究,調(diào)查記錄了8個(gè)可能的危險(xiǎn)因素,試用Logistic逐步回歸分析方法篩選危險(xiǎn)因素,并分析各自變量的作用大小。實(shí)例DepartmentofHealthStatistics*目前二十二頁\總數(shù)六十頁\編于八點(diǎn)表16-2冠心病8個(gè)可能的危險(xiǎn)因素與編碼說明實(shí)例目前二十三頁\總數(shù)六十頁\編于八點(diǎn)實(shí)例表16-3冠心病危險(xiǎn)因素病例對(duì)照研究原始數(shù)據(jù)目前二十四頁\總數(shù)六十頁\編于八點(diǎn)Logistic回歸模型在m個(gè)自變量的作用下陽性結(jié)果發(fā)生的概率記作:Logit變換DepartmentofHealthStatistics*目前二十五頁\總數(shù)六十頁\編于八點(diǎn)Logistic回歸模型這就擺脫了二值反應(yīng)變量在一般線性回歸分析中可能出現(xiàn)的應(yīng)變量值域的窘境。DepartmentofHealthStatistics*目前二十六頁\總數(shù)六十頁\編于八點(diǎn)Logistic曲線DepartmentofHealthStatistics*目前二十七頁\總數(shù)六十頁\編于八點(diǎn)常數(shù)項(xiàng):

α表示暴露劑量為0時(shí)個(gè)體發(fā)病與不發(fā)病概率之比的自然對(duì)數(shù)?;貧w系數(shù):

表示自變量改變一個(gè)單位時(shí)Logit(P)的改變量。模型參數(shù)的意義Logistic模型還有另一種線性化表達(dá)形式,稱為Logit模型:DepartmentofHealthStatistics*目前二十八頁\總數(shù)六十頁\編于八點(diǎn)流行病學(xué)衡量危險(xiǎn)因素作用大小的比數(shù)比指標(biāo)。計(jì)算公式為:模型參數(shù)的意義比數(shù)比OR(oddsratio)DepartmentofHealthStatistics*目前二十九頁\總數(shù)六十頁\編于八點(diǎn)模型參數(shù)的意義OR與Logit(P)的關(guān)系βj表示

ORj的自然對(duì)數(shù)值。DepartmentofHealthStatistics*目前三十頁\總數(shù)六十頁\編于八點(diǎn)模型參數(shù)的意義DepartmentofHealthStatistics*目前三十一頁\總數(shù)六十頁\編于八點(diǎn)模型參數(shù)的意義ααDepartmentofHealthStatistics*目前三十二頁\總數(shù)六十頁\編于八點(diǎn)logistic回歸模型的參數(shù)估計(jì)原理:最大似然(likelihood)估計(jì)參數(shù)估計(jì)DepartmentofHealthStatistics*目前三十三頁\總數(shù)六十頁\編于八點(diǎn)可反映某一因素兩個(gè)不同水平(c1,c0)的優(yōu)勢比。優(yōu)勢比估計(jì)logistic回歸模型的參數(shù)估計(jì)DepartmentofHealthStatistics*目前三十四頁\總數(shù)六十頁\編于八點(diǎn)logistic回歸模型的假設(shè)檢驗(yàn)2.1.似然比檢驗(yàn):-2lnL近似服從分布

G=2(lnL1-lnL0)=2ln(L1/L0)ν=p-lDepartmentofHealthStatistics*目前三十五頁\總數(shù)六十頁\編于八點(diǎn)標(biāo)準(zhǔn)化回歸系數(shù)標(biāo)準(zhǔn)化回歸系數(shù)絕對(duì)值越大,說明相應(yīng)變量的作用越大.DepartmentofHealthStatistics*目前三十六頁\總數(shù)六十頁\編于八點(diǎn)實(shí)例分析DepartmentofHealthStatistics*目前三十七頁\總數(shù)六十頁\編于八點(diǎn)數(shù)據(jù)準(zhǔn)備成3列:例數(shù)、吸煙史(1:有,0:無),膀胱癌(1:有,0:無)實(shí)例分析DepartmentofHealthStatistics*目前三十八頁\總數(shù)六十頁\編于八點(diǎn)DataWeightcases實(shí)例分析DepartmentofHealthStatistics*目前三十九頁\總數(shù)六十頁\編于八點(diǎn)AnalyzeRegressionBinaryLogistic實(shí)例分析DepartmentofHealthStatistics*目前四十頁\總數(shù)六十頁\編于八點(diǎn)應(yīng)變量編碼模型擬合結(jié)果實(shí)例分析DepartmentofHealthStatistics*目前四十一頁\總數(shù)六十頁\編于八點(diǎn)方法:前進(jìn)法、后退法和逐步法。

檢驗(yàn)統(tǒng)計(jì)量:不是F統(tǒng)計(jì)量,而是似然比統(tǒng)計(jì)量、Wald統(tǒng)計(jì)量和計(jì)分統(tǒng)計(jì)量之一。變量的篩選DepartmentofHealthStatistics*目前四十二頁\總數(shù)六十頁\編于八點(diǎn)變量的篩選例16-2為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對(duì)26例冠心病病人和28例對(duì)照者進(jìn)行病例對(duì)照研究,調(diào)查記錄了8個(gè)可能的危險(xiǎn)因素,試用Logistic逐步回歸分析方法篩選危險(xiǎn)因素,并分析各自變量的作用大小。DepartmentofHealthStatistics*目前四十三頁\總數(shù)六十頁\編于八點(diǎn)表16-2冠心病8個(gè)可能的危險(xiǎn)因素與編碼說明實(shí)例分析目前四十四頁\總數(shù)六十頁\編于八點(diǎn)實(shí)例分析表16-3冠心病危險(xiǎn)因素病例對(duì)照研究原始數(shù)據(jù)目前四十五頁\總數(shù)六十頁\編于八點(diǎn)由標(biāo)準(zhǔn)化回歸系數(shù)可以看出,選入的四個(gè)危險(xiǎn)因素按其影響大小排列的順序?yàn)閄6、X8、X5、X1,它們分別是動(dòng)物脂肪攝入量、A型性格、高血脂史和年齡增高。實(shí)例分析DepartmentofHealthStatistics*目前四十六頁\總數(shù)六十頁\編于八點(diǎn)第二節(jié)條件Logistic回歸分析

ConditionalLogisticRegression目前四十七頁\總數(shù)六十頁\編于八點(diǎn)條件Logistic回歸的原理?xiàng)l件Logistic回歸(conditionalLogisticregression)是針對(duì)配對(duì)或分層資料分析的一種方法。為了控制一些重要的混雜因素(如性別和年齡等),流行病學(xué)常采用1:M配對(duì)的研究方法,即每一個(gè)病例與M個(gè)與它條件相一致的對(duì)照形成一個(gè)匹配組(每一匹配組為一個(gè)層)。條件Logistic回歸,其實(shí)質(zhì)是在構(gòu)造似然函數(shù)時(shí)利用適當(dāng)?shù)臈l件分布,實(shí)現(xiàn)在各層中進(jìn)行比較。DepartmentofHealthStatistics*目前四十八頁\總數(shù)六十頁\編于八點(diǎn)表16-51:M

條件logistic回歸數(shù)據(jù)的格式

*t=0為病例,其他為對(duì)照

1:M數(shù)據(jù)格式DepartmentofHealthStatistics*目前四十九頁\總數(shù)六十頁\編于八點(diǎn)條件Logistic回歸模型DepartmentofHealthStatistics*目前五十頁\總數(shù)六十頁\編于八點(diǎn)實(shí)例分析例16-3某市調(diào)查三種生活方式與胃癌發(fā)病的關(guān)系,采用1:1配對(duì)的病例對(duì)照研究形式。按每個(gè)病例的性別、年齡和居住地選取一個(gè)健康作為對(duì)照。調(diào)查的三種生活方式取值見表16-7,共調(diào)查了50對(duì)病例與對(duì)照。試作條件Logistic逐步回歸分析。表16-7三種生活方式取值因素變量名分級(jí)說明不良飲食習(xí)慣X10、1、2、3、4表示程度(0表示無,4表示最多)喜吃鹵食和鹽漬食物X20、1、2、3、4表示程度(0表示不吃,4表示非常喜歡吃)精神狀況X30表示差,1表示好DepartmentofHealthStatistics*目前五十一頁\總數(shù)六十頁\編于八點(diǎn)數(shù)據(jù)準(zhǔn)備成4列:X1、X2、X3,配對(duì)號(hào)及疾病發(fā)生情況Y(1:病例,0:對(duì)照)。實(shí)例分析DepartmentofHealthStatistics*目前五十二頁\總數(shù)六十頁\編于八點(diǎn)模型擬合結(jié)果顯然,存在不顯著的變量,可以進(jìn)行逐步回歸分析。實(shí)例分析DepartmentofHealthStatistics*目前五十三頁\總數(shù)六十頁\編于八點(diǎn)實(shí)例分析DepartmentofHealthStatistics*目前五十四頁\總數(shù)六十頁\編于八點(diǎn)第三節(jié)Logistic回歸的應(yīng)用

及注意事項(xiàng)目前五十五頁\總數(shù)六十頁\編于八點(diǎn)logistic回歸分析的特點(diǎn)之一是參數(shù)意義清楚,即得到某一因素的回歸系數(shù)后,可以很快估計(jì)出這一因素在不同水平下的優(yōu)勢比OR或近似相對(duì)危險(xiǎn)度RR,因此非常適合于流行病學(xué)研究。logistic回歸既適合于隊(duì)列研究(cohortstudy),也適合于病例-對(duì)照研究(case-controlstudy),同樣還可以用于橫斷面研究(cross-sectionalstudy)logistic回歸的應(yīng)用流行病學(xué)危險(xiǎn)因素分析DepartmentofHealthStatistics*目前五十六頁\總數(shù)六十頁\編于八點(diǎn)臨床試驗(yàn)的目的大多是為了評(píng)價(jià)某種藥物或治療方法的效果,如果有其他影響效果的非處理因素(如年齡、病情等)在試驗(yàn)組和對(duì)照組中分布不均衡,就有可能夸大或掩蓋試驗(yàn)組的治療效果。當(dāng)非處理因素過多時(shí),可能會(huì)遇到各層樣本量過小和非處理因素在試驗(yàn)組和對(duì)照組內(nèi)的分布不均衡的問題。用單因素分析很難保證對(duì)比組間的齊同性。當(dāng)評(píng)價(jià)指標(biāo)為二值變量時(shí)(如有效和無效),可以利用lo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論