Logistic模型應(yīng)用的方法與技術(shù)PPT課件_第1頁
Logistic模型應(yīng)用的方法與技術(shù)PPT課件_第2頁
Logistic模型應(yīng)用的方法與技術(shù)PPT課件_第3頁
Logistic模型應(yīng)用的方法與技術(shù)PPT課件_第4頁
Logistic模型應(yīng)用的方法與技術(shù)PPT課件_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、問題提出 可用于慢性非傳染性疾病的病例對(duì)照資料分析,可用于病例對(duì)照研究資料分析,不僅限于病例對(duì)照研究資可用于慢性非傳染性疾病的病例對(duì)照資料分析,可用于病例對(duì)照研究資料分析,不僅限于病例對(duì)照研究資料分析料分析; ; 樣本量要求樣本量要求5050以上以上; ; 對(duì)調(diào)查的因素或變量先做單因素對(duì)調(diào)查的因素或變量先做單因素LogisticLogistic模型分析,再有意義的因素變量做多因素變量篩選,即可獲得模型模型分析,再有意義的因素變量做多因素變量篩選,即可獲得模型分析結(jié)果分析結(jié)果; ;第1頁/共30頁問題提出 模型分析結(jié)果為某一些因素變量有統(tǒng)計(jì)學(xué)意義,模型擬合良好(模型分析結(jié)果為某一些因素變量有統(tǒng)計(jì)

2、學(xué)意義,模型擬合良好(P P0.82560.8256,P0.05P0.05); ; 模型分析結(jié)果與專業(yè)解釋有矛盾,專業(yè)上認(rèn)為有意義的,檢驗(yàn)結(jié)果無意義,或雖有統(tǒng)計(jì)意義,但符號(hào)和方模型分析結(jié)果與專業(yè)解釋有矛盾,專業(yè)上認(rèn)為有意義的,檢驗(yàn)結(jié)果無意義,或雖有統(tǒng)計(jì)意義,但符號(hào)和方向相反向相反; ; 自變量為計(jì)量資料自變量為計(jì)量資料( (數(shù)值變量數(shù)值變量) )信息最多,變量處理上比較簡單,可直接進(jìn)入模型分析信息最多,變量處理上比較簡單,可直接進(jìn)入模型分析。第2頁/共30頁Logistic模型應(yīng)用的方法與技術(shù) 適用資料和研究設(shè)計(jì)類型與模型分析目的適用資料和研究設(shè)計(jì)類型與模型分析目的 模型的應(yīng)用條件模型的應(yīng)用條

3、件 LogisticLogistic模型的樣本量模型的樣本量 資料準(zhǔn)備與變量設(shè)置資料準(zhǔn)備與變量設(shè)置 變量篩選與因素分析變量篩選與因素分析 LogisticLogistic模型的流行病學(xué)意義模型的流行病學(xué)意義 不同分析目的和設(shè)計(jì)類型對(duì)分析結(jié)果選取不同分析目的和設(shè)計(jì)類型對(duì)分析結(jié)果選取第3頁/共30頁適用資料與研究設(shè)計(jì)類型 病例對(duì)照研究資料病例對(duì)照研究資料 成組設(shè)計(jì)成組設(shè)計(jì) 個(gè)體匹配(個(gè)體匹配(1:1, 1:M, N:M1:1, 1:M, N:M)和頻率匹配)和頻率匹配 橫斷面調(diào)查觀察資料橫斷面調(diào)查觀察資料 隊(duì)列研究資料(封閉隊(duì)列)隊(duì)列研究資料(封閉隊(duì)列) 隨機(jī)對(duì)照試驗(yàn)資料隨機(jī)對(duì)照試驗(yàn)資料 交叉試驗(yàn)

4、設(shè)計(jì)資料交叉試驗(yàn)設(shè)計(jì)資料 藥物與毒物劑量反應(yīng)研究資料藥物與毒物劑量反應(yīng)研究資料第4頁/共30頁模型的分析目的因素分析 自變量與因變量間有無關(guān)聯(lián)性自變量與因變量間有無關(guān)聯(lián)性 在調(diào)整和控制其他因素條件下研究自變量與因變量間的關(guān)系在調(diào)整和控制其他因素條件下研究自變量與因變量間的關(guān)系 可能的危險(xiǎn)因素可能的危險(xiǎn)因素結(jié)合設(shè)計(jì)與專業(yè)問題結(jié)合設(shè)計(jì)與專業(yè)問題 劑量反應(yīng)關(guān)系(連續(xù)與有序多分類)劑量反應(yīng)關(guān)系(連續(xù)與有序多分類) 自變量與因變量關(guān)系的形態(tài)自變量與因變量關(guān)系的形態(tài)線性,線性,“”型,型,“”型,對(duì)數(shù)線性等型,對(duì)數(shù)線性等第5頁/共30頁模型分析目的建模預(yù)測(cè)判別 分析的基礎(chǔ)上建立分析的基礎(chǔ)上建立 Logis

5、ticLogistic回歸方程,用于因變量的預(yù)測(cè)與判別回歸方程,用于因變量的預(yù)測(cè)與判別 僅對(duì)前瞻性研究資料(包括臨床隨機(jī)試驗(yàn))僅對(duì)前瞻性研究資料(包括臨床隨機(jī)試驗(yàn)) 反映模型擬合度的指標(biāo)要好反映模型擬合度的指標(biāo)要好 回代符合率與前瞻符合率要高回代符合率與前瞻符合率要高 對(duì)模型的適合性有較高要求對(duì)模型的適合性有較高要求 有較好專業(yè)研究基礎(chǔ)有較好專業(yè)研究基礎(chǔ)第6頁/共30頁應(yīng)用條件 Logistic模型是以二項(xiàng)分布為基礎(chǔ) 獨(dú)立,重復(fù),互拆 獨(dú)立各個(gè)體間發(fā)?。ㄊ录┫嗷ゲ挥绊?重復(fù)各個(gè)體事件發(fā)生的條件相同且有一定的重復(fù)數(shù),多個(gè)調(diào)查結(jié)果的合并分析與樣本量; 互拆只有兩種對(duì)立的結(jié)果(兩分類)第7頁/共3

6、0頁應(yīng)用條件實(shí)例分析 在高血壓患病率與危險(xiǎn)因素的現(xiàn)況調(diào)查中,以高血壓病人為病例,非高血壓病人為對(duì)照,應(yīng)用在高血壓患病率與危險(xiǎn)因素的現(xiàn)況調(diào)查中,以高血壓病人為病例,非高血壓病人為對(duì)照,應(yīng)用logisticlogistic模型模型分析影響高血壓發(fā)病的可能危險(xiǎn)因素。(分析影響高血壓發(fā)病的可能危險(xiǎn)因素。(GEEGEE模型)模型) 應(yīng)用應(yīng)用logisticlogistic回歸模型分析傳染病病例對(duì)照研究資料,探索傳染病發(fā)病的可能影響因素回歸模型分析傳染病病例對(duì)照研究資料,探索傳染病發(fā)病的可能影響因素第8頁/共30頁Logistic模型的樣本量 研究對(duì)象個(gè)數(shù)大于參數(shù)個(gè)數(shù) 一般為自變量個(gè)數(shù)(參數(shù)個(gè)數(shù))的510

7、倍 小樣本時(shí)模型效率較差,傳統(tǒng)概念為50 與參數(shù)個(gè)數(shù)、病例與非病例的比例、比數(shù)比(OR)大小有關(guān)(中國公共衛(wèi)生,中國衛(wèi)生統(tǒng)計(jì)學(xué)) 許多情況下樣本量50 仍有效 確切Logistic回歸模型第9頁/共30頁資料準(zhǔn)備變量設(shè)置 二分類變量直接設(shè)置成01變量 無序多分類(計(jì)數(shù)資料中的多分類),將k類設(shè)置成 k-1 個(gè)0-1變量血型血型 x1 x2 x3x1 x2 x3 O O型型 0 0 00 0 0 A A型型 1 0 01 0 0 B B型型 0 1 00 1 0 AB AB型型 0 0 10 0 1血型血型 x1 x2 x3x1 x2 x3 O O型型 1 0 01 0 0 A A型型 0 1

8、00 1 0 B B型型 0 0 10 0 1 AB AB型型 0 0 00 0 0第10頁/共30頁資料準(zhǔn)備變量設(shè)置 有序多分類變量(等級(jí)分組資料) 設(shè)置成0,1,2,3,4, 根據(jù)專業(yè)問題設(shè)置成特殊的數(shù)量等級(jí)關(guān)系,如 0,1.5,3,5 轉(zhuǎn)換成k-1 個(gè)0-1變量 例如大便隱血試驗(yàn)結(jié)果,+,+,+,+, 第11頁/共30頁隱血試驗(yàn)結(jié)果隱血試驗(yàn)結(jié)果X1 X2 X3 X4X1 X2 X3 X4 0 0 0 00 0 0 0 1 0 0 01 0 0 0 0 1 0 00 1 0 0 0 0 1 00 0 1 0 0 0 0 10 0 0 1第12頁/共30頁資料準(zhǔn)備變量設(shè)置 計(jì)量資料(連續(xù)性變

9、量) 以原始變量值進(jìn)入 將原始變量值作適當(dāng)變換(如對(duì)數(shù)變換)后進(jìn)入從專業(yè)上和數(shù)量關(guān)系上先進(jìn)行探索 將原始變量值中心化、尺度化和標(biāo)準(zhǔn)化 將連續(xù)性變量離散成有序多分類,或再轉(zhuǎn)化為0-1變量(探索規(guī)律,不十分準(zhǔn)確離散較大) 從專業(yè)探索與多種方式償試 Data cleaning第13頁/共30頁變量篩選與因素分析 單變量分析與多變量分析單變量分析與多變量分析 一般軟件中有逐步篩選法、向前法和向后法一般軟件中有逐步篩選法、向前法和向后法 變量簡單篩選只是最初步分析,可能會(huì)產(chǎn)生不變量簡單篩選只是最初步分析,可能會(huì)產(chǎn)生不理想或有矛盾的結(jié)果理想或有矛盾的結(jié)果; ; 單變量分析作用單變量分析作用探索計(jì)量資料變換

10、規(guī)律探索計(jì)量資料變換規(guī)律 部分因素變量進(jìn)行多種變量設(shè)置后進(jìn)入模型,部分因素變量進(jìn)行多種變量設(shè)置后進(jìn)入模型,或調(diào)整不同的基礎(chǔ)水平或調(diào)整不同的基礎(chǔ)水平 可區(qū)分混雜因素與處理因素,但是相對(duì),混雜可區(qū)分混雜因素與處理因素,但是相對(duì),混雜因素設(shè)置可粗一些,處理因素設(shè)置要精細(xì)一些;因素設(shè)置可粗一些,處理因素設(shè)置要精細(xì)一些;第14頁/共30頁因素分析(實(shí)例分析) 婦女年齡與低出生體重的關(guān)系分析,年齡在婦女年齡與低出生體重的關(guān)系分析,年齡在16451645歲歲 直接輸入無統(tǒng)計(jì)意義或弱統(tǒng)計(jì)意義直接輸入無統(tǒng)計(jì)意義或弱統(tǒng)計(jì)意義 標(biāo)準(zhǔn)化或轉(zhuǎn)換無改變標(biāo)準(zhǔn)化或轉(zhuǎn)換無改變 用用0-10-1變量分析,以低年齡組為基準(zhǔn),中間年

11、齡危險(xiǎn)度低,高年齡組危險(xiǎn)度高;變量分析,以低年齡組為基準(zhǔn),中間年齡危險(xiǎn)度低,高年齡組危險(xiǎn)度高; 分別以中間年齡組和高年齡組為基準(zhǔn)分別進(jìn)行分析分別以中間年齡組和高年齡組為基準(zhǔn)分別進(jìn)行分析第15頁/共30頁可能的矛盾結(jié)果及原因分析 因素應(yīng)有意義,回歸系數(shù)無統(tǒng)計(jì)意義; 回歸系數(shù)的符號(hào)與專業(yè)意義相反 變量篩選過程中變量有進(jìn)有出,變量間作用可能有包含有重疊作用 選用不同的水平,結(jié)果相差較大或截然不同的結(jié)果 選用不同的基礎(chǔ)水平或不同的變量設(shè)置或轉(zhuǎn)換方式結(jié)果相差較大或相反。第16頁/共30頁可能的矛盾結(jié)果及原因分析 變量(因素)間有相關(guān)性共線性 重要直接的變量未調(diào)查或未引入模型 樣本有偏性或有局限,取值范圍

12、較窄 樣本量較少 變量設(shè)置不合理 研究問題不適合用乘法Logistic回歸模型,還有加法模型,冪轉(zhuǎn)換模型、非線性模型或其他模型第17頁/共30頁可能解決的處理方法 Data cleaning 分析數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)的分布范圍、相互關(guān)系,因素和變量重新設(shè)置,其他多元統(tǒng)計(jì)方法先處理或?qū)iT的分析模型; 從專業(yè)上分析研究問題的重要變量和樣本的局限性,取值范圍是否較窄; 深入進(jìn)行因素分析,重新設(shè)置變量取值 試用其他分析模型,加法模型,構(gòu)造非線性模型,廣義相對(duì)危險(xiǎn)度模型第18頁/共30頁Logistic模型參數(shù)意義與結(jié)果選取 病例對(duì)照研究b0受病例組與對(duì)照組從相應(yīng)總體抽樣的抽樣比(1,0)影響,其關(guān)系為b0=

13、b0*+ln(1 /0); 病例對(duì)照研究中,當(dāng)因素為兩分類時(shí),OR=eb; 在任何設(shè)計(jì)中,當(dāng)因素為有序多分類或數(shù)值變量時(shí),OR=exp(b(xk-x1)第19頁/共30頁例某研究者欲比較3個(gè)不同的藥物治療病情不同的某病的效果,研究數(shù)據(jù)見表12-1,試對(duì)數(shù)據(jù)進(jìn)行Logistic回歸分析 第20頁/共30頁第21頁/共30頁第22頁/共30頁第23頁/共30頁Deviance and Pearson Goodness-of-Fit Statistics Criterion DF Value Value/DF Pr ChiSq Deviance 2 0.3749 0.1874 0.8291 Pear

14、son 2 0.3689 0.1844 0.8316 Number of unique profiles: 6 Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 797.017 641.326 SC 801.375 658.757 -2 Log L 795.017 633.326 R-Square 0.2444 Max-rescaled R-Square 0.3268 第24頁/共30頁Testing Global Nul了 Hypothesis:BETA=0 Test Chi-Square D

15、F Pr ChiSq Likelihood Ratio 161.6907 3 .0001 Score 148.1598 3 .0001 Wald 118.1394 3 ChiSq DRUG 2 95.0859 0.0001 DEGREE 1 47.4607 ChiSq Intercept 1 -1.9594 0.2229 77.2441 0.0001 DRUG 2 1 1.8342 0.2406 58.0936 0.0001 DRUG 1 1 2.2850 0.2479 84.9472 0.0001 DEGREE 1 1.3806 0.2004 47.4607 0.0001 第26頁/共30頁 log ( ) -1.9594 2.28501 1.83422+1.3806 it PDRUGDRUGDEGREE Odds Ratio Estimates Point 95% Wald Effect Estimate Conf

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論