




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Logistic回歸分析
及其應(yīng)用溫澤淮DME中心*8/23/20231Logistic回歸分析
及其應(yīng)用溫澤淮*8/3/20231概述1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上發(fā)表了冠心病危險(xiǎn)因素的研究,較早將Logistic回歸用于醫(yī)學(xué)研究。一般概念一元直線回歸多元直線回歸*8/23/20232概述1967年TrueltJ,ConnifieldJ和K一元直線回歸模型
y=a+bx+e多元直線回歸模型
y=a+b1x1+b2x2+…+bkxk+e*8/23/20233一元直線回歸模型*8/3/20233-4.00-2.000.002.004.00X:自變量0.000.250.500.751.00F(y):因變量的logit值如果一定要進(jìn)行直線回歸也可以做出結(jié)果,但此時(shí)效果不佳。當(dāng)自變量取一定值時(shí),因變量的預(yù)測(cè)值可能為負(fù)數(shù)。*8/23/20234-4.00-2.000.002.004.00X:自變量0.0一般直線回歸難以解決的問(wèn)題醫(yī)學(xué)數(shù)據(jù)的復(fù)雜、多樣連續(xù)型和離散型數(shù)據(jù)醫(yī)學(xué)研究中疾病的復(fù)雜性一種疾病可能有多種致病因素或與多種危險(xiǎn)因素有關(guān)疾病轉(zhuǎn)歸的影響因素也可能多種多樣臨床治療結(jié)局的綜合性*8/23/20235一般直線回歸難以解決的問(wèn)題醫(yī)學(xué)數(shù)據(jù)的復(fù)雜、多樣*8/3/20簡(jiǎn)單的解決方法固定其他因素,研究有影響的一兩個(gè)因素;分層分析:按1~2個(gè)因素組成的層進(jìn)行層內(nèi)分析和綜合。統(tǒng)計(jì)模型*8/23/20236簡(jiǎn)單的解決方法固定其他因素,研究有影響的一兩個(gè)因素;*8/3尋找合適的模型進(jìn)行l(wèi)ogit變換logit(p)=ln(——),p為y=1所對(duì)應(yīng)的概率logit(0.1)=ln(———)=ln(0.1/0.9)p1-p0.11-0.1*8/23/20237尋找合適的模型進(jìn)行l(wèi)ogit變換p1-p0.11-0logit(p)=ln(——)p=0或1時(shí),此式失效
以p=r/n代之logit(p)=ln[(r+0.5)/(n–r+0.5)]此稱(chēng)經(jīng)驗(yàn)logistic變換
以Z代上式的logit(p),Z=a+b1x1+b2x2+…+bkxk稱(chēng)此為logistic回歸模型p1-p*8/23/20238logit(p)=ln(——)p=0或1P=ez/(1+ez)ea+b1x1+b2x2+…+bkxk
1+ea+b1x1+b2x2+…+bkxk此為非條件logistic回歸模型應(yīng)用于成組數(shù)據(jù)的分析P=*8/23/20239P=*8/3/20239自變量取定一些值時(shí),因變量取0、1的概率就是條件概率,對(duì)條件概率進(jìn)行l(wèi)ogistic回歸,稱(chēng)為條件logistic回歸表達(dá)式:eb1x1+b2x2+…+bkxk
1-eb1x1+b2x2+…+bkxk
常用于分析配比的資料P=*8/23/202310自變量取定一些值時(shí),因變量取0、1的概率就是條件概率,對(duì)條件概述小結(jié)logistic回歸對(duì)因變量的比數(shù)的對(duì)數(shù)值(logit值)建立模型因變量的logit值的改變與多個(gè)自變量的加權(quán)和呈線性關(guān)系因變量呈二項(xiàng)分布*8/23/202311概述小結(jié)logistic回歸對(duì)因變量的比數(shù)的對(duì)數(shù)值(log分析的一般步驟變量的編碼啞變量的設(shè)置和引入各個(gè)自變量的單因素分析變量的篩選交互作用的引入建立多個(gè)模型選擇較優(yōu)的模型模型應(yīng)用條件的評(píng)價(jià)輸出結(jié)果的解釋*8/23/202312分析的一般步驟變量的編碼*8/3/2023121.變量的編碼變量的編碼要易于識(shí)別注意編碼的等級(jí)關(guān)系改變分類(lèi)變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標(biāo)識(shí)(valuelabels)記錄編碼內(nèi)容*8/23/2023131.變量的編碼變量的編碼要易于識(shí)別*8/3/202313變量的編碼變量名變量標(biāo)識(shí)變量值值標(biāo)識(shí)
SEX性別1男2女EDU教育程度0文盲1小學(xué)2初中及以上*8/23/202314變量的編碼變量名變量標(biāo)識(shí)變量值variablelabelsqnum'問(wèn)卷序號(hào)'rnum'錄入序號(hào)'pnum'病人編號(hào)'hnum'住院號(hào)/門(mén)診號(hào)'chname'患者中文姓名'drugroup'組別'name'患者姓名'sex'患者性別'age'患者年齡'valuelabelssex1'男'2'女'/hisc1'是'0'否'9'無(wú)法判斷'/nsex1'正常'0'異常'9'未檢'/demdx1'有'0'無(wú)'/addx0'無(wú)'1'危險(xiǎn)性'2'可能'3'很可能'/edu0‘文盲’1‘小學(xué)程度’2‘初中及以上'*8/23/202315variablelabelsvaluelabels*8/2.啞變量的設(shè)置和引入啞變量,又稱(chēng)指示變量或設(shè)計(jì)矩陣。有利于檢驗(yàn)等級(jí)變量各個(gè)等級(jí)間的變化是否相同。一個(gè)k分類(lèi)的分類(lèi)變量,可以用k-1個(gè)啞變量來(lái)表示。*8/23/2023162.啞變量的設(shè)置和引入啞變量,又稱(chēng)指示變量或設(shè)計(jì)矩陣。*8/啞變量的設(shè)置教育程度X1X2X3文盲:0000小學(xué):1100初中:2010高中:3001教育程度:文盲,小學(xué),初中,高中以上*8/23/202317啞變量的設(shè)置教育程度X1X2X3文盲:0000小學(xué):1100教育程度X1X2X3文盲:0100小學(xué):1010初中:2001高中:3000以高中作為參照*8/23/202318教育程度X1X2X3文盲:0100小學(xué):1010初中:200SPSS提供的方法Indicator:默認(rèn)。以第1或最后1類(lèi)作對(duì)照,其他每類(lèi)與對(duì)照比較;Sample:以第1或最后1類(lèi)作對(duì)照,其他每類(lèi)與對(duì)照比較,但反映平均效應(yīng)。Difference:除第1類(lèi)外各分類(lèi)與其前各類(lèi)平均效應(yīng)比較;Helmert:除最后1類(lèi)外各分類(lèi)與其前各類(lèi)平均效應(yīng)比較;Repeated:除第1類(lèi)外各分類(lèi)與其前一類(lèi)比較;Polynomial:假設(shè)類(lèi)間距相等,用于數(shù)值型變量。Deviation:以第1或最后1類(lèi)作對(duì)照,其余每類(lèi)與總效應(yīng)比較。*8/23/202319SPSS提供的方法Indicator:默認(rèn)。以第1或最3.自變量的單因素分析了解自變量與因變量的分布檢驗(yàn)是否符合建立模型的應(yīng)用條件偏離應(yīng)用條件時(shí),進(jìn)行數(shù)據(jù)變換各個(gè)自變量?jī)山M間的比較計(jì)數(shù)資料計(jì)量資料雙變量分析*8/23/2023203.自變量的單因素分析了解自變量與因變量的分布*8/3/204.變量的篩選變量篩選的原則專(zhuān)業(yè)上考慮測(cè)量上考慮共線性問(wèn)題:計(jì)算相關(guān)矩陣,相關(guān)系數(shù)0.8-0.9,則選其一。缺失數(shù)據(jù)少、測(cè)量誤差低的優(yōu)先選擇經(jīng)驗(yàn)上考慮雙變量分析中有顯著性的自變量(P≤0.15)選擇那些改變主效應(yīng)的自變量*8/23/2023214.變量的篩選變量篩選的原則*8/3/202321變量的篩選變量篩選的可用方法逐步logistic回歸:自動(dòng)選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項(xiàng)是否顯著的判斷。前進(jìn)法:逐個(gè)引入模型外的變量后退法:放入所有變量,再逐個(gè)篩選
理論上看,前進(jìn)法選擇變量的經(jīng)驗(yàn)公式缺乏總體概念,當(dāng)用于因素分析時(shí),建議用后退法。當(dāng)變量間有完全相關(guān)性時(shí),后退法無(wú)法使用,可用前進(jìn)法。*8/23/202322變量的篩選變量篩選的可用方法*8/3/2023225.交互作用的引入交互作用的定義當(dāng)自變量和因變量的關(guān)系隨第三個(gè)變量的變化而改變時(shí),則存在交互作用交互作用項(xiàng)的引入基于臨床實(shí)際認(rèn)為對(duì)結(jié)果有重要影響基于模型應(yīng)用條件的分析引入兩個(gè)自變量的乘積項(xiàng)交互作用的檢驗(yàn)交互作用的解釋*8/23/2023235.交互作用的引入交互作用的定義*8/3/2023236.建立多個(gè)模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型*8/23/2023246.建立多個(gè)模型飽和模型*8/3/2023247.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗(yàn)AIC(Akaikeinformationcriterion):同一資料的多個(gè)模型的比較,此值越小,模型越合適。SC(Schwartzcriterion):同上Score統(tǒng)計(jì)量:同上,但不包括截距項(xiàng)。-2logL(似然比檢驗(yàn),OmnibusTest):檢驗(yàn)全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗(yàn):評(píng)價(jià)估計(jì)概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。*8/23/2023257.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗(yàn)*8/3/2023258.模型應(yīng)用條件的評(píng)價(jià)殘差分析殘差是觀察值與估計(jì)值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類(lèi)變量時(shí)更易出現(xiàn)。增加交互作用項(xiàng)可能增加模型的效能*8/23/2023268.模型應(yīng)用條件的評(píng)價(jià)殘差分析*8/3/2023269.輸出結(jié)果的解釋模型中各個(gè)系數(shù)的顯著性檢驗(yàn)Wald檢驗(yàn):類(lèi)似于直線回歸系數(shù)的t檢驗(yàn)Waldx2檢驗(yàn):同上似然比檢驗(yàn):自變量不在模型中與在模型中的似然值比較。Score檢驗(yàn)*8/23/2023279.輸出結(jié)果的解釋模型中各個(gè)系數(shù)的顯著性檢驗(yàn)*8/3/202輸出結(jié)果的解釋回歸系數(shù)的解釋系數(shù)的正負(fù)值:正(負(fù))系數(shù)表示隨自變量的增加因變量logit值的增加(減少)。二分類(lèi)自變量系數(shù)為比數(shù)比的對(duì)數(shù)值,由此比數(shù)比=eb多分類(lèi)自變量
以第i類(lèi)作參照,比較相鄰或相隔的兩個(gè)類(lèi)別。連續(xù)型自變量當(dāng)自變量改變一個(gè)單位時(shí),比數(shù)比為eb*8/23/202328輸出結(jié)果的解釋回歸系數(shù)的解釋*8/3/202328輸出結(jié)果的解釋模型擬合的優(yōu)劣自變量與結(jié)果變量(因變量)有無(wú)關(guān)系確認(rèn)因變量與自變量的編碼模型包含的各個(gè)自變量的臨床意義由模型回歸系數(shù)計(jì)算得到的各個(gè)自變量的比數(shù)比的臨床意義*8/23/202329輸出結(jié)果的解釋模型擬合的優(yōu)劣*8/3/202329輸出結(jié)果的解釋模型的預(yù)測(cè)結(jié)果的評(píng)價(jià)敏感度、特異度和陽(yáng)性預(yù)測(cè)值正確選擇預(yù)測(cè)概率界值,簡(jiǎn)單地以0.5為界值,但并不是最好的。C指數(shù)預(yù)測(cè)結(jié)果與觀察結(jié)果的一致性的度量。C值越大(最大為1),模型預(yù)測(cè)結(jié)果的能力越強(qiáng)。*8/23/202330輸出結(jié)果的解釋模型的預(yù)測(cè)結(jié)果的評(píng)價(jià)*8/3/202330非條件logistic回歸研究對(duì)象之間是否發(fā)生某事件是獨(dú)立的。適用于:成組的病例-對(duì)照研究無(wú)分層的隊(duì)列研究或橫斷面調(diào)查診斷性試驗(yàn)*8/23/202331非條件logistic回歸研究對(duì)象之間是否發(fā)生某事件是獨(dú)立的條件logistic回歸研究中有N個(gè)配比組,每組中n個(gè)病例配m個(gè)對(duì)照者。這時(shí),各個(gè)研究對(duì)象發(fā)生某事件的概率即為條件概率。適用于配比設(shè)計(jì)的病例-對(duì)照研究精細(xì)分層設(shè)計(jì)的隊(duì)列研究*8/23/202332條件logistic回歸研究中有N個(gè)配比組,每組中n個(gè)病例配logistic回歸的應(yīng)用疾病影響因素的研究校正混雜因素疾病預(yù)后的估計(jì)疾病診斷*8/23/202333logistic回歸的應(yīng)用疾病影響因素的研究*8/3/202疾病影響因素的研究病因?qū)W研究病例-對(duì)照研究隊(duì)列研究影響因素的研究橫斷面調(diào)查臨床試驗(yàn)*8/23/202334疾病影響因素的研究病因?qū)W研究*8/3/202334校正混雜因素一般采用Mantel-Haenszel分層分析分層較細(xì)或存在格子零頻數(shù)時(shí),M-H法無(wú)法采用。logistic回歸分析可綜合校正多個(gè)混雜因素的影響*8/23/202335校正混雜因素一般采用Mantel-Haenszel分層分析*疾病預(yù)后
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- YY/T 1284-2024牙科學(xué)牙科鑷
- 銷(xiāo)售公司業(yè)務(wù)員勞動(dòng)合同協(xié)議
- 房屋按揭共同還款合同樣本2025
- 生態(tài)養(yǎng)殖基地租賃合同
- 特許經(jīng)營(yíng)合同示范文本
- 新能源貨車(chē)租賃合同
- 采購(gòu)合同管理:風(fēng)險(xiǎn)防范與應(yīng)對(duì)措施
- 合作建房借款合同(單位集體住房)
- 度產(chǎn)品試用合同協(xié)議
- 金屬冶煉安全管理課件
- 2025包頭青山賓館有限公司面向社會(huì)公開(kāi)招聘18人筆試參考題庫(kù)附帶答案詳解
- 課件-DeepSeek從入門(mén)到精通
- 2025至2030年中國(guó)毛絨卡通玩具數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年度智能充電樁場(chǎng)地租賃合同范本3篇
- 2024年蕪湖職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文歷年參考題庫(kù)含答案解析
- 心電監(jiān)護(hù)儀的操作及注意事項(xiàng) 課件
- GB/T 718-2024鑄造用生鐵
- 細(xì)胞生物學(xué)(全套1047張課件)
- CFM56-7發(fā)動(dòng)機(jī)滑油系統(tǒng)及其常見(jiàn)故障分析(共41頁(yè))
- 《嵌入式技術(shù)》課程標(biāo)準(zhǔn)(STM32版)
- tplink-mr11u刷openwrt教程
評(píng)論
0/150
提交評(píng)論