logistic回歸方程_第1頁(yè)
logistic回歸方程_第2頁(yè)
logistic回歸方程_第3頁(yè)
logistic回歸方程_第4頁(yè)
logistic回歸方程_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Logistic 回歸:實(shí)際上屬于判別分析,因擁有很差的判別效率而不常用。1 應(yīng)用范圍: 適用于流行病學(xué)資料的危險(xiǎn)因素分析 實(shí)驗(yàn)室中藥物的劑量 - 反應(yīng)關(guān)系 臨床試驗(yàn)評(píng)價(jià) 疾病的預(yù)后因素分析2 Logistic 回歸的分類(lèi): 按因變量的資料類(lèi)型分:二分類(lèi)多分類(lèi) 其中二分較為常用 按研究方法分:條 件 Logistic 回歸非條件 Logistic 回歸 兩者針對(duì)的資料類(lèi)型不一樣,后者針對(duì)成組研究,前者針對(duì)配對(duì)或配伍研究。3 Logistic 回歸的應(yīng)用條件是: 獨(dú)立性。各觀測(cè)對(duì)象間是相互獨(dú)立的; LogitP 與自變量是線性關(guān)系; 樣本量。經(jīng)驗(yàn)值是病例對(duì)照各 50 例以上或?yàn)樽宰兞康?5-10

2、 倍(以 10 倍為宜),不 過(guò)隨著統(tǒng)計(jì)技術(shù)和軟件的發(fā)展,樣本量較小或不能進(jìn)行似然估計(jì)的情況下可采用精確 logistic 回歸分析,此時(shí)要求分析變量不能太多,且變量分類(lèi)不能太多; 當(dāng)隊(duì)列資料進(jìn)行 logistic 回歸分析時(shí), 觀察時(shí)間應(yīng)該相同, 否則需考慮觀察時(shí)間的 影響(建議用 Poisson 回歸)。4擬和 logistic 回歸方程的步驟: 對(duì)每一個(gè)變量進(jìn)行量化,并進(jìn)行單因素分析; 數(shù)據(jù)的離散化,對(duì)于連續(xù)性變量在分析過(guò)程中常常需要進(jìn)行離散變成等級(jí)資料???采用的方法有依據(jù)經(jīng)驗(yàn)進(jìn)行離散, 或是按照四分、 五分位數(shù)法來(lái)確定等級(jí), 也可采用聚類(lèi)方 法將計(jì)量資料聚為二類(lèi)或多類(lèi),變?yōu)殡x散變量。

3、 對(duì)性質(zhì)相近的一些自變量進(jìn)行部分多因素分析,并探討各自變量(等級(jí)變量,數(shù)值 變量)納入模型時(shí)的適宜尺度,及對(duì)自變量進(jìn)行必要的變量變換; 在單變量分析和相關(guān)自變量分析的基礎(chǔ)上,對(duì)PW a (常取0.2 , 0.15或0.3 )的變量,以及專(zhuān)業(yè)上認(rèn)為重要的變量進(jìn)行多因素的逐步篩選;模型程序每擬合一個(gè)模型將給出多個(gè)指標(biāo)值,供用戶判斷模型優(yōu)劣和篩選變量??梢圆捎秒p向篩選技術(shù):a進(jìn)入變量的篩選用score統(tǒng)計(jì)量或G統(tǒng)計(jì)量或LRS(似然比統(tǒng)計(jì)量),用戶確定P值臨界值如:0.05、0.1或0.2, 選擇統(tǒng)計(jì)量顯著且最大的變量進(jìn)入模型;b剔除變量的選擇用 Z統(tǒng)計(jì)量(Wald統(tǒng)計(jì)量),用戶確定其P值 顯著性水平

4、,當(dāng)變量不顯者,從模型中予以剔除。 這樣,選入和剔除反復(fù)循環(huán), 直至無(wú)變量選入,也無(wú)變量刪除為止,選入或剔除的顯著界值的確定要依具體的問(wèn)題和變量的多寡而定,一般地,當(dāng)納入模型的變量偏多,可提高選入界值或降低剔除標(biāo)準(zhǔn),反之, 則降低選入界值、提高刪除標(biāo)準(zhǔn)。但篩選標(biāo)準(zhǔn)的不同會(huì)影響分析結(jié)果,這在與他人結(jié)果比較時(shí)應(yīng)當(dāng)注意。 在多因素篩選模型的基礎(chǔ)上,考慮有無(wú)必要納入變量的交互作用項(xiàng);兩變量間的交互作用為一級(jí)交互作用,可推廣到二級(jí)或多級(jí)交互作用,但在實(shí)際應(yīng)用中,各變量最好相互獨(dú)立(也是模型本身的要求),不必研究交互作用,最多是研究少量的一級(jí)交互作用。 對(duì)專(zhuān)業(yè)上認(rèn)為重要但未選入回歸方程的要查明原因。5.回

5、歸方程擬合優(yōu)劣的判斷(為線性回歸方程判斷依據(jù),可用于logistic回歸分析) 決定系數(shù)(R2)和校正決定系數(shù)(尺),可以用來(lái)評(píng)價(jià)回歸方程的優(yōu)劣。於隨著自變量個(gè)數(shù)的增加而增加,所以需要校正;校正決定系數(shù)(;)越大,方程越優(yōu)。但亦有研究指出r2是多元線性回歸中經(jīng)常用到的一個(gè)指標(biāo),表示的是因變量的變動(dòng)中由模型中自變量 所解釋的百分比,并不涉及預(yù)測(cè)值與觀測(cè)值之間差別的問(wèn)題,因此在logistic 回歸中不適合。G無(wú)法用SPSS C p選擇法:選擇 G最接近p或p+ 1的方程(不同學(xué)者解釋不同)(甘2丙=直接計(jì)算,可能需要手工。1964年CL Mallows提出:(旳 2嚴(yán))Cp 接近(p+1)的模型

6、為最佳,其中 p為方程中自變量的個(gè)數(shù),m為自變量總個(gè)數(shù)。 AIC 準(zhǔn)則:1973年由日本學(xué)者赤池提出AIC計(jì)算準(zhǔn)則,AIC越小擬合的方程越好。AIC = / In(堆一戸”浮身世.戶H 2戸2在logistic回歸中,評(píng)價(jià)模型擬合優(yōu)度的指標(biāo)主要有Pearson x、偏差(devianee) 、Hosmer-2Lemeshow (HL)指標(biāo)、Akaike 信息準(zhǔn)則(AIC)、SC指標(biāo)等。Pearson x、偏差(devianee)主 要用于自變量不多且為分類(lèi)變量的情況,當(dāng)自變量增多且含有連續(xù)型變量時(shí),用HL指標(biāo)則更為恰當(dāng)。Pearson %2、偏差(devia nee)、Hosmer- Leme

7、show(HL)指標(biāo)值均服從 x 2 分布, x 2檢驗(yàn)無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)表示模型擬合的較好,x 2檢驗(yàn)有統(tǒng)計(jì)學(xué)意義(PW 0.05)則表示模型擬合的較差。AIC和SC指標(biāo)還可用于比較模型的優(yōu)劣,當(dāng)擬合多個(gè)模型時(shí),可以將不同模型按其AIC和SC指標(biāo)值排序,AIC和SC值較小者一般認(rèn)為擬合得更好。6擬合方程的注意事項(xiàng): 進(jìn)行方程擬合對(duì)自變量篩選采用逐步選擇法前進(jìn)法(forward )、后退法(backward )、逐步回歸法( stepwise ) 時(shí),引入變量的檢驗(yàn)水準(zhǔn)要小于或等于剔除變量的檢驗(yàn)水準(zhǔn); 小樣本檢驗(yàn)水準(zhǔn) a定為0.10或0.15,大樣本把a(bǔ)定為0.05。值越小說(shuō)明

8、自變量 選取的標(biāo)準(zhǔn)越嚴(yán); 在逐步回歸的時(shí)可根據(jù)需要放寬或限制進(jìn)入方程的標(biāo)準(zhǔn),或硬性將最感興趣的研究 變量選入方程; 強(qiáng)影響點(diǎn)記錄的選擇: 從理論上講, 每一個(gè)樣本點(diǎn)對(duì)回歸模型的影響應(yīng)該是同等的, 實(shí)際并非如此。 有些樣本點(diǎn)(記錄)對(duì)回歸模型影響很大。 對(duì)由過(guò)失或錯(cuò)誤造成的點(diǎn)應(yīng)刪去, 沒(méi)有錯(cuò)誤的強(qiáng)影響點(diǎn)可能和自變量與應(yīng)變量的相關(guān)有關(guān),不可輕易刪除。 多重共線性的診斷(SPSS中的指標(biāo)):a容許度:越近似于 0,共線性越強(qiáng);b特征 根:越近似于 0,共線性越強(qiáng); e 條件指數(shù):越大,共線性越強(qiáng); 異常點(diǎn)的檢查:主要包括特異點(diǎn) (outher) 、高杠桿點(diǎn) (high leverage points

9、) 以及強(qiáng)影響點(diǎn) (influential points) 。 特異點(diǎn)是指殘差較其他各點(diǎn)大得多的點(diǎn);高杠桿點(diǎn)是指 距離其他樣品較遠(yuǎn)的點(diǎn); 強(qiáng)影響點(diǎn)是指對(duì)模型有較大影響的點(diǎn), 模型中包含該點(diǎn)與不包含該 點(diǎn)會(huì)使求得的回歸 系數(shù)相差很大。 單獨(dú)的特異點(diǎn)或高杠桿點(diǎn)不一定會(huì)影響回歸系數(shù)的估計(jì), 但如果既是特異點(diǎn)又是高杠桿點(diǎn)則很可能是一個(gè)影響回歸方程的“有害”點(diǎn)。對(duì)特異點(diǎn)、 高杠桿點(diǎn)、 強(qiáng)影響點(diǎn)診斷的指標(biāo)有 Pearson 殘差、 Devianee 殘差、杠桿度統(tǒng)計(jì)量 H( hat matrix diagnosis )、 Cook 距離、 DFBETA、 Seore 檢驗(yàn)統(tǒng)計(jì)量等。這五個(gè)指標(biāo)中, Pear

10、son 殘差、 Devianee 殘差可用來(lái)檢查特異點(diǎn),如果某觀測(cè)值的殘差值 >2,則可認(rèn)為是一個(gè)特異點(diǎn)。杠 桿度統(tǒng)計(jì)量 H 可用來(lái)發(fā)現(xiàn)高杠桿點(diǎn), H 值大的樣品說(shuō)明距離其他樣品較遠(yuǎn),可認(rèn)為是一個(gè) 高杠桿點(diǎn)。Cook距離、DFBETA指標(biāo)可用來(lái)度量特異點(diǎn)或高杠桿點(diǎn)對(duì)回歸模型的影響程度。Cook 距離是標(biāo)準(zhǔn)化殘差和杠桿度兩者的合成指標(biāo),其值越大,表明所對(duì)應(yīng)的觀測(cè)值的影響越大。DFBETA指標(biāo)值反映了某個(gè)樣品被刪除后logistic回歸系數(shù)的變化,變化越大(即DFBETA指標(biāo)值越大),表明該觀測(cè)值的影響越大。如果模型中檢查出有特異點(diǎn)、高杠桿點(diǎn) 或強(qiáng)影響點(diǎn),首先應(yīng)根據(jù)專(zhuān)業(yè)知識(shí)、 數(shù)據(jù)收集的情況

11、,分析其產(chǎn)生原因后酌情處理。如來(lái)自 測(cè)量或 記錄錯(cuò)誤,應(yīng)剔除或校正,否則處置就必須持慎重態(tài)度,考慮是否采用新的模型, 而不能只是簡(jiǎn)單地刪除就算完事。因?yàn)樵谠S多場(chǎng)合,異常點(diǎn)的出現(xiàn)恰好是我們探測(cè)某些事先不清楚的或許更為重要因素的線索。7回歸系數(shù)符號(hào)反常與主要變量選不進(jìn)方程的原因: 存在多元共線性; 有重要影響的因素未包括在內(nèi); 某些變量個(gè)體間的差異很大; 樣本內(nèi)突出點(diǎn)上數(shù)據(jù)誤差大; 變量的變化范圍較??; 樣本數(shù)太少。8參數(shù)意義 Logistic回歸中的常數(shù)項(xiàng)(bo)表示,在不接觸任何潛在危險(xiǎn)/保護(hù)因素條件下,效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件的概率之比的對(duì)數(shù)值。 Logistic回歸中的回歸系數(shù)(bi)表示,其它所有自變量固定不變,某一因素改變一個(gè)單位時(shí),效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件的概率之比的對(duì)數(shù)變化值,即OR或RR的對(duì)數(shù)值。需要指出的是,回歸系數(shù)3的大小并不反映變量對(duì)疾病發(fā)生的重要性,那么哪種因素對(duì)模型貢獻(xiàn)最大即與疾病聯(lián)系最強(qiáng)呢 ? (InL (t-1) -InL (t) )三種方法結(jié)果基本一致。 存在因素間交互作用時(shí), Logistic 回歸系數(shù)的解釋變得更為復(fù)雜,應(yīng)特別小心。 模型估計(jì)出OR當(dāng)發(fā)病率較低時(shí),O慶RR因此發(fā)病率高的疾病資料不適合使用該 模型。另外, Logistic 模型不能利用隨訪研

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論