第十二章Logistic回歸分析

上傳人：小*** IP屬地：天津上傳時(shí)間：2022-02-14 格式：DOC 頁數(shù)：7 大小：98KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、logit（P）= ln（±）=B o+B * 1 x 1 + , + B n x n第十二章Logistic 回歸分析一、Logistic 回歸概述：Logistic 回歸主要用于篩選疾病的危險(xiǎn)因素、預(yù)后因素或評價(jià)治療措施；通常以疾病的死亡、痊愈等結(jié)果發(fā)生的概率為因變量，以影響疾病發(fā)生和預(yù)后的因素為自變量建立模型。、Logistic回歸的分類及資料類型：第一節(jié)非條件Logistic回歸分析、Logistic回歸模型：Logistic 回歸模型：exp（：i Xi 亠pX p）p 二1 +exp（ Bo + Bi X i i + PpX p）1二、回歸系數(shù)的估計(jì)(參數(shù)估計(jì))：回

2、歸模型的參數(shù)估計(jì)通常利用最大似然估回歸模型的參數(shù)估計(jì)：Logistic 計(jì)法。二、假設(shè)檢驗(yàn)：1. Logistic 回歸方程的檢驗(yàn)：檢驗(yàn)?zāi)Ｐ椭兴凶宰兞空w來看是否與所研究事件的對數(shù)優(yōu)勢比存在線性關(guān)系，也即方程是否成立。檢驗(yàn)的方法有似然比檢驗(yàn)、比分檢驗(yàn)(score test )和Wald檢驗(yàn)(wald test )。上述三種方法中，似然比檢驗(yàn)最可靠。似然比檢驗(yàn)(likehood ratio test ):通過比較包含與不包含某一個(gè)或幾個(gè)待檢驗(yàn)觀察因素的兩個(gè)模型的對數(shù)似然函數(shù)變化來進(jìn)行，其統(tǒng)計(jì)量為 G=-2l n(L)(又稱Devia nee )。無效假設(shè)HO： B =0。當(dāng)H0成立時(shí)，檢

3、驗(yàn)統(tǒng)計(jì)量 G 近似服從自由度為N-P-1的X1亠e分布。當(dāng)G大于臨界值時(shí)，接受H,拒絕無效假設(shè)，認(rèn)為從整體上看適合作Logistic回歸分析，回歸方程成立。2. Logistic 回歸系數(shù)的檢驗(yàn)：為了確定哪些自變量能進(jìn)入方程，還需要對每個(gè)自變量的回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)，判斷其對模型是否有貢獻(xiàn)。檢驗(yàn)方法常用 WaldX檢驗(yàn)，無效假設(shè)H0 B =0。當(dāng)X2大于臨界值時(shí)，拒絕無效假設(shè)，自變量能進(jìn)入方程。3 Logistic 回歸模型的擬合優(yōu)度檢驗(yàn)：Logistic 回歸模型的擬合優(yōu)度檢驗(yàn)是通過比較模型預(yù)測的與實(shí)際觀測的事件發(fā)生與不發(fā)生的頻數(shù)有無差別來進(jìn)行檢驗(yàn)。如果預(yù)測的值與實(shí)際觀測的值越接

4、近，說明模型的擬合效果越好。模型的擬合優(yōu)度檢驗(yàn)方法有偏差檢驗(yàn)(Devia nee )、皮爾遜(pearson )檢驗(yàn)、統(tǒng)計(jì)量(Homser-Lemeshow),分別計(jì)算統(tǒng)計(jì)量 XD Xp、Xl值。統(tǒng)計(jì)量值越小，對應(yīng)的概率越大。無效假設(shè) H0:模型的擬合效果好。模型擬合優(yōu)度信息指標(biāo)有：-2lnL、AIC、SC這3個(gè)指標(biāo)越小表示模型擬合的越好。四、Logistie 回歸模型的預(yù)測準(zhǔn)確度：常用的有以下 2 種：1廣義決定系數(shù)氏：2 預(yù)測準(zhǔn)確率:五、回歸系數(shù)的意義：利用參數(shù)和優(yōu)勢比探討影響因素。當(dāng)B i =0,優(yōu)勢比OR=1時(shí)，表示自變量X對是否出現(xiàn)陽性結(jié)果不存在影響；當(dāng) B i工0,優(yōu)勢比0

5、寺1時(shí)，表示自變量X對是否出現(xiàn)陽性結(jié)果有影響。B i >0，OR增加是危險(xiǎn)因素，B i v0，OR 減小是保護(hù)因素。六、Logistie 回歸分析方法：從所用的方法看，有強(qiáng)迫法、前進(jìn)法、后退法和逐步法。在這些方法中，篩選變量的過程與線性回歸過程的完全一樣。七、Logistie 回歸的應(yīng)用：1醫(yī)學(xué)中 Logistie 回歸主要用于篩選疾病的危險(xiǎn)因素或預(yù)后因素，進(jìn)行病因?qū)W分析2控制和校正混雜因素。第二節(jié) 條件 Logistie 回歸分析(略)第十三章主成分分析與因子分析第一節(jié) 主成分分析1概念：主成分分析是從多個(gè)數(shù)值變量（指標(biāo)）之間的相互關(guān)系入手，利用降維的思想，將多個(gè)變量（指

6、標(biāo)）化為少數(shù)幾個(gè)互不相關(guān)的綜合變量（指標(biāo)）的統(tǒng)計(jì)方法。2主成分線性模型：z1=a11X1+ a 12X2+,+ az2=a21X1+ a 22X2+,+ a1mXm2mXmzJJJm=am1X1+ a m2X2+,+ ammXm主成分分析的基本思想：主成分分析就是設(shè)法將原來眾多具有一定相關(guān)性的指標(biāo)，重新組合成一組新的相互無關(guān)的綜合指標(biāo)，來代替原來指標(biāo)。通常數(shù)學(xué)上的處理就是將原來 k 個(gè)指標(biāo)做線性組合，作為新的綜合指標(biāo)，（即幾個(gè) Z1、Z2, Zm）。如果將第一個(gè)線性組合即第一個(gè)綜合指標(biāo)記為乙，則希望Z1盡可能多地反映原來指標(biāo)的信息，這里的方法就是用方差來表達(dá)，即（Z1）S2

7、Z1 方差越大，表示乙包含的信息越多。因此，在所有的線性組合中所選取的乙應(yīng)該是方差最大的，故稱 Z1 為第一主成分。第一主成分不足以代表原來 K個(gè)指標(biāo)的信息時(shí)，再考慮選取Z2,乙已有的信息不需要再出現(xiàn)在乙中。以此類推可以構(gòu)造出第三，四個(gè)主成分， , 。這些主成分不僅不相關(guān)，而且他們的方差依次遞減。因此在實(shí)際工作中，就挑選前幾個(gè)最大主成分。3主成分分析步驟：（1）對原始指標(biāo)進(jìn)行標(biāo)準(zhǔn)化；（2）求協(xié)方差或相關(guān)矩陣；（3）求出協(xié)方差矩陣的特征根和特征向量；（4）確定主成分，并結(jié)合專業(yè)知識(shí)給各個(gè)主成分的信息給予解釋4主成分的性質(zhì)：（1）各主成分互不相關(guān) , 兩個(gè)主成分間相關(guān)系數(shù)等于零；（2）

8、各主成分的方差依次遞減；Szi> Sz2> Sz3, > Szn> 0（3）總方差保持不變。即各個(gè)原指標(biāo)的方差之和與各主成分的方差之和相等。2 2 2 ( 4) ai1 +ai2 +, +aim =15主成分模型中的統(tǒng)計(jì)量：(1) 特征根(值)入：表示主成分Z的方差。它是主成分影響力度的指標(biāo), 代表某主成分可以解釋平均多少原始變量信息。(2) 貢獻(xiàn)率：表示某主成分的方差在全部方差中的比重。貢獻(xiàn)率越大,表示該主成分綜合原變量的能力越強(qiáng)。貢獻(xiàn)率=入/工入( 3)累計(jì)貢獻(xiàn)率：表示前幾個(gè)主成分累計(jì)提取原變量多少信息。前幾個(gè)主成分累計(jì)貢獻(xiàn)率越大,表示包含原變量的信息越多。累

9、計(jì)貢獻(xiàn)率=2 (入/工入)(4) 特征向量(因子載荷、因子負(fù)載)a：實(shí)質(zhì)是公因子F與變量X的相關(guān) 系數(shù)，表示變量X依賴因子F的程度，反映變量X對公因子F的重要性。在主成分分析中，可理解為反映主成分Z與變量X之間的相關(guān)系數(shù)，反映兩者間相關(guān)密切程度。a = r5. 主成分個(gè)數(shù)：(1) 以累計(jì)貢獻(xiàn)率確定：大于 7080% ( 2)以特征值確定：大于 1 則保留。第二節(jié) 因子分析1 概念：因子分析是從分析多個(gè)原始指標(biāo)的相關(guān)關(guān)系入手，找出支配這種相關(guān)關(guān)系的有限個(gè)不可觀測的潛在變量，并用這些潛在變量來解釋原始指標(biāo)之間相關(guān)性或協(xié)方差關(guān)系。1 ）因子線性模型：Xi=aii Fi+ a 12F2+,+

10、 a inFm+ £ 1X?=92lFl + a 22F2+,+ a 2mF m+ £ 2Xm=am1F 1+ a m2 F 2+,+ ammFm+£其中：x為變量指標(biāo)。 a 為因子載荷。 F為公因子。為特殊因子，代表公因子以外的影響因素(2) 因子線性模型特點(diǎn)：因子線性模型不受量綱的影響；因子載荷不是唯一的，通過因子軸旋轉(zhuǎn)，可得到新的因子載荷陣。(3) 模型要求：各X、各公因子F的均數(shù)均為0,方差均為1;各特殊因子&的均數(shù)為0;各公因子之間的相關(guān)系數(shù)、各特殊因子之間的相關(guān)系數(shù)、各公因子與各特殊因子之間的相關(guān)系數(shù)均為 0。2. 因子模型中的統(tǒng)計(jì)量：(

11、1) 公共度(公因子方差)：h2=X a2,反映全體公因子對原始指標(biāo) X的影響，或反映原始指標(biāo)X對全體公因子的依賴程度，表示各變量中原始信息被公因子表示的程度。公共度取值范圍在 0和1 之間，當(dāng)公共度接近 0時(shí)，表示原始指標(biāo) X 受公因子的影響不大。(2) KMO僉驗(yàn)：用于檢驗(yàn)變量間的偏相關(guān)性，取值范圍在0和1之間，當(dāng) 統(tǒng)計(jì)量越接近 1 時(shí)，變量的間偏相關(guān)性越強(qiáng)，因子分析效果越好。(3) 因子旋轉(zhuǎn)：因子旋轉(zhuǎn)的目的是使某些變量在某個(gè)因子上的負(fù)載較高，而在其它因子上的負(fù)載則顯著的低，這事實(shí)上是依據(jù)因子對變量進(jìn)行更好的“聚類”。為使因子載荷矩陣中系數(shù)更加明顯，對初始因子載荷矩陣進(jìn)行旋轉(zhuǎn)，

12、使得因子和原始變量間的關(guān)系重新分配，相關(guān)系數(shù)向 0-1 分化，使得各因子的意義更加明顯。正交旋轉(zhuǎn)( orthogonal rotation )和斜交旋轉(zhuǎn)( oblique rotation )是因子旋轉(zhuǎn)的兩類方法。3計(jì)算并檢驗(yàn)協(xié)方差(相關(guān))矩陣因子分析基于變量間的協(xié)方差矩陣。換言之，包含在因子分析中的變量必須具有一定的相關(guān)性，如果變量間不存在相關(guān)，或者相關(guān)性很小，那么因子分析將不是一種合適的分析方法。檢驗(yàn)方法：巴特利特球體檢驗(yàn)和KMOffl度。巴特利特球體檢驗(yàn)( Bartlett 's test of sphericity )可以用來檢驗(yàn)變量間是否存在相關(guān)。

13、它是一種建立在協(xié)方差陣是單位陣 (即變量間不相關(guān)) 的假設(shè) 基礎(chǔ)之上的檢驗(yàn)。一個(gè)大的檢驗(yàn)值通常意味著檢驗(yàn)結(jié)果的顯著性，因此可以拒絕原假設(shè)，可以進(jìn)行因子分析，否則應(yīng)該慎重考慮。«皿0度(Kaiser-Meyer-Olkin measure of sampling adequacy) ，它比較了觀測到的變量間的相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小。一個(gè)大的kmOM度值同樣支持我們進(jìn)行因子分析。一般而言，KMO測度0.5意味著因子分析可以進(jìn)行，而在 0.7 以上則是令人滿意的值。選擇因子分析的方法( method of factor analysis ) 主成分分析法( principa

14、l component analysis )和公因子分析法( common factor analysis )是兩種主要的尋找公因子的方法。5. 各公因子的表達(dá)式：F1=a11X1+ a 12X2+,+ a 1mXmF2=a21X1+ a 22X2+,+ a 2mXmF m=am1X1+ a m2X2+,+ ammXm因子得分 : 如果后續(xù)分析需要，如進(jìn)行回歸分析等等，通常需要進(jìn)一步計(jì)算各公因子的因子得分。即給出各因子在每一個(gè)案例(case )上的值。6. 模型的適合度 :因子分析的最后，應(yīng)該對構(gòu)建的模型是否適合問題本身有一個(gè)認(rèn)識(shí)，這就涉及到模型的適合度的判斷。這種判斷常常基于殘差矩陣而進(jìn)行。因子模型建立，有了因子負(fù)載后，我們就可以計(jì)算的觀測變量的方差 - 協(xié)方差陣，這種由公因子再生的方差 -協(xié)方差陣( repro

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第十二章Logistic回歸分析

文檔簡介

溫馨提示

最新文檔

評論

第十二章Logistic回歸分析

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔