因變量是定性變量的回歸分析—Logistic回歸分析_第1頁
因變量是定性變量的回歸分析—Logistic回歸分析_第2頁
因變量是定性變量的回歸分析—Logistic回歸分析_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、因變量是定性變量的回歸分析一Logistic回歸分析一、從多元線性回歸到 Logistic回歸例 這是200個不同年齡和性別的人對某項效勞產(chǎn)品的認可的數(shù)據(jù)logi.sav.其中:年齡是連續(xù)變量,性別是有男和女分別用1和0表示兩個水平的定性變 量,而變量“觀點那么為包含認可用1表示和不認可用0表示兩個水平的定性 變量.從這張圖可以看出什么呢從這張圖又可以看出什么呢這里觀點是因變量,只有兩個值;所以可以把它看作成功概率為 p的Bernoulli試 驗的結(jié)果.但是和單純的Bernoulli試驗不同,這里的概率p為年齡和性別的 函數(shù).必須應(yīng)用Logistic回歸.二、多元線性回歸不能應(yīng)用于定性因變量的

2、原因首先,多元線性回歸中使用定性因變量嚴(yán)重違反本身假設(shè)條件,即 :因變量只能取兩個值時,對于任何給定的自變量值,e本身也只能取兩個值.這必然會違背線性回歸中關(guān)于誤差項 e的假設(shè)條件.其次,線性概率概型及其問題:由于因變量只有兩個值;所以可以把它看作成功概率p,取值范圍必然限制在0 1的區(qū)間中,然而線性回歸方程不能做到.另外概率發(fā)生的情況也不是線性的.三、Logistic函數(shù)Logistic的概率函數(shù)定義為:我們將多元線性組合表示為:于是,Logistic概率函數(shù)表示為:經(jīng)過變形,可得到線性函數(shù):這里,事件發(fā)生概率=P y=1事件不發(fā)生概率=1-P y=0發(fā)生比:odds =-p- j1 - P

3、=log it( p)對數(shù)發(fā)生比:10g(odds) = ln IP:(1- P) 一這樣,就可將logistic曲線線性化為:從P到logit P經(jīng)歷了兩個步驟變換過程:第一步:將p轉(zhuǎn)換成發(fā)生比,其值域為0到無窮第二步:將發(fā)生比換成對數(shù)發(fā)生比,其值域科為I-:十30 經(jīng)過轉(zhuǎn)換,將P-logit P,在將其作為回歸因變量來解釋就不再有任何值域方面的限制了,即可線性化!四、Logistic回歸系數(shù)的意義以logit P方程的線性表達式來解釋回歸系數(shù),即:在logistic回歸的實際研究中,通常不是報告自變量對P的作用,而是報告自變量對logit P的作用.以發(fā)生比.的指數(shù)表達式來解釋回歸系數(shù)與l

4、ogit P不同,發(fā)生比.具有一定的實際意義,代表一種相對風(fēng)險.因此對logistic回歸系數(shù)的解釋 通常是從發(fā)生比的指數(shù)表達式出發(fā)的.例如:在取得了 logistic回歸系數(shù)的各bi的解以后,將其帶入Q函數(shù),如果分析x變化一個單位對于Q的影響幅度,可以用(x +1)表示,并將其代入 上式,得到新的發(fā)生比將兩個發(fā)生比集中在一起有:將此稱為發(fā)生比率,它可測量自變量一個單位的增加給原來的發(fā)生比所帶來的 變化,一般表達式為:八=exp(h)說明在其他情況不變的情況下,x 一個單位的變化使原來的發(fā)生比擴大exo(bi)倍.比方,原來的.為6:4(比值為1.5),如果一個自變量變化一個單位導(dǎo)致的發(fā)生比

5、率為exp(0.693)=2,即表小這一變化將會導(dǎo)致新發(fā)生比值Q為原來的2倍,即新發(fā)生比將是12:4(比值為3).我們也可用發(fā)生比率減1的差來表示發(fā)生比的增長率,如發(fā)生比率為2.3,就可 以說自變量一個單位的變化會使原發(fā)生比增加1.3倍(2.3-1=1.3).當(dāng)logistic回歸系數(shù)為負數(shù)時,發(fā)生比率小于1.這時的表達要特別小心.比方發(fā)生比率為0.8時,表示新發(fā)生比只有原來的80%,那么下降的倍數(shù)那么是 (1-0.8=)0.2.五、Logistic回歸應(yīng)用以上例為例,說明logistic回歸分析SPSS選項: Analyze Regression Binary logisticLogisti

6、c回歸的SPSS輸出結(jié)果六、Logistic模型的檢驗與評價1.對于整體模型的檢驗Logistic回歸方程求解參數(shù)是采用 最大似然估計方法,因此其回歸方程的整體檢 驗通過似然函數(shù)值,表示為:-2 Log Likelihood該值越大,意味著回歸方程的似然值越小,模型的擬和程度越差.反之,擬和 程度越好.在評價或檢驗一個含有自變量的Logistic回歸模型時,通常是將其含有自變量的Logistic的-2 Log Likelihood與截距模型的相比擬.兩者之差服從卡方分布,進 行卡方檢驗.所謂截距模型,就是將所有自變量刪除后只剩一個截距系數(shù)的模型.2.對于回歸系數(shù)的檢驗Logistic回歸系數(shù)的檢驗是用Wald統(tǒng)計量進行的.七、Logistic回歸的標(biāo)準(zhǔn)化回歸系數(shù)SPSS進行Logistic回歸時不提供標(biāo)準(zhǔn)化回歸系數(shù),但是其手工計算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論