版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第11章
邏輯回歸1第11章邏輯回歸分析——目錄11.1邏輯回歸模型11.2估計(jì)邏輯回歸模型11.3顯著性檢驗(yàn)11.4回歸系數(shù)的含義11.5案例分析2許多社會(huì)科學(xué)問題中的因變量往往是分類變量。比如,政治學(xué)中經(jīng)常研究的是否選舉某候選人,候選人的類型等;又如,經(jīng)濟(jì)學(xué)研究中所涉及的是否銷售或購(gòu)買某種商品、是否簽訂一份合同,保險(xiǎn)是否違約,違約有哪些類型等等。這些分類變量中有一類特殊的變量,遵循二值取值原則,要么“是”或“發(fā)生”,要么“否”或“未發(fā)生”。統(tǒng)計(jì)上我們將這樣的變量稱作二分類變量(Binaryvariable)。3應(yīng)用背景多元回歸模型分析二分類變量的局限性被解釋變量的取值區(qū)間受限制自變量的邊際分析不符合實(shí)際分析二分類變量的方法利用概率轉(zhuǎn)化模型調(diào)整二分類變量使其線性化,也即,使其隨著自變量的變化,這一概率的值總是在0到1之間變化。11.1邏輯回歸模型Logistic函數(shù)Logistic回歸方程11.1邏輯回歸模型——概率轉(zhuǎn)換方法
似然函數(shù)其中,11.2估計(jì)邏輯回歸模型——最大似然估計(jì)追求似然函數(shù)最大值的過(guò)程就是追求對(duì)數(shù)似然函數(shù)值最大值的過(guò)程。對(duì)數(shù)似然函數(shù)值越大,意味著模型較好地?cái)M合樣本數(shù)據(jù)的可能性也越大,所得模型的擬合優(yōu)度越高。整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)
整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)判錯(cuò)矩陣預(yù)測(cè)值01正確率觀測(cè)值01總體正確率判錯(cuò)矩陣是一種極為直觀的評(píng)價(jià)模型優(yōu)劣的方法,它通過(guò)矩陣表格的形式展現(xiàn)預(yù)測(cè)值與實(shí)際觀測(cè)值的吻合程度。整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)Cox&SnellR2統(tǒng)計(jì)量Cox&SnellR2統(tǒng)計(jì)量與一般線性回歸分析中的R2有相似之處,也是方程對(duì)被解釋變量變差解釋程度的反映。缺點(diǎn)是取值范圍不易確定,因此使用時(shí)不方便。NagelkerkeR2統(tǒng)計(jì)量Cox&SnellR2統(tǒng)計(jì)量取值在0~1之間,越接近1說(shuō)明方程的擬合優(yōu)度越高?;貧w系數(shù)的顯著性檢驗(yàn)
11.3顯著性檢驗(yàn)
Wald統(tǒng)計(jì)量多重共線性檢驗(yàn)
應(yīng)當(dāng)注意,如果解釋變量存在多重共線性會(huì)對(duì)Wald檢驗(yàn)統(tǒng)計(jì)量產(chǎn)生影響。由于用于logistic回歸建模的很多軟件包,如
Excel,SPSS,和R并不提供共線性的問題檢驗(yàn),所以如果用戶想檢驗(yàn)共線性問題,可以就給定的自變量做一個(gè)線性回歸模型,并輸出共線性診斷指標(biāo),就可以了解自變量的相關(guān)情況。11.4邏輯回歸系數(shù)的意義平均個(gè)人偏效應(yīng)和平均偏效應(yīng)Logistic回歸模型的解釋涉及到對(duì)建立回歸方程所包含的自變量的分析。也即,我們常常想估計(jì)xi對(duì)響應(yīng)概率P(y=1|X)的影響。若xi是(大致)連續(xù)的,則對(duì)xi的較小變化,有:比例因子
11.4邏輯回歸系數(shù)的意義平均個(gè)人偏效應(yīng)和平均偏效應(yīng)
平均個(gè)人偏效應(yīng)表示將每個(gè)解釋變量都代之以樣本平均值而得到常數(shù)比例因子,利用該常數(shù)比例因子乘以對(duì)應(yīng)的xi的系數(shù)βi
即得到平均個(gè)人偏效應(yīng)。數(shù)學(xué)表達(dá)式為:平均個(gè)人偏效應(yīng)(PEA)平均偏效應(yīng)表示將樣本中所有個(gè)體的偏效應(yīng)取平均而得到常數(shù)比例因子。數(shù)學(xué)表達(dá)式為:平均偏效應(yīng)(PEA)11.4邏輯回歸系數(shù)的意義
根據(jù)平均個(gè)人偏效應(yīng)的定義,將年齡的樣本均值40.00代入公式可計(jì)算年齡對(duì)購(gòu)買該產(chǎn)品響應(yīng)概率影響的平均個(gè)人偏效應(yīng)PEA;將根據(jù)個(gè)人偏效應(yīng)的定義,將年齡的樣本所有取值代入公式可得年齡對(duì)購(gòu)買該產(chǎn)品響應(yīng)概率影響的個(gè)人偏效應(yīng)APE。
由于logistic模型中,自變量與響應(yīng)概率之間的關(guān)系是非線性的,因此平均個(gè)人偏效應(yīng)和平均偏效應(yīng)存在差異。11.4邏輯回歸系數(shù)的意義發(fā)生比Logistic回歸模型的解釋涉及到對(duì)建立回歸方程所包含的自變量的分析。利用logistic回歸,直接解釋自變量和y=1的概率之間的關(guān)系非常困難,統(tǒng)計(jì)學(xué)上,通過(guò)定義發(fā)生比和比值比對(duì)logistic回歸方程做出解釋。發(fā)生比
發(fā)生比被定義為事件將要發(fā)生的概率與該事件將不會(huì)發(fā)生的概率之比。11.4邏輯回歸系數(shù)的意義比值比比值比(Oddsratio)度量了當(dāng)一組自變量中只有一個(gè)自變量增加了一個(gè)單位時(shí)對(duì)事件發(fā)生概率(Odds)的影響。比值比是當(dāng)給定的一組自變量中一個(gè)自變量增加了一個(gè)單位,y=1發(fā)生概率(Odds1)除以該組自變量的值都沒有變化時(shí)y=1發(fā)生概率(Odds0)
比值比(Oddsratio)11.4邏輯回歸系數(shù)的意義
此時(shí),我們想要知道去年消費(fèi)支出為2萬(wàn)元,且擁有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比與去年消費(fèi)支出為2萬(wàn)元,但沒有信用卡額度顧客使用優(yōu)惠券的機(jī)會(huì)比精細(xì)比較,也即,當(dāng)解釋變量x2增加一個(gè)單位時(shí)的影響:
因此,去年消費(fèi)支出為2萬(wàn)元,且擁有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比是去年消費(fèi)支出為2萬(wàn)元,但沒有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比的3倍。11.5案例分析一、案例背景
某商品銷售人員在長(zhǎng)期推銷該產(chǎn)品的過(guò)程中發(fā)現(xiàn),消費(fèi)者是否購(gòu)買該產(chǎn)品受到很強(qiáng)的消費(fèi)者人口結(jié)構(gòu)特征的影響。比如性別、年齡以及收入水平。為了驗(yàn)證自己的猜想,以及在未來(lái)的銷售活動(dòng)中能更好的,有針對(duì)性的,對(duì)可能購(gòu)買該產(chǎn)品的顧客提供更好的服務(wù)。經(jīng)與銷售主管的商議,該銷售團(tuán)隊(duì)對(duì)到達(dá)商鋪的顧客進(jìn)行隨機(jī)的問卷調(diào)查,并對(duì)顧客最終是否購(gòu)買該產(chǎn)品做了詳細(xì)的記錄。對(duì)數(shù)據(jù)進(jìn)行初步的整理以后,團(tuán)隊(duì)成員計(jì)劃通過(guò)運(yùn)用logistic回歸的方法來(lái)檢驗(yàn)消費(fèi)者人口特征對(duì)其是否購(gòu)買該產(chǎn)品的影響。11.5案例分析二、數(shù)據(jù)及其說(shuō)明剔除無(wú)效樣本,并對(duì)數(shù)據(jù)進(jìn)行編碼后發(fā)現(xiàn),收集到有效樣本431份。數(shù)據(jù)項(xiàng)包括:是否購(gòu)買(purchase)、性別(gender)、年齡(age)、收入水平(income)。是否購(gòu)買作為被解釋變量(0/1二分類變量),其余各變量作為解釋變量,且其中性別和收入水平為類別變量,年齡為數(shù)值型變量。11.5案例分析三、數(shù)據(jù)分析表11-4分類表a,b
已觀測(cè)已預(yù)測(cè)
是否購(gòu)買百分比校正
不購(gòu)買購(gòu)買步驟0是否購(gòu)買不購(gòu)買2690100.0購(gòu)買1620.0總計(jì)百分比
62.4a.模型中包括常量。b.切割值為.50011.5案例分析三、數(shù)據(jù)分析表11-5方程中的變量
BS.E,WalsdfSig.Exp(B)EXP(B)的95%C.I.下限上限步驟1aage.025.0181.9741.1601.026.9901.062gender.511.2095.9541.0151.6671.1062.513income
12.3052.002
income(1)-.787.2539.6761.002.455.277.748income(2)-.686.2437.9451.005.503.312.811常量-1.836.7865.4571.019.159
a.在步驟1中輸入的變量:age,gender,income.
11.5案例分析三、結(jié)論
通過(guò)運(yùn)用logistic
回歸分析的方法發(fā)現(xiàn),消費(fèi)者是否購(gòu)買該產(chǎn)品顯著的受到性別和收入水平的影響。其中女性消費(fèi)者比男性消費(fèi)者更青睞于購(gòu)買該產(chǎn)品。此外,該產(chǎn)品更適合于低收入群體,因?yàn)橹小?/p>
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年粗糙度測(cè)試儀資金申請(qǐng)報(bào)告
- 2023年多譜勒天氣雷達(dá)資金申請(qǐng)報(bào)告
- DB14T-玉米穗青貯飼料生產(chǎn)技術(shù)規(guī)程
- 工程目標(biāo)管理承包責(zé)任書范文
- 法理考卷分章節(jié)習(xí)題
- 《 云服務(wù)提供商的合作博弈研究》
- 《基于心一腎一子宮軸理論指導(dǎo)下雷火灸結(jié)合子午流注開穴法治療腎虛血瘀型慢性盆腔炎患者的個(gè)案報(bào)告》
- 2024義務(wù)教育信息科技新課標(biāo)2022版考試真題庫(kù)附含答案
- 2024小學(xué)語(yǔ)文新課程2022版標(biāo)準(zhǔn)測(cè)試題【含答案】
- 北師大版小學(xué)數(shù)學(xué)四年級(jí)上冊(cè)線與角《角的度量(一)》示范教學(xué)課件
- 技術(shù)監(jiān)督工作計(jì)劃共3篇
- 水痘和帶狀皰疹課件
- 第二期問卷數(shù)據(jù)對(duì)比分析
- 公司安全環(huán)保信息管控平臺(tái)運(yùn)行管理制度
- 2022年通信工程師中級(jí)考試終端與業(yè)務(wù)簡(jiǎn)答
- 《緬懷先烈牢記歷史勿忘國(guó)恥》主題班會(huì)課件
- 質(zhì)量計(jì)劃保證大綱編制方案
- 軟件培訓(xùn)與服務(wù)方案
- 弘揚(yáng)長(zhǎng)征精神PPT二萬(wàn)五千里長(zhǎng)征勝利87周年學(xué)習(xí)PPT課件(帶內(nèi)容)
- 人民幣教具正反面完美打印版
- 《長(zhǎng)襪子皮皮》閱讀推進(jìn)課
評(píng)論
0/150
提交評(píng)論