市場(chǎng)研究定量分析:Logistic回歸分析課件_第1頁
市場(chǎng)研究定量分析:Logistic回歸分析課件_第2頁
市場(chǎng)研究定量分析:Logistic回歸分析課件_第3頁
市場(chǎng)研究定量分析:Logistic回歸分析課件_第4頁
市場(chǎng)研究定量分析:Logistic回歸分析課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、市場(chǎng)研究定量分析Logistic回歸分析本章結(jié)構(gòu)Logistic回歸分析概述1.Logistic回歸理論介紹2.Logistic回歸分析實(shí)際應(yīng)用3.為什么要使用Logistic回歸 第5章講的回歸分析是自變量、因變量都為定量數(shù)據(jù)的回歸。但在實(shí)際生活中出現(xiàn)的并不一定總是這種全是定量數(shù)據(jù)的回歸。比如,根據(jù)中國(guó)股市中各上市公司的財(cái)務(wù)指標(biāo),來建立財(cái)務(wù)指標(biāo)與該上市公司是否為ST或PT之間的回歸關(guān)系。這里自變量為各種財(cái)務(wù)指標(biāo),如利潤(rùn)率、流動(dòng)性、市盈率等都為數(shù)值型的變量,而該上市公司是否處于財(cái)務(wù)預(yù)警狀態(tài),即是否ST或PT,只有兩個(gè)值:0和1,為類別變量。 又如,經(jīng)濟(jì)學(xué)研究中所涉及的是否銷售或購買某種商品、是

2、否簽訂合同,等等。這種選擇量度通常分為兩類,即“是”與“否”。在社會(huì)學(xué)和人口研究中,人們的社會(huì)行為與生命事件的發(fā)生如犯罪、逃學(xué)、遷移、結(jié)婚、離婚、生育、患病等都可以按照二分類變量來測(cè)量。在研究中,態(tài)度與偏好等心理現(xiàn)象通常也是按幾個(gè)類型進(jìn)行測(cè)量的,如“強(qiáng)烈反對(duì)”、“反對(duì)”、“中立”、“支持”和“強(qiáng)烈支持”。 此外,雖然一些測(cè)量在理論上可以是連續(xù)變量,比如某件事情對(duì)于人們生活的重要程度,但是在實(shí)際調(diào)查中卻常常按次序分類(如“不重要”、“重要”、“非常重要”)進(jìn)行測(cè)量。有的時(shí)候,人們甚至更愿意將連續(xù)量度轉(zhuǎn)換為類型劃分。一種常見的情況就是當(dāng)分析學(xué)生升學(xué)考試成績(jī)的影響因素時(shí),考試分?jǐn)?shù)可以被劃分為兩類:錄

3、取線以上和錄取線以下。只要選定一個(gè)分界點(diǎn),連續(xù)變量便可以轉(zhuǎn)換為二分類變量。 在這些情況下,運(yùn)用傳統(tǒng)的方法建立回歸模型實(shí)在不大可能,于是,我們用Logistic回歸來解決這個(gè)問題。簡(jiǎn)言之,Logistic回歸是建立數(shù)據(jù)型自變量與取值為0,1的定性因變量之間回歸方程的方法。Logistic回歸分析與線性回歸分析的對(duì)比與聯(lián)系 Logistic回歸完成將樣本分類的過程與線性回歸分析很相似,與線性回歸模型的不同之處在于它直接預(yù)測(cè)出事件發(fā)生的概率。盡管這個(gè)概率值是個(gè)度量尺度,Logistic回歸與線性回歸還是有很大的差異。概率值必須是01之間的一個(gè)數(shù)值,所以預(yù)測(cè)值必須落入01的區(qū)間。這樣,Logistic

4、回歸假定解釋變量與被解釋變量之間的關(guān)系類似于S形曲線。而且,不能從普通回歸的角度來分析Logistic回歸,因?yàn)檫@樣做會(huì)違反幾個(gè)假定。首先,離散變量的誤差形式服從貝努利分布或泊松分布,而不是正態(tài)分布,這樣使得基于正態(tài)性假設(shè)的統(tǒng)計(jì)檢驗(yàn)無效。其次,二值變量的方差不是常數(shù),會(huì)造成異方差。Logistic回歸是專門處理這些問題的。它的解釋變量與被解釋變量之間獨(dú)特的關(guān)系使其在估計(jì)、評(píng)價(jià)擬合度和解釋系數(shù)方面有不同的方法。 線性回歸一般采用最小二乘估計(jì),將解釋變量的真實(shí)值與預(yù)測(cè)值之間差的平方和最小化。而Logistic變換的非線性特征使其在估計(jì)模型時(shí)采用極大似然法估計(jì)的迭代方法,找到系數(shù)的“最可能”估計(jì)。這

5、樣,在計(jì)算整個(gè)模型擬合度的時(shí)候,就采用似然值而不是離差平方和。本章結(jié)構(gòu)Logistic回歸分析概述1.Logistic回歸理論介紹2.Logistic回歸分析實(shí)際應(yīng)用3.Logistic回歸原理介紹Logistic回歸理論模型2.Logistic回歸系數(shù) 為了理解Logistic回歸系數(shù)的含義,可以將方程式重新寫為某一事件發(fā)生的優(yōu)勢(shì)比(odds ratio,OR),一個(gè)時(shí)間發(fā)生的優(yōu)勢(shì)比被定義為它發(fā)生的可能性與不發(fā)生的可能性之比。例如,拋一枚硬幣后,其正面向上的優(yōu)勢(shì)比為0.5/0.5=1,從52張撲克牌中抽出一張A的優(yōu)勢(shì)比為(4/52)/(48/52)=1/12,這里不要將優(yōu)勢(shì)比的含義與概率混淆

6、,其概率值為4/52=1/13。 首先把Logistic方程寫作優(yōu)勢(shì)比的對(duì)數(shù),命名為L(zhǎng)ogit。 Wald統(tǒng)計(jì)量的弱點(diǎn)是當(dāng)回歸系數(shù)的絕對(duì)值變大時(shí),其標(biāo)準(zhǔn)誤差將發(fā)生更大的改變,Wald值就會(huì)變得很小,導(dǎo)致無法拒絕回歸系數(shù)為0的原假設(shè),即認(rèn)為變量的回歸系數(shù)為0。因此當(dāng)變量的系數(shù)很大時(shí),不應(yīng)該依據(jù)Wald統(tǒng)計(jì)量進(jìn)行檢驗(yàn),應(yīng)該建立包含與不包含要檢驗(yàn)的變量的兩個(gè)模型,利用對(duì)數(shù)似然比的變化值進(jìn)行檢驗(yàn)。可以選擇Backward LR方式作為變量的選擇方法。本章結(jié)構(gòu)Logistic回歸分析概述1.Logistic回歸理論介紹2.Logistic回歸分析實(shí)際應(yīng)用3.分析步驟 Logistic回歸一般有一下幾個(gè)步

7、驟: (1)選擇自變量和因變量。這里因變量為分組變量,自變量可以使定量變量和定型變量。Logistic回歸對(duì)于資料數(shù)據(jù)有較強(qiáng)的穩(wěn)健性,無須各組自變量的協(xié)方差陣相等的假設(shè)。 (2)將一部分樣本用于估計(jì)Logistic函數(shù)(訓(xùn)練樣本),另一部分樣本用于檢驗(yàn)?zāi)P偷呐袆e精度(預(yù)測(cè)樣本)。 (3)模型中假定自變量之間不存在高度相關(guān),因變量發(fā)生的概率符合Logistic模型。這樣我們可以進(jìn)行Logistic回歸估計(jì)。 (4)估計(jì)模型參數(shù),評(píng)估擬合情況。選擇回歸估計(jì)方法對(duì)回歸參數(shù)進(jìn)行估計(jì)并檢驗(yàn)回歸參數(shù)的顯著性,對(duì)模型的擬合程度進(jìn)行檢驗(yàn)。 (5)解釋所得到的模型結(jié)果。通過參數(shù)的顯著性、符號(hào)和大小來解釋自變量對(duì)

8、因變量的意義。 (6)通過預(yù)測(cè)樣本來驗(yàn)證模型的判別精度。 Logistic回歸的邏輯框圖如圖6-1所示。Logistic回歸分析在SPSS軟件中的操作:例6-1 (2)在Logistic回歸主窗口中完成設(shè)置。進(jìn)入Logistic回歸主窗口后,將“是否ST”作為因變量選入“因變量”框內(nèi),選擇財(cái)務(wù)指標(biāo)作為自變量,選入“協(xié)變量”框內(nèi),如圖6-3所示。這里我們通過對(duì)實(shí)際情況以及數(shù)據(jù)特征的考慮,選定了下面一系列指標(biāo)作為自變量,如表6-1所示。 變量進(jìn)入回歸模型的方式可以在“方法”右邊的下拉菜單進(jìn)行選擇。有將所有變量選入回歸方程的方法,也有向前和向后回歸兩類,具體有以下的變量選擇類型:向前條件:以假定參數(shù)

9、為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;向前LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量;向前Wald:以Wald統(tǒng)計(jì)量檢驗(yàn),向前逐步選擇自變量;向后條件:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;向后LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量;向后Wald:以Wald統(tǒng)計(jì)量檢驗(yàn),向后逐步選擇自變量; 這里我們選擇向前Wald的方式進(jìn)行Logistic回歸。 點(diǎn)擊“分類”按鈕,出現(xiàn)小窗口,它主要于自變量也有定性變量時(shí)使用。需要將定性自變量選入框內(nèi),這里我們的自變量全為定量數(shù)據(jù),所以不用選入變量。點(diǎn)擊“繼續(xù)”回到主窗口,如圖6-4所示。 點(diǎn)擊“保存”按鈕,出現(xiàn)的小窗口是將分析過程中產(chǎn)生的統(tǒng)計(jì)量保存在SPSS數(shù)據(jù)視圖中。這里我們選擇保存計(jì)算出來的Logistic回歸函數(shù)值“概率”以及根據(jù)Logistic回歸函數(shù)值的分組結(jié)果“組成員”。點(diǎn)擊“繼續(xù)”回到主窗口,如圖6-5所示。 點(diǎn)擊“選項(xiàng)”,出現(xiàn)如圖6-6所示的畫面,這是對(duì)要保存的統(tǒng)計(jì)量和圖進(jìn)行選擇。在“統(tǒng)計(jì)量和圖”中勾選“Hosmer-Lemeshow擬合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論