spss回歸分析大全ppt.ppt

上傳人：優(yōu)*** IP屬地：廣東上傳時(shí)間：2020-03-10 格式：PPT 頁(yè)數(shù)：227 大?。?.28MB 積分：88 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩222頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS回歸分析小組成員李標(biāo)祝斌宋金澤周益豐賈汪洋 2 本章內(nèi)容 7 1回歸分析概述7 2線性回歸分析7 3曲線估計(jì)回歸分析7 4羅輯回歸分析7 5序數(shù) 概率回歸分析7 6非線性權(quán)重估計(jì) 兩階最小二乘最佳尺度回歸分析 3 回歸分析 regressionanalysis 確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法涉及的自變量的多少一元回歸分析多元回歸分析自變量和因變量之間的關(guān)系類型線性回歸分析非線性回歸分析回歸分析 4 回歸分析一般步驟確定回歸方程中的解釋變量自變量和被解釋變量因變量確定回歸模型建立回歸方程對(duì)回歸方程進(jìn)行各種檢驗(yàn)利用回歸方程進(jìn)行預(yù)測(cè) 回歸分析線性回歸分析一元線性回歸方程反應(yīng)一個(gè)因變量與一個(gè)自變量之間的線性關(guān)系當(dāng)直線方程Y a bx的a和b確定時(shí) 即為一元回歸線性方程經(jīng)過(guò)相關(guān)分析后在直角坐標(biāo)系中將大量數(shù)據(jù)繪制成散點(diǎn)圖這些點(diǎn)不在一條直線上但可以從中找到一條合適的直線使各散點(diǎn)到這條直線的縱向距離之和最小這條直線就是回歸直線這條直線的方程叫作直線回歸方程注意一元線性回歸方程與函數(shù)的直線方程有區(qū)別一元線性回歸方程中的自變量X對(duì)應(yīng)的是因變量Y的一個(gè)取值范圍 1 一元線性回歸分析的基本理論把解釋變量和被解釋變量的多個(gè)對(duì)應(yīng)樣本值組隊(duì)成坐標(biāo)數(shù)據(jù)對(duì) xi yi 通過(guò)觀察數(shù)據(jù)對(duì) xi yi 的散點(diǎn)圖如果發(fā)現(xiàn)y與xi之間呈現(xiàn)出顯著的線性關(guān)系則應(yīng)考慮建立y和xi的一元線性回歸模型其中 y a bx y為被解釋變量 a為模型的截距項(xiàng) b為待估計(jì)參數(shù) x為解釋變量為隨機(jī)誤差項(xiàng) 線性回歸分析對(duì)于一元線性模型一般采用最小二乘估計(jì)法來(lái)估計(jì)相關(guān)的參數(shù) 如和的無(wú)偏估計(jì)值和從而得到樣本回歸直線這樣把得到的樣本回歸直線作為總體回歸的近似是一種預(yù)測(cè)過(guò)程那要確定得到的樣本回歸直線是否能作為總體回歸的近似就必須對(duì)回歸方程的線性關(guān)系進(jìn)行各種統(tǒng)計(jì)檢驗(yàn) 包括擬合優(yōu)度檢驗(yàn) 回歸方程顯著性檢驗(yàn) 回歸系數(shù)的顯著性檢驗(yàn) t檢驗(yàn) 殘差分析等線性回歸分析回歸方程的擬合優(yōu)度檢驗(yàn) 相關(guān)系數(shù)檢驗(yàn) 一元線性回歸的擬合優(yōu)度檢驗(yàn)采用R2統(tǒng)計(jì)量稱為判定系數(shù)或決定系數(shù) 數(shù)學(xué)定義為其中稱為回歸平方和 SSA 稱為總離差平方和 SST R2取值在0 1之間 R2越接近于1 說(shuō)明回歸方程對(duì)樣本數(shù)據(jù)點(diǎn)的擬合優(yōu)度越高線性回歸分析 9 多元線性回歸的擬合優(yōu)度檢驗(yàn)采用統(tǒng)計(jì)量稱為調(diào)整的判定系數(shù)或調(diào)整的決定系數(shù) 數(shù)學(xué)定義為式中n p 1 n 1分別是SSE和SST的自由度其取值范圍和意義與一元回歸方程中的R2是相同的回歸方程的擬合優(yōu)度檢驗(yàn) 相關(guān)系數(shù)檢驗(yàn) 線性回歸分析回歸方程的顯著性檢驗(yàn) F檢驗(yàn) 即平均的SSA 平均的SSE F統(tǒng)計(jì)量服從 1 n 2 個(gè)自由度的F分布 SPSS將會(huì)自動(dòng)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值如果p值小于給定的顯著性水平則應(yīng)拒絕零假設(shè) 認(rèn)為線性關(guān)系顯著一元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是 1 0 檢驗(yàn)采用F統(tǒng)計(jì)量其數(shù)學(xué)定義為線性回歸分析 11 回歸方程的顯著性檢驗(yàn) F檢驗(yàn) 多元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是各個(gè)偏回歸系數(shù)同時(shí)為零檢驗(yàn)采用F統(tǒng)計(jì)量其數(shù)學(xué)定義為即平均的SSA 平均的SSE F統(tǒng)計(jì)量服從 p n p 1 個(gè)自由度的F分布 SPSS將會(huì)自動(dòng)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值如果p值小于給定的顯著性水平則應(yīng)拒絕零假設(shè) 認(rèn)為y與x的全體的線性關(guān)系顯著線性回歸分析回歸系數(shù)的顯著性檢驗(yàn) t檢驗(yàn) 一元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假設(shè)是 1 0 檢驗(yàn)采用t統(tǒng)計(jì)量其數(shù)學(xué)定義為 t統(tǒng)計(jì)量服從n 2個(gè)自由度的t分布 SPSS將會(huì)自動(dòng)計(jì)算t統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值如果p值小于給定的顯著性水平則應(yīng)拒絕零假設(shè) 認(rèn)為x對(duì)y有顯著貢獻(xiàn) 線性關(guān)系顯著線性回歸分析 13 回歸系數(shù)的顯著性檢驗(yàn) t檢驗(yàn) 多元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假設(shè)是 i 0 檢驗(yàn)采用t統(tǒng)計(jì)量其數(shù)學(xué)定義為 ti統(tǒng)計(jì)量服從n p 1個(gè)自由度的t分布 SPSS將會(huì)自動(dòng)計(jì)算ti統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值如果p值小于給定的顯著性水平則應(yīng)拒絕零假設(shè) 認(rèn)為xi對(duì)y有顯著貢獻(xiàn) 應(yīng)保留在線性方程中 i 1 2 p 線性回歸分析殘差分析所謂殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)際樣本值之間的差距即它是回歸模型中的估計(jì)值如果回歸方程能較好地反映被解釋變量的特征和變化規(guī)律那么殘差序列中應(yīng)不包含明顯的規(guī)律性和趨勢(shì)性線性回歸分析殘差分析均值為0的正態(tài)性分析殘差均值為0的正態(tài)性分析可以通過(guò)繪制殘差圖進(jìn)行分析如果殘差均值為0 殘差圖中的點(diǎn)應(yīng)在縱坐標(biāo)為0的橫線上下隨機(jī)散落著正態(tài)性可以通過(guò)繪制標(biāo)準(zhǔn)化或?qū)W生化殘差的累計(jì)概率圖來(lái)分析線性回歸分析 16 回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析獨(dú)立性分析繪制殘差序列的序列圖以樣本期或時(shí)間為橫坐標(biāo) 殘差為縱坐標(biāo) 如果殘差隨時(shí)間的推移呈規(guī)律性變化則存在一定的正或負(fù)相關(guān)性計(jì)算殘差的自相關(guān)系數(shù)取值在 1到 1之間接近于 1表明序列存在正自相關(guān)性 DW Durbin Watson 檢驗(yàn)DW取值在0至4之間直觀判斷標(biāo)準(zhǔn)是DW 4 殘差序列完全負(fù)自相關(guān) DW 2 完全無(wú)自相關(guān) DW 0 完全正自相關(guān) 線性回歸分析 17 回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析異方差分析繪制殘差圖如果殘差的方差隨著解釋變量值的增加呈增加或減少的趨勢(shì) 說(shuō)明出現(xiàn)了異方差現(xiàn)象線性回歸分析 18 回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析探測(cè)樣本中的異常值和強(qiáng)影響點(diǎn) 對(duì)于y值標(biāo)準(zhǔn)化殘差ZRE由于殘差是服從均值為0的正態(tài)分布因此可以根據(jù)3 準(zhǔn)則進(jìn)行判斷首先對(duì)殘差進(jìn)行標(biāo)準(zhǔn)化絕對(duì)值大于3對(duì)應(yīng)的觀察值為異常值學(xué)生化殘差SRE剔除殘差DRE 或剔除學(xué)生化殘差SDRE 上述SRE SDRE的直觀判斷標(biāo)準(zhǔn)同標(biāo)準(zhǔn)化殘差ZRE 19 線性回歸分析 20 多元回歸分析中的其他問(wèn)題變量篩選問(wèn)題向前篩選策略解釋變量不斷進(jìn)入回歸方程的過(guò)程首先選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進(jìn)入方程并進(jìn)行各種檢驗(yàn) 其次在剩余的變量中挑選與解釋變量偏相關(guān)系數(shù)最高并通過(guò)檢驗(yàn)的變量進(jìn)入回歸方程向后篩選策略變量不斷剔除出回歸方程的過(guò)程首先所有變量全部引入回歸方程并檢驗(yàn) 然后在回歸系數(shù)顯著性檢驗(yàn)不顯著的一個(gè)或多個(gè)變量中剔除t檢驗(yàn)值最小的變量逐步篩選策略向前篩選與向后篩選策略的綜合線性回歸分析 21 多元回歸分析中的其他問(wèn)題變量多重共線性問(wèn)題容忍度Tol容忍度值越接近于1 表示多重共線性越弱 SPSS變量多重共線性的要求不很嚴(yán)格只是在容忍度值太小時(shí)給出相應(yīng)警告信息方差膨脹因子VIF膨脹因子是容忍度的倒數(shù) 越接近于1 表示解釋變量間的多重共線性越弱通常如果VIFi大于等于10 說(shuō)明解釋變量xi與其余解釋變量之間有嚴(yán)重的多重共線性特征根和方差比這里的特征根是指相關(guān)系數(shù)矩陣的特征根如果最大特征根遠(yuǎn)遠(yuǎn)大于其他特征根的值則說(shuō)明這些解釋變量之間具有相當(dāng)多的重疊信息條件指數(shù)ki10 ki 100時(shí) 認(rèn)為多重共線性較強(qiáng) ki 100時(shí) 認(rèn)為多重共線性很嚴(yán)重線性回歸分析 22 回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析異方差分析等級(jí)相關(guān)分析得到殘差序列后首先對(duì)其取絕對(duì)值然后計(jì)算出殘差和解釋變量的秩最后計(jì)算Spearman等級(jí)相關(guān)系數(shù) 并進(jìn)行等級(jí)相關(guān)分析具體過(guò)程見相關(guān)分析相關(guān)章節(jié) 線性回歸分析回歸分析步驟第一分析大量樣本變量觀測(cè)值確定變量之間的數(shù)學(xué)關(guān)系式回歸方程第二分析其回歸方程的可信程度區(qū)分影響顯著的和影響不顯著的自變量第三根據(jù)已確定的數(shù)學(xué)關(guān)系預(yù)測(cè) y 或者控制 x 特定變量的取值并給出預(yù)測(cè)或控制的精確度線性回歸分析線性回歸的使用條件線性趨勢(shì) 即自變量與因變量的關(guān)系是線性的獨(dú)立性因變量Y的取值相互獨(dú)立反映在方程中即殘差獨(dú)立正態(tài)性即自變量的任何一個(gè)線性組合 Y應(yīng)該服從正態(tài)分布反映在方程中即殘差Ei服從正態(tài)分布方差齊性自變量的任何一個(gè)線性組合 Y的方差相同一元線性回歸分析 2 一元線性回歸分析的SPSS操作打開分析回歸線性出現(xiàn)線性回歸主對(duì)話框進(jìn)行SPSS程序命令操作即對(duì)各子對(duì)話框進(jìn)行設(shè)置線性回歸分析 1 變量因變量被選入該文本框中的變量為線性回歸模型中的被解釋變量數(shù)值類型為數(shù)值型如果被解釋變量為分類變量則可以用二元或者多元Logistic模型等建模分析自變量被選入該列表框中的變量為線性模型中的解釋變量數(shù)值類型一般為數(shù)值型如果解釋變量為分類變量或定性變量可以用虛擬變量啞變量表示如果選擇多個(gè)自變量可將自變量分組成塊通過(guò) 上一張和下一張按鈕對(duì)不同的變量子集指定不同的進(jìn)入方法線性回歸分析總離差平方和可分解為 2 方法用于選擇線性回歸中變量的進(jìn)入和剔除方法來(lái)建立多個(gè)回歸模型進(jìn)入該方法表示自變量列表中所有的變量都進(jìn)入回歸模型逐步該方法是一個(gè)動(dòng)態(tài)過(guò)程表示具有F統(tǒng)計(jì)量的概率最小的自變量被選進(jìn)回歸模型對(duì)于已經(jīng)在回歸方程中的變量如果它們的F統(tǒng)計(jì)量的概率變得足夠大則移除這些變量直到不再有自變量符合進(jìn)入或移除的條件該方法終止刪除該方法表示建立回歸模型前設(shè)定一定條件然后根據(jù)條件刪除自變量向后該方法表示首先將自變量列表中的所有自變量選入到回歸模型中然后按順序移除最先刪除與因變量之間的部分相關(guān)性最小的那個(gè)變量移除第一個(gè)變量后得到新的方程又將與因變量之間的部分相關(guān)性最小的那個(gè)變量刪除直到方程中沒(méi)有滿足消除條件的變量過(guò)程結(jié)束向前該方法與向后恰好相反是將自變量按順序選入到回歸模型中首先選入與因變量之間具有最大相關(guān)性的滿足選入條件的變量進(jìn)入回歸模型中然后再考慮下一個(gè)變量直到?jīng)]有滿足條件的變量時(shí) 過(guò)程結(jié)束線性回歸分析 3 選擇變量該文本框主要用于指定分析個(gè)案的選擇規(guī)則當(dāng)回歸分析中包含由選擇規(guī)則定義的個(gè)案則需要進(jìn)行設(shè)置線性回歸設(shè)置規(guī)則子對(duì)話框用于選擇關(guān)系對(duì)于分類變量可用的關(guān)系有等于和不等于對(duì)于字符串型變量可以用等于關(guān)系在值文本框中輸入按具體數(shù)值或字符串選擇個(gè)案的規(guī)則如在值中輸入 f 則表示只有那些性別為女性的個(gè)案才能進(jìn)入分析對(duì)于連續(xù)變量則可用的關(guān)系有等于不等于小于小于等于大于以及大于等于如選擇不等于并在值中輸入 1 表示只有那些有無(wú)線服務(wù)的個(gè)案才會(huì)包含在回歸分析中線性回歸分析 4 個(gè)案標(biāo)簽該文本框主要用于指定個(gè)案標(biāo)簽的變量 5 WLS權(quán)重該文本框表示加權(quán)最小二乘當(dāng)判斷回歸模型的殘差存在異方差時(shí) 才選用加權(quán)最小二乘方法指定加權(quán)變量線性回歸分析 6 統(tǒng)計(jì)量按鈕設(shè)置回歸系數(shù)選項(xiàng)組估計(jì) 選擇該復(fù)選框可輸出回歸系數(shù) 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)化系數(shù)beta t值以及t的雙尾顯著性水平置信區(qū)間誤差條形圖的表征選擇該復(fù)選框可輸出每個(gè)回歸系數(shù)或協(xié)方差矩陣指定置信度的置信區(qū)間在水平框中輸入范圍協(xié)方差矩陣選擇它可輸出回歸系數(shù)的方差協(xié)方差矩陣其對(duì)角線以外的協(xié)方差對(duì)角線上為方差同時(shí)還顯示相關(guān)系數(shù)矩陣線性回歸分析殘差選項(xiàng)組該選項(xiàng)組用于指定對(duì)回歸殘差進(jìn)行檢驗(yàn)的方法 Durbin Watson 該復(fù)選框表示輸出用于檢驗(yàn)殘差系列自相關(guān)的D W檢驗(yàn)統(tǒng)計(jì)量個(gè)案診斷該復(fù)選框表示對(duì)個(gè)案進(jìn)行診斷輸出個(gè)案其中離群值表示輸出滿足條件的個(gè)案離群值標(biāo)準(zhǔn)差用于指定離群值滿足幾倍標(biāo)準(zhǔn)差的條件所有個(gè)案指可以輸出所有個(gè)案的殘差線性回歸分析模型擬合度勾選該復(fù)選框則輸出顯示輸入模型的變量和從模型刪去的變量并顯示以下擬合優(yōu)度統(tǒng)計(jì)量復(fù)相關(guān)系數(shù) R2和調(diào)整R2 估計(jì)的標(biāo)準(zhǔn)誤以及方差分析表 R方變化勾選該復(fù)選框則輸出由于添加或刪除自變量而產(chǎn)生的R2統(tǒng)計(jì)量的更改如果與某個(gè)變量相關(guān)聯(lián)的R2變化很大則意味著該變量是因變量的一個(gè)良好的預(yù)測(cè)變量描述性勾選該復(fù)選框則輸出回歸分析中的有效個(gè)案數(shù) 均值以及每個(gè)變量的標(biāo)準(zhǔn)差同時(shí)輸出具有單尾顯著性水平的相關(guān)矩陣以及每個(gè)相關(guān)系數(shù)的個(gè)案數(shù) 線性回歸分析部分相關(guān)和偏相關(guān)性該復(fù)選框表示輸出部分相關(guān)和偏相關(guān)統(tǒng)計(jì)量其中部分相關(guān) 指對(duì)于因變量與某個(gè)自變量當(dāng)已移去模型中的其他自變量對(duì)該自變量的線性效應(yīng)之后因變量與自變量之間的相關(guān)性當(dāng)變量添加到方程時(shí) 它與R2的更改有關(guān) 偏相關(guān) 指的是對(duì)于兩個(gè)變量在移去由于它們與其他變量之間的相互關(guān)聯(lián)引起的相關(guān)之后這兩個(gè)變量之間剩余的相關(guān)性對(duì)于因變量與某個(gè)自變量當(dāng)已移去模型中的其他自變量對(duì)上述兩者的線性效應(yīng)后這兩者之間的相關(guān)性共線性診斷輸出各變量的容限公差以及共線性診斷表線性回歸分析 7 繪制按鈕設(shè)置線性回歸圖對(duì)話框主要用于幫助驗(yàn)證正態(tài)性線性和方差相等的假設(shè) 還可以檢測(cè)離群值異常觀察值和有影響的個(gè)案在源變量列表中列出了因變量 DEPENDNT 及以下的預(yù)測(cè)變量和殘差變量標(biāo)準(zhǔn)化預(yù)測(cè)值 ZPRED 標(biāo)準(zhǔn)化殘差 ZRESID 剔除殘差 DRESID 調(diào)整的預(yù)測(cè)值 ADJPERD 學(xué)生化的殘差 SRESID 以及學(xué)生化的已刪除殘差 SDRESID 線性回歸分析散點(diǎn)1的1該選項(xiàng)組可以利用源變量列表中的任意兩個(gè)來(lái)繪制散點(diǎn)圖在 Y 中選入Y軸的變量 X 中選入X軸的變量單擊下一張可以再繪制下一張圖單擊上一張可以回到剛剛設(shè)定的上一張圖進(jìn)行修改另外針對(duì)標(biāo)準(zhǔn)化預(yù)測(cè)值繪制標(biāo)準(zhǔn)化殘差可以檢驗(yàn)線性關(guān)系和等方差性標(biāo)準(zhǔn)化殘差圖該選項(xiàng)組用于繪制標(biāo)準(zhǔn)化殘差圖主要可以指定兩種圖直方圖和正態(tài)概念圖將標(biāo)準(zhǔn)化殘差的分布與正態(tài)分布進(jìn)行比較產(chǎn)生所有部分圖該復(fù)選框表示當(dāng)根據(jù)其余自變量分別對(duì)兩個(gè)變量進(jìn)行回歸時(shí) 顯示每個(gè)自變量殘差和因變量殘差的散點(diǎn)圖但是要求方程中必須至少有兩個(gè)自變量線性回歸分析 8 保存按鈕設(shè)置線性回歸保存對(duì)話框主要用于在活動(dòng)數(shù)據(jù)文件中保存預(yù)測(cè)值殘差和其他對(duì)于診斷有用的統(tǒng)計(jì)量包括預(yù)測(cè)值選項(xiàng)組該選項(xiàng)組用于保存回歸模型對(duì)因變量的預(yù)測(cè)值未標(biāo)準(zhǔn)化選中該復(fù)選框表示保存回歸模型對(duì)因變量的預(yù)測(cè)值標(biāo)準(zhǔn)化選中該復(fù)選框表示保存標(biāo)準(zhǔn)化后的預(yù)測(cè)值調(diào)節(jié) 選中它表示保存當(dāng)某個(gè)案從回歸系數(shù)的計(jì)算中排除時(shí)個(gè)案的預(yù)測(cè)值均值預(yù)測(cè)值的S E 選中它表示保存預(yù)測(cè)值的標(biāo)準(zhǔn)誤線性回歸分析殘差選項(xiàng)組該選項(xiàng)組用于保存回歸模型的殘差未標(biāo)準(zhǔn)化選中它表示保存觀察值與模型預(yù)測(cè)值之間的原始?xì)埐?標(biāo)準(zhǔn)化選中它表示保存標(biāo)準(zhǔn)化后的殘差即Pearson殘差學(xué)生化選中它表示保存學(xué)生化的殘差即殘差除以其隨個(gè)案變化的標(biāo)準(zhǔn)差的估計(jì) 這取決于每個(gè)個(gè)案的自變量值與自變量均值之間的距離刪除選中它表示保存當(dāng)某個(gè)案從回歸系數(shù)的計(jì)算中排除時(shí)該個(gè)案的殘差它是因變量的值和調(diào)整預(yù)測(cè)值之間的差學(xué)生化已刪除選中它表示保存學(xué)生化的刪除殘差即個(gè)案的剔除殘差除以其標(biāo)準(zhǔn)誤線性回歸分析距離選項(xiàng)組該選項(xiàng)組用于標(biāo)識(shí)自變量的值具有異常組合的個(gè)案以及可能對(duì)回歸模型產(chǎn)生很大影響的個(gè)案的測(cè)量 Mahalanobis距離表示自變量中個(gè)案的值與所有個(gè)案的平均值相異程度的測(cè)量大的Mahalanobis距離表示個(gè)案在一個(gè)或多個(gè)自變量上具有極值 Cook距離選中它表示保存Cook距離值較大的Cook距離表明從回歸統(tǒng)計(jì)量的計(jì)算中排除個(gè)案之后系數(shù)會(huì)發(fā)生很大變化杠桿值選擇它表示保存杠桿值杠桿值是度量某個(gè)點(diǎn)對(duì)回歸擬合的影響范圍從0到 N 1 N 其中0表示對(duì)回歸擬合無(wú)影響線性回歸分析影響統(tǒng)計(jì)量選項(xiàng)組該選項(xiàng)組用于測(cè)度由于排除了特定個(gè)案而導(dǎo)致的回歸系數(shù) DfBeta 和預(yù)測(cè)值 DfFit 的變化 DfBeta 即計(jì)算Beta值的差分表示由于排除了某個(gè)特定個(gè)案而導(dǎo)致的回歸系數(shù)的改變標(biāo)準(zhǔn)化DfBeta 表示計(jì)算Beta值的標(biāo)準(zhǔn)化差分 DfFit 表示計(jì)算擬合值的差分即由于排除了某個(gè)特定個(gè)案而產(chǎn)生的預(yù)測(cè)變量的更改標(biāo)準(zhǔn)化DfFit 表示計(jì)算擬合值的標(biāo)準(zhǔn)化差分協(xié)方差比率選中它表示從回歸系數(shù)計(jì)算中排除特定個(gè)案的協(xié)方差矩陣的行列式與包含所有個(gè)案的協(xié)方差矩陣的行列式的比率如果比率接近1 則說(shuō)明被排除的個(gè)案不能顯著改變協(xié)方差矩陣線性回歸分析預(yù)測(cè)區(qū)間選項(xiàng)組該選項(xiàng)組用于設(shè)置均值和個(gè)別預(yù)測(cè)區(qū)間的上界和下界線性回歸分析線性回歸選項(xiàng) 對(duì)話框主要用于對(duì)步進(jìn)方法標(biāo)準(zhǔn)和缺失值進(jìn)行設(shè)置各選項(xiàng)含義如下步進(jìn)方法標(biāo)準(zhǔn) 選項(xiàng)組該選項(xiàng)組在已指定向前向后或逐步式變量選擇法的情況下適用變量可以進(jìn)入到模型中或者從模型中移除這取決于F值的顯著性概率或者F值本身使用F的概率表示如果變量的F值的顯著性水平小于進(jìn)入值則將該變量選入到模型中如果該顯著性水平大于刪除值則將該變量從模型中移除其中進(jìn)入值必須小于刪除值且兩者均必須為正數(shù) 使用F值表示如果變量的F值大于進(jìn)入值則該變量輸入模型如果F值小于刪除值則該變量從模型中移除進(jìn)入值必須大于刪除值且兩者均必須為正數(shù) 要將更多的變量選入到模型中請(qǐng)降低進(jìn)入值要將更多的變量從模型中移除請(qǐng)?jiān)龃?刪除值線性回歸分析在等式中包含常數(shù) 復(fù)選框該復(fù)選框表示回歸模型中包含常數(shù)項(xiàng) 取消選擇此選項(xiàng)可強(qiáng)制使回歸模型通過(guò)原點(diǎn) 但是某些通過(guò)原點(diǎn)的回歸結(jié)果無(wú)法與包含常數(shù)的回歸結(jié)果相比較如不能以通常的方式解釋R2 缺失值選項(xiàng)組該選項(xiàng)組用于對(duì)回歸中缺失值的設(shè)定有3個(gè)可選項(xiàng) 按列表排除個(gè)案選中該選項(xiàng) 表示只有所有變量均取有效值的個(gè)案才包含在分析中按對(duì)排除個(gè)案選擇該選項(xiàng) 表示使用正被相關(guān)的變量對(duì)具有完整數(shù)據(jù)的個(gè)案來(lái)計(jì)算回歸分析所基于的相關(guān)系數(shù) 使用均值替換選擇該選項(xiàng) 表示用變量的均值來(lái)替換缺失值線性回歸分析實(shí)例操作橡皮的韌性和拉伸倍數(shù)是否存在顯著的線性關(guān)系線性回歸分析 44 線性回歸分析 45 線性回歸分析 46 方程中包含的自變量列表同時(shí)顯示進(jìn)入方法如本例中方程中的自變量為x 方法為Enter 模型擬合概述列出了模型的R R2 調(diào)整R2及估計(jì)標(biāo)準(zhǔn)誤 R2值越大所反映的兩變量的共變量比率越高模型與數(shù)據(jù)的擬合程度越好本例所用數(shù)據(jù)擬合結(jié)果顯示所考察的自變量和因變量之間的相關(guān)系數(shù)為0 985 擬合線性回歸的確定性系數(shù)為0 971 經(jīng)調(diào)整后的確定性系數(shù)為0 968 標(biāo)準(zhǔn)誤的估計(jì)為0 09931 線性回歸分析 47 方差分析表列出了變異源自由度均方 F值及對(duì)F的顯著性檢驗(yàn) 本例中回歸方程顯著性檢驗(yàn)結(jié)果表明回歸平方和為2 658 殘差平方和為0 079 總平方和為2 736 對(duì)應(yīng)的F統(tǒng)計(jì)量的值為269 456 顯著性水平小于0 05 可以認(rèn)為所建立的回歸方程有效線性回歸分析 48 回歸系數(shù)表列出了常數(shù)及非標(biāo)準(zhǔn)化回歸系數(shù)的值及標(biāo)準(zhǔn)化的回歸系數(shù) 同時(shí)對(duì)其進(jìn)行顯著性檢驗(yàn) 本例中非標(biāo)準(zhǔn)化的回歸系數(shù)B的估計(jì)值為0 890 標(biāo)準(zhǔn)誤為0 053 標(biāo)準(zhǔn)化的回歸系數(shù)為0 985 回歸系數(shù)顯著性檢驗(yàn)t統(tǒng)計(jì)量的值為16 415 對(duì)應(yīng)顯著性水平Sig 0 000 0 05 可以認(rèn)為方程顯著因此本例回歸分析得到的回歸方程為 Y 0 116 0 89X對(duì)方程的方差分析及對(duì)回歸系數(shù)的顯著性檢驗(yàn)均發(fā)現(xiàn) 所建立的回歸方程顯著線性回歸分析 49 線性回歸分析線性回歸分析 50 一元線性回歸分析討論的回歸問(wèn)題只涉及了一個(gè)自變量但在實(shí)際問(wèn)題中影響因變量的因素往往有多個(gè) 例如商品的需求除了受自身價(jià)格的影響外還要受到消費(fèi)者收入其他商品的價(jià)格消費(fèi)者偏好等因素的影響影響水果產(chǎn)量的外界因素有平均氣溫平均日照時(shí)數(shù) 平均濕度等因此在許多場(chǎng)合僅僅考慮單個(gè)變量是不夠的還需要就一個(gè)因變量與多個(gè)自變量的聯(lián)系來(lái)進(jìn)行考察才能獲得比較滿意的結(jié)果這就產(chǎn)生了測(cè)定多因素之間相關(guān)關(guān)系的問(wèn)題研究在線性相關(guān)條件下兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系稱為多元線性回歸分析表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公式稱為多元線性回歸模型 51 線性回歸分析 52 線性回歸分析 53 線性回歸分析 54 方程中包含的自變量列表同時(shí)顯示進(jìn)入方法如本例中方程中的自變量為Q1和Q2 Q3 Q4 Q5 選擇變量進(jìn)入方程的方法為Enter 2 模型概述列出了模型的R R2 調(diào)整R2及估計(jì)標(biāo)準(zhǔn)誤 R2值越大所反映的自變量與因變量的共變量比率越高模型與數(shù)據(jù)的擬合程度越好上面所定義模型確定系數(shù)的平方根為0 888 確定系數(shù)為0 789 調(diào)整后的確定系數(shù)為0 525 標(biāo)準(zhǔn)誤為6 5322 線性回歸分析 55 3 方差分析表列出了變異源自由度均方 F值及對(duì)F的顯著性檢驗(yàn) 本例中回歸平方和為637 321 殘差平方和為170 679 總平方和為808 000 F統(tǒng)計(jì)量的值為2 987 Sig 0 05 可以認(rèn)為所建立的回歸方程無(wú)效線性回歸分析 56 4 回歸系數(shù)表列出了常數(shù)及回歸系數(shù)的值及標(biāo)準(zhǔn)化的值同時(shí)對(duì)其進(jìn)行顯著性檢驗(yàn) 回歸系數(shù)分析中 Sig 0 05 建立的回歸方程無(wú)效說(shuō)明多個(gè)變量與因變量不存在顯著地線性關(guān)系線性回歸分析曲線估計(jì) 變量間相關(guān)關(guān)系的分析中變量之間的關(guān)系并不總是表現(xiàn)出線性關(guān)系非線性關(guān)系也極為常見非線性又可劃分為本質(zhì)線性關(guān)系形式上雖然呈非線性但可通過(guò)變量轉(zhuǎn)換化為線性關(guān)系本質(zhì)非線性關(guān)系不僅形式上呈非線性也無(wú)法通過(guò)變量轉(zhuǎn)換化為線性關(guān)系這里的曲線估計(jì)是解決本質(zhì)線性關(guān)系問(wèn)題的常見本質(zhì)線性模型曲線估計(jì) 稱曲線擬合曲線回歸是研究?jī)勺兞块g非線性關(guān)系的一種方法選定一種用方程表達(dá)的曲線使得實(shí)際數(shù)據(jù)與理論數(shù)據(jù)之間的差異盡可能地小如果曲線選擇得好那么可以揭示因變量與自變量的內(nèi)在關(guān)系并對(duì)因變量的預(yù)測(cè)有一定意義曲線估計(jì)中需要解決兩個(gè)問(wèn)題一是選用哪種理論模型即用哪種方程來(lái)擬合觀測(cè)值二是當(dāng)模型確定后如何選擇合適的參數(shù) 使得理論數(shù)據(jù)和實(shí)際數(shù)據(jù)的差異最小在SPSS曲線估計(jì)中首先在不能明確哪種模型更接近樣本數(shù)據(jù)時(shí)可在上述可選擇的模型中選擇幾種模型然后 SPSS自動(dòng)完成模型的參數(shù)估計(jì) 并輸出回歸方程顯著性檢驗(yàn)的F值和概率P值判定系數(shù)R2等統(tǒng)計(jì)量最后以判定系數(shù)R2為主要依據(jù)選擇其中的最優(yōu)模型并進(jìn)行預(yù)測(cè)分析曲線估計(jì)應(yīng)用舉例為研究居民家庭教育支出和消費(fèi)性支出之間的關(guān)系收集到1990年至2002年全國(guó)人均消費(fèi)性支出和教育支出的數(shù)據(jù) 第一步畫散點(diǎn)圖教育支出和年人均消費(fèi)性支出的散點(diǎn)圖觀察散點(diǎn)圖發(fā)現(xiàn)兩變量之間呈非線性關(guān)系可嘗試選擇二次三次曲線復(fù)合函數(shù) 冪函數(shù)等模型第二步選擇函數(shù)模型注選擇相應(yīng)的變量注模型中選擇二次項(xiàng) 立方冪復(fù)合勾選顯示ANOVA表格然后點(diǎn)擊保存按鈕注勾選預(yù)測(cè)值殘差預(yù)測(cè)空間 95 置信點(diǎn)擊繼續(xù) 并確定得到輸出結(jié)果擬合優(yōu)度最高第三步分析輸出結(jié)果三次兩個(gè)系數(shù)均大于0 05 此模型不理想復(fù)合冪相伴概率Sig 0 000 該模型較理想二次三次復(fù)合冪函數(shù)的曲線冪函數(shù)曲線復(fù)合函數(shù)和冪函數(shù)的擬合優(yōu)度都很好同時(shí)兩種模型的回歸系數(shù)顯著性檢驗(yàn)也都通過(guò) 因此可考慮采用這兩種模型但是從曲線走勢(shì)上來(lái)看復(fù)合函數(shù)增長(zhǎng)趨勢(shì)比冪函數(shù)更接近原函數(shù) 因此可最終考慮采用復(fù)合函數(shù) 復(fù)合曲線由于在曲線估計(jì)對(duì)話框中選了保存項(xiàng) 并且勾選了預(yù)測(cè)值殘差和預(yù)測(cè)區(qū)間因此在編輯窗口增加了16個(gè)變量的值以fit 1 err 1 lcl 1 ucl 1為例進(jìn)行說(shuō)明 fit 1 表示在線性回歸分析條件下當(dāng)自變量x1值為1627 64時(shí) 因變量x1的預(yù)測(cè)值為77 75243 err 1 表示在線性回歸分析條件下當(dāng)自變量x1值為1627 64時(shí) 因變量x2的實(shí)際值與預(yù)測(cè)值殘差為 39 51243 lcl 1 表示在線性回歸分析條件下預(yù)測(cè)值95 可置信區(qū)間的下限為 41 46780 52 47135 ucl 1 表示在線性回歸分析條件下預(yù)測(cè)值95 可置信區(qū)間的上限為 196 97266 179 94058 回歸分析時(shí)間序列上的曲線估計(jì) 定義時(shí)間序列的曲線估計(jì)是分析社會(huì)和經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計(jì) 通常把時(shí)間設(shè)為自變量x 代表具體的經(jīng)濟(jì)或社會(huì)現(xiàn)象的變量設(shè)為因變量y 研究變量x與y之間關(guān)系的方法就是時(shí)間序列曲線估計(jì) 其具體步驟與一般的曲線估計(jì)基本類似對(duì)1978 2006年間社會(huì)消費(fèi)品零售總額之間的關(guān)系進(jìn)行曲線回歸分析時(shí)間序列上的曲線估計(jì)應(yīng)用舉例注因變量選擇y 社會(huì)消費(fèi)品零售總額變量選擇x 年份同時(shí)選中時(shí)間項(xiàng) 表示其為代表時(shí)間的自變量模型框內(nèi)勾選線性二次項(xiàng) 立方和冪四種曲線模型進(jìn)行估計(jì) 不必勾選顯示ANOVA表格注在曲線估計(jì)中單擊保存按鈕當(dāng)以時(shí)間作為自變量時(shí) 預(yù)測(cè)個(gè)案是有效的從估計(jì)期到最后一個(gè)個(gè)案的預(yù)測(cè) 是計(jì)算當(dāng)前所有樣本期內(nèi)的預(yù)測(cè)值預(yù)測(cè)范圍是指如果預(yù)測(cè)的范圍超過(guò)了當(dāng)前樣本期可以選擇在此項(xiàng)隨后的觀測(cè)值中鍵入一個(gè)需預(yù)測(cè)的期數(shù) 31 表示將使用不同曲線模型對(duì)1978 2008年這31年的社會(huì)消費(fèi)品零售總額作預(yù)測(cè) 并在spss數(shù)據(jù)編輯窗口中保留所有預(yù)測(cè)值結(jié)果和分析所選的4種曲線函數(shù)中以立方曲線的擬合優(yōu)度最高所以選擇立方擬合社會(huì)消費(fèi)品零售總額在各年的變化趨勢(shì) 接下來(lái)結(jié)合觀察值和各種函數(shù)模型預(yù)測(cè)值的對(duì)比圖加以檢驗(yàn) 從對(duì)比圖中可以看出三次函數(shù)的曲線與樣本的實(shí)際觀察值擬合得較好所以決定對(duì)本節(jié)中的研究問(wèn)題社會(huì)消費(fèi)品零售總額的趨勢(shì)分析采用指數(shù)函數(shù)進(jìn)行回歸分析其具體模型為 y 2155 592 197 636x 35 303x2 1 947x3 由于在曲線估計(jì) 窗口中選了保存項(xiàng) 因此在spss數(shù)據(jù)編輯窗口中就新增了fit 1 fit 2 fit 3 fit 4四個(gè)變量的預(yù)測(cè)值同時(shí)在窗口下面還新增了兩個(gè)個(gè)案他們分別代表對(duì)2007年和2008年的預(yù)測(cè)值以三次函數(shù)做回歸分析當(dāng)自變量x值為2001時(shí) 因變量y的預(yù)測(cè)值為44665 01213當(dāng)自變量x值為2007時(shí) 因變量y的預(yù)測(cè)值為80573 79934當(dāng)自變量x值為2008時(shí) 因變量y的預(yù)測(cè)值為87964 31013 邏輯回歸分析定性變量在許多實(shí)際問(wèn)題中會(huì)經(jīng)常出現(xiàn)因變量是定性變量的情況例如某個(gè)人是否購(gòu)買汽車受到多種如家庭情況收人情況等因素的影響但最終的可能性只有兩個(gè) 要么購(gòu)買要么不購(gòu)買把y 1定義為購(gòu)買 y o則表示不購(gòu)買再如在是否購(gòu)買某項(xiàng)商業(yè)保險(xiǎn)的研究中根據(jù)消費(fèi)者的年齡身體狀況收人情況工作性質(zhì) 受教育程度等因變量y也只有兩種可能結(jié)果要么y 1表示購(gòu)買要么y o表示不購(gòu)買 90 處理方法可用于處理定性因變量的統(tǒng)計(jì)分析方法有判別分析 D1scriminantanalysis Probit分析 Logistic回歸分析和對(duì)數(shù)線性模型等在社會(huì)科學(xué)中應(yīng)用最多的是logistic回歸分析邏輯回歸分析是對(duì)定性變量的回歸分析 Logistic中文意思為邏輯但是這里并不是邏輯的意思而是通過(guò)logit變換來(lái)命名的 91 Logistic回歸分析法 Logistic回歸分析是對(duì)定性變量的回歸分析分類 Logistic回歸分析根據(jù)因變量取值類別不同又可以分為二元 Binarylogistic 回歸分析和多項(xiàng) Multinomianllogistic 回歸分析變量特點(diǎn) 因變量是分類變量自變量可以是分類變量也可以是連續(xù)變量Binarylogistic回歸模型中因變量只能取兩個(gè)值1和o 虛擬因變量二分類變量二元指兩種可能性就好比邏輯中的是或者否一樣 Multinomianllogistic回歸模型中因變量可以取多個(gè)值多分類變量 92 Logistic回歸分析要解決的問(wèn)題具體地說(shuō) Logistic回歸分析主要解決以下幾方面的問(wèn)題通過(guò)分析大量的樣本數(shù)據(jù) 確定變量之間的數(shù)學(xué)關(guān)系式對(duì)所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn) 并區(qū)分出對(duì)某一特定變量影響較為顯著的變量和影響不顯著的變量利用所確定的數(shù)學(xué)關(guān)系式根據(jù)一個(gè)或幾個(gè)變量的值來(lái)預(yù)測(cè)或控制另一個(gè)特定變量的取值并給出這種預(yù)測(cè)或控制的精確度 93 二元logistic回歸模型數(shù)學(xué)表達(dá)式二元Logistic函數(shù)的形式為二元Logistic回歸方程二元logistic中通過(guò)Logit變換成為線性關(guān)系利用極大似然估計(jì)法對(duì)參數(shù)進(jìn)行估計(jì) 可用SPSS計(jì)算 94 對(duì)參數(shù)進(jìn)行檢驗(yàn) 常用檢驗(yàn)統(tǒng)計(jì)量 1 2對(duì)數(shù)似然值 2loglikelihood 2LL 因?yàn)?2LL近似服從卡方分布且在數(shù)學(xué)上更為方便所以 2LL可用于檢驗(yàn)Logistic回歸的顯著性公式為 2 擬合優(yōu)度GoodnessofFit統(tǒng)計(jì)量Logistic回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公式為 95 3 cox和snell的R24 Nagelkerke的R25 偽R2 Psedo R square 偽R2與線性回歸模型的R2相似其意義相似但它小于16 Hosmer和Lemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量7 Wald統(tǒng)計(jì)量 96 二元logistic回歸應(yīng)用在一組獨(dú)立變量上對(duì)二分類從屬變量進(jìn)行回歸利用前像后向逐步方法或全部進(jìn)入方法建模用偏差數(shù)對(duì)比簡(jiǎn)單比較差分反Helmert Helmert 多項(xiàng)式鄰近類別比較用戶自定義或指示預(yù)示變量選擇建模標(biāo)準(zhǔn) 變量進(jìn)入的評(píng)分統(tǒng)計(jì)量的概率值 Wald概率值或者移除變量的對(duì)數(shù)似然比統(tǒng)計(jì)量保存統(tǒng)計(jì)量預(yù)測(cè)概率和分組殘差偏差值 Logit 標(biāo)準(zhǔn)化殘差杠桿值類似Cook s的距離差異通過(guò)XML導(dǎo)出模型 97 多項(xiàng)logistic回歸模型數(shù)學(xué)表達(dá)式多項(xiàng)logistic回歸模型模型如下與二元邏輯回歸一樣通過(guò)變換可得 98 檢驗(yàn)統(tǒng)計(jì)量擬合檢驗(yàn)Pearson卡方統(tǒng)計(jì)量卡方偏差統(tǒng)計(jì)量大樣本數(shù)據(jù)的這兩個(gè)統(tǒng)計(jì)量的取值很相近偽R方統(tǒng)計(jì)量指McFadden統(tǒng)計(jì)量 99 多項(xiàng)logistic回歸應(yīng)用在一組自變量上對(duì)多于兩種類別的分類因變量進(jìn)行回歸用CRITERIA子命令控制算法調(diào)整參數(shù)的值包含交互作用項(xiàng)自定義假設(shè)檢驗(yàn) 使用TEST子命令直接把零假設(shè)指定為參數(shù)的線性組合用SCALE子命令指定離差偏離比例建立包含不包含截距項(xiàng)的方程幾率比的置信區(qū)間保存統(tǒng)計(jì)量預(yù)測(cè)概率預(yù)測(cè)響應(yīng)類別 100 預(yù)測(cè)響應(yīng)分類的概率和實(shí)際響應(yīng)分類的概率指定因變量的參照類處理非常大的問(wèn)題利用逐步方法從眾多的可能的預(yù)測(cè)因子中選擇最佳預(yù)測(cè)因子利用評(píng)分和Wald方法使您在大數(shù)據(jù)集的情況下更迅速地得出研究結(jié)果利用AIC或者BIC準(zhǔn)則也稱為SBC 評(píng)估模型擬合度 101 多項(xiàng)logistic回歸二元logistic回歸二元與多項(xiàng)logistic回歸的區(qū)別 103 同二元Logistic回歸相對(duì)應(yīng) 當(dāng)因變量有2個(gè)以上的分類變量時(shí) 就選用多項(xiàng)Logistic回歸在因變量中其中一個(gè)分類變量要作基線類其他類別都同它比較成為非冗余的邏輯變換模型對(duì)于基線類其模型中所有系數(shù)均為0 比如三分類的變量A B C 可以以B為基線 A與B比較 C與B比較這就如同建立了兩個(gè)二元Logistic回歸分析多項(xiàng)Logistic回歸實(shí)例操作案例1 二元Logistic回歸在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會(huì)調(diào)查中因變量y 1表示居民主要乘坐公共汽車上下班 y 0表示主要騎自行車上下班自變量x1表示被調(diào)查者的年齡 x2表示被調(diào)查者的月收入 x3表示被調(diào)查者的性別 x3 1為男性 x3 0為女性試建立y與自變量間的Logistic回歸數(shù)據(jù)如表L 1所示 104 操作步驟 1 輸入數(shù)據(jù) 105 2 在分析菜單的回歸子菜單中選擇二元Logistic 命令進(jìn)行Logistic回歸分析 106 3 在彈出的 Logistic回歸對(duì)話框中從左側(cè)的變量列表中選擇y變量居民上下班使用交通工具的情況將至添加到因變量框中表示該變量時(shí)因變量選擇年齡月收入性別進(jìn)入協(xié)變量框中表示其為自變量在Method框中選擇SPSS默認(rèn)的 Enter 方法使所選變量全部進(jìn)入回歸方程如圖所示 107 4 單擊對(duì)話框中的選項(xiàng) 按鈕在彈出的 Logistic回歸選項(xiàng) 對(duì)話框中按需要選擇各選項(xiàng) 如圖所示 108 統(tǒng)計(jì)量和圖框中的選項(xiàng)用來(lái)選擇輸出哪些統(tǒng)計(jì)量或統(tǒng)計(jì)圖表具體選項(xiàng)如下 Classificationplots 分類圖通過(guò)比較因變量的觀測(cè)值和預(yù)測(cè)值之間關(guān)系反映回歸模型的擬合效果 Hosmer Lemeshowgoodness of fit H L擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量用以檢驗(yàn)整個(gè)回歸模型的擬合優(yōu)度 Casewiselistingofresiduals 個(gè)案殘差列表輸出標(biāo)準(zhǔn)方差大于某值 Outliersoutside std Dev 的個(gè)案或者全部個(gè)案 Allcases 的入選狀態(tài) 因變量的觀測(cè)值和預(yù)測(cè)值及其相應(yīng)預(yù)測(cè)概率殘差值 Correlationsofestimates 估計(jì)參數(shù)的相關(guān)性輸出模型中各估計(jì)參數(shù)間的相關(guān)矩陣 Iterationhistory 迭代歷史輸出參數(shù)估計(jì)迭代過(guò)程中的系數(shù)及對(duì)數(shù)似然值 CIforexp B exp B 的N 置信區(qū)間選中該選項(xiàng)將會(huì)在模型檢驗(yàn)的輸出結(jié)果中列出exp B 各回歸系數(shù)指數(shù)函數(shù)值的N 缺省值為95 置信區(qū)間如果要改變?nèi)笔≈?可以在空白方框內(nèi)輸入1 99 一般常用的值為90 95 99 之間的任何一個(gè)整數(shù) 選項(xiàng)說(shuō)明 110 輸出框用來(lái)選擇輸出計(jì)算結(jié)果的方式 Ateachstep 顯示spss每個(gè)步驟的計(jì)算結(jié)果 Atlaststep 只顯示最終計(jì)算結(jié)果在模型中包括常數(shù) 選項(xiàng)用以確定所求模型的參數(shù)是否要包含常數(shù)項(xiàng) 為了更好地說(shuō)明以上各選項(xiàng)的意義本例選擇了所有選項(xiàng) 但保留各選項(xiàng)中的缺省值選項(xiàng)說(shuō)明步進(jìn)概率框用來(lái)設(shè)定步長(zhǎng)標(biāo)準(zhǔn) 以便逐步控制自變量進(jìn)入方程或被剔除出方程進(jìn)入設(shè)置變量進(jìn)入方程的標(biāo)準(zhǔn)值如果變量的分?jǐn)?shù)統(tǒng)計(jì)概率小于所設(shè)置進(jìn)入方程的標(biāo)準(zhǔn)值則該變量進(jìn)入模型 SPSS默認(rèn)的顯著性水平為0 05刪除設(shè)置變量被剔除方程的標(biāo)準(zhǔn)值如果變量的分?jǐn)?shù)統(tǒng)計(jì)概率大于所設(shè)置被剔除出方程的標(biāo)準(zhǔn)值則將該變量剔除出方程 SPSS默認(rèn)的顯著性水平為0 10 分類標(biāo)準(zhǔn)值選項(xiàng)用以確定個(gè)案分類的中止點(diǎn) 因變量預(yù)測(cè)值大于分類中止點(diǎn)的個(gè)案設(shè)歸為正個(gè)案一類因變量預(yù)測(cè)值小于分類中止點(diǎn)的個(gè)案設(shè)為負(fù)個(gè)案 SPSS設(shè)中止點(diǎn)缺省值為0 5 我們可以通過(guò)輸入0 01 0 99之間任一數(shù)值改變?nèi)笔≈?從而產(chǎn)生新的分類表最大迭代次數(shù) 選項(xiàng)用以確定最大對(duì)數(shù)似然值達(dá)到之前的迭代次數(shù) 最大對(duì)數(shù)似然值是通過(guò)反復(fù)迭代計(jì)算知道收斂為止而得到的 SPSS中該項(xiàng)的缺省值為20 我們可以重新輸入一個(gè)新的正整數(shù)來(lái)改變此項(xiàng)的值選項(xiàng)說(shuō)明 5 在保存中只選擇預(yù)測(cè)值中的概率組成員即原始數(shù)據(jù)個(gè)案中每一個(gè)個(gè)案最后的預(yù)測(cè)分類情況 PRE 1 PGR 1分別是最后的預(yù)測(cè)結(jié)果中的預(yù)測(cè)概率和預(yù)測(cè)組的變量名做完后才會(huì)在數(shù)據(jù)視圖中出現(xiàn) 6 單擊繼續(xù) 按鈕返回上一個(gè)對(duì)話框然后單擊確定按鈕即可得到SPSS回歸分析的結(jié)果 112 第二個(gè)表格說(shuō)明初始的因變量值 0 1 已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的0 1數(shù)值 SPSS輸出結(jié)果文件如下 1 第一部分輸出結(jié)果有兩個(gè)表格第一個(gè)表格說(shuō)明所有個(gè)案 28個(gè) 都被選入作為回歸分析的個(gè)案 6 結(jié)果討論和分析結(jié)果分析 2020 3 10 114 可編輯 2 第二部分 Block0 輸出結(jié)果有4個(gè)表格第1個(gè)輸出表格列出迭代過(guò)程其中常數(shù)項(xiàng)包括在模型中初始 2LL為38 673 迭代結(jié)束于第二步因?yàn)榇藭r(shí)參數(shù)與其在上一步的變化已經(jīng)小于0 001 第2個(gè)分類表說(shuō)明Step0的擬合效果可以看出對(duì)于y 0 有100 的準(zhǔn)確性對(duì)于y 1 有0 準(zhǔn)確性總共有53 6 的準(zhǔn)確性此時(shí)參數(shù)估計(jì)的變化表現(xiàn)為對(duì)數(shù)似然值的變化分類表結(jié)果分析下面兩個(gè)表格給出了模型系數(shù)的檢驗(yàn)結(jié)果其中常數(shù)項(xiàng)的系數(shù)值為 0 143 其伴隨概率為0 706 可見常數(shù)項(xiàng)不顯著 X1 X2 X3的系數(shù)通過(guò)了檢驗(yàn) 即這兩個(gè)變量顯著各回歸系數(shù)指數(shù)函數(shù)值結(jié)果分析 3 表格列出了模型系數(shù)的綜合檢驗(yàn)結(jié)果 4 表格給出了 2對(duì)數(shù)似然值 Cox和Snell的R2以及Nagelkerke的R2檢驗(yàn)統(tǒng)計(jì)結(jié)果 cox和snell的R2是在似然值基礎(chǔ)上模仿線性回歸模型的R2解釋Logistic回歸模型一般小于1 為了對(duì)cox和snell的R2進(jìn)一步調(diào)整使得取值范圍在0 1之間 Nagelkerke把cox和snell的R2除以它的最大值即Nagelkerke的R2 5 表格給出了Hosmer和Lemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量 HosmerandLemeshow檢驗(yàn) HosmerandLemeshow檢驗(yàn)的隨機(jī)性表與一般擬合優(yōu)度檢驗(yàn)不同 Hosmer和Lemeshow的擬合優(yōu)度檢驗(yàn)通常把樣本數(shù)據(jù)根據(jù)預(yù)測(cè)概率分為10組然后根據(jù)觀測(cè)頻數(shù)和期望頻數(shù)構(gòu)造卡方統(tǒng)計(jì)量即Hosmer和Lemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量簡(jiǎn)稱H L擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量最后根據(jù)自由度為8的卡方分布計(jì)算其p值并對(duì)Logistic模型進(jìn)行檢驗(yàn) 如果該P(yáng)值小于給定的顯著性水平如 0 05 表明模型的預(yù)測(cè)值與觀測(cè)值存在顯著差異如果P值大于給定的顯著性水平表明在可接受的水平上模型的估計(jì)擬合了數(shù)據(jù) 大于0 05 表明擬合了數(shù)據(jù) 6 分類表說(shuō)明第一次迭代結(jié)果的擬合效果從該表格可以看出對(duì)于y 0 有86 7 的準(zhǔn)確性對(duì)于y 1 有76 9 準(zhǔn)確性因此對(duì)于所有個(gè)案總共有82 1 的準(zhǔn)確性正確分類比例預(yù)測(cè)值觀測(cè)值 7 方程中的變量表格列出了Step1中各個(gè)變量對(duì)應(yīng)的系數(shù) 以及該變量對(duì)應(yīng)的Wald統(tǒng)計(jì)量和它對(duì)應(yīng)的相伴概率從該表格中可以看出X3相伴概率最小 Wald統(tǒng)計(jì)量最大可見該標(biāo)量在模型中很重要 wald統(tǒng)計(jì)量用于判斷個(gè)變量是否應(yīng)該包含在模型中 SPSS軟件沒(méi)有給出Logisticc回歸的標(biāo)準(zhǔn)化回歸系數(shù) 因此如果要考慮每個(gè)自變量在回歸方程中的重要性不妨直接比較Wald統(tǒng)計(jì)量的大小或sig Wald統(tǒng)計(jì)量大者或sig值小者顯著性高也就更重要 8 相關(guān)矩陣表格列出了常數(shù)Constant 系數(shù)之間的相關(guān)矩陣常數(shù)與月收入之間相關(guān)性最大年齡和性別之間的相關(guān)性最小相關(guān)矩陣 9 下圖所示是觀測(cè)值和預(yù)測(cè)概率分布圖該圖以0和1為符號(hào) 每四個(gè)符號(hào)代表一個(gè)個(gè)案橫坐標(biāo)是個(gè)案屬于1的隸屬度這里稱為預(yù)測(cè)概率 PredictedProbability 縱坐標(biāo)是個(gè)案分布頻數(shù) 反映個(gè)案的分布如果邏輯回歸預(yù)測(cè)完全準(zhǔn)確那么該坐標(biāo)圖中預(yù)測(cè)概率是0 0 5之間的個(gè)案都應(yīng)該是0 0 5 1之間的個(gè)案都應(yīng)該是1 該例生成的圖基本上符合這個(gè)效果不正確的結(jié)果包括預(yù)測(cè)概率是0 0 5之間的個(gè)案中有3個(gè)實(shí)際的觀測(cè)值為1 0 5 1之間的個(gè)案觀測(cè)值有2個(gè)為0 這是錯(cuò)誤預(yù)測(cè)的結(jié)果觀測(cè)值和預(yù)測(cè)概率分布圖 10 邏輯回歸的最后一個(gè)輸出表格式CasewiseList 列出了殘差大于2的個(gè)案本例中列出了兩個(gè)符合條件的個(gè)案分別是第10個(gè)案和第19個(gè)案這兩個(gè)個(gè)案都有表明這兩個(gè)個(gè)案的邏輯回歸結(jié)果是錯(cuò)誤的案例列表殘差標(biāo)準(zhǔn)化殘差 124 案例2 多項(xiàng)Logistic回歸分析某快餐公司為了提高早餐的市場(chǎng)份額對(duì)880名消費(fèi)者做了一份調(diào)查請(qǐng)利用多項(xiàng)Logistic回歸方法分析3種早餐的市場(chǎng)銷售情況數(shù)據(jù)見表L 1 125 操作步驟 1 輸入數(shù)據(jù) 126 2 在分析菜單的回歸子菜單中選擇多項(xiàng)Logistic 命令進(jìn)行多項(xiàng)Logistic回歸分析 127 3 變量設(shè)置選擇相應(yīng)的因變量因子項(xiàng)目接著點(diǎn)擊參考類別對(duì)因變量設(shè)置參考類別分別有第一類最后一類用戶指定取值三種類別然后選擇類別順序根據(jù)圖示設(shè)置 128 4 模型設(shè)置點(diǎn)擊模型進(jìn)入模型界面選擇設(shè)定步進(jìn)式模型把因素列表中的 agecat 和 active 放入強(qiáng)制輸入項(xiàng) 欄建立項(xiàng)選擇主效應(yīng) 如圖進(jìn)行設(shè)置 129 5 統(tǒng)計(jì)量設(shè)置點(diǎn)擊統(tǒng)計(jì)量進(jìn)行圖示設(shè)置用于選擇關(guān)于統(tǒng)計(jì)模型的統(tǒng)計(jì)量用于選擇關(guān)于模型參數(shù)的輸出統(tǒng)計(jì)量設(shè)置分組定義 130 6 收斂標(biāo)準(zhǔn)設(shè)置點(diǎn)擊條件設(shè)置收斂準(zhǔn)則 131 7 選項(xiàng)設(shè)置點(diǎn)擊選項(xiàng) 在此設(shè)置逐步回歸的參數(shù) 132 8 保存設(shè)置點(diǎn)擊保存勾選需要保存到數(shù)據(jù)集中的變量 133 9 結(jié)果分析按確定獲得需要的分析結(jié)果擬合優(yōu)度表格零假設(shè)是模型能夠很好擬合原始數(shù)據(jù) Pearson統(tǒng)計(jì)量和偏差統(tǒng)計(jì)量的顯著水平都大于0 1 不能否定零假設(shè) 即最終模型顯著成立零假設(shè)認(rèn)為某效應(yīng)從模型中剔除后系數(shù)沒(méi)有變化由于卡方檢驗(yàn)的顯著水平 Sig值都遠(yuǎn)遠(yuǎn)小于0 01 故不能否定零假設(shè) 認(rèn)為3個(gè)效應(yīng)對(duì)系數(shù)的影響都是顯著的不能剔除 134 135 136 OrdinalRegression序數(shù)回歸分析相關(guān)分析與回歸分析定義是根據(jù)反應(yīng)變量水平是否有序來(lái)區(qū)分的有序多分類的Logistic回歸又稱之為等級(jí)回歸分析序數(shù)回歸的過(guò)程在語(yǔ)法中稱為PLUM 應(yīng)用如療效可以分為無(wú)效緩解好轉(zhuǎn) 治愈4個(gè)等級(jí) 其中緩解與好轉(zhuǎn)是病人的主觀體驗(yàn) 難以測(cè)量與量化用序數(shù)回歸就可以分析這樣的有序變量 OrdinalRegression序數(shù)回歸分析有序結(jié)果變量回歸的適用條件 1 一個(gè)因變量它是兩個(gè)或以上水平的分類變量無(wú)論是主觀名義變量或客觀有序結(jié)果變量的分類均可 2 一個(gè)或以上的協(xié)變量它可以是分類變量或連續(xù)型變量患者對(duì)藥物劑量可能的反應(yīng)可以分為無(wú) 輕微適度或劇烈輕微反應(yīng)和適度反應(yīng)之間的差別很難或不可能量化并且這種差別是取決于感覺的另外輕微反應(yīng)和適度反應(yīng)之間的差別可能比適度反應(yīng)和劇烈反應(yīng)之間的差別更大或更小相關(guān)分析與回歸分析序數(shù)回歸和線性回歸當(dāng)你試圖預(yù)測(cè)有序反應(yīng)時(shí) 一般線性回歸模型并不能很好地工作這些方法僅可以衡量結(jié)果定變量是在一個(gè)區(qū)間范圍這不是真正的有序結(jié)果變量因此回歸模型可能無(wú)法準(zhǔn)確反映數(shù)據(jù)之間的關(guān)系一個(gè)有序變量最重要的就是排序因此如果您將兩個(gè)相鄰的類別折疊成一個(gè)較大的類別這只是一個(gè)很小的變化使用舊的和新的類別建立的模型應(yīng)十分類似不幸的是線性回歸對(duì)類別的使用很敏感類別合并前建成的模型和合并后建成的模型有很大不同廣義線性模型適合每一類別中的有序變量的單獨(dú)方程每一個(gè)方程給出了在相應(yīng)類別或者任何較低類別中的預(yù)測(cè)概率沒(méi)有建立預(yù)測(cè)模型而所有的案件都必須在最后一類或較低類別其概率為1 正因?yàn)槿绱?對(duì)于最后一類預(yù)測(cè)方程是不需要的序數(shù)回歸數(shù)據(jù)注意事項(xiàng) 1 數(shù)據(jù) 假設(shè)因變量是序數(shù)并且可以是數(shù)值或字符串通過(guò)對(duì)因變量的值進(jìn)行升序排序來(lái)確定排列順序最低值定義第一個(gè)類別假設(shè)因變量是分類變量協(xié)變量必須為數(shù)值請(qǐng)注意使用多個(gè)連續(xù)協(xié)變量很容易使創(chuàng)建的單元概率表非常大 2 假設(shè) 只允許使用一個(gè)因變量并且必須指定該因變量另外對(duì)于多個(gè)自變量值的各個(gè)不同模式假設(shè)該因變量是獨(dú)立的多項(xiàng)變量輸出的統(tǒng)計(jì)量與圖形包括協(xié)變量中每個(gè)分類變量的觀測(cè)頻數(shù) 預(yù)測(cè)頻數(shù) 累計(jì)頻數(shù) 頻數(shù)與累計(jì)頻數(shù)的Pearson殘差觀察概率與預(yù)測(cè)概率和累積概率還有參數(shù)估計(jì)值的漸進(jìn)相關(guān)矩陣與協(xié)方差矩陣 Prarson卡方統(tǒng)計(jì)量似然比卡方統(tǒng)計(jì)量擬合優(yōu)度統(tǒng)計(jì)量迭代歷史參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差和Cox SnellR方統(tǒng)計(jì)量等序數(shù)回歸使用總體思路 1 需要確定因變量的序 2 需要決定是否使用預(yù)測(cè)模型的位置組件 3 需要決定是否使用規(guī)模組件如果需要確定哪一個(gè)預(yù)測(cè)值需要使用在許多

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

spss回歸分析大全ppt.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

spss回歸分析大全ppt.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔