




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第十章 SPSS軟件應(yīng)用(三)第二節(jié)第二節(jié) 回歸分析回歸分析回歸分析的概念尋求有關(guān)聯(lián)(相關(guān))的變量之間的關(guān)系主要內(nèi)容:n從一組樣本數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式n對(duì)這些關(guān)系式的可信度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn)n從影響某一變量的諸多變量中,判斷哪些變量的影響顯著,哪些不顯著n利用求得的關(guān)系式進(jìn)行預(yù)測和控制回歸分析的過程在回歸過程中包括:Liner:線性回歸Curve Estimation:曲線估計(jì)Binary Logistic: 二分變量邏輯回歸Multinomial Logistic:多分變量邏輯回歸Ordinal 序回歸Probit:概率單位回歸Nonlinear:非線性回歸Weight Est
2、imation:加權(quán)估計(jì)2-Stage Least squares:二段最小平方法Optimal Scaling 最優(yōu)編碼回歸回歸菜單回歸菜單回歸分析(regression analysis) 確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。p涉及的自變量的多少a. 一元回歸分析b. 多元回歸分析p自變量和因變量之間的關(guān)系類型,a. 線性回歸分析b. 非線性回歸分析線性回歸回歸分析一般步驟:確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸模型建立回歸方程對(duì)回歸方程進(jìn)行各種檢驗(yàn)利用回歸方程進(jìn)行預(yù)測線性回歸一元線性回歸模型是指只有一個(gè)解釋變量的線性回歸模型,用于揭示被
3、解釋變量與另一個(gè)解釋變量之間的線性關(guān)系。一元線性回歸數(shù)學(xué)模型:其中0和1是未知參數(shù),分別稱為回歸常數(shù)和回歸系數(shù),稱為隨機(jī)誤差,是一個(gè)隨機(jī)變量,且應(yīng)該滿足兩個(gè)前提條件: E( )=0 var()=201yx線性回歸模型線性回歸多元線性回歸模型是指有多個(gè)解釋變量的線性回歸模型,用于揭示被解釋變量與其他多個(gè)解釋變量之間的線性關(guān)系。多元線性回歸數(shù)學(xué)模型:其中0、1、 p都是未知參數(shù),分別稱為回歸常數(shù)和偏回歸系數(shù),稱為隨機(jī)誤差,是一個(gè)隨機(jī)變量,且同樣滿足兩個(gè)前提條件: E( )=0 var()=201122ppyxxx線性回歸線性回歸模型線性回歸模型假設(shè)條件線性回歸模型假設(shè)條件(1)正態(tài)性假設(shè):即所研究
4、的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè), 即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無自相關(guān)性,即誤差項(xiàng)之間互不相關(guān),Cov(i,j)= 0回歸參數(shù)的普通最小二乘估計(jì)(OLSE)線性回歸方程確定后的任務(wù)是利用已經(jīng)收集到的樣本數(shù)據(jù),根據(jù)一定的統(tǒng)計(jì)擬合準(zhǔn)則,對(duì)方程中的各參數(shù)進(jìn)行估計(jì)。普通最小二乘就是一種最為常見的統(tǒng)計(jì)擬合準(zhǔn)則。最小二乘法將偏差距離定義為離差平方和,即 (1)最小二乘估計(jì)就是尋找參數(shù)0 、1、 p的估計(jì)值0 、 1、 p,使式(1)達(dá)到極小。通過求極值原理(偏導(dǎo)為零)和解方程組,可求得估計(jì)值,SPSS將自動(dòng)完成。2011(,)()npiiiQ
5、yE y線性回歸一元線性回歸方程: y=a+bxa稱為截距b為回歸直線的斜率用R2判定系數(shù)判定一個(gè)線性回歸直線的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例)多元線性回歸方程: y=b0+b1x1+b2x2+bnxnb0為常數(shù)項(xiàng)b1、b2、bn稱為y對(duì)應(yīng)于x1、x2、xn的偏回歸系數(shù)用Adjusted R2調(diào)整判定系數(shù)判定一個(gè)多元線性回歸方程的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例)線性回歸模型的檢驗(yàn)項(xiàng)目線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(
6、5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。 u回歸方程的統(tǒng)計(jì)檢驗(yàn)u回歸方程的擬合優(yōu)度檢驗(yàn)(相關(guān)系數(shù)檢驗(yàn))一元線性回歸的擬合優(yōu)度檢驗(yàn)采用R2統(tǒng)計(jì)量,稱為判定系數(shù)或決定系數(shù),數(shù)學(xué)定義為22121()()niiniiyyRyy21()niiyy其中 稱為回歸平方和(SSA) 稱為總離差平方和(SST)21()niiyy線性回歸線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u回歸方程的擬合優(yōu)度檢驗(yàn)(相關(guān)系數(shù)檢驗(yàn)) R2取值在0-1之間, R2越接近于1,說明回歸方程對(duì)樣本數(shù)據(jù)點(diǎn)的擬合優(yōu)度越高。多元線性回歸的擬合優(yōu)度檢驗(yàn)采用 統(tǒng)計(jì)量,稱為調(diào)整的判定系數(shù)或調(diào)整的決定系數(shù),數(shù)學(xué)定義為
7、2R式中n-p-1、n-1分別是SSE和SST的自由度。其取值范圍和意義與一元回歸方程中的R2是相同的。u回歸方程的統(tǒng)計(jì)檢驗(yàn)u回歸方程的擬合優(yōu)度檢驗(yàn)(相關(guān)系數(shù)檢驗(yàn))2111SSEnpSSTnR 線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))一元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是1=0,檢驗(yàn)采用F統(tǒng)計(jì)量,其數(shù)學(xué)定義為:2121()()2niiniiiyyMSAFMSEyyn即平均的SSA/平均的SSE,F(xiàn)統(tǒng)計(jì)量服從(1,n-2)個(gè)自由度的F分布。SPSS將會(huì)自動(dòng)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認(rèn)為線性關(guān)系顯著。線性回歸u回歸方程
8、的統(tǒng)計(jì)檢驗(yàn)u回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))多元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是各個(gè)偏回歸系數(shù)同時(shí)為零,檢驗(yàn)采用F統(tǒng)計(jì)量,其數(shù)學(xué)定義為:即平均的SSA/平均的SSE,F(xiàn)統(tǒng)計(jì)量服從(p,n-p-1)個(gè)自由度的F分布。SPSS將會(huì)自動(dòng)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認(rèn)為y與x的全體的線性關(guān)系顯著。2121()()1niiniiiyyPMSAFMSEyynP線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))一元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假設(shè)是1=0,檢驗(yàn)采用t統(tǒng)計(jì)量,其數(shù)學(xué)定義為:121()niitxxt統(tǒng)計(jì)量服從n-2個(gè)自由
9、度的t分布。 SPSS將會(huì)自動(dòng)計(jì)算t統(tǒng)計(jì)量的觀測值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認(rèn)為x對(duì)y有顯著貢獻(xiàn),線性關(guān)系顯著。線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))多元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假設(shè)是i=0,檢驗(yàn)采用t統(tǒng)計(jì)量,其數(shù)學(xué)定義為:ti統(tǒng)計(jì)量服從n-p-1個(gè)自由度的t分布。 SPSS將會(huì)自動(dòng)計(jì)算ti統(tǒng)計(jì)量的觀測值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認(rèn)為xi對(duì)y有顯著貢獻(xiàn),應(yīng)保留在線性方程中。21()injiijixxt(i=1,2, ,p)線性回歸lt檢驗(yàn)與F檢驗(yàn)的關(guān)系l一元回歸中,F檢驗(yàn)與t檢驗(yàn)一
10、致,即: F=t2,兩種檢驗(yàn)可以相互替代l在多元回歸中,F(xiàn)檢驗(yàn)與t檢驗(yàn)不能相互替代lF統(tǒng)計(jì)量和R2值的關(guān)系l如果回歸方程的擬合優(yōu)度高,F(xiàn)統(tǒng)計(jì)量就越顯著。F統(tǒng)計(jì)量越顯著,回歸方程的擬合優(yōu)度就會(huì)越高。u回歸方程的統(tǒng)計(jì)檢驗(yàn)u殘差分析所謂殘差是指由回歸方程計(jì)算所得的預(yù)測值與實(shí)際樣本值之間的差距,即iiiyye它是回歸模型中 的估計(jì)值。如果回歸方程能較好地反映被解釋變量的特征和變化規(guī)律,那么殘差序列中應(yīng)不包含明顯的規(guī)律性和趨勢(shì)性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。 i線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u殘差分析均值為0的正態(tài)性分析殘
11、差均值為0的正態(tài)性分析,可以通過繪制殘差圖進(jìn)行分析,如果殘差均值為0,殘差圖中的點(diǎn)應(yīng)在縱坐標(biāo)為0的橫線上下隨機(jī)散落著。正態(tài)性可以通過繪制標(biāo)準(zhǔn)化(或?qū)W生化)殘差的累計(jì)概率圖來分析線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u殘差分析獨(dú)立性分析 繪制殘差序列的序列圖以樣本期(或時(shí)間)為橫坐標(biāo),殘差為縱坐標(biāo),如果殘差隨時(shí)間的推移呈規(guī)律性變化,則存在一定的正或負(fù)相關(guān)性。計(jì)算殘差的自相關(guān)系數(shù)取值在-1到+1之間,接近于+1表明序列存在正自相關(guān)性。 DW(DurbinWatson)檢驗(yàn)DW取值在0至4之間,直觀判斷標(biāo)準(zhǔn)是DW=4,殘差序列完全負(fù)自相關(guān);DW=2,完全無自相關(guān);DW=0,完全正自相關(guān)。線性回歸u回歸方程的統(tǒng)
12、計(jì)檢驗(yàn)u殘差分析異方差分析 繪制殘差圖如果殘差的方差隨著解釋變量值的增加呈增加(或減少)的趨勢(shì),說明出現(xiàn)了異方差現(xiàn)象。線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u殘差分析異方差分析 等級(jí)相關(guān)分析得到殘差序列后首先對(duì)其取絕對(duì)值,然后計(jì)算出殘差和解釋變量的秩,最后計(jì)算Spearman等級(jí)相關(guān)系數(shù),并進(jìn)行等級(jí)相關(guān)分析。具體過程見相關(guān)分析相關(guān)章節(jié)。線性回歸u回歸方程的統(tǒng)計(jì)檢驗(yàn)u殘差分析探測樣本中的異常值和強(qiáng)影響點(diǎn)(對(duì)于y值)強(qiáng)影響點(diǎn):指對(duì)多重線性回歸模型參數(shù)估計(jì)有很強(qiáng)影響的數(shù)據(jù)點(diǎn)標(biāo)準(zhǔn)化殘差ZRE由于殘差是服從均值為0的正態(tài)分布,因此可以根據(jù)3準(zhǔn)則進(jìn)行判斷,首先對(duì)殘差進(jìn)行標(biāo)準(zhǔn)化 ,絕對(duì)值大于3對(duì)應(yīng)的觀察值為異常值。學(xué)
13、生化殘差SRE剔除殘差DRE(或剔除學(xué)生化殘差SDRE)上述SRE、SDRE的直觀判斷標(biāo)準(zhǔn)同標(biāo)準(zhǔn)化殘差ZRE。iZREe線性回歸線性回歸變量多重共線性問題多重共線性:是指自變量間存在線性相關(guān),即一個(gè)自變量可用其他一個(gè)或幾個(gè)自變量的線性表達(dá)式進(jìn)行表示。導(dǎo)致偏回歸系數(shù)存在無窮多個(gè)解或無解,出現(xiàn)偏回歸系數(shù)難以有合乎專業(yè)知識(shí)的解釋容忍度Tol容忍度值越接近于1,表示多重共線性越弱。SPSS變量多重共線性的要求不很嚴(yán)格,只是在容忍度值太小時(shí)給出相應(yīng)警告信息。方差膨脹因子VIF膨脹因子是容忍度的倒數(shù),越接近于1,表示解釋變量間的多重共線性越弱。通常如果VIFi大于等于10,說明解釋變量xi與其余解釋變量之
14、間有嚴(yán)重的多重共線性。線性回歸21iiTolR 變量多重共線性問題特征根和方差比這里的特征根是指相關(guān)系數(shù)矩陣的特征根。如果最大特征根遠(yuǎn)遠(yuǎn)大于其他特征根的值,則說明這些解釋變量之間具有相當(dāng)多的重疊信息。條件指數(shù)ki10 ki 100時(shí),認(rèn)為多重共線性較強(qiáng), ki 100時(shí),認(rèn)為多重共線性很嚴(yán)重多重共線性的解決方法逐步回歸嶺回歸主成分回歸路徑分析線性回歸miiku變量篩選問題向前篩選策略 解釋變量不斷進(jìn)入回歸方程的過程,首先選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進(jìn)入方程,并進(jìn)行各種檢驗(yàn);其次在剩余的變量中挑選與解釋變量偏相關(guān)系數(shù)最高并通過檢驗(yàn)的變量進(jìn)入回歸方程。向后篩選策略 變量不斷剔除出回歸
15、方程的過程,首先所有變量全部引入回歸方程并檢驗(yàn),然后在回歸系數(shù)顯著性檢驗(yàn)不顯著的一個(gè)或多個(gè)變量中,剔除t檢驗(yàn)值最小的變量。逐步篩選策略 向前篩選與向后篩選策略的綜合線性回歸逐步回歸分析的基本原理按每個(gè)變量在方程中對(duì)應(yīng)變量作用的大小,由大到小依次引入回歸方程。具體作法:每引入一個(gè)自變量都要對(duì)回歸方程中每一個(gè)已引入的自變量的作用作統(tǒng)計(jì)意義檢驗(yàn),當(dāng)發(fā)現(xiàn)一個(gè)或幾個(gè)已被引入的自變量的作用無統(tǒng)計(jì)意義時(shí),即行剔除。每剔除一個(gè)自變量后,也要對(duì)仍留在回歸方程中的自變量逐個(gè)作統(tǒng)計(jì)意義檢驗(yàn)。如果發(fā)現(xiàn)方程中還存在作用無統(tǒng)計(jì)意義的自變量時(shí),也就剔除,直到?jīng)]有變量可引入,也無剔除時(shí)為止前進(jìn)、后退、逐步法的側(cè)重點(diǎn)不同。當(dāng)自
16、變量間不存在簡單線性相關(guān)時(shí),三種方法計(jì)算結(jié)果一致。當(dāng)自變量間存在一定的簡單線性相關(guān)時(shí):前進(jìn)法側(cè)重于向模型中引入單獨(dú)作用較強(qiáng)的變量后退法側(cè)重于向模型中引入聯(lián)合作用較強(qiáng)的變量逐步法介于兩者之間應(yīng)用線性回歸方程應(yīng)注意的問題1、作回歸分析要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象勉強(qiáng)作回歸分析,即便有回歸關(guān)系,也不一定有因果關(guān)系,還必須對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認(rèn)識(shí),即能從專業(yè)理論上作出合理解釋或有所依據(jù)2、在進(jìn)行線性回歸分析時(shí),應(yīng)繪散點(diǎn)圖,當(dāng)觀察點(diǎn)的分布有直線趨勢(shì),才適宜作直線回歸分析。散點(diǎn)圖還能提示資料有無異常點(diǎn),異常點(diǎn)對(duì)方程估計(jì)影響較大3、線性回歸方程的適用范圍一般以自變量的取值范圍為限,在此范圍求
17、出y的估計(jì)值,稱為內(nèi)插,超出自變量取值范圍稱外延。若無充分理由證明超過自變量取值范圍還是直線,應(yīng)該避免外延n回歸分析基本操作(1)選擇菜單AnalyzeRegressionLinear,出現(xiàn)如下對(duì)話框因變量自變量條件變量標(biāo)志變量篩選策略線性回歸(2)將因變量選入Dependent框(3)將一個(gè)或多個(gè)自變量選入Independengt(s)框(4)在Method框中選擇回歸分析中自變量的篩選策略。其中Enter表示所選變量強(qiáng)行進(jìn)入回歸方程,是SPSS默認(rèn)策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward、Forward分
18、別表示向后、向前篩選策略。n回歸分析基本操作線性回歸(5)上述(3)、(4)中確定的自變量和篩選策略可放置在不同的Block中,單擊 “Next”和“Previous”按鈕設(shè)置多組自變量和變量篩選策略,并放在不同Block中,SPSS將按照設(shè)置順序依次進(jìn)行分析?!癇lock”設(shè)置便于作各種探索性的回歸分析。n回歸分析基本操作線性回歸(6)選擇一個(gè)變量作為條件變量到Selection Variable框中,并單擊“Rule”按鈕給定一個(gè)判斷條件。只有變量值滿足給定條件的樣本數(shù)據(jù)才參與線性回歸分析。線性回歸n回歸分析基本操作(7)在Case Labels框中指定哪個(gè)變量作為數(shù)據(jù)樣本點(diǎn)的標(biāo)志變量,該
19、變量的值將標(biāo)在回歸分析的輸出圖形中。(8)WLS Weight中選人權(quán)重變量,主要用于加權(quán)最小二乘法。 至此便完成了線性回歸分析的基本操作,SPSS將根據(jù)指定自動(dòng)進(jìn)行回歸分析,并將結(jié)果輸出到輸出窗口中。線性回歸n回歸分析基本操作n回歸分析的其他操作StatisticsStatistics選項(xiàng)選項(xiàng)輸出與回歸系數(shù)相關(guān)的統(tǒng)計(jì)量,包括回歸系數(shù)、回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗(yàn)的t統(tǒng)計(jì)量和概率p值,個(gè)解釋變量的容忍度。每個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)的95%置信區(qū)間輸出各解釋變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)的方差線性回歸輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤、回歸方程顯著性檢驗(yàn)的方差
20、分析表每個(gè)解釋變量進(jìn)入方程后引起的判定系數(shù)的變化量和F值的變化量(偏F統(tǒng)計(jì)量)輸出個(gè)解釋變量和被解釋變量的均值、標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單側(cè)檢驗(yàn)概率值輸出方程中各解釋變量與被解釋變量之間的簡單相關(guān)、偏相關(guān)系數(shù)和部分相關(guān)線性回歸n回歸分析的其他操作StatisticsStatistics選項(xiàng)選項(xiàng)多重共線性分析:輸出各解釋變量的容忍度、方差膨脹因子、特征值、條件指標(biāo)、方差比例等DW值輸出標(biāo)準(zhǔn)化殘差絕對(duì)值大于等于3(默認(rèn))的樣本數(shù)據(jù)的相關(guān)信息線性回歸n回歸分析的其他操作StatisticsStatistics選項(xiàng)選項(xiàng)PlotsPlots選項(xiàng)選項(xiàng)標(biāo)準(zhǔn)化預(yù)測值標(biāo)準(zhǔn)化殘差剔除殘差調(diào)整的預(yù)測值學(xué)生化殘差剔除學(xué)
21、生化殘差標(biāo)準(zhǔn)化殘差序列直方圖標(biāo)準(zhǔn)化殘差序列正態(tài)分布累計(jì)概率圖依次繪制被解釋變量與各解釋變量的散點(diǎn)圖線性回歸n回歸分析的其他操作將選中結(jié)果作為新變量存入數(shù)據(jù)文件或新文件將選中結(jié)果作為新變量存入數(shù)據(jù)文件或新文件預(yù)測值觀測值與均值偏差預(yù)測值區(qū)間殘差值剔除某case后改變值SaveSave選項(xiàng)選項(xiàng)OptionsOptions選項(xiàng)選項(xiàng)設(shè)置多元線性回歸分析中解釋變量進(jìn)入或剔除出回歸方程的標(biāo)準(zhǔn)偏F統(tǒng)計(jì)量的概率值線性回歸n回歸分析的其他操作回歸分析中是否包含常數(shù)項(xiàng)【結(jié)果形式結(jié)果形式】可決系數(shù)-自變量可解釋因變量的比例模型的方差分析H0: b1=bn=0模型中常數(shù)項(xiàng)與回歸系數(shù)的檢驗(yàn)回歸方程為time=-1.95
22、5+3.457diamH0:a=0H0:bi=0u線性回歸分析的應(yīng)用舉例例10-2-1線性回歸【實(shí)例實(shí)例】為研究某公司職工當(dāng)前工資水平(為研究某公司職工當(dāng)前工資水平(salarysalary),),收集了影響因素收集了影響因素6 6個(gè),即開始工資(個(gè),即開始工資(salbeginsalbegin $ $)、受)、受教育時(shí)間(教育時(shí)間(educeduc)、來公司工作時(shí)間()、來公司工作時(shí)間(jobtimejobtime)、工)、工種(種(jobcatjobcat)、來前工作經(jīng)驗(yàn)()、來前工作經(jīng)驗(yàn)(prevexpprevexp)及是否少數(shù))及是否少數(shù)民族(民族(minorityminority),
23、試用多元線性回歸對(duì)該公司當(dāng)前工),試用多元線性回歸對(duì)該公司當(dāng)前工資水平建立恰當(dāng)回歸模型。資水平建立恰當(dāng)回歸模型?!緮?shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備】見下頁見下頁6個(gè)影響因素變量自變量逐步篩選【設(shè)置界面設(shè)置界面】【statistics按鈕按鈕】【Save按鈕按鈕】【結(jié)果形式結(jié)果形式】先后選入自變量, minority未選入未選入剔除變量復(fù)相關(guān)系數(shù),隨自變量的加入而增大,較大,線性相關(guān)高可決系數(shù)D-W統(tǒng)計(jì)量值:在1.52.5間無顯著自相關(guān)性隨自變量的加入,線性模型都有顯著效果H0:b1=b5=0H0:b1=b2=b3=0隨自變量的加入,因變量與自變量都顯著線性相關(guān)H0:a=0,bi=0 (j=1,.,5)標(biāo)準(zhǔn)化回
24、歸系數(shù)(無量綱),用于比較各變量重要程度大小 可見,第可見,第5個(gè)回歸方程為個(gè)回歸方程為 salary=-15038.574+1.365salbegin+5859.585jobcat-19.553prevexp+154.698jobtime+539.642educ 復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù)R=0.917,可決系數(shù),可決系數(shù)R2=0.84,經(jīng)檢驗(yàn),回,經(jīng)檢驗(yàn),回歸模型、回歸系數(shù)及歸模型、回歸系數(shù)及D-W檢驗(yàn)都有顯著統(tǒng)計(jì)學(xué)意義。檢驗(yàn)都有顯著統(tǒng)計(jì)學(xué)意義。 對(duì)工資水平影響較大的因素依次為對(duì)工資水平影響較大的因素依次為 開始工資、工種、來前工作經(jīng)驗(yàn)、來公司工作時(shí)間、受教開始工資、工種、來前工作經(jīng)驗(yàn)、來公司工
25、作時(shí)間、受教育時(shí)間。育時(shí)間。曲線回歸(估計(jì)、擬合) 變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可通過變量變換為線性關(guān)系,并最終可通過線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無法變換為線性關(guān)系。本節(jié)的曲線估計(jì)是解決本質(zhì)線性關(guān)系問題的。 Curve Estimation: 曲線估計(jì)分析曲線估計(jì)分析 曲線回歸曲線回歸(估計(jì)、擬合):選定一種用函數(shù)表達(dá)曲線,(估計(jì)、擬合):選定一種用函數(shù)表達(dá)曲線,使理論數(shù)據(jù)與實(shí)際數(shù)據(jù)間的差異
26、盡可能小。使理論數(shù)據(jù)與實(shí)際數(shù)據(jù)間的差異盡可能小。解決問題解決問題:(1)曲線模型的選擇;曲線模型的選擇;(2)模型參數(shù)的確定。模型參數(shù)的確定。 本質(zhì)非線性關(guān)系本質(zhì)線性關(guān)系非線性關(guān)系線性關(guān)系變量間關(guān)系可以經(jīng)變量變換轉(zhuǎn)化為線性關(guān)系,可以經(jīng)變量變換轉(zhuǎn)化為線性關(guān)系,SPSS中中Curve Estimation解決。解決。不能經(jīng)變換轉(zhuǎn)化為線性關(guān)系,用迭代或分段平不能經(jīng)變換轉(zhuǎn)化為線性關(guān)系,用迭代或分段平均值等方法處理,均值等方法處理, SPSS中中Nonlinear解決解決基本思路基本思路:通過散點(diǎn)圖及專業(yè)、經(jīng)驗(yàn)等確定函數(shù)類型,:通過散點(diǎn)圖及專業(yè)、經(jīng)驗(yàn)等確定函數(shù)類型,再利用再利用SPSSSPSS解決。解決
27、。SPSS曲線估計(jì)中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時(shí),可在多種可選擇的模型中選擇幾種模型;然后SPSS自動(dòng)完成模型的參數(shù)估計(jì),并輸出回歸方程顯著性檢驗(yàn)的F值和概率p值、判定系數(shù)R2等統(tǒng)計(jì)量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進(jìn)行預(yù)測分析等。另外,SPSS曲線估計(jì)還可以以時(shí)間為解釋變量實(shí)現(xiàn)時(shí)間序列的簡單回歸分析和趨勢(shì)外推分析。Curve Estimation中提供了中提供了11種本質(zhì)線性模型:種本質(zhì)線性模型:曲線估計(jì)的基本操作 可通過繪制并觀察樣本數(shù)據(jù)的散點(diǎn)圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線擬合中的模型選擇提供依據(jù)。SPSS曲線估計(jì)的基本操作步驟是:
28、(1)選擇菜單AnalyzeRegressionCurve Estimation,出現(xiàn)窗口如下頁所示。(2)把被解釋變量選到Dependent框中。(3)曲線估計(jì)中的解釋變量可以是相關(guān)因素變量也可是時(shí)間變量。如果解釋變量為相關(guān)因素變量,則選擇Variable選項(xiàng),并把一個(gè)解釋變量指定到Independent框;如果選擇Time參數(shù)則表示解釋變量為時(shí)間變量。(4)在Models中選擇幾種模型。(5)選擇Plot Models選項(xiàng)繪制回歸線;選擇Display ANOVA table輸出各個(gè)模型的方差分析表和各回歸系數(shù)顯著性檢驗(yàn)結(jié)果。 至此,完成了曲線估計(jì)的操作,SPSS將根據(jù)選擇的模型自動(dòng)進(jìn)行曲線估計(jì),并將結(jié)果顯示到輸出窗口中。【實(shí)例實(shí)例】某產(chǎn)品零售商已知產(chǎn)品的廣告投入和銷售某產(chǎn)品零售商已知產(chǎn)品的廣告投入和銷售額的數(shù)據(jù),試找出適當(dāng)?shù)幕貧w方程。額的數(shù)據(jù),試找出適當(dāng)?shù)幕貧w方程?!咀魃Ⅻc(diǎn)圖預(yù)分析作散點(diǎn)圖預(yù)分析】 Graphs-scatter/dotGraphs-scatt
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 種樹股份協(xié)議書
- 生產(chǎn)管理協(xié)議書
- 牙冠轉(zhuǎn)診協(xié)議書
- 物業(yè)顧問協(xié)議書
- 北京市重點(diǎn)高中10-11學(xué)年高一上學(xué)期期中考試(化學(xué))(國際)無答案
- 工程設(shè)計(jì)合同協(xié)議書
- 工程轉(zhuǎn)讓個(gè)人協(xié)議書
- 小區(qū)住房出售協(xié)議書
- 江蘇環(huán)保協(xié)議書
- 小型餐廳轉(zhuǎn)租協(xié)議書
- ESD標(biāo)準(zhǔn)培訓(xùn)資料ppt課件
- 河南省確山縣三里河治理工程
- 水利工程合同工程完工驗(yàn)收工程建設(shè)管理工作報(bào)告
- photoshop實(shí)訓(xùn)指導(dǎo)書
- 多級(jí)泵檢修及維護(hù)(1)
- 涵洞孔徑計(jì)算
- 測量未知電阻的方法
- 中國民主同盟入盟申請(qǐng)表
- SAP項(xiàng)目用戶操作手冊(cè)CO月結(jié)
- 觀感質(zhì)量檢查表
- 企業(yè)信息登記表
評(píng)論
0/150
提交評(píng)論