SPSS做回歸分析(多元逐步)_第1頁
SPSS做回歸分析(多元逐步)_第2頁
SPSS做回歸分析(多元逐步)_第3頁
SPSS做回歸分析(多元逐步)_第4頁
SPSS做回歸分析(多元逐步)_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一、簡介一、簡介在現(xiàn)實生活中,客觀事物常受多種因素影響,我在現(xiàn)實生活中,客觀事物常受多種因素影響,我們記錄下相應數(shù)據(jù)并加以分析,們記錄下相應數(shù)據(jù)并加以分析,是為了是為了找出找出對我對我們所關心的指標(因變量)們所關心的指標(因變量)Y有有影響影響的的因素因素(也稱自變(也稱自變量或回歸變量)量或回歸變量)x1、x2、xm,并,并建立建立用用x1、x2、xm預報預報Y的經(jīng)驗的經(jīng)驗公式公式:mmmxbxbxbbxxxfY 2211021),(從而用以進行預測或控制,達到指導生產(chǎn)活動的目的。從而用以進行預測或控制,達到指導生產(chǎn)活動的目的。多元線性回歸多元線性回歸以年齡為自變量以年齡為自變量x,血壓為

2、因變量血壓為因變量y,可,可作出如下散點圖:作出如下散點圖:年齡394745476545674267563650392144血壓144120138145162142170124158154136142120120116年齡645659344248451720195363292569血壓162150140110128130135114116124158144130125175例例1、某醫(yī)學研究所對、某醫(yī)學研究所對30個不同年齡的人的血壓(高個不同年齡的人的血壓(高壓)進行了測量,得到如下數(shù)據(jù):壓)進行了測量,得到如下數(shù)據(jù): 為了判斷經(jīng)驗公式是否可用線性函數(shù)來擬合,可以為了判斷經(jīng)驗公式是否可用線性

3、函數(shù)來擬合,可以畫出散點圖觀察。其方法如下:畫出散點圖觀察。其方法如下:雙擊雙擊改變顯示格式改變顯示格式改變坐標軸的顯示改變坐標軸的顯示為了求得經(jīng)驗公式,為了求得經(jīng)驗公式,可通過如下步驟進可通過如下步驟進行:行:從散點圖可以從散點圖可以看出年齡與血看出年齡與血壓有線性關系:壓有線性關系:當自變量和當自變量和因變量選好因變量選好后,點擊后,點擊 OK 鍵鍵)(1)1(222為為樣樣本本數(shù)數(shù)為為自自變變量量個個數(shù)數(shù), NPPNRPRRa 1. Model為回歸方程模型編號為回歸方程模型編號(不同方法對應不同模型不同方法對應不同模型)2. R為回歸方程的復相關系數(shù)為回歸方程的復相關系數(shù)3. R Sq

4、uare即即R2系數(shù),用以判斷自變量對因變量的影響有多系數(shù),用以判斷自變量對因變量的影響有多大,但這并不意味著越大越好大,但這并不意味著越大越好自變量增多時,自變量增多時,R2系數(shù)系數(shù)會增大,但模型的擬合度未必更好會增大,但模型的擬合度未必更好4. Adjusted R Square即修正即修正R2,為了盡可能確切地反映模,為了盡可能確切地反映模型的擬合度,用該參數(shù)修正型的擬合度,用該參數(shù)修正R2系數(shù)偏差,它未必隨變量個系數(shù)偏差,它未必隨變量個數(shù)的增加而增加數(shù)的增加而增加5. Std. Error of the Estimate是估計的標準誤差是估計的標準誤差結果說明結果說明常用統(tǒng)計量:常用統(tǒng)

5、計量:1. Sum of Squares為回歸平方和(為回歸平方和(Regression)、殘差平方和)、殘差平方和(Residual)、總平方和()、總平方和(Total)2. df 為自由度為自由度3. Mean Square4. F5. Sig 為大于為大于F的概率,其值為的概率,其值為0.000,拒絕回歸系數(shù)為,拒絕回歸系數(shù)為0的原假的原假設:設:b0=b1=0即認為回歸方程顯著性成立即認為回歸方程顯著性成立結果說明結果說明方差分析:方差分析:1. Model 為回歸方程模型編號為回歸方程模型編號2. Unstandardized Coefficients 為非標準化系數(shù),為非標準化系

6、數(shù),B為系數(shù)值,為系數(shù)值,Std.Error為系數(shù)的標準差為系數(shù)的標準差3. Standardized Coefficients 為標準化系數(shù)為標準化系數(shù)4. t 為為t檢驗,是偏回歸系數(shù)為檢驗,是偏回歸系數(shù)為0(和常數(shù)項為和常數(shù)項為0)的假設檢驗的假設檢驗5. Sig. 為偏回歸系數(shù)為為偏回歸系數(shù)為0 (和常數(shù)項為和常數(shù)項為0)的假設檢驗的顯著性的假設檢驗的顯著性水平值水平值6. B 為為Beta系數(shù),系數(shù),Std.Error 為相應的標準差為相應的標準差結果說明結果說明回歸系數(shù)分析:回歸系數(shù)分析: 第一導絲盤速度第一導絲盤速度Y是合成纖維抽絲的重要因素,它是合成纖維抽絲的重要因素,它與電流

7、的周波與電流的周波X有密切關系,由生產(chǎn)記錄得:有密切關系,由生產(chǎn)記錄得:周波周波X 49.250.049.349.049.049.549.849.950.250.2速度速度Y 16.717.016.816.616.716.816.917.017.017.1 試求試求Y對對X的經(jīng)驗回歸直線方程,并求誤差方差的經(jīng)驗回歸直線方程,并求誤差方差2的的無偏估計值。無偏估計值。 檢驗檢驗X與與Y之間是否存在顯著的線性關系(取之間是否存在顯著的線性關系(取=0.01)?)?例例. 概率論與數(shù)理統(tǒng)計概率論與數(shù)理統(tǒng)計P267 例例9.2.120.04720.33890.0019yx 0.010.01117.12

8、82(1,8)11.260.9675(8)0.765FFRR檢驗說明線性關系顯著檢驗說明線性關系顯著操作步驟:操作步驟:AnalyzeRegression Linear StatisticsModel fit Descriptives結果:結果:mmmxbxbxbbxxxfY 2211021),(對于多元線性回歸主要需研究如下幾個問題:對于多元線性回歸主要需研究如下幾個問題:1) 建立因變量建立因變量Y與與x1、x2、xm的經(jīng)驗公式(回的經(jīng)驗公式(回歸方程)歸方程)2) 對經(jīng)驗公式的可信度進行檢驗對經(jīng)驗公式的可信度進行檢驗3) 判斷每個自變量判斷每個自變量xi(i=1, , m)對對Y的影響是

9、否顯的影響是否顯著?著?4) 利用經(jīng)驗公式進行預報、控制及指導生產(chǎn)利用經(jīng)驗公式進行預報、控制及指導生產(chǎn)5) 診斷經(jīng)驗公式是否適合這組數(shù)據(jù)診斷經(jīng)驗公式是否適合這組數(shù)據(jù)mmnxbxbxbbxxxfY 2211021),(0:2100 mbbbbH方差分析的主要思想是把方差分析的主要思想是把 yi 的總方差進行分解:的總方差進行分解: MSSESSyyyyyynidefiniiinii 121212模型平方和模型平方和誤差平方和誤差平方和二、多元線性回歸二、多元線性回歸1. 參數(shù)估計方法參數(shù)估計方法最小二乘法最小二乘法2. 回歸方程顯著性的檢驗回歸方程顯著性的檢驗就是檢驗以下假設是就是檢驗以下假設是

10、否成立(采用方差分析法):否成立(采用方差分析法): 如果自變量對如果自變量對Y的影響顯著,則總方差主要應由的影響顯著,則總方差主要應由xi引起,也就是原假設不成立,從而檢驗統(tǒng)計量為:引起,也就是原假設不成立,從而檢驗統(tǒng)計量為:)()()1(均均方方誤誤差差模模型型均均方方EMSMMSkmESSkMSSF 方差來方差來源源自由度自由度平方和平方和均方均方Fp值值自變量自變量mMSSMMSMMSEMSp隨機誤隨機誤差差n-m-1ESSEMS和和n-1TSS多元線性回歸的方差分析表:多元線性回歸的方差分析表: 在實際問題中,影響因變量在實際問題中,影響因變量Y的因素(自變量)可的因素(自變量)可能

11、很多。在回歸方程中,如果漏掉了重要因素,則會能很多。在回歸方程中,如果漏掉了重要因素,則會產(chǎn)生大的偏差;但如果回歸式中包含的因素太多,則產(chǎn)生大的偏差;但如果回歸式中包含的因素太多,則不僅使用不便,且可能影響預測精度。如何選擇適當不僅使用不便,且可能影響預測精度。如何選擇適當?shù)淖兞?,建立最?yōu)的回歸方程呢?的變量,建立最優(yōu)的回歸方程呢? 在最優(yōu)的方程中,所有變量對因變量在最優(yōu)的方程中,所有變量對因變量Y的影響都應的影響都應該是顯著的,而所有對該是顯著的,而所有對Y影響不顯著的變量都不包含影響不顯著的變量都不包含在方程中。選擇方法主要有:在方程中。選擇方法主要有:逐步篩選法逐步篩選法(STEPWIS

12、E) (最常用最常用)向前引入法向前引入法(FORWARD)向后剔除法向后剔除法(BACKWARD)等等逐步回歸逐步回歸變量選擇問題變量選擇問題開始開始對不在方程中的變對不在方程中的變量考慮能否引入?量考慮能否引入?引入變量引入變量能能對已在方程中的變對已在方程中的變量考慮能否剔除?量考慮能否剔除?能能剔除變量剔除變量否否篩選結束篩選結束否否逐步回歸的基本思想和步驟:逐步回歸的基本思想和步驟:某地區(qū)大春某地區(qū)大春糧食產(chǎn)量糧食產(chǎn)量 y 和大春糧食和大春糧食播種面積播種面積x1、化肥用量化肥用量x2、肥豬發(fā)展頭肥豬發(fā)展頭數(shù)數(shù)x3、水稻、水稻抽穗揚花期抽穗揚花期降雨量降雨量x4的的數(shù)據(jù)如下表,數(shù)據(jù)如

13、下表,尋求大春糧尋求大春糧食產(chǎn)量的預食產(chǎn)量的預報模型。報模型。YX1X2X3X4309.0137.04.015.027.0400.0148.06.026.038.0454.0154.010.033.020.0520.0157.018.038.099.0516.0153.013.041.043.0459.0151.010.039.033.0531.0151.015.037.046.0558.0154.016.038.078.0607.0155.027.044.052.0541.0155.036.051.022.0597.0156.046.053.039.0558.0155.047.051.028

14、.0619.0157.048.051.046.0618.0156.060.052.059.0742.0159.096.052.070.0805.0164.0191.057.052.0859.0164.0186.068.038.0855.0156.0195.074.032.0例例2、大春糧食產(chǎn)量的預報模型、大春糧食產(chǎn)量的預報模型1) 按按GraphsScatter Simple順序展開對話框順序展開對話框2) 將將y選入選入Y Axis,然后將其余變量逐個選入,然后將其余變量逐個選入X Axis ,繪出散點圖,觀察是否適宜用線性方程來擬合。繪出散點圖,觀察是否適宜用線性方程來擬合。1.初步分析(

15、作圖觀察)初步分析(作圖觀察)1) 按按StatisticsRegression Linear順序展開對話框順序展開對話框2) 將將y作為因變量選入作為因變量選入Dependent框中,然后將其余變框中,然后將其余變量選入作為自變量選入量選入作為自變量選入Independent(s)框中框中3. Method框中選擇框中選擇Stepwise(逐步回歸逐步回歸)作為分析方式作為分析方式4. 單擊單擊Statistics按鈕,按鈕,進行需要的選擇,進行需要的選擇,單擊單擊Continue返回返回5. 單擊單擊OK按鈕執(zhí)行按鈕執(zhí)行2. 回歸模型的建立回歸模型的建立被引入與被剔除的變量被引入與被剔除的

16、變量回歸方程模型編號回歸方程模型編號引入回歸方程的自變量名稱引入回歸方程的自變量名稱從回歸方程被剔除的自變量名稱從回歸方程被剔除的自變量名稱回歸方程中引入或剔除自變量的依據(jù)回歸方程中引入或剔除自變量的依據(jù)3. 結果分析結果分析由復相關系數(shù)由復相關系數(shù)R=0.982說明該預報說明該預報模型高度顯著,可用于該地區(qū)大春模型高度顯著,可用于該地區(qū)大春糧食產(chǎn)量的短期預報糧食產(chǎn)量的短期預報常用統(tǒng)計量常用統(tǒng)計量方差分析表方差分析表回歸方程為:回歸方程為:432359. 1626. 5100. 1059.205xxxy 按常識理解,糧食產(chǎn)量和播種面積關系密切,但預報按常識理解,糧食產(chǎn)量和播種面積關系密切,但預

17、報模型中,變量模型中,變量x1未引入,這是因為:未引入,這是因為:多年來該地區(qū)的大春糧食播種面積變化甚微,近多年來該地區(qū)的大春糧食播種面積變化甚微,近于常數(shù),因而對產(chǎn)量的影響不大而失去其重要性。于常數(shù),因而對產(chǎn)量的影響不大而失去其重要性?;貧w系數(shù)分析回歸系數(shù)分析 在汽油中加入兩種化學添加劑,觀察它們對汽車消在汽油中加入兩種化學添加劑,觀察它們對汽車消耗耗1公升汽油所行里程的影響,共進行公升汽油所行里程的影響,共進行9次試驗,得到次試驗,得到里程里程Y與兩種添加劑用量與兩種添加劑用量X1、X2之間數(shù)據(jù)如下:之間數(shù)據(jù)如下:xi1010120231xi2001102213yi15.8 16.0 15

18、.9 16.2 16.5 16.3 16.8 17.4 17.2試求里程試求里程Y關于關于X1、X2的經(jīng)驗線性回歸方程,并求的經(jīng)驗線性回歸方程,并求誤差方差誤差方差2的無偏估計值。的無偏估計值。例例. 概率論與數(shù)理統(tǒng)計概率論與數(shù)理統(tǒng)計P280 例例9.3.112215.64680.41390.31390.0387yxx 0.0130.6202(2,6)10.920.9543FFR 檢驗說明線性關系顯著檢驗說明線性關系顯著結果:結果: 在實際問題中,常會遇到變量之間關系不是線性的在實際問題中,常會遇到變量之間關系不是線性的相關關系,而是某種曲線的非線性相關關系。此時首相關關系,而是某種曲線的非線

19、性相關關系。此時首先要確定回歸函數(shù)的類型,其原則是:先要確定回歸函數(shù)的類型,其原則是:1. 根據(jù)問題的專業(yè)知識或經(jīng)驗確定根據(jù)問題的專業(yè)知識或經(jīng)驗確定2. 根據(jù)觀測數(shù)據(jù)的散點圖確定根據(jù)觀測數(shù)據(jù)的散點圖確定常選曲線類型:常選曲線類型:雙曲線、冪函數(shù)曲線、對數(shù)曲線、指數(shù)曲線、雙曲線、冪函數(shù)曲線、對數(shù)曲線、指數(shù)曲線、倒數(shù)指數(shù)曲線、倒數(shù)指數(shù)曲線、S形曲線形曲線三、非線性回歸三、非線性回歸鼠標在選項上點擊右鍵可看到相應模型類型鼠標在選項上點擊右鍵可看到相應模型類型操作步驟:操作步驟:AnalyzeRegression Curve Estimation結合結合SPSS的曲線模型選擇:的曲線模型選擇: 測量測量13個樣品中某種金屬含量個樣品中某種金屬含量Y與該樣品采集點距與該樣品采集點距中心觀測點的距離中心觀測點的距離X,有如下觀測值:,有如下觀測值:xi23457810yi106.42108.20109.58109.50110.00109.93110.49xi111415161819yi110.59106.62110.90110.76111.00111.20求求Y關于關于X的關系式。的關系式。106.30941.7172lnyx 例例. 概率論與數(shù)理統(tǒng)計概率論與數(shù)理統(tǒng)計P286 例例9.4.1首先繪出散點圖:首先繪出散點圖:Graphs Scatter Simple 步驟:步驟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論