spss教程第三章--相關(guān)分析與回歸模型的建立與分析講課教案_第1頁
spss教程第三章--相關(guān)分析與回歸模型的建立與分析講課教案_第2頁
spss教程第三章--相關(guān)分析與回歸模型的建立與分析講課教案_第3頁
spss教程第三章--相關(guān)分析與回歸模型的建立與分析講課教案_第4頁
spss教程第三章--相關(guān)分析與回歸模型的建立與分析講課教案_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。spss教程第三章-相關(guān)分析與回歸模型的建立與分析-第三章相關(guān)分析與回歸模型的建立與分析相關(guān)分析和回歸分析是統(tǒng)計(jì)分析方法中最重要內(nèi)容之一,是多元統(tǒng)計(jì)分析方法的基礎(chǔ)。相關(guān)分析和回歸分析主要用于研究和分析變量之間的相關(guān)關(guān)系,在變量之間尋求合適的函數(shù)關(guān)系式,特別是線性表達(dá)式。本章主要內(nèi)容:對(duì)變量之間的相關(guān)關(guān)系進(jìn)行分析(Correlate)。其中包括簡單相關(guān)分析(Bivariate)和偏相關(guān)分析(Partial)。建立因變量和自變量之間回歸模型(Regression),其中包括線性回歸分析(Linear)和曲線

2、估計(jì)(CurveEstimation)。數(shù)據(jù)條件:參與分析的變量數(shù)據(jù)是數(shù)值型變量或有序變量。3.1相關(guān)分析在SPSS中,可以通過Analyze菜單進(jìn)行相關(guān)分析(Correlate),Correlate菜單如圖3.1所示。圖3.1Correlate相關(guān)分析菜單3.1.1簡單相關(guān)分析兩個(gè)變量之間的相關(guān)關(guān)系稱簡單相關(guān)關(guān)系。有兩種方法可以反映簡單相關(guān)關(guān)系。一是通過散點(diǎn)圖直觀地顯示變量之間關(guān)系,二是通過相關(guān)系數(shù)準(zhǔn)確地反映兩變量的關(guān)系程度。散點(diǎn)圖SPSS軟件的繪圖命令集中在Graphs菜單。下面通過例題來介紹具體操作方法。例1:數(shù)據(jù)庫SY-8中的變量X表示山東省人均國內(nèi)生產(chǎn)總值,Y表示山東省城鎮(zhèn)居民的消費(fèi)

3、額(資料來源:山東省2003年統(tǒng)計(jì)年鑒),現(xiàn)畫出散點(diǎn)圖來觀察兩個(gè)變量的關(guān)聯(lián)程度。具體操作步驟如下:首先打開數(shù)據(jù)SY-8,然后單擊GraphsScatter,打開Scatterplot散點(diǎn)圖對(duì)話框,如圖3.2所示。然后選擇需要的散點(diǎn)圖,圖中的四個(gè)選項(xiàng)依次是:Simple簡單散點(diǎn)圖Matrix矩陣散點(diǎn)圖Overlay重疊散點(diǎn)圖3-D三維散點(diǎn)圖圖3.2散點(diǎn)圖對(duì)話框如果只考慮兩個(gè)變量,可選擇簡單的散點(diǎn)圖Simple,然后點(diǎn)擊Define,打開SimpleScatterplot對(duì)話框,如圖3.3所示。圖3.3SimpleScatterplot對(duì)話框選擇變量分別進(jìn)入X軸和Y軸,點(diǎn)擊OK后就可以得到散點(diǎn)圖,

4、見圖3.4。從下面輸出的人均國內(nèi)生產(chǎn)總值與城鎮(zhèn)居民消費(fèi)額的散點(diǎn)圖3.4中可以粗略地看出,兩個(gè)變量之間有強(qiáng)正相關(guān)的線性關(guān)系。圖3.4散點(diǎn)圖簡單相關(guān)分析操作簡單相關(guān)分析是指兩個(gè)變量之間的相關(guān)分析,主要是指對(duì)兩變量之間的線性相關(guān)程度作出定量分析。仍然數(shù)據(jù)SY-8為例,說明居民收入與某商品的銷售量兩變量的相關(guān)分析過程,具體操作如下:1、打開數(shù)據(jù)庫SY-8后,單擊AnalyzeCorrelateBivariate打開Bivariate對(duì)話框,見圖3.5所示。圖3.5Bivariate:Correlation兩變量相關(guān)分析對(duì)話框2、從左邊的變量框中選擇需要考察的兩個(gè)變量進(jìn)入Variables框內(nèi),從Cor

5、relationCoefficients欄內(nèi)選擇相關(guān)系數(shù)的種類,有Pearson相關(guān)系數(shù),Kendalls一致性系數(shù)和Spearman等級(jí)相關(guān)系數(shù)。從檢驗(yàn)欄內(nèi)選擇檢驗(yàn)方式,有雙尾檢驗(yàn)和單尾檢驗(yàn)兩種。3、單擊Options按紐,選擇輸出項(xiàng)和缺失值的處理方式。本例中選擇輸出基本統(tǒng)計(jì)描述,見圖3.6所示。圖3.6BivariateCorrelation:Options對(duì)話框4、單擊OK,可以得到相關(guān)分析的結(jié)果。從表3.1(a)可以得到兩個(gè)變量的基本統(tǒng)計(jì)描述,從表(b)中可以得到相關(guān)系數(shù)及對(duì)相關(guān)系數(shù)的檢驗(yàn)結(jié)果,由于尾概率就小于0.01,故說明兩變量之間存在著顯著的線性相關(guān)性。表3.1(a)基本統(tǒng)計(jì)描述

6、DescriptiveStatisticsMeanStd.DeviationN城鎮(zhèn)居民消費(fèi)額(元)2582.28002335.9638425人均國內(nèi)生產(chǎn)總值(元)3689.88003701.5079825表3.1(b)相關(guān)系數(shù)檢驗(yàn)Correlations城鎮(zhèn)居民消費(fèi)額(元)人均國內(nèi)生產(chǎn)總值(元)城鎮(zhèn)居民消費(fèi)額(元)PearsonCorrelation1.998(*)Sig.(2-tailed).000N2525人均國內(nèi)生產(chǎn)總值(元)PearsonCorrelation.998(*)1Sig.(2-tailed).000.N2525*Correlationissignificantatthe0.

7、01level(2-tailed).從表3.1(b)中可以看到兩個(gè)變量相關(guān)性分析的結(jié)果:相關(guān)系數(shù)是0.998,相關(guān)程度非常高,且假設(shè)檢驗(yàn)的P值遠(yuǎn)遠(yuǎn)地小于0.05,可以認(rèn)為居民收入與某產(chǎn)品的銷量存在線性正相關(guān)關(guān)系。3.1.2偏相關(guān)分析簡單相關(guān)關(guān)系只反映兩個(gè)變量之間的關(guān)系,但如果因變量受到多個(gè)因素的影響時(shí),因變量與某一自變量之間的簡單相關(guān)關(guān)系顯然受到其它相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其它因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分析。例2:為了考察火柴銷售量的影響因素,選擇煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量作為影響因素,得數(shù)據(jù)表3.2。試求火柴銷售量與煤氣戶數(shù)

8、的偏相關(guān)系數(shù).表3.2火柴銷量及影響因素表(見參考文獻(xiàn)1)年份火柴銷售量(萬件)煤氣戶數(shù)(萬戶)卷煙銷量(百箱)蚊香銷量(十萬盒)打火石銷量(百萬粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.46

9、27.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17解:根據(jù)數(shù)據(jù)表建立數(shù)據(jù)文件SY-9,求解火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù)具體操作如下:1、首先打開數(shù)據(jù)文件SY-9,單擊AnalyzeCorrelatePartial,打開PartialCorrelations對(duì)話框,見圖3.7所示。圖3.7PartialCorrelat

10、ions2、從左邊框內(nèi)選擇要考察的兩個(gè)變量進(jìn)入Variables框內(nèi),其它客觀存在的變量作為控制變量進(jìn)入Controllingfor框內(nèi),如本例中考察煤氣戶數(shù)與火柴銷量的偏相關(guān)系數(shù)進(jìn)入Variables框內(nèi),其它相關(guān)變量(除年份外)進(jìn)入Controllingfor框內(nèi)。3、單擊Options按紐,打開Options對(duì)話框如圖3.8所示。從Statistics欄中選擇輸出項(xiàng),有平均值及標(biāo)準(zhǔn)差,Zero-ordercorrelations表示在輸出偏相關(guān)系數(shù)的同時(shí)輸出變量間的簡單相關(guān)系數(shù)。另外還有缺失值的處理方式。本例中選擇簡單相關(guān)系數(shù)。圖3.8PartialCorrelate:Options對(duì)話

11、框4、選擇結(jié)束后,單擊OK得輸出結(jié)果,如表3.3所示。表3.3偏相關(guān)分析輸出表-PARTIALCORRELATIONCOEFFICIENTS-ZeroOrderPartials簡單相關(guān)火柴銷量煤氣戶數(shù)打火石量蚊香銷量卷煙銷量火柴銷量1.0000.8260-.4902.8083.8788(簡單相關(guān)系數(shù))(0)(13)(13)(13)(13)(自由度)P=.P=.000P=.064P=.000P=.000(P值)煤氣戶數(shù).82601.0000-.0230.9489.9029(13)(0)(13)(13)(13)P=.000P=.P=.935P=.000P=.000打火石量-.4902-.02301

12、.0000-.0070-.0295(13)(13)(0)(13)(13)P=.064P=.935P=.P=.980P=.917蚊香銷量.8083.9489-.00701.0000.9030(13)(13)(13)(0)(13)P=.000P=.000P=.980P=.P=.000卷煙銷量.8788.9029-.0295.90301.0000(13)(13)(13)(13)(0)P=.000P=.000P=.917P=.000P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed_-

13、PARTIALCORRELATIONCOEFFICIENTS偏相關(guān)系數(shù)-Controllingfor(控制變量).打火石量蚊香銷量卷煙銷量火柴銷量煤氣戶數(shù)火柴銷量1.0000.6046(偏相關(guān)系數(shù))(0)(10)(自由度)P=.P=.037(P值)煤氣戶數(shù).60461.0000(10)(0)P=.037P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed表中的上半部分是簡單相關(guān)系數(shù),下半部分是偏相關(guān)系數(shù)。從表中可以看出,火柴銷量與煤氣戶數(shù)的簡單相關(guān)系數(shù)為0.8260,自由度為13

14、,檢驗(yàn)的P值為0.000;而偏相關(guān)系數(shù)為0.6046,自由度為10,檢驗(yàn)的P值為0.037,表示煤氣戶數(shù)對(duì)火柴銷量的真實(shí)影響是顯著的。3.2線性回歸分析線性回歸是統(tǒng)計(jì)分析方法中最常用的方法之一。如果所研究的現(xiàn)象有若干個(gè)影響因素,且這些因素對(duì)現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。這一節(jié)將專門介紹SPSS軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對(duì)輸出結(jié)果的分析等相關(guān)內(nèi)容。3.2.1線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)

15、1、線性回歸的假設(shè)理論(1)正態(tài)性假設(shè):即所研究的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無自相關(guān)性,即誤差項(xiàng)之間互不相關(guān),Cov(i,j)=02、線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。3.2.2線性回歸分析的具體步驟SPSS軟件中進(jìn)行線性回歸分析的選擇項(xiàng)為AnalyzeRegressionLinear。如圖

16、3.9所示。下面通過例題介紹線性回歸分析的操作過程。圖3.9Regression分析功能菜單例3.仍然用例2的數(shù)據(jù),考察火柴銷售量與各影響因素之間的相關(guān)關(guān)系,建立火柴銷售量對(duì)于相關(guān)因素煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量的線性回歸模型,通過對(duì)模型的分析,找出合適的線性回歸方程。解:建立線性回歸模型的具體操作步驟如下:1、打開數(shù)據(jù)文件SY-9,單擊AnalyzeRegressionLinear打開Linear對(duì)話框如圖3.10所示。2、從左邊框中選擇因變量Y進(jìn)入Dependent框內(nèi),選擇一個(gè)或多個(gè)自變量進(jìn)入Independent框內(nèi)。從Method框內(nèi)下拉式菜單中選擇回歸分析方法,有強(qiáng)行進(jìn)

17、入法(Enter),消去法(Remove),向前選擇法(Forward),向后剔除法(Backward)及逐步回歸法(Stepwise)五種。本例中選擇逐步回歸法(Stepwise)。圖3.10LinearRegression對(duì)話框3、單擊Statistics,打開LinearRegression:Statistics對(duì)話框,可以選擇輸出的統(tǒng)計(jì)量如圖3.11所示。RegressionCoefficients欄,回歸系數(shù)選項(xiàng)欄。Estimates(系統(tǒng)默認(rèn)):輸出回歸系數(shù)的相關(guān)統(tǒng)計(jì)量:包括回歸系數(shù),回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量(t值)及相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量概率的P值(sig)。

18、本例中只選擇此項(xiàng)。Confidenceintervals:輸出每一個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)95的置信區(qū)間。Covariancematrix:輸出協(xié)方差矩陣。與模型擬合及擬合效果有關(guān)的選擇項(xiàng)。Modelfit是默認(rèn)項(xiàng)。能夠輸出復(fù)相關(guān)系數(shù)R、R2及R2修正值,估計(jì)值的標(biāo)準(zhǔn)誤,方差分析表。Rsquaredchange:引入或剔除一個(gè)變量時(shí),R2的變化。Descriptives:基本統(tǒng)計(jì)描述。PartandPartialcorrelations:相關(guān)系數(shù)及偏相關(guān)系數(shù)。Collinearitydiagnostics:共線性診斷。主要對(duì)于多元回歸模型,分析各自變量的之間的共線性的統(tǒng)計(jì)量:包括容忍度和方差膨脹因子

19、、特征值,條件指數(shù)等。本例中選擇上面所有的統(tǒng)計(jì)項(xiàng)。Residuals殘差欄Durbin-Watson:D.W檢驗(yàn).Casewisediagnostics:奇異值診斷,有兩個(gè)選項(xiàng):Outliersoutside()standarddeviations:奇異值判據(jù),默認(rèn)項(xiàng)標(biāo)準(zhǔn)差3。Allcase輸出所有觀測(cè)量的殘差值。本例中選擇D.W檢驗(yàn)及奇異值診斷,選擇標(biāo)準(zhǔn)差為2,即置信度約為95%。圖3.11LinearRegression:Statistics4、如果需要觀察圖形,可單擊Plots按紐,打開LinearRegression:Plots對(duì)話框如圖3.12所示。在此對(duì)話框中可以選擇所需要的圖形。

20、圖3.12LinearRegression:Plots對(duì)話框在左上角的源變量框中,選擇Dependent進(jìn)入X(或Y)軸變量框,選擇其它變量進(jìn)入Y(或X)軸變量框,除因變量外,其客觀存在變量依次是:ZPRED:標(biāo)準(zhǔn)化預(yù)測(cè)值,ZRESID:標(biāo)準(zhǔn)化殘差,DRESID:剔除殘差,ADJPRED:修正后預(yù)測(cè)值,SRESID學(xué)生化殘差,SDRESID:學(xué)生化剔除殘差。StandardizedResidualPlots欄,標(biāo)準(zhǔn)化殘差圖類型,有選擇項(xiàng):Histogram:標(biāo)準(zhǔn)化殘差直方圖Normalprobabilityplot標(biāo)準(zhǔn)化殘差序列的正態(tài)分布概率圖.Produceallpartialplots依次

21、繪制因變量和所有自變量的散布圖本例中選擇因變量Dependent與標(biāo)準(zhǔn)化殘差ZRESID的殘差圖。5、單擊Options按紐,打開LinearRegression:Options對(duì)話框,如圖3.13所示。可以從中選擇模型擬合判斷準(zhǔn)則SteppingMethodCriteria及缺失值的處理方式。圖3.13LinearRegression:Options對(duì)話框SteppingMethodCriteria欄,設(shè)置變量引入或剔除模型的判別標(biāo)準(zhǔn)。UseprobabilityofF:采用F檢驗(yàn)的概率為判別依據(jù)。UseFvalue:采用F值作為檢驗(yàn)標(biāo)準(zhǔn)。Includeconstantinequation回

22、歸方程中包括常數(shù)項(xiàng)。MissingValues缺失值的處理方式。本例中選擇系統(tǒng)默認(rèn)項(xiàng)。6、如果要保存預(yù)測(cè)值等數(shù)據(jù),可單擊Save按紐打開LinearRegression:Save對(duì)話框。選擇需要保存的數(shù)據(jù)種類作為新變量存在數(shù)據(jù)編輯窗口。其中有預(yù)測(cè)值、殘差,預(yù)測(cè)區(qū)間等。本例中不做選擇。7、當(dāng)所有選擇完成后,單擊OK得到分析結(jié)果。主要的分析結(jié)果見表3.4。表3.4(a)ModelSummary(d)模型綜合分析表ModelRRSquareAdjustedRSquareStd.ErroroftheEstimateChangeStatistics變動(dòng)分析Durbin-WatsonRSquareChan

23、geFChangedf1df2Sig.FChange1.879(a).772.7552.44047.77244.085113.0002.994(b).988.986.58304.216215.772112.0003.997(c).994.993.41783.00612.365111.0052.066aPredictors:(Constant),卷煙銷量(萬箱)bPredictors:(Constant),卷煙銷量(萬箱),打火石銷量(百萬粒)cPredictors:(Constant),卷煙銷量(萬箱),打火石銷量(百萬粒),煤氣戶數(shù)(萬戶)dDependentVariable:火柴銷量(萬件

24、)表3.4(a)模型綜合分析中有模型的復(fù)相關(guān)系數(shù)R,樣本決定系數(shù)R2,修正的可決系數(shù),估計(jì)標(biāo)準(zhǔn)誤,模型變化導(dǎo)致的可決系數(shù)及F值的變化,D.W檢驗(yàn)值等。由上表中知模型3的修正的可決系數(shù)為0.993,其模型的擬合程度最好,DW值為2.066,顯然通過DW檢驗(yàn),說明殘差項(xiàng)不存在一階自相關(guān)。表3.4(b)方差分析表方差分析表3.4(b)同時(shí)給出了3個(gè)模型的方差分析表。其中模型3的F值最大,說明模型3的回歸效果最顯著。表3.4(c)回歸系數(shù)Model非標(biāo)準(zhǔn)化回歸系數(shù)UnstandardizedCoefficients標(biāo)準(zhǔn)化回歸系數(shù)StandardizedCoefficients檢驗(yàn)統(tǒng)計(jì)量tP值Sig.相

25、關(guān)系數(shù)Correlations共線性統(tǒng)計(jì)CollinearityStatisticsBStd.ErrorBeta單相關(guān)Zero-order偏相關(guān)PartialPart容忍度Tolerance方差膨脹因子VIF1(Constant)13.3921.9996.698.000卷煙銷量(萬箱).320.048.8796.640.000.879.879.8791.0001.0002(Constant)17.240.54531.647.000卷煙銷量(萬箱).315.012.86527.347.000.879.992.865.9991.001打火石銷量(百萬粒)-.243.017-.465-14.689.

26、000-.490-.973-.464.9991.0013(Constant)17.420.39444.243.000卷煙銷量(萬箱).254.019.69813.228.000.879.970.300.1855.417打火石銷量(百萬粒)-.243.012-.465-20.526.000-.490-.987-.465.9991.001煤氣戶數(shù)(萬戶).049.014.1853.516.005.826.727.080.1855.415aDependentVariable:火柴銷量(萬件)表3.4(c)中的Model欄中,模型1是先將卷煙銷量作為自變量進(jìn)入模型,模型2將卷煙銷量與打火石銷量兩個(gè)自變

27、量進(jìn)入模型,模型3是將卷煙、打火石和煤氣戶數(shù)三個(gè)自變量進(jìn)入模型。第四個(gè)自變量蚊香銷量沒有通過檢驗(yàn)自動(dòng)剔除?;貧w系數(shù)表的輸出結(jié)果可以看出,回歸系數(shù)都通過檢驗(yàn),模型中自變量與因變量的偏相關(guān)系數(shù)都在0.7以上,說明進(jìn)入模型的自變量對(duì)因變量的影響都比較顯著。由最后兩列的容忍度Tolerance和方差膨脹因子VIF的值來看,自變量之間不存在強(qiáng)烈的共線性。表3.4(d)相關(guān)系數(shù)表Correlations火柴銷量(萬件)煤氣戶數(shù)(萬戶)卷煙銷量(萬箱)蚊香銷量(十萬盒)打火石銷量(百萬粒)PearsonCorrelation火柴銷量(萬件)1.000.826.879.808-.490煤氣戶數(shù)(萬戶).826

28、1.000.903.949-.023卷煙銷量(萬箱).879.9031.000.903-.029蚊香銷量(十萬盒).808.949.9031.000-.007打火石銷量(百萬粒)-.490-.023-.029-.0071.000Sig.(1-tailed)火柴銷量(萬件).000.000.000.032煤氣戶數(shù)(萬戶).000.000.000.468卷煙銷量(萬箱).000.000.000.458蚊香銷量(十萬盒).000.000.000.490打火石銷量(百萬粒).032.468.458.490.N火柴銷量(萬件)1515151515煤氣戶數(shù)(萬戶)1515151515卷煙銷量(萬箱)151

29、5151515蚊香銷量(十萬盒)1515151515打火石銷量(百萬粒)1515151515相關(guān)分析表中表示的相關(guān)系數(shù)是全部變量(自變量與因變量)的兩兩變量之間的簡單相關(guān)系數(shù)和相關(guān)性檢驗(yàn)。表3.4(e)殘差統(tǒng)計(jì)殘差統(tǒng)計(jì)表3.4(e)表示了預(yù)測(cè)值、殘差、標(biāo)準(zhǔn)化預(yù)測(cè)值和標(biāo)準(zhǔn)化殘差的特征值。其中包括預(yù)測(cè)值及殘差項(xiàng)的最小值和最大值、均值、標(biāo)準(zhǔn)誤和樣本容量。表3.4(f)共線性診斷表:共線性診斷表中第二列是特征值,第三列是條件指數(shù),最后一列是方差比。最大的條件指數(shù)小于20,說明自變量之間不存在比較強(qiáng)烈的共線性。表3.4(g)奇異值表(標(biāo)準(zhǔn)化殘差值大于2)奇異值表3.4(g)中依次是序號(hào),標(biāo)準(zhǔn)化殘差值,實(shí)

30、際觀測(cè)值、預(yù)測(cè)值及殘差值。表中給出的兩個(gè)個(gè)體數(shù)據(jù)的標(biāo)準(zhǔn)化殘差(數(shù)據(jù)號(hào)為12和14)超出了2。表3.4(h)標(biāo)準(zhǔn)化殘差圖:由圖中可以看出,殘差圖中的點(diǎn)分布是隨機(jī)的,沒有出現(xiàn)趨勢(shì)性,所以回歸模型是有效的。最終得回歸模型為:3.3曲線估計(jì)上節(jié)介紹了線性回歸模型的分析和檢驗(yàn)方法。如果某對(duì)變量數(shù)據(jù)的散點(diǎn)圖不是直線,而是某種曲線的形式時(shí),可以利用曲線估計(jì)的方法為數(shù)據(jù)尋求一條合適的曲線,也可用變量代換的方法將曲線方程變?yōu)橹本€方程,用線性回歸模型進(jìn)行分析和預(yù)測(cè)。SPSS提供了多種曲線方程。列出表3.5如下:表3.5可化為線性方程的曲線方程函數(shù)名稱方程形式相應(yīng)的線性回歸方程Linear線性函數(shù)Quadratic

31、二次多項(xiàng)式Compound復(fù)合模型Growth生長曲線Logarithmic對(duì)數(shù)函數(shù)Cubic三次多項(xiàng)式SS曲線Exponential指數(shù)函數(shù)Inverse逆函數(shù)Power冪函數(shù)Logistic邏輯曲線這里以例題說明曲線擬合的具體操作方法。例4:表3.6表示的是全國1990年至2002年人均消費(fèi)支出與教育支出的統(tǒng)計(jì)數(shù)據(jù),試以人均消費(fèi)性支出為解釋變量,教育支出作為被解釋變量,擬合用一條合適的函數(shù)曲線。表3.6人均消費(fèi)支出與教育支出數(shù)據(jù)表(見參考文獻(xiàn)3)年份人均消費(fèi)性支出(元)教育支出(元)19901627.6438.2419911854.2247.9119922203.657.561993313

32、8.5671.0019944442.09153.9819955565.68194.6219966544.73307.9519977188.71419.1919987911.94542.7819997493.31556.9320007997.37656.2820019463.071091.8520029396.451062.13解:首先根據(jù)上表建立數(shù)據(jù)SY-10,作出人均消費(fèi)支出與教育支出的散點(diǎn)圖3.14如下:圖3.14人均消費(fèi)與教育支出的散點(diǎn)圖由上面圖形可以看出,兩個(gè)變量的散點(diǎn)圖為增長的曲線形式,故選擇合適的函數(shù)進(jìn)行曲線估計(jì)。具體操作如下:1、單擊AnalyzeRegressionCurveE

33、stimation打開CurveEstimation對(duì)話框。如圖3.15所示:圖3.15CurveEstimation曲線估計(jì)對(duì)話框2、選擇估計(jì)曲線:SPSS有多條曲線形式供選擇。根據(jù)散點(diǎn)圖,本例中選擇Quadratic,Power,和Compound曲線進(jìn)行對(duì)比分析。3、單擊Save按紐,打開Save對(duì)話框如圖3.16所示。圖3.16CurveEstimation:Save對(duì)話框選擇需要保存到數(shù)據(jù)表中的項(xiàng)目。在SaveVariables欄中,復(fù)選項(xiàng)依次是:PredictedValues預(yù)測(cè)值、Residuals殘差、Predictionintervals預(yù)測(cè)區(qū)間,可以在下方框中選擇置信度,默

34、認(rèn)值為95%。本例中不作選擇。4、所有選擇完成后,單擊OK,得到輸出結(jié)果如表3.7.:表3.7曲線估計(jì)輸出表與曲線圖Independent:X決定系數(shù)自由度F值P值回歸系數(shù)DependentMthRsqd.f.FSigfb0b1b2YQUA.98710382.64.000252.698-.14752.5E-05YCOM.995112086.35.00020.95501.0004YPOW.95411229.58.0003.6E-051.8460從表中可以看出,可決系數(shù)接近1的模型是Com復(fù)合函數(shù),同時(shí)也可通過圖形驗(yàn)證這三個(gè)模型對(duì)觀察值的擬合程度。下面對(duì)以上三個(gè)模型進(jìn)一步分析。在主對(duì)話框的下方選擇

35、輸出方差分析表DisplayAMOVAtable,可得到方差分析表的詳細(xì)分析結(jié)果如表3.8所示:表3.8曲線估計(jì)及方差分析表Dependentvariable.YMethod.QUADRATI二次多項(xiàng)式復(fù)相關(guān)指數(shù)MultipleR.99353可決系數(shù)RSquare.98710修正的可決系數(shù)AdjustedRSquare.98452標(biāo)準(zhǔn)誤StandardError45.70690AnalysisofVariance:方差分析表自由度平方和均方DFSumofSquaresMeanSquareRegression21598766.0799383.00Residuals1020891.22089.12

36、F(檢驗(yàn)統(tǒng)計(jì)量)=382.64096SignifF(假設(shè)檢驗(yàn)P值)=.0000-VariablesintheEquation-變量回歸系數(shù)標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)化系數(shù)T值P值VariableBSEBBetaTSigTX-.147527.025041-1.134958-5.892.0002X*22.46018091E-052.2722E-062.08579710.827.0000(Constant)252.69789057.7922484.373.0014_Dependentvariable.YMethod.COMPOUND復(fù)合函數(shù)ListwiseDeletionofMissingDataMultipleR

37、.99737RSquare.99476AdjustedRSquare.99428StandardError.09002AnalysisofVariance:DFSumofSquaresMeanSquareRegression116.90528916.905289Residuals11.089131.008103F=2086.35111SignifF=.0000-VariablesintheEquation-VariableBSEBBetaTSigTX1.0004209.1977E-062.711154108768.23.0000(Constant)20.9550191.22613917.090

38、.0000_Dependentvariable.YMethod.POWER冪函數(shù)ListwiseDeletionofMissingDataMultipleR.97687RSquare.95428AdjustedRSquare.95012StandardError.26578AnalysisofVariance:DFSumofSquaresMeanSquareRegression116.21738716.217387Residuals11.777033.070639F=229.58009SignifF=.0000-VariablesintheEquation-VariableBSEBBetaTSigTX1.845988.121832.97687115.152.0000(Constant)3.5781705054E-053.7164E-05.963.3563從上面的輸出結(jié)果可以看出,比較各種估計(jì)模型的樣本決定系數(shù),標(biāo)準(zhǔn)誤,F(xiàn)值,擬合程度最好的復(fù)合函數(shù)曲線,并且其模型的回歸系數(shù)的檢驗(yàn)也通過。故可以選擇復(fù)合函數(shù)曲線作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論