spss教程相關(guān)分析與回歸模型的建立與分析_第1頁
spss教程相關(guān)分析與回歸模型的建立與分析_第2頁
spss教程相關(guān)分析與回歸模型的建立與分析_第3頁
spss教程相關(guān)分析與回歸模型的建立與分析_第4頁
spss教程相關(guān)分析與回歸模型的建立與分析_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章相關(guān)分析與回歸模型的建立與分析相關(guān)分析和回歸分析是統(tǒng)計(jì)分析方法中最重要內(nèi)容之一,是多元統(tǒng)計(jì)分析方法的基礎(chǔ)。相關(guān)分析和回歸分析主要用于研究和分析變量之間的相關(guān)關(guān)系,在變量之間尋求合適的函數(shù)關(guān)系式,特別是線性表達(dá)式。本章主要內(nèi)容:1、對變量之間的相關(guān)關(guān)系進(jìn)行分析(Correlate)。其中包括簡單相關(guān)分析(Bivariate)和偏相關(guān)分析(Partial)。2、建立因變量和自變量之間回歸模型(Regression),其中包括線性回歸分析(Linear)和曲線估計(jì)(CurveEstimation)。數(shù)據(jù)條件:參與分析的變量數(shù)據(jù)是數(shù)值型變量或有序變量。3.1相關(guān)分析在SPSS中,可以通過Anal

2、yze菜單進(jìn)行相關(guān)分析(Correlate),Correlate菜單如圖3.1所示。3.1.1簡單相關(guān)分析兩個(gè)變量之間的相關(guān)關(guān)系稱簡單相關(guān)關(guān)系。有兩種方法可以反映簡單相關(guān)關(guān)系。一是通過散點(diǎn)圖直觀地顯示變量之間關(guān)系,二是通過相關(guān)系數(shù)準(zhǔn)確地反映兩變量的關(guān)系程度。散點(diǎn)圖SPSS軟件的繪圖命令集中在Graphs菜單。下面通過例題來介紹具體操作方法。例1:數(shù)據(jù)庫SY-8中的變量X表示山東省人均國內(nèi)生產(chǎn)總值,Y表示山東省城鎮(zhèn)居民的消費(fèi)額(資料來源:山東省2003年統(tǒng)計(jì)年鑒),現(xiàn)畫出散點(diǎn)圖來觀察兩個(gè)變量的關(guān)聯(lián)程度。具體操作步驟如下:首先打開數(shù)據(jù)SY-8,然后單擊GraphsScatter,打開Seatter

3、plot散點(diǎn)圖對話框,如圖3.2所示。然后選擇需要的散點(diǎn)圖,圖中的四個(gè)選項(xiàng)依次是:Simple簡單散點(diǎn)圖Matrix矩陣散點(diǎn)圖Overlay重疊散點(diǎn)圖3-D三維散點(diǎn)圖圖3.2散點(diǎn)圖對話框如果只考慮兩個(gè)變量,可選擇簡單的散點(diǎn)圖Simple,然后點(diǎn)擊Define,打開SimpleSeatterplot對話框,如圖3.3所示。圖3.3SimpleSeatterplot對話框選擇變量分別進(jìn)入X軸和Y軸,點(diǎn)擊OK后就可以得到散點(diǎn)圖,見圖3.4。從下面輸出的人均國內(nèi)生產(chǎn)總值與城鎮(zhèn)居民消費(fèi)額的散點(diǎn)圖3.4中可以粗略地看出,兩個(gè)變量之間有強(qiáng)正相關(guān)的線性關(guān)系。人均國內(nèi)生產(chǎn)總值(元)圖3.4散點(diǎn)圖簡單相關(guān)分析操作

4、簡單相關(guān)分析是指兩個(gè)變量之間的相關(guān)分析,主要是指對兩變量之間的線性相關(guān)程度作出定量分析。仍然數(shù)據(jù)SY-8為例,說明居民收入與某商品的銷售量兩變量的相關(guān)分析過程,具體操作如下:1、打開數(shù)據(jù)庫SY-8后,單擊AnalyzetCorrelateTBivariate打開Bivariate對話框,見圖3.5所示。圖3.5Bivariate:Correlation兩變量相關(guān)分析對話框2、從左邊的變量框中選擇需要考察的兩個(gè)變量進(jìn)入Variables框內(nèi),從CorrelationCoefficients欄內(nèi)選擇相關(guān)系數(shù)的種類,有Pearson相關(guān)系數(shù),Kendalls致性系數(shù)和Spearman等級相關(guān)系數(shù)。從

5、檢驗(yàn)欄內(nèi)選擇檢驗(yàn)方式,有雙尾檢驗(yàn)和單尾檢驗(yàn)兩種。3、單擊Options按紐,選擇輸出項(xiàng)和缺失值的處理方式。本例中選擇輸出基本統(tǒng)計(jì)描述,見圖3.6所示。圖3.6BivariateCorrelation:Options對話框4、單擊OK,可以得到相關(guān)分析的結(jié)果。從表3.1(a)可以得到兩個(gè)變量的基本統(tǒng)計(jì)描述,從表(b)中可以得到相關(guān)系數(shù)及對相關(guān)系數(shù)的檢驗(yàn)結(jié)果,由于尾概率就小于0.01,故說明兩變量之間存在著顯著的線性相關(guān)性。表3.1(a)基本統(tǒng)計(jì)描述DescriptiveStatisticsMeanStd.DeviationN城鎮(zhèn)居民消費(fèi)額(元)2582.28002335.9638425人均國內(nèi)生

6、產(chǎn)總值(元)3689.88003701.5079825表3.1(b)相關(guān)系數(shù)檢驗(yàn)Correlations城鎮(zhèn)居民消費(fèi)額(元)人均國內(nèi)生產(chǎn)總值(元)城鎮(zhèn)居民消費(fèi)額(元)PearsonCorrelation1.998(*)Sig.(2-tailed)-.000N2525人均國內(nèi)生產(chǎn)總值(元)PearsonCorrelation.998(*)1Sig.(2-tailed).000-N2525*Correlationissignificantatthe0.01level(2-tailed).從表3.1(b)中可以看到兩個(gè)變量相關(guān)性分析的結(jié)果:相關(guān)系數(shù)是0.998,相關(guān)程度非常高,且假設(shè)檢驗(yàn)的P值遠(yuǎn)遠(yuǎn)地

7、小于0.05,可以認(rèn)為居民收入與某產(chǎn)品的銷量存在線性正相關(guān)關(guān)系。3.1.2偏相關(guān)分析簡單相關(guān)關(guān)系只反映兩個(gè)變量之間的關(guān)系,但如果因變量受到多個(gè)因素的影響時(shí),因變量與某一自變量之間的簡單相關(guān)關(guān)系顯然受到其它相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其它因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分析。例2:為了考察火柴銷售量的影響因素,選擇煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量作為影響因素,得數(shù)據(jù)表3.2。試求火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù).表3.2火柴銷量及影響因素表(見參考文獻(xiàn)1)年份火柴銷售量(萬件)煤氣戶數(shù)(萬戶)卷煙銷量(百箱)蚊香銷量(十萬盒)打火石銷量(百萬粒

8、)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.

9、1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17解:根據(jù)數(shù)據(jù)表建立數(shù)據(jù)文件SY-9,求解火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù)具體操作如下:1、首先打開數(shù)據(jù)文件SY-9,單擊AnalyzetCorrelateTPartial,打開PartialCorrelations對話框,見圖3.7所示。2、從左邊框內(nèi)選擇要考察的兩個(gè)變量進(jìn)入Variables框內(nèi),其它客觀存在的變量作為控制變量進(jìn)入Controllingfor框內(nèi),如本例中考察煤氣戶數(shù)與火柴銷量的偏相關(guān)系數(shù)進(jìn)入Var

10、iables框內(nèi),其它相關(guān)變量(除年份外)進(jìn)入Controllingfor框內(nèi)。3、單擊Options按紐,打開Options對話框如圖3.8所示。從Statistics欄中選擇輸出項(xiàng),有平均值及標(biāo)準(zhǔn)差,Zero-ordercorrelations表示在輸出偏相關(guān)系數(shù)的同時(shí)輸出變量間的簡單相關(guān)系數(shù)。另外還有缺失值的處理方式。本例中選擇簡單相關(guān)系數(shù)。圖3.8PartialCorrelate:Options對話框4、選擇結(jié)束后,單擊OK得輸出結(jié)果,如表3.3所示。表3.3偏相關(guān)分析輸出表-PARTIALCORRELATIONCOEFFICIENTS-ZeroOrderPartials簡單相關(guān)火柴銷

11、量煤氣戶數(shù)打火石量蚊香銷量卷煙銷量火柴銷量1.0000.8260-.4902.8083.8788(簡單相關(guān)系數(shù))(0)(13)(13)(13)(13)(自由度)P=.P=.000P=.064P=.000P=.000(P值)煤氣戶數(shù).82601.0000-.0230.9489.9029(13)(0)(13)(13)(13)P=.000P=.P=.935P=.000P=.000打火石量-.4902-.02301.0000-.0070-.0295(13)(13)(0)(13)(13)P=.064P=.935P=.P=.980P=.917蚊香銷量.8083.9489-.00701.0000.9030(

12、13)(13)(13)(0)(13)P=.000P=.000P=.980P=.P=.000卷煙銷量.8788.9029-.0295.90301.0000(13)(13)(13)(13)(0)P=.000P=.000P=.917P=.000P=.(Coefficient/(D.F.)/2-tailedSignificance).1r*.isprintedifacoefficientcannotbecomputed-PARTIALCORRELATIONCOEFFICIENTS偏相關(guān)系數(shù)-Controllingfor(控制變量).打火石量蚊香銷量卷煙銷量火柴銷量煤氣戶數(shù)火柴銷量1.0000.6046

13、(偏相關(guān)系數(shù))(0)(10)(自由度)P=.P=.037(P值)煤氣戶數(shù).60461.0000(10)(0)P=.037P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed表中的上半部分是簡單相關(guān)系數(shù),下半部分是偏相關(guān)系數(shù)。從表中可以看出,火柴銷量與煤氣戶數(shù)的簡單相關(guān)系數(shù)為0.8260,自由度為13,檢驗(yàn)的P值為0.000;而偏相關(guān)系數(shù)為0.6046,自由度為10,檢驗(yàn)的P值為0.037,表示煤氣戶數(shù)對火柴銷量的真實(shí)影響是顯著的。3.2線性回歸分析線性回歸是統(tǒng)計(jì)分析方法中最常用的

14、方法之一。如果所研究的現(xiàn)象有若干個(gè)影響因素,且這些因素對現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。這一節(jié)將專門介紹SPSS軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對輸出結(jié)果的分析等相關(guān)內(nèi)容。3.2.1線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)1、線性回歸的假設(shè)理論(1)正態(tài)性假設(shè):即所研究的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無自相關(guān)性,

15、即誤差項(xiàng)之間互不相關(guān),Cov,s)=0ij2、線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。3.2.2線性回歸分析的具體步驟SPSS軟件中進(jìn)行線性回歸分析的選擇項(xiàng)為AnalyzeRegressionLinear。如圖3.9所示。下面通過例題介紹線性回歸分析的操作過程。圖3.9Regression分析功能菜單例3.仍然用例2的數(shù)據(jù),考察火柴銷售量與各影響因素之間的相關(guān)關(guān)系,建立火柴銷售量對于相關(guān)因素

16、煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量的線性回歸模型,通過對模型的分析,找出合適的線性回歸方程。解:建立線性回歸模型的具體操作步驟如下:1、打開數(shù)據(jù)文件SY-9,單擊AnalyzetRegressiontLinear打開Linear對話框如圖3.10所示。2、從左邊框中選擇因變量Y進(jìn)入Dependent框內(nèi),選擇一個(gè)或多個(gè)自變量進(jìn)入Independent框內(nèi)。從Method框內(nèi)下拉式菜單中選擇回歸分析方法,有強(qiáng)行進(jìn)入法(Enter),消去法(Remove),向前選擇法(Forward),向后剔除法(Backward)及逐步回歸法(Stepwise)五種。本例中選擇逐步回歸法(Stepwise

17、)。圖3.10LinearRegression對話框3、單擊Statistics,打開LinearRegression:Statistics對話框,可以選擇輸出的統(tǒng)計(jì)量如圖3.11所示。RegressionCoefficients欄,回歸系數(shù)選項(xiàng)欄。Estimates(系統(tǒng)默認(rèn)):輸出回歸系數(shù)的相關(guān)統(tǒng)計(jì)量:包括回歸系數(shù),回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量值)及相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量概率的P值(sig)。本例中只選擇此項(xiàng)。Confidenceintervals:輸出每一個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)95%的置信區(qū)間。Covariancematrix:輸出協(xié)方差矩陣。與模型擬合及擬合效果有關(guān)的選擇項(xiàng)

18、。Modelfit是默認(rèn)項(xiàng)。能夠輸出復(fù)相關(guān)系數(shù)R、R2及R2修正值,估計(jì)值的標(biāo)準(zhǔn)誤,方差分析表。Rsquaredchange:引入或剔除一個(gè)變量時(shí),R2的變化。Descriptives:基本統(tǒng)計(jì)描述。PartandPartialcorrelations:相關(guān)系數(shù)及偏相關(guān)系數(shù)。Collinearitydiagnostics:共線性診斷。主要對于多元回歸模型,分析各自變量的之間的共線性的統(tǒng)計(jì)量:包括容忍度和方差膨脹因子、特征值,條件指數(shù)等。本例中選擇上面所有的統(tǒng)計(jì)項(xiàng)。Residuals殘差欄Durbin-Watson:D.W檢驗(yàn).Casewisediagnostics:奇異值診斷,有兩個(gè)選項(xiàng):Ou

19、tliersoutside()standarddeviations:奇異值判據(jù),默認(rèn)項(xiàng)標(biāo)準(zhǔn)差三3。Allcase輸出所有觀測量的殘差值。本例中選擇D.W檢驗(yàn)及奇異值診斷,選擇標(biāo)準(zhǔn)差為2,即置信度約為95%。圖3.11LinearRegression:Statistics4、如果需要觀察圖形,可單擊Plots按紐,打開LinearRegression:Plots對話框如圖3.12所示。在此對話框中可以選擇所需要的圖形。圖3.12LinearRegression:Plots對話框在左上角的源變量框中,選擇Dependent進(jìn)入X(或Y)軸變量框,選擇其它變量進(jìn)入Y(或X)軸變量框,除因變量外,其客

20、觀存在變量依次是:ZPRED:標(biāo)準(zhǔn)化預(yù)測值,ZRESID:標(biāo)準(zhǔn)化殘差,DRESID:剔除殘差,ADJPRED:修正后預(yù)測值,SRESID學(xué)生化殘差,SDRESID:學(xué)生化剔除殘差。StandardizedResidualPlots欄,標(biāo)準(zhǔn)化殘差圖類型,有選擇項(xiàng):Histogram:標(biāo)準(zhǔn)化殘差直方圖Normalprobabilityplot標(biāo)準(zhǔn)化殘差序列的正態(tài)分布概率圖.Produceallpartialplots依次繪制因變量和所有自變量的散布圖本例中選擇因變量Dependent與標(biāo)準(zhǔn)化殘差ZRESID的殘差圖。5、單擊Options按紐,打開LinearRegression:Options對

21、話框,如圖3.13所示??梢詮闹羞x擇模型擬合判斷準(zhǔn)則SteppingMethodCriteria及缺失值的處理方式。UseprobabilityofF:采用F檢驗(yàn)的概率為判別依據(jù)。UseFvalue:采用F值作為檢驗(yàn)標(biāo)準(zhǔn)。Includeconstantinequation回歸方程中包括常數(shù)項(xiàng)。MissingValues缺失值的處理方式。本例中選擇系統(tǒng)默認(rèn)項(xiàng)。6、如果要保存預(yù)測值等數(shù)據(jù),可單擊Save按紐打開LinearRegression:Save對話框。選擇需要保存的數(shù)據(jù)種類作為新變量存在數(shù)據(jù)編輯窗口。其中有預(yù)測值、殘差,預(yù)測區(qū)間等。本例中不做選擇。7、當(dāng)所有選擇完成后,單擊OK得到分析結(jié)果

22、。主要的分析結(jié)果見表3.4。表3.4(a)ModelSummary(d)模型綜合分析表ModelRRSquareAdjustedRSquareStd.ErroroftheEstimateChangeStatistics變動分析Durbin-WatsonRSquareChangeFChangedf1df2Sig.FChange1.879(a).772.7552.44047.77244.085113.0002.994(b).988.986.58304.216215.772112.0003.997(c).994.993.41783.00612.365111.0052.066aPredictors:(

23、Constant),卷煙銷量(萬箱)bPredictors:(Constant),卷煙銷量(萬箱),打火石銷量(百萬粒)cPredictors:(Constant),卷煙銷量(萬箱),打火石銷量(百萬粒),煤氣戶數(shù)(萬戶)dDependentVariable:火柴銷量(萬件)表3.4(a)模型綜合分析中有模型的復(fù)相關(guān)系數(shù)R,樣本決定系數(shù)R2修正的可決系數(shù)可2,估計(jì)標(biāo)準(zhǔn)誤,模型變化導(dǎo)致的可決系數(shù)及F值的變化,D.W檢驗(yàn)值等。由上表中知模型3的修正的可決系數(shù)為0.993,其模型的擬合程度最好,DW值為2.066,顯然通過DW檢驗(yàn),說明殘差項(xiàng)不存在一階自相關(guān)。表3.4(b)方差分析表ANOVAdMo

24、delSumofSquaresdfMeanSquareFSig.1Regression262.5661262.56644.085.000aResidual77.427135.956Total339.993142Regression335.9142167.957494.090.000bResidual4.07912.340Total339.993143Regression338.0733112.691645.483.000cResidual1.92011.175Total339.99314Predict。rs:(Constant),萬箱Predictors:(Constant),萬箱,百萬粒Pr

25、edictors:(Constant),萬箱,百萬粒,萬戶DependentVariable:萬件方差分析表3.4(b)同時(shí)給出了3個(gè)模型的方差分析表。其中模型3的F值最大,說明模型3的回歸效果最顯著。表3.4(c)回歸系數(shù)Model非標(biāo)準(zhǔn)化回歸系數(shù)UnstandardizedCoefficients標(biāo)準(zhǔn)化回歸系數(shù)StandardizedCoefficients檢驗(yàn)統(tǒng)計(jì)量tP值Sig.相關(guān)系數(shù)Correlations共線性統(tǒng)計(jì)CollinearityStatistics單相關(guān)容忍度方差膨Std.Zero-or偏相關(guān)Toleranc脹因子BErrorBetaderPartialParteVIF1

26、(Constant)13.3921.9996.698.000卷煙銷量(萬箱).320.048.8796.640.000.879.879.8791.0001.0002(Constant)17.240.54531.647.000卷煙銷量(萬箱).315.012.86527.347.000.879.992.865.9991.001打火石銷量(百萬粒)-.243.017-.465-14.689.000-.490-.973-.464.9991.0013(Constant)17.420.39444.243.000卷煙銷量(萬箱).254.019.69813.228.000.879.970.300.1855

27、.417打火石銷量(百萬粒)-.243.012-.465-20.526.000-.490-.987-.465.9991.001煤氣戶數(shù)(萬戶).049.014.1853.516.005.826.727.080.1855.415aDependentVariable:火柴銷量(萬件)表3.4(c)中的Model欄中,模型1是先將卷煙銷量作為自變量進(jìn)入模型,模型2將卷煙銷量與打火石銷量兩個(gè)自變量進(jìn)入模型,模型3是將卷煙、打火石和煤氣戶數(shù)三個(gè)自變量進(jìn)入模型。第四個(gè)自變量蚊香銷量沒有通過檢驗(yàn)自動剔除。回歸系數(shù)表的輸出結(jié)果可以看出,回歸系數(shù)都通過檢驗(yàn),模型中自變量與因變量的偏相關(guān)系數(shù)都在0.7以上,說明進(jìn)

28、入模型的自變量對因變量的影響都比較顯著。由最后兩列的容忍度Tolerance和方差膨脹因子VIF的值來看,自變量之間不存在強(qiáng)烈的共線性。表3.4(d)相關(guān)系數(shù)表Correlations火柴銷量(萬件)煤氣戶數(shù)(萬戶)卷煙銷量(萬箱)蚊香銷量(十萬盒)打火石銷量(百萬粒)PearsonCorrelation火柴銷量(萬件)1.000.826.879.808-.490煤氣戶數(shù)(萬戶).8261.000.903.949-.023卷煙銷量(萬箱).879.9031.000.903-.029蚊香銷量(十萬盒).808.949.9031.000-.007打火石銷量(百萬粒)-.490-.023-.029-

29、.0071.000Sig.(1-tailed)火柴銷量(萬件)-.000.000.000.032煤氣戶數(shù)(萬戶).000.000.000.468卷煙銷量(萬箱).000.000.000.458蚊香銷量(十萬盒).000.000.000.490打火石銷量(百萬粒).032.468.458.490.N火柴銷量(萬件)1515151515煤氣戶數(shù)(萬戶)1515151515卷煙銷量(萬箱)1515151515蚊香銷量(十萬盒)1515151515打火石銷量(百萬粒)1515151515相關(guān)分析表中表示的相關(guān)系數(shù)是全部變量(自變量與因變量)的兩兩變量之間的簡單相關(guān)系數(shù)和相關(guān)性檢驗(yàn)。表3.4(e)殘差統(tǒng)

30、計(jì)ResidualsStatisticsMinimumMaximumMeanStd.DeviationNPredictedValue17.927232.153225.98934.9140715Residual-.9332.9950.0000.3703715Std.PredictedValue-1.6411.254.0001.00015Std.Residual-2.2332.381.000.88615a.DependentVariable萬件殘差統(tǒng)計(jì)表3.4(e)表示了預(yù)測值、殘差、標(biāo)準(zhǔn)化預(yù)測值和標(biāo)準(zhǔn)化殘差的特征值。其中包括預(yù)測值及殘差項(xiàng)的最小值和最大值、均值、標(biāo)準(zhǔn)誤和樣本容量。表3.4(f)共

31、線性診斷表:CollinearityDiagnosticsModelDimensionEigenvalueConditionIndexVarianeeProportions(Constant)萬箱百萬粒萬戶111.9491.000.03.032.057212.7421.000.01.01.032.2123.597.03.12.843.0467.73313.6641.000.01.00.02.002.2623.742.00.01.74.023.0647.568.84.01.24.074.01118.30.91a.DependentVa

32、rible:萬件共線性診斷表中第二列是特征值,第三列是條件指數(shù),最后一列是方差比。最大的條件指數(shù)小于20,說明自變量之間不存在比較強(qiáng)烈的共線性。Scatterplot表3.4(h)標(biāo)準(zhǔn)化殘差圖:奇異值表3.4(g)中依次是序號,標(biāo)準(zhǔn)化殘差值,實(shí)際觀測值、預(yù)測值及殘差值。表中給出的兩個(gè)個(gè)體數(shù)據(jù)的標(biāo)準(zhǔn)化殘差(數(shù)據(jù)號為12和14)超出了2。3DependentVariable:萬件口口口口口口16182022242628303234表3.4(g)奇異值表(標(biāo)準(zhǔn)化殘差值大于2)CasewiseDiagnosticsaCaseNumberStd.Residual萬件PredictedValueResid

33、ual122.38129.6928.6950.995014-2.23331.0531.9832-.9332a.DependentVariable:萬件萬件由圖中可以看出,殘差圖中的點(diǎn)分布是隨機(jī)的,沒有出現(xiàn)趨勢性,所以回歸模型是有效的。最終得回歸模型為:y=17.42+0.254x+0.049x-0.243x1243.3曲線估計(jì)上節(jié)介紹了線性回歸模型的分析和檢驗(yàn)方法。如果某對變量數(shù)據(jù)的散點(diǎn)圖不是直線,而是某種曲線的形式時(shí),可以利用曲線估計(jì)的方法為數(shù)據(jù)尋求一條合適的曲線,也可用變量代換的方法將曲線方程變?yōu)橹本€方程,用線性回歸模型進(jìn)行分析和預(yù)測。SPSS提供了多種曲線方程。列出表3.5如下:表3.5

34、可化為線性方程的曲線方程函數(shù)名稱方程形式相應(yīng)的線性回歸方程Linear線性函數(shù)y=b+bx01Quadratic二次多項(xiàng)式y(tǒng)=b+bx+bx2012y=b+bx+bxx=x2012Compound復(fù)合模型y=bbx01lny=Inb+xlnb01Growth生長曲線y=e(b0+sx)y,=+bxy,=lnyLogarithmic對數(shù)函數(shù)y=b+bInx丿01y=b+bx!X=lnx01Cubic三次多項(xiàng)式y(tǒng)=b+bx+bx2+bx30123y=b+bx+bx+bxx=x2;x=X3J0123SS曲線y=e(b0+b1/x)y=b+bxy=lny;x=1/xExponential指數(shù)函數(shù)y=b

35、eb1xy=b+bxy=lny;b=lnb0100Inverse逆函數(shù)y=b+(b/x)01y=b+bxx=1/x01Power幕函數(shù)y=b(xb1)y=b+bxy=lny;b=lnb0100 x=lnxLogistic邏輯曲線y=(1/u+bbx)-101y=b+bx01y=ln(1/y一1/u);b=加氣曲;=lnb這里以例題說明曲線擬合的具體操作方法。例4:表3.6表示的是全國1990年至2002年人均消費(fèi)支出與教育支出的統(tǒng)計(jì)數(shù)據(jù),試以人均消費(fèi)性支出為解釋變量,教育支出作為被解釋變量,擬合用一條合適的函數(shù)曲線。表3.6人均消費(fèi)支出與教育支出數(shù)據(jù)表(見參考文獻(xiàn)3)年份人均消費(fèi)性支出(元)教

36、育支出(兀)19901627.6438.2419911854.2247.9119922203.657.5619933138.5671.0019944442.09153.9819955565.68194.6219966544.73307.9519977188.71419.1919987911.94542.7819997493.31556.9320007997.37656.2820019463.071091.8520029396.451062.13解:首先根據(jù)上表建立數(shù)據(jù)SY-10,作出人均消費(fèi)支出與教育支出的散點(diǎn)圖3.14如下:年人均消費(fèi)性支出(元)圖3.14人均消費(fèi)與教育支出的散點(diǎn)圖由上面圖形

37、可以看出,兩個(gè)變量的散點(diǎn)圖為增長的曲線形式,故選擇合適的函數(shù)進(jìn)行曲線估計(jì)。具體操作如下:1、單擊AnalyzetRegressiontCurveEstimation打開CurveEstimation對話框。如圖3.15所示:圖3.15CurveEstimation曲線估計(jì)對話框2、選擇估計(jì)曲線:SPSS有多條曲線形式供選擇。根據(jù)散點(diǎn)圖,本例中選擇Quadratic,Power,和Compound曲線進(jìn)行對比分析。3、單擊Save按紐,打開Save對話框如圖3.16所示。圖3.16CurveEstimation:Save對話框選擇需要保存到數(shù)據(jù)表中的項(xiàng)目。在SaveVariables欄中,復(fù)選項(xiàng)

38、依次是:PredictedValues預(yù)測值、Residuals殘差、Predictionintervals預(yù)測區(qū)間,可以在下方框中選擇置信度,默認(rèn)值為95%。本例中不作選擇。4、所有選擇完成后,單擊OK,得到輸出結(jié)果如表3.7.:表3.7曲線估計(jì)輸出表與曲線圖教育支出ObservedQuadraticCompoundPowerIndependent:X決定系數(shù)自由度F值P值回歸系數(shù)DependentMthRsqd.f.FSigfb0b1b2YQUA.98710382.64.000252.698-.14752.5E-05YCOM.995112086.35.00020.95501.0004YPO

39、W.95411229.58.0003.6E-051.8460從表中可以看出,可決系數(shù)接近1的模型是Com復(fù)合函數(shù),同時(shí)也可通過圖形驗(yàn)證這三個(gè)模型對觀察值的擬合程度。下面對以上三個(gè)模型進(jìn)一步分析。在主對話框的下方選擇輸出方差分析表DisplayAMOVAtable,可得到方差分析表的詳細(xì)分析結(jié)果如表3.8所示:表3.8曲線估計(jì)及方差分析表Dependentvariable.Y復(fù)相關(guān)指數(shù)MuitipleR可決系數(shù)RSquare修正的可決系數(shù)Adjusted標(biāo)準(zhǔn)誤StandardErrorMethod.QUADRATI二次多項(xiàng)式.99353.98710RSquare.9845245.70690Ana

40、lysisofVariance:方差分析表自由度DF平方和SumofSquares均方MeanSquareRegression21598766.0799383.00Residuals1020891.22089.12F(檢驗(yàn)統(tǒng)計(jì)量)382.64096SignifF(假設(shè)檢驗(yàn)P值).0000VariablesintheEquationDependentvariable.YMethod.COMPOUND復(fù)合函數(shù)變量回歸系數(shù)標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)化系數(shù)T值P值VariableBSEBBetaTSigTX-.147527.025041-1.134958-5.892.0002X*22.46018091E-052.27

41、22E-062.08579710.827.0000(Constant)252.69789057.7922484.373.0014ListwiseDeletionofMissingDataMultipleR.99737RSquare.99476AdjustedRSquare.99428StandardError.09002AnalysisofVariance:DFSumofSquaresMeanSquareRegression116.90528916.905289Residuals11.089131.008103F=2086.35111SignifF=.0000VariablesintheEqu

42、ationVariableX(Constant)B1.00042020.955019SEBBeta9.1977E-061.226139TSigT2.711154108768.23.000017.090.0000Dependentvariable.YListwiseDeletionofMissingMultipleR.97687RSquare.95428AdjustedRSquare.95012StandardError.26578Method.POWER冪函數(shù)DataAnalysisofVariance:DFSumofSquaresMeanSquareRegression16.21738716.217387Residuals11.777033.070639F=229.58009SignifF=.0000VariablesintheEquationVariableBSEBBetaTSigTX1.845988.121832.97687115.152.0000(Constant)3.578170505

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論