spss多元線性回歸實例_第1頁
spss多元線性回歸實例_第2頁
spss多元線性回歸實例_第3頁
spss多元線性回歸實例_第4頁
spss多元線性回歸實例_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、SPSS19.0實戰(zhàn)之多元線性回歸分析  (2011-12-09 12:19:11)轉(zhuǎn)載標(biāo)簽: 文化分類: 軟件介紹   線性回歸數(shù)據(jù)(全國各地區(qū)能源消耗量與產(chǎn)量)來源,可點擊協(xié)會博客數(shù)據(jù)挖掘欄:國泰安數(shù)據(jù)服務(wù)中心的經(jīng)濟(jì)研究數(shù)據(jù)庫。1.1 數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理包括的內(nèi)容非常廣泛,包括數(shù)據(jù)清理和描述性數(shù)據(jù)匯總,數(shù)據(jù)集成和變換,數(shù)據(jù)歸約,數(shù)據(jù)離散化等。本次實習(xí)主要涉及的數(shù)據(jù)預(yù)處理只包括數(shù)據(jù)清理和描述性數(shù)據(jù)匯總。一般意義的數(shù)據(jù)預(yù)處理包括缺失值填寫和噪聲數(shù)據(jù)的處理。于此我們只對數(shù)據(jù)做缺失值填充,但是依然將其統(tǒng)稱數(shù)據(jù)清理。1.1.1&

2、#160;數(shù)據(jù)導(dǎo)入與定義單擊“打開數(shù)據(jù)文檔 ”,將xls格式的全國各地區(qū)能源消耗量與產(chǎn)量的數(shù)據(jù)導(dǎo)入SPSS中,如圖1-1所示。                                   圖1-1 導(dǎo)入數(shù)據(jù)導(dǎo)入過程中,各個字段的值都被轉(zhuǎn)化為字

3、符串型(String),我們需要手動將相應(yīng)的字段轉(zhuǎn)回數(shù)值型。單擊菜單欄的“ ”->“ ”將所選的變量改為數(shù)值型。如圖1-2所示: 圖1-2 定義變量數(shù)據(jù)類型1.1.2 數(shù)據(jù)清理數(shù)據(jù)清理包括缺失值的填寫和還需要使用SPSS分析工具來檢查各個變量的數(shù)據(jù)完整性。單擊“ ”->“ ”,將檢查所輸入的數(shù)據(jù)的缺失值個數(shù)以及百分比等。如圖1-3所示:                  &#

4、160;        圖1-3缺失值分析能源數(shù)據(jù)缺失值分析結(jié)果如表1-1所示:                                    

5、0;                          單變量統(tǒng)計 N均值標(biāo)準(zhǔn)差缺失極值數(shù)目a計數(shù)百分比低高能源消費總量309638.506175.9240.001煤炭消費量309728.997472.2590.002焦炭消費量30874.611053.0080.002原油消費量281177.511282.74426.701汽油

6、消費量30230.05170.2700.001煤油消費量2845.4066.18926.704柴油消費量30392.34300.9790.002燃料油消費量30141.00313.4670.003天然氣消費量3019.5622.0440.002電力消費量30949.64711.6640.003原煤產(chǎn)量269125.9712180.689413.302焦炭產(chǎn)量291026.491727.73513.302原油產(chǎn)量181026.481231.7241240.000燃料油產(chǎn)量2590.72134.150516.703汽油產(chǎn)量26215.18210.090413.302煤油產(chǎn)量2048.4462.13

7、01033.300柴油產(chǎn)量26448.29420.675413.301天然氣產(chǎn)量2029.2849.3911033.303電力產(chǎn)量30954.74675.2300.000 表2-1 能源消耗量與產(chǎn)量數(shù)據(jù)缺失值分析                               

8、60;              表1-1 能源消耗量與產(chǎn)量數(shù)據(jù)缺失值分析SPSS提供了填充缺失值的工具,點擊菜單欄“ ”->“ ”,即可以使用軟件提供的幾種填充缺失值工具,包括序列均值,臨近點中值,臨近點中位數(shù)等。結(jié)合本次實習(xí)數(shù)據(jù)的具體情況,我們不使用SPSS軟件提供的替換缺失值工具,主要是手動將缺失值用零值來代替。 1.1.3 描述性數(shù)據(jù)匯總描述性數(shù)據(jù)匯總技術(shù)用來獲得數(shù)據(jù)的典型性質(zhì),我們關(guān)心數(shù)據(jù)的中心趨勢和離中趨勢,根據(jù)這些統(tǒng)

9、計值,可以初步得到數(shù)據(jù)的噪聲和離群點。中心趨勢的量度值包括:均值(mean),中位數(shù)(median),眾數(shù)(mode)等。離中趨勢量度包括四分位數(shù)(quartiles),方差(variance)等。SPSS提供了詳盡的數(shù)據(jù)描述工具,單擊菜單欄的“ ”->“ ”->“ ”,將彈出如圖2-4所示的對話框,我們將所有變量都選取到,然后在選項中勾選上所希望描述的數(shù)據(jù)特征,包括均值,標(biāo)準(zhǔn)差,方差,最大最小值等。由于本次數(shù)據(jù)的單位不盡相同,我們需要將數(shù)據(jù)標(biāo)準(zhǔn)化,同時勾選上“將標(biāo)準(zhǔn)化得分另存為變量”。 圖1-4 描述性數(shù)據(jù)匯總得到如表1-2所示的描述性數(shù)據(jù)匯總。 N極小值極大

10、值均值標(biāo)準(zhǔn)差方差能源消費總量30911261649638.506175.92438142034.412煤炭消費量30332290019728.997472.25955834651.378焦炭消費量30195461874.611053.0081108824.853原油消費量30055551099.011273.2651621202.562汽油消費量3018771230.05170.27028991.746煤油消費量30026242.3764.8964211.520柴油消費量30271368392.34300.97990588.441燃料油消費量3001574141.00313.46798261.

11、261天然氣消費量30110619.5622.044485.947電力消費量30983004949.64711.664506464.953原煤產(chǎn)量300581427909.1711741.3881.379E8焦炭產(chǎn)量3009202992.281707.9982917256.193原油產(chǎn)量2904341637.121085.3791178048.432燃料油產(chǎn)量30049775.60126.79116075.971汽油產(chǎn)量3001032186.49208.77143585.122煤油產(chǎn)量30021932.3055.3943068.535柴油產(chǎn)量3001911388.52420.216176581

12、.285天然氣產(chǎn)量30016419.5242.3711795.341電力產(chǎn)量30972536954.74675.230455935.003有效的 N (列表狀態(tài))29     表1-2 描述性數(shù)據(jù)匯總標(biāo)準(zhǔn)化后得到的數(shù)據(jù)值,以下的回歸分析將使用標(biāo)準(zhǔn)化數(shù)據(jù)。如圖1-5所示:                       &#

13、160;               圖1-5 數(shù)據(jù)標(biāo)準(zhǔn)化我們還可以通過描述性分析中的“ ”來得到各個變量的眾數(shù),均值等,還可以根據(jù)這些量繪制直方圖。我們選取個別變量(能源消費總量)的直方圖,可以看到我們因變量基本符合正態(tài)分布。如圖1-6所示:                 &

14、#160;               圖1-6能源消費總量1.2 回歸分析 我們本次實驗主要考察地區(qū)能源消費總額(因變量)與煤炭消費量、焦炭消費量、原油消費量、原煤產(chǎn)量、焦炭產(chǎn)量、原油產(chǎn)量之間的關(guān)系。以下的回歸分析所涉及只包括以上幾個變量,并使用標(biāo)準(zhǔn)化之后的數(shù)據(jù)。1.2.1 參數(shù)設(shè)置1.     單擊菜單欄“ ”->“ ”->“ ”,將彈出如圖1-7所示

15、的對話框,將通過選擇因變量和自變量來構(gòu)建線性回歸模型。因變量:標(biāo)準(zhǔn)化能源消費總額;自變量:標(biāo)準(zhǔn)化煤炭消費量、標(biāo)準(zhǔn)化焦炭消費量、標(biāo)準(zhǔn)化原油消費量、標(biāo)準(zhǔn)化原煤產(chǎn)量、標(biāo)準(zhǔn)化焦炭產(chǎn)量、標(biāo)準(zhǔn)化原油產(chǎn)量。自變量方法選擇:進(jìn)入,個案標(biāo)簽使用地名,不使用權(quán)重最小二乘法回歸分析即WLS權(quán)重為空。圖1-7選擇線性回歸變量還需要設(shè)置統(tǒng)計量的參數(shù),我們選擇回歸系數(shù)中的“ ”和其他項中的“ ”。選中估計可輸出回歸系數(shù)B及其標(biāo)準(zhǔn)誤,t值和p值,還有標(biāo)準(zhǔn)化的回歸系數(shù)beta。選中模型擬合度復(fù)選框:模型擬合過程中進(jìn)入、退出的變量的列表,以及一些有關(guān)擬合優(yōu)度的檢驗:R,R2和調(diào)整的R2, 標(biāo)準(zhǔn)誤及方差分析表。如圖1-8所示:&

16、#160;                              圖1-8 設(shè)置回歸分析統(tǒng)計量3.在設(shè)置繪制選項的時候,我們選擇繪制標(biāo)準(zhǔn)化殘差圖,其中的正態(tài)概率圖是rankit圖。同時還需要畫出殘差圖,Y軸選擇:ZRESID,X軸選擇: ZPRED。如圖1-9所示: 圖1-9 

17、;設(shè)置繪制左上框中各項的意義分別為:·     “DEPENDNT”因變量·     “ZPRED”標(biāo)準(zhǔn)化預(yù)測值·     “ZRESID”標(biāo)準(zhǔn)化殘差·     “DRESID”刪除殘差·     “ADJPRED”調(diào)節(jié)預(yù)測值·     “

18、SRESID”學(xué)生化殘差·     “SDRESID”學(xué)生化刪除殘差          4. 許多時候我們需要將回歸分析的結(jié)果存儲起來,然后用得到的殘差、預(yù)測值等做進(jìn)一步的分析,“保存”按鈕就是用來存儲中間結(jié)果的??梢源鎯Φ挠校侯A(yù)測值系列、殘差系列、距離(Distances)系列、預(yù)測值可信區(qū)間系列、波動統(tǒng)計量系列。本次實驗暫時不保存任何項。5. 設(shè)置回歸分析的一些選項,有:步進(jìn)方法標(biāo)準(zhǔn)單選鈕組:設(shè)置納入和排除標(biāo)準(zhǔn),可按P值或F值來設(shè)置。在等式中

19、包含常量復(fù)選框:用于決定是否在模型中包括常數(shù)項,默認(rèn)選中。如圖1-10所示: 圖1-10  設(shè)置選項1.2.2 結(jié)果輸出與分析在以上選項設(shè)置完畢之后點擊確定,SPSS將輸出一系列的回歸分析結(jié)果。我們來逐一貼出和分析,并根據(jù)它得到最后的回歸方程以及驗證回歸模型。1.     表1-3所示,是回歸分析過程中輸入、移去模型記錄。具體方法為:enter(進(jìn)入)輸入移去的變量 模型輸入的變量移去的變量方法1Zscore(原油產(chǎn)量), Zscore(原煤產(chǎn)量), Zscore(焦炭消費量), Zscore(

20、原油消費量), Zscore(煤炭消費量), Zscore(焦炭產(chǎn)量).輸入 表1-3 輸入的變量2. 表1-4所示是模型匯總,R稱為多元相關(guān)系數(shù),R方(R2)代表著模型的擬合度。2. 我們可以看到該模型是擬合優(yōu)度良好。模型匯總模型匯總 模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差 Sig.1.962.925.905.30692707.000表1-4 模型匯總3.表1-5所示是離散分析。 ,F(xiàn)的值較大,代表著該回歸模型是顯著。也稱為失擬性檢驗。模型平方和df均方F1回歸25.66064.27745.397殘差2.07222.094 總計27.73228

21、60;          表1-5 離散分析4.表1-6所示的是回歸方程的系數(shù),根據(jù)這些系數(shù)我們能夠得到完整的多元回歸方程。觀測以下的回歸值,都是具有統(tǒng)計學(xué)意義的。因而,得到的多元線性回歸方程:Y=0.008+1.061x1+0.087 x2+0.157 x3-0.365 x4-0.105 x5-0.017x6 (x1為煤炭消費量,x2為焦炭消費量,x3為原油消費量,x4為原煤產(chǎn)量,x5為原炭產(chǎn)量,x6為原油產(chǎn)量,Y是能源消費總量)結(jié)論:能量消費總量由主要與煤炭消費總量所影響,成正相關(guān);與原煤產(chǎn)量成一定的反比。系數(shù)模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差beta1(常量).

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論