SPSS多元線性回歸分析_第1頁(yè)
SPSS多元線性回歸分析_第2頁(yè)
SPSS多元線性回歸分析_第3頁(yè)
SPSS多元線性回歸分析_第4頁(yè)
SPSS多元線性回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、轉(zhuǎn)載SPSS19.0實(shí)戰(zhàn)之多元線性回歸分析 (2016-08-12 20:31:47)刪除轉(zhuǎn)載標(biāo)簽: 轉(zhuǎn)載原文地址:SPSS19.0實(shí)戰(zhàn)之多元線性回歸分析作者:建模手   線性回歸數(shù)據(jù)(全國(guó)各地區(qū)能源消耗量與產(chǎn)量)來源,可點(diǎn)擊協(xié)會(huì)博客數(shù)據(jù)挖掘欄:國(guó)泰安數(shù)據(jù)服務(wù)中心的經(jīng)濟(jì)研究數(shù)據(jù)庫(kù)。1.1 數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理包括的內(nèi)容非常廣泛,包括數(shù)據(jù)清理和描述性數(shù)據(jù)匯總,數(shù)據(jù)集成和變換,數(shù)據(jù)歸約,數(shù)據(jù)離散化等。本次實(shí)習(xí)主要涉及的數(shù)據(jù)預(yù)處理只包括數(shù)據(jù)清理和描述性數(shù)據(jù)匯總。一般意義的數(shù)據(jù)預(yù)處理包括缺失值填寫和噪聲數(shù)據(jù)的處理。于此我們只對(duì)數(shù)據(jù)做缺失值填充

2、,但是依然將其統(tǒng)稱數(shù)據(jù)清理。1.1.1 數(shù)據(jù)導(dǎo)入與定義單擊“打開數(shù)據(jù)文檔 ”,將xls格式的全國(guó)各地區(qū)能源消耗量與產(chǎn)量的數(shù)據(jù)導(dǎo)入SPSS中,如圖1-1所示。                                   圖1-1 導(dǎo)入

3、數(shù)據(jù)導(dǎo)入過程中,各個(gè)字段的值都被轉(zhuǎn)化為字符串型(String),我們需要手動(dòng)將相應(yīng)的字段轉(zhuǎn)回?cái)?shù)值型。單擊菜單欄的“ ”->“ ”將所選的變量改為數(shù)值型。如圖1-2所示: 圖1-2 定義變量數(shù)據(jù)類型1.1.2 數(shù)據(jù)清理數(shù)據(jù)清理包括缺失值的填寫和還需要使用SPSS分析工具來檢查各個(gè)變量的數(shù)據(jù)完整性。單擊“ ”->“ ”,將檢查所輸入的數(shù)據(jù)的缺失值個(gè)數(shù)以及百分比等。如圖1-3所示:               

4、            圖1-3缺失值分析能源數(shù)據(jù)缺失值分析結(jié)果如表1-1所示:                                 &#

5、160;                             單變量統(tǒng)計(jì) N均值標(biāo)準(zhǔn)差缺失極值數(shù)目a計(jì)數(shù)百分比低高能源消費(fèi)總量309638.506175.9240.001煤炭消費(fèi)量309728.997472.2590.002焦炭消費(fèi)量30874.611053.0080.002原油消費(fèi)量28117

6、7.511282.74426.701汽油消費(fèi)量30230.05170.2700.001煤油消費(fèi)量2845.4066.18926.704柴油消費(fèi)量30392.34300.9790.002燃料油消費(fèi)量30141.00313.4670.003天然氣消費(fèi)量3019.5622.0440.002電力消費(fèi)量30949.64711.6640.003原煤產(chǎn)量269125.9712180.689413.302焦炭產(chǎn)量291026.491727.73513.302原油產(chǎn)量181026.481231.7241240.000燃料油產(chǎn)量2590.72134.150516.703汽油產(chǎn)量26215.18210.090413

7、.302煤油產(chǎn)量2048.4462.1301033.300柴油產(chǎn)量26448.29420.675413.301天然氣產(chǎn)量2029.2849.3911033.303電力產(chǎn)量30954.74675.2300.000 表2-1 能源消耗量與產(chǎn)量數(shù)據(jù)缺失值分析                            &

8、#160;                 表1-1 能源消耗量與產(chǎn)量數(shù)據(jù)缺失值分析SPSS提供了填充缺失值的工具,點(diǎn)擊菜單欄“ ”->“ ”,即可以使用軟件提供的幾種填充缺失值工具,包括序列均值,臨近點(diǎn)中值,臨近點(diǎn)中位數(shù)等。結(jié)合本次實(shí)習(xí)數(shù)據(jù)的具體情況,我們不使用SPSS軟件提供的替換缺失值工具,主要是手動(dòng)將缺失值用零值來代替。 1.1.3 描述性數(shù)據(jù)匯總描述性數(shù)據(jù)匯總技術(shù)用來獲得數(shù)據(jù)的典型性質(zhì),我們

9、關(guān)心數(shù)據(jù)的中心趨勢(shì)和離中趨勢(shì),根據(jù)這些統(tǒng)計(jì)值,可以初步得到數(shù)據(jù)的噪聲和離群點(diǎn)。中心趨勢(shì)的量度值包括:均值(mean),中位數(shù)(median),眾數(shù)(mode)等。離中趨勢(shì)量度包括四分位數(shù)(quartiles),方差(variance)等。SPSS提供了詳盡的數(shù)據(jù)描述工具,單擊菜單欄的“ ”->“ ”->“ ”,將彈出如圖2-4所示的對(duì)話框,我們將所有變量都選取到,然后在選項(xiàng)中勾選上所希望描述的數(shù)據(jù)特征,包括均值,標(biāo)準(zhǔn)差,方差,最大最小值等。由于本次數(shù)據(jù)的單位不盡相同,我們需要將數(shù)據(jù)標(biāo)準(zhǔn)化,同時(shí)勾選上“將標(biāo)準(zhǔn)化得分另存為變量”。 圖1-4 描述性數(shù)據(jù)匯總得到如表1-2所示的

10、描述性數(shù)據(jù)匯總。 N極小值極大值均值標(biāo)準(zhǔn)差方差能源消費(fèi)總量30911261649638.506175.92438142034.412煤炭消費(fèi)量30332290019728.997472.25955834651.378焦炭消費(fèi)量30195461874.611053.0081108824.853原油消費(fèi)量30055551099.011273.2651621202.562汽油消費(fèi)量3018771230.05170.27028991.746煤油消費(fèi)量30026242.3764.8964211.520柴油消費(fèi)量30271368392.34300.97990588.441燃料油消費(fèi)量300157

11、4141.00313.46798261.261天然氣消費(fèi)量30110619.5622.044485.947電力消費(fèi)量30983004949.64711.664506464.953原煤產(chǎn)量300581427909.1711741.3881.379E8焦炭產(chǎn)量3009202992.281707.9982917256.193原油產(chǎn)量2904341637.121085.3791178048.432燃料油產(chǎn)量30049775.60126.79116075.971汽油產(chǎn)量3001032186.49208.77143585.122煤油產(chǎn)量30021932.3055.3943068.535柴油產(chǎn)量300191

12、1388.52420.216176581.285天然氣產(chǎn)量30016419.5242.3711795.341電力產(chǎn)量30972536954.74675.230455935.003有效的 N (列表狀態(tài))29     表1-2 描述性數(shù)據(jù)匯總標(biāo)準(zhǔn)化后得到的數(shù)據(jù)值,以下的回歸分析將使用標(biāo)準(zhǔn)化數(shù)據(jù)。如圖1-5所示:                    

13、                   圖1-5 數(shù)據(jù)標(biāo)準(zhǔn)化我們還可以通過描述性分析中的“ ”來得到各個(gè)變量的眾數(shù),均值等,還可以根據(jù)這些量繪制直方圖。我們選取個(gè)別變量(能源消費(fèi)總量)的直方圖,可以看到我們因變量基本符合正態(tài)分布。如圖1-6所示:              

14、;                   圖1-6能源消費(fèi)總量1.2 回歸分析 我們本次實(shí)驗(yàn)主要考察地區(qū)能源消費(fèi)總額(因變量)與煤炭消費(fèi)量、焦炭消費(fèi)量、原油消費(fèi)量、原煤產(chǎn)量、焦炭產(chǎn)量、原油產(chǎn)量之間的關(guān)系。以下的回歸分析所涉及只包括以上幾個(gè)變量,并使用標(biāo)準(zhǔn)化之后的數(shù)據(jù)。1.2.1 參數(shù)設(shè)置1.     單擊菜單欄“ ”->“

15、”->“ ”,將彈出如圖1-7所示的對(duì)話框,將通過選擇因變量和自變量來構(gòu)建線性回歸模型。因變量:標(biāo)準(zhǔn)化能源消費(fèi)總額;自變量:標(biāo)準(zhǔn)化煤炭消費(fèi)量、標(biāo)準(zhǔn)化焦炭消費(fèi)量、標(biāo)準(zhǔn)化原油消費(fèi)量、標(biāo)準(zhǔn)化原煤產(chǎn)量、標(biāo)準(zhǔn)化焦炭產(chǎn)量、標(biāo)準(zhǔn)化原油產(chǎn)量。自變量方法選擇:進(jìn)入,個(gè)案標(biāo)簽使用地名,不使用權(quán)重最小二乘法回歸分析即WLS權(quán)重為空。圖1-7選擇線性回歸變量還需要設(shè)置統(tǒng)計(jì)量的參數(shù),我們選擇回歸系數(shù)中的“ ”和其他項(xiàng)中的“ ”。選中估計(jì)可輸出回歸系數(shù)B及其標(biāo)準(zhǔn)誤,t值和p值,還有標(biāo)準(zhǔn)化的回歸系數(shù)beta。選中模型擬合度復(fù)選框:模型擬合過程中進(jìn)入、退出的變量的列表,以及一些有關(guān)擬合優(yōu)度的檢驗(yàn):R,R2和調(diào)整的R2,

16、 標(biāo)準(zhǔn)誤及方差分析表。如圖1-8所示:                               圖1-8 設(shè)置回歸分析統(tǒng)計(jì)量3.在設(shè)置繪制選項(xiàng)的時(shí)候,我們選擇繪制標(biāo)準(zhǔn)化殘差圖,其中的正態(tài)概率圖是rankit圖。同時(shí)還需要畫出殘差圖,Y軸選擇:ZRESID,X軸選擇: ZPRED。如圖1

17、-9所示: 圖1-9 設(shè)置繪制左上框中各項(xiàng)的意義分別為:·     “DEPENDNT”因變量·     “ZPRED”標(biāo)準(zhǔn)化預(yù)測(cè)值·     “ZRESID”標(biāo)準(zhǔn)化殘差·     “DRESID”刪除殘差·     “ADJPRED”調(diào)節(jié)預(yù)測(cè)值·  

18、;   “SRESID”學(xué)生化殘差·     “SDRESID”學(xué)生化刪除殘差          4. 許多時(shí)候我們需要將回歸分析的結(jié)果存儲(chǔ)起來,然后用得到的殘差、預(yù)測(cè)值等做進(jìn)一步的分析,“保存”按鈕就是用來存儲(chǔ)中間結(jié)果的。可以存儲(chǔ)的有:預(yù)測(cè)值系列、殘差系列、距離(Distances)系列、預(yù)測(cè)值可信區(qū)間系列、波動(dòng)統(tǒng)計(jì)量系列。本次實(shí)驗(yàn)暫時(shí)不保存任何項(xiàng)。5. 設(shè)置回歸分析的一些選項(xiàng),有:步進(jìn)方法標(biāo)準(zhǔn)單選鈕組:設(shè)置納入和

19、排除標(biāo)準(zhǔn),可按P值或F值來設(shè)置。在等式中包含常量復(fù)選框:用于決定是否在模型中包括常數(shù)項(xiàng),默認(rèn)選中。如圖1-10所示: 圖1-10  設(shè)置選項(xiàng)1.2.2 結(jié)果輸出與分析在以上選項(xiàng)設(shè)置完畢之后點(diǎn)擊確定,SPSS將輸出一系列的回歸分析結(jié)果。我們來逐一貼出和分析,并根據(jù)它得到最后的回歸方程以及驗(yàn)證回歸模型。1.     表1-3所示,是回歸分析過程中輸入、移去模型記錄。具體方法為:enter(進(jìn)入)輸入移去的變量 模型輸入的變量移去的變量方法1Zscore(原油產(chǎn)量), Zscore(原煤產(chǎn)量), Zs

20、core(焦炭消費(fèi)量), Zscore(原油消費(fèi)量), Zscore(煤炭消費(fèi)量), Zscore(焦炭產(chǎn)量).輸入 表1-3 輸入的變量1. 表1-4所示是模型匯總,R稱為多元相關(guān)系數(shù),R方(R2)代表著模型的擬合度。1. 我們可以看到該模型是擬合優(yōu)度良好。模型匯總模型匯總 模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差 Sig.1.962.925.905.30692707.000表1-4 模型匯總3.表1-5所示是離散分析。 ,F(xiàn)的值較大,代表著該回歸模型是顯著。也稱為失擬性檢驗(yàn)。模型平方和df均方F1回歸25.66064.27745.397殘差2.07222.09

21、4 總計(jì)27.73228           表1-5 離散分析4.表1-6所示的是回歸方程的系數(shù),根據(jù)這些系數(shù)我們能夠得到完整的多元回歸方程。觀測(cè)以下的回歸值,都是具有統(tǒng)計(jì)學(xué)意義的。因而,得到的多元線性回歸方程:Y=0.008+1.061x1+0.087 x2+0.157 x3-0.365 x4-0.105 x5-0.017x6 (x1為煤炭消費(fèi)量,x2為焦炭消費(fèi)量,x3為原油消費(fèi)量,x4為原煤產(chǎn)量,x5為原炭產(chǎn)量,x6為原油產(chǎn)量,Y是能源消費(fèi)總量)結(jié)論:能量消費(fèi)總量由主要與煤炭消費(fèi)總量所影響,成正相關(guān);與原煤產(chǎn)量成一定的反比。系數(shù)模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差beta1(常量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論