版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、SPSS19.0實(shí)戰(zhàn)之多元線(xiàn)性回歸分析 (2016-08-12 20:31:47)刪除標(biāo)簽: 原文地址:SPSS19.0實(shí)戰(zhàn)之多元線(xiàn)性回歸分析作者:建模手 線(xiàn)性回歸數(shù)據(jù)(全國(guó)各地區(qū)能源消耗量與產(chǎn)量)來(lái)源,可點(diǎn)擊協(xié)會(huì)博客數(shù)據(jù)挖掘欄:國(guó)數(shù)據(jù)服務(wù)中心的經(jīng)濟(jì)研究數(shù)據(jù)庫(kù)。1.1 數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理包括的容非常廣泛,包括數(shù)據(jù)清理和描述性數(shù)據(jù)匯總,數(shù)據(jù)集成和變換,數(shù)據(jù)歸約,數(shù)據(jù)離散化等。本次實(shí)習(xí)主要涉及的數(shù)據(jù)預(yù)處理只包括數(shù)據(jù)清理和描述性數(shù)據(jù)匯總。一般意義的數(shù)據(jù)預(yù)處理包括缺失值填寫(xiě)和噪聲數(shù)據(jù)的處理。于此我們只對(duì)數(shù)據(jù)做缺失值填充,但是依然將其統(tǒng)稱(chēng)
2、數(shù)據(jù)清理。1.1.1 數(shù)據(jù)導(dǎo)入與定義單擊“打開(kāi)數(shù)據(jù)文檔 ”,將xls格式的全國(guó)各地區(qū)能源消耗量與產(chǎn)量的數(shù)據(jù)導(dǎo)入SPSS中,如圖1-1所示。 圖1-1 導(dǎo)入數(shù)據(jù)導(dǎo)入過(guò)程中,各
3、個(gè)字段的值都被轉(zhuǎn)化為字符串型(String),我們需要手動(dòng)將相應(yīng)的字段轉(zhuǎn)回?cái)?shù)值型。單擊菜單欄的“ ”->“ ”將所選的變量改為數(shù)值型。如圖1-2所示: 圖1-2 定義變量數(shù)據(jù)類(lèi)型1.1.2 數(shù)據(jù)清理數(shù)據(jù)清理包括缺失值的填寫(xiě)和還需要使用SPSS分析工具來(lái)檢查各個(gè)變量的數(shù)據(jù)完整性。單擊“ ”->“ ”,將檢查所輸入的數(shù)據(jù)的缺失值個(gè)數(shù)以及百分比等。如圖1-3所示:
4、60; 圖1-3缺失值分析能源數(shù)據(jù)缺失值分析結(jié)果如表1-1所示:
5、; 單變量統(tǒng)計(jì) N均值標(biāo)準(zhǔn)差缺失極值數(shù)目a計(jì)數(shù)百分比低高能源消費(fèi)總量309638.506175.9240.001煤炭消費(fèi)量309728.997472.2590.002焦炭消費(fèi)量30874.611053.0080.002原油消費(fèi)量281177.511282.
6、74426.701汽油消費(fèi)量30230.05170.2700.001煤油消費(fèi)量2845.4066.18926.704柴油消費(fèi)量30392.34300.9790.002燃料油消費(fèi)量30141.00313.4670.003天然氣消費(fèi)量3019.5622.0440.002電力消費(fèi)量30949.64711.6640.003原煤產(chǎn)量269125.9712180.689413.302焦炭產(chǎn)量291026.491727.73513.302原油產(chǎn)量181026.481231.7241240.000燃料油產(chǎn)量2590.72134.150516.703汽油產(chǎn)量26215.18210.090413.302煤油產(chǎn)量2
7、048.4462.1301033.300柴油產(chǎn)量26448.29420.675413.301天然氣產(chǎn)量2029.2849.3911033.303電力產(chǎn)量30954.74675.2300.000 表2-1 能源消耗量與產(chǎn)量數(shù)據(jù)缺失值分析
8、0; 表1-1 能源消耗量與產(chǎn)量數(shù)據(jù)缺失值分析SPSS提供了填充缺失值的工具,點(diǎn)擊菜單欄“ ”->“ ”,即可以使用軟件提供的幾種填充缺失值工具,包括序列均值,臨近點(diǎn)中值,臨近點(diǎn)中位數(shù)等。結(jié)合本次實(shí)習(xí)數(shù)據(jù)的具體情況,我們不使用SPSS軟件提供的替換缺失值工具,主要是手動(dòng)將缺失值用零值來(lái)代替。 1.1.3 描述性數(shù)據(jù)匯總描述性數(shù)據(jù)匯總技術(shù)用來(lái)獲得數(shù)據(jù)的典型性質(zhì),我們關(guān)心數(shù)據(jù)的中心趨勢(shì)
9、和離中趨勢(shì),根據(jù)這些統(tǒng)計(jì)值,可以初步得到數(shù)據(jù)的噪聲和離群點(diǎn)。中心趨勢(shì)的量度值包括:均值(mean),中位數(shù)(median),眾數(shù)(mode)等。離中趨勢(shì)量度包括四分位數(shù)(quartiles),方差(variance)等。SPSS提供了詳盡的數(shù)據(jù)描述工具,單擊菜單欄的“ ”->“ ”->“ ”,將彈出如圖2-4所示的對(duì)話(huà)框,我們將所有變量都選取到,然后在選項(xiàng)中勾選上所希望描述的數(shù)據(jù)特征,包括均值,標(biāo)準(zhǔn)差,方差,最大最小值等。由于本次數(shù)據(jù)的單位不盡相同,我們需要將數(shù)據(jù)標(biāo)準(zhǔn)化,同時(shí)勾選上“將標(biāo)準(zhǔn)化得分另存為變量”。 圖1-4 描述性數(shù)據(jù)匯總得到如表1-2所示的描述性數(shù)據(jù)匯總。&
10、#160;N極小值極大值均值標(biāo)準(zhǔn)差方差能源消費(fèi)總量30911261649638.506175.92438142034.412煤炭消費(fèi)量30332290019728.997472.25955834651.378焦炭消費(fèi)量30195461874.611053.0081108824.853原油消費(fèi)量30055551099.011273.2651621202.562汽油消費(fèi)量3018771230.05170.27028991.746煤油消費(fèi)量30026242.3764.8964211.520柴油消費(fèi)量30271368392.34300.97990588.441燃料油消費(fèi)量3001574141.0031
11、3.46798261.261天然氣消費(fèi)量30110619.5622.044485.947電力消費(fèi)量30983004949.64711.664506464.953原煤產(chǎn)量300581427909.1711741.3881.379E8焦炭產(chǎn)量3009202992.281707.9982917256.193原油產(chǎn)量2904341637.121085.3791178048.432燃料油產(chǎn)量30049775.60126.79116075.971汽油產(chǎn)量3001032186.49208.77143585.122煤油產(chǎn)量30021932.3055.3943068.535柴油產(chǎn)量3001911388.5242
12、0.216176581.285天然氣產(chǎn)量30016419.5242.3711795.341電力產(chǎn)量30972536954.74675.230455935.003有效的 N (列表狀態(tài))29 表1-2 描述性數(shù)據(jù)匯總標(biāo)準(zhǔn)化后得到的數(shù)據(jù)值,以下的回歸分析將使用標(biāo)準(zhǔn)化數(shù)據(jù)。如圖1-5所示:
13、60; 圖1-5 數(shù)據(jù)標(biāo)準(zhǔn)化我們還可以通過(guò)描述性分析中的“ ”來(lái)得到各個(gè)變量的眾數(shù),均值等,還可以根據(jù)這些量繪制直方圖。我們選取個(gè)別變量(能源消費(fèi)總量)的直方圖,可以看到我們因變量基本符合正態(tài)分布。如圖1-6所示:
14、160; 圖1-6能源消費(fèi)總量1.2 回歸分析 我們本次實(shí)驗(yàn)主要考察地區(qū)能源消費(fèi)總額(因變量)與煤炭消費(fèi)量、焦炭消費(fèi)量、原油消費(fèi)量、原煤產(chǎn)量、焦炭產(chǎn)量、原油產(chǎn)量之間的關(guān)系。以下的回歸分析所涉及只包括以上幾個(gè)變量,并使用標(biāo)準(zhǔn)化之后的數(shù)據(jù)。1.2.1 參數(shù)設(shè)置1. 單擊菜單欄“ ”->“ ”->“ ”
15、,將彈出如圖1-7所示的對(duì)話(huà)框,將通過(guò)選擇因變量和自變量來(lái)構(gòu)建線(xiàn)性回歸模型。因變量:標(biāo)準(zhǔn)化能源消費(fèi)總額;自變量:標(biāo)準(zhǔn)化煤炭消費(fèi)量、標(biāo)準(zhǔn)化焦炭消費(fèi)量、標(biāo)準(zhǔn)化原油消費(fèi)量、標(biāo)準(zhǔn)化原煤產(chǎn)量、標(biāo)準(zhǔn)化焦炭產(chǎn)量、標(biāo)準(zhǔn)化原油產(chǎn)量。自變量方法選擇:進(jìn)入,個(gè)案標(biāo)簽使用地名,不使用權(quán)重最小二乘法回歸分析即WLS權(quán)重為空。圖1-7選擇線(xiàn)性回歸變量還需要設(shè)置統(tǒng)計(jì)量的參數(shù),我們選擇回歸系數(shù)中的“ ”和其他項(xiàng)中的“ ”。選中估計(jì)可輸出回歸系數(shù)B及其標(biāo)準(zhǔn)誤,t值和p值,還有標(biāo)準(zhǔn)化的回歸系數(shù)beta。選中模型擬合度復(fù)選框:模型擬合過(guò)程中進(jìn)入、退出的變量的列表,以及一些有關(guān)擬合優(yōu)度的檢驗(yàn):R,R2和調(diào)整的R2, 標(biāo)準(zhǔn)誤及方差分析
16、表。如圖1-8所示: 圖1-8 設(shè)置回歸分析統(tǒng)計(jì)量3.在設(shè)置繪制選項(xiàng)的時(shí)候,我們選擇繪制標(biāo)準(zhǔn)化殘差圖,其中的正態(tài)概率圖是rankit圖。同時(shí)還需要畫(huà)出殘差圖,Y軸選擇:ZRESID,X軸選擇: ZPRED。如圖1-9所示:
17、0;圖1-9 設(shè)置繪制左上框中各項(xiàng)的意義分別為:· “DEPENDNT”因變量· “ZPRED”標(biāo)準(zhǔn)化預(yù)測(cè)值· “ZRESID”標(biāo)準(zhǔn)化殘差· “DRESID”刪除殘差· “ADJPRED”調(diào)節(jié)預(yù)測(cè)值·
18、160; “SRESID”學(xué)生化殘差· “SDRESID”學(xué)生化刪除殘差 4. 許多時(shí)候我們需要將回歸分析的結(jié)果存儲(chǔ)起來(lái),然后用得到的殘差、預(yù)測(cè)值等做進(jìn)一步的分析,“保存”按鈕就是用來(lái)存儲(chǔ)中間結(jié)果的??梢源鎯?chǔ)的有:預(yù)測(cè)值系列、殘差系列、距離(Distances)系列、預(yù)測(cè)值可信區(qū)間系列、波動(dòng)統(tǒng)計(jì)量系列。本次實(shí)驗(yàn)暫時(shí)不保存任何項(xiàng)。5. 設(shè)置回歸分析的一些選項(xiàng),有:步進(jìn)方法標(biāo)準(zhǔn)單選鈕組:設(shè)置納入和排除標(biāo)準(zhǔn),可按P值
19、或F值來(lái)設(shè)置。在等式中包含常量復(fù)選框:用于決定是否在模型中包括常數(shù)項(xiàng),默認(rèn)選中。如圖1-10所示: 圖1-10 設(shè)置選項(xiàng)1.2.2 結(jié)果輸出與分析在以上選項(xiàng)設(shè)置完畢之后點(diǎn)擊確定,SPSS將輸出一系列的回歸分析結(jié)果。我們來(lái)逐一貼出和分析,并根據(jù)它得到最后的回歸方程以及驗(yàn)證回歸模型。1. 表1-3所示,是回歸分析過(guò)程中輸入、移去模型記錄。具體方法為:enter(進(jìn)入)輸入移去的變量 模型輸入的變量移去的變量方法1Zscore(原油產(chǎn)量), Zscore(原煤產(chǎn)量), Zscore(焦炭消費(fèi)
20、量), Zscore(原油消費(fèi)量), Zscore(煤炭消費(fèi)量), Zscore(焦炭產(chǎn)量).輸入 表1-3 輸入的變量1. 表1-4所示是模型匯總,R稱(chēng)為多元相關(guān)系數(shù),R方(R2)代表著模型的擬合度。1. 我們可以看到該模型是擬合優(yōu)度良好。模型匯總模型匯總 模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差 Sig.1.962.925.905.30692707.000表1-4 模型匯總3.表1-5所示是離散分析。 ,F(xiàn)的值較大,代表著該回歸模型是顯著。也稱(chēng)為失擬性檢驗(yàn)。模型平方和df均方F1回歸25.66064.27745.397殘差2.07222.094 總計(jì)
21、27.73228 表1-5 離散分析4.表1-6所示的是回歸方程的系數(shù),根據(jù)這些系數(shù)我們能夠得到完整的多元回歸方程。觀測(cè)以下的回歸值,都是具有統(tǒng)計(jì)學(xué)意義的。因而,得到的多元線(xiàn)性回歸方程:Y=0.008+1.061x1+0.087 x2+0.157 x3-0.365 x4-0.105 x5-0.017x6 (x1為煤炭消費(fèi)量,x2為焦炭消費(fèi)量,x3為原油消費(fèi)量,x4為原煤產(chǎn)量,x5為原炭產(chǎn)量,x6為原油產(chǎn)量,Y是能源消費(fèi)總量)結(jié)論:能量消費(fèi)總量由主要與煤炭消費(fèi)總量所影響,成正相關(guān);與原煤產(chǎn)量成一定的反比。系數(shù)模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差beta1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工員的實(shí)習(xí)報(bào)告
- 小學(xué)班主任的年度工作總結(jié)(32篇)
- 幼兒園圣誕節(jié)的小活動(dòng)策劃書(shū)(3篇)
- 晉升工程師工作總結(jié)
- 廣東省佛山市S6高質(zhì)量發(fā)展聯(lián)盟2024-2025學(xué)年高二上學(xué)期期中聯(lián)考 數(shù)學(xué)試卷含答案
- (一模)長(zhǎng)春市2025屆高三質(zhì)量監(jiān)測(cè)(一)數(shù)學(xué)試卷
- 廣東省肇慶市(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版摸底考試(上學(xué)期)試卷及答案
- 2024年潔磁劑項(xiàng)目資金需求報(bào)告代可行性研究報(bào)告
- 上海市市轄區(qū)(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版期末考試((上下)學(xué)期)試卷及答案
- 上海市縣(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版摸底考試(上學(xué)期)試卷及答案
- 湘教版八年級(jí)上冊(cè)初二數(shù)學(xué)全冊(cè)表格式教案
- 供水服務(wù)滿(mǎn)意度調(diào)查協(xié)議
- 《工程泥漿技術(shù)標(biāo)準(zhǔn)》
- 2024年江蘇蘇州市(12345)便民服務(wù)中心招聘座席代表人員【重點(diǎn)基礎(chǔ)提升】模擬試題(共500題)附帶答案詳解
- 2024年合租租房合同電子版(三篇)
- 羊水過(guò)少課件
- 完美著裝智慧樹(shù)知到期末考試答案章節(jié)答案2024年武漢紡織大學(xué)
- 櫻桃栽培技術(shù)(共85張課件)
- AED使用指南培訓(xùn)課件
- 江蘇紅色文化-過(guò)程性考核作業(yè)二-參考資料-江蘇開(kāi)大
- 北京科技大學(xué)輔導(dǎo)員考試試題2024
評(píng)論
0/150
提交評(píng)論