版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、什么是回歸分析冋歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系 的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元 回歸分析和多元回歸分析;按照口變量和因變量之間的關(guān)系類型,可分為線性回歸分析 和非線性冋歸分析。如果在冋歸分析中,只包括一個自變量和一個因變量,且二者的關(guān) 系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如杲回歸分析中包括 兩個或兩個以上的自變量,冃因變量和自變量之間是線性關(guān)系,則稱為多元線性冋歸分 析。回歸分析之一多元線性回歸模型案例解析多元線性回歸,主要是研究一個因變量與多個口變量之間的相關(guān)關(guān)系
2、,跟一元回歸原理差不 多,區(qū)別在于影響因素(自變量)更多些而已,例如:一元線性回歸方稈 為:y =卩。七卩七£毫無疑問, 多元線性回歸方程應(yīng)該為:y = 00 +01 兀 1 +02兀2 + +0pxp 十£上圖中的x1, x2, xp分別代表“自變量” xp截止,代表有p個自變量,如果有“n組樣 本,那么這個多元線性回歸,將會組成一個矩陣,如下圖所示:記刃組樣本分別是(兀,兀2,兀嚴(yán)必)(=1,2,),令那么,多元線性冋歸方程矩陣形式為:y = xfl + £ .y = z =仃xn1 x2i xi2x22kj x2p ,0 =a9» £ =
3、古£2x«2np丿厲丿其中:8代表隨機誤差,其中隨機誤差分為:可解釋的誤差和不可解釋的誤差, 隨機誤差必須滿足以下四個條件,多元線性方程才有意義(一元線性方程也一樣) 1:服成正太分布,即指:隨機誤差£必須是服成正太分別的隨機變量。2:無偏性假設(shè),即指:期望值為03:同共方差性假設(shè),即指,所有的隨機誤差變量方差都相等4:獨立性假設(shè),即指:所有的隨機誤差變量都相互獨立,可以用協(xié)方差解釋。今天跟大家一起討論一下,spss-多元線性回歸的具體操作過程,下面以教程教程數(shù)據(jù) 為例,分析汽車特征與汽車銷售暈z間的關(guān)系。通過分析汽車特征跟汽車銷售量的關(guān)系,建 立擬合多元線性回歸
4、模型。數(shù)據(jù)如下圖所示:(數(shù)據(jù)可以先用excel建立再通過spss打開)salesresaletypepriceengine_shorsepowwheelbaswidthlengthcurt16.91916.360021.5001.8140101.267.3172.439.38419.875028.4003.2225108.170.3192.914.11418.22503.2225106.970.6192.08.58829.725042.0003.5210114.671.4196.620.39722255i23.9901.8150102.668.2178.018.78023.555033.950
5、2.8200108.776.1192.01.38039.000062.0004.2310113.074.0198.219.747026.9902.5170107.368-4176.09.23128.675033.4002.8193107.368.5176.017.52736.125038.9002.8193111.470.9188.091.56112.475021.9753.1175109.072.7194.639.35013.740025.3003.8240109.072.7196.227.85120.190031.9653.8205113.874.7206.883.25713.360027
6、.8853.8205112.273.5200.063.72922.525039.8954.6275115.374.5207.215.94327.100044.4754.6275112.275.0201.06.53625.725039.6654.6275108.075.5200.611.18518 225031.0103.0200107.470.3194.814.785146.2255.7255117.577.0201.2145.5199 250013.2602.2115104.167.9180.9135.12611.22516.5353.1170107.069.4190.424.62910.3
7、10018.8903.1175107.572.5200.942.59311.525019.3903.4180110.5727197.9點擊“分析”一一回歸一一線性一一進(jìn)入如下圖所示的界面:oa 廠家【manufact model modelq新車售價(單位:. 夕4年后二手車售價 cfi vehicle type type 夕 price in thousand. 夕 engine size engi. 夕 horsepower hor. 夕 wheelbase whe. 夕車寬width 夕 車長length& 車凈重curb_wgt 夕 fuel capacity fue. 3耗油
8、晝邁丿升mpg 少 cook's distance . 夕 95%lci forlnsa. 夕 95% u clforlnsa. 夕 95% l clforlnsa.因變量p):夕 log-tansfomed sales insales塊的上_張v j自變量q):jj vehicle type type 夕 price in thousands price 爐 engine size engine s方法迴):逐步選擇變量匡):個案標(biāo)簽(q):| 冷 price in thousands picewls權(quán)重旦):i統(tǒng)計量©) 繪制將“銷售輦”作為“因變量”拖入因變量框內(nèi),將“
9、車長,車寬,耗油率,車凈重等10個 自變量拖入自變量框內(nèi),如上圖所示,在“方法”旁邊,選擇“逐步”,當(dāng)然,你也可以 選擇其它的方式,如果你選擇“進(jìn)入”默認(rèn)的方式,在分析結(jié)杲屮,將會得到如下圖所示的 結(jié)果:(所有的自變量,都會強行進(jìn)入)輸入/移去的變量b模型輸入的變量移去的變量方法1耗油量邁爲(wèi), 車長,price in thousa nds. vehicle type. 車寬,engine size, fuel capacity. wheelbase. 車凈重, horsepower輸入乳已輸入所有諳求的變量。b.因變m: log-transtormed sales如果你選擇“逐步”這個方法,將
10、會得到如下圖所示的結(jié)果:(將會根據(jù)預(yù)先設(shè)定的“f統(tǒng) 計量的概率值進(jìn)行篩選,最先進(jìn)入冋歸方程的“自變量”應(yīng)該是跟“因變量”關(guān)系最為密 切,貢獻(xiàn)最大的,如下圖可以看出,車的價格和車軸跟因變量關(guān)系最為密切,符合判斷條 件的概率值必須小于0.05,當(dāng)概率值大于等于0.1時將會被剔除)輸入/移去的突量已模型輸入的變量移去的變量方法1price in thousands步進(jìn)(準(zhǔn)則:f- to-enter 的槪 率 <=.050, f-to-remove 的槪率 >= 100) o2wheelbase步進(jìn)(準(zhǔn)則:f- to-enter 的槪 率 <=.050 y f-to-remove 的
11、槪率 >= 100)。a.因變邑 log-transformed sales“選擇變量(e)”框內(nèi),我并沒有輸入數(shù)據(jù),如果你需要對某個“自變量”進(jìn)行條件篩選, 可以將那個白變量,移入“選擇變量框”內(nèi),有一個前提就是:該變量從未在另一個目標(biāo)列 表中出現(xiàn)!,再點擊“規(guī)則”設(shè)定相應(yīng)的“篩選條件”即可,如下圖所示:匣線性回歸:岡定義選擇規(guī)則sales値電):等于 不等于小于 小于等于大于thousarids |大于等于!):點擊“統(tǒng)計量”彈出如下所示的框,如下所示:在“回歸系數(shù)”下面勾選“估計,在右側(cè)勾選”模型擬合度“和”共線性診斷“兩個選 項,再勾選“個案診斷”再點擊“離群值” 一般默認(rèn)值為“
12、3”,(設(shè)定異常值的依據(jù),只有 當(dāng)殘差超過3倍標(biāo)準(zhǔn)差的觀測才會被當(dāng)做異常值)點擊繼續(xù)。提示:共線性檢驗,如果有兩個或兩個以上的自變量之間存在線性相關(guān)關(guān)系,就會產(chǎn)生多重共線性 現(xiàn)象。這時候,用最小二乘法估計的模型參數(shù)就會不穩(wěn)定,回歸系數(shù)的估計值很容易引起誤 導(dǎo)或者導(dǎo)致錯誤的結(jié)論。所以,需要勾選“共線性診斷”來做判斷通過容許度可以計算共線性的存在與否?容許度t0l=1-ri平方 或方差膨脹因子(vif): vif=1/1-ri平方,其屮ri平方是用其他自變量預(yù)測第i個變量的復(fù)相關(guān)系數(shù),顯然,vif 為tol的倒數(shù),tol的值越小,vif的值越大,自變量xi與其他自變量之間存在共線性的 可能性越大。
13、提供三種處理方法:1:從有共線性問題的變量里刪除不重要的變量2:增加樣本量或重新抽取樣本。3:采用其他方法擬合模型,如領(lǐng)回歸法,逐步回歸法,主成分分析法。再點擊“繪制”選項,如下所示:更線性回歸:圖、trvs*嚴(yán)生所有部分圖edependnt *zpred 吃resid *dresid v.djpred *sresid *sdresid標(biāo)準(zhǔn)化殘差圖直方圖(旦)正態(tài)槪率圖(旦)"繼續(xù)取消幫助上圖中:dependent因變量) zpred(標(biāo)準(zhǔn)化預(yù)測值)zresid(標(biāo)準(zhǔn)化殘差) dresid(剔 除殘差) adjpred(修正后預(yù)測值) srsid(學(xué)生化殘差)sdresid(學(xué)生化剔
14、除殘 差)一般我們大部分以“自變量”作為x軸,用“殘差”作為y軸,但是,也不要忽略特殊 情況,這里我們以“zpred (標(biāo)準(zhǔn)化預(yù)測值)作為“x”軸,分別用“sdresid (血生化剔除 殘差)”和“zresid(標(biāo)準(zhǔn)化殘差)作為y軸,分別作為兩組繪圖變量。再點擊”保存“按鈕,進(jìn)入如下界面:如上圖所示:勾選“距離”下面的“cook距離”選項(cook距離,主要是指:把一個個 案從計算回歸系數(shù)的樣木中剔除時所引起的殘差大小,cook距離越大,表明該個案對回歸 系數(shù)的影響也越大)在“預(yù)測區(qū)間”勾選“均值”和“單值”點擊“繼續(xù)”按鈕,再點擊“確定按鈕,得到如 下所示的分析結(jié)果:(此分析結(jié)果,采用的是“
15、逐步法”得到的結(jié)果)2 i哇0 cn cjl 5 52btur.304.430.300.4221.1155341.013572agwmo二ao)ko) price in thousands ob官邕崩刪二訶刪“ price in thousands- whee-base o c田whoi lo transformed sa-esanovao2 近湖回 斗 mh iffx遼湖回哇i 115.311153.072| 268.38381.720186.662 | 268.383吉192xx5 cj1i o i57.6561.02781.7201.244sy-r二fo o o bo o oojcoa+
16、0超_wnmo) price in thousands 0 b官邕禺刪-moi price in ihousands- whee-base o c田禺腳 lotransformed sa-es已緋除的變量模型beta intsig.偏相關(guān)共線性統(tǒng)計量容差vif最小容差1vehicle type.251a3.854.000.301.9981.002.998engine size,342a4.128.000.320.6111.636.611horsepower.25滬2.062.041.167.2933.417.293wheelbase.356a5.718.000.424.9881.012.988
17、車寬,244a3.517.001.277.8921.121.892車長.308a4.790.000.365.9761.025.976車浄重.346a4.600.000.353.7221.385.722fuel capacity,266a3.687.000.289.8201.219.820耗油量:邁供-.198a-2.584.011-.207.7581.319.7582vehicle type.129b1.928.056.157.8351.197.827engine size.145b1.576.117.128.4452.246.445horsepower.028b.229.819.019.25
18、63.910.256車寬-,025b-.275.784-.023.4702.126.470車長.027b.237.813.020.2903.448.290車浄重.105b1.028.306.084.3652.741.365fuel capacity.002b.024.981.002.4432.259.443耗油量:邁供.01 4b.164.870.014.5591.790.559a. 摸型中的預(yù)測變匿(常量).price in thousands。b. 模型中的鎖贏ij變量:j常量),price in thousands, wheelbase。c. 因變m: log-transformed s
19、ales系數(shù)k模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tsig.共線性統(tǒng)計量b標(biāo)準(zhǔn)誤差試用版容差vif1(常屋)price in thousands4.684-.051.194.006-.55224.0908.104.000.0001.0001.0002(常量)price in thousandswheelbase-1.822-.055.0611.151.006.011-.590.356-1.583-9.4875.718.116.000.000.988.9881.0121.012a.因變昱 log-transformed sales共線性診斷模型維數(shù)特征値條件索引方差比例(常量)price in thousa
20、ndswheelbase111.8851.000.06.062.1154.051.94.94212.8471.000.00.02.002.1504.351.01.97.013.00333.412.99.00.99a.因變董 log-transformed sales殘差純計墨'極小値極大値均値標(biāo)準(zhǔn)偏差n預(yù)測値-.245405.642043.29052.868512155標(biāo)準(zhǔn)預(yù)測値-4.0452.693.002.994155預(yù)測値的標(biāo)準(zhǔn)誤差.082.354.130.057155調(diào)整的預(yù)測値-.440425.672143.28907.874840155殘差-4.9711132.327782
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年音樂學(xué)校鋼琴教師合同
- 2024年財產(chǎn)共有轉(zhuǎn)為個人協(xié)議
- 2024年轎車買賣標(biāo)準(zhǔn)協(xié)議模板一
- 2024苗木采購合同范本
- 2025年度編劇與導(dǎo)演聯(lián)合創(chuàng)作合同終止及后續(xù)作品開發(fā)協(xié)議3篇
- 2024年網(wǎng)絡(luò)安全防護(hù)與技術(shù)支持合同
- 2024年高精度導(dǎo)航定位技術(shù)研發(fā)合同
- 2024年跨國服務(wù)提供協(xié)議
- 2024版旅行社轉(zhuǎn)讓合同
- 2024年租賃物業(yè)保險協(xié)議3篇
- 河南省鄭州外國語高中-【高二】【上期中】【把握現(xiàn)在 蓄力高三】家長會【課件】
- 2025年中煤電力有限公司招聘筆試參考題庫含答案解析
- 2024-2025學(xué)年烏魯木齊市數(shù)學(xué)三上期末檢測試題含解析
- 企業(yè)內(nèi)部控制與財務(wù)風(fēng)險防范
- 2025年初級經(jīng)濟師之初級經(jīng)濟師基礎(chǔ)知識考試題庫及完整答案【全優(yōu)】
- 建設(shè)項目施工現(xiàn)場春節(jié)放假期間的安全管理方案
- 胃潴留護(hù)理查房
- 眼科慢病管理新思路
- 劉先生家庭投資理財規(guī)劃方案設(shè)計
- 2024年度服裝代言合同:明星代言服裝品牌拍攝廣告協(xié)議
- 五年高考真題(2020-2024)分類匯編 政治 專題19 世界多極化 含解析
評論
0/150
提交評論