信息分析與決策Chapert回歸分析_第1頁
信息分析與決策Chapert回歸分析_第2頁
信息分析與決策Chapert回歸分析_第3頁
信息分析與決策Chapert回歸分析_第4頁
信息分析與決策Chapert回歸分析_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 樣本數(shù)據(jù)的統(tǒng)計(jì)分析回歸分析3-11回歸分析概述 回歸分析(Regression)是一種應(yīng)用極為廣泛的統(tǒng)計(jì)分析方法,成功應(yīng)用在金融,經(jīng)濟(jì),管理等領(lǐng)域。它用于分析事物之間的統(tǒng)計(jì)關(guān)系,側(cè)重考察變量之間的變化規(guī)律,并通過回歸模型形式描述和反映這種關(guān)系。2回歸分析概述 線性回歸分析Linear Regression 是研究一個(gè)因變量和一個(gè)或多個(gè)自變量之間是否存在某種線性關(guān)系的統(tǒng)計(jì)學(xué)方法。若自變量的個(gè)數(shù)為1,則為一元線性回歸分析。若為n(n1)為多元回歸分析。在SPSS中兩種分析是整合在一起處理的。3回歸分析概述1. 線性回歸分析的數(shù)學(xué)模型線性回歸分析是基于最小二乘法Least Square Me

2、thod原理的統(tǒng)計(jì)分析方法。假設(shè)收集到n對(duì)數(shù)據(jù)xi,yi(i=1,2,n),xi認(rèn)為是來自于隨機(jī)變量X的一組樣本值,yi認(rèn)為是來自于Y的一組樣本值。探討Y和X在統(tǒng)計(jì)意義下的相互關(guān)系。y4-3-1 性回歸分析4-3-1 性回歸分析4-3-1 性回歸分析4-3-1 性回歸分析4-3-1 性回歸分析x4-3-1 性回歸分析4回歸分析概述4-3-1 性回歸分析4-3-1 性回歸分析4-3-1 性回歸分析4-3-1 性回歸分析4-3-1 性回歸分析xy4-3-1 性回歸分析 觀察(xi,yi)的散點(diǎn)圖,y和x呈現(xiàn)出顯著地線性關(guān)系,則可考慮建立隨機(jī)變量X與Y之間的線性回歸模型。 X和Y分別稱為解釋變量In

3、dependent Varibles 和被解釋變量Depentdent Varibles。5回歸分析概述一元線性回歸的數(shù)學(xué)模型y = a + bx + y的變化由兩部分解釋:x的變化引起y的線性變化部分,即y = a + bx其他隨機(jī)因素引起的y的變化部分 6回歸分析概述一元線性回歸的數(shù)學(xué)模型y = a + bx + 7回歸分析概述8回歸分析概述2. 回歸方程的統(tǒng)計(jì)檢驗(yàn) 我們利用最小二乘法獲得回歸系數(shù)及相應(yīng)的回歸方程。至于x和y之間是否真有如回歸模型所描述的關(guān)系,或者說采用所得的回歸模型去擬合實(shí)際數(shù)據(jù)是否有足夠好的近似。還需得到進(jìn)一步的判明。9回歸分析概述 對(duì)回歸模型描述實(shí)際數(shù)據(jù)的近似程度,即

4、對(duì)所得的回歸模型的可信程度進(jìn)行檢驗(yàn)。包括回歸方程的顯著性檢驗(yàn),回歸方程的擬合優(yōu)度檢驗(yàn),回歸系數(shù)的顯著性檢驗(yàn),殘差分析等。10回歸分析概述 回歸方程的顯著性檢驗(yàn) 檢驗(yàn)被解釋變量Y與解釋變量X之間的線性關(guān)系是否顯著,用線性模型來描述它們之間的關(guān)系是否恰當(dāng),即進(jìn)行整體回歸效果的檢驗(yàn)。11回歸分析概述 回歸方程的顯著性檢驗(yàn)采用方差分析的方法。對(duì)于SST=SSA+SSE的方差分析形式,研究y的SST中模型可解釋部分SSA相對(duì)于隨機(jī)誤差部分SSE是否占較大的比例。若所占比例較大,則表示y與x全體的線性關(guān)系明顯,利用線性模型反映與的關(guān)系式恰當(dāng)?shù)摹7粗?,利用線性模型反映與的關(guān)系并不恰當(dāng)。12回歸分析概述13回

5、歸分析概述 可見R2=SSA/SST=1-SSE/SST反映的是回歸方程所能解釋的變差的比例。1-R2則體現(xiàn)了被解釋變量總變差中回歸方程所無法解釋的比例。14回歸分析概述15回歸分析概述16回歸分析概述 當(dāng)R較大時(shí),我們才可以用回歸直線來近似的描述y和x的相關(guān)關(guān)系。但R大到什么程度,才可以適用回歸直線來描述y與x的關(guān)系達(dá)到足夠好的近似程度呢?17回歸分析概述18回歸分析概述 回歸系數(shù)的顯著性檢驗(yàn) 主要目的是研究回歸方程中的每個(gè)解釋變量與被解釋變量之間是否存在顯著地線性關(guān)系,即研究解釋變量能否有效地解釋被解釋變量的線性變化,他們能否保留在線性回歸方程中。19回歸分析概述20回歸分析概述 對(duì)回歸系

6、數(shù)t統(tǒng)計(jì)量的顯著性檢驗(yàn),決定了相應(yīng)的變量能否作為解釋變量進(jìn)入回歸方程。當(dāng)b=0假設(shè)成立,意味著x的變化不會(huì)引起y的線性變化,x無法解釋y,它們之間不存在線性關(guān)系, x不能進(jìn)入回歸模型。 在一元線性回歸分析中,回歸方程顯著性檢驗(yàn)和回歸系數(shù)顯著性檢驗(yàn)的作用是相同的,兩者可以相互替代。21線性回歸分析實(shí)例Ex1: 一元回歸示例 研究我國31個(gè)省市自治區(qū)的人均食品支出。變量“人均食品出”對(duì)“人均收入”的依存關(guān)系。此問題的回歸方程為人均食品支出 = a + b * 人均收入 + 22線性回歸分析實(shí)例數(shù)據(jù): “CH10回歸人均食品支出”SPSS 的分析步驟:Step-1:Analyzeregression

7、 linearStep-2: 人均收入Independent 自變量人均食出Dependent 因變量23線性回歸分析實(shí)例Step-3:按Statistics默認(rèn)項(xiàng),系統(tǒng)輸出回歸系數(shù),其標(biāo)準(zhǔn)差,統(tǒng)計(jì)量t及其雙尾檢驗(yàn)的p值。系統(tǒng)輸出每個(gè)回歸系數(shù)的95%的置信區(qū)間。SPSS默認(rèn)輸入項(xiàng),輸出判定系數(shù),調(diào)整的判定系數(shù),回歸方程的標(biāo)準(zhǔn)誤差,回歸方程顯著F檢驗(yàn)的方差分析表。24線性回歸分析實(shí)例Step-4: 點(diǎn)擊Continue, 返回主對(duì)話框Step-5: OKStep-6: 結(jié)果分析Step-7: 在輸出窗口按“File”菜單保存, 可將回歸結(jié)果存成(*.spo)文件 25線性回歸分析實(shí)例Report

8、-1: Model Summary預(yù)測(cè)變量 Predictiors : 人均收入給出了兩個(gè)變量之間的相關(guān)系數(shù)R - 這里為簡(jiǎn)單相關(guān)系數(shù)R Square - 判定系數(shù)R2Adjusted R Square - 調(diào)整判定系數(shù)Std. Error of the Estimate - 回歸的標(biāo)準(zhǔn)誤差26線性回歸分析實(shí)例方差分析表 ANOVA(F檢驗(yàn)表)自由度F統(tǒng)計(jì)量回歸項(xiàng)殘差項(xiàng)F統(tǒng)計(jì)項(xiàng)對(duì)應(yīng)的概率值F = 162.035, Sig = .000 0.05,接受H0假設(shè)檢驗(yàn),即常數(shù)項(xiàng)在5%的顯著性水平上與0無顯著差異。自變量“人均收入”通過檢驗(yàn)(p=0.0000.05),即其相應(yīng)系數(shù)b顯著異于0。 因此該

9、回歸方程最好采用標(biāo)準(zhǔn)回歸方程,即人均食品支出 = 0.921*人均收入。28線性回歸分析實(shí)例多元回歸分析 在多元回歸分析中,由于被解釋變量會(huì)受眾多因素的共同影響,需要由多個(gè)解釋變量解釋,于是會(huì)出現(xiàn)如下問題:多個(gè)變量是否都能夠進(jìn)入模型解釋變量應(yīng)以怎樣的策略和順序進(jìn)入方程方程中多個(gè)解釋變量之間是否存在多重共線性等等。29線性回歸分析實(shí)例Ex2. 我國31個(gè)省市自治區(qū)的“人均食品支出”對(duì)“人均收入”,“糧食單價(jià)”的依賴關(guān)系。建立多元回歸方程人均食品支出= a + b1 人均收入 + b2 糧食單價(jià) + 30線性回歸分析實(shí)例 SPSS 操作同Ex1多個(gè)自變量選擇變量的進(jìn)入方法為EnterEnter:自

10、變量強(qiáng)行進(jìn)入模式,即所有的自變量均一次性進(jìn)入整個(gè)模型。31線性回歸分析實(shí)例結(jié)果分析:* 擬合優(yōu)度檢驗(yàn)結(jié)果(Model Summary) 在多元線性回歸分析中,參考調(diào)整的R2比R2更能夠準(zhǔn)確地反映回歸方程對(duì)樣本數(shù)據(jù)的擬合程度。調(diào)整的判定系數(shù)R2,反映回歸效果的好壞32線性回歸分析實(shí)例多元回歸方程顯著性檢查H0:各個(gè)偏回歸系數(shù)與0同時(shí)無顯著差異。 若同時(shí)為0,則說明各個(gè)xi的變化不會(huì)引起y的線性變化,所有x無法解釋y的線性變化,y與x的全體不存在線性關(guān)系。33線性回歸分析實(shí)例34線性回歸分析實(shí)例回歸方程顯著性檢查反映回歸的效果,F(xiàn)的對(duì)應(yīng)概率值p =0.000 0.05 , 即a 與0 無顯著差異人

11、均收入:p = 0.000 0.05 , b1 與0 有顯著差異,通過檢驗(yàn)糧食平均單價(jià):p = 0.007 0.005 與0 有顯著差異,通過檢驗(yàn)則采用標(biāo)準(zhǔn)系數(shù)得到的回歸方程為人均食品支出 = 0.767*人均收入 + 0.243 * 糧食平均單價(jià)36線性回歸分析實(shí)例 多元線性模型中,回歸方程顯著性檢驗(yàn)與回歸系數(shù)顯著性檢驗(yàn)的作用不盡相同。回歸方程顯著性檢驗(yàn)只能檢驗(yàn)所有偏回歸系數(shù)是否同時(shí)為0.通過回歸方程顯著性檢驗(yàn)并不能保證回歸方程中不存在不能較好解釋說明y的xi. 回歸系數(shù)顯著性正是為此對(duì)每個(gè)偏回歸系數(shù)是否為0進(jìn)行逐一考察。兩種檢驗(yàn)各有作用,不能互相替代。37課后練習(xí) 利用SPSS 分析 “土地問題”采用Enter策略分析方法。問題提出:土地問題是當(dāng)今世界重大的經(jīng)濟(jì)問題,人口和經(jīng)濟(jì)發(fā)展都和土地之間存在著密不可分的聯(lián)系。人口數(shù),糧食總產(chǎn)量和糧食作物面積是影響土地面積的重要因素。某地區(qū)的基本數(shù)據(jù)如下表,用多元線性回歸分析土地面積與人口,糧食總產(chǎn)量及糧食作物面積的之間的量化關(guān)系。38課后練習(xí)時(shí)間/年199

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論