第8章 相關(guān)與回歸分析(新)_第1頁
第8章 相關(guān)與回歸分析(新)_第2頁
第8章 相關(guān)與回歸分析(新)_第3頁
第8章 相關(guān)與回歸分析(新)_第4頁
第8章 相關(guān)與回歸分析(新)_第5頁
已閱讀5頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 據(jù)世界衛(wèi)生組織統(tǒng)計,全球肥胖癥患者達據(jù)世界衛(wèi)生組織統(tǒng)計,全球肥胖癥患者達3 3億人,億人,其中兒童占其中兒童占22002200萬人,萬人,1111億人體重過重。肥胖癥和體重億人體重過重。肥胖癥和體重超常早已不是發(fā)達國家的超常早已不是發(fā)達國家的“專利專利”,已遍及五大洲。目,已遍及五大洲。目前,全球因前,全球因”吃吃”致病乃至死亡的人數(shù)已高于因饑餓死致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。亡的人數(shù)。 (引自引自光明日報光明日報劉軍劉軍/文)文)問題問題: : 肥胖癥和體重超常與死亡人數(shù)真有顯著的數(shù)量關(guān)肥胖癥和體重超常與死亡人數(shù)真有顯著的數(shù)量關(guān)系嗎系嗎? ?這些類型的問題可以運用相關(guān)分析與回歸

2、分析的方法去這些類型的問題可以運用相關(guān)分析與回歸分析的方法去解決。解決。實例實例2:2:全球吃死的人比餓死的人多全球吃死的人比餓死的人多? ?一、變量間的相互關(guān)系一、變量間的相互關(guān)系二、相關(guān)關(guān)系的類型二、相關(guān)關(guān)系的類型三、簡單線性相關(guān)系數(shù)及其檢驗三、簡單線性相關(guān)系數(shù)及其檢驗)var()var(),cov(YXYXXYrXYr_22()()()()iiXYiiXXYYrXXYYr221(2)tr nrtn221rntr3.取定顯著性水平和自由度n-2,查t分布臨界表得t/2(n-2), 作出統(tǒng)計決策:若|t| t/2(n-2),則認為x與y之間線性相關(guān)關(guān)系顯著,否則,不顯著446.97x 446

3、.97x 446.97x312.757411.32yxy,210830.67x 25191.73y 222222()()20 7411.32446.97 312.7520 10830.67446.9720 5191.73 312.750.838nxyxyrnxxnyy 2220.83820 26.515511 0.838ntrr0.050.05/2(20 2) 2.101t 0.025(18)tt一、回歸分析的概念一、回歸分析的概念二、回歸分析與相關(guān)分析的關(guān)系二、回歸分析與相關(guān)分析的關(guān)系三、回歸系數(shù)的估計三、回歸系數(shù)的估計四、擬合優(yōu)度的度量四、擬合優(yōu)度的度量估計因變估計因變量平均值量平均值線

4、性 回 歸非 線 性 回 歸一 元 回 歸線 性 回 歸非 線 性 回 歸多 元 回 歸回 歸 模 型()Yf X()Yf X注意:注意: 隨機項隨機項 來自以下幾個方面:來自以下幾個方面:(1)自變量的省略)自變量的省略 (2) 統(tǒng)計誤差統(tǒng)計誤差 (3) 模型的設(shè)定誤差模型的設(shè)定誤差 (4) 隨機誤差隨機誤差 01YX01iiiyx( ,)iix y (/)0iiEX(/)0iiEX222var( /)( /)( )iiiiiiXEEXE(/)0iiEX222var( /)( /)( )iiiiiiXEEXEov( , )( )( )( , ) 0ijiijjijCEEEE (/)0iiEX

5、222var( /)( /)( )iiiiiiXEEXEov( , )( )( )( , ) 0ijiijjijCEEEE ( ,)( )()0iiiiiCovXEEXE Xi(/)0iiEX222var( /)( /)( )iiiiiiXEEXEov( , )( )( )( , ) 0ijiijjijCEEEE ( ,)( )()0iiiiiCovXEEXE X2(0,)iNi2(0,)iNi用用樣本統(tǒng)計量樣本統(tǒng)計量 和和 代替回歸方程中的未知參代替回歸方程中的未知參數(shù)數(shù) 和和 ,就得到了估計的回歸方程,就得到了估計的回歸方程0101總體總體回歸參數(shù)回歸參數(shù) 和和 是未知的,必須利用樣本數(shù)是

6、未知的,必須利用樣本數(shù)據(jù)信息去估計據(jù)信息去估計0101 yx01y (五)估計的回歸方程(五)估計的回歸方程iyiy01220111()()nniiiiiiyyyx最小xy1022()tttQeyy201()tQyx01012()02()0ttyxyx x1111221101nnniiiiiiinniiiinx yxynxxyx 0 和和 的估計公式如下:的估計公式如下:100()E11()E0100()E11()E12()iVarx12()iSEx202()iiXVarNx202()iiXSENx2112(,)iNx2002(,)iiXNNx n 因變量因變量 y 的取值是不同的,的取值是不

7、同的,y 取值的這種波動稱取值的這種波動稱為變差。變差來源于兩個方面:為變差。變差來源于兩個方面: (1)由于自變量)由于自變量 x 的取值不同造成的的取值不同造成的 (2)除)除 x 以外的其他因素以外的其他因素(如如x對對y的非線性的非線性影響、測量誤差等影響、測量誤差等)的影響的影響yxy10yy yyyy ),(iiyx對一個具體的觀測值來說,變差的大小可以通對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差過該實際觀測值與其均值之差 來表示來表示yy_222()()()iiiiyyyyyy注:注:K為回歸系數(shù)的個數(shù)為回歸系數(shù)的個數(shù)對于樣本對于樣本n個觀察值看,因變量的

8、變差可分解為:個觀察值看,因變量的變差可分解為:222112211-1 -nniiiinniiiiyyyySSRRSSTyyyy22Rr222ien 222ien222ienn比比 容易解釋,實際使用起來較為方便容易解釋,實際使用起來較為方便2()22iieyySSEsMSEnn21. 是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布己的分布2. 的的分布具有如下性質(zhì)分布具有如下性質(zhì)分布形式:正態(tài)分布分布形式:正態(tài)分布數(shù)學(xué)期望:數(shù)學(xué)期望:標準差標準差:)(E2xxi)(E21xxssiy() (2)tt nS2xxssiy2S 確定顯著性水平確定顯著性水

9、平 ,并進行決策,并進行決策 t t,拒絕,拒絕H0; t F ,拒絕拒絕H0;若若FF ,不不能拒絕能拒絕H0121211121212221111270561868045382821177379030721400iiiiiiiiiiinxyxx yy,1012 11773790 7056 186802.02887312 4538282 7056 7056111868 07056 363.68911212 故廣告投入與銷售量故廣告投入與銷售量之間的回歸方程為:之間的回歸方程為: 363.6891 2.028873xy2222()1642866.7()1602708.6()4015.8070.9

10、87SSTyySSRyySSEyySSRRSST2()4015.80763.3704212 2yy ysn01111:0,:02.02919.8820.102( )HHs1第二步,構(gòu)造t統(tǒng)計量 t=1(10)1.812,19.8821.812,0.t0.05/2第三步,給定的顯著性水平=0.05,查t分布臨界值t拒絕原假設(shè),回歸系數(shù)顯著不為0111:0,:01602709399.14015.807HHMSRFMSE第二步,構(gòu)造F統(tǒng)計量 0.05(1,10)6.94,399.16.94,F0.05/2第三步,給定的顯著性水平,查F分布臨界值F拒絕原假設(shè),總體線性回歸模型顯著。)0(612.767

11、,965.0,966.0)000.0()136.0()706.27()538.1(165.0371.74922pFRRptxy)7033. 1)27(,0518. 2)27(05. 0025. 0tt)21. 4)27, 1 (,63. 5)27, 1 (05. 0025. 0FF 試在顯著性水平為試在顯著性水平為=0.05下,對回歸系數(shù)和回歸方下,對回歸系數(shù)和回歸方程進行檢驗。程進行檢驗。2. 點預(yù)測值有ny 的個別值的點預(yù)測ny 的平均值的點預(yù)測在點預(yù)測條件下,平均值的點預(yù)測和個別值的的點預(yù)測是一樣的,但在區(qū)間預(yù)測中則不同對于自變量 x 的一個給定值x0 ,根據(jù)回歸方程得到因變量 y 的一

12、個估計值0 y0 yn利用估計的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的平均值的一個估計值E(y0) ,就是平均值的點預(yù)測2002211(2)1yniixxytnSnxx2002211(2)yniixxytnsnxx式中:sy為估計標準誤差xy10_FXX_2()FXX_X_2()FXXY越大,預(yù)測區(qū)間越寬越大,預(yù)測區(qū)間越寬當(dāng)當(dāng)=0,,表表 8 . 3 . 1 某地某地1978年年2003年年的 國 內(nèi) 生的 國 內(nèi) 生產(chǎn)總值產(chǎn)總值GDP與貨與貨運 周 轉(zhuǎn) 量運 周 轉(zhuǎn) 量的數(shù)據(jù)的數(shù)據(jù) R2)6.7511935+0.5952747yx 回歸方程: 檢驗Signific

13、ance F=1.395E-21;P-value=1.395E-21F ,拒絕H03. 確定顯著性水平,并進行決策 tt,拒絕H0; tt,不能拒絕H0 (1)iitt nkS)6991. 1)29(,0452. 2)29(05. 0025. 0tt)33. 3)29, 2(,20. 4)29, 2(05. 0025. 0FF試在顯著性水平為試在顯著性水平為=0.05下,對回歸系數(shù)和回歸方下,對回歸系數(shù)和回歸方程進行檢驗。程進行檢驗。)000. 0(919.126,894. 0,901. 0)000. 0()000. 0()001. 0()961. 3()337.12()754. 3(116.

14、21066. 0491.3692232pFRRptxxy例:例:中國各省財政中國各省財政收入(收入(y)與各?。┡c各省GDP(x2)及第一)及第一產(chǎn)業(yè)就業(yè)比重(產(chǎn)業(yè)就業(yè)比重(x3)額關(guān)系如下:額關(guān)系如下:2k012ky=+.+xxx2k01 122ky=+.+kxxx21122,kkkzx zx zx01 122.kkyzzz原模型可化為線性形式: 011YX令1ZX 原模型可化為線性函數(shù)形式:01YZ01lnlnyx*lnlnyyxx*01yx01ln yx*11(ln )/dyydxydyy yxdxx 表示變動一個單位,將變動%的百分比 lnyx11*(ln)/ dydyydxxxdxxyx表示變動1%,將變動個單位的絕對量 120 12yx x e1、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論