第12章-回歸分析_第1頁
第12章-回歸分析_第2頁
第12章-回歸分析_第3頁
第12章-回歸分析_第4頁
第12章-回歸分析_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2021/8/61第十二章第十二章 回歸分析回歸分析 n學(xué)習(xí)目標(biāo)學(xué)習(xí)目標(biāo)n掌握簡單線性回歸模型基本原理。n掌握最小平方法。n掌握測定系數(shù)。n了解模型假定。n掌握顯著性檢驗(yàn)n學(xué)會(huì)用回歸方程進(jìn)行估計(jì)和預(yù)測。n了解殘差分析。2021/8/621. P370-1 4. P380-202. P372-7 5. P388-283. P380-18 6. P393-35習(xí) 題2021/8/63n案例討論:n1.這個(gè)案例都告訴了我們哪些信息?n2.通過閱讀這個(gè)案例你受到哪些啟發(fā)?2021/8/64n 根據(jù)一個(gè)變量(或更多變量)來估計(jì)某一變量的方法,統(tǒng)計(jì)上稱為回歸分析回歸分析(Regression analys

2、is)。n 回歸分析中,待估計(jì)的變量稱為因變因變量量(Dependent variables),用y表示;用來估計(jì)因變量的變量稱為自變量自變量(Independent variables),用x表示。 2021/8/65第一節(jié)第一節(jié) 簡單線性回歸模型簡單線性回歸模型 n 只涉及兩個(gè)變量(一個(gè)自變量和一個(gè)因變量)之間關(guān)系的回歸分析稱為簡簡單回歸分析單回歸分析(Simple regression analysis)。n 兩個(gè)變量之間的關(guān)系大約呈一條直線的簡單回歸分析稱為簡單線性回歸分簡單線性回歸分析析(Simple linear regression analysis)。2021/8/66一、從一

3、個(gè)實(shí)際問題入手一、從一個(gè)實(shí)際問題入手n用回歸分析可以預(yù)測運(yùn)行一條商業(yè)航空線的成本嗎?n如果可以,那么哪些變量與這一成本有關(guān)呢?2021/8/67飛機(jī)運(yùn)行成本飛機(jī)型號(hào)飛行距離乘客數(shù)量乘客數(shù)量行李或貨物重量天氣狀況2021/8/68n為了減少自變量個(gè)數(shù),我們做如下假定:n飛機(jī)類別波音737飛機(jī)n飛行距離500公里n航線可比,而且在每年的相同季節(jié)n在這種條件下,可以用乘客數(shù)來預(yù)測飛行的成本嗎?2021/8/69n 表12-1是每年相同季節(jié)波音737飛機(jī)在12條500公里的不同航線不同乘客數(shù)時(shí)的飛行成本。我們用這些數(shù)據(jù)以乘客數(shù)作為自變量構(gòu)造模型來預(yù)測成本。 2021/8/6102021/8/611二、

4、回歸模型和回歸方程二、回歸模型和回歸方程xy10(12.1) :因變量(隨機(jī)變量):因變量(隨機(jī)變量) y:自變量(給定變量):自變量(給定變量) x:參數(shù):參數(shù) 10、:誤差項(xiàng)(隨機(jī)變量),含義為說明在:誤差項(xiàng)(隨機(jī)變量),含義為說明在 中不能被中不能被 和和 之間線性關(guān)系解釋的變異之間線性關(guān)系解釋的變異性。性。 yxy2021/8/612n 在有關(guān) 假設(shè)中,有一個(gè)假設(shè)就是的期望值或均值等于0,即 0E(12.2) 如果簡單線性回歸模型滿足了這個(gè)條如果簡單線性回歸模型滿足了這個(gè)條件,那么就意味著件,那么就意味著 的均值或期望值就是的均值或期望值就是一個(gè)線性函數(shù)。一個(gè)線性函數(shù)。 y 描述描述

5、的均值與的均值與 的關(guān)系如何的方的關(guān)系如何的方程稱為程稱為回歸方程回歸方程(Regression equation)。)。 yx2021/8/613n在簡單線性回歸中 n1.回歸方程的圖形是一條直線(如圖12.1所示); xyE10(12.3) 2021/8/6142021/8/6152. : 的截距;的截距; 0y13. :斜率(回歸系數(shù)); 的含義:當(dāng)自變量的含義:當(dāng)自變量 給定一個(gè)具體變動(dòng)值給定一個(gè)具體變動(dòng)值時(shí),因變量時(shí),因變量 平均平均變化的量。變化的量。1xy2021/8/6162021/8/6172021/8/618三、估計(jì)回歸方程三、估計(jì)回歸方程 n 估計(jì)回歸方程估計(jì)回歸方程(E

6、stimated regression equation) 就是用樣本統(tǒng)計(jì)量作為參數(shù)的估計(jì)值所建立的回歸方程。 xbby10(12.4) : 的估計(jì)值的估計(jì)值y y: 的估計(jì)值的估計(jì)值 0b0: 的估計(jì)值的估計(jì)值 1b12021/8/6192021/8/620第二節(jié)第二節(jié) 最小平方法最小平方法 n 最小平方法最小平方法(Least squares method),也稱最小二乘法最小二乘法,是將回歸模型的方差之和最小化,以得到一系列方程,從這些方程中解出模型中需要的參數(shù)的一種方法。n 2021/8/621n(一)畫散點(diǎn)圖,以初步觀察成本與乘客數(shù)量之間是否呈回歸直線。 2021/8/622n(二)

7、建立估計(jì)回歸方程122110,ixbbyii(12.5) 最小平方法運(yùn)用樣本數(shù)據(jù)求出最小平方法運(yùn)用樣本數(shù)據(jù)求出 和和 的值,的值,使得因變量的實(shí)際觀察值使得因變量的實(shí)際觀察值 與其估計(jì)值與其估計(jì)值 之之差的平方和最小,即差的平方和最小,即0b1biyiy min2iiyy(12.6) 2021/8/623n(三)估計(jì)回歸方程斜率和截距的計(jì)算公式bxxnyxyxnbaxnxyxyxbiiiiii7 .127 .12221221 xbyb10(12.8)2021/8/6242021/8/6250407. 09307376412690.56930220.4462122221 xxnyxyxnbiii

8、i2021/8/626570. 1129300407. 012690.56110nxbnyxbyb2021/8/627 (四)將(四)將 和和 的計(jì)算結(jié)果代入式的計(jì)算結(jié)果代入式(12.5)有:)有: 1b0biixy0407. 0570. 1 計(jì)算結(jié)果表明,在其他條件相同情況下,計(jì)算結(jié)果表明,在其他條件相同情況下,12條航線上波音條航線上波音737飛機(jī)各條航線每次飛行時(shí)飛機(jī)各條航線每次飛行時(shí)每增加每增加1名乘客,將會(huì)使飛行成本平均增加名乘客,將會(huì)使飛行成本平均增加40.70元。元。 結(jié)論:結(jié)論:2021/8/628千元419. 4700407. 0570. 1iy*Y = 4.48千元二者差千

9、元二者差0.061千元或千元或61元。元。2021/8/629第三節(jié)第三節(jié) 一元線性回歸方程的評(píng)價(jià)一元線性回歸方程的評(píng)價(jià)n測定系數(shù)n估計(jì)標(biāo)準(zhǔn)誤差2021/8/630n一、測定系數(shù)n 回歸直線與各觀測數(shù)據(jù)的接近程度回歸直線與各觀測數(shù)據(jù)的接近程度稱為回歸直線的稱為回歸直線的擬合優(yōu)度擬合優(yōu)度。n 度量回歸直線的擬合優(yōu)度最常用的度量回歸直線的擬合優(yōu)度最常用的指標(biāo)是指標(biāo)是測定系數(shù)測定系數(shù),(,(又稱又稱可決系數(shù)可決系數(shù)、判判定系數(shù)定系數(shù))。)。n 該指標(biāo)是建立在對總離差平方和進(jìn)該指標(biāo)是建立在對總離差平方和進(jìn)行分解的基礎(chǔ)之上的。行分解的基礎(chǔ)之上的。 2021/8/631離差分解圖離差分解圖xyyxy10y

10、yyyyy),(iiyx離差分解圖2021/8/632離差平方和的分解離差平方和的分解兩端平方后求和有兩端平方后求和有)()(yyyyyy222yyyyyyiii總離差平方和(SST)回歸平方和(SSR)殘差平方和(SSE)22222)()(1)() (yyyyyyyySSTSSRRiiiii(12.9)(12.10)(12.11)2021/8/633決定系數(shù)的取值決定系數(shù)的取值nR2的取值范圍是的取值范圍是0,1。nR2越接近于越接近于1,表明回歸平方和占總離差,表明回歸平方和占總離差平方和的比例越大,回歸直線與各觀測點(diǎn)平方和的比例越大,回歸直線與各觀測點(diǎn)越接近,回歸直線的擬合程度就越好。越

11、接近,回歸直線的擬合程度就越好。n在一元線性回歸中,相關(guān)系數(shù)在一元線性回歸中,相關(guān)系數(shù)r的平方等于的平方等于判定系數(shù),符號(hào)與自變量判定系數(shù),符號(hào)與自變量x的系數(shù)一致。的系數(shù)一致。因此可以根據(jù)回歸結(jié)果求出相關(guān)系數(shù)。因此可以根據(jù)回歸結(jié)果求出相關(guān)系數(shù)。 2021/8/634n(一)殘差(一)殘差 n 殘差殘差(Residual error)是因變量的觀察值y和因變量的估計(jì)值 之間的偏差。iy iiyy 例如,上面的例子, 705ixi,元061. 0419. 448. 455 yy(12.12)2021/8/635表12-3 殘差計(jì)算表2021/8/636(二)誤差平方和(二)誤差平方和 n 殘差平

12、方的總和稱為殘差平方的總和稱為誤差平方和誤差平方和(Sum of squares of error,SSE)。)。 2iiyySSE(12.13) SSE的值是用估計(jì)回歸方程估計(jì)樣本中因的值是用估計(jì)回歸方程估計(jì)樣本中因變量的值時(shí)所產(chǎn)生誤差的一種測度。變量的值時(shí)所產(chǎn)生誤差的一種測度。 2021/8/637(三)總離差平方和(三)總離差平方和n 因變量的值與其均值之間離差的平方和稱為總離差平方和總離差平方和(Total sum of squares,SST)。2yySSTi(12.14) 2021/8/638(四)回歸平方和(四)回歸平方和 n 因變量的值與其估計(jì)值之間離差的平方和稱為回歸平方和回

13、歸平方和(Sum of squares due to regression,SSR)。 2iiyySSR(12.15) 2021/8/639例如;飛行成本案例中各種有關(guān)數(shù)據(jù)計(jì)算如下n表12-4 計(jì)算表 2021/8/640n由表12-4計(jì)算結(jié)果可知,nSSE = 0.31434,nSSR = 2.79775,nSST = 3.11209,n則 899. 011209. 379775. 22SSTSSRr2021/8/641n 這就是說,在一條商業(yè)航線上一架波音這就是說,在一條商業(yè)航線上一架波音737飛機(jī)飛行成本的方差中有飛機(jī)飛行成本的方差中有89.9%可以被可以被乘客數(shù)目說明或預(yù)測,換句話說,

14、飛行成乘客數(shù)目說明或預(yù)測,換句話說,飛行成本本Y的方差中不能由的方差中不能由X或回歸方程解釋的有或回歸方程解釋的有10.1%。 2021/8/642二、估計(jì)標(biāo)準(zhǔn)誤二、估計(jì)標(biāo)準(zhǔn)誤n 估計(jì)標(biāo)準(zhǔn)誤估計(jì)標(biāo)準(zhǔn)誤:是對各觀測數(shù)據(jù)在回歸直線周圍分散程度的一個(gè)度量值,它是對誤差項(xiàng)的標(biāo)準(zhǔn)差的估計(jì)。n估計(jì)標(biāo)準(zhǔn)誤反映了用估計(jì)的回歸方程擬合因估計(jì)標(biāo)準(zhǔn)誤反映了用估計(jì)的回歸方程擬合因變量變量Y時(shí)平均誤差的大小。時(shí)平均誤差的大小。n各觀測數(shù)據(jù)越靠近回歸直線,各觀測數(shù)據(jù)越靠近回歸直線,sy 就越小,回就越小,回歸直線對各觀測數(shù)據(jù)的代表性就越好。歸直線對各觀測數(shù)據(jù)的代表性就越好。n與與R2不同的是,估計(jì)標(biāo)準(zhǔn)誤是一個(gè)有單位的不同

15、的是,估計(jì)標(biāo)準(zhǔn)誤是一個(gè)有單位的平均數(shù)。平均數(shù)。MSEnSSEnyysiiy22)(2(12.16)2021/8/643n在飛行成本的案例中:nsse=0.31414 n=12千元1773. 01031434. 02nSSEsy【統(tǒng)計(jì)分析】計(jì)算結(jié)果表明,在12條商業(yè)航線上,每架波音737飛機(jī)在飛行500公里和其他條件相同情況下,其飛行成本與它們的平均飛行成本平均相差117.3元。2021/8/644三、利用測定系數(shù)計(jì)算相關(guān)系數(shù)三、利用測定系數(shù)計(jì)算相關(guān)系數(shù)n樣本相關(guān)系數(shù) 21rbrxy的符號(hào)(12.17) 例如,例如,在飛行成本的例子中,在飛行成本的例子中, 899. 02r0407. 01b95

16、. 0899. 02rrxy2021/8/645n 計(jì)算結(jié)果表明,波音計(jì)算結(jié)果表明,波音737飛機(jī)在相同季飛機(jī)在相同季節(jié)節(jié)12條航線上,乘客數(shù)量與運(yùn)行成本之間條航線上,乘客數(shù)量與運(yùn)行成本之間存在線性高度的正相關(guān)關(guān)系。存在線性高度的正相關(guān)關(guān)系。 2021/8/646測定系數(shù)與相關(guān)系數(shù)的聯(lián)系與區(qū)別測定系數(shù)與相關(guān)系數(shù)的聯(lián)系與區(qū)別 n 兩種系數(shù)都可以用來測量線性相關(guān)關(guān)系的強(qiáng)弱;n 兩種系數(shù)的取值范圍不同:測定系數(shù)在01之間,相關(guān)系數(shù)在-1 +1之間。n 兩種系數(shù)的作用范圍不同:相關(guān)系數(shù)只能用來測定雙變量之間的線性相關(guān)關(guān)系的強(qiáng)弱,測定系數(shù)除了可以測量雙變量之間線性相關(guān)關(guān)系的強(qiáng)弱外,還可以用來測量非線性相

17、關(guān)關(guān)系的強(qiáng)弱和多變量時(shí)的相關(guān)。因此,測定系數(shù)的應(yīng)用范圍比相關(guān)系數(shù)更廣泛。2021/8/647第四節(jié)第四節(jié) 模型假定模型假定 n 在進(jìn)行回歸分析時(shí),為了建立適當(dāng)?shù)哪P蛠碚f明因變量和自變量之間的關(guān)系,需要做出一些假定。n 簡單線性回歸的假定模型是: xy102021/8/648n 要確定假定模型是否恰當(dāng),就需要進(jìn)行顯著性檢驗(yàn)。n 顯著性檢驗(yàn)建立在以下有關(guān)假定的基礎(chǔ)上: 關(guān)于回歸模型中誤差項(xiàng) 的假定 (1)誤差項(xiàng) 是一個(gè)隨機(jī)變量,它的均值或期望值為0,即 0E(12.18)2021/8/649 xyE10 x2 (2)對于所有 值,誤差項(xiàng) 的方差( )相等,即 22221n (3)誤差項(xiàng))誤差項(xiàng) 值

18、是相互獨(dú)立的。值是相互獨(dú)立的。 jiEji 0(12.19)(12.20)2021/8/650n(4)誤差項(xiàng) 是一個(gè)服從正態(tài)分布的隨機(jī)變量niNi,2102(12.21)2021/8/651第五節(jié)第五節(jié) 回歸分析中的顯著性檢驗(yàn)回歸分析中的顯著性檢驗(yàn) n回歸分析中的顯著性檢驗(yàn)包括兩方面的內(nèi)容:回歸分析中的顯著性檢驗(yàn)包括兩方面的內(nèi)容:n一是對一是對單個(gè)自變量回歸系數(shù)單個(gè)自變量回歸系數(shù)的顯著性檢驗(yàn)(的顯著性檢驗(yàn)( t檢檢驗(yàn));驗(yàn));n二是對二是對整個(gè)回歸方程(所有自變量回歸系數(shù))整個(gè)回歸方程(所有自變量回歸系數(shù))顯著性的整體檢驗(yàn)(顯著性的整體檢驗(yàn)( F檢驗(yàn))檢驗(yàn))n在一元線性回歸模型中,由于只有一個(gè)

19、解釋在一元線性回歸模型中,由于只有一個(gè)解釋變量變量X,因此,對,因此,對10的的t檢驗(yàn)與對整個(gè)方檢驗(yàn)與對整個(gè)方程的程的F檢驗(yàn)是等價(jià)的。檢驗(yàn)是等價(jià)的。 2021/8/652一、單個(gè)回歸系數(shù)顯著性的一、單個(gè)回歸系數(shù)顯著性的t檢驗(yàn)檢驗(yàn)n第第1步:提出假設(shè)。一般為步:提出假設(shè)。一般為n對于一些具體問題也可能需要進(jìn)行單側(cè)檢驗(yàn)。對于一些具體問題也可能需要進(jìn)行單側(cè)檢驗(yàn)。n第第2步:確定檢驗(yàn)的統(tǒng)計(jì)量??梢宰C明在步:確定檢驗(yàn)的統(tǒng)計(jì)量??梢宰C明在回歸模型的基本假設(shè)成立時(shí),如果零假設(shè)回歸模型的基本假設(shè)成立時(shí),如果零假設(shè)正確,則有正確,則有0:0:1110HH)2(11ntsbtb(12.22)2021/8/653n

20、xxssyb221(12.23)2021/8/654n第第3步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值。步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值。n第第4步:進(jìn)行決策:步:進(jìn)行決策:n根據(jù)顯著性水平根據(jù)顯著性水平a a和自由度和自由度dfn2確定檢驗(yàn)統(tǒng)計(jì)量的臨界值,確定檢驗(yàn)統(tǒng)計(jì)量的臨界值, t taa時(shí)拒絕時(shí)拒絕H0;2021/8/655例如,已知在飛行成本的例子中, 1773. 0ys。,12737649302nxx004314. 012930737641773. 02221nxxssiiyb0407. 01b2021/8/6564344. 9004314. 00407. 011bsbt查表查表 (P453)=

21、2122/05. 0t228. 22021/8/657n 由于t = 9.43 ,表明t值落在拒絕域。因此,總體斜率 的假設(shè)被拒絕,說明X與Y之間線性關(guān)系是顯著的。n 即12條航線上,波音737飛機(jī)在飛行500公里和其他條件相同情況下,其乘客數(shù)量與飛行成本之間的線性關(guān)系是顯著的。 228. 2102/05. 0t012021/8/658單個(gè)回歸系數(shù)的顯著性檢驗(yàn)的幾點(diǎn)說明單個(gè)回歸系數(shù)的顯著性檢驗(yàn)的幾點(diǎn)說明n 為什么要檢驗(yàn)回歸系數(shù)是否等于為什么要檢驗(yàn)回歸系數(shù)是否等于0?n如果總體中的回歸系數(shù)等于零,說明相應(yīng)的自如果總體中的回歸系數(shù)等于零,說明相應(yīng)的自變量對變量對y缺乏解釋能力,在這種情況下我們可能

22、缺乏解釋能力,在這種情況下我們可能需要中回歸方程中去掉這個(gè)自變量。需要中回歸方程中去掉這個(gè)自變量。n 我們也可以對常數(shù)項(xiàng)進(jìn)行我們也可以對常數(shù)項(xiàng)進(jìn)行t檢驗(yàn),但大部分檢驗(yàn),但大部分情況下我們并不關(guān)心常數(shù)項(xiàng)的檢驗(yàn)結(jié)果。情況下我們并不關(guān)心常數(shù)項(xiàng)的檢驗(yàn)結(jié)果。n 通常情況下即使常數(shù)項(xiàng)在模型中不顯著,我通常情況下即使常數(shù)項(xiàng)在模型中不顯著,我們也會(huì)在模型中保留常數(shù)項(xiàng),去掉常數(shù)項(xiàng)可能們也會(huì)在模型中保留常數(shù)項(xiàng),去掉常數(shù)項(xiàng)可能會(huì)對模型帶來不利影響。會(huì)對模型帶來不利影響。2021/8/659n第第1步:提出假設(shè)。在一元回歸為步:提出假設(shè)。在一元回歸為 第第2步:確定檢驗(yàn)統(tǒng)計(jì)量:步:確定檢驗(yàn)統(tǒng)計(jì)量: ) 2, 1 ()

23、 2/(1/nFMSEMSRnSSESSRF二、方程整體顯著性的二、方程整體顯著性的F檢驗(yàn)檢驗(yàn) 顯著)兩個(gè)變量間的線性關(guān)系不顯著)兩個(gè)變量間的線性關(guān)系(0:(0:1110HH(12.24)2021/8/660 MSE:均方誤差均方誤差(Mean square error)是殘差平方和(SSE)除以自由度(n-2)所得的一個(gè)平均數(shù),它是殘差項(xiàng)方差的一個(gè)無偏估計(jì)量。 2nSSEMSE(12.25)2021/8/661n例如,在飛行成本的例子中nSSE=0.31434,(n-2)=(12-2)=10,n則031434. 01031434. 02nSSEMSE2021/8/662nMSR:均方回歸均方

24、回歸(Mean square regression)是回歸平方和(SSR)除以它的自由度所得的平均數(shù)?;貧w自由度SSRMSR (12.26)2021/8/663 在這一節(jié)所考慮的模型里,將回歸自在這一節(jié)所考慮的模型里,將回歸自由度定義為自變量的個(gè)數(shù),則由度定義為自變量的個(gè)數(shù),則自變量個(gè)數(shù)SSRMSR (12.27)2021/8/664n 在雙變量回歸分析中自變量是1個(gè),所以,MSR=SSRn 例如,在飛行成本的例子中,n SSR = 2.79775,n 所以MSR=SSR=2.79775。 第第3步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值。步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值。2021/8/665n第第4步:進(jìn)

25、行決策:步:進(jìn)行決策:n根據(jù)顯著性水平根據(jù)顯著性水平a a和自由度和自由度1,n2確定檢確定檢驗(yàn)統(tǒng)計(jì)量的臨界值驗(yàn)統(tǒng)計(jì)量的臨界值Fa a ,F(xiàn)Fa a時(shí)拒絕時(shí)拒絕H0;n或者或者p值值 96. 410105. 0,F(xiàn)所以,我們拒絕 ,并得出結(jié)論:0H 當(dāng)顯著性水平為0.05時(shí), F檢驗(yàn)提供了必要的統(tǒng)計(jì)證據(jù),使我們得出乘客數(shù)量與飛行成本之間存在顯著性關(guān)系的結(jié)論。012021/8/668n 在簡單回歸分析中,還可以利用F值與t值的關(guān)系來進(jìn)行F檢驗(yàn)。 2tF 例如,在飛行成本的例子中,已知t=9.43 92.8843. 922 tF(12.28)2021/8/669三、解釋顯著性檢驗(yàn)時(shí)應(yīng)注意的兩個(gè)問題

26、三、解釋顯著性檢驗(yàn)時(shí)應(yīng)注意的兩個(gè)問題 n(一)拒絕了零假設(shè),并得出自變量和(一)拒絕了零假設(shè),并得出自變量和 因變量之間存在統(tǒng)計(jì)顯著性關(guān)系的結(jié)論,因變量之間存在統(tǒng)計(jì)顯著性關(guān)系的結(jié)論,并不能使我們認(rèn)為和之間存在并不能使我們認(rèn)為和之間存在因果關(guān)系因果關(guān)系。 2021/8/670注意:相關(guān)關(guān)系注意:相關(guān)關(guān)系因果關(guān)系!因果關(guān)系!n 典型的錯(cuò)誤推斷:典型的錯(cuò)誤推斷:n慶祝生日有利于健康。統(tǒng)計(jì)慶祝生日有利于健康。統(tǒng)計(jì)分析表明,慶祝生日次數(shù)越分析表明,慶祝生日次數(shù)越多的人越長壽。多的人越長壽。n學(xué)生穿的鞋越大,他的識(shí)字學(xué)生穿的鞋越大,他的識(shí)字水平就越高:對小學(xué)各年級(jí)學(xué)生的抽樣調(diào)查表明,學(xué)生水平就越高:對小學(xué)

27、各年級(jí)學(xué)生的抽樣調(diào)查表明,學(xué)生的識(shí)字水平與他們鞋子的尺寸高度正相關(guān)。的識(shí)字水平與他們鞋子的尺寸高度正相關(guān)。n思考問題:如何證明兩個(gè)變量之間存在思考問題:如何證明兩個(gè)變量之間存在因果關(guān)系因果關(guān)系? 2021/8/671(二)僅僅能夠拒絕零假設(shè)和證明了統(tǒng)計(jì)(二)僅僅能夠拒絕零假設(shè)和證明了統(tǒng)計(jì)的顯著性,還不能得出結(jié)論:的顯著性,還不能得出結(jié)論:Y和和X之間之間存在線性關(guān)系。存在線性關(guān)系。 2021/8/672第六節(jié)第六節(jié) 回歸估計(jì)和預(yù)測回歸估計(jì)和預(yù)測n一、點(diǎn)估計(jì)一、點(diǎn)估計(jì) n利用回歸方程,對給定的某一特定值時(shí)的均值進(jìn)行估計(jì)或預(yù)測。例如,上面我們提到的在乘客人數(shù)為75人時(shí),對飛行成本的預(yù)測就是一種點(diǎn)估

28、計(jì)或預(yù)測。n二、區(qū)間估計(jì)二、區(qū)間估計(jì)n略2021/8/673三、三、Y Y均值的置信區(qū)間估計(jì)均值的置信區(qū)間估計(jì) 的估計(jì)值ppyEy :自變量某一給定的值:pxppxbby10的均值的對應(yīng)給定自變量yxyEpp:(12.29)2021/8/674n一般地說,當(dāng)用 估計(jì) 時(shí),不能希望二者正好相等。要推斷 是如何接近 真實(shí)均值 ,就需要根據(jù)回歸方程求出方差估計(jì)值。py pyEpy pyEnxxxxnssiipyyp/122222(12.30) pys2: 的方差的方差py 2021/8/675n 的標(biāo)準(zhǔn)差為: py nxxxxnssiipyyp/1222(12.31) 的置信區(qū)間估計(jì)公式為:的置信區(qū)

29、間估計(jì)公式為: pyEpypsty2/a(12.32) 2021/8/676n例如,在飛行成本的模型中,我們要預(yù)測當(dāng) (乘客人數(shù))為73時(shí),在95%的置信度內(nèi) (飛行成本)的均值。xy置信度置信度=95%; 05. 0adf = n 2 = 12 2 =10;s = 0.1773; 930 x5 .77x737642x228. 2102/05. 0t2021/8/6775411. 4730407. 057. 1pynxxxxnssiipyp/12220533667. 012930737645 .77741211773. 02273px當(dāng)當(dāng) 時(shí)時(shí)2021/8/678pyE的置信區(qū)間為:的置信區(qū)間為: pypsty2/a66. 442. 41217. 05411. 40533667. 0228. 25411. 4(12.33)2021/8/679n這說明,當(dāng) 時(shí),在95%的可信度下,Y的均值會(huì)落在4.424.66千元之間。73px2021/8/680四、預(yù)測某個(gè)四、預(yù)測某個(gè)Y值的單個(gè)區(qū)間值的單個(gè)區(qū)間 n 回歸預(yù)測的另外一種區(qū)間是對每個(gè)給定自變量的值預(yù)測單個(gè)Y值的估計(jì)區(qū)間。 nxxxxnstyiipyp/112222/a(12.34) 2021/8/681n例如,我們利用上一個(gè)例子的所有資料,便可預(yù)測當(dāng)X=73時(shí)單個(gè)Y值的估計(jì)區(qū)間。12930737645 .777

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論