一元線性回歸模型06411_第1頁
一元線性回歸模型06411_第2頁
一元線性回歸模型06411_第3頁
一元線性回歸模型06411_第4頁
一元線性回歸模型06411_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Econometrics第三章第三章 一元線性回歸模型一元線性回歸模型(教材第二、三章)(教材第二、三章)第三章第三章 一元線性回歸模型一元線性回歸模型3.1 3.1 回歸的涵義回歸的涵義3.2 3.2 隨機(jī)擾動(dòng)項(xiàng)的來源隨機(jī)擾動(dòng)項(xiàng)的來源3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)3.6 3.6 擬合優(yōu)度擬合優(yōu)度3.7 3.7 預(yù)測預(yù)測學(xué)習(xí)要點(diǎn)學(xué)習(xí)要點(diǎn) 回歸模型的涵義,參數(shù)的回歸模型的涵義,參數(shù)的OLS估計(jì)估計(jì)及其性質(zhì),顯著性檢驗(yàn)及其性質(zhì),顯著性檢驗(yàn)3.1 3.1 回歸的涵義回歸的涵義回歸分析(回歸分析(re

2、gression analysis)用于研究一個(gè)變量(稱為被解釋變量被解釋變量或應(yīng)變量應(yīng)變量)與另一個(gè)或多個(gè)變量(稱為解釋變量解釋變量或自變量自變量)之間的關(guān)系。Y代表被解釋變量,X代表解釋變量;解釋變量有多個(gè)時(shí),用X1,X2,X3等表示。例:商品的需求量與該商品價(jià)格、消費(fèi)者收入以及其他競爭性商品價(jià)格之間的關(guān)系??傮w回歸函數(shù)(總體回歸函數(shù)(population regression function,PRF)例:學(xué)生的家庭收入與數(shù)學(xué)分?jǐn)?shù)有怎樣的關(guān)系?3.1 3.1 回歸的涵義回歸的涵義3.1 3.1 回歸的涵義回歸的涵義總體回歸函數(shù)(總體回歸函數(shù)(population regression f

3、unction,PRF)根據(jù)上面數(shù)據(jù)做散點(diǎn)圖3.1 3.1 回歸的涵義回歸的涵義總體回歸函數(shù)(總體回歸函數(shù)(population regression function,PRF)上圖中,圓圈點(diǎn)稱為條件均值;條件均值的連線稱為總體回歸線??傮w回歸線表明了Y的均值與每個(gè)X的變動(dòng)關(guān)系。上圖近似線性的總體回歸線可以表示成: 表示給定的X值所對(duì)應(yīng)的Y的均值; 、 稱為參數(shù)(parameters),也稱回歸系數(shù)(regression coefficients); 稱為截距(intercept), 稱為斜率(slope)。斜率系數(shù)度量了X每變動(dòng)一單位,Y(條件)均值的變化率。舉例: ,含義?12iiE Y

4、XBB XiE Y X1B2B1B2B20.001B 3.1 3.1 回歸的涵義回歸的涵義樣本回歸函數(shù)(樣本回歸函數(shù)(sample regression function, SRF)實(shí)際中往往無法獲得整個(gè)總體的數(shù)據(jù),怎么估計(jì)總體回歸函數(shù)?即如何求參數(shù)B1、B2?通常,我們僅僅有來自總體的一個(gè)樣本。我們的任務(wù)就是根據(jù)樣本信息估計(jì)總體回歸函數(shù)。怎么實(shí)現(xiàn)?3.1 3.1 回歸的涵義回歸的涵義樣本回歸函數(shù)(樣本回歸函數(shù)(sample regression function, SRF)表2-2、2-3的數(shù)據(jù)都是從表2-1中隨機(jī)抽取得到的。3.1 3.1 回歸的涵義回歸的涵義樣本回歸函數(shù)(樣本回歸函數(shù)(s

5、ample regression function, SRF)通過散點(diǎn)得到兩條“擬合”樣本數(shù)據(jù)的樣本回歸線。3.1 3.1 回歸的涵義回歸的涵義樣本回歸函數(shù)(樣本回歸函數(shù)(sample regression function, SRF)可用樣本回歸函數(shù)(SRF)表示樣本回歸線: 其中, 總體條件均值 的估計(jì)量;并非所有樣本數(shù)據(jù)都準(zhǔn)確地落在樣本回歸線上,因此建立隨機(jī)樣本回歸函數(shù): 其中, 是 的估計(jì)量,稱 為殘差(residual)。 表示了Y的實(shí)際值與樣本回歸估計(jì)值的差。 iY iE Y X12iiYbb X1122bBbB的估計(jì)量;的估計(jì)量12iiiYbb Xeieiuieie3.1 3.1

6、 回歸的涵義回歸的涵義樣本回歸函數(shù)(樣本回歸函數(shù)(sample regression function, SRF)回歸分析:根據(jù)樣本回歸函數(shù)估計(jì)總體回歸函數(shù)。3.1 3.1 回歸的涵義回歸的涵義“線性線性”回歸的特殊含義回歸的特殊含義對(duì)“線性”有兩種解釋:變量線性和參數(shù)線性。變量線性:例如前面的總體(或樣本)回歸函數(shù);下面的函數(shù)不是變量線性的:參數(shù)線性:參數(shù)B1、B2僅以一次方的形式出現(xiàn)。下面的模型是參數(shù)非線性的:本書主要關(guān)注參數(shù)線性模型。從現(xiàn)在起,線性回歸(linear regression)是指參數(shù)線性的回歸,而解釋變量并不一定是線性的。 212121, iiE YBB XE YBBX 2

7、12iE YBB X3.2 3.2 隨機(jī)擾動(dòng)項(xiàng)的來源隨機(jī)擾動(dòng)項(xiàng)的來源總體回歸函數(shù)說明在給定的家庭收入下,美國學(xué)生 平均的平均的數(shù)學(xué)分?jǐn)?shù)。但對(duì)于某一個(gè)學(xué)生,他的數(shù)學(xué)分?jǐn)?shù)可能與該平均水平有偏差??梢越忉尀?,個(gè)人數(shù)學(xué)分?jǐn)?shù)等于這一組的平均值加上或減去某個(gè)值。用數(shù)學(xué)公式表示為: 其中, 表示隨機(jī)擾動(dòng)項(xiàng),簡稱擾動(dòng)項(xiàng)。擾動(dòng)項(xiàng)是一個(gè)隨機(jī)變量,通常用概率分布來描述。12iiiYBB Xuiu3.2 3.2 隨機(jī)擾動(dòng)項(xiàng)的來源隨機(jī)擾動(dòng)項(xiàng)的來源對(duì)于回歸模型 稱為 被解釋變量(explained variable) 也稱 應(yīng)變量或因變量(dependent variable) 稱為 解釋變量(explanatory v

8、ariable) 也稱 自變量(independent variable) 稱為 參數(shù)(parameter) 稱為 隨機(jī)擾動(dòng)項(xiàng)(random error term)12iiiYBB XuiuiYiX12,B B3.2 3.2 隨機(jī)擾動(dòng)項(xiàng)的來源隨機(jī)擾動(dòng)項(xiàng)的來源上式如何解釋?可以認(rèn)為,在給定家庭收入水平 上,第i個(gè)學(xué)生的數(shù)學(xué)分?jǐn)?shù)可以表達(dá)為兩部分之和:一是 ,即 ,是該收入水平上的平均數(shù)學(xué)分?jǐn)?shù)。這一部分稱為系統(tǒng)或確定性部分。二是 ,稱為非系統(tǒng)或隨機(jī)成本,由收入以外的因素決定。此時(shí),稱 為隨機(jī)總體回歸函數(shù)(stochastic PRF)。 12iBB XiE Y XiuiX12iiiiiYE Y Xu

9、BB Xu3.2 3.2 隨機(jī)擾動(dòng)項(xiàng)的來源隨機(jī)擾動(dòng)項(xiàng)的來源3.2 3.2 隨機(jī)擾動(dòng)項(xiàng)的來源隨機(jī)擾動(dòng)項(xiàng)的來源性質(zhì)1:擾動(dòng)項(xiàng)代表了未納入模型變量的影響。例如個(gè)人健康狀況、居住區(qū)域等等。性質(zhì)2:反映了人類行為的內(nèi)在隨機(jī)性。即使模型中包括了決定數(shù)學(xué)分?jǐn)?shù)的所有變量,其內(nèi)在隨機(jī)性也不可避免,這是做任何努力都無法解釋的。性質(zhì)3:還代表了度量誤差,例如收入的數(shù)據(jù)可能不等于真實(shí)值。性質(zhì)4:“奧卡姆剃刀原則”即描述應(yīng)該盡可能簡單,只要不遺漏重要的信息,此時(shí)可以把影響Y的次要因素歸入隨機(jī)擾動(dòng)項(xiàng)。3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法(參數(shù)估計(jì):普通最小二乘法(OLS)根據(jù)樣本回

10、歸函數(shù)估計(jì)總體回歸函數(shù),要回答兩個(gè)問題:如何估計(jì)PRF?如何驗(yàn)證估計(jì)的PRF是真實(shí)的PRF的一個(gè)“好”的估計(jì)值?這里先回答第一個(gè)問題?;貧w分析中使用最廣泛的是普通最小二乘法(method of ordinary least squares, OLS)3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法(參數(shù)估計(jì):普通最小二乘法(OLS)最小二乘原理:由于不能直接觀察PRF: 所以用SRF 來估計(jì)它,因而最好的估計(jì)方法是,選擇 使得殘差 盡可能小。12iiiYBB Xu12iiiYbb Xe12 iiiiiiieYYYYYbb X實(shí)際的估計(jì)的12bb、ie3.3 3.3

11、參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法(參數(shù)估計(jì):普通最小二乘法(OLS)普通最小二乘法就是要選擇參數(shù) ,使得殘差平殘差平方和方和(residual sum of squares, RSS) 最小。即12bb、2ie22212 miniiiiiQeYYYbb X3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法(參數(shù)估計(jì):普通最小二乘法(OLS)如何確定 的值?根據(jù)微積分,當(dāng) 對(duì) 的一階偏導(dǎo)數(shù)為0時(shí),Q達(dá)到最小。即12bb、12bb、1200QbQb212iiQYbb X121200iiiiiYbb XYbb X X12212iiiiiiYnbb

12、XY XbXbX或3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法(參數(shù)估計(jì):普通最小二乘法(OLS)以上聯(lián)立方程組稱為正規(guī)方程組(normal equations)。求解 ,得注意: ,即小寫字母代表了變量與其均值的離差。上面給出的估計(jì)量稱為OLS估計(jì)量(OLS estimator)。12bb、1222222iiiiiiiiibYb XXXYYX YnXYx ybXnXxXX,iiiixXXyYY3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法(參數(shù)估計(jì):普通最小二乘法(OLS)OLS估計(jì)量的一些重要性質(zhì)用OLS法得出的樣本回歸線經(jīng)過樣

13、本均值點(diǎn),即殘差的均值 總為0。對(duì)殘差和解釋變量的積求和,其值為零,即對(duì)殘差與 (估計(jì)的 )的積求和,其值為零,即12Ybb Xeie n0iie x 0iieY iYiY3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)例子:數(shù)學(xué)例子:數(shù)學(xué)S.A.T分?jǐn)?shù)分?jǐn)?shù)3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)例子:數(shù)學(xué)例子:數(shù)學(xué)S.A.T分?jǐn)?shù)分?jǐn)?shù)根據(jù)公式可以得到回歸結(jié)果:432.41380.0013iiYX3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)例子:數(shù)學(xué)例子:數(shù)學(xué)S.A.T分?jǐn)?shù)分?jǐn)?shù)根據(jù)公式可以得到回歸結(jié)果:對(duì)估計(jì)結(jié)果的解釋:斜率系數(shù)0.0013表示在其他條件保持不變的情況下,

14、家庭年收入每增加1美元,數(shù)學(xué)S.A.T.分?jǐn)?shù)平均提高0.0013分截距432.4138表示,當(dāng)家庭年收入為0時(shí),數(shù)學(xué)平均分大約為432.4138。(這樣的解釋沒有什么經(jīng)濟(jì)意義)對(duì)截距最好的解釋是,它代表了回歸模型中所有省略變量對(duì)Y的平均影響。432.41380.0013iiYX3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)例子:受教育年限與平均小時(shí)工資例子:受教育年限與平均小時(shí)工資預(yù)期平均工資隨受教育年限的增加而增加回歸結(jié)果:0.01440.7241iiYX 3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)例子:股票價(jià)格與利率例子:股票價(jià)格與利率經(jīng)濟(jì)理論表明,股票價(jià)格和利率之間存在反

15、向關(guān)系。3.3 3.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)例子:股票價(jià)格與利率例子:股票價(jià)格與利率看起來兩個(gè)變量之間的關(guān)系不是線性的(即不是直線),因此,假設(shè)實(shí)際關(guān)系如下:回歸結(jié)果為:作為比較,線性回歸結(jié)果為:引發(fā)的一個(gè)重要問題:哪一個(gè)模型更好?如何進(jìn)行判斷?在模型選擇中使用那些檢驗(yàn)?后面將逐一回答。404.4067996.866 1iiYX121iiiYBBXu1229.341499.401iiYX3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)古典線性回歸模型(古典線性回歸模型(CLRM)的假定)的假定前面我們回答了“如何估計(jì)PRF”的問題OLS。下面我們要回答“怎樣判別它是真實(shí)PRF的一個(gè)

16、好的估計(jì)”的問題。只有假定了隨機(jī)擾動(dòng)項(xiàng)u的生成過程,才能判定SRF對(duì)PRF擬合得是好是壞。OLS估計(jì)量的推導(dǎo)與隨機(jī)擾動(dòng)項(xiàng)的生成過程無關(guān);但根據(jù)SRF進(jìn)行假設(shè)檢驗(yàn)時(shí),就必須對(duì)隨機(jī)擾動(dòng)項(xiàng)的生成做一些特殊的假定,否則無法進(jìn)行假設(shè)檢驗(yàn)。下面仍然沿用一元線性回歸模型來討論。3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)古典線性回歸模型(古典線性回歸模型(CLRM)的假定)的假定假定1. 回歸模型是參數(shù)線性的,但不一定是變量線性的?;貧w模型形式如下(可擴(kuò)展到多個(gè)解釋變量):假定2. 解釋變量 與隨機(jī)擾動(dòng)項(xiàng) 不相關(guān)。如果X是非隨機(jī)的,該假定自動(dòng)滿足;即使X是隨機(jī)的,如果樣本容量足夠大,也不會(huì)對(duì)分析產(chǎn)生嚴(yán)重影響

17、。12iiiYBB XuXu3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)古典線性回歸模型(古典線性回歸模型(CLRM)的假定)的假定假定3. 給定 ,擾動(dòng)項(xiàng)的均值為零。即iX0iE u X3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)古典線性回歸模型(古典線性回歸模型(CLRM)的假定)的假定假定4. 同方差(homoscedastic),即iu 2variu3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)古典線性回歸模型(古典線性回歸模型(CLRM)的假定)的假定假定5. 無自相關(guān)(no autocorrelation),即兩個(gè)擾動(dòng)項(xiàng)之間不相關(guān):cov,0, iju uij3.4 3.4 參數(shù)估計(jì)

18、的性質(zhì)參數(shù)估計(jì)的性質(zhì)古典線性回歸模型(古典線性回歸模型(CLRM)的假定)的假定假定6. 回歸模型是正確設(shè)定的,即模型不存在設(shè)定偏差或設(shè)定誤差。為什么需要以上6個(gè)假定?這些假定現(xiàn)實(shí)嗎?如果不滿足這些假定,情況又會(huì)怎樣?如何得知是否滿足所有這些假定?這些重要的問題暫時(shí)沒有答案,事實(shí)上,教材“第二部分”都是圍繞“如果假定不滿足時(shí)會(huì)怎樣”而展開的。3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)OLS估計(jì)量的方差與標(biāo)準(zhǔn)差估計(jì)量的方差與標(biāo)準(zhǔn)差有了上述假定后可以計(jì)算出估計(jì)量的方差和標(biāo)準(zhǔn)差。OLS估計(jì)量是隨機(jī)變量,因?yàn)槠渲惦S樣本的不同而變化,這些估計(jì)量的抽樣變異性通常由估計(jì)量的方差或其標(biāo)準(zhǔn)差來度量。 OLS估

19、計(jì)量的方差(variance)及標(biāo)準(zhǔn)差(standard error):怎么估計(jì) ?2222222var,varbibse bbx 12221112var,varibiXbse bbnx23.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)OLS估計(jì)量的方差與標(biāo)準(zhǔn)差估計(jì)量的方差與標(biāo)準(zhǔn)差根據(jù)下式估計(jì) :(n-2)稱為自由度。在一元線性回歸模型中有兩個(gè)參數(shù),在計(jì)算這兩個(gè)未知參數(shù)時(shí),失去了兩個(gè)自由度。因此,雖然有n個(gè)觀察值,但自由度僅為(n-2)。順便指出, 稱為回歸標(biāo)準(zhǔn)差(standard error of the regression,SER)。2222ien23.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性

20、質(zhì)OLS估計(jì)量的方差與標(biāo)準(zhǔn)差:數(shù)學(xué)估計(jì)量的方差與標(biāo)準(zhǔn)差:數(shù)學(xué)S.A.T一例(一例(教材有誤教材有誤)3.4 3.4 參數(shù)估計(jì)的性質(zhì)參數(shù)估計(jì)的性質(zhì)估計(jì)結(jié)果的報(bào)告估計(jì)結(jié)果的報(bào)告估計(jì)的數(shù)學(xué)SAT函數(shù)如下(括號(hào)內(nèi)數(shù)字為標(biāo)準(zhǔn)差):OLS估計(jì)量的性質(zhì)估計(jì)量的性質(zhì)可以概括為高斯-馬爾柯夫定理(Gauss-Markov theorem): 如果滿足古典線性回歸模型的基本假定,則在所有線性估計(jì)兩種,OLS估計(jì)量具有最小方差性,即OLS估計(jì)是最優(yōu)線性無偏估計(jì)量(BLUE)。具體見教材PP46。 432.41380.001316.9061 0.000245iiYXse3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)OLS估計(jì)量

21、的抽樣分布或概率分布估計(jì)量的抽樣分布或概率分布知道如何計(jì)算OLS估計(jì)量及其標(biāo)準(zhǔn)差仍然不夠,必須求出其抽樣分布才能進(jìn)行假設(shè)檢驗(yàn)。為了推導(dǎo)抽樣分布,再增加一條假定。假定假定7. 在總體回歸函數(shù) 中,擾動(dòng)項(xiàng) 服從均值為0,方差為 的正態(tài)分布。即為什么可以作這樣一個(gè)假定?12iiiYBB Xuiu220,iuN3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)OLS估計(jì)量的抽樣分布或概率分布估計(jì)量的抽樣分布或概率分布 可以證明, 是 的線性函數(shù),根據(jù)“正態(tài)變量的線性函數(shù)仍服從正態(tài)分布”,得知 服從正態(tài)分布。中心極限定理: 隨著樣本量的增加,獨(dú)立同分布隨機(jī)變量構(gòu)造的統(tǒng)計(jì)量近似服從正態(tài)分布。iu2120,iuNbb、

22、的概率分布?12bb、12bb、3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)OLS估計(jì)量的抽樣分布或概率分布估計(jì)量的抽樣分布或概率分布 12221122,bbbN BbN B3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)假定:家庭年收入對(duì)學(xué)生的數(shù)學(xué)成績沒有影響數(shù)值結(jié)果表明: 。因此,零假設(shè)不成立?不能僅看數(shù)值結(jié)果,抽樣波動(dòng)性會(huì)導(dǎo)致數(shù)值結(jié)果因樣本變化而不同 需要進(jìn)行假設(shè)檢驗(yàn)。怎么進(jìn)行?前面指出:當(dāng)我們知道估計(jì)量的抽樣分布后,假設(shè)檢驗(yàn)將不成問題。討論以下兩種方法:(1)置信區(qū)間法(2)顯著性檢驗(yàn)法02:0HB 20.0013b 2222,ibN Bx3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)檢

23、驗(yàn) 能否使用上式進(jìn)行假設(shè)檢驗(yàn)?問題在哪里?問題在于真實(shí)的 是未知的!可以用 來估計(jì)它,則有:2222220,1ibBbBZNse bx2222nibBttx2222,ibN Bx2222ien3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):置信區(qū)間法假設(shè)檢驗(yàn):置信區(qū)間法 在數(shù)學(xué)S.A.T一例中,共有10個(gè)觀察值,因此自由度為(10-2)=8。假定 ,顯著性水平或犯第一類錯(cuò)誤(棄真)的概率為5%,于是有 即 2222.3062.3060.95ibBPx2.3062.3060.95Pt 0212:0,:0HBHB3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):置信區(qū)間法假設(shè)檢驗(yàn):置信區(qū)間法整理 或 上

24、式給出了 的一個(gè)95%的置信區(qū)間:重復(fù)上述過程,100個(gè)這樣的區(qū)間中將有95個(gè)包括真實(shí)的 。代入 ,得區(qū)間不包括0,所以拒絕零假設(shè) :家庭年收入對(duì)數(shù)學(xué)S.A.T沒有影響。222222.3062.3060.95iiP bBbxx222222.3062.3060.95P bse bBbse b2B2B22bse b、20.000740.00187B02:0HB 3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):置信區(qū)間法假設(shè)檢驗(yàn):置信區(qū)間法圖形(教材有誤) 0.00074 0.001873.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):置信區(qū)間法假設(shè)檢驗(yàn):置信區(qū)間法按照上述過程,同樣可得截距 95%的置信

25、區(qū)間:如果 ,則顯然拒絕零假設(shè),因?yàn)樯鲜?5%的置信區(qū)間不包括0。如果 ,則不能拒絕該假設(shè),因?yàn)?5%的置信區(qū)間包括了這個(gè)值。1B1393.4283471.3993B0111:0,:0HBHB0111:400,:400HBHB3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):顯著性檢驗(yàn)法假設(shè)檢驗(yàn):顯著性檢驗(yàn)法核心思想是根據(jù)從樣本數(shù)據(jù)求得的檢驗(yàn)統(tǒng)計(jì)量的值決定接受或拒絕零假設(shè)。前面曾介紹如果令 ,其中, 是 的某個(gè)給定數(shù)值(例如, ),則根據(jù)樣本數(shù)據(jù)很容易求得可用計(jì)算出的t值作為檢驗(yàn)統(tǒng)計(jì)量,它服從自由度為(n-2)的t分布。相應(yīng)的檢驗(yàn)過程稱為t檢驗(yàn)。2222nbBttse b*222bBtse b估計(jì)

26、量-假設(shè)值估計(jì)量的標(biāo)準(zhǔn)誤*022:HBB*2B2B*20B 3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):顯著性檢驗(yàn)法假設(shè)檢驗(yàn):顯著性檢驗(yàn)法在具體進(jìn)行t檢驗(yàn)時(shí)(1)對(duì)于一元線性回歸模型(雙變量模型),自由度為(n-2)。(2)常用的顯著水平 有1%、5%或10%。為了避免選擇顯著水平的隨意性,通常求出p值(精確的顯著水平),如果計(jì)算的p值充分小,則拒絕零假設(shè)。(3)可用單邊或雙邊檢驗(yàn)。3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):顯著性檢驗(yàn)法假設(shè)檢驗(yàn):顯著性檢驗(yàn)法先看雙邊檢驗(yàn)(two-tailed test)假設(shè) ,有自由度為8時(shí),t的(雙邊)臨界值如果計(jì)算得到的 超過臨界值,則拒絕零假設(shè)。0

27、212:0,:0HBHB*2220.001305.43540.00245bBtse b顯著水平顯著水平臨界值臨界值t0.013.3550.052.3060.101.860t3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):顯著性檢驗(yàn)法假設(shè)檢驗(yàn):顯著性檢驗(yàn)法 本例t=5.4354,拒絕零假設(shè)。相伴概率p約為0.0006,說明如果拒絕零假設(shè),犯錯(cuò)的概率只有萬分之六。3.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):顯著性檢驗(yàn)法假設(shè)檢驗(yàn):顯著性檢驗(yàn)法再看單邊檢驗(yàn)(one-tailed test)由于預(yù)期家庭收入對(duì)數(shù)學(xué)成績的影響是正向的,因此假設(shè) (備擇假設(shè)是單邊的)。 此時(shí)犯第一類錯(cuò)誤的概率不是均等分布在t

28、分布的兩側(cè),而是集中于一側(cè)。左側(cè)還是右側(cè)?自由度為8時(shí),臨界t值(右側(cè))為:結(jié)論:拒絕零假設(shè)!0212:0,:0HBHB*2220.001305.43540.00245bBtse b顯著水平顯著水平臨界值臨界值t0.012.8960.051.8600.101.3973.5 3.5 顯著性檢驗(yàn)顯著性檢驗(yàn)假設(shè)檢驗(yàn):顯著性檢驗(yàn)法假設(shè)檢驗(yàn):顯著性檢驗(yàn)法單邊t檢驗(yàn): 3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線的優(yōu)度:判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r2t檢驗(yàn)表明樣本回歸函數(shù)很好地?cái)M合了樣本數(shù)據(jù)。但并非每一個(gè)Y值都準(zhǔn)確地落在了估計(jì)的PRF上。能否建立一個(gè)“擬合優(yōu)度”的判定規(guī)則,從而辨別估計(jì)的回歸線擬

29、合真實(shí)的Y值的優(yōu)劣程度? 判定系數(shù)r2(coefficient of determination) 前面講到 ,作恒等變化,得 iiiYYe iiiiiYYYYYYe即由X變異所解釋的部分未解釋部分或殘差的變異Yi的變異3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線的優(yōu)度:判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r2 小寫字母表示與均值的離差,得或?qū)憺閮蛇呁瑫r(shí)平方再求和,得 iiiiiYYYYYYe即由X變異所解釋的部分未解釋部分或殘差的變異Yi的變異iiiyye2iiiyb xeYY注:22iyb x注:222iiiyye0,0,28iieeYPP注:利用3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直

30、線的優(yōu)度:判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r2 上式出現(xiàn)的各種平方和定義如下: (total sum of squares, TSS),真實(shí)Y值圍繞其均值 的總變異。 (explained sum of squares, ESS),估計(jì)的Y值圍繞其均值 的變異,也稱回歸平方和(由解釋變量解釋的部分)。 (residual sum of squares, RSS),即Y變異未被解釋的部分。于是上式可以簡化為: 222iiiyye2iy 總平方和Y2iy 解釋平方和YY2ie 殘差平方和TSSESSRSS3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線的優(yōu)度:判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r

31、2 表明Y與其均值的總離差可分解為兩部分:一部分歸于回歸線,另一部分歸于隨機(jī)因素。TSSESSRSS3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線的優(yōu)度:判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r2對(duì)于 ,一般的情形是:ESS和RSS均不為零,如果ESS遠(yuǎn)大于RSS,則SRF在很大程度上解釋了Y的變異;如果RSS遠(yuǎn)大于ESS,則SRF只能部分解釋Y的變異。如何量化“擬合優(yōu)度”?兩邊同時(shí)除以TSS,得:定義 ,稱 為判定系數(shù)。度量回歸線的擬合優(yōu)度,或者說度量了回歸模型對(duì)Y變異的解釋比例。TSSESSRSS1ESSRSSTSSTSS2ESSrTSS2r3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線的優(yōu)度:

32、判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r2計(jì)算公式:數(shù)學(xué)S.A.T一例:該 值已經(jīng)相當(dāng)大了,收入變量X解釋數(shù)學(xué)S.A.T分?jǐn)?shù)79%的變異。1ESSRSSTSSTSS27801.077610.786936610r 222iiery2221iiery 2r3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線的優(yōu)度:判定系數(shù)擬合回歸直線的優(yōu)度:判定系數(shù)r2 的兩個(gè)重要性質(zhì):(1)非負(fù)性;(2) 趨于1表示擬合得好,反之表示擬合得不好。引起 較低的若干原因:引入的X不合適,其解釋能力較差;數(shù)據(jù)中被解釋變量個(gè)別觀測值具有較大的變差,使總平方和TSS變大。實(shí)際使用中,不可一味追求 趨于1。201r2r2r2r2r3.6 3.6 擬合優(yōu)度擬合優(yōu)度擬合回歸直線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論