計量經(jīng)濟學(xué)第二章簡單線性回歸_第1頁
計量經(jīng)濟學(xué)第二章簡單線性回歸_第2頁
計量經(jīng)濟學(xué)第二章簡單線性回歸_第3頁
計量經(jīng)濟學(xué)第二章簡單線性回歸_第4頁
計量經(jīng)濟學(xué)第二章簡單線性回歸_第5頁
已閱讀5頁,還剩100頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1引子引子: :中國出境旅游人數(shù)中國出境旅游人數(shù)20202020年將達一億人次年將達一億人次? ?中新社北京中新社北京4 4月月3 3日電日電 : :從中國出境旅游交易會上獲悉,中國從中國出境旅游交易會上獲悉,中國每年出境游人次以每年出境游人次以25%25%的速度持續(xù)增長,預(yù)計到的速度持續(xù)增長,預(yù)計到20202020年將達年將達一億人次。如今中國是世界上旅游消費第二高的國家,在出一億人次。如今中國是世界上旅游消費第二高的國家,在出國旅游的人群中,中國人平均每人每天的消費達國旅游的人群中,中國人平均每人每天的消費達175175美元。美元。另據(jù)報道另據(jù)報道: :到到20202020年,中國旅游業(yè)總

2、收入將超過年,中國旅游業(yè)總收入將超過30003000億美億美元,相當于國內(nèi)生產(chǎn)總值的元,相當于國內(nèi)生產(chǎn)總值的8%8%至至11%11%。(國際金融報2004年11月25日) (參考現(xiàn)狀:第一產(chǎn)業(yè)占(參考現(xiàn)狀:第一產(chǎn)業(yè)占GDP15%,建筑業(yè)占,建筑業(yè)占GDP7%,海南旅游業(yè)占GDP13.62%)什么決定性因素能使中國出境旅游達一億人次什么決定性因素能使中國出境旅游達一億人次?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系怎樣具體測定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?2 顯然,對旅游起決定性影響

3、作用的是中國居民的收入顯然,對旅游起決定性影響作用的是中國居民的收入水平水平. . “出境旅游人次出境旅游人次” (Y Y)與)與“居民平均收入居民平均收入”(X X)有)有什么數(shù)量關(guān)系呢?什么數(shù)量關(guān)系呢? 能否用某種線性或非線性關(guān)系式能否用某種線性或非線性關(guān)系式 Y= f ( X ) Y= f ( X ) 去表現(xiàn)這種去表現(xiàn)這種數(shù)量關(guān)系呢數(shù)量關(guān)系呢? ?怎樣去表現(xiàn)呢怎樣去表現(xiàn)呢? ?需要研究經(jīng)濟變量之間數(shù)量關(guān)系的方法需要研究經(jīng)濟變量之間數(shù)量關(guān)系的方法為了不使問題復(fù)雜化為了不使問題復(fù)雜化, , 先從在某些古典先從在某些古典假定下的模型去討論假定下的模型去討論為什么先討論古典假定下的模型為什么先討

4、論古典假定下的模型? ?比喻:比喻:學(xué)習(xí)經(jīng)濟學(xué)時學(xué)習(xí)經(jīng)濟學(xué)時, ,總先熟悉總先熟悉“完全競爭理論完全競爭理論”,再,再接觸接觸“壟斷和寡頭等非完全競爭理論壟斷和寡頭等非完全競爭理論”。但是。但是, ,并不是說并不是說“完全競爭理論完全競爭理論”就總是真實的。就總是真實的。4研究方式:研究方式:由簡單到復(fù)雜由簡單到復(fù)雜 !在簡單的情況下理論更容易被闡述,!在簡單的情況下理論更容易被闡述,也最容易被接受,所以從最簡單的情況入手。也最容易被接受,所以從最簡單的情況入手。簡單線性回歸模型簡單線性回歸模型在計量經(jīng)濟模型中,只有兩個變量的線性回歸模型最簡單,稱為簡在計量經(jīng)濟模型中,只有兩個變量的線性回歸模

5、型最簡單,稱為簡單線性回歸模型。簡單線性回歸原理也最直觀。單線性回歸模型。簡單線性回歸原理也最直觀。主要討論主要討論: 回歸分析和回歸函數(shù)回歸分析和回歸函數(shù) 最小二乘估計最小二乘估計 回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度 參數(shù)的區(qū)間估計和假設(shè)檢驗參數(shù)的區(qū)間估計和假設(shè)檢驗 回歸模型預(yù)測回歸模型預(yù)測 案例分析案例分析6第一節(jié)第一節(jié) 回歸分析與回歸函數(shù)回歸分析與回歸函數(shù)一、相關(guān)分析與回歸分析(對統(tǒng)計學(xué)的(對統(tǒng)計學(xué)的回顧)回顧) 1 1、經(jīng)濟變量間的相互關(guān)系、經(jīng)濟變量間的相互關(guān)系 性質(zhì)上可分為性質(zhì)上可分為 確定性的函數(shù)關(guān)系確定性的函數(shù)關(guān)系 Y=f (X) 可用數(shù)學(xué) 不確定性的統(tǒng)計關(guān)系不確定性的統(tǒng)計關(guān)系

6、相關(guān)關(guān)系相關(guān)關(guān)系 可用統(tǒng)計 Y= f(X)+ (為隨機變量為隨機變量) 沒有關(guān)系沒有關(guān)系 不用分析 2、相關(guān)關(guān)系 相關(guān)關(guān)系的描述相關(guān)關(guān)系的描述 最直觀的描述方式最直觀的描述方式坐標圖(散布圖、散點圖)坐標圖(散布圖、散點圖) 7函數(shù)關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系沒有關(guān)系沒有關(guān)系 相關(guān)關(guān)系的類型類型 從涉及的變量數(shù)量看從涉及的變量數(shù)量看 簡單相關(guān)簡單相關(guān)兩個變量間兩個變量間 多重相關(guān)(復(fù)相關(guān))多重相關(guān)(復(fù)相關(guān)) 多個變量間多個變量間 從變量相關(guān)關(guān)系的表現(xiàn)形式看從變量相關(guān)關(guān)系的表現(xiàn)形式看 線性相關(guān)線性相關(guān)散布圖接近一條直線散布圖接近一條直線 非線性相關(guān)非線性相關(guān)散布圖接近一條曲線散布圖接近一條曲線

7、從變量相關(guān)關(guān)系變化的方向看從變量相關(guān)關(guān)系變化的方向看 正相關(guān)正相關(guān)變量同方向變化,同增同減變量同方向變化,同增同減 負相關(guān)負相關(guān)變量反方向變化,一增一減變量反方向變化,一增一減 不相關(guān)不相關(guān)無規(guī)律無規(guī)律89 3、相關(guān)程度的度量相關(guān)系數(shù) X和和Y的的總體線性相關(guān)系數(shù)總體線性相關(guān)系數(shù): 其中:其中: -X 的方差的方差 -Y的方差的方差 -X和和Y的協(xié)方差的協(xié)方差 X和和Y的的樣本線性相關(guān)系數(shù)樣本線性相關(guān)系數(shù): 其中:其中: 和和 分別是變量分別是變量X和和Y的樣本觀測值,的樣本觀測值, 和和 分別是變量分別是變量 X 和和Y 樣本值的平均值樣本值的平均值iXiY_X_Y(, )()( )Cov

8、X YVar X Var Y_22()()()()iiXYiiXX YYrXXYY(, )Cov X Y()Var X( )Var Y對相關(guān)系數(shù)的正確理解和使用對相關(guān)系數(shù)的正確理解和使用 X X和和Y Y 都是相互都是相互對稱對稱的隨機變量,的隨機變量, 線性相關(guān)系數(shù)只反映變量間的線性相關(guān)系數(shù)只反映變量間的線性相關(guān)線性相關(guān)程度,不能說明程度,不能說明非線性相關(guān)關(guān)系非線性相關(guān)關(guān)系 樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于抽樣抽樣波動波動,樣本相關(guān)系數(shù)是隨抽樣而變動的,樣本相關(guān)系數(shù)是隨抽樣而變動的隨機變量隨機變量,其統(tǒng)計,其統(tǒng)計顯著性有待檢驗(顯著性

9、有待檢驗(總體相關(guān)系數(shù)是隨機變量嗎?)總體相關(guān)系數(shù)是隨機變量嗎?) 相關(guān)系數(shù)只能反映變量間線性相關(guān)的方向和程度,相關(guān)系數(shù)只能反映變量間線性相關(guān)的方向和程度,不能不能確定變量間的因果關(guān)系確定變量間的因果關(guān)系,也不能說明相關(guān)關(guān)系具體接近哪,也不能說明相關(guān)關(guān)系具體接近哪條直線。條直線。 只作相關(guān)分析還不能達到經(jīng)濟計量分析的目的。只作相關(guān)分析還不能達到經(jīng)濟計量分析的目的。 計量經(jīng)濟學(xué)關(guān)心的問題:計量經(jīng)濟學(xué)關(guān)心的問題:經(jīng)濟變量間的因果關(guān)系及隱經(jīng)濟變量間的因果關(guān)系及隱藏在隨機性后面的統(tǒng)計規(guī)律性,在就要依靠回歸分析。藏在隨機性后面的統(tǒng)計規(guī)律性,在就要依靠回歸分析。10XYYXrr114 4、回歸分析、回歸分

10、析回歸的古典意義古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念 ( ( 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系) )子女的身高有向人的平均身高子女的身高有向人的平均身高 回歸回歸 的趨勢的趨勢回歸的現(xiàn)代意義現(xiàn)代意義:一個被解釋變量對若干個一個被解釋變量對若干個解釋變量依存關(guān)系的研究解釋變量依存關(guān)系的研究12(1)注意明確幾個概念)注意明確幾個概念(為深刻理解“回歸”) 被解釋變量被解釋變量Y的的條件分布和條件概率條件分布和條件概率: 當解釋變量當解釋變量X取某固定值時(條件),取某固定值時(條件),Y的值不確定,的值不確定,Y的不同取值形成一定的分布,這是的不同取值形成一定

11、的分布,這是Y的的條件分布條件分布。 X取某取某固定值時,固定值時,Y取不同值的概率稱為取不同值的概率稱為條件概率條件概率。 被解釋變量被解釋變量Y的的條件期望條件期望: 對于對于X 的每一個取值,的每一個取值, 對對Y所形成的分布確所形成的分布確 定其期望或均值,稱定其期望或均值,稱 為為Y的的條件期望或條件均條件期望或條件均 值值用用 表示。表示。 注意注意:Y:Y的條件期望是隨的條件期望是隨X X的變動而變動的的變動而變動的 iX)(iXYE)(iXYEYX13回歸線回歸線:對于每一個:對于每一個X的取值的取值 ,都有,都有Y的條件期望的條件期望 與之對應(yīng),代表與之對應(yīng),代表Y的條件期望

12、的點的軌跡形成的條件期望的點的軌跡形成的直線或曲線稱為回歸線。的直線或曲線稱為回歸線?;貧w函數(shù)回歸函數(shù):被解釋變量:被解釋變量Y的條件期望的條件期望 隨隨解釋變量解釋變量X的變化而有規(guī)律的變化而有規(guī)律的變化,如果把的變化,如果把Y的條件期的條件期望表現(xiàn)為望表現(xiàn)為X的某種函數(shù)的某種函數(shù) ,這個函數(shù)稱為回歸函數(shù)。這個函數(shù)稱為回歸函數(shù)。回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù) iXX YiX()iE Y X()iE Y X()iE Y XE()()iiY Xf X14每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X X10001500200025003

13、0003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家132414001615194321852365265030213399庭庭1448165020372210239827893064消消148917122078

14、2289248728533142費費1538177821792313251329343274支支160018412298239825383110出出17021886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X舉例舉例: 假如已知由假如已知由100100個家庭構(gòu)成的總體的數(shù)據(jù)個家庭構(gòu)成的總體的數(shù)據(jù) (單位單位:美元美元)(2)總體回歸函數(shù))總體回歸函數(shù)(PRF)15家庭消費支出的條件期望與家庭收入的關(guān)系的圖形家庭消費支出的條件期望與家庭收入的

15、關(guān)系的圖形:對于本例的總體,家庭消費支出的條件期望對于本例的總體,家庭消費支出的條件期望與家庭收入與家庭收入 基本是線性關(guān)系基本是線性關(guān)系, , 可以把家庭消費可以把家庭消費支出的條件均值表示為家庭收入的線性函數(shù):支出的條件均值表示為家庭收入的線性函數(shù):iiXXYE)()(iXYE)(iXYEiXiX16 總體回歸函數(shù)的概念總體回歸函數(shù)的概念 前提:前提:假如已知假如已知所研究的經(jīng)濟現(xiàn)象的總體的被解所研究的經(jīng)濟現(xiàn)象的總體的被解釋變量釋變量Y和解釋變量和解釋變量X的每個觀測值的每個觀測值 (通常這是不可能的!)(通常這是不可能的?。?那么,可以計算出總體被解釋變量那么,可以計算出總體被解釋變量Y

16、的條件期望的條件期望 ,并將其表現(xiàn)為解釋變量,并將其表現(xiàn)為解釋變量X的某種函數(shù)的某種函數(shù) 這個函數(shù)稱為總體回歸函數(shù)(這個函數(shù)稱為總體回歸函數(shù)(PRF) 總體回歸函數(shù)表現(xiàn)的是該總體活動的某種規(guī)律性總體回歸函數(shù)表現(xiàn)的是該總體活動的某種規(guī)律性)()(iiXfXYE)(iXYE17 iuiXXY)(iXYEiY條件期望條件期望表現(xiàn)形式表現(xiàn)形式例如例如Y的條件期望的條件期望 是解是解 釋變量釋變量X的線性函數(shù),可表示為:的線性函數(shù),可表示為: 個別值個別值表現(xiàn)形式表現(xiàn)形式(隨機設(shè)定形式)(隨機設(shè)定形式) 對于一定的對于一定的 ,Y的各個別值的各個別值 分布分布 在在 的周圍,若令各個的周圍,若令各個 與

17、條件與條件 期望期望 的偏差為的偏差為 ,顯然,顯然 是個隨機變量是個隨機變量 則有則有 iYiYiX)(iXYE12()()iiiiE Y Xf XX)(iXYE)(iXYEiuiuiiiiiiXYXYEYu21)(12iiiYXu總體回歸函數(shù)的表現(xiàn)形式總體回歸函數(shù)的表現(xiàn)形式PRF如何理解總體回歸函數(shù)如何理解總體回歸函數(shù)實際的經(jīng)濟研究中總體回歸函數(shù)(總體運動的規(guī)律性)實際的經(jīng)濟研究中總體回歸函數(shù)(總體運動的規(guī)律性)通常是通常是未知未知的,只能根據(jù)經(jīng)濟理論和實踐經(jīng)驗去的,只能根據(jù)經(jīng)濟理論和實踐經(jīng)驗去設(shè)定設(shè)定?!坝嬃坑嬃俊钡母灸康木褪且獙で罂傮w回歸函數(shù)。我們所設(shè)的根本目的就是要尋求總體回歸函數(shù)

18、。我們所設(shè)定的計量模型實際就是在設(shè)定總體回歸函數(shù)的形式。定的計量模型實際就是在設(shè)定總體回歸函數(shù)的形式??傮w回歸函數(shù)中總體回歸函數(shù)中Y Y與與X X的關(guān)系可以是的關(guān)系可以是線性線性的,也可以是的,也可以是非非線性線性的。的。1819注意:注意:在計量經(jīng)濟學(xué)中,線性回歸模型主要指在計量經(jīng)濟學(xué)中,線性回歸模型主要指就參數(shù)而言就參數(shù)而言是是“線性線性”的的,因為只要對參數(shù)而言是線性的因為只要對參數(shù)而言是線性的,都可以用都可以用類似的方法去估計其參數(shù),可以歸于線性回歸。類似的方法去估計其參數(shù),可以歸于線性回歸。iiiXXYE21)(iiiXXYE221)(iiiXXYE21)(“線性線性”的判斷的判斷

19、(3 3)隨機擾動項)隨機擾動項u概念概念 在總體回歸函數(shù)中,各在總體回歸函數(shù)中,各 個個 的值與其條件期望的值與其條件期望 的偏差的偏差 有很有很重要的意義,它代表排除在重要的意義,它代表排除在模型以外的所有因素對模型以外的所有因素對Y的的影響。影響。性質(zhì)性質(zhì) 是其期望為是其期望為0有一定分布的隨機變量有一定分布的隨機變量重要性:重要性:隨機擾動項的性質(zhì)決定著計量經(jīng)濟方法的隨機擾動項的性質(zhì)決定著計量經(jīng)濟方法的 選擇選擇20iuiuiY)(iiXYEiuiXXY()iE Y XiY 引入隨機擾動項引入隨機擾動項 的原因的原因是是未知未知影響因素影響因素的代表的代表( (理論的模糊性理論的模糊性

20、) ) 是是無法取得數(shù)據(jù)無法取得數(shù)據(jù)的已知影響因素的代表的已知影響因素的代表( (數(shù)據(jù)欠缺數(shù)據(jù)欠缺) ) 是是眾多細小影響因素眾多細小影響因素的綜合代表的綜合代表( (非系統(tǒng)性影響非系統(tǒng)性影響) ) 模型可能存在模型可能存在設(shè)定誤差設(shè)定誤差( (變量、函數(shù)形式的設(shè)定)變量、函數(shù)形式的設(shè)定) 模型中變量可能存在模型中變量可能存在觀測誤差觀測誤差( (變量數(shù)據(jù)不符合實際變量數(shù)據(jù)不符合實際) ) 變量可能有內(nèi)在變量可能有內(nèi)在隨機性隨機性( (人類行為的內(nèi)在隨機性人類行為的內(nèi)在隨機性) )21iu(4)樣本回歸函數(shù))樣本回歸函數(shù)(SRF)樣本回歸線:樣本回歸線: 對于對于X的一定值,取得的一定值,取得

21、Y 的樣本觀測值,可計算其條件的樣本觀測值,可計算其條件 均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù):樣本回歸函數(shù):如果把被解釋變量如果把被解釋變量Y的樣本條件的樣本條件均值均值 表示為解釋變量表示為解釋變量X的某種的某種函數(shù),這個函數(shù)稱為樣本回歸函函數(shù),這個函數(shù)稱為樣本回歸函數(shù)(數(shù)(SRF)。)。 22XYiYiYiXSRF23 樣本回歸函數(shù)如果為線性函數(shù),可表示為樣本回歸函數(shù)如果為線性函數(shù),可表示為 其中:其中: 是與是與 相對應(yīng)的相對應(yīng)的 Y 的樣本條件均值的樣本條件均值 和和 分別是樣本回歸函數(shù)的參數(shù)分別是樣本回歸函數(shù)的

22、參數(shù) 個別值(實際值)形式:個別值(實際值)形式: 被解釋變量被解釋變量Y的實際觀測值的實際觀測值 不完全等于樣本條件均值不完全等于樣本條件均值 ,二者之差用二者之差用 表示,表示, 稱為稱為剩余項剩余項或或殘差項殘差項: 則則 或或 12iiYXiY12iYieiiieYY12iiiYXeiXie樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式iY條件均值形式:條件均值形式:樣本回歸函數(shù)樣本回歸函數(shù)的特點的特點樣本回歸線隨抽樣波動而變化樣本回歸線隨抽樣波動而變化:每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,線,(SRF不唯一不唯一) Y S

23、RF1 SRF2 樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。函數(shù)形式一致。 X 樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸 線,它至多只是未知的總體回歸線的近似表現(xiàn)。線,它至多只是未知的總體回歸線的近似表現(xiàn)。24樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系 SRF PRF A X 25iYYiYiY()iiE Y XieiuiX對樣本回歸的理解對樣本回歸的理解 如果能夠獲得如果能夠獲得 和和 的數(shù)值,顯然的數(shù)值,顯然: 和和 是對總體回歸函數(shù)參數(shù)是對總體回歸

24、函數(shù)參數(shù) 和和 的估計的估計 是對總體條件期望是對總體條件期望 的估計的估計 在概念上類似總體回歸函數(shù)中的在概念上類似總體回歸函數(shù)中的 ,可,可 視為對視為對 的估計。的估計。26對比:對比: 總體回歸函數(shù)總體回歸函數(shù) 樣本回歸函數(shù)樣本回歸函數(shù)12iYieiuiu12()iiE Y X1212()iiiE Y XX12iiiYXu12iiYX12iiiYXe27 目的: 用樣本回歸函數(shù)用樣本回歸函數(shù)SRF去估計總體回歸函數(shù)去估計總體回歸函數(shù)PRF。 由于樣本對總體總是存在代表性誤差,由于樣本對總體總是存在代表性誤差,SRF 總會總會過高或過低估計過高或過低估計PRF。要解決的問題:要解決的問題

25、: 尋求一種規(guī)則和方法,使其得到的尋求一種規(guī)則和方法,使其得到的SRF的參數(shù)的參數(shù) 和和 盡可能盡可能“接近接近”總體回歸函數(shù)中的參數(shù)總體回歸函數(shù)中的參數(shù) 和和 的真實值。的真實值。這樣的這樣的“規(guī)則和方法規(guī)則和方法”有多種,最常用的是最小二乘法有多種,最常用的是最小二乘法11212回歸分析的目的回歸分析的目的第二節(jié)第二節(jié) 簡單線性回歸模型的最小二乘估計簡單線性回歸模型的最小二乘估計用樣本去估計總體回歸函數(shù),除了樣本以外,針對特定的用樣本去估計總體回歸函數(shù),除了樣本以外,針對特定的估計方法,還需要有一些前提條件估計方法,還需要有一些前提條件假定條件假定條件 1 1、簡單線性回歸的基本假定簡單線

26、性回歸的基本假定 為什么要作基本假定?為什么要作基本假定?(把問題簡化!)(把問題簡化?。?只有具備一定的假定條件,所作出的估計才具有良好只有具備一定的假定條件,所作出的估計才具有良好的的統(tǒng)計性質(zhì)統(tǒng)計性質(zhì)。 因為模型中有隨機擾動項,估計的參數(shù)是隨機變量,因為模型中有隨機擾動項,估計的參數(shù)是隨機變量,顯然參數(shù)估計值的分布與擾動項的分布有關(guān),只有對顯然參數(shù)估計值的分布與擾動項的分布有關(guān),只有對隨機擾動的分布作出假定,才能比較方便地隨機擾動的分布作出假定,才能比較方便地確定所估確定所估計參數(shù)的分布性質(zhì)計參數(shù)的分布性質(zhì),也才可能進行,也才可能進行假設(shè)檢驗和區(qū)間估假設(shè)檢驗和區(qū)間估計。計。假定分為:假定分

27、為:對模型和變量的假定對模型和變量的假定對隨機擾動項的假定對隨機擾動項的假定 28(1 1)對模型和變量的假定)對模型和變量的假定如如 假定模型設(shè)定是正確的(變量和模型假定模型設(shè)定是正確的(變量和模型無設(shè)定誤差)無設(shè)定誤差)假定解釋變量假定解釋變量X與擾動項與擾動項u是不相關(guān)是不相關(guān)的。的。(從變量從變量X角角度看度看)有時還假定:有時還假定:回歸模型對參數(shù)而言是線性的回歸模型對參數(shù)而言是線性的觀測次觀測次n必須大于待估計參數(shù)個數(shù)必須大于待估計參數(shù)個數(shù)(解釋變量個數(shù)解釋變量個數(shù))2912iiiYXu(2 2)對隨機擾動項)對隨機擾動項u u的假定的假定 假定假定1 1:零均值假定零均值假定:

28、在給定在給定X的條件下,的條件下, 的條件期望為零的條件期望為零 假定假定2 2:同方差假定同方差假定: 在給定在給定X的條件下,的條件方差為某個常數(shù)的條件下,的條件方差為某個常數(shù) 30iu22)()(iiiiiXuEuEXuVariu()0iiE u X231 假定假定3 3:無自相關(guān)假定無自相關(guān)假定: 隨機擾動項隨機擾動項 的逐次值互不相關(guān)的逐次值互不相關(guān) 假定假定4 4:隨機擾動隨機擾動 與解釋變量與解釋變量 不相關(guān)不相關(guān) 表明表明 和和 是各自獨立影響是各自獨立影響 iuiuiXiu( ,)( )()()0()ijiijjijCov u uE uE uuE uE uuij( ,)( )

29、()0iiiiiiCov u XE uE uXE XiXiY232假定假定5:注意注意: :并不是參數(shù)估計的每一具體步驟都要用到所有的假定并不是參數(shù)估計的每一具體步驟都要用到所有的假定, ,但對全部假定有完整的認識但對全部假定有完整的認識, ,對學(xué)習(xí)計量經(jīng)濟學(xué)是有益對學(xué)習(xí)計量經(jīng)濟學(xué)是有益的。的。iuiu2( ,)iuN o在對在對 的基本假定下的基本假定下 Y Y 的分布性質(zhì)的分布性質(zhì)由于由于其中的其中的 和和 是非隨機的,因此是非隨機的,因此 的分布性質(zhì)決定了的分布性質(zhì)決定了 的分布性質(zhì)。的分布性質(zhì)。 對對 的一些假定可以等價地表示為對的一些假定可以等價地表示為對 的假定:的假定: 假定假定

30、1:零均值假定:零均值假定 假定假定2:同方差假定:同方差假定 假定假定3:無自相關(guān)假定:無自相關(guān)假定 假定假定5:正態(tài)性假定:正態(tài)性假定 33iuiiiuXY21iuiuiYiY212(,)iiYNXiiiXXYE21)(12, iX2()iiVar Y X( ,)0ijCov Y Y 2、普通最小二乘法普通最小二乘法(OLS) (rdinary Least Squaresrdinary Least Squares)(1)OLS的基本思想:的基本思想: 不同的估計方法可以得到不同的樣本回歸參數(shù)不同的估計方法可以得到不同的樣本回歸參數(shù) 和和 ,所估計的,所估計的 也就不同。也就不同。 理想的估

31、計方法應(yīng)使理想的估計方法應(yīng)使 與與 的差即剩余的差即剩余 越越小越好小越好 因因 可正可負,所以可以取可正可負,所以可以取 最小最小即即在觀測值在觀測值Y和和X確定時,確定時, 的大小決定于的大小決定于 和和 。12iYiYieie2ie2212minmin()iiieYXiY2ie1234 (2) 正規(guī)方程和估計式正規(guī)方程和估計式用克萊姆法則求解得以觀測值表現(xiàn)的用克萊姆法則求解得以觀測值表現(xiàn)的OLS估計式:估計式: 352122()iiiiiiiXYXX YnXX222()iiiiiinX YXYnXX取偏導(dǎo)數(shù)并令其為取偏導(dǎo)數(shù)并令其為0,得正規(guī)方程,得正規(guī)方程12212iiiiiiYnXX

32、YXX21212122()2()0()2()0iiiiiiieYXeYXX 或或00iiiee X即即36 為表達得更簡潔,或者用離差形式為表達得更簡潔,或者用離差形式OLS估計式估計式: 容易證明容易證明 注意:注意:其中:其中: 本課程中大寫的本課程中大寫的 和和 均表示觀測值;均表示觀測值; 小寫的小寫的 和和 均表示觀測值的離差均表示觀測值的離差而且由而且由樣本回歸函數(shù)可用離差形式寫為樣本回歸函數(shù)可用離差形式寫為 _12YXXXxiiYYyii用離差表現(xiàn)的用離差表現(xiàn)的OLSOLS估計式估計式iiiyxiiXY2112YXixiyiXiY_22_222()()()()iiiiiiiiii

33、iinX YXYXX YYx yxnXXXX (3) OLSOLS回歸線的數(shù)學(xué)性質(zhì)回歸線的數(shù)學(xué)性質(zhì) 可以證明:(見教材P33P34證明) (證明過程用到OLS的結(jié)論,但與基本假定無關(guān)) 回歸線通過樣本均值回歸線通過樣本均值 估計值估計值 的均值等于實的均值等于實 際觀測值際觀測值 的均值的均值 剩余項剩余項 的均值為零的均值為零 37ie0neeiYXXYiY12YXiY12121()iiXXYYnn(由OLS第一個正規(guī)方程直接得到)(由OLS正規(guī)方程 兩邊同除n得到)12()0iiYX 被解釋變量估計值被解釋變量估計值 與剩余項與剩余項 不相關(guān)不相關(guān) Cov(,)0iiY eiYie 解釋變

34、量解釋變量 與剩余項與剩余項 不相關(guān)不相關(guān) ieiXCov(,)0iiX e由OLS正規(guī)方程:1Cov(,)()()0iiiiii ieX eeXXeX eXn12121Cov( ,)()()()()()0iiiiiii iiiiiiiY eYYeenYYeYeYeeeeeXX00iiiee X(注意注意:紅色的項為紅色的項為0)(4 4)OLSOLS估計式的統(tǒng)計性質(zhì)估計式的統(tǒng)計性質(zhì)參數(shù)估計式的優(yōu)劣需要有評價的標準參數(shù)估計式的優(yōu)劣需要有評價的標準 參數(shù)無法通過觀測直接確定,只能通過樣本估計,但因參數(shù)無法通過觀測直接確定,只能通過樣本估計,但因存在抽樣波動存在抽樣波動,參數(shù)估計值不一定等于總體參

35、數(shù)的真實值參數(shù)估計值不一定等于總體參數(shù)的真實值。 參數(shù)估計方法及所確定的估計式不一定完備,不一定參數(shù)估計方法及所確定的估計式不一定完備,不一定能得到總體參數(shù)的真實值,需要對估計方法作評價與選擇。能得到總體參數(shù)的真實值,需要對估計方法作評價與選擇。比較不同估計方法的估計結(jié)果時,需要有一定的評價標準比較不同估計方法的估計結(jié)果時,需要有一定的評價標準 基本要求:基本要求:參數(shù)估計值應(yīng)盡可能地接近總體參數(shù)的真實值參數(shù)估計值應(yīng)盡可能地接近總體參數(shù)的真實值估計準則:估計準則:“盡可能地接近盡可能地接近” 原則原則理論計量經(jīng)濟學(xué)主要討論參數(shù)估計式是否符合一定的準則,理論計量經(jīng)濟學(xué)主要討論參數(shù)估計式是否符合一

36、定的準則,怎樣才算怎樣才算“盡可能地接近盡可能地接近”總體參數(shù)的真實值呢?這決定于總體參數(shù)的真實值呢?這決定于參數(shù)估計式的統(tǒng)計性質(zhì):無偏性、最小方差性、一致性等。參數(shù)估計式的統(tǒng)計性質(zhì):無偏性、最小方差性、一致性等。 3940 無偏性 前提:前提:重復(fù)抽樣重復(fù)抽樣中中估計方法固定估計方法固定、樣本數(shù)不變樣本數(shù)不變、經(jīng)、經(jīng) 重復(fù)抽樣的觀測值重復(fù)抽樣的觀測值, ,可得一系列參數(shù)估計值可得一系列參數(shù)估計值 , , 的分布稱為的分布稱為 的抽樣分布,其密度函數(shù)記為的抽樣分布,其密度函數(shù)記為 如果如果 稱稱 是參數(shù)是參數(shù)的無偏估計式,否則的無偏估計式,否則 則稱則稱 是有偏的,其偏倚為是有偏的,其偏倚為

37、(見圖2)( )f( )E( )E( )E41 概 率 密 度 估計值 偏倚偏倚)(*E)(f)(*f圖242 最小方差最小方差( (有效有效) )性性前提:前提:樣本相同樣本相同、用、用不同的方法不同的方法估計參數(shù),可以找到若干估計參數(shù),可以找到若干 個不同的估計式個不同的估計式 目標目標: 努力尋求其抽樣分布具有最小方差的估計式努力尋求其抽樣分布具有最小方差的估計式 最小方差準則最小方差準則 (見圖(見圖3 3) 既是無偏的同時又具有最小方差的估計式,稱為最佳既是無偏的同時又具有最小方差的估計式,稱為最佳 (有效)估計式。(有效)估計式。43概率密度圖 3*()f( )f估計值 漸近性質(zhì)漸

38、近性質(zhì)(大樣本性質(zhì))(大樣本性質(zhì))思想思想:當樣本容量較小時,有時很難找到方差最小的無偏估計,當樣本容量較小時,有時很難找到方差最小的無偏估計,需要考慮樣本擴大后的性質(zhì)(需要考慮樣本擴大后的性質(zhì)(估計方法不變估計方法不變,樣本數(shù)逐步增大樣本數(shù)逐步增大)一致性:一致性: 當樣本容量當樣本容量 n 趨于無窮大時,如果估計式趨于無窮大時,如果估計式 依概率收斂于總體依概率收斂于總體參數(shù)的真實值,就稱這個估計式參數(shù)的真實值,就稱這個估計式 是是 的一致估計式。即的一致估計式。即 或或 (漸近無偏估計式是當樣本容量變得足夠大時其偏倚趨于零的(漸近無偏估計式是當樣本容量變得足夠大時其偏倚趨于零的估計式)估

39、計式) (見圖4)漸近有效性:漸近有效性:當樣本容量當樣本容量 n 趨于無窮大時,在所有的一致估計趨于無窮大時,在所有的一致估計式中,具有最小的漸近方差。式中,具有最小的漸近方差。441)(limPnP)lim(45概率密度估計值圖 4100()f80( )f40()f20()f 分析OLSOLS估計式的統(tǒng)計性質(zhì)估計式的統(tǒng)計性質(zhì)先明確幾點先明確幾點: :由由OLS估計式可以看出估計式可以看出 由可觀測的樣本值由可觀測的樣本值 和和 唯一表示。唯一表示。 因存在抽樣波動,因存在抽樣波動,OLS估計估計 是隨機變量是隨機變量 OLS估計式是估計式是點估計式點估計式 2122()iiiiiiiXYX

40、X YnXX46iYiX222()iiiiiinX YXYnXXkk1、 線性特征線性特征 是是Y的線性函數(shù)的線性函數(shù) 2、 無偏特性無偏特性 (證明見教材(證明見教材P37) 3、 最小方差特性最小方差特性 (證明見教材(證明見教材P68附錄附錄21) 在所有的線性無偏估計中,在所有的線性無偏估計中,OLS估計估計 具有最小方差具有最小方差(注意(注意:無偏性和最小方差性的證明中用到基本假定無偏性和最小方差性的證明中用到基本假定1假定假定4)結(jié)論:結(jié)論:在在古典假定條件古典假定條件下下,OLSOLS估計式是最佳線性無偏估計式是最佳線性無偏 估計式(估計式(BLUEBLUE:best line

41、ar unbiased estimatorbest linear unbiased estimator)47kkE)(k222()()()iiiiiiiiXX YYx yk yXXxOLSOLS估計式的統(tǒng)計性質(zhì)估計式的統(tǒng)計性質(zhì)高斯定理高斯定理2iiixkxk 第三節(jié)第三節(jié) 擬合優(yōu)度的度量擬合優(yōu)度的度量概念概念:樣本回歸線是對樣本數(shù)據(jù)樣本回歸線是對樣本數(shù)據(jù)的一種擬合,不同估計方的一種擬合,不同估計方法可以擬合出不同的回歸法可以擬合出不同的回歸線,擬合的回歸線與樣本線,擬合的回歸線與樣本觀測值總是有偏離。觀測值總是有偏離。 樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程

42、度 擬合優(yōu)度擬合優(yōu)度如何度量擬合優(yōu)度呢?如何度量擬合優(yōu)度呢?擬合優(yōu)度的度量建立在對擬合優(yōu)度的度量建立在對Y的總變差分解的基礎(chǔ)上的總變差分解的基礎(chǔ)上48XY 1、總變差的分解、總變差的分解 分析分析Y的觀測值、估計值與平均值的關(guān)系的觀測值、估計值與平均值的關(guān)系 將上式兩邊平方加總,可證得將上式兩邊平方加總,可證得(提示有(提示有 ) (TSS) (ESS) (RSS) 或者或者 總變差總變差 (TSS):被解釋變量:被解釋變量Y的觀測值與其平均值的離差平的觀測值與其平均值的離差平 方和方和(總平方和)(總平方和)(說明說明 Y 的變動程度)的變動程度) 解釋了的變差解釋了的變差 (ESS):被解

43、釋變量:被解釋變量Y的估計值與其平均值的的估計值與其平均值的 離差平方和離差平方和(回歸平方和)(回歸平方和) 剩余平方和剩余平方和 (RSS):被解釋變量觀測值與估計值之差的平方:被解釋變量觀測值與估計值之差的平方 和和(未解釋的平方和)(未解釋的平方和)49()()iiiiYYYYYY222()()()iiiiYYYYYY2iy222iiiyye2ie()0iiYY e2iy Y X 50iYYiX來自殘差SRF變差分解的圖示變差分解的圖示()iYY 來自回歸ie()iYY變差iY 2、可決系數(shù)、可決系數(shù) 以以TSS同除總變差等式兩邊:同除總變差等式兩邊: 或或 定義:定義:回歸平方和(解

44、釋了的變差回歸平方和(解釋了的變差ESS) 在總變在總變 差(差(TSS) 中所占的比重稱為可決系數(shù),用中所占的比重稱為可決系數(shù),用 或或 表示表示: 51ESSTSSTSSRSSTSSTSS2iy2r2iy222iyyR2221iiyeR22221iiiyyey或或2R可決系數(shù)的作用可決系數(shù)的作用 可決系數(shù)越大,說明在總變差中由模型作出了解可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)越小,說明模型對樣本觀測值的擬合之可決系數(shù)越小,說明模型對樣本觀測值的擬合程度越差。程度越差。 可決系數(shù)的特點可決系數(shù)的

45、特點: 可決系數(shù)取值范圍:可決系數(shù)取值范圍: 隨抽樣波動,樣本可決系數(shù)隨抽樣波動,樣本可決系數(shù) 是隨抽樣而變是隨抽樣而變 動的隨機變量動的隨機變量 可決系數(shù)是非負的統(tǒng)計量可決系數(shù)是非負的統(tǒng)計量52102 R2R運用可決系數(shù)時應(yīng)注意:運用可決系數(shù)時應(yīng)注意: 可決系數(shù)只是說明列入模型的所有解釋變量對可決系數(shù)只是說明列入模型的所有解釋變量對 被解釋變量的被解釋變量的聯(lián)合聯(lián)合的影響程度,不說明模型中每個的影響程度,不說明模型中每個 解釋變量的影響程度(在多元中)解釋變量的影響程度(在多元中) 如果回歸的主要目的是經(jīng)濟結(jié)構(gòu)分析,不能只追如果回歸的主要目的是經(jīng)濟結(jié)構(gòu)分析,不能只追 求高的可決系數(shù),而是要得

46、到總體回歸系數(shù)可信求高的可決系數(shù),而是要得到總體回歸系數(shù)可信 的估計量??蓻Q系數(shù)高并不一定每個回歸系數(shù)都的估計量??蓻Q系數(shù)高并不一定每個回歸系數(shù)都 可信任。可信任。 如果主要目的只是為了預(yù)測被解釋變量值,不是為如果主要目的只是為了預(yù)測被解釋變量值,不是為 了正確估計回歸系數(shù),一般可考慮有較高的可決系數(shù)。了正確估計回歸系數(shù),一般可考慮有較高的可決系數(shù)。5354第四節(jié)第四節(jié) 回歸系數(shù)的區(qū)間估計和假設(shè)檢驗回歸系數(shù)的區(qū)間估計和假設(shè)檢驗為什么要作區(qū)間估計?為什么要作區(qū)間估計? OLS估計只是通過樣本得到的點估計,不一定等估計只是通過樣本得到的點估計,不一定等于真實參數(shù),還需要找到真實參數(shù)的可能范圍,并說

47、于真實參數(shù),還需要找到真實參數(shù)的可能范圍,并說明其可靠性明其可靠性為什么要作假設(shè)檢驗?為什么要作假設(shè)檢驗?OLS 估計只是用樣本估計的結(jié)果,是否可靠?估計只是用樣本估計的結(jié)果,是否可靠? 是否抽樣的偶然結(jié)果?還有待統(tǒng)計檢驗。是否抽樣的偶然結(jié)果?還有待統(tǒng)計檢驗。區(qū)間估計和假設(shè)檢驗都是建立在確定參數(shù)估區(qū)間估計和假設(shè)檢驗都是建立在確定參數(shù)估計值計值 概率分布性質(zhì)的基礎(chǔ)上。概率分布性質(zhì)的基礎(chǔ)上。k55 1 1、OLSOLS估計的分布性質(zhì)估計的分布性質(zhì) 基本思想基本思想 是隨機變量,必須確定其分布性質(zhì)才可能進行區(qū)是隨機變量,必須確定其分布性質(zhì)才可能進行區(qū)間估計和假設(shè)檢驗間估計和假設(shè)檢驗 怎樣確定怎樣確定

48、 的分布性質(zhì)呢的分布性質(zhì)呢? 是服從正態(tài)分布的隨機變量,決定了是服從正態(tài)分布的隨機變量,決定了 也是服從正也是服從正態(tài)分布的隨機變量,態(tài)分布的隨機變量, 是是 的線性函數(shù),決定了的線性函數(shù),決定了 也是服從正態(tài)分布的隨機變量也是服從正態(tài)分布的隨機變量 正態(tài)正態(tài) 正態(tài)正態(tài) 正態(tài)正態(tài) 只要確定只要確定 的期望和方差,即可確定的期望和方差,即可確定 的分布性質(zhì)的分布性質(zhì) kkiuiYiYiuiYkkkkk56 的期望:的期望: (無偏估計)無偏估計) 的方差和標準誤差的方差和標準誤差 (證明見P38) (標準誤差是方差的平方根標準誤差是方差的平方根) 注意:注意:以上各式中以上各式中 未知但是常數(shù),

49、其余均是已知的未知但是常數(shù),其余均是已知的樣本觀測值,這時樣本觀測值,這時 和和 都不是隨機變量。都不是隨機變量。 ()kkE22()iSEx 的期望和方差222()iVarx2212()iiXVarNx212SE()iiXNx2kkk)(kVar)(kSE57 基本思想:基本思想: 是是 的方差,而的方差,而 不能直接觀測,只能從由樣本得不能直接觀測,只能從由樣本得到的到的 去獲得有關(guān)去獲得有關(guān) 的某些信息,去對的某些信息,去對 作出估計。作出估計。 可以證明(見附錄可以證明(見附錄2.2)其無偏估計為其無偏估計為 (n-2為自由度為自由度,即可自由變化的樣本觀測值個數(shù)即可自由變化的樣本觀測

50、值個數(shù))注意區(qū)別:注意區(qū)別: 是未知的確定的常數(shù);是未知的確定的常數(shù); 是由樣本信息估計的,是個隨機變量是由樣本信息估計的,是個隨機變量2222nei對隨機擾動項方差對隨機擾動項方差 的估計的估計iuiuiuie222222()E58對對 作標準化變換作標準化變換為什么要對為什么要對 作標準化變換作標準化變換?在在 正態(tài)性假定下,由前面的分析已知正態(tài)性假定下,由前面的分析已知但在對一般正態(tài)變量但在對一般正態(tài)變量 作實際分析時,要具體確作實際分析時,要具體確定定 的取值及對應(yīng)的概率是很麻煩的,為了便的取值及對應(yīng)的概率是很麻煩的,為了便于直接利用于直接利用“標準化正態(tài)分布的臨界值標準化正態(tài)分布的臨

51、界值”,需要對,需要對 作標準化變換。作標準化變換。標準化的方式:標準化的方式:kkkkk()()kkkkEzSEiu)(,kkkVarN59在在 已知時已知時對對 作標準化變換,所得作標準化變換,所得Z統(tǒng)計量為標準統(tǒng)計量為標準正態(tài)變量。正態(tài)變量。11111212(0,1)()iizNSEXnx2222222(0,1)()izNSEx (1 1) 已知時,對已知時,對 作標準化變換作標準化變換k注意注意:這時這時 和和 都不是隨機變量都不是隨機變量(X、 、 都是非隨機的)都是非隨機的))(2SE)(1SE2k2n60條件:條件: 當當 未知時未知時,可用,可用 (隨機變量)代替(隨機變量)代

52、替 去估計去估計參數(shù)的標準誤差參數(shù)的標準誤差。這時參數(shù)估計的標準誤差是個這時參數(shù)估計的標準誤差是個隨機變量。隨機變量。 樣本為大樣本時樣本為大樣本時, ,作標準化變換所得的統(tǒng)計量作標準化變換所得的統(tǒng)計量Z Zk k,也可以也可以 視為標準正態(tài)變量視為標準正態(tài)變量(根據(jù)中心極限定理)。(根據(jù)中心極限定理)。 樣本為小樣本時樣本為小樣本時, 用估計的參數(shù)標準誤差對用估計的參數(shù)標準誤差對 作標準化變換,所得的統(tǒng)作標準化變換,所得的統(tǒng) 計量用計量用t表示,這時表示,這時t將不再服從正態(tài)分布,而是服從將不再服從正態(tài)分布,而是服從 t 分布分布(注意這時分母是隨機變量) :22 (2)()kkktt nS

53、E(2 2) 未知時,對未知時,對 作標準化變換作標準化變換k2k2 2、回歸系數(shù)的區(qū)間估計基本思想基本思想: 對參數(shù)作出的點估計是隨機變量,雖然是無偏估對參數(shù)作出的點估計是隨機變量,雖然是無偏估計,但還不能說明這種估計的可靠性和精確性。計,但還不能說明這種估計的可靠性和精確性。 需要找到包含真實參數(shù)的一個范圍,并確定這樣需要找到包含真實參數(shù)的一個范圍,并確定這樣的范圍包含參數(shù)真實值的可靠程度的范圍包含參數(shù)真實值的可靠程度。方法:方法:如果在確定參數(shù)估計式概率分布性質(zhì)的基礎(chǔ)上,可如果在確定參數(shù)估計式概率分布性質(zhì)的基礎(chǔ)上,可 找到兩個正數(shù)找到兩個正數(shù)和和 ,能使得,能使得 這樣的區(qū)間包含真實這樣

54、的區(qū)間包含真實 的概率為的概率為 ,即,即 這樣的區(qū)間稱為所估計參數(shù)的置信區(qū)間。這樣的區(qū)間稱為所估計參數(shù)的置信區(qū)間。 61),(kkk) 10(11)(kkkP62怎樣正確理解置信區(qū)間怎樣正確理解置信區(qū)間?注意:注意: 是未知但是未知但確定確定的數(shù),的數(shù), 是隨抽樣而是隨抽樣而變化的變化的隨機區(qū)間隨機區(qū)間。從重復(fù)抽樣的觀點看,每次抽樣都可構(gòu)。從重復(fù)抽樣的觀點看,每次抽樣都可構(gòu)造一個區(qū)間,象這樣構(gòu)造的區(qū)間,平均來說有(造一個區(qū)間,象這樣構(gòu)造的區(qū)間,平均來說有( )比例的次數(shù)包含比例的次數(shù)包含 的真實值。的真實值。 kk(,)kk 1k問題:問題: 是給定的,如何去尋找合適的是給定的,如何去尋找合

55、適的 呢呢? 63樣本容量充分大樣本容量充分大樣本容量較小樣本容量較小總體方差總體方差 已知已知總總體體方方差差 未未知知*222222(0,1)()iZNSExZ將接近將接近標準正態(tài)分布標準正態(tài)分布服從服從 t 分布分布22k三三種種情情況況1)(kkkP基本思想基本思想:利用利用 標準化后的分布性質(zhì)去尋求標準化后的分布性質(zhì)去尋求 :置信區(qū)間:置信區(qū)間:標準正態(tài)分布標準正態(tài)分布回歸系數(shù)的區(qū)間估計回歸系數(shù)的區(qū)間估計 (分三種情況尋找合適的分三種情況尋找合適的 )(1) 當總體方差當總體方差 已知時已知時( Z 服從正態(tài)分布服從正態(tài)分布) 取定取定 (例如(例如 =0.05),查標準正態(tài)分布表得

56、與),查標準正態(tài)分布表得與 對對應(yīng)的臨界值應(yīng)的臨界值z (例如例如z為為1.96),則標準化變量,則標準化變量Z*(統(tǒng)計量)(統(tǒng)計量) 因為因為 或或 即即64222222()()1PzSEzSE 2221()PzzSE *222222(0,1)()iZNSExzz22()izSEzx0(2)當總體方差)當總體方差 未知,而樣本容量充分大時未知,而樣本容量充分大時方法:方法:可用無偏估計可用無偏估計 去代替未知的去代替未知的 ,由于樣本容量充分大,標準化變量由于樣本容量充分大,標準化變量Z*(統(tǒng)計量)將(統(tǒng)計量)將接近標準正態(tài)分布接近標準正態(tài)分布注意:這里的“ ”,表示“估計的”, 這時區(qū)間估

57、計的方式也可利用標準正態(tài)分布這時區(qū)間估計的方式也可利用標準正態(tài)分布只是這時只是這時65222*222222(0,1)()izNSEx2()zSE(3)當總體方差)當總體方差 未知,且樣本容量較小時未知,且樣本容量較小時方法:方法:用無偏估計用無偏估計 去代替未知的去代替未知的 ,由于樣本容量較小,由于樣本容量較小,“標準化變量標準化變量” t (統(tǒng)計量)不再(統(tǒng)計量)不再服從正態(tài)分布,而服從服從正態(tài)分布,而服從 t 分布。分布。這時可用這時可用 t 分布去建立參數(shù)估計的置信區(qū)間。選定分布去建立參數(shù)估計的置信區(qū)間。選定,查查 t 分布表得顯著性水平為分布表得顯著性水平為 ,自由度為,自由度為n-

58、2的臨界值的臨界值 (n-2) ,則有,則有即即 662222t222221()PttSE 2222222()()1PtSEtSE *222 (2)()tt nSE2例例1:研究某市城鎮(zhèn)居民人均鮮蛋需求量研究某市城鎮(zhèn)居民人均鮮蛋需求量Y(公斤公斤)與人均可支配收入與人均可支配收入X(元元,1980年不變價計年不變價計)的關(guān)系的關(guān)系設(shè)定模型設(shè)定模型: : 1995-2005年樣本數(shù)據(jù):估計參數(shù):估計參數(shù):年份19951996199719981999200020012002200320042005Y14.414.414.414.717.016.318.018.518.219.317.1X847.3

59、821.0884.2903.7984.11035.31200.91289.81432.91539.01633.616.57,1142.89,11YXntttuXY21224489.940.005858661.8iiix yx1216.570.005 1142.8910.60YX10.600.005ttYX可決系數(shù)計算舉例可決系數(shù)計算舉例例例1:由前面的估計結(jié)果可計算出由前面的估計結(jié)果可計算出 由數(shù)據(jù)由數(shù)據(jù)Y 可計算出可計算出:則則222210.561134.03161 0.31030.6897iieryr 210.56ie 22()34.0316iiYYy估計結(jié)果估計結(jié)果:估計估計 :給定給定

60、 查查df=9df=9的的t t分布臨界值分布臨界值參數(shù)區(qū)間估計參數(shù)區(qū)間估計:692210.561.1736211 2ien05. 0262. 2)9(025. 0t10.600.005ttYX2222222()()1PtSEtSE 05. 01001. 0262. 2005. 0001. 0262. 2005. 02P95. 0)0073. 00027. 0(2P221.1736()0.001858661.8iSEx2703、回歸系數(shù)的假設(shè)檢驗?zāi)康模耗康模汉唵尉€性回歸中,檢驗簡單線性回歸中,檢驗X對對Y是否有顯著影響是否有顯著影響(1 1)假設(shè)檢驗的基本思想)假設(shè)檢驗的基本思想 在某種條件下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論