版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章簡(jiǎn)單線性回歸模型計(jì)量經(jīng)濟(jì)學(xué)本章主要討論: 回歸分析與回歸函數(shù) 簡(jiǎn)單線性回歸模型參數(shù)的估計(jì) 擬合優(yōu)度的度量 回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 回歸模型預(yù)測(cè)第一節(jié) 回歸分析與回歸函數(shù)一、相關(guān)分析與回歸分析(一)經(jīng)濟(jì)變量之間的相互關(guān)系 相關(guān)關(guān)系 1、總體相關(guān) 變量之間具有本質(zhì)上的聯(lián)系 2、樣本相關(guān) 變量的樣本觀察值之間相關(guān)在概率統(tǒng)計(jì)中,我們將隨機(jī)變量之間的關(guān)系總結(jié)為: 相互獨(dú)立(沒有任何聯(lián)系) 不獨(dú)立線性相關(guān)非線性相關(guān)正相關(guān)負(fù)相關(guān)相互獨(dú)立:比如,張三的身體健康水平與李四的學(xué)習(xí)成績(jī)之間,沒有任何聯(lián)系。不獨(dú)立(有聯(lián)系):張三的身體健康水平與他自己的學(xué)習(xí)成績(jī)之間,有聯(lián)系。線性相關(guān):比如,收入與消費(fèi)、投資
2、與GDP、收入水平與汽車銷售量等等。美國的收入與消費(fèi)的散點(diǎn)圖:非線性相關(guān):非線性相關(guān):非線性相關(guān)的模擬數(shù)據(jù):正相關(guān):兩個(gè)量變化的方向相同負(fù)相關(guān):兩個(gè)量變化的方向相反(二)簡(jiǎn)單線性相關(guān)關(guān)系的度量 1、簡(jiǎn)單線性相關(guān)系數(shù) (簡(jiǎn)稱為相關(guān)系數(shù)) 總體相關(guān)系數(shù):式中,Cov(X,Y),表示X與Y的協(xié)方差,Var(X)、Var(Y)表示X、Y的方差 樣本相關(guān)系數(shù):式中,Xi、Yi分別表示X與Y的樣本數(shù)據(jù), 分別表示X、Y的均值。 在Eviews中計(jì)算相關(guān)系數(shù)的命令為:COR X,Y 2、相關(guān)系數(shù)的性質(zhì) 1)-1r1 2)r的絕對(duì)值越近于1,說明線性相關(guān)程度越高,越近于0,說明線性相關(guān)程度越低。 3)r=1,
3、稱為完全正相關(guān)。 4)r=-1,稱為完全負(fù)相關(guān)。 5)接近于1,比如0.98,稱為高度正相關(guān)。 6)接近于-1,比如-0.95,稱為高度負(fù)相關(guān)。完全正相關(guān):比如,在價(jià)格P不變時(shí),銷售收入Y與銷售量X之間。完全負(fù)相關(guān):高度正相關(guān):高度負(fù)相關(guān): (三)回歸分析 “回歸(Regression)”一詞最早出現(xiàn)在生物學(xué)的遺傳現(xiàn)象研究中,用來指子輩身高相對(duì)于父輩身高趨向其平均水平的傾向?,F(xiàn)在這一術(shù)語廣泛地用來指隨機(jī)因果關(guān)系中變量之間的統(tǒng)計(jì)規(guī)律?;貧w分析方法是計(jì)量經(jīng)濟(jì)學(xué)的基礎(chǔ)。 經(jīng)濟(jì)變量之間的因果關(guān)系有兩種:確定性的因果關(guān)系與隨機(jī)的因果關(guān)系。前者可以表示為數(shù)學(xué)中的函數(shù)關(guān)系,后者不能像函數(shù)關(guān)系那樣比較精確地描
4、述其變化規(guī)律,但是可以通過分析大量的統(tǒng)計(jì)數(shù)據(jù),找尋出它們之間的一定的數(shù)量變化規(guī)律,這種通過大量統(tǒng)計(jì)數(shù)據(jù)歸納出的數(shù)量變化規(guī)律稱之為統(tǒng)計(jì)相關(guān)關(guān)系,進(jìn)而稱為回歸關(guān)系。研究回歸關(guān)系的方法稱為回歸分析方法,表示回歸關(guān)系的數(shù)學(xué)式子稱為回歸方程。 比如,在市場(chǎng)經(jīng)濟(jì)條件下,當(dāng)商品的價(jià)格變化時(shí),雖然商品的銷售量受其價(jià)格變化的影響,但銷售量并不能由價(jià)格惟一確定,它還受到人們的消費(fèi)習(xí)慣、收入水平以及可替代品價(jià)格等因素 的影響。 像這種銷售量與其價(jià)格之間的關(guān)系,我們稱之為非確定性的因果關(guān)系,這時(shí)盡管我們不能像函數(shù)關(guān)系那樣比較精確地描述其變化規(guī)律,但是,可以通過分析有關(guān)銷售量與其價(jià)格的統(tǒng)計(jì)數(shù)據(jù), 找尋出它們之 間的一定
5、的 數(shù)量變化 規(guī)律。 二、總體回歸模型 假設(shè) X 為一個(gè)經(jīng)濟(jì)變量,Y 為另一個(gè)經(jīng)濟(jì)變量,且變量 X 與 Y 之間存在著非確定性的因果關(guān)系,即當(dāng) X 變化時(shí)會(huì)引起 Y 的變化,但這種變化是隨機(jī)的。例如,某種飲料的銷售量與氣溫的關(guān)系,銷售量受氣溫的影響而變化,但其變化又不能由氣溫惟一確定;再比如,家庭的周消費(fèi)額與周收入之間的關(guān)系等等。 由于變量Y的非確定性是由于它受一些隨機(jī)因素的影響,因此可以認(rèn)為,當(dāng)給定變量 X 的一個(gè)確定值之時(shí),所對(duì)應(yīng)的變量 Y 是一個(gè)隨機(jī)變量,記作Y|X 。假定條件隨機(jī)變量 Y|X 的數(shù)學(xué)期望值是存在的,即 E( Y|X ) 存在,由于同一隨機(jī)變量的數(shù)學(xué)期望值是惟一的,故 E
6、(Y|X ) 能夠由 X 的值惟一地確定,于是 E(Y|X )是變量X 的函數(shù), 令 (2.1) 我們稱(2.1)式為變量 Y 關(guān)于變量 X 的總體回歸方程(Population Regression Equation)或稱總體回歸函數(shù)(Population Regression Function),回歸函數(shù)的圖像稱為回歸曲線。這里,(X) 是X 的一元函數(shù),它可以是任何一種形式,其中最簡(jiǎn)單的形式就是線性函數(shù),當(dāng)為線性函數(shù)之時(shí), 令 這時(shí) (2.1) 式變?yōu)?(2.2) 現(xiàn)在的總體回歸方程為線性方程,我們稱 (2.2) 式為變量Y 關(guān)于變量 X 的總體線性回歸方程,由于只有一個(gè)解釋變量,故稱為
7、總體一元線性回歸方程。此時(shí),回歸曲線變成了直線,我們稱它為總體回歸直線 令 U = Y E(Y|X) (2.3) 即U為變量 Y中不能由變量X的線性關(guān)系表示的部分,由于對(duì)應(yīng) X 的每一個(gè)給定值 X=X0 ,所對(duì)應(yīng)的 Y 為一個(gè)隨機(jī)變量,因此 ,可以將 Y 看成一簇隨機(jī)變量(即一系列隨機(jī)變量組成的集合),從而U 也為一簇隨機(jī)變量。將 (2.2) 、(2.3) 結(jié)合可得: 我們稱(2.4)為變量Y 關(guān)于變量 X 的總體一元線性回歸模型。式中,X 稱為解釋變量,Y 稱為被解釋變量, 稱為總體回歸參數(shù),U 稱為隨機(jī)擾動(dòng)項(xiàng),或稱隨機(jī)項(xiàng),或稱擾動(dòng)項(xiàng),或稱誤差項(xiàng)。 三、擾動(dòng)項(xiàng)的本質(zhì)含義 在上述總體一元線性回
8、歸模型中,將被解釋變量Y與回歸函數(shù)部分 之差定義作擾動(dòng)項(xiàng),即將被解釋變量Y分為兩部分,一部分是可以由X的線性函數(shù)解釋的部分,即 ,另一部分是不能由 X 的線性函數(shù)解釋的部分,即擾動(dòng)項(xiàng)U ,擾動(dòng)項(xiàng)U具體包含以下四部分內(nèi)容: 1. 被忽略的有關(guān)因素 在一元線性回歸模型中,我們討論由于解釋變量 X 的變化而引起被解釋變量 Y 的變化,但事實(shí)上,影響經(jīng)濟(jì)變量 Y 的不止一個(gè)因素 X ,比如說還有其他 m 個(gè)因素對(duì) Y 有影響,而當(dāng)變量 X 是影響變量 Y 的主要一個(gè)因素時(shí),且我們又著重考慮 X 對(duì) Y 的影響之時(shí),就忽略了其他有關(guān) 的m 個(gè)變量,只考慮X 對(duì) Y 的影響,這時(shí),其他m 個(gè)被省略的有關(guān)變
9、量對(duì) Y 的影響仍然是存在的,其影響即并入擾動(dòng)項(xiàng) U 中。 2. 回歸函數(shù)的設(shè)定誤差 在實(shí)際應(yīng)用中,為了避免計(jì)算的復(fù)雜性,或者由于技術(shù)處理上的局限性,我們?cè)谶x取總體回歸函數(shù)時(shí),往往是取其近似形式。這時(shí),所選用的回歸函數(shù)與本質(zhì)上存在的回歸函數(shù)之間有一定的誤差。再則,如前所述,大多數(shù)情況下,總體回歸函數(shù)的形式是未知的,我們只能根據(jù)樣本觀察點(diǎn)的分布情況來近似地設(shè)定總體回歸函數(shù),這種設(shè)定自然會(huì)產(chǎn)生一定的誤差,上述誤差也包括在擾動(dòng)項(xiàng)之中。 3. 變量的測(cè)量誤差 變量的測(cè)量誤差包含兩方面的內(nèi)容,一方面,在觀察或測(cè)量變量數(shù)據(jù)的過程中,總要產(chǎn)生某些主觀或客觀上的誤差,使有關(guān)變量的觀察值并不精確地等于其實(shí)際值;
10、另一方面,有些經(jīng)濟(jì)變量是一種綜合性變量,其統(tǒng)計(jì)數(shù)據(jù)通過若干個(gè)變量的統(tǒng)計(jì)數(shù)據(jù)歸并而得,歸并過程中的各種誤差也是一種測(cè)量誤差。 例如,統(tǒng)計(jì)資料中,同一經(jīng)濟(jì)指標(biāo),常常由于計(jì)算口徑不一致而造成數(shù)據(jù)的不一致,其中大部分是由于指標(biāo)的分類與歸并方法不同 而造成的。 4. 隨機(jī)誤差 經(jīng)濟(jì)過程的運(yùn)行不可能像自然科學(xué)那樣在可控實(shí)驗(yàn)室中進(jìn)行,這就不可避免地會(huì)涉及到一些不可控制的因素的影響,如氣候變量等自然因素的影響、消費(fèi)偏好等人文因素的影響等等。即使沒有以上13項(xiàng)誤差,在相同的條件下運(yùn)行同一經(jīng)濟(jì)過程,所得結(jié)果往往也不一樣。這種差異就是隨機(jī)誤差,它是由于一些隨機(jī)或偶然的因素而造成的。四、樣本回歸模型 在經(jīng)濟(jì)現(xiàn)象的研究
11、中,經(jīng)濟(jì)變量的總體分布大多數(shù)是未知的,比如,消費(fèi)支出的精確分布我們無從所知。因此總體線性回歸方程中的參數(shù)具體等于多少也是未知的,總體參數(shù)只是理論上存在的。我們只能根據(jù)樣本觀察值進(jìn)行統(tǒng)計(jì)推斷,以此來估計(jì)總體回歸方程和總體回歸參數(shù)。 假設(shè)取得X與Y的n個(gè)樣本觀察點(diǎn)(X1,Y1),(X2,Y2),.,(Xn ,Yn),設(shè)法用這n個(gè)點(diǎn)擬合一直線,使之近似地代替總體回歸直線,令 該直線方程為 我們稱(2.8)式為變量 Y 關(guān)于變量X 的樣本回歸方程(Sample Regression Equation)或稱樣本回歸函數(shù)(Sample Regression Function ),稱該直線為樣本回歸直線,
12、稱為樣本回歸參數(shù)。 令 (2.9) 稱 為Yi 的擬合值。則 是樣本回歸直線上的點(diǎn)。 設(shè) (2.10) 則 (2.11) 我們稱(2.11)式為變量Y 關(guān)于變量 X 的樣本一元線性回歸模型。e i 稱為殘差項(xiàng)(RESIDAL)。 例2.1 家庭消費(fèi)模型 假定某地區(qū)共有100個(gè)家庭,我們來研究家庭月消費(fèi)支出Y與可支配收入X之間的聯(lián)系,X與Y之間的關(guān)系如何?我們收集樣本數(shù)據(jù)(如表2.1),收入水平X的取值分別為1000、1500、2000、2500、3000、3500、4000、4500、5000、5500,同一收入水平的下的家庭個(gè)數(shù)不等,比如收入為1000的家庭有4個(gè),而收入為3000的家庭有1
13、4個(gè)。 第一步:輸入數(shù)據(jù) 在Eviews中建立一個(gè)Cross Section的Workfile: 1、用命令:Create U 1 100 2、用Menu:File/New/Workfile/Undated or irregular 再輸入: Start observation End observation 點(diǎn)擊OK即可。1 100 這時(shí)進(jìn)入Workfile 界面。 第二步:輸入、保存數(shù)據(jù) 1、用命令:Data X Y 2、保存數(shù)據(jù): File/Save File/Save as 注意:1、Eviews 數(shù)據(jù)在舊版本下不能保存在中文路徑,只能存在英文路徑下。 2、保存數(shù)據(jù)時(shí)要在工作文件為活動(dòng)
14、狀態(tài)下,否則會(huì)出錯(cuò)。 第三步:作散點(diǎn)圖 1、用命令:Scat X Y 2、用Menu: Quick/Graph/Scatter 輸入:X Y 家庭消費(fèi)關(guān)于收入的散點(diǎn)圖: 散點(diǎn)圖:加入趨勢(shì)線 總體回歸線 第一個(gè)樣本的散點(diǎn)圖: 第一個(gè)樣本的散點(diǎn)圖:樣本回歸線 第二個(gè)樣本的散點(diǎn)圖: 第二個(gè)樣本的散點(diǎn)圖: 樣本回歸線第二節(jié) 一元線性回歸模型的參數(shù)估計(jì)一、擬合一條直線的準(zhǔn)則 前面談到的總體線性回歸方程只是理論上存在的,一般是未知的,我們只能用樣本觀察點(diǎn)來擬合一條直線,即樣本回歸直線,以此來推斷被解釋變量相對(duì)于解釋變量的變化特征。然而,給定一組觀察點(diǎn)之后,在坐標(biāo)平面上可以作出不止一條與這些點(diǎn)有關(guān)有直線,選
15、取哪一條直線作為樣本回歸直線為佳呢?首先我們需要給出擬合一條直線的準(zhǔn)則。 下面我們逐漸來探討這個(gè)問題。設(shè)用這 n 個(gè)點(diǎn) (X1,Y1),(X2,Y2),(Xn,Yn) 擬合而得的直線方程為 稱 為 Yi 的擬合值,稱 ei 為 Yi 點(diǎn)的擬合誤差。 圖 2-2 擬合誤差的直觀圖 由圖2-2可以看出,當(dāng)觀察點(diǎn)(Xi,Yi)落在擬合直線上方時(shí),擬合誤差為正值,當(dāng)觀察點(diǎn)(Xi,Yi)落在擬合直線之上時(shí),擬合誤差為 0 。當(dāng)觀察點(diǎn)(Xi,Yi)落在擬合直線下方時(shí),擬合誤差為負(fù)值。顯然擬合的優(yōu)劣與擬合誤差有關(guān),我們分三種情況來討論如何確定擬合直線的標(biāo)準(zhǔn)。 1假設(shè)以擬合誤差之和為最小作為擬合直線的標(biāo)準(zhǔn),
16、即要求 為最小。這時(shí),當(dāng)擬合誤差中有符號(hào)相反時(shí),和式中就會(huì)正負(fù)抵消,即使擬合直線離散布點(diǎn)大多數(shù)都很遠(yuǎn),也可能此和式很小。 2. 為了克服上述準(zhǔn)則中由于誤差符號(hào)相反所帶來的缺點(diǎn),我們改造一下上述準(zhǔn)則,以誤差絕對(duì)值之和為最小作為擬合的準(zhǔn)則,即以 為最小。這時(shí),雖然可排除大的正負(fù)誤差相抵,但可能會(huì)照顧了一些點(diǎn)而忽略了個(gè)別點(diǎn)。 圖 2-4 (a) 圖 2-4 (b) 3. 第二種消除正負(fù)相抵的方法是以擬合誤差平方和為最小作為擬合準(zhǔn)則,即以 為最小。采用這一準(zhǔn)則,一方面消除了誤差正負(fù)相抵,另一方面避免了像2那樣有個(gè)別點(diǎn)是大誤差絕對(duì)值的情況。依照這一標(biāo)準(zhǔn),圖2-4中的(a)優(yōu)于(b)的擬合。 進(jìn)一步的研究
17、表明,這一標(biāo)準(zhǔn)是一條可取的準(zhǔn)則,直觀上看,它從總體上考慮到了所有的散布點(diǎn),使樣本信息得到了充分利用。因而,我們采用擬合誤差平方和最小作為擬合一條直線的準(zhǔn)則。這一準(zhǔn)則稱為“最小二乘”或“最小平方”準(zhǔn)則。 二、最小二乘法 用最小二乘準(zhǔn)則即擬合誤差的平方和為最小來求解樣本回歸參數(shù)的方法稱為普通最小二乘法(Ordinary Least Square)簡(jiǎn)稱 OLS 。 這是計(jì)量經(jīng)濟(jì)學(xué)中常用的參數(shù)估計(jì)方法。 用最小二乘準(zhǔn)則求解樣本回歸參數(shù)可以分為以下幾步: 1、構(gòu)造擬合誤差平方和 令即Q為擬合誤差的平方和。 2、導(dǎo)出正規(guī)方程 由于Q是回歸參數(shù)的二次連續(xù)可導(dǎo)函數(shù),由極值原理可知:使Q達(dá)到最小的 必定滿足方程
18、組: 而 整理得: 稱之為正規(guī)方程。 3、求解正規(guī)方程 用線性代數(shù)中的克萊姆(Cramm)法則求解正規(guī)方程得: 整理得: 其中: 分別表示 Xi 與Yi 的平均值, 分別表示Xi 與Yi 的離差。 將 代入第一個(gè)方程即得 的解,于是: 稱該解為模型中參數(shù)的最小二乘估計(jì)量(OLS)。 三、一元線性回歸模型的基本假設(shè) 現(xiàn)在的問題是用OLS方法估計(jì)出來的樣本回歸直線方程是否可靠,是否一定可以用來推斷總體的特性,也就是說是否一定可以用它來代表X與Y的總體回歸關(guān)系?當(dāng)然不一定,這有賴于經(jīng)濟(jì)變量的總體特征,因此,為了使所估計(jì)出來的樣本回歸直線能夠說明總體的特征,我們需要對(duì)變量的總體分布作一些假設(shè): 對(duì)于一
19、元線性回歸模型: 我們假設(shè):(在此Yi 應(yīng)理解為 X i 所對(duì)應(yīng)的隨機(jī)變量Y, 即 (Y|X= Xi),不僅僅是某一個(gè)樣本觀察值。)解釋變量是非隨機(jī)的,且 假設(shè)1:零均值 E(u i) = 0 i=1,2,.,n 稱為擾動(dòng)項(xiàng)具有零均值,也稱零均值假設(shè)。 假設(shè)2 :同方差 Var(u i) = i=1,2,.,n 即所有的擾動(dòng)項(xiàng)具有相同的方差,該假設(shè)稱為擾動(dòng)項(xiàng)具有同方差,或稱同方差性,該假設(shè)不滿足時(shí)稱為異方差性,或異方差模型。 假設(shè)3 序列無關(guān)或無自相關(guān) Cov(u i,u j) = 0 ij , i , j=1,2, ,n 即擾動(dòng)項(xiàng)序列不相關(guān)。該項(xiàng)假設(shè)稱為擾動(dòng)項(xiàng)序列無關(guān),或稱無自相關(guān)假設(shè)。否則
20、,模型稱為序列相關(guān)或自相關(guān)。 假設(shè)4 擾動(dòng)項(xiàng) u i 與解釋變量X i從不相關(guān) Cov(u i,Xi) = 0 i=1,2, ,n 即擾動(dòng)項(xiàng)序列u i 與解釋變量X i之間沒有線性關(guān)系。假設(shè)5 擾動(dòng)項(xiàng) ui 服從正態(tài)分布 即 ui N (, ) 此外我們還假設(shè)解釋變量X為 非隨機(jī)變量的。在這一假設(shè)下,第4條假設(shè)自然成立。 我們將解釋變量X為非隨機(jī)變量的假設(shè)以及假設(shè) 1、2、3、5合稱為一元線性回歸模型的經(jīng)典假設(shè),或稱基本假設(shè),或古典假設(shè),滿足經(jīng)典假設(shè)的一元線性回歸模型稱為經(jīng)典一元線性回歸模型。 關(guān)于解釋變量的非隨機(jī)性,這一條要求比較高,一般不能滿足,因?yàn)榻?jīng)濟(jì)現(xiàn)象中大多數(shù)變量是隨機(jī)的,具體應(yīng)用中
21、,我們首先對(duì)解釋變量進(jìn)行抽樣,這樣一般是可以達(dá)到的,對(duì)于抽定的樣本隨機(jī)性問題就暫時(shí)可以不考慮了,然后研究對(duì)解釋變量給定的樣本被解釋變量隨解釋變量變化的規(guī)律等等,由于抽樣的隨機(jī)性,這樣做理論上講有一定的局限性,但是一定程度上還是可以反映變量之間的變化規(guī)律。 關(guān)于零均值假設(shè),由模型式: 在解釋變量非隨機(jī)的前提下,對(duì)上式兩邊取數(shù)學(xué)期望,得: 即零均值等價(jià)于: 也即變量Y與X之間的回歸方程是線性的,即模型是線性模型。假設(shè)2的要求是對(duì)于不同的X的值Xi,Y的離散程度是一樣的。 線性: 非線性: 方差不同時(shí)的圖示: 方差:離散程度測(cè)度 有人對(duì)歷史上有生死日期的209位皇帝的壽命做了調(diào)查,發(fā)現(xiàn)平均壽命為39
22、歲,其中乾隆皇帝壽命最長88歲。為什么會(huì)是這樣呢? 比如有一組三個(gè)學(xué)生的成績(jī)分別是60、65、70分;另一組三個(gè)學(xué)生的成績(jī)分別是30、75、90,這兩組學(xué)生的均分都是65分,那么這兩組成績(jī)有區(qū)別嗎? 顯然是有的,直觀上看,后一組兩極分化。那么如何體現(xiàn)這一區(qū)別呢?這就是數(shù)據(jù)的離散程度。極差(全距) 最大值-最小值 極差大的離散程度大,極差小的離散程度小。方差(Variance) 變量與其平均數(shù)差(離差)的平方的均值: 以上兩組數(shù)據(jù)的方差分別為:16.67與650,顯然,方差小的離散程度小。 方差大的離散程度大,方差小的離散程度小。標(biāo)準(zhǔn)差(Standard Deviation)方差的平方根,與方差
23、的用法類似。 91哪家供貨商更好? 四、最小二乘估計(jì)量的性質(zhì) 高斯馬爾可夫定理 對(duì)于滿足經(jīng)典假設(shè)的一元線性回歸模型,在所有的線性、無偏估計(jì)量中,OLS估計(jì)量具有方差最小的性質(zhì)。 高斯馬爾可夫定理說明,對(duì)于經(jīng)典的一元線性回歸模型,OLS估計(jì)量是總體回歸參數(shù)的線性、無偏以及方差最小的估計(jì)量(方差最小性也稱有效性)。 前面談到,之所以對(duì)模型作以上假設(shè),是為了規(guī)范方法的研究。對(duì)于經(jīng)典的一元線性回歸模型,由上可知OLS估計(jì)量是由解釋變量及被解釋變量的樣本觀察值計(jì)算而得,而被解釋變量具有隨機(jī)性,于是OLS估計(jì)量 也具有隨機(jī)性,且有以下性質(zhì): 1線性性 線性性指 為Yi 的線性函數(shù)。 2. 無偏性 無偏性指
24、 為 的無偏估計(jì)量,就是說,OLS估計(jì)量的數(shù)學(xué)期望即均值正好是所要估計(jì)的參數(shù)本身。 也即 無偏性是衡量一個(gè)估計(jì)量的可信度的一個(gè)非常重要的指標(biāo)。 無偏性與有偏性: 無偏有偏 比如: 取數(shù)學(xué)期望得: 即 是 的無偏估計(jì)量。同理可證得 是 的無偏估計(jì)量。 3. 方差最小性(也稱有效性) 方差最小性也稱為有效性,它指在所有的總體參數(shù)的線性、無偏估計(jì)量中,普通最小二乘估計(jì)量具有方差最小的性質(zhì)。 無偏性體現(xiàn)的是估計(jì)量的均值水平與總體參數(shù)之間的關(guān)系,而有效性體現(xiàn)的是估計(jì)量相對(duì)于其均值的離散程度,隨機(jī)變量的方差越大其離散程度就越大,方差越小離散程度就越小。 方差最小性: 方差較小方差較大第三節(jié) 回歸參數(shù)的顯著
25、性檢驗(yàn)及置信區(qū)間 前面談到,對(duì)所估計(jì)出的模型要進(jìn)行統(tǒng)計(jì)檢驗(yàn),第一個(gè)統(tǒng)計(jì)檢驗(yàn)即參數(shù)的顯著性檢驗(yàn),也稱 t- 顯著性檢驗(yàn),在作t-檢驗(yàn)之前,我們首先需知道參數(shù)估計(jì)量所服從的分布。 在經(jīng)典假設(shè)條件下,OLS估計(jì)量也服從正態(tài)分布。由上可知, 于是: 但是,由于總體的方差 未知,我們只能用其估計(jì)量 來代替之,可以證明, 為 的無偏估計(jì)量。令 則 為 的標(biāo)準(zhǔn)差的估計(jì)量。 于是 為服從自由度為 n-2 的 t 分布,即 一般地,由于t-分布的極限分布為正態(tài)分布,因此,當(dāng)樣本容量 n30 即大樣本時(shí),我們作 Z-顯著性檢驗(yàn),當(dāng)樣本容量 n30 時(shí),作t-顯著性檢驗(yàn), Z-顯著性檢驗(yàn)的步驟與 t-顯著性檢驗(yàn)的步
26、驟完全相同,只是所查的臨界值表不同,前者查得是正態(tài)分布的臨界值表,后者查得是t-分布的臨界值表。 t-顯著性檢驗(yàn)可以檢驗(yàn)總體回歸參數(shù)為任意值的顯著性,但計(jì)量經(jīng)濟(jì)模型中的t-檢驗(yàn)一般只檢驗(yàn)為零的顯著性,因?yàn)闉榱愕娘@著性等價(jià)于解釋變量對(duì)被解釋變量的線性影響的有效性。t-顯著性檢驗(yàn)的步驟如下: 對(duì) 作顯著性檢驗(yàn): (1) 提出原假設(shè) H0 : ; 作對(duì)立假設(shè) H1 : ; (2) 在假設(shè) H0 成立的條件下計(jì)算 t -統(tǒng)計(jì)量: (3) 給定顯著水平 = 0.05 ,查自由度為 v = n-2 的 t - 分布表,得到臨界值 , (4) 比較 與 : 若 ,則接受假設(shè) H0: , 說明回歸參數(shù) 在統(tǒng)計(jì)
27、上是不顯著的,即解釋變量 X 對(duì)被解釋變量Y 沒有顯著的線性影響,也即X與Y的均值之間不存在線性關(guān)系。換言之,線性回歸模型無意義。 若 ,則拒絕假設(shè) H0, 接受假設(shè) H1: ,說明回歸參數(shù) 在統(tǒng)計(jì)上是顯著的,即解釋變量 X 對(duì)被解釋變量Y 有顯著的線性影響,也即X與Y的均值之間存在線性關(guān)系。換言之,線性回歸模型有意義。 下面給出OLS估計(jì)量的置信區(qū)間(區(qū)間估計(jì)): 由上可知, 服從 t 分布,由臨界值 的定義可以導(dǎo)出 的置信區(qū)間,給定顯著水平,由臨界值的定義可知: 上式等價(jià)于: 即 以 95% 的可能性落在下面區(qū)間上: 稱該區(qū)間為 的置信區(qū)間,或稱區(qū)間估計(jì),置信度為95%,同理可得 置信度為
28、 95% 的 的置信區(qū)間為: 很顯然,置信區(qū)間越小越好,置信區(qū)間越小可信度越高,而置信區(qū)間的半徑中變化不大,因此估計(jì)量的可信度主要取決于其標(biāo)準(zhǔn)差的估計(jì)量,標(biāo)準(zhǔn)差越小,可信度越高,標(biāo)準(zhǔn)差越大,可信度就越低。這與 t - 檢驗(yàn)的顯著性是等價(jià)的,從T 統(tǒng)計(jì)量的計(jì)算可知,標(biāo)準(zhǔn)差越小,則T 統(tǒng)計(jì)量的絕對(duì)值越大,即T值通過臨界值的可能性也大,從而 t - 檢驗(yàn)顯著的可能性也大。此外從標(biāo)準(zhǔn)差的計(jì)算公式可知, 標(biāo)準(zhǔn)差的大小主要取決于總體方差的大小以及解釋變量的離差平方和,它與總體方差成正比,與解釋變量的離差平方和成反比,也就是說,當(dāng)被解釋變量的離散程度較大(即總體方差較大)以及解釋變量的取值過于集中(即解釋變
29、量的離差平方和較小)時(shí),線性回歸模型的可信度會(huì)大大降低,不利于作線性回歸分析。 第四節(jié) 擬合優(yōu)度的度量 用在作普通最小二乘估計(jì)之時(shí),我們談到,對(duì)于給定的樣本觀察值,用樣本回歸直線來擬合這些觀察值,那么擬合的程度如何呢?是不是任何兩個(gè)經(jīng)濟(jì)變量的一組樣本觀察值的擬合直線都可作為此二變量的線性關(guān)系的精確描述呢?問題在于擬合程度的優(yōu)劣表述,我們稱之為擬合優(yōu)度檢驗(yàn),為此,定義可決系數(shù)。在定義可決系數(shù)之前,我們先介紹幾個(gè)有關(guān)的結(jié)論。 一、總變差的分解 首先定義幾個(gè)符號(hào): 令 稱為樣本總變差; 稱為回歸總變差; 即殘差平方和。 可以證明: TSS = ESS + RSS 于是樣本總變差可以分解為回 歸總變差
30、與殘差平方和之和。 二、可決系數(shù) 對(duì)于給定的樣本觀察值,TSS 不變,前面談到,擬合的好即殘差平方和較小,由于此三項(xiàng)均為平方和,都大于0,于是擬合的好就等價(jià)于RSS 較接近于TSS ,換言之,回歸總變差越接近于樣本總離差,擬合的就越好。 令 稱 R2為變量Y與變量X的樣本s可決系數(shù),或稱樣本決定系數(shù)、樣本判定系數(shù)等。之所以稱為樣本可決系數(shù),是因?yàn)樗?X 與 Y 的樣本觀察值 (X i,Yi) 決定。 前面談到擬合的好壞取決于RSS 較接近于TSS的程度,由R2的定義可知,等價(jià)于R2 接近于1的程度,于是我們用R2 接近于1的程度來衡量樣本回歸直線對(duì)樣本觀察值的擬合的優(yōu)度,即擬合優(yōu)度檢驗(yàn)。R2
31、 越接近于1,說明擬合的越好,R2越接近于0,說明擬合的越差。 三、可決系數(shù)與相關(guān)系數(shù)的關(guān)系 變量Y關(guān)于變量X的樣本可決系數(shù)正好等于Y與X的相關(guān)系數(shù)的平方。 而于是 又 四、樣本決定系數(shù)的本質(zhì)意義 樣本可決系數(shù)是由樣本觀察值(Xi,Yi)所決定的,我們進(jìn)一步要想它由樣本觀察值的哪些方面的性質(zhì)決定呢?研究表明實(shí)質(zhì)上R2由X與Y的樣本觀察值(Xi,Yi)的線性相關(guān)程度來決定,當(dāng)樣本散布點(diǎn)過于離散時(shí),即樣本總離差 TSS 較大時(shí),不可能作一條直線很好地?cái)M合這些散布點(diǎn),自然所得回歸直線的殘差平方和就較大,同時(shí)R2就相對(duì)離1較遠(yuǎn)。 圖 2-5 (a) 圖 2-5 (b) 第五節(jié) 一元線性回歸模型的預(yù)測(cè) 計(jì)量經(jīng)濟(jì)模型的預(yù)測(cè)分為條件預(yù)測(cè)與無條件預(yù)測(cè)兩類,當(dāng)給定解釋變量X的樣本區(qū)間之外的值,來計(jì)算被解釋變量Y的相應(yīng)值時(shí),稱為條件預(yù)測(cè);當(dāng)解釋變量X的值也未知,且要預(yù)測(cè)被解釋變量的相應(yīng)值時(shí),稱為無條件預(yù)測(cè)。 本節(jié)介紹的是條件預(yù)測(cè),無條件預(yù)測(cè)要先采用其它方法計(jì)算出解釋變量X的值,比較復(fù)雜,比如說借助于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版科技園區(qū)入駐租賃合同4篇
- 工程咨詢行業(yè)商業(yè)模式創(chuàng)新-深度研究
- 2025年廣東科貿(mào)職業(yè)學(xué)院高職單招數(shù)學(xué)歷年(2016-2024)頻考點(diǎn)試題含答案解析
- 2025年車輛抵押貸款合同續(xù)保協(xié)議4篇
- 2025年廣東創(chuàng)新科技職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025年平頂山文化藝術(shù)職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025年常州機(jī)電職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025至2030年中國電子顯示板數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年山東外貿(mào)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫含答案解析
- Z銀行A分行零貸客戶經(jīng)理績(jī)效管理優(yōu)化研究
- 茉莉花-附指法鋼琴譜五線譜
- 結(jié)婚函調(diào)報(bào)告表
- SYT 6968-2021 油氣輸送管道工程水平定向鉆穿越設(shè)計(jì)規(guī)范-PDF解密
- 冷庫制冷負(fù)荷計(jì)算表
- 肩袖損傷護(hù)理查房
- 設(shè)備運(yùn)維管理安全規(guī)范標(biāo)準(zhǔn)
- 辦文辦會(huì)辦事實(shí)務(wù)課件
- 大學(xué)宿舍人際關(guān)系
- 2023光明小升初(語文)試卷
- GB/T 14600-2009電子工業(yè)用氣體氧化亞氮
- 申請(qǐng)使用物業(yè)專項(xiàng)維修資金征求業(yè)主意見表
評(píng)論
0/150
提交評(píng)論