版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
經(jīng)濟(jì)計(jì)量分析
第四章一元線性回歸模型本文檔共270頁;當(dāng)前第1頁;編輯于星期一\10點(diǎn)46分本章介紹一元線性回歸模型的概念及一元線性回歸模型所依據(jù)的理論與應(yīng)用。一元線性回歸模型只包含一個(gè)解釋變量和一個(gè)被解釋變量,是最簡單的線性回歸模型。通過一元線性回歸模型的學(xué)習(xí),可較容易地理解回歸分析的基本理論與應(yīng)用。本文檔共270頁;當(dāng)前第2頁;編輯于星期一\10點(diǎn)46分第一節(jié)回歸分析的相關(guān)概念
一、回歸的含義
回歸一詞最早由F·高爾頓(FrancisGalton)提出。在一篇研究父母身高與子女身高相互關(guān)系的論文中,高爾頓發(fā)現(xiàn),雖然有一個(gè)趨勢,父母高,子女也高;父母矮,子女也矮,但給定父母的身高,子女的平均身高卻趨向于或者回歸到全體人口的平均身高。本文檔共270頁;當(dāng)前第3頁;編輯于星期一\10點(diǎn)46分也就是說,當(dāng)父母雙親都異常高或異常矮,則子女的身高有趨向于人口總體平均身高的趨勢。這種現(xiàn)象被稱為高爾頓普遍回歸定律。這就是回歸一詞的原始含義。本文檔共270頁;當(dāng)前第4頁;編輯于星期一\10點(diǎn)46分在現(xiàn)代,回歸一詞已演變?yōu)橐环N新的概念?;貧w分析就是研究被解釋變量對解釋變量的依賴關(guān)系,其目的就是通過解釋變量的已知或設(shè)定值,去估計(jì)或預(yù)測被解釋變量的總體均值。在下面的幾個(gè)例子中,我們可以清晰地看到回歸分析的實(shí)際意義。本文檔共270頁;當(dāng)前第5頁;編輯于星期一\10點(diǎn)46分1.高爾頓普遍回歸定律。高爾頓的目的在于發(fā)現(xiàn)為什么人口的身高分布有一種穩(wěn)定性。在現(xiàn)代,我們并不關(guān)心這種解釋,我們關(guān)心的是:在給定父輩身高的情形下,找到兒輩平均身高的變化規(guī)律。本文檔共270頁;當(dāng)前第6頁;編輯于星期一\10點(diǎn)46分就是說,我們?nèi)绻懒烁篙叺纳砀?,就可預(yù)測兒輩的平均身高。假設(shè)我們得到了一組父親、兒子身高的數(shù)據(jù),制成如下的散點(diǎn)圖。圖中按統(tǒng)計(jì)分組的方法將父親身高分為若干組。本文檔共270頁;當(dāng)前第7頁;編輯于星期一\10點(diǎn)46分××××××××××××××××××××父親身高(cm)兒子身高(cm)
圖4.1
給定父親身高兒子身高的分布
本文檔共270頁;當(dāng)前第8頁;編輯于星期一\10點(diǎn)46分圖4.1中對應(yīng)于設(shè)定的父親身高,兒子身高有一個(gè)分布范圍。隨著父親身高的增加,兒子的平均身高也在增加,畫一條通過兒子平均身高的線,說明兒子的平均身高是如何隨著父親身高的增加而增加的,這條線就是回歸線。
本文檔共270頁;當(dāng)前第9頁;編輯于星期一\10點(diǎn)46分2.在經(jīng)濟(jì)學(xué)中,經(jīng)濟(jì)學(xué)家要研究個(gè)人消費(fèi)支出與個(gè)人可支配收入的依賴關(guān)系。這種分析有助于估計(jì)邊際消費(fèi)傾向,就是可支配收入每增加一元引起消費(fèi)支出的平均變化。本文檔共270頁;當(dāng)前第10頁;編輯于星期一\10點(diǎn)46分
3.在企業(yè)中,我們很想知道人們對企業(yè)產(chǎn)品的需求與廣告費(fèi)開支的關(guān)系。這種研究有助于估計(jì)出相對于廣告費(fèi)支出的需求彈性,即廣告費(fèi)支出每變化百分之一的需求變化百分比,這有助于制定最優(yōu)廣告策略。
本文檔共270頁;當(dāng)前第11頁;編輯于星期一\10點(diǎn)46分4.農(nóng)業(yè)工作需要預(yù)計(jì)糧食產(chǎn)量,需要研究糧食產(chǎn)量與播種面積、施肥量、降雨量之間的依賴關(guān)系。這種一個(gè)變量依賴于另一個(gè)或多個(gè)變量的事例在經(jīng)濟(jì)系統(tǒng)中普遍存在?;貧w分析就是要研究這種變量之間的依存關(guān)系。本文檔共270頁;當(dāng)前第12頁;編輯于星期一\10點(diǎn)46分二、統(tǒng)計(jì)關(guān)系與確定性關(guān)系如果給定一個(gè)變量X的結(jié)果值就可確定另一個(gè)變量Y的結(jié)果值,則稱變量Y是變量X的函數(shù),即X、Y之間是函數(shù)關(guān)系。本文檔共270頁;當(dāng)前第13頁;編輯于星期一\10點(diǎn)46分在經(jīng)典物理學(xué)中,給定電阻Ω,電流I和電壓V
之間的關(guān)系即為函數(shù)關(guān)系,即。這種典型的變量關(guān)系就是確定性關(guān)系。本文檔共270頁;當(dāng)前第14頁;編輯于星期一\10點(diǎn)46分在經(jīng)濟(jì)系統(tǒng)中,這種變量之間的函數(shù)關(guān)系或確定性關(guān)系就很少見。常見的是變量之間是一種不確定的關(guān)系,既使變量X是變量Y
的原因,給定變量X
的值也不能具體確定變量Y的值,而只能確定變量Y
的統(tǒng)計(jì)特征,通常稱變量X與Y之間的這種關(guān)系為統(tǒng)計(jì)關(guān)系。本文檔共270頁;當(dāng)前第15頁;編輯于星期一\10點(diǎn)46分
例如,企業(yè)總產(chǎn)出Y
與企業(yè)的資本投入K
、勞動(dòng)力投入L
之間的關(guān)系就是統(tǒng)計(jì)關(guān)系。雖然資本K和勞動(dòng)力L
是影響產(chǎn)出Y的兩大核心要素,但是給定K、L
的值并不能確定產(chǎn)出Y
的值。因?yàn)?,總產(chǎn)出Y除了受資本投入K、勞動(dòng)力投入L
的影響外,還要受到技術(shù)進(jìn)步、自然條件等其它因素的影響。本文檔共270頁;當(dāng)前第16頁;編輯于星期一\10點(diǎn)46分三、回歸分析與相關(guān)分析
與回歸分析密切相聯(lián)的是相關(guān)分析。相關(guān)分析主要測度兩個(gè)變量之間的線性關(guān)聯(lián)度,相關(guān)系數(shù)就是用來測度兩個(gè)變量之間的線性關(guān)聯(lián)程度的。例如,吸煙與肺癌、統(tǒng)計(jì)學(xué)成績與數(shù)學(xué)成績、身高與體重等等之間的相關(guān)程度,就可用相關(guān)系數(shù)來測度。本文檔共270頁;當(dāng)前第17頁;編輯于星期一\10點(diǎn)46分而在回歸分析中,我們的主要目的在于根據(jù)其它變量的給定值來估計(jì)或預(yù)測某一變量的平均值。例如,我們想知道能否從一個(gè)學(xué)生的數(shù)學(xué)成績?nèi)ヮA(yù)測他的統(tǒng)計(jì)學(xué)平均成績。本文檔共270頁;當(dāng)前第18頁;編輯于星期一\10點(diǎn)46分在回歸分析中,被解釋變量Y被當(dāng)作是隨機(jī)變量,而解釋變量X則被看作非隨機(jī)變量。而在相關(guān)分析中,我們把兩個(gè)變量都看作是隨機(jī)變量。本文檔共270頁;當(dāng)前第19頁;編輯于星期一\10點(diǎn)46分例如,在學(xué)生的數(shù)學(xué)成績與統(tǒng)計(jì)學(xué)成績的分析中,如為回歸分析,則統(tǒng)計(jì)學(xué)成績是隨機(jī)變量,數(shù)學(xué)成績是非隨機(jī)變量,即數(shù)學(xué)成績被固定在給定的水平上,以此求得統(tǒng)計(jì)學(xué)的平均成績。而在相關(guān)分析中,兩者處于平等地位,不存在誰為解釋變量,誰為被解釋變量的問題,兩者均為隨機(jī)變量。本文檔共270頁;當(dāng)前第20頁;編輯于星期一\10點(diǎn)46分第二節(jié)一元線性回歸模型
一、引例假定我們要研究一個(gè)局部區(qū)域的居民消費(fèi)問題,該區(qū)域共有80戶家庭組成,將這80戶家庭視為一個(gè)統(tǒng)計(jì)總體。本文檔共270頁;當(dāng)前第21頁;編輯于星期一\10點(diǎn)46分我們研究每月家庭消費(fèi)支出Y
與每月可支配收入X
的關(guān)系。就是說,已知家庭每月可支配收入,要預(yù)測家庭每月消費(fèi)支出的總體平均水平。為此,將80戶家庭分為10組。表4.1給出了人為數(shù)據(jù)。本文檔共270頁;當(dāng)前第22頁;編輯于星期一\10點(diǎn)46分XY每月家庭可支配收入(元)1000150020002500300035004000450050005500每月家庭消費(fèi)支出(元)7007407808208609009401050107011201170122012701320137014201380144015001560162016801740180018601780184019001960202020802140220022602180224023002360242024802540260026602620268027402820290029803160290029803060314032203300338034603540332034203520362037203820392037103810391040204130423043304090420043104420453046404750合計(jì)5740109801458018180217801974022540253402814030940表4.1居民收入、消費(fèi)數(shù)據(jù)本文檔共270頁;當(dāng)前第23頁;編輯于星期一\10點(diǎn)46分
從表4.1中可以看出,對于每月1000元收入的7戶家庭,每月消費(fèi)支出為700元到940元不等。同樣,當(dāng)X=3000元時(shí),9戶家庭的每月消費(fèi)支出在2180元到2660元之間。表4.1給出了以X的給定值為條件的Y
的條件分布。
本文檔共270頁;當(dāng)前第24頁;編輯于星期一\10點(diǎn)46分對于Y的每一條件分布,我們能計(jì)算出它的條件期望,記為E(Y/X=Xi),即在X取特定Xi
值時(shí)Y的期望值。例如,X=1000時(shí),Y的期望值為:本文檔共270頁;當(dāng)前第25頁;編輯于星期一\10點(diǎn)46分
將表4.1中的數(shù)據(jù)在直角坐標(biāo)系中描出,則得到圖4.2的散點(diǎn)圖。本文檔共270頁;當(dāng)前第26頁;編輯于星期一\10點(diǎn)46分XY1000200030004000500010001500200025003000
3500
4000
4500
5000
5500
收入、消費(fèi)散點(diǎn)圖
圖4.2本文檔共270頁;當(dāng)前第27頁;編輯于星期一\10點(diǎn)46分該圖表明了對應(yīng)于各X
值的Y的條件分布。雖然每個(gè)個(gè)別家庭的消費(fèi)支出都有異,但圖4.2清楚地表明隨著收入的增加,消費(fèi)支出平均地說也在增加。就是說,散點(diǎn)圖啟示我們,Y的條件均值隨X
的增加而增加。本文檔共270頁;當(dāng)前第28頁;編輯于星期一\10點(diǎn)46分如果我們觀察圖4.2中那些代表Y的各個(gè)條件均值的粗圓點(diǎn),則表明這些條件平均值落在一根有正斜率的直線上。我們稱這根直線叫做總體回歸線,它是Y對X的回歸。本文檔共270頁;當(dāng)前第29頁;編輯于星期一\10點(diǎn)46分總體回歸線就是當(dāng)解釋變量取給定值時(shí),被解釋變量的條件均值或期望值的軌跡。
圖4.2表明,對每一Xi都有Y值的一個(gè)總體和一個(gè)相應(yīng)的均值。而回歸線是穿過這些條件均值的線。本文檔共270頁;當(dāng)前第30頁;編輯于星期一\10點(diǎn)46分二、總體回歸函數(shù)從圖4.2我們可以看出,條件均值E(Y/Xi)是Xi的函數(shù),即:E(Y/Xi)=f(Xi)
(4.1)
其中,f(Xi)表示解釋變量Xi
的某個(gè)函數(shù)。在我們的引例中,E(Y/Xi)是Xi的一個(gè)線性函數(shù)。本文檔共270頁;當(dāng)前第31頁;編輯于星期一\10點(diǎn)46分式(4.1)就是總體回歸函數(shù),簡稱總體回歸。它表明在給定Xi下Y的分布的總體均值與Xi有函數(shù)關(guān)系,就是說它給出了Y的均值是怎樣隨X值的變化而變化的。本文檔共270頁;當(dāng)前第32頁;編輯于星期一\10點(diǎn)46分函數(shù)f(Xi)采取什么函數(shù)形式,是一個(gè)需要解決的重要問題。在實(shí)際經(jīng)濟(jì)系統(tǒng)中,我們不會得到總體的全部數(shù)據(jù),因而就無法據(jù)已知數(shù)據(jù)確定總體回歸函數(shù)的函數(shù)形式。同時(shí),對總體回歸函數(shù)的形式只能據(jù)經(jīng)濟(jì)理論與經(jīng)驗(yàn)去推斷。本文檔共270頁;當(dāng)前第33頁;編輯于星期一\10點(diǎn)46分
例如,我們可以假定消費(fèi)支出與收入有線性關(guān)系。則總體回歸函數(shù)為(4.2)
其中,和為未知而固定的參數(shù),稱為回歸系數(shù);為截距系數(shù),為斜率系數(shù)。式(4.2)為線性總體回歸函數(shù)。本文檔共270頁;當(dāng)前第34頁;編輯于星期一\10點(diǎn)46分三、線性的含義1.對變量為線性對線性的第一種解釋是指Y
的條件期望是Xi的線性函數(shù),例如式(4.2)就是線性回歸函數(shù),該回歸線是一條直線。 本文檔共270頁;當(dāng)前第35頁;編輯于星期一\10點(diǎn)46分
按這種解釋就不是線性的,因?yàn)閷Φ囊浑A導(dǎo)數(shù)不是常數(shù)。本文檔共270頁;當(dāng)前第36頁;編輯于星期一\10點(diǎn)46分2.對參數(shù)為線性對線性的第二種解釋是指Y的條件期望 是參數(shù)的一個(gè)線性函數(shù)。它可以是也可以不是變量的X
的線性函數(shù)。本文檔共270頁;當(dāng)前第37頁;編輯于星期一\10點(diǎn)46分此時(shí), 就是線性回歸函數(shù)。但 則不是線性回歸函數(shù),而是非線性回歸函數(shù)。本文檔共270頁;當(dāng)前第38頁;編輯于星期一\10點(diǎn)46分在本書中,主要考慮的是對參數(shù)為線性的回歸模型,線性回歸是指對參數(shù)β為線性的一種回歸(即參數(shù)只以它的1次方出現(xiàn));對解釋變量X則可以不是線性的。本文檔共270頁;當(dāng)前第39頁;編輯于星期一\10點(diǎn)46分從圖4.2可清楚地看到,隨著家庭收入Xi的增加,家庭平均消費(fèi)支出E(Y/Xi)也在增加,這表明了Xi與Y的平均水平的關(guān)系。我們想知道對于具體家庭而言,消費(fèi)支出Y與它的收入水平Xi的關(guān)系。四、總體回歸函數(shù)的隨機(jī)設(shè)定本文檔共270頁;當(dāng)前第40頁;編輯于星期一\10點(diǎn)46分
就個(gè)別家庭而言,收入水平增加,消費(fèi)支出不一定會增加。本文檔共270頁;當(dāng)前第41頁;編輯于星期一\10點(diǎn)46分
例如從表4.1可以看到,對于每月3000元的收入水平,有一戶家庭的消費(fèi)支出為2180元,少于每月收入為2500元的兩戶家庭的消費(fèi)支出(2200元和2260元)。但應(yīng)看到,每月收入為3000元的家庭的平均消費(fèi)支出大于每月收入2500元的家庭的平均消費(fèi)支出(2420元大于2020元)。本文檔共270頁;當(dāng)前第42頁;編輯于星期一\10點(diǎn)46分從圖4.2可以看到,給定收入水平Xi的個(gè)別家庭的消費(fèi)支出處于在該收入水平的家庭平均消費(fèi)支出左右,也就是圍繞著它的條件均值。我們把個(gè)別的Yi圍繞它的期望值的離差表示如下:本文檔共270頁;當(dāng)前第43頁;編輯于星期一\10點(diǎn)46分或(4.3)
其中,離差ui是一個(gè)不可觀測的可正可負(fù)的隨機(jī)變量,在專業(yè)術(shù)語中,把ui稱為隨機(jī)干擾項(xiàng)或隨機(jī)誤差項(xiàng)。
本文檔共270頁;當(dāng)前第44頁;編輯于星期一\10點(diǎn)46分
在式(4.3)中,給定收入X的水平,個(gè)別家庭的消費(fèi)支出,可表示為兩個(gè)成份之和。本文檔共270頁;當(dāng)前第45頁;編輯于星期一\10點(diǎn)46分(1)代表相同收入水平的所有家庭的平均消費(fèi)支出。這是系統(tǒng)性或確定性成份。(2)ui為隨機(jī)或非系統(tǒng)性成份,代表所有可能影響Y,但又未能包括到回歸模型中來的被忽略變量的代理變量。本文檔共270頁;當(dāng)前第46頁;編輯于星期一\10點(diǎn)46分假設(shè)對Xi
為線性的,則:(4.4)
本文檔共270頁;當(dāng)前第47頁;編輯于星期一\10點(diǎn)46分式(4.4)表示一個(gè)家庭的消費(fèi)支出線性地依賴于它的收入加干擾項(xiàng)。本文檔共270頁;當(dāng)前第48頁;編輯于星期一\10點(diǎn)46分例如,給定X=1000,各家庭的消費(fèi)支出可表達(dá)為本文檔共270頁;當(dāng)前第49頁;編輯于星期一\10點(diǎn)46分五、隨機(jī)誤差項(xiàng)u的意義
1.理論的欠缺。
雖然有決定Y的行為的理論,但常常是不能完全確定的,理論常常有一定的含糊性。我們可以肯定每月收入X影響每月消費(fèi)支出Y。但不能確定是否有其它變量影響Y,只好用ui作為模型所忽略的全部變量的替代變量。
本文檔共270頁;當(dāng)前第50頁;編輯于星期一\10點(diǎn)46分2.?dāng)?shù)據(jù)的欠缺。
即使能確定某些變量對Y
有顯著影響,但由于不能得到這些變量的數(shù)據(jù)信息而不能引入該變量。例如,從經(jīng)濟(jì)理論分析,家庭財(cái)富量是影響家庭消費(fèi)的重要因素,應(yīng)該引入該變量作為解釋變量。但是,通常我們得不到有關(guān)家庭財(cái)富的信息。因此,我們只得把這個(gè)很重要的解釋變量舍棄掉。本文檔共270頁;當(dāng)前第51頁;編輯于星期一\10點(diǎn)46分
3.核心變量與非核心變量。
例如,在引例的居民消費(fèi)模型中,除了收入X1外,家庭的人口數(shù)X2
、戶主宗教信仰X3、戶主受教育水平X4也影響家庭消費(fèi)支出。但很可能X2、X3、X4合起來的影響也是很微弱的,是一種非系統(tǒng)的或隨機(jī)的影響。從效果與成本角度來看,引入它們是不合算的。所以,人們把它們的聯(lián)合效用當(dāng)作一個(gè)隨機(jī)變量來看待。本文檔共270頁;當(dāng)前第52頁;編輯于星期一\10點(diǎn)46分
4.人類行為的內(nèi)在隨機(jī)性。
即使我們成功地把所有有關(guān)的變量都引進(jìn)到模型中來,在個(gè)別的Y中仍不免有一些“內(nèi)在”的隨機(jī)性,無論我們花了多少力氣都解釋不了的。隨機(jī)誤差項(xiàng)ui能很好地反映這種隨機(jī)性。
本文檔共270頁;當(dāng)前第53頁;編輯于星期一\10點(diǎn)46分5.節(jié)省原則,我們想保持一個(gè)盡可能簡單的回歸模型。
如果我們能用兩個(gè)或三個(gè)變量就基本上解釋了Y
的行為,就沒有必要引進(jìn)更多的變量。讓ui
代表所有其它變量是一種很好的選擇。本文檔共270頁;當(dāng)前第54頁;編輯于星期一\10點(diǎn)46分在實(shí)際回歸分析中,我們無法獲得像引例中的總體數(shù)據(jù),而只能獲得對應(yīng)于某些固定X的Y值的一個(gè)樣本。我們只能根據(jù)抽樣信息估計(jì)總體回歸函數(shù)。六、樣本回歸函數(shù)本文檔共270頁;當(dāng)前第55頁;編輯于星期一\10點(diǎn)46分
我們從表4.1隨機(jī)抽取對應(yīng)于固定X值的Y值的一個(gè)樣本如表4.2所示,對應(yīng)于給定的每個(gè)Xi值只有一個(gè)Y值。為了對比分析,按同樣的方法再抽取另一個(gè)樣本,如表4.3所示。本文檔共270頁;當(dāng)前第56頁;編輯于星期一\10點(diǎn)46分XY1000150020002500300035004000450050005500900132016202140248027403300352040204310表4.2總體的一個(gè)隨機(jī)樣本本文檔共270頁;當(dāng)前第57頁;編輯于星期一\10點(diǎn)46分XY1000150020002500300035004000450050005500700132016201840242028203380342038104640表4.3總體的另一個(gè)隨機(jī)樣本本文檔共270頁;當(dāng)前第58頁;編輯于星期一\10點(diǎn)46分將表4.2和表4.3的數(shù)據(jù)描點(diǎn),得到圖4.3。在這個(gè)散點(diǎn)圖中畫兩根樣本回歸線以盡好地?cái)M合這些散點(diǎn)。我們可以看出,兩個(gè)樣本存在著差異,這是由于抽樣的隨機(jī)性而造成的波動(dòng)。
本文檔共270頁;當(dāng)前第59頁;編輯于星期一\10點(diǎn)46分XY1000200030004000500010001500200025003000
3500
4000
4500
5000
5500×●
●×
●×
●×
●×
●×
●×
●×
×
●
×
●
S2S1×第一個(gè)樣本(表4.2)●第二個(gè)樣本(表4.3)圖4.3兩個(gè)不同樣本的回歸線本文檔共270頁;當(dāng)前第60頁;編輯于星期一\10點(diǎn)46分S1是根據(jù)第1個(gè)樣本畫的;S2是根據(jù)第2個(gè)樣本畫的。那么,兩條樣本回歸線中哪一條代表“真實(shí)”的總體回歸線呢?在未知總體數(shù)據(jù)的情況下,我們就不可能知道哪一條代表真實(shí)的總體回歸線。本文檔共270頁;當(dāng)前第61頁;編輯于星期一\10點(diǎn)46分圖4.3中的回歸線稱為樣本回歸線,因抽樣波動(dòng),它們都是總體回歸線的一個(gè)近似。一般地講,由幾個(gè)不同的樣本會得到幾個(gè)不同的樣本回歸線,通常這些樣本回歸線會彼此不同。本文檔共270頁;當(dāng)前第62頁;編輯于星期一\10點(diǎn)46分據(jù)任一樣本,我們可得樣本回歸線,其函數(shù)形式為(4.5)
其中,
本文檔共270頁;當(dāng)前第63頁;編輯于星期一\10點(diǎn)46分正如總體回歸函數(shù),樣本回歸函數(shù)也存在隨機(jī)形式。(4.6)
其中,ei為殘差項(xiàng),概念上,ei類似于ui,并可把它當(dāng)作ui的估計(jì)量。將ei引入樣本回歸函數(shù)中,其理由與總體回歸函數(shù)中引入ui是一樣的。本文檔共270頁;當(dāng)前第64頁;編輯于星期一\10點(diǎn)46分回歸分析中的主要目的就是根據(jù)樣本回歸函數(shù):來估計(jì)總體回歸函數(shù)(4.7)
(4.8)
本文檔共270頁;當(dāng)前第65頁;編輯于星期一\10點(diǎn)46分由于抽樣的波動(dòng),我們根據(jù)樣本回歸函數(shù)估計(jì)出來的總體回歸函數(shù)只能是一個(gè)近似結(jié)果。因此,怎樣構(gòu)造樣本回歸函數(shù)能使盡可能接近真實(shí)的就成為回歸分析的核心。
本文檔共270頁;當(dāng)前第66頁;編輯于星期一\10點(diǎn)46分第三節(jié)最小二乘估計(jì)
在回歸分析中有很多種構(gòu)造樣本回歸函數(shù)的方法,而最廣泛使用的一種是普通最小二乘法(methodofordinaryleastsquares,簡記OLS)
本文檔共270頁;當(dāng)前第67頁;編輯于星期一\10點(diǎn)46分一、普通最小二乘法(OLS)
普通最小二乘法是由德國數(shù)學(xué)家高斯(C.F.Gauss)最早提出和使用的。在一定的假設(shè)條件下,最小二乘估計(jì)量有著非常好的統(tǒng)計(jì)性質(zhì),從而使它成為回歸分析中最有功效和最為流行的方法之一。本文檔共270頁;當(dāng)前第68頁;編輯于星期一\10點(diǎn)46分我們首先從最小二乘原理談起。對于一元線性回歸模型(總體)(4.9)
這是一個(gè)不可觀測的模型。因?yàn)橥ǔ5貌坏娇傮w的全部觀測值,我們只能通過總體的一個(gè)樣本去推測它。即,只能通過樣本回歸模型去估計(jì)總體回歸模型。本文檔共270頁;當(dāng)前第69頁;編輯于星期一\10點(diǎn)46分其中,是Yi
的估計(jì)值。樣本回歸模型為(4.10)
本文檔共270頁;當(dāng)前第70頁;編輯于星期一\10點(diǎn)46分
那么,樣本回歸模型又是怎樣確定呢?將式(4.10)寫成:(4.11)
殘差ei是實(shí)際值Yi與其估計(jì)值之差。對于給定的Y和X
的n
對觀測值,我們希望樣本回歸模型的估計(jì)值盡可能地靠近觀測值Yi。本文檔共270頁;當(dāng)前第71頁;編輯于星期一\10點(diǎn)46分為了達(dá)到此目的,我們就必須使用最小二乘準(zhǔn)則,使:(4.12)
盡可能地小,其中,是殘差的平方。本文檔共270頁;當(dāng)前第72頁;編輯于星期一\10點(diǎn)46分由式(4.12)可以看出:(4.13)
就是說,殘差平方和是估計(jì)量的函數(shù),對任意給定的一組數(shù)據(jù)(樣本),選擇不同的和值將得到不同的ei,從而有不同的值。本文檔共270頁;當(dāng)前第73頁;編輯于星期一\10點(diǎn)46分
微積分知識告訴我們對和的偏導(dǎo)數(shù)為0時(shí),將使最小。本文檔共270頁;當(dāng)前第74頁;編輯于星期一\10點(diǎn)46分(4.14)
(4.15)
本文檔共270頁;當(dāng)前第75頁;編輯于星期一\10點(diǎn)46分令得到:(4.16)
(4.17)
本文檔共270頁;當(dāng)前第76頁;編輯于星期一\10點(diǎn)46分n是樣本容量。求解該聯(lián)立方程,可得(4.18)
(4.19)
本文檔共270頁;當(dāng)前第77頁;編輯于星期一\10點(diǎn)46分其中,,分別為X和Y的樣本均值。
上面得到的估計(jì)量,是從最小二乘原理演算而得的。因此,稱其為最小二乘估計(jì)量。本文檔共270頁;當(dāng)前第78頁;編輯于星期一\10點(diǎn)46分二、經(jīng)典線性回歸模型如果我們的目的僅僅是估計(jì)和,那么普通最小二乘法就足夠用了。但在回歸分析中,我們的目的不僅僅是獲得,的估計(jì)值,,而是要對真實(shí)和做出推斷。
本文檔共270頁;當(dāng)前第79頁;編輯于星期一\10點(diǎn)46分例如,我們想知道和離它們的總體真值和有多近,或者靠其期望值E(Y/Xi)有多近。本文檔共270頁;當(dāng)前第80頁;編輯于星期一\10點(diǎn)46分
為達(dá)這一目的,我們不僅要確定模型的函數(shù)形式,還要對Yi的產(chǎn)生方式做出某些假定。本文檔共270頁;當(dāng)前第81頁;編輯于星期一\10點(diǎn)46分在總體回歸模型中,,Yi依賴于Xi
和ui
。因此,除非我們明確Xi
和ui
是怎樣產(chǎn)生的,否則,我們將無法對Yi做出任何統(tǒng)計(jì)推斷,同時(shí),也無法對用和推斷其真實(shí)值,的效果進(jìn)行判斷。本文檔共270頁;當(dāng)前第82頁;編輯于星期一\10點(diǎn)46分
為了回歸估計(jì)的有效解釋,對Xi變量和誤差項(xiàng)ui做出假設(shè)是極其重要的。本文檔共270頁;當(dāng)前第83頁;編輯于星期一\10點(diǎn)46分假定1誤差項(xiàng)ui的均值為零。對于給定的X
值,隨機(jī)誤差項(xiàng)ui的均值或期望值為零,即ui的條件均值為零,記為E(ui/Xi)=0
(4.20)
本文檔共270頁;當(dāng)前第84頁;編輯于星期一\10點(diǎn)46分
這一假定的實(shí)際意義為:凡是模型中不顯含的并因而歸屬于ui的因素,對Y
的均值都沒有系統(tǒng)的影響,正的ui
值抵消了負(fù)的ui
值,它們對Y
的平均影響為零。本文檔共270頁;當(dāng)前第85頁;編輯于星期一\10點(diǎn)46分假定2同方差性或ui的方差相等。對所有給定的Xi,ui的方差都是相同的。就是說,ui
的條件方差是恒定的,即:本文檔共270頁;當(dāng)前第86頁;編輯于星期一\10點(diǎn)46分該假定表示對應(yīng)于不同Xi
值,ui的方差都是某個(gè)等于的正的常數(shù)。其中,Var表示方差。
(4.21)
本文檔共270頁;當(dāng)前第87頁;編輯于星期一\10點(diǎn)46分假定3
各個(gè)誤差項(xiàng)之間無自相關(guān),ui和uj(i≠j)之間的相關(guān)為零。本文檔共270頁;當(dāng)前第88頁;編輯于星期一\10點(diǎn)46分(4.22)
其中,i和j為兩次不同的觀測,而Cov表示協(xié)方差,該假定還可以稱為無序列相關(guān)或無自相關(guān)假定。本文檔共270頁;當(dāng)前第89頁;編輯于星期一\10點(diǎn)46分假定4
ui和Xi的協(xié)方差為零或E(uiXi)=0
本文檔共270頁;當(dāng)前第90頁;編輯于星期一\10點(diǎn)46分該假定表示誤差項(xiàng)u
和解釋變量X
是不相關(guān)的。也就是說在總體回歸模型中,X
和u
對Y
有各自的影響。但是,如果X
和u
是相關(guān)的,就不可能評估他們各自對Y
的影響。本文檔共270頁;當(dāng)前第91頁;編輯于星期一\10點(diǎn)46分假定5正確地設(shè)定了回歸模型,即在經(jīng)驗(yàn)分析中所用的模型沒有設(shè)定偏誤。
本文檔共270頁;當(dāng)前第92頁;編輯于星期一\10點(diǎn)46分正確設(shè)定回歸模型是至關(guān)重要的。如果模型遺漏了重要變量或選擇了錯(cuò)誤的函數(shù)形式,那么,要對所估計(jì)的回歸模型做出有效的解釋是靠不住的?;貧w分析以及由此而得到的結(jié)果,是以所選模型為條件的。因此,在建立經(jīng)濟(jì)計(jì)量模型時(shí),必須謹(jǐn)慎而小心。本文檔共270頁;當(dāng)前第93頁;編輯于星期一\10點(diǎn)46分假定6對于多元線性回歸模型,沒有完全的多重共線性。就是說解釋變量之間沒有完全的線性關(guān)系。本文檔共270頁;當(dāng)前第94頁;編輯于星期一\10點(diǎn)46分
至此,我們完成了關(guān)于經(jīng)典線性回歸模型的基本假定的討論。上述所有假定都是針對總體回歸模型而言的,而不是關(guān)于樣本回歸模型的。
本文檔共270頁;當(dāng)前第95頁;編輯于星期一\10點(diǎn)46分三、最小二乘估計(jì)量的性質(zhì)高斯—馬爾可夫定理
在經(jīng)典線性回歸模型的假定條件下,最小二乘估計(jì)量具有較好的統(tǒng)計(jì)性質(zhì),這些性質(zhì)包含在高斯—馬爾可夫定理之中。
本文檔共270頁;當(dāng)前第96頁;編輯于星期一\10點(diǎn)46分
高斯—馬爾可夫定理:在給定經(jīng)典線性回歸模型的假定下,最小二乘估計(jì)量是最佳線性無偏估計(jì)量。本文檔共270頁;當(dāng)前第97頁;編輯于星期一\10點(diǎn)46分該定理說明最小二乘估計(jì)量是的最佳線性無偏估計(jì)量。即:第一,它是線性的,即它是回歸模型中的被解釋變量Y
的線性函數(shù)。本文檔共270頁;當(dāng)前第98頁;編輯于星期一\10點(diǎn)46分第二,它是無偏的,即它的均值或期望值等于其真值,即。本文檔共270頁;當(dāng)前第99頁;編輯于星期一\10點(diǎn)46分第三,它在所有這樣的線性無偏估計(jì)量中具有最小方差。具有最小方差的無偏估計(jì)量叫做有效估計(jì)量。
本文檔共270頁;當(dāng)前第100頁;編輯于星期一\10點(diǎn)46分
下面,就普通最小二乘估計(jì)量的性質(zhì)給予說明。本文檔共270頁;當(dāng)前第101頁;編輯于星期一\10點(diǎn)46分1線性性
(4.23)
本文檔共270頁;當(dāng)前第102頁;編輯于星期一\10點(diǎn)46分(4.24)
(4.25)令則本文檔共270頁;當(dāng)前第103頁;編輯于星期一\10點(diǎn)46分這說明是Yi的一個(gè)線性函數(shù),它是以ki為權(quán)的一個(gè)加權(quán)平均數(shù),從而它是一個(gè)線性估計(jì)量。同理,也是一個(gè)線性估計(jì)量。本文檔共270頁;當(dāng)前第104頁;編輯于星期一\10點(diǎn)46分2無偏性,,即是無偏的,是無偏的。就是說,雖然由不同的樣本得到的可能大于或小于它們的真實(shí)值,但平均起來等于它們的真實(shí)值。本文檔共270頁;當(dāng)前第105頁;編輯于星期一\10點(diǎn)46分由式(4.25)可知:(4.26)
因?yàn)椋瑒t(4.27)
本文檔共270頁;當(dāng)前第106頁;編輯于星期一\10點(diǎn)46分據(jù)經(jīng)典假定,ki非隨機(jī),E(ui)=0,則
(4.28)
因此,的一個(gè)無偏估計(jì)量。同理,可證明的一個(gè)無偏估計(jì)量。本文檔共270頁;當(dāng)前第107頁;編輯于星期一\10點(diǎn)46分
在此要特別注意,無偏性是的抽樣分布的性質(zhì),并沒有告訴我們從特定樣本中得到的估計(jì)值是什么,我們希望得到較好的樣本,那樣就會得到接近于總體參數(shù)的估計(jì)值。但由于是隨機(jī)獲得樣本,就有可能得到遠(yuǎn)離總體參數(shù)的估計(jì)值的較差樣本。并且,我們無法判定所得到的樣本是哪一種。
本文檔共270頁;當(dāng)前第108頁;編輯于星期一\10點(diǎn)46分
當(dāng)X
是非隨機(jī)變量、E(u)=0
這些經(jīng)典假定不滿足時(shí),那么無偏性也就不成立了。本文檔共270頁;當(dāng)前第109頁;編輯于星期一\10點(diǎn)46分3方差最小
(1)最小二乘估計(jì)的方差與標(biāo)準(zhǔn)誤普通最小二乘估計(jì)量的方差 代表了估計(jì)參數(shù)的估計(jì)精度。本文檔共270頁;當(dāng)前第110頁;編輯于星期一\10點(diǎn)46分[據(jù)式(4.27)]據(jù)方差定義,可知:(4.29)
本文檔共270頁;當(dāng)前第111頁;編輯于星期一\10點(diǎn)46分據(jù)經(jīng)典假定,且E(uiuj)=0,i≠j故(4.30)
本文檔共270頁;當(dāng)前第112頁;編輯于星期一\10點(diǎn)46分式(4.30)是依賴于同方差和無序列相關(guān)假定的。同理,的方差為:(4.31)
本文檔共270頁;當(dāng)前第113頁;編輯于星期一\10點(diǎn)46分影響估計(jì)精度的因素為隨機(jī)誤差項(xiàng)的方差和Xi的總變異。本文檔共270頁;當(dāng)前第114頁;編輯于星期一\10點(diǎn)46分隨機(jī)誤差項(xiàng)的方差越大, 越大。因?yàn)椋绊慪的不可觀測的因素變異越大,要準(zhǔn)確地估計(jì)就越難。本文檔共270頁;當(dāng)前第115頁;編輯于星期一\10點(diǎn)46分另一方面,自變量的變異越大,估計(jì)的精度就越高。因?yàn)閄i
的變異性增時(shí),的方差就會減小,就是說,解釋變量的樣本分布越分散,就越容易找出E(Y/Xi)
和Xi
間的關(guān)系,即越容易準(zhǔn)確估計(jì)。本文檔共270頁;當(dāng)前第116頁;編輯于星期一\10點(diǎn)46分如果Xi沒有什么變化,就難以準(zhǔn)確地確定E(Y/Xi)是如何隨著Xi
的變化而變化的。當(dāng)樣本容量擴(kuò)大時(shí),Xi
的總變異也增加。因此,較大的樣本容量會產(chǎn)生較小的的方差。本文檔共270頁;當(dāng)前第117頁;編輯于星期一\10點(diǎn)46分最小二乘估計(jì)的標(biāo)準(zhǔn)誤為(4.32)
(4.33)本文檔共270頁;當(dāng)前第118頁;編輯于星期一\10點(diǎn)46分式中,表示的標(biāo)準(zhǔn)誤,表示的標(biāo)準(zhǔn)誤。除外,上述方程中的數(shù)據(jù)都是已知的。本文檔共270頁;當(dāng)前第119頁;編輯于星期一\10點(diǎn)46分(2)的最小二乘估計(jì)量從式(4.30)、式(4.31)可以看到,影響 和的因素除外,均為已知數(shù)。通常誤差項(xiàng)的方差是未知的,只能通過觀測數(shù)據(jù)去估計(jì),從而估計(jì)出和。本文檔共270頁;當(dāng)前第120頁;編輯于星期一\10點(diǎn)46分
我們要區(qū)分誤差與殘差的概念。誤差ui出現(xiàn)在總體回歸模型中,ui
是第i次觀測的誤差,由于未知,ui無法觀測到。殘差ei出現(xiàn)在樣本回歸模型m中, 是估計(jì)參數(shù),通過觀測值Yi,Xi可得到殘差ei。
本文檔共270頁;當(dāng)前第121頁;編輯于星期一\10點(diǎn)46分已知。由于ui不可觀,無法計(jì)算。我們可通過最小二乘法的殘差ei估計(jì)。用殘差ei代替ui就得到的一個(gè)估計(jì)量,但這是一個(gè)有偏估計(jì)量。本文檔共270頁;當(dāng)前第122頁;編輯于星期一\10點(diǎn)46分這是使用殘差代替誤差的緣故,調(diào)整自由度后,我們就得到的無偏估計(jì)量(4.35)
本文檔共270頁;當(dāng)前第123頁;編輯于星期一\10點(diǎn)46分
在經(jīng)典假定條件下,可以證明。 的估計(jì)量為(4.36)
我們稱其為回歸的標(biāo)準(zhǔn)誤。估計(jì)量是對影響Y的不可觀測因素的標(biāo)準(zhǔn)誤的估計(jì)。就是說,它估計(jì)了把X的影響排除之后Y的標(biāo)準(zhǔn)誤。本文檔共270頁;當(dāng)前第124頁;編輯于星期一\10點(diǎn)46分至此,用代替,我們可利用式(4.32)、(4.33)估計(jì)的標(biāo)準(zhǔn)誤。(4.37)(4.38)本文檔共270頁;當(dāng)前第125頁;編輯于星期一\10點(diǎn)46分當(dāng)對Y
的不同樣本使用普通最小二乘法時(shí),我們要注意將看作一個(gè)隨機(jī)變量,這是因?yàn)槭请S著樣本的不同而變化的。對于一個(gè)給定的樣本,是一個(gè)數(shù)字,就像我們用給定的數(shù)據(jù)計(jì)算時(shí)一樣,它也只是一個(gè)數(shù)字。
本文檔共270頁;當(dāng)前第126頁;編輯于星期一\10點(diǎn)46分(3)可以證明,在滿足經(jīng)典假定條件下,普通最小二乘估計(jì)量是所有線性無偏估計(jì)量中方差最小的。本文檔共270頁;當(dāng)前第127頁;編輯于星期一\10點(diǎn)46分四、判定系數(shù)R2—擬合優(yōu)度的度量
為了評價(jià)一個(gè)回歸方程的優(yōu)劣,我們引入擬合優(yōu)度的概念。即考查對一組數(shù)據(jù)所擬合的回歸線的擬合優(yōu)度,表示出樣本回歸線對數(shù)據(jù)擬合的有多么好。本文檔共270頁;當(dāng)前第128頁;編輯于星期一\10點(diǎn)46分如果全部觀測點(diǎn)都落在樣本回歸線上,我們就得到一個(gè)完美的擬合,但這種情況很少發(fā)生。一般情況下,總有一些正的ei和一些負(fù)的ei
,我們只能希望這些圍繞著回歸線的殘差盡可能小。判定系數(shù)R2
就是表示這種擬合優(yōu)劣的一個(gè)度量。本文檔共270頁;當(dāng)前第129頁;編輯于星期一\10點(diǎn)46分計(jì)算R2的步驟如下?lián)颖净貧w模型可得:(4.39)
(4.40)
為被解釋變量的樣本均值。本文檔共270頁;當(dāng)前第130頁;編輯于星期一\10點(diǎn)46分式(4.39)可表示為(4.41)本文檔共270頁;當(dāng)前第131頁;編輯于星期一\10點(diǎn)46分式(4.41)兩邊取平方得(4.42)
對所有觀測值求和,得(4.43)本文檔共270頁;當(dāng)前第132頁;編輯于星期一\10點(diǎn)46分其中,,因此(4.44)本文檔共270頁;當(dāng)前第133頁;編輯于星期一\10點(diǎn)46分式(4.44)中,表示實(shí)測的Y值圍繞其均值的總變異,稱為總平方和(TSS)。為來自解釋變量的回歸平方和,稱為解釋平方和(ESS)。是圍繞回歸線的Y值的變異,稱為殘差平方和(RSS)。
本文檔共270頁;當(dāng)前第134頁;編輯于星期一\10點(diǎn)46分式(4.44)可表示為TSS=ESS+RSS(4.45)這說明Y的觀測值圍繞其均值的總變異可分解為兩部分,一部分來自回歸線,而另一部分則來自擾動(dòng)項(xiàng)ui。從幾何意義上可畫出圖4.4。本文檔共270頁;當(dāng)前第135頁;編輯于星期一\10點(diǎn)46分YXXiYi圖4.4Yi的變異分解為兩個(gè)部分
本文檔共270頁;當(dāng)前第136頁;編輯于星期一\10點(diǎn)46分用TSS除式(4.45)的兩邊,得(4.46)
本文檔共270頁;當(dāng)前第137頁;編輯于星期一\10點(diǎn)46分定義R2為:(4.47)(4.48)
或本文檔共270頁;當(dāng)前第138頁;編輯于星期一\10點(diǎn)46分上述定義的R2稱為判定系數(shù),它是對回歸線擬合優(yōu)度的度量。就是說,R2測度了在Y的總變異中由回歸模型解釋的那個(gè)部分所占的比例或百分比。本文檔共270頁;當(dāng)前第139頁;編輯于星期一\10點(diǎn)46分
據(jù)判定系數(shù)的定義可知:0≤R2≤1。等于1的R2意味著一個(gè)完美的擬合,即對每個(gè)i都有 。另一方面,等于0的R2意味著被解釋變量與解釋變量之間無任何關(guān)系(即),這時(shí),,就是說,對任一Y值的最優(yōu)預(yù)測值都是它的均值,從而回歸線平行于X
軸。本文檔共270頁;當(dāng)前第140頁;編輯于星期一\10點(diǎn)46分
與R2關(guān)系緊密但概念上與R2差異較大的一個(gè)參數(shù)是相關(guān)系數(shù),它測度了兩個(gè)變量之間的關(guān)聯(lián)度。也可據(jù)R
的定義計(jì)算(4.49)
本文檔共270頁;當(dāng)前第141頁;編輯于星期一\10點(diǎn)46分從定義可以看出-1≤R≤1
。在回歸分析中,R2是一個(gè)比R更有意義的度量,因?yàn)镽2告訴我們在被解釋變量的變異中,由解釋變量解釋的部分占怎樣一個(gè)比例,因而對一個(gè)變量的變異在多大程度上決定另一個(gè)變量的變異,提供了一個(gè)總的度量,而R則沒有這種作用。本文檔共270頁;當(dāng)前第142頁;編輯于星期一\10點(diǎn)46分五、案例【例4.1】
根據(jù)凱恩斯理論,我們可建立消費(fèi)與可支配收入的線性回歸模型,模型形式如下(4.50)
其中,Y=消費(fèi),X=可支配收入,u=隨機(jī)誤差項(xiàng)。本文檔共270頁;當(dāng)前第143頁;編輯于星期一\10點(diǎn)46分XYXY1000150020002500300090013201620214024803500400045005000550027403300352040204310表4.4每月家庭消費(fèi)支出Y
和每月家庭收入X本文檔共270頁;當(dāng)前第144頁;編輯于星期一\10點(diǎn)46分調(diào)用回歸分析軟件EViews3.1進(jìn)行最小二乘估計(jì)可得:本文檔共270頁;當(dāng)前第145頁;編輯于星期一\10點(diǎn)46分DependentVariable:YMethod:LeastSquaresDate:12/25/04Time:01:40Sample:110Includedobservations:10VariableCoefficientStd.Errort-StatisticProb.CX159.878852.918443.0212300.01650.7615760.01489351.135410.0000R-squared0.996950Meandependentvar2635.000AdjustedR-squared0.996569S.D.dependentvar1154.655S.E.ofregression67.63763Akaikeinfocriterion11.44306Sumsquaredresid36598.79Schwarzcriterion11.50358Loglikelihood-55.21531F-statistic2614.830Durbin-Watsonstat3.391406Prob(F-statistic)0.000000EViews報(bào)告結(jié)果為本文檔共270頁;當(dāng)前第146頁;編輯于星期一\10點(diǎn)46分159.87881Y圖4.5樣本回歸線
X本文檔共270頁;當(dāng)前第147頁;編輯于星期一\10點(diǎn)46分樣本回歸線定義:回歸線上的點(diǎn)是給定X值相對應(yīng)的Yi的期望值或均值的一個(gè)估計(jì)值。得到的樣本回歸線為:本文檔共270頁;當(dāng)前第148頁;編輯于星期一\10點(diǎn)46分回歸線的斜率 表示,在X的樣本區(qū)間(1000,5500)內(nèi)X每增加1元,平均每月消費(fèi)支出增加0.7616元。本文檔共270頁;當(dāng)前第149頁;編輯于星期一\10點(diǎn)46分
回歸線的截距為159.8788,直觀解釋是當(dāng)每月收入X值為零時(shí),每月消費(fèi)支出的平均水平,但這種解釋是不恰當(dāng)?shù)?。因?yàn)閄值的變化范圍并不包括零這樣一個(gè)觀測值。截距項(xiàng)的解釋只能借助于經(jīng)濟(jì)理論或其它知識來解釋。通??衫斫鉃槭撬形窗ㄔ诨貧w模型的變量對Y的綜合影響。本文檔共270頁;當(dāng)前第150頁;編輯于星期一\10點(diǎn)46分
R2=0.9970,說明有99.70%的每月消費(fèi)支出的變異,可以由收入來解釋。本文檔共270頁;當(dāng)前第151頁;編輯于星期一\10點(diǎn)46分【例4.2】
中國城鎮(zhèn)居民消費(fèi)函數(shù)(1985~2003年)
本文檔共270頁;當(dāng)前第152頁;編輯于星期一\10點(diǎn)46分年份人均可支配收入人均消費(fèi)支出年份人均可支配收入人均消費(fèi)支出1985198619871988198919901991199219931994739.10840.71861.05841.08842.24912.92978.231073.281175.691275.67673.20746.70759.84785.98741.41773.10836.26885.33962.851040.371995199619971998199920002001200220031337.941389.351437.051519.931661.611768.311918.232175.792370.061105.091125.371165.611213.571310.211407.331484.621703.281821.46表4.5中國城鎮(zhèn)居民家庭人均收入與支出單位:元
本文檔共270頁;當(dāng)前第153頁;編輯于星期一\10點(diǎn)46分EViews報(bào)告結(jié)果為:DependentVariable:YMethod:LeastSquaresDate:12/25/04Time:02:32Sample:19852003Includedobservations:19VariableCoefficientStd.Errort-StatisticProb.C149.205910.8588713.740470.0000X0.7049330.00774291.052450.0000R-squared0.997954Meandependentvar1081.136AdjustedR-squared0.997833S.D.dependentvar339.6804S.E.ofregression15.81140Akaikeinfocriterion8.458640Sumsquaredresid4250.005Schwarzcriterion8.558054Loglikelihood-78.35708F-statistic8290.549Durbin-Watsonstat2.016588Prob(F-statistic)0.000000本文檔共270頁;當(dāng)前第154頁;編輯于星期一\10點(diǎn)46分據(jù)表4.5的數(shù)據(jù),使用普通最小二乘法,得到中國城鎮(zhèn)居民消費(fèi)函數(shù)。R2=0.9980
模型中,Yt=城鎮(zhèn)居民人均消費(fèi)性支出,Xt=城鎮(zhèn)居民人均可支配收入。本文檔共270頁;當(dāng)前第155頁;編輯于星期一\10點(diǎn)46分模型表明,在1985~2003年期間,中國城鎮(zhèn)居民可支配收入每增加1元,平均消費(fèi)支出增加0.70元,邊際消費(fèi)傾向?yàn)?.70。本文檔共270頁;當(dāng)前第156頁;編輯于星期一\10點(diǎn)46分
截距項(xiàng),從表面上看是當(dāng)居民可支配收入為0時(shí)的消費(fèi)支出水平,但這是一種毫無意義的解釋。因?yàn)樵跇颖局校⒉淮嬖诰用窨芍涫杖霝?的樣本。本文檔共270頁;當(dāng)前第157頁;編輯于星期一\10點(diǎn)46分
判定系數(shù)R2=0.9980。說明城鎮(zhèn)居民可支配收入解釋了城鎮(zhèn)居民消費(fèi)支出變異的99.80%,這是一個(gè)非常好的擬合。本文檔共270頁;當(dāng)前第158頁;編輯于星期一\10點(diǎn)46分第四節(jié)置信區(qū)間與假設(shè)檢驗(yàn)一、置信區(qū)間的基本概念
例4.1消費(fèi)模型中,邊際消費(fèi)傾向的估計(jì)值為0.7616,這是對未知的總體邊際消費(fèi)傾向的一個(gè)點(diǎn)估計(jì)。由于是點(diǎn)估計(jì),我們無法判斷這種估計(jì)的可靠性有多大。我們只能保證在重復(fù)抽樣中估計(jì)值的均值等于其真值。本文檔共270頁;當(dāng)前第159頁;編輯于星期一\10點(diǎn)46分為了衡量這一估計(jì)的可靠性,我們可圍繞點(diǎn)估計(jì)量構(gòu)造一個(gè)區(qū)間。要判斷對估計(jì)的可靠性,可設(shè)定區(qū)間,使其包含的概率為。即:(4.51)本文檔共270頁;當(dāng)前第160頁;編輯于星期一\10點(diǎn)46分其中,,。如果存在這樣一個(gè)區(qū)間,就稱設(shè)定的區(qū)間為的置信區(qū)間。 稱為置信系數(shù)或置信水平,而稱為顯著性水平,稱為置信上限,稱為置信下限。本文檔共270頁;當(dāng)前第161頁;編輯于星期一\10點(diǎn)46分如果或5%,則式(4.51)的意義即為隨機(jī)區(qū)間包含真實(shí)的概率為0.95或95%??梢钥闯觯眯艆^(qū)間給出了對估計(jì)的可靠程度。為了正確理解式(4.51),說明如下:本文檔共270頁;當(dāng)前第162頁;編輯于星期一\10點(diǎn)46分1.式(4.51)并不是說落入該界限內(nèi)的概率是。因?yàn)殡m然未知,但它是總體回歸函數(shù)中的邊際消費(fèi)傾向,是個(gè)定數(shù),要么落在該區(qū)間內(nèi),要么落在該區(qū)間外。式(4.51)的意義為:用隨機(jī)樣本估計(jì)參數(shù)構(gòu)造的區(qū)間包含的概率為。本文檔共270頁;當(dāng)前第163頁;編輯于星期一\10點(diǎn)46分
2.式(4.51)中的區(qū)間是一個(gè)隨機(jī)區(qū)間,它隨著樣本的不同而不同。本文檔共270頁;當(dāng)前第164頁;編輯于星期一\10點(diǎn)46分
3.式(4.51)的意義為,對于多次抽樣,平均地說,這些區(qū)間有包含真實(shí)參數(shù)。本文檔共270頁;當(dāng)前第165頁;編輯于星期一\10點(diǎn)46分4.式(4.51)中,當(dāng)是一個(gè)隨機(jī)變量時(shí),代表多種可能結(jié)果。如果選定了一個(gè)樣本,就獲得的一個(gè)結(jié)果值,式(4.51)的區(qū)間就不再是隨機(jī)區(qū)間,而是特定區(qū)間。本文檔共270頁;當(dāng)前第166頁;編輯于星期一\10點(diǎn)46分此時(shí),我們就不能說這個(gè)給定的區(qū)間包含真實(shí)參數(shù)的概率是 。此時(shí),要么在該區(qū)間內(nèi),要么在該區(qū)間外,概率只能是1或0。如果我們得到了的95%置信區(qū)間為,就不能說這個(gè)區(qū)間包含真實(shí)值的概率是95%。這個(gè)概率不是1就是0。本文檔共270頁;當(dāng)前第167頁;編輯于星期一\10點(diǎn)46分二、ui正態(tài)性假定及普通最小二乘估計(jì)量 ,和的性質(zhì)
(一)ui正態(tài)性假定
在回歸分析中,我們的目的不僅僅是得到,而是要用推斷。因此,我們需要得到的置信區(qū)間,通過置信區(qū)間去判斷這種推斷的可靠性。本文檔共270頁;當(dāng)前第168頁;編輯于星期一\10點(diǎn)46分在最小二乘估計(jì)式中,是Yi
的線性函數(shù),從而也就是ui的線性函數(shù)。要推斷的置信區(qū)間,我們就必須獲得ui
的概率分布。在回歸分析中,人們常常假定ui
服從正態(tài)分布,即每個(gè)ui
都是正態(tài)分布的。本文檔共270頁;當(dāng)前第169頁;編輯于星期一\10點(diǎn)46分期望值:
E(ui)=0
(4.52)
方差:
(4.53)
協(xié)方差:(4.54)
本文檔共270頁;當(dāng)前第170頁;編輯于星期一\10點(diǎn)46分用符號表示,則為(4.55)
其中,~表示“其分布為”,N表示“正態(tài)分布”,括號中的數(shù)字為正態(tài)分布的兩個(gè)參數(shù):期望值與方差。本文檔共270頁;當(dāng)前第171頁;編輯于星期一\10點(diǎn)46分正態(tài)假定理由如下:1.ui代表回歸模型中未包含的變量的集合。這些未引入的變量的影響是微弱的和隨機(jī)的。根據(jù)中心極限定理,如果存在大量獨(dú)立且同分布的隨機(jī)變量,隨著這些變量個(gè)數(shù)的增大,它們的總和將趨向正態(tài)分布。
本文檔共270頁;當(dāng)前第172頁;編輯于星期一\10點(diǎn)46分
2.即使變量個(gè)數(shù)不是很大或這些變量不是嚴(yán)格獨(dú)立的,它們的總和仍可視同正態(tài)分布。本文檔共270頁;當(dāng)前第173頁;編輯于星期一\10點(diǎn)46分(二)ui正態(tài)假定下普通最小二乘估計(jì)量,和的性質(zhì)1.它們是無偏的。2.它們有最小方差。3.它們是一致估計(jì)量。就是說,隨著樣本容量無限地增大,估計(jì)量將收斂到它們的真值。本文檔共270頁;當(dāng)前第174頁;編輯于星期一\10點(diǎn)46分4.服從正態(tài)分布
期望值:方差
:(4.56)
(4.57)
即:(4.58)
本文檔共270頁;當(dāng)前第175頁;編輯于星期一\10點(diǎn)46分5.服從正態(tài)分布期望值:
方差
:(4.59)(4.60)即:(4.61)本文檔共270頁;當(dāng)前第176頁;編輯于星期一\10點(diǎn)46分6.服從χ2(n-2)分布。
7.
Yi服從正態(tài)分布期望值:
方差:
即:(4.62)(4.63)(4.64)本文檔共270頁;當(dāng)前第177頁;編輯于星期一\10點(diǎn)46分三、回歸系數(shù)和的置信區(qū)間
在ui正態(tài)假定下,和均服從正態(tài)分布,將轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,則為:(4.65)本文檔共270頁;當(dāng)前第178頁;編輯于星期一\10點(diǎn)46分Z為期望值為0、方差為1的標(biāo)準(zhǔn)正態(tài)分布,即:Z~N(0,1)
(4.66)本文檔共270頁;當(dāng)前第179頁;編輯于星期一\10點(diǎn)46分
當(dāng)已知時(shí),我們就可得到β2的置信度為(1-α)的置信區(qū)間為本文檔共270頁;當(dāng)前第180頁;編輯于星期一\10點(diǎn)46分但是,由于ui的不可觀測,我們無法獲知。我們只能用的無偏估計(jì)量來測定,如果我們用代替,則式(4.65)可寫為本文檔共270頁;當(dāng)前第181頁;編輯于星期一\10點(diǎn)46分(4.67)
本文檔共270頁;當(dāng)前第182頁;編輯于星期一\10點(diǎn)46分
可以證明,這樣定義的t變量服從自由度為n-2的t分布,據(jù)t分布可得
(4.68)
式(4.68)中,是顯著性水平為,自由度為n-2的t分布的t值,通常稱為顯著水平的臨界值。本文檔共270頁;當(dāng)前第183頁;編輯于星期一\10點(diǎn)46分(4.69)
(4.70)
將式(4.67)代入式(4.68)得本文檔共270頁;當(dāng)前第184頁;編輯于星期一\10點(diǎn)46分
式(4.70)給出了的一個(gè)100%(1-)置信區(qū)間。同理我們可得到的置信區(qū)間:(4.71)
本文檔共270頁;當(dāng)前第185頁;編輯于星期一\10點(diǎn)46分從式(4.70)、(4.71)可以看出,,的置信區(qū)間的寬度與估計(jì)量,的標(biāo)準(zhǔn)誤 成正比例。標(biāo)準(zhǔn)誤越大,置信區(qū)間越寬。就是說,估計(jì)量的標(biāo)準(zhǔn)誤越大,對未知參數(shù)的真值進(jìn)行估計(jì)的可靠性越差。因此,估計(jì)量的標(biāo)準(zhǔn)誤也被用于測度估計(jì)量的精度,就是說用估計(jì)量去測定真實(shí)的總體值有多精確。本文檔共270頁;當(dāng)前第186頁;編輯于星期一\10點(diǎn)46分例如,在我們的引例中,上一節(jié)中我們得到斜率系數(shù)的估計(jì)值,,自由度為8,當(dāng)顯著性水平為5%,即置信系數(shù)為95%時(shí),查t分布表可知,,則的95%置信區(qū)間為0.7272≤≤0.7960
(4.72)本文檔共270頁;當(dāng)前第187頁;編輯于星期一\10點(diǎn)46分
式(4.72)的意義為:給定置信系數(shù)為95%,從長遠(yuǎn)看,類似于(0.7272,0.7960)的區(qū)間,100個(gè)區(qū)間中,將有95個(gè)包含著真實(shí)的值。
本文檔共270頁;當(dāng)前第188頁;編輯于星期一\10點(diǎn)46分
我們不能說這個(gè)固定的區(qū)間有95%的概率包含真實(shí)的值,因?yàn)檫@個(gè)區(qū)間是固定不變的,要么在該區(qū)間內(nèi),要么在該區(qū)間外。這個(gè)固定的區(qū)間包含的概率要么為1,要么為0。
本文檔共270頁;當(dāng)前第189頁;編輯于星期一\10點(diǎn)46分同理,我們可構(gòu)建的置信區(qū)間為37.8500≤≤281.9080(4.73)
式(4.73)表示,從長遠(yuǎn)看,該區(qū)間100個(gè)中將有95個(gè)包含真實(shí)的;但這個(gè)固定的區(qū)間包含真實(shí)的的概率是1或0。本文檔共270頁;當(dāng)前第190頁;編輯于星期一\10點(diǎn)46分四、假設(shè)檢驗(yàn)
1檢驗(yàn)回歸系數(shù)的顯著性——t檢驗(yàn)
統(tǒng)計(jì)假設(shè)檢驗(yàn)的中心思想就是判斷某一特定觀測或發(fā)現(xiàn)是否與某一聲稱的假設(shè)相符。如果相符就不拒絕這一假設(shè),如不相符就拒絕這一假設(shè)。本文檔共270頁;當(dāng)前第191頁;編輯于星期一\10點(diǎn)46分例如,在引例的回歸分析中,如果事先我們已有一些研究成果認(rèn)定邊際消費(fèi)傾向?yàn)?.90,那么=0.90就是我們所說的聲稱的假設(shè)。本文檔共270頁;當(dāng)前第192頁;編輯于星期一\10點(diǎn)46分如果我們的觀測(估計(jì))結(jié)果在一定的統(tǒng)計(jì)原則下與0.90并不矛盾,我們就接受假設(shè),即邊際消費(fèi)傾向的真值為0.90。如果 與在一定的統(tǒng)計(jì)原則下相互矛盾,我們就拒絕假設(shè),即邊際消費(fèi)傾向的真實(shí)值不是0.90。本文檔共270頁;當(dāng)前第193頁;編輯于星期一\10點(diǎn)46分
我們稱這一聲稱的假設(shè)為虛擬假設(shè)或原假設(shè),用符號H0表示,與之相對應(yīng)就稱為備擇假設(shè),用符號H1表示。本文檔共270頁;當(dāng)前第194頁;編輯于星期一\10點(diǎn)46分一般地,可假設(shè)為原假設(shè)H0:
備擇假設(shè)H1:
本文檔共270頁;當(dāng)前第195頁;編輯于星期一\10點(diǎn)46分已知:(4.74)即t服從自由度為n-2的t分布。如原假設(shè)成立,即,則
:(4.75)
本文檔共270頁;當(dāng)前第196頁;編輯于星期一\10點(diǎn)46分該t值是一個(gè)統(tǒng)計(jì)量,服從t分布,據(jù)此可得到t統(tǒng)計(jì)量的置信區(qū)間(4.76)本文檔共270頁;當(dāng)前第197頁;編輯于星期一\10點(diǎn)46分
式(4.76)建立的100()%置信區(qū)間為原假設(shè)H0:的接受域,置信區(qū)間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度供應(yīng)鏈金融合同示范文本3篇
- 2024年度企業(yè)高級管理人員任期聘用合同范本3篇
- 2024年度內(nèi)衣行業(yè)品牌推廣代理合同范本3篇
- 2024年物業(yè)運(yùn)營管理合同2篇
- 2024年度石材購銷合同的爭議解決機(jī)構(gòu)
- 2024年期土建施工勞務(wù)合作合同樣本一
- 2024年油茶種植產(chǎn)業(yè)協(xié)會會員間的合作協(xié)議
- 2024年度重慶駕駛員服務(wù)期與薪酬福利合同3篇
- 2024年度新能源項(xiàng)目三方入股合作協(xié)議書3篇
- 2024年二零二四年度汽車貸款電子簽章服務(wù)合同3篇
- 咯血病人做介入手術(shù)后的護(hù)理
- 境外投資環(huán)境分析報(bào)告
- 《壓力平衡式旋塞閥》課件
- 物聯(lián)網(wǎng)與人工智能技術(shù)融合發(fā)展年度報(bào)告
- 婦產(chǎn)科醫(yī)生醫(yī)患溝通技巧
- 內(nèi)科學(xué)糖尿病教案
- 《高尿酸血癥》課件
- 微量泵的操作及報(bào)警處置課件查房
- 人教版小學(xué)數(shù)學(xué)四年級上冊5 1《平行與垂直》練習(xí)
- 市政設(shè)施養(yǎng)護(hù)面年度計(jì)劃表
- 公差配合與技術(shù)測量技術(shù)教案
評論
0/150
提交評論