計量經(jīng)濟學(xué)基礎(chǔ) 第3版 課件全套 張兆豐 第1-12章 導(dǎo)論、回歸與回歸分析-時間序列模型_第1頁
計量經(jīng)濟學(xué)基礎(chǔ) 第3版 課件全套 張兆豐 第1-12章 導(dǎo)論、回歸與回歸分析-時間序列模型_第2頁
計量經(jīng)濟學(xué)基礎(chǔ) 第3版 課件全套 張兆豐 第1-12章 導(dǎo)論、回歸與回歸分析-時間序列模型_第3頁
計量經(jīng)濟學(xué)基礎(chǔ) 第3版 課件全套 張兆豐 第1-12章 導(dǎo)論、回歸與回歸分析-時間序列模型_第4頁
計量經(jīng)濟學(xué)基礎(chǔ) 第3版 課件全套 張兆豐 第1-12章 導(dǎo)論、回歸與回歸分析-時間序列模型_第5頁
已閱讀5頁,還剩484頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第1章導(dǎo)論第1章

導(dǎo)論了解計量經(jīng)濟學(xué)的產(chǎn)生與發(fā)展過程理解計量經(jīng)濟學(xué)的含義了解計量經(jīng)濟學(xué)的研究過程掌握統(tǒng)計學(xué)的基本方法LEARNINGTARGET學(xué)習(xí)目標(biāo)在現(xiàn)實的經(jīng)濟活動中,我們經(jīng)常要對諸如國民生產(chǎn)總值(GNP)、失業(yè)、通貨膨脹、進(jìn)口、出口等經(jīng)濟現(xiàn)象進(jìn)行定量分析,如何對這些經(jīng)濟現(xiàn)象進(jìn)行測度呢?計量經(jīng)濟學(xué)就是利用經(jīng)濟理論、數(shù)學(xué)、統(tǒng)計推斷等工具對經(jīng)濟現(xiàn)象進(jìn)行分析的一門社會科學(xué)。計量經(jīng)濟學(xué)運用數(shù)理統(tǒng)計知識分析經(jīng)濟數(shù)據(jù),對構(gòu)建于數(shù)理經(jīng)濟學(xué)基礎(chǔ)之上的數(shù)學(xué)模型提供經(jīng)驗支持,并得出量化的結(jié)果。計量經(jīng)濟學(xué)(Econometrics)這個詞是1926年挪威經(jīng)濟學(xué)家、第一屆諾貝爾經(jīng)濟學(xué)獎獲得者弗瑞希(R.Frisch)在《論純經(jīng)濟問題》一文中,按照“生物計量學(xué)”(Biometrics)一詞的結(jié)構(gòu)仿造出來的。Econometrics一詞的本意是指“經(jīng)濟度量”,研究對經(jīng)濟現(xiàn)象和經(jīng)濟關(guān)系的計量方法,因此Econometrics有時也譯為“經(jīng)濟計量學(xué)”。將Econometrics譯為計量經(jīng)濟學(xué),是為了強調(diào)計量經(jīng)濟學(xué)是一門經(jīng)濟學(xué)科,不僅要研究經(jīng)濟現(xiàn)象的計量方法,而且要研究經(jīng)濟現(xiàn)象發(fā)展變化的數(shù)量規(guī)律。1.1計量經(jīng)濟學(xué)的產(chǎn)生與發(fā)展1.1計量經(jīng)濟學(xué)的產(chǎn)生與發(fā)展計量經(jīng)濟學(xué)的產(chǎn)生源于對經(jīng)濟問題的定量研究,這是社會經(jīng)濟發(fā)展到一定階段的客觀需要。經(jīng)濟現(xiàn)象本來就充滿著數(shù)量關(guān)系,人們很早就在探索用定量的方式研究經(jīng)濟問題。早在17世紀(jì)英國經(jīng)濟學(xué)家、統(tǒng)計學(xué)家威廉?配第在《政治算術(shù)》中就運用統(tǒng)計方法研究社會經(jīng)濟問題,主張用“數(shù)字、重量和尺度”來闡明經(jīng)濟現(xiàn)象。以后的相當(dāng)一段時間,經(jīng)濟學(xué)家們也力圖運用數(shù)學(xué)方法研究經(jīng)濟活動,用數(shù)學(xué)語言和公式去表達(dá)經(jīng)濟范疇和經(jīng)濟規(guī)律。但這都還沒有形成計量經(jīng)濟學(xué)。計量經(jīng)濟學(xué)作為經(jīng)濟學(xué)的一門獨立學(xué)科被正式確立,其標(biāo)志一般認(rèn)為是1930年12月弗瑞希和丁伯根(J.Tinbergen)等經(jīng)濟學(xué)家發(fā)起在美國克里富蘭成立國際計量經(jīng)濟學(xué)會。第二次世界大戰(zhàn)以后,計量經(jīng)濟學(xué)在西方各國的影響迅速擴大,發(fā)展成為經(jīng)濟學(xué)的重要分支。特別是從20世紀(jì)40年代到60年代,經(jīng)典計量經(jīng)濟學(xué),逐步完善并得到廣泛應(yīng)用。美國著名經(jīng)濟學(xué)家、諾貝爾經(jīng)濟學(xué)獎獲得者薩謬爾森(P.Samuelson)認(rèn)為:“第二次世界大戰(zhàn)后的經(jīng)濟學(xué)是計量經(jīng)濟學(xué)的時代”。事實上,在世界諾貝爾經(jīng)濟學(xué)獎獲得者中,相當(dāng)一部分都是計量經(jīng)濟學(xué)家。20世紀(jì)70年代以來,計量經(jīng)濟學(xué)的理論和應(yīng)用又進(jìn)入一個新的階段。首先是計算機的廣泛應(yīng)用和新的計算方法大量提出,所使用的計量經(jīng)濟模型的規(guī)模越來越大。更重要的是非經(jīng)典計量經(jīng)濟學(xué)的理論和應(yīng)用有了新的突破。微觀計量經(jīng)濟學(xué)、非參數(shù)計量經(jīng)濟學(xué)、時間序列計量經(jīng)濟學(xué)和動態(tài)計量經(jīng)濟學(xué)等的提出,使計量經(jīng)濟學(xué)產(chǎn)生了新的理論體系,協(xié)整理論、面板數(shù)據(jù)、對策論、貝葉斯方法等理論在計量經(jīng)濟學(xué)中的應(yīng)用已成為新的研究課題。應(yīng)該看到,計量經(jīng)濟學(xué)的發(fā)展是與現(xiàn)代科學(xué)技術(shù)成就結(jié)合在一起的,它反映了社會化大生產(chǎn)對各種經(jīng)濟因素和經(jīng)濟活動進(jìn)行數(shù)量分析的客觀要求。經(jīng)濟學(xué)從定性研究向定量分析的發(fā)展,是經(jīng)濟學(xué)逐步向更加精密、更加科學(xué)發(fā)展的表現(xiàn)。正如馬克思強調(diào)的:一種科學(xué)只有成功地運用了數(shù)學(xué)以后,才算達(dá)到了完善的地步。因此另一獲得諾貝爾經(jīng)濟學(xué)獎的經(jīng)濟學(xué)家克萊因(R.Klein)認(rèn)為:“計量經(jīng)濟學(xué)已經(jīng)在經(jīng)濟學(xué)科中居于最重要的地位”。1.1計量經(jīng)濟學(xué)的產(chǎn)生與發(fā)展計量經(jīng)濟學(xué)的奠基人弗瑞希在《計量經(jīng)濟學(xué)》的創(chuàng)刊詞中說到:“用數(shù)學(xué)方法探討經(jīng)濟學(xué)可以從好幾個方面著手,但任何一方面都不能與計量經(jīng)濟學(xué)混為一談。計量經(jīng)濟學(xué)與經(jīng)濟統(tǒng)計學(xué)決非一碼事;它也不同于我們所說的一般經(jīng)濟理論,盡管經(jīng)濟理論大部分都具有一定的數(shù)量特征;計量經(jīng)濟學(xué)也不應(yīng)視為數(shù)學(xué)應(yīng)用于經(jīng)濟學(xué)的同義語。經(jīng)驗表明,統(tǒng)計學(xué)、經(jīng)濟理論和數(shù)學(xué)這三者對于真正了解現(xiàn)代經(jīng)濟生活中的數(shù)量關(guān)系來說,都是必要的,但各自并非是充分條件。而三者結(jié)合起來,就有力量,這種結(jié)合便構(gòu)成了計量經(jīng)濟學(xué)?!焙髞砻绹嬃拷?jīng)濟學(xué)家克萊因也認(rèn)為:計量經(jīng)濟學(xué)是數(shù)學(xué)、統(tǒng)計技術(shù)和經(jīng)濟分析的綜合。也可以說,計量經(jīng)濟學(xué)不僅是指對經(jīng)濟現(xiàn)象加以測量,而且表明是根據(jù)一定的經(jīng)濟理論進(jìn)行計量的意思。1.2計量經(jīng)濟學(xué)的性質(zhì)盡管這些經(jīng)濟學(xué)家對計量經(jīng)濟學(xué)定義的表述各不相同,但可以看出,計量經(jīng)濟學(xué)不是對經(jīng)濟的一般度量,它與經(jīng)濟理論、統(tǒng)計學(xué)、數(shù)學(xué)都有密切的關(guān)系。事實上,計量經(jīng)濟學(xué)是以經(jīng)濟理論和經(jīng)濟數(shù)據(jù)的事實為依據(jù),運用數(shù)學(xué)、統(tǒng)計學(xué)的方法,通過建立數(shù)學(xué)模型來研究經(jīng)濟數(shù)量關(guān)系和規(guī)律的一門經(jīng)濟學(xué)科。應(yīng)當(dāng)注意,計量經(jīng)濟學(xué)所研究的主體是經(jīng)濟現(xiàn)象及其發(fā)展變化的規(guī)律,所以它是一門經(jīng)濟學(xué)科。計量經(jīng)濟學(xué)當(dāng)然會運用大量的數(shù)學(xué)方法,特別是許多數(shù)理統(tǒng)計方法,但是數(shù)學(xué)在這里只是工具,而不是研究的主體。計量經(jīng)濟學(xué)的用途或目的主要有兩個方面:其一是理論檢驗,這是計量經(jīng)濟學(xué)用途最為主要的和可靠的方面,這也是計量經(jīng)濟學(xué)本身的一個主要內(nèi)容。其二是預(yù)測應(yīng)用。從理論研究和方法的最終目的看,預(yù)測(包括政策評價)當(dāng)然是計量經(jīng)濟學(xué)最終任務(wù),必須注意學(xué)習(xí)和了解,但其預(yù)測的可靠性或有效性是我們應(yīng)該十分注意的。1.2計量經(jīng)濟學(xué)的性質(zhì)1.3計量經(jīng)濟學(xué)的研究方法運用計量經(jīng)濟方法研究經(jīng)濟問題一般可以分為以下步驟:理論或假說的陳述建立理論的數(shù)學(xué)模型建立理論的計量經(jīng)濟學(xué)模型抽樣、收集數(shù)據(jù)估計回歸系數(shù)參數(shù)的假設(shè)檢驗?zāi)P偷膽?yīng)用QUESTION為了闡明計量經(jīng)濟學(xué)的方法論,我們來考慮這樣一個問題:居民的消費支出與居民家庭收入之間有什么關(guān)系?或者說居民家庭收入不同對于居民的消費支出會有影響嗎?根據(jù)經(jīng)濟學(xué)中的凱恩斯消費理論可知:隨著收入水平的提高,消費也會增加;但消費的增加不及收入增加得多。那么這個理論我們怎么來驗證它?當(dāng)居民的家庭收入變動后,會引起居民的消費支出發(fā)生多大的變化呢?這個問題可以用計量經(jīng)濟學(xué)的方法來回答。我們可以建立相應(yīng)的模型來“計量”因收入變化而使消費變化的程度。這個問題中涉及兩個經(jīng)濟變量:收入和消費,由經(jīng)濟理論可知,收入影響消費,即收入是“自變量”、消費是“因變量”。我們應(yīng)該用什么樣的函數(shù)形式來描述這兩個經(jīng)濟變量關(guān)系呢?1.理論或假說的陳述我們將式(1-1)稱之為一元線性回歸方程。這個方程從數(shù)學(xué)意義上刻畫兩個變量之間的關(guān)系,而且斜率項系數(shù)有著特定的經(jīng)濟學(xué)意義—邊際消費傾向。根據(jù)斜率項系數(shù)的幾何意義可知:

即消費的增量比收入的增量,表示邊際消費傾向。經(jīng)濟學(xué)理論和大量事實證明,收入與消費是線性關(guān)系。于是,我們可以建立數(shù)學(xué)模型:(1-1)

其中Y-消費,X-收入,??_0、??_1-回歸系數(shù)2.建立理論的數(shù)學(xué)模型我們將式(1-2)稱之為一元線性回歸模型。與式(1-1)相比,式(1-2)多出一個誤差項,這是因為對于同一收入水平(X)的居民,他們的消費(Y)也會有差異,有非常多的偶然因素影響到消費行為,這些因素都?xì)w結(jié)到誤差項當(dāng)中。誤差在計量經(jīng)濟學(xué)分析中有著非常重要的意義,我們認(rèn)為這樣的誤差是隨機誤差。由于消費是隨機變量,故這兩個變量之間的關(guān)系不會表現(xiàn)出像式(1-1)那樣嚴(yán)格的函數(shù)關(guān)系。也就是說,式(1-1)是“近似”的表示消費與收入的關(guān)系,這樣,這兩個經(jīng)濟變量之間的真實關(guān)系應(yīng)該是:(1-2)其中u—誤差項3.建立理論的計量經(jīng)濟學(xué)模型式(1-1)和(1-2)描述的總體的情形。我們知道,總體一般來說是不可全面觀測的,雖然斜率項系數(shù)表示邊際消費傾向。但是我們相信,總體中的一部分人群的消費與收入的關(guān)系和總體人群的消費與收入的關(guān)系具有相同的特性,可以建立相同形式的樣本一元線性回歸方程和模型。于是,我們抽樣并收集樣本數(shù)據(jù),并用樣本數(shù)據(jù)得到樣本的斜率項系數(shù),即樣本的邊際消費傾向;再用樣本邊際消費傾向推斷總體邊際消費傾向,這個過程是可以實現(xiàn)的。4.抽樣、收集數(shù)據(jù)在這個結(jié)果里,斜率項系數(shù)為0.65,即樣本邊際消費傾向是0.65,表示收入增加1元,消費會增加0.65元。但是,這個結(jié)果是一個樣本得到的結(jié)果,我們認(rèn)為樣本是隨機抽取的,所以,樣本邊際消費傾向是一個隨機的結(jié)果,我們的目的是希望用樣本結(jié)果對總體特征做出估計。如何得到式(1-3)的結(jié)果,我們會在第3章進(jìn)行介紹。收集到樣本數(shù)據(jù)后,我們可以用相應(yīng)的統(tǒng)計方法得到樣本的截距項系數(shù)和斜率項系數(shù)。假如我們用某一個樣本數(shù)據(jù)得到如下結(jié)果:

5.估計回歸系數(shù)如果通過了檢驗,說明模型是可靠的,那么我們可以對模型進(jìn)行應(yīng)用。模型的應(yīng)用主要是兩個方面:一是對總體的系數(shù)做估計。例如在消費模型中,斜率項系數(shù)表示邊際消費傾向,我們只能得到樣本的邊際消費傾向,我們可以運用統(tǒng)計學(xué)的方法對總體的邊際消費傾向進(jìn)行估計。另外一個是預(yù)測。對于樣本以外的X值,我們可以通過樣本方程預(yù)測其對應(yīng)的Y值,例如當(dāng)收入(X)達(dá)到8000元時,對應(yīng)的消費大約為5435.60元。6.參數(shù)的假設(shè)檢驗式(1-3)得到的結(jié)果是一個樣本結(jié)果,樣本結(jié)果是帶有偶然性的,那么這樣一個結(jié)果在統(tǒng)計意義上顯著嗎?為什么要提出這樣的問題呢?這是因為由樣本得到的斜率項系數(shù)為0.65,是不等于0的,這是一個偶然的結(jié)果嗎?或者說,我們是不是偶然得到了一個不等于0的斜率項系數(shù)呢?而總體的斜率實際上是等于0的。這個問題的另外一個表達(dá)方式是由樣本的這個結(jié)果能判斷總體的??_1也不等于0嗎?我們建立模型式(1-2)的含義是“計量”X對Y影響的程度,如果??_1=0則式(1-2)變?yōu)??=??_0+??,這說明X沒有對Y產(chǎn)生影響,這個結(jié)果顯然與我們最初建立模型的意圖是不相符的,或者說建立這樣的模型是不可靠的。這樣的一個問題就是參數(shù)的假設(shè)檢驗。如果通過檢驗可以證實??_1≠0",那么說明我們建立的模型式(1?2)是可靠的。"7.模型的應(yīng)用1.4數(shù)據(jù)由上述分析,要“計量”收入對消費的影響,必須要有數(shù)據(jù),對于不同的現(xiàn)象表現(xiàn)出來的數(shù)據(jù)類型是不一樣的。最常用的數(shù)據(jù)有時間序列數(shù)據(jù)、截面數(shù)據(jù)和面板數(shù)據(jù)。時間序列數(shù)據(jù)是同一總體在不同時間上的統(tǒng)計數(shù)據(jù),比如不同年份的GNP、失業(yè)、就業(yè)、貨幣供給、政府赤字等數(shù)據(jù)就可以構(gòu)成不同的時間序列。右表為中國近三年季度國內(nèi)生產(chǎn)總值及構(gòu)成數(shù)據(jù),這些數(shù)據(jù)按照時間先后的原則進(jìn)行排列,反映了我國(同一總體)在近三年各季度(不同時間)國內(nèi)生產(chǎn)總值及構(gòu)成的情況。1.時間序列數(shù)據(jù)(timeseriesdata)1.4數(shù)據(jù)時間國內(nèi)生產(chǎn)總值其中第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)2019Q1218062.88769.481806.5127486.92019Q2242573.914437.697315.6130820.62019Q3252208.719798.097790.4134620.42019Q4278019.727461.7109252.8141305.22020Q1206504.310186.273638.0122680.12020Q2250110.115866.899121.0135122.32020Q3266172.022069.5101507.7142594.72020Q4293199.829631.6109988.6153579.72021Q1249310.111332.192623.5145354.52021Q2282857.417070.2114530.7151256.52021Q3290963.823027.8113785.5154150.42021Q4320538.731655.9129964.3158918.6截面數(shù)據(jù)是不同總體在同一時間截面上的調(diào)查數(shù)據(jù)。例如各國或各地區(qū)的工業(yè)普查數(shù)據(jù)、人口普查數(shù)據(jù)數(shù)據(jù)等。表1-2為2020年我國西北地區(qū)一般公共預(yù)算收入與稅收收入的相關(guān)數(shù)據(jù),是不同地區(qū)(總體)在同一時間截面(2020年)的數(shù)據(jù)。2.橫截面數(shù)據(jù)(cross-sectionaldata)1.4數(shù)據(jù)單位:億元地區(qū)一般公共預(yù)算收入稅收收入陜西2257.311752.14甘肅874.55567.93青海297.99213.27寧夏419.44263.87新疆1477.22910.19表1-3的為華北各地區(qū)在不同時間的年末人口數(shù)的數(shù)據(jù),這類數(shù)據(jù)即有截面數(shù)據(jù)的特征(各地區(qū)),又有時間序列數(shù)據(jù)的特征(不同時間)。3.面板數(shù)據(jù)(paneldata)1.4數(shù)據(jù)地區(qū)年份北京天津河北山西內(nèi)蒙古2011202413417232356224702012207813787262354824642013212514107288353524552014217114297323352824492015218814397345351924402016219514437375351424362017219414107409351024332018219213837426350224222019219013857447349724152020218913877464349024031.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)隨機現(xiàn)象是無法事先準(zhǔn)確確定其結(jié)果的現(xiàn)象。在社會經(jīng)濟領(lǐng)域中,隨機現(xiàn)象是普遍存在的,研究隨機現(xiàn)象,對認(rèn)識這些現(xiàn)象是非常必要的。觀察隨機現(xiàn)象或為了觀察隨機而進(jìn)行的試驗稱為隨機試驗。隨機現(xiàn)象具有可以重復(fù)多次;可能的結(jié)果不止一個,但事先可知;每一次試驗都會出現(xiàn)上述結(jié)果中的某一個,但事先不能預(yù)知是哪一個等特點。隨機試驗的每一個可能結(jié)果稱為一個樣本點,全體樣本點的集合稱為樣本空間。隨機試驗的結(jié)果稱為隨機事件。隨機事件由一系列樣本點組成。某隨機事件A發(fā)生的可能性稱為事件A發(fā)生的概率,記為p(A),(0≤p(A)≤1),p(A)=1表示不可能發(fā)生的事件,p(A)=1表示必然發(fā)生事件。1.隨機現(xiàn)象、隨機試驗與概率以隨機試驗的結(jié)果為取值的變量稱為隨機變量。一個隨機變量具有下列特性:可以取許多不同的數(shù)值,取這些數(shù)值的概率為p。重復(fù)抽樣得到的樣本就是一個隨機變量,所謂“樣本容量為n的樣本”就是n個相互獨立且與總體有相同分布的隨機變量

,……,

每一次具體抽樣所得的數(shù)據(jù),就是n元隨機變量的一個觀察值,記為(

,……,

)。隨機變量可以為分為離散隨機變量和連續(xù)隨機變量。一個離散隨機變量只能取有限(或可數(shù)無窮)多個值。例如,投擲骰子的所有可能點數(shù)為1至6中的任何一個,我們就可以定義隨機變量為點數(shù)X=1,2,3,4,5,6,從而它是一個離散隨機變量。連續(xù)隨機變量可以取某一區(qū)間的任何值,例如人的身高、體重、學(xué)生的分?jǐn)?shù)等都是連續(xù)隨機變量。2.隨機變量

1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)若X為一隨機變量,對任意實數(shù)x,稱F(x)=p(X<x)為隨機變量X的分布函數(shù)。對于連續(xù)型隨機變量如果有:2.隨機變量

我們稱為X的概率分布密度函數(shù),簡稱為分布密度。1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)其中,??(??)≥0分布密度函數(shù)具有如下性質(zhì):如果X的分布密度為??(??)則記為??~??(??)1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)(1)數(shù)學(xué)期望數(shù)學(xué)期望也稱為均值,它描述隨機變量(總體)的一般水平,從計算方法上來看它是一個加權(quán)平均值。離散的隨機變量X的數(shù)學(xué)期望記為E(X)或,定義如下:3.隨機變量的數(shù)字特征其中--取x值的概率連續(xù)型隨機變量數(shù)學(xué)期望的定義如下:

其中—分布密度

1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)①如果a、b為常數(shù),則E(aX+b)=aE(X)+b,特別的E(b)=b;②如果X、Y為兩個隨機變量,則E(X+Y)=E(X)+E(Y);③如果g(x)和f(x)分別為X的兩個函數(shù),則E[g(X)+f(X)]=E[g(X)]+E[f(X)];④如果X、Y是兩個獨立的隨機變量,則E(XY)=E(X)E(Y)。數(shù)學(xué)期望具有如下性質(zhì):1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)

方差的算術(shù)平方根稱為標(biāo)準(zhǔn)差,即:方差和標(biāo)準(zhǔn)差刻畫了隨機變量取值相對于均值的分散的程度,方差或標(biāo)準(zhǔn)差的值越大說明隨機變量的取值越分散。(2)方差如果隨機變量X的數(shù)學(xué)期望E(X)存在,稱[X-E(X)]為隨機變量X的離均差或離差,顯然,隨機變量離均差的數(shù)學(xué)期望是0,即E[X-E(X)]=0隨機變量離差平方的數(shù)學(xué)期望叫隨機變量的方差,記作Var(x)或,即:3.隨機變量的數(shù)字特征①Var(c)=0②Var(c+x)=Var(x)③Var(cx)=c2Var(x)④x,y為相互獨立的隨機變量,則Var(x+y)=Var(x)+Var(y)=Var(x-y)⑤Var(x)=E(x2)-(E(x))2

方差具有以下性質(zhì)(c是常數(shù)):1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)如果X=Y,則有(3)協(xié)方差設(shè)X、Y是兩個隨機變量,定義X、Y的協(xié)方差為:3.隨機變量的數(shù)字特征相關(guān)系數(shù)的取值范圍為[-1,1],說明X與Y是正相關(guān),反之為負(fù)相關(guān)

越接近1,說明X與Y的相關(guān)程度越高,反之越低(4)相關(guān)系數(shù)描述X與Y線性相關(guān)程度可以用相關(guān)系數(shù)度量,X與Y的相關(guān)定義為:3.隨機變量的數(shù)字特征1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)

(1)正態(tài)分布,分布密度為:4.重要的理論分布

1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)記為,即它有三個重要的性質(zhì):利用這三條性質(zhì),可以查標(biāo)準(zhǔn)正態(tài)分布表得到相應(yīng)的概率。可以證明,對于任意一個正態(tài)分布都可以通過標(biāo)準(zhǔn)化變換為標(biāo)準(zhǔn)正態(tài)分布:這樣,我們可以求出任意一個正態(tài)分布所對應(yīng)的概率。1.2.3.1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)關(guān)于正態(tài)分布還有一個重要的結(jié)論:如果都是服從的獨立隨機變量,那么其線性組合也服從均值為、方差為的正態(tài)分布,即:1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)(2)分布4.重要的理論分布設(shè)z1,z2

,…,zk

是互相獨立的服從標(biāo)準(zhǔn)正態(tài)分布變量,則:服從自由度為k的分布,記為分布取決于自由度k。分布的分布密度圖像是一個右偏分布(如圖1-2),當(dāng)k的值越來越大時,分布的分布密度圖像會越來越大趨于對稱。一般認(rèn)為,當(dāng)自由度超過100時,分布近似為正態(tài)分布。

圖1-2

1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)(3)t分布4.重要的理論分布如果,,則服從t分布,記為t分布取決于自由度,形態(tài)是對稱分布,與標(biāo)準(zhǔn)正態(tài)分布近似,但比較平緩(如圖1-3),當(dāng)自由度越來越大時,趨近于標(biāo)準(zhǔn)正態(tài)分布。圖1-3

t分布與標(biāo)準(zhǔn)正態(tài)分布查t分布表可以得到給定自由度及上側(cè)面積的臨界值1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)4.重要的理論分布(4)F分布如果、,則服從自由度為k1,k2的F分布,記為,其中k1

稱為分子自由度,k2稱為分母自由度F分布取決于自由度,是右偏分布(如圖1-4)查F分布表可以得到給定自由度及上側(cè)面積的臨界值圖1-41.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)5.統(tǒng)計推斷(1)參數(shù)估計參數(shù)估計是用樣本統(tǒng)計量估計總體參數(shù)的統(tǒng)計方法。參數(shù)估計有點估計和區(qū)間估計兩種,做參數(shù)估計需要知道統(tǒng)計量的分布—抽樣分布。在參數(shù)估計中用的最多的是用樣本平均數(shù)估計總體均值,關(guān)于樣本平均數(shù)的抽樣分布的結(jié)論是中心極限定理:設(shè)總體均值為,且存在有限方差,從中抽取樣本容量為n的樣本。當(dāng)樣本容量足夠大時,樣本平均數(shù)的抽樣分布近似地服從正態(tài)分布。這個結(jié)論用數(shù)學(xué)表達(dá)式表示為:

1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)(,)5.統(tǒng)計推斷

根據(jù)中心極限定理,可以認(rèn)為樣本平均數(shù)圍繞在總體均值附近,故對于某一個樣本平均數(shù),可以認(rèn)為即是一個點估計值。在點估計的基礎(chǔ)上,給出的一個取值范圍,稱之為區(qū)間估計當(dāng)總體方差已知,大樣本,顯著性水平為時,的的置信區(qū)間是:當(dāng)總體方差未知,大樣本,顯著性水平為時,的的置信區(qū)間是:

(,)

如果是小樣本,則要求總體服從正態(tài)分布,仍然可以用式(1-16)和(1-17)進(jìn)行估計。此外,我們可以得到常用的統(tǒng)計量樣本比率、樣本方差的抽樣分布,并運用這些分布對對應(yīng)的總體比率和總體方差進(jìn)行估計。(2)假設(shè)檢驗假設(shè)檢驗也稱為“顯著性檢驗”,是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。其基本原理是先對總體的特征作出某種假設(shè),然后通過抽樣研究的統(tǒng)計推理,對此假設(shè)應(yīng)該被拒絕還是接受作出推斷。假設(shè)檢驗的邏輯方法是反證法和小概率原理,并運用樣本統(tǒng)計量的分布來進(jìn)行判斷。其基本步驟為:提出假設(shè)→建立檢驗統(tǒng)計量并確定其分布→設(shè)定顯著性水平并構(gòu)造拒絕域→根據(jù)檢驗統(tǒng)計量的值做決策。1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)假設(shè)檢驗的決策規(guī)則是:如果檢驗統(tǒng)計量的值落入拒絕域則拒絕原假設(shè),否則則不拒絕。上述決策的方法稱為臨界值法,我們還可以根據(jù)檢驗統(tǒng)計量的伴隨概率—p值進(jìn)行檢驗,決策的規(guī)則是:如果p值小于顯著性水平則拒絕原假設(shè),否則則不拒絕。限于篇幅,統(tǒng)計學(xué)的具體內(nèi)容讀者可參閱其他專門的統(tǒng)計學(xué)資料。1.5預(yù)備知識--統(tǒng)計學(xué)基礎(chǔ)第2章回歸與回歸分析第2章回歸與回歸分析掌握線性相關(guān)系數(shù)的意義及計算方法理解統(tǒng)計關(guān)系與確定性關(guān)系的意義理解總體線性回歸方程與總體回歸模型的意義理解隨機擾動項的意義理解樣本回歸方程與總體回歸模型的意義LEARNINGTARGET學(xué)習(xí)目標(biāo)最早使用“回歸”一詞的是英國遺傳學(xué)家法蘭西斯·高爾頓(FrancisGalton),他在研究父母身高與子女身高的關(guān)系時,發(fā)現(xiàn)子女身高有向平均身高“回歸”的趨向,這就是古典意義上的回歸?,F(xiàn)代意義的“回歸”已經(jīng)演變成建立回歸方程或模型研究一個隨機變量Y對另一個變量(X)或多個變量(X1,X2,…,Xk)的相互依存關(guān)系的統(tǒng)計分析方法。在經(jīng)濟領(lǐng)域,很多變量之間都存在著相互依存關(guān)系。2.1回歸的基本問題2.1回歸的基本問題【例2-1】邊際消費傾向是凱恩斯宏觀經(jīng)濟學(xué)的核心概念之一。通俗的講當(dāng)人們的收入增加時,消費支出也會增加,但消費支出增加的沒有收入增加的快,而消費支出的增加值比收入的增加就是邊際消費傾向。在這個理論中,描述了兩個經(jīng)濟變量--收入與消費之間的關(guān)系,那么兩者之間存在怎樣的關(guān)系呢?我們搜集到2020年各地區(qū)居民人均可支配收入與人均消費支出的數(shù)據(jù)(數(shù)據(jù)見教學(xué)資源data2-1,數(shù)據(jù)來源:中國統(tǒng)計年鑒2021),并繪制散點圖如下:

其中,X表示收入,Y表示消費。從圖2-1可以看出,當(dāng)X增加時,Y也在增加,并且這些散點散布在某條直線附近。于是我們可以用一條直線“近似”表示收入(X)與消費支出(Y)的關(guān)系:(2-1)而其中的斜率項系數(shù),即消費支出的增量比收入的增量,其含義是邊際消費傾向?!纠?-2】新西蘭經(jīng)濟學(xué)家W·菲利普斯根據(jù)英國近100年貨幣工資變化的百分比(Y)與失業(yè)率(X)的經(jīng)驗統(tǒng)計資料提出了一條用以表示失業(yè)率和貨幣工資變動率之間交替關(guān)系的曲線(如圖2-2)。這條曲線表明:當(dāng)失業(yè)率較低時,貨幣工資增長率較高;反之,當(dāng)失業(yè)率較高時,貨幣工資增長率較低,甚至是負(fù)數(shù)。根據(jù)成本推動的通貨膨脹理論,貨幣工資可以表示通貨膨脹率。因此,這條曲線就可以表示失業(yè)率與通貨膨脹率之間的交替關(guān)系。2.1回歸的基本問題由圖2-2,我們可以用一條雙曲線“近似”表示貨幣工資增長率(Y)與失業(yè)率(X)這兩個變量的規(guī)律性:(2-2)2.1回歸的基本問題【例2-3】經(jīng)濟理論告訴我們,影響經(jīng)濟增長的主要因素是消費、投資和凈出口,如果用GDP作為經(jīng)濟總量的代表變量,則可以用以下方程“近似”地表示這些變量的關(guān)系:(2-3)其中Y—GDP,X1—消費,X2—投資,X3—凈出口。通過以上例子可以看到,我們可以用一些我們熟知的曲線去“近似”的表示經(jīng)濟變量之間的關(guān)系,再用這些曲線的特性來對經(jīng)濟變量之間的關(guān)系做分析,這就是現(xiàn)代意義的回歸分析。但是,要進(jìn)行回歸分析,首先要進(jìn)行相關(guān)分析。2.1回歸的基本問題2.2相關(guān)分析相關(guān)分析是研究現(xiàn)象(變量)之間是否存在某種依存關(guān)系(相關(guān)關(guān)系)的一種統(tǒng)計方法,主要研究變量之間相關(guān)關(guān)系的形式、方向和密切程度。1.統(tǒng)計關(guān)系與確定性關(guān)系在我們所觀察的經(jīng)濟變量中,存在著各種各樣的關(guān)系,從整體上劃分可以分為統(tǒng)計關(guān)系和確定性關(guān)系。確定性關(guān)系是指經(jīng)濟變量之間的關(guān)系可以用精確的公式表示,如:資產(chǎn)=負(fù)債+所有者權(quán)益、銷售額=銷售量×價格等等。但是這類關(guān)系在經(jīng)濟變量之間相對較少,大部分經(jīng)濟變量之間的關(guān)系是如前面所舉例的關(guān)系—統(tǒng)計關(guān)系。2.2相關(guān)分析經(jīng)濟變量大多都是隨機變量,例如消費支出、失業(yè)率、凈出口等等,正是由于這種隨機性,導(dǎo)致經(jīng)濟變量之間很難保持確定性的關(guān)系。但是,經(jīng)濟運行存在的內(nèi)在規(guī)律性會使經(jīng)濟變量之間存在著某種“相關(guān)”,這些“相關(guān)”在實踐中被反復(fù)大量的觀察,并在某種程度上被證實,于是人們描述出這些“相關(guān)”意義,總結(jié)成相應(yīng)的經(jīng)濟理論,這些“相關(guān)”就是我們所理解的經(jīng)濟意義上的統(tǒng)計關(guān)系—相關(guān)關(guān)系。兩個變量之間存在相關(guān)關(guān)系,還需要考慮兩個變量之間的邏輯關(guān)系—因果關(guān)系,即哪個變量依賴于哪個變量。例如消費支出與收入之間的關(guān)系,一定是消費支出依賴于收入,即收入是“自變量”,消費支出是“因變量”;但是也有一些經(jīng)濟變量之間是互相依賴的,如某種商品的價格與供應(yīng)量之間的關(guān)系就是互相依賴的關(guān)系。判斷因果關(guān)系依據(jù)是相關(guān)的經(jīng)濟理論,在統(tǒng)計意義上是無法判斷的,所以在進(jìn)行相關(guān)分析時一般不區(qū)分因果關(guān)系。相關(guān)分析就是研究統(tǒng)計關(guān)系的形式、方向和密切程度的統(tǒng)計方法。為了表達(dá)問題的方便,我們約定在本書中,用大寫字母表示變量,如Y、X、X1、…、Xk等等。(1)按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)當(dāng)兩個變量之間的關(guān)系是確定性關(guān)系是,稱這兩種現(xiàn)象間的關(guān)系為完全相關(guān);當(dāng)兩個變量之間彼此互不影響,其數(shù)量變化各自獨立時,稱為不相關(guān);兩個變量之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān),一般的相關(guān)關(guān)系就是指這種不完全相關(guān)。(2)按相關(guān)的方向可分為正相關(guān)和負(fù)相關(guān)當(dāng)一個變量的數(shù)量增加(或減少),另一個變量的數(shù)量也隨之增加(或減少)時,稱為正相關(guān);反之,當(dāng)一個變量的數(shù)量增加(或減少),而另一個變量的數(shù)量向相反方向變動時,稱為負(fù)相關(guān)。2.相關(guān)關(guān)系的種類(3)按相關(guān)的形式可分為線性相關(guān)和非線性相關(guān)當(dāng)兩種相關(guān)變量之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時,稱之為線性相關(guān);如果兩種相關(guān)變量之間,并不表現(xiàn)為直線的關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。(4)按所研究的變量多少可分為簡單相關(guān)、復(fù)相關(guān)兩個變量之間的相關(guān),稱為簡單相關(guān);當(dāng)所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系時,稱為復(fù)相關(guān)。簡單線性相關(guān)關(guān)系是最簡單也是最常見的相關(guān)形式,一般用簡單線性相關(guān)系數(shù)度量這種關(guān)系的密切程度。簡單線性相關(guān)系數(shù)簡稱相關(guān)系數(shù)(correlationcoefficient),如果是根據(jù)總體全部數(shù)據(jù)計算的,則稱為總體相關(guān)系數(shù),通常記為,計算公式為:其中

變量X和Y的協(xié)方差變量X的方差變量Y的方差3.簡單線性相關(guān)關(guān)系的度量可以證明,的取值范圍為-1≤≤1;若為正,則表明兩變量為正相關(guān);若為負(fù),則表明兩變量為負(fù)相關(guān);如果=1或–1,則表明兩個變量完全相關(guān)。根據(jù)樣本數(shù)據(jù)計算的相關(guān)系數(shù)稱為樣本相關(guān)系數(shù),記為r。由于總體一般是不能全面觀測的,所以相關(guān)系數(shù)一般只能計算樣本相關(guān)系數(shù),計算公式為:(2-5)其中

變量X的平均數(shù)變量Y的平均數(shù)注意到式(2-5)中計算項都是離差,設(shè),,則有:

(2-6)式(2-6)稱為r的離差形式。r與有相同的取值范圍與意義。但是,r是由樣本數(shù)據(jù)計算得到的,其值會隨樣本的波動而波動,故r是統(tǒng)計量,我們可以用r檢驗總體是否存在相關(guān)關(guān)系??梢宰C明,在的條件下,關(guān)于r的統(tǒng)計量服從t分布:

(2-7)其中r—樣本相關(guān)系數(shù)n—樣本容量顯著性檢驗的步驟如下:1)提出假設(shè):,;2)由式(2-7)計算檢驗統(tǒng)計量的值;3)確定顯著性水平,根據(jù)給定的顯著性水平和自由度(n-2)查t分布表查構(gòu)造拒絕域;4)決策判斷:若,拒絕H0,表明總體的兩個變量之間存在顯著的線性相關(guān)關(guān)系。2.3一元線性回歸分析回歸分析是指在相關(guān)分析的基礎(chǔ)上,將變量之間的變動關(guān)系模型化,即尋找出一個能夠“近似”刻畫變量間變化關(guān)系的函數(shù)關(guān)系式,并據(jù)此“精確”的表達(dá)變量之間影響的結(jié)構(gòu)、方向和程度。通過回歸分析,可以將相關(guān)變量之間不確定、不規(guī)則的數(shù)量關(guān)系一般化、規(guī)范化,從而可以根據(jù)自變量的某一個給定值推斷出因變量的可能值(或估計值)?;貧w分析中最簡單、最基本的是一元線性回歸分析,即只考慮兩個變量之間的線性回歸。由于回歸分析要建立回歸方程,故要考慮兩個變量之間的因果關(guān)系。我們將數(shù)學(xué)意義上的自變量稱為“解釋變量”(比如X),因變量稱為“被解釋變量”或“響應(yīng)變量”(比如Y),我們要尋找的就是用X解釋Y的函數(shù)關(guān)系式。我們通過一個人為設(shè)定的例子來說明怎樣建立總體線性回歸方程與總體回歸模型。【例2-4】假設(shè)一個總體中只有100個家庭。由于這個總體非常小,我們可以對這個總體中的所有數(shù)據(jù)進(jìn)行調(diào)查。經(jīng)過調(diào)查,這100個家庭的月度收入和消費支出數(shù)據(jù)如下:1.總體線性回歸方程與回歸模型收入X4000450050005500600065007000750080008500

消費支出Y2656293131483428372239964288466146354915268729343173356437724169437946944857521426982951320235903802419244174917499955232698296532713612382042384453501552055693275429973301363638234262446450515526

282830483303365138284272458350565690

3141332036813829428547525104

315733313700385842924797

315733633708390543354839

3374372039214381

3426372339694400

3450372340114439

373240434453

378740434551

37994063

4067

4133

4231

Y的條件均值2720303133053670393643054552492851525336表2-1100個家庭收入與消費支出數(shù)據(jù)單位:元根據(jù)這些數(shù)據(jù),說明收入對消費支出影響的規(guī)律性。解:由經(jīng)濟理論可知,收入是解釋變量,消費支出是被解釋變量。從這些數(shù)據(jù)可以看出,雖然每一個收入水平對應(yīng)下的消費支出是不相同的,但平均而言當(dāng)收入增加時,消費支出也會增加。計算每一個收入水平對應(yīng)的平均消費支出,由于這個平均值是在給定的收入條件下得到的,所以稱為條件均值,一般用符號表示,如,表示在收入水平為4000元的條件下,消費支出是2720元。繪制X與Y的散點圖:圖2-3收入與消費支出的散點圖由圖(2-3)可以看出,消費支出的條件均值可以用一條直線來表示:(2-8)我們稱式(2-8)為總體線性回歸方程,因為它是一個一元一次方程,所以也稱為總體一元線性回歸方程。對于相同收入水平的家庭,消費支出并不一定相同。每個家庭的具體消費支出與其條件均值會有一個“偏差”,這個偏差記為,之所以加下標(biāo)是因為在同一個收入水平下,這樣的偏差有多個。顯然有:(2-9)由式(2-8)和(2-9)可得:(2-10)我們稱式(2-10)為總體回歸模型,它是刻畫總體真實統(tǒng)計關(guān)系的模型。由【例2-1】的分析可知,斜率項系數(shù)表示邊際消費傾向。由以上分析可知,收入對消費支出的影響可以用一元線性方程近似地來刻畫。對于總體線性回歸方程和模型我們要做如下理解和說明:第一,總體線性回歸方程是被解釋變量(Y)的條件均值與解釋變量(X)真實關(guān)系的描述,總體回歸模型是兩者統(tǒng)計關(guān)系的描述;第二,要確定總體線性回歸方程,只需確定截距項系數(shù)和斜率項系數(shù)即可,而且這些系數(shù)往往表示特定的經(jīng)濟學(xué)含義,如在消費模型中斜率項系數(shù)表示邊際消費傾向。由于在研究的同一個問題中,總體是唯一確定的,所以這些系數(shù)也是唯一確定的或者說是一種客觀存在,它們是統(tǒng)計意義上的參數(shù),稱為總體回歸系數(shù)。第三,表示在同一X水平下每一個實際Y與其條件均值的離差,這樣的偏差是一種誤差,這種誤差的形成是由隨機原因造成的,故是隨機誤差,項也稱為隨機擾動項。第四,本例完全是一個假設(shè)的總體,在實際中這樣小的總體是不存在的。我們可以設(shè)想,當(dāng)我們觀察的總體足夠大時,在同一收入水平下的消費支出數(shù)據(jù)是非常多的,它們在一個比較狹小的區(qū)域中“堆積”,會形成一個消費支出(Y)的分布,我們相信消費支出數(shù)據(jù)會在其均值附近集中,而偏差均值的數(shù)據(jù)是較少的。由于,所以根據(jù)Y的分布可以得到關(guān)于的分布,而且這兩個分布在形態(tài)上應(yīng)該是相同的。那么,這個分布的形態(tài)是怎樣的呢?我們用計算機隨機生成10000個收入水平為4000元的家庭消費支出數(shù)據(jù),這些數(shù)據(jù)以2720元為均值,繪制消費支出和隨機擾動項的直方圖??梢悦黠@看到,這個分布的形態(tài)近似的是正態(tài)分布。a)消費支出b)隨機擾動項圖2-4由10000個模擬數(shù)據(jù)生成的分布圖在模型中引入隨機擾動項的原因是復(fù)雜的,歸納起來有以下幾點:(1)隨機誤差項代表了模型中并未包括的變量的影響。例如,當(dāng)我們要研究居民的收入對消費行為的影響,即用收入(解釋變量X)解釋消費支出(被解釋變量Y)。但是從實際的經(jīng)濟活動來看,不僅僅是收入會影響消費支出,如商品的價格、營銷策略、消費者對該商品的需求狀況、需求偏好等因素都會對消費支出造成影響,我們就可以把這些影響因素用隨機擾動項來表示。(2)經(jīng)濟行為內(nèi)在的隨機性。雖然人類的經(jīng)濟行為是理性的,也不可以完全可預(yù)測,所以這些行為的結(jié)果—經(jīng)濟變量是隨機變量,這是我們做何種努力都無法精確解釋的,隨機擾動項則反映了經(jīng)濟行為中的一些內(nèi)在隨機性。(3)數(shù)據(jù)的測量誤差。一般來說消費支出的數(shù)據(jù)相對真實,但收入數(shù)據(jù)可能是有偏差的,比如有些人會夸大或隱瞞收入,有些人可能會超前消費,故與消費支出數(shù)據(jù)對應(yīng)的收入數(shù)據(jù)非??赡懿皇桥c實際情況相吻合的;另外在數(shù)據(jù)統(tǒng)計時往往會四舍五入,也會會產(chǎn)生誤差。所有這些誤差我們用隨機擾動項來表示。(4)引入隨機擾動項有利于建立比較簡單的模型。如果我們要考慮影響消費的所有因素,顯然是不現(xiàn)實的,此外模型中的解釋變量過多,會使模型變得非常復(fù)雜,讓我們無從下手,也會影響我們分析核心的影響因素。特別需要說明的是,對于“線性”可以做兩方面的理解:第一個方面的理解是,對于變量而言是線性的,即對于解釋變量(X)與被解釋變量(Y)之間是線性關(guān)系;另外一個方面理解是對于系數(shù)而言是線性的,即回歸系數(shù)()與被解釋變量(Y)之間是線性關(guān)系,而且這種線性對于我們特別重要,這在以后的內(nèi)容里會表現(xiàn)出來。例如,對變量而言是線性的,對系數(shù)而言也是線性的;對變量而言不是線性的,對系數(shù)而言是線性的;

對變量而言是線性的,對系數(shù)而言不是線性的。我們建立了總體的一元線性回歸方程和模型,只是在總體上確立了解釋變量與被解釋變量之間的關(guān)系。但是總體是不能全面觀察的,【例2-4】只是假想的一個例子。如果要實際得到解釋變量與被解釋變量之間的關(guān)系,我們要進(jìn)行抽樣,用樣本數(shù)據(jù)得到樣本回歸系數(shù),去估計總體回歸系數(shù)。仍然以【例2-4】為例。對于各個收入水平,在其中隨機抽取消費支出數(shù)據(jù),下表顯示的是其中兩個樣本結(jié)果:表2-2在100個家庭里抽樣得到的兩個結(jié)果2.樣本回歸方程與回歸模型收入X4000450050005500600065007000750080008500消費支出Y2687304833743651377244004797491755265523收入X4000450050005500600065007000750080008500消費支出Y2754295133203428413343354464510446354915樣本1樣本2對于這個問題的抽樣,我們做如下理解和解釋:第一,為了保證樣本有好的代表性,選取的收入(X)與總體的收入完全一致,所以我們認(rèn)為X的取值不是隨機的,或者說X不是隨機變量。第二,消費支出是隨機變量。第三,如果是重復(fù)抽樣,在100個家庭里抽取10個家庭做樣本,從理論上說最多可以得到10010個不同的樣本。也就是說我們可以按這樣方法抽樣,得到成千上萬個不同的樣本,表2-2里僅僅顯示了其中的兩個樣本。表2-2里僅僅顯示了其中的兩個樣本。我們將這兩個樣本的數(shù)據(jù)繪制散點圖,如圖2-5。

圖2-5兩個樣本的散點圖從兩個樣本的散點圖可以看到,收入(X)與消費支出(Y)之間近似的是一條直線,這樣我們就可以用直線來“近似”地表示這兩個變量之間的規(guī)律性。從兩個樣本的散點圖可以看到,收入(X)與消費支出(Y)之間近似的是一條直線,這樣我們就可以用直線來“近似”地表示這兩個變量之間的規(guī)律性。設(shè)定樣本回歸方程為:(2-11)我們用分別表示樣本回歸方程的截距項系數(shù)和斜率項系數(shù),稱為樣本回歸系數(shù)。這樣表示樣本回歸系數(shù),一是為了和總體回歸系數(shù)相區(qū)別,二是一般情況下在字母上加“^”表示是估計量。同樣道理,表示估計值。從本質(zhì)上來說,我們的思想是在給定的X(總體和樣本是相同的)條件下,用樣本回歸方程決定的去估計(近似)實際觀察到的,這樣的過程也稱為擬合,也稱為的擬合值。既然是的擬合值,那么兩者之間就會有誤差,這個誤差記為,稱為殘差。則有:(2-12)由式(2-11)和(2-12)可得:(2-13)式(2-13)稱為樣本回歸模型。對于樣本線性回歸方程和回歸模型做如下理解:第一,樣本線性回歸方程和回歸模型是總體線性回歸方程和模型的估計。我們認(rèn)為,樣本的解釋變量()與總體的解釋變量()是相同的;樣本的被解釋變量()是從總體被解釋變量()中抽樣得到的,是的擬合值,是總體條件均值的一個估計;樣本的殘差是總體隨機擾動項的一個估計,樣本回歸系數(shù)是總體回歸系數(shù)的一個估計。第二,我們只需要確定樣本回歸系數(shù)即可確定樣本回歸方程。第三,樣本回歸系數(shù)是統(tǒng)計量,是隨機變量。這是因為是由樣本決定的,不同的樣本得到不同的

,而樣本是隨機抽樣得到的,故的取值是隨機的,是隨機變量。第四,我們的目的是用樣本回歸系數(shù)對總體回歸系數(shù)做估計。要實現(xiàn)這個目的,需要得到對于一個抽到的特定樣本(比如表2-2中的樣本1)所確定的的值,以及它的抽樣分布與數(shù)量特征。用樣本去推斷總體,是統(tǒng)計學(xué)的基本思想。我們可以運用相應(yīng)的統(tǒng)計學(xué)知識來得到樣本回歸系數(shù)的估計值,并推斷其分布,這些問題在下一章進(jìn)行介紹。第1章中我們介紹了三種類型的數(shù)據(jù)—截面數(shù)據(jù)、時間序列數(shù)據(jù)和面板數(shù)據(jù),運用不同類型的數(shù)據(jù)可以構(gòu)建不同的模型,一般稱為截面數(shù)據(jù)模型、時間數(shù)據(jù)模型和面板數(shù)據(jù)模型,我們可以用變量的下標(biāo)來區(qū)別這些模型,例如:截面數(shù)據(jù)模型變量下標(biāo)用i表示:時間序列數(shù)據(jù)模型變量下標(biāo)用t表示:面板數(shù)據(jù)模型變量下標(biāo)用it表示:就經(jīng)典的計量經(jīng)濟學(xué)模型而言,構(gòu)建的是截面數(shù)據(jù)模型和時間序列數(shù)據(jù)模型。2.4不同類型數(shù)據(jù)構(gòu)建的模型相關(guān)分析與回歸分析是統(tǒng)計學(xué)的基本方法,也是計量經(jīng)濟學(xué)的基本內(nèi)容。判斷兩個變量是否存在相關(guān)關(guān)系的有效方法是繪制散點圖,在數(shù)量上判斷線性相關(guān)程度的指標(biāo)是相關(guān)系數(shù)?;貧w分析是建立模型來刻畫變量之間的關(guān)系,由于總體往往是不能全面觀測的,所以我們可以用抽樣的方法得到樣本,建立樣本回歸模型,去對總體對應(yīng)的參數(shù)做估計?!颈菊滦〗Y(jié)】本章的學(xué)習(xí)要深入體會其基本思想—用樣本推斷總體,正確理解總體線性方程與模型以及樣本線性回歸方程與模型所表示的意義,掌握線性相關(guān)系數(shù)的計算方法,理解其表示的意義。1.本章重點散點圖的繪制相關(guān)系數(shù)的計算總體線性方程與模型樣本線性回歸方程與模型2.本章難點相關(guān)系數(shù)的計算總體線性方程與模型樣本線性回歸方程與模型【學(xué)習(xí)建議】第3章一元線性回歸模型的估計LEARNINGTARGET學(xué)習(xí)目標(biāo)掌握普通最小二乘法(OLS)的基本原理能夠運用OLS估計一元線性回歸模型的系數(shù)了解一元線性回歸線的代數(shù)性質(zhì)理解擬合優(yōu)度的度量方法第3章一元線性回歸模型的估計3.1普通最小二乘法估計一元線性回歸模型參數(shù)的最常用、最簡潔的方法是普通最小二乘法(ordinaryleastsquares,OLS)。設(shè)總體一元線性回歸模型為:(3-1)樣本一元線性回歸模型為:

(3-2)式中,為隨機擾動項式中,為殘差項樣本回歸方程為:

(3-3)我們的目的是通過估計樣本回歸方程(3-3)得到總體線性回歸模型的系數(shù)、的估計值3.1普通最小二乘法對于一個特定的樣本數(shù)據(jù),對應(yīng)的點(

,)不一定在同一條直線上,所以這些散點會與樣本回歸直線有誤差,這些誤差就是殘差項。從理論上講,近似地表示這些樣本點的直線有無數(shù)條,我們想要求的樣本回歸直線,是一條與所有樣本數(shù)據(jù)構(gòu)成的點(

,)誤差最小的直線(這種情形稱為擬合)。假定樣本容量為n,每個點(,)與假設(shè)最佳的理論的樣本回歸直線都會有一個誤差,所以就會有n個誤差,這些誤差就是殘差,計算公式為:(3-4)圖3-1殘差的幾何意義3.1普通最小二乘法由于這樣的殘差有n個,直觀的看,要使樣本回歸直線與樣本的散點(,)之間的誤差為最小,則需要為最小

。但是,殘差的值可正可負(fù)(圖3-1只繪制了正離差的情形,負(fù)離差的情形請讀者自己繪制),求和時可以正負(fù)抵消,所以

的值會非常接近0,甚至為0。這樣,如果有兩條樣本回歸直線的殘差和都為0,我們就無法準(zhǔn)確的判斷哪一條樣本回歸直線與散點的誤差更小。為了克服這個問題,我們可以用殘差的平方和來比較回歸直線與散點誤差的大小。由于殘差平方和為非負(fù)數(shù),求和時不會正負(fù)抵消,所以,能夠使殘差平方和為最小的回歸直線,就是與散點誤差最小的直線。于是由式(3-2)、(3-3)和(3-4)得:(3-5)3.1普通最小二乘法由于樣本數(shù)據(jù)

都是已知的、確定的,所以,上式中殘差平方和的值取決于系數(shù)

、的取值。這是一個顯而易見的事實,由于

、是樣本回歸直線的截距和斜率,不同的

、對應(yīng)不同的直線,從而就有不同的殘差平方和。能夠使殘差平方和取得最小值的

、所決定的直線就是我們要求的最佳的直線。由上述分析可知,殘差平方和是關(guān)于

、的函數(shù),即:

(3-6)3.1普通最小二乘法由高等數(shù)學(xué)知識可知,函數(shù)

取得極值的必要條件是其偏導(dǎo)數(shù)為0,即:求上述兩個偏導(dǎo)數(shù)得:(3-7)(3-8)注意到

,式(3-7)、(3-8)也可以表示為:(3-9)(3-10)對式(3-9)、(3-10)進(jìn)行整理得:3.1普通最小二乘法式(3-11)和(3-12)稱為正規(guī)方程,其中n是樣本容量

。由這兩個正規(guī)方程組成的方程組是關(guān)于、的二元一次方程組,解這個方程組得:

(3-11)(3-12)

(3-13)

(3-14)我們稱用這種方法得到的為最小二乘估計量或OLS估計量,對應(yīng)的直線為OLS回歸直線。由式(3-13)和(3-14)可以看出,我們可以用樣本的觀測值計算出,由此得到的直線是最佳的直線。為了簡化計算,我們可以對上述兩個計算式進(jìn)行簡化,得:和對于最小二乘估計量(OLS估計量)、,我們要做如下一些解釋:3.1普通最小二乘法為的平均值,

(3-15)(3-16)式中,式(3-15)和式(3-16)稱為最小二乘估計量的離差形式。第一,

OLS估計量和是由給定的樣本觀測值計算得到的。第二,

OLS估計量是總體參數(shù)和的點估計值。對于不同的樣本和是統(tǒng)計量,是隨機變量。用最小二乘法可以計算得到不同的值,所以我們計算得到的是由給定樣本觀測值的特定的一個值,它是成千上萬個估計值中的一個。,便可以畫出樣本回歸直線的圖像。第三,根據(jù)給定樣本觀測值計算得到和雖然進(jìn)行了簡化,但在實際的計算過程中得到這兩個最小二乘估計量的值還是非常繁瑣的。下面我們以一個實例來說明最小二乘法估計值的計算方法。3.1普通最小二乘法【例3-1】我們以表2-2中的樣本1為例。假定我們從100個家庭中抽到一個由10個家庭組成的樣本,觀測得到他們的收入和消費數(shù)據(jù)(數(shù)據(jù)見表3-1),計算OLS估計量解:用式(3-15)和(3-16)進(jìn)行計算。用excel計算我們需要的各項數(shù)值,如表3-1所示:的值。和3.1普通最小二乘法再代入公式得:則所求的樣本回歸直線為:其圖像如圖3-2所示。圖3-2樣本回歸直線在實際運用中,我們可以用EViews軟件得到計算結(jié)果。EViews是EconometricsViews的縮寫,直譯為計量經(jīng)濟學(xué)觀察,通常稱為計量經(jīng)濟學(xué)軟件包,是專門從事數(shù)據(jù)分析、回歸分析和預(yù)測的工具,在科學(xué)數(shù)據(jù)分析與評價、金融分析、經(jīng)濟預(yù)測、銷售預(yù)測和成本分析等領(lǐng)域應(yīng)用非常廣泛。3.1普通最小二乘法2.建立工作文件在主菜單上依次點擊File/New/Workfile,將彈出一個對話框(如圖3-4所示),即選擇新建對象的類型為工作文件。在建立工作文件時,必需要設(shè)定數(shù)據(jù)性質(zhì)。由于本例數(shù)據(jù)是截面數(shù)據(jù),所以在Workfilestructuretype窗口選擇Unstructured/undated(非時序數(shù)據(jù)),在Datarange中輸入數(shù)據(jù)的個數(shù)后,點擊“OK”。如果是時間序列數(shù)據(jù),則要選擇Dated-regularfrequency,并在Dataspecification中選擇時間單位、起始期和終止期,點擊“OK”。其中時間單位有:Annual—年度、Monthly—月度、Semi-annual—半年度、Weekly—周、Quarterly—季度、Daily—日。工作文件窗口如圖3-5所示。3.1普通最小二乘法

圖3-4工作文件對話框

圖3-5工作文件窗口3.1普通最小二乘法工作文件窗口是EViews的子窗口,工作文件一建立就包含了兩個對象,一個是系數(shù)向量C(用來保存估計系數(shù)),另一個是殘差序列RESID(實際值與擬合值之差)。3.建立工作對象在工作文件窗口上選擇Objects/NewObject,彈出一個對象窗口,選擇組(Group)對象并命名,點擊“OK”,如圖3-6所示。圖3-6組對象窗口

圖3-7組文件和序列文件3.1普通最小二乘法4.輸入數(shù)據(jù)數(shù)據(jù)可以用復(fù)制/粘貼來輸入,但對應(yīng)的數(shù)據(jù)文件是與EViews兼容的文件。為了操作方便,輸入數(shù)據(jù)后可以對變量進(jìn)行重新命名,命名后可以直接關(guān)閉對象窗口,文件將自動保存,同時生成組對象中對應(yīng)的變量序列,如圖3-7所示。5.作圖在命令窗口中輸入EViews:scatxy回車,即可得到散點圖(注意,命令中橫坐標(biāo)的變量在前,縱坐標(biāo)的變量在后)。在圖窗口中點擊Name,命名,點擊“OK”,結(jié)果如圖3-8所示。圖3-8散點圖3.1普通最小二乘法4.輸入數(shù)據(jù)數(shù)據(jù)可以用復(fù)制/粘貼來輸入,但對應(yīng)的數(shù)據(jù)文件是與EViews兼容的文件。為了操作方便,輸入數(shù)據(jù)后可以對變量進(jìn)行重新命名,命名后可以直接關(guān)閉對象窗口,文件將自動保存,同時生成組對象中對應(yīng)的變量序列,如圖3-7所示。5.作圖在命令窗口中輸入EViews:scatxy回車,即可得到散點圖(注意,命令中橫坐標(biāo)的變量在前,縱坐標(biāo)的變量在后)。在圖窗口中點擊Name,命名,點擊“OK”,結(jié)果如圖3-8所示。圖3-8散點圖3.1普通最小二乘法6.估計在命令窗口中輸入EViews:lsycx回車,即可得到OLS估計值(注意命令中的順序,C表示截距項)。在方程窗口中點擊“Name”,命名,點擊“OK”,如果如表3-2所示:DependentVariable:Y

Method:LeastSquares

Date:11/22/17Time:20:48

Sample:110

Includedobservations:10

VariableCoefficientStd.Errort-StatisticProb.

C29.27273188.28240.1554720.8803X0.6624360.02936022.562510.0000R-squared0.984528

Meandependentvar4169.500AdjustedR-squared0.982594

S.D.dependentvar1010.662S.E.ofregression133.3380

Akaikeinfocriterion12.80051Sumsquaredresid142232.1

Schwarzcriterion12.86102Loglikelihood-62.00254

Hannan-Quinncriter.12.73412F-statistic509.0668

Durbin-Watsonstat2.629012Prob(F-statistic)0.000000

在這個結(jié)果中,C對應(yīng)的是截距項系數(shù)(29.27273),X對應(yīng)的是斜率項系數(shù)(0.662436),計算結(jié)果與前面手工計算的結(jié)果相同。7.保存用鼠標(biāo)單擊工作文件空白處,然后在主菜單中選擇File/Save,給文件命名,點擊“確定”。以上操作還可以用菜單命令來完成,讀者可以參閱相關(guān)文獻(xiàn)。3.2樣本回歸直線的代數(shù)性質(zhì)由OLS估計量所確定的樣本回歸直線是總體的回歸的估計結(jié)果,其具有以下代數(shù)性質(zhì):1.樣本回歸直線經(jīng)過X和Y的樣本均值,即點()在樣本回歸直線上。由式(3-16)整理得:

(3-17)即點()在樣本回歸直線上。2.估計的Y值()的均值等于實際觀測的Y的均值,即。由式(3-16)得:3.2樣本回歸直線的代數(shù)性質(zhì)由以上兩條性質(zhì),我們可以得到樣本回歸模型和方程的離差形式。用式(3-2)減式(3-17)得:則有

(3-18)

(3-19)3.2樣本回歸直線的代數(shù)性質(zhì)3.4.5.3.3擬合優(yōu)度的度量在第一節(jié)中,我們講述了怎樣用最小二乘法求出最佳的樣本回歸直線,即OLS回歸直線。在實例中,我們也求出了一條具體的樣本回歸直線,并繪制了圖像。從圖3-2可以看出,樣本回歸直線實際上是對樣本數(shù)據(jù)所決定的散點的一種近似或者逼近。既然是近似或者逼近,我們自然就會想到一個問題:怎樣度量近似的程度,或者說怎樣度量擬合的程度。這個問題就是擬合優(yōu)度的度量。3.3擬合優(yōu)度的度量在第一節(jié)中,我們講述了怎樣用最小二乘法求出最佳的樣本回歸直線,即OLS回歸直線。在實例中,我們也求出了一條具體的樣本回歸直線,并繪制了圖像。從圖3-2可以看出,樣本回歸直線實際上是對樣本數(shù)據(jù)所決定的散點的一種近似或者逼近。既然是近似或者逼近,我們自然就會想到一個問題:怎樣度量近似的程度,或者說怎樣度量擬合的程度。這個問題就是擬合優(yōu)度的度量。3.3擬合優(yōu)度的度量3.3擬合優(yōu)度的度量3.3擬合優(yōu)度的度量3.3擬合優(yōu)度的度量3.3擬合優(yōu)度的度量【例3-2】【例3-2】GDP是一國總體經(jīng)濟活動運行表現(xiàn)的概括性衡量指標(biāo),消費需求是經(jīng)濟增長的助推器。我們選取了1978~2020年我國GDP和最終消費的數(shù)據(jù)(數(shù)據(jù)見教學(xué)資源data3-2,數(shù)據(jù)來源:中國統(tǒng)計年鑒2021),來分析消費對GDP的影響程度。解:1.建立工作文件打開EViews,選擇數(shù)據(jù)類型以及起始日期和終止日期。如圖3-10所示。3.4案例分析2.輸入數(shù)據(jù)在命令窗口輸入:dataxy回車,即可快速建立Group。輸入對應(yīng)的解釋變量和被解釋變量,如圖3-11所示。3.作圖在命令窗口輸入:scatxy回車,即可得到散點圖。也可以在Group窗口中點擊View—Graph,選擇Graphtype為scatter,也可獲得散點圖,如圖3-12所示。3.4案例分析4.估計觀察散點圖發(fā)現(xiàn),樣本點近似于一條直線,于是可以考慮用一元線性回歸模型來近似表示兩個變量之間的規(guī)律性。在命令窗口中輸入命令:lsycx回車,得到樣本回歸方程如表3-3所示。3.4案例分析由回歸結(jié)果得到樣本回歸方程:這個結(jié)果說明,當(dāng)消費增加1個單位,GDP平均增加約2個單位。3.4案例分析DependentVariable:Y

Method:LeastSquares

Date:05/21/22Time:16:05

Sample:19782020

Includedobservations:43

VariableCoefficientStd.Errort-StatisticProb.

C-961.98264267.030-0.2254450.8228X1.9134050.02093991.380880.0000

R-squared0.995114Meandependentvar243766.7AdjustedR-squared0.994995S.D.dependentvar307906.7S.E.ofregression21783.36Akaikeinfocriterion22.86108Sumsquaredresid1.95E+10Schwarzcriterion22.94299Loglikelihood-489.5131Hannan-Quinncriter.22.89128F-statistic8350.465Durbin-Watsonstat1.518336Prob(F-statistic)0.000000

5.做樣本回歸直線在Group窗口中,點擊View—Graph,選擇Graphtype為scatter,F(xiàn)itlines選擇RegressiongLine,點擊“OK”即可得到如圖3-13所示的樣本回歸線。3.4案例分析【本章小結(jié)】一元線性回歸模型是最簡單的回歸模型,它是學(xué)習(xí)計量經(jīng)濟學(xué)的基礎(chǔ)性內(nèi)容,并且在很多情況下有非常廣泛的運用。學(xué)習(xí)本章內(nèi)容要正確理解模型的設(shè)定以及系數(shù)的意義;掌握用普通最小二乘法進(jìn)行估計的方法,特別是要掌握EViews的基本操作方法;掌握樣本回歸方程的代數(shù)性質(zhì);理解擬合優(yōu)度的度量。

【學(xué)習(xí)建議】本章是計量經(jīng)濟學(xué)的基礎(chǔ)內(nèi)容,在學(xué)習(xí)時要正確理解相關(guān)的基本概念,掌握基本方法,并掌握EViews的基本操作方法。1.本章重點模型的設(shè)定以及系數(shù)的意義普通最小二乘法擬合優(yōu)度的度量2.本章難點模型的設(shè)定以及系數(shù)的意義

普通最小二乘法【核心概念】模型的設(shè)定隨機擾動項殘差

普通最小二乘3.4案例分析第4章一元線性回歸模型的推斷第4章一元線性回歸模型的推斷4.1古典假定4.1古典假定4.1古典假定4.1古典假定4.2OLS估計量的統(tǒng)計性質(zhì)4.2OLS估計量的統(tǒng)計性質(zhì)4.2OLS估計量的統(tǒng)計性質(zhì)4.2OLS估計量的統(tǒng)計性質(zhì)4.2OLS估計量的統(tǒng)計性質(zhì)4.2OLS估計量的統(tǒng)計性質(zhì)4.2OLS估計量的統(tǒng)計性質(zhì)4.3參數(shù)的檢驗與區(qū)間估計在滿足古典假定的條件下,用最小二乘法得到的估計量是最佳線性無偏估計量,這是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論