版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、古扎拉蒂計(jì)量經(jīng)濟(jì)學(xué)4人大版讀書筆記第一章 回歸分析的性質(zhì)“回歸”一詞是費(fèi)朗西斯·高爾頓在研究子女身高與父母身高的關(guān)系時(shí)提出來的,他發(fā)現(xiàn),給定父母的身高,子女的身高會(huì)趨向于或“回歸”到總?cè)丝诘钠骄砀摺Q言之,父母異常高或異常矮,其兒子的身高都會(huì)趨向于或回歸到所有男子的平均身高。統(tǒng)計(jì)關(guān)系與確定性關(guān)系的區(qū)別:先看了解什么叫確定性關(guān)系,某個(gè)應(yīng)變量確定的依賴于自變量,數(shù)學(xué)中和經(jīng)典物理學(xué)中的各種定律都是確定性的關(guān)系,比如宇宙間兩個(gè)粒子的引力離,k是比例常數(shù),給定兩個(gè)粒子質(zhì)量和他們間的距離,那么他們之間的引力隨機(jī)可以確定,而且是唯一的。而統(tǒng)計(jì)關(guān)系是不確定性的,應(yīng)變量和自變量間是統(tǒng)計(jì)依賴關(guān)系,給定
2、解釋變量的某個(gè)取值,不能預(yù)測因變量的確定取值,因?yàn)檫@時(shí)因變量的取值有著概率分布圍,所以我們說它是一個(gè)隨機(jī)變量,如農(nóng)作物的收成對氣溫、降雨量、光照條件的依賴關(guān)系是統(tǒng)計(jì)性質(zhì)的,這個(gè)性質(zhì)的意義在于影響農(nóng)作物的因素(變量)還有很多很多,無法一一辨認(rèn)出來,無論考慮的多少個(gè)解釋變量,都無法完全解釋農(nóng)作物收成這個(gè)因變量,所以它在的或隨機(jī)的變異是存在的?;貧w和因果:統(tǒng)計(jì)關(guān)系式本身不能意味著任何因果關(guān)系,回歸分析研究一個(gè)變量對另一些變量的依賴關(guān)系但他們絕不是因果關(guān)系。對于因果關(guān)系的理念,必須來自與統(tǒng)計(jì)學(xué)之外的經(jīng)驗(yàn)或者理論,比如說用經(jīng)濟(jì)學(xué)的理論來說明價(jià)格對需求變動(dòng)的影響。回歸與相關(guān)的區(qū)別:回歸區(qū)分哪個(gè)是解釋變量,
3、哪個(gè)是被解釋變量(因變量),相關(guān)不區(qū)分兩者,也就是說前者變量間是不對稱的,后者變量間是對稱的。另一方面,相關(guān)分析中的所有變量被看作都是隨機(jī)的,而回歸分析則基于以下假定:因變量是隨機(jī)的,而解釋變量是固定的或者非隨機(jī)的。給定每個(gè)x,都有很多相應(yīng)的y值(即y有一個(gè)分布圍),但不可能知道每一個(gè)y的值,所以我們用回歸線來預(yù)測y的均值第2章 回歸分析的一些基本概念1、 條件均值(條件期望值):為什么叫“條件”?因?yàn)樗麄內(nèi)Q于(條件)變量x的給定值,E(Y|Xi)讀成給定X下Y的期望值,與E(Y)的區(qū)別:E(Y)是總體的Y的均值2、 隨機(jī)或統(tǒng)計(jì)總體回歸函數(shù)(statistical PRF):E(Y|Xi)=
4、B1+B2Xi;非隨機(jī)的或確定的總體回歸函數(shù)(non-stochastic PRF):Yi=B1+B2Xi+i,i的方差記為2。3、 樣本回歸函數(shù)(SRF):Yi=b1+b2Xi;隨機(jī)樣本回歸函數(shù):Yi=b1+b2Xi+ei,各小寫字母都是總體回歸函數(shù)中對應(yīng)大寫字母的估計(jì)量。ei的方差記為,是真正的但未知的2的OLS估計(jì)量。開方的正數(shù)(公式中的符號(hào)帽改為e,其他不變)被稱為回歸估計(jì)的標(biāo)準(zhǔn)誤差(標(biāo)準(zhǔn)誤),即Y對估計(jì)的回歸線的離差的標(biāo)準(zhǔn)差,用于衡量所估計(jì)的回歸線的擬合優(yōu)度(goodness of fit)。4、 標(biāo)準(zhǔn)誤和標(biāo)準(zhǔn)差的區(qū)別(個(gè)人理解):標(biāo)準(zhǔn)誤衡量的是一個(gè)估計(jì)量的精度問題,標(biāo)準(zhǔn)誤越大,估計(jì)
5、量對真實(shí)值的估計(jì)就越不精準(zhǔn);標(biāo)準(zhǔn)差則是一組數(shù)據(jù)的離散程度的度量,標(biāo)準(zhǔn)差越大,該組數(shù)據(jù)越離散。第3章 雙變量模型:估計(jì)問題1、 最小二乘法(點(diǎn)估計(jì)):A、樣本回歸函數(shù)中使用;B、使得ei2=f(b1,b2),要使minei2,分別對b1,b2的偏導(dǎo)等于零的時(shí)候可以使得ei2最小,得出正規(guī)方程1 (可以這樣記憶:就是SRFi加和)、2(可以這樣記憶就是SRFi*Xi再加和);C、通過簡單代數(shù)運(yùn)算求得,2、 經(jīng)典線性回歸模型(CLRM):最小二乘法的基本假定(都是針對PRF而不是SPF的)假定1:回歸模型對參數(shù)而言是線性的。Yi=B1+B2Xi+i假定2:在重復(fù)抽樣中X值是固定的,即X是非隨機(jī)的。每
6、一個(gè)固定的Xi值都會(huì)有一個(gè)Y總體(即給定一個(gè)Xi值會(huì)有若干個(gè)Y值對應(yīng)),而且每次抽樣(重復(fù)抽樣)的時(shí)候Xi都是同一個(gè)值,來看Y是怎么如何取值的,這意味著我們的分析是條件回歸分析,即以回歸元X的給定值作為條件的。假定3:干擾項(xiàng)i的均值為零。E(i|Xi)=0。給定X,對應(yīng)的Y值都是圍繞其均值分布的,最終Y與其均值的離差會(huì)互相抵消,所以i的均值為零。這意味著凡是模型未包含的且歸屬于i的因素對Y的平均影響為零。假定4:同方差性或者的i方差相等。這意味著給定X值的Y總體有相同的分布或相同的方差同方差假定5:各干擾項(xiàng)之間無自相關(guān)。給定兩個(gè)X值,Xi和Xj(i不等于j),i和j的相關(guān)性為零。設(shè)想i和j正相
7、關(guān),那么Yi不僅依賴于Xi而且依賴于j,因?yàn)閖在一定程度上決定了i。假定6:Xi和i的協(xié)方差為零。干擾項(xiàng)和解釋變量X是不相關(guān)的,即可以區(qū)分Y受到的只是X的影響,而不會(huì)收到隨機(jī)干擾項(xiàng)中未納入模型的因素的影響。假定7:觀測次數(shù)n必須大于待估計(jì)的參數(shù)個(gè)數(shù)。假定8:X值要有變異性。給定一個(gè)樣本,X值不可以全是相同的。假定9:正確的設(shè)定了回歸模型。即在經(jīng)驗(yàn)分析中,模型沒有設(shè)定偏差。假定10:沒有完全的多重共線性。即解釋變量之間沒有完全的線性關(guān)系。3、 在統(tǒng)計(jì)學(xué)中一個(gè)估計(jì)量的精密度(或者可靠性)可以用它的標(biāo)準(zhǔn)誤(se)來度量。4、 最小二乘估計(jì)量的性質(zhì):高斯-馬爾可夫定理、最優(yōu)線性無偏估計(jì)(BLUE)。5
8、、 (樣本)判定系數(shù)r2:“擬合優(yōu)度”的一個(gè)度量。r2測度了在Y的總變異中由回歸模型解釋的部分所占的百分比。而r2的開平方根r則是樣本的相關(guān)系數(shù)。在對時(shí)間序列數(shù)據(jù)的回歸常能得到很高的r2值,而橫截面數(shù)據(jù)的回歸中得到r2的值較低是因?yàn)闃颖締挝坏姆稚⑿运?。?章 經(jīng)典正態(tài)線性回歸模型1、 i的正態(tài)性假定:i(0,2)2、 正態(tài)性假定下估計(jì)的性質(zhì):b1(B1,b12),b2(B2,b22)第5章 雙變量回歸:區(qū)間估計(jì)與假設(shè)檢驗(yàn)1、 B1、B2、2三個(gè)統(tǒng)計(jì)量的區(qū)間估計(jì)(運(yùn)用OLS計(jì)算得出的b1、b2、是點(diǎn)估計(jì)值):構(gòu)造t變量、B1的置信區(qū)間、B2的置信區(qū)間、構(gòu)造2變量、2的置信區(qū)間、2、 假設(shè)檢驗(yàn):
9、(1) 置信區(qū)間法:一個(gè)決策規(guī)則(2) 顯著性檢驗(yàn)法:兩個(gè)決策規(guī)則3、 顯著性檢驗(yàn)的決策語言:4、 2倍t經(jīng)驗(yàn)法則:雙側(cè)、單側(cè)5、 兩類錯(cuò)誤的相對代價(jià):6、 精確的顯著性水平p值:|t|(t=)值越大,估計(jì)的b2值越遠(yuǎn)離假設(shè)的B2值,則說明數(shù)據(jù)(樣本)越不支持虛擬假設(shè)(H0:B2=0),真實(shí)的B2不等于零就越顯著,查t表可知同樣自由度下,|t|越大,p值越小。在回歸結(jié)果中,p值與|t|成反向變動(dòng),t統(tǒng)計(jì)量的p值(即t等于多少時(shí),對應(yīng)的p值是多少)是精確的顯著性水平(),p值越小B2不等于零就越顯著。7、 P值判斷:對于雙邊檢驗(yàn),當(dāng)P值小于(給定的置信水平)時(shí)即可判斷通過t檢驗(yàn);對于單邊檢驗(yàn),當(dāng)
10、P/2值小于(給定的置信水平)時(shí),即可判斷通過t檢驗(yàn)。8、 回歸分析與方差分析:第10章 多重共線性1、 完全共線性和近似共線性:完全的多重線性關(guān)系即X間有準(zhǔn)確的線性函數(shù)關(guān)系,如下面情形:。不完全的多重共線性(近似共線性)即X間不是準(zhǔn)確的線性函數(shù)關(guān)系,而是高度相關(guān)關(guān)系,如。完全共線性的情形用ols估計(jì)各參數(shù)是不可能的,近似共線性的情形中,不管相關(guān)度有多高,只要不等于1,用ols估計(jì)各參數(shù)都是可能的。2、 注意:多重共線性僅對X變量之間的線性關(guān)系而言的,若解釋變量之間有非線性關(guān)系,比如變量X1和X12是非線性的函數(shù)關(guān)系,嚴(yán)格的講并不違反無多重共線性假定。但這種情況,X1和X12是的相關(guān)系數(shù)將會(huì)接
11、近1,那么他們的系數(shù)將很難準(zhǔn)確(即以較小的標(biāo)準(zhǔn)誤差估計(jì))。另外,由于多重共線性是對假定的非隨機(jī)的解釋變量之間的關(guān)系而言的,所以它是一種樣本現(xiàn)象,而非總體特征;多重共線性是一個(gè)程度問題而不是有無問題,有意義的程度不在于有無之間而在于它的不同的程度。3、 多重共線性的實(shí)際后果:4、 多重共線性的做題步驟:A、 根據(jù)ols結(jié)果初步判斷:觀察因變量對所有自變量回歸模型的結(jié)果,看各系數(shù)的經(jīng)濟(jì)意義是否與預(yù)期一致以及是否存在高R2和F值而部分系數(shù)小t值的情況,如果存在,則初步認(rèn)為解釋變量間存在多重共線性。B、 找出是哪些變量間存在多重共線性:對各x進(jìn)行相關(guān)系數(shù)分析,若存在兩變量間相關(guān)系數(shù)0.8的情況,則可認(rèn)
12、為此兩變量高度相關(guān)。C、 單獨(dú)回歸、輔助回歸和逐步回歸求最優(yōu)模型:Y對各自變量分別回歸(單獨(dú)回歸),對Ri2值進(jìn)行排序,選Ri2值最大的自變量作為初始回歸模型逐步引入各個(gè)X自變量進(jìn)行逐步回歸,每引入一個(gè)X自變量都要觀察其回歸結(jié)果的t值,對t值不顯著的予以剔除(剔除該X自變量)。最后僅以留下來的自變量為回歸元做最優(yōu)的回歸模型。5、 利用差分法消除多重共線性:由于多重共線性會(huì)引起各種實(shí)際后果(如3所說),在現(xiàn)實(shí)工作中,如果選取的必須變量(特別是時(shí)間序列變量)存在著多重共線性,為了提高模型的精確度,可以用差分法消除變量間的多重共線性??梢杂迷隽炕蛟鲩L率來作為變量,如Y對Xi進(jìn)行回歸,從而消除多重共線
13、性。A、 一次差分形式(增量):B、 比率變換:C、 A和B的缺陷:第11章 異方差:誤差的方差不是常數(shù)會(huì)怎么樣?1、 異方差的緣由:2、 異方差情形用ols估計(jì)后果:b2已經(jīng)不是BLUE,不是“有效的”或“最優(yōu)的”,但仍是線性的和無偏的。不是“最優(yōu)的”意味著b2在線性無偏估計(jì)量一類中不是最小方差。3、 異方差的診斷:方法多種多樣,下面僅介紹三種方法,著重掌握C。A、 問題的性質(zhì):往往根據(jù)所考慮的性質(zhì)就能判斷是否存在異方差性,例如,在儲(chǔ)蓄對收入的回歸模型中,殘差的方差隨著收入的增加而增加;又如,在打字出錯(cuò)率對訓(xùn)練時(shí)間的回歸中,殘差的方差隨訓(xùn)練時(shí)間的增多而變?。ㄟ@是由于邊錯(cuò)邊改學(xué)習(xí)模型決定的)。
14、B、 圖解法:在做題時(shí)首選的方法,a、可想利用ols的 回歸結(jié)果將對Y帽做散點(diǎn)圖,看是否呈現(xiàn)出一定的關(guān)系樣式,并確定是單調(diào)遞增、單調(diào)遞減還是復(fù)雜型;b、也可以做和解釋變量之一做散點(diǎn)圖,當(dāng)雙變量模型時(shí)結(jié)果是和a一樣的,當(dāng)多變量模型時(shí),可以根據(jù)A判斷異方差是那個(gè)變量引起的,做和該變量的散點(diǎn)圖確定是單調(diào)遞增、單調(diào)遞減還是復(fù)雜型。C、 A和B都是非正式的方法,正式的方法常用懷特檢驗(yàn):4、 異方差的修正:加權(quán)最小二乘法在實(shí)際操作中人們通常采用如下的經(jīng)驗(yàn)方法:不對原模型進(jìn)行異方差性檢驗(yàn),而是直接選擇加權(quán)最小二乘法,尤其是采用截面數(shù)據(jù)作樣本時(shí)。如果確實(shí)存在異方差,則被有效地消除了;如果不存在異方差性,則加權(quán)最小二乘法等價(jià)于普通最小二乘法5、第12章
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- IT專員崗位職責(zé)共8篇可編輯范本
- 石河子大學(xué)《新疆地理》2021-2022學(xué)年第一學(xué)期期末試卷
- 僵尸的小說6篇
- 品牌養(yǎng)生飲茶茶室投資經(jīng)營項(xiàng)目商業(yè)計(jì)劃書
- 石河子大學(xué)《企業(yè)經(jīng)營決策模擬實(shí)訓(xùn)》2021-2022學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《果樹栽培學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《大數(shù)據(jù)技術(shù)基礎(chǔ)》2023-2024學(xué)年期末試卷
- 沈陽理工大學(xué)《有限元法》2021-2022學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《文獻(xiàn)檢索與科技文寫作》2022-2023學(xué)年第一學(xué)期期末試卷
- 國有土地租賃合同協(xié)議書范本
- 2024美團(tuán)外賣服務(wù)合同范本
- 2024-2030年飛機(jī)內(nèi)部緊固件行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報(bào)告
- 2023~2024學(xué)年第一學(xué)期高一期中考試數(shù)學(xué)試題含答案
- 企業(yè)信用修復(fù)服務(wù)協(xié)議
- 部編人教版三年級語文上冊期中測試卷5份(含答案)
- 期中測評試卷(1-4單元)(試題)-2024-2025學(xué)年人教版三年級數(shù)學(xué)上冊
- 2023年國家公務(wù)員錄用考試《行測》行政執(zhí)法卷-解析
- 非遺漆扇扇子科普宣傳
- 2023年全國中學(xué)生英語能力競賽初三年級組試題及答案
- 一種基于STM32的智能門鎖系統(tǒng)的設(shè)計(jì)-畢業(yè)論文
- 部編版道德與法治九年級上冊 8.2 共圓中國夢 教學(xué)設(shè)計(jì)
評論
0/150
提交評論