線性回歸分析的基本步驟_第1頁
線性回歸分析的基本步驟_第2頁
線性回歸分析的基本步驟_第3頁
線性回歸分析的基本步驟_第4頁
線性回歸分析的基本步驟_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、步驟一、建立模型知識點:1、總體回歸模型、總體回歸方程、樣本回歸模型、樣本回歸方程總體回歸模型:研究總體之中自變量和因變量之間某種非確定依賴關(guān)系的計量模型。特點:由于隨機誤差項U的存在,使得Y和X不在一條直線/平面上。例1:某鎮(zhèn)共有60個家庭,經(jīng)普查,60個家庭的每周收入(X)與每周消費(Y)數(shù)據(jù)如下:每周收入(X)每周消費支出(Y)805560657075100657074808588120798490949814080939510310811311516010210711011611812518011011512013013514020012013614014414522013513714

2、0152157160162240137145155165175189260150152175178180185191作出其散點圖如下:總體回歸方程(線):由于假定,因此因變量的均值與自變量總處于一條直線上,這條直線就稱為總體回歸線(方程)??傮w回歸方程的求法:以例1的數(shù)據(jù)為例1)對第一個Xi,求出E(Y|Xi)。每周收入(X)每周消費支出(Y)E(Y|Xi)805560657075651006570748085887712079849094988914080939510310811311510116010210711011611812511318011011512013013514012520

3、0120136140144145137220135137140152157160162149240137145155165175189161260150152175178180185191173由于,因此任意帶入兩個Xi和其對應(yīng)的E(Y|Xi)值,即可求出,并進而得到總體回歸方程。如將代入可得:以上求出反映了E(Y|Xi)和Xi之間的真實關(guān)系,即所求的總體回歸方程為:,其圖形為:樣本回歸模型:總體通常難以得到,因此只能通過抽樣得到樣本數(shù)據(jù)。如在例1中,通過抽樣考察,我們得到了20個家庭的樣本數(shù)據(jù):每周收入(X)每周消費支出(Y)805510065701207984140809316010210

4、7110180110200120136220135137240137145260150152175那么描述樣本數(shù)據(jù)中因變量Y和自變量X之間非確定依賴關(guān)系的模型就稱為樣本回歸模型。樣本回歸方程(線):通過樣本數(shù)據(jù)估計出,得到樣本觀測值的擬合值與解釋變量之間的關(guān)系方程稱為樣本回歸方程。如下圖所示:四者之間的關(guān)系:總體回歸模型建立在總體數(shù)據(jù)之上,它描述的是因變量Y和自變量X之間的真實的非確定型依賴關(guān)系;樣本回歸模型建立在抽樣數(shù)據(jù)基礎(chǔ)之上,它描述的是因變量Y和自變量X之間的近似于真實的非確定型依賴關(guān)系。這種近似表現(xiàn)在兩個方面:一是結(jié)構(gòu)參數(shù)是其真實值的一種近似估計;二是殘差是隨機誤差項U的一個近似估計;

5、:總體回歸方程是根據(jù)總體數(shù)據(jù)得到的,它描述的是因變量的條件均值E(Y|X)與自變量X之間的線性關(guān)系;樣本回歸方程是根據(jù)抽樣數(shù)據(jù)得到的,它描述的是因變量Y樣本預(yù)測值的擬合值與自變量X之間的線性關(guān)系。:回歸分析的目的是試圖通過樣本數(shù)據(jù)得到真實結(jié)構(gòu)參數(shù)的估計值,并要求估計結(jié)果足夠接近真實值。由于抽樣數(shù)據(jù)有多種可能,每一次抽樣所得到的估計值都不會相同,即的估計量是一個隨機變量。因此必須選擇合適的參數(shù)估計方法,使其具有良好的統(tǒng)計性質(zhì)。2、隨機誤差項U存在的原因:非重要解釋變量的省略人的隨機行為數(shù)學(xué)模型形式欠妥歸并誤差(如一國GDP的計算)測量誤差等3、多元回歸模型的基本假定隨機誤差項的期望值為零隨機誤差

6、項具有同方差性隨機誤差項彼此之間不相關(guān)解釋就變量X1,X2,···,Xk為確定型變量,與隨機誤差項彼此不相關(guān)。解釋就變量X1,X2,···,Xk之間不存在精確的(完全的)線性關(guān)系,即解釋變量的樣本觀測值矩陣X為滿秩矩陣:rank(X)=k+1<n隨機誤差項服從正態(tài)分布,即:uiN(0,s2),i=1,2,···,n步驟二、參數(shù)估計知識點:1、最小二乘估計的基本原理:殘差平方和最小化。2、參數(shù)估計量: 一元回歸: 多元回歸:3、最小二乘估計量的性質(zhì)(Gauss-Markov定理):在滿足基本假設(shè)的情況

7、下,最小二乘估計量是的最優(yōu)線性無偏估計量(BLUE估計量)步驟三、模型檢驗1、經(jīng)濟計量檢驗(后三章內(nèi)容)2、統(tǒng)計檢驗擬合優(yōu)度檢驗知識點:擬合優(yōu)度檢驗的作用:檢驗回歸方程對樣本點的擬合程度:擬合優(yōu)度的檢驗方法:計算(調(diào)整的)樣本可決系數(shù),注意掌握離差平方和、回歸平方和、殘差平方和之間的關(guān)系以及它們的自由度。計算方法:通過方差分析表計算方差來源符號計算公式自由度(d.f.)均方值(MSS)離差平方和TSSn-1/n-1回歸平方和RSSk/k殘差平方和ESSn-k-1/ n-k-1例2:下表列出了三變量(二元)模型的回歸結(jié)果:方差來源平方和(SS)自由度均方值離差平方和TSS6604214回歸平方和

8、RSS65965殘差平方和ESS1) 樣本容量為多少?解:由于TSS的自由度為n-1,由上表知n-114,因此樣本容量n=15。2) 求ESS解:由于TSSESSRSS,故ESSTSSRSS773) ESS和RSS的自由度各為多少?解:對三變量模型而言,k=2,故ESS的自由度為n-k-112RSS的自由度為k24) 求解:,回歸方程的顯著性檢驗(F檢驗)目的:檢驗?zāi)P椭械囊蜃兞颗c自變量之間是否存在顯著的線性關(guān)系步驟:1、提出假設(shè):2、構(gòu)造統(tǒng)計量:3、給定顯著性水平,確定拒絕域4、計算統(tǒng)計量值,并判斷是否拒絕原假設(shè)例3:就例2中的數(shù)據(jù),給定顯著性水平,對回歸方程進行顯著性檢驗。解:由于統(tǒng)計量值

9、,又,而故拒絕原假設(shè),即在1%的顯著性水平下可以認為回歸方程存在顯著的線性關(guān)系。附:檢驗的關(guān)系:由于解釋變量的顯著性檢驗(t檢驗)目的:檢驗?zāi)P椭械淖宰兞渴欠駥σ蜃兞看嬖陲@著影響。知識點:多元回歸:,其中為中位于第i+1行和i+1列的元素;一元回歸:變量顯著性檢驗的基本步驟:1、提出假設(shè):2、構(gòu)造統(tǒng)計量:3、給定顯著性水平,確定拒絕域4、計算統(tǒng)計量值,并判斷是否拒絕原假設(shè)例4:根據(jù)19個樣本數(shù)據(jù)得到某一回歸方程如下:試在5%的顯著性水平下對變量的顯著性進行檢驗。解:由于,故t檢驗的拒絕域為。對自變量而言,其t統(tǒng)計量值為,落入拒絕域,故拒絕的原假設(shè),即在5%的顯著性水平下,可以認為自變量對因變量

10、有顯著影響;對自變量而言,其t統(tǒng)計量值為,未落入拒絕域,故不能拒絕的原假設(shè),即在5%的顯著性水平下,可以認為自變量對因變量Y的影響并不顯著?;貧w系數(shù)的置信區(qū)間目的:給定某一置信水平,構(gòu)造某一回歸參數(shù)的一個置信區(qū)間,使落在該區(qū)間內(nèi)的概率為基本步驟:1、構(gòu)造統(tǒng)計量2、給定置信水平,查表求出水平的雙側(cè)分位數(shù)3、求出的置信度為的置信區(qū)間例5:根據(jù)例4的數(shù)據(jù),求出的置信度為95%的置信區(qū)間。解:由于,故的置信度為95%的置信區(qū)間為:3、經(jīng)濟意義檢驗?zāi)康模簷z驗回歸參數(shù)的符號及數(shù)值是否與經(jīng)濟理論的預(yù)期相符。例6:根據(jù)26個樣本數(shù)據(jù)建立了以下回歸方程用于解釋美國居民的個人消費支出:其中:Y為個人消費支出(億元

11、);X1為居民可支配收入(億元);X2為利率(%)1) 先驗估計的符號;解:由于居民可支配收入越高,其個人消費水平也會越高,因此預(yù)期自變量X1回歸系數(shù)的符號為正;而利率越高,居民儲蓄意愿越強,消費意愿相應(yīng)越低,因此個從消費支出與利率應(yīng)該存在負相關(guān)關(guān)系,即應(yīng)為負。2) 解釋兩個自變量回歸系數(shù)的經(jīng)濟含義;解:表示,居民可支配收入每增加1億元,其個人消費支出相應(yīng)會增加0.93億元,即居民的邊際消費傾向MPC0.93;表示,利率提高1個百分點,個人消費支出將減少2.09億元。截距項表示居民可支配收入和利率為零時的個人消費支出為-10.96億元,它沒有明確的經(jīng)濟含義。3) 檢驗是否顯著不為1;()解:1

12、)提出假設(shè):2)構(gòu)造統(tǒng)計量:3)給定顯著性水平,查表得,故拒絕域為4)計算統(tǒng)計量值:由于則,落入拒絕域。故拒絕的原假設(shè)。即在5%的顯著性水平下,可認為邊際消費傾向MPC顯著不為1。4) 檢驗顯否顯著不為零;()解:1)提出假設(shè):2)構(gòu)造統(tǒng)計量:3)給定顯著性水平,查表得,故拒絕域為4)計算統(tǒng)計量值:由于,落入拒絕域,故拒絕原假設(shè)。即在5%的顯著性水平下,可以認為顯著異于零。5) 計算值;解:由于6) 計算每個回歸系數(shù)的標準差;解:由于7) 給出置信水平為95%的置信區(qū)間;解:由于,故置信水平為95%的置信區(qū)間為8) 對回歸方程進行顯著性檢驗;解:提出假設(shè):構(gòu)造統(tǒng)計量確定拒絕域:計算統(tǒng)計量并進行判斷:由于故拒絕原假設(shè),即在5%的顯著性水平下認為回歸方程的線性關(guān)系顯著成立。步驟四:經(jīng)濟預(yù)測點預(yù)測:可以看著是Y的條件均值和個別值的預(yù)測值,分別稱為均值預(yù)測和個值預(yù)測;性質(zhì):是和的一個無偏估計量。區(qū)間預(yù)測:均值的區(qū)間預(yù)測預(yù)測步驟:1)確定統(tǒng)計量:其中2)給定置信水平,確定的預(yù)測區(qū)間為:個值的區(qū)間預(yù)測預(yù)測步驟:1)確定統(tǒng)計量:其中2)給定置信水平,確定的預(yù)測區(qū)間為:作業(yè):為解釋某地對酒的消費,根據(jù)20年的樣本數(shù)據(jù)得到了如下回歸方程:其中:每一成年人每年對酒的消費量(升);:酒類的平均價格(元);:個人可支配收

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論