兩變量線性回歸分析

上傳人：x*** IP屬地：北京上傳時(shí)間：2021-01-10 格式：PPT 頁(yè)數(shù)：49 大?。?.46MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩44頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章兩變量線性回歸分析,兩變量線性回歸模型,兩變量線性回歸模型的核心是兩個(gè)變量之間，存在著用線性函數(shù)表示的因果關(guān)系如果用Y表示因果關(guān)系中被影響或決定的變量，用X表示影響或決定Y的變量，那么兩變量線性回歸模型的核心就是線性函數(shù)Y=+X，這個(gè)線性函數(shù)的截距和斜率是兩個(gè)待定參數(shù)，是決定這個(gè)特定因果關(guān)系（或經(jīng)濟(jì)規(guī)律）的關(guān)健變數(shù) 由于計(jì)量分析是的問題導(dǎo)向的，Y應(yīng)該是與所考察問題最緊密相關(guān)的指標(biāo)；解釋變量應(yīng)該根據(jù)所研究問題的具體情況和特征，以及相關(guān)的經(jīng)濟(jì)理論和研究經(jīng)驗(yàn)等進(jìn)行判斷選擇；兩個(gè)變量關(guān)系是否直接用線性函數(shù)反映，則需要利用相關(guān)的經(jīng)濟(jì)理論和經(jīng)驗(yàn)，以及根據(jù)變量數(shù)據(jù)的分布情況進(jìn)行判斷,教材20頁(yè)圖,

2、經(jīng)濟(jì)變量關(guān)系中的隨機(jī)性（一,線性回歸分析是以經(jīng)濟(jì)變量之間存在線性的因果關(guān)系為基礎(chǔ)的，但這種因果關(guān)系不是嚴(yán)格意義上的函數(shù)關(guān)系，一個(gè)變量通常不可能被另一個(gè)經(jīng)濟(jì)變量完全精確地決定人類經(jīng)濟(jì)行為本身有隨機(jī)性一個(gè)經(jīng)濟(jì)變量總是受眾多因素的影響，雖然眾多因素的單獨(dú)影響可能較小，甚至可以忽略不計(jì)，但這些因素的總體影響是存在的，會(huì)對(duì)所考察的變量產(chǎn)生明顯的影響或擾動(dòng)，從而使只考慮兩個(gè)變量之間的函數(shù)難以嚴(yán)格成立任何函數(shù)反映經(jīng)濟(jì)變量之間的關(guān)系都只是一種簡(jiǎn)化反映，常常忽略一些高階項(xiàng)的次要部分，這種簡(jiǎn)化也會(huì)導(dǎo)致變量之間的函數(shù)關(guān)系不能嚴(yán)格成立經(jīng)濟(jì)數(shù)據(jù)來源于調(diào)查統(tǒng)計(jì)而非控制條件下的嚴(yán)格實(shí)驗(yàn)和測(cè)度，因而難免有一定的偏差

3、,經(jīng)濟(jì)變量關(guān)系中的隨機(jī)性（二,影響經(jīng)濟(jì)變量嚴(yán)格函數(shù)關(guān)系因素的存在，使得我們所研究的兩變量線性關(guān)系，實(shí)際上都是有一定隨機(jī)性的隨機(jī)函數(shù)關(guān)系，應(yīng)該表示為Y=+X+ 兩個(gè)變量的隨機(jī)線性函數(shù)由兩部分組成一部分由嚴(yán)格的線性函數(shù)E（Y）= +X構(gòu)成，我們稱之為兩變量關(guān)系的趨勢(shì)部分，也稱為總體回歸直線，是兩變量關(guān)系的主要方面，也是我們研究的主要目標(biāo)和對(duì)象另一部分是隨機(jī)誤差項(xiàng)，代表了影響Y的各種較小因素的綜合影響，是兩變量關(guān)系中的次要方面,模型的假設(shè),變量X和Y之間的函數(shù)關(guān)系Y=+X+，對(duì)兩變量的所有觀察數(shù)據(jù)組（i=1,n）都成立，其中為隨機(jī)誤差項(xiàng) 對(duì)應(yīng)每組變量觀測(cè)數(shù)據(jù)的誤差項(xiàng) ，都為零均值的隨機(jī)變量，

4、即對(duì) i=1,n 都成立誤差項(xiàng) 的方差為常數(shù)，即對(duì)i=1,n 都成立對(duì)應(yīng)不同觀測(cè)值數(shù)據(jù)組的誤差項(xiàng)不相關(guān)，即對(duì)任意的i j都成立解釋變量X是確定性變量，而非隨機(jī)變量誤差項(xiàng) 服從正態(tài)分布,零均值,零均值是線性回歸模型最基本的假設(shè)，它是兩變量線性隨機(jī)函數(shù)的本質(zhì)特征，是識(shí)別這種關(guān)系的根本標(biāo)準(zhǔn) 識(shí)別變量之間的隨機(jī)函數(shù)關(guān)系，只能根據(jù)平均情況或概率分布來進(jìn)行如果兩個(gè)變量的關(guān)系中確實(shí)線性函數(shù)是主導(dǎo)的，誤差項(xiàng)只是次要的隨機(jī)擾動(dòng)因素，那么Y的個(gè)別觀測(cè)會(huì)因?yàn)殡S機(jī)擾動(dòng)偏離線性函數(shù)規(guī)定的基本趨勢(shì)，但如果對(duì)同樣的X多次重復(fù)觀測(cè)對(duì)應(yīng)的Y值，則Y值的概率均值應(yīng)該能消除隨機(jī)擾動(dòng)的影響，符合線性函數(shù)的基本趨勢(shì) 該

5、標(biāo)準(zhǔn)可等價(jià)地表示為對(duì) i=1,n 都成立，也就是被解釋變量的期望值始終落在總體回歸直線上，是參數(shù)估計(jì)方法有有效性和良好性質(zhì)的必要保證,26頁(yè)圖2-3,同方差,誤差項(xiàng)的方差反映誤差項(xiàng)作為隨機(jī)函數(shù)的分布分散程度同方差假設(shè)的意義是對(duì)于不同觀測(cè)數(shù)據(jù)組，誤差項(xiàng)的發(fā)散趨勢(shì)相同，或有相同形狀的概率密度函數(shù) 如果的方差隨i變化而變化，就意味著這部分因素對(duì)被解釋變量的影響力度會(huì)隨著i而變化，因此就不能再理解為一些微小的可以忽略的隨機(jī)擾動(dòng)因素的影響同方差假設(shè)排除模型誤差項(xiàng)對(duì)被解釋變量影響程度的變化，對(duì)保證線性回歸分析的性質(zhì)和價(jià)值，有非常重要的作用,26頁(yè)圖2-4,無自相關(guān),無自相關(guān)假設(shè)的意義是對(duì)應(yīng)不同觀測(cè)

6、值的誤差項(xiàng)之間沒有相關(guān)性。如果這一點(diǎn)不成立，則意味著調(diào)養(yǎng)項(xiàng)的取值變化存在某種規(guī)律性，這與模型認(rèn)為誤差項(xiàng)只是沒有規(guī)律的微小隨機(jī)因素的綜合影響的思想不符當(dāng)誤差項(xiàng)之間存在相關(guān)性時(shí)，會(huì)對(duì)線性回歸分析的效果產(chǎn)生不利的影響同時(shí)滿足零均值、同方差、無自相關(guān)三條假設(shè)的隨機(jī)誤差項(xiàng)，有時(shí)也稱為“球形擾動(dòng)項(xiàng),解釋變量是確定性變量,解釋變量X是確定性變量而不是隨機(jī)變量的假設(shè)，在于方便線性回歸分析的討論和證明；這個(gè)假設(shè)不成立時(shí)，雖然多數(shù)情況下參數(shù)估計(jì)和相關(guān)的統(tǒng)計(jì)分析仍然有效，但證明比較困難當(dāng)X既是隨機(jī)變量又與誤差項(xiàng)有強(qiáng)相關(guān)性時(shí)，回歸分析的有效性和價(jià)值會(huì)受到嚴(yán)重影響這條假設(shè)有很大的人為性，因?yàn)閄作為一個(gè)經(jīng)濟(jì)變量，

7、也是不可重復(fù)的調(diào)查統(tǒng)計(jì)數(shù)據(jù)，而且也必然有觀測(cè)誤差。由于我們研究的是X決定Y的因果關(guān)系，可以認(rèn)為X是可以任意選擇的確定性變量，只有Y是隨機(jī)的可以證明，只要X與誤差項(xiàng)沒有多在的相關(guān)性，X是否是隨機(jī)變量一般并不會(huì)影響參數(shù)估計(jì)的性質(zhì)和相關(guān)的統(tǒng)計(jì)分析,誤差項(xiàng)服從正態(tài)分布,誤差項(xiàng) 服從正態(tài)分布是參數(shù)估計(jì)量分布性質(zhì)和相關(guān)統(tǒng)計(jì)推斷的基礎(chǔ) 實(shí)際上只要變量關(guān)系確定滿足線性回歸分析的基本思想，其誤差項(xiàng)代表許多微小擾動(dòng)因素的綜合，那么根據(jù)中心極限定理，誤差項(xiàng)服從正態(tài)分布是很自然的誤差項(xiàng)服從正態(tài)分布在進(jìn)行參數(shù)估計(jì)時(shí)并一定需要，除了會(huì)對(duì)統(tǒng)計(jì)檢驗(yàn)和推斷造成一定影響外，也不會(huì)影響最小二乘估計(jì)量的基本性質(zhì)，因此有時(shí)誤差項(xiàng)服

8、從正態(tài)分布并不作為線性回歸分析模型的基本假設(shè)，線性回歸分析中的“古典假設(shè)”中也不包括它回歸模型假設(shè)目的是為了明確回歸分析的對(duì)象，方便分析，以及保證回歸分析的性質(zhì)和價(jià)值,參數(shù)估計(jì)的基本思路（一,雖然設(shè)定兩變量線性回歸模型的前提是相信兩變量之間確實(shí)存在特定的線性因果關(guān)系，模型兩個(gè)參數(shù)和的“真實(shí)值”是客觀存在的因?yàn)槲覀儫o法觀察到變量關(guān)系本身，我們能觀察到的只是這種變量關(guān)系所產(chǎn)生的結(jié)果，即有關(guān)的經(jīng)濟(jì)現(xiàn)象或經(jīng)濟(jì)數(shù)據(jù)，因而我們不可能知道這些真實(shí)值由于存在隨機(jī)擾動(dòng)因素的影響，我們所觀察到的結(jié)果，不可能精確地反映變量關(guān)系中趨勢(shì)部分的確實(shí)情況，也就是參數(shù)和的“真實(shí)值”，隨機(jī)擾動(dòng)項(xiàng)給兩變量的真實(shí)關(guān)系提供了一

9、種“掩護(hù)”，便我們無法發(fā)現(xiàn)它的廬山真面目。由于擾動(dòng)項(xiàng)影響始終存在，因此即使增加觀測(cè)數(shù)據(jù)也并不能解決問題,參數(shù)估計(jì)的基本思路（二,由于我們無法知道參數(shù)的真實(shí)值，因此我們的目標(biāo)定在找出它的某種近似值或估計(jì)值，并且希望估計(jì)值與真實(shí)值之間的近似程度能夠比較高；更進(jìn)一步的問題是，既然參數(shù)的真實(shí)值無法知道，那么我們找到一個(gè)估計(jì)值后，如何認(rèn)定它是真實(shí)值的較好近似，或在兩個(gè)估計(jì)值中，如何判斷哪個(gè)更好？解決這些問題的基本思路是，利用樣本數(shù)據(jù)反映出來的趨勢(shì)性設(shè)法確定參數(shù)估計(jì)值，以與樣本趨勢(shì)的擬合程度作為選擇回歸直線、判斷參數(shù)估計(jì)好壞的標(biāo)準(zhǔn) 用擬合樣本趨勢(shì)的回歸直線，或者稱“樣本回歸直線”，近似模型的總體回歸直線

10、，從而得到模型參數(shù)的估計(jì)值，這利方法是線性回歸分析的基本方法,樣本趨勢(shì)的擬合和回歸殘差（一,29頁(yè)圖,樣本趨勢(shì)的擬合和回歸殘差（二,建立判斷回歸直線對(duì)樣本趨勢(shì)擬合程度的標(biāo)準(zhǔn)，關(guān)健是要利用樣本點(diǎn)與回歸直線之間的縱向偏差，我們把這種偏差稱為“回歸殘差”或者簡(jiǎn)稱“殘差” 如果樣本回歸直線為Y=a+bX，那么由于Y和X之間真實(shí)關(guān)系是隨機(jī)線性函數(shù)關(guān)系，因此通常多數(shù)樣本點(diǎn) 不會(huì)落在這條回歸直線上，它們與回歸直線之間有一段縱向距離，也就是殘差 (i=1,2,n)。殘差越小，說明回歸直線離樣本點(diǎn)越近，如果對(duì)所有樣本點(diǎn)的回歸都較小，那么回歸直線離所有樣本點(diǎn)都較近，對(duì)樣本趨勢(shì)的擬合當(dāng)然就是較好，因此殘差是判斷

11、回歸直線擬合程度的重要指標(biāo),最小二乘法,最小二乘法的思想是用殘差序列的平方和作為衡量回歸直線與樣本趨勢(shì)總體擬合程度的指標(biāo) 殘差平方和可以避免殘差正負(fù)抵消問題，反映了所有樣本點(diǎn)與回歸直線偏差的總體水平，在計(jì)算估計(jì)值的數(shù)學(xué)運(yùn)算上比較方便在兩變量線性回歸模型的基本假設(shè)滿足的情況下，最小二乘法得到的參數(shù)估計(jì)具有許多好的性質(zhì)，是對(duì)參數(shù)真實(shí)值的良好近似,最小二乘法,最小二乘直線的性質(zhì),回歸直線通過Y和X的樣本均值估計(jì)的Y（即）的均值等于Y實(shí)現(xiàn)觀測(cè)值的均值殘差均值為零殘差與解釋變量不相關(guān) 殘差與估計(jì)的不相關(guān),最小二乘估計(jì)量的性質(zhì)線性性,最小二乘估計(jì)量的性質(zhì)無偏性,最小二乘估計(jì)量的性質(zhì)有效性,證

12、明最小二乘估計(jì)具有最小方差性的思路是，先假設(shè)a和b是和的任意其它線性無偏估計(jì)，然后設(shè)法證明a和b的方差Vara、Varb，與a和b的方差Vara、Varb之間，滿足VaraVara和VarbVarb兩個(gè)不等式 b是的線性無偏估計(jì)，設(shè)b是的線性無偏估計(jì)，則有,最小二乘估計(jì)量的性質(zhì)有效性,最小二乘估計(jì)量的性質(zhì)有效性,一致估計(jì),最小二乘估計(jì)具有重要的大樣本性質(zhì)：當(dāng)樣本容量不斷增大時(shí)，最小二乘估計(jì)量以參數(shù)真實(shí)值為極限,一致估計(jì),一致估計(jì),最小二乘估計(jì)的一致性，說明在大樣本的情況下，最小二乘估計(jì)與參數(shù)真實(shí)值的近似程度會(huì)很高一致性提供了如何逼近參數(shù)真實(shí)值的思路，那就是增加樣本容量，從更多的樣本中得到更

13、多的信息雖然在對(duì)現(xiàn)實(shí)問題的實(shí)證研究中，增加樣本容量不是很容易的事，但至少存在隨著信息增加而不斷提高估計(jì)精確度的可能性,回歸擬合度評(píng)價(jià)和決定系數(shù),回歸擬合度或擬合度，是回歸直線與樣本數(shù)據(jù)趨勢(shì)的吻合程度。擬合度取決于回歸分析的方法和樣本數(shù)據(jù)的分布決定樣本數(shù)據(jù)分布情況的，一方面是生成它們的變量關(guān)系，另一方面是隨機(jī)擾動(dòng)因素的情況。如果隨機(jī)擾動(dòng)項(xiàng)比較正常，也就是基本滿足模型的假設(shè)，那么樣本數(shù)據(jù)分布情況的變化和差異，則主要是由變量之間的關(guān)系決定變化關(guān)系是否符合模型所假設(shè)的情況，必然會(huì)在樣本數(shù)據(jù)的分布中反映出來，并進(jìn)而會(huì)影響回歸直線的擬合程度。因此回歸擬合度實(shí)際上也是反映模型假設(shè)的變量關(guān)系真實(shí)性的指標(biāo)

14、，可以作為檢驗(yàn)?zāi)Ｐ妥兞筷P(guān)系真實(shí)性的重要手段,回歸擬合度評(píng)價(jià)和決定系數(shù),既然根據(jù)模型的基本假設(shè)，Y和X之間的線性關(guān)系是主要關(guān)系，X是以線性方式?jīng)Q定Y的最主要因素，那么Y的離差就應(yīng)該主要被回歸值的離差，或X的離差決定，因此我們可以在回歸分析的基礎(chǔ)上，用Y的離差被回歸值或X的離差決定的程度，作為評(píng)價(jià)擬合程度的標(biāo)準(zhǔn) 根據(jù)最小二乘估計(jì)和回歸殘差的相關(guān)公式，Y的離差可以分解為,回歸擬合度評(píng)價(jià)和決定系數(shù),回歸擬合度評(píng)價(jià)和決定系數(shù),統(tǒng)計(jì)推斷,根據(jù)最小二乘估計(jì)量的分布性質(zhì)，對(duì)兩變量線性回歸模型的參數(shù)及它們對(duì)應(yīng)的變量關(guān)系，作統(tǒng)計(jì)推斷分析統(tǒng)計(jì)推斷分析，對(duì)于進(jìn)一步判斷模型假設(shè)的變量關(guān)系的真實(shí)性，以及如何進(jìn)一步修改模

15、型的思路，具有非常重要的意義當(dāng)我們所分析的線性回歸模型與特定的經(jīng)濟(jì)理論有內(nèi)在聯(lián)系時(shí)，本節(jié)所提出的一些假設(shè)檢驗(yàn)，實(shí)際上也是檢驗(yàn)這些經(jīng)濟(jì)理論正確性的重要方法,最小二乘估計(jì)量的分布性質(zhì)和標(biāo)準(zhǔn)化,根據(jù)最小二乘估計(jì)量的性質(zhì)，在模型假設(shè)條件下，模型參數(shù)的最小二乘估計(jì)量，服從以參數(shù)真實(shí)值為中心，以誤差項(xiàng)方差的一個(gè)比例（或倍數(shù)）為方差的正態(tài)分布,最小二乘估計(jì)量的分布性質(zhì)和標(biāo)準(zhǔn)化,正是因?yàn)樽钚《斯烙?jì)量具有以參數(shù)真實(shí)值為均值的分布性質(zhì)，使得參數(shù)估計(jì)量與真實(shí)值通過概率分布聯(lián)系在一起，使我們可以通過參數(shù)估計(jì)量的分布性質(zhì)推斷參數(shù)真實(shí)值的情況，并進(jìn)行相關(guān)的統(tǒng)計(jì)檢驗(yàn)和分析，以進(jìn)一步確定變量關(guān)系或檢驗(yàn)相關(guān)的理論我們可以

16、通過變換將b轉(zhuǎn)化為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量Zb，a也可以作類似的變換,誤差項(xiàng)方差的估計(jì),誤差項(xiàng)的方差2的真實(shí)值我們是無法知道的，因此我們只能設(shè)法得到它的較好的估計(jì)值 i有一個(gè)自然的近似，即最小二乘估計(jì)的回歸殘差ei，因此不難想到用殘差平方和的均值，作為2的估計(jì)量如果考慮到一個(gè)好的估計(jì)量應(yīng)該具有無偏估計(jì)的性質(zhì)，就應(yīng)該對(duì)初步考慮的估計(jì)量作進(jìn)一步的考察。事實(shí)上可以證明，在模型假設(shè)成立的條件下，最小二乘殘差平方和的數(shù)學(xué)期望E（ei2）=(n-2) 2 把S2= ei2/ （n-2）作為2的估計(jì)量，就是具有無偏性的較好的估計(jì)量,誤差項(xiàng)方差的估計(jì),誤差項(xiàng)方差的估計(jì),參數(shù)的置信區(qū)間和假設(shè)檢驗(yàn),有了最小二

17、乘估計(jì)量的分布性質(zhì)，我們便可以對(duì)模型的情況和真實(shí)性作進(jìn)一步的推斷分析推斷分析包括兩方面內(nèi)容：一是參數(shù)真實(shí)值的可能范圍，即所謂的“置信敬意”或敬意估計(jì)問題二是對(duì)參數(shù)的顯著性（對(duì)應(yīng)變量關(guān)系的存在等），以及參數(shù)取特定值的可能性等進(jìn)行檢驗(yàn)和分析,參數(shù)的置信區(qū)間,參數(shù)的置信區(qū)間,以置信度為95%，即顯著性水平=0.05為例根據(jù)樣本容量n和顯著性水平=0.05，查t分布臨界值表，得到自由度為n-2，顯著性水平=0.05的雙側(cè)t分布臨界值t/2=t0.025（如n=10， =0.05， t/2=t0.025=2.306）根據(jù)雙側(cè)t分布臨界值的意義，有,模型參數(shù)的假設(shè)檢驗(yàn),根據(jù)最小二乘估計(jì)量的分布性質(zhì)構(gòu)造的t統(tǒng)計(jì)量可以用來進(jìn)行區(qū)間估計(jì)，并且可對(duì)模型參數(shù)（實(shí)質(zhì)上就是變量關(guān)系）進(jìn)行各種假設(shè)檢驗(yàn) 構(gòu)造原假設(shè)H0：=0.3，備擇假設(shè)H1：0.3 如根據(jù)樣本數(shù)據(jù)計(jì)算結(jié)果，已知b=0.5091，SE(b)=0.0357，n=10， =0.05， t/2=t0.025=2.306，則 P0.2177b0.3823=0.95 由于估計(jì)值b=0.5091不在區(qū)間0.2177，0

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

兩變量線性回歸分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

兩變量線性回歸分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔