版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第六章回歸分析討論問題:影響城市公交規(guī)模的因素人口數(shù)量;
居民消費(fèi)水平;
公交管理水平;
公交服務(wù)質(zhì)量;
其他交通工具情況;
公交設(shè)施的先進(jìn)性;
票價(jià);
出行者心理因素;
……
回歸分析是研究事物的相互關(guān)系、測定它們聯(lián)系的緊密程度、揭示其變化的具體形式和規(guī)律性的統(tǒng)計(jì)方法,是構(gòu)造各種經(jīng)濟(jì)模型、進(jìn)行結(jié)構(gòu)分析、政策評價(jià)、預(yù)測和控制的重要工具。第六章回歸分析第一節(jié)引言第二節(jié)一元線性回歸模型
第三節(jié)多元線性回歸模型第四節(jié)非線性回歸模型本章小結(jié)主要內(nèi)容第六章回歸分析第六章回歸分析回歸是研究自變量與因變量之間的關(guān)系形式的分析方法。一、回歸分析的提出
回歸分析起源于生物學(xué)研究,是由英國生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾登(FrancisGalton1822-1911)在19世紀(jì)末葉研究遺傳學(xué)特性時(shí)首先提出來的。
高爾登在1889年發(fā)表的著作《自然的遺傳》中,提出了回歸分析方法以后,很快就應(yīng)用到經(jīng)濟(jì)領(lǐng)域中來,而且這一名詞也一直為生物學(xué)和統(tǒng)計(jì)學(xué)所沿用。第一節(jié)引言
第六章回歸分析
二、回歸分析和相關(guān)分析函數(shù)關(guān)系
函數(shù)關(guān)系反映客觀事物之間存在著嚴(yán)格的依存關(guān)系。在這種關(guān)系中,當(dāng)一個(gè)或幾個(gè)變量取值一定時(shí),另一個(gè)變量有確定的值與之相對應(yīng),并且這種關(guān)系可以用一個(gè)確定的數(shù)學(xué)表達(dá)式反映出來。 一般把作為影響因素的變量稱為自變量,把發(fā)生對應(yīng)變化的變量稱為因變量。第一節(jié)引言
第六章回歸分析
【如】:某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p
x(p為單價(jià));圓的面積(S)與半徑之間的關(guān)系可表示為S=
R2
。企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)
、單位產(chǎn)量消耗(x2)
、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3
第一節(jié)引言
第六章回歸分析相關(guān)關(guān)系
相關(guān)關(guān)系反映的是客觀事物之間的非嚴(yán)格、不確定的線性依存關(guān)系。這種線性依存關(guān)系有兩個(gè)顯著的特點(diǎn):
①客觀事物之間在數(shù)量上確實(shí)存在一定的內(nèi)在聯(lián)系。表現(xiàn)在一個(gè)變量發(fā)生數(shù)量上的變化,要影響另一個(gè)變量也相應(yīng)地發(fā)生數(shù)量上的變化。
②客觀事物之間的數(shù)量依存關(guān)系不是確定的,具有一定的隨機(jī)性。表現(xiàn)在當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之對應(yīng)的另一個(gè)變量可以取若干個(gè)不同的數(shù)值。這種關(guān)系雖然不確定,但因變量總是遵循一定規(guī)律圍繞這些數(shù)值的平均數(shù)上下波動(dòng)。第一節(jié)引言
第六章回歸分析【如】:商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系;商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系;糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系;收入水平(y)與受教育程度(x)之間的關(guān)系;父親身高(y)與子女身高(x)之間的關(guān)系;第一節(jié)引言
第六章回歸分析回歸分析與相關(guān)分析的關(guān)系
相關(guān)分析
相關(guān)分析是研究兩個(gè)或兩個(gè)以上隨機(jī)變量之間線性依存關(guān)系的緊密程度。通常用相關(guān)系數(shù)表示,多元相關(guān)時(shí)用復(fù)相關(guān)系數(shù)表示。回歸分析
回歸分析是研究某一隨機(jī)變量(因變量)與另外一個(gè)或幾個(gè)普通變量(自變量)之間的數(shù)量變動(dòng)的關(guān)系。由回歸分析求出的關(guān)系式,稱為回歸模型。
第一節(jié)引言
第六章回歸分析1、區(qū)別:(1)相關(guān)分析所研究的兩個(gè)變量是對等關(guān)系;回歸分析所研究的兩個(gè)變量不是對等關(guān)系。(2)對兩個(gè)變量x和y來說,相關(guān)分析只能計(jì)算出一個(gè)相關(guān)系數(shù);回歸分析有時(shí)可根據(jù)研究目的分別建立兩個(gè)不同的回歸方程。(3)相關(guān)分析對資料的要求是,兩個(gè)變量都必須是隨機(jī)變量,而回歸分析對資料的要求是,自變量是可控變量,因變量是隨機(jī)變量。
2、聯(lián)系(1)相關(guān)分析是回歸分析的基礎(chǔ)和前提。(2)回歸分析是相關(guān)分析的深入和繼續(xù)。第一節(jié)引言
第六章回歸分析三、回歸模型的種類相關(guān)關(guān)系按表現(xiàn)形態(tài)分按涉及因素多少分正相關(guān)負(fù)相關(guān)按相關(guān)變化方向分按相關(guān)程度分單相關(guān)復(fù)相關(guān)完全相關(guān)不完全相關(guān)直線相關(guān)曲線相關(guān)無相關(guān)相關(guān)關(guān)系種類第一節(jié)引言
第六章回歸分析a.完全正線性相關(guān)
b.完全負(fù)線性相關(guān)
c.非線性相關(guān)
d.正線性相關(guān)
f.不相關(guān)
e.負(fù)線性相關(guān)相關(guān)關(guān)系類型第一節(jié)引言
第六章回歸分析根據(jù)自變量的多少
回歸模型可以分為一元回歸模型和多元回歸模型。
根據(jù)回歸模型的形式線性與否
回歸模型可以分為線性回歸模型和非線性回歸模型。根據(jù)回歸模型是否帶有虛擬變量
回歸模型可以分為普通回歸模型和帶虛擬變量的回歸模型。
此外,根據(jù)回歸模型是否用滯后的因變量作自變量,回歸模型又可分為無自回歸現(xiàn)象的回歸模型和自回歸模型。
回歸模型的種類第一節(jié)引言
第六章回歸分析
補(bǔ)充:相關(guān)關(guān)系的判斷(一)定性判斷:根據(jù)對客觀事物的定性認(rèn)識判斷。(二)相關(guān)表判斷:將現(xiàn)象之間的相關(guān)關(guān)系用表格來反映。
[例]:某煉鋼廠進(jìn)行鋼液最初含碳量和冶煉時(shí)間關(guān)系測定,下表是10個(gè)爐次的鋼液最初含碳量和冶煉時(shí)間試驗(yàn)結(jié)果。表10個(gè)爐次鋼液初始含碳量和冶煉時(shí)間試驗(yàn)結(jié)果表爐次12345678910最初含碳量(%)x0.91.01.21.41.51.61.71.81.92.0冶煉時(shí)間(分)y100105130145170175190190220235
由上表可看出,最初含碳量和冶煉時(shí)間呈正相關(guān)關(guān)系。第一節(jié)引言
第六章回歸分析
(三)散點(diǎn)圖判斷:也稱散布圖,是將現(xiàn)象之間的關(guān)系用圖像來表示的方法。
(四)相關(guān)系數(shù)法:通過計(jì)算相關(guān)系數(shù)判斷相關(guān)的方法。
1、相關(guān)系數(shù)(1)概念:是測定兩個(gè)變量x與y之間是否存在線性相關(guān)關(guān)系,及其相關(guān)方向和密切程度的數(shù)量指標(biāo)。常用r表示。例上表的散點(diǎn)圖:第一節(jié)引言
第六章回歸分析(2)計(jì)算方法:用積差法(Pearson相關(guān)系數(shù),CORREL函數(shù))上式也可簡化為:第一節(jié)引言
第六章回歸分析
(3)相關(guān)系數(shù)的性質(zhì):
1)r
的取值范圍是[-1,1];2)|r|=1,完全相關(guān);r=1,完全正相關(guān);r=-1,完全負(fù)相關(guān);3)r=0,不存在線性相關(guān)(不一定無其它相關(guān));4)-1
r<0,為負(fù)相關(guān);0<r
1,為正相關(guān);5)|r|越趨于1表示關(guān)系越密切,越趨于0表示關(guān)系越不密切;6)在實(shí)際應(yīng)用中的標(biāo)準(zhǔn):
|r|
<0.3為無相關(guān);0.3≤|r|
<0.5為低度相關(guān);
0.5≤|r|
<0.8為顯著相關(guān);|r|≥0.8為高度相關(guān)。第一節(jié)引言
第六章回歸分析【例】計(jì)算工業(yè)總產(chǎn)值與能源消耗量之間的相關(guān)系數(shù)。
資料結(jié)論:工業(yè)總產(chǎn)值與能源消耗量之間存在高度的正相關(guān)關(guān)系。第六章回歸分析(4)相關(guān)系數(shù)的顯著性檢驗(yàn)用t檢驗(yàn)法,基本步驟為:第一步,提出假設(shè),H0:ρ(總體相關(guān)系數(shù))=0H1:ρ≠0H0
為真時(shí),t~t(n-2)第二步,確定統(tǒng)計(jì)量,第三步,根據(jù)給定的顯著性水平α,查t分布表,找到相應(yīng)的臨界值第四步,判斷,若拒絕H0,表示r在統(tǒng)計(jì)上是顯著的,即X與Y間存在顯著相關(guān)關(guān)系;若接受H0,表示r在統(tǒng)計(jì)上是不顯著的,即X與Y間不存在顯著相關(guān)關(guān)系。第一節(jié)引言
第六章回歸分析【例】檢驗(yàn)工業(yè)總產(chǎn)值與能源消耗量之間的線性相關(guān)性是否顯著。(α=0.05)當(dāng)成立時(shí),則統(tǒng)計(jì)量資料第六章回歸分析第二節(jié)一元線性回歸模型
設(shè)隨機(jī)變量y與一個(gè)非隨機(jī)變量x之間存在某種相關(guān)關(guān)系,對于x的取定的一組不完全相同的值x1,x2,…,xn,作獨(dú)立實(shí)驗(yàn)得到n對觀察結(jié)果(x1,y1),(x2,y2),…,(xn,yn)其中,yi是x=xi處對隨機(jī)變量y觀察的結(jié)果,這n對觀察結(jié)果就是一個(gè)容量為n的樣本。
一、散點(diǎn)圖如下圖第六章回歸分析國內(nèi)生產(chǎn)總值y與固定資產(chǎn)投資完成額x間關(guān)系的散點(diǎn)圖第二節(jié)一元線性回歸模型第六章回歸分析
設(shè)x為自變量,y為因變量,y與x之間存在某種線性關(guān)系,即一元線性回歸模型為
(6.2.1)
二、一元線性回歸模型式中:x是自變量,y是因變量;a、b是待定參數(shù)。ε是隨機(jī)誤差項(xiàng),是各隨機(jī)因素對y的影響的總和。ε~N(0,σ2)第二節(jié)一元線性回歸模型第六章回歸分析給定x,y的n對觀測值xi,yi,,代入式(6.2.1)得
(6.2.1’)(6.2.1’)為一元線性回歸模型。因變量y是一個(gè)以回歸直線上的對應(yīng)值為中心的正態(tài)隨機(jī)變量,即:第二節(jié)一元線性回歸模型第六章回歸分析(6.2.2)為一元線性回歸方程。(6.2.2)當(dāng)b>0時(shí),x與y為正相關(guān),當(dāng)b<0時(shí),x與y為負(fù)相關(guān)。InterceptSlope第二節(jié)一元線性回歸模型第六章回歸分析
三、
一元線性回歸模型的基本特征(1)由于,其中(a+bxi)為常量項(xiàng)(不是隨機(jī)變量),εi是隨機(jī)變量,因此yi也是隨機(jī)變量。
以上特征表明,yi是一個(gè)隨機(jī)變量,它來自于N(a+bxi,σ2)分布。第二節(jié)一元線性回歸模型第六章回歸分析四、
OLS(OrdinaryLeastSquare)估計(jì)
OLS的中心思想
最小二乘法的中心思想,是通過數(shù)學(xué)模型,配合一條較為理想的趨勢線。這條趨勢線必須滿足下列兩點(diǎn)要求:(1)原數(shù)列的觀測值與模型估計(jì)值的離差平方和為最?。唬?)原數(shù)列的觀測值與模型估計(jì)值的離差總和為0。公式表示為:第二節(jié)一元線性回歸模型第六章回歸分析根據(jù)最小二乘法的要求,記
Q=???===+-=-=niiiniiiniibxayyye121212)()?(
根據(jù)多元微分學(xué)的極值原理,Q取極小值的必要條件是Q對a,b的兩個(gè)一階偏導(dǎo)數(shù)全為零。上式分別對a和b求偏導(dǎo)數(shù),并令其等于零,有
0)(20)(211=+--=??=+--=????==iniiiniiixbxaybQbxayaQ
()()()()???íì=---=---??02012xbxaybxay
第二節(jié)一元線性回歸模型第六章回歸分析整理得:
??===+niiniiyxbna11
???====+niiiniiniiyxxbxa1121對上兩等式聯(lián)立求解,可得回歸參數(shù)的估計(jì)值為:
第二節(jié)一元線性回歸模型第六章回歸分析
其中:?==niixnx11?==niiyny11
OLS的特性:最小二乘估計(jì)量
具有線性、無偏性和最小方差性等良好的性質(zhì)。線性、無偏性和最小方差性統(tǒng)稱BLUE性質(zhì)。滿足BLUE性質(zhì)的估計(jì)量稱為BLUE估計(jì)量。第二節(jié)一元線性回歸模型第六章回歸分析【分析】因?yàn)楣I(yè)總產(chǎn)值與能源消耗量之間存在高度正相關(guān)關(guān)系(),所以可以擬合工業(yè)總產(chǎn)值對能源消耗量的線性回歸方程?!纠拷⒐I(yè)總產(chǎn)值對能源消耗量的線性回歸方程。解:設(shè)線性回歸方程為資料第六章回歸分析即線性回歸方程為:計(jì)算結(jié)果表明,在其他條件不變時(shí),能源消耗量每增加一個(gè)單位(十萬噸),工業(yè)總產(chǎn)值將增加0.7961個(gè)單位(億元)。第六章回歸分析五、離差平方和的分解和可決系數(shù)R2
在一元線性回歸模型中,觀測值的數(shù)值會(huì)發(fā)生波動(dòng),這種波動(dòng)稱為離差。離差產(chǎn)生的原因如下:①受自變量變動(dòng)的影響,即x取值不同時(shí)的影響;②受其他因素(包括觀測和實(shí)驗(yàn)中產(chǎn)生的誤差)的影響。為了分析這兩方面的影響,需要對總離差進(jìn)行分解。
變量y的觀測值聚集在回歸直線周圍的緊密程度稱回歸直線的擬合程度。用判定系數(shù)R2表示。
(一)離差平方和的分解第二節(jié)一元線性回歸模型第六章回歸分析總離差總偏差總變差回歸離差、回歸誤差殘差、剩余誤差第二節(jié)一元線性回歸模型第六章回歸分析剩余離差平方和回歸離差平方和總離差平方和總離差分解圖第六章回歸分析(總離差)(剩余離差)+(回歸離差)可以證明:(總離差平方和)(剩余離差平方和)+(回歸離差平方和)可寫成:
ST
=SE+SR
(n-1)=(n-2)+1總離差平方和除于自由度得平均離差平方和:
MST
=MSE+MSR第二節(jié)一元線性回歸模型第六章回歸分析
(二)可決系數(shù)R2
R2的取值范圍是[0,1]R2=1:所有觀測值都落在直線上,擬合是完全的。R2=0:變量X與Y無關(guān),x完全無助于解釋y的離差。R2越接近于1,回歸直線離各觀測點(diǎn)越近,用x的變化解釋Y值離差的部分越多,回歸直線的擬合程度就越好。反之,R2越接近于0,回歸直線的擬合程度就越差。第二節(jié)一元線性回歸模型第六章回歸分析注意:相關(guān)系數(shù)R是判定系數(shù)R2的平方根。
相關(guān)系數(shù)的取值范圍為[-1,1]
當(dāng)R=0時(shí),說明回歸變差為0,自變量x的變動(dòng)對總變差毫無影響,這種情況稱y與x不相關(guān)。當(dāng)|R|=1時(shí),說明回歸變差等于總變差,總變差的變化完全由自變量x變化所引起,這種情況成為完全相關(guān)。這時(shí)因變量y是自變量x的線性函數(shù),二者之間呈函數(shù)關(guān)系。
當(dāng)0<|R|<1時(shí),說明自變量x的變動(dòng)對總變差有部分影響,這種情況成為普通相關(guān)。
第二節(jié)一元線性回歸模型第六章回歸分析【例】判定工業(yè)總產(chǎn)值對能源消耗量的線性回歸方程的擬合程度。資料很明顯:R2=r2第二節(jié)一元線性回歸模型第六章回歸分析六、顯著性檢驗(yàn)方法全檢驗(yàn):回歸方程的顯著性檢驗(yàn)—F檢驗(yàn)法偏檢驗(yàn):回歸系數(shù)的顯著性檢驗(yàn)—t檢驗(yàn)法檢驗(yàn)自變量x與因變量y之間的線性關(guān)系是否顯著,變量之間的關(guān)系能否用線性模型來表示。檢驗(yàn)自變量對因變量的影響程度是否顯著。第二節(jié)一元線性回歸模型第六章回歸分析F檢驗(yàn)法的步驟1.提出假設(shè)。H0:b=0H1:b≠02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F3.確定顯著性水平α(一般0.05),查F分布表,得到相應(yīng)的臨界值Fα。4.判斷。若F≥Fα(1,n-1),拒絕H0,說明變量之間的線性關(guān)系是顯著的。若F<Fα(1,n-1),接受H0,說明變量間線性關(guān)系不顯著;第二節(jié)一元線性回歸模型第六章回歸分析顯著性檢驗(yàn)過程可由方差分析表給出方差分析表誤差來源自由度平方和均平方和F回歸R1SRMSRMSR/MSE誤差En-2SEMSE總離差Tn-1STMST第二節(jié)一元線性回歸模型第六章回歸分析t檢驗(yàn)法的步驟1.提出假設(shè)。H0:b=0H1:b≠02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量t~t(n-2)3.確定顯著性水平α(一般0.05),查t分布表,得到相應(yīng)的臨界值tα/2。4.判斷。若|t|≥tα/2(n-2),拒絕H0,表明自變量x對因變量y的線性影響顯著;若|t|<tα/2(n-2),接受H0,表明x對y的線性影響不顯著的。第二節(jié)一元線性回歸模型第六章回歸分析【例】判定工業(yè)總產(chǎn)值對能源消耗量的線性回歸方程的顯著程度。(以F檢驗(yàn)為例)資料當(dāng)H0:b=0成立時(shí),則統(tǒng)計(jì)量查表Fα(1,n-2)=F0.05(1,14)=4.6?!?77.75>4.6∴拒絕H0,說明工業(yè)總產(chǎn)值和能源消耗量間線性關(guān)系顯著。第六章回歸分析七、回歸系數(shù)的檢驗(yàn)與區(qū)間估計(jì)1、回歸系數(shù)b的檢驗(yàn)與區(qū)間估計(jì):已知對于b的最小二乘估計(jì)檢驗(yàn)假設(shè)H0:b=0,H1:b≠0檢驗(yàn)的統(tǒng)計(jì)量為:第二節(jié)一元線性回歸模型第六章回歸分析對于給定的顯著性水平α。若|t|≥tα/2(n-2),拒絕H0;
若|t|<tα/2(n-2)
,接受H0?;貧w系數(shù)b的置信度為1-α的置信區(qū)間為:2、回歸參數(shù)a的置信區(qū)間回歸系數(shù)a的置信度為1-α的置信區(qū)間為:第二節(jié)一元線性回歸模型第六章回歸分析點(diǎn)估計(jì)
在一元線性回歸模型中,對于自變量x的一個(gè)給定值,代入回歸模型,就可以求得一個(gè)對應(yīng)的回歸預(yù)測值,又稱為點(diǎn)估計(jì)值。
區(qū)間估計(jì)
所謂預(yù)測區(qū)間就是指在一定的顯著性水平上,依據(jù)數(shù)理統(tǒng)計(jì)方法計(jì)算出的包含預(yù)測對象未來真實(shí)值的某一區(qū)間范圍。
八、預(yù)測區(qū)間第二節(jié)一元線性回歸模型第六章回歸分析回歸系數(shù)b的統(tǒng)計(jì)性質(zhì)點(diǎn)估計(jì)值的統(tǒng)計(jì)性質(zhì)
第二節(jié)一元線性回歸模型第六章回歸分析
由于總體方差往往是未知的,所以,常用總體方差的無偏估計(jì)量來代替。式中,Sy稱為y的標(biāo)準(zhǔn)誤差,實(shí)際計(jì)算時(shí)可用其簡捷式
第二節(jié)一元線性回歸模型第六章回歸分析預(yù)測值和預(yù)測誤差第二節(jié)一元線性回歸模型第六章回歸分析第二節(jié)一元線性回歸模型第六章回歸分析(6.2.31)當(dāng)實(shí)際觀測值較多時(shí),一般n>30,式(6.2.31)可簡化為第二節(jié)一元線性回歸模型第六章回歸分析九、幾個(gè)應(yīng)當(dāng)注意的問題
1.重視數(shù)據(jù)的收集和甄別在收集數(shù)據(jù)的過程中可能會(huì)遇到以下困難:(1)一些變量無法直接觀測。(2)數(shù)據(jù)缺失或出現(xiàn)異常數(shù)據(jù)。(3)數(shù)據(jù)量不夠。(4)數(shù)據(jù)不準(zhǔn)確、不一致、有矛盾。2.合理確定數(shù)據(jù)的單位
在建立回歸方程時(shí),如果不同變量的單位選取不適當(dāng),導(dǎo)致模型中各變量的數(shù)量級差異懸殊,往往會(huì)給建模和模型解釋帶來諸多不便。比如模型中有的變量用小數(shù)位表示,有的變量用百位或千位數(shù)表示,可能會(huì)因舍入誤差使模型計(jì)算的準(zhǔn)確性受到影響。因此,適當(dāng)選取變量的單位,使模型中各變量的數(shù)量級大體一致是一種明智的做法。第二節(jié)一元線性回歸模型第六章回歸分析
一元線性回歸模型研究的是某一因變量與一個(gè)自變量之間的關(guān)系問題。但是,客觀現(xiàn)象之間的聯(lián)系是復(fù)雜的,許多現(xiàn)象的變動(dòng)都涉及到多個(gè)變量之間的數(shù)量關(guān)系。研究某一因變量與多個(gè)自變量之間的相互關(guān)系的理論和方法就是多元線性回歸模型。
第三節(jié)多元線性回歸模型第六章回歸分析1978-1989某地區(qū)國民經(jīng)濟(jì)基本數(shù)據(jù)第三節(jié)多元線性回歸模型第六章回歸分析一、多元線性回歸模型及其假設(shè)條件多元線性回歸模型第三節(jié)多元線性回歸模型第六章回歸分析第三節(jié)多元線性回歸模型第六章回歸分析第三節(jié)多元線性回歸模型第六章回歸分析多元線性回歸模型可寫成如下矩陣形式:此式可簡記為:第三節(jié)多元線性回歸模型第六章回歸分析二、模型參數(shù)OSL的估計(jì)與性質(zhì)
模型參數(shù)的OSL估計(jì)與一元線性回歸相似,多元線性回歸參數(shù)的OSL是使第三節(jié)多元線性回歸模型第六章回歸分析化簡此式得正規(guī)方程組為:第三節(jié)多元線性回歸模型第六章回歸分析為方便求解,將上式寫成矩陣形式回歸系數(shù)向量估計(jì)值的統(tǒng)計(jì)性質(zhì):線性性、無偏性、最小方差性第三節(jié)多元線性回歸模型第六章回歸分析三、多元線性回歸擬合程度的測定
(一)總偏差的分解
總偏差平方和=回歸離差平方和+剩余離差平方和可寫成:
ST
=SR+SE方差分析表
(n-1)=m+n-m-1誤差來源自由度平方和平均平方和F回歸RmSRMSRMSR/MSE誤差En-m-1SEMSE總離差Tn-1STMST第三節(jié)多元線性回歸模型第六章回歸分析
(二)擬合程度的測定R2的取值范圍是[0,1],越接近于1線性擬合程度越高,越接近于0線性擬合程度越低.R2=1:所有觀測值都落在直線上,擬合是完全的。R2=0:對yi完全沒有擬合能力。第三節(jié)多元線性回歸模型第六章回歸分析
由于R2的大小受回歸方程中自變量數(shù)目多少的影響,自變量數(shù)目越多,R2就會(huì)越接近于1,為消除自變量數(shù)目的影響,常采用調(diào)整的R2來判斷擬合程度,調(diào)整的方法是用自由度進(jìn)行修正,調(diào)整后的復(fù)可決系數(shù)為:第三節(jié)多元線性回歸模型第六章回歸分析四、復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)
(一)復(fù)相關(guān)系數(shù)(多重相關(guān)系數(shù))是衡量因變量y與所有m個(gè)自變量x間的關(guān)系密切程度的指標(biāo)。一般定義樣本的復(fù)相關(guān)系數(shù)為:
(二)偏相關(guān)系數(shù)在排除其它變量影響的條件下,僅僅反映兩個(gè)變量之間相關(guān)程度的相關(guān)系數(shù),稱偏相關(guān)系數(shù)。
如:三個(gè)變量,y、x1、x2第三節(jié)多元線性回歸模型第六章回歸分析y與x1在排除x2的影響后的相關(guān)系數(shù)記為ry1.2,稱為y與x1在對x2的偏相關(guān)系數(shù):y與x2在排除x1的影響后的相關(guān)系數(shù)記為ry2.1,稱為y與x2在對x1的偏相關(guān)系數(shù):第三節(jié)多元線性回歸模型第六章回歸分析五、多元線性回歸的顯著性檢驗(yàn)(一)全檢驗(yàn)(回歸效果的顯著性檢驗(yàn))檢驗(yàn)假設(shè)為:第三節(jié)多元線性回歸模型第六章回歸分析(二)偏檢驗(yàn)(回歸系數(shù)的顯著性檢驗(yàn))檢驗(yàn)假設(shè)為:第六章回歸分析六.預(yù)測區(qū)間第三節(jié)多元線性回歸模型第六章回歸分析第三節(jié)多元線性回歸模型第六章回歸分析補(bǔ)充:線性回歸模型的多重共線性和序列相關(guān)性
一、多重共線性當(dāng)回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)時(shí),則稱回歸模型中存在多重共線性。出現(xiàn)多重共線性可能出現(xiàn)的問題:
1、變量之間高度相關(guān)時(shí),可能會(huì)使回歸的結(jié)果造成混亂,甚至把分析引入歧途;
2、多重共線性可能對參數(shù)估計(jì)值的正負(fù)號產(chǎn)生影響,特別是βi的正負(fù)號有可能同預(yù)期的正負(fù)號相反多重共線性的判別:(1)模型中各對自變量之間顯著相關(guān);第六章回歸分析
(2)當(dāng)模型的線性關(guān)系檢驗(yàn)(F檢驗(yàn))顯著時(shí),幾乎所有回歸系數(shù)βi的t檢驗(yàn)卻不顯著;(3)回歸系數(shù)的正負(fù)號與預(yù)期的相反。
3、多重共線性問題的處理(1)將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān);
(2)如果要在模型中保留所有的自變量,就應(yīng)該:避免根據(jù)t統(tǒng)計(jì)量對單個(gè)參數(shù)β進(jìn)行檢驗(yàn);
對因變量y值的推斷(估計(jì)或預(yù)測)限定在自變量樣本值的范圍內(nèi)。補(bǔ)充:線性回歸模型的多重共線性和序列相關(guān)性第六章回歸分析
(二)序列相關(guān)性若回歸模型存在自相關(guān),若使用最小二乘法估計(jì)參數(shù),將可能產(chǎn)生下列嚴(yán)重后果:估計(jì)標(biāo)準(zhǔn)誤差S可能嚴(yán)重低估真實(shí)值;樣本方差可能嚴(yán)重低估真實(shí)值;估計(jì)回歸系數(shù)可能歪曲真實(shí)值;通常的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 共青科技職業(yè)學(xué)院《運(yùn)輸系統(tǒng)規(guī)劃與設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 《財(cái)經(jīng)公務(wù)文書》課件
- 糧食安全課件
- 甘肅中醫(yī)藥大學(xué)《操作系統(tǒng)應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 人事專員培訓(xùn)課件
- 七年級道德與法治上冊第一單元成長的節(jié)拍第三課發(fā)現(xiàn)自己第一課時(shí)誤區(qū)警示新人教版
- 三年級數(shù)學(xué)下冊一兩位數(shù)乘兩位數(shù)第5課時(shí)用兩步連乘計(jì)算解決實(shí)際問題教案蘇教版
- 三年級科學(xué)下冊第三單元固體和液體5使沉在水里的物體浮起來教案蘇教版
- 九年級化學(xué)上冊第六單元碳和碳的氧化物課題1金剛石石墨和C60第2課時(shí)單質(zhì)碳的化學(xué)性質(zhì)導(dǎo)學(xué)案新版新人教版
- 小學(xué)生請假制度
- 列管式換熱器-換熱面積計(jì)算
- 10個(gè)地基基礎(chǔ)工程質(zhì)量通病及防治措施
- 25m預(yù)應(yīng)力混凝土簡支T梁橋設(shè)計(jì)(共30頁)
- 籃球校本課程教案
- 高一學(xué)生文理分班意向表
- 高等傳熱學(xué)部分答案
- 地球物理學(xué)進(jìn)展投稿須知
- 機(jī)床精度檢驗(yàn)標(biāo)準(zhǔn) VDI3441 a ISO230-2
- 七年級英語下冊任務(wù)型閱讀單元測試題(含答案)(word)
- 解析電力施工項(xiàng)目的信息化管理
- 火炬介紹 音速火炬等
評論
0/150
提交評論