相關(guān)與回歸分析_第1頁
相關(guān)與回歸分析_第2頁
相關(guān)與回歸分析_第3頁
相關(guān)與回歸分析_第4頁
相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相關(guān)與回歸分析第1頁,課件共84頁,創(chuàng)作于2023年2月2第七章相關(guān)與回歸分析第一節(jié)相關(guān)與回歸分析的基本概念第二節(jié)簡(jiǎn)單線性相關(guān)與回歸分析第2頁,課件共84頁,創(chuàng)作于2023年2月3第一節(jié)相關(guān)與回歸分析的基本概念一、函數(shù)關(guān)系與相關(guān)關(guān)系二、相關(guān)關(guān)系的種類三、相關(guān)分析與回歸分析四、相關(guān)圖第3頁,課件共84頁,創(chuàng)作于2023年2月4一、函數(shù)關(guān)系與相關(guān)關(guān)系當(dāng)一個(gè)或幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。例如,商品的銷售收入Y與該商品的銷售量X以及該商品價(jià)格P之間的關(guān)系Y=PX。當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。變量間的這種相互關(guān)系,稱為具有不確定性的相關(guān)關(guān)系。例如,勞動(dòng)生產(chǎn)率與工資水平的關(guān)系。第4頁,課件共84頁,創(chuàng)作于2023年2月5變量之間的函數(shù)關(guān)系和相關(guān)關(guān)系,在一定條件下是可以互相轉(zhuǎn)化的。本來具有函數(shù)關(guān)系的變量,當(dāng)存在觀測(cè)誤差時(shí),其函數(shù)關(guān)系往往以相關(guān)的形式表現(xiàn)出來。而具有相關(guān)關(guān)系的變量之間的聯(lián)系,如果我們對(duì)它們有了深刻的規(guī)律性認(rèn)識(shí),并且能夠把影響因變量變動(dòng)的因素全部納入方程,這時(shí)的相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。第5頁,課件共84頁,創(chuàng)作于2023年2月6相關(guān)關(guān)系也具有某種變動(dòng)規(guī)律性,所以,相關(guān)關(guān)系經(jīng)??梢杂靡欢ǖ暮瘮?shù)形式去近似地描述??陀^現(xiàn)象的函數(shù)關(guān)系可以用數(shù)學(xué)分析的方法去研究,而研究客觀現(xiàn)象的相關(guān)關(guān)系必須借助于統(tǒng)計(jì)學(xué)中的相關(guān)與回歸分析方法。第6頁,課件共84頁,創(chuàng)作于2023年2月7二、相關(guān)關(guān)系的種類

按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)。當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一個(gè)現(xiàn)象的數(shù)量變化所確定時(shí),稱這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。在這種場(chǎng)合,相關(guān)關(guān)系便成為函數(shù)關(guān)系。因此也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個(gè)特例。當(dāng)兩個(gè)現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),稱為不相關(guān)現(xiàn)象。兩個(gè)現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān),一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān)。第7頁,課件共84頁,創(chuàng)作于2023年2月8按相關(guān)的方向可分為正相關(guān)和負(fù)相關(guān)。當(dāng)一個(gè)現(xiàn)象的數(shù)量增加(或減少),另一個(gè)現(xiàn)象的數(shù)量也隨之增加(或減少)時(shí),稱為正相關(guān)。例如,消費(fèi)水平隨收入的增加而提高。當(dāng)一個(gè)現(xiàn)象的數(shù)量增加(或減少),而另一個(gè)現(xiàn)象的數(shù)量向相反方向變動(dòng)時(shí),稱為負(fù)相關(guān)。例如商品流轉(zhuǎn)的規(guī)模愈大,流通費(fèi)用水平則愈低。第8頁,課件共84頁,創(chuàng)作于2023年2月9按相關(guān)的形式可分為線性相關(guān)和非線性相關(guān)。

當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時(shí),稱之為線性相關(guān)。如果兩種相關(guān)現(xiàn)象之間,并不表現(xiàn)為直線的關(guān)系,而是近似于某種曲線方程關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。第9頁,課件共84頁,創(chuàng)作于2023年2月按所研究的變量多少可分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)。兩個(gè)變量之間的相關(guān),稱為單相關(guān)。當(dāng)所研究的是一個(gè)變量對(duì)兩個(gè)或兩個(gè)以上其他變量的相關(guān)關(guān)系時(shí),稱為復(fù)相關(guān)。在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場(chǎng)合,假定其他變量不變,專門考察其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相關(guān)。例如,在假定人們的收入水平不變的條件下,某種商品的需求與其價(jià)格水平的關(guān)系就是一種偏相關(guān)。10第10頁,課件共84頁,創(chuàng)作于2023年2月11三、相關(guān)分析與回歸分析

相關(guān)分析是用一個(gè)指標(biāo)來表明現(xiàn)象間相互依存關(guān)系的密切程度?;貧w分析是根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型,來近似地表達(dá)變量間的平均變化關(guān)系。第11頁,課件共84頁,創(chuàng)作于2023年2月相關(guān)分析和回歸分析有著密切的聯(lián)系,它們不僅具有共同的研究對(duì)象,而且在具體應(yīng)用時(shí),常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量的具體形式;回歸分析則需要依靠相關(guān)分析來表明數(shù)量變化的相關(guān)程度。12第12頁,課件共84頁,創(chuàng)作于2023年2月13相關(guān)分析與回歸分析之間在研究目的和方法上是有明顯區(qū)別的。相關(guān)分析研究變量之間相關(guān)的方向和相關(guān)的程度?;貧w分析則是研究變量之間相互關(guān)系的具體形式,它對(duì)具有相關(guān)關(guān)系的變量之間的數(shù)量聯(lián)系進(jìn)行測(cè)定,確定一個(gè)相關(guān)的數(shù)學(xué)表達(dá)式,根據(jù)這個(gè)數(shù)學(xué)方程式可以從已知量來推測(cè)未知量,從而為估算和預(yù)測(cè)提供一個(gè)重要的方法。第13頁,課件共84頁,創(chuàng)作于2023年2月相關(guān)分析不能指出變量間相互關(guān)系的具體形式,也無法從一個(gè)變量的變化來推測(cè)另一個(gè)變量的變化情況??梢圆槐卮_定變量中哪個(gè)是自變量,哪個(gè)是因變量,其所涉及的變量可以都是隨機(jī)變量?;貧w分析則必須事先研究確定具有相關(guān)關(guān)系的變量中哪個(gè)為自變量,哪個(gè)為因變量。一般地說,回歸分析中因變量是隨機(jī)的,而把自變量作為研究時(shí)給定的非隨機(jī)變量。在應(yīng)用相關(guān)與回歸分析方法對(duì)客觀現(xiàn)象進(jìn)行研究時(shí),一定要注意把定性分析和定量分析結(jié)合起來,在定性分析的基礎(chǔ)上開展定量分析。14第14頁,課件共84頁,創(chuàng)作于2023年2月15【例7-1】教堂數(shù)與監(jiān)獄服刑人數(shù)同步增長(zhǎng)。美國(guó)印第安納州的地區(qū)教會(huì)想要籌款興建新教堂,提出教堂能潔凈人們的心靈,減少犯罪,降低監(jiān)獄服刑人數(shù)的口號(hào)。為了增進(jìn)民眾參與的熱誠(chéng)和信心,教會(huì)的神父收集了近15年的教堂數(shù)與在監(jiān)獄服刑的人數(shù)進(jìn)行統(tǒng)計(jì)分析。結(jié)果卻令教會(huì)大吃一驚。最近15年教堂數(shù)與監(jiān)獄服刑人數(shù)呈顯著的正相關(guān)。那么是否可以由此得出,教堂建得越多,就可能帶來更多的犯罪呢?經(jīng)過統(tǒng)計(jì)學(xué)家和教會(huì)神父深入討論,并進(jìn)一步收集近15年的當(dāng)?shù)厝丝谧儎?dòng)資料和犯罪率等資料作進(jìn)一步分析,發(fā)現(xiàn)監(jiān)獄服刑人數(shù)的增加和教堂數(shù)的增加都與人口的增加有關(guān)。教堂數(shù)的增加并非監(jiān)獄服刑人數(shù)增加的原因。至此,教會(huì)人士總算松了一口氣。第15頁,課件共84頁,創(chuàng)作于2023年2月16四、相關(guān)圖

相關(guān)圖又稱散點(diǎn)圖。它是以直角坐標(biāo)系的橫軸代表變量X,縱軸代表變量Y,將兩個(gè)變量間相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來,用來反映兩變量之間相關(guān)關(guān)系的圖形。

圖a圖b圖c第16頁,課件共84頁,創(chuàng)作于2023年2月17第二節(jié)簡(jiǎn)單線性相關(guān)與回歸分析

一、相關(guān)系數(shù)及其檢驗(yàn)二、標(biāo)準(zhǔn)的一元線性回歸模型三、一元線性回歸模型的估計(jì)四、一元線性回歸模型的檢驗(yàn)五、一元線性回歸模型預(yù)測(cè)第17頁,課件共84頁,創(chuàng)作于2023年2月18一、相關(guān)系數(shù)及其檢驗(yàn)(一)相關(guān)系數(shù)的定義

總體相關(guān)系數(shù)的定義式是 總體相關(guān)系數(shù)是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個(gè)常數(shù)。樣本相關(guān)系數(shù)的定義公式是 上式中,和分別是X和Y的樣本平均數(shù)。 樣本相關(guān)系數(shù)是根據(jù)樣本觀測(cè)值計(jì)算的,抽取的樣本不同,其具體的數(shù)值也會(huì)有所差異。樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計(jì)量。第18頁,課件共84頁,創(chuàng)作于2023年2月19(二)相關(guān)系數(shù)的特點(diǎn)

(1)r的取值介于-1與1之間。(2)當(dāng)r=0時(shí),X與Y的樣本觀測(cè)值之間沒有線性關(guān)系。(3)在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測(cè)值之間存在著一定的線性關(guān)系,當(dāng)r>0時(shí),X與Y為正相關(guān),當(dāng)r<0時(shí),X與Y為負(fù)相關(guān)。(4)如果|r|=1,則表明X與Y完全線性相關(guān),當(dāng)r=1時(shí),稱為完全正相關(guān),而r=-1時(shí),稱為完全負(fù)相關(guān)。(5)r是對(duì)變量之間線性相關(guān)關(guān)系的度量。r=0只是表明兩個(gè)變量之間不存在線性關(guān)系,它并不意味著X與Y之間不存在其他類型的關(guān)系。對(duì)于二者之間可能存在的非線性相關(guān)關(guān)系,需要利用其他指標(biāo)去進(jìn)行分析。第19頁,課件共84頁,創(chuàng)作于2023年2月20(三)相關(guān)系數(shù)的計(jì)算

具體計(jì)算樣本相關(guān)系數(shù)時(shí),通常利用以下公式:第20頁,課件共84頁,創(chuàng)作于2023年2月21

【例7-2】表7-1是1992年-2003年我國(guó)城鎮(zhèn)居民人均年消費(fèi)性支出和人均年可支配收入的有關(guān)資料,試計(jì)算消費(fèi)性支出與可支配收入的樣本相關(guān)系數(shù)。第21頁,課件共84頁,創(chuàng)作于2023年2月22(四)相關(guān)系數(shù)的檢驗(yàn)

對(duì)總體相關(guān)系數(shù)r是否等于0進(jìn)行檢驗(yàn)。計(jì)算相關(guān)系數(shù)r的t值:根據(jù)給定的顯著性水平和自由度(n-2),查找t分布表中相應(yīng)的臨界值tα/2。若|t|≥tα/2,表明r在統(tǒng)計(jì)上是顯著的。若|t|≤tα/2,表明r在統(tǒng)計(jì)上是不顯著的。第22頁,課件共84頁,創(chuàng)作于2023年2月23【例7-3】假設(shè)根據(jù)6對(duì)樣本觀測(cè)數(shù)據(jù)計(jì)算出某公司的股票價(jià)格與氣溫的樣本相關(guān)系數(shù)r=0.5,試問是否可以根據(jù)5%的顯著水平認(rèn)為該公司的股票與氣溫之間存在一定程度的線性相關(guān)關(guān)系?解:H0:ρ=0;H1:ρ≠0

r的t檢驗(yàn)值

查表可知:自由度為4的臨界值t0.025=2.776,上式中的t=1.1547<2.776,因此,r不能通過顯著性檢驗(yàn)。這就是說,盡管根據(jù)樣本觀測(cè)值計(jì)算的r達(dá)到0.5,但是由于樣本單位過少,這一結(jié)論并不可靠,它不足以證明該公司的股票與氣溫之間存在一定程度的線性相關(guān)關(guān)系。第23頁,課件共84頁,創(chuàng)作于2023年2月24二、標(biāo)準(zhǔn)的一元線性回歸模型

(一)總體回歸函數(shù)

上式被稱為總體回歸函數(shù)。式中的β1和β2是未知的參數(shù),又叫回歸系數(shù)。Yt和Xt分別是Y和X的第t個(gè)觀測(cè)值。ut是隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),它是一個(gè)特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對(duì)Y的影響。第24頁,課件共84頁,創(chuàng)作于2023年2月25(二)樣本回歸函數(shù)

在現(xiàn)實(shí)問題研究中,由于所要研究的現(xiàn)象的總體單位數(shù)一般是很多的,在許多場(chǎng)合甚至是無限的,因此無法掌握因變量Y總體的全部取值。也就是說,總體回歸函數(shù)事實(shí)上是未知的,需要利用樣本的信息對(duì)其進(jìn)行估計(jì)。一元線性回歸模型的樣本回歸線可表示為:式中的是樣本回歸線上與Xt相對(duì)應(yīng)的Y值,可視為E(Yt)的估計(jì);是樣本回歸函數(shù)的截距系數(shù),是樣本回歸函數(shù)的斜率系數(shù),它們是對(duì)總體回歸系數(shù)β1和β2的估計(jì)。第25頁,課件共84頁,創(chuàng)作于2023年2月26實(shí)際觀測(cè)到的因變量Yt值,并不完全等于,如果用et表示二者之差(),則有:(t=1,2,...n)上式稱為樣本回歸函數(shù)。式中et稱為殘差。第26頁,課件共84頁,創(chuàng)作于2023年2月27樣本回歸函數(shù)與總體回歸函數(shù)之間的間的區(qū)別??傮w回歸線是未知的,它只有一條。而樣本回歸線則是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線??傮w回歸函數(shù)中的β1和β2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的和是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測(cè)值不同而變動(dòng)??傮w回歸函數(shù)中的ut是Yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測(cè)的。而樣本回歸函數(shù)中的et是Yt與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測(cè)值擬合出樣本回歸線之后,可以計(jì)算出et的具體數(shù)值。第27頁,課件共84頁,創(chuàng)作于2023年2月28(三)誤差項(xiàng)的標(biāo)準(zhǔn)假定

假定1:誤差項(xiàng)的期望值為0,即對(duì)所有的t總有假定2:誤差項(xiàng)的方差為常數(shù),即對(duì)所有的t總有假定3:誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,其協(xié)方差為零,即當(dāng)t≠s時(shí)有:假定4:自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無關(guān)。假定5:隨機(jī)誤差項(xiàng)服從正態(tài)分布。 滿足以上標(biāo)準(zhǔn)假定的一元線性模型,稱為標(biāo)準(zhǔn)的一元線性回歸模型。第28頁,課件共84頁,創(chuàng)作于2023年2月29三、一元線性回歸模型的估計(jì)

(一)回歸系數(shù)的點(diǎn)估計(jì)

所謂最小二乘法就是根據(jù)這一思路,是通過使殘差平方和為最小來估計(jì)回歸系數(shù)的一種方法。

第29頁,課件共84頁,創(chuàng)作于2023年2月以上方程組稱為正規(guī)方程組或標(biāo)準(zhǔn)方程組,式中的n是樣本容量。求解這一方程組可得:

加以整理后有

第30頁,課件共84頁,創(chuàng)作于2023年2月31

【例7-4】我們利用例7-2的表7-1中已給出我國(guó)歷年城鎮(zhèn)居民人均消費(fèi)支出和人均可支配收入的數(shù)據(jù),來估計(jì)我國(guó)城鎮(zhèn)居民的邊際消費(fèi)傾向和基礎(chǔ)消費(fèi)水平。解:Yt=β1+β2Xt+ut

=50.073÷12-0.7511×62.976÷12=0.2310樣本回歸方程為:上式中:0.7511是邊際消費(fèi)傾向,表示人均可支配收入每增加1千元,人均消費(fèi)支出會(huì)增加0.7511千元;0.2310是基本消費(fèi)水平,即與收入無關(guān)最基本的人均消費(fèi)為0.2310千元。

第31頁,課件共84頁,創(chuàng)作于2023年2月32(二)總體方差的估計(jì)數(shù)學(xué)上可以證明,σ2的無偏估計(jì)S2可由下式給出:

式中,分子是殘差平方和,分母是自由度,其中n是樣本觀測(cè)值的個(gè)數(shù),2是一元線性回歸方程中回歸系數(shù)的個(gè)數(shù)。)S2的正平方根又叫做回歸估計(jì)的標(biāo)準(zhǔn)誤差。一般采用以下公式計(jì)算殘差平方和:上式的推導(dǎo)過程如下:

第32頁,課件共84頁,創(chuàng)作于2023年2月33【例7-5】根據(jù)例7-2中給出的有關(guān)數(shù)據(jù)和例7-4中已得到的回歸系數(shù)估計(jì)值,計(jì)算我國(guó)城鎮(zhèn)居民消費(fèi)函數(shù)的總體方差S2和回歸估計(jì)標(biāo)準(zhǔn)差S。解:根據(jù)例7-2中給出的有關(guān)數(shù)據(jù)和例7-4中已得到的回歸系數(shù)估計(jì)值,可得:

=232.7719-0.2310×50.073-0.7511×294.4539=0.0407 S2=0.0407/(12-2)=0.00407

進(jìn)而有:S=0.0638第33頁,課件共84頁,創(chuàng)作于2023年2月34(三)最小二乘估計(jì)量的性質(zhì)按照最小二乘法求得的估計(jì)總體回歸系數(shù)的數(shù)學(xué)公式是樣本觀測(cè)值的函數(shù),通常稱之為最小二乘估計(jì)量。可以證明,在標(biāo)準(zhǔn)假定能夠得到滿足的條件下,回歸系數(shù)的最小二乘估計(jì)量的期望值等于其真值,即有:其方差為:和的期望值與方差的推導(dǎo)過程基本類似。這里只就進(jìn)行證明。第34頁,課件共84頁,創(chuàng)作于2023年2月35

為了便于討論,將Yt=β1+β2Xt+ut代入估計(jì)量,并作以下變形:

為了推導(dǎo)上式,利用了以下恒等式:

這樣,回歸系數(shù)的最小二乘估計(jì)量可以表現(xiàn)為所要估計(jì)的參數(shù)的真值與隨機(jī)誤差項(xiàng)的線性組合。由于我們已假定Xt是給定的變量(不是隨機(jī)變量),因此,同各期誤差項(xiàng)相乘的權(quán)數(shù)也都是確定量。為了敘述的方便,令第35頁,課件共84頁,創(chuàng)作于2023年2月36利用前面所述的關(guān)于隨機(jī)誤差項(xiàng)的標(biāo)準(zhǔn)假定和期望值運(yùn)算的規(guī)則,可以證明的期望值和方差分別為:根據(jù)標(biāo)準(zhǔn)假定4根據(jù)標(biāo)準(zhǔn)假定1根據(jù)標(biāo)準(zhǔn)假定4、3根據(jù)標(biāo)準(zhǔn)假定2根據(jù)標(biāo)準(zhǔn)假定4證畢。第36頁,課件共84頁,創(chuàng)作于2023年2月37由以上推導(dǎo)過程可知,最小二乘估計(jì)量是因變量觀測(cè)值Yt的線性函數(shù),其期望值等于總體回歸系數(shù)的真值。因此,最小二乘估計(jì)量是總體回歸系數(shù)的線性無偏估計(jì)量。數(shù)學(xué)上還可以進(jìn)一步證明,在所有的線性無偏估計(jì)量中,回歸系數(shù)的最小二乘估計(jì)量的方差最??;同時(shí)隨著樣本容量的增大,其方差會(huì)不斷縮小。也就是說,回歸系數(shù)的最小二乘估計(jì)量是最優(yōu)線性無偏估計(jì)量和一致估計(jì)量。高斯-馬爾可夫定理表明,在標(biāo)準(zhǔn)的假定條件下,最小二乘估計(jì)量是一種最佳的估計(jì)方式。但是應(yīng)當(dāng)明確,這并不意味著根據(jù)這一方式計(jì)算的每一個(gè)具體的估計(jì)值都比根據(jù)其他方式計(jì)算的具體估計(jì)值更接近真值,而只是表明如果反復(fù)多次進(jìn)行估計(jì)值計(jì)算或是擴(kuò)大樣本的容量進(jìn)行估計(jì)值計(jì)算,按最佳估計(jì)方式計(jì)算的估計(jì)值接近真值的可能性(概率)最大。第37頁,課件共84頁,創(chuàng)作于2023年2月38(四)回歸系數(shù)的區(qū)間估計(jì)根據(jù)第五章中介紹的關(guān)于參數(shù)區(qū)間估計(jì)的原理,可得到以下回歸系數(shù)區(qū)間估計(jì)的公式:(j=1,2)式中,是回歸系數(shù)估計(jì)的樣本標(biāo)準(zhǔn)誤差,是顯著水平為α,自由度為(n-2)的t分布雙側(cè)臨界值。第38頁,課件共84頁,創(chuàng)作于2023年2月39【例7-6】利用例7-2的有關(guān)資料和例7-4與例7-5的結(jié)果,對(duì)例7-4中估計(jì)的我國(guó)城鎮(zhèn)居民邊際消費(fèi)傾向進(jìn)行置信度為95%的區(qū)間估計(jì)。解: 查t分布表可知:顯著水平為5%,自由度為10的t分布雙側(cè)臨界值是2.228,前面已求得,將其代入回歸系數(shù)區(qū)間估計(jì)的公式,可得:第39頁,課件共84頁,創(chuàng)作于2023年2月40四、一元線性回歸模型的檢驗(yàn)

(一)回歸模型檢驗(yàn)的種類回歸模型的檢驗(yàn)包括理論意義檢驗(yàn)、一級(jí)檢驗(yàn)和二級(jí)檢驗(yàn)。理論意義檢驗(yàn)主要涉及參數(shù)估計(jì)值的符號(hào)和取值區(qū)間,如果它們與實(shí)質(zhì)性科學(xué)的理論以及人們的實(shí)踐經(jīng)驗(yàn)不相符,就說明模型不能很好地解釋現(xiàn)實(shí)的現(xiàn)象。例如,在前面所舉的消費(fèi)函數(shù)中,β2的取值區(qū)間應(yīng)在0至1之間。在對(duì)實(shí)際的社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行回歸分析時(shí),常常會(huì)遇到經(jīng)濟(jì)意義檢驗(yàn)不能通過的情況。造成這一結(jié)果的主要原因是:社會(huì)經(jīng)濟(jì)的統(tǒng)計(jì)數(shù)據(jù)無法像自然科學(xué)中的統(tǒng)計(jì)數(shù)據(jù)那樣通過有控制的實(shí)驗(yàn)去取得,因而所觀測(cè)的樣本容量有可能偏小,不具有足夠的代表性,或者不能滿足標(biāo)準(zhǔn)線性回歸分析所要求的假定條件。第40頁,課件共84頁,創(chuàng)作于2023年2月41一級(jí)檢驗(yàn)又稱統(tǒng)計(jì)學(xué)檢驗(yàn),它是利用統(tǒng)計(jì)學(xué)中的抽樣理論來檢驗(yàn)樣本回歸方程的可靠性,具體又可分為擬合程度評(píng)價(jià)和顯著性檢驗(yàn)。一級(jí)檢驗(yàn)是對(duì)所有現(xiàn)象進(jìn)行回歸分析時(shí)都必須通過的檢驗(yàn)。二級(jí)檢驗(yàn)又稱經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn),它是對(duì)標(biāo)準(zhǔn)線性回歸模型的假定條件能否得到滿足進(jìn)行檢驗(yàn),具體包括序列相關(guān)檢驗(yàn)、異方差性檢驗(yàn)、多重共線性檢驗(yàn)等。二級(jí)檢驗(yàn)對(duì)于社會(huì)經(jīng)濟(jì)現(xiàn)象的定量分析具有特別重要的意義。第41頁,課件共84頁,創(chuàng)作于2023年2月42(二)擬合程度的評(píng)價(jià)總離差平方和的分解 對(duì)任一實(shí)際觀測(cè)值Yt總有:

對(duì)上式兩邊取平方并求和,得到:

可以證明:

從而有:

即SST=SSR+SSE

第42頁,課件共84頁,創(chuàng)作于2023年2月43上式中,SST是總離差平方和;SSR是由回歸直線可以解釋的那一部分離差平方和,稱為回歸平方和;SSE是用回歸直線無法解釋的離差平方和,稱為殘差平方和。式子兩邊同除以SST,得:顯而易見,各個(gè)樣本觀測(cè)點(diǎn)與樣本回歸直線靠得越緊,SSR在SST中所占的比例就越大。因此,可定義這一比例為決定系數(shù),即有:決定系數(shù)是對(duì)回歸模型擬合程度的綜合度量,決定系數(shù)越大,模型擬合程度越高。決定系數(shù)越小,則模型對(duì)樣本的擬合程度越差。第43頁,課件共84頁,創(chuàng)作于2023年2月44決定系數(shù)r2具有如下特性:1.決定系數(shù)r2具有非負(fù)性。 由決定系數(shù)的定義式可知,r2的分子分母均是不可能為負(fù)值的平方和,因此其比值必大于零。(但是在回歸模型中不包括截距項(xiàng)的場(chǎng)合,由于總離差平方和的分解公式不成立,按該式計(jì)算的r2有可能小于0。)2.決定系數(shù)的取值范圍為0≤r2≤1。3.決定系數(shù)是樣本觀測(cè)值的函數(shù),它也是一個(gè)統(tǒng)計(jì)量。4.在一元線性回歸模型中,決定系數(shù)是單相關(guān)系數(shù)的平方。第44頁,課件共84頁,創(chuàng)作于2023年2月45【例7-7】利用例7-5中計(jì)算的殘差平方和,計(jì)算例7-3所擬合的樣本回歸方程的決定系數(shù)。解: 上式中的SST是利用表7-1中給出的數(shù)據(jù)按下式計(jì)算的:第45頁,課件共84頁,創(chuàng)作于2023年2月46(三)顯著性檢驗(yàn)所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣本估計(jì)的結(jié)果對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn)。下面我們以β2的檢驗(yàn)為例,介紹回歸系數(shù)顯著性檢驗(yàn)的基本步驟:第46頁,課件共84頁,創(chuàng)作于2023年2月471.t檢驗(yàn)(1)提出假設(shè)。對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),所提出的假設(shè)的一般形式是:式中,Ho表示原假設(shè);H1表示備擇假設(shè);是假設(shè)的總體回歸系數(shù)的真值。在許多回歸分析的計(jì)算機(jī)程序里,常常令=0。這是因?yàn)棣?

是否為0,可以表明X對(duì)Y是否有顯著的影響。第47頁,課件共84頁,創(chuàng)作于2023年2月48(2)確定顯著水平α。 顯著水平的大小應(yīng)根據(jù)犯哪一類錯(cuò)誤可能帶來損失的大小確定。一般情況下可取0.05。(3)計(jì)算回歸系數(shù)的t值。

上式中,是回歸系數(shù)估計(jì)的標(biāo)準(zhǔn)誤差。第48頁,課件共84頁,創(chuàng)作于2023年2月49(4)確定臨界值。

t檢驗(yàn)的臨界值是由顯著水平和自由度df決定的。這時(shí)應(yīng)該注意,原假設(shè)和備擇假設(shè)設(shè)定的方式不同,據(jù)以判斷的接受域和拒絕域也不相同。例如,對(duì)H0:β2=0,H1:β2≠0,進(jìn)行的是雙側(cè)t檢驗(yàn);而對(duì)H0:β2=0.9,H1:β2<0.9,進(jìn)行的是單側(cè)t檢驗(yàn)。對(duì)此,在雙側(cè)檢驗(yàn)的場(chǎng)合,依據(jù)α和df,查t分布表所確定的臨界值是(-tα/2)和(tα/2

);而在單側(cè)檢驗(yàn)的場(chǎng)合,所確定的臨界值是(tα)。(5)做出判斷。 如果的絕對(duì)值大于臨界值的絕對(duì)值,就拒絕原假設(shè),接受備擇假設(shè);反之,如果的絕對(duì)值小于臨界值的絕對(duì)值,則接受原假設(shè)。第49頁,課件共84頁,創(chuàng)作于2023年2月502.p檢驗(yàn) 回歸系數(shù)的顯著性檢驗(yàn)還可以采用p檢驗(yàn)。其前三步與t檢驗(yàn)相同,但t值計(jì)算出來之后,并不與t分布的臨界值進(jìn)行對(duì)比,而是直接計(jì)算自由度為n-2的t統(tǒng)計(jì)量大于或小于根據(jù)樣本觀測(cè)值計(jì)算的的概率即p值。然后將其與給定的顯著水平α對(duì)比,如果p小于α,則拒絕原假設(shè),反之則接受原假設(shè)。利用Excel進(jìn)行回歸分析時(shí),計(jì)算機(jī)將直接給出回歸系數(shù)估計(jì)的p值。第50頁,課件共84頁,創(chuàng)作于2023年2月51【例7-8】利用例7-4和例7-6的有關(guān)資料和結(jié)果,對(duì)例7-4中估計(jì)的我國(guó)城鎮(zhèn)居民邊際消費(fèi)傾向進(jìn)行顯著性檢驗(yàn)。 (1)以5%的顯著水平檢驗(yàn)可支配收入是否對(duì)消費(fèi)支出有顯著影響。 (2)對(duì)Ho:β2=0.8,H1:β2<0.8進(jìn)行檢驗(yàn)。 解: (1)首先,提出假設(shè)H0:β2=0,H1:β2≠0。其次,計(jì)算t值=0.7511/0.0098=76.6429

查t分布表可知:顯著水平為5%,自由度為10的雙側(cè)t檢驗(yàn)的臨界值是2.228。以上計(jì)算的t值遠(yuǎn)遠(yuǎn)大于此臨界值,所以拒絕原假設(shè),接受備擇假設(shè),即認(rèn)為可支配收入對(duì)消費(fèi)支出的影響是非常顯著的。

(2)=(0.7511-0.8)/0.0098=-4.9898

查t分布表可知:顯著水平為5%,自由度為10的單側(cè)t檢驗(yàn)的臨界值是1.812。因?yàn)橛?jì)算的t值的絕對(duì)值大于此臨界值,所以否定β2=0.8的原假設(shè),接受備擇假設(shè),認(rèn)為我國(guó)城鎮(zhèn)居民的平均消費(fèi)傾向小于0.8。第51頁,課件共84頁,創(chuàng)作于2023年2月52五、一元線性回歸模型預(yù)測(cè)

(一)回歸預(yù)測(cè)的基本公式簡(jiǎn)單回歸預(yù)測(cè)的基本公式如下:式中,Xf是給定的X的具體數(shù)值;是Xf給定時(shí)Y的預(yù)測(cè)值;和是已估計(jì)出的樣本回歸系數(shù)。回歸預(yù)測(cè)是一種有條件的預(yù)測(cè),在進(jìn)行回歸預(yù)測(cè)時(shí),必須先給出Xf的具體數(shù)值。當(dāng)給出的Xf屬于樣本內(nèi)的數(shù)值時(shí),利用該式去計(jì)算稱為內(nèi)插檢驗(yàn)或事后預(yù)測(cè)。而當(dāng)給出的Xf在樣本之外時(shí),利用該式去計(jì)算稱為外推預(yù)測(cè)或事前預(yù)測(cè)。通常所說的預(yù)測(cè)是指事前預(yù)測(cè)。第52頁,課件共84頁,創(chuàng)作于2023年2月53(二)預(yù)測(cè)誤差在實(shí)際的回歸模型預(yù)測(cè)中,發(fā)生預(yù)測(cè)誤差的原因可以概括為以下四個(gè):1.模型本身中的誤差因素所造成的誤差;這一誤差可以用總體隨機(jī)誤差項(xiàng)的方差來評(píng)價(jià)。2.由于回歸系數(shù)的估計(jì)值同其真值不一致所造成的誤差;這一誤差可以用回歸系數(shù)的最小二乘估計(jì)量的方差來評(píng)價(jià)。3.由于自變量X的設(shè)定值同其實(shí)際值的偏離所造成的誤差。4.由于未來時(shí)期總體回歸系數(shù)發(fā)生變化所造成的誤差。在以上造成預(yù)測(cè)誤差的原因中,3、4、兩項(xiàng)不屬于回歸方程本身的問題,而且也難以事先予以估計(jì)和控制。因此,在下面的討論中,假定只存在1、2、兩種誤差。第53頁,課件共84頁,創(chuàng)作于2023年2月54

設(shè)Xf給定時(shí)Y的真值為Yf, Yf=β1+β2Xf+uf

則有 式中,ef是預(yù)測(cè)的殘差。利用期望值與方差的運(yùn)算規(guī)則以及前面給出的回歸系數(shù)最小二乘估計(jì)量的期望值和方差,可以證明:

在此基礎(chǔ)上,還可以進(jìn)一步證明是Yf的最優(yōu)線性無偏預(yù)測(cè),即在標(biāo)準(zhǔn)假定能夠滿足的情況下,公式是Yf的最佳預(yù)測(cè)方式。第54頁,課件共84頁,創(chuàng)作于2023年2月55(三)區(qū)間預(yù)測(cè) 若用Sef來表示預(yù)測(cè)標(biāo)準(zhǔn)誤差的估計(jì)值, 則數(shù)學(xué)上可以證明:服從于自由度為(n-2)的t分布。按照確定置信區(qū)間的方法,可以得出Yf的(1-α)的置信區(qū)間為: 式中,是置信度為(1-α)、自由度為(n-2)的t分布的臨界值。第55頁,課件共84頁,創(chuàng)作于2023年2月56對(duì)于每一個(gè)給定的X值,計(jì)算相應(yīng)的Y的置信區(qū)間,并將連接各點(diǎn)的曲線描繪在平面圖上,便可得到右圖。從置信區(qū)間和Sef的計(jì)算公式以及右圖,可以得到以下結(jié)論:回歸預(yù)測(cè)的置信區(qū)間第56頁,課件共84頁,創(chuàng)作于2023年2月57第一,置信區(qū)間的上下限對(duì)稱地落在樣本回歸直線兩邊,呈中間小兩頭大的喇叭型。當(dāng)Xf=時(shí)的置信區(qū)間最窄,而當(dāng)Xf遠(yuǎn)離時(shí),其置信間逐漸增大。這就是說,在用回歸模型進(jìn)行預(yù)測(cè)時(shí),X

f的取值不宜離開過遠(yuǎn),否則預(yù)測(cè)精度將會(huì)降低,有可能使預(yù)測(cè)失效。第二,在樣本容量n保持不變時(shí),

的值,隨置信度(1-α)的提高而增加,因此,要求預(yù)測(cè)值的概率保證程度增加,在其它條件不變時(shí),也就意味著預(yù)測(cè)精度的降低。第三,當(dāng)其它條件不變時(shí),和Sef的值均為樣本容量n的減函數(shù),即隨著n的增加,這二者將逐漸減少。這說明隨著樣本容量的增加,預(yù)測(cè)精度將會(huì)提高,而樣本容量過小,預(yù)測(cè)的精度就較差。第57頁,課件共84頁,創(chuàng)作于2023年2月58第四,當(dāng)n足夠大時(shí),Sef會(huì)趨近于S;會(huì)趨近于zα/2。(zα/2是置信度為(1-α)的標(biāo)準(zhǔn)正態(tài)分布的臨界值)。這時(shí),可以用S和zα/2取代Sef和tα/2來確定預(yù)測(cè)區(qū)間。即樣本容量充分大時(shí),Yf的(1-α)的置信區(qū)間為:Yf±zα/2×S

按上式確定的預(yù)測(cè)區(qū)間的上、下限在平面圖上呈兩條直線(參見圖“回歸預(yù)測(cè)的置信區(qū)間”中與樣本回歸線平行的兩條虛線)。第58頁,課件共84頁,創(chuàng)作于2023年2月59【例7-9】假定已知某居民家庭的年人均可支配收入為8千元,要求利用例7-4中擬合的樣本回歸方程與有關(guān)數(shù)據(jù),計(jì)算置信度為95%的年人均消費(fèi)支出的預(yù)測(cè)區(qū)間。解:將有關(guān)數(shù)據(jù)代入擬合好的樣本回歸方程,可得:

從前面幾例的結(jié)果可知:S=0.0638,n=12

將其代入求預(yù)測(cè)標(biāo)準(zhǔn)誤差估計(jì)值的公式,有

查t分布表可知:顯著水平為5%,自由度為10的雙側(cè)t檢驗(yàn)的臨界值是2.228。因此,當(dāng)人均可支配收入為8千元時(shí),置信度為95%的消費(fèi)支出的預(yù)測(cè)區(qū)間如下:

6.2398-2.228×0.0717≤Yf≤6.2398+2.228×0.07176.0801(千元)≤Yf

≤6.3995(千元)第59頁,課件共84頁,創(chuàng)作于2023年2月60第三節(jié)多元線性相關(guān)與回歸分析一、標(biāo)準(zhǔn)的多元線性回歸模型二、多元線性回歸模型的估計(jì)第60頁,課件共84頁,創(chuàng)作于2023年2月61一、標(biāo)準(zhǔn)的多元線性回歸模型研究在線性相關(guān)條件下,兩個(gè)和兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公式,稱為多元線性回歸模型。多元線性回歸模型總體回歸函數(shù)的一般形式如下:多元線性回歸模型的樣本回歸函數(shù)如下:

(t=1,2,…,n)上式中,et是Yt與其估計(jì)之間的離差,即殘差。與一元線性回歸分析相類似,為了進(jìn)行多元線性回歸分析也需要提出一些必要的假定。多元線性回歸分析的標(biāo)準(zhǔn)假定除了包括上一節(jié)中已經(jīng)提出的關(guān)于隨機(jī)誤差項(xiàng)的假定外,還要追加一條假定。這就是回歸模型所包含的自變量之間不能具有較強(qiáng)的線性關(guān)系,同時(shí)樣本容量必須大于所要估計(jì)的回歸系數(shù)的個(gè)數(shù)即n>k。我們稱這條假定為標(biāo)準(zhǔn)假定6。第61頁,課件共84頁,創(chuàng)作于2023年2月62二、多元線性回歸模型的估計(jì)(一)回歸系數(shù)的估計(jì)多元線性回歸模型中回歸系數(shù)的估計(jì)同樣采用最小二乘法。設(shè)根據(jù)微積分中求極小值的原理,可知?dú)埐钇椒胶停汛嬖跇O小值,欲使Q達(dá)到最小,Q對(duì)的偏導(dǎo)數(shù)必須等于零。將Q對(duì)求偏導(dǎo)數(shù),并令其等于零,加以整理后可得到以下k個(gè)方程式:

以上k元一次方程組稱為正規(guī)方程組或標(biāo)準(zhǔn)方程組,通過求解這一方程組便可以得到。第62頁,課件共84頁,創(chuàng)作于2023年2月63求解多元回歸方程,用矩陣形式來表達(dá)較為簡(jiǎn)便(這里給出的矩陣形式具有一般性,對(duì)于一元線性回歸模型也同樣適用。對(duì)于尚未學(xué)過矩陣代數(shù)的讀者,可以不必掌握這一部分內(nèi)容。)記第63頁,課件共84頁,創(chuàng)作于2023年2月64則總體回歸函數(shù)(7.50)式可以寫為:Y

=XB+U樣本回歸函數(shù)(7.51)式可以寫為:

標(biāo)準(zhǔn)方程組可以寫為:

式中X'表示X的轉(zhuǎn)置矩陣。(X'X)是一個(gè)k×k的對(duì)稱矩陣,根據(jù)標(biāo)準(zhǔn)假定6,(k-1)個(gè)自變量之間不存在高度的線性相關(guān),因此其逆矩陣存在。在上式兩邊同時(shí)左乘(X'X)-1,可以得到:上式是回歸系數(shù)最小二乘估計(jì)的一般形式。第64頁,課件共84頁,創(chuàng)作于2023年2月65(二)總體方差的估計(jì)多元線性回歸模型中的σ2也是利用殘差平方和除以其自由度來估計(jì)的。即有:上式中,n是樣本觀測(cè)值的個(gè)數(shù);k是方程中回歸系數(shù)的個(gè)數(shù);數(shù)學(xué)上可以證明,S2是σ2的無偏估計(jì)。S2的正平方根S又叫做回歸估計(jì)的標(biāo)準(zhǔn)誤差。S越小表明樣本回歸方程的代表性越強(qiáng)。在編制計(jì)算機(jī)程序時(shí),殘差平方和一般不是按照其定義式計(jì)算,而是利用以下公式計(jì)算:上式是殘差平方和的矩陣形式。式中Y是因變量樣本觀測(cè)值向量;X是自變量樣本觀測(cè)值矩陣;是回歸系數(shù)估計(jì)值向量的轉(zhuǎn)置向量。第65頁,課件共84頁,創(chuàng)作于2023年2月66(三)最小二乘估計(jì)量的性質(zhì) 在標(biāo)準(zhǔn)的多元線性回歸模型中,高斯.馬爾可夫定理同樣成立。第66頁,課件共84頁,創(chuàng)作于2023年2月67三、多元線性回歸模型的檢驗(yàn)和預(yù)測(cè)(一)擬合程度的評(píng)價(jià)利用R2來評(píng)價(jià)多元線性回歸方程的擬合程度,必須注意以下問題。由決定系數(shù)的定義可知,R2的大小取決于殘差平方和在總離差平方和中所占的比重。在樣本容量一定的條件下,總離差平方和與自變量的個(gè)數(shù)無關(guān),而殘差平方和則會(huì)隨著模型中自變量個(gè)數(shù)的增加不斷減少,至少不會(huì)增加。因此,R2是自變量個(gè)數(shù)的非遞減函數(shù)。在一元線性回歸模型中,所有模型包含的變量數(shù)目都相同,如果所使用的樣本容量也一樣,決定系數(shù)便可以直接作為評(píng)價(jià)擬合程度的尺度。然而在多元線性回歸模型中,各回歸模型所含的變量的數(shù)目未必相同,以R2的大小作為衡量擬合優(yōu)劣的尺度是不合適的。第67頁,課件共84頁,創(chuàng)作于2023年2月68在多元回歸分析中,人們更常用的評(píng)價(jià)指標(biāo)是所謂的修正自由度的決定系數(shù)。該指標(biāo)的定義如下:式中,n是樣本容量;k是模型中回歸系數(shù)的個(gè)數(shù)。(n-1)和(n-k

)實(shí)際上分別是總離差平方和與殘差平方和的自由度。第68頁,課件共84頁,創(chuàng)作于2023年2月69修正自由度的決定系數(shù)具有以下特點(diǎn):1.。因?yàn)閗≥1,所以根據(jù)和R2各自的定義式可以得出這一結(jié)論。對(duì)于給定的R2值和n值,k值越大越小。在進(jìn)行回歸分析時(shí),一般總是希望以盡可能少的自變量去達(dá)到盡可能高的擬合程度。作為綜合評(píng)價(jià)這兩方面情況的一項(xiàng)指標(biāo)顯然比R2更為合適。2.小于1,但未必都大于0。在擬合極差的場(chǎng)合,有可能取負(fù)值。第69頁,課件共84頁,創(chuàng)作于2023年2月70【例7-10】假設(shè)有7年的年度統(tǒng)計(jì)資料,現(xiàn)利用其對(duì)同一因變量擬合了兩個(gè)樣本回歸方程。方程一中:k=6,R2=0.82;方程二中:k=2,R2=0.80。試對(duì)這兩個(gè)回歸方程的擬合程度做出評(píng)價(jià)。解:如果僅從R2考察,似乎方程一的擬合程度更佳。但是,由于兩個(gè)方程選用的自變量個(gè)數(shù)不同,這一結(jié)論是不正確的。將上列數(shù)據(jù)代入修正自由度的決定系數(shù)公式,可得:方程一的=1-((7-1)/(7-6))(1-0.82)=-0.08方程二的=1-((7-1)/(7-2))(1-0.80)=0.76由此可見,方程二的實(shí)際擬合程度遠(yuǎn)遠(yuǎn)優(yōu)于方程一。第70頁,課件共84頁,創(chuàng)作于2023年2月71(二)顯著性檢驗(yàn)1.回歸系數(shù)的顯著性檢驗(yàn)多元回歸中進(jìn)行這一檢驗(yàn)的目的主要是為了檢驗(yàn)與各回歸系數(shù)對(duì)應(yīng)的自變量對(duì)因變量的影響是否顯著,以便對(duì)自變量的取舍做出正確的判斷。一般來說,當(dāng)發(fā)現(xiàn)某個(gè)自變量的影響不顯著時(shí),應(yīng)將其從模型中刪除。這樣才能夠做到以盡可能少的自變量去達(dá)到盡可能高的擬合優(yōu)度。多元模型中回歸系數(shù)的檢驗(yàn)同樣采用t檢驗(yàn)和P檢驗(yàn),其原理和基本步驟與一元回歸模型基本相同,這里不再贅述。下面僅給出回歸系數(shù)顯著性檢驗(yàn)t統(tǒng)計(jì)量的一般計(jì)算公式。第71頁,課件共84頁,創(chuàng)作于2023年2月72j=1,2,…,k式中,是回歸系數(shù)的估計(jì)值,

是的標(biāo)準(zhǔn)差的估計(jì)值,其按下式計(jì)算:式中,是(X’X)-1的第j個(gè)對(duì)角線元素,S2是隨機(jī)誤差項(xiàng)方差的估計(jì)值。上式的t統(tǒng)計(jì)量背后的原假設(shè)是H0:βj=0,因此t的絕對(duì)值越大表明βj為0的可能性越小,即表明相應(yīng)的自變量對(duì)因變量的影響是顯著的。第72頁,課件共84頁,創(chuàng)作于2023年2月732.回歸方程的顯著性檢驗(yàn) 必須在方差分析的基礎(chǔ)上利用F檢驗(yàn)進(jìn)行。其具體的方法步驟可歸納如下:(1)假設(shè)總體回歸方程不顯著,即有

H0:β2=β3=……=βk=0

(2)進(jìn)行方差分析,列出回歸方差分析表(見下表)第73頁,課件共84頁,創(chuàng)作于2023年2月74回歸模型方差分析表表中,回歸平方和的取值受k個(gè)回歸系數(shù)估計(jì)值的影響,同時(shí)又要服從的約束條件,因此其自由度是k-1。殘差平方和取決于n個(gè)因變量的觀測(cè)值,同時(shí)又要服從k個(gè)正規(guī)方程式的約束,因此其自由度是n-k。回歸平方和與殘差平方和各除以自身的自由度得到的是樣本方差。第74頁,課件共84頁,創(chuàng)作于2023年2月75(3)根據(jù)方差分析的結(jié)果求F統(tǒng)計(jì)量,即 數(shù)學(xué)上可以證明,在隨機(jī)誤差項(xiàng)服從正態(tài)分布同時(shí)原假設(shè)成立的條件下,F服從于自由度為(k-1)和(n-k)的F分布。(4)根據(jù)自由度和給定的顯著性水平α,查F分布表中的理論臨界值Fα。當(dāng)F>Fα?xí)r,拒絕原假設(shè),即認(rèn)為總體回歸函數(shù)中各自變量與因變量的線性回歸關(guān)系顯著。當(dāng)F<Fα?xí)r,接受原假設(shè),即認(rèn)為總體回歸函數(shù)中,自變量與因變量的線性關(guān)系不顯著,因而所建立的回歸模型沒有意義。第75頁,課件共84頁,創(chuàng)作于2023年2月76(三)多元線性回歸預(yù)測(cè)在通過各種檢驗(yàn)的基礎(chǔ)上,多元線性回歸模型可以用于預(yù)測(cè)。多元線性回歸預(yù)測(cè)與一元線性回歸預(yù)測(cè)的原理是一致的,其基本公式如下:式中,Xjf(j=2,3,……k)是給定的Xj在預(yù)測(cè)期的具體數(shù)值;是已估計(jì)出的樣本回歸系數(shù);是Xj給定時(shí)Y的預(yù)測(cè)值。該方程的矩陣形式為:第76頁,課件共84頁,創(chuàng)作于2023年2月77

式中:多元線性回歸預(yù)測(cè)標(biāo)準(zhǔn)誤差的計(jì)算公式如下: 式中,S是回歸方程估計(jì)的標(biāo)準(zhǔn)誤差。多元線性回歸預(yù)測(cè)Yf的(1-α)的置信區(qū)間可由下式給出: 式中,tα/2是顯著水平為α的t分布雙側(cè)臨界值。第77頁,課件共84頁,創(chuàng)作于2023年2月78四、復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)(一)復(fù)相關(guān)系數(shù)樣本復(fù)相關(guān)系數(shù)(以下簡(jiǎn)稱復(fù)相關(guān)系數(shù))的定義式如下:實(shí)際計(jì)算復(fù)相關(guān)系數(shù)時(shí),一般不直接根據(jù)其定義式,而是先計(jì)算出決定系數(shù),然后再求決定系數(shù)的平方根

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論