第八章-相關(guān)與回歸分析_第1頁(yè)
第八章-相關(guān)與回歸分析_第2頁(yè)
第八章-相關(guān)與回歸分析_第3頁(yè)
第八章-相關(guān)與回歸分析_第4頁(yè)
第八章-相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章相關(guān)與回歸分析第一節(jié)相關(guān)與回歸分析的基本概念第二節(jié)一元線性回歸分析第三節(jié)多元線性回歸分析第四節(jié)非線性回歸分析

——可化為線性回歸的曲線回歸學(xué)習(xí)目標(biāo)1. 掌握一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)方法2.掌握回歸方程的顯著性檢驗(yàn)利用回歸方程進(jìn)行預(yù)測(cè)掌握多元線性回歸分析的基本方法了解可化為線性回歸的曲線回歸掌握相關(guān)系數(shù)的含義、計(jì)算方法和應(yīng)用用Excel進(jìn)行回歸分析相關(guān)與回歸分析的基本概念一、函數(shù)關(guān)系與相關(guān)關(guān)系函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為

y=p

x(p為單價(jià)是常量)圓的面積(S)與半徑之間的關(guān)系可表示為S=R2

企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)

、單位產(chǎn)量消耗(x2)

、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3

客觀現(xiàn)象的數(shù)量聯(lián)系

(函數(shù)關(guān)系)(一元線性函數(shù)關(guān)系)兩個(gè)變量是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上

xy客觀現(xiàn)象的數(shù)量聯(lián)系

(相關(guān)關(guān)系)相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系(簡(jiǎn)單線性相關(guān)關(guān)系)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周?chē)?/p>

xy函數(shù)關(guān)系與相關(guān)關(guān)系的聯(lián)系由于存在測(cè)量誤差,函數(shù)關(guān)系在現(xiàn)實(shí)中往往表現(xiàn)為相關(guān)關(guān)系。函數(shù)關(guān)系是相關(guān)分析的工具。相關(guān)分析需要借助函數(shù)來(lái)近似描述具有相關(guān)關(guān)系的變量之間的數(shù)量聯(lián)系。相關(guān)關(guān)系的類型按變量多少按相關(guān)形式按相關(guān)程度按相關(guān)方向簡(jiǎn)單相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)二、相關(guān)分析與回歸分析相關(guān)分析(概念)

相關(guān)分析是分析研究變量之間相關(guān)關(guān)系的一種統(tǒng)計(jì)分析方法。廣義的相關(guān)分析包括兩個(gè)方面的主要內(nèi)容:一是測(cè)定變量之間相關(guān)關(guān)系的密切程度;二是尋找一個(gè)合適的數(shù)學(xué)關(guān)系式來(lái)描述相關(guān)的變量之間的數(shù)值變化關(guān)系。一般所說(shuō)的相關(guān)分析是指通過(guò)統(tǒng)計(jì)指標(biāo)來(lái)測(cè)定變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析方法?;貧w分析(概念)回歸分析也是分析研究變量之間相關(guān)關(guān)系的統(tǒng)計(jì)分析方法。其主要目的是:建立合適的數(shù)學(xué)模型(或數(shù)學(xué)表達(dá)式,回歸方程),來(lái)近似描述變量之間的數(shù)量變化關(guān)系,以便通過(guò)已知的自變量來(lái)估計(jì)或預(yù)測(cè)未知的因變量值。一個(gè)自變量?jī)蓚€(gè)及兩個(gè)以上自變量回歸分析多元回歸析一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,所有變量處于平等的地位;回歸分析中,必須確定哪個(gè)變量為因變量,需要用其它變量解釋,哪個(gè)或哪些變量稱為自變量,用于解釋或預(yù)測(cè)因變量的變化相關(guān)分析中所涉及的變量都是隨機(jī)變量;回歸分析中,因變量是隨機(jī)變量,把自變量作為給定的非隨機(jī)的確定變量對(duì)待相關(guān)分析主要是描述兩個(gè)變量之間相關(guān)關(guān)系的密切程度;回歸分析的目的在于揭示自變量對(duì)因變量變化的影響大小,以便進(jìn)行預(yù)測(cè)和控制三、相關(guān)系數(shù)及其計(jì)算相關(guān)關(guān)系的測(cè)度

(相關(guān)系數(shù))對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r相關(guān)關(guān)系的測(cè)度

(相關(guān)系數(shù))

樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為相關(guān)關(guān)系的測(cè)度

(相關(guān)系數(shù)取值及其意義)

r

的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)

r=0,不存在線性相關(guān)關(guān)系-1r<0,為負(fù)相關(guān)0<r1,為正相關(guān)|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)關(guān)系的測(cè)度

(相關(guān)系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)關(guān)系的測(cè)度

(相關(guān)系數(shù)計(jì)算例)【例】居民收入與消費(fèi)水平數(shù)據(jù)見(jiàn)下表(單位:百元),計(jì)算相關(guān)系數(shù)。相關(guān)關(guān)系的測(cè)度

(計(jì)算結(jié)果)解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有家庭人均消費(fèi)支出與人均可支配收入之間的相關(guān)系數(shù)為0.9878相關(guān)系數(shù)的顯著性檢驗(yàn)

(概念要點(diǎn))

1. 檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系采用t檢驗(yàn)檢驗(yàn)的步驟為提出假設(shè):H0:;H1:0

計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:

確定顯著性水平,并作出決策若t>t,拒絕H0

若t<t,接受H0相關(guān)系數(shù)的顯著性檢驗(yàn)

(實(shí)例)

對(duì)前例計(jì)算的相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3.根據(jù)顯著性水平=0.05,查t分布表得t(n-2)=2.201由于t=17.9113>t(13-2)=2.201,拒絕H0,人均消費(fèi)支出與可支配收入之間的相關(guān)關(guān)系顯著第二節(jié)一元線性回歸一.一元線性回歸模型參數(shù)的最小二乘估計(jì)回歸方程的顯著性檢驗(yàn)預(yù)測(cè)及應(yīng)用回歸模型與回歸方程一元線性回歸模型

(概念要點(diǎn))描述因變量如何依賴于自變量和隨機(jī)誤差項(xiàng)的數(shù)學(xué)表達(dá)式稱為回歸模型當(dāng)模型中只涉及一個(gè)自變量時(shí)稱為一元回歸模型,若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸回歸模型中隨機(jī)誤差項(xiàng)的均值為0,也就是說(shuō)因變量的數(shù)學(xué)期望是自變量的函數(shù),該函數(shù)稱為因變量對(duì)自變量的回歸函數(shù)(或回歸方程)?!盎貧w”一詞的由來(lái)(高爾頓的例子)一元線性回歸模型

(概念要點(diǎn))

對(duì)于只涉及一個(gè)自變量的簡(jiǎn)單線性回歸模型可表示為

y=b1+b2x+u模型中,y是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)u是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性1和2稱為模型的參數(shù)一元線性回歸模型

(基本假定)誤差項(xiàng)u是一個(gè)期望值為0的隨機(jī)變量,即E(u)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(y)=1+

2x誤差項(xiàng)u的方差σ2為常數(shù)誤差項(xiàng)u之間不存在序列相關(guān)自變量是給定的變量,與隨機(jī)誤差項(xiàng)不相關(guān)隨機(jī)誤差項(xiàng)服從正態(tài)分布,即u~N(0,σ2)總體回歸方程描述y的平均值或期望值如何依賴于x的參數(shù)方程稱為總體回歸方程簡(jiǎn)單線性回歸方程的形式如下

E(y)=1+2x方程的圖示是一條直線,因此也稱為直線回歸方程1是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值2是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值估計(jì)(經(jīng)驗(yàn))的回歸方程

(樣本回歸方程)

簡(jiǎn)單線性回歸中樣本回歸方程為總體回歸方程中包含未知的回歸系數(shù),必須通過(guò)樣本進(jìn)行估計(jì),當(dāng)回歸參數(shù)用樣本的估計(jì)量替代時(shí)所得到的方程稱為樣本回歸方程。參數(shù)1和2的最小二乘估計(jì)最小二乘法使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得和的方法。即用最小二乘法擬合的直線來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小最小二乘法

(圖示)最小二乘法

和的計(jì)算公式)

根據(jù)最小二乘法的要求,可得求解和的標(biāo)準(zhǔn)方程如下最小二乘估計(jì)的性質(zhì)無(wú)偏性線性性方差最小性估計(jì)方程的求法

(實(shí)例)【例】根據(jù)例8.1中的數(shù)據(jù),配合人均月食品支出對(duì)人均月收入的回歸方程

根據(jù)和的求解公式得估計(jì)(經(jīng)驗(yàn))方程估計(jì)方程的求法

(Excel的輸出結(jié)果)回歸方程的顯著性檢驗(yàn)離差平方和的分解因變量y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來(lái)源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差來(lái)表示離差平方和的分解

(圖示)xyy{}}離差分解圖離差平方和的分解

(三個(gè)平方和的關(guān)系)2.兩端平方后求和有從圖上看有SST=SSR+SSE總變差平方和(SST){回歸平方和(SSR){殘差平方和(SSE){離差平方和的分解

(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說(shuō),是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和樣本決定系數(shù)

(判定系數(shù)r2

)回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間

r21,說(shuō)明回歸方程擬合的越好;r20,說(shuō)明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即r2=(r)2回歸方程的顯著性檢驗(yàn)

(線性關(guān)系的檢驗(yàn)

)檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著如果是顯著的,兩個(gè)變量之間存在線性關(guān)系如果不顯著,兩個(gè)變量之間不存在線性關(guān)系回歸方程的顯著性檢驗(yàn)

(檢驗(yàn)的步驟)提出假設(shè)H0:線性關(guān)系不顯著2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若FF,拒絕H0;若F<F,接受H0回歸方程的顯著性檢驗(yàn)

(方差分析表)(續(xù)前例)Excel

輸出的方差分析表平方和均方估計(jì)標(biāo)準(zhǔn)誤差Sy

(總體方差的估計(jì))實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根反映實(shí)際觀察值在回歸直線周?chē)姆稚顩r從另一個(gè)角度說(shuō)明了回歸直線的擬合程度計(jì)算公式為注:上例的計(jì)算結(jié)果為1.8286回歸系數(shù)的顯著性檢驗(yàn)

(要點(diǎn))2.在一元線性回歸中,等價(jià)于回歸方程的顯著性檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說(shuō),檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著回歸系數(shù)的顯著性檢驗(yàn)

(樣本統(tǒng)計(jì)量的分布)

是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布由于無(wú)未知,需用其估計(jì)量Sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差回歸系數(shù)的顯著性檢驗(yàn)

(步驟)提出假設(shè)H0:b2=0(沒(méi)有線性關(guān)系)H1:b2

0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,接受H0回歸系數(shù)的顯著性檢驗(yàn)

(實(shí)例)提出假設(shè)H0:b2=0人均收入與人均食品之間無(wú)線性關(guān)系H1:b2

0人均收入與人均食品之間有線性關(guān)系計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

t=10.07>t

(13)=2.160,拒絕H0,表明人均收入與人均食品支出之間有線性關(guān)系對(duì)前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)預(yù)測(cè)及應(yīng)用利用回歸方程進(jìn)行預(yù)測(cè)根據(jù)自變量x

的取值估計(jì)或預(yù)測(cè)因變量y的取值估計(jì)或預(yù)測(cè)的類型點(diǎn)估計(jì)或點(diǎn)預(yù)測(cè)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)(區(qū)間預(yù)測(cè))y的平均值的區(qū)間估計(jì)y的個(gè)別值的區(qū)間估計(jì)利用回歸方程進(jìn)行預(yù)測(cè)

(點(diǎn)估計(jì))2.點(diǎn)估計(jì)值有y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)3.在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對(duì)于自變量x的一個(gè)給定值x0

,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值利用回歸方程進(jìn)行預(yù)測(cè)

(點(diǎn)估計(jì))

y的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)人均收入為200元時(shí),所有家庭人均食品支出的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得利用回歸方程進(jìn)行預(yù)測(cè)

(點(diǎn)估計(jì))

y的個(gè)別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)2.比如,如果我們只是想知道某家庭人均收入為200元時(shí)的人均食品支出是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得利用回歸方程進(jìn)行預(yù)測(cè)

(區(qū)間估計(jì))點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y0

的平均值或y0的一個(gè)估計(jì)區(qū)間(前者通常稱為區(qū)間估計(jì)問(wèn)題,后者通常稱為預(yù)測(cè)問(wèn)題)利用回歸方程進(jìn)行預(yù)測(cè)

(置信區(qū)間估計(jì))

y的平均值的置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值E(y0)的估計(jì)區(qū)間,這一估計(jì)區(qū)間稱為置信區(qū)間

E(y0)

在1-置信水平下的置信區(qū)間為式中:Sy為估計(jì)標(biāo)準(zhǔn)誤差利用回歸方程進(jìn)行預(yù)測(cè)

(置信區(qū)間估計(jì):算例)【例】根據(jù)前例,求出人均收入為200元時(shí),人均食品支出的95%的置信區(qū)間解:根據(jù)前面的計(jì)算結(jié)果=46.03,Sy=1.8286,t(15-2)=2.160,n=15

置信區(qū)間為=46.032.160×1.83=46.03±3.9528人均食品支出的95%的置信區(qū)間為42.0772

元~49.9828元之間利用回歸方程進(jìn)行預(yù)測(cè)

(預(yù)測(cè)區(qū)間估計(jì))

y的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的一個(gè)個(gè)別值y0的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間

y0在1-置信水平下的預(yù)測(cè)區(qū)間為利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)

(置預(yù)測(cè)區(qū)間估計(jì):算例)【例】根據(jù)前例,求出人均收入為200元時(shí),人均食品支出的95%的預(yù)測(cè)區(qū)間解:根據(jù)前面的計(jì)算結(jié)果有=46.03,Sy=14.95,t(15-2)=2.160,n=15

置信區(qū)間為=46.032.16×2.5852人均食品支出的95%的預(yù)測(cè)區(qū)間為40.45元~51.61元之間影響區(qū)間寬度的因素1. 置信水平(1-)區(qū)間寬度隨置信水平的增大而增大2. 數(shù)據(jù)的離散程度(s)區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測(cè)的x與x的差異程度區(qū)間寬度隨x與x的差異程度的增大而增大置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程第三節(jié)多元線性回歸一.多元線性回歸模型回歸參數(shù)的估計(jì)回歸方程的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)多元線性回歸的預(yù)測(cè)多元線性回歸模型多元線性回歸模型

(概念要點(diǎn))對(duì)于n組實(shí)際觀察數(shù)據(jù)(yi;xi1,,xi2

,,xip),(i=1,2,…,n),多元線性回歸模型可表示為y1

=b0+b1x11+b2x12

++

bpx1p

+e1y2=b0+b1x21

+b2x22

++

bpx2p

+e2

yn=b0+b1xn1

+b2xn2

++

bpxnp

+en{……多元線性回歸模型

(基本假定)自變量x1,x2,…,xp是確定性變量,不是隨機(jī)變量,且自變量之間不存在多重共線性隨機(jī)誤差項(xiàng)ε的期望值為0,且方差σ2都相同。誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,即ε~N(0,σ2),且相互獨(dú)立。多元線性回歸方程

(概念要點(diǎn))描述y的平均值或期望值如何依賴于x1,x1

,…,xp的方程稱為多元線性回歸方程多元線性回歸方程的形式為

E(y)=0+1x1

+2x2

+…+

pxpb1,b2,,bp稱為偏回歸系數(shù)

bi

表示假定其他變量不變,當(dāng)xi

每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值多元線性回歸方方程的直觀解釋二元線性回歸模型(觀察到的y)回歸面0ix1yx2(x1,x2)}多元線性回歸的估計(jì)(經(jīng)驗(yàn))方程總體回歸參數(shù)是未知的,利用樣本數(shù)據(jù)去估計(jì)用樣本統(tǒng)計(jì)量代替回歸方程中的未知參數(shù)

即得到估計(jì)的回歸方程

是估計(jì)值是y

的估計(jì)值參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘法

(要點(diǎn))根據(jù)最小二乘法的要求,可得求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得

。即回歸方程的顯著性檢驗(yàn)多重樣本決定系數(shù)

(多重判定系數(shù)R2

)回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間

R21,說(shuō)明回歸方程擬合的越好;R20,說(shuō)明回歸方程擬合的越差等于多重相關(guān)系數(shù)(復(fù)相關(guān)系數(shù)R)的平方,即

R2=(R)2修正的多重樣本決定系數(shù)

(修正的多重判定系數(shù)R2

)由于增加自變量將影響到因變量中被估計(jì)的回歸方程所解釋的變異性的數(shù)量,為避免高估這一影響,需要用自變量的數(shù)目去修正R2的值用n表示觀察值的數(shù)目,p表示自變量的數(shù)目,修正的多元判定系數(shù)的計(jì)算公式可表示為回歸方程的顯著性檢驗(yàn)

(步驟)提出假設(shè)H0:12p=0線性關(guān)系不顯著H1:1,2,,p至少有一個(gè)不等于02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F3.確定顯著性水平和分子自由度p、分母自由度n-p-1找出臨界值F4.作出決策:若FF,拒絕H0;若F<F,接受H0回歸系數(shù)的顯著性檢驗(yàn)

(要點(diǎn))如果F檢驗(yàn)已經(jīng)表明了回歸模型總體上是顯著的,那么回歸系數(shù)的檢驗(yàn)就是用來(lái)確定每一個(gè)單個(gè)的自變量xi

對(duì)因變量y的影響是否顯著對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn)應(yīng)用t

檢驗(yàn)在多元線性回歸中,回歸方程的顯著性檢驗(yàn)不再等價(jià)于回歸系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)

(步驟)提出假設(shè)H0:bi=0(自變量xi與

因變量y沒(méi)有線性關(guān)系)H1:bi

0(自變量xi與

因變量y有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t

確定顯著性水平,并進(jìn)行決策tt,拒絕H0;t<t,接受H0一個(gè)二元線性回歸的例子銷售額、人口數(shù)和年人均收入數(shù)據(jù)地區(qū)編號(hào)銷售額(萬(wàn)元)y人口數(shù)(萬(wàn)人)x1年人均收入(元)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570【例】一家百貨公司在10個(gè)地區(qū)設(shè)有經(jīng)銷分公司。公司認(rèn)為商品銷售額與該地區(qū)的人口數(shù)和年人均收入有關(guān),并希望建立它們之間的數(shù)量關(guān)系式,以預(yù)測(cè)銷售額。有關(guān)數(shù)據(jù)如下表。試確定銷售額對(duì)人口數(shù)和年人均收入的線性回歸方程,并分析回歸方程的擬合程度,對(duì)線性關(guān)系和回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)。一個(gè)二元線性回歸的例子

(Excel輸出的結(jié)果)一個(gè)二元線性回歸的例子

(計(jì)算機(jī)輸出結(jié)果解釋)銷售額與人口數(shù)和年人均收入的二元回歸方程為

多重判定系數(shù)R2=0.9373;調(diào)整后的R2=0.9194

回歸方程的顯著性檢驗(yàn)F=52.3498F>F0.05(2,7)=4.74,回歸方程顯著回歸系數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論