教育學相關與回歸分析全_第1頁
教育學相關與回歸分析全_第2頁
教育學相關與回歸分析全_第3頁
教育學相關與回歸分析全_第4頁
教育學相關與回歸分析全_第5頁
已閱讀5頁,還剩109頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

不要過于教條地對待研究的結(jié)果,尤其當數(shù)據(jù)的質(zhì)量受到懷疑時。

——DamodarN.Gujarati統(tǒng)計名言第八章相關與回歸分析8.1

相關分析8.2一元線性回歸分析8.3多元線性回歸分析8.4非線性回歸分析

學習目標相關關系的分析參數(shù)的最小二乘估計回歸直線的擬合優(yōu)度回歸方程的顯著性檢驗利用回歸方程進行預測用Excel

和SPSS進行回歸子代與父代一樣嗎?Galton被譽為現(xiàn)代回歸和相關技術的創(chuàng)始人。1875年,Galton利用豌豆實驗來確定尺寸的遺傳規(guī)律。他挑選了7組不同尺寸的豌豆,并說服他在英國不同地區(qū)的朋友每一組種植10粒種子,最后把原始的豌豆種子(父代)與新長的豌豆種子(子代)進行尺寸比較。當結(jié)果被繪制出來之后,他發(fā)現(xiàn)并非每一個子代都與父代一樣,不同的是,尺寸小的豌豆會得到更大的子代,而尺寸大的豌豆卻得到較小的子代。Galton把這一現(xiàn)象叫做“返祖”(趨向于祖先的某種平均類型),后來又稱之為“向平均回歸”。一個總體中在某一時期具有某一極端特征(低于或高于總體均值)的個體在未來的某一時期將減弱它的極端性(或者是單個個體或者是整個子代),這一趨勢現(xiàn)在被稱作“回歸效應”。人們發(fā)現(xiàn)它的應用很廣,而不僅限于從一代到下一代豌豆大小問題子代與父代一樣嗎?正如Galton進一步發(fā)現(xiàn)的那樣,平均來說,非常矮小的父輩傾向于有偏高的子代;而非常高大的父輩則傾向于有偏矮的子代。在第一次考試中成績最差的那些學生在第二次考試中傾向于有更好的成績(比較接近所有學生的平均成績),而第一次考試中成績最好的那些學生在第二次考試中則傾向于有較差的成績(同樣比較接近所有學生的平均成績)。同樣,平均來說,第一年利潤最低的公司第二年不會最差,而第一年利潤最高的公司第二年則不會是最好的如果把父代和子代看作兩個變量,找出這兩個變量的關系,并根據(jù)這種關系建立適當?shù)臄?shù)學模型,就可以根據(jù)父代的數(shù)值預測子代的取值,這就是經(jīng)典的回歸方法要解決的問題。學完本章的內(nèi)容你會對回歸問題有更深入的理解

8.1變量間的關系

8.1.1變量間是什么樣的關系?

8.1.2用散點圖描述相關關系

8.1.3用相關系數(shù)度量關系強度第8章相關與回歸分析怎樣分析變量間的關系?建立回歸模型時,首先需要弄清楚變量之間的關系。分析變量之間的關系需要解決下面的問題變量之間是否存在關系?如果存在,它們之間是什么樣的關系?變量之間的關系強度如何?樣本所反映的變量之間的關系能否代表總體變量之間的關系?8.1.1變量間是什么樣的關系?8.1變量間的關系

xy函數(shù)關系是一一對應的確定關系設有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當變量x取某個數(shù)值時,

y依確定的關系取相應的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點落在一條線上

函數(shù)關系(幾個例子)

函數(shù)關系的例子某種商品的銷售額y與銷售量x之間的關系可表示為

y=px

(p為單價)圓的面積S與半徑之間的關系可表示為S=

R2

企業(yè)的原材料消耗額y與產(chǎn)量x1

、單位產(chǎn)量消耗x2

、原材料價格x3之間的關系可表示為

y=x1x2x3

相關關系

(幾個例子)子女的身高與其父母身高的關系從遺傳學角度看,父母身高較高時,其子女的身高一般也比較高。但實際情況并不完全是這樣,因為子女的身高并不完全是由父母身高一個因素所決定的,還有其他許多因素的影響一個人的收入水平同他受教育程度的關系收入水平相同的人,他們受教育的程度也可能不同,而受教育程度相同的人,他們的收入水平也往往不同。因為收入水平雖然與受教育程度有關系,但它并不是決定收入的惟一因素,還有職業(yè)、工作年限等諸多因素的影響農(nóng)作物的單位面積產(chǎn)量與降雨量之間的關系在一定條件下,降雨量越多,單位面積產(chǎn)量就越高。但產(chǎn)量并不是由降雨量一個因素決定的,還有施肥量、溫度、管理水平等其他許多因素的影響相關關系

(correlation)一個變量的取值不能由另一個變量唯一確定當變量

x取某個值時,變量y的取值對應著一個分布各觀測點分布在直線周圍

變量之間存在非嚴格確定的依存關系y

x

相關關系(幾個例子)

相關關系的例子父親身高y與子女身高x之間的關系收入水平y(tǒng)與受教育程度x之間的關系糧食畝產(chǎn)量y與施肥量x1

、降雨量x2

、溫度x3之間的關系商品的消費量y與居民收入x之間的關系商品銷售額y與廣告費支出x之間的關系相關關系的分類按變量的多少分為:單相關、復相關和偏相關按相關程度分為:完全相關、不完全相關和不相關按相關形式分為:線性相關和非線性相關按相關方向分為:正相關和負相關按相關性質(zhì)分為:真實相關和虛假相關8.1.2用相關表、相關圖描述相關關系8.1變量間的關系相關表和相關圖相關表是一種反映變量之間相關關系的統(tǒng)計表。將某一變量按其取值的大小排列,然后再將與其相關的另一變量的對應值平行排列,便可得到簡單的相關表。如前表8.1所示相關圖又稱散點圖。它是以直角坐標系的橫軸代表變量x,縱軸代表變量Y,將兩個變量間相對應的變量值用坐標點的形式描繪出來,用來反映兩變量之間的相關關系的圖形。缺點:二者是研究相關關系的直觀工具,它們只能對現(xiàn)象之間存在的相關關系的方向、形式、密切程度作大致判斷,不能說明具體相關關系的密切程度。因此需要計算相關系數(shù)。8.1.2用散點圖描述相關關系8.1變量間的關系

完全負線性相關完全正線性相關

散點圖

(scatterdiagram)

不相關

負線性相關

正線性相關

非線性相關

完全負線性相關(散點圖舉例)從下圖可以看出,居民的消費支出和可支配收入之間呈現(xiàn)正線性相關關系

8.1.3用相關系數(shù)度量關系強度8.1變量間的關系2)相關系數(shù)(correlationcoefficient)對變量之間關系密切程度的度量對兩個變量之間線性相關程度的度量稱為簡單相關系數(shù)反映一個因變量與兩個及兩個以上變量之間相關程度的統(tǒng)計分析指標稱為復相關系數(shù)。偏相關系數(shù)是指在多元相關分析中考慮其他變量但假定其保持不變的情況下計算出來的反映兩個變量之間相關程度的統(tǒng)計分析方法。若相關系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關系數(shù),記為

若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關系數(shù),記為

r相關系數(shù)的計算公式(記?。?/p>

樣本相關系數(shù)的計算公式或化簡為相關系數(shù)的性質(zhì)性質(zhì)1:r

的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負正相關r=0,不存在線性相關關系(并不說明不存在關系)-1

r<0,為負相關0<r

1,為正相關|r|越趨于1表示關系越強;|r|越趨于0表示關系越弱相關系數(shù)的性質(zhì)性質(zhì)2:r具有對稱性。即x與y之間的相關系數(shù)和y與x之間的相關系數(shù)相等,即rxy=ryx性質(zhì)3:r數(shù)值大小與x和y原點及尺度無關,即改變x和y的數(shù)據(jù)原點及計量尺度,并不改變r數(shù)值大小性質(zhì)4:僅僅是x與y之間線性關系的一個度量,它不能用于描述非線性關系。這意為著,r=0只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有任何關系性質(zhì)5:r雖然是兩個變量之間線性關系的一個度量,卻不一定意味著x與y一定有因果關系取值及其意義-1.0+1.00-0.5+0.5完全負相關無線性相關完全正相關負相關程度增加r正相關程度增加相關系數(shù)的經(jīng)驗解釋|r|

0.8時,可視為兩個變量之間高度相關0.5

|r|<0.8時,可視為中度相關0.3

|r|<0.5時,視為低度相關|r|<0.3時,說明兩個變量之間的相關程度極弱,可視為不相關上述解釋必須建立在對相關系數(shù)的顯著性進行檢驗的基礎之上3.相關關系的顯著性檢驗1)r

的抽樣分布r是依據(jù)樣本數(shù)據(jù)計算的,根據(jù)一個樣本的相關系數(shù)能否說明總體的相關性呢?這需對樣本相關系數(shù)的顯著性進行檢驗。樣本相關系數(shù)的理論分布函數(shù)是很復雜的。r的抽樣分布隨總體相關系數(shù)和樣本容量的大小而變化。在進行這項檢驗時,通常假設x與y是正態(tài)變量,如果總體相關系數(shù)

=0,則樣本相關系數(shù)r服從t分布2)檢驗的步驟1. 檢驗兩個變量之間是否存在線性相關關系等價于對回歸系數(shù)b1的檢驗采用R.A.Fisher提出的

t檢驗檢驗的步驟為提出假設:H0:

;H1:

0

計算檢驗的統(tǒng)計量:

確定顯著性水平

,并作出決策若

t

>t

,拒絕H0

t

<t

,不能拒絕H0

8.2一元線性回歸的估計和檢驗

8.2.1一元線性回歸模型

8.2.2參數(shù)的最小二乘估計

8.2.3回歸直線的擬合優(yōu)度

8.2.4顯著性檢驗第8章一元線性回歸分析8.2.1一元線性回歸分析8.2一元線性回歸的估計和檢驗什么是回歸分析?

(regressionanalysis)回歸分析是指根據(jù)相關關系的具體形態(tài),選擇合適的數(shù)學模型(回歸方程),近似地描述變量間的平均變化關系的一種統(tǒng)計分析方法?;貧w分析實際上是相關現(xiàn)象間不確定、不規(guī)則的數(shù)量關系的一般化、規(guī)律化?;貧w分析采用的方法是配合直線或曲線來反映現(xiàn)象之間的一般數(shù)量關系。這條直線或曲線叫回歸直線或回歸曲線,它們的方程稱為回歸直線方程或回歸曲線方程。

回歸的古典和現(xiàn)代意義1.回歸的古典意義:高爾頓遺傳學的回歸概念父母身高與子女身高的關系:

無論高個子或低個子的子女都有向人的平均身高回歸的趨勢2.回歸的現(xiàn)代意義:一個因變量對若干解釋變量依存關系的研究回歸的目的(實質(zhì)):

由固定的自變量去估計因變量的平均值相關分析與回歸分析的聯(lián)系簡單說:(1)相關分析是回歸分析的基礎和前提。如果缺少相關分析,沒有從定性上說明現(xiàn)象間是否存在相關關系及相關關系的密切程度,就無法進行回歸分析。

(2)回歸分析是相關分析的深入和繼續(xù)。僅僅說明現(xiàn)象間具有密切的相關關系是不夠的,只有進行回歸分析,擬合回歸方程,才可能進行深入分析和回歸預測,相關分析才有實際應用價值?;貧w分析與相關分析的區(qū)別相關分析中,變量x

變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預測因變量的變化相關分析中所涉及的變量x和y都是隨機變量;回歸分析中,因變量y是隨機變量,自變量x

可以是隨機變量,也可以是非隨機的確定變量相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進行預測和控制

二、回歸分析的種類(一)按回歸分析中自變量的個數(shù)不同

1.簡單回歸/一元回歸:在回歸關系中包含兩個變量,一個是具有確定性的自變量;另一個稱因變量,是隨機變量。

2.多元回歸:在回歸關系中包含三個或以上的變量,一個是因變量,是隨機變量;其他變量是具有確定性的自變量。(二)按回歸線的形狀

1.直線回歸:變量間變化的規(guī)律近似于線性關系,從散點圖看,表示變量關系的點接近于一條直線。

2.非直線回歸:變量間變化的規(guī)律不是線性關系,從散點圖看,表示變量關系的點接近于一條曲線。一元線性回歸涉及一個自變量的回歸因變量y與自變量x之間為線性關系被預測或被解釋的變量稱為因變量(dependentvariable),用y表示用來預測或用來解釋因變量的一個或多個變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關系用一個線性方程來表示一元線性回歸模型

(linearregressionmodel)描述因變量y如何依賴于自變量x和誤差項

的方程稱為回歸模型一元線性回歸模型可表示為

y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項

是隨機變量反映了除x和y之間的線性關系之外的隨機因素對y的影響是不能由x和y之間的線性關系所解釋的變異性

0和

1稱為模型的參數(shù)一元線性回歸模型

(基本假定)

因變量y與自變量x之間具有線性關系在重復抽樣中,自變量x的取值是固定的,即假定x是非隨機的誤差項

滿足正態(tài)性。

是一個服從正態(tài)分布的隨機變量,且期望值為0,即

~N(0,

2)。對于一個給定的x值,y的期望值為E(y)=

0+

1x方差齊性。對于所有的x值,

的方差是一個特定的值,

的方差也都等于

2

,都相同。同樣,一個特定的x值,y的方差也都等于

2獨立性。獨立性意味著對于一個特定的x值,它所對應的ε與其他x值所對應的ε不相關;對于一個特定的x值,它所對應的y值與其他x所對應的y值也不相關估計的回歸方程

(estimatedregressionequation)總體回歸參數(shù)和

是未知的,必須利用樣本數(shù)據(jù)去估計用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程一元線性回歸中估計的回歸方程(經(jīng)驗回歸方程)為其中:是估計的回歸直線在y

軸上的截距,是直線的斜率,它表示對于一個給定的x

的值,是y

的估計值,也表示x

每變動一個單位時,y的平均變動值

8.2.2參數(shù)的最小二乘估計8.2一元線性回歸的估計和檢驗參數(shù)的最小二乘估計

德國科學家KarlGauss(1777—1855)提出用最小化圖中垂直方向的誤差平方和來估計參數(shù)

使因變量的觀察值與估計值之間的誤差平方和達到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關系與實際數(shù)據(jù)的誤差比其他任何直線都小KarlGauss的最小化圖xy(xn,yn)(x1,y1)

(x2,y2)(xi,yi)ei=yi-yi^參數(shù)的最小二乘估計

(

和的計算公式)

根據(jù)最小二乘法,可得求解和的公式如下參數(shù)的最小二乘估計8.2.3回歸直線的擬合優(yōu)度8.2一元線性回歸的估計和檢驗變差因變量

y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面:由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示誤差分解圖xyy

誤差平方和的分解

(誤差平方和的關系)

SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{誤差平方和的分解

(三個平方和的意義)總平方和(SST—totalsumofsquares)反映因變量的n個觀察值與其均值的總誤差回歸平方和(SSR—sumofsquaresofregression)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE—sumofsquaresoferror)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和樣本決定系數(shù)R2

(coefficientofdetermination)回歸平方和占總誤差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間

R2

1,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差決定系數(shù)平方根等于相關系數(shù)

估計標準誤差

實際觀察值與回歸估計值誤差平方和的均方根反映實際觀察值在回歸直線周圍的分散狀況對誤差項

的標準差

的估計,是在排除了x對y的線性影響后,y隨機波動大小的一個估計量反映用估計的回歸方程預測y時預測誤差的大小

計算公式為回歸標準差越小,表明實際觀測值與所擬合的樣本回歸線的離差程度越小,即回歸線具有較強的代表性。8.2.4顯著性檢驗8.2一元線性回歸的估計和檢驗回歸方程的顯著性檢驗檢驗自變量與因變量之間的線性關系是否顯著將回歸均方(MSR)同殘差均方(MSE)加以比較,應用F檢驗來分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應的自由度(自變量的個數(shù)k)殘差均方:殘差平方和SSE除以相應的自由度(n-k-1)回歸方程的顯著性檢驗

(檢驗的步驟)

提出假設H0:

1=0線性關系不顯著2.計算檢驗統(tǒng)計量F確定顯著性水平

,并根據(jù)分子自由度1和分母自由度n-2求統(tǒng)計量的P值作出決策:若P<,拒絕H0。表明兩個變量之間的線性關系顯著作出決策:若F>F

,拒絕H0線性關系顯著回歸系數(shù)的檢驗和推斷在一元線性回歸中,等價于線性關系的顯著性檢驗采用t檢驗檢驗x與y之間是否具有線性關系,或者說,檢驗自變量x對因變量y的影響是否顯著理論基礎是回歸系數(shù)

的抽樣分布

回歸系數(shù)的檢驗和推斷

提出假設H0:b1=0(沒有線性關系)H1:b1

0(有線性關系)計算檢驗的統(tǒng)計量3.確定顯著性水平

,計算出統(tǒng)計量的P值,并做出決策P<,拒絕H0,表明自變量是影響因變量的一個顯著因素

t

>t

(n-2),拒絕H0;

t

<t

(n-2),不能拒絕H0回歸系數(shù)的檢驗和推斷

(b1和b0的置信區(qū)間)

b1在1-

置信水平下的置信區(qū)間為2.b0在1-

置信水平下的置信區(qū)間為三種檢驗的關系在一元線性回歸分析中,回歸系數(shù)顯著性的t檢驗、回歸方程顯著性的F檢驗,相關系數(shù)顯著性t檢驗,三者等價的,檢驗結(jié)果是完全一致的。對一元線性回歸,只做其中的一種檢驗即可。

8.3利用回歸方程進行預測

8.3.1平均值的置信區(qū)間

8.3.2個別值的預測區(qū)間第8章一元線性回歸區(qū)間估計對于自變量

x的一個給定值x0,根據(jù)回歸方程得到因變量y的一個估計區(qū)間區(qū)間估計有兩種類型置信區(qū)間估計(confidenceintervalestimate)預測區(qū)間估計(predictionintervalestimate)8.3.1平均值的置信區(qū)間8.3利用回歸方程進行預測平均值的置信區(qū)間利用估計的回歸方程,對于自變量x的一個給定值x0

,求出因變量y

的平均值的估計區(qū)間,這一估計區(qū)間稱為置信區(qū)間(confidenceinterval)

E(y0)

在1-

置信水平下的置信區(qū)間為式中:為估計標準誤差個別值的預測區(qū)間利用估計的回歸方程,對于自變量x的一個給定值x0

,求出因變量y

的一個個別值的估計區(qū)間,這一區(qū)間稱為預測區(qū)間(predictioninterval)

y0在1-

置信水平下的預測區(qū)間為注意!殘差

(residual)因變量的觀測值與根據(jù)估計的回歸方程求出的預測值之差,用e表示反映了用估計的回歸方程去預測而引起的誤差可用于確定有關誤差項

的假定是否成立用于檢測有影響的觀測值殘差圖

(residualplot)表示殘差的圖形關于x的殘差圖關于y的殘差圖標準化殘差圖用于判斷誤差

的假定是否成立檢測有影響的觀測值殘差圖(形態(tài)及判別)

(a)滿意模式

殘差x

0

(b)非常數(shù)方差

殘差x

0

(c)模型不合適

殘差x

0

若所有的x值,的方差都相同,而且假設描述變量x和y之間的關系的回歸模型是合理的,那么殘差圖中的所有點都應落在一條水平帶中間。第三節(jié)多元線性回歸PowerPoint統(tǒng)計學多元線性回歸11.1

多元線性回歸模型11.2

回歸方程的擬合優(yōu)度11.3顯著性檢驗11.4

利用回歸方程進行估計和預測11.5非線性回歸學習目標1.回歸模型、回歸方程、估計的回歸方程2.回歸方程的擬合優(yōu)度回歸方程的顯著性檢驗利用回歸方程進行估計和預測非線性回歸用Excel進行回歸分析多元線性回歸模型1.1多元回歸模型與回歸方程1.2估計的多元回歸方程1.3參數(shù)的最小二乘估計多元回歸模型與回歸方程多元回歸模型

(multipleregressionmodel)一個因變量與兩個及兩個以上自變量的回歸描述因變量y如何依賴于自變量x1

,x2

,…,

xk

和誤差項

的方程,稱為多元回歸模型涉及k個自變量的多元回歸模型可表示為

b0

,b1,b2

,,bk是參數(shù)

是被稱為誤差項的隨機變量

y是x1,,x2

,

,xk

的線性函數(shù)加上誤差項

包含在y里面但不能被k個自變量的線性關系所解釋的變異性多元線性回歸模型

(基本假定)誤差項ε是一個期望值為0的隨機變量,即E(

)=0對于自變量x1,x2,…,xk的所有值,

的方差

2都相同誤差項ε是一個服從正態(tài)分布的隨機變量,即ε~N(0,

2),且相互獨立理論回歸方程

(multipleregressionequation)描述因變量y的平均值或期望值如何依賴于自變量x1,x2

,…,xk的方程多元線性回歸方程的形式為

E(y)=

0+

1x1

+

2x2

+…+

k

xkb1,b2,,bk稱為偏回歸系數(shù)

bi

表示假定其他變量不變,當xi

每變動一個單位時,y的平均變動值二元回歸方程的直觀解釋二元線性回歸模型(觀察到的y)回歸面

0

ix1yx2(x1,x2)}估計的多元回歸方程估計的多元回歸的方程

(estimatedmultipleregressionequation)用樣本統(tǒng)計量估計回歸方程中的參數(shù)

時得到的方程由最小二乘法求得一般形式為

是的估計值是y

的估計值參數(shù)的最小二乘估計參數(shù)的最小二乘法求解各回歸參數(shù)的標準方程如下使因變量的觀察值與估計值之間的離差平方和達到最小來求得

。即參數(shù)的最小二乘法

(例題分析)【例】一家大型商業(yè)銀行在多個地區(qū)設有分行,為弄清楚不良貸款形成的原因,抽取了該銀行所屬的25家分行2002年的有關業(yè)務數(shù)據(jù)。試建立不良貸款y與貸款余額x1、累計應收貸款x2、貸款項目個數(shù)x3和固定資產(chǎn)投資額x4的線性回歸方程,并解釋各回歸系數(shù)的含義

參數(shù)的最小二乘估計

(例題分析)F檢驗t檢驗偏回歸系數(shù)回歸方程的擬合優(yōu)度2.1多重判定系數(shù)2.2估計標準誤差樣本決定系數(shù)樣本復決定系數(shù)

(multiplecoefficientofdetermination)

回歸平方和占總平方和的比例計算公式為因變量取值的變差中,能被估計的多元回歸方程所解釋的比例樣本復相關系數(shù)為:R==調(diào)整后的決定系數(shù)

(adjustedmultiplecoefficientofdetermination)

用樣本量n和自變量的個數(shù)k去修正R2得到計算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2

Excel輸出結(jié)果的分析樣本復相關系數(shù)

(multiplecorrelationcoefficient)

樣本決定系數(shù)的平方根R反映因變量y與k個自變量之間的相關程度實際上R度量的是因變量的觀測值與由多元回歸方程得到的預測值之間的關系強度,即樣本復相關系數(shù)R等于因變量的觀測值與估計值之間的簡單相關系數(shù)即

估計標準誤差

對誤差項

的標準差

的一個估計值衡量多元回歸方程的擬合優(yōu)度計算公式為

Excel輸出結(jié)果的分析顯著性檢驗3.1回歸方程顯著性的F檢驗3.2回歸系數(shù)檢驗和推斷回歸方程顯著性的F檢驗回歸方程顯著性的F檢驗檢驗因變量與所有自變量之間的線性關系是否顯著也被稱為總體的顯著性檢驗檢驗方法是將回歸均方(MSR)同殘差均方(MSE)加以比較,應用F檢驗來分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關系如果不顯著,因變量與自變量之間不存在線性關系回歸方程的顯著性檢驗提出假設H0:

1

2

k=0線性關系不顯著H1:

1,

2,

k至少有一個不等于02.計算檢驗統(tǒng)計量F確定顯著性水平

和分子自由度k、分母自由度n-k-1找出臨界值F

4.作出決策:若F>F

,拒絕H0

Excel輸出結(jié)果的分析回歸系數(shù)檢驗和推斷回歸系數(shù)的檢驗線性關系檢驗通過后,對各個回歸系數(shù)有選擇地進行一次或多次檢驗究竟要對哪幾個回歸系數(shù)進行檢驗,通常需要在建立模型之前作出決定對回歸系數(shù)檢驗的個數(shù)進行限制,以避免犯過多的第Ⅰ類錯誤(棄真錯誤)對每一個自變量都要單獨進行檢驗應用t檢驗統(tǒng)計量回歸系數(shù)的檢驗

(步驟)提出假設H0:bi=0(自變量xi

因變量y沒有線性關系)H1:bi

0(自變量xi

因變量y有線性關系)計算檢驗的統(tǒng)計量t3.確定顯著性水平

,并進行決策

t>t

(n-k-1),拒絕H0;t<t

(n-k-1)

,不拒絕H0

Excel輸出結(jié)果的分析回歸系數(shù)的推斷

(置信區(qū)間)

回歸系數(shù)在1-

置信水平下的置信區(qū)間為

回歸系數(shù)的抽樣標準差

Excel輸出結(jié)果的分析利用回歸方程進行估計和預測軟件應用第四節(jié)非線性回歸分析一、非線性函數(shù)形式的確定

在對實際的客觀現(xiàn)象進行定量分析時,選擇回歸方程的具體形式應遵循以下原則:首先,方程形式應與有關實質(zhì)性科學的基本理論相一致。例如,采用冪函數(shù)的形式,能夠較好地表現(xiàn)生產(chǎn)函數(shù);采用多項式方程能夠較好地反映總成本與總產(chǎn)量之間的關系等等。其次,方程有較高的擬合程度。因為只有這樣,才能說明回歸方程可以較好地反映現(xiàn)實經(jīng)濟的運行情況。最后,方程的數(shù)學形式要盡可能簡單。如果幾種形式都能基本符合上述兩項要求,則應該選擇其中數(shù)學形式較簡單的一種。一般來說,數(shù)學形式越簡單,其可操作性就越強。非線性回歸1.因變量y與x之間不是線性關系2.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論