第十一一元線性回歸演示文稿_第1頁
第十一一元線性回歸演示文稿_第2頁
第十一一元線性回歸演示文稿_第3頁
第十一一元線性回歸演示文稿_第4頁
第十一一元線性回歸演示文稿_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十一一元線性回歸演示文稿現(xiàn)在是1頁\一共有48頁\編輯于星期五(優(yōu)選)第十一一元線性回歸現(xiàn)在是2頁\一共有48頁\編輯于星期五學(xué)習(xí)目標(biāo)1. 掌握相關(guān)系數(shù)的分析方法掌握一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)3.能利用回歸方程進(jìn)行估計(jì)和預(yù)測4.用Excel

進(jìn)行回歸現(xiàn)在是3頁\一共有48頁\編輯于星期五§11.1變量間關(guān)系的度量變量間的關(guān)系相關(guān)關(guān)系的描述與測度現(xiàn)在是4頁\一共有48頁\編輯于星期五一、變量間的關(guān)系現(xiàn)在是5頁\一共有48頁\編輯于星期五(一)函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點(diǎn)落在一條線上

xy現(xiàn)在是6頁\一共有48頁\編輯于星期五(二)相關(guān)關(guān)系

(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量

x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測點(diǎn)分布在直線周圍

xy現(xiàn)在是7頁\一共有48頁\編輯于星期五相關(guān)關(guān)系

(類型)現(xiàn)在是8頁\一共有48頁\編輯于星期五二、相關(guān)關(guān)系的描述與測度

現(xiàn)在是9頁\一共有48頁\編輯于星期五(一)散點(diǎn)圖

(scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)現(xiàn)在是10頁\一共有48頁\編輯于星期五散點(diǎn)圖

(例題分析)【例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的提高,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)現(xiàn)在是11頁\一共有48頁\編輯于星期五散點(diǎn)圖

(例題分析)現(xiàn)在是12頁\一共有48頁\編輯于星期五散點(diǎn)圖

(例題分析)現(xiàn)在是13頁\一共有48頁\編輯于星期五(二)相關(guān)系數(shù)

(correlationcoefficient)對變量之間關(guān)系密切程度的度量對兩個(gè)變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r現(xiàn)在是14頁\一共有48頁\編輯于星期五相關(guān)系數(shù)

(計(jì)算公式)

樣本相關(guān)系數(shù)的計(jì)算公式或化簡為現(xiàn)在是15頁\一共有48頁\編輯于星期五相關(guān)系數(shù)

(取值及其意義)

r

的取值范圍是[-1,1]

|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)

r=0,不存在線性相關(guān)關(guān)系相關(guān)

-1r<0,為負(fù)相關(guān)

0<r1,為正相關(guān)

|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切現(xiàn)在是16頁\一共有48頁\編輯于星期五相關(guān)系數(shù)

(例題分析)用Excel計(jì)算相關(guān)系數(shù)現(xiàn)在是17頁\一共有48頁\編輯于星期五§11.2一元線性回歸一元線性回歸模型參數(shù)的最小二乘估計(jì)現(xiàn)在是18頁\一共有48頁\編輯于星期五什么是回歸分析?

(Regression)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度現(xiàn)在是19頁\一共有48頁\編輯于星期五回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x

變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x

可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制現(xiàn)在是20頁\一共有48頁\編輯于星期五回歸模型的類型現(xiàn)在是21頁\一共有48頁\編輯于星期五一、一元線性回歸模型現(xiàn)在是22頁\一共有48頁\編輯于星期五(一)一元線性回歸涉及一個(gè)自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測或被解釋的變量稱為因變量(dependentvariable),用y表示用來預(yù)測或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一條線性方程來表示現(xiàn)在是23頁\一共有48頁\編輯于星期五(二)回歸模型

(regressionmodel)回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個(gè)數(shù)字的因變量(響應(yīng)變量)被預(yù)測的變量1個(gè)或多個(gè)數(shù)字的或分類的自變量(解釋變量)用于預(yù)測的變量3. 主要用于預(yù)測和估計(jì)現(xiàn)在是24頁\一共有48頁\編輯于星期五一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)

的方程稱為回歸模型一元線性回歸模型可表示為

y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)

是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)現(xiàn)在是25頁\一共有48頁\編輯于星期五一元線性回歸模型

(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。對于一個(gè)給定的x值,y的期望值為E(y)=0+

1x對于所有的x值,ε的方差σ2都相同誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即ε~N(0,σ2)獨(dú)立性意味著對于一個(gè)特定的x值,它所對應(yīng)的ε與其他x值所對應(yīng)的ε不相關(guān)對于一個(gè)特定的x值,它所對應(yīng)的y值與其他x所對應(yīng)的y值也不相關(guān)現(xiàn)在是26頁\一共有48頁\編輯于星期五(三)回歸方程

(regressionequation)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下

E(y)=0+1x方程的圖示是一條直線,也稱為直線回歸方程0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值現(xiàn)在是27頁\一共有48頁\編輯于星期五估計(jì)的回歸方程

(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程總體回歸參數(shù)和

是未知的,必需利用樣本數(shù)據(jù)去估計(jì)其中:是估計(jì)的回歸直線在y

軸上的截距,是直線的斜率,它表示對于一個(gè)給定的x

的值,是y

的估計(jì)值,也表示x

每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值

現(xiàn)在是28頁\一共有48頁\編輯于星期五二、參數(shù)的最小二乘估計(jì)現(xiàn)在是29頁\一共有48頁\編輯于星期五(一)最小二乘估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小現(xiàn)在是30頁\一共有48頁\編輯于星期五最小二乘估計(jì)

(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^現(xiàn)在是31頁\一共有48頁\編輯于星期五最小二乘法

(

和的計(jì)算公式)

根據(jù)最小二乘法的要求,可得求解和的公式如下現(xiàn)在是32頁\一共有48頁\編輯于星期五估計(jì)方程的求法

(例題分析)【例】求不良貸款對貸款余額的回歸方程回歸方程為:y=-0.8295+0.037895x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元

現(xiàn)在是33頁\一共有48頁\編輯于星期五估計(jì)方程的求法

(例題分析)不良貸款對貸款余額回歸方程的圖示現(xiàn)在是34頁\一共有48頁\編輯于星期五用Excel進(jìn)行回歸分析具體做法現(xiàn)在是35頁\一共有48頁\編輯于星期五§11.3利用回歸方程進(jìn)行

估計(jì)和預(yù)測點(diǎn)估計(jì)區(qū)間估計(jì)現(xiàn)在是36頁\一共有48頁\編輯于星期五利用回歸方程進(jìn)行估計(jì)和預(yù)測根據(jù)自變量x

的取值估計(jì)或預(yù)測因變量y的取值估計(jì)或預(yù)測的類型點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別值的預(yù)測區(qū)間估計(jì)現(xiàn)在是37頁\一共有48頁\編輯于星期五一、點(diǎn)估計(jì)現(xiàn)在是38頁\一共有48頁\編輯于星期五點(diǎn)估計(jì)2.點(diǎn)估計(jì)值有y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對于自變量x的一個(gè)給定值x0

,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值現(xiàn)在是39頁\一共有48頁\編輯于星期五

y的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)貸款余額為100億元時(shí),所有分行不良貸款的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得現(xiàn)在是40頁\一共有48頁\編輯于星期五y的個(gè)別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y

的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)比如,如果我們只是想知道貸款余額為72.8億元的那個(gè)分行(這里是編號為10的那個(gè)分行)的不良貸款是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得現(xiàn)在是41頁\一共有48頁\編輯于星期五二、區(qū)間估計(jì)現(xiàn)在是42頁\一共有48頁\編輯于星期五區(qū)間估計(jì)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對于自變量

x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)(confidenceintervalestimate)預(yù)測區(qū)間估計(jì)(predictionintervalestimate)現(xiàn)在是43頁\一共有48頁\編輯于星期五置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值的估計(jì)區(qū)間,這一估計(jì)區(qū)間稱為置信區(qū)間(confidenceinterval)

E(y0)

在1-置信水平下的置信區(qū)間為式中:sy為估計(jì)標(biāo)準(zhǔn)誤差現(xiàn)在是44頁\一共有48頁\編輯于星期五置信區(qū)間估計(jì)

(例題分析)

【例】求出貸款余額為100億元時(shí),不良貸款95%

的置信區(qū)間

解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,

sy=1.9799,t(25-2)=2.0687

置信區(qū)間為當(dāng)貸款余額為100億元時(shí),不良貸款的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論