版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十一一元線性回歸演示文稿現(xiàn)在是1頁\一共有48頁\編輯于星期五(優(yōu)選)第十一一元線性回歸現(xiàn)在是2頁\一共有48頁\編輯于星期五學(xué)習(xí)目標(biāo)1. 掌握相關(guān)系數(shù)的分析方法掌握一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)3.能利用回歸方程進(jìn)行估計(jì)和預(yù)測4.用Excel
進(jìn)行回歸現(xiàn)在是3頁\一共有48頁\編輯于星期五§11.1變量間關(guān)系的度量變量間的關(guān)系相關(guān)關(guān)系的描述與測度現(xiàn)在是4頁\一共有48頁\編輯于星期五一、變量間的關(guān)系現(xiàn)在是5頁\一共有48頁\編輯于星期五(一)函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個(gè)數(shù)值時(shí),
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點(diǎn)落在一條線上
xy現(xiàn)在是6頁\一共有48頁\編輯于星期五(二)相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量
x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測點(diǎn)分布在直線周圍
xy現(xiàn)在是7頁\一共有48頁\編輯于星期五相關(guān)關(guān)系
(類型)現(xiàn)在是8頁\一共有48頁\編輯于星期五二、相關(guān)關(guān)系的描述與測度
現(xiàn)在是9頁\一共有48頁\編輯于星期五(一)散點(diǎn)圖
(scatterdiagram)不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)現(xiàn)在是10頁\一共有48頁\編輯于星期五散點(diǎn)圖
(例題分析)【例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的提高,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)現(xiàn)在是11頁\一共有48頁\編輯于星期五散點(diǎn)圖
(例題分析)現(xiàn)在是12頁\一共有48頁\編輯于星期五散點(diǎn)圖
(例題分析)現(xiàn)在是13頁\一共有48頁\編輯于星期五(二)相關(guān)系數(shù)
(correlationcoefficient)對變量之間關(guān)系密切程度的度量對兩個(gè)變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r現(xiàn)在是14頁\一共有48頁\編輯于星期五相關(guān)系數(shù)
(計(jì)算公式)
樣本相關(guān)系數(shù)的計(jì)算公式或化簡為現(xiàn)在是15頁\一共有48頁\編輯于星期五相關(guān)系數(shù)
(取值及其意義)
r
的取值范圍是[-1,1]
|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系相關(guān)
-1r<0,為負(fù)相關(guān)
0<r1,為正相關(guān)
|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切現(xiàn)在是16頁\一共有48頁\編輯于星期五相關(guān)系數(shù)
(例題分析)用Excel計(jì)算相關(guān)系數(shù)現(xiàn)在是17頁\一共有48頁\編輯于星期五§11.2一元線性回歸一元線性回歸模型參數(shù)的最小二乘估計(jì)現(xiàn)在是18頁\一共有48頁\編輯于星期五什么是回歸分析?
(Regression)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度現(xiàn)在是19頁\一共有48頁\編輯于星期五回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x
變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x
可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制現(xiàn)在是20頁\一共有48頁\編輯于星期五回歸模型的類型現(xiàn)在是21頁\一共有48頁\編輯于星期五一、一元線性回歸模型現(xiàn)在是22頁\一共有48頁\編輯于星期五(一)一元線性回歸涉及一個(gè)自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測或被解釋的變量稱為因變量(dependentvariable),用y表示用來預(yù)測或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示因變量與自變量之間的關(guān)系用一條線性方程來表示現(xiàn)在是23頁\一共有48頁\編輯于星期五(二)回歸模型
(regressionmodel)回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個(gè)數(shù)字的因變量(響應(yīng)變量)被預(yù)測的變量1個(gè)或多個(gè)數(shù)字的或分類的自變量(解釋變量)用于預(yù)測的變量3. 主要用于預(yù)測和估計(jì)現(xiàn)在是24頁\一共有48頁\編輯于星期五一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)
的方程稱為回歸模型一元線性回歸模型可表示為
y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)
是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)現(xiàn)在是25頁\一共有48頁\編輯于星期五一元線性回歸模型
(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。對于一個(gè)給定的x值,y的期望值為E(y)=0+
1x對于所有的x值,ε的方差σ2都相同誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即ε~N(0,σ2)獨(dú)立性意味著對于一個(gè)特定的x值,它所對應(yīng)的ε與其他x值所對應(yīng)的ε不相關(guān)對于一個(gè)特定的x值,它所對應(yīng)的y值與其他x所對應(yīng)的y值也不相關(guān)現(xiàn)在是26頁\一共有48頁\編輯于星期五(三)回歸方程
(regressionequation)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下
E(y)=0+1x方程的圖示是一條直線,也稱為直線回歸方程0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值現(xiàn)在是27頁\一共有48頁\編輯于星期五估計(jì)的回歸方程
(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程總體回歸參數(shù)和
是未知的,必需利用樣本數(shù)據(jù)去估計(jì)其中:是估計(jì)的回歸直線在y
軸上的截距,是直線的斜率,它表示對于一個(gè)給定的x
的值,是y
的估計(jì)值,也表示x
每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值
現(xiàn)在是28頁\一共有48頁\編輯于星期五二、參數(shù)的最小二乘估計(jì)現(xiàn)在是29頁\一共有48頁\編輯于星期五(一)最小二乘估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小現(xiàn)在是30頁\一共有48頁\編輯于星期五最小二乘估計(jì)
(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^現(xiàn)在是31頁\一共有48頁\編輯于星期五最小二乘法
(
和的計(jì)算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下現(xiàn)在是32頁\一共有48頁\編輯于星期五估計(jì)方程的求法
(例題分析)【例】求不良貸款對貸款余額的回歸方程回歸方程為:y=-0.8295+0.037895x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元
現(xiàn)在是33頁\一共有48頁\編輯于星期五估計(jì)方程的求法
(例題分析)不良貸款對貸款余額回歸方程的圖示現(xiàn)在是34頁\一共有48頁\編輯于星期五用Excel進(jìn)行回歸分析具體做法現(xiàn)在是35頁\一共有48頁\編輯于星期五§11.3利用回歸方程進(jìn)行
估計(jì)和預(yù)測點(diǎn)估計(jì)區(qū)間估計(jì)現(xiàn)在是36頁\一共有48頁\編輯于星期五利用回歸方程進(jìn)行估計(jì)和預(yù)測根據(jù)自變量x
的取值估計(jì)或預(yù)測因變量y的取值估計(jì)或預(yù)測的類型點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別值的預(yù)測區(qū)間估計(jì)現(xiàn)在是37頁\一共有48頁\編輯于星期五一、點(diǎn)估計(jì)現(xiàn)在是38頁\一共有48頁\編輯于星期五點(diǎn)估計(jì)2.點(diǎn)估計(jì)值有y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對于自變量x的一個(gè)給定值x0
,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值現(xiàn)在是39頁\一共有48頁\編輯于星期五
y的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0
,求出因變量y
的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)貸款余額為100億元時(shí),所有分行不良貸款的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得現(xiàn)在是40頁\一共有48頁\編輯于星期五y的個(gè)別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0
,求出因變量y
的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)比如,如果我們只是想知道貸款余額為72.8億元的那個(gè)分行(這里是編號為10的那個(gè)分行)的不良貸款是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得現(xiàn)在是41頁\一共有48頁\編輯于星期五二、區(qū)間估計(jì)現(xiàn)在是42頁\一共有48頁\編輯于星期五區(qū)間估計(jì)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對于自變量
x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)(confidenceintervalestimate)預(yù)測區(qū)間估計(jì)(predictionintervalestimate)現(xiàn)在是43頁\一共有48頁\編輯于星期五置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0
,求出因變量y
的平均值的估計(jì)區(qū)間,這一估計(jì)區(qū)間稱為置信區(qū)間(confidenceinterval)
E(y0)
在1-置信水平下的置信區(qū)間為式中:sy為估計(jì)標(biāo)準(zhǔn)誤差現(xiàn)在是44頁\一共有48頁\編輯于星期五置信區(qū)間估計(jì)
(例題分析)
【例】求出貸款余額為100億元時(shí),不良貸款95%
的置信區(qū)間
解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,
sy=1.9799,t(25-2)=2.0687
置信區(qū)間為當(dāng)貸款余額為100億元時(shí),不良貸款的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版高中語文選修“中國文化經(jīng)典研讀”第十單元⑩《人間詞話》十則-課件(28張)(共28張)
- 做賬實(shí)操-酒店業(yè)的稅務(wù)處理
- 《機(jī)械原理與機(jī)械設(shè)計(jì) (下冊) 第4版》 課件 第19章-蝸桿傳動(dòng)
- 安徽省合肥市示范初中2021-2022學(xué)年物理高一下期末檢測模擬試題含解析
- 安徽蚌埠二中2022年物理高一第二學(xué)期期末統(tǒng)考試題含解析
- 2022年新疆維吾爾自治區(qū)喀什二中高一物理第二學(xué)期期末達(dá)標(biāo)檢測模擬試題含解析
- 小學(xué)數(shù)學(xué)課件試講
- 旅游形象片發(fā)展現(xiàn)狀及未來趨勢分析
- 公輸課件教學(xué)課件
- 《機(jī)械原理 第5版》 課件 劉會英 06-齒輪機(jī)構(gòu)、07-輪系
- 月考測試(第一至第二單元)(試題)-2024-2025學(xué)年三年級上冊數(shù)學(xué)人教版
- 2024網(wǎng)絡(luò)銷售代理合同范本2
- 2024年成人高考專升本政治考試時(shí)政強(qiáng)化練習(xí)及答案
- 3.2 學(xué)習(xí)成就夢想(課件)-【新教材】七年級道德與法治上冊課件 教案 作業(yè)(統(tǒng)編版2024)
- 2024陜西西安市自來水限公司招聘98人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 五年高考語文真題分類匯編:詩歌鑒賞
- 東莞2024年廣東東莞市統(tǒng)計(jì)局招聘工作人員筆試歷年典型考題及考點(diǎn)附答案解析
- 2024男女雙方自愿離婚協(xié)議書
- 節(jié)假日網(wǎng)絡(luò)安全
- 新人教版七年級上冊英語單詞默寫表(英譯漢)
- 武繼祥-矯形器的臨床應(yīng)用
評論
0/150
提交評論