【公開課】一元線性回歸模型參數(shù)的最小二乘估計(第二課時)課件-高二下學期數(shù)學人教A版(2019)選擇性必修第三冊_第1頁
【公開課】一元線性回歸模型參數(shù)的最小二乘估計(第二課時)課件-高二下學期數(shù)學人教A版(2019)選擇性必修第三冊_第2頁
【公開課】一元線性回歸模型參數(shù)的最小二乘估計(第二課時)課件-高二下學期數(shù)學人教A版(2019)選擇性必修第三冊_第3頁
【公開課】一元線性回歸模型參數(shù)的最小二乘估計(第二課時)課件-高二下學期數(shù)學人教A版(2019)選擇性必修第三冊_第4頁
【公開課】一元線性回歸模型參數(shù)的最小二乘估計(第二課時)課件-高二下學期數(shù)學人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八章成對數(shù)據(jù)的統(tǒng)計分析8.2.2一元線性回歸模型參數(shù)的最小二乘估計(第二課時)李思目錄CONTENT03040102典型例題課堂總結(jié)知識回顧殘差分析與非線性回歸分析知識回顧PART.01知識回顧1.什么是經(jīng)驗回歸方程?我們將

稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法.2.什么是最小二乘估計?經(jīng)驗回歸方程中的參數(shù)計算公式為:

問題引入

相應的經(jīng)驗回歸直線如圖所示.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182問題引入

不一定,還有其他影響兒子身高的因素,父親的身高不能完全決定兒子的身高.不過,我們可以作出推測,當父親的身高為176cm時,兒子身高一般在177cm左右.殘差分析與非線性回歸分析PART.02殘差殘差分析:殘差表:將殘差以表格的形式呈現(xiàn);殘差圖:將殘差以圖象的形式呈現(xiàn)。殘差表編號父親身高/cm兒子身高觀測值/cm兒子身高預測值/cm殘差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023殘差表:殘差為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標,殘差作為縱坐標,畫出殘差圖,如下:012345-1-2-3-4-5160165170175180185殘差/cm父親身高/cm??????????????觀察殘差的散點圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定??梢?,通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型的假設(shè).殘差圖法:作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi),帶狀區(qū)域越窄,則說明擬合效果越好.殘差圖思考:以下四幅殘差圖,你認為哪一個殘差滿足一元線性回歸模型中對隨機誤差的假定?通過觀察發(fā)現(xiàn),圖(4)的殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi).所以在四幅殘差圖中,只有圖(4)滿足一元線性回歸模型對隨機誤差的假設(shè).

一般地,建立經(jīng)驗回歸方程后,通常需要對模型刻畫數(shù)據(jù)的效果進行分析.借助殘差分析還可以對模型進行改進,使我們能根據(jù)改進模型作出更符合實際的預測與決策.殘差殘差非線性回歸分析問題:人們常將男子短跑100m的高水平運動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀錄產(chǎn)生的年份和世界紀錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀錄關(guān)于紀錄產(chǎn)生年份的經(jīng)驗回歸方程.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.951.畫散點圖:非線性回歸分析由散點圖可知,散點看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗回歸方程.2.求經(jīng)驗回歸方程:將經(jīng)驗回歸方程疊加到散點圖,如圖(3)所示.由圖形可知,散點并不是隨機分布在經(jīng)驗回歸直線的周圍,而是圍繞著經(jīng)驗回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.根據(jù)最小二乘法,由表中數(shù)據(jù)可得經(jīng)驗回歸方程為非線性回歸分析3.修改模型:散點更趨向于落在中間下凸且遞減的某條曲線附近.函數(shù)y=-lnx的圖象具有類似的形狀特征.用上述函數(shù)刻畫數(shù)據(jù)變化的趨勢,這是一個非線性經(jīng)驗回歸函數(shù),其中c1,c2是待定參數(shù).現(xiàn)在問題轉(zhuǎn)化為如何利用成對數(shù)據(jù)估計參數(shù)c1和c2.注意到100m短跑的第一個世界紀錄產(chǎn)生于1896年,因此可認為散點集中在曲線y=c1+c2ln(t-1895)的周圍.其中c1和c2為未知參數(shù),且c2<0.非線性回歸分析為了利用一元線性回歸模型估計參數(shù)c1和c2,引進一個中間變量x,令x=ln(t-1895).通過x=ln(t-1895),將年份變量數(shù)據(jù)進行變換,得到新的成對數(shù)據(jù)(精確到0.01),如下表所示.編號12345678x0.002.833.263.563.714.114.174.29Y/s11.8010.6010.4010.3010.2010.1010.009.95作出上表的散點圖:由散點圖可知,現(xiàn)在散點的分布呈現(xiàn)出很強的線性相關(guān)特征,故可以一元線性回歸模型建立經(jīng)驗回歸方程.②非線性回歸分析在同一坐標系中畫出成對數(shù)據(jù)散點圖、非線性經(jīng)驗回歸方程②的圖像(藍色)以及經(jīng)驗回歸方程①的圖像(紅色),如圖所示.我們發(fā)現(xiàn),散點圖中各散點都非常靠近②的圖像,表明非線性經(jīng)驗回歸方程②對于原始數(shù)據(jù)的擬合效果遠遠好于經(jīng)驗回歸方程①.下面通過殘差來比較這兩個經(jīng)驗回歸方程對數(shù)據(jù)刻畫的好壞.非線性回歸分析用ti表示編號為i的年份數(shù)據(jù),用yi表示編號為i的紀錄數(shù)據(jù),則經(jīng)驗回歸方程①和②的殘差計算公式分別為兩個經(jīng)驗回歸方程的殘差(精確到0.001)如下表所示.觀察各項殘差的絕對值,發(fā)現(xiàn)經(jīng)驗回歸方程②遠遠小于①,即經(jīng)驗回歸方程②的擬合效果要遠遠好于①.編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022非線性回歸分析在一般情況下,直接比較兩個模型的殘差比較困難,因為在某些散點上一個模型的殘差的絕對值比另一個模型的小,而另一些散點的情況則相反.可以通過比較殘差的平方和來比較兩個模型的效果.由可知Q2小于Q1.因此在殘差平方和最小的標準下,非線性回歸模型的擬合效果要優(yōu)于一元線性回歸模型的擬合效果.決定系數(shù)R2

通過前面的討論我們知道,當殘差的平方和越小,經(jīng)驗回歸模型的擬合效果就越好,故我們可以用決定系數(shù)R2來驗證模型的擬合效果.決定系數(shù)R2的計算公式為R2越大,表示殘差平方和越小,即模型的擬合效果越好;R2越小,表示殘差平方和越大,即模型的擬合效果越差.注意點:在含有一元線性回歸模型中,決定系數(shù)R2=r2.在線性回歸模型中有0≤R2≤1,因此R2和r都能刻畫用線性回歸模型擬合數(shù)據(jù)的效果.|r|越大,R2就越大,線性回歸模型擬合數(shù)據(jù)的效果就越好.決定系數(shù)R2編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022由上述殘差表可算出經(jīng)驗回歸方程①和②的決定系數(shù)R2分別為由于因此經(jīng)驗回歸方程②的刻畫效果比經(jīng)驗回歸方程①的好很多.刻畫回歸效果的三種方法刻畫回歸效果的三種方法1.殘差圖法:殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適.2.殘差平方和法:殘差平方和越小,模型的擬合效果越好.3.決定系數(shù)法:R2=越接近1,表明回歸模型的擬合效果越好.典例2:在建立兩個變量y與x的回歸模型中,分別選擇了4個不同的模型,模型1~4的R2值分別是0.98,0.80,0.60,0.55,則其中擬合效果最好的模型是()A.模型1 B.模型2C.模型3 D.模型4A典型例題PART.03殘差分析例1:為研究質(zhì)量x(單位:g)對彈簧長度y(單位:cm)的影響,對不同質(zhì)量的6個物體進行測量,數(shù)據(jù)如下表:x51015202530y7.258.128.959.9010.911.8(1)作出散點圖并求經(jīng)驗回歸方程;(2)求出R2并說明回歸模型擬合的效果;(3)進行殘差分析.殘差分析解:(1)散點圖如圖所示.樣本點分布在一條直線附近,所以y與x具有線性相關(guān)關(guān)系.殘差分析非線性回歸分析非線性回歸分析非線性回歸分析例3:某公司為確定下一年度投入某種產(chǎn)品的宣傳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論