8.2.2一元線性回歸模型參數(shù)的最小二乘估計第2課時課件-高二下學(xué)期數(shù)學(xué)人教A版2019選擇性_第1頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計第2課時課件-高二下學(xué)期數(shù)學(xué)人教A版2019選擇性_第2頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計第2課時課件-高二下學(xué)期數(shù)學(xué)人教A版2019選擇性_第3頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計第2課時課件-高二下學(xué)期數(shù)學(xué)人教A版2019選擇性_第4頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計第2課時課件-高二下學(xué)期數(shù)學(xué)人教A版2019選擇性_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

8.2.2一元線性回歸模型參數(shù)的最小二乘估計

第2課時 1.針對實(shí)際問題,會用一元線性回歸模型進(jìn)行預(yù)測.

2.通過對具體問題的進(jìn)一步分析,能將某些非線性回歸問題轉(zhuǎn)化為線性回歸問題并加以解決. 3.通過具體實(shí)例,了解決定系數(shù)R2的意義和作用.編號123456胸徑/cm18.120.122.224.426.028.3樹高/m18.819.221.021.022.122.1編號789101112胸徑/cm29.632.433.735.738.340.2樹高/m22.422.623.024.323.924.7

例1

經(jīng)驗表明,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時,某林場收集了某種樹的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗回歸方程.知識點(diǎn)一:線性回歸分析解:以胸徑為橫坐標(biāo),樹高為縱坐標(biāo)作散點(diǎn)圖如下: 散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明兩個變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.用d表示胸徑,h表示樹高,根據(jù)據(jù)最小二乘法,計算可得經(jīng)驗回歸方程為編號胸徑/cm樹高觀測值/m樹高預(yù)測值/m殘差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2

根據(jù)經(jīng)驗回歸方程,由胸徑的數(shù)據(jù)可以計算出樹高的預(yù)測值(精確到0.1)以及相應(yīng)的殘差,如下表所示.以胸徑為橫坐標(biāo),殘差為縱坐標(biāo),作殘差圖,如圖:

觀察殘差表和殘差圖,可得殘差的絕對值最大是0.8,所有殘差分布在以橫軸為對稱軸、寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗回歸方程較好地刻畫了樹高與胸徑的關(guān)系,可以根據(jù)經(jīng)驗回歸方程由胸徑預(yù)測樹高.歸納總結(jié)

一元線性回歸模型解決問題的過程: 1.分析實(shí)際問題確定響應(yīng)變量,通過散點(diǎn)圖觀察成對樣本數(shù)據(jù)是否線性相關(guān),進(jìn)而選擇合適的統(tǒng)計模型; 2.通過統(tǒng)計軟件得到模型參數(shù)的估計; 3.通過經(jīng)驗回歸方程得到預(yù)測值、殘差,分析殘差圖的特點(diǎn),確定是否需要改進(jìn)模型等; 4.根據(jù)經(jīng)驗回歸方程,可以預(yù)測結(jié)果.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95

問題:人們常將男子短跑100m的高水平運(yùn)動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗回歸方程.以世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點(diǎn)圖,得下圖:散點(diǎn)看上去大致分布在一條直線附近知識點(diǎn)二:非線性回歸分析將經(jīng)驗回歸直線疊加到散點(diǎn)圖,得到下圖:根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為: 從圖中可以看到,經(jīng)驗回歸方程較好地刻畫了散點(diǎn)的變化趨勢,請再仔細(xì)觀察圖形,你能看出其中存在的問題嗎

用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份利用一元線性回歸模型來刻畫世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系 第一個世界紀(jì)錄所對應(yīng)的散點(diǎn)遠(yuǎn)離經(jīng)驗回歸直線,并且前后兩時間段中的散點(diǎn)都在經(jīng)驗回歸直線的上方,中間時間段的散點(diǎn)都在經(jīng)驗回歸直線的下方. 這說明散點(diǎn)并不是隨機(jī)分布在經(jīng)驗回歸直線的周圍,而是圍繞著經(jīng)驗回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.函數(shù)y=-lnx的圖象具有類似的形狀特征.問題:你能對模型進(jìn)行修改,以使其更好地反映散點(diǎn)的分布特征嗎?散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線附近. 注意到100m短跑的第一個世界紀(jì)錄產(chǎn)生于1896年,因此可以認(rèn)為散點(diǎn)是集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c2<0.y=f(t)=c1+c2ln(t-1895)編號12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95對數(shù)據(jù)進(jìn)行變化可得下表:這是一個非線性經(jīng)驗回歸函數(shù),如何利用成對數(shù)據(jù)估計參數(shù)c1、c2令x=ln(t-1895),則Y=c2x+c1得到散點(diǎn)圖如下:由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為:(*)上圖表明,經(jīng)驗回歸方程對于成對數(shù)據(jù)具有非常好的擬合精度.將經(jīng)驗回歸直線疊加到散點(diǎn)圖,得到下圖:將x=ln(t-1895)代入得

思考:對于通過創(chuàng)紀(jì)錄時間預(yù)報世界紀(jì)錄的問題,我們建立了兩個回歸模型,得到了兩個回歸方程,你能判斷哪個回歸方程擬合的精度更好嗎?散點(diǎn)圖中各散點(diǎn)都非??拷诘膱D象,表明非線性經(jīng)驗回歸方程②對于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗回歸方程①.(1)直接觀察法②①①②(2)殘差分析:殘差平方和越小,模型擬合效果越好.Q2明顯小于Q1,說明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程.(3)利用決定系數(shù)R2刻畫回歸效果.由于令①和②的R2分別為0.7325和0.9983.因此經(jīng)驗回歸方程②的刻畫效果比①好.

顯然0≤R2≤1,R2越接近1,則線性回歸刻畫的效果越好.在一元線性回歸模型中

R2=r2,即決定系數(shù)R2等于響應(yīng)變量與解釋變量的樣本相關(guān)系數(shù)r的平方.

R2越大,表示殘差平方和越小,即模型的擬合效果越好;R2越小,表示殘差平方和越大,即模型的擬合效果越差.剔除量綱的影響1.建立非線性經(jīng)驗回歸模型的基本步驟:歸納總結(jié)(1)確定研究對象,明確哪個是解釋變量,哪個是響應(yīng)變量;(2)由經(jīng)驗確定非線性經(jīng)驗回歸方程的模型;(3)通過變換,將非線性經(jīng)驗回歸模型轉(zhuǎn)化為線性經(jīng)驗回歸模型;(4)按照公式計算經(jīng)驗回歸方程中的參數(shù),得到經(jīng)驗回歸方程;(5)消去新元,得到非線性經(jīng)驗回歸方程;(6)得出結(jié)果后分析殘差圖是否有異常.2.在使用經(jīng)驗回歸方程進(jìn)行預(yù)測時,需注意的問題:(1)回歸方程只適用于我們所研究的樣本的總體;(2)我們所建立的回歸方程一般都有時間性;(3)樣本采集的范圍會影響回歸方程的適用范圍; (4)不能期望回歸方程得到的預(yù)報值就是預(yù)報變量的精確值.事實(shí)上,它是預(yù)報變量的可取值的平均值.總結(jié)提升常見非線性模型及其線性化的方法(1)指數(shù)函數(shù)y=αeβx(α>0)β>0β<0處理方法:兩邊取自然對數(shù),得lny=lnα+βx,令y′=lny,x′=lnx,則y′=lnα+βx′(2)冪函數(shù)y=αxβ(α>0)β>0β<0(3)對數(shù)函數(shù)y=α+βlogax0<β<1β>1-1<β<0β<-1處理方法:兩邊取自然對數(shù),得lny=lnα+βlnx,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論