8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì) 課件-山東省滕州市第一中學(xué)高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第1頁(yè)
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì) 課件-山東省滕州市第一中學(xué)高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第2頁(yè)
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì) 課件-山東省滕州市第一中學(xué)高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第3頁(yè)
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì) 課件-山東省滕州市第一中學(xué)高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第4頁(yè)
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì) 課件-山東省滕州市第一中學(xué)高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)(2)非線性回歸方程的分析對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)我們知道其經(jīng)驗(yàn)回歸方程的截距和斜率的最小二乘估計(jì)公式分別為:稱為樣本點(diǎn)的中心.殘差圖:作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),解釋變量或響應(yīng)變量,這樣作出的圖形稱為殘差圖復(fù)習(xí)引入求經(jīng)驗(yàn)回歸直線方程的步驟:(3)代入公式(4)寫(xiě)出直線方程為y=bx+a,即為所求的回歸直線方程.復(fù)習(xí)引入典型例題 例1.經(jīng)驗(yàn)表明,對(duì)于同一樹(shù)種,一般樹(shù)的胸徑(樹(shù)的主干在地面以上1.3m處的直徑)越大,樹(shù)就越高.由于測(cè)量樹(shù)高比測(cè)量胸徑困難,因此研究人員希望由胸徑預(yù)測(cè)樹(shù)高.在研究樹(shù)高與胸徑之間的關(guān)系時(shí),某林場(chǎng)收集了某種

2、樹(shù)的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹(shù)高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號(hào)123456胸徑/cm18.120.122.224.426.028.3樹(shù)高/m18.819.221.021.022.122.1編號(hào)789101112胸徑/cm29.632.433.735.738.340.2樹(shù)高/m22.422.623.024.323.924.7解: 以胸徑為橫坐標(biāo),樹(shù)高為縱坐標(biāo)作散點(diǎn)圖如下: 散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明兩個(gè)變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫(huà)樹(shù)高與胸徑之間的關(guān)系. 用d表示胸徑,h表示樹(shù)高,根據(jù)據(jù)最小二乘法,計(jì)算可得經(jīng)驗(yàn)回歸方程為編號(hào)胸徑/c

3、m樹(shù)高觀測(cè)值/m樹(shù)高預(yù)測(cè)值/m殘差/m118.1 18.8 19.4 -0.6 220.1 19.2 19.9 -0.7 322.2 21.0 20.4 0.6 424.4 21.0 20.9 0.1 526.0 22.1 21.3 0.8 628.3 22.1 21.9 0.2 729.6 22.4 22.2 0.2 832.4 22.6 22.9 -0.3 933.7 23.0 23.2 -0.2 1035.7 24.3 23.7 0.6 1138.3 23.9 24.4 -0.5 1240.2 24.7 24.9 -0.2 根據(jù)經(jīng)驗(yàn)回歸方程,由胸徑的數(shù)據(jù)可以計(jì)算出樹(shù)高的預(yù)測(cè)值(精確到0.

4、1)以及相應(yīng)的殘差,如下表所示.以胸徑為橫坐標(biāo),殘差為縱坐標(biāo),作殘差圖,得到下圖.30252015 -1.0 -0.5 0.0 0.5 1.0殘差/m 35 40 45 胸徑/cm 觀察殘差表和殘差圖,可以看到殘差的絕對(duì)值最大是 0.8,所有殘差分布在以橫軸為對(duì)稱軸、寬度小于2的帶狀區(qū)域內(nèi) .可見(jiàn)經(jīng)驗(yàn)回歸方程較好地刻畫(huà)了樹(shù)高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗(yàn)回歸方程由胸徑預(yù)測(cè)樹(shù)高.編號(hào)12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95 例2.人們常將男子短跑100m的高水平運(yùn)動(dòng)員

5、稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對(duì)數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程 以成對(duì)數(shù)據(jù)中的世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點(diǎn)圖,得到下圖 在左圖中,散點(diǎn)看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.典型例題 用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份 ,利用一元線性回歸模型來(lái)刻畫(huà)世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系 . 根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:將經(jīng)驗(yàn)回歸直線疊加到散點(diǎn)圖,得到下圖:仔細(xì)觀察:從圖中可以看到,經(jīng)驗(yàn)回歸方程較

6、好地刻畫(huà)了散點(diǎn)的變化趨勢(shì),請(qǐng)?jiān)僮屑?xì)觀察圖形,你能看出其中存在的問(wèn)題嗎? 第一個(gè)世界紀(jì)錄所對(duì)應(yīng)的散點(diǎn)遠(yuǎn)離經(jīng)驗(yàn)回歸直線,并且前后兩時(shí)間段中的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的上方,中間時(shí)間段的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的下方. 這說(shuō)明散點(diǎn)并不是隨機(jī)分布在經(jīng)驗(yàn)回歸直線的周圍, 而是圍繞著經(jīng)驗(yàn)回歸直線有一定的變化規(guī)律, 即成對(duì)樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.回顧已有的函數(shù)知識(shí),可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類似的形狀特征思考:你能對(duì)模型進(jìn)行修改,以使其更好地反映散點(diǎn)的分布特征嗎?仔細(xì)觀察左圖,可以發(fā)現(xiàn)散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線附近. 注意到100m短跑的第一個(gè)世界紀(jì)錄產(chǎn)生于1896年, 因此可以

7、認(rèn)為散點(diǎn)是集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c20.用上述函數(shù)刻畫(huà)數(shù)據(jù)變化的趨勢(shì),這是一個(gè)非線性經(jīng)驗(yàn)回歸函數(shù),其中c1,c2是待定參數(shù),現(xiàn)在問(wèn)題轉(zhuǎn)化為如何利用成對(duì)數(shù)據(jù)估計(jì)參數(shù)c1和c2令x=ln(t-1895),則 Y=c2x+c1編號(hào)12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄Y/s11.8010.6010.4010.3010.2010.1010.009.95對(duì)數(shù)據(jù)進(jìn)行變化可得下表:由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:得到散點(diǎn)圖

8、如右:上圖表明,經(jīng)驗(yàn)回歸方程對(duì)于成對(duì)數(shù)據(jù)具有非常好的擬合精度.將經(jīng)驗(yàn)回歸直線疊加到散點(diǎn)圖,得到下圖:將x=ln(t-1895)代入: 對(duì)于通過(guò)創(chuàng)紀(jì)錄時(shí)間預(yù)報(bào)世界紀(jì)錄的問(wèn)題,我們建立了兩個(gè)回歸模型,得到了兩個(gè)回歸方程,你能判斷哪個(gè)回歸方程擬合的精度更好嗎?我們發(fā)現(xiàn),散點(diǎn)圖中各散點(diǎn)都非??拷膱D象, 表明非線性經(jīng)驗(yàn)回歸方程對(duì)于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗(yàn)回歸方程.(1).直接觀察法.在同一坐標(biāo)系中畫(huà)出成對(duì)數(shù)據(jù)散點(diǎn)圖、非線性經(jīng)驗(yàn)回歸方程的圖象(藍(lán)色)以及經(jīng)驗(yàn)回歸方程的圖象(紅色).(2).殘差分析:殘差平方和越小,模型擬合效果越好.Q2明顯小于Q1,說(shuō)明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程.

9、(3).利用決定系數(shù)R2刻畫(huà)回歸效果.和的R2分別為0.7325和0.9983說(shuō)明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型擬合效果越差.(4)用新的觀測(cè)數(shù)據(jù)來(lái)檢驗(yàn)?zāi)P偷臄M合效果,事實(shí)上,我們還有1968年之后的男子短跑100m世界紀(jì)錄數(shù)據(jù),如表所示在散點(diǎn)圖中,繪制表中的散點(diǎn)(綠色),再添加經(jīng)驗(yàn)回歸方程所對(duì)應(yīng)的經(jīng)驗(yàn)回歸直線(紅色),以及經(jīng)驗(yàn)回歸方程所對(duì)應(yīng)的經(jīng)驗(yàn)回歸曲線(藍(lán)色),得到右圖.顯然綠色散點(diǎn)分布在藍(lán)色經(jīng)驗(yàn)回歸曲線的附近,遠(yuǎn)離紅色經(jīng)驗(yàn)回歸直線,表明經(jīng)驗(yàn)回歸方程對(duì)于新數(shù)據(jù)的預(yù)報(bào)效果遠(yuǎn)遠(yuǎn)好于.思考:在上述問(wèn)

10、題情境中,男子短跑100m世界紀(jì)錄和紀(jì)錄創(chuàng)建年份之間呈現(xiàn)出對(duì)數(shù)關(guān)系,能借助于樣本相關(guān)系數(shù)刻畫(huà)這種關(guān)系的強(qiáng)弱嗎?在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)時(shí),需要注意下列問(wèn)題:(1)經(jīng)驗(yàn)回歸方程只適用于所研究的樣本的總體,例如,根據(jù)我國(guó)父親身高與兒子身高的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來(lái)描述美國(guó)父親身高與兒子身高之間的關(guān)系,同樣,根據(jù)生長(zhǎng)在南方多雨地區(qū)的樹(shù)高與胸徑的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來(lái)描述北方干早地區(qū)的樹(shù)高與胸徑之間的關(guān)系。(2)經(jīng)驗(yàn)回歸方程一般都有時(shí)效性,例如,根據(jù)20世紀(jì)80年代的父親身高與兒子身高的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來(lái)描述現(xiàn)在的父親身高與兒子身高之間的關(guān)系。(3)解釋變量的取值不能

11、離樣本數(shù)據(jù)的范圍太遠(yuǎn),一般解釋變量的取值在樣本數(shù)據(jù)范圍內(nèi),經(jīng)驗(yàn)回歸方程的預(yù)報(bào)效果會(huì)比較好,超出這個(gè)范圍越遠(yuǎn),預(yù)報(bào)的效果越差,(4)不能期望經(jīng)驗(yàn)回歸方程得到的預(yù)報(bào)值就是響應(yīng)變量的精確值,事實(shí)上,它是響應(yīng)變量的可能取值的平均值。 一只藥用昆蟲(chóng)的產(chǎn)卵數(shù)y與一定范圍內(nèi)的溫度x有關(guān),現(xiàn)收集了6組觀測(cè)數(shù)據(jù)列于表中: 經(jīng)計(jì)算得: 線性回歸殘差的平方和: 其中 分別為觀測(cè)數(shù)據(jù)中的溫度和產(chǎn)卵數(shù),i=1,2,3,4,5,6.(1)若用線性回歸模型擬合,求y關(guān)于x的回歸方程 (精確到0.1);(2)若用非線性回歸模型擬合,求得y關(guān)于x回歸方程為且相關(guān)指數(shù)R20.9522 試與(1)中的線性回歸模型相比較,用R2說(shuō)明哪種模型的擬合效果更好 ?用擬合效果好的模型預(yù)測(cè)溫度為35時(shí)該種藥用昆蟲(chóng)的產(chǎn)卵數(shù).(結(jié)果取整數(shù)). 附:相關(guān)系數(shù) 鞏固練習(xí)解:所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為0.93980.9522 非線性回歸模型的回歸方程 比線性回歸方程為:y6.6x-139.4擬合的擬合效果更好

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論