【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊

上傳人：M*** IP屬地：福建上傳時間：2023-02-02 格式：PPTX 頁數(shù)：34 大?。?.39MB 積分：11 舉報 版權(quán)申訴

【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊_第2頁

【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊_第3頁

【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊_第4頁

【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊_第5頁

已閱讀5頁，還剩29頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

8.2.2一元線性回歸模型參數(shù)的最小二乘估計(2)復(fù)習(xí)：1.經(jīng)驗(yàn)回歸方程：我們將

稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程，也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式，其圖形稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法.2.最小二乘估計：經(jīng)驗(yàn)回歸方程中的參數(shù)計算公式為：

例1

散點(diǎn)大致分布在一條從左下角到右上角的直線附近，表明兩個變量正線性相關(guān)，因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.用d表示胸徑，h表示樹高，根據(jù)最小二乘法，計算可得經(jīng)驗(yàn)回歸方程為例1

經(jīng)驗(yàn)表明，一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大，樹就越高，由于測量樹高比測量胸徑困難，因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時，某林場收集了某種樹的一些數(shù)據(jù)(如下表)，試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號123456789101112胸徑/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高/cm18.819.221.021.022.122.122.422.623.024.323.924.7相應(yīng)的經(jīng)驗(yàn)回歸直線如圖(1)所示.(1)編號胸徑/cm樹高觀測值/m樹高預(yù)測值/m殘差/m118.118.819.4－0.6220.119.219.9－0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9－0.3933.723.023.2－0.21035.724.323.70.61138.323.924.4－0.51240.224.724.9－0.2計算殘差：以胸徑為橫坐標(biāo)，殘差為縱坐標(biāo)，作殘差圖，如圖(2)所示.作殘差圖：觀察殘差表和殘差圖，可以看到，殘差的絕對值最大是0.8，所有殘差分布在以橫軸為對稱軸、寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗(yàn)回歸方程較好地刻畫了樹高與胸徑的關(guān)系，我們可以根據(jù)經(jīng)驗(yàn)回歸方程由胸徑預(yù)測樹高.00.51.0-0.5-1.0152025303540殘差/m胸徑/cm??????????????45(2)問題人們常將男子短跑100m的高水平運(yùn)動員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù)，建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.951.畫散點(diǎn)圖：由散點(diǎn)圖可知，散點(diǎn)看上去大致分布在一條直線附近，似乎可用一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.根據(jù)最小二乘法，由表中數(shù)據(jù)可得經(jīng)驗(yàn)回歸方程為2.求經(jīng)驗(yàn)回歸方程：將經(jīng)驗(yàn)回歸方程疊加到散點(diǎn)圖，如圖(3)所示.由圖形可知，第一點(diǎn)遠(yuǎn)離經(jīng)驗(yàn)回歸直線，并且前后兩時間段中的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的上方，中間時間段的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的下方.這說明散點(diǎn)并不是隨機(jī)分布在經(jīng)驗(yàn)回歸直線的周圍，而是圍繞著經(jīng)驗(yàn)回歸直線有一定的變化規(guī)律，即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.(3)3.修改模型：對模型進(jìn)行修改，以使其更好地反映散點(diǎn)的分布特征.仔細(xì)觀察圖形，可以發(fā)現(xiàn)散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線附近.回顧已有的函數(shù)知識，可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類似的形狀特征.注意到100m短跑的第一個世界紀(jì)錄產(chǎn)生于1896年，因此可以認(rèn)為散點(diǎn)是集中在曲線的周圍.其中c1和c2為未知參數(shù)，且c2<0.用上述函數(shù)刻畫數(shù)據(jù)變化的趨勢，這是一個非線性經(jīng)驗(yàn)回歸函數(shù)，其中c1,c2是待定參數(shù).現(xiàn)在問題轉(zhuǎn)化為如何利用成對數(shù)據(jù)估計參數(shù)c1和c2.為了利用一元線性回歸模型估計參數(shù)c1和c2，我們引進(jìn)一個中間變量x，令x=ln(t-1895).通過x=ln(t-1895)，將年份變量數(shù)據(jù)進(jìn)行變換，得到新的成對數(shù)據(jù)(精確到0.01)，如下表所示.編號12345678x0.002.833.263.563.714.114.174.29Y/s11.8010.6010.4010.3010.2010.1010.009.95作出上表的散點(diǎn)圖：由散點(diǎn)圖可知，現(xiàn)在散點(diǎn)的分布呈現(xiàn)出很強(qiáng)的線性相關(guān)特征，故可以一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.根據(jù)最小二乘法，可得新的經(jīng)驗(yàn)回歸方程為再在散點(diǎn)圖中畫出(*)式所對應(yīng)的經(jīng)驗(yàn)回歸直線，如圖(4)所示.(4)圖(4)表明，經(jīng)驗(yàn)回歸方程(*)對于改進(jìn)后的成對數(shù)據(jù)具有非常好的擬合精度.將圖(4)與圖(3)進(jìn)行對比，可以發(fā)現(xiàn)x和Y之間的線性相關(guān)程度比原始樣本數(shù)據(jù)的線性相關(guān)程度強(qiáng)得多.將x=ln(t-1895)代入(*)式，得到由創(chuàng)紀(jì)錄年份預(yù)報世界紀(jì)錄的經(jīng)驗(yàn)回歸方程在同一坐標(biāo)系中畫出成對數(shù)據(jù)散點(diǎn)圖、非線性經(jīng)驗(yàn)回歸方程②的圖象(藍(lán)色)以及經(jīng)驗(yàn)回歸方程①的圖象(紅色)，如圖(5)所示.我們發(fā)現(xiàn)，散點(diǎn)圖中各散點(diǎn)都非?？拷诘膱D象，表明非線性經(jīng)驗(yàn)回歸方程②對于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗(yàn)回歸方程①.(5)下面通過殘差來比較這兩個經(jīng)驗(yàn)回歸方程對數(shù)據(jù)刻畫的好壞.用ti表示編號為i的年份數(shù)據(jù)，用yi表示編號為i的紀(jì)錄數(shù)據(jù)，則經(jīng)驗(yàn)回歸方程①和②的殘差計算公式分別為兩個經(jīng)驗(yàn)回歸方程的殘差(精確到0.001)如下表所示.觀察各項(xiàng)殘差的絕對值，發(fā)現(xiàn)經(jīng)驗(yàn)回歸方程②遠(yuǎn)遠(yuǎn)小于①，即經(jīng)驗(yàn)回歸方程②的擬合效果要遠(yuǎn)遠(yuǎn)好于①.編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022在一般情況下，直接比較兩個模型的殘差比較困難，因?yàn)樵谀承┥Ⅻc(diǎn)上一個模型的殘差的絕對值比另一個模型的小，而另一些散點(diǎn)的情況則相反.可以通過比較殘差的平方和來比較兩個模型的效果.由可知Q2小于Q1.因此在殘差平方和最小的標(biāo)準(zhǔn)下，非線性回歸模型的擬合效果要優(yōu)于一元線性回歸模型的擬合效果.決定系數(shù)R2：通過前面的討論我們知道，當(dāng)殘差的平方和越小，經(jīng)驗(yàn)回歸模型的擬合效果就越好，故我們可以用決定系數(shù)R2來驗(yàn)證模型的擬合效果.決定系數(shù)R2的計算公式為在R2表達(dá)式中，由于與經(jīng)驗(yàn)回歸方程無關(guān)，殘差平方和與經(jīng)驗(yàn)回歸方程有關(guān)，因此R2越大，表示殘差平方和越小，即模型的擬合效果越好；R2越小，表示殘差平方和越大，即模型的擬合效果越差.決定系數(shù)R2：決定系數(shù)是總偏差平方和中回歸平方和所占的比重.顯然0≤R2≤1，R2越接近1，則線性回歸刻畫的效果越好.還可以證明，在一元線性回歸模型中R2=r2，即決定系數(shù)R2等于響應(yīng)變量與解釋變量的樣本相關(guān)系數(shù)r的平方.回歸平方和總偏差平方和編號12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022由上述殘差表可算出經(jīng)驗(yàn)回歸方程①和②的決定系數(shù)R2分別為由于因此經(jīng)驗(yàn)回歸方程②的刻畫效果比經(jīng)驗(yàn)回歸方程①的好很多.

例2為研究質(zhì)量x(單位：g)對彈簧長度y(單位：cm)的影響，對不同質(zhì)量的6個物體進(jìn)行測量，數(shù)據(jù)如表所示：

(1)作出散點(diǎn)圖，并求經(jīng)驗(yàn)回歸方程；(2)求出R2；(3)進(jìn)行殘差分析．x51015202530y7.258.128.959.9010.911.8(2)求出R2；(3)進(jìn)行殘差分析．x51015202530y7.258.128.959.9010.911.8解：(2)列表如下：0.050.005－0.08－0.0450.040.025－2.24－1.37－0.540.411.412.31解：(3)由殘差表中的數(shù)值可以看出第3個樣本點(diǎn)的殘差比較大，需要確認(rèn)在采集這個數(shù)據(jù)的時候是否有人為的錯誤，如果有的話，需要糾正數(shù)據(jù)，重新建立回歸模型；由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在不超過0.15的狹窄的水平帶狀區(qū)域中，說明選用的回歸模型的精度較高，由以上分析可知，彈簧長度與質(zhì)量成線性關(guān)系．0.050.005－0.08－0.0450.040.025－2.24－1.37－0.540.411.412.31變式已知某種商品的單價x(單位:元)與需求量y(單位:件)之間的關(guān)系有如下一組數(shù)據(jù):x1416182022y1210753求y關(guān)于x的經(jīng)驗(yàn)回歸方程，并說明回歸模型擬合效果的好壞.解：列殘差表如下：y1210753129.77.45.12.800.3－0.4－0.10.24.62.6－0.4－2.4－4.4故回歸模型的擬合效果很好.

例3某企業(yè)為確定下一年投入某種產(chǎn)品的研發(fā)費(fèi)用，需了解年研發(fā)費(fèi)用x(單位:千萬元)對年銷售量y(單位:千萬件)的影響，統(tǒng)計了近10年投入的年研發(fā)費(fèi)用xi與年銷售量yi(i=1,2,???,10)的數(shù)據(jù)，得到散點(diǎn)圖如圖所示.(1)利用散點(diǎn)圖判斷y=a+bx和y=c?xd(其中c,d均為大于0的常數(shù))哪一個更適合作為年銷售量y和年研發(fā)費(fèi)用x的回歸方程類型(只要給出判斷即可，不必說明理由)；(2)對數(shù)據(jù)作出如下處理，令ui=lnxi,vi=lnyi,得到相關(guān)統(tǒng)計量的值如下表.根據(jù)第(1)問的判斷結(jié)果及表中數(shù)據(jù)，求y關(guān)于x的回歸方程.附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),???,(un,vn)，其回歸直線的斜率和截距的最小二乘估計分別為解：(1)由散點(diǎn)圖可知，選擇回歸類型y=c?xd更合適.(2)對y=c?xd兩邊取對數(shù)，的lny=lnc+dlnx，變式某地今年上半年患某種傳染病的人數(shù)y(人)與月份x(月)之間滿足函數(shù)關(guān)系，模型為y＝aebx，確定這個函數(shù)解析式．月份x/月123456人數(shù)y/人526168747883解：x123456u=lny3.95124.11094.21954.30414.35674.4188在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測時，需要注意下列問題:(1)經(jīng)驗(yàn)回歸方程只適用于所研究的樣本的總體.例如，根據(jù)我國父親身高與兒子身高的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程，不能用來描述美國父親身高與兒子身高之間的關(guān)系.同樣，根據(jù)生長在南方多雨地區(qū)的樹高與胸徑的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程，不能用來描述北方干旱地區(qū)的樹高與胸徑之間的關(guān)系.(2)經(jīng)驗(yàn)回歸方程一般都有時效性.例如，根據(jù)20世紀(jì)80年代的父親身高與兒子身高的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程，不能用來描述現(xiàn)在的父親身高與兒子身高之間的關(guān)系.(3)解釋變量的取值不能離樣本數(shù)據(jù)的范圍太遠(yuǎn).一般解釋變量的取值在樣本數(shù)據(jù)范圍內(nèi)，經(jīng)驗(yàn)回歸方程的預(yù)報效果會比較好，超出這個范圍越遠(yuǎn)，預(yù)報的效果越差.(4)不能期望經(jīng)驗(yàn)回歸方程得到的預(yù)報值就是響應(yīng)變量的精確值.事實(shí)上，它是響應(yīng)變量的可能取值的平均值.課本120頁1.在回歸分析中，分析殘差能夠幫助我們解決哪些問題?解：分析殘差可以幫助我們解決以下幾個問題:(1)尋找殘差明顯比其他殘差大很多的異常點(diǎn)，如果有，檢查相應(yīng)的樣本數(shù)據(jù)是否有錯.(2)分析殘差圖可以診斷選擇的模型是否合適，如果不合適，可以參考?xì)埐顖D提出修改模型的思路.(1)作GDP和年份的散點(diǎn)圖，根據(jù)該圖猜想它們之間的關(guān)系可以用什么模型描述；(2)建立年份為解釋變量，GDP為響應(yīng)變量的一元線性回歸模型，并計算殘差;(3)根據(jù)你得到的一元線性回歸模型，預(yù)測2017年的GDP，看看你的預(yù)測值與實(shí)際的GDP的誤差是多少;(4)你認(rèn)為這個模型能較好地刻畫GDP和年份的關(guān)系嗎?請說明理由.課本120頁2.1997-2006年我國的國內(nèi)生產(chǎn)總值(GDP)的數(shù)據(jù)如下:年份GDP/億元年份GDP/億元199779715.02002121727.4199885195.52003137422.0199990564.42004161840.22000100280.12005187318.92001110863.12006219438.5(5)隨著時間的發(fā)展，又收集到2007-2016年的GDP數(shù)據(jù)如下:建立年份(1997-2016)為解釋變量，GDP為響應(yīng)變量的經(jīng)驗(yàn)回歸方程，并預(yù)測2017年的GDP，與實(shí)際的GDP誤差是多少?你能發(fā)現(xiàn)什么?年份GDP/億元年份GDP/億元2007270232.32012540367.42008319515.52013595244.42009349081.42014643974.02010413030.32015689052.12011489300.62016744127.2(1)作GDP和年份的散點(diǎn)圖，根據(jù)該圖猜想它們之間的關(guān)系可以用什么模型描述；課本120頁2.1997-2006年我國的國內(nèi)生產(chǎn)總值(GDP)的數(shù)據(jù)如下:年份GDP/億元年份GDP/億元199779715.02002121727.4199885195.52003137422.0199990564.42004161840.22000100280.12005187318.92001110863.12006219438.5解：(1)畫GDP與年份的散點(diǎn)圖，如圖所示，可以觀察到隨著年份的增加GDP也隨之增加，GDP值與年份呈現(xiàn)近似線性關(guān)系，可以用一元線性回歸模型刻畫.(2)建立年份為解釋變量,GDP為響應(yīng)變量的一元線性回歸模型,并計算殘差;(3)根據(jù)你得到的一元線性回歸模型，預(yù)測2017年的GDP，看看你的預(yù)測值與實(shí)際的GDP的誤差是多少;課本120頁2.1997-2006年我國的國內(nèi)生產(chǎn)總值(GDP)的數(shù)據(jù)如下:解：(2)用y表示GDP的值，t表示年份，用一元線性回歸模型擬合數(shù)據(jù)，用統(tǒng)計軟件計算，得到經(jīng)驗(yàn)回歸方程為殘差的計算結(jié)果見下表.年份1997199819992000200120022003200420052006殘差171267752-1734-6873-11145-15145-14296-4732589223157(3)2017年的GDP預(yù)報值為359684億元，2017年的實(shí)際的GDP為820754億元，預(yù)測值比實(shí)際值少461070億元.(4)你認(rèn)為這個模型能較好地刻畫GDP和年份的關(guān)系嗎?請說明理由.課本120頁2.1997-2006年我國的國內(nèi)生產(chǎn)總值(GDP)的數(shù)據(jù)

人人文庫> 全部分類> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊

文檔簡介

溫馨提示

最新文檔

評論

【課件】8.2.2一元線性回歸模型參數(shù)的最小二乘估計（2）課件-2021-2022學(xué)年高二下學(xué)期數(shù)學(xué)人教A版（2019）選擇性必修第三冊

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔