《線性回歸方程》示范課教案【高中數(shù)學(xué)蘇教版】_第1頁
《線性回歸方程》示范課教案【高中數(shù)學(xué)蘇教版】_第2頁
《線性回歸方程》示范課教案【高中數(shù)學(xué)蘇教版】_第3頁
《線性回歸方程》示范課教案【高中數(shù)學(xué)蘇教版】_第4頁
《線性回歸方程》示范課教案【高中數(shù)學(xué)蘇教版】_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章統(tǒng)計9.1.2線性回歸方程教學(xué)目標(biāo)教學(xué)目標(biāo)1.結(jié)合具體實例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理;2.掌握一元線性回歸模型參數(shù)的最小二乘估計方法,會使用相關(guān)的統(tǒng)計軟件;3.針對實際問題,會用一元線性回歸模型進(jìn)行預(yù)測.教學(xué)重難點(diǎn)教學(xué)重難點(diǎn)重點(diǎn):線性歸回方程的求解方法.難點(diǎn):線性歸回分析的基本思想和方法.教學(xué)過程教學(xué)過程一、新課導(dǎo)入上節(jié)課我們學(xué)習(xí)了一種非確定關(guān)系——相關(guān)關(guān)系,并重點(diǎn)學(xué)習(xí)了一種特殊的相關(guān)關(guān)系——線性相關(guān)關(guān)系,比如我國城鎮(zhèn)居民人均年支出與人均年可支配收入之間的關(guān)系.根據(jù)數(shù)據(jù),我們得到了相應(yīng)的散點(diǎn)圖,接下來,我們需要通過這種關(guān)系預(yù)測對應(yīng)的人均年支出.年份19902000201020112012201320142015人均年可支配收入/元15106280191092181024565264672884431195人均年支出/元12794998134711516116674184881996821392散點(diǎn)圖:二、新知探究問題1:怎樣才能恰當(dāng)?shù)姆从硟蓚€變量之間的線性相關(guān)關(guān)系呢?答案:觀察散點(diǎn)圖,做一條直線,從圖中可以看出,這些點(diǎn)在這條直線附近,但并不都在這條直線上,也就是說,這條直線并不能精確地反映x與y之間的關(guān)系,y的值不能由x確定,也就是說,數(shù)據(jù)中的y值與a+bx的值之間存在誤差,在此,我們將兩者之間的關(guān)系表示為y=a+bx+ε,其中a+bx是確定性函數(shù),ε稱為隨機(jī)誤差.追問:隨機(jī)誤差產(chǎn)生的主要原因有哪些?(1)所用的確定性函數(shù)不恰當(dāng)引起的誤差;(2)忽略了某些因素的影響;(3)存在觀測誤差等.線性回歸模型的定義我們將y=a+bx+ε稱為線性回歸模型,其中其中a+bx是確定性函數(shù),ε稱為隨機(jī)誤差.問題2:對于y=a+bx+ε這樣的線性回歸模型,我們需要考慮哪些方面的問題?(1)模型是否合理?可用線性相關(guān)性檢驗的方法處理,這里對相關(guān)性檢驗的方法不作要求,只要根據(jù)相關(guān)系數(shù)作出判斷.(2)在模型合理的條件下,如何估計a,b?設(shè)有n對觀測數(shù)據(jù)xi,yi(i=1,2,3,···,n),根據(jù)線性回歸模型,對于每一個xi,對應(yīng)的隨機(jī)誤差項εi=y(tǒng)i-a+bxi,我們希望y=a+bx+ε與y=由于ε1+ε2+···+εn是絕對值之和的形式,這對于進(jìn)一步的運(yùn)算與推導(dǎo)帶來很多不便,而ε1+ε2+···+εn很小并不表示ε1+ε2+···+εn很小,因此通常用“ε12+于是,只要求出使Qα,β=i=1nyi?α?βx2取最小值時的α,β的值,分別將它們作為a其中:.線性回歸方程的定義:設(shè)有n對觀測數(shù)據(jù)xi,yi((其中)得到的直線y=a+bx稱為n對數(shù)據(jù)的回歸直線,此直線方程稱為線性回歸方程,其中a稱為回歸截距,b“最小二乘法”的定義:使樣本數(shù)據(jù)各點(diǎn)到回歸直線的距離的平方和最小來得到回歸直線的方法叫做最小二乘法.問題3:怎樣求解回歸直線的方程即線性回歸方程?有哪些方法?答案:方案1:在散點(diǎn)圖中選兩點(diǎn)作直線,使直線兩側(cè)的點(diǎn)的個數(shù)基本相同;方案2:如果多取幾對點(diǎn),確定多條直線,再求出這些直線的斜率和截距的平均值作為回歸直線的斜率和截距,從而得到回歸方程;方案3:先畫出一條直線,測量出各點(diǎn)與它的距離,再移動直線,到達(dá)一個使距離的和最小時,測出它的斜率和截距,從而得到回歸方程;方案4:(最小二乘法)回歸直線的方程是一次函數(shù),即設(shè)為y=bx+a的形式,關(guān)鍵是求出斜率b和截距a.三、應(yīng)用舉例例120個工業(yè)企業(yè)某年的平均固定資產(chǎn)價值與總產(chǎn)值(單位:百萬元)如下表所示,企業(yè)編號年平均固定資產(chǎn)價值年產(chǎn)總值企業(yè)編號年平均固定資產(chǎn)價值年產(chǎn)總值13632.0115045.524340.2127065.035047.5136256.044041.5145855.055551.0155255.065853.4166357.073833.8176454.284542.8185356.594745.6195450.2104240.8205649.2設(shè)平均固定資產(chǎn)價值為x,年總產(chǎn)值為y,單位均為百萬元,試求出x,y的線性回歸方程.解:由表中數(shù)據(jù)可得,代入公式可得:,因此,線性回歸方程為.方法總結(jié):求線性回歸直線方程的一般步驟:(1)整理觀測數(shù)據(jù),列成表格;(2)計算等;(3)代入公式計算a,(4)寫出線性回歸直線的方程.例2下表為某地近幾年機(jī)動車車輛數(shù)與交通事故數(shù)的統(tǒng)計資料,請判斷機(jī)動車車輛數(shù)與交通事故數(shù)之間是否具有線性相關(guān)關(guān)系,如果具有線性相關(guān)關(guān)系,求出線性回歸方程;如果不具有線性相關(guān)關(guān)系,說明理由.機(jī)動車輛數(shù)x/95110112120129135150180交通事故數(shù)y/6.27.57.78.58.79.810.213解:數(shù)據(jù)之間有線性關(guān)系.計算相應(yīng)的數(shù)據(jù)之和:代入公式,可得相關(guān)系數(shù)r=0.9927,故兩個變量之間具有很強(qiáng)的線性相關(guān)關(guān)系.代入公式,可得:,因此所求線性回歸方程為.例3統(tǒng)計學(xué)家K.Pearson收集了大量父親和兒子的身高數(shù)據(jù),下表是從中隨機(jī)抽取的10對父子的身高數(shù)據(jù).父親的身高x/152.4157.5162.6165.1167.6170.2172.7177.8182.9188.0兒子的身高y/161.3165.6167.6166.4169.9170.4171.2173.5178.1177.8試估計父親身高為166cm時,他兒子的身高.解:根據(jù)表中數(shù)據(jù)畫出散點(diǎn)圖,如圖所示:由表中數(shù)據(jù)可得:根據(jù)線性相關(guān)系數(shù)公式可得r=0.9801,說明父親與兒子的身高之間具有很強(qiáng)的線性相關(guān)關(guān)系.再由公式可得,因此,所求線性回歸方程為,當(dāng)x=166時,,即父親的身高為166cm時,他的兒子的身高約為168cm.想一想:上述結(jié)論是否說明,身高為166cm的父親,其兒子的身高就一定是168cm呢?答案:首先,這個結(jié)論是對當(dāng)?shù)?、?dāng)時的父親身高而言的,對其他地區(qū)或該地區(qū)的不同年代,這個結(jié)論不一定成立;其次,父親身高為166cm時,他的兒子的身高不一定是168cm,因為人的身高還受到母親身高、生長的條件等多種因素的影響.上述結(jié)果說明:對于當(dāng)?shù)?、?dāng)時的父子而言,身高為166cm的父親們,其兒子的身高大多在168cm附近,且平均身高約為168cm,因此我們可以作出推斷:父親身高為166cm時,他的兒子的身高一般在168cm左右.事實上,在線性回歸方程中,表示自變量x每增加1個單位時因變量y平均的增加,表示當(dāng)自變量為x時因變量y的平均值.四、課堂練習(xí)1.已知變量x,y之間具有線性關(guān)系,其散點(diǎn)圖如圖所示,則其線性回歸方程可能為()A.y=1.5x+2 B.yC.y=1.5x?2 2.某醫(yī)學(xué)科研所對人體脂肪含量與年齡這兩個變量研究得到一組隨機(jī)樣本數(shù)據(jù),運(yùn)用Excel軟件計算得y=0.577x-0.448(x為人的年齡,y為人體脂肪含量),對年齡為37歲的人來說,下面說法正確的是()A.年齡為37歲的人體內(nèi)脂肪含量一定為20.90B.年齡為37歲的人體內(nèi)脂肪含量約為21.01C.年齡為37歲的人群中的體內(nèi)脂肪含量平均為20.90D.年齡為37歲的人群中的大部分人的體內(nèi)脂肪含量約為31.53.某地區(qū)2013年至2019年農(nóng)村居民家庭人均純收入y(單位:千元)的數(shù)據(jù)如下表:年份2013201420152016201720182019年份代號t1234567人均純收入y2.93.33.64.44.85.25.9(1)求y關(guān)于t的線性回歸方程;(2)利用(1)中的線性回歸方程,分析2013年至2019年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測該地區(qū)2021年農(nóng)村居民家庭人均純收入.參考答案:1.解析:選B.由散點(diǎn)圖可得到答案.2.解析:選C.當(dāng)x=37時,y=0.577×37-0.448=20.901≈20.90,由此估計,年齡為37歲的人群中的體內(nèi)脂肪含量平均為20.90.3.解析:(1)由所給數(shù)據(jù)計算得:t=17b=a=所求線性回歸方程為y=0.5t+2.3(2)由(1)知,b=0.5>0,故2013年至2019年該地區(qū)農(nóng)村居民家庭人均收入逐年增加,平均每年增加0將2021年的年份代號t=9代入(1)中的線性回歸方程,得y=0.5×9+2.3=6.8故預(yù)測該地區(qū)2021年農(nóng)村居民家庭人均純收入為6.8千元.五、課堂小結(jié)1.線性回歸模型的定義我們將y=a+bx+ε稱為線性回歸模型,其中其中a+bx是確定性函數(shù),ε稱為隨機(jī)誤差.2.線性回歸方程的定義:設(shè)有n對觀測數(shù)據(jù)xi,yi((其中)得到的直線稱為n對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論