8.2.1一元線性回歸模型參數的最小二乘估計(第一課時)課件高二下學期數學人教A版選擇性_第1頁
8.2.1一元線性回歸模型參數的最小二乘估計(第一課時)課件高二下學期數學人教A版選擇性_第2頁
8.2.1一元線性回歸模型參數的最小二乘估計(第一課時)課件高二下學期數學人教A版選擇性_第3頁
8.2.1一元線性回歸模型參數的最小二乘估計(第一課時)課件高二下學期數學人教A版選擇性_第4頁
8.2.1一元線性回歸模型參數的最小二乘估計(第一課時)課件高二下學期數學人教A版選擇性_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

8.2一元線性回歸模型及其應用通過前面的學習我們已經了解到,根據成對樣本數據的散點圖和樣本相關系數,可以推斷兩個變量是否存在相關關系、是正相關還是負相關,以及線性相關程度的強弱等.進一步地,如果能像建立函數模型刻畫兩個變量之間的確定性關系那樣,通過建立適當的統(tǒng)計模型刻畫兩個隨機變量的相關關系,那么我們就可以利用這個模型研究兩個變量之間的隨機關系,并通過模型進行預測.下面我們研究當兩個變量線性相關時,如何利用成對樣本數據建立統(tǒng)計模型,并利用模型進行預測的問題.8.2.1一元線性回歸模型參數的最小二乘估計(第一課時)一、課前回顧二、學習目標1.了解一元線性回歸模型及隨機誤差.2.了解一元線性回歸模型、殘差、殘差分析的概念.3.了解最小二乘法的思想方法,會求經驗回歸方程,并用回歸方程進行預報.三、自學指導105頁到112頁完成下列問題與例題生活經驗告訴我們,兒子的身高與父親的身高不僅線性相關,而且還是正相關,即父親的身高較高時,兒子的身高通常也較高.為了進一步研究兩者之間的關系,有人調查了14名男大學生的身高及其父親的身高,得到的數據如表8.2-1所示.表8.2-1編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182兒子身高/cm父親身高/cm圖8.2-1利用前面表示數據的方法,以橫軸表示父親身高、縱軸表示兒子身高建立直角坐標系,再將表8.2-1中的成對樣本數據表示為散點圖,如圖8.2-1所示.可以發(fā)現,散點大致分布在一條從左下角到右上角的直線附近,表明兒子身高和父親身高線性相關.利用統(tǒng)計軟件,求得樣本相關系數為,表明兒子身高和父親身高正線性相關,且相關程度較高.根據表8.2-1中的數據,兒子身高和父親身高這兩個變量之間的關系可以用函數模型刻畫嗎?在表8.2-1的數據中,存在父親身高相同而兒子身高不同的情況例如,第6個和第8個觀測的父親身高均為172cm,而對應的兒子身高分別為176cm和174cm;同樣,第3,4兩個觀測中,兒子身高都是170cm,而父親身高分別為173cm和169cm.可見兒子身高和父親身高之間不是函數關系,也就不能用函數模型刻畫圖8.2-1中的散點大致分布在一條直線附近,表明兒子身高和父親身高這兩個變量之間有較強的線性相關關系,因此我們可以用一次函數來刻畫父親身高對兒子身高的影響,而把影響兒子身高的其他因素,如母親身高、生活環(huán)境、飲食習慣等作為隨機誤差,得到刻畫兩個變量之間關系的線性回歸模型其中,隨機誤差是一個隨機變量.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182我們稱(1)式為Y關于x的一元線性回歸模型(simplelinearregressionmodel).其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差,模型中的Y也是隨機變量,其值雖然不能由變量x的值確定,但是卻能表示為bx+a與e的和(疊加),前一部分由x所確定,后一部分是隨機的.如果e=0,那么Y與x之間的關系就可用一元線性函數模型來描述.你能結合具體實例解釋產生模型(1)中隨機誤差項的原因嗎?在研究兒子身高與父親身高的關系時,產生隨機誤差e的原因有:(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環(huán)境、飲食習慣和鍛煉時間等;(2)在測量兒子身高時,由于測量工具、測量精度所產生的測量誤差;(3)實際問題中,我們不知道兒子身高和父親身高的相關關系是什么,可以利用一元線性回歸模型來近似這種關系,這種近似也是產生隨機誤差e的原因.問題思考1.某電腦公司有5名產品推銷員,其工作年限與年推銷金額數據如下表:推銷員編號12345工作年限x/年35679年推銷金額y/萬元80120120160200請問如何表示年推銷金額y與工作年限x之間的相關關系?提示:畫出散點圖,由圖可知,樣本點散布在一條直線附近,因此可用回歸直線表示變量之間的相關關系.由模型的建立過程可知,參數a和b刻畫了變量Y與變量x的線性關系,因此通過成對樣本數據估計這兩個參數,相當于尋找一條適當的直線,使表示成對樣本數據的這些散點在整體上與這條直線最接近.探究利用散點圖8.2-1找出一條直線,使各散點在整體上與此直線盡可能接近.兒子身高/cm父親身高/cm圖8.2-2有的同學可能會想,可以采用測量的方法,先畫出一條直線,測量出各點與它的距離,然后移動直線,到達一個使距離的和最小的位置,測量出此時的斜率和截距,就可得到一條直線,如圖8.2-2所示.兒子身高/cm父親身高/cm圖8.2-3有的同學可能會想,可以在圖中選擇這樣的兩點畫直線,使得直線兩側的點的個數基本相同,把這條直線作為所求直線,如圖8.2-3所示.兒子身高/cm父親身高/cm圖8.24還有的同學會想,在散點圖中多取幾對點,確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數,將這兩個平均數作為所求直線的斜率和截距如圖8.2-4所示.同學們不妨去實踐一下,看看這些方法是不是真的可行.上面這些方法雖然有一定的道理,但比較難操作,我們需要另辟蹊徑先進一步明確我們面臨的任務:從成對樣本數據出發(fā),用數學的方法刻畫“從整體上看,各散點與直線最接近”.兒子身高/cm父親身高/cm下面利用成對樣本數據求使Q取最小值的a,b.兒子身高/cm父親身高/cm圖8.2-6做一做:(1)在一次試驗中,測得(x,y)的四組值分別是(1,2),(2,3),(3,4),(4,5),則y關于x的經驗回歸方程為(

)答案:(1)A

(2)8.95顯然不一定,因為還有其他影響兒子身高的因素,父親身高不能完全決定兒子身高.不過,我們可以作出推測,當父親身高為176cm時,兒子身高一般在177cm左右.實際上,如果把這所學校父親身高為176cm的所有兒子身高作為一個子總體,那么177cm是這個子總體的均值的估計值.英國著名統(tǒng)計學家高爾頓(F.Galton,1822—1911)把這種后代的身高向中間值靠近的趨勢稱為“回歸現象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回歸分析.根據模型,父親身高為多少時,長大成人的兒子的平均身高與父親的一樣?你怎么看這個判斷?對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的y稱為預測值,觀測值減去預測值稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.編號父親身高/cm兒子身高/cm兒子身高預測值/cm殘差1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.10413164165166.553-1.55314180182179.9772.023父親身高/cm殘差/cm圖8.2-7為了使數據更加直觀,用父親身高作為橫坐標,殘差作為縱坐標,可以畫出殘差圖,如圖8.2-7所示觀察表8.2-2可以看到,殘差有正有負,殘差的絕對值最大是4.413.觀察殘差的散點圖可以發(fā)現,殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機變量的觀測值.可見,通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型的假設.一般地,建立經驗回歸方程后,通常需要對模型刻畫數據的效果進行分析.借助殘差分析還可以對模型進行改進,使我們能根據改進模型作出更符合實際的預測與決策.思考觀察圖8.2-8中的四幅殘差圖,你認為哪一個殘差滿足一元線性回歸模型中對隨機誤差的假定?根據一元線性回歸模型中對隨機誤差的假定,殘差應是均值為0、方差為σ2的隨機變量的觀測值.在圖8.2-8中,圖(1)顯示殘差與觀測時間有線性關系,應將時間變量納入模型;圖(2)顯示殘差與觀測時間有非線性關系,應在模型中加入時間的非線性函數部分;圖(3)說明殘差的方差不是一個常數,隨觀測時間變大而變大圖(4)的殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內.可見,在圖8.2-8中,只有圖(4)滿足一元線性回歸模型對隨機誤差的假設.例1下表提供了某廠節(jié)能降耗技術改造后生產甲產品過程中記錄的產量x(單位:噸)與相應的生產能耗y(單位:噸標準煤)的幾組對照數據:(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,用最小二乘法求出y關于x的經驗回歸方程(3)已知該廠技改前100噸甲產品的生產能耗為90噸標準煤.試根據(2)求出的經驗回歸方程,預測生產100噸甲產品的生產能耗比技改前降低了多少噸標準煤.(參考數值:3×2.5+4×3+5×4+6×4.5=66.5)x3456y2.5344.5例1下表提供了某廠節(jié)能降耗技術改造后生產甲產品過程中記錄的產量x(單位:噸)與相應的生產能耗y(單位:噸標準煤)的幾組對照數據:(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,用最小二乘法求出y關于x的經驗回歸方程(3)已知該廠技改前100噸甲產品的生產能耗為90噸標準煤.試根據(2)求出的經驗回歸方程,預測生產100噸甲產品的生產能耗比技改前降低了多少噸標準煤.(參考數值:3×2.5+4×3+5×4+6×4.5=66.5)x3456y2.5344.5解:(1)由題設所給數據,可得散點圖如圖.(3)由(2)的經驗回歸方程及技改前生產100噸甲產品的生產能耗,得降低的生產能耗為90-(0.7×100+0.35)=19.65(噸標準煤).求經驗回歸方程的三個步驟(1)畫散點圖:由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關關系.(2)求回歸系數:若存在線性相關關系,則求回歸系數.(3)寫方程:寫出經驗回歸方程.變式訓練1一個車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了10次試驗.測得的數據如下:(1)y與x是否具有線性相關關系?(2)如果y與x具有線性相關關系,求經驗回歸方程;(3)根據求出的經驗回歸方程,預測加工200個零件所用的時間為多少?零件數x/個102030405060708090100加工時間y/min626875818995102108115122解:(1)列出下表.i12345678910xi102030405060708090100yi626875818995102108115122xiyi6201

3602

2503

2404

4505

7007

1408

64010

35012

200由于r≈0.999

8,因此x與y之間有很強的線性相關關系,因而可求經驗回歸方程.1.某車間加工零件的數量x與加工時間y的統(tǒng)計數據如表:零件數x/個102030加工時間y/分鐘213039四、當堂檢測答案:C2.下表是x與y之間的一組數據,則y關于x的經驗回歸直線必過點(

)A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)x0123y1357答案:D2.下表是x與y之間的一組數據,則y關于x的經驗回歸直線必過點(

)A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)x0123y13574.某工廠為了對新研發(fā)的一種產品進行合理定價,將該產品按事先擬定的價格進行試銷,得到如下數據:(2)預計在今后的銷售中,銷量與單價仍然服從(1)中的關系,且該產品的成本是4元/件,為使工廠獲得最大利潤,該產品的單價應定為多少元?(利潤=銷售收入-成本)單價x/元88.28.48.68.89銷量y/件908483807568五、課后小結第107頁1.說明函數模型與回歸模型的區(qū)別,并分別舉出兩個應用函數模型和回歸模型的例子.函數模型刻畫的是變量之間具有的函數關系,是一種確定性的關系.回歸模型刻畫的是變量之間具有的相關關系,不是一種確定性的關系,即回歸模型刻畫的是兩個變量之間的隨機關系.舉例:路程與速度的關系、正方體體積與邊長的關系可以應用函數模型刻畫,體重與身高的關系、冷飲銷量與氣溫的關系可以應用回歸模型刻畫.六、課后作業(yè)2.在一元線性回歸模型(1)中,參數b的含

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論