一元線性回歸模型參數(shù)的最小二乘估計課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第1頁
一元線性回歸模型參數(shù)的最小二乘估計課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第2頁
一元線性回歸模型參數(shù)的最小二乘估計課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第3頁
一元線性回歸模型參數(shù)的最小二乘估計課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第4頁
一元線性回歸模型參數(shù)的最小二乘估計課件-高二下學(xué)期數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一元線性回歸模型參數(shù)的最小二乘估計(第一課時)F佳2022年06月問題:為了研究兩個變量之間的相關(guān)關(guān)系,我們建立了一元線性回歸模型表達(dá)式

刻畫的是變量Y與變量x之間的線性相關(guān)關(guān)系,其中參數(shù)a和b未知,我們能否通過樣本數(shù)據(jù)估計參數(shù)a和b?參數(shù)a和b刻畫了變量Y與變量x的線性關(guān)系,因此通過樣本數(shù)據(jù)估計這兩個參數(shù),相當(dāng)于尋找一條適當(dāng)?shù)闹本€,使表示成對樣本數(shù)據(jù)的這些散點(diǎn)在整體上與這條直線最接近.

與函數(shù)模型不同,回歸模型的參數(shù)一般是無法精確求出的,只能通過成對樣本數(shù)據(jù)估計這兩個參數(shù).例如:在各種各樣的散點(diǎn)圖中,有些散點(diǎn)圖中的點(diǎn)是雜亂分布的,有些散點(diǎn)圖中的點(diǎn)的分布有一定的規(guī)律性,年齡和人體脂肪含量的樣本數(shù)據(jù)的散點(diǎn)圖中的點(diǎn)的分布有什么特點(diǎn)?

這些點(diǎn)大致分布在一條直線附近.思考:對一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),你認(rèn)為其回歸直線是一條還是幾條?思考:在樣本數(shù)據(jù)的散點(diǎn)圖中,能否用直尺準(zhǔn)確畫出回歸直線?方案一:畫出一條直線,使其過盡可能多的樣本點(diǎn);方案二:在圖中選取兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個數(shù)基本相同。整體上最接近!

方案三:

在散點(diǎn)圖中多取幾組點(diǎn),確定幾條直線的方程,分別求出各條直線的斜率和截距的平均數(shù),將這兩個平均數(shù)作為回歸方程的斜率和截距。設(shè)滿足一元線性回歸模型的兩個變量的n對樣本數(shù)據(jù)為(x1,

y1),(x2,

y2),???,(xn,

yn),由yi=bxi+a+ei(i=1,2,???,n),得

顯然|ei|越小,表示點(diǎn)(xi,

yi)與點(diǎn)(xi,

bxi+a)的“距離”越小,即樣本數(shù)據(jù)點(diǎn)離直線y=bx+a的豎直距離越小,如右圖所示.特別地,當(dāng)ei=0時,表示點(diǎn)(xi,

yi)在這條直線上.因此,可以用這n個豎直距離之和來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”.

在實(shí)際應(yīng)用中,因為絕對值使得計算不方便,所以人們通常用各散點(diǎn)到直線的豎直距離的平方之和來刻畫“整體接近程度”.運(yùn)算不方便避免相互抵消各點(diǎn)與直線的整體偏差人們經(jīng)過長期的實(shí)踐與研究,已經(jīng)找到了計算回歸方程的一般公式

,其中:

以上公式的推導(dǎo)較復(fù)雜,故不作推導(dǎo),但它的原理較為簡單:即各點(diǎn)到該直線的距離的平方和最小,這一方法叫最小二乘法。易得:(1)經(jīng)驗回歸直線必過樣本中心;(2)與相關(guān)系數(shù)r符號相同.我們將稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,這種求經(jīng)驗回歸方程的方法叫最小二乘法,求得的,叫做b,a的最小二乘估計.利用上節(jié)課的數(shù)據(jù),依據(jù)用最小二乘估計一元線性回歸模型參數(shù)的公式,求出兒子身高Y關(guān)于父親身高x的經(jīng)驗回歸方程.利用公式(2)可以計算出b=0.839,a=28.957,得到兒子身高Y關(guān)于父親身高x的經(jīng)驗回歸方程為相應(yīng)的經(jīng)驗回歸直線如圖所示:反思1:當(dāng)x=176時,

,如果一位父親身高為176cm,他兒子長大后身高一定能長到177cm嗎?為什么?兒子的身高不一定會是177cm,這是因為還有其他影響兒子身高的因素,回歸模型中的隨機(jī)誤差清楚地表達(dá)了這種影響,父親的身高不能完全決定兒子的身高,不過,我們可以作出推測,當(dāng)父親的身高為176cm時,兒子身高一般在177cm左右.如果把父親身高為176cm的所有兒子身高作為一個子總體,那么177cm是這個子總體均值的估計值.

反思2:根據(jù)經(jīng)驗回歸方程

中斜率的具體含義,高個子的父親一定生高個子的兒子嗎?同樣,矮個子的父親一定生矮個子的兒子嗎?

根據(jù)經(jīng)驗回歸方程

中斜率0.839可以解釋為父親身高每增加1cm,其兒子的身高平均增加0.839cm.分析模型可以發(fā)現(xiàn),高個子父親有生高個子兒子的趨勢,但一群高個子父親的兒子們的平均身高要低于父親們的平均身高,例如x=185(cm),則矮個子父親有生矮個子兒子的趨勢,但一群矮個子父親的兒子們的平均身高要高于父親們的平均身高,例如x=170(cm),則英國著名統(tǒng)計學(xué)家高爾頓把這種后代的身高像中間值靠近的趨勢稱為“回歸現(xiàn)象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回歸分析.反思2:根據(jù)經(jīng)驗回歸方程

中斜率的具體含義,高個子的父親一定生高個子的兒子嗎?同樣,矮個子的父親一定生矮個子的兒子嗎?

練習(xí):某商品銷售量y(單位∶件)與銷售價格x(單位∶元/件)負(fù)相關(guān),則其經(jīng)驗回歸方程可能是(

A.y=-10x+200

B.y=10x+200

C.y=-10x-200

D.y=10x-200

練習(xí):已知回歸直線的斜率的估計值是1.23,且過定點(diǎn)(4,5),則經(jīng)驗回歸方程是________________.

對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗回歸方程得到的)稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.殘差是隨機(jī)誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.

例如,對于下表中的第6個觀測,父親身高為172cm,其兒子身高的觀測值為y6=176(cm),預(yù)測值為殘差為176-173.265=2.735(cm).編號父親身高/cm兒子身高觀測值/cm兒子身高預(yù)測值/cm殘差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023殘差表:為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標(biāo),殘差作為縱坐標(biāo),可以畫出殘差圖,如圖下所示.殘差圖:

觀察殘差的散點(diǎn)圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機(jī)變量的觀測值.可見,通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型的假設(shè).(1)(2)(3)(4)觀察以下四幅殘差圖,你認(rèn)為哪一個殘差滿足一元線性回歸模型中對隨機(jī)誤差的假定?(1)(2)圖(1)顯示殘差與觀測時間有線性關(guān)系,應(yīng)將時間變量納入模型;圖(2)顯示殘差與觀測時間有非線性關(guān)系,應(yīng)在模型中加入時間的非線性函數(shù)部分;(3)(4)圖(3)說明殘差的方差不是一個常數(shù),隨觀測時間變大而變大圖(4)的殘差比較均勻地集中在以橫軸為對稱軸的水平帶狀區(qū)域內(nèi).

一般地,建立經(jīng)驗回歸方程后,通常需要對模型刻畫數(shù)據(jù)的效果進(jìn)行分析.借助殘差分析還可以對模型進(jìn)行改進(jìn),使我們能根據(jù)改進(jìn)模型作出更符合實(shí)際的預(yù)測與決策.2.殘差的平方和越小越好;3.原始數(shù)據(jù)中的可疑數(shù)據(jù)往往是殘差絕對值過大的數(shù)據(jù);4.對數(shù)據(jù)刻畫效果比較好的殘差圖特征:殘差點(diǎn)比較均勻的集中在水平帶狀區(qū)域內(nèi).1.殘差等于觀測值減預(yù)測值殘差的性質(zhì):小結(jié):1.經(jīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論