7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第1頁(yè)
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第2頁(yè)
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第3頁(yè)
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第4頁(yè)
7.1一元線性回歸(課件)-高二數(shù)學(xué)(北師大版2019選擇性)_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一元線性回歸

在現(xiàn)實(shí)生活中,反映量與量之間的函數(shù)關(guān)系非常普遍,但也存在一些量與量之間不滿足函數(shù)關(guān)系,如人的身高與體重.一般說(shuō)來(lái),人的身高越高,體重就越重,二者確實(shí)有關(guān)系.但是身高相同的人,體重卻不一定相同,也就是說(shuō),給定身高h(yuǎn)沒(méi)有唯一的體重m與之對(duì)應(yīng).在現(xiàn)實(shí)生活中,這樣的例子還有很多,如人的年齡與血壓、農(nóng)作物的施肥量與產(chǎn)量等.實(shí)例分析直線擬合為了了解人的身高與體重的關(guān)系,我們隨機(jī)抽取9名15歲的男生,測(cè)得他們的身高(單位:cm)、體重(單位:kg)如表7-1:表7-1編號(hào)123456789身高/cm165157155175168157178160163體重/kg524445555447625053

從表7-1中不難看出,同一身高157cm對(duì)應(yīng)著不同的體重44kg和47kg,即體重不是身高的函數(shù).如果把身高看作橫坐標(biāo)、體重看作縱坐標(biāo),在平面直角坐標(biāo)系中畫出對(duì)應(yīng)的點(diǎn)(如圖7-1),就會(huì)發(fā)現(xiàn),隨著身高的增長(zhǎng),體重基本上呈現(xiàn)直線增加的趨勢(shì).1.在圖7-1中,每個(gè)點(diǎn)對(duì)應(yīng)的一對(duì)數(shù)據(jù)(xi,yi),稱為成對(duì)數(shù)據(jù).這些點(diǎn)構(gòu)成的圖稱為散點(diǎn)圖.2.從散點(diǎn)圖上可以看出,如果變量之間存在著某種關(guān)系,這些點(diǎn)會(huì)有一個(gè)大致趨勢(shì),這種趨勢(shì)通??梢杂靡粭l光滑的曲線來(lái)近似地描述.這樣近似描述的過(guò)程稱為曲線擬合。3.若在兩個(gè)變量x和y的散點(diǎn)圖中,所有點(diǎn)看上去都在一條直線附近波動(dòng),此時(shí)就可以用一條直線來(lái)近似地描述這兩個(gè)量之間的關(guān)系,稱之為直線擬合.

注意點(diǎn):(1)判斷兩個(gè)變量X和Y之間是否具有線性關(guān)系,常用的簡(jiǎn)便方法就是繪制散點(diǎn)圖.(2)散點(diǎn)圖中包含的數(shù)據(jù)越多,效果就越好.那么,應(yīng)當(dāng)如何求出這條直線呢?方法1

選取散點(diǎn)圖中的兩個(gè)點(diǎn),使得其余的點(diǎn)在這兩個(gè)點(diǎn)所連直線兩側(cè)分布得盡可能一樣多,如有人選取了(165,52)和(168,54)這兩個(gè)成對(duì)數(shù)據(jù),得到直線方程為2x-3y-174=0.因此,一個(gè)身高166cm的15歲男生,他的體重大致為52.667kg.方法2

將所有的點(diǎn)分成兩部分,一部分是身高在165cm以下的,一部分是身高在165cm以上(含165cm)的;然后每部分的點(diǎn)求一個(gè)平均點(diǎn):165cm以下的身高、體重的平均數(shù)(取整近似)作為一個(gè)平均點(diǎn),即(158,48),165cm以上(含165cm)的身高、體重的平均數(shù)(取整近似)作為另一個(gè)平均點(diǎn),即(172,56);最后將這兩點(diǎn)連接成一條直線,得到直線方程為4x-7y-296=0,因此,一個(gè)身高166cm的15歲男生,他的體重大致為52.571kg.

上面兩種方法都有一定的道理.用方法1,若x=175cm,則可計(jì)算y≈58.667kg;用方法2,若x=175cm,則可計(jì)算y≈714kg.每一種方法均與實(shí)際觀測(cè)值有偏差.在實(shí)際應(yīng)用時(shí),我們通常選擇本章第1.2節(jié)中介紹的方法進(jìn)行處理.散點(diǎn)圖說(shuō)明1.定義:

將兩個(gè)變量所對(duì)應(yīng)的點(diǎn)在平面直角坐標(biāo)系中描出來(lái),這些點(diǎn)就組成了變量之間的一個(gè)圖,這種圖叫散點(diǎn)圖.2.散點(diǎn)圖的畫法:

把成對(duì)的兩個(gè)變量分別作為橫坐標(biāo)和縱坐標(biāo),把每對(duì)數(shù)值對(duì)應(yīng)的點(diǎn)在平面直角坐標(biāo)系中畫出來(lái).3.散點(diǎn)圖的作用:(1)從散點(diǎn)圖可以看出,如果變量之間存在某種關(guān)系,這些點(diǎn)會(huì)有一個(gè)集中的大致趨勢(shì),這種趨勢(shì)通??梢杂靡粭l光滑的曲線來(lái)近似,這樣近似的過(guò)程稱為曲線擬合.

若如果變量x和y的散點(diǎn)圖中,所有點(diǎn)看上去都在一條直線附近波動(dòng),則稱變量間是線性相關(guān)的.此時(shí),我們可用一條直線來(lái)近似.xyo(2)若所有點(diǎn)看上去都在某條曲線(不是一條直線)附近波動(dòng),則稱此相關(guān)為非線性相關(guān)的.此時(shí),我們可用一條曲線來(lái)擬合.

如果所有的點(diǎn)在散點(diǎn)圖中沒(méi)有顯示任何關(guān)系,則稱變量間是不相關(guān)的.xyoxyo(1)根據(jù)表中的數(shù)據(jù),制成散點(diǎn)圖.你能從散點(diǎn)圖中發(fā)現(xiàn)身高與右手一拃長(zhǎng)之間的近似關(guān)系嗎?o身高/cm右手一拃長(zhǎng)/cm15015516016517017518018519019510152025女生男生4.例題與練習(xí)(2)如果近似成線性關(guān)系,請(qǐng)畫出一條直線來(lái)近似地表示這種線性關(guān)系.女生男生o身高/cm右手一拃長(zhǎng)/cm15015516016517017518018519019510152025(3)如果一個(gè)學(xué)生的身高是188cm,你能估計(jì)他的右手一拃長(zhǎng)大概有多長(zhǎng)嗎?18821(2)如果近似成線性關(guān)系,請(qǐng)畫出一條直線來(lái)近似地表示這種線性關(guān)系.o身高/cm右手一拃長(zhǎng)/cm15015516016517017518018519019510152025(3)如果一個(gè)學(xué)生的身高是188cm,你能估計(jì)他的右手一拃長(zhǎng)大概有多長(zhǎng)嗎?18822平均點(diǎn)(2)如果近似成線性關(guān)系,請(qǐng)畫出一條直線來(lái)近似地表示這種線性關(guān)系.o身高/cm右手一拃長(zhǎng)/cm15015516016517017518018519019510152025(3)如果一個(gè)學(xué)生的身高是188cm,你能估計(jì)他的右手一拃長(zhǎng)大概有多長(zhǎng)嗎?18822.7(3)如果一個(gè)學(xué)生的身高是188cm,你能估計(jì)他的右手一拃長(zhǎng)大概有多長(zhǎng)嗎?o身高/cm右手一拃長(zhǎng)/cm16018.016218016616817017217417617816418218.519.019.520.020.521.021.5(2)如果近似成線性關(guān)系,請(qǐng)畫出一條直線來(lái)近似地表示這種線性關(guān)系.例1

某種木材體積與樹木的樹齡之間有如下的對(duì)應(yīng)關(guān)系:(1)請(qǐng)作出這些數(shù)據(jù)的散點(diǎn)圖;樹齡2345678體積30344060556270解以x軸表示樹木的樹齡,y軸表示樹木的體積,可得相應(yīng)的散點(diǎn)圖如圖所示:(2)你能由散點(diǎn)圖發(fā)現(xiàn)木材體積與樹木的樹齡近似成什么關(guān)系嗎?解由散點(diǎn)圖發(fā)現(xiàn)木材體積隨著樹齡的增加而呈增加的趨勢(shì),且散點(diǎn)落在一條直線附近,所以木材的體積與樹齡成線性關(guān)系.練習(xí):

以下四個(gè)散點(diǎn)圖中,兩個(gè)變量的關(guān)系適合用直線擬合描述的是(

)A.①② B.①③C.②③ D.③④解析

①③中的點(diǎn)分布在一條直線附近,適合直線擬合描述.B

例2某品牌服裝的廣告費(fèi)支出x(單位:萬(wàn)元)與銷售額y(單位:萬(wàn)元)之間有如下的對(duì)應(yīng)數(shù)據(jù):廣告費(fèi)支出x246810銷售額y64138205285360(1)試畫出散點(diǎn)圖,并判斷廣告費(fèi)支出x與銷售額y是否具有線性相關(guān)關(guān)系;(2)若取過(guò)點(diǎn)(2,64)和點(diǎn)(8,285)的直線作為擬合直線,試預(yù)測(cè)當(dāng)x=10和15時(shí)銷售額y的值是多少?(結(jié)果保留一位小數(shù))解

(1)根據(jù)題中數(shù)據(jù)畫出散點(diǎn)圖如圖觀察散點(diǎn)圖,可以發(fā)現(xiàn)5個(gè)樣本點(diǎn)從整體上看大致在一條直線附近,所以變量x,y之間具有線性相關(guān)關(guān)系.(2)過(guò)點(diǎn)(2,64)和點(diǎn)(8,285)的直線方程是221x-6y-58=0.令x=10,則221×10-6y-58=0,∴y≈358.7;令x=15,則221×15-6y-58=0,∴y≈542.8,即當(dāng)x=10時(shí),銷售額y的值大約是358.7萬(wàn)元;當(dāng)x=15時(shí),銷售額y的值大約是542.8萬(wàn)元.反思利用擬合直線進(jìn)行預(yù)測(cè)時(shí)應(yīng)注意的問(wèn)題(1)首先要理解線性相關(guān)和擬合直線方程的意義.(2)利用擬合直線方程求得的預(yù)測(cè)值只是實(shí)際問(wèn)題的一個(gè)估計(jì)值,因此在回答結(jié)論時(shí)不能說(shuō)成是準(zhǔn)確值,而只能用“大約”等詞來(lái)回答.一元線性回歸方程

對(duì)于給定的兩個(gè)變量x和y(如身高和體重),可以把其成對(duì)的觀測(cè)值(x1,y1),(x2,y2),…,(xn,yn)表示為平面直角坐標(biāo)系中的n個(gè)點(diǎn).

現(xiàn)在希望找到一條直線Y=a+bX,使得對(duì)每一個(gè)xi(i=1,2,…,n),由這個(gè)直線方程計(jì)算出來(lái)的值a+bi與實(shí)際觀測(cè)值yi的差異盡可能小.為此,希望[y1-(a+b1)]2+[y2-(a+b2)]2+…+[yn-(a+bn)]2達(dá)到最小.換句話說(shuō),我們希望a,b最小二乘法.

為了直觀起見,先考慮3對(duì)數(shù)據(jù)(x1,y1),(x2,y2),(x3,y3),即:求a,b的值,使得偏差yi-(a+bi)(i=1,2,3)的平方和最小,即[y1-(a+b1)]2+[y2-(a+b2)]2+[y3-(a+b3)]2達(dá)到最小.下面我們用向量的方法解決這個(gè)問(wèn)題.首先,用向量的語(yǔ)言描述問(wèn)題.

要用向量的語(yǔ)言描述偏差yi-(a+bi)(i=1,2,3),容易想到將偏差作為向量的分量,即向量的坐標(biāo)(y1-(a+b1),y2-(a+b2),y3-(a+b3)).這樣,問(wèn)題就等價(jià)于:求的a,b值,使得向量(y1-(a+b1),y2-(a+b2),y3-(a+b3))的長(zhǎng)度最小.

在這里需要強(qiáng)調(diào)的是:身高和體重之間并沒(méi)有函數(shù)關(guān)系,我們得到的線性回歸方程只是對(duì)其變化趨勢(shì)的一種近似描述.對(duì)一個(gè)給定身高的人,人們可以用這個(gè)方程來(lái)估計(jì)這個(gè)人的體重,這是十分有意義的.…①先來(lái)討論3個(gè)樣本點(diǎn)的情況補(bǔ)充:怎樣使達(dá)到最小值?函數(shù)法求線性回歸方程:利用配方法可得同樣使用配方法可以得到,當(dāng)假設(shè)我們已經(jīng)得到兩個(gè)具有相關(guān)關(guān)系的變量的一組數(shù)據(jù)且回歸方程是:y=bx+a,^其中,a,b是待定參數(shù)。當(dāng)變量x取時(shí)它與實(shí)際收集到的之間的偏差是oxy2024/1/26易知,截距和斜率分別是使取最小值時(shí)的值。由于這正是我們所要推導(dǎo)的公式。在上式中,后兩項(xiàng)和無(wú)關(guān),而前兩項(xiàng)為非負(fù)數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)前兩項(xiàng)的值均為0,即有2024/1/262024/1/26用同樣的方法我們可以推導(dǎo)出n個(gè)點(diǎn)的線性回歸方程的系數(shù):牢記公式1、所求直線方程叫做回歸直線方程;相應(yīng)的直線叫做回歸直線。2、對(duì)兩個(gè)變量進(jìn)行的線性分析叫做線性回歸分析?;貧w直線方程最小二乘法:稱為樣本點(diǎn)的中心。2、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為y=bx+a,即為所求的回歸直線方程。^例1

在本章節(jié)的練習(xí)中,從散點(diǎn)圖可以看出,某小賣部6天賣出熱茶的杯數(shù)Y(單位:杯)與當(dāng)天氣溫X(單位:°C7-2.(1)試用最小二乘法求岀Y關(guān)于X的線性回歸方程;(2)如果某天的氣溫是-3℃,請(qǐng)預(yù)測(cè)這天可能會(huì)賣出熱茶多少杯.

1.思考辨析(正確的畫“√”,錯(cuò)誤的畫“×”)(1)利用散點(diǎn)圖可以直觀判斷兩個(gè)變量的關(guān)系是否可以用線性表示.(

)(2)線性回歸方程適用于一切樣本和總體.(

)(3)線性回歸方程一般都有局限性.(

)(4)線性回歸方程一定過(guò)樣本中的某一點(diǎn).(

)√×√×鞏固提升2.如果記錄了x,y的幾組數(shù)據(jù)分別為(0,1),(1,3),(2,5),(3,7),那么y關(guān)于x的線性回歸直線必過(guò)點(diǎn)(

)A.(2,2)

B.,2)C.(1,2)

D.,4)

答案:D3.隨機(jī)抽樣中測(cè)得四個(gè)樣本點(diǎn)為(1,2),(2,3),(3,4),(4,5),則y與x之間的線性回歸方程為(

)A.y=x+1B.y=x+2C.y=2x+1D.y=x-1

答案:A

例3在本章1.1節(jié)的練習(xí)中,從散點(diǎn)圖可以看出,某小賣部6天賣出熱茶的杯數(shù)Y-2.(1) 試用最小二乘法求岀Y關(guān)于X的線性回歸方程;(2) 如果某天的氣溫是-3℃,請(qǐng)預(yù)測(cè)這天可能會(huì)賣出熱茶多少杯.

解(1)從散點(diǎn)圖7-6中可以看岀,表7-2中的兩個(gè)變量有近似的線性關(guān)系.

例4

某項(xiàng)研究發(fā)現(xiàn)某地的PM10濃度與車流量之間有線性相關(guān)關(guān)系.現(xiàn)采集到該地一周內(nèi)車流量x與PM10濃度y的數(shù)據(jù)如下表:時(shí)間車流量x(單位:萬(wàn)輛)PM10濃度y(單位:μg/m3)星期一25.435.7星期二24.634.5星期三23.535.2星期四24.433.6星期五25.836.1星期六19.730.9星期日20.329.4

解析:(1)如圖所示.

月份代碼t1234567銷售量y(萬(wàn)件)y1y2y3y4y5y6y7

例5

某地區(qū)2013年至2019年農(nóng)村居民家庭人均純收入Y(單位:千元)的數(shù)據(jù)如下表:(1)求Y關(guān)于T的線性回歸方程;年份2013201420152016201720182019年份代號(hào)T1234567人均純收入Y2.93.33.64.44.85.25.9解由所給數(shù)據(jù)計(jì)算得

=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×+1×+2×+3×=14,所求線性回歸方程為Y=T+2.3.(2)利用(1)中的線性回歸方程,分析2013年至2019年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測(cè)該地區(qū)2022年農(nóng)村居民家庭人均純收入.解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論