回歸直線方程-最小二乘法課件_第1頁(yè)
回歸直線方程-最小二乘法課件_第2頁(yè)
回歸直線方程-最小二乘法課件_第3頁(yè)
回歸直線方程-最小二乘法課件_第4頁(yè)
回歸直線方程-最小二乘法課件_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

問(wèn)題:在一次對(duì)人體脂肪含量與年齡關(guān)系的研究中,

研究人員獲得了一組樣本數(shù)據(jù):年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6散點(diǎn)圖回歸直線1BG問(wèn)題:在一次對(duì)人體脂肪含量與年齡關(guān)系的研究中,年齡23273回歸直線概念:散點(diǎn)圖中心的分布從整體上看大致是一條直線附近,該直線稱(chēng)為回歸直線求出回歸直線的方程我們就可以比較清楚地了解年齡與體內(nèi)脂肪含量之間的相關(guān)性由此可以預(yù)測(cè)相應(yīng)年齡段的脂肪含量那我們又該如何具體求這個(gè)回歸方程呢?2BG回歸直線概念:散點(diǎn)圖中心的分布從整體上看大致是一條直線附近,方法匯總?1.畫(huà)一條直線2.測(cè)量出各點(diǎn)與它的距離3.移動(dòng)直線,到達(dá)某一位置使距離的和最小,測(cè)量出此時(shí)直線的斜率與截距,得到回歸方程。1.選取兩點(diǎn)作直線ps:使直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同。1.在散點(diǎn)圖中多取幾組點(diǎn),確定出幾條直線的方程2.分別求出各條直線的斜率、截距的平均數(shù)3.將這兩個(gè)平均數(shù)當(dāng)成回歸方程的斜率與截距。法一法四法二法三?3BG方法匯總?1.畫(huà)一條直線1.選取兩點(diǎn)作直線1.在散點(diǎn)圖中多取

上面三種方法都有一定的道理,但總讓人感到可靠性不強(qiáng).

回歸直線與散點(diǎn)圖中各點(diǎn)的位置用數(shù)學(xué)的方法來(lái)刻畫(huà)應(yīng)具有怎樣的關(guān)系?4BG上面三種方法都有一定的道理,但總讓人感到可靠性不強(qiáng).方法匯總1.畫(huà)一條直線2.測(cè)量出各點(diǎn)與它的距離3.移動(dòng)直線,到達(dá)某一位置使距離的和最小,測(cè)量出此時(shí)直線的斜率與截距,得到回歸方程。1.選取兩點(diǎn)作直線ps:使直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同。1.在散點(diǎn)圖中多取幾組點(diǎn),確定出幾條直線的方程2.分別求出各條直線的斜率、截距的平均數(shù)3.將這兩個(gè)平均數(shù)當(dāng)成回歸方程的斜率與截距。最小二乘法法一法四法二法三5BG方法匯總1.畫(huà)一條直線1.選取兩點(diǎn)作直線1.在散點(diǎn)圖中多取幾求回歸方程的關(guān)鍵

——如何使用數(shù)學(xué)方法來(lái)刻畫(huà)“從整體上看,各點(diǎn)到此直線的距離最小”。假設(shè)兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),......(xn,yn)下面討論如何表達(dá)這些點(diǎn)與一條直線y=bx+a之間的距離。6BG求回歸方程的關(guān)鍵

——如何使用數(shù)學(xué)方法來(lái)刻畫(huà)“從整體上看,各最小二乘法的公式的探索過(guò)程如下:1.設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn)2.設(shè)所求的回歸直線方程為Y=bx+a,其中a,b是待定的系數(shù)。當(dāng)變量x取x1,x2,…,xn時(shí),可以得到

Yi=bxi+a(i=1,2,…,n)3.它與實(shí)際收集得到的yi之間偏差是

yi-Yi=yi-(bxi+a)(i=1,2,…,n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy

x這樣,用這n個(gè)偏差的和來(lái)刻畫(huà)“各點(diǎn)與此直線的整體偏差”是比較合適的。7BG最小二乘法的公式的探索過(guò)程如下:1.設(shè)已經(jīng)得到具有線性相關(guān)關(guān)

因此用表示各點(diǎn)到直線y=bx+a的“整體距離”

(x1,y1)(x2,y2)(xi,yi)yi-(bxi+a)8BG

因此用(x1,y1)(x2,y2)(xi,yi)(xn,yn)

由于絕對(duì)值使得計(jì)算不方便,在實(shí)際應(yīng)用中人們更喜歡用9BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)(x1,y1)(x2,y2)(xi,yi)(xn,yn)這樣,問(wèn)題就歸結(jié)為:當(dāng)a,b取什么值時(shí)Q最???即點(diǎn)到直線的“整體距離”最小.10BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)這樣這樣通過(guò)求此式的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小的方法叫做最小二乘法.根據(jù)有關(guān)數(shù)學(xué)原理推導(dǎo),a,b的值由下列公式給出11BG這樣通過(guò)求此式的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的Σ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni=1Σ(yi-Yi)2的最小值ni=1Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2當(dāng)a,b取什么值時(shí),Q的值最小,即總體偏差最小12BGΣ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni求線性回歸方程的步驟:(1)求平均數(shù);(2)計(jì)算與yi的乘積,再求;(3)計(jì)算;(4)將上述有關(guān)結(jié)果代入公式,寫(xiě)出回歸

直線方程.xi13BG求線性回歸方程的步驟:(1)求平均數(shù)年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6根據(jù)最小二乘法公式,利用計(jì)算機(jī)可以求出其回歸直線方程散點(diǎn)圖回歸直線14BG年齡2327394145495053545657586061思考:將表中的年齡作為x代入回歸方程,看看得出的數(shù)值與真實(shí)數(shù)值之間的關(guān)系,從中你體會(huì)到了什么?

x=27時(shí),y=15.099%x=37時(shí),y=20.901%可利用回歸方程預(yù)測(cè)不同年齡段的體內(nèi)脂肪含量的百分比。存在樣本點(diǎn)不在直線上年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.615BG思考:將表中的年齡作為x代入回歸方程,看看得出的數(shù)值與真實(shí)數(shù)(2012山東臨沂二模,20,12)假設(shè)關(guān)于某設(shè)備的使用年限x和所有支出的維修費(fèi)用y(萬(wàn)元),有如下表的統(tǒng)計(jì)資料:使用年限x23456維修費(fèi)用y2.23.85.56.57.0若由資料可知y對(duì)x呈線性相關(guān)關(guān)系,試求:(1)線性回歸直線方程(2)估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?y=1.23x+0.08;y=12.3816BG(2012山東臨沂二模,20,12)假設(shè)關(guān)于某設(shè)備的使用年限

回歸直線方程特點(diǎn)存在樣本點(diǎn)不在直線上的樣本點(diǎn)只能表示線性相關(guān)關(guān)系回歸直線方程的特點(diǎn)過(guò)定點(diǎn)(樣本中心)17BG回歸直線存在樣本點(diǎn)只能表示線回歸直線方程的特點(diǎn)過(guò)定點(diǎn)17B練習(xí)解析:∵銷(xiāo)售量y(件)與銷(xiāo)售價(jià)格x(元/件)負(fù)相關(guān).∴x的系數(shù)為負(fù).又∵y不能為負(fù)值,∴常數(shù)項(xiàng)必須是正值.故選A.答案:A18BG練習(xí)解析:∵銷(xiāo)售量y(件)與銷(xiāo)售價(jià)格x(元/件)負(fù)相關(guān).1820y=2x19BG20y=2x19BG問(wèn)題:在一次對(duì)人體脂肪含量與年齡關(guān)系的研究中,

研究人員獲得了一組樣本數(shù)據(jù):年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6散點(diǎn)圖回歸直線20BG問(wèn)題:在一次對(duì)人體脂肪含量與年齡關(guān)系的研究中,年齡23273回歸直線概念:散點(diǎn)圖中心的分布從整體上看大致是一條直線附近,該直線稱(chēng)為回歸直線求出回歸直線的方程我們就可以比較清楚地了解年齡與體內(nèi)脂肪含量之間的相關(guān)性由此可以預(yù)測(cè)相應(yīng)年齡段的脂肪含量那我們又該如何具體求這個(gè)回歸方程呢?21BG回歸直線概念:散點(diǎn)圖中心的分布從整體上看大致是一條直線附近,方法匯總?1.畫(huà)一條直線2.測(cè)量出各點(diǎn)與它的距離3.移動(dòng)直線,到達(dá)某一位置使距離的和最小,測(cè)量出此時(shí)直線的斜率與截距,得到回歸方程。1.選取兩點(diǎn)作直線ps:使直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同。1.在散點(diǎn)圖中多取幾組點(diǎn),確定出幾條直線的方程2.分別求出各條直線的斜率、截距的平均數(shù)3.將這兩個(gè)平均數(shù)當(dāng)成回歸方程的斜率與截距。法一法四法二法三?22BG方法匯總?1.畫(huà)一條直線1.選取兩點(diǎn)作直線1.在散點(diǎn)圖中多取

上面三種方法都有一定的道理,但總讓人感到可靠性不強(qiáng).

回歸直線與散點(diǎn)圖中各點(diǎn)的位置用數(shù)學(xué)的方法來(lái)刻畫(huà)應(yīng)具有怎樣的關(guān)系?23BG上面三種方法都有一定的道理,但總讓人感到可靠性不強(qiáng).方法匯總1.畫(huà)一條直線2.測(cè)量出各點(diǎn)與它的距離3.移動(dòng)直線,到達(dá)某一位置使距離的和最小,測(cè)量出此時(shí)直線的斜率與截距,得到回歸方程。1.選取兩點(diǎn)作直線ps:使直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同。1.在散點(diǎn)圖中多取幾組點(diǎn),確定出幾條直線的方程2.分別求出各條直線的斜率、截距的平均數(shù)3.將這兩個(gè)平均數(shù)當(dāng)成回歸方程的斜率與截距。最小二乘法法一法四法二法三24BG方法匯總1.畫(huà)一條直線1.選取兩點(diǎn)作直線1.在散點(diǎn)圖中多取幾求回歸方程的關(guān)鍵

——如何使用數(shù)學(xué)方法來(lái)刻畫(huà)“從整體上看,各點(diǎn)到此直線的距離最小”。假設(shè)兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),......(xn,yn)下面討論如何表達(dá)這些點(diǎn)與一條直線y=bx+a之間的距離。25BG求回歸方程的關(guān)鍵

——如何使用數(shù)學(xué)方法來(lái)刻畫(huà)“從整體上看,各最小二乘法的公式的探索過(guò)程如下:1.設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn)2.設(shè)所求的回歸直線方程為Y=bx+a,其中a,b是待定的系數(shù)。當(dāng)變量x取x1,x2,…,xn時(shí),可以得到

Yi=bxi+a(i=1,2,…,n)3.它與實(shí)際收集得到的yi之間偏差是

yi-Yi=yi-(bxi+a)(i=1,2,…,n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy

x這樣,用這n個(gè)偏差的和來(lái)刻畫(huà)“各點(diǎn)與此直線的整體偏差”是比較合適的。26BG最小二乘法的公式的探索過(guò)程如下:1.設(shè)已經(jīng)得到具有線性相關(guān)關(guān)

因此用表示各點(diǎn)到直線y=bx+a的“整體距離”

(x1,y1)(x2,y2)(xi,yi)yi-(bxi+a)27BG

因此用(x1,y1)(x2,y2)(xi,yi)(xn,yn)

由于絕對(duì)值使得計(jì)算不方便,在實(shí)際應(yīng)用中人們更喜歡用28BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)(x1,y1)(x2,y2)(xi,yi)(xn,yn)這樣,問(wèn)題就歸結(jié)為:當(dāng)a,b取什么值時(shí)Q最???即點(diǎn)到直線的“整體距離”最小.29BG(x1,y1)(x2,y2)(xi,yi)(xn,yn)這樣這樣通過(guò)求此式的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小的方法叫做最小二乘法.根據(jù)有關(guān)數(shù)學(xué)原理推導(dǎo),a,b的值由下列公式給出30BG這樣通過(guò)求此式的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的Σ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni=1Σ(yi-Yi)2的最小值ni=1Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2當(dāng)a,b取什么值時(shí),Q的值最小,即總體偏差最小31BGΣ(yi-Yi)的最小值ni=1Σ|yi-Yi|的最小值ni求線性回歸方程的步驟:(1)求平均數(shù);(2)計(jì)算與yi的乘積,再求;(3)計(jì)算;(4)將上述有關(guān)結(jié)果代入公式,寫(xiě)出回歸

直線方程.xi32BG求線性回歸方程的步驟:(1)求平均數(shù)年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6根據(jù)最小二乘法公式,利用計(jì)算機(jī)可以求出其回歸直線方程散點(diǎn)圖回歸直線33BG年齡2327394145495053545657586061思考:將表中的年齡作為x代入回歸方程,看看得出的數(shù)值與真實(shí)數(shù)值之間的關(guān)系,從中你體會(huì)到了什么?

x=27時(shí),y=1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論