《回歸分析的基本思想及其初步應(yīng)用》第一課_第1頁
《回歸分析的基本思想及其初步應(yīng)用》第一課_第2頁
《回歸分析的基本思想及其初步應(yīng)用》第一課_第3頁
《回歸分析的基本思想及其初步應(yīng)用》第一課_第4頁
《回歸分析的基本思想及其初步應(yīng)用》第一課_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、問題問題1 1:正方形的面積:正方形的面積y y與正方形的邊長與正方形的邊長x x之間的之間的函數(shù)關(guān)系函數(shù)關(guān)系是是y = xy = x2 2確定性關(guān)系確定性關(guān)系問題問題2 2:某水田水稻產(chǎn)量:某水田水稻產(chǎn)量y y與施肥量與施肥量x x之間是否有一個確定性之間是否有一個確定性的關(guān)系?的關(guān)系?例如:在例如:在 7 7 塊并排、形狀大小相同的試驗田上進(jìn)行施肥量塊并排、形狀大小相同的試驗田上進(jìn)行施肥量對水稻產(chǎn)量影響的試驗,得到如下所示的一組數(shù)據(jù):對水稻產(chǎn)量影響的試驗,得到如下所示的一組數(shù)據(jù):施化肥量施化肥量x 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量y 330 345 365 405

2、445 450 455復(fù)習(xí)復(fù)習(xí) 變量之間的兩種關(guān)系變量之間的兩種關(guān)系10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量 自變量取值一定時,因變量的取值帶有一定隨自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關(guān)系叫做機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系相關(guān)關(guān)系。定義:定義: 1):相關(guān)關(guān)系是一種不確定性關(guān)系;):相關(guān)關(guān)系是一種不確定性關(guān)系;注注對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計

3、分析的方法叫分析的方法叫回歸分析回歸分析。2):): 現(xiàn)實生活中存在著大量的相關(guān)關(guān)系?,F(xiàn)實生活中存在著大量的相關(guān)關(guān)系。 如:人的身高與年齡;如:人的身高與年齡; 產(chǎn)品的成本與生產(chǎn)數(shù)量;產(chǎn)品的成本與生產(chǎn)數(shù)量; 商品的銷售額與廣告費;商品的銷售額與廣告費; 家庭的支出與收入。等等家庭的支出與收入。等等探索:水稻產(chǎn)量探索:水稻產(chǎn)量y與施肥量與施肥量x之間大致有何規(guī)律?之間大致有何規(guī)律?10 20 30 40 50500450400350300發(fā)現(xiàn):圖中各點,大致分布在某條直線附近。發(fā)現(xiàn):圖中各點,大致分布在某條直線附近。探索探索2 2:在這些點附近可畫直線不止一條,哪條直線最能代表:在這些點附近可畫

4、直線不止一條,哪條直線最能代表x x與與y y之間的關(guān)系呢?之間的關(guān)系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻產(chǎn)量水稻產(chǎn)量y 330 345 365 405 445 450 455xy散點圖散點圖施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻產(chǎn)量水稻產(chǎn)量yx探究探究對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)1122( ,),(,),.,(,),nnx yxyxy我們知道其回歸方程的截距和斜率的最小二乘估計公式分別為:我們知道其回歸方程的截距和斜率的最小二乘估計公式分別為:1122

5、211()(),.(2)()nniiiiiinniiiixxyyxnxybxxxnxy,.(1)aybx1111,.nniiiixx yynn其中( , )x y稱為樣本點的中心。稱為樣本點的中心。你能推導(dǎo)出這個公式嗎?你能推導(dǎo)出這個公式嗎?1122( ,),(,),.,(,)nnx yxyxy假設(shè)我們已經(jīng)得到兩個具有相關(guān)關(guān)系的變量的一組數(shù)據(jù)假設(shè)我們已經(jīng)得到兩個具有相關(guān)關(guān)系的變量的一組數(shù)據(jù) 且回歸方程是:且回歸方程是:y=bx+a,其中,其中,a,b是待定參數(shù)。當(dāng)變量是待定參數(shù)。當(dāng)變量x取取 時時 它與實際收集到的它與實際收集到的 之間的偏差是之間的偏差是(1,2,., )ix in()iii

6、iyyybxaiyoxy11( ,)x y22(,)xy( ,)iix yiiyy21( ,)()()niiiQyxyxyx 221()2() () () niiiiiyxyxyxyxyxyx2211()2() ()() ,nniiiiiiyxyxyxyxyxn yx11() ()()()nniiiiiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221( ,)()()niiiQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2222211221111()()()()()()(

7、)()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx易知,截距易知,截距 和斜率和斜率 分別是使分別是使取最小值時取最小值時 的值。由于的值。由于( ,)()iiiiQyyyx b, a121()()()niiiniixxyyxxyx這正是我們所要推導(dǎo)的公式。這正是我們所要推導(dǎo)的公式。在上式中,后兩項和在上式中,后兩項和 無關(guān),而前兩項為非負(fù)無關(guān),而前兩項為非負(fù)數(shù),因此要使數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)前兩項的值取得最小值,當(dāng)且僅當(dāng)前兩項的值均為均為0,即有,即有, 1、所求直線方程叫做、所求直線方程叫做回歸直線方程回歸直線方程; 相應(yīng)的直線叫做相應(yīng)的

8、直線叫做回歸直線回歸直線。2、對兩個變量進(jìn)行的線性分析叫做、對兩個變量進(jìn)行的線性分析叫做線性回歸分析線性回歸分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxay bxy 回歸直線方程回歸直線方程nn(x- x )(y- y )xy-n x yiiiii= 1i= 1b =,nn222(x- x )x-n xiii= 1i= 1 a = y -b x .nn11x =x,y =y.iinni= 1i= 1其其 中中最小二乘法:最小二乘法:ybxa( , )x y稱為樣本點的中心稱為樣本點的中心。求回歸直線方程的步驟:求回歸直線方程的步驟:1111(1)

9、,nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1122211()(),(),.(1)nniiiiiinniiiixx yyxnxybxxxnxa y bxy (4)寫出直線方程為)寫出直線方程為y=bx+a,即為所求的回歸直線方程。即為所求的回歸直線方程。例例1 1、觀察兩相關(guān)量得如下數(shù)據(jù)、觀察兩相關(guān)量得如下數(shù)據(jù): :101010221110,0,110,3 01 0.3 ,1iiiiiiixyyyxx求兩變量間的回歸方程求兩變量間的回歸方程. .解:列表:解:列表:1011022110110100111010010iiiiixybyxxx000a

10、ybxb.yx所求回歸直線方程為所求回歸直線方程為例例2:已知:已知10只狗的血球體積及血球的測量值如下:只狗的血球體積及血球的測量值如下:x(血球體積血球體積,mm), y(血球數(shù),百萬血球數(shù),百萬)(1)畫出上表的散點圖;)畫出上表的散點圖;(2)求出回歸直線并且畫出圖形;)求出回歸直線并且畫出圖形;(3)回歸直線必經(jīng)過的一點是哪一點?)回歸直線必經(jīng)過的一點是哪一點?利用回歸直線方程對總體進(jìn)行線性相關(guān)性的檢驗利用回歸直線方程對總體進(jìn)行線性相關(guān)性的檢驗 例例3 3、煉鋼是一個氧化降碳的過程,鋼水含碳量的多少直接、煉鋼是一個氧化降碳的過程,鋼水含碳量的多少直接影響冶煉時間的長短,必須掌握影響冶

11、煉時間的長短,必須掌握鋼水含碳量和冶煉時間的關(guān)系。鋼水含碳量和冶煉時間的關(guān)系。如果已測得爐料熔化完畢時,鋼水的含碳量如果已測得爐料熔化完畢時,鋼水的含碳量x與冶煉時間與冶煉時間y(從爐(從爐料熔化完畢到出剛的時間)的一列數(shù)據(jù),如下表所示:料熔化完畢到出剛的時間)的一列數(shù)據(jù),如下表所示:(1 1)y y與與x x是否具有線性相關(guān)關(guān)系;是否具有線性相關(guān)關(guān)系;(2 2)如果具有線性相關(guān)關(guān)系,求回歸直線方程;)如果具有線性相關(guān)關(guān)系,求回歸直線方程;(3 3)預(yù)測當(dāng)鋼水含碳量為)預(yù)測當(dāng)鋼水含碳量為160160個個0.01%0.01%時,應(yīng)冶煉多少分鐘?時,應(yīng)冶煉多少分鐘?(1)(1)列出下表列出下表,

12、,并計算并計算10101022111159.8,172,265448,312350,287640iiiiiiixyyyxx1011010222211100.9906.(10)(10)iiiiiiix yx yrxxyy于是,10110221101.26710iiiiixybyxxx30.51.aybx 所以回歸直線的方程為所以回歸直線的方程為 =1.267x-30.51 y(3)(3)當(dāng)當(dāng)x=160 x=160時時, 1.267.160-30.51=172, 1.267.160-30.51=172 y (2)(2)設(shè)所求的回歸方程為設(shè)所求的回歸方程為ybxa 例例4 4 從某大學(xué)中隨機選出從某

13、大學(xué)中隨機選出8 8名女大學(xué)生,其身高名女大學(xué)生,其身高和體重數(shù)據(jù)如下表:和體重數(shù)據(jù)如下表: 求根據(jù)一名女大學(xué)生的身高預(yù)報她的體重的回歸求根據(jù)一名女大學(xué)生的身高預(yù)報她的體重的回歸方程,并預(yù)報一名身高為方程,并預(yù)報一名身高為172172的女大學(xué)生的體重。的女大學(xué)生的體重。172.85849. 0 xy分析:由于問題中要分析:由于問題中要求根據(jù)身高預(yù)報體重,求根據(jù)身高預(yù)報體重,因此選取身高為自變因此選取身高為自變量,體重為因變量量,體重為因變量學(xué)學(xué)身身高高1 17 72 2c cm m女女大大生生體體重重y y = = 0 0. .8 84 49 91 17 72 2- -8 85 5. .7 7

14、1 12 2 = = 6 60 0. .3 31 16 6( (k kg g) )2.2.回歸方程:回歸方程:1. 1. 散點圖;散點圖;n(x -x)(y -y)iii=1r=nn22(x -x)(y -y)iii=1i=1相關(guān)系數(shù)相關(guān)系數(shù)正相關(guān);負(fù)相關(guān)通常,正相關(guān);負(fù)相關(guān)通常,r0.75r0.75,認(rèn)為兩個變量有很強的相關(guān)性認(rèn)為兩個變量有很強的相關(guān)性本例中本例中, ,由上面公式由上面公式r=0.7980.75r=0.7980.75探究?探究? 身高為身高為172172的女大學(xué)生的體重一定是的女大學(xué)生的體重一定是60.316kg60.316kg嗎?如果不是嗎?如果不是, ,其原因是什么其原因是什么? ?如何描述兩個變量之間線性相關(guān)關(guān)系的強弱?如何描述兩個變量之間線性相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論