2019-2020學(xué)年選修2-33.2回歸分析學(xué)案_第1頁
2019-2020學(xué)年選修2-33.2回歸分析學(xué)案_第2頁
免費預(yù)覽已結(jié)束,剩余17頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、3. 2 回歸分析ESI1會作出兩個有關(guān)聯(lián)變量的散點圖,并利用散點圖認識變量間的相關(guān)關(guān)系.2.了解線性回歸模型,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.3了解回歸分析的基本思想、方法及簡單應(yīng)用.新知提煉1.線性回歸模型(1)線性回歸模型的概念:將 y= a + bx+ ?稱為線性回歸模型,其中 a + bx 是確定性函數(shù),?稱為隨機誤差.(2)線性回歸方程:直線 y = a+ bx 稱為線性回歸方程,其中 a 稱為回歸截距,b 稱為回歸nA占 Xiyi nx ybn,inin系數(shù),y 稱為回歸值,其中苕 x2 n(x )2其中 x =*苕 Xi, y =語 yi.A 一 A 一a =

2、 y b x2.相關(guān)關(guān)系(1)相關(guān)系數(shù)是精確刻畫線性相關(guān)關(guān)系的量.相 關(guān) 系 數(shù) rn_占 Xiyi n x yn一n一;占 x2 n ( x)2Eyi2 n ( y )2相關(guān)系數(shù) r 具有的性質(zhì):1|r|w1;2|r|越接近于 1, x, y 的線性相關(guān)程度越強;3|r|越接近于 0, x, y 的線性相關(guān)程度越弱.相關(guān)性檢驗的步驟:1提出統(tǒng)計假設(shè) H。:變量 x, y 不具有線性相關(guān)關(guān)系;2如果以 95%的把握作出推斷,那么可以根據(jù)1 0.95 = 0.05 與 n 2 在附錄 2 中查出一個 r 的臨界值 ro.o5(其中 1 0.95 = 0.05 稱為檢驗水平);3計算樣本相關(guān)系數(shù)

3、r;4作出統(tǒng)計推斷:若|r| ro.05,則否定 Ho,表明有 95%的把握認為 x 與 y 之間具有線性相關(guān)關(guān)系;若|r|wro.05,則沒有理由拒絕原來的假設(shè)Ho,即就目前數(shù)據(jù)而言,沒有充分理由認為 y 與 x 之間有線性相關(guān)關(guān)系.Q判斷(正確的打“V”,錯誤的打“x”)(1) 求回歸直線方程前必須進行相關(guān)性檢驗.()(2) 兩個變量的相關(guān)系數(shù)越大,它們的相關(guān)程度越強.()(3) 若相關(guān)系數(shù) r = 0,則兩變量 x, y 之間沒有關(guān)系.()答案:“(2)x(3)V因變量 x 與 y 之間的回歸方程表示()A . x 與 y 之間的函數(shù)關(guān)系B. x 與 y 之間的不確定性關(guān)系C. x 與

4、y 之間的真實關(guān)系形式D. x 與 y 之間的真實關(guān)系達到最大限度的吻合答案:D幅 已知線性回歸方程 y = 0.75x+ 0.7,則 x= 11 時,y 的估計值為 _答案:8.95探究點1線性回歸方程觀察值如下表x(s)5101520304050607090120y(m)610101316171923252946(1)畫出散點圖;(2) 求 y 對 x 的線性回歸方程;利用線性回歸方程預(yù)測時間為100 s 時腐蝕深度為多少.【解】 散點圖如圖所示.八4o| y對x的樣本點分布在一條直線附io .匸-1在某種產(chǎn)品表面進行腐蝕刻線試驗,得到腐蝕深度y 與腐蝕時間 x 之間的一組從散點圖中,我們

5、可以看出近,因而求回歸直線方程有意義.x =石(5+ 10+ 15 + + 120)5101214=77,y =石(6 +10+10 + + 46)=石,Xiyi=5X6+10X10+15X10+ - +120X46=13 910,X2= 52+ 102+ 152+ + 1202= 36 750,a= y bX =214-0.304X510=5.36.故腐蝕深度對腐蝕時間的線性回歸方程為y= 0.304X+ 5.36.35.76( m),即腐蝕時間為 100 s 時腐蝕深度大約為 35.76 卩 m.冇 i 去歸納求線性回歸方程的三個步驟(1)畫散點圖:由樣本點是否呈條狀分布來判斷兩個量是否具

6、有線性相關(guān)關(guān)系.求回歸系數(shù):若存在線性相關(guān)關(guān)系,則求回歸系數(shù).(3)寫方程:寫出線性回歸方程,并利用線性回歸方程進行預(yù)測說明.呱汗隊 1.煉鋼是一個氧化降碳的過程,鋼水含碳量的多少直接影響冶煉時間的長短,必須掌握鋼水含碳量和冶煉時間的關(guān)系如果已測得爐料熔化完畢時鋼水的含碳量x10與冶煉時間 y(從煉料熔化完畢到出鋼的時間)的數(shù)據(jù)(Xi,yi)(i = 1,2,10)并已計算出i _ 1=159.8,=盒 yi= 172.i = 1|510 214Zx.y ri1-lit J13 910-11 xx4 1u.rfsioY36 7501 xi= 1ck11/所以 b=(3)根據(jù)(2)求得的線性回歸

7、方程,當(dāng)腐蝕時間為100 s 時,y= 5.36 + 0.304X100 =Xi10 10=1 598,yi= 1 720,i _1i _110的含碳量 X 的回歸直線方程解:由Xii _ 110=1 598,i _ 1110yi= 1 720,可得 x =后 Xii = 1i11iia= b=1721.267X159.830.47.故冶煉時間 y 對鋼水的含碳量 x 的回歸直線方程為 y= 1.267x 30.47.探究點2線性回歸分析A -10 名同學(xué)在高一和高二的數(shù)學(xué)成績?nèi)缦卤?x74717268767367706574y76757170767965776272其中 x 為高一數(shù)學(xué)成績,

8、y 為高二數(shù)學(xué)成績.(1) y 與 x 是否具有相關(guān)關(guān)系?如果 y 與 x 具有線性相關(guān)關(guān)系,求回歸直線方程.【解】由已知表格中的數(shù)據(jù),求得x= 71, y= 72.3,n占(xi x ) ( yi y )rnn一“.78.& (x x )2占(yi y )2由檢驗水平 0.05 及 n 2= 8,在課本附錄 2 中查得0.05= 0.632,因為 0.78 0.632, 所以y 與 x 之間具有很強的線性相關(guān)關(guān)系.(2) y 與 x 具有線性相關(guān)關(guān)系,設(shè)回歸直線方程為ny y y yi =1(xi)(yi)y= a + bx, 則有 b=n1.22.E (xix)2i = 1a=yb

9、 x=72.31.22X71= 14.32.所以 y 關(guān)于 x 的回歸直線方程為 y= 1.22x 14.32.(1)線性回歸分析必須進行相關(guān)性檢驗;若忽略,則所求回歸方程沒有實際意義.(2)|r|越接近于 1,兩變量相關(guān)性越強,|r|越接近于 0,兩變量相關(guān)性越弱.故可得 b =y- Kkv- 10 x287 64010X159.8X172265 448 10X159.821.267.匪ll 誅 2關(guān)于兩個變量 x 和 y 的 7 組數(shù)據(jù)如下表所示:x21232527293235y711212466115325試判斷 x 與 y 之間是否有線性相關(guān)關(guān)系. 1解:x = 7X(21 + 23+

10、 25+ 27+ 29 + 32 + 35)2741y=7X(7+11+21+24+66+115+325)81.3.7首處=212+232+252+272+292+322+352=5 414.7首 Xiyi=21X7+23X11+25X21+27X24+29X66+32X115+35X325=18 542.7i星 yi2= 72+ 112+ 212+ 242+ 662+ 1152+ 3252= 124 393.18 5427X27.4X81.3-(5 4147X27.42)(124 3937X81.32)0.837 5.由檢驗水平 0.05 及 n 2 = 5,在課本附錄因為 0.837 5

11、0.754.所以 x 與 y 之間具有線性相關(guān)關(guān)系.探究點3月份 x/月123456人數(shù) y/人5261687478832 中查得0.05= 0.754,非線性回歸分析y(人)與月份 x(月)之間滿足函數(shù)關(guān)系,模7所以 r =2【解】 設(shè) u = In y, c = In a,AAA得 u = c+ bx,則 U 與 x 的數(shù)據(jù)關(guān)系如下表:X123456u= In y3.954.114.224.3044.356 74.418 86由上表,得iHXi= 21,6 6省 ui= 25.359 5 , 每 X2= 91,6 6靄 u2-107.334,iHXiUi= 90.342 3,x = 3.5

12、, u 4.226 58,6 _ _工龍川-6x u所以$ =斗二-09,一6耳,u - i jt = 4, 226 58 - 0, 09 x 3, 5 = 3.911 58,所以彳=3.911 58 +0. 09乳占爲(wèi) T 4去9】1處0. O0.T/7f y = e戶”求非線性回歸方程的步驟(1)確定變量,作出散點圖.根據(jù)散點圖,選擇恰當(dāng)?shù)臄M合函數(shù).變量置換,通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題,并求出線性回歸方程.(4)分析擬合效果:通過計算相關(guān)指數(shù)或畫殘差圖來判斷擬合效果.,(5)根據(jù)相應(yīng)的變換,寫出非線性回歸方程.例 3)某地今年上半年患某種傳染病的人數(shù)A,為 y = ae

13、bx,確定這個函數(shù)解析式.匪汗隊 3某種書每冊的成本費 y(元)與印刷冊數(shù) x 仟冊)有關(guān),經(jīng)統(tǒng)計得到數(shù)據(jù)如下:X(千冊)123510203050100200y(元)10.155.524.082.852.111.621.411.301.211.151檢驗每冊書的成本費 y(元)與印刷冊數(shù)的倒數(shù)丄之間是否具有線性相關(guān)關(guān)系,如有,求出Xy 對 x 的回歸方程,并畫出其圖形.1解:首先作變量置換 u =x,題目中所給的數(shù)據(jù)變成如下表所示的10 對數(shù)據(jù).ui10.50.330.20.10.050.030.020.010.005yi10.155.524.082.852.111.621.411.301.2

14、11.15然后作相關(guān)性檢測.經(jīng)計算得 r疋0.999 80.632,從而認為 u 與 y 之間具有線性相關(guān)關(guān)系,由公式得 a 胡.125 ,AA1A8 973b8.973,所以 y= 1.125+ 8.973u,最后回代 u = -,可得 y = 1.125+ .XX這就是題目要求的 y 對 x 的回歸方程.回歸方程的圖形如圖所示,它是經(jīng)過平移的反比例函數(shù)圖象的一個分支.氏卜某商場經(jīng)營一批進價是 30 元/臺的小商品,在市場試銷中發(fā)現(xiàn),此商品的銷售單 價 x(x 取整數(shù))(元)與日銷售量 y(臺)之間有如下關(guān)系:x35404550y56412811(1)畫出散點圖,并判斷 y 與 x 是否具有

15、線性相關(guān)關(guān)系;(2)求日銷售量 y對銷售單價 x 的線性回歸方程(方程的斜率保留一個有效數(shù)字);設(shè)經(jīng)營此商品的日銷售利潤為P 元,根據(jù) 寫出 P 關(guān)于 x 的函數(shù)關(guān)系式,并預(yù)測當(dāng) 銷售單價 x為多少元時,才能獲得最大日銷售利潤.【解】(1)散點圖如圖所示,從圖中可以看出這些點大致分布在一條直線附近,因此 兩個變量具有線性相關(guān)關(guān)系.2010JO 20 30 40 SO 6U 70占因為x= 4x(35 + 40+ 45+ 50)= 42.5,=4 (56 + 41 + 28+ 11) = 34 ,lx y=35 X 56 +40梵41 +45 x28 +50 x II=5 410,ix2=352

16、-+402+452+5O2=7 350,所以方二2盜-垢=410一4x426 34一i? -4? -1350 -4 x42. 5:t = ii=所以丘=y=34 (- 3)x42, 5 = 161.5.所以y - 16L 5 - 3,r依題意有 P = (161.5-3x)(x 30)=3x2+ 251.5X 4 845251.52251.52=3 x6+12 4 845.251 5所以當(dāng) x= 甲-42 時,P 有最大值,約為 426 元故預(yù)測當(dāng)銷售單價為42 元時,能6獲得最大日銷售利潤.防范措施: (1)注重雙基的積累基礎(chǔ)知識及基本方法是解決所有問題的依據(jù),需熟練掌握.如本例中回歸方程的

17、特點是解決本題的關(guān)鍵所在.(2)注意題設(shè)信息的提取對于建模問題,合理提取題設(shè)信息可順利地建立函數(shù)模型,如本例中利潤函數(shù)的建立, 可直接利用“利潤=銷售收入成本”求解.1 關(guān)于回歸分析,下列說法錯誤的是()A 回歸分析是研究兩個具有相關(guān)關(guān)系的變量的方法B .散點圖中,解釋變量在 x 軸,預(yù)報變量在 y 軸C.回歸模型中一定存在隨機誤差D 散點圖能明確反映變量間的關(guān)系解析:選 D.用散點圖反映兩個變量間的關(guān)系時,存在誤差.2 下列關(guān)于統(tǒng)計的說法:1將一組數(shù)據(jù)中的每個數(shù)據(jù)都加上或減去同一個常數(shù),方差恒不變;2回歸方程 y=bx+ a 必經(jīng)過點(,);3設(shè)回歸方程為 y= 5x+ 3,若變量 x 增加

18、 1 個單位,則 y 平均增加 5 個單位.其中正確的為_ (寫出全部正確說法的序號).解析:正確;正確;若變量 x 增加 1 個單位,則 y 平均減少 5 個單位,故錯誤. 答案:A 基礎(chǔ)達標(biāo)1.廢 品 率x%和每噸生鐵成本 y(元)之間的回歸直線方程為 y= 256 + 3x,表明()A 廢品率每增加 1%,生鐵成本增加 259 元B廢品率每增加 1%,生鐵成本增加 3 元C 廢品率每增加 1%,生鐵成本平均每噸增加 3 元D .廢品率不變,生鐵成本為256 元解析:選 C.回歸方程的系數(shù) b 表示 x 每增加一個單位,y 平均增加 b,當(dāng) x 為 1 時,廢品率應(yīng)為 1%,故當(dāng)廢品率增加

19、 1%時,生鐵成本平均每噸增加 3 元.2已知某產(chǎn)品連續(xù) 4 個月的廣告費用為 xi(i = 1, 2, 3, 4)千元,銷售額為 yi(i = 1, 2, 3, 4)萬元,經(jīng)過對這些數(shù)據(jù)的處理,得到如下數(shù)據(jù)信息: X1+ X2+ X3+ X4= 18, y1+ y2+ y3+ y4= 14 ;廣告費用 x 和銷售額 y 之間具有較強的線性相關(guān)關(guān)系;回歸直線方程 y= bx +a 中,b=0.8(用最小二乘法求得),那么當(dāng)廣告費用為 6 千元時,可預(yù)測銷售額約為()A.3.5 萬元C. 4.9 萬元D . 6.5 萬元解析:選 B.依題意得x= 4.5,y= 3.5,由回歸直線必過樣本點中心得

20、a = 3.5 0.8X4.5=-0.1,所以回歸直線方程為y = 0.8x 0.1.當(dāng) x= 6 時,y = 0.8X6 0.1 = 4.7.3.某化工廠為預(yù)測某產(chǎn)品的回收率y,需要研究它和原料有效成分含量之間的相關(guān)關(guān)XT二52,二系,現(xiàn)取了 8 對觀測值,計算得 i心 1 gB,228=478,Xx v =1 849,i-丨- 1則 y 與 x 的線性回歸方程是()A;= 11.47+ 2.62xB. y= 11.47 + 2.62xC. y= 2.62+ 11.47xD. y= 11.47 2.62x解析:選 A.由題中數(shù)據(jù)得 x= 6.5, y= 28.5,1 8498X6.5X28.

21、5367-=-V 624788X6.521402.62,a= b=28.52.62X6.5=11.47,所以 y 與 x 的線性回歸方程是 y= 2.62x+ 11.47.故選 A.4.若某地財政收入x 與支出 y 滿足線性回歸方程 y= bx+ a + s(單位:億元),其中 b =0.8, a= 2, |s0.5.如果今年該地區(qū)財政收入10 億元,則年支出預(yù)計不會超過()A . 10 億元B. 9 億元C. 10.5 億元D. 9.5 億元解析:選 C.代入數(shù)據(jù) y= 10+s因為|桿 0.5,所以 9.5Wyw10.5,故不會超過 10.5 億元.B. 4.7 萬元所以 b=5.某種產(chǎn)品

22、的廣告費支出x 與銷售額 y(單位:萬元)之間的關(guān)系如下表:x24568y3040605070y 與 x 的線性回歸方程為 y = 6.5x+ 17.5,當(dāng)廣告支出 5 萬元時,隨機誤差的效應(yīng)(殘差)為_.解析:因為 y 與 x 的線性回歸方程為 y= 6.5x+ 17.5,當(dāng) x= 5 時,y = 50,當(dāng)廣告支出 5萬兀時,由表格得:y= 60,故隨機誤差的效應(yīng)(殘差)為 60 50= 10.答案:106.一唱片公司研究預(yù)支出費用x(十萬元)與唱片銷售量 y(千張)之間的關(guān)系,從其所發(fā)行的唱片中隨機抽選了 10 千張,得到如下的資料:10工y =237,則 y 與 x 的相關(guān)系數(shù) r 的絕

23、對值為解析:根據(jù)公式得相關(guān)系數(shù)(常-10刃陽-諒)23710X2.8X7.5=- - 0.3,(303.410X2.82)(598.510X7.52)所以 |r|= 0.3.答案:0.37.某個服裝店經(jīng)營某種服裝,在某周內(nèi)獲純利 y(元)與該周每天銷售這種服裝件數(shù)x 之間的一組數(shù)據(jù)關(guān)系見表:x3456789y6669738189909177已知睪1x2= 280,為 Xiyi= 3 487.(1)求 x , y ;已知純利 y 與每天銷售件數(shù) x 線性相關(guān),試求出其回歸方程.3+ 4 + 5 + 6+ 7 + 8 + 9 解:(1)x = 6,XA598. 5 , X55一 66 + 69 +

24、 73 + 81 + 89 + 90 + 91559y=7=T.因為 y 與 x 有線性相關(guān)關(guān)系,7_ c c c 559人 i X-1|Xiyi一 7 x y 3 487 一 7X6X7 所以 b=二= 4.75,iEx2-77280-7X36i =1A559719a=6X4.75=P1.36.714故回歸方程為 y= 4.75 x + 51.36.&已知某校 5 個學(xué)生的數(shù)學(xué)和物理成績?nèi)缦卤?學(xué)生的編號 i12345數(shù)學(xué) Xi8075706560物理 yi7066686462(1) 假設(shè)在對這 5 名學(xué)生成績進行統(tǒng)計時,把這5 名學(xué)生的物理成績搞亂了,數(shù)學(xué)成績沒出現(xiàn)問題,問:恰有

25、2 名學(xué)生的物理成績是自己的實際分數(shù)的概率是多少?(2) 通過大量事實證明發(fā)現(xiàn),一個學(xué)生的數(shù)學(xué)成績和物理成績具有很強的線性相關(guān)關(guān)系,在上述表格是正確的前提下,用 x 表示數(shù)學(xué)成績,用 y 表示物理成績,求 y 與 x 的回歸方程.參考數(shù)據(jù)和公式:y = bx + a , 其中 b =a=23 190, i? =24 750.”i=LJ 1j= *解:(1)記事件 A 為“恰有 2 名學(xué)生的物理成績是自己的實際成績”,則P(A)=2C5=180+ 75 + 70+ 65 + 60因為 x= 70,一70 + 66 + 68 + 64 + 62y = 66,丫兀m -n x vL二- 二0. 36

26、,i=i1a=66 -0. 36 x70 =40. 8,所以回歸直線方程為y =0. 36兀+468.B 能力提升1 假設(shè)關(guān)于某設(shè)備的使用年限x 和所支出的維修費用 y(萬元)有如表的統(tǒng)計資料:使用年限 x23456維修費用 y2.23.85.56.57.0若由資料可知 y 對 x 呈線性相關(guān)關(guān)系:求線性回歸方程 y= bx + a;估計使用年限為 10 年時,維修費用是多少?解:(1)列表如下:12345總計xi2345620yi2.23.85.56.57.025Xiyi4.411.422.032.542.0112.3x24916253690.V = 4 , y = 5 ;X/二90; y = 1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論