3.1回歸分析的基本思想及其初步應用_第1頁
3.1回歸分析的基本思想及其初步應用_第2頁
3.1回歸分析的基本思想及其初步應用_第3頁
3.1回歸分析的基本思想及其初步應用_第4頁
3.1回歸分析的基本思想及其初步應用_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、31 回歸分析的基本思想及其初步應用考點學習目標核心素養(yǎng)線性回歸方程會利用散點圖分析兩個變量是否存在相關(guān)關(guān)系,會用最小二乘法求線性回歸方程直觀想象、數(shù)學運算、 數(shù)據(jù)分析線性回歸分析會用殘差及 R2 來刻畫線性回歸模型的擬合效 果數(shù)學運算、數(shù)據(jù)分析、 數(shù)學建模非線性回歸分析能記住建立回歸模型的方法和步驟,能知道如何利用線性回歸模型求非線性回歸模型數(shù)學建模、數(shù)據(jù)分析問題導學預習教材 P80P89 的內(nèi)容 , 并思考下列問題: 1什么是回歸分析? 2什么是線性回歸模型? 3求線性回歸方程的步驟是什么? 4如何進行線性回歸分析和非線性回歸分析?1 回歸分析回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析

2、的一種常用方法, 回歸分析的基本步驟是畫出兩個變量的散點圖,求回歸直線方程,并用回歸直線方程進行預報2線性回歸模型n i1(xi x)(yi y) (1)在線性回歸直線方程 ya bx中,bi 1 n ,a y bx,其中 xi1 ( xi x )21 n 1 n 1ni1xi, y 1ni1yi, ( x , y )稱為樣本點的中心,回歸直線過樣本點的中心(2)線性回歸模型 ybxae,其中 e稱為隨機誤差,自變量 x 稱為解釋變量,因變量y 稱為預報變量3刻畫回歸效果的方式方式方法計算公式刻畫效果R2ni1 ( yiyi) 2 R21 in1i1(yiy)2R2 越接近于 1,表示回歸的效

3、果越好殘差圖ei 稱為相應于點 (xi,yi )的殘差, eiyiyi殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣的帶狀區(qū)域 的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高殘差 平方和n i1 (yi yi)2殘差平方和越小,模型的擬合效果越好名師點撥(1) 對回歸分析的理解 回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法按照自變量和因變量之間的關(guān)系類型 , 可分為線性回歸分析和非線性回歸分析(2) 隨機誤差與殘差隨機誤差是在建模的時候引入 ,用來解釋由于數(shù)據(jù)本身具有測量誤差而導致的最終結(jié)果與實際數(shù)值的偏差而殘差是回歸分析得到的估計值

4、與實際值的偏差1 判斷正誤 ( 正確的打“”,錯誤的打“×” )(1) 求線性回歸方程前可以不進行相關(guān)性檢驗 ( )(2) 在殘差圖中,縱坐標為殘差,橫坐標可以選為樣本編號 ( )(3) 利用線性回歸方程求出的值是準確值 ( )2.對于自變量 x和因變量 y,當 x取值一定時, y的取值帶有一定的隨機性, x,y之間的這 種非確定性關(guān)系叫做 ( )A 函數(shù)關(guān)系B線性關(guān)系 C相關(guān)關(guān)系 D 回歸關(guān)系3. 已知回歸方程 y2x 1,而試驗得到一組數(shù)據(jù)是 (2, 4.9),(3,7.1), (4, 9.1),則殘差平 方和是 ( )A0.01 B0.02C0.03D 0.044. 如圖是一組

5、數(shù)據(jù)(x, y)的散點圖,經(jīng)最小二乘法計算,y與 x之間的線性回歸方程為 ybx1,則b線性回歸方程在某種產(chǎn)品表面進行腐蝕刻線試驗, 得到腐蝕深度 y 與腐蝕時間 x 之間的一組觀察值如下表 .x(s)5101520304050607090120y( m)610101316171923252946(1)畫出散點圖;(2)求 y 與 x 之間的線性回歸方程;(3) 利用線性回歸方程預報時間為 100 s 時腐蝕深度為多少總結(jié):求線性回歸方程的三個步驟(1) 畫散點圖: 由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關(guān)關(guān)系(2) 求回歸系數(shù): 若存在線性相關(guān)關(guān)系 , 則求回歸系數(shù)(3) 寫方程:

6、 寫出線性回歸方程 ,并利用線性回歸方程進行預報說明強化訓練 :1一位母親記錄了自己兒子 39 歲的身高數(shù)據(jù) (略),由此建立的身高與年齡的回歸模型為y 7.19x 73.93,用這個模型預報這個孩子 10 歲時的身高,則正確的敘述是 ( )A 身高一定是 145.83 cmB 身高在 145.83 cm 以上C身高在 145.83 cm 左右D 身高在 145.83 cm 以下2煉鋼是一個氧化降碳的過程,鋼水含碳量的多少直接影響冶煉時間的長短,必須掌握鋼 水含碳量和冶煉時間的關(guān)系 如果已測得爐料熔化完畢時鋼水的含碳量 x 與冶煉時間 y(從煉1010料熔化完畢到出鋼的時間 )的數(shù)據(jù) (xi,

7、yi)(i1,2,10)并已計算出 xi1 598, yi1 720,i 1i11010xi2265 448, xiyi287 640,試求冶煉時間 y與鋼水的含碳量 x之間的回歸方程 .i 1i1線性回歸分析x 與成熟期有效穗 y假定小麥基本苗數(shù) 之間存在相關(guān)關(guān)系,今測得 5 組數(shù)據(jù)如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以 x 為解釋變量, y 為預報變量,作出散點圖;(2)求 y 與 x之間的回歸方程,對于基本苗數(shù)為56.7 時預報有效穗;(3)計算各組殘差,并計算殘差平方和;(4) 求相關(guān)指數(shù) R2,并說明殘差變量對有效穗的影響占

8、百分之幾?(1)該類題屬于線性回歸問題 , 解答本題應先通過散點圖來分析兩變量間的關(guān)系是否線 性相關(guān) ,然后再利用求回歸方程的公式求解回歸方程 ,并利用殘差圖或相關(guān)指數(shù) R2 來分析 函數(shù)模型的擬合效果 , 在此基礎(chǔ)上 , 借助回歸方程對實際問題進行分析(2)刻畫回歸效果的三種方法 殘差圖法:殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適;殘差平方和法:殘差平方和n(yiyi)2 越小,模型的擬合效果越好;n( yiyi)2i 1相關(guān)指數(shù)法:R21越接近 1, 表明回歸的效果越好 .n(yi y )2i1強化訓練為研究質(zhì)量 x(單位:克 )對彈簧長度 y(單位:厘米 )的影響,對不

9、同質(zhì)量的 6 個物體進行測量,數(shù)據(jù)如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散點圖,并求線性回歸方程;(2)求出 R2;(3)進行殘差分析非線性回歸分析菜農(nóng)定期使用低害殺蟲農(nóng)藥對蔬菜進 行噴灑, 以防止害蟲的危害, 但采集上市時蔬菜仍存有少量的殘留農(nóng)藥, 食用時需要用清水 清洗干凈,下表是用清水 x(單位:千克 )清洗該蔬菜 1 千克后,蔬菜上殘留的農(nóng)藥 y(單位: 微克 )的統(tǒng)計表:x12345y5854392910(1)令 x2,利用給出的參考數(shù)據(jù)求出 y 關(guān)于 的回歸方程 yba.(a,b精確到 0.1)5 5 5 參考數(shù)據(jù):i55,

10、(i) (yi y) 751, (i)2374,其中 i xi2, i 1i1i15i1i.(2)對于某種殘留在蔬菜上的農(nóng)藥,當它的殘留量不高于20 微克時對人體無害,為了放心食用該蔬菜, 請估計至少需要用多少千克的清水清洗 1 千克蔬菜? (精確到 0.1,參考數(shù)據(jù)52.24) 附:對于一組數(shù)據(jù) (u1,v1),(u2,v2), (un, vn),其回歸直線 vu 的斜率和截n ( ui u )( vi v ) i 1 距的最小二乘估計分別為 , v u .n( ui u ) 2i1總結(jié) :求非線性回歸方程的步驟(1)確定變量 ,作出散點圖(2)根據(jù)散點圖 , 選擇恰當?shù)臄M合函數(shù)(3)變量置

11、換 ,通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題, 并求出線性回歸方程(4)分析擬合效果:通過計算相關(guān)指數(shù)或畫殘差圖來判斷擬合效果(5)根據(jù)相應的變換 , 寫出非線性回歸方程強化訓練 :某地今年上半年患某種傳染病的人數(shù)y(人) 與月份 x(月 )之間滿足函數(shù)關(guān)系,模型為 y aebx,確定這個函數(shù)解析式月份 x/月123456人數(shù) y/人526168747883訓練題 1散點圖在回歸分析過程中的作用是( )A 查找個體個數(shù)B比較個體數(shù)據(jù)大小關(guān)系C探究個體分類D粗略判斷變量是否線性相關(guān)2為研究兩個變量之間的關(guān)系,選擇了4 個不同的模型進行擬合,計算得它們的相關(guān)指數(shù)R2,其中擬合效果最好的模型

12、是 ()A相關(guān)指數(shù) R2為 0.96B相關(guān)指數(shù) R2為 0.75C相關(guān)指數(shù) R2為 0.52D相關(guān)指數(shù) R2 為 0.343已知 x, y 的取值如下表所示,若y與 x線性相關(guān),且 y0.95xa,則a()x0134y2.24.34.86.7A 2.2B2.9C2.8D 2.64已知變量 x和 y滿足關(guān)系 y0.1x10,變量 z與 y負相關(guān),則下列結(jié)論中正確的是 ( ) Ax與 y負相關(guān), x與 z負相關(guān)Bx與y正相關(guān), x與 z正相關(guān)Cx 與 y 正相關(guān), x 與 z負相關(guān)Dx與 y 負相關(guān), x 與 z正相關(guān)5下列說法中正確的是 ( )相關(guān)系數(shù) r 用來衡量兩個變量之間線性關(guān)系的強弱,|

13、r|越接近于 1,相關(guān)性越弱; 回歸直線 ybxa一定經(jīng)過樣本點的中心 (x , y ); 隨機誤差 e 滿足 E(e)0,其方差 D(e)的大小用來衡量預報的精確度; 相關(guān)指數(shù) R2 用來刻畫回歸的效果, R2越小,說明模型的擬合效果越好A BCDA 組訓練題1關(guān)于回歸分析,下列說法錯誤的是( )A回歸分析是研究兩個具有相關(guān)關(guān)系的變量的方法 B散點圖中,解釋變量在 x 軸,預報變量在 y 軸 C回歸模型中一定存在隨機誤差 D散點圖能明確反映變量間的關(guān)系2根據(jù)如下樣本數(shù)據(jù)得到的回歸方程為ybxa,若a5.4,則 x 每增加 1 個單位,估計y( )x34567y42.50.50.52A增加 0

14、.9個單位B減少 0.9 個單位C增加 1 個單位D減少 1 個單位3對具有線性相關(guān)關(guān)系的變量x, y 有一組觀測數(shù)據(jù) (xi, yi)(i 1, 2, 8),其回歸直線 1 方程是 y bx ,且 x1x2x3 x8 2(y1y2y3 y8)6,則實數(shù) b的值是 ()8A1161B141C 13D4.如圖, 5個 (x,y)數(shù)據(jù),去掉 D(3,10)后,下列說法錯誤的是 ( )A 相關(guān)系數(shù) r 變大 B殘差平方和變大C相關(guān)指數(shù) R2變大 D解釋變量 x與預報變量 y 的相關(guān)性變強5若某地財政收入 x 與支出 y 滿足線性回歸方程 ybx ae(單位:億元 ),其中 b0.8, a2, |e|

15、 0.5.如果今年該地區(qū)財政收入 10 億元,則年支出預計不會超過 ( )A 10 億元B 9 億元C 10.5 億元D 9.5 億元6某市居民 20142018 年家庭年平均收入 x(單位:萬元 )與年平均支出 y(單位:萬元 )的統(tǒng) 計資料如表:年份20142015201620172018收入 x11.512.11313.515支出 y6.88.89.81012根據(jù)統(tǒng)計資料, 居民家庭年平均收入的中位數(shù)是 ,家庭年平均收入與年平均支出有 (填“正”或“負” )線性相關(guān)關(guān)系7關(guān)于變量 x,y 的一組樣本數(shù)據(jù) (a1, b1),(a2, b2), (an, bn)( n 2, a1, a2,

16、an不全相等 )的散點圖中,若所有樣本點 (ai,bi)(i1,2, n)恰好都在直線 y2x1 上,則根據(jù)這組樣本數(shù)據(jù)推斷的變量x,y 的相關(guān)系數(shù)為 8某種產(chǎn)品的廣告費支出 x 與銷售額 y(單位:萬元 )之間的關(guān)系如下表:x24568y3040605070y與 x 的線性回歸方程為 y6.5x17.5,當廣告支出 5萬元時,隨機誤差的效應 (殘差) 為9某企業(yè)為了對新研發(fā)的一批產(chǎn)品進行合理定價,將產(chǎn)品按事先擬定的價格進行試銷,得 到一組銷售數(shù)據(jù) (xi,yi)(i1,2, 6),如表所示:試銷單價 x/ 元456789產(chǎn)品銷量 y/件q8483807568已知 y 80,(1)求 q 的值

17、;(2)已知變量 x,y 具有線性相關(guān)性, 求產(chǎn)品銷量 y關(guān)于試銷單價 x 的線性回歸方程 y bx 6 6a.可供選擇的數(shù)據(jù)i1xiyi3 050,i1xi2271.(3) 用y表示(2)中所求的線性回歸方程得到的與xi 對應的產(chǎn)品銷量 yi 的估計值當銷售數(shù)據(jù)(xi,yi)(i1,2, 6)對應的殘差的絕對值 |yiyi|1 時,則將銷售數(shù)據(jù) (xi,yi)稱為一個 “好數(shù)據(jù)”試求這 6 組銷售數(shù)據(jù)中的“好數(shù)據(jù)”n i1xiyi n x y 參數(shù)數(shù)據(jù):線性回歸方程中 b,a的最小二乘估計分別是 b ni1 ,a y bx . i1xi2 n( x ) 2B 能力提升 10對于給定的樣本點所

18、建立的模型A 和模型 B,它們的殘差平方和分別是 a1,a2,R2的值分別為 b1, b2,下列說法正確的是 ( )A 若 a1<a2,則 b1<b2,A 的擬合效果更好B若 a1<a2,則 b1<b2,B 的擬合效果更好C若 a1<a2,則 b1>b2,A 的擬合效果更好D若 a1<a2,則 b1>b2 ,B 的擬合效果更好11某品牌手機銷售商今年 1,2, 3月份的銷售量分別是 1萬部, 1.2萬部, 1.3 萬部,為估 計以后每個月的銷售量,以這三個月的銷售為依據(jù),用一個函數(shù)模擬該品牌手機的銷售量 y(單位:萬部 )與月份 x之間的關(guān)系, 現(xiàn)從二次函數(shù) yax2bxc(a 0)或函數(shù) yabxc(b>0,b1)中選用一個效果好的函數(shù)進行模擬,如果4月份的銷售量為 1.37萬部,則 5 月份的銷售量為 萬部12(2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論