人教A版選修23 3.1回歸分析的基本思 想及其初步應(yīng)用 課件(86張).ppt_第1頁
人教A版選修23 3.1回歸分析的基本思 想及其初步應(yīng)用 課件(86張).ppt_第2頁
人教A版選修23 3.1回歸分析的基本思 想及其初步應(yīng)用 課件(86張).ppt_第3頁
人教A版選修23 3.1回歸分析的基本思 想及其初步應(yīng)用 課件(86張).ppt_第4頁
人教A版選修23 3.1回歸分析的基本思 想及其初步應(yīng)用 課件(86張).ppt_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章統(tǒng)計(jì)案例3 1回歸分析的基本思想及其初步應(yīng)用 主題1回歸分析的概念及回歸方程1 在 必修3 中學(xué)習(xí)的利用最小二乘法估計(jì)計(jì)算得出的回歸方程是什么 提示 2 在回歸方程中與線性回歸模型中y bx a e中真實(shí)值a b之間是否存在誤差 它是否引起預(yù)報(bào)值與真實(shí)值y之間存在誤差 提示 在回歸方程中 和為斜率和截距的估計(jì)值 由于樣本不一樣 其值可能不一樣 所以它們與真實(shí)值a b之間存在誤差 這種誤差會(huì)引起預(yù)報(bào)值與真實(shí)值y之間存在誤差 結(jié)論 回歸直線方程1 回歸分析 1 函數(shù)關(guān)系 函數(shù)關(guān)系是一種 關(guān)系 例如正方形的周長c 4a 周長c與邊長a之間就是一種確定性關(guān)系 對于自變量 邊長 的每一個(gè)確定的值 都有唯一確定的周長與之相對應(yīng) 確定性 2 相關(guān)關(guān)系 當(dāng)自變量取值一定時(shí) 因變量的取值帶有一定的 的兩個(gè)變量之間的關(guān)系 相關(guān)關(guān)系是一種 關(guān)系 回歸分析 對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法 隨機(jī)性 非確定性 2 回歸直線方程對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù) x1 y1 x2 y2 xn yn 回歸直線y bx a的斜率和截距的最小二乘估計(jì)公式分別為 其中 稱為樣本點(diǎn)的中心 微思考 1 現(xiàn)實(shí)生活中的兩個(gè)變量有哪些關(guān)系 線性回歸模型是用來刻畫哪類變量間的模型 提示 現(xiàn)實(shí)生活中的兩個(gè)變量關(guān)系主要有確定性關(guān)系與非確定性關(guān)系 線性回歸模型是用來刻畫非確定性關(guān)系的模型 2 回歸分析中 利用線性回歸方程求出的函數(shù)值是否一定為真實(shí)值 提示 不一定是真實(shí)值 利用線性回歸方程求的值 在很多時(shí)候是個(gè)預(yù)報(bào)值 例如 人的體重與身高存在一定的線性關(guān)系 但體重除了受身高的影響外 還受其他因素的影響 如飲食 是否喜歡運(yùn)動(dòng)等 3 線性回歸方程能否用散點(diǎn)圖中的某兩點(diǎn)來確定 提示 不能用散點(diǎn)圖中過某兩點(diǎn)的直線方程來作為線性回歸方程 由散點(diǎn)圖易發(fā)現(xiàn)樣本點(diǎn)散布在某一條直線附近 而不是一條直線上 不能用一次函數(shù)y bx a描述它們之間的關(guān)系 因此用線性回歸模型y bx a e來表示 其中a b可以由最小二乘法估計(jì) 就是a b的估計(jì)值 主題2模型擬合效果的衡量1 線性回歸模型是函數(shù)關(guān)系嗎 提示 不是 回歸模型是刻畫一組數(shù)據(jù)的整體趨勢 回歸模型中的y由x和隨機(jī)誤差e共同確定 即x只能解釋部分y的變化 因此它不是函數(shù)關(guān)系 2 一個(gè)模型建立的好壞一般如何來衡量呢 提示 可以用yi 即殘差的值來估計(jì)一個(gè)模型建立的好壞 當(dāng)殘差越小時(shí) 說明模型越好 反之 模型建立的不好 結(jié)論 刻畫回歸模型效果的概率及方法1 相關(guān)概念 1 殘差 數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差i 1 2 3 n 稱為相應(yīng)于點(diǎn) xi yi 的殘差 2 殘差圖 利用圖形來分析殘差特性 作圖時(shí) 為殘差 可以選為樣本編號(hào) 或身高數(shù)據(jù) 或體重的估計(jì)值等 這樣作出的圖形稱為殘差圖 縱坐標(biāo) 橫坐標(biāo) 2 回歸模型模擬效果的判斷方法 合適 越窄 越小 解釋變量 預(yù)報(bào)變量 越好 微思考 1 有時(shí)散點(diǎn)圖的各點(diǎn)并不集中在一條直線的附近 仍然可以按照求回歸直線方程的步驟求回歸直線 顯然這樣的回歸直線沒有實(shí)際意義 用殘差能否判斷建立的回歸模型是否合理 提示 殘差能對x y的線性相關(guān)性進(jìn)行檢驗(yàn) 殘差可以發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù) 如果殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中說明選用的模型較為合適 2 殘差分析與計(jì)算r2的值來刻畫模型函數(shù)的模擬效果有什么區(qū)別 提示 殘差分析只能從圖形中直觀感覺上得出結(jié)論 而計(jì)算r2的值是用數(shù)據(jù)說話 即一個(gè)是從形上 一個(gè)是從數(shù)上說明 預(yù)習(xí)自測 1 下列兩個(gè)變量之間的關(guān)系不是函數(shù)關(guān)系的是 a 角度和它的余弦值b 正方形的邊長和面積c 正n邊形的邊數(shù)和內(nèi)角度數(shù)和d 人的年齡和身高 解析 選d 函數(shù)關(guān)系是兩變量之間有確定性的關(guān)系 選項(xiàng)a b c都是函數(shù)關(guān)系 而人的年齡和身高不具備確定性關(guān)系 不是函數(shù)關(guān)系 2 線性回歸方程必過定點(diǎn) a 0 0 b 0 c 0 d 解析 選d 因?yàn)?所以 3 線性回歸模型y bx a e中 e為隨機(jī)誤差 則e e 解析 由線性回歸模型y bx a e定義可知 e e 0 答案 0 4 對某城市進(jìn)行職工人均工資水平x 千元 與居民人均消費(fèi)水平y(tǒng) 千元 統(tǒng)計(jì)調(diào)查后知 y與x具有線性相關(guān)關(guān)系 滿足線性回歸方程y 0 6x 1 5 若該城市居民人均消費(fèi)水平為7 5 千元 則可以估計(jì)該城市人均消費(fèi)額占人均工資收入的百分比約為 解析 因?yàn)閥與x具有線性相關(guān)關(guān)系 滿足線性回歸方程y 0 6x 1 5 該城市居民人均消費(fèi)水平為y 7 5 由7 5 0 6x 1 5 得x 10 所以可以估計(jì)該城市的職工人均工資水平為10 所以可以估計(jì)該城市人均消費(fèi)額占人均工資收入的百分比約為 100 75 答案 75 5 為了對某校高三 1 班9月月考成績進(jìn)行分析 在全班同學(xué)中隨機(jī)抽出5位 他們的數(shù)學(xué)分?jǐn)?shù) 物理分?jǐn)?shù) 化學(xué)分?jǐn)?shù) 均已折算為百分制 對應(yīng)如表 1 求這5位同學(xué)中數(shù)學(xué)和物理分?jǐn)?shù)都不小于85分的概率 2 從散點(diǎn)圖分析 y與x z與x之間都有較好的線性相關(guān)關(guān)系 分別求y與x z與x的線性回歸方程 并用相關(guān)指數(shù)比較所求回歸模型的擬合效果 解析 1 這5位同學(xué)中數(shù)學(xué)和物理分?jǐn)?shù)都不小于85分 共有2人 故概率為p 2 設(shè)y與x z與x的線性回歸方程分別是 根據(jù)所給的數(shù)據(jù) 可以計(jì)算出 81 0 8 85 13 86 0 6 85 35 所以 0 8x 13 0 6x 35 所以 02 02 1 2 22 1 2 6 所以 2 2 22 12 02 1 2 10 又y與x z與x的相關(guān)指數(shù)是r2 1 0 964 r 2 1 0 90 故回歸模型 0 8x 13比回歸模型 0 6x 35的擬合的效果好 類型一求回歸直線方程 典例1 在一段時(shí)間內(nèi) 某種商品的價(jià)格x 萬元 和需求量y t 之間的一組數(shù)據(jù)為 1 畫出散點(diǎn)圖 2 求出y對x的線性回歸方程 3 如果價(jià)格定為1 9萬元 預(yù)測需求量大約是多少 解題指南 1 根據(jù)表中的數(shù)據(jù) 在直角坐標(biāo)系中畫出散點(diǎn)圖 2 將表中所給的數(shù)據(jù)代入公式 求出y對x的線性回歸方程y bx a 3 當(dāng)價(jià)格定為1 9萬元 即x 1 9 代入線性回歸方程 即可預(yù)測需求量 解析 1 散點(diǎn)圖如圖所示 2 采用列表的方法計(jì)算與 所以y對x的線性回歸方程為 28 1 11 5x 3 當(dāng)x 1 9時(shí) 28 1 11 5 1 9 6 25 t 所以價(jià)格定為1 9萬元時(shí) 需求量大約是6 25t 方法總結(jié) 求線性回歸方程的三個(gè)步驟 1 畫散點(diǎn)圖 由樣本點(diǎn)是否呈條狀分布來判斷兩個(gè)量是否具有線性相關(guān)關(guān)系 2 求回歸系數(shù) 若存在線性相關(guān)關(guān)系 則求回歸系數(shù) 3 寫方程 寫出線性回歸方程 并利用線性回歸方程進(jìn)行預(yù)測說明 鞏固訓(xùn)練 2017 漢口高二檢測 某車間為了規(guī)定工時(shí)定額 需要確定加工零件所花費(fèi)的時(shí)間 為此做了4次試驗(yàn) 得到數(shù)據(jù)如下 1 在給出坐標(biāo)系中畫出表中數(shù)據(jù)的散點(diǎn)圖 2 求y關(guān)于x的回歸方程y bx a 3 試預(yù)測加工10個(gè)零件需要的時(shí)間 解析 1 散點(diǎn)圖如圖所示 2 由題中表格數(shù)據(jù)得 3 5 3 5 由公式計(jì)算得 0 7 1 05 所以所求線性回歸方程為 0 7x 1 05 3 當(dāng)x 10時(shí) 0 7 10 1 05 8 05 所以預(yù)測加工10個(gè)零件需要8 05小時(shí) 補(bǔ)償訓(xùn)練 某個(gè)服裝店經(jīng)營某種服裝 在某周內(nèi)獲純利潤y 元 與該周每天銷售這種服裝件數(shù)x之間的一組數(shù)據(jù)關(guān)系見表 已知 1 求 2 判斷純利潤y 元 與每天銷售件數(shù)x之間是否線性相關(guān) 如果線性相關(guān) 求出回歸方程 解析 1 2 畫出散點(diǎn)圖知 y與x有線性相關(guān)關(guān)系 設(shè)回歸直線方程 6 4 75 51 36 所以回歸方程為 4 75x 51 36 類型二線性回歸分析 典例2 1 甲 乙 丙 丁四位同學(xué)各自對a b兩變量做回歸分析 分別得到散點(diǎn)圖與殘差平方和如下表 哪位同學(xué)的試驗(yàn)結(jié)果體現(xiàn)擬合a b兩變量關(guān)系的模型擬合精度高 a 甲b 乙c 丙d 丁 2 為研究質(zhì)量x 單位 g 對彈簧長度y 單位 cm 的影響 對不同質(zhì)量的6個(gè)物體進(jìn)行測量 數(shù)據(jù)如表所示 作出散點(diǎn)圖 并求線性回歸方程 求出r2 進(jìn)行殘差分析 解題指南 1 可依據(jù)殘差平方和與回歸模型效果的關(guān)系處理 2 通過殘差表或殘差圖進(jìn)行殘差分析 解析 1 選d 根據(jù)線性相關(guān)的知識(shí) 散點(diǎn)圖中各樣本點(diǎn)帶狀分布越均勻 同時(shí)保持殘差平方和越小 對于已經(jīng)獲取的樣本數(shù)據(jù) r2表達(dá)式中為確定的數(shù) 則殘差平方和越小 r2越大 由回歸分析建立的線性回歸模型的擬合效果越好 由試驗(yàn)結(jié)果知丁要好些 2 散點(diǎn)圖如圖所示 5 10 15 20 25 30 17 5 7 25 8 12 8 95 9 90 10 9 11 8 9 487 2275 1076 2 計(jì)算得 0 183 6 285 所求線性回歸方程為 0 183x 6 285 列表如下 所以所以 r2 1 0 9991 回歸模型的擬合效果較好 由殘差表中的數(shù)值可以看出第3個(gè)樣本點(diǎn)的殘差比較大 需要確認(rèn)在采集這個(gè)數(shù)據(jù)的時(shí)候是否有人為的錯(cuò)誤 如果有的話 需要糾正數(shù)據(jù) 重新建立回歸模型 由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在不超過0 15的狹窄的水平帶狀區(qū)域中 說明選用的線性回歸模型的精度較高 由以上分析可知 彈簧長度與質(zhì)量成線性關(guān)系 延伸探究 1 第 2 題在條件不變的情況下 畫出殘差圖 解析 如圖所示 2 當(dāng)x 35時(shí) 估計(jì)y的值 解析 當(dāng)x 35時(shí) y 6 285 0 183 35 12 69 方法總結(jié) 刻畫回歸效果的三種方式 1 殘差圖法 殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適 2 殘差平方和法 殘差平方和越小 模型的擬合效果越好 3 r2法 越接近1 表明回歸的效果越好 補(bǔ)償訓(xùn)練 2017 鄭州高二檢測 收集一只棉鈴蟲的產(chǎn)卵數(shù)y與溫度x的幾組數(shù)據(jù)后發(fā)現(xiàn)兩個(gè)變量有相關(guān)關(guān)系 并按不同的曲線來擬合y與x之間的回歸方程 并算出了對應(yīng)相關(guān)指數(shù)r2如下表 則這組數(shù)據(jù)模型的回歸方程的最好選擇應(yīng)是 a 19 8x 463 7b e0 27x 3 84c 0 367x2 202d 解析 選b 用相關(guān)指數(shù)r2來刻畫回歸效果 r2的值越接近1 說明模型的擬合效果越好 類型三非線性回歸分析 典例3 2017 太原高二檢測 下表為收集到的一組數(shù)據(jù) 1 作出x與y的散點(diǎn)圖 并猜測x與y之間的關(guān)系 2 建立x與y的關(guān)系 預(yù)報(bào)回歸模型并計(jì)算殘差 3 利用所得模型 預(yù)報(bào)x 40時(shí)y的值 解題指南 1 畫出散點(diǎn)圖 確定兩變量x y是否線性相關(guān) 由散點(diǎn)圖得x y之間的回歸模型 2 進(jìn)行擬合 預(yù)報(bào)回歸模型 求回歸方程 解析 1 作出散點(diǎn)圖如圖 從散點(diǎn)圖可以看出x與y不具有線性相關(guān)關(guān)系 根據(jù)已有知識(shí)可以發(fā)現(xiàn)樣本點(diǎn)分布在某一條指數(shù)函數(shù)曲線y c1的周圍 其中c1 c2為待定的參數(shù) 2 對兩邊取對數(shù)把指數(shù)關(guān)系變?yōu)榫€性關(guān)系 令z lny 則有變換后的樣本點(diǎn)應(yīng)分布在直線z bx a a lnc1 b c2 的周圍 這樣就可以利用線性回歸模型來建立y與x之間的非線性回歸方程了 數(shù)據(jù)可以轉(zhuǎn)化為 求得回歸直線方程為 0 272x 3 849 所以 e0 272x 3 849 殘差 3 當(dāng)x 40時(shí) e0 272x 3 849 1131 方法總結(jié) 解決非線性回歸問題的方法及步驟 1 確定變量 確定解釋變量為x 預(yù)報(bào)變量為y 2 畫散點(diǎn)圖 通過觀察散點(diǎn)圖并與學(xué)過的函數(shù) 冪函數(shù) 指數(shù)函數(shù) 對數(shù)函數(shù) 二次函數(shù) 作比較 選取擬合效果好的函數(shù)模型 3 變量置換 通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題 4 分析擬合效果 通過計(jì)算相關(guān)指數(shù)等來判斷擬合效果 5 寫出非線性回歸方程 鞏固訓(xùn)練 2017 貴陽高二檢測 研究 剎車距離 對于安全行車及分析交通事故責(zé)任都有一定的作用 所謂 剎車距離 就是指行駛中的汽車 從剎車開始到停止 由于慣性的作用而又繼續(xù)向前滑行的一段距離 為了測定某種型號(hào)汽車的剎車性能 車速不超過140km h 對這種汽車進(jìn)行測試 測得的數(shù)據(jù)如表 1 以車速為x軸 以剎車距離為y軸 在給定坐標(biāo)系中畫出這些數(shù)據(jù)的散點(diǎn)圖 2 觀察散點(diǎn)圖 估計(jì)函數(shù)的類型 并確定一個(gè)滿足這些數(shù)據(jù)的函數(shù)表達(dá)式 3 該型號(hào)汽車在國道上發(fā)生了一次交通事故 現(xiàn)場測得剎車距離為46 5m 請推測剎車時(shí)的速度為多少 請問在事故發(fā)生時(shí) 汽車是超速行駛還是正常行駛 解題指南 1 依據(jù)散點(diǎn)圖的概念及作法 畫出散點(diǎn)圖 2 細(xì)心觀察散點(diǎn)圖 然后確定其函數(shù)表達(dá)式 3 依據(jù) 2 中的表達(dá)式 得出關(guān)于x的方程 解方程即得結(jié)果 解析 1 散點(diǎn)圖如圖所示 2 由圖象 設(shè)函數(shù)的表達(dá)式為y ax2 bx c a 0 將 0 0 10 0 3 20 1 0 代入 得解得a 0 002 b 0 01 c 0 所以 函數(shù)的表達(dá)式為y 0 002x2 0 01x 0 x 140 經(jīng)檢驗(yàn) 表中其他各值也符合此表達(dá)式 3 當(dāng)y 46 5時(shí) 即0 002x2 0 01x 46 5 所以 x2 5x 23250 0 解得x1 150 x2 155 舍去 故可推測剎車時(shí)的速度為150km h 而150 140 因此發(fā)生事故時(shí) 汽車屬于超速行駛 補(bǔ)償訓(xùn)練 為了研究某種細(xì)菌隨時(shí)間x變化的繁殖個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論