(命題回歸分析的基本思想及其初步應(yīng)用)人教版高中數(shù)學(xué)選修1-2教學(xué)課件(第1.1.1課時)_第1頁
(命題回歸分析的基本思想及其初步應(yīng)用)人教版高中數(shù)學(xué)選修1-2教學(xué)課件(第1.1.1課時)_第2頁
(命題回歸分析的基本思想及其初步應(yīng)用)人教版高中數(shù)學(xué)選修1-2教學(xué)課件(第1.1.1課時)_第3頁
(命題回歸分析的基本思想及其初步應(yīng)用)人教版高中數(shù)學(xué)選修1-2教學(xué)課件(第1.1.1課時)_第4頁
(命題回歸分析的基本思想及其初步應(yīng)用)人教版高中數(shù)學(xué)選修1-2教學(xué)課件(第1.1.1課時)_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、講解人:精品課件 時間:2020.6.1PEOPLES EDUCATION PRESS HIGH SCHOOL MATHEMATICS ELECTIVE 1-21.1命題回歸分析的基本思想及其初步應(yīng)用第1章 統(tǒng)計案例人教版高中數(shù)學(xué)選修1-2第一頁,共二十七頁。通過對必修的學(xué)習(xí),我們知道,變量之間存在關(guān)系時,有兩種關(guān)系:確 定 性 關(guān) 系非確定性關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系函數(shù)關(guān)系是非常明確的關(guān)系,相關(guān)關(guān)系確實一種變化的,通過數(shù)學(xué)3的學(xué)習(xí)我們知道,回歸分析(regression analysis)是相關(guān)關(guān)系的一種分析方法,它是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析一般步驟為:課前導(dǎo)入第二頁,共二十七頁。散

2、點圖求回歸方程利用回歸方程預(yù)報下面我們通過實際案例。進一步學(xué)習(xí)回歸分析的基本思想及其應(yīng)用二分法函數(shù)關(guān)系課前導(dǎo)入第三頁,共二十七頁。例1.從某大學(xué)中隨機選取8名女大學(xué)生。其身高和體重數(shù)據(jù)如表所示:編號12345678身高cm165165157170175165155170體重kg4857505464614359求根據(jù)一名大學(xué)生的身高預(yù)報她的體重的回歸方程,并預(yù)報一名172cm的女大學(xué)生的體重。新知探究第四頁,共二十七頁。解利用前面的知識我們首先作身高x和體重y的散點圖:新知探究第五頁,共二十七頁。從圖可以看出,樣本點的分布有比較好的線性關(guān)系,因此可以用線性回歸來刻畫它們之間的關(guān)系.會求它們的方程

3、嗎?事實上,從散點圖可以看出,樣本點并不是分布在這條直線上,而是分布在它的兩邊,所以嚴格來說: y=bx+a不是真正的表示它們之間的關(guān)系,這時我們把身高和體重的關(guān)系做一下調(diào)整來模擬回歸關(guān)系:Y=bx+a+e其中a和b為模型的未知參數(shù),e稱為隨機誤差如何產(chǎn)生的?新知探究第六頁,共二十七頁。身高X(cm)體重y(kg)飲食習(xí)慣運動習(xí)慣質(zhì)量誤差新知探究第七頁,共二十七頁。線性回歸模型y=bx+a+e與我們了的一次函數(shù)模型不同之處在于多了一個隨機誤差e,y的值有它們一起決定解釋變量x預(yù)報變量y隨機誤差e如何估計a,b,e?新知探究第八頁,共二十七頁。1.a,b的估計:a,b的估計和最小二乘法估計一樣其

4、中稱為樣本的中心新知探究第九頁,共二十七頁。2.e的估計y=0.849x-85.712通過數(shù)學(xué)3的學(xué)習(xí)我們知道,它們之間是正相關(guān)的,我們用它們的相關(guān)系數(shù)r來衡量它們之間的相關(guān)性的強弱新知探究第十頁,共二十七頁。1.當(dāng)r0時,正相關(guān)2.當(dāng)r0.75是,認為兩個變量有極強的線性相關(guān)關(guān)系。3.當(dāng)r0時,無相關(guān)新知探究第十一頁,共二十七頁。在上面的例子中我們假設(shè)體重與身高沒有關(guān)系即:體重都為:則,她們身高體重的散點圖應(yīng)該在一條水平直線上:新知探究第十二頁,共二十七頁。事實上,并非如此,它們和45.5之間存在差別,這時我們就引入隨機誤差,利用隨機誤差和解釋變量共同來預(yù)報變量y把所有的這種效應(yīng)利用總體偏差

5、平方和合并成一個數(shù)總體偏差平方和解釋變量隨機誤差?新知探究第十三頁,共二十七頁。我們現(xiàn)在要弄清楚這個總的效應(yīng)中,有多少來自解釋變量,有多少來自隨機誤差,即:哪一個效應(yīng)起決定性作用?根據(jù)我們在數(shù)學(xué)3總的知識,我們知道:每個點與回歸方程的差異我們可以用 來表示,記作: (殘差(residual)它剛好可以表示隨機誤差的效應(yīng)。新知探究為什么說可以用殘差來表示隨機誤差的效應(yīng)?怎樣去刻畫每個效應(yīng)呢?第十四頁,共二十七頁。為了回歸的準(zhǔn)確和計算的方便我們引入殘差平方和(residual sum of squares)它代表隨機誤差的效應(yīng)求出了隨機誤差的效應(yīng)后,我們就比較容易得到解釋變量的效應(yīng)了。同學(xué)們知道怎

6、樣求嗎?解釋變量的效應(yīng)總體偏差平方和殘差平方和回歸平方和(regression sun of squares)新知探究第十五頁,共二十七頁。你會計算上面的總體偏差平方和、殘差平方和、回歸平方和嗎?354128.361225.639新知探究第十六頁,共二十七頁。有了這些評估效應(yīng)的方法,我們就可以利用它們來刻畫總體效應(yīng),事實上,為了將我們的計算簡化,我們又引入相關(guān)指數(shù)R2來刻畫回歸的效果:殘差平方和總體偏差平方和顯然,當(dāng)R2的值越大,說明殘差所占的比例越小,回歸效果約好;反之,回歸效果越差。一般的,當(dāng)R2越接近于1,說明解釋變量和預(yù)報變量之間的相關(guān)性越強,如果同一個問題,采用不同的回歸方法分析,我

7、們可以通過選擇R2大的來作為回歸模型新知探究第十七頁,共二十七頁。一般方法:1.利用散點圖觀察兩個變量是否線性相關(guān)2.利用殘差來判斷模型擬合的效果(殘差分析)利用殘差圖來分析數(shù)據(jù),對可疑數(shù)據(jù)(殘差較大的數(shù)據(jù))進行重新調(diào)查,有錯誤就更正,然后重新利用回歸模型擬合,如果沒有錯誤,則需要找其他原因。新知探究第十八頁,共二十七頁。殘差圖:編號12345678身高cm165165157170175165155170體重kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382問題數(shù)據(jù)越窄越好新知探究第十九頁,共二十七頁。1.回歸方程只適

8、合對所研究總體的估計2.回歸方程是對數(shù)據(jù)的模擬,數(shù)據(jù)的改變,可能會導(dǎo)致回歸方程的變化3.不同的回歸樣本數(shù)據(jù),有不同的回歸方程,也適合不同的回歸總體,4.回歸方程是預(yù)報變量的平均值,而不是精確值5.回歸的好壞可以由相關(guān)指數(shù)來評價新知探究說明第二十頁,共二十七頁。建立回歸方程的一般步驟:1.確定變量2.制作散點圖,觀察是否相關(guān)3.確定回歸方程的類型(線性回歸、指數(shù)回歸、對數(shù)回歸等)4.利用公式確定回歸參數(shù)5.利用殘差分析回歸是否合理或模型是否合適新知探究第二十一頁,共二十七頁。例2一只紅蛉蟲的產(chǎn)卵數(shù)y與溫度x有關(guān),現(xiàn)收集了7組數(shù)據(jù),請建立y與x建德回歸方程溫度x21232527293235產(chǎn)卵數(shù)y

9、/個711212466115325解 1.制作散點圖新知探究第二十二頁,共二十七頁。2.觀察模擬樣本點不能直接利用線性回歸,根據(jù)我們的函數(shù)知識,它應(yīng)該是一個指數(shù)模型:y=c1ec2x其中c1c2為參數(shù)或二次函數(shù)模型,根據(jù)對數(shù)回歸知識我們知道:令z=lny將其變換到樣本點的分布直線z=a+bxx21232527293235z1.9462.3983.0453.1784.1904.7455.784z=0272x-3.843會求著條直線嗎?則:y=e0.272x-3.843新知探究第二十三頁,共二十七頁。2.我們認為樣本點集中在某二次函數(shù)y=c3x2+c4附近,c3c4為參數(shù),則,令tx2則:y=c5

10、t+c6其中c5c6為參數(shù)t44152962572984110241225y711212466115325y=0.367t-202.54不適合利用線性回歸為什么這樣說?新知探究第二十四頁,共二十七頁。4.殘差分析:X21232527293235合計(殘差平方和)R2Y711212466115329e(1)0.518-0.1671.760-9.1498.889-14.15332.9281450.6730.98e(2)47.69319.397-5.835-41.003-40.107-58.26877.96515448.4320.80由圖的對比可以看出,指數(shù)模擬優(yōu)于線性模擬新知探究第二十五頁,共二十七頁?;貧w分析基本思想及其初步應(yīng)用基本思想實際應(yīng)用回歸分析相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論