高中數(shù)學(xué) 第三章 統(tǒng)計案例 3.1 回歸分析的基本思想及其初步應(yīng)用(第2課時)教案 新人教A版選修2-3_第1頁
高中數(shù)學(xué) 第三章 統(tǒng)計案例 3.1 回歸分析的基本思想及其初步應(yīng)用(第2課時)教案 新人教A版選修2-3_第2頁
高中數(shù)學(xué) 第三章 統(tǒng)計案例 3.1 回歸分析的基本思想及其初步應(yīng)用(第2課時)教案 新人教A版選修2-3_第3頁
免費預(yù)覽已結(jié)束,剩余15頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、學(xué)必求其心得,業(yè)必貴于專精3.1 回歸分析的基本思想及其初步應(yīng)用第二課時教學(xué)目標(biāo)知識與技能從相關(guān)指數(shù)和殘差分析角度探討回歸模型的擬合效果,以及建立回歸模型的基本步驟過程與方法在發(fā)現(xiàn)直接求回歸直線方程存在缺陷的基礎(chǔ)上,引導(dǎo)學(xué)生去發(fā)現(xiàn)解決問題的新思路-進行回歸分析,進而介紹殘差分析的方法和利用r2來表示解釋變量對于預(yù)報變量變化的貢獻率情感、態(tài)度與價值觀通過本節(jié)課的學(xué)習(xí),加強數(shù)學(xué)與現(xiàn)實生活的聯(lián)系,以科學(xué)的態(tài)度評價兩個變量的相關(guān)性,掌握處理問題的方法,形成嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度和鍥而不舍的求學(xué)精神培養(yǎng)學(xué)生運用所學(xué)知識解決實際問題的能力教學(xué)中適當(dāng)?shù)乩脤W(xué)生的合作與交流,使學(xué)生在學(xué)習(xí)的同時,體會與他人合作的重要性

2、重點難點教學(xué)重點:從殘差分析、相關(guān)指數(shù)角度探討回歸模型的擬合效果,以及建立回歸模型的基本步驟;教學(xué)難點:了解評價回歸效果的兩個統(tǒng)計量:相關(guān)指數(shù)、殘差和殘差平方和(幻燈片)編號12345678身高/cm165165157170175165155170體重/kg4857505464614359上表是上一節(jié)課我們從某大學(xué)選取8名女大學(xué)生其身高和體重數(shù)據(jù)組成的數(shù)據(jù)表,在上一節(jié)課中我們通過數(shù)據(jù)建立了回歸直線方程,并根據(jù)方程預(yù)測了身高為172 cm的女大學(xué)生的體重當(dāng)時,我們提到根據(jù)回歸直線方程求得的體重數(shù)據(jù),僅是一個估計值,其與真實值之間存在著誤差,為了綜合分析身高和體重的關(guān)系,我們引入了線性回歸模型yb

3、xae來表示兩變量之間的關(guān)系,其中e為隨機變量,又稱隨機誤差線性回歸模型ybxae增加了隨機誤差項e,因變量y的值由自變量x和隨機誤差e共同確定假設(shè)隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上但是,在圖中,數(shù)據(jù)點并沒有完全落在回歸直線上這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上“推”開了,即自變量x只能解釋部分y的變化同學(xué)們考慮一下,隨機變量e的均值是多少?方差又是多少?活動設(shè)計:學(xué)生思考回答問題學(xué)情預(yù)測:學(xué)生回答e(e)0,d(e)20.教師提問:能否通過d(e)來刻畫線性回歸模型的擬合程度?學(xué)情預(yù)測:隨機誤差e的方差越

4、小,通過回歸直線預(yù)報真實值y的精度越高隨機誤差是引起預(yù)報值與真實值y之間的誤差的原因之一,其大小取決于隨機誤差的方差設(shè)計意圖:說明研究隨機誤差e的必要性,通過研究隨機誤差e可以分析預(yù)報值的可信度提出問題:既然可以用隨機變量e的方差來衡量隨機誤差的大小,即通過方差2來刻畫預(yù)報變量(體重)的變化在多大程度上與隨機誤差有關(guān),那么如何獲得方差2呢?學(xué)生活動:學(xué)生獨立思考,小組合作交流討論活動結(jié)果:可以采用抽樣統(tǒng)計的思想,通過隨機變量e的樣本來估計2的大小設(shè)計目的:復(fù)習(xí)抽樣統(tǒng)計思想,以便通過隨機變量e的樣本來估計總體提出問題:既然e表示了除解釋變量以外其他各種影響預(yù)報值的因素帶來的誤差,那么如何獲得e的

5、樣本來計算2呢?學(xué)生活動:分組合作討論交流學(xué)情預(yù)測:由函數(shù)模型 x 和回歸模型ybxae可知ey ,這樣根據(jù)圖表中女大學(xué)生的身高求出預(yù)報值,再與真實值作差,即可求得e的一個估計值教師:由于在計算回歸直線方程時,利用公式求得的 和 為斜率和截距的估計值,它們與真實值a和b之間存在誤差,因此 是估計值,所以 y 也是一個估計值由上可知,對于樣本點(x1,y1),(x2,y2),,(xn,yn)而言,它們的隨機誤差為eiyibxia,i1,2,n,稱其估計值 iyi i為相應(yīng)于點(xi,yi)的殘差將所有殘差的平方加起來,即 ,這個和稱作殘差平方和類比樣本方差估計總體方差的思想,可以用 2 (yi

6、i)2(n2)作為2的估計量,通常, 2越小,預(yù)報精度越高這樣,當(dāng)我們求得回歸直線方程后,可以通過殘差來判斷模型擬合程度的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析設(shè)計目的:通過問題誘思,引入殘差概念提出問題:對照女大學(xué)生的身高和體重的原始數(shù)據(jù),結(jié)合求出的回歸直線方程,求出相應(yīng)的殘差數(shù)據(jù)學(xué)生活動:獨立完成活動結(jié)果:編號12345678身高( cm)165165157170175165155170體重( kg)4857505464614359殘差 6。3732。6272.4194。6181。1376.6272。8830.382提出問題:根據(jù)表格中的數(shù)據(jù),以樣本編號為橫坐標(biāo)

7、,殘差值為縱坐標(biāo),做出散點圖(這樣的散點圖稱作殘差圖)學(xué)生活動:分組合作,共同完成活動結(jié)果:殘差圖提出問題:觀察上面的殘差圖,你認(rèn)為哪幾個樣本點在采集時可能存在人為的錯誤?為什么?學(xué)生活動:分組討論活動結(jié)果:第一個和第六個樣本點在采集過程中可能存在錯誤,因為其他的樣本點基本都集中在一個區(qū)域內(nèi),只有這兩個樣本點的殘差比較大,相對其他樣本點來說,分布得較為分散提出問題:如何從殘差圖來判斷模型的擬合程度?學(xué)生活動:獨立思考也可相互討論活動結(jié)果:因為 2越小,預(yù)報精度越高,即模型的擬合程度越高,而 2越小, 的取值越集中,故若殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適,且?guī)顓^(qū)域的寬

8、度越窄,說明擬合精度越高,回歸直線的預(yù)報精度越高教師:在統(tǒng)計學(xué)上,人們經(jīng)常用相關(guān)指數(shù)r2來刻畫回歸的效果,其計算公式是:r21提出問題:分析上面計算相關(guān)指數(shù)r2的公式,如何根據(jù)r2來判斷模型的擬合效果?學(xué)生活動:獨立思考也可相互討論,教師加以適當(dāng)?shù)囊龑?dǎo)提示活動結(jié)果:因為對于確定的樣本數(shù)據(jù)而言,(yi)2是一個定值,故r2取值越大,意味著殘差平方和越小,也就是說模型的擬合效果越好提出問題:在線性回歸模型中,r2表示解釋變量對于預(yù)報變量變化的貢獻率,r2越接近1,表示回歸的效果越好,即解釋變量和預(yù)報變量的線性相關(guān)性越強,試計算關(guān)于女大學(xué)生身高與體重問題中的相關(guān)指數(shù)r2。學(xué)生活動:學(xué)生獨立計算獲得數(shù)

9、據(jù)活動結(jié)果:r20。64。根據(jù)r20。64就可得出“女大學(xué)生的身高解釋了64%的體重變化”,或者說“女大學(xué)生的體重差異有64是由身高引起的”由此就不難理解為什么預(yù)報體重和真實值之間有差距了設(shè)計目的:結(jié)合圖象,讓學(xué)生直觀感受殘差圖在刻畫回歸模型擬合效果方面的應(yīng)用,體會殘差分析和相關(guān)指數(shù)的意義提出問題:根據(jù)前面得到的回歸方程,能否預(yù)測一名美國女大學(xué)生的體重?建立回歸模型后能否一勞永逸,在若干年后還可以使用,或者適用于多年以前的女大學(xué)生體重預(yù)測?學(xué)生活動:討論交流總結(jié)發(fā)言活動結(jié)果:在使用回歸方程進行預(yù)報時要注意:(1)回歸方程只適用于我們所研究的樣本的總體;(2)我們建立的回歸方程一般都有時間性;(

10、3)樣本取值的范圍會影響回歸方程的適用范圍;(4)不能期望回歸方程得到的預(yù)報值就是預(yù)報變量的精確值提出問題:結(jié)合我們剛學(xué)習(xí)的概念,現(xiàn)在能否將建立回歸模型的步驟補充完整?學(xué)生活動:討論交流,合作完成活動結(jié)果:一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等)(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程)(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù)(5)得出結(jié)果后分析殘差圖是否有異常(如個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機

11、的規(guī)律性,等等)若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等設(shè)計意圖:設(shè)計問題,讓學(xué)生討論分析,得出使用回歸方程進行預(yù)報需注意的問題,并讓學(xué)生完善建立回歸模型的步驟在這個過程中,教師不宜做太多引導(dǎo),要放手給學(xué)生,讓學(xué)生討論,充分參與進來例1一個車間為了規(guī)定工時定額,需確定加工零件所花費的時間,為此進行了10次試驗,測得的數(shù)據(jù)如下:編號12345678910零件數(shù)x/個102030405060708090100加工時間y/分626875818995102108115122(1)建立零件數(shù)為解釋變量,加工時間為預(yù)報變量的回歸模型,并計算殘差;(2)你認(rèn)為這個模型能較好地刻畫零件數(shù)和加工時間的關(guān)

12、系嗎?分析:首先根據(jù)散點圖粗略判斷變量是否具有線性相關(guān)性,判斷是否可以用線性回歸模型來擬合數(shù)據(jù),然后通過殘差 1, 2, n來判斷模型擬合的效果,判斷原始數(shù)據(jù)是否存在可疑數(shù)據(jù)解:(1)根據(jù)表中數(shù)據(jù)作出散點圖如下:散點圖由散點圖可知變量之間具有線性相關(guān)關(guān)系,可以通過求線性回歸方程來擬合數(shù)據(jù)根據(jù)公式可求得加工時間對零件數(shù)的線性回歸方程為 0。668x54。96.殘差數(shù)據(jù)如下表:編號12345678910殘差 0。390.290。030。650。670.010.310.370.050。27(2)畫出殘差圖殘差圖由圖可知,殘差點分布較均勻,即用上述回歸模型擬合數(shù)據(jù)效果很好,但需注意,由殘差圖也可以看出

13、,第4個樣本點和第5個樣本點殘差較大,需要確認(rèn)在采集這兩個樣本點的過程中是否有人為的錯誤點評:由散點圖判斷兩個變量的線性相關(guān)關(guān)系,誤差較大,利用殘差圖可以較好地評價模型的擬合程度,并能發(fā)現(xiàn)樣本點中的可疑數(shù)據(jù)【變練演編】例2在一段時間內(nèi),某種商品的價格x(元)和需求量y(件)之間的一組數(shù)據(jù)為:價格x/元1416182022需求量y/件5650434137求出y對x的回歸方程,并說明擬合效果的好壞思路分析:先根據(jù)散點圖判斷兩個變量是否線性相關(guān),若相關(guān),求出回歸直線方程,然后通過相關(guān)指數(shù)的大小來評價擬合效果的好壞解:作出散點圖:從作出的散點圖可以看出,這些點在一條直線附近,可用線性回歸模型來擬合數(shù)據(jù)

14、由數(shù)據(jù)可得18,45。4,由計算公式得 2。35, 87。7.故y對x的回歸方程為 2.35x87。7,列表:yi i1。20.12.40。31yi10.64。62。44。48.4所以(yi i)28.3,(yi)2229。2。相關(guān)指數(shù)r210.946.因為0。964很接近1,所以該模型的擬合效果很好變式1:若要分析是否在上述樣本的采集過程中存在可疑數(shù)據(jù),應(yīng)如何分析?活動設(shè)計:學(xué)生分組討論,回顧課本解答問題活動成果:可以畫出殘差圖來進行分析變式2:既然利用殘差圖和相關(guān)指數(shù)都能夠評價回歸模型的擬合效果,能否總結(jié)一下兩種方法各自的特點?活動成果:利用殘差圖可以直觀展示擬合的效果,而且還可以發(fā)現(xiàn)樣本

15、數(shù)據(jù)中的可疑數(shù)據(jù);而相關(guān)指數(shù)是把對擬合效果的評價轉(zhuǎn)換為數(shù)值大小的判斷,易于量化處理,并能在數(shù)量上表現(xiàn)解釋變量對于預(yù)報變量變化的貢獻率設(shè)計意圖:進一步熟悉判斷擬合效果的方法以及各自的特點【達標(biāo)檢測】1分析下列殘差圖,所選用的回歸模型效果最好的是()abcd2下列說法正確的是()回歸直線方程適用于一切樣本和總體;回歸直線方程一般都有時間性;樣本的取值范圍會影響回歸直線方程的適用范圍;根據(jù)回歸直線方程得到的預(yù)測值是預(yù)測變量的精確值abcd3在研究氣溫和熱茶銷售杯數(shù)的關(guān)系時,若求得相關(guān)指數(shù)r2_,表明“氣溫解釋了85的熱茶銷售杯數(shù)變化”或者說“熱茶銷售杯數(shù)差異有85是由氣溫引起的”答案:1。d2.b3

16、.0。85。學(xué)生回顧本節(jié)課學(xué)習(xí)的內(nèi)容,嘗試總結(jié),然后不充分的地方由學(xué)生相互補充,最后在老師的引導(dǎo)下,用精煉的語言進行概括:1判斷變量是否線性相關(guān)的方法以及各自的特點;2在運用回歸模型時需注意的事項;3建立回歸模型的基本步驟設(shè)計意圖:讓學(xué)生自己小結(jié),這是一個多維整合的過程,是一個高層次的自我認(rèn)識過程【基礎(chǔ)練習(xí)】1有下列說法:在殘差圖中,殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適用相關(guān)指數(shù)r2來刻畫回歸的效果,r2值越接近于1,說明模型的擬合效果越好比較兩個模型的擬合效果,可以比較殘差平方和的大小,殘差平方和越小的模型,擬合效果越好正確的是()a b c d2甲、乙、丙、丁四位同

17、學(xué)各自對a,b兩變量做回歸分析,分別得到散點圖與殘差平方和(yi i)2如下表甲乙丙丁散點圖殘差平方和115106124103哪位同學(xué)的實驗結(jié)果體現(xiàn)擬合a,b兩變量關(guān)系的模型擬合精度高?()a甲 b乙 c丙 d丁3關(guān)于x與y有如下數(shù)據(jù):x24568y3040605070為了對x,y兩個變量進行統(tǒng)計分析,現(xiàn)有以下兩種線性模型:甲: 6。6x17。5,乙: 7x17。試比較哪一個模型擬合效果更好答案或提示:1。d2.d3解析:設(shè)甲模型的相關(guān)指數(shù)為r,則r110.845;設(shè)乙模型的相關(guān)指數(shù)為r,則可求得r0.82,因為rr,所以甲模型的擬合效果更好【拓展練習(xí)】4假設(shè)某種農(nóng)作物基本苗數(shù)x與有效穗數(shù)y之

18、間存在相關(guān)關(guān)系,今測得5組數(shù)據(jù)如下:x15.025。830。036.644。4y39.442.942.943.149.2(1)以x為解釋變量,y為預(yù)報變量,作出散點圖;(2)求y與x之間的回歸方程,對于基本苗數(shù)56.7預(yù)報有效穗數(shù)(3)計算各組殘差;(4)求r2,并說明隨機誤差對有效穗數(shù)的影響占百分之幾?解:(1)散點圖如圖:(2)由圖可以看出,樣本點呈條狀分布,有比較好的線性相關(guān)關(guān)系,因此可用線性回歸方程來建立兩個變量之間的關(guān)系設(shè)線性回歸方程為 x ,由數(shù)據(jù)可以求得: 0。291, 34.67。故所求的線性回歸方程為 0.291x34。67.當(dāng)x56。7時, 0.29156。734.6751

19、。169 7。估計有效穗數(shù)為51。169 7。(3)各組數(shù)據(jù)的殘差分別是 10。37, 20。72, 30。5, 42.22, 51。61。(4)殘差平方和:(yi i)28。425 8,又(yi)250。18,r2110。832.即解釋變量(農(nóng)作物基本苗數(shù))對有效穗數(shù)的影響約占了83。2%,所以隨機誤差對有效穗數(shù)的影響約占183.2%16。8%。本課時從上一節(jié)課的案例出發(fā),通過分析隨機誤差產(chǎn)生的原因,引入隨機變量、殘差、殘差平方和、相關(guān)指數(shù)的有關(guān)概念,從相關(guān)指數(shù)和殘差分析等角度探討回歸模型擬合的效果,并通過案例說明利用所建立的回歸模型進行預(yù)報時需要注意的問題,然后總結(jié)建立回歸模型的基本步驟在教學(xué)過程中以問題為引導(dǎo)思考的動機,注重對學(xué)生合作意識的培養(yǎng),通過對案例的分析,培養(yǎng)學(xué)生對數(shù)據(jù)的處理能力,讓學(xué)生初步了解回歸分析思想在實際生活中的運用有關(guān)總偏差平方和、回歸平方和、殘差平方和以及相關(guān)指數(shù)等概念的說明1總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論