




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
3.1回歸分析的基本思想及其初步應(yīng)用(第1課時(shí))一、教學(xué)內(nèi)容與教學(xué)對(duì)象分析學(xué)生將在必修課程學(xué)習(xí)統(tǒng)計(jì)的基礎(chǔ)上,通過對(duì)典型案例的討論,了解和使用一些常用的統(tǒng)計(jì)方法,進(jìn)一步體會(huì)運(yùn)用統(tǒng)計(jì)方法解決實(shí)際問題的基本思想,認(rèn)識(shí)統(tǒng)計(jì)方法在決策中的作用。二、學(xué)習(xí)目標(biāo)1、知識(shí)與技能通過本節(jié)的學(xué)習(xí),了解回歸分析的基本思想,會(huì)對(duì)兩個(gè)變量進(jìn)行回歸分析,明確建立回歸模型的基本步驟,并對(duì)具體問題進(jìn)行回歸分析,解決實(shí)際應(yīng)用問題。2、過程與方法本節(jié)的學(xué)習(xí),應(yīng)該讓學(xué)生通過實(shí)際問題去理解回歸分析的必要性,明確回歸分析的基本思想,從散點(diǎn)圖中點(diǎn)的分布上我們發(fā)現(xiàn)直接求回歸直線方程存在明顯的不足,從中引導(dǎo)學(xué)生去發(fā)現(xiàn)解決問題的新思路—進(jìn)行回歸分析,進(jìn)而介紹殘差分析的方法和利用R的平方來表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率,從中選擇較為合理的回歸方程,最后是建立回歸模型基本步驟。3、情感、態(tài)度與價(jià)值觀通過本節(jié)課的學(xué)習(xí),首先通過實(shí)際問題了解回歸分析的必要性和回歸分析的基本思想,明確回歸分析的基本方法和基本步驟,培養(yǎng)我們利用整體的觀點(diǎn)和互相聯(lián)系的觀點(diǎn),來分析問題,進(jìn)一步加強(qiáng)數(shù)學(xué)的應(yīng)用意識(shí),培養(yǎng)學(xué)生學(xué)好數(shù)學(xué)、用好數(shù)學(xué)的信心。加強(qiáng)與現(xiàn)實(shí)生活的聯(lián)系,以科學(xué)的態(tài)度評(píng)價(jià)兩個(gè)變量的相關(guān)系。培養(yǎng)學(xué)生運(yùn)用所學(xué)知識(shí),解決實(shí)際問題的能力。三、教學(xué)重點(diǎn)、難點(diǎn)教學(xué)重點(diǎn):熟練掌握回歸分析的步驟;各相關(guān)指數(shù)、建立回歸模型的步驟。教學(xué)難點(diǎn):求回歸系數(shù)a,b;相關(guān)指數(shù)的計(jì)算、殘差分析。四、教學(xué)策略:教學(xué)方法:誘思探究教學(xué)法學(xué)習(xí)方法:自主探究、觀察發(fā)現(xiàn)、合作交流、歸納總結(jié)。教學(xué)手段:多媒體輔助教學(xué)五、教學(xué)過程:(一)、復(fù)習(xí)引入:回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法。對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù):(),(),…,(),我們知道其回歸方程的截距和斜率的最小二乘估計(jì)公式分別為:(1)(2)其中,()成為樣本點(diǎn)的中心.回歸分析的基本步驟:(1)畫出兩個(gè)變量的散點(diǎn)圖.(2)求回歸直線方程.(3)用回歸直線方程進(jìn)行預(yù)報(bào).下面我們通過案例,進(jìn)一步學(xué)習(xí)回歸分析的基本思想及其應(yīng)用.舉例:例1.從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表編號(hào)12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據(jù)女大學(xué)生的身高預(yù)報(bào)體重的回歸方程,并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重.解:由于問題中要求根據(jù)身高預(yù)報(bào)體重,因此選取身高為自變量x,體重為因變量y.作散點(diǎn)圖(圖3.1一1)從圖3.1一1中可以看出,樣本點(diǎn)呈條狀分布,身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程來近似刻畫它們之間的關(guān)系.根據(jù)探究中的公式(1)和(2),可以得到.于是得到回歸方程.因此,對(duì)于身高172cm的女大學(xué)生,由回歸方程可以預(yù)報(bào)其體重為(kg).是斜率的估計(jì)值,說明身高x每增加1個(gè)單位時(shí),體重y就增加0.849位,這表明體重與身高具有正的線性相關(guān)關(guān)系.如何描述它們之間線性相關(guān)關(guān)系的強(qiáng)弱?在必修3中,我們介紹了用相關(guān)系數(shù);來衡量?jī)蓚€(gè)變量之間線性相關(guān)關(guān)系的方法.本相關(guān)系數(shù)的具體計(jì)算公式為當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對(duì)值接近于0時(shí),表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常,當(dāng)r的絕對(duì)值大于0.75時(shí)認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系.在本例中,可以計(jì)算出r=0.798.這表明體重與身高有很強(qiáng)的線性相關(guān)關(guān)系,從而也表明我們建立的回歸模型是有意義的.顯然,身高172cm的女大學(xué)生的體重不一定是60.316kg,但一般可以認(rèn)為她的體重接近于60.316kg.圖3.1一2中的樣本點(diǎn)和回歸直線的相互位置說明了這一點(diǎn).由于所有的樣本點(diǎn)不共線,而只是散布在某一條直線的附近,所以身高和體重的關(guān)系可用下面的線性回歸模型來表示:,(3)這里a和b為模型的未知參數(shù),e是y與之間的誤差.通常e為隨機(jī)變量,稱為隨機(jī)誤差,它的均值E(e)=0,方差D(e)=>0.這樣線性回歸模型的完整表達(dá)式為:(4)在線性回歸模型(4)中,隨機(jī)誤差e的方差越小,通過回歸直線(5)預(yù)報(bào)真實(shí)值y的精度越高.隨機(jī)誤差是引起預(yù)報(bào)值與真實(shí)值y之間的誤差的原因之一,大小取決于隨機(jī)誤差的方差.另一方面,由于公式(1)和(2)中和為截距和斜率的估計(jì)值,它們與真實(shí)值a和b之間也存在誤差,這種誤差是引起預(yù)報(bào)值與真實(shí)值y之間誤差的另一個(gè)原因.思考:產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么?一個(gè)人的體重值除了受身高的影響外,還受許多其他因素的影響。例如飲食習(xí)慣、是否喜歡運(yùn)動(dòng)、度量誤差等。事實(shí)上,我們無法知道身高和體重之間的確切關(guān)系是什么,這里只是利用線性回歸方程來近似這種關(guān)系。這種近似以及上面提到的影響因素都是產(chǎn)生隨機(jī)誤差e的原因。因?yàn)殡S機(jī)誤差是隨機(jī)變量,所以可以通過這個(gè)隨機(jī)變量的數(shù)字特征來刻畫它的一些總體特征。均值是反映隨機(jī)變量取值平均水平的數(shù)字特征,方差是反映隨機(jī)變量集中于均值程度的數(shù)字特征,而隨機(jī)誤差的均值為0,因此可以用方差來衡量隨機(jī)誤差的大小。為了衡量預(yù)報(bào)的精度,需要估計(jì)e的值。一個(gè)自然的想法是通過樣本方差來估計(jì)總體方差。如何得到隨機(jī)變量的樣本呢?由于模型(3)或(4)中的隱含在預(yù)報(bào)變量y中,我們無法精確地把它從y中分離出來,因此也就無法得到隨機(jī)變量的樣本。解決問題的途徑是通過樣本的估計(jì)值來估計(jì)。根據(jù)截距和斜率的估計(jì)公式(1)和(2),可以建立回歸方程,因此是(5)中的估計(jì)量.由于隨機(jī)誤差,所以是的估計(jì)量.對(duì)于樣本點(diǎn)(),(),…,()而言,相應(yīng)于它們的隨機(jī)誤差為,其估計(jì)值為,稱為相應(yīng)于點(diǎn)的殘差(residual).類比樣本方差估計(jì)總體方差的思想,可以用作為的估計(jì)量,其中和由公式(1)(2)給出,Q(,)稱為殘差平方和(residualsumofsquares).可以用衡量回歸方程的預(yù)報(bào)精度.通常,越小,預(yù)報(bào)精度越高.在研究?jī)蓚€(gè)變量間的關(guān)系時(shí),首先要根據(jù)散點(diǎn)圖來粗略判斷它們是否線性相關(guān),是否可以用線性回歸模型來擬合數(shù)據(jù).然后,可以通過殘差來判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù).這方面的分析工作稱為殘差分析.表3一2列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù).編號(hào)12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382我們可以利用圖形來分析殘差特性作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重的估計(jì)值等,這樣作出的圖形稱為殘差圖.圖3.1一3是以樣本編號(hào)為橫坐標(biāo)的殘差圖.從圖3.1一3中可以看出,第1個(gè)樣本點(diǎn)和第6個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這兩個(gè)樣本點(diǎn)的過程中是否有人為的錯(cuò)誤.如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒有錯(cuò)誤,則需要尋找其他的原因.另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高.另外,我們還可以用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:顯然,取值越大,意味著殘差平方和越小,也就是說模型的擬合效果越好.在線性回歸模型中,表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率.越接近于1,表示回歸的效果越好(因?yàn)樵浇咏?,表示解釋變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng)).如果對(duì)某組數(shù)據(jù)可能采取幾種不同的回歸方程進(jìn)行回歸分析,也可以通過比較幾個(gè),選擇大的模型作為這組數(shù)據(jù)的模型.在例1中,=0.64,表明“女大學(xué)生的身高解釋了64%的體重變化”,或者說“女大學(xué)生的體重差異有64%是由身高引起的”.用身高預(yù)報(bào)體重時(shí),需要注意下列問題:1.回歸方程只適用于我們所研究的樣本的總體.例如,不能用女大學(xué)生的身高和體重之間的回歸方程,描述女運(yùn)動(dòng)員的身高和體重之間的關(guān)系.同樣,不能用生長(zhǎng)在南方多雨地區(qū)的樹木的高與直徑之間的回歸方程,描述北方干旱地區(qū)的樹木的高與直徑之間的關(guān)系.2.我們所建立的回歸方程一般都有時(shí)間性.例如,不能用20世紀(jì)80年代的身高體重?cái)?shù)據(jù)所建立的回歸方程,描述現(xiàn)在的身高和體重之間的關(guān)系.3.樣本取值的范圍會(huì)影響回歸方程的適用范圍.例如,我們的回歸方程是由女大學(xué)生身高和體重?cái)?shù)據(jù)建立的,那么用它來描述一個(gè)人幼兒時(shí)期的身高和體重之間的關(guān)系就不恰當(dāng)(即在回歸方程中,解釋變量x的樣本的取值范圍為[155cm,170cm〕,而用這個(gè)方程計(jì)算x-70cm時(shí)的y值,顯然不合適.)4.不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值.事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值.一般地,建立回歸模型的基本步驟為:(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等);(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程y=bx+a);(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法);(5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.3、從上節(jié)課的例1提出的問題引入線性回歸模型:Y=bx+a+e解釋變量x預(yù)報(bào)變量y隨機(jī)誤差e4、(1)相關(guān)指數(shù):相關(guān)系數(shù)r(公式),r>0正相關(guān).R<0負(fù)相關(guān)R絕對(duì)值接近于1相關(guān)性強(qiáng)接r絕對(duì)值近于0相關(guān)性幾乎無5、回憶建立模型的基本步驟①例2問題背景分析畫散點(diǎn)圖。②觀察散點(diǎn)圖,分析解釋變量與預(yù)報(bào)變量更可能是什么函數(shù)關(guān)系。③學(xué)生討論后建立自己的模型④引導(dǎo)學(xué)生探究如果不是線性回歸模型如何估計(jì)參數(shù)。能否利用回歸模型通過探究體會(huì)有些不是線性的模型通過變換可以轉(zhuǎn)化為線性模型⑤對(duì)數(shù)據(jù)進(jìn)行變換后,對(duì)數(shù)據(jù)(新)建立線性模型⑥轉(zhuǎn)化為原來的變量模型,并通過計(jì)算相關(guān)指數(shù)比較幾個(gè)不同模型的擬合效果⑦總結(jié)建模的思想。鼓勵(lì)學(xué)生大膽創(chuàng)新。⑧布置課后作業(yè):習(xí)題1.11、6、復(fù)習(xí)與鞏固:練習(xí)1:某班5名學(xué)生的數(shù)學(xué)和化學(xué)成績(jī)?nèi)缦卤硭荆瑢?duì)x與y進(jìn)行回歸分析,并預(yù)報(bào)某學(xué)生數(shù)學(xué)成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)房急診剖宮產(chǎn)管理制度
- 景區(qū)商鋪?zhàn)赓U管理制度
- 服裝企業(yè)崗位管理制度
- 分公司規(guī)范經(jīng)營(yíng)管理制度
- 公司照明燈節(jié)能管理制度
- 日常學(xué)校安全管理制度
- 施工重大危險(xiǎn)管理制度
- 電力公司辦公室管理制度
- 分公司財(cái)務(wù)收支管理制度
- 旅游商鋪安全管理制度
- 電子信息工程技術(shù)基礎(chǔ)知識(shí)單選題100道及答案
- 防火封堵工程專項(xiàng)施工方案(精選二篇)
- 肥皂泡(第二課時(shí))教學(xué)設(shè)計(jì)及反思
- 安全生產(chǎn)工貿(mào)行業(yè)企業(yè)崗位安全生產(chǎn)責(zé)任清單
- 醫(yī)療美容病歷范本(試行)(適用于民營(yíng)醫(yī)療美容機(jī)構(gòu))
- 工業(yè)純鈦的耐化學(xué)腐蝕數(shù)據(jù)表
- 110kv油浸電力變壓器基礎(chǔ)知識(shí)介紹
- 期權(quán)基礎(chǔ)知識(shí)2——期權(quán)價(jià)格及影響因素
- 青少版新概念英語1A單詞表
- 14銀行業(yè)金融機(jī)構(gòu)從業(yè)人員處罰信息管理辦法
- 腫瘤標(biāo)志物及其臨床意義
評(píng)論
0/150
提交評(píng)論