人教版高中數(shù)學(xué)選修2-3回歸分析的基本思想及其初步應(yīng)用教案(共14頁(yè))_第1頁(yè)
人教版高中數(shù)學(xué)選修2-3回歸分析的基本思想及其初步應(yīng)用教案(共14頁(yè))_第2頁(yè)
人教版高中數(shù)學(xué)選修2-3回歸分析的基本思想及其初步應(yīng)用教案(共14頁(yè))_第3頁(yè)
人教版高中數(shù)學(xué)選修2-3回歸分析的基本思想及其初步應(yīng)用教案(共14頁(yè))_第4頁(yè)
人教版高中數(shù)學(xué)選修2-3回歸分析的基本思想及其初步應(yīng)用教案(共14頁(yè))_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上31回歸分析的基本思想及其初步應(yīng)用(共計(jì)4課時(shí))一、教學(xué)內(nèi)容與教學(xué)對(duì)象分析學(xué)生將在必修課程學(xué)習(xí)統(tǒng)計(jì)的基礎(chǔ)上,通過(guò)對(duì)典型案例的討論,了解和使用一些常用的統(tǒng)計(jì)方法,進(jìn)一步體會(huì)運(yùn)用統(tǒng)計(jì)方法解決實(shí)際問(wèn)題的基本思想,認(rèn)識(shí)統(tǒng)計(jì)方法在決策中的作用。二、學(xué)習(xí)目標(biāo)1、知識(shí)與技能通過(guò)本節(jié)的學(xué)習(xí),了解回歸分析的基本思想,會(huì)對(duì)兩個(gè)變量進(jìn)行回歸分析,明確建立回歸模型的基本步驟,并對(duì)具體問(wèn)題進(jìn)行回歸分析,解決實(shí)際應(yīng)用問(wèn)題。2、過(guò)程與方法本節(jié)的學(xué)習(xí),應(yīng)該讓學(xué)生通過(guò)實(shí)際問(wèn)題去理解回歸分析的必要性,明確回歸分析的基本思想,從散點(diǎn)圖中點(diǎn)的分布上我們發(fā)現(xiàn)直接求回歸直線方程存在明顯的不足,從中引導(dǎo)學(xué)生去發(fā)現(xiàn)

2、解決問(wèn)題的新思路進(jìn)行回歸分析,進(jìn)而介紹殘差分析的方法和利用R的平方來(lái)表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率,從中選擇較為合理的回歸方程,最后是建立回歸模型基本步驟。3、情感、態(tài)度與價(jià)值觀通過(guò)本節(jié)課的學(xué)習(xí),首先讓顯示了解回歸分析的必要性和回歸分析的基本思想,明確回歸分析的基本方法和基本步驟,培養(yǎng)我們利用整體的觀點(diǎn)和互相聯(lián)系的觀點(diǎn),來(lái)分析問(wèn)題,進(jìn)一步加強(qiáng)數(shù)學(xué)的應(yīng)用意識(shí),培養(yǎng)學(xué)生學(xué)好數(shù)學(xué)、用好數(shù)學(xué)的信心。加強(qiáng)與現(xiàn)實(shí)生活的聯(lián)系,以科學(xué)的態(tài)度評(píng)價(jià)兩個(gè)變量的相關(guān)系。教學(xué)中適當(dāng)?shù)卦黾訉W(xué)生合作與交流的機(jī)會(huì),多從實(shí)際生活中找出例子,使學(xué)生在學(xué)習(xí)的同時(shí)。體會(huì)與他人合作的重要性,理解處理問(wèn)題的方法與結(jié)論的聯(lián)系,形成實(shí)

3、事求是的嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度和鍥而不舍的求學(xué)精神。培養(yǎng)學(xué)生運(yùn)用所學(xué)知識(shí),解決實(shí)際問(wèn)題的能力。三、教學(xué)重點(diǎn)、難點(diǎn)教學(xué)重點(diǎn):熟練掌握回歸分析的步驟;各相關(guān)指數(shù)、建立回歸模型的步驟;通過(guò)探究使學(xué)生體會(huì)有些非線性模型通過(guò)變換可以轉(zhuǎn)化為線性回歸模型,了解在解決實(shí)際問(wèn)題的過(guò)程中尋找更好的模型的方法。教學(xué)難點(diǎn):求回歸系數(shù) a , b ;相關(guān)指數(shù)的計(jì)算、殘差分析;了解常用函數(shù)的圖象特點(diǎn),選擇不同的模型建模,并通過(guò)比較相關(guān)指數(shù)對(duì)不同的模型進(jìn)行比較。四、教學(xué)策略:教學(xué)方法:誘思探究教學(xué)法 學(xué)習(xí)方法:自主探究、觀察發(fā)現(xiàn)、合作交流、歸納總結(jié)。教學(xué)手段:多媒體輔助教學(xué)五、教學(xué)過(guò)程:(一)、復(fù)習(xí)引入:回歸分析是對(duì)具有相關(guān)關(guān)系的

4、兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法。(二)、新課:探究:對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù):() , () , (), 我們知道其回歸方程的截距和斜率的最小二乘估計(jì)公式分別為: (1) (2)其中,()成為樣本點(diǎn)的中心.注:回歸直線過(guò)樣本中心.你能推導(dǎo)出這兩個(gè)計(jì)算公式嗎? 從我們已經(jīng)學(xué)過(guò)的知識(shí)知道,截距和斜率分別是使 取到最小值時(shí)的值. 由于 注意到. 在上式中,后兩項(xiàng)和無(wú)關(guān),而前兩項(xiàng)為非負(fù)數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)前兩項(xiàng)的值均為0,即有這正是我們所要推導(dǎo)的公式下面我們從另一個(gè)角度來(lái)推導(dǎo)的公式人教A版選修2-2P37習(xí)題1.4A組第4題:用測(cè)量工具測(cè)量某物體的長(zhǎng)度,由于工具的精度以及測(cè)量技

5、術(shù)的原因,測(cè)得n個(gè)數(shù)據(jù) .證明:用這個(gè)數(shù)據(jù)的平均值 表示這個(gè)物體的長(zhǎng)度,能使這n個(gè)數(shù)據(jù)的方差最小思考:這個(gè)結(jié)果說(shuō)明了什么?通過(guò)這個(gè)問(wèn)題,你能說(shuō)明最小二乘法的基本原理嗎?證明:由于,所以,令, 得??梢缘玫?, 是函數(shù)的極小值點(diǎn),也是最小值點(diǎn)這個(gè)結(jié)果說(shuō)明,用n個(gè)數(shù)據(jù)的平均值表示這個(gè)物體的長(zhǎng)度是合理的,這就是最小二乘法的基本原理由最小二乘法的基本原理即得 定理 設(shè),則 (*)當(dāng)且僅當(dāng)時(shí)取等號(hào). (*)式說(shuō)明, 是任何一個(gè)實(shí)數(shù)與的差的平方的平均數(shù)中最小的數(shù).從而說(shuō)明了方差具有最小性,也即定義標(biāo)準(zhǔn)差的合理性.下面借助(*)式求的最小值.,由(*)式知, 當(dāng)且僅當(dāng),且時(shí), 達(dá)到最小值.由此得到,其中是回歸

6、直線的斜率,是截距.借助和配方法,我們給出了人教A版必修3的第二章統(tǒng)計(jì)第三節(jié)變量間的相關(guān)關(guān)系中回歸直線方程的一個(gè)合理的解釋.1、回歸分析的基本步驟:(1) 畫(huà)出兩個(gè)變量的散點(diǎn)圖. (2) 求回歸直線方程.(3) 用回歸直線方程進(jìn)行預(yù)報(bào).下面我們通過(guò)案例,進(jìn)一步學(xué)習(xí)回歸分析的基本思想及其應(yīng)用2、舉例:例1. 從某大學(xué)中隨機(jī)選取 8 名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如表 編號(hào)12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據(jù)女大學(xué)生的身高預(yù)報(bào)體重的回歸方程,并預(yù)報(bào)一名身高為 172 cm 的女大學(xué)生的體重解:由于問(wèn)題中要求根據(jù)身高

7、預(yù)報(bào)體重,因此選取身高為自變量 x ,體重為因變量 y .作散點(diǎn)圖(圖3 . 1 一 1)從圖3. 1一1 中可以看出,樣本點(diǎn)呈條狀分布,身高和體重有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程來(lái)近似刻畫(huà)它們之間的關(guān)系根據(jù)探究中的公式(1)和(2 ) ,可以得到. 于是得到回歸方程.因此,對(duì)于身高172 cm 的女大學(xué)生,由回歸方程可以預(yù)報(bào)其體重為 ( kg ) . 是斜率的估計(jì)值,說(shuō)明身高 x 每增加1個(gè)單位時(shí),體重y就增加0.849 位,這表明體重與身高具有正的線性相關(guān)關(guān)系如何描述它們之間線性相關(guān)關(guān)系的強(qiáng)弱?在必修 3 中,我們介紹了用相關(guān)系數(shù);來(lái)衡量?jī)蓚€(gè)變量之間線性相關(guān)關(guān)系的方法本相關(guān)系

8、數(shù)的具體計(jì)算公式為當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān)r的絕對(duì)值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對(duì)值接近于0時(shí),表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系通常,當(dāng)r的絕對(duì)值大于0. 75 時(shí)認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系在本例中,可以計(jì)算出r =0. 798這表明體重與身高有很強(qiáng)的線性相關(guān)關(guān)系,從而也表明我們建立的回歸模型是有意義的顯然,身高172cm 的女大學(xué)生的體重不一定是60. 316 kg,但一般可以認(rèn)為她的體重接近于60 . 316 kg .圖3 . 1 一 2 中的樣本點(diǎn)和回歸直線的相互位置說(shuō)明了這一點(diǎn)由于所有的樣本點(diǎn)不共線,而只是

9、散布在某一條直線的附近,所以身高和體重的關(guān)系可用下面的線性回歸模型來(lái)表示: , ( 3 ) 這里 a 和 b 為模型的未知參數(shù),e是 y 與之間的誤差通常e為隨機(jī)變量,稱為隨機(jī)誤差,它的均值 E (e)=0,方差D(e)=0 這樣線性回歸模型的完整表達(dá)式為: (4)在線性回歸模型(4)中,隨機(jī)誤差e的方差護(hù)越小,通過(guò)回歸直線 (5)預(yù)報(bào)真實(shí)值y的精度越高隨機(jī)誤差是引起預(yù)報(bào)值與真實(shí)值 y 之間的誤差的原因之一,大小取決于隨機(jī)誤差的方差.另一方面,由于公式(1)和(2)中 和為截距和斜率的估計(jì)值,它們與真實(shí)值a和b之間也存在誤差,這種誤差是引起預(yù)報(bào)值與真實(shí)值y之間誤差的另一個(gè)原因思考:產(chǎn)生隨機(jī)誤差

10、項(xiàng)e的原因是什么?一個(gè)人的體重值除了受身高的影響外,還受許多其他因素的影響例如飲食習(xí)慣、是否喜歡運(yùn)動(dòng)、度量誤差等事實(shí)上,我們無(wú)法知道身高和體重之間的確切關(guān)系是什么,這里只是利用線性回歸方程來(lái)近似這種關(guān)系這種近似以及上面提到的影響因素都是產(chǎn)生隨機(jī)誤差 e 的原因因?yàn)殡S機(jī)誤差是隨機(jī)變量,所以可以通過(guò)這個(gè)隨機(jī)變量的數(shù)字特征來(lái)刻畫(huà)它的一些總體特征均值是反映隨機(jī)變量取值平均水平的數(shù)字特征,方差是反映隨機(jī)變量集中于均值程度的數(shù)字特征,而隨機(jī)誤差的均值為0,因此可以用方差來(lái)衡量隨機(jī)誤差的大小為了衡量預(yù)報(bào)的精度,需要估計(jì)護(hù)的值一個(gè)自然的想法是通過(guò)樣本方差來(lái)估計(jì)總體方差如何得到隨機(jī)變量的樣本呢?由于模型(3)或

11、(4)中的隱含在預(yù)報(bào)變量 y 中,我們無(wú)法精確地把它從 y 中分離出來(lái),因此也就無(wú)法得到隨機(jī)變量的樣本解決問(wèn)題的途徑是通過(guò)樣本的估計(jì)值來(lái)估計(jì)根據(jù)截距和斜率的估計(jì)公式(1)和(2 ) , 可以建立回歸方程,因此是(5)中的估計(jì)量由于隨機(jī)誤差,所以是的估計(jì)量對(duì)于樣本點(diǎn)() , () , ()而言,相應(yīng)于它們的隨機(jī)誤差為,其估計(jì)值為,稱為相應(yīng)于點(diǎn)的殘差(residual )類比樣本方差估計(jì)總體方差的思想,可以用 作為的估計(jì)量, 其中和由公式(1) (2)給出,Q( ,)稱為殘差平方和(residual sum of squares )可以用衡量回歸方程的預(yù)報(bào)精度通常,越小,預(yù)報(bào)精度越高在研究?jī)蓚€(gè)變量

12、間的關(guān)系時(shí),首先要根據(jù)散點(diǎn)圖來(lái)粗略判斷它們是否線性相關(guān),是否可以用線性回歸模型來(lái)擬合數(shù)據(jù)然后,可以通過(guò)殘差來(lái)判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)這方面的分析工作稱為殘差分析表3一 2 列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)編號(hào)12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382我們可以利用圖形來(lái)分析殘差特性作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重的估計(jì)值等,這樣作出的圖形稱為殘差圖圖 3 .

13、1 一 3 是以樣本編號(hào)為橫坐標(biāo)的殘差圖從圖3 . 1 一 3 中可以看出,第 1 個(gè)樣本點(diǎn)和第 6 個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這兩個(gè)樣本點(diǎn)的過(guò)程中是否有人為的錯(cuò)誤如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒(méi)有錯(cuò)誤,則需要尋找其他的原因另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高另外,我們還可以用相關(guān)指數(shù)來(lái)刻畫(huà)回歸的效果,其計(jì)算公式是:顯然,取值越大,意味著殘差平方和越小,也就是說(shuō)模型的擬合效果越好在線性回歸模型中,表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率

14、越接近于1,表示回歸的效果越好(因?yàn)樵浇咏?,表示解釋變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng))如果對(duì)某組數(shù)據(jù)可能采取幾種不同的回歸方程進(jìn)行回歸分析,也可以通過(guò)比較幾個(gè),選擇大的模型作為這組數(shù)據(jù)的模型在例 1 中,=0. 64 ,表明“女大學(xué)生的身高解釋了64 的體重變化”,或者說(shuō)“女大學(xué)生的體重差異有 64 是由身高引起的”.用身高預(yù)報(bào)體重時(shí),需要注意下列問(wèn)題: 1回歸方程只適用于我們所研究的樣本的總體例如,不能用女大學(xué)生的身高和體重之間的回歸方程,描述女運(yùn)動(dòng)員的身高和體重之間的關(guān)系同樣,不能用生長(zhǎng)在南方多雨地區(qū)的樹(shù)木的高與直徑之間的回歸方程,描述北方干旱地區(qū)的樹(shù)木的高與直徑之間的關(guān)系 2我們所建立

15、的回歸方程一般都有時(shí)間性例如,不能用 20 世紀(jì) 80 年代的身高體重?cái)?shù)據(jù)所建立的回歸方程,描述現(xiàn)在的身高和體重之間的關(guān)系 3樣本取值的范圍會(huì)影響回歸方程的適用范圍例如,我們的回歸方程是由女大學(xué)生身高和體重?cái)?shù)據(jù)建立的,那么用它來(lái)描述一個(gè)人幼兒時(shí)期的身高和體重之間的關(guān)系就不恰當(dāng)(即在回歸方程中,解釋變量 x 的樣本的取值范圍為155cm,170cm ,而用這個(gè)方程計(jì)算 x-70cm 時(shí)的y值,顯然不合適) 4不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值一般地,建立回歸模型的基本步驟為: (1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量; (

16、2)畫(huà)出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等) ; (3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程 y=bx+a ) ; (4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法); (5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等例2.現(xiàn)收集了一只紅鈴蟲(chóng)的產(chǎn)卵數(shù)y和溫度x之間的7組觀測(cè)數(shù)據(jù)列于下表:溫度xoC21232527293235產(chǎn)卵數(shù)y/個(gè)711212466115325(1)試建立y與x之間的回歸方程;并預(yù)測(cè)溫度為28oC時(shí)產(chǎn)卵

17、數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化?探究:方案1(學(xué)生實(shí)施):(1)選擇變量,畫(huà)散點(diǎn)圖。(2)通過(guò)計(jì)算器求得線性回歸方程:=19.87x-463.73(3)進(jìn)行回歸分析和預(yù)測(cè):R2=r20.8642=0.7464預(yù)測(cè)當(dāng)氣溫為28 時(shí),產(chǎn)卵數(shù)為92個(gè)。這個(gè)線性回歸模型中溫度解釋了74.64%產(chǎn)卵數(shù)的變化。困惑:隨著自變量的增加,因變量也隨之增加,氣溫為28 時(shí),估計(jì)產(chǎn)卵數(shù)應(yīng)該低于66個(gè),但是從推算的結(jié)果來(lái)看92個(gè)比66個(gè)卻多了26個(gè),是什么原因造成的呢?方案2:(1)找到變量t=x 2,將y=bx2+a轉(zhuǎn)化成y=bt+a;(2)利用計(jì)算器計(jì)算出y和t的線性回歸方程:y

18、=0.367t-202.54(3)轉(zhuǎn)換回y和x的模型: (4)y=0.367x2 -202.54(5)計(jì)算相關(guān)指數(shù)R20.802這個(gè)回歸模型中溫度解釋了80.2%產(chǎn)卵數(shù)的變化。預(yù)測(cè):當(dāng)氣溫為28 時(shí),產(chǎn)卵數(shù)為85個(gè)。困惑:比66還多19個(gè),是否還有更適合的模型呢?方案3: (1)作變換z=lgy,將轉(zhuǎn)化成z=c2x+lgc1(線性模型)。 (2)利用計(jì)算器計(jì)算出z和x的線性回歸方程: z=0.118x-1.672 (3)轉(zhuǎn)換回y和x的模型: (4)計(jì)算相關(guān)指數(shù)R20.985這個(gè)回歸模型中溫度解釋了98.5%產(chǎn)卵數(shù)的變化。預(yù)測(cè):當(dāng)氣溫為28 時(shí),產(chǎn)卵數(shù)為4 2個(gè)。解:根據(jù)收集的數(shù)據(jù)作散點(diǎn)圖(圖3

19、. 1一4 ) .在散點(diǎn)圖中,樣本點(diǎn)并沒(méi)有分布在某個(gè)帶狀區(qū)域內(nèi),因此兩個(gè)變量不呈線性相關(guān)關(guān)系,所以不能直接利用線性回歸方程來(lái)建立兩個(gè)變量之間的關(guān)系根據(jù)已有的函數(shù)知識(shí),可以發(fā)現(xiàn)樣本點(diǎn)分布在某一條指數(shù)函數(shù)曲線的周?chē)?,其中和是待定參?shù)現(xiàn)在,問(wèn)題變?yōu)槿绾喂烙?jì)待定參數(shù)和我們可以通過(guò)對(duì)數(shù)變換把指數(shù)關(guān)系變?yōu)榫€性關(guān)系令,則變換后樣本點(diǎn)應(yīng)該分布在直線的周?chē)@樣,就可以利用線性回歸模型來(lái)建立 y 和 x 之間的非線性回歸方程了由表3一3 的數(shù)據(jù)可以得到變換后的樣本數(shù)據(jù)表 3一4 ,圖3.1一5 給出了表 3 一 4 中數(shù)據(jù)的散點(diǎn)圖從圖3.1一5 中可以看出,變換后的樣本點(diǎn)分布在一條直線的附近,因此可以用線性回歸方

20、程來(lái)擬合x(chóng)21232527293235z1.9463.3983.0453.1784.1904.7455.784由表 3 一 4 中的數(shù)據(jù)得到線性回歸方程.因此紅鈴蟲(chóng)的產(chǎn)卵數(shù)對(duì)溫度的非線性回歸方程為. ( 6 ) 另一方面,可以認(rèn)為圖3. 1一4 中樣本點(diǎn)集中在某二次曲線的附近,其中和為待定參數(shù)因此可以對(duì)溫度變量做變換,即令,然后建立y與t之間的線性回歸方程,從而得到y(tǒng)與x之間的非線性回歸方程表3一5 是紅鈴蟲(chóng)的產(chǎn)卵數(shù)和對(duì)應(yīng)的溫度的平方,圖3 . 1一6 是相應(yīng)的散點(diǎn)圖t44152962572984110241225x711212466115325從圖3.1一6 中可以看出,y與t的散點(diǎn)圖并不分

21、布在一條直線的周?chē)?,因此不宜用線性回歸方程來(lái)擬合它,即不宜用二次曲線來(lái)擬合 y 和 x 之間的關(guān)系這個(gè)結(jié)論還可以通過(guò)殘差分析得到,下面介紹具體方法為比較兩個(gè)不同模型的殘差,需要建立兩個(gè)相應(yīng)的回歸方程前面我們已經(jīng)建立了y關(guān)于x 的指數(shù)回歸方程,下面建立y關(guān)于x的二次回歸方程用線性回歸模型擬合表 3 一 5 中的數(shù)據(jù),得到 y 關(guān)于 t 的線性回歸方程, 即 y 關(guān)于 x 的二次回歸方程為 . ( 7 ) 可以通過(guò)殘差來(lái)比較兩個(gè)回歸方程( 6 )和( 7 )的擬合效果用 xi表示表3一3 中第 1 行第 i 列的數(shù)據(jù),則回歸方程( 6 )和( 7 )的殘差計(jì)算公式分別為 ;.表3一6 給出了原始數(shù)

22、據(jù)及相應(yīng)的兩個(gè)回歸方程的殘差從表中的數(shù)據(jù)可以看出模型 ( 6 )的殘差的絕對(duì)值顯然比模型( 7 )的殘差的絕對(duì)值小,因此模型( 6 )的擬合效果比模型( 7 ) 的擬合效果好x21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.1.4-58.26577.968在一般情況下,比較兩個(gè)模型的殘差比較困難原因是在某些樣本點(diǎn)上一個(gè)模型的殘差的絕對(duì)值比另一個(gè)模型的小,而另一些樣本點(diǎn)的情況則相反這時(shí)可以通過(guò)比較兩個(gè)模型的殘差平方和的大小來(lái)判斷模型的擬合效果殘差平

23、方和越小的模型,擬合的效果越好由表 3 一 6 容易算出模型( 6 )和( 7 )的殘差平方和分別為 . 因此模型(6)的擬合效果遠(yuǎn)遠(yuǎn)優(yōu)于模型(7). 類似地,還可以用尸來(lái)比較兩個(gè)模型的擬合效果,R2越大,擬合的效果越好由表 3 一 6 容易算出模型(6)和(7)的R2分別約為 0 . 98 和 0 . 80 ,因此模型( 6 )的效果好于模型(7) 的效果對(duì)于給定的樣本點(diǎn)() , () , (),兩個(gè)含有未知參數(shù)的模型和, 其中 a 和 b 都是未知參數(shù)可以按如下的步驟來(lái)比較它們的擬合效果: (1)分別建立對(duì)應(yīng)于兩個(gè)模型的回歸方程與, ,其中和分別是參數(shù)a和b的估計(jì)值; (2)分別計(jì)算兩個(gè)回歸方程的殘差平方和與;( s )若,則的效果比的好;反之,的效果不如的好例2:(提示后做練習(xí)、作業(yè))研究某灌溉渠道水的流速y與水深x之間的關(guān)系,測(cè)得一組數(shù)據(jù)如下:水深xm1.401.501.601.701.801.902.002.10流速ym/s1.701.791.881.952.032.102.162.21(1)求y對(duì)x的回歸直線方程;(2)預(yù)測(cè)水深為1。95m 時(shí)水的流速是多少?解:依題意,把溫度作為解釋變量x ,產(chǎn)卵個(gè)數(shù)y作為預(yù)報(bào)變量 , 作散點(diǎn)圖,由觀察知兩個(gè)變量不呈線性相關(guān)關(guān)系。但樣本點(diǎn)分布在某一條指數(shù)函數(shù) y=c1ec2 x 周?chē)?令 z=lny , a=l

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論