1.2回歸分析 (2)_第1頁(yè)
1.2回歸分析 (2)_第2頁(yè)
1.2回歸分析 (2)_第3頁(yè)
1.2回歸分析 (2)_第4頁(yè)
1.2回歸分析 (2)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1.1 回歸分析的基本思想 及其初步應(yīng)用溫故知新我們通過(guò)一個(gè)微視頻來(lái)回憶一下必修三中回歸分析的相關(guān)內(nèi)容.所以回歸方程是所以,對(duì)于身高為172cm的女大學(xué)生,由回歸方程可以預(yù)報(bào)其體重為 問(wèn)題1身高為172cm的女大學(xué)生的體重一定是60.316kg嗎?如果不是,這是由什么原因引起的呢?解:回歸直線 從散點(diǎn)圖還看到,樣本點(diǎn)散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a簡(jiǎn)單描述它們關(guān)系。 我們可以用下面的線性回歸模型來(lái)表示:y=bx+a+e,其中a和b為模型的未知參數(shù),e稱為隨機(jī)誤差.產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么?問(wèn)題2:產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么?隨機(jī)誤差e的來(lái)源(可以

2、推廣到一般):1、其它因素的影響:影響體重 y 的因素不只是身高 x,可能還包括遺傳基因、飲食習(xí)慣、生長(zhǎng)環(huán)境等因素;2、用線性回歸模型近似真實(shí)模型所引起的誤差;3、身高 x的觀測(cè)誤差. 線性回歸模型y=bx+a+e增加了隨機(jī)誤差項(xiàng)e,因變量y的值由自變量x和隨機(jī)誤差項(xiàng)e共同確定,即自變量x只能解析部分y的變化. 在統(tǒng)計(jì)中,我們也把自變量x稱為解析變量,因變量y為預(yù)報(bào)變量.問(wèn)題3:在線性回歸模型中, 是用 預(yù)報(bào)真實(shí)值 的誤差,它是一個(gè)不可觀測(cè)的量,那么應(yīng)該怎樣研究隨機(jī)誤差呢?隨機(jī)誤差的估計(jì)值 ,我們稱為殘差.殘差數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異 稱為相應(yīng)于點(diǎn)(xi,yi ) 的殘差.例:編號(hào)

3、為6的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)殘差平方和 把每一個(gè)殘差所得的值平方后加起來(lái),用數(shù)學(xué)符號(hào)表示為:稱為殘差平方和.在例1中,殘差平方和約為128.361.表1-4列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù).殘差分析與殘差圖 我們可以通過(guò)殘差 來(lái)判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析.編號(hào)12345678身高165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382 我們可以利用圖形來(lái)分析殘差特性,作圖時(shí)縱坐標(biāo)為殘差

4、,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為殘差圖。殘差圖的制作及作用:(1)坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;(2)若選擇的模型比較合適,殘差點(diǎn)應(yīng)該比較均勻的分布在以橫軸為中心的帶狀區(qū)域;(3)對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。身高與體重殘差圖異常點(diǎn) 錯(cuò)誤數(shù)據(jù) 模型問(wèn)題 幾點(diǎn)說(shuō)明: 從殘差圖中可以看出,第1個(gè)樣本點(diǎn)和第6個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過(guò)程中是否有人為的錯(cuò)誤. 如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒(méi)有錯(cuò)誤,則需要尋找其他的原因. 另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適.

5、 這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高.用身高預(yù)報(bào)體重時(shí),需要注意下列問(wèn)題:1、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時(shí)間性;3、樣本采集的范圍會(huì)影響回歸方程的適用范圍;4、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值. 事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值.一般地,建立回歸模型的基本步驟為:(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量.(2)畫(huà)出解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類(lèi)型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4

6、)按一定規(guī)則(如最小二乘法)估計(jì)回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等). 若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.例2、一只紅鈴蟲(chóng)的產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集了7組觀測(cè)數(shù)據(jù)列于下表,試建立y與x之間的回歸方程.325115662421117產(chǎn)卵數(shù)y/個(gè)35322927252321溫度x/0C問(wèn)題1:利用圖形計(jì)算器統(tǒng)計(jì)模式,輸入數(shù)據(jù),畫(huà)出散點(diǎn)圖。問(wèn)題2:通過(guò)觀察散點(diǎn)圖,思考能用線性回歸模型來(lái)近似的模擬該模型?如果不行可以用什么模型來(lái)模擬?學(xué)生分組討論、實(shí)踐。問(wèn)題3:在圖形計(jì)算器統(tǒng)計(jì)模式利用自帶模型求出回歸方程。利用

7、一次模型: 利用二次模型:利用指數(shù)模型: 問(wèn)題4:探索如何衡量指數(shù)模型還是二次函數(shù)模型擬合效果更好?函數(shù)模型殘差平方和線性回歸模型3963.78955二次函數(shù)模型796.738869指數(shù)函數(shù)模型0.03273949問(wèn)題5:探究相關(guān)指數(shù) 的含義我們進(jìn)一步觀察上面三個(gè)圖的信息,你們有什么發(fā)現(xiàn)? 我們可以用相關(guān)指數(shù)R2來(lái)刻畫(huà)回歸的效果,其計(jì)算公式是顯然,R2的值越大,說(shuō)明殘差平方和越小,也就是說(shuō)模型擬合效果越好.R2越接近1,表示回歸的效果越好(因?yàn)镽2越接近1,表示解釋變量和預(yù)報(bào)變量的相關(guān)性越強(qiáng)). 如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,則可以通過(guò)比較R2的值來(lái)做出選擇,即選取R2較大

8、的模型作為這組數(shù)據(jù)的模型??偟膩?lái)說(shuō):相關(guān)指數(shù)R2是度量模型擬合效果的一種指標(biāo). 在線性回歸模型中,R2表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率. 函數(shù)模型相關(guān)指數(shù)R2線性回歸模型0.7464二次函數(shù)模型0.9592指數(shù)函數(shù)模型0.9852用相關(guān)指數(shù) 衡量一次函數(shù)模型、二次函數(shù)模型以及指數(shù)模型的擬合效果.回歸分析的基本思想及其初步應(yīng)用探索無(wú)止境探索無(wú)止境探索無(wú)止境探索無(wú)止境課堂知識(shí)延伸 我們知道,刑警如果能在案發(fā)現(xiàn)場(chǎng)提取到罪犯的腳印,即將獲得一條重要的破案線索,其原因之一是人類(lèi)的腳掌長(zhǎng)度和身高存在著相關(guān)關(guān)系,可以根據(jù)一個(gè)人的腳掌長(zhǎng)度來(lái)預(yù)測(cè)他的身高 我們還知道,在統(tǒng)計(jì)史上,很早就有人收集過(guò)人們的身高、

9、前臂長(zhǎng)度等數(shù)據(jù),試圖尋找這些數(shù)據(jù)之間的規(guī)律 還有研究發(fā)現(xiàn)人眼睛眉毛的濃密稀疏與是否雙眼皮有關(guān),你能尋找這兩者之間的關(guān)系嗎? 大家還可以查閱資料探索年份與我國(guó)GDP產(chǎn)值之間的相關(guān)關(guān)系,并且預(yù)測(cè)2014和2015我國(guó)的GDP產(chǎn)值。 在上述三個(gè)小故事的啟發(fā)下,全班同學(xué)請(qǐng)分成一些小組,每組4-6名同學(xué),在老師的指導(dǎo)下,開(kāi)展一次數(shù)學(xué)建?;顒?dòng),來(lái)親自體驗(yàn)回歸分析的思想方法,提高自己的實(shí)踐能力。 數(shù)學(xué)建模的題目是:收集一些周?chē)藗兊哪_掌長(zhǎng)度、前臂長(zhǎng)度中的一個(gè)數(shù)據(jù)及其身高,來(lái)作為兩個(gè)變量畫(huà)散點(diǎn)圖,如果這兩個(gè)變量之間具有線性相關(guān)關(guān)系,就求出回歸直線方程,另選一個(gè)人的這兩個(gè)變量的數(shù)據(jù),作一次預(yù)測(cè),并分析預(yù)測(cè)結(jié)果。最后以小組寫(xiě)出數(shù)學(xué)建模報(bào)告,報(bào)告要求過(guò)程清晰,結(jié)論明確,有關(guān)數(shù)學(xué)論述準(zhǔn)確,以下兩個(gè)問(wèn)題需要注意: (1)如果腳掌長(zhǎng)度不方便,可改量腳印的長(zhǎng)度。 (2)數(shù)據(jù)盡量取得分散一些。處理數(shù)據(jù)收集數(shù)據(jù) 相關(guān)指數(shù)殘差分析統(tǒng)計(jì)源于生活統(tǒng)計(jì)用于生活小結(jié)1.根據(jù)數(shù)據(jù)畫(huà)出散點(diǎn)圖2.選擇合適的回歸模型3.根據(jù)殘差圖和相關(guān)指數(shù)分析擬合效果回歸分析的基本思想及其初步應(yīng)用問(wèn)題2:通過(guò)觀察散點(diǎn)圖,思考能用線性回歸模型來(lái)近似的模擬該模型

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論