




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章第一章 統(tǒng)計(jì)案例統(tǒng)計(jì)案例 線性回歸模型線性回歸模型y=y=bx+a+ebx+a+e增加了隨機(jī)誤差項(xiàng)增加了隨機(jī)誤差項(xiàng)e e,因,因變量變量y y的值由自變量的值由自變量x x和隨機(jī)誤差項(xiàng)和隨機(jī)誤差項(xiàng)e e共同確定,即共同確定,即自自變量變量x x只能解析部分只能解析部分y y的變化的變化。 在統(tǒng)計(jì)中,我們也把自變量在統(tǒng)計(jì)中,我們也把自變量x x稱為稱為解析變量解析變量,因變,因變量量y y為為預(yù)報(bào)變量預(yù)報(bào)變量。我們可以用我們可以用相關(guān)指數(shù)相關(guān)指數(shù)r2來刻畫回歸的效果,其計(jì)算公式是來刻畫回歸的效果,其計(jì)算公式是n n2 2i ii i2 2i i= =1 1n n2 2i ii i= =1
2、1( (y y - -y y ) )r r = =1 1- -( (y y - -y y) )顯然,顯然,r2的值越大,說明殘差平方和越小,也就是說模型擬合的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。效果越好。r2越接近越接近1,表示回歸的效果越好(因?yàn)椋硎净貧w的效果越好(因?yàn)閞2越接近越接近1,表示解析,表示解析變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng))。變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng))。 如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,則可以通過比較則可以通過比較r r2 2的值來做出選擇,即的值來做出選擇,即選取選取r r2 2較大
3、的模型作為較大的模型作為這組數(shù)據(jù)的模型這組數(shù)據(jù)的模型??偟膩碚f:總的來說:相關(guān)指數(shù)相關(guān)指數(shù)r2是度量模型擬合效果的一種指標(biāo)。是度量模型擬合效果的一種指標(biāo)。在線性模型中,它在線性模型中,它代表自變量刻畫預(yù)報(bào)變量的能力代表自變量刻畫預(yù)報(bào)變量的能力。1、殘差、殘差數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異 稱為相應(yīng)于點(diǎn)(稱為相應(yīng)于點(diǎn)(x xi i,y yi i ) 的的殘差殘差。iiieyy=例:編號(hào)為例:編號(hào)為6 6的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)61(0.849 16585.712)6.6272、殘差平方和、殘差平方和 把
4、每一個(gè)殘差所得的值平方后加起來,用數(shù)學(xué)符號(hào)表把每一個(gè)殘差所得的值平方后加起來,用數(shù)學(xué)符號(hào)表示為:示為:21()niiiyy稱為稱為殘差平方和殘差平方和在例在例1 1中,殘差平方和約為中,殘差平方和約為128.361128.361。編號(hào)編號(hào)12345678身高身高/cm165165157170175165155170體重體重/kg4857505464614359殘差殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382 我們可以利用圖形來分析殘差特性,作圖時(shí)縱我們可以利用圖形來分析殘差特性,作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)坐標(biāo)為殘差,橫坐標(biāo)
5、可以選為樣本編號(hào),或身高數(shù)據(jù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為,或體重估計(jì)值等,這樣作出的圖形稱為殘差圖殘差圖。表表1-4列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。相應(yīng)的殘差數(shù)據(jù)。iiieyy=使用公式使用公式 計(jì)算殘差計(jì)算殘差殘差圖的制作及作用。殘差圖的制作及作用。坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以橫軸為心的帶形區(qū)域;橫軸為心的帶形區(qū)域;對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。身高與體重
6、殘差圖異常點(diǎn) 錯(cuò)誤數(shù)據(jù) 模型問題 幾點(diǎn)說明:幾點(diǎn)說明: 第一個(gè)樣本點(diǎn)和第第一個(gè)樣本點(diǎn)和第6個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過程中是否有人為個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過程中是否有人為的錯(cuò)誤。如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)的錯(cuò)誤。如果數(shù)據(jù)采集有錯(cuò)誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒有錯(cuò)誤,則需要尋找其他的原因。據(jù);如果數(shù)據(jù)采集沒有錯(cuò)誤,則需要尋找其他的原因。 另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,
7、說明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高。樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高。用身高預(yù)報(bào)體重時(shí),需要注意下列問題:用身高預(yù)報(bào)體重時(shí),需要注意下列問題:1、回歸方程只適用于我們所研究的樣本的總體;、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時(shí)間性;、我們所建立的回歸方程一般都有時(shí)間性;3、樣本采集的范圍會(huì)影響回歸方程的適用范圍;、樣本采集的范圍會(huì)影響回歸方程的適用范圍;4、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值。、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值。 事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值。事實(shí)上,它是預(yù)
8、報(bào)變量的可能取值的平均值。這些問題也使用于其他問題。這些問題也使用于其他問題。一般地,建立回歸模型的基本步驟為:一般地,建立回歸模型的基本步驟為:(1)確定研究對(duì)象,明確哪個(gè)變量是解析變量,哪個(gè)變量)確定研究對(duì)象,明確哪個(gè)變量是解析變量,哪個(gè)變量是預(yù)報(bào)變量。是預(yù)報(bào)變量。(2)畫出確定好的解析變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它)畫出確定好的解析變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等)。們之間的關(guān)系(如是否存在線性關(guān)系等)。(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程性關(guān)系,則選用線性回歸方程y
9、=bx+a).(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法)。)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法)。(5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng))得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性,等等),過存在殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性,等等),過存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。練習(xí)練習(xí)1 在一段時(shí)間內(nèi),某中商品的價(jià)格在一段時(shí)間內(nèi),某中商品的價(jià)格x元和需求量元和需求量y件件之間的一組數(shù)據(jù)為:之間的一組數(shù)據(jù)為:求出求出y對(duì)對(duì)x的回歸直線方程,并說明擬合效果的好壞。的回歸直線方
10、程,并說明擬合效果的好壞。價(jià)格價(jià)格x1416182022需求量需求量y1210753解:解:18,7.4,xy555221111660,327,620,iiiiiiixyx y7.4 1.15 1828.1.a1.1528.1.yx 回歸直線方程為:51522155iiiiix yxybxx26205 18 7.41.15.16605 18 練習(xí)練習(xí)1 在一段時(shí)間內(nèi),某中商品的價(jià)格在一段時(shí)間內(nèi),某中商品的價(jià)格x元和需求量元和需求量y件之件之間的一組數(shù)據(jù)為:間的一組數(shù)據(jù)為:求出求出y對(duì)的回歸直線方程,并說明擬合效果的好壞。對(duì)的回歸直線方程,并說明擬合效果的好壞。價(jià)格價(jià)格x1416182022需求
11、量需求量y1210753列出殘差表為列出殘差表為521()iiiyy0.3,521()iiyy53.2,5221521()1()iiiiiyyryy 0.994因而,擬合效果較好。因而,擬合效果較好。iiyyiyy00.3-0.4-0.10.24.62.6-0.4-2.4-4.4練習(xí)練習(xí)2 關(guān)于關(guān)于x與與y有如下數(shù)據(jù):有如下數(shù)據(jù): 有如下的兩個(gè)線性模型:有如下的兩個(gè)線性模型:(1) ;(;(2) 試比較哪一個(gè)擬合效果更好。試比較哪一個(gè)擬合效果更好。x24568y30406050706.517.5yx717.yx5221521()1551=1-= 0.8451000()iiiiiyyryy( 1
12、)5221521()1 8 01=1-= 0 .8 21 0 0 0()iiiiiyyryy( 2 )選用模型(選用模型(1)的擬合效果更好)的擬合效果更好練練:某種產(chǎn)品的廣告費(fèi)支出某種產(chǎn)品的廣告費(fèi)支出x與銷售額與銷售額y之間有如表之間有如表所示數(shù)據(jù)所示數(shù)據(jù):零件數(shù)零件數(shù)x24568加工時(shí)間加工時(shí)間y(分分鐘鐘)3040605070(1)0.9192r (2)6.517.5yx(1)求求x,y之間的相關(guān)系數(shù)之間的相關(guān)系數(shù);(2)求線性回歸方程求線性回歸方程;案例2 一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān)?,F(xiàn)收集了7組觀測(cè)數(shù)據(jù)列于表中:(1)試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程;并預(yù)測(cè)溫度為28oc時(shí)
13、產(chǎn)卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化? 溫度xoc21232527293235產(chǎn)卵數(shù)y/個(gè)711212466115325非線性回歸問題假設(shè)線性回歸方程為 :=bx+a選 模 型由計(jì)算器得:線性回歸方程為由計(jì)算器得:線性回歸方程為y=y=19.8719.87x x-463.73-463.73 相關(guān)指數(shù)相關(guān)指數(shù)r r2 2= =r r2 20.8640.8642 2=0.7464=0.7464估計(jì)參數(shù) 解:選取氣溫為解釋變量解:選取氣溫為解釋變量x x,產(chǎn)卵數(shù),產(chǎn)卵數(shù) 為預(yù)報(bào)變量為預(yù)報(bào)變量y y。選變量所以,一次函數(shù)模型中溫度解釋了所以,一次函數(shù)模型中溫度解釋了74.
14、64%的產(chǎn)卵數(shù)變化。的產(chǎn)卵數(shù)變化。探索新知畫散點(diǎn)圖050100150200250300350036912151821242730333639方案方案1分析和預(yù)測(cè)當(dāng)x=28時(shí),y =19.8728-463.73 93一元線性模型 y=bx2+a 變換 y=bt+a非線性關(guān)系 線性關(guān)系方案方案2選用y=bx2+a ,還是y=bx2+cx+a ?-200-1000100200300400-40-30-20-10010203040 產(chǎn)卵數(shù)氣溫如何求a、b ? t=x2二次函數(shù)模型方案2解答平方變換平方變換:令令t=xt=x2 2,產(chǎn)卵數(shù),產(chǎn)卵數(shù)y y和溫度和溫度x x之間二次函數(shù)模型之間二次函數(shù)模型y
15、=bxy=bx2 2+a+a就轉(zhuǎn)化為產(chǎn)卵數(shù)就轉(zhuǎn)化為產(chǎn)卵數(shù)y y和溫度的平方和溫度的平方t t之間線性回歸模型之間線性回歸模型y=y=bt+abt+a溫度21232527293235溫度的平方t44152962572984110241225產(chǎn)卵數(shù)y/個(gè)711212466115325作散點(diǎn)圖,并由計(jì)算器得:作散點(diǎn)圖,并由計(jì)算器得:y y和和t t之間的線性回歸方程為之間的線性回歸方程為y=y=0.3670.367t t-202.543-202.543,相關(guān)指數(shù),相關(guān)指數(shù)r r2 2=0.802=0.802將將t=xt=x2 2代入線性回歸方程得:代入線性回歸方程得: y=y=0.3670.367x
16、 x2 2 -202.543 -202.543當(dāng)當(dāng)x x=28=28時(shí)時(shí),y y=0.367=0.36728282 2- -202.5485202.5485,且,且r r2 2=0.802=0.802,所以,二次函數(shù)模型中溫度所以,二次函數(shù)模型中溫度解釋了解釋了80.2%80.2%的產(chǎn)卵數(shù)變化。的產(chǎn)卵數(shù)變化。產(chǎn)卵數(shù)y/個(gè)0501001502002503003500150300450600750900 1050 1200 1350t 變換 y=bx+a非線性關(guān)系 線性關(guān)系21c xyce-50050100150200250300350400450-10-50510152025303540產(chǎn)卵數(shù)氣
17、溫指數(shù)函數(shù)模型方案3方案3解答溫度xoc21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784產(chǎn)卵數(shù)y/個(gè)71121246611532500.40.81.21.622.42.8036912 15 18 21 24 27 30 33 36 39xz當(dāng)當(dāng)x=28x=28o oc c 時(shí),時(shí),y 44 y 44 ,指數(shù)回歸模型中溫度解釋指數(shù)回歸模型中溫度解釋了了98.5%98.5%的產(chǎn)卵數(shù)的變化的產(chǎn)卵數(shù)的變化由計(jì)算器得:由計(jì)算器得:z z關(guān)于關(guān)于x x的線性回歸方程的線性回歸方程為為0.272x-3.849 .ye22111221lnln()ln
18、lnlnlnlnc xc xycececc xec xc 對(duì)數(shù)變換:在 中兩邊取常用對(duì)數(shù)得21c xyc e令 ,則 就轉(zhuǎn)換為z=bx+a.12ln ,ln,zy ac bc21c xyc e z=0.272x-3.849 ,相關(guān)指數(shù)相關(guān)指數(shù)r r2 2=0.98=0.98最好的模型是哪個(gè)最好的模型是哪個(gè)?-200-1000100200300400-40-30-20-10010203040 產(chǎn)卵數(shù)氣溫-50050100150200250300350400450-10-50510152025303540產(chǎn)卵數(shù)氣溫線性模型線性模型二次函數(shù)模型二次函數(shù)模型指數(shù)函數(shù)模型指數(shù)函數(shù)模型比一比函數(shù)模型函數(shù)模型相關(guān)指數(shù)相關(guān)指數(shù)r2線性回歸模型線性回歸模型0.7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 酒店服務(wù)流程課件
- 學(xué)前兒童健康教育
- 五線譜初學(xué)課程
- 創(chuàng)意紐扣貼畫勞動(dòng)教育
- 寓言故事《刻舟求劍》解讀
- 小兒潰瘍性口炎的護(hù)理
- 腸造口出院后的護(hù)理指南
- 血小板減少性紫癜飲食護(hù)理
- 2025年山東省曲阜市中考一模語文試題含答案
- 口才國(guó)慶節(jié)課件:《中華頌》演講與愛國(guó)教育
- 《基于寧德時(shí)代的財(cái)務(wù)報(bào)表的公司財(cái)務(wù)分析》4100字(論文)
- 湖南省長(zhǎng)沙市雅禮實(shí)驗(yàn)中學(xué)-主題班會(huì)-《陽光心態(tài)美麗青春》【課件】
- 提高單病種上報(bào)率
- The+Person+I+respect+高考應(yīng)用文寫作+導(dǎo)學(xué)案 高三上學(xué)期英語一輪復(fù)習(xí)專項(xiàng)
- 2025年中考考前物理押題密卷(河北卷)(考試版A4)
- 臨床護(hù)理實(shí)踐指南2024版
- 人教版七年級(jí)下冊(cè)數(shù)學(xué)第七章平面直角坐標(biāo)系-測(cè)試題及答案
- “煎炒烹炸”與中藥療效(安徽中醫(yī)藥大學(xué))知道智慧樹章節(jié)答案
- 行政事業(yè)單位內(nèi)部控制規(guī)范專題講座
- 加油站卸油時(shí)跑冒油應(yīng)急演練及方案
- 藥品供貨服務(wù)方案
評(píng)論
0/150
提交評(píng)論