數(shù)學(xué)模型姜啟源第十章統(tǒng)計(jì)回歸模型課件_第1頁(yè)
數(shù)學(xué)模型姜啟源第十章統(tǒng)計(jì)回歸模型課件_第2頁(yè)
數(shù)學(xué)模型姜啟源第十章統(tǒng)計(jì)回歸模型課件_第3頁(yè)
數(shù)學(xué)模型姜啟源第十章統(tǒng)計(jì)回歸模型課件_第4頁(yè)
數(shù)學(xué)模型姜啟源第十章統(tǒng)計(jì)回歸模型課件_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章統(tǒng)計(jì)回歸模型10.1牙膏的銷售量10.2軟件開發(fā)人員的薪金10.3酶促反應(yīng)10.4投資額與國(guó)民生產(chǎn)總值和物價(jià)指數(shù)回歸模型是用統(tǒng)計(jì)分析方法建立的最常用的一類模型數(shù)學(xué)建模的基本方法機(jī)理分析測(cè)試分析通過對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析,找出與數(shù)據(jù)擬合最好的模型不涉及回歸分析的數(shù)學(xué)原理和方法通過實(shí)例討論如何選擇不同類型的模型對(duì)軟件得到的結(jié)果進(jìn)行分析,對(duì)模型進(jìn)行改進(jìn)由于客觀事物內(nèi)部規(guī)律的復(fù)雜及人們認(rèn)識(shí)程度的限制,無法分析實(shí)際對(duì)象內(nèi)在的因果關(guān)系,建立合乎機(jī)理規(guī)律的數(shù)學(xué)模型。10.1牙膏的銷售量

問題建立牙膏銷售量與價(jià)格、廣告投入之間的模型預(yù)測(cè)在不同價(jià)格和廣告費(fèi)用下的牙膏銷售量收集了30個(gè)銷售周期本公司牙膏銷售量、價(jià)格、廣告費(fèi)用,及同期其它廠家同類牙膏的平均售價(jià)9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851銷售量(百萬支)價(jià)格差(元)廣告費(fèi)用(百萬元)其它廠家價(jià)格(元)本公司價(jià)格(元)銷售周期MATLAB統(tǒng)計(jì)工具箱

模型求解[b,bint,r,rint,stats]=regress(y,x,alpha)

輸入

x=~n4數(shù)據(jù)矩陣,第1列為全1向量alpha(置信水平,0.05)

b~的估計(jì)值bint~b的置信區(qū)間r~殘差向量y-xb

rint~r的置信區(qū)間Stats~檢驗(yàn)統(tǒng)計(jì)量

R2,F,p

y~n維數(shù)據(jù)向量輸出

由數(shù)據(jù)y,x1,x2估計(jì)參數(shù)參數(shù)估計(jì)值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123結(jié)果分析y的90.54%可由模型確定參數(shù)參數(shù)估計(jì)值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123F遠(yuǎn)超過F檢驗(yàn)的臨界值p遠(yuǎn)小于=0.05

2的置信區(qū)間包含零點(diǎn)(右端點(diǎn)距零點(diǎn)很近)x2對(duì)因變量y的影響不太顯著x22項(xiàng)顯著可將x2保留在模型中模型從整體上看成立銷售量預(yù)測(cè)價(jià)格差x1=其它廠家價(jià)格x3-本公司價(jià)格x4估計(jì)x3調(diào)整x4控制價(jià)格差x1=0.2元,投入廣告費(fèi)x2=650萬元銷售量預(yù)測(cè)區(qū)間為[7.8230,8.7636](置信度95%)上限用作庫(kù)存管理的目標(biāo)值下限用來把握公司的現(xiàn)金流若估計(jì)x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在7.83203.729(百萬元)以上控制x1通過x1,x2預(yù)測(cè)y(百萬支)兩模型銷售量預(yù)測(cè)比較(百萬支)區(qū)間[7.8230,8.7636]區(qū)間[7.8953,8.7592](百萬支)控制價(jià)格差x1=0.2元,投入廣告費(fèi)x2=6.5百萬元預(yù)測(cè)區(qū)間長(zhǎng)度更短略有增加x2=6.5x1=0.2x1x1x2x2兩模型與x1,x2關(guān)系的比較交互作用影響的討論價(jià)格差x1=0.1價(jià)格差x1=0.3加大廣告投入使銷售量增加(x2大于6百萬元)價(jià)格差較小時(shí)增加的速率更大x2價(jià)格優(yōu)勢(shì)會(huì)使銷售量增加價(jià)格差較小時(shí)更需要靠廣告來吸引顧客的眼球10.2軟件開發(fā)人員的薪金資歷~從事專業(yè)工作的年數(shù);管理~1=管理人員,0=非管理人員;教育~

1=中學(xué),2=大學(xué),3=更高程度建立模型研究薪金與資歷、管理責(zé)任、教育程度的關(guān)系分析人事策略的合理性,作為新聘用人員薪金的參考

編號(hào)薪金資歷管理教育0113876111021160810303187011130411283102編號(hào)薪金資歷管理教育422783716124318838160244174831601451920717024619346200146名軟件開發(fā)人員的檔案資料

分析與假設(shè)y~薪金,x1~資歷(年)x2=

1~管理人員,x2=

0~非管理人員1=中學(xué)2=大學(xué)3=更高資歷每加一年薪金的增長(zhǎng)是常數(shù);管理、教育、資歷之間無交互作用

教育線性回歸模型a0,a1,…,a4是待估計(jì)的回歸系數(shù),是隨機(jī)誤差中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0模型求解參數(shù)參數(shù)估計(jì)值置信區(qū)間a011032[1025811807]a1546[484608]a26883[62487517]a3-2994[-3826-2162]a4148[-636931]R2=0.957F=226p=0.000R2,F,p模型整體上可用資歷增加1年薪金增長(zhǎng)546管理人員薪金多6883中學(xué)程度薪金比更高的少2994大學(xué)程度薪金比更高的多148a4置信區(qū)間包含零點(diǎn),解釋不可靠!中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0.x2=

1~管理,x2=

0~非管理x1~資歷(年)進(jìn)一步的模型增加管理x2與教育x3,x4的交互項(xiàng)參數(shù)參數(shù)估計(jì)值置信區(qū)間a011204[1104411363]a1497[486508]a27048[68417255]a3-1727[-1939-1514]a4-348[-545–152]a5-3071[-3372-2769]a61836[15712101]R2=0.999F=554p=0.000R2,F有改進(jìn),所有回歸系數(shù)置信區(qū)間都不含零點(diǎn),模型完全可用

消除了不正常現(xiàn)象

異常數(shù)據(jù)(33號(hào))應(yīng)去掉

e~x1

e~組合去掉異常數(shù)據(jù)后的結(jié)果參數(shù)參數(shù)估計(jì)值置信區(qū)間a011200[1113911261]a1498[494503]a27041[69627120]a3-1737[-1818-1656]a4-356[-431–281]a5-3056[-3171–2942]a61997[18942100]R2=0.9998F=36701p=0.0000e~x1

e~組合R2:0.9570.9990.9998F:226

55436701置信區(qū)間長(zhǎng)度更短殘差圖十分正常最終模型的結(jié)果可以應(yīng)用模型應(yīng)用

制訂6種管理—教育組合人員的“基礎(chǔ)”薪金(資歷為0)組合管理教育系數(shù)“基礎(chǔ)”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0x1=

0;x2=

1~管理,x2=

0~非管理大學(xué)程度管理人員比更高程度管理人員的薪金高

大學(xué)程度非管理人員比更高程度非管理人員的薪金略低

10.3酶促反應(yīng)

問題研究酶促反應(yīng)(酶催化反應(yīng))中嘌呤霉素對(duì)反應(yīng)速度與底物(反應(yīng)物)濃度之間關(guān)系的影響

建立數(shù)學(xué)模型,反映該酶促反應(yīng)的速度與底物濃度以及經(jīng)嘌呤霉素處理與否之間的關(guān)系

設(shè)計(jì)了兩個(gè)實(shí)驗(yàn):酶經(jīng)過嘌呤霉素處理;酶未經(jīng)嘌呤霉素處理。實(shí)驗(yàn)數(shù)據(jù)見下表:

方案底物濃度(ppm)0.020.060.110.220.561.10反應(yīng)速度處理764797107123139159152191201207200未處理6751848698115131124144158160/線性化模型

經(jīng)嘌呤霉素處理后實(shí)驗(yàn)數(shù)據(jù)的估計(jì)結(jié)果

參數(shù)參數(shù)估計(jì)值(×10-3)置信區(qū)間(×10-3)15.107[3.5396.676]20.247[0.1760.319]R2=0.8557F=59.2975p=0.0000對(duì)1

,2非線性

對(duì)1,2線性

線性化模型結(jié)果分析

x較大時(shí),y有較大偏差1/x較小時(shí)有很好的線性趨勢(shì),1/x較大時(shí)出現(xiàn)很大的起落

參數(shù)估計(jì)時(shí),x較?。?/x很大)的數(shù)據(jù)控制了回歸參數(shù)的確定

1/y1/xxy非線性模型結(jié)果分析參數(shù)參數(shù)估計(jì)值置信區(qū)間1212.6819[197.2029228.1609]20.0641[0.04570.0826]畫面左下方的Export輸出其它統(tǒng)計(jì)結(jié)果。拖動(dòng)畫面的十字線,得y的預(yù)測(cè)值和預(yù)測(cè)區(qū)間剩余標(biāo)準(zhǔn)差s=10.9337最終反應(yīng)速度為半速度點(diǎn)(達(dá)到最終速度一半時(shí)的x值)為其它輸出命令nlintool給出交互畫面o~原始數(shù)據(jù)+~擬合結(jié)果

混合反應(yīng)模型

x1為底物濃度,x2為一示性變量

x2=1表示經(jīng)過處理,x2=0表示未經(jīng)處理

β1是未經(jīng)處理的最終反應(yīng)速度

γ1是經(jīng)處理后最終反應(yīng)速度的增長(zhǎng)值

β2是未經(jīng)處理的反應(yīng)的半速度點(diǎn)

γ2是經(jīng)處理后反應(yīng)的半速度點(diǎn)的增長(zhǎng)值在同一模型中考慮嘌呤霉素處理的影響一般混合模型與簡(jiǎn)化混合模型預(yù)測(cè)比較實(shí)際值一般模型預(yù)測(cè)值Δ(一般模型)簡(jiǎn)化模型預(yù)測(cè)值Δ(簡(jiǎn)化模型)6747.34439.207842.73585.44465147.34439.207842.73585.44468489.28569.571084.73567.0478……………191190.83299.1484189.05748.8438201190.83299.1484189.05748.8438207200.968811.0447198.183710.1812200200.968811.0447198.183710.1812簡(jiǎn)化混合模型的預(yù)測(cè)區(qū)間較短,更為實(shí)用、有效預(yù)測(cè)區(qū)間為預(yù)測(cè)值Δ注:非線性模型擬合程度的評(píng)價(jià)無法直接利用線性模型的方法,但R2與s仍然有效。酶促反應(yīng)

反應(yīng)速度與底物濃度的關(guān)系非線性關(guān)系求解線性模型

求解非線性模型機(jī)理分析嘌呤霉素處理對(duì)反應(yīng)速度與底物濃度關(guān)系的影響混合模型

發(fā)現(xiàn)問題,得參數(shù)初值引入0-1變量簡(jiǎn)化模型

檢查參數(shù)置信區(qū)間是否包含零點(diǎn)10.4投資額與國(guó)民生產(chǎn)總值和物價(jià)指數(shù)

問題建立投資額模型,研究某地區(qū)實(shí)際投資額與國(guó)民生產(chǎn)總值(GNP)及物價(jià)指數(shù)(

PI

)的關(guān)系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145992.7144.281.63422417.8423.0170.8679944.0149.371.50422163.9386.6160.8254873.4133.361.40051918.3324.1150.7906799.0122.851.32341718.0257.9140.7676756.0125.741.25791549.2206.1130.7436691.1113.531.15081434.2228.7120.7277637.797.421.05751326.4229.8110.7167596.790.91物價(jià)指數(shù)國(guó)民生產(chǎn)總值投資額年份序號(hào)物價(jià)指數(shù)國(guó)民生產(chǎn)總值投資額年份序號(hào)根據(jù)對(duì)未來GNP及PI的估計(jì),預(yù)測(cè)未來投資額

該地區(qū)連續(xù)20年的統(tǒng)計(jì)數(shù)據(jù)

時(shí)間序列中同一變量的順序觀測(cè)值之間存在自相關(guān)以時(shí)間為序的數(shù)據(jù),稱為時(shí)間序列

分析許多經(jīng)濟(jì)數(shù)據(jù)在時(shí)間上有一定的滯后性

需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型若采用普通回歸模型直接處理,將會(huì)出現(xiàn)不良后果

投資額與國(guó)民生產(chǎn)總值和物價(jià)指數(shù)

……………………1.32341718.0257.9140.7676756.0125.741.25791549.2206.1130.7436691.1113.531.15081434.2228.7120.7277637.797.421.05751326.4229.8110.7167596.790.91物價(jià)指數(shù)國(guó)民生產(chǎn)總值投資額年份序號(hào)物價(jià)指數(shù)國(guó)民生產(chǎn)總值投資額年份序號(hào)基本回歸模型投資額與GNP及物價(jià)指數(shù)間均有很強(qiáng)的線性關(guān)系t~年份,yt~投資額,x1t~GNP,x2t~物價(jià)指數(shù)0,1,2~回歸系數(shù)x1tytx2tytt~對(duì)t相互獨(dú)立的零均值正態(tài)隨機(jī)變量基本回歸模型的結(jié)果與分析

MATLAB統(tǒng)計(jì)工具箱

參數(shù)參數(shù)估計(jì)值置信區(qū)間0322.7250[224.3386421.1114]10.6185[0.47730.7596]2-859.4790[-1121.4757-597.4823]R2=0.9908F=919.8529p=0.0000剩余標(biāo)準(zhǔn)差s=12.7164沒有考慮時(shí)間序列數(shù)據(jù)的滯后性影響R2=0.9908,擬合度高模型優(yōu)點(diǎn)模型缺點(diǎn)可能忽視了隨機(jī)誤差存在自相關(guān);如果存在自相關(guān)性,用此模型會(huì)有不良后果自相關(guān)性的定性診斷

殘差診斷法模型殘差作殘差et~et-1散點(diǎn)圖大部分點(diǎn)落在第1,3象限t

存在正的自相關(guān)大部分點(diǎn)落在第2,4象限自相關(guān)性直觀判斷在MATLAB工作區(qū)中輸出et為隨機(jī)誤差t的估計(jì)值et-1ett

存在負(fù)的自相關(guān)基本回歸模型的隨機(jī)誤差項(xiàng)t

存在正的自相關(guān)自回歸性的定量診斷自回歸模型ρ~自相關(guān)系數(shù)0,1,2~回歸系數(shù)ρ=

0無自相關(guān)性ρ>

0ρ<

0如何估計(jì)ρ

如何消除自相關(guān)性D-W統(tǒng)計(jì)量D-W檢驗(yàn)

ut~對(duì)t相互獨(dú)立的零均值正態(tài)隨機(jī)變量存在負(fù)自相關(guān)性存在正自相關(guān)性廣義差分法

D-W統(tǒng)計(jì)量與D-W檢驗(yàn)

檢驗(yàn)水平,樣本容量,回歸變量數(shù)目D-W分布表n較大DW4-dU44-dLdUdL20正自相關(guān)負(fù)自相關(guān)不能確定不能確定無自相關(guān)檢驗(yàn)臨界值dL和dU由DW值的大小確定自相關(guān)性廣義差分變換

以*0,1

,2

為回歸系數(shù)的普通回歸模型原模型DW值D-W檢驗(yàn)無自相關(guān)有自相關(guān)廣義差分繼續(xù)此過程原模型新模型新模型

步驟

原模型變換不能確定增加數(shù)據(jù)量;選用其它方法

投資額新模型的建立

DWold<dL

作變換

原模型殘差et樣本容量n=20,回歸變量數(shù)目k=3,=0.05

查表臨界值dL=1.10,dU=1.54DWold=0.8754原模型有正自相關(guān)DW4-dU44-dLdUdL20正自相關(guān)負(fù)自相關(guān)不能確定不能確定無自相關(guān)參數(shù)參數(shù)估計(jì)值置信區(qū)間*0163.4905[1265.4592200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論