




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)學(xué)實驗國家“十二五”規(guī)劃教材山東省優(yōu)秀教材一等獎主編:李秀珍龐常詞2第七章回歸分析實驗7.1一元回歸分析實驗7.2多元回歸分析數(shù)學(xué)實驗3實驗7.1一元回歸分析一、一元線性回歸分析二一元非線性回歸分析數(shù)學(xué)實驗4一、一元線性回歸分析模型兩個變量x與y可以表示為:稱為一元線性回歸模型,
y稱為響應(yīng)變量自變量x是可以控制的變量,稱為未知參數(shù)a,b稱為回歸系數(shù),回歸變量;(7.1)
一元線性回歸分析實驗的主要任務(wù)是:(1)用試驗值(樣本觀測值)對未知參a,b做出估計;或因變量,(2)對建立的回歸方程進(jìn)行顯著性檢驗;(3)利用建立的回歸方程進(jìn)行預(yù)測或控制。
是隨機(jī)誤差.
假設(shè)均服從正態(tài)分布5(7.1)式,得這里是相互獨立的隨機(jī)變量,假設(shè)均服從正態(tài)分布,,.即,
使用最小二乘方法,求得a,b的值,可得到回歸方程:1.模型回歸系數(shù)的估計
假定試驗得到兩個變量x與y
的n個數(shù)據(jù)對,我們將這n對觀測值代入62.回歸方程的顯著性檢驗剩余(殘差)平方和它是由觀測誤差等其他因素引起的誤差.它反映了回歸變量x對變量y線性關(guān)系的密切程度.回歸平方和它表示觀測值總的分散程度.檢驗中常用的幾個統(tǒng)計量:偏差平方和7(1)擬合優(yōu)度檢驗(2)回歸方程的顯著性檢驗反映了回歸直線與觀測值的擬合程度,值越大,說明直線對數(shù)據(jù)的擬合程度越好.在實際應(yīng)用中也可通過F的統(tǒng)計值對應(yīng)的概率P<a來說明y與x之間的線性相關(guān)性顯著.當(dāng)P<0.01時,稱回歸方程高度顯著;當(dāng)0.01<P<0.05時,稱回歸方程顯著;當(dāng)P>0.05時,稱回歸方程不顯著.83.利用模型預(yù)測和控制把的值代入回歸方程得到預(yù)測值.當(dāng)n很大時,99%的預(yù)測區(qū)間可分別近似為這里s是剩余標(biāo)準(zhǔn)差,它表示觀測值偏離回歸直線的平均誤差.觀測值與回歸值之差稱為殘差.
如果模型的假定成立,那么殘差數(shù)據(jù)散點圖應(yīng)該以0為均值,呈寬度一致的帶狀分布.9函數(shù)功能regress(y,x,alpha)計算回歸系數(shù)及其區(qū)間估計,殘差及其置信區(qū)間,并給出檢驗回歸模型的參數(shù)(決定系數(shù),F(xiàn)統(tǒng)計量等),alpha缺省為0.05rcoplot(r,rint)畫出殘差及其置信區(qū)間fitlm(x,y,model)以x為數(shù)據(jù)矩陣,以y為響應(yīng)變量,用model的方式建立一個線性回歸模型.Modelspec方式見軟件說明,可缺省.plotDiagnostics(mdl,plottype)以plottype選項的方式顯示數(shù)據(jù)與回歸模型的數(shù)據(jù)診斷圖plotResiduals(mdl,plottype)以plottype指定選項的方式顯示數(shù)據(jù)與回歸模型的誤差圖predict(mdl,Xnew)返回(線性、非線性)模型mdl在Xnew的預(yù)測值和99%置信區(qū)間相關(guān)matlab命令函數(shù)4.一元回歸分析的matlab實現(xiàn)10例1
設(shè)為x某個時期的家庭人均收入,y為該時期內(nèi)平均每十戶擁有照相機(jī)的數(shù)量.統(tǒng)計數(shù)據(jù)如下表7-2所示,求y與x的回歸方程,并畫出參差及用回歸方程進(jìn)行預(yù)測.表7-2家庭人均收入與需照相機(jī)的關(guān)系(百元)1.51.82.43.03.53.94.44.85.0(臺/十戶)2.83.75.06.38.810.511.011.613.2用regress函數(shù)執(zhí)行實驗實驗方法如下:11(1)輸入數(shù)據(jù),觀察x與y是否線性關(guān)系x=[1.51.82.43.03.53.94.44.85.0]’Y=[2.83.75.06.38.810.511.011.613.2]’;plot(x,Y,'*')↙在命令窗口輸入:12(2)求回歸方程在命令窗口輸入:X=[ones(9,1)x];[b,bint,r,rint,stats]=regress(Y,X)↙b=-1.70702.9130bint=-2.9748-0.43932.55853.2675r=….rint=…stats=0.9818377.57990.00000.2944決定系數(shù)R^2F統(tǒng)計值F的值對應(yīng)的概率誤差平方的均值s2回歸系數(shù)的估計值回歸系數(shù)的置信區(qū)間殘差(此處略)殘差的100(1-alpha)%置信區(qū)間13(3)相關(guān)的檢驗可得回歸方程:決定系數(shù)R2=0.9818,F=377.5799,對應(yīng)的概率P=0.000<0.01因此線性相關(guān)性高度顯著.(4)殘差分析在命令窗口輸入:rcoplot(r,rint)↙檢驗擬合效果,以進(jìn)一步優(yōu)化和改進(jìn)模型。必要時可以剔除異常數(shù)據(jù)。14生成右邊的殘差圖,可以看出,數(shù)據(jù)的殘差離零點均較近,且殘差的置信區(qū)間均包含零點,這說明回歸模型能很好的擬合原始數(shù)據(jù).(5)利用回歸方程預(yù)測及作圖在命令窗口輸入:z=b(1)+b(2)*x;plot(x,Y,'k+',x,z,'r')↙圖7-315給定x=4.5,利用回歸方程可以預(yù)測:注意
一般情況下,建立模型后還要對模型的假定——
隨機(jī)誤差是服從正態(tài)分布且相互獨立——進(jìn)行一定的檢驗,以進(jìn)一步優(yōu)化和改進(jìn)模型。常用的方法是殘差分析法
當(dāng)然也可利用模型對預(yù)測目標(biāo)進(jìn)行區(qū)間估計,對給定的置信度其預(yù)測區(qū)間為:16運(yùn)行matlab:(1)錄入數(shù)據(jù)同實驗方法一(1).(2)求回歸方程在命令窗口輸入:lmf=fitlm(x,Y)↙注意,此處是用x,而非X.否則出錯.lmf=線性回歸模型:y~1+x1估計系數(shù):EstimateSEtStatpValue(Intercept)-1.7070.53613-3.1840.015405x12.9130.1499119.4312.3846e-07
這是回歸模型的說明,lmf是自己定義的.實驗方法二:用fitlm函數(shù)來執(zhí)行17lmf=線性回歸模型:(這是回歸模型的說明).y~1+x1估計系數(shù):EstimateSEtStatpValue(Intercept)-1.7070.53613-3.1840.015405x12.9130.1499119.4312.3846e-07所求的回歸方程為:系數(shù)估計值
從以上運(yùn)行結(jié)果可知,系數(shù)的t統(tǒng)計值和對應(yīng)的概率,而regress命令則沒有這個。所求的回歸方程為:18
從以上運(yùn)行結(jié)果可知,決定系數(shù)=0.982,F=378,對應(yīng)的概率P=2.38e-07<0.01,可知回歸方程:線性相關(guān)性高度顯著.觀測值數(shù)目:9,誤差自由度:7均方根誤差:0.543R-方:0.982,調(diào)整R-方0.979F統(tǒng)計量(常量模型):378,p值=2.38e-07
可知:剩余標(biāo)準(zhǔn)差是s=0.543,決定系數(shù)R2=0.982,F統(tǒng)計量的值是:378,對應(yīng)的概率是:2.38e-07.(注意,在用regress中得到的是s2=0.2944.即stats的第四個參數(shù).)(3)回歸方程的顯著性檢驗19(4)殘差分析在命令窗口輸入:plotResiduals(lmf,'probability')↙該命令可畫出殘差與回歸擬合分布圖●可見沒有殘差明顯偏離回歸擬合直線.模型無需改進(jìn).●可用下列命令找到殘差大于0.8的數(shù)據(jù)位置:find(lmf.Residuals.Raw>0.8)↙ans=620(5)點預(yù)測與95%的置信區(qū)間預(yù)測x=4.5的值.在命令窗口輸入:[NewlmfNewCI]=predict(lmf,4.5)↙Newlmf=11.4014NewCI=10.814611.9881
可得到回歸預(yù)測值為11.4014,其置信區(qū)間為[10.8146,11.9881].思考題:如何利用該命令畫出回歸方程的95%置信區(qū)間的圖形?或者用feval(lmf,4.5)也可.21二一元非線性回歸分析選擇適當(dāng)?shù)那€求回歸方程其中a,b為未知參數(shù)。常見的可化為一元線性回歸的非線性(即曲線型)問題詳見教材,此處略去.
兩個變量之間的相關(guān)關(guān)系不是線性的,可以根據(jù)專業(yè)知識或散點圖,22非線性回歸Matlab命令函數(shù)函數(shù)功能nlinfit(x,y,’model’beta0)計算非線性回歸的系數(shù),殘差,估計預(yù)測誤差的數(shù)據(jù)nlintool(x,y,’model’,beta0,alpha)產(chǎn)生擬合曲線和y的置信區(qū)間等信息的交互畫面nlpredci(‘model’,x,beta,r,J)求回歸函數(shù)在x處的預(yù)測值y及其置信區(qū)間nlparci(beta,r,J)計算回歸系數(shù)的置信區(qū)間fitnlm(x,y,fun,beta0)與nlinfit函數(shù)采用相同算法的另一個非線性回歸命令plotDiagnostics(mdl,plottype)以plottype選項的方式顯示數(shù)據(jù)與回歸模型的數(shù)據(jù)診斷圖plotResiduals(mdl,plottype)以plottype指定選項的方式顯示數(shù)據(jù)與回歸模型的誤差圖predict(mdl,Xnew)返回(線性、非線性)模型mdl在Xnew的預(yù)測值和99%置信區(qū)間23例2
在彩色顯影中,根據(jù)經(jīng)驗形成燃料光學(xué)密度y與析出銀的光學(xué)密度x由公式表7-3光學(xué)密度與析出銀的光學(xué)密度實驗數(shù)據(jù)xi0.050.060.070.100.140.200.250.310.380.430.47yi0.100.140.230.370.590.791.001.121.191.251.29求y關(guān)于x的回歸方程.表示,測得實驗數(shù)據(jù)如下:24實驗流程如下:(2)對要擬合對非線性模型建立M文件volum.m如下(1)輸入數(shù)據(jù)x=[0.050.060.070.100.140.200.250.310.380.430.47]';
y=[0.100.140.230.370.590.791.001.121.191.251.29]‘;beta0=[0.10.1];在命令行窗口輸入:這里初始?xì)垟?shù)的設(shè)定沒有一般的方法.該初值的選取直接影響到計算和擬合的質(zhì)量,在沒有相關(guān)信息的情況下可用beta0=randn(nVars,1).
functionyhat=volum(beta,x)yhat=beta(1)*exp(beta(2)./x);25(3)求回歸系數(shù)[beta,r,J]=nlinfit(x,y,'volum',beta0);可得非線性回歸方程(4)回歸方程的預(yù)測及作圖[yy,delta]=nlpredci('volum1',x,beta,r,J);beta=↙1.7924-0.153426plot(x,y,'k+',x,yy,'r')↙可見回歸曲線與原始數(shù)據(jù)擬合的很好。可以用剩余標(biāo)準(zhǔn)差來定量的判定擬合效果。27實驗方法二:用fitnlm命令流程如下:(1)輸入數(shù)據(jù)在命令窗口輸入x,y的數(shù)據(jù).同上(2)模型選擇模型也可以用匿名函數(shù).yhat=@(b,x)b(1)*exp(b(2)./x);(3)回歸與檢驗在命令窗口輸入:nlf=fitnlm(x,y,yhat,beta0)↙得到如下結(jié)果:在命令窗口輸入:28nlf=非線性回歸模型:y~b1*exp(b2/x)估計系數(shù):EstimateSEtStatpValueb11.79240.03026159.2315.6151e-13b2-0.153390.0043739-35.0696.1601e-11觀測值數(shù)目:11,誤差自由度:9均方根誤差:0.0236R-方:0.998,調(diào)整R-方0.997F-statisticvs.zeromodel:7.25e+03,p值=3.68e-15這是回歸模型的說明,nlf是自己定義的.可得非線性回歸方程29我們還可知道:決定系數(shù),F(xiàn)統(tǒng)計值對應(yīng)概率P=3.68e-15<0.01.系數(shù)的統(tǒng)計值對應(yīng)概率很小.此外,剩余標(biāo)準(zhǔn)差為0.0236相比y的數(shù)據(jù)范圍小的多,也說明模型擬合較好.(4)回歸方程的預(yù)測在命令行窗口輸入:[yhat,yci]=predict(nlf,x);↙plot(x,y,'k+',x,yhat,'r')↙此函數(shù)線性和非線性通用30
下表為1980~1991年間以1987年不變價計算的美國個人消費(fèi)支出Y與國內(nèi)生產(chǎn)支出X數(shù)據(jù)(單位:10億美元)年份YX年份YX19802447.13776.319862969.14404.519812476.93843.119873052.24539.919822503.73760.319883162.44718.619832619.43906.619893223.34838.019842746.14148.519903260.44877.519852865.84279.819913240.84821.0(1)在直角坐標(biāo)系下,作X與Y的散點圖,并判斷Y與X是否存在線性相關(guān)關(guān)系.(2)試求Y與X的一元線性回歸方程.三應(yīng)用實例31(3)對所得回歸方程作顯著性檢驗(a=0.05).(4)若國內(nèi)生產(chǎn)支出為x0=4500,試求對應(yīng)的消費(fèi)支出y0的點預(yù)測和包含概率為的95%區(qū)間預(yù)測.實驗流程(1)輸入數(shù)據(jù),觀察散點圖.x=[3776.33843.13760.33906.64148.54279.84404.54539.94718.64838.04877.54821.0]’;y=[2447.12476.92503.72619.42746.12865.82969.13052.23162.43223.33260.43240.8]’;plot(y,x,'+')↙在命令窗口輸入:圖7-5632(2)求回歸方程在命令窗口輸入:lmf=fitlm(x,y)↙lmf=線性回歸模型:y~1+x1估計系數(shù):EstimateSEtStatpValue(Intercept)-231.894.528
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代陶瓷材料在商業(yè)空間裝飾的應(yīng)用與工藝
- 單板加工職業(yè)技能競賽組織與成果展示考核試卷
- 木材加工中的技術(shù)進(jìn)步與裝備升級考核試卷
- 社交禮儀基礎(chǔ)如何成為更好的對話者
- 周密改進(jìn)年度工作計劃
- 后疫情時代的品牌建設(shè)秘訣計劃
- 基礎(chǔ)知識班主任的基礎(chǔ)知識講解計劃
- 2025年01月江西南昌市青山湖區(qū)審計局面向社會公開招聘工作人員4人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解-1
- 文案采購合同范本
- 安寧療護(hù)中的臨終患者生理變化考核試卷
- 教學(xué)課件-電力系統(tǒng)的MATLAB-SIMULINK仿真與應(yīng)用(王晶)
- GB/T 26189.2-2024工作場所照明第2部分:室外作業(yè)場所的安全保障照明要求
- 新教科版一年級科學(xué)下冊第一單元《身邊的物體》全部課件(共7課時)
- 鹽城江蘇鹽城市住房和城鄉(xiāng)建設(shè)局直屬事業(yè)單位市政府投資工程集中建設(shè)管理中心招聘4人筆試歷年參考題庫附帶答案詳解
- 2024年黑龍江職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 2024年南京旅游職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 《電商直播》 課件 項目一 走入電商直播
- 《中國宮腔鏡診斷與手術(shù)臨床實踐指南(2023版)》解讀課件
- 中藥學(xué)電子版教材
- GB/T 9535-1998地面用晶體硅光伏組件設(shè)計鑒定和定型
- 建筑公司項目部績效考核管理制度
評論
0/150
提交評論