




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、實(shí) 驗(yàn) 報 告9 姓 名 葉美芳 學(xué)號 *1235 班級 數(shù)學(xué)*班實(shí)驗(yàn)名稱 回歸分析一實(shí)驗(yàn)?zāi)康募耙螅?. 掌握回歸分析的基本理論2. 會運(yùn)用回歸分析相關(guān)理論進(jìn)行編程和解決實(shí)際問題二實(shí)驗(yàn)內(nèi)容:1.背景:由于有氧鍛煉中,人體的耗氧能力是衡量人身體健康狀況的重要指標(biāo),而耗氧能力(人體單位重量單位時間內(nèi)最大的耗氧量)在日常生活中難以直接測量,故本文建立相關(guān)數(shù)學(xué)模型,采用機(jī)理分析和回歸分析以及數(shù)據(jù)擬合相結(jié)合的辦法,以期望使普通大眾能夠方便快鍵地對自身身體狀況有更為直接的了解,也能更加合理科學(xué)地鍛煉。2.題目:習(xí)題7:在有氧鍛煉中人的耗氧能力 (mL/(min·kg)是衡量身體狀況的重要指標(biāo),
2、它可能與以下因素有關(guān):年齡,體重(kg),1500m跑的時間(min),靜止時心跳速度(次/min),跑步后心速(次/min),對24名40至57歲的志愿者進(jìn)行了測試,結(jié)果如下表1.1(節(jié)選),試建立耗氧能力y與諸因素的之間的回歸模型。序號123421222324YX14440444257545250X2X3X46262454058624848X5178185156166174156164146(1) 若中只許選擇1個變量,最好的模型是什么?(2) 若中只許選擇2個變量,最好的模型是什么?(3) 若不限制變量的個數(shù),最好的模型是什么?(4) 對最終模型觀察殘查,有無異常點(diǎn),若有,剔除后如何?3
3、.做法 :本題不同小問需要建立不同模型,由于專業(yè)知識所限,并且提供的數(shù)據(jù)較少,難以做出精確符合現(xiàn)實(shí)情況的模型,因此這里用最簡單的線性回歸法進(jìn)行擬和模型基本形式如下:事實(shí)上,中的項(xiàng)(高次項(xiàng)和交互項(xiàng))對于本題目來講意義不大,因?yàn)樗o定的5個自變量和因變量之間關(guān)系比較模糊,幾個變量彼此之間的聯(lián)系也很難說清,因此用自變量的一次線性擬和就足以適應(yīng)本題的要求。但作為練習(xí),還是將每種回歸方法都使用到了,可以用于參考。具體采用的各個模型將在下面單獨(dú)說明,這里不再重復(fù)。由于本題需要建立多組模型,并且要在不斷的調(diào)試中發(fā)現(xiàn)最合理的,很多命令都要在這個過程中不斷使用,這里僅僅給出使用的最基本的命令。數(shù)據(jù)clear A
4、=; %數(shù)據(jù)矩陣,略n=24; y=A(2,:); %提取各個數(shù)據(jù)x1=A(3,:);x2=A(4,:);x3=A(5,:);x4=A(6,:);x5=A(7,:);繪制散點(diǎn)圖(大致判斷影響情況)for i=1:5 subplot(2,3,i),plot(A(i+2,:),y,'+'),grid pause end pause 單參數(shù)回歸(第一問)X=ones(n,1),x4' %這里檢驗(yàn)的是自變量x4,實(shí)際操作時要分別檢驗(yàn)x1x5 b,bint,r,rint,s=regress(y',X); %回歸分析程序()b,bint,s, %輸出回歸系數(shù)估計值、置信區(qū)間
5、、以及統(tǒng)計量rcoplot(r,rint) %殘差圖Polytool(x3',y',2) %檢驗(yàn)一元多項(xiàng)式回歸的結(jié)果,輸出交互式畫面雙參數(shù)回歸(第二問):用逐步回歸法找出最合理的兩個變量X5=x1',x2',x3',x4',x5' stepwise(X5,y'); %利用輸出的交互式畫面,可以選出最佳的兩個變量XX=x3',x1' %當(dāng)?shù)玫搅俗罴训膬蓚€變量后(這里假設(shè)是x3x1)rstool(XX,y','linear') %檢驗(yàn)二元情況下的交互項(xiàng)和高次項(xiàng)全部參數(shù)回歸(第三問):X5=x1&
6、#39;,x2',x3',x4',x5' %仍然用逐步回歸法找出最合理的組合方式stepwise(X5,y')第五問要求對殘差進(jìn)行分析,并且剔除異常點(diǎn),可以在該問得到最終模型后,采用regress得到的殘差值和置信區(qū)間并根據(jù)其繪制殘差圖,然后再進(jìn)行剔除操作重新檢驗(yàn)。散點(diǎn)圖 (1) (2) (3)(4) (5)從左上到右下的順序?yàn)閤1x5.可以由點(diǎn)的分布大致看出,除了x3自變量呈現(xiàn)比較明顯的負(fù)相關(guān)趨勢以外,對于其他的各個自變量都難以直接觀測出其對于因變量的影響。根據(jù)這種結(jié)果,可以假設(shè)自變量x3(1500m跑后心速)最直接的與鍛煉耗氧能力相關(guān),下面通過對各個
7、自變量的單參數(shù)回歸進(jìn)行檢驗(yàn)。單參數(shù)回歸被檢對象011置信區(qū)間R2FPs2X1,X2,X3,0X4,X5,由單參數(shù)回歸的結(jié)果可以證明X3(1500m跑后心速)可以最好的反映出y(鍛煉耗氧能力)的情況。由1置信區(qū)間可以看出,x1、x2包含0在內(nèi),即y可能與該參數(shù)無關(guān),所以不選擇,并且兩者的p值已經(jīng)明顯的大于,則不考慮x1、x2。比較x3x5后發(fā)現(xiàn),x3的2R-決定系數(shù)明顯的大于x5的,決定系數(shù)反映的是在因量的總變化中自變量引起的那部分的比例,2R大說明x3自變量對因變量起的決定作用最大。并且x3的p和s2值也都比較小,所以最終確定x3可以最好的反映出y的情況。用Polytool檢驗(yàn)含x3高次(2次
8、)項(xiàng)的情況,參量Export如下表:012回歸系數(shù)估計值置信區(qū)間下限置信區(qū)間上限可以同之前的僅含一次項(xiàng)的結(jié)果進(jìn)行比較,發(fā)現(xiàn)各個參量的置信區(qū)間都很寬,且2的置信區(qū)間過0??梢哉J(rèn)為二次項(xiàng)的引入是不重要的。因此采用如下單參數(shù)模型描述y是最準(zhǔn)確地:其中:83.4438,其中:83.4438,雙參數(shù)回歸:用stepwise作逐步回歸,部分過程和最終結(jié)果如下圖:根據(jù)題目要求,最終得到取雙參量時的最佳結(jié)果(RMSE參量最?。┦侨3 (1500m跑后心速)和x1(年齡)自變量。但事實(shí)上,實(shí)際的逐步回歸過程在此時并沒有結(jié)束,最終的最優(yōu)結(jié)果是只取x3參量。這說明取x3、x1參量同只取x3相比優(yōu)勢并不明顯。通過r
9、stool命令檢驗(yàn)二元情況下的交互項(xiàng)和高次項(xiàng)情況,下圖是linear情況下固定單參數(shù)進(jìn)行預(yù)測的結(jié)果:項(xiàng)對應(yīng)的系數(shù)常數(shù)項(xiàng)X3X1X32X12X3*X1RMSELinearPurequadraticInteractionQuadratic可以看到高次項(xiàng)和相關(guān)項(xiàng)的系數(shù)都非常小,說明其對于y的影響不大。根據(jù)rmse的結(jié)果進(jìn)行比較,仍然選擇linear回歸方式,即只用二元自變量的一次項(xiàng)。yxx其中:全參數(shù)回歸根據(jù)以上的分析可以驗(yàn)證模型建立時的猜想,本題中5個字變量和y的關(guān)系都不是很直接的,除x3外其他變量的影響很小,所以在最終完整模型中,不再考慮高次項(xiàng)和交互項(xiàng)的影響,一方面簡化模型,一方面大大節(jié)省的篩選
10、的時間。所以采用stepwise命令,僅對五元變量x1x5的一次項(xiàng)進(jìn)行回歸分析,結(jié)果如下:Export參數(shù)結(jié)果:置信區(qū)間Coeff.Set-statp-valX1X2000X30X4000X5R2=0.814315 F=29.2364 RMSE=2.66669 P=1.64368*e-7 最終取以下三個參數(shù)得到最佳回歸結(jié)果:x3 (1500m跑后心速)、x1(年齡)以及x5(跑步后心速)。但仍需要進(jìn)行一般回歸分析(regress)確定常數(shù)項(xiàng)并觀察殘差,結(jié)果如下:最終得到的結(jié)果整體上優(yōu)越于剔除異常點(diǎn)之前的結(jié)果(不再粘貼結(jié)果)。但是事實(shí)上,由于數(shù)據(jù)點(diǎn)經(jīng)過剔除不斷的結(jié)果,模型最終的形式和實(shí)際統(tǒng)計到的
11、24組數(shù)據(jù)的整體情況偏離越來越大,也就是說:剔除異常點(diǎn)雖然能夠一應(yīng)程度上降低其對于整體情況的干擾作用,而剔除的過程也放大了其他原本正常數(shù)據(jù)點(diǎn)的異常性,所以異常點(diǎn)可能會不斷產(chǎn)生,但是剔除的數(shù)量增加即采樣數(shù)據(jù)的減少也會削弱模型反省整體性能的能力。是一對矛盾,在數(shù)據(jù)點(diǎn)較少的時候尤其明顯。比較科學(xué)的做法是:只進(jìn)行1次或少次剔除,保證整體性,又去掉了最主要的異常點(diǎn)。這里的最終結(jié)果采用剔除最初兩個異常點(diǎn)(10,15號)后的結(jié)果,在此也附上完整數(shù)據(jù)(剔除之前)的結(jié)果,作為第3問的答案:完整數(shù)據(jù)(第三題結(jié)果):回歸參數(shù)取值置信區(qū)間135R2FPs2其中:=118.0135, =-0.3254, =-4.569
12、4, =-一次剔除(最終結(jié)果)回歸參數(shù)取值置信區(qū)間119495594.6827 141623991 -0.12553-4.0411-5.3617 -2.72055774R2FPs208625其中:=119.4955, =-0.03623, =-4.0411, =-1500m跑后心速、年齡以及跑步后心速三個參數(shù)最能夠反映鍛煉耗氧量這個重要的身體狀態(tài)指標(biāo)。三種心跳速度越快,說明耗氧量越大;速度越慢,即時間越長,說明耗氧量越小。三實(shí)驗(yàn)總結(jié):各回歸模型之間的區(qū)別:5重線性回歸模型是對所有的相關(guān)因素,統(tǒng)一作線性回歸分析,沒有考慮其顯著程度;3 重線性回歸模型,剔除了5 重線性回歸模型中顯著程度較低的因素, 主要研究顯著程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版七年級生物下冊教學(xué)工作計劃(及進(jìn)度表)
- 團(tuán)員采訪發(fā)言材料
- 沙庫巴曲纈沙坦鈉聯(lián)合琥珀酸美托洛爾治療心力衰竭的臨床效果
- 軟件測試與優(yōu)化服務(wù)合同
- 環(huán)保用地居間服務(wù)合同
- 現(xiàn)代農(nóng)業(yè)綠色植保技術(shù)方案
- 項(xiàng)目進(jìn)度說明及下一步計劃文書模板
- 三農(nóng)生產(chǎn)管理規(guī)劃手冊
- 企業(yè)員工健康管理方案
- 貴陽項(xiàng)目可行性研究報告
- 2024年同等學(xué)力申碩-同等學(xué)力(新聞傳播學(xué))歷年考試高頻考點(diǎn)試題附帶答案
- 《小學(xué)數(shù)學(xué)課程標(biāo)準(zhǔn)與教材教學(xué)研究》課件 12圖形的運(yùn)動
- INSAR技術(shù)在城市地面沉降監(jiān)測中的應(yīng)用
- 【人力資源管理工具】員工獎懲審批表(表格版)
- 商事糾紛解決的法律框架
- 小學(xué)語文學(xué)生學(xué)情分析報告4篇
- 靜載施工方案
- 報價單(報價單模板)
- 六年級下冊勞動教育《場館服務(wù)我上崗》教學(xué)設(shè)計
- 小學(xué)科學(xué)說課稿
- 22S803 圓形鋼筋混凝土蓄水池
評論
0/150
提交評論