




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.2.2.2一元線性回歸模型的應(yīng)用例:經(jīng)驗表明,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時,某林場收集了某種樹的一些數(shù)據(jù)(如下表),試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗回歸方程.編號123456胸徑/cm18.120.122.224.426.028.3樹高/m18.819.221.021.022.122.1編號789101112胸徑/cm29.632.433.735.738.340.2樹高/m22.422.623.024.323.924.7以胸徑為橫坐標,樹高為縱坐標作散點圖,得到下圖.散點大致分布在一條從左下角到右上角的直線附近,表明兩個變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.用d表示胸徑,h表示樹高,根據(jù)最小二乘法,計算可得經(jīng)驗回歸方程為相應(yīng)的經(jīng)驗回歸直線如圖所示.根據(jù)經(jīng)驗回歸方程,由例題中所給表中胸徑的數(shù)據(jù)可以計算出樹高的預(yù)測值(精確到0.1)以及相應(yīng)的殘差,如下表所示.編號胸徑/cm樹高觀測值/m樹高預(yù)測值/m殘差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2以胸徑為橫坐標,殘差為縱坐標,作殘差圖,得到下圖.觀察殘差表和殘差圖,可以看到,殘差的絕對值最大是0.8,所有殘差分布在以橫軸為對稱軸,寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗回歸方程較好地刻畫了樹高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗回歸方程由胸徑預(yù)測樹高.問題:人們常將男子短跑100m的高水平運動員稱為"百米飛人".表中給出了1968年之前男子短跑100m世界紀錄產(chǎn)生的年份和世界紀錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀錄關(guān)于紀錄產(chǎn)生年份的經(jīng)驗回歸方程.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95以成對數(shù)據(jù)中的世界紀錄產(chǎn)生年份為橫坐標,世界紀錄為縱坐標作散點圖散點看上去大致分布在一條直線附近似乎可用一元線性回歸模型建立經(jīng)驗回歸方程.用Y表示男子短跑100m的世界紀錄,t表示紀錄產(chǎn)生的年份,利用一元線性回歸模型來刻畫世界紀錄和世界紀錄產(chǎn)生年份之間的關(guān)系.將經(jīng)驗回歸直線疊加到散點圖,得到下圖(1)根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗回歸方程為觀察:從上圖中可以看到,經(jīng)驗回歸方程(1)較好地刻畫了散點的變化趨勢.請再仔細觀察圖形,你能看出其中存在的問題嗎?以經(jīng)驗回歸直線為參照,可以發(fā)現(xiàn)經(jīng)驗回歸方程的不足之處,以及散點的更為精細的分布特征.例如,第一個世界紀錄所對應(yīng)的散點遠離經(jīng)驗回歸直線,并且前后兩時間段中的散點都在經(jīng)驗回歸直線的上方,中間時間段的散點都在經(jīng)驗回歸直線的下方.這說明散點并不是隨機分布在經(jīng)驗回歸直線的周圍,而是圍繞著經(jīng)驗回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.觀察:從上圖中可以看到,經(jīng)驗回歸方程(1)較好地刻畫了散點的變化趨勢.請再仔細觀察圖形,你能看出其中存在的問題嗎?思考:你能對模型進行修改,以使其更好地反映散點的分布特征嗎?散點更趨向于落在中間下凸且遞減的某條曲線附近.100m短跑的第一個世界紀錄產(chǎn)生于1896年y=f(t)=c1+c2ln(t-1895)其中c1和c2為未知的參數(shù),且c2
<0.y=-lnx的圖象具有類似的形狀特征y=f(t)=c1+c2ln(t-1895)其中c1和c2為未知的參數(shù),且c2
<0.將年份變量數(shù)據(jù)進行變換,得到新的成對數(shù)據(jù)(精確到0.01).編號12345678x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95引進一個中間變量x
,令
x=ln(t-1895)借助一元線性回歸模型和新的成對數(shù)據(jù),對參數(shù)c1和c2作出估計,進而可以得到Y(jié)關(guān)于t的非線性經(jīng)驗回歸方程.散點的分布呈現(xiàn)出很強的線性相關(guān)特征.散點圖用一元線性回歸模型得到經(jīng)驗回歸方程
再在上圖中畫出(*)式所對應(yīng)的經(jīng)驗回歸直線,得到右圖.(*)由上圖表明,經(jīng)驗回歸方程(*)對于上表中的成對數(shù)據(jù)具有非常好的擬合精度.將上圖與右圖進行對比,可以發(fā)現(xiàn)
x
和Y之間的線性相關(guān)程度比原始樣本數(shù)據(jù)的線性相關(guān)程度強得多.將
x=ln(t-1895)代人(*)式,得到由創(chuàng)紀錄年份預(yù)報世界紀錄的經(jīng)驗回歸方程
在同一直角坐標系中畫出成對數(shù)據(jù)散點圖,非線性經(jīng)驗回歸方程(2)的圖象以及經(jīng)驗回歸方程(1)的圖象,如下圖所示.(2)散點圖中各散點都非??拷?)的圖象,表明非線性經(jīng)驗回歸方程(2)對于原始數(shù)據(jù)的擬合效果遠遠好于經(jīng)驗回歸方程(1).①②通過殘差來比較這兩個經(jīng)驗回歸方程對數(shù)據(jù)刻畫的好壞.在表中,用ti表示編號為i的年份數(shù)據(jù),用yi
表示編號為i的紀錄數(shù)據(jù),則經(jīng)驗回歸方程(1)和(2)的殘差計算公式分別為
編號12345678t189619121921193019361956196019600.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022觀察各項殘差的絕對值,發(fā)現(xiàn)經(jīng)驗回歸方程②遠遠小于①,即經(jīng)驗回歸方程②的擬合效果要遠遠好于①.在一般情況下,直接比較兩個模型的殘差比較困難,因為在某些散點上一個模型的殘差的絕對值比另一個模型的小,而另一些散點的情況則相反.可以通過比較殘差的平方和來比較兩個模型的效果.由可知Q2
小于
Q1
.的擬合效果要優(yōu)于一元線性回歸模型的擬合效果.因此在殘差平方和最小的標準下,非線性回歸模型刻畫回歸效果的方式——殘差平方和法稱為殘差平方和殘差平方和越小,模型擬合效果越好.其中,稱為總體偏差平方和,為確定的數(shù)值,與經(jīng)驗回歸方程無關(guān)稱為殘差平方和,與經(jīng)驗回歸方程有關(guān)刻畫回歸效果的方式
回歸方程(1)和(2)的
R2
分別約為0.7325和0.9983,因此經(jīng)驗回歸方程(2)的刻畫效果比經(jīng)驗回歸方程(1)的好很多.另外,我們還可以用新的觀測數(shù)據(jù)來檢驗?zāi)P偷臄M合效果.事實上,我們還有1968年之后的男子短跑100m世界紀錄數(shù)據(jù),如下表.編號91011121314151617181920t198319881991199119941996199920052007200820082009Y/s9.939.929.909.869.859.849.799.779.749.729.699.58在下面的散點圖中,繪制上表中的散點(綠色),再添加經(jīng)驗回歸方程(1)所對應(yīng)的經(jīng)驗回歸直線(紅色),以及經(jīng)驗回歸方程(2)所對應(yīng)的經(jīng)驗回歸曲線(藍色),得到下圖
.顯然綠色散點分布在藍色經(jīng)驗回歸曲線的附近,遠離紅色經(jīng)驗回歸直線,表明經(jīng)驗回歸方程(2)對于新數(shù)據(jù)的預(yù)報效果遠遠好于(1).x24568y3040605070練:關(guān)于??與??有如下數(shù)據(jù):x24568y3040605070-0.5-3.510-6.50.5-20-1010020解:根據(jù)模型1可得:根據(jù)模型2可得:-1-58-9-3-20-1010020①回歸方程只適用于我們研究的樣本和總體。②回歸方程一般都有時間性。③樣本取值的范圍會影響回歸方程的適用范圍。④不能期望回歸方程得到的預(yù)報值是預(yù)報變量的精確值。注意問題:1)確定解釋變量和預(yù)報變量;2)畫出散點圖;3)確定回歸方程類型;4)求出回歸方程;5)利用相關(guān)指數(shù)或殘差進行分析.建立回歸模型的基本步驟非線性回歸分析對于非線性回歸問題,并且沒有給出經(jīng)驗公式,這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學(xué)過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)的圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù),然后采用適當(dāng)?shù)淖兞看鷵Q,把問題轉(zhuǎn)化為線性回歸問題,使其得到解決.練:
一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集了7組觀測數(shù)據(jù)列于表中:試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程。
解:作散點圖:從散點圖中可以看出產(chǎn)卵數(shù)和溫度之間的關(guān)系并不能用線性回歸模型來很好地近似。這些散點更像是集中在一條指數(shù)曲線或二次曲線的附近。
此時x和z之間的關(guān)系可以用線性回歸直線z=bx+a來擬合。由計算器得:z關(guān)于x的線性回歸方程:
x212325
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025保險公司短期借款合同范本
- 2025簡易店鋪租賃合同范本
- 2025YY餐飲管理公司學(xué)校食堂承包合同樣本
- 2025房屋租賃合同樣本范文
- 2025浙江省新勞動合同范本【全日制】
- 2025合同履行證據(jù)
- 《法律知識普及》課件
- 創(chuàng)業(yè)投資策略課件
- 2025年國有企業(yè)土地使用權(quán)轉(zhuǎn)讓合同示范文本
- 《市場趨勢研討》課件
- 跟著電影去旅游知到智慧樹章節(jié)測試課后答案2024年秋山東大學(xué)(威海)
- 《有機硅乳液防水劑》文本及編制說明
- 學(xué)校基金會的資金籌集與運用策略
- 2021年高考物理試卷(江蘇)(解析卷)
- 調(diào)度室副主任安全生產(chǎn)職責(zé)模版(3篇)
- 2025年中電科太力通信科技限公司招聘高頻重點提升(共500題)附帶答案詳解
- 虛擬現(xiàn)實導(dǎo)覽設(shè)計-洞察分析
- 《設(shè)備房管理標準》課件
- 2025年內(nèi)蒙古呼倫貝爾農(nóng)墾拉布大林上庫力三河蘇沁農(nóng)牧場有限公司招聘筆試參考題庫附帶答案詳解
- 呼吸機故障應(yīng)急演練
- 輕鋼結(jié)構(gòu)大棚施工組織設(shè)計方案
評論
0/150
提交評論