版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.2.1一元線性回歸模型內(nèi)容索引復習回顧典例分析探究新知隨堂練習01030204課堂小結(jié)05課后作業(yè)06判斷下列情境中兩個變量是否是相關(guān)關(guān)系?復習回顧1.正方形面積y與邊長x的關(guān)系2.子女身高y與父親身高x的關(guān)系3.糧食產(chǎn)量y與種植面積x的關(guān)系4.某商品價格不變情況下,該商品銷售利潤y與銷售量x的關(guān)系×√×√思考:是否能建立適當?shù)慕y(tǒng)計模型來刻畫兩個隨機變量之間的相關(guān)關(guān)系,并通過模型進行預測?探究新知探究1:生活經(jīng)驗告訴我們,兒子的身高與父親的身高相關(guān).一般來說,父親的身高較高時,兒子的身高通常也較高。為了進一步研究兩者之間的關(guān)系,有人調(diào)查了14名男大學生的身高及其父親的身高,得到的數(shù)據(jù)如表所示:編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182散點大致分布在一條從左下角到右上角的直線附近,表明兒子身高和父親身高線性相關(guān).利用統(tǒng)計軟件,求得樣本相關(guān)系數(shù)為r≈0.886,表明兒子身高和父親身高正線性相關(guān),且相關(guān)程度較高探究新知探究2:根據(jù)表格及圖形,兒子身高和父親身高這兩個變量之間的關(guān)系可以用函數(shù)模型刻畫嗎?不能表中的數(shù)據(jù),存在父親身高相同而兒子身高不同的情況.例如,第6個和第8個觀測父親的身高均為172cm,而對應的兒子的身高為176cm和174cm;同樣在第3,4個觀測中,兒子的身高都是170cm,而父親的身高分別為173cm,169cm.可見兒子的身高不是父親身高的函數(shù)同樣父親的身高也不是兒子身高的函數(shù),所以不能用函數(shù)模型來刻畫.探究新知探究3:從成對樣本數(shù)據(jù)的散點圖和樣本相關(guān)系數(shù)可以發(fā)現(xiàn),散點大致分布在一條直線附近表明兒子身高和父親身高有較強的線性關(guān)系。我們可以這樣理解,由于有母親的身高、生活的環(huán)境、飲食習慣、營養(yǎng)水平、體育鍛煉等隨機的因素的存在,使兒子身高和父親身高有關(guān)系但不是函數(shù)關(guān)系。能否考慮到這些隨機因素的作用,用類似于函數(shù)的表達式,表示兒子身高y與父親身高x的關(guān)系?用e表示各種其他隨機因素影響之和,稱e為隨機誤差,由于兒子身高與父親身高線性相關(guān),所以y=bx+a+e探究新知用x表示父親身高,Y表示兒子身高,e表示隨機誤差,假定隨機誤差e的均值為0,方差為與父親身高無關(guān)的定值
,則它們之間的關(guān)系可以表示為:(1)我們稱
(1)
式為Y關(guān)于x的一元線性回歸模型(simplelinearregressionmodel)。其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機誤差,模型中的Y也是隨機變量,其值雖然不能由變量x的值確定,但是卻能表示為bx+a與e的和(疊加),前一部分由x所確定,后一部分是隨機的,如果e=0,那么Y與x之間的關(guān)系就可用一元線性函數(shù)模型來描述.定義:一元線性回歸模型探究新知觀察一元線性回歸模型問題1:你能結(jié)合父親與兒子身高的實例,說明該回歸模型的意義嗎?可以解釋為父親身高為
的所有男大學生身高組成一個子總體,該子總體的均值為
,即該子總體的均值與父親的身高是線性函數(shù)關(guān)系.而對于父親身高為
的某一名男大學生,他的身高
并不一定為
,它僅是該子總體的一個觀測值,這個觀測值與均值有一個誤差項yi探究新知觀察一元線性回歸模型問題2:你能結(jié)合具體實例解釋產(chǎn)生模型中隨機誤差項e的原因嗎?(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環(huán)境、飲食習慣和鍛煉時間等.(2)在測量兒子身高時,由于測量工具、測量精度所產(chǎn)生的測量誤差.(3)實際問題中,我們不知道兒子身高和父親身高的相關(guān)關(guān)系是什么,可以利用一元線性回歸模型來近似這種關(guān)系,這種近似關(guān)系也是產(chǎn)生隨機誤差e的原因.探究新知觀察一元線性回歸模型問題3:我們怎樣尋找一條“最好”的直線,使得表示成對樣本數(shù)據(jù)的這些散
點在整體上與這條直線最“接近”?探究新知因此,可以用
來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的整體接近程度。探究新知定義:殘差平方和∴上式是關(guān)于b的二次函數(shù),因此要使Q取得最小值,當且僅當b的取值為探究新知定義:殘差平方和當a,b的取值為時,Q達到最小探究新知其中
,
的取值為定義:經(jīng)驗回歸方程點睛:典例分析問題:利用下表的數(shù)據(jù),依據(jù)用最小二乘估計一元線性回歸模型參數(shù)的公式,求出兒子身高Y關(guān)于父親身高x的經(jīng)驗回歸方程。編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182∵=2425/14=2440/14∴≈0.839≈28.957∴典例分析問題:兒子的身高不一定會是177cm,這是因為還有其他影響兒子身高的因素,回歸模型中的隨機誤差清楚地表達了這種影響,父親的身高不能完全決定兒子的身高,不過,我們可以作出推測,當父親的身高為176cm時,兒子身高一般在177cm左右.如果把父親身高為176cm的所有兒子身高作為一個子總體,那么177cm是這個子總體均值的估計值.隨堂練習A.y平均增加1.5個單位
B.y平均增加2個單位C.y平均減少1.5個單位
D.y平均減少2個單位C隨堂練習AD隨堂練習建立線性回歸模型的基本步驟:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應變量.
(2)畫出解釋變量與響應變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).
(3)由經(jīng)驗確定回歸方程的類型.
(4)按一定規(guī)則(如最小二乘法)估計經(jīng)驗回歸方程中的參數(shù).
(5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《等速萬向節(jié)講義》課件
- 2024年05月廣東廣州銀行資產(chǎn)管理部社會招考筆試歷年參考題庫附帶答案詳解
- 農(nóng)事服務協(xié)議書(2篇)
- 《將廣告加以完善》課件
- 2024年李家峽醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2024年本溪市職業(yè)病醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2025年滬科版九年級化學下冊階段測試試卷
- 2025年滬科版七年級生物下冊階段測試試卷
- 2025年湘教版二年級語文上冊月考試卷
- 2024年華師大版九年級科學上冊階段測試試卷
- 鐵路工程-軌道工程施工工藝及方案
- 福建省福州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細及行政區(qū)劃代碼
- 《高中語文文言斷句》一等獎優(yōu)秀課件
- 上海市中小學生學籍信息管理系統(tǒng)
- (完整版)自動感應門施工方案
- [QC成果]提高剪力墻施工質(zhì)量一次合格率
- 8站小車呼叫的plc控制
- _ 基本粒子與宏觀物體內(nèi)在聯(lián)系
- 象棋比賽積分編排表
- 小學贛美版六年級美術(shù)上冊第二十課向往和平課件(16張)ppt課件
- DPP4抑制劑比較篇PPT課件
評論
0/150
提交評論