



版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第七章
直線回歸與相關(guān)分析回歸和相關(guān)的概念直線回歸分析直線相關(guān)可直線化的線性回歸分析
橄欖球狀的散點圖,中間的點密集,邊沿的點稀少,其主要部分是一個橢圓。為了研究父親與成年兒子身高之間的關(guān)系,卡爾·皮爾遜測量了1078對父子的身高。把1078對用散點圖進(jìn)行描述。許多現(xiàn)象之間都有相互聯(lián)系,例如:身高與體重、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。這里,體溫和脈搏的關(guān)系就比產(chǎn)前檢查與嬰兒體重之間的關(guān)系密切得多,而體重和身高的關(guān)系則介與二者之間。另外,可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;但是,有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說有因果關(guān)系。兩個變量之間的關(guān)系:(1)依存關(guān)系:因變量(dependentvariable)y隨自變量(independentvariable)
x變化而變化,即因果關(guān)系。
——回歸分析(2)互依關(guān)系:變量y與變量x間是平行關(guān)系。
——
相關(guān)分析回歸與相關(guān)的分類回歸的分類:依據(jù)變量多少:一元回歸和多元回歸依據(jù)線性關(guān)系:線性回歸和非線性回歸相關(guān)的分類:簡單相關(guān):僅有兩變量之間的相關(guān)復(fù)相關(guān):一變量與多變量之間的相關(guān),偏相關(guān):其余變量不變的情況下兩變量之間的相關(guān)直線回歸方程的建立直線回歸的數(shù)學(xué)模型和基本假定直線回歸的假設(shè)檢驗直線回歸的區(qū)間估計直線回歸的應(yīng)用及注意問題第一節(jié)
直線回歸直線回歸的任務(wù)就是要找出一個變量隨另一個變量變化的直線方程,我們把這個直線方程叫做直線回歸方程。一、直線回歸方程一般表達(dá)式:a:截距(intercept),直線與y軸交點的縱坐標(biāo),回歸截距。b:斜率(slope),回歸系數(shù)(regressioncoefficient)。意義:x每改變一個單位,y平均改變b個單位。
b>0,y隨x的增大而增大(減少而減少)——斜上;
b<0,y隨x的增大而減?。p少而增加)——斜下;
b=0,y與x無直線關(guān)系——水平。|b|越大,表示y隨x變化越快,直線越陡峭。是與x值相對應(yīng)的依變量0xya>0,b>0a<0,b>0a>0,b<0a=0b=0回歸方程參數(shù)a、b的計算
最小二乘法原則(leastsquaremethod):使各散點到直線的縱向距離的平方和(離差平方和)最小。即使最小。直線一定經(jīng)過“均數(shù)”點!!!SSxyx與y的離均差乘積和編號xy
x2y2
xy11.213.901.464115.21004.719021.304.501.690020.25005.850031.394.201.932117.64005.838041.424.832.016423.32896.858651.474.162.160917.30566.115261.564.932.433624.30497.690871.684.322.822418.66247.257681.724.992.958424.90018.582891.984.703.920422.09009.3060102.105.204.410027.040010.9200合計15.8345.7325.8083210.731973.1380回歸參數(shù)計算的實例
散點圖用x估計y,存在隨機誤差,必須根據(jù)回歸的數(shù)學(xué)模型對隨機誤差進(jìn)行估計,并對回歸方程進(jìn)行檢驗。二、直線回歸的數(shù)學(xué)模型和基本假設(shè)x引起y的變異y的隨機誤差y總體平均數(shù)總體回歸截距,y不依賴x變化的部分總體回歸系數(shù),y依賴x變化的部分隨機誤差,是,也稱為回歸估計誤差、殘差x引起y的變異y的隨機誤差樣本平均數(shù)樣本回歸截距樣本回歸系數(shù)隨機誤差直線回歸分析必須符合的假設(shè):x是沒有誤差的固定變量,y是隨機變量,其誤差是隨機誤差x的任一值都對應(yīng)著一個y總體,且是正態(tài)分布,其平均數(shù)為:,方差為:。隨機誤差ε是獨立的,且是正態(tài)分布。三、直線回歸的假設(shè)檢驗由樣本建立的方程是否有意義呢?即用a、b、e對α、β、ε的估計是否有意義?涉及兩個問題的計算:1.離差平方和2.自由度直線回歸的變異來源y(x,y)實際值與估計值之差,剩余或殘差。估計值與均值之差。1.離差平方和的分解與計算:y的離均差,反映了y的總變異程度。y總變異的平方和,記作SSy誤差因素引起的平方和,稱為離回歸平方和,記作Qx引起y的變異平方和,稱為回歸平方和,記作U2.自由度的分解與計算:3.方差的計算:U=bSP
=-2.5317×(-139.6937)=353.6628Q=SSy
-U=377.2688-353.6628=23.6060【例7.2】計算例7.1資料的回歸平方和、離回歸平方和以及回歸估計標(biāo)準(zhǔn)誤。根據(jù)前面計算結(jié)果,可得:對兩個樣本是否存在線性關(guān)系進(jìn)行F檢驗:4.F檢驗:H0:黏蟲孵化歷期平均溫度x與歷期天數(shù)y之間不存在線性關(guān)系
HA:兩變量間有線性關(guān)系變異來源df
SS
s2
F
F0.05
F0.01
回歸1353.6628353.6628
89.89**5.9913.74
離回歸623.60603.9343
總變異7377.2688【例7.3】用F檢驗的方法檢驗例7.1資料直線回歸關(guān)系的顯著性:t檢驗的結(jié)果與F檢驗結(jié)果是一樣的:5.t檢驗:【例7.4】用t檢驗的方法檢驗例7.1資料直線回歸關(guān)系的顯著性:否定H0:β=0,接受HA:β≠0,認(rèn)為黏蟲孵化歷期平均溫度與歷期天數(shù)間有真實直線回歸關(guān)系。同一概率值F(單尾)值(df1=1,df2=n-2)t值(兩尾)(df=n-2)三、直線回歸的區(qū)間估計1.回歸截距和回歸系數(shù)的置信區(qū)間
【例7.5】計算例7.1資料回歸截距和回歸系數(shù)的95%置信區(qū)間95%的樣本回歸截距落在該區(qū)間內(nèi)95%的樣本回歸系數(shù)落在該區(qū)間內(nèi)2.
μy/x的置信區(qū)間和單個y的預(yù)測區(qū)間不受隨機誤差的影響【例7.6.1】黏蟲孵化歷期平均溫度為15℃時,歷期平均天數(shù)為多少天(取95%置信概率)?受隨機誤差的影響【例7.6.2】某年的歷期平均溫度為15℃時,該年的歷期天數(shù)為多少天(取95%置信概率)?3.μy/x和單個y觀測值置信區(qū)間圖示【例7.7】制作例7.1資料μy/x的95%置信區(qū)間和單個y的95%預(yù)測區(qū)間圖。
x=時,和sy的估計值取最小值,即μy/x和單個y的估計區(qū)間最小。(1)x(2)μy/x的95%置信區(qū)間的計算y的95%預(yù)測區(qū)間的計算(3)(4)(5)[L1,L2](6)sy(7)t0.05sy(8)[L1,L2]1226.71.473.623.130.32.476.020.632.71324.11.243.021.127.22.345.718.429.91421.61.032.519.124.12.245.516.127.11519.10.862.117.021.22.165.313.824.41616.50.741.814.718.32.125.211.421.71714.00.701.712.315.72.105.18.919.21811.50.771.99.613.32.135.26.316.7198.90.912.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江省金華市云富高級中學(xué)高中生物第七章第17課時人類對全球環(huán)境的影響校本作業(yè)必修3
- 跨國公司財務(wù)管理中的現(xiàn)金流管理
- 高效能工作環(huán)境下安全操作流程的生產(chǎn)計劃制定
- 跨境電商平臺用戶行為分析與營銷策略優(yōu)化
- 高中語文作文甩開步子踏出精彩人生
- 高效能辦公人員的體能提升策略
- 財務(wù)風(fēng)險管理在醫(yī)療領(lǐng)域的應(yīng)用
- 高效籌備學(xué)校運動會的策略與實踐
- 時尚耳環(huán)售后合同范本
- 跨文化交流中的語言學(xué)習(xí)與適應(yīng)
- 高中雷雨完整省公開課金獎全國賽課一等獎微課獲獎?wù)n件
- 施工現(xiàn)場安全標(biāo)準(zhǔn)化施工手冊(匯編)
- 《串珠》教案-2024鮮版
- 藥物超敏反應(yīng)綜合征并人類免疫缺陷病毒感染1例及文獻(xiàn)復(fù)習(xí)
- 經(jīng)濟數(shù)學(xué)(高等職業(yè))全套教學(xué)課件
- 口腔種植學(xué)試題
- 網(wǎng)絡(luò)傳播概論(彭蘭第5版) 課件全套 第1-8章 網(wǎng)絡(luò)媒介的演變-網(wǎng)絡(luò)傳播中的“數(shù)字鴻溝”
- 口服止痛藥物健康宣教
- 超載限位器調(diào)試報告
- 智能微電網(wǎng)應(yīng)用技術(shù)
- 被執(zhí)行人生活費申請書范文
評論
0/150
提交評論