7直線回歸分析_第1頁(yè)
7直線回歸分析_第2頁(yè)
7直線回歸分析_第3頁(yè)
7直線回歸分析_第4頁(yè)
7直線回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、直線回歸分析linear regression兩變量之間的關(guān)系無(wú)關(guān)系確定性關(guān)系(函數(shù)關(guān)系)有關(guān)系非確定性關(guān)系(回歸關(guān)系)醫(yī)學(xué)領(lǐng)域里常常需要研究?jī)蓚€(gè)變量之間的關(guān)系,例如:人的身高與體重,體溫與脈搏次數(shù),年齡與血壓,藥劑量與療效,體表面積與肺活量, 身高與臂長(zhǎng)兩變量關(guān)系的密切程度可以用直線相關(guān)衡量;兩變量的數(shù)量變化關(guān)系可以用直線回歸衡量。函數(shù)關(guān)系與回歸關(guān)系函數(shù)關(guān)系:自變量X取某一數(shù)值時(shí),應(yīng)變量Y有一個(gè)完全確定的數(shù)值與之對(duì)應(yīng)。如: y = 2p x回歸關(guān)系:兩個(gè)變量間的取值并非完全的一一對(duì)應(yīng), 而是具有某一種隨機(jī)性的“趨勢(shì)”?;貧w問(wèn)題的研究起源于生物學(xué)界。1886年英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家FGalto

2、n 在他的一篇著名論文中提出。Regression 釋義主要內(nèi)容 直線回歸方程的建立 直線回歸的統(tǒng)計(jì)推斷 直線回歸的應(yīng)用 直線回歸需注意的問(wèn)題 直線回歸與直線相關(guān)的聯(lián)系與區(qū)別直線回歸概念直線回歸(linearregression)用來(lái)研究?jī)蓚€(gè)連續(xù)型變量之間數(shù)量上的線性依存關(guān)系。因變量(dependent variable) 常用y表示自變量(independent variable) 常用x表示例14.1某研究欲探討男性腰圍與腹腔內(nèi)脂肪面積的關(guān)系,對(duì)20名男性志愿受試者測(cè)量其腰圍(cm),并采用磁共振成像法測(cè)量其腹腔內(nèi)脂肪面積(cm2),結(jié)果如表14.1所示。試建立腹腔內(nèi)脂肪面積和腰圍的直線回

3、歸方程。表 14.120 名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測(cè)量值腹腔內(nèi)脂肪面積(cm2)腰圍(cm)編號(hào)123456789101181.385.685.987.879.082.595.296.194.490.693.569.861.280.375.575.785.4102.599.697.8100.9108.2130120110100908070607580859095100105腰圍 (cm)圖14.1 兩變量直線回歸關(guān)系散點(diǎn)圖腹腔內(nèi)脂肪面積 (cm2)直線回歸方程: y = a + bx x為自變量的取值y 為當(dāng)x取某一值時(shí)應(yīng)變量y的平均估計(jì)值 a 為截距(intercept),即當(dāng)

4、 x = 0時(shí)y的平均估計(jì)值 b 為回歸系數(shù)(regression coefficient),表示改變一個(gè)單位 x 時(shí)y的平均改變量。y = a + bx直線方程:估計(jì)值 YY= 2.5211 + 0.2358 X的意義 X=11時(shí),Y =5.145,即體重為 11 kg 的三歲女童, 其平均體表面積之估計(jì)為 5.145 (103cm2); X=15時(shí),Y =6.099,即體重為 15 kg 的三歲女童, 其平均體表面積之估計(jì)為 6.099 (103cm2). 給定X時(shí),Y的平均估計(jì)值。 時(shí),Y = Y 當(dāng)X = X由體重(kg)估計(jì)體表面積(103cm2 )Y(Y 的估計(jì)值)5.1455.3

5、365.3835.4555.6465.7895.9566.0756.1466.337X(體重,kg)11.011.812.012.313.113.714.414.915.216.0Y(體表面積)5.2835.2995.3585.2925.6026.0145.8306.1026.0756.411Y - Y的意義Y - Y 為殘差 (residual) :由回歸方程y = b0+ b x知,當(dāng)自變量取某值x時(shí),因變量為 y ,而實(shí)際觀察值卻時(shí)y,兩者之差為殘差(residual),即點(diǎn)到直線的縱向距離。6.56.05.55.0111213141516ya 0a = 0a 00xb0:x 每增加(減

6、少)一個(gè)觀測(cè)單位,y 增加(減少)b個(gè)單位。b0b0:x每增加(減少)一個(gè)觀測(cè)單位,y|b|個(gè)單位。減少(增加)b=0b=0:x與 y 沒(méi)有直線回歸關(guān)系?;貧w方程的估計(jì)原理:最小二乘法(least square method)各實(shí)測(cè)點(diǎn)到直線的縱向距離平方之和達(dá)到最小計(jì)算公式b = lxy= (x - x )( y - y)(x - x )2lxxa = y - bx其中= x2 -( x)2 / n= y2 - ( y)2 / n= xy -( x y) / nlxxlyylxy本例= x2 - ( x)2 / n = 950.778= y2 - ( y)2 / n = 7293.650= x

7、y - ( x y) / n = 2006.649lxxlyylxyb = lxy= 2006.649 = 2.11053lxx950.778a = y - bx = 95.645 - 2.11053 90.990 = -96.39212故所求回歸方程為:y = -96.39212 + 2.11053x腰圍每增加1cm,腹腔內(nèi)脂肪面積平均增加2.11053cm2。直線回歸的統(tǒng)計(jì)推斷 樣本回歸系數(shù)b 總體回歸系數(shù) 對(duì)的兩種假設(shè)檢驗(yàn)方法: 方差分析法 t檢驗(yàn)法11.5因變量總變異的分解YP(X,Y) (Y - Y)(Y - Y)Y (Y - Y)YYX總變異的分解( y - y)2 = ( y -

8、 y)2 + ( y - y)2即:SS總 = SS回 + SS殘SS總:總離均差平方和 (不考慮回歸關(guān)系的總變異)SS回:回歸平方和(總變異中可以用回歸關(guān)系所解釋的部分。值越大,說(shuō)明回歸效果越好。)SS殘 :殘差平方和(總平方和中無(wú)法用回歸關(guān)系解釋的部分隨機(jī)誤差)自由度的分解n總=n回+n 殘n總 = n -1,n回 = 1,n 殘 = n - 2,構(gòu)造F統(tǒng)計(jì)量=SS回 /n回F = MS 回SS殘 /n 殘MS殘方差分析表自由度n平方和SS均方MS來(lái)源統(tǒng)計(jì)量FSS總 = S(y - y)2n總=n-1總n回=1SS= S(y - y)2回歸MS回=SS回/1MS回/MS殘回MS殘=SS殘/

9、(n-2)SS殘 = S(y - y)n殘差2=n-2殘本例1.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)H0 : b = 0 ,即腹腔內(nèi)脂肪面積與腰圍之間無(wú)直線回歸關(guān)系H1 : b 0 ,即腹腔內(nèi)脂肪面積與腰圍之間有直線回歸關(guān)系a =0.052.計(jì)算檢驗(yàn)統(tǒng)計(jì)量= ( y - y)2 = l= 7293.650SSyy總= b2l= 4235.086- SS回 = 3058.564SSxx回SS殘 = SS總SS回 /n回SS殘 /n殘MS回= 4235.086 /1F = 24.924MS殘3058.564 /18直線回歸的方差分析表n變異來(lái)源SSMSFP 0.01回歸4235.0863058.564729

10、3.650118194235.086169.92024.924殘差總變異3.確定P值,作出統(tǒng)計(jì)推斷P0.01,按照0.05檢驗(yàn)水準(zhǔn)拒絕H0。回歸方程有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為腹腔內(nèi)脂肪面積與腰圍之間有直線回歸關(guān)系。t檢驗(yàn)法b -0n =n -2公式:t=bSbSy xSS殘其中: S=Sy xn - 2blxx本例SS殘3058.564 = 13.03535=Syx n - 220 - 2Syx = 13.03535S= 0.42275bl950.778xxb= 2.11053 = 4.9924t=bS0.42275b 查t界值表 ,得P0.001,結(jié)論與方差分析法一致 實(shí)際上:對(duì)同一資料作總體回

11、歸系數(shù)是否為0 的假設(shè)檢驗(yàn),方差分析和t 檢驗(yàn)是一致的。tb=F總體回歸系數(shù)的區(qū)間估計(jì)b ta / 2,(n-2) Sb本例:(2.11053 - 2.1010.42275, 2.11053 + 2.1010.42275) = (1.222, 2.999)決定系數(shù)(coefficient of determination)= SS 回R2SS總R2反映了回歸貢獻(xiàn)的相對(duì)程度,即在因變量 y的總變異中用y與x回歸關(guān)系所能解釋的比例。在實(shí)際應(yīng)用中,常用決定系數(shù)來(lái)反映回歸的實(shí)際效果。本例決定系數(shù)為0.581直線回歸分析的應(yīng)用 因變量總體條件均數(shù)的置信區(qū)間估計(jì) 應(yīng)變量個(gè)體y值的預(yù)測(cè)區(qū)間總體條件均數(shù)的置信區(qū)間估計(jì) 點(diǎn)估計(jì):yp 是在給定x=xp下的條件平均值的點(diǎn)估計(jì)yp 的1-的置信區(qū)間估計(jì)公式為: ta / 2,(n-2) S yy pp其中:( x- x )21np= S+Sy xy plxx應(yīng)變量個(gè)體y值的預(yù)測(cè)區(qū)間對(duì)于給定的x=xp,y值的預(yù)測(cè)區(qū)間 ta / 2,n Sy|xpyp計(jì)算公式為:( x- x )2其中:1np= S1 +Sy xy| xplxx二者的區(qū)別(置信帶和預(yù)測(cè)帶)130120110100908

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論