




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第六章直線回歸與相關張菊英復習
已學過的基本統(tǒng)計推斷方法單變量分析(univariateanalysis):t檢驗、u檢驗、2檢驗、秩和檢驗、方差分析多變量分析(multivariateanalysis):人的身高與體重,體溫與脈搏次數(shù),年齡與血壓,藥劑量與療效,體表面積與肺活量,身高與臂長
直線回歸(linearregression)問題的提出例11.1在腦血管疾病的診斷治療中,腦脊液白細胞介素-6(IL-6)水平是影響診斷與預后分析的一項重要指標,但腦脊液臨床上有時又不容易采集到。某醫(yī)生欲用容易測定的血清IL-6含量,來了解急性腦血管病病人腦脊液IL-6水平,隨機抽取了某醫(yī)院確診的10例蛛網(wǎng)膜下腔出血(SAH)患者24小時內血清IL-6(pg/ml)和腦脊液IL-6(pg/ml)數(shù)據(jù)見表11.1,試求腦脊液IL-6對血清IL-6的直線回歸方程。表11.1SAH患者第一天血清和腦脊液
IL-6(pg/ml)檢測結果
患者號
12345678910血清IL-6(x)22.451.658.125.165.979.775.332.496.485.7腦脊液IL-6(y)134.0167.0132.380.2100.0139.1187.297.2192.3199.4
為直觀理解SAH患者血清IL-6和腦脊液IL-6的關系,以血清IL-6為橫軸,腦脊液IL-6為縱軸,描出10對數(shù)據(jù)散點圖如圖11.1。血清IL-6(pg/ml)10080604020腦脊液IL-6(pg/ml)2202001801601401201008060直線回歸目的研究變量之間的數(shù)量依存關系(Y隨著X變化而變化),找出一條最能代表這種數(shù)據(jù)關系的直線。背景
高個子父代的子一代在成年之后的身高平均來說不是更高,而是稍矮于其父代水平,而矮個子父代的子一代的平均身高不是更矮,而是稍高于其父代水平?;靖拍钪本€回歸方程:X為自變量的取值為當X取某一值時應變量Y的平均估計值
函數(shù)關系與回歸關系函數(shù)關系:自變量取某一數(shù)值時,應變量有一個完全確定的數(shù)值與之對應。如:y=2x+1回歸關系:變量間雖然存在一定的關系,但關系不是十分確定。如:SAH患者的血清水平與腦脊液水平,一般情況下,血清水平越高,其腦脊液水平就越高。血清IL-6(pg/ml)10080604020腦脊液IL-6(pg/ml)2202001801601401201008060基本概念直線回歸方程:X為自變量的取值為當X取某一值時應變量Y的平均估計值為截距(intercept),即當X=0時Y的平均估計值a>0a=0a<0基本概念直線回歸方程:為回歸系數(shù)(regressioncoefficient),又稱斜率(slope),是當X每改變一個觀測單位時所引起Y
的改變量。b>0:X每增加(減少)一個觀測單位,增加(減少)b個單位。b<0:X每增加(減少)一個觀測單位,減少(增加)|b|個單位。b=0:X與Y沒有直線回歸關系。b>0b<0b=0原理最小二乘法:實測點到直線的縱向距離平方之和達到最小。基本公式設有n對觀測值(X1,Y1),,(Xn,Yn),記則血清IL-6(pg/ml)10080604020腦脊液IL-6(pg/ml)2202001801601401201008060具體步驟(1)用實測數(shù)據(jù)繪制散點圖(scatterdiagram)(2)計算回歸系數(shù)b與截距a求求
則(3)列出回歸方程
(4)作出回歸直線:在X值實際范圍內任取兩點
(25,102.4535)(50,131.946)血清IL-6(pg/ml)10080604020腦脊液IL-6(pg/ml)2202001801601401201008060一、建立假設檢驗,確定檢驗水準
H0:X與Y之間無回歸關系,即
H1:X與Y之間有某種程度的回歸關系,即二、計算檢驗統(tǒng)計量方差分析:對應變量Y的離均差平方和進行分解P(X,Y)
表示實際值Y與估計值之差,
稱為殘差或剩余。表示估計值與均數(shù)之差,它與回歸系數(shù)的大小有關。當|b|值越大時,差值也越大。方差分析表來源平方和SS自由度均方MS統(tǒng)計量F總總=n-1回歸回=1MS回=SS回/1MS回/MS殘殘差殘=n-2MS殘=SS殘/(n-2)表11.2方差分析結果來源平方和SS自由度均方MS統(tǒng)計量FP總16242.1009回歸8495.883918495.88398.77420.018殘差7746.21618
968.2770
(2)
t檢驗則
t=(b-0)/Sb
,=n-2
本例中,t=2.306,=8
三、確定P值和作出統(tǒng)計判斷
本例P<0.05,按=0.05水準拒絕H0,故可以認為X與Y之間有某種程度的回歸關系,即回歸系數(shù)0。注:直線回歸方程的應用條件平均數(shù)的可信區(qū)間點估計:是在給定X下的條件平均值的點估計的1-α的可信區(qū)間估計
其計算公式為:
為自由度為n-2的t分布的雙側1-臨界值
當時,條件平均值的可信區(qū)間最窄,越遠離時,的可信區(qū)間越寬個體Y值的容許區(qū)間
同一X值下,個體Y值的預報區(qū)間要寬于條件平均值的可信區(qū)間。2、控制:控制是指要求應變量Y在一定范圍內波動時,如何控制自變量X的取值。
例:
為使一名糖尿病人的血糖維持在正常范圍(4.44~6.66mmol/L),根據(jù)資料已建立的直線回歸方程,問欲將血糖水平控制在正常范圍的上界(6.66mmol/L)以內時,胰島素應維持在什么水平上?解得X=32.64(mU/L)注意事項(1)直線通過點()(2)實際意義:從專業(yè)角度對兩個變量內在聯(lián)系有一定認識,不能把毫無關聯(lián)的兩種現(xiàn)象作回歸分析。YX,(3)適用條件
Y為數(shù)值變量且服從正態(tài)分布,X為人為控制或精確測量,一般稱為Ⅰ型回歸。若X,Y服從雙變量正態(tài)分布,則對這種資料進行的回歸稱為Ⅱ型回歸。可計算兩個回歸方程:(4)散點圖:必需有直線趨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大數(shù)據(jù)時代企業(yè)數(shù)據(jù)安全管理制度手冊
- 動力電池再生利用
- 三農村電氣化工程作業(yè)指導書
- 高職護理婦產科復習測試卷附答案
- 附件3醫(yī)院護類人員年終理論考試500題練習試題附答案
- 智能環(huán)保與資源利用作業(yè)指導書
- 項目管理執(zhí)行方案與時間表安排
- 機械設計基礎與制造工藝手冊
- 包裝材料印刷油墨適印性
- 企業(yè)組織架構調整與優(yōu)化指南
- 2023年韶關北江實驗學校小升初招生數(shù)學題
- 眼科學基礎本科
- 小沈陽《四大才子》歡樂喜劇人臺詞
- 交通安全設施作業(yè)指導書
- 優(yōu)秀員工榮譽證書模板
- 神奇的電家長課堂
- 城南舊事讀書匯報教學課件
- 不銹鋼容器制造通用標準工藝守則
- 校園環(huán)境衛(wèi)生檢查及記錄表
- 合同能源管理合同范本模板
- Q∕SY 05006-2016 在役油氣管道 第三方施工管理規(guī)范
評論
0/150
提交評論