統(tǒng)計(jì)學(xué)基礎(chǔ)課件第六章相關(guān)與回歸_第1頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)課件第六章相關(guān)與回歸_第2頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)課件第六章相關(guān)與回歸_第3頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)課件第六章相關(guān)與回歸_第4頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)課件第六章相關(guān)與回歸_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)學(xué)統(tǒng)計(jì)第六關(guān)與交通大學(xué)醫(yī)學(xué)院生物統(tǒng)計(jì)學(xué)教研分機(jī) 1概如體血壓下降值等,而客觀事物在發(fā)展過(guò)程 第一線相事物之間的關(guān)系→職業(yè)種類(lèi)和收入之間的關(guān)系:job 治 和治愈率之間的關(guān)系等等:treat→(這些都是二元的關(guān)系變量間的關(guān)系函數(shù)關(guān)系:相關(guān)關(guān)系:數(shù) 來(lái)表父親身高 3變量間的函數(shù)yy=fC=2x設(shè)有兩個(gè)變xy,變量y隨變x而變化,并完全依賴于x,當(dāng)變量x取某y依確定的關(guān)系取yy=fC=2x是一一對(duì)應(yīng)的確定各觀測(cè)點(diǎn)落在一條4變量間的相關(guān)關(guān)yy=?f yy=?f xy的取值不能由另一個(gè)變x唯一確定當(dāng)變x取某個(gè)值時(shí),變y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線5相關(guān)關(guān)系的Pearson相關(guān)系數(shù):線性相關(guān)系數(shù)或簡(jiǎn)稱(chēng)相關(guān)系r)樣本相關(guān)系數(shù)r

(x1x1)(x2x211 計(jì) (xx11

(xx本的秩。它一般用rs表示6相關(guān)系數(shù)取值及其意r的取值范圍|r|=1,為完全相關(guān)

r=1,為完全正相r=-1,為完全負(fù)相r=0,不 性相關(guān)關(guān)-1r<0,為負(fù)相0r1,為正相完全負(fù)相 無(wú)線性相

完全正相

負(fù)相關(guān)程

r正相關(guān)程r

7變量相關(guān)關(guān)系的類(lèi)因果關(guān)平行關(guān)因果關(guān)平行關(guān)線性相線性相非線性完全相不相r

r=0<r< -1<

r= r=-8相關(guān)關(guān)系的圖r=r=完全正線性相r=-完全負(fù)線性r=非線正線0<r<負(fù)線-1<rBAC不相r=9相關(guān)系相關(guān)系數(shù)的計(jì)r (x1x1)(x2x2 (x

(xx (x1x1)(x2x2)x1x2x1x2x1和x2的離均差積x

x1

x

121x的離均差平121相關(guān)系數(shù)的顯著性檢驗(yàn)(采用t檢驗(yàn) rtr rs

nr1r1rn查t界值表,得P

樣本相關(guān)系數(shù)試驗(yàn)半衰血中測(cè)定尿中試驗(yàn)半衰血中測(cè)定尿中測(cè)定123456789 34 (x

(x

/n1521.16

/12(xx)2x2(x)2/n1286.8-(122)2/12 (x1x1)(x2x2)x1x2(x1x2)/n1386.27-16250.4/1242.6442.641r2n1r2n112

trr/sr0.7205/0.2193 A藥在血中和尿中的半衰期存在正相關(guān) 線性相關(guān)的應(yīng)用的注意事有效范圍:僅限于原資料中X變量和Y變量的實(shí)測(cè)范圍,合并問(wèn)題:對(duì)兩個(gè)樣本合并成一個(gè)樣本進(jìn)行相關(guān)分析,可無(wú)相關(guān)數(shù)據(jù)合并后有相關(guān) 有相關(guān)數(shù)據(jù)合并后無(wú)相關(guān)相關(guān)分析的應(yīng)用的注意事正確解釋的的 .datainputx1x2@@;

例 9.48.58.4 14.81212.4 14.5 9.29.511 9.2;procregmodelx2=x1/p;outputout=rprocunivariatedata=dat1normal;varprocunivariatedata=rnormal;varprocplotplotx1*x2='*'/haxis=by3vaxis=by3;varx1;with 第二節(jié)直線回歸分(因)來(lái)預(yù)測(cè)、控制因變量(果)E(yE(y)=α+?abxy?abxy為應(yīng)變量(dependentx為自變量(independenta為截距(intercept):x等于0時(shí)相應(yīng)的yb為回歸系數(shù)(regressioncoefficient):x每改變一個(gè)單位,y平均改變b個(gè)單位 心臟

y?=4.22+0.20x體設(shè)有n對(duì)(x,y)的觀察值,為了直觀地看出x和y間的變化趨勢(shì),可將每一對(duì)最小來(lái)a和b的方法(y?)2 最小二乘

(x,y(x2,

?ai

,y

(xi,yi blxy/lxx(xx)(yy)/[(xx)2ay?a回歸系數(shù)的統(tǒng)計(jì)學(xué)檢H0:β 當(dāng)H0時(shí),認(rèn)為總體回歸系數(shù)不為零,亦即x與y間存性關(guān)系,一元直線回歸方程有統(tǒng)計(jì)統(tǒng)計(jì)學(xué)檢驗(yàn)可有兩種方歸中二者t檢驗(yàn)法:回歸系數(shù)的顯著性檢驗(yàn)歸中二者回歸系數(shù)的顯著性檢樣本樣本統(tǒng)計(jì)的抽樣分t檢驗(yàn)(xx)2tb(b(xx)2

n?)2?)2

sbsy.x/

sy.x殘差標(biāo)

sy.x(y?)2(yy)2[(xx)(yy)]2/(xsy.x表示應(yīng)變量y在扣除自變量x的線性影響后的離散程度,反映實(shí)際觀察值方差分析法(離差平方和的分解因變量y的取值是不同的,y取值的這種由于自變量x的取值不同造成x以外的其他因素(如x對(duì)y的非線性影響、對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變異的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值yy來(lái)yyyP(x,}y?a}?yxy的總變

x和y的線性關(guān)系引起的變異?y(y

誤差引起的變

(y?總離差平方和

SS=(yy)2

(

y)

(y?)2 2回歸平方和:SS(?2

殘差平方和SS殘差

(y?)三個(gè)平方和的意SS總=(yy)2,ν=n-

y ?

?yy(totalsumof未考慮x與y的回歸關(guān)系時(shí)SS回歸=?y) 為回歸平(regressionsumofsquares)xy的不同而導(dǎo)致?的不x解釋的變異部分。SS回 殘 殘 ,ν=n-亦稱(chēng)剩余平方和或誤差平方和。考慮回歸之后y,是x對(duì)y的線性影響y的變異,即總變異中無(wú)法用x解釋的部分。SS殘差越小,回歸效果越好。(yy(?y)+(y?

P(x,y

?aSS總=SSSS總=回總的自由度:n-

y(總例數(shù)減

}?y回歸自由誤差自由度:n-

(自變量個(gè)數(shù))F回歸均方誤差均方FSSFSS殘n2)查方差分析用的F界值表,得P決定系數(shù)2意義:應(yīng)變量y變異被自變量x反映回歸直線的擬合程度,即回歸方程估測(cè)可靠程度高低取值范01之間 R21,說(shuō)明回歸方程擬合的越好;R20,說(shuō)明回歸決定系數(shù)等于相關(guān)系數(shù)r的平方,即R2=P1436.2律藥電激狗 顫失與 致閾數(shù)6.2。?方法1tb15.1271,523,P0.05方法

SS 479.6948, SS殘6.2889, F228.83,P0.05兩個(gè)檢驗(yàn)是等價(jià)的tb F 228.8315.1271datadat2;inputxy; ;procplotdata=dat2;ploty*x='*';modely=x/p;plot直線回歸的應(yīng)用的注意事直線回歸與相關(guān)的關(guān)檢驗(yàn)完全等價(jià)tb=tr同一資料:rb(x (y回歸解釋相關(guān):決定系數(shù)=(相關(guān)系數(shù)r2 SS回 SS總SS誤SS總 SS總當(dāng)SS總固定不SS回∝r2;回歸平方和是由于引入了相關(guān)變量而使總平方和減少的部分。r2越接近1,說(shuō)區(qū)地xy處于在被解釋的地位,x稱(chēng)變量的變性所涉及的變量x和y都是隨布因變量 是隨實(shí)主要是描述兩個(gè)作量之間線性關(guān)系的影響大?。ɑ貧w單密切程度(相關(guān)位),還可以由回回歸分析的正確應(yīng)應(yīng)用條件(1)線性 (3)給定X時(shí),Y服從正態(tài)分布(normal):殘給定X時(shí),Y是正態(tài)分布、等方差給定X時(shí),Y是正態(tài)分布、不等方差示意 y

yx0x0x 0xx yx

0x y0x0

二.直線回歸的區(qū)間估計(jì)(了解*總體回歸系數(shù)β的可信區(qū)間估(bt/2,(n2)sb,bt/2,(n2)sb*固定xi時(shí),y的總體均數(shù)的可信區(qū)(?t/2,(n2)s?,?t/2,(n2)s? s?

1n

x*固定xi時(shí) y值的容許區(qū)間(即波動(dòng)范圍(?t/2,(n2)sy,?t/2,(n2)sy sy

1n

x影響區(qū)間寬度的1.置信水(1區(qū)間寬度隨置信水平的增大而增2.數(shù)據(jù)的離散程度區(qū)間寬度隨離散程度的增大而增3.樣本容區(qū)間寬度隨樣本容量的增大而減4.用于預(yù)測(cè)的xi與x區(qū)間寬度隨xi與x的差異程度的增大而增置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方y(tǒng)1?1

xi i直線相直線回作彼此相關(guān)r (x1x1)(x2x2(xx)2( x 依存因果關(guān)?abx統(tǒng)計(jì)r→trr/sr b→β1.tbb/2F SSSS/(n2)程proccorrvarx2;withx1*var x1;procreg;modely=x;run;(x=x1;y=x2)rb(x (y r SS /SS trtb 表6.4用兩種方法測(cè)定免耳收縮壓(mmHg)和動(dòng)脈收(mmHg)的測(cè)定記直接記錄 閉合膠囊耳收縮壓 動(dòng)脈收縮壓 耳收縮壓 動(dòng)脈收縮壓1使用回歸建立各自的回歸方建立回歸系數(shù)的假設(shè)H0:12或兩條回歸直線平:12或兩條回歸直線不平建立截距假設(shè)檢驗(yàn)H1:a1a2或兩條回歸直線的截距不相datadogroup=1to2;inputn@@;doi=1ton;inputxy@@;

例75847593909895106961039711010211311412610641151081321261271151401211371211371

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論