衛(wèi)生學(xué) 第十三章 直線相關(guān)與回歸_第1頁
衛(wèi)生學(xué) 第十三章 直線相關(guān)與回歸_第2頁
衛(wèi)生學(xué) 第十三章 直線相關(guān)與回歸_第3頁
衛(wèi)生學(xué) 第十三章 直線相關(guān)與回歸_第4頁
衛(wèi)生學(xué) 第十三章 直線相關(guān)與回歸_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、世間萬物是普遍聯(lián)系的世間萬物是普遍聯(lián)系的 直線相關(guān)直線相關(guān) 直線回歸直線回歸 相關(guān)與回歸分析的關(guān)系相關(guān)與回歸分析的關(guān)系 SpearmanSpearman等級(jí)相關(guān)等級(jí)相關(guān) 1 1、掌握直線相關(guān)與回歸的基本概念。、掌握直線相關(guān)與回歸的基本概念。 2 2、掌握相關(guān)系數(shù)與回歸系數(shù)的意義及計(jì)算。、掌握相關(guān)系數(shù)與回歸系數(shù)的意義及計(jì)算。 3 3、熟悉相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗(yàn)。、熟悉相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗(yàn)。 4 4、掌握相關(guān)系數(shù)與回歸系數(shù)相互的區(qū)別與聯(lián)系。、掌握相關(guān)系數(shù)與回歸系數(shù)相互的區(qū)別與聯(lián)系。 5 5、熟悉直線回歸方程的應(yīng)用。、熟悉直線回歸方程的應(yīng)用。 6 6、了解、了解spearmanspea

2、rman等級(jí)相關(guān)的應(yīng)用。等級(jí)相關(guān)的應(yīng)用。 因果關(guān)系:乙肝病毒感染和乙肝因果關(guān)系:乙肝病毒感染和乙肝 伴隨關(guān)系:丈夫的身高和妻子的身高伴隨關(guān)系:丈夫的身高和妻子的身高 相關(guān)分析:研究變量間相互關(guān)系的密切程相關(guān)分析:研究變量間相互關(guān)系的密切程 度和變化趨勢,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)加以度和變化趨勢,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)加以 表示。表示。 回歸分析:研究變量間數(shù)量上的依存關(guān)系,回歸分析:研究變量間數(shù)量上的依存關(guān)系, 用函數(shù)形式將其表現(xiàn)出來,并用一個(gè)或多用函數(shù)形式將其表現(xiàn)出來,并用一個(gè)或多 個(gè)變量來推測另一個(gè)變量的估計(jì)值及波動(dòng)個(gè)變量來推測另一個(gè)變量的估計(jì)值及波動(dòng) 范圍。范圍。 第一節(jié)第一節(jié) 直線相關(guān)直線相關(guān)

3、相關(guān)就是用于研究和解釋兩個(gè)相關(guān)就是用于研究和解釋兩個(gè) 變量之間變量之間相互相互關(guān)系的。關(guān)系的。 相關(guān)分析:研究變量間相互關(guān)相關(guān)分析:研究變量間相互關(guān) 系的密切程度和變化趨勢,并用適系的密切程度和變化趨勢,并用適 當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)加以表示。當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)加以表示。 相關(guān)系數(shù)相關(guān)系數(shù)(r) 資料性資料性 質(zhì)質(zhì) 直直 線線 相相 關(guān)關(guān) 分析分析正態(tài)分布正態(tài)分布的兩個(gè)隨機(jī)變量的兩個(gè)隨機(jī)變量x x與與y y是是 否有直線相關(guān)關(guān)系以及相關(guān)的性質(zhì)和相否有直線相關(guān)關(guān)系以及相關(guān)的性質(zhì)和相 關(guān)的密切程度。關(guān)的密切程度。 審核資料的性質(zhì)審核資料的性質(zhì) 繪制散點(diǎn)圖,判斷是否存在相關(guān)關(guān)系繪制散點(diǎn)圖,判斷是否存在相關(guān)關(guān)系 求出

4、相關(guān)系數(shù),判斷相關(guān)的強(qiáng)度和性質(zhì)求出相關(guān)系數(shù),判斷相關(guān)的強(qiáng)度和性質(zhì) 進(jìn)行假設(shè)檢驗(yàn),判斷是本質(zhì)因素還是抽樣進(jìn)行假設(shè)檢驗(yàn),判斷是本質(zhì)因素還是抽樣 誤差誤差 為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該 收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對的。收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對的。 例如,每人的身高和體重。然后在直角坐例如,每人的身高和體重。然后在直角坐 標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為散點(diǎn)標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為散點(diǎn) 圖。圖。 為了研究父親與成年兒子身高之間的關(guān)系,卡爾為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測皮爾遜測 量了量了1078對父子的身高。把對父子的

5、身高。把1078對數(shù)字表示在坐標(biāo)上,對數(shù)字表示在坐標(biāo)上, 它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀 少,其主要部分是一個(gè)橢圓。少,其主要部分是一個(gè)橢圓。 A B y x 一、相關(guān)系數(shù)一、相關(guān)系數(shù)r(r() )及其意義及其意義 它反映具有直線關(guān)系的兩個(gè)變量之它反映具有直線關(guān)系的兩個(gè)變量之 間,相關(guān)的性質(zhì)和密切程度的指標(biāo)。樣間,相關(guān)的性質(zhì)和密切程度的指標(biāo)。樣 本相關(guān)系用本相關(guān)系用r r來表示,總體相關(guān)系用來表示,總體相關(guān)系用來來 表示表示其取值范圍是其取值范圍是-1r1-1r1。 r r為正表示正相關(guān)關(guān)系,為正表示正相關(guān)關(guān)系,x x與與y

6、 y同向變化;同向變化; r r為負(fù)表示負(fù)相關(guān)關(guān)系,為負(fù)表示負(fù)相關(guān)關(guān)系,x x與與y y反向變化。反向變化。 r r的絕對值越接近的絕對值越接近1 1,線性關(guān)系越密切;,線性關(guān)系越密切; r r的絕對值越接近的絕對值越接近0 0,線性關(guān)系越不密切。,線性關(guān)系越不密切。 r=1r=1,為完全相關(guān);,為完全相關(guān);r=0r=0,為零相關(guān)。,為零相關(guān)。 r0.7:高度相關(guān)(強(qiáng)相關(guān)):高度相關(guān)(強(qiáng)相關(guān)) 0.4r0.7:中度相關(guān)(中相關(guān)):中度相關(guān)(中相關(guān)) 0.2r0.4:低相關(guān)(弱相關(guān)):低相關(guān)(弱相關(guān)) r0.2:可乎略不計(jì):可乎略不計(jì) 正相關(guān) 負(fù)相關(guān) 完全正相關(guān) 零相關(guān) (相關(guān)背景知識(shí)) y x

7、 二、 相關(guān)系數(shù)的計(jì)算 r的大小的大小 變量之間關(guān)聯(lián)的密切程度變量之間關(guān)聯(lián)的密切程度 符號(hào)的正負(fù)符號(hào)的正負(fù) 關(guān)聯(lián)的性質(zhì)關(guān)聯(lián)的性質(zhì) 一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量雌三醇含量與產(chǎn)兒的與產(chǎn)兒的 體重體重有關(guān)。于是設(shè)想,通過測量待產(chǎn)婦尿中雌三有關(guān)。于是設(shè)想,通過測量待產(chǎn)婦尿中雌三 醇含量,可以預(yù)測產(chǎn)兒體重,以便對低出生體重醇含量,可以預(yù)測產(chǎn)兒體重,以便對低出生體重 進(jìn)行預(yù)防。因此收集了進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦例待產(chǎn)婦24小時(shí)的尿,小時(shí)的尿, 測量其中的雌三醇含量,同時(shí)記錄產(chǎn)兒的體重。測量其中的雌三醇含量,同時(shí)記錄產(chǎn)兒的體重。 問如何進(jìn)行統(tǒng)計(jì)學(xué)分析?問如何進(jìn)行統(tǒng)計(jì)學(xué)分

8、析? 分析問題:目的、變量、關(guān)系分析問題:目的、變量、關(guān)系 編號(hào)編號(hào) (1) 尿雌三醇尿雌三醇 mg/24h(2) 產(chǎn)兒體重產(chǎn)兒體重 kg(3) 編號(hào)編號(hào) (1) 尿雌三醇尿雌三醇 mg/24h(2) 產(chǎn)兒體重產(chǎn)兒體重 kg(3) 172.517173.2 292.518253.2 392.519273.4 4122.720153.4 5142.721153.4 6162.722153.5 7162.423163.5 8143.024193.4 9163.025183.5 10163.126173.6 11173.027183.7 12193.128203.8 13213.029224.0 1

9、4242.830253.9 15153.231244.3 16163.2 1 2 3 4 5 51015202530 尿雌三醇含量(mg/24h)尿雌三醇含量(mg/24h) 產(chǎn)兒體重(kg)產(chǎn)兒體重(kg) 待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系 X=534 Y=99.2 X2=9876 Y2=324.8 XY=1750 n=31 從計(jì)算結(jié)果可以知道,從計(jì)算結(jié)果可以知道,31例待產(chǎn)婦尿中雌三醇含例待產(chǎn)婦尿中雌三醇含 量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)是0.61。 問題:我們能否得出結(jié)論:問題:我們能否得出結(jié)論:待產(chǎn)待產(chǎn) 婦尿中雌三

10、醇含量與產(chǎn)兒體重之婦尿中雌三醇含量與產(chǎn)兒體重之 間成正相關(guān),相關(guān)系數(shù)是間成正相關(guān),相關(guān)系數(shù)是0.61? 為什么?為什么? 上例中的相關(guān)系數(shù)上例中的相關(guān)系數(shù)r等于等于0.61,說明了,說明了31例樣本中雌三例樣本中雌三 醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只例只 是是總體總體中的中的一個(gè)樣本一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣,由此得到的相關(guān)系數(shù)會(huì)存在抽樣 誤差。誤差。 因?yàn)?,總體相關(guān)系數(shù)因?yàn)椋傮w相關(guān)系數(shù)( )為零時(shí),由于抽樣誤差,從為零時(shí),由于抽樣誤差,從 總體抽出的總體抽出的31例,其例,其r可能不等于零。可能不等于零。 這就要對這就

11、要對r進(jìn)行假設(shè)檢驗(yàn),判斷進(jìn)行假設(shè)檢驗(yàn),判斷r不等于零是由于抽樣誤不等于零是由于抽樣誤 差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。 y t t 檢驗(yàn)檢驗(yàn) 查表法查表法 對相關(guān)系數(shù)的假設(shè)檢驗(yàn),常用對相關(guān)系數(shù)的假設(shè)檢驗(yàn),常用t檢驗(yàn),選檢驗(yàn),選 用統(tǒng)計(jì)量用統(tǒng)計(jì)量t的計(jì)算公式如下:的計(jì)算公式如下: =n-2 zH0 : =0 H1 : 0 =0.05 r=0.61, n=31, 代入公式代入公式t= =n-2=31-2=29 查查t值表,值表,t0.05(29)=2.045 上述計(jì)算上述計(jì)算t=4.142.045,由,由t所推斷的所推斷的P值小于值小于0.05,

12、按,按 =0.05水準(zhǔn)拒絕水準(zhǔn)拒絕H0,接受,接受H1認(rèn)為臨產(chǎn)婦認(rèn)為臨產(chǎn)婦2424小時(shí)內(nèi)尿中小時(shí)內(nèi)尿中 雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。 根據(jù)自由度查相關(guān)系數(shù)根據(jù)自由度查相關(guān)系數(shù)r界值表:界值表: 課本課本P343頁表頁表13-3 =n-2=31-2=29,=0.05 r0.05( (29)=0.355 r=0.61r0.05( (29)=0.355 P100n100),并對),并對r r進(jìn)進(jìn) 行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí),行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí),r r的絕對值大于的絕對值大于 等于等于0.70.7,則表示兩個(gè)變量高度相關(guān);,則表示兩個(gè)變量高度相關(guān)

13、;r r的絕對的絕對 值大于等于值大于等于0.40.4,小于,小于0.70.7時(shí),則表示兩個(gè)變量時(shí),則表示兩個(gè)變量 之間中度相關(guān);之間中度相關(guān);r r的絕對值大于等于的絕對值大于等于0.20.2,小于,小于 0.40.4時(shí),則兩個(gè)變量低度相關(guān)。時(shí),則兩個(gè)變量低度相關(guān)。 r0.7:高度相關(guān)(強(qiáng)相關(guān)):高度相關(guān)(強(qiáng)相關(guān)) 0.4r0.7:中度相關(guān)(中相關(guān)):中度相關(guān)(中相關(guān)) 0.2r0.4:低相關(guān)(弱相關(guān)):低相關(guān)(弱相關(guān)) r0.2:可忽略不計(jì):可忽略不計(jì) 存在相關(guān)關(guān)系,存在相關(guān)關(guān)系, 一定是因果關(guān)系嗎?一定是因果關(guān)系嗎? 識(shí)字?jǐn)?shù),鞋大小識(shí)字?jǐn)?shù),鞋大小 游泳票與冰激凌銷售量游泳票與冰激凌銷售量

14、 排除其它變量的干擾排除其它變量的干擾 前面我們討論了待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體前面我們討論了待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體 重之間的關(guān)系,知道了二者之間成正相關(guān)。那么,重之間的關(guān)系,知道了二者之間成正相關(guān)。那么, 如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能 推斷出產(chǎn)兒的體重嗎?推斷出產(chǎn)兒的體重嗎?或產(chǎn)兒的體重可能在什么或產(chǎn)兒的體重可能在什么 范圍內(nèi)呢?范圍內(nèi)呢? 還有,隨著身高的增加,體重也在增大,它們之還有,隨著身高的增加,體重也在增大,它們之 間也成正相關(guān)關(guān)系。那么,身高每增加間也成正相關(guān)關(guān)系。那么,身高每增加1 1厘米,厘米, 體重增加多少克呢

15、?體重增加多少克呢? 上面的相關(guān)關(guān)系分析不能提供給我們需要的答案上面的相關(guān)關(guān)系分析不能提供給我們需要的答案, , 這些要用直線回歸的方法來解決。這些要用直線回歸的方法來解決。 當(dāng)我們知道了兩個(gè)變量之間有直線相關(guān)關(guān)系,當(dāng)我們知道了兩個(gè)變量之間有直線相關(guān)關(guān)系, 并且一個(gè)變量的變化會(huì)引起另一個(gè)變量的變化,并且一個(gè)變量的變化會(huì)引起另一個(gè)變量的變化, 這時(shí),如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系,這時(shí),如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系, 它們的變化可用函數(shù)方程來表示,叫它們是函它們的變化可用函數(shù)方程來表示,叫它們是函 數(shù)關(guān)系,它們之間的關(guān)系式叫函數(shù)方程。數(shù)關(guān)系,它們之間的關(guān)系式叫函數(shù)方程。 但在實(shí)際生活當(dāng)中,

16、由于其它因素的干擾,許但在實(shí)際生活當(dāng)中,由于其它因素的干擾,許 多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系, 不能用函數(shù)方程反映,為了區(qū)別于兩變量間的不能用函數(shù)方程反映,為了區(qū)別于兩變量間的 函數(shù)方程,我們稱這種關(guān)系式為函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程直線回歸方程, 這種關(guān)系為直線回歸這種關(guān)系為直線回歸. . 直線回歸就是用來描述直線回歸就是用來描述 一個(gè)變量如何一個(gè)變量如何依賴于依賴于另一個(gè)變量另一個(gè)變量 自變量(自變量(independent variableindependent variable):在一對變):在一對變 量中,一個(gè)變量的數(shù)據(jù)變

17、化引起另一變量數(shù)據(jù)量中,一個(gè)變量的數(shù)據(jù)變化引起另一變量數(shù)據(jù) 發(fā)生相應(yīng)的變動(dòng)發(fā)生相應(yīng)的變動(dòng), ,這一變量數(shù)據(jù)的變動(dòng)是另一這一變量數(shù)據(jù)的變動(dòng)是另一 變量數(shù)據(jù)變動(dòng)的前提條件,稱此變量為自變量。變量數(shù)據(jù)變動(dòng)的前提條件,稱此變量為自變量。 常用常用X X表示。表示。 應(yīng)變量(應(yīng)變量( dependent variabledependent variable):因自變量):因自變量 的改變而改變的變量。常用的改變而改變的變量。常用Y Y表示。表示。 直線回歸的任務(wù)就是要找出一個(gè)變量隨直線回歸的任務(wù)就是要找出一個(gè)變量隨 另一個(gè)變量變化的直線方程,我們把這另一個(gè)變量變化的直線方程,我們把這 個(gè)直線方程叫做直線

18、回歸方程個(gè)直線方程叫做直線回歸方程。 式中的式中的X X為自變量為自變量 式中的式中的是由自變量是由自變量X X推算應(yīng)變量推算應(yīng)變量Y Y的估計(jì)值,的估計(jì)值, a a是回歸直線在是回歸直線在Y Y 軸上的截距,即軸上的截距,即X=0X=0時(shí)的時(shí)的Y Y值;值; b b為樣本的回歸系數(shù),即回歸直線的斜率,表示為樣本的回歸系數(shù),即回歸直線的斜率,表示 當(dāng)當(dāng)X X變動(dòng)一個(gè)單位時(shí),變動(dòng)一個(gè)單位時(shí),Y Y平均變動(dòng)平均變動(dòng)b b個(gè)單位。個(gè)單位。 如果如果a a、b b已知,代入上式,就可求得直線回歸已知,代入上式,就可求得直線回歸 方程。方程。 b b0 0,表示,表示Xy Xy b b0 0,表示,表示

19、X yX y b=0 b=0 ,表示直線與,表示直線與X X軸平行,即軸平行,即X X與與Y Y無直無直 線回歸關(guān)系線回歸關(guān)系 x x(自變量):(自變量):一般是可以精確測量和嚴(yán)一般是可以精確測量和嚴(yán) 格控制的變量(如年齡、藥物劑量)。格控制的變量(如年齡、藥物劑量)。 y y(應(yīng)變量):(應(yīng)變量):為依賴于為依賴于x x呈正態(tài)分布的呈正態(tài)分布的 隨機(jī)變量。隨機(jī)變量。 注意:注意:收集資料時(shí),收集資料時(shí),x x與與y y是成對觀察的是成對觀察的 審核資料的性質(zhì)審核資料的性質(zhì) 在普通坐標(biāo)系中作散點(diǎn)圖在普通坐標(biāo)系中作散點(diǎn)圖 求求b b和和a a,列出回歸方程:,列出回歸方程: =a+bx=a+b

20、x 畫出回歸直線畫出回歸直線 回歸系數(shù)的假設(shè)檢驗(yàn)回歸系數(shù)的假設(shè)檢驗(yàn) 求回歸系數(shù)求回歸系數(shù) 求常數(shù)求常數(shù) a a 和和 b b 的估計(jì)常用最小二乘原則的估計(jì)常用最小二乘原則 所有的點(diǎn)離回歸線的縱向距離最近所有的點(diǎn)離回歸線的縱向距離最近 回歸線必然通過回歸線必然通過 p(x,y) x, 0,a 一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量雌三醇含量與與 產(chǎn)兒的產(chǎn)兒的體重體重有關(guān)。于是設(shè)想,通過測量待有關(guān)。于是設(shè)想,通過測量待 產(chǎn)婦尿中雌三醇含量,可以預(yù)測產(chǎn)兒體重,產(chǎn)婦尿中雌三醇含量,可以預(yù)測產(chǎn)兒體重, 以便對低出生體重進(jìn)行預(yù)防。因此收集了以便對低出生體重進(jìn)行預(yù)防。因此收集了 31例待

21、產(chǎn)婦例待產(chǎn)婦24小時(shí)的尿,測量其中的雌小時(shí)的尿,測量其中的雌 三醇含量,同時(shí)記錄產(chǎn)兒的體重。問如何三醇含量,同時(shí)記錄產(chǎn)兒的體重。問如何 進(jìn)行統(tǒng)計(jì)學(xué)分析?進(jìn)行統(tǒng)計(jì)學(xué)分析? 編號(hào)編號(hào) (1) 尿雌三醇尿雌三醇 mg/24h(2) 產(chǎn)兒體重產(chǎn)兒體重 kg(3) 編號(hào)編號(hào) (1) 尿雌三醇尿雌三醇 mg/24h(2) 產(chǎn)兒體重產(chǎn)兒體重 kg(3) 172.517173.2 292.518253.2 392.519273.4 4122.720153.4 5142.721153.4 6162.722153.5 7162.423163.5 8143.024193.4 9163.025183.5 10163.

22、126173.6 11173.027183.7 12193.128203.8 13213.029224.0 14242.830253.9 15153.231244.3 16163.2 1 2 3 4 5 51015202530 尿雌三醇含量(mg/24h)尿雌三醇含量(mg/24h) 產(chǎn)兒體重(kg)產(chǎn)兒體重(kg) 待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系 求出求出X X與與Y Y的離均差積和的離均差積和( (l lxy xy) ); ;求出求出X X的離均的離均 差平方和差平方和( (l lxx xx) ) 求出求出b b值值:b= :b= l lxy xy/ l

23、/ lxx xx 求求a a值值: :根據(jù)直線必然通過根據(jù)直線必然通過 列出回歸方程:列出回歸方程: =a+bx=a+bx ),(YX 在自變量在自變量X的實(shí)測全距范圍內(nèi)任取相距較的實(shí)測全距范圍內(nèi)任取相距較 遠(yuǎn)且易讀的兩遠(yuǎn)且易讀的兩X值,代入回歸方程,求出值,代入回歸方程,求出 1、 2 在坐標(biāo)系中找出(在坐標(biāo)系中找出( X1, 1 )()( X2 , 2 )兩點(diǎn))兩點(diǎn) 兩點(diǎn)確定一條直線兩點(diǎn)確定一條直線 回歸直線一定經(jīng)過(回歸直線一定經(jīng)過(0 0,a a ),), 這兩這兩 點(diǎn)可以用來核對圖線繪制是否正確點(diǎn)可以用來核對圖線繪制是否正確 1 2 3 4 5 51015202530 尿雌三醇含量(

24、mg/24h)尿雌三醇含量(mg/24h) 產(chǎn)兒體重(kg)產(chǎn)兒體重(kg) 待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系 =a+bx=a+bx ( X X2 2 , , 2 2 ) ( X X1 1, , 1 1 ) 與直線相關(guān)一樣,直線回歸方程也是從樣本資與直線相關(guān)一樣,直線回歸方程也是從樣本資 料計(jì)算而得的,同樣也存在著抽樣誤差問題。料計(jì)算而得的,同樣也存在著抽樣誤差問題。 所以,需要對樣本的回歸系數(shù)所以,需要對樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),進(jìn)行假設(shè)檢驗(yàn), 以判斷以判斷b是否從回歸系數(shù)為零的總體中抽得。是否從回歸系數(shù)為零的總體中抽得。 為了判斷抽樣誤差的影響,需對回歸

25、系數(shù)進(jìn)行為了判斷抽樣誤差的影響,需對回歸系數(shù)進(jìn)行 假設(shè)檢驗(yàn)??傮w的回歸系數(shù)一般用假設(shè)檢驗(yàn)??傮w的回歸系數(shù)一般用表示。表示。 t檢驗(yàn) 方差分析 F=MS回歸/MS剩余 H H0 0:=0=0 H H1 1:00 =0.05=0.05 選擇合適的假設(shè)檢驗(yàn)選擇合適的假設(shè)檢驗(yàn) 方法,計(jì)算統(tǒng)計(jì)量方法,計(jì)算統(tǒng)計(jì)量 計(jì)算概率值計(jì)算概率值P,P,做出推做出推 論:統(tǒng)計(jì)學(xué)結(jié)論和專論:統(tǒng)計(jì)學(xué)結(jié)論和專 業(yè)結(jié)論業(yè)結(jié)論 其中其中Sy.x(剩余標(biāo)準(zhǔn)差剩余標(biāo)準(zhǔn)差) 為各觀察值為各觀察值Y到回歸到回歸 直線的距離的標(biāo)準(zhǔn)差,直線的距離的標(biāo)準(zhǔn)差, 表示去除表示去除X影響后影響后Y 的變異程度的變異程度 回歸系數(shù)的回歸系數(shù)的t檢驗(yàn)

26、檢驗(yàn) 判斷判斷b是否來自回歸系數(shù)為是否來自回歸系數(shù)為0 (=0 )的總體。)的總體。 1、建立檢驗(yàn)假設(shè):、建立檢驗(yàn)假設(shè): H0: =0 H1: 0 =0.05 2 2、計(jì)算統(tǒng)計(jì)量、計(jì)算統(tǒng)計(jì)量 =31-2=29=31-2=29 查查t t值表,值表,t t0.05(29) 0.05(29)=2.045, P0.05, =2.045, P50時(shí),計(jì)算檢驗(yàn)統(tǒng)計(jì)量時(shí),計(jì)算檢驗(yàn)統(tǒng)計(jì)量Z 查查r rs s界值表(課本界值表(課本343343頁,表頁,表13-413-4) 根據(jù)根據(jù)n n和和得到得到r rs s界值:界值:n=10n=10, =0.05=0.05, r rs s( (1010,0.050.0

27、5)=0.648 =0.648 比較:比較:r rs s =0.903r=0.903rs s( (1010,0.050.05),則 ,則 p0.05p0.05,按,按=0.05=0.05水準(zhǔn),拒絕水準(zhǔn),拒絕H H0 0,接受,接受H H1 1, 認(rèn)為認(rèn)為r rs s有統(tǒng)計(jì)學(xué)意義,即子癇抽搐次數(shù)與有統(tǒng)計(jì)學(xué)意義,即子癇抽搐次數(shù)與 新生兒窒息之間有負(fù)向的等級(jí)相關(guān)關(guān)系。新生兒窒息之間有負(fù)向的等級(jí)相關(guān)關(guān)系。 病例編號(hào)病例編號(hào)1 12 23 34 45 56 67 78 89 91010 血小板數(shù)血小板數(shù)130130160160310310420420540540740740106010601230123

28、01260126014401440 出血癥出血癥+ 編號(hào)編號(hào) 血小板數(shù)血小板數(shù) x 出血癥出血癥 y X的秩次的秩次Y的秩次的秩次dd2 1130+110-981 216026-416 3310-3300 4420+48-416 5540+58-39 6740-6339 71060-73416 81230-83525 91260-93636 101440+10824 合計(jì)合計(jì)-212 查表查表13-4:n=10,=0.05, rs( (10,0.05)=0.648 得出結(jié)論:得出結(jié)論: 相關(guān)分析:研究變量間相互關(guān)系的密切程相關(guān)分析:研究變量間相互關(guān)系的密切程 度和變化趨勢,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)加

29、以度和變化趨勢,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)加以 表示。表示。 回歸分析:研究變量間數(shù)量上的依存關(guān)系,回歸分析:研究變量間數(shù)量上的依存關(guān)系, 用函數(shù)形式將其表現(xiàn)出來,并用一個(gè)或多用函數(shù)形式將其表現(xiàn)出來,并用一個(gè)或多 個(gè)變量來推測另一個(gè)變量的估計(jì)值及波動(dòng)個(gè)變量來推測另一個(gè)變量的估計(jì)值及波動(dòng) 范圍。范圍。 直線相關(guān):分析正態(tài)分布的兩個(gè)隨機(jī)變量直線相關(guān):分析正態(tài)分布的兩個(gè)隨機(jī)變量x x 與與y y是否有直線相關(guān)關(guān)系以及是否有直線相關(guān)關(guān)系以及相關(guān)的性質(zhì)和相關(guān)的性質(zhì)和 相關(guān)的密切程度相關(guān)的密切程度。 直線回歸:探討兩個(gè)連續(xù)變量直線回歸:探討兩個(gè)連續(xù)變量X X和和Y Y間間依存依存 關(guān)系關(guān)系的一種統(tǒng)計(jì)學(xué)方法。的一種

30、統(tǒng)計(jì)學(xué)方法。 審核資料的性質(zhì)審核資料的性質(zhì) 繪制散點(diǎn)圖,判斷是否存在相關(guān)關(guān)系繪制散點(diǎn)圖,判斷是否存在相關(guān)關(guān)系 求出相關(guān)系數(shù),判斷相關(guān)的強(qiáng)度和性質(zhì)求出相關(guān)系數(shù),判斷相關(guān)的強(qiáng)度和性質(zhì) 進(jìn)行假設(shè)檢驗(yàn),判斷是本質(zhì)因素還是抽樣進(jìn)行假設(shè)檢驗(yàn),判斷是本質(zhì)因素還是抽樣 誤差誤差 審核資料的性質(zhì)審核資料的性質(zhì) 在普通坐標(biāo)系中作散點(diǎn)圖在普通坐標(biāo)系中作散點(diǎn)圖 求求b和和 a 列出回歸方程:列出回歸方程: =a+bx 畫出回歸直線畫出回歸直線 回歸系數(shù)的假設(shè)檢驗(yàn)回歸系數(shù)的假設(shè)檢驗(yàn) r的大小的大小 變量之間關(guān)聯(lián)的密切程度變量之間關(guān)聯(lián)的密切程度 符號(hào)的正負(fù)符號(hào)的正負(fù) 關(guān)聯(lián)的性質(zhì)關(guān)聯(lián)的性質(zhì) b的大小的大小 斜率的大小斜率的大小 符號(hào)的正負(fù)符號(hào)的正負(fù) 關(guān)聯(lián)的性質(zhì)關(guān)聯(lián)的性質(zhì) 區(qū)別區(qū)別 資料性質(zhì)資料性質(zhì) 應(yīng)用應(yīng)用 r r與與b b的取值不同的取值不同 聯(lián)系聯(lián)系 方向一致方向一致 假設(shè)檢驗(yàn)等價(jià):假設(shè)檢驗(yàn)等價(jià):t tr r=t=tb b 可以用回歸解釋相關(guān)可以用回歸解釋相關(guān) 1.實(shí)際意義實(shí)際意義 進(jìn)行相關(guān)回歸分析要有實(shí)際意義,進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)系不可把毫無關(guān)系 的兩個(gè)事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有的兩個(gè)事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有 人說,孩子長,公園里的小樹也在長。求孩子和小人說,孩子長,公園里的小樹也

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論