SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第1頁
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第2頁
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第3頁
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第4頁
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇

SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇

目錄

數(shù)據(jù)分析的統(tǒng)計(jì)方法選擇小結(jié)錯(cuò)誤!未定義書

簽。

目錄...................................2

?資料1................................................................4

完全隨機(jī)分組設(shè)計(jì)的資料..............4

配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)..............7

變量之間的關(guān)聯(lián)性分析................9

?資料2..............................................................12

L連續(xù)性資料.......................13

1.1兩組獨(dú)立樣本比較......13

1.2兩組配對(duì)樣本的比較....13

1.3多組完全隨機(jī)樣本比較...13

L4多組隨機(jī)區(qū)組樣本比較...14

2.分類資料........................15

2?1四格表資料............15

2.22XC表或RX2表資料的統(tǒng)計(jì)

分析.......................16

2.3RXC表資料的統(tǒng)計(jì)分析.?17

2

2.4配對(duì)分類資料的統(tǒng)計(jì)分析.18

?資料3...............................18

一、兩個(gè)變量之間的關(guān)聯(lián)性分析...20

二、回歸分析...................21

?資料4...............................23

一.統(tǒng)計(jì)方法抉擇的條件........23

1.分析目的...............24

2.資料類型...............25

3.設(shè)計(jì)方法...............27

4.分布特征及數(shù)理統(tǒng)計(jì)條件?.29

二.數(shù)據(jù)資料的描述............32

1.數(shù)值變量資料的描述.....32

2.分類變量資料的描述.....33

三.數(shù)據(jù)資料的比較............35

1.假設(shè)檢驗(yàn)的基本步驟.....35

2.假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤..37

3.假設(shè)檢驗(yàn)的注意事項(xiàng).....38

4.常用假設(shè)檢驗(yàn)方法.......40

四.變量間的相關(guān)分析..........44

1.數(shù)值變量(計(jì)量資料)的關(guān)系

分析.......................45

2.無序分類變量(計(jì)數(shù)資料)的

3

相關(guān)分析..................46

3.有序分類變量(等級(jí)資

料)等級(jí)相關(guān).......46

?資料1

完全隨機(jī)分組設(shè)計(jì)的資料

一、兩組或多組計(jì)量資料的比較

1.兩組資料:

1)大樣本資料或服從正態(tài)分布的小樣本

資料

(1)若方差齊性,則作成組t檢驗(yàn)

(2)若方差不齊,則作檢驗(yàn)或用成組

的Wilcoxon秩和檢驗(yàn)

2)小樣本偏態(tài)分布資料,則用成組的

Wilcoxon秩和檢驗(yàn)

2.多組資料:

1)若大樣本資料或服從正態(tài)分布,并且

方差齊性,則作完全隨機(jī)的方差分析。如果

方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)

一步作統(tǒng)計(jì)分析:選擇合適的方法(如:LSD

檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比較。

2)如果小樣本的偏態(tài)分布資料或方差不

4

齊,則作KruskalWallis的統(tǒng)計(jì)檢驗(yàn)。如果

KruskalWallis的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意

義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法

(如:用成組的Wilcoxon秩和檢驗(yàn),但用

Bonferroni方法校正P值等)進(jìn)行兩兩比較。

二'分類資料的統(tǒng)計(jì)分析

1.單樣本資料與總體比較

1)二分類資料:

(1)小樣本時(shí):用二項(xiàng)分布進(jìn)行確切概率

法檢驗(yàn);

(2)大樣本時(shí):用U檢驗(yàn)。

2)多分類資料:用Pearson/檢驗(yàn)(又

稱擬合優(yōu)度檢驗(yàn))。

2.四格表資料

l)n>40并且所以理論數(shù)大于5,則用

Pearson%2

2)n>40并且所以理論數(shù)大于1并且至少

存在一個(gè)理論數(shù)<5,則用校正行或用

Fisher's確切概率法檢驗(yàn)

3)n<40或存在理論數(shù)<1,則用

Fishers檢驗(yàn)

3.2XC表資料的統(tǒng)計(jì)分析

5

1)列變量為效應(yīng)指標(biāo),并且為有序多分

類變量,行變量為分組變量,則行評(píng)分的CMH

/或成組的Wilcoxon秩和檢驗(yàn)

2)列變量為效應(yīng)指標(biāo)并且為二分類,列

變量為有序多分類變量,則用趨勢(shì)/檢驗(yàn)

3)行變量和列變量均為無序分類變量

(l)n>40并且理論數(shù)小于5的格子數(shù)〈行

列表中格子總數(shù)的25%,則用Pearson%2

(2)n<40或理論數(shù)小于5的格子數(shù)》行列

表中格子總數(shù)的25%,則用Fisher,s確切

概率法檢驗(yàn)

4.RXC表資料的統(tǒng)計(jì)分析

1)列變量為效應(yīng)指標(biāo),并且為有序多分

類變量,行變量為分組變量,則CMH/或

KruskalWallis的秩和檢驗(yàn)

2)列變量為效應(yīng)指標(biāo),并且為無序多分

類變量,行變量為有序多分類變量,作none

zerocorrelationanalysis的CMH%2

3)列變量和行變量均為有序多分類變

量,可以作Spearman相關(guān)分析

4)列變量和行變量均為無序多分類變

量,

6

(l)n>40并且理論數(shù)小于5的格子數(shù)〈行

列表中格子總數(shù)的25%,則用Pearson%

(2)n<40或理論數(shù)小于5的格子數(shù)》行列

表中格子總數(shù)的25%,則用Fisher's確切

概率法檢驗(yàn)

三、Poisson分布資料

1.單樣本資料與總體比較:

1)觀察值較小時(shí):用確切概率法進(jìn)行檢

驗(yàn)。

2)觀察值較大時(shí):用正態(tài)近似的U檢驗(yàn)。

2.兩個(gè)樣本比較:用正態(tài)近似的U檢驗(yàn)。

配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)

四、兩組或多組計(jì)量資料的比較

1.兩組資料:

1)大樣本資料或配對(duì)差值服從正態(tài)分布

的小樣本資料,作配對(duì)t檢驗(yàn)

2)小樣本并且差值呈偏態(tài)分布資料,則

用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn)

2.多組資料:

1)若大樣本資料或殘差服從正態(tài)分布,

并且方差齊性,則作隨機(jī)區(qū)組的方差分析。

7

如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,

則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:

LSD檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比

較。

2)如果小樣本時(shí),差值呈偏態(tài)分布資料

或方差不齊,則作Fredman的統(tǒng)計(jì)檢驗(yàn)。如

果Fredman的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則

進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:

用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn),但用

Bonferroni方法校正P值等)進(jìn)行兩兩比較。

五、分類資料的統(tǒng)計(jì)分析

1.四格表資料

l)b+c>40,則用McNemar配對(duì)%?檢驗(yàn)或

配對(duì)邊際必檢驗(yàn)

2)b+c<40,則用二項(xiàng)分布確切概率法檢

驗(yàn)

2.CXC表資料:

1)配對(duì)比較:用McNemar配對(duì)了檢驗(yàn)或

配對(duì)邊際/檢驗(yàn)

2)一致性問題(Agreement):用Kap檢

驗(yàn)

8

變量之間的關(guān)聯(lián)性分析

六、兩個(gè)變量之間的關(guān)聯(lián)性分析

1.兩個(gè)變量均為連續(xù)型變量

1)小樣本并且兩個(gè)變量服從雙正態(tài)分

布,則用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析

2)大樣本或兩個(gè)變量不服從雙正態(tài)分

布,則用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析

2.兩個(gè)變量均為有序分類變量,可以用

Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析

3.一個(gè)變量為有序分類變量,另一個(gè)變量

為連續(xù)型變量,可以用Spearman相關(guān)系數(shù)進(jìn)

行統(tǒng)計(jì)分析

七、回歸分析

L直線回歸:如果回歸分析中的殘差服從

正態(tài)分布(大樣本時(shí)無需正態(tài)性),殘差與自

變量無趨勢(shì)變化,則直線回歸(單個(gè)自變量的

線性回歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)?/p>

變換,使其滿足上述條件。

2.多重線性回歸:應(yīng)變量(Y)為連續(xù)型

變量(即計(jì)量資料),自變量(XuX2,Xp)

可以為連續(xù)型變量、有序分類變量或二分類變

量。如果回歸分析中的殘差服從正態(tài)分布(大

9

樣本時(shí)無需正態(tài)性),殘差與自變量無趨勢(shì)變

化,可以作多重線性回歸。

1)觀察性研究:可以用逐步線性回歸尋

找(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變

量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>

它可能的混雜因素變量,以校正這些混雜因

素對(duì)結(jié)果的混雜作用

3.二分類的Logistic回歸:應(yīng)變量為二

分類變量,自變量(X“X2,Xp)可以為

連續(xù)型變量、有序分類變量或二分類變量。

1)非配對(duì)的情況:用非條件Logistic

回歸

(1)觀察性研究:可以用逐步線性回歸尋

找(擬)主要的影響因素

(2)實(shí)驗(yàn)性研究:在保持主要研究因素變

量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>

它可能的混雜因素變量,以校正這些混雜因

素對(duì)結(jié)果的混雜作用

2)配對(duì)的情況:用條件Logistic回歸

(1)觀察性研究:可以用逐步線性回歸尋

找(擬)主要的影響因素

10

(2)實(shí)驗(yàn)性研究:在保持主要研究因素變

量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>

它可能的混雜因素變量,以校正這些混雜因

素對(duì)結(jié)果的混雜作用

4.有序多分類有序的Logistic回歸:應(yīng)

變量為有序多分類變量,自變量(X1,X2,…,

Xp)可以為連續(xù)型變量、有序分類變量或二分

類變量。

1)觀察性研究:可以用逐步線性回歸尋

找(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變

量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>

它可能的混雜因素變量,以校正這些混雜因

素對(duì)結(jié)果的混雜作用

5.無序多分類有序的Logistic回歸:應(yīng)

變量為無序多分類變量,自變量(X1,X2,…,

Xp)可以為連續(xù)型變量、有序分類變量或二分

類變量。

1)觀察性研究:可以用逐步線性回歸尋

找(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變

量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>

11

它可能的混雜因素變量,以校正這些混雜因

素對(duì)結(jié)果的混雜作用

八、生存分析資料:

(要求資料記錄結(jié)局和結(jié)局發(fā)生的時(shí)

間,如:死亡和死亡發(fā)生的時(shí)間)

1.用Kaplan-Meier方法估計(jì)生存曲線

2.大樣本時(shí),可以壽命表方法估計(jì)

3.單因素可以用Log—rank比較兩條或

多條生存曲線

4.多個(gè)因素時(shí),可以作多重的Cox回歸

1)觀察性研究:可以用逐步線性回歸尋

找(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變

量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>

它可能的混雜因素變量,以校正這些混雜因

素對(duì)結(jié)果的混雜作用

?資料2

12

1.連續(xù)性資料

1.1兩組獨(dú)立樣本比較

1.1.1資料符合正態(tài)分布,且兩組方差齊性,

直接采用t檢驗(yàn)。

1.1.2資料不符合正態(tài)分布

(1)可進(jìn)行數(shù)據(jù)轉(zhuǎn)換,如對(duì)數(shù)轉(zhuǎn)換等,使

之服從正態(tài)分布,然后對(duì)轉(zhuǎn)換后的數(shù)據(jù)采用t檢

驗(yàn);

(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。

1.1.3資料方差不齊

(1)采用Satterthwate的t'檢驗(yàn);

(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。

1.2兩組配對(duì)樣本的比較

1.2.1兩組差值服從正態(tài)分布,采用配對(duì)t

檢驗(yàn)。

1.2.2兩組差值不服從正態(tài)分布,采用

wilcoxon的符號(hào)配對(duì)秩和檢驗(yàn)。

1.3多組完全隨機(jī)樣本比較

1.3.1資料符合正態(tài)分布,且各組方差齊性,

13

直接采用完全隨機(jī)的方差分析。如果檢驗(yàn)結(jié)果為

有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較

的方法有LSD檢驗(yàn),Bonferroni法,tukey法,

Scheffe法,SNK法等。

1.3.2資料不符合正態(tài)分布,或各組方差不

齊,則采用非參數(shù)檢驗(yàn)的Kruscal-Wallis法。

如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩

比較,一般采用Bonferroni法校正P值,然后

用成組的Wilcoxon檢驗(yàn)。

1.4多組隨機(jī)區(qū)組樣本比較

1.4.1資料符合正態(tài)分布,且各組方差齊性,

直接采用隨機(jī)區(qū)組的方差分析。如果檢驗(yàn)結(jié)果為

有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較

的方法有LSD檢驗(yàn),Bonferroni法,tukey法,

Scheffe法,SNK法等。

L4.2資料不符合正態(tài)分布,或各組方差不

齊,則采用非參數(shù)檢驗(yàn)的Fridman檢驗(yàn)法。如果

檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比

較,一般采用Bonferroni法校正P值,然后用

符號(hào)配對(duì)的Wilcoxon檢驗(yàn)。

需要注意的問題:

14

(1)一般來說,如果是大樣本,比如各組

例數(shù)大于50,可以不作正態(tài)性檢驗(yàn),直接采用t

檢驗(yàn)或方差分析。因?yàn)榻y(tǒng)計(jì)學(xué)上有中心極限定

理,假定大樣本是服從正態(tài)分布的。

(2)當(dāng)進(jìn)行多組比較時(shí),最容易犯的錯(cuò)誤

是僅比較其中的兩組,而不顧其他組,這樣作容

易增大犯假陽性錯(cuò)誤的概率。正確的做法應(yīng)該

是,先作總的各組間的比較,如果總的來說差別

有統(tǒng)計(jì)學(xué)意義,然后才能作其中任意兩組的比

較,這些兩兩比較有特定的統(tǒng)計(jì)方法,如上面提

到的LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe

法,SNK法等。絕不能對(duì)其中的兩組直接采用t

檢驗(yàn),這樣即使得出結(jié)果也未必正確。

(3)關(guān)于常用的設(shè)計(jì)方法:多組資料盡管

最終分析都是采用方差分析,但不同設(shè)計(jì)會(huì)有差

別。常用的設(shè)計(jì)如完全隨即設(shè)計(jì),隨機(jī)區(qū)組設(shè)計(jì),

析因設(shè)計(jì),裂區(qū)設(shè)計(jì),嵌套設(shè)計(jì)等。

2.分類資料

2.1四格表資料

2.1.1例數(shù)大于40,且所有理論數(shù)大于5,

則用普通的Pearson檢驗(yàn)。

15

2.1.2例數(shù)大于40,所有理論數(shù)大于1,且

至少一個(gè)理論數(shù)小于5,則用校正的檢驗(yàn)或

Fisher's確切概率法檢驗(yàn)。

2.1.3例數(shù)小于40,或有理論數(shù)小于2,則

用Fisher,s確切概率法檢驗(yàn)。

2.22XC表或RX2表資料的統(tǒng)計(jì)分析

2.2.1列變量&行變量均為無序分類變量,

(1)例數(shù)大于40,且理論數(shù)小于5的格子

數(shù)目〈總格子數(shù)目的25%,則用普通的Pearson

檢驗(yàn)。

(2)例數(shù)小于40,或理論數(shù)小于5的格子

數(shù)目》總格子數(shù)目的25%,則用Fisher's確切

概率法檢驗(yàn)。

2.2.2列變量為效應(yīng)指標(biāo),且為有序多分類

變量,行變量為分組變量,用普通的Pearson檢

驗(yàn)只說明組間構(gòu)成比不同,如要說明療效,則可

用行平均分差檢驗(yàn)或成組的Wilcoxon秩和檢

驗(yàn)。

2.2.3列變量為效應(yīng)指標(biāo),且為二分類變量,

行變量為有序多分類變量,則可采用普通的

16

Pearson檢驗(yàn)比較各組之間有無差別,如果總的

來說有差別,還可進(jìn)一步作兩兩比較,以說明是

否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。

2.3RXC表資料的統(tǒng)計(jì)分析

2.3.1列變量&行變量均為無序分類變量,

(1)例數(shù)大于40,且理論數(shù)小于5的格子

數(shù)目〈總格子數(shù)目的25%,則用普通的Pearson

檢驗(yàn)。

(2)例數(shù)小于40,或理論數(shù)小于5的格子

數(shù)目》總格子數(shù)目的25%,則用Fisher's確切

概率法檢驗(yàn)。

(3)如果要作相關(guān)性分析,可采用Pearson

相關(guān)系數(shù)。

2.3.2列變量為效應(yīng)指標(biāo),且為有序多分類

變量,行變量為分組變量,用普通的Pearson檢

驗(yàn)只說明組間構(gòu)成比不同,如要說明療效或強(qiáng)弱

程度的不同,則可用行平均分差檢驗(yàn)或成組的

Wilcoxon秩和檢驗(yàn)或Ridit分析。

2.3.3列變量為效應(yīng)指標(biāo),且為無序多分類

變量,行變量為有序多分類變量,則可采用普通

17

的Pearson檢驗(yàn)比較各組之間有無差別,如果有

差別,還可進(jìn)一步作兩兩比較,以說明是否任意

兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。

2.3.4列變量&行變量均為有序多分類變量

(1)如要做組間差別分析,則可用行平均

分差檢驗(yàn)或成組的Wilcoxon秩和檢驗(yàn)或Ridit

分析。如果總的來說有差別,還可進(jìn)一步作兩兩

比較,以說明是否任意兩組之間的差別都有統(tǒng)計(jì)

學(xué)意義。

(2)如果要做兩變量之間的相關(guān)性,可采

用Spearson相關(guān)分析。

2.4配對(duì)分類資料的統(tǒng)計(jì)分析

2.4.1四格表配對(duì)資料

(1)b+c>40,則用McNemar配對(duì)檢驗(yàn)。

(2)b+c<40,則用校正的配對(duì)檢驗(yàn)。

2.4.1CXC資料

(1)配對(duì)比較:用McNemar配對(duì)檢驗(yàn)。

(2)一致性檢驗(yàn),用Kappa檢驗(yàn)。

?資料3

18

在研究設(shè)計(jì)時(shí),統(tǒng)計(jì)方法的選擇需考慮以

下6個(gè)方面的問題:(1)看反應(yīng)變量是單變量、

雙變量還是多變量;(2)看單變量資料屬于3種

資料類型(計(jì)量、計(jì)數(shù)及等級(jí)資料)中的哪一

種;(3)看影響因素是單因素還是多因素;(4)

看單樣本、兩樣本或多樣本;(5)看是否是配對(duì)

或配伍設(shè)計(jì);(6)看是否滿足檢驗(yàn)方法所需的前

提條件,必要時(shí)可進(jìn)行變量變換,應(yīng)用參數(shù)方

法進(jìn)行假設(shè)檢驗(yàn)往往要求數(shù)據(jù)滿足某些前提條

件,如兩個(gè)獨(dú)立樣本比較t檢驗(yàn)或多個(gè)獨(dú)立樣

本比較的方差分析,均要求方差齊性,因此需

要做方差齊性檢驗(yàn)。如果要用正態(tài)分布法估計(jì)參

考值范圍,首先要檢驗(yàn)資料是否服從正態(tài)分布。

在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間

的多重共線性和殘差分布的正態(tài)性。

表1T

連續(xù)因變分類因變量

連續(xù)回歸分析Logistic回

自變歸

分類方差分析表格檢驗(yàn)(比

19

自變(ANOVA)如卡方檢驗(yàn))

不同的統(tǒng)計(jì)分析方法都有其各自的應(yīng)用條

件和適用范圍。實(shí)際應(yīng)用時(shí),必須根據(jù)研究目

的、資料的性質(zhì)以及所要分析的具體內(nèi)容等選

擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,切忌只關(guān)心P值的大

?。ㄊ欠瘛?.05),而忽略統(tǒng)計(jì)分析方法的應(yīng)用

條件和適用范圍。

一、兩個(gè)變量之間的關(guān)聯(lián)性分析

1.兩個(gè)變量均為連續(xù)型變量

1)小樣本并且兩個(gè)變量服從雙正態(tài)分布,則

用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析

2)大樣本或兩個(gè)變量不服從雙正態(tài)分布,則

用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析

2.兩個(gè)變量均為有序分類變量,可以用

Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析

3.一個(gè)變量為有序分類變量,另一個(gè)變量

為連續(xù)型變量,可以用Spearman相關(guān)系數(shù)進(jìn)行

統(tǒng)計(jì)分析

20

二、回歸分析

1.直線回歸:如果回歸分析中的殘差服從正

態(tài)分布(大樣本時(shí)無需正態(tài)性),殘差與自變量

無趨勢(shì)變化,則直線回歸(單個(gè)自變量的線性回

歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)淖儞Q,使

其滿足上述條件。

2.多重線性回歸:應(yīng)變量(Y)為連續(xù)型變

量(即計(jì)量資料),自變量(XI,X2,Xp)

可以為連續(xù)型變量、有序分類變量或二分類變

量。如果回歸分析中的殘差服從正態(tài)分布(大樣

本時(shí)無需正態(tài)性),殘差與自變量無趨勢(shì)變化,

可以作多重線性回歸。

1)觀察性研究:可以用逐步線性回歸尋找

(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變量

(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>

的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的

混雜作用

3.二分類的Logistic回歸:應(yīng)變量為二分

類變量,自變量(XI,X2,Xp)可以為連續(xù)

型變量、有序分類變量或二分類變量。

1)非配對(duì)的情況:用非條件Logistic回歸

21

(1)觀察性研究:可以用逐步線性回歸尋找

(擬)主要的影響因素

(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量

(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>

的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的

混雜作用

2)配對(duì)的情況:用條件Logistic回歸

(1)觀察性研究:可以用逐步線性回歸尋找

(擬)主要的影響因素

(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量

(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>

的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的

混雜作用

4.有序多分類有序的Logistic回歸:應(yīng)變

量為有序多分類變量,自變量(XLX2,Xp)

可以為連續(xù)型變量、有序分類變量或二分類變

量。

1)觀察性研究:可以用逐步線性回歸尋找

(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變量

(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>

22

的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的

混雜作用

5.無序多分類有序的Logistic回歸:應(yīng)變

量為無序多分類變量,自變量(XLX2,Xp)

可以為連續(xù)型變量、有序分類變量或二分類變

量。

1)觀察性研究:可以用逐步線性回歸尋找

(擬)主要的影響因素

2)實(shí)驗(yàn)性研究:在保持主要研究因素變量

(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>

的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的

混雜作用。

?資料4

一.統(tǒng)計(jì)方法抉擇的條件

在臨床科研工作中,正確地抉擇統(tǒng)計(jì)分析方

法,應(yīng)充分考慮科研工作者的分析目的、臨床科

研設(shè)計(jì)方法、搜集到的數(shù)據(jù)資料類型、數(shù)據(jù)資料

的分布特征與所涉及的數(shù)理統(tǒng)計(jì)條件等。其中任

何一個(gè)問題沒考慮到或考慮有誤,都有可能導(dǎo)致

統(tǒng)計(jì)分析方法的抉擇失誤。

23

此外,統(tǒng)計(jì)分析方法的抉擇應(yīng)在科研的設(shè)計(jì)

階段來完成,而不應(yīng)該在臨床試驗(yàn)結(jié)束或在數(shù)據(jù)

的收集工作已完成之后。

對(duì)臨床科研數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和進(jìn)行統(tǒng)計(jì)

方法抉擇時(shí),應(yīng)考慮下列因素:

1.分析目的

對(duì)于臨床醫(yī)生及臨床流行病醫(yī)生來說,在進(jìn)

行統(tǒng)計(jì)分析前,一定要明確利用統(tǒng)計(jì)方法達(dá)到研

究者的什么目的。一般來說,統(tǒng)計(jì)方法可分為描

述與推斷兩類方法。一是統(tǒng)計(jì)描述

(descriptivestatistics),二是統(tǒng)計(jì)推斷

(inferentialstatistics)o

統(tǒng)計(jì)描述,即利用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖或統(tǒng)計(jì)

表,對(duì)數(shù)據(jù)資料所進(jìn)行的最基本的統(tǒng)計(jì)分析,使

其能反映數(shù)據(jù)資料的基本特征,有利于研究者能

準(zhǔn)確、全面地了解數(shù)據(jù)資料所包涵的信息,以便

做出科學(xué)的推斷。統(tǒng)計(jì)表,如頻數(shù)表、四格表、

列聯(lián)表等;統(tǒng)計(jì)圖,如直方圖、餅圖,散點(diǎn)圖等;

統(tǒng)計(jì)指標(biāo),如均數(shù)、標(biāo)準(zhǔn)差、率及構(gòu)成比等。

統(tǒng)計(jì)推斷,即利用樣本所提供的信息對(duì)總體

進(jìn)行推斷(估計(jì)或比較),其中包括參數(shù)估計(jì)和

24

假設(shè)檢驗(yàn),如可信區(qū)間、t檢驗(yàn)、方差分析、

2檢驗(yàn)等,如要分析甲藥治療與乙藥治療兩組

的療效是否不相同、不同地區(qū)某病的患病率有無

差異等。

還有些統(tǒng)計(jì)方法,既包含了統(tǒng)計(jì)描述也包含

了統(tǒng)計(jì)推斷的內(nèi)容,如不同變量間的關(guān)系分析。

相關(guān)分析,可用于研究某些因素間的相互聯(lián)系,

以相關(guān)系數(shù)來衡量各因素間相關(guān)的密切程度和

方向,如高血脂與冠心病、慢性宮頸炎與宮頸癌

等的相關(guān)分析;回歸分析,可用于研究某個(gè)因素

與另一因素(變量)的依存關(guān)系,即以一個(gè)變量

去推測(cè)另一變量,如利用回歸分析建立起來的回

歸方程,可由兒童的年齡推算其體重。

2.資料類型

資料類型的劃分現(xiàn)多采用國際通用的分類

方法,將其分為兩類:數(shù)值變量

(numericalvariable)資料和分類變量

(categoricalvariable)資料。數(shù)值變量是指

其值是可以定量或準(zhǔn)確測(cè)量的變量,其表現(xiàn)為數(shù)

值大小的不同;而分類變量是指其值是無法定量

或不能測(cè)量的變量,其表現(xiàn)沒有數(shù)值的大小而只

25

有互不相容的類別或?qū)傩?。分類變量又可分為無

序分類變量和有序分類變量?jī)尚☆?,無序分類變

量表現(xiàn)為沒有大小之分的屬性或類別,如:性別

是兩類無序分類變量,血型是四類無序分類變

量;有序分類變量表現(xiàn)為各屬性或類別間有程度

之分,如:臨床上某種疾病的“輕、中、重”,治

療結(jié)果的“無效、顯效、好轉(zhuǎn)、治愈”。由此可

見,數(shù)值變量資料、無序分類變量資料和有序分

類變量資料又可叫做計(jì)量資料、計(jì)數(shù)資料和等級(jí)

資料。

資料類型的劃分與統(tǒng)計(jì)方法的抉擇有關(guān),在

多數(shù)情況下不同的資料類型,選擇的統(tǒng)計(jì)方法不

一樣。如數(shù)值變量資料的比較可選用t檢驗(yàn)、U

檢驗(yàn)等統(tǒng)計(jì)方法;而率的比較多用2檢驗(yàn)。

值得注意的是,有些臨床科研工作者,常常

人為地將數(shù)值變量的結(jié)果轉(zhuǎn)化為分類變量的臨

床指標(biāo),然后參與統(tǒng)計(jì)分析,如患者的血紅蛋白

含量,研究者常用正常、輕度貧血、中度貧血和

重度貧血來表示,這樣雖然照顧了臨床工作的習(xí)

慣,卻損失了資料所提供的信息量。換言之,在

多數(shù)情況下,數(shù)值變量資料提供的信息量最為充

分,可進(jìn)行統(tǒng)計(jì)分析的手段也較為豐富、經(jīng)典和

26

可靠,與之相比,分類變量在這些方面都不如數(shù)

值變量資料。因此,在臨床實(shí)驗(yàn)中要盡可能選擇

量化的指標(biāo)反映實(shí)驗(yàn)效應(yīng),若確實(shí)無法定量時(shí),

才選用分類數(shù)據(jù),通常不宜將定量數(shù)據(jù)轉(zhuǎn)變成分

類數(shù)據(jù)。

3.設(shè)計(jì)方法

在眾多的臨床科研設(shè)計(jì)方法中,每

一種設(shè)計(jì)方法都有與之相適應(yīng)的統(tǒng)計(jì)方法。在統(tǒng)

計(jì)方法的抉擇時(shí),必須根據(jù)不同的臨床科研設(shè)計(jì)

方法來選擇相應(yīng)的統(tǒng)計(jì)分析方法。如果統(tǒng)計(jì)方法

的抉擇與設(shè)計(jì)方法不一致,統(tǒng)計(jì)分析得到的任何

結(jié)論都是錯(cuò)誤的。

在常用的科研設(shè)計(jì)方法中,有成組設(shè)計(jì)(完

全隨機(jī)設(shè)計(jì))的t檢驗(yàn)、配對(duì)t檢驗(yàn)、成組設(shè)計(jì)

(完全隨機(jī)設(shè)計(jì))的方差分析、配伍設(shè)計(jì)(隨機(jī)

區(qū)組設(shè)計(jì))的方差分析等,都是統(tǒng)計(jì)方法與科研

設(shè)計(jì)方法有關(guān)的佐證。因此,應(yīng)注意區(qū)分成組設(shè)

計(jì)(完全隨機(jī)設(shè)計(jì))與配對(duì)和配伍設(shè)計(jì)(隨機(jī)區(qū)

組設(shè)計(jì)),在成組設(shè)計(jì)中又要注意區(qū)別兩組與多

組設(shè)計(jì)。最常見的錯(cuò)誤是將配對(duì)或配伍設(shè)計(jì)(隨

機(jī)區(qū)組設(shè)計(jì))的資料當(dāng)做成組設(shè)計(jì)(完全隨機(jī)設(shè)

27

計(jì))來處理,如配對(duì)設(shè)計(jì)的資料使用成組t檢驗(yàn)、

配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))使用成組資料的方差

分析;或?qū)⑷M及三組以上的成組設(shè)計(jì)(完全隨

機(jī)設(shè)計(jì))資料的比較采用多個(gè)t檢驗(yàn)、三個(gè)或多

個(gè)率的比較采用四格表的卡方檢驗(yàn)來進(jìn)行比較,

都是典型的錯(cuò)誤。如下表:

表1常見與設(shè)計(jì)方法有關(guān)的統(tǒng)計(jì)方法抉

擇錯(cuò)誤

表格1

設(shè)計(jì)方法錯(cuò)誤的統(tǒng)計(jì)正確統(tǒng)計(jì)方法

方法

兩個(gè)均數(shù)的比成組設(shè)計(jì)的t成組設(shè)計(jì)的秩和

較(成組設(shè)計(jì)、檢驗(yàn)檢驗(yàn)

完全隨機(jī)設(shè)

計(jì))

多個(gè)均數(shù)的比多個(gè)成組設(shè)完全隨機(jī)設(shè)計(jì)的

較(成組設(shè)計(jì)、計(jì)的t檢驗(yàn)方差分析及q檢

完全隨機(jī)設(shè)驗(yàn)、完全隨機(jī)設(shè)計(jì)

計(jì))的秩和檢驗(yàn)及兩

兩比較

數(shù)值變量的配成組設(shè)計(jì)的t配對(duì)t檢驗(yàn)、配對(duì)

對(duì)設(shè)檢驗(yàn)秩和檢驗(yàn)

28

計(jì)

隨機(jī)區(qū)組設(shè)計(jì)多個(gè)成組設(shè)隨機(jī)區(qū)組設(shè)計(jì)的

(配伍設(shè)計(jì)的t檢驗(yàn)、方差分析及q檢

計(jì))完全隨機(jī)設(shè)驗(yàn)、隨機(jī)區(qū)組設(shè)計(jì)

計(jì)的方差分的秩和檢驗(yàn)及兩

析兩比較

交叉設(shè)計(jì)成組設(shè)計(jì)的t交叉設(shè)計(jì)的方差

檢驗(yàn)、配對(duì)t分析、交叉設(shè)計(jì)的

檢驗(yàn)、配對(duì)秩秩和檢驗(yàn)

和檢驗(yàn)

4.分布特征及數(shù)理統(tǒng)計(jì)條件

數(shù)理統(tǒng)計(jì)和概率論是統(tǒng)計(jì)的理論

基礎(chǔ)。每種統(tǒng)計(jì)方法都要涉及數(shù)理統(tǒng)計(jì)公式,而

這些數(shù)理統(tǒng)計(jì)公式都是在一定條件下推導(dǎo)和建

立的。也就是說,只有當(dāng)某個(gè)或某些條件滿足時(shí),

某個(gè)數(shù)理統(tǒng)計(jì)公式才成立,反之若不滿足條件

時(shí),就不能使用某個(gè)數(shù)理統(tǒng)計(jì)公式。

在數(shù)理統(tǒng)計(jì)公式推導(dǎo)和建立的條件中,涉及

最多的是數(shù)據(jù)的分布特征。數(shù)據(jù)的分布特征是指

29

數(shù)據(jù)的數(shù)理統(tǒng)計(jì)規(guī)律,許多數(shù)理統(tǒng)計(jì)公式都是在

特定的分布下推導(dǎo)和建立的。若實(shí)際資料服從

(符合)某種分布,即可使用該分布所具有的數(shù)

理統(tǒng)計(jì)規(guī)律來分析和處理該實(shí)際資料,反之則不

能。在臨床資料的統(tǒng)計(jì)分析過程中,涉及得最多

的分布有正態(tài)分布、偏態(tài)分布、二項(xiàng)分布等。

許多統(tǒng)計(jì)方法對(duì)資料的分布有要求,如:均

數(shù)和標(biāo)準(zhǔn)差、t和U檢驗(yàn);方差分析都要求資料

服從正態(tài)分布,而中位數(shù)和四分位數(shù)間距、秩和

檢驗(yàn)等,可用于不服從正態(tài)分布的資料。所以,

臨床資料的統(tǒng)計(jì)分析過程中,應(yīng)考慮資料的分布

特征,最起碼的要求是熟悉正態(tài)分布與偏態(tài)分

布。

例如:在臨床科研中,許多資料的描述不考

慮資料的分布特征,而多選擇均數(shù)與標(biāo)準(zhǔn)差。如

某婦科腫瘤化療前的血象值,資料如下表:

某婦科腫瘤化療前的血象值

表格2

指標(biāo)名例均標(biāo)偏度P峰度P

數(shù)數(shù)準(zhǔn)系數(shù)值系數(shù)值

血紅蛋9811118.0.180.0.020.

30

白(g/D.9982045595

98

血小板9817387.1.350.1.840.

(X.5811300300

109/L)00

白細(xì)胞986.72.71.200.1.200.

(X93067700201

109/L)03

從上結(jié)果可見,若只看三項(xiàng)指標(biāo)的均數(shù)和

標(biāo)準(zhǔn)差,臨床醫(yī)生也許不會(huì)懷疑有什么問題。但

是經(jīng)正態(tài)性檢驗(yàn),病人的血紅蛋白服從正態(tài)分

布,而血小板和白細(xì)胞兩項(xiàng)指標(biāo)的偏度和峰度系

數(shù)均不服從正態(tài)分布(PC0.05)。因此,描述病

人的血小板和白細(xì)胞平均水平正確的指標(biāo)是中

位數(shù),而其變異程度應(yīng)使用四分位數(shù)間距。

除了數(shù)據(jù)的分布特征外,有些數(shù)理統(tǒng)計(jì)公式

還有其它一些的條件,如t檢驗(yàn)和方差分析的方

差齊性、卡方檢驗(yàn)的理論數(shù)⑴大小等。

總之,對(duì)于臨床科研工作者來說,

為正確地進(jìn)行統(tǒng)計(jì)方法的抉擇,首先要掌握或熟

悉上述影響統(tǒng)計(jì)方法抉擇因素;其次,還應(yīng)熟悉

和了解常用統(tǒng)計(jì)方法的應(yīng)用條件。

31

二.數(shù)據(jù)資料的描述

統(tǒng)計(jì)描述的內(nèi)容包括了統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖和

表,其目的是使數(shù)據(jù)資料的基本特征更加清晰地

表達(dá)。本節(jié)只討論統(tǒng)計(jì)指標(biāo)的正確選用,而統(tǒng)計(jì)

圖表的正確使用請(qǐng)參閱其他書籍。

1.數(shù)值變量資料的描述

描述數(shù)值變量資料的基本特征有兩類指標(biāo),

一是描述集中趨勢(shì)的指標(biāo),用以反映一組數(shù)據(jù)的

平均水平;二是描述離散程度的指標(biāo),用以反映

一組數(shù)據(jù)的變異大小。各指標(biāo)的名稱及適用范圍

等見表2。

表3描述數(shù)值變量資料的常用指標(biāo)

表格3

指標(biāo)名用途適用的資料

均描述一組數(shù)據(jù)的正態(tài)分布或近似

數(shù)(X平均水平,集中位正態(tài)分布

一)置

中位與均數(shù)相同偏態(tài)分布、分布未

數(shù)(M)知、兩端無界

幾何均數(shù)與均數(shù)相同對(duì)數(shù)正態(tài)分布,等

32

(G)比資料

標(biāo)準(zhǔn)描述一組數(shù)據(jù)的正態(tài)分布或近似

差(變異大小,離散程正態(tài)分布

S)度

四分位數(shù)(QU-QL)與標(biāo)偏態(tài)分布、分布未

間距準(zhǔn)差相同知、兩端無界

極差與標(biāo)準(zhǔn)差相同觀察例數(shù)相近的

(R)數(shù)值變量

變異系數(shù)與標(biāo)準(zhǔn)差相同比較幾組資料間

(CV)的變異大小

從表中可看出,均數(shù)與標(biāo)準(zhǔn)差聯(lián)合

使用描述正態(tài)分布或近似正態(tài)分布資料的基本

特征;中位數(shù)與四分位數(shù)間距聯(lián)合使用描述偏態(tài)

分布或未知分布資料的基本特征。

這些描述指標(biāo)應(yīng)用時(shí),最常見的錯(cuò)誤是不考

慮其應(yīng)用條件的隨意使用,如:用均數(shù)和標(biāo)準(zhǔn)差

描述偏態(tài)分布、分布未知或兩端無界的資料,這

是目前在臨床研究文獻(xiàn)中較為普遍和典型的錯(cuò)

誤。

2.分類變量資料的描述

描述分類變量資料常用的指標(biāo)有

33

死亡率、患病率、發(fā)病率等。

臨床上,這類指標(biāo)的應(yīng)用較多,出

現(xiàn)的錯(cuò)誤也較多。這些錯(cuò)誤歸納起來大致有兩

類:一是以比代率,即誤將構(gòu)成比(proportion)

當(dāng)做率(rate)來描述某病發(fā)生的強(qiáng)度和頻率,如

用某病的病人數(shù)除以就診人數(shù)(或人次)得到“某

病患病率”或“某病發(fā)病率”,就是典型的以比

代率的例子。二是把各種不同的率相互混淆,如

把患病率與發(fā)病率、死亡率與病死率等概念混

同。

需要指出的是,單純利用醫(yī)院常規(guī)

資料,最易得到的指標(biāo)是構(gòu)成比。而描述疾病發(fā)

生強(qiáng)度和頻率的指標(biāo)的率反映如患病率、發(fā)病

率、死亡率等,很難利用醫(yī)院的常規(guī)資料(如醫(yī)

院醫(yī)院的病例檔案)獲得。因?yàn)?,醫(yī)院常規(guī)資料

無法得到計(jì)算這些率所需的分子和分母的資料。

所以,一旦研究者利用的是醫(yī)院常規(guī)資料,則無

法衡量疾病對(duì)人群的危害程度。常用描述指標(biāo)如

表3o

表4描述分類變量資料的常用指標(biāo)

表格4

指標(biāo)計(jì)算公式意義

34

名稱

率發(fā)生某現(xiàn)象的觀察描述事件發(fā)生的強(qiáng)

單位數(shù)可能發(fā)生度和頻率

某現(xiàn)象的觀察單位

總數(shù)XK

構(gòu)成AA+B+…X事物內(nèi)部各組成部

比100%分所占的比重

相對(duì)ABA指標(biāo)為B指標(biāo)的若

比干倍或百分之幾

三.數(shù)據(jù)資料的比較

在眾多的科研研究方法中,歸納起

來最基本的手段有兩種,一是對(duì)研究對(duì)象的全體

進(jìn)行研究,在實(shí)際工作中往往難以實(shí)現(xiàn);二是從

總體中抽取一定數(shù)量的樣本進(jìn)行抽樣研究,但要

考慮抽樣誤差對(duì)結(jié)果的影響。因此,若用樣本信

息去推斷其所代表的總體間有無差別時(shí),需要使

用假設(shè)檢驗(yàn)(hypothesistesting)或稱顯著性

檢驗(yàn)(significancetest)。

1.假設(shè)檢驗(yàn)的基本步驟

(1)建立檢驗(yàn)假設(shè)。

35

建立假設(shè)的過程應(yīng)有三個(gè)內(nèi)容。即

無效假設(shè)HO(nullhypothesis)>備擇假設(shè)

Hl(alternativehypothesis)和檢驗(yàn)水準(zhǔn)

(sizeoftest)o無效假設(shè)HO是研究者

想得到結(jié)論的對(duì)立事件的假設(shè),對(duì)于差異性檢驗(yàn)

而言,研究者想得到的是“有差別”的結(jié)論,故

首先應(yīng)假設(shè)各總體間無差別;備擇假設(shè)H1是其

對(duì)立的假設(shè),即是“有差別”的假設(shè);此外,還

應(yīng)確定有統(tǒng)計(jì)意義的概率水平,通常取

0.05o建立檢驗(yàn)假設(shè)的通常格式為:

H0:多個(gè)樣本來自同一總體,各樣本間的差

別是由于抽樣誤差所致

H1:多個(gè)樣本來自不同的總體,各

樣本間的差別是由于不同總體所致

=0.05

(2)計(jì)算統(tǒng)計(jì)量。

根據(jù)資料的類型、分布特征、科研設(shè)計(jì)方法

等條件,選擇不同的統(tǒng)計(jì)量計(jì)算方法,如t檢驗(yàn)、

u檢驗(yàn)等統(tǒng)計(jì)方法。

(3)根據(jù)統(tǒng)計(jì)量的值得到概率(P)值;再按

概率⑻值的大小得出結(jié)論。其結(jié)論只有兩種情

況,若PW時(shí),即概率小于我們事先確定好的

36

檢驗(yàn)水平概率(如P^o.05),我們就拒絕其無

差別假設(shè)H0,而接受HL認(rèn)為差別有統(tǒng)計(jì)學(xué)意

義,各樣本來自不同總體,樣本間的差別是總體

的不同所致;若P>時(shí),其概率大于我們事先

確定好的檢驗(yàn)水平(如P>0.05),我們就不拒

絕其無差別的假設(shè)H0,還不能認(rèn)為各總體間有

差別,樣本來自同一總體,即差別沒有統(tǒng)計(jì)學(xué)意

義。

2.假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤

在假設(shè)檢驗(yàn)的兩種結(jié)論中無論做出何種結(jié)

論,都有可能犯錯(cuò)誤。

當(dāng)PW時(shí),做出“拒絕其無差別的假設(shè),

可認(rèn)為各總體間有差別”的結(jié)論時(shí)就有可能犯錯(cuò)

誤,這類錯(cuò)誤稱為第一類錯(cuò)誤(I型錯(cuò)誤,

typeIerror),其犯錯(cuò)誤的概率用表示,

若取0?05,此時(shí)犯I型錯(cuò)誤的概率小于或等

于0.05,若假設(shè)檢驗(yàn)的P值比0.05越小,犯一

類錯(cuò)誤的概率就越小。

當(dāng)P>時(shí),做出“不拒絕其無差別的假設(shè),

還不能認(rèn)為各總體間有差別”的結(jié)論時(shí),就有可

能犯第二類錯(cuò)誤(H型錯(cuò)誤,typeIIerror),

37

其犯錯(cuò)誤的概率用表示,在通常情況下犯n類

錯(cuò)誤的概率未知,雖然是個(gè)未知數(shù),但假設(shè)檢

驗(yàn)p值越大,犯二類錯(cuò)誤的概率就越小。

表5假設(shè)檢驗(yàn)的兩類錯(cuò)誤

表格5

11靈設(shè)檢驗(yàn)結(jié)

真實(shí)情況拒絕H0不拒絕H0

樣本來自推斷不正推斷正確

同一總體確()(1-)

樣本來自推斷正確推斷不正

不同總體(1_)確()

3.假設(shè)檢驗(yàn)的注意事項(xiàng)

(1)假設(shè)檢驗(yàn)比較的對(duì)象是總體,而研究

的方法是抽樣研究,即通過對(duì)樣本提供的信息去

推斷總體間有無差別。不能誤認(rèn)為假設(shè)檢驗(yàn)是樣

本間的比較,更不能將此體現(xiàn)在結(jié)論中。如果研

究方法是普查時(shí),由于不存在抽樣誤差,也不存

在用樣本提供的信息去推斷總體的問題。因此,

在這種情況下也就不能使用假設(shè)檢驗(yàn)的統(tǒng)計(jì)方

法。

38

(2)當(dāng)PW時(shí),概率(P)越小,

越有理由拒絕無差別的假設(shè),即拒絕假設(shè)的可信

程度就越大,這時(shí)概率(P)越小,其結(jié)論的可

靠性就越好。當(dāng)P>時(shí),概率(P)越大,越

有理由不拒絕無差別的假設(shè),即不拒絕無差別假

設(shè)的可信程度就越大。這時(shí)概率(P)越大,其

結(jié)論的可靠性就越好。因此,無論概率PW,

還是P>時(shí),都不能說明組間差別的大小。

(3)假設(shè)檢驗(yàn)的結(jié)論不能絕對(duì)化。

假設(shè)檢驗(yàn)的結(jié)論是根據(jù)概率(P)的大小得出的,

事實(shí)上當(dāng)PW時(shí),我們拒絕其無差別的假設(shè),

可認(rèn)為各總體間有差別,但是,只要PWO,我

們無法完全拒絕無差別的假設(shè),即不能肯定各總

體間有差別:同理,當(dāng)P>時(shí),我們不拒絕其

無差別的假設(shè),還不能認(rèn)為各總體間有差別,但

是,只要PW1,我們無法完全接受無差別的假

設(shè),即不能肯定各總體間無差別。因此,在做出

統(tǒng)計(jì)結(jié)論時(shí),要避免使用絕對(duì)的或肯定的語句,

如當(dāng)PW時(shí),使用“拒絕假設(shè),可認(rèn)為各組間

有差別";而當(dāng)P>時(shí),使用“不拒絕假設(shè),

還不能認(rèn)為各組間有差別”的語言進(jìn)行描述。

(4)假設(shè)檢驗(yàn)的方法與設(shè)計(jì)方案和

39

分布特征有關(guān),如:兩組比較的方法有t檢驗(yàn)、

U檢驗(yàn)、兩組秩和檢驗(yàn)、四格表和校正四格表的

2檢驗(yàn)等,這些方法只能用于兩組比較,而不

能用于多組的比較。在實(shí)際工作中錯(cuò)誤地使用兩

組比較的方法代替多組比較的情況并不少見,

如,三個(gè)均數(shù)比較用三個(gè)t檢驗(yàn)、四個(gè)均數(shù)比較

用六個(gè)t檢驗(yàn)等。多組比較可用方差分析、多組

秩和檢驗(yàn)、行乘列2檢驗(yàn)等。t、u檢驗(yàn)和方

差分析用于正態(tài)分布的資料,不服從正態(tài)分布的

資料可用秩和檢驗(yàn)。

4.常用假設(shè)檢驗(yàn)方法

(1)計(jì)量資料的假設(shè)檢驗(yàn)

表6常用計(jì)量資料假設(shè)檢驗(yàn)方法

表格6

比較目應(yīng)用條件統(tǒng)計(jì)方法

樣本與總體例數(shù)(n)較大,u檢驗(yàn)

的比較(任意分布)

例數(shù)(n)較t檢驗(yàn)

40

小,樣本來自

正態(tài)

兩組資料的(完全隨機(jī)設(shè)u檢驗(yàn)

比較計(jì))例

數(shù)(n)較大,

(任意分布)

例數(shù)(n)較成組設(shè)計(jì)的

小,來自正態(tài)t檢驗(yàn)

且方差齊

例數(shù)(n)較小成組設(shè)計(jì)的秩和

且非正態(tài)或方檢驗(yàn)、或成組設(shè)計(jì)

差不齊的檢驗(yàn)、或成

組設(shè)計(jì)的中位數(shù)

檢驗(yàn)

配對(duì)資料的例數(shù)(n)較大,對(duì)設(shè)計(jì)的U檢驗(yàn)

比較(配對(duì)(任意分布)

設(shè)計(jì))

例數(shù)(n)較小,配對(duì)設(shè)計(jì)的t檢

差值來自正態(tài)驗(yàn)

例數(shù)(n)較小,配對(duì)設(shè)計(jì)的秩

差值為非正態(tài)和檢驗(yàn)

多組資料的各組均數(shù)來自成組設(shè)計(jì)的方

41

比較(完全正

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論