版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇
SPSS數(shù)據(jù)分析的醫(yī)學(xué)統(tǒng)計(jì)方法選擇
目錄
數(shù)據(jù)分析的統(tǒng)計(jì)方法選擇小結(jié)錯(cuò)誤!未定義書
簽。
目錄...................................2
?資料1................................................................4
完全隨機(jī)分組設(shè)計(jì)的資料..............4
配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)..............7
變量之間的關(guān)聯(lián)性分析................9
?資料2..............................................................12
L連續(xù)性資料.......................13
1.1兩組獨(dú)立樣本比較......13
1.2兩組配對(duì)樣本的比較....13
1.3多組完全隨機(jī)樣本比較...13
L4多組隨機(jī)區(qū)組樣本比較...14
2.分類資料........................15
2?1四格表資料............15
2.22XC表或RX2表資料的統(tǒng)計(jì)
分析.......................16
2.3RXC表資料的統(tǒng)計(jì)分析.?17
2
2.4配對(duì)分類資料的統(tǒng)計(jì)分析.18
?資料3...............................18
一、兩個(gè)變量之間的關(guān)聯(lián)性分析...20
二、回歸分析...................21
?資料4...............................23
一.統(tǒng)計(jì)方法抉擇的條件........23
1.分析目的...............24
2.資料類型...............25
3.設(shè)計(jì)方法...............27
4.分布特征及數(shù)理統(tǒng)計(jì)條件?.29
二.數(shù)據(jù)資料的描述............32
1.數(shù)值變量資料的描述.....32
2.分類變量資料的描述.....33
三.數(shù)據(jù)資料的比較............35
1.假設(shè)檢驗(yàn)的基本步驟.....35
2.假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤..37
3.假設(shè)檢驗(yàn)的注意事項(xiàng).....38
4.常用假設(shè)檢驗(yàn)方法.......40
四.變量間的相關(guān)分析..........44
1.數(shù)值變量(計(jì)量資料)的關(guān)系
分析.......................45
2.無序分類變量(計(jì)數(shù)資料)的
3
相關(guān)分析..................46
3.有序分類變量(等級(jí)資
料)等級(jí)相關(guān).......46
?資料1
完全隨機(jī)分組設(shè)計(jì)的資料
一、兩組或多組計(jì)量資料的比較
1.兩組資料:
1)大樣本資料或服從正態(tài)分布的小樣本
資料
(1)若方差齊性,則作成組t檢驗(yàn)
(2)若方差不齊,則作檢驗(yàn)或用成組
的Wilcoxon秩和檢驗(yàn)
2)小樣本偏態(tài)分布資料,則用成組的
Wilcoxon秩和檢驗(yàn)
2.多組資料:
1)若大樣本資料或服從正態(tài)分布,并且
方差齊性,則作完全隨機(jī)的方差分析。如果
方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)
一步作統(tǒng)計(jì)分析:選擇合適的方法(如:LSD
檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比較。
2)如果小樣本的偏態(tài)分布資料或方差不
4
齊,則作KruskalWallis的統(tǒng)計(jì)檢驗(yàn)。如果
KruskalWallis的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意
義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法
(如:用成組的Wilcoxon秩和檢驗(yàn),但用
Bonferroni方法校正P值等)進(jìn)行兩兩比較。
二'分類資料的統(tǒng)計(jì)分析
1.單樣本資料與總體比較
1)二分類資料:
(1)小樣本時(shí):用二項(xiàng)分布進(jìn)行確切概率
法檢驗(yàn);
(2)大樣本時(shí):用U檢驗(yàn)。
2)多分類資料:用Pearson/檢驗(yàn)(又
稱擬合優(yōu)度檢驗(yàn))。
2.四格表資料
l)n>40并且所以理論數(shù)大于5,則用
Pearson%2
2)n>40并且所以理論數(shù)大于1并且至少
存在一個(gè)理論數(shù)<5,則用校正行或用
Fisher's確切概率法檢驗(yàn)
3)n<40或存在理論數(shù)<1,則用
Fishers檢驗(yàn)
3.2XC表資料的統(tǒng)計(jì)分析
5
1)列變量為效應(yīng)指標(biāo),并且為有序多分
類變量,行變量為分組變量,則行評(píng)分的CMH
/或成組的Wilcoxon秩和檢驗(yàn)
2)列變量為效應(yīng)指標(biāo)并且為二分類,列
變量為有序多分類變量,則用趨勢(shì)/檢驗(yàn)
3)行變量和列變量均為無序分類變量
(l)n>40并且理論數(shù)小于5的格子數(shù)〈行
列表中格子總數(shù)的25%,則用Pearson%2
(2)n<40或理論數(shù)小于5的格子數(shù)》行列
表中格子總數(shù)的25%,則用Fisher,s確切
概率法檢驗(yàn)
4.RXC表資料的統(tǒng)計(jì)分析
1)列變量為效應(yīng)指標(biāo),并且為有序多分
類變量,行變量為分組變量,則CMH/或
KruskalWallis的秩和檢驗(yàn)
2)列變量為效應(yīng)指標(biāo),并且為無序多分
類變量,行變量為有序多分類變量,作none
zerocorrelationanalysis的CMH%2
3)列變量和行變量均為有序多分類變
量,可以作Spearman相關(guān)分析
4)列變量和行變量均為無序多分類變
量,
6
(l)n>40并且理論數(shù)小于5的格子數(shù)〈行
列表中格子總數(shù)的25%,則用Pearson%
(2)n<40或理論數(shù)小于5的格子數(shù)》行列
表中格子總數(shù)的25%,則用Fisher's確切
概率法檢驗(yàn)
三、Poisson分布資料
1.單樣本資料與總體比較:
1)觀察值較小時(shí):用確切概率法進(jìn)行檢
驗(yàn)。
2)觀察值較大時(shí):用正態(tài)近似的U檢驗(yàn)。
2.兩個(gè)樣本比較:用正態(tài)近似的U檢驗(yàn)。
配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)
四、兩組或多組計(jì)量資料的比較
1.兩組資料:
1)大樣本資料或配對(duì)差值服從正態(tài)分布
的小樣本資料,作配對(duì)t檢驗(yàn)
2)小樣本并且差值呈偏態(tài)分布資料,則
用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn)
2.多組資料:
1)若大樣本資料或殘差服從正態(tài)分布,
并且方差齊性,則作隨機(jī)區(qū)組的方差分析。
7
如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,
則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:
LSD檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比
較。
2)如果小樣本時(shí),差值呈偏態(tài)分布資料
或方差不齊,則作Fredman的統(tǒng)計(jì)檢驗(yàn)。如
果Fredman的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則
進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:
用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn),但用
Bonferroni方法校正P值等)進(jìn)行兩兩比較。
五、分類資料的統(tǒng)計(jì)分析
1.四格表資料
l)b+c>40,則用McNemar配對(duì)%?檢驗(yàn)或
配對(duì)邊際必檢驗(yàn)
2)b+c<40,則用二項(xiàng)分布確切概率法檢
驗(yàn)
2.CXC表資料:
1)配對(duì)比較:用McNemar配對(duì)了檢驗(yàn)或
配對(duì)邊際/檢驗(yàn)
2)一致性問題(Agreement):用Kap檢
驗(yàn)
8
變量之間的關(guān)聯(lián)性分析
六、兩個(gè)變量之間的關(guān)聯(lián)性分析
1.兩個(gè)變量均為連續(xù)型變量
1)小樣本并且兩個(gè)變量服從雙正態(tài)分
布,則用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析
2)大樣本或兩個(gè)變量不服從雙正態(tài)分
布,則用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析
2.兩個(gè)變量均為有序分類變量,可以用
Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析
3.一個(gè)變量為有序分類變量,另一個(gè)變量
為連續(xù)型變量,可以用Spearman相關(guān)系數(shù)進(jìn)
行統(tǒng)計(jì)分析
七、回歸分析
L直線回歸:如果回歸分析中的殘差服從
正態(tài)分布(大樣本時(shí)無需正態(tài)性),殘差與自
變量無趨勢(shì)變化,則直線回歸(單個(gè)自變量的
線性回歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)?/p>
變換,使其滿足上述條件。
2.多重線性回歸:應(yīng)變量(Y)為連續(xù)型
變量(即計(jì)量資料),自變量(XuX2,Xp)
可以為連續(xù)型變量、有序分類變量或二分類變
量。如果回歸分析中的殘差服從正態(tài)分布(大
9
樣本時(shí)無需正態(tài)性),殘差與自變量無趨勢(shì)變
化,可以作多重線性回歸。
1)觀察性研究:可以用逐步線性回歸尋
找(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變
量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>
它可能的混雜因素變量,以校正這些混雜因
素對(duì)結(jié)果的混雜作用
3.二分類的Logistic回歸:應(yīng)變量為二
分類變量,自變量(X“X2,Xp)可以為
連續(xù)型變量、有序分類變量或二分類變量。
1)非配對(duì)的情況:用非條件Logistic
回歸
(1)觀察性研究:可以用逐步線性回歸尋
找(擬)主要的影響因素
(2)實(shí)驗(yàn)性研究:在保持主要研究因素變
量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>
它可能的混雜因素變量,以校正這些混雜因
素對(duì)結(jié)果的混雜作用
2)配對(duì)的情況:用條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋
找(擬)主要的影響因素
10
(2)實(shí)驗(yàn)性研究:在保持主要研究因素變
量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>
它可能的混雜因素變量,以校正這些混雜因
素對(duì)結(jié)果的混雜作用
4.有序多分類有序的Logistic回歸:應(yīng)
變量為有序多分類變量,自變量(X1,X2,…,
Xp)可以為連續(xù)型變量、有序分類變量或二分
類變量。
1)觀察性研究:可以用逐步線性回歸尋
找(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變
量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>
它可能的混雜因素變量,以校正這些混雜因
素對(duì)結(jié)果的混雜作用
5.無序多分類有序的Logistic回歸:應(yīng)
變量為無序多分類變量,自變量(X1,X2,…,
Xp)可以為連續(xù)型變量、有序分類變量或二分
類變量。
1)觀察性研究:可以用逐步線性回歸尋
找(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變
量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>
11
它可能的混雜因素變量,以校正這些混雜因
素對(duì)結(jié)果的混雜作用
八、生存分析資料:
(要求資料記錄結(jié)局和結(jié)局發(fā)生的時(shí)
間,如:死亡和死亡發(fā)生的時(shí)間)
1.用Kaplan-Meier方法估計(jì)生存曲線
2.大樣本時(shí),可以壽命表方法估計(jì)
3.單因素可以用Log—rank比較兩條或
多條生存曲線
4.多個(gè)因素時(shí),可以作多重的Cox回歸
1)觀察性研究:可以用逐步線性回歸尋
找(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變
量(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢?/p>
它可能的混雜因素變量,以校正這些混雜因
素對(duì)結(jié)果的混雜作用
?資料2
12
1.連續(xù)性資料
1.1兩組獨(dú)立樣本比較
1.1.1資料符合正態(tài)分布,且兩組方差齊性,
直接采用t檢驗(yàn)。
1.1.2資料不符合正態(tài)分布
(1)可進(jìn)行數(shù)據(jù)轉(zhuǎn)換,如對(duì)數(shù)轉(zhuǎn)換等,使
之服從正態(tài)分布,然后對(duì)轉(zhuǎn)換后的數(shù)據(jù)采用t檢
驗(yàn);
(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。
1.1.3資料方差不齊
(1)采用Satterthwate的t'檢驗(yàn);
(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。
1.2兩組配對(duì)樣本的比較
1.2.1兩組差值服從正態(tài)分布,采用配對(duì)t
檢驗(yàn)。
1.2.2兩組差值不服從正態(tài)分布,采用
wilcoxon的符號(hào)配對(duì)秩和檢驗(yàn)。
1.3多組完全隨機(jī)樣本比較
1.3.1資料符合正態(tài)分布,且各組方差齊性,
13
直接采用完全隨機(jī)的方差分析。如果檢驗(yàn)結(jié)果為
有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較
的方法有LSD檢驗(yàn),Bonferroni法,tukey法,
Scheffe法,SNK法等。
1.3.2資料不符合正態(tài)分布,或各組方差不
齊,則采用非參數(shù)檢驗(yàn)的Kruscal-Wallis法。
如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩
比較,一般采用Bonferroni法校正P值,然后
用成組的Wilcoxon檢驗(yàn)。
1.4多組隨機(jī)區(qū)組樣本比較
1.4.1資料符合正態(tài)分布,且各組方差齊性,
直接采用隨機(jī)區(qū)組的方差分析。如果檢驗(yàn)結(jié)果為
有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較
的方法有LSD檢驗(yàn),Bonferroni法,tukey法,
Scheffe法,SNK法等。
L4.2資料不符合正態(tài)分布,或各組方差不
齊,則采用非參數(shù)檢驗(yàn)的Fridman檢驗(yàn)法。如果
檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比
較,一般采用Bonferroni法校正P值,然后用
符號(hào)配對(duì)的Wilcoxon檢驗(yàn)。
需要注意的問題:
14
(1)一般來說,如果是大樣本,比如各組
例數(shù)大于50,可以不作正態(tài)性檢驗(yàn),直接采用t
檢驗(yàn)或方差分析。因?yàn)榻y(tǒng)計(jì)學(xué)上有中心極限定
理,假定大樣本是服從正態(tài)分布的。
(2)當(dāng)進(jìn)行多組比較時(shí),最容易犯的錯(cuò)誤
是僅比較其中的兩組,而不顧其他組,這樣作容
易增大犯假陽性錯(cuò)誤的概率。正確的做法應(yīng)該
是,先作總的各組間的比較,如果總的來說差別
有統(tǒng)計(jì)學(xué)意義,然后才能作其中任意兩組的比
較,這些兩兩比較有特定的統(tǒng)計(jì)方法,如上面提
到的LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe
法,SNK法等。絕不能對(duì)其中的兩組直接采用t
檢驗(yàn),這樣即使得出結(jié)果也未必正確。
(3)關(guān)于常用的設(shè)計(jì)方法:多組資料盡管
最終分析都是采用方差分析,但不同設(shè)計(jì)會(huì)有差
別。常用的設(shè)計(jì)如完全隨即設(shè)計(jì),隨機(jī)區(qū)組設(shè)計(jì),
析因設(shè)計(jì),裂區(qū)設(shè)計(jì),嵌套設(shè)計(jì)等。
2.分類資料
2.1四格表資料
2.1.1例數(shù)大于40,且所有理論數(shù)大于5,
則用普通的Pearson檢驗(yàn)。
15
2.1.2例數(shù)大于40,所有理論數(shù)大于1,且
至少一個(gè)理論數(shù)小于5,則用校正的檢驗(yàn)或
Fisher's確切概率法檢驗(yàn)。
2.1.3例數(shù)小于40,或有理論數(shù)小于2,則
用Fisher,s確切概率法檢驗(yàn)。
2.22XC表或RX2表資料的統(tǒng)計(jì)分析
2.2.1列變量&行變量均為無序分類變量,
則
(1)例數(shù)大于40,且理論數(shù)小于5的格子
數(shù)目〈總格子數(shù)目的25%,則用普通的Pearson
檢驗(yàn)。
(2)例數(shù)小于40,或理論數(shù)小于5的格子
數(shù)目》總格子數(shù)目的25%,則用Fisher's確切
概率法檢驗(yàn)。
2.2.2列變量為效應(yīng)指標(biāo),且為有序多分類
變量,行變量為分組變量,用普通的Pearson檢
驗(yàn)只說明組間構(gòu)成比不同,如要說明療效,則可
用行平均分差檢驗(yàn)或成組的Wilcoxon秩和檢
驗(yàn)。
2.2.3列變量為效應(yīng)指標(biāo),且為二分類變量,
行變量為有序多分類變量,則可采用普通的
16
Pearson檢驗(yàn)比較各組之間有無差別,如果總的
來說有差別,還可進(jìn)一步作兩兩比較,以說明是
否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。
2.3RXC表資料的統(tǒng)計(jì)分析
2.3.1列變量&行變量均為無序分類變量,
則
(1)例數(shù)大于40,且理論數(shù)小于5的格子
數(shù)目〈總格子數(shù)目的25%,則用普通的Pearson
檢驗(yàn)。
(2)例數(shù)小于40,或理論數(shù)小于5的格子
數(shù)目》總格子數(shù)目的25%,則用Fisher's確切
概率法檢驗(yàn)。
(3)如果要作相關(guān)性分析,可采用Pearson
相關(guān)系數(shù)。
2.3.2列變量為效應(yīng)指標(biāo),且為有序多分類
變量,行變量為分組變量,用普通的Pearson檢
驗(yàn)只說明組間構(gòu)成比不同,如要說明療效或強(qiáng)弱
程度的不同,則可用行平均分差檢驗(yàn)或成組的
Wilcoxon秩和檢驗(yàn)或Ridit分析。
2.3.3列變量為效應(yīng)指標(biāo),且為無序多分類
變量,行變量為有序多分類變量,則可采用普通
17
的Pearson檢驗(yàn)比較各組之間有無差別,如果有
差別,還可進(jìn)一步作兩兩比較,以說明是否任意
兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。
2.3.4列變量&行變量均為有序多分類變量
(1)如要做組間差別分析,則可用行平均
分差檢驗(yàn)或成組的Wilcoxon秩和檢驗(yàn)或Ridit
分析。如果總的來說有差別,還可進(jìn)一步作兩兩
比較,以說明是否任意兩組之間的差別都有統(tǒng)計(jì)
學(xué)意義。
(2)如果要做兩變量之間的相關(guān)性,可采
用Spearson相關(guān)分析。
2.4配對(duì)分類資料的統(tǒng)計(jì)分析
2.4.1四格表配對(duì)資料
(1)b+c>40,則用McNemar配對(duì)檢驗(yàn)。
(2)b+c<40,則用校正的配對(duì)檢驗(yàn)。
2.4.1CXC資料
(1)配對(duì)比較:用McNemar配對(duì)檢驗(yàn)。
(2)一致性檢驗(yàn),用Kappa檢驗(yàn)。
?資料3
18
在研究設(shè)計(jì)時(shí),統(tǒng)計(jì)方法的選擇需考慮以
下6個(gè)方面的問題:(1)看反應(yīng)變量是單變量、
雙變量還是多變量;(2)看單變量資料屬于3種
資料類型(計(jì)量、計(jì)數(shù)及等級(jí)資料)中的哪一
種;(3)看影響因素是單因素還是多因素;(4)
看單樣本、兩樣本或多樣本;(5)看是否是配對(duì)
或配伍設(shè)計(jì);(6)看是否滿足檢驗(yàn)方法所需的前
提條件,必要時(shí)可進(jìn)行變量變換,應(yīng)用參數(shù)方
法進(jìn)行假設(shè)檢驗(yàn)往往要求數(shù)據(jù)滿足某些前提條
件,如兩個(gè)獨(dú)立樣本比較t檢驗(yàn)或多個(gè)獨(dú)立樣
本比較的方差分析,均要求方差齊性,因此需
要做方差齊性檢驗(yàn)。如果要用正態(tài)分布法估計(jì)參
考值范圍,首先要檢驗(yàn)資料是否服從正態(tài)分布。
在建立各種多重回歸方程時(shí),常需檢驗(yàn)變量間
的多重共線性和殘差分布的正態(tài)性。
表1T
連續(xù)因變分類因變量
量
連續(xù)回歸分析Logistic回
自變歸
量
分類方差分析表格檢驗(yàn)(比
19
自變(ANOVA)如卡方檢驗(yàn))
量
不同的統(tǒng)計(jì)分析方法都有其各自的應(yīng)用條
件和適用范圍。實(shí)際應(yīng)用時(shí),必須根據(jù)研究目
的、資料的性質(zhì)以及所要分析的具體內(nèi)容等選
擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,切忌只關(guān)心P值的大
?。ㄊ欠瘛?.05),而忽略統(tǒng)計(jì)分析方法的應(yīng)用
條件和適用范圍。
一、兩個(gè)變量之間的關(guān)聯(lián)性分析
1.兩個(gè)變量均為連續(xù)型變量
1)小樣本并且兩個(gè)變量服從雙正態(tài)分布,則
用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析
2)大樣本或兩個(gè)變量不服從雙正態(tài)分布,則
用Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析
2.兩個(gè)變量均為有序分類變量,可以用
Spearman相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)分析
3.一個(gè)變量為有序分類變量,另一個(gè)變量
為連續(xù)型變量,可以用Spearman相關(guān)系數(shù)進(jìn)行
統(tǒng)計(jì)分析
20
二、回歸分析
1.直線回歸:如果回歸分析中的殘差服從正
態(tài)分布(大樣本時(shí)無需正態(tài)性),殘差與自變量
無趨勢(shì)變化,則直線回歸(單個(gè)自變量的線性回
歸,稱為簡(jiǎn)單回歸),否則應(yīng)作適當(dāng)?shù)淖儞Q,使
其滿足上述條件。
2.多重線性回歸:應(yīng)變量(Y)為連續(xù)型變
量(即計(jì)量資料),自變量(XI,X2,Xp)
可以為連續(xù)型變量、有序分類變量或二分類變
量。如果回歸分析中的殘差服從正態(tài)分布(大樣
本時(shí)無需正態(tài)性),殘差與自變量無趨勢(shì)變化,
可以作多重線性回歸。
1)觀察性研究:可以用逐步線性回歸尋找
(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變量
(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>
的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的
混雜作用
3.二分類的Logistic回歸:應(yīng)變量為二分
類變量,自變量(XI,X2,Xp)可以為連續(xù)
型變量、有序分類變量或二分類變量。
1)非配對(duì)的情況:用非條件Logistic回歸
21
(1)觀察性研究:可以用逐步線性回歸尋找
(擬)主要的影響因素
(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量
(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>
的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的
混雜作用
2)配對(duì)的情況:用條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找
(擬)主要的影響因素
(2)實(shí)驗(yàn)性研究:在保持主要研究因素變量
(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>
的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的
混雜作用
4.有序多分類有序的Logistic回歸:應(yīng)變
量為有序多分類變量,自變量(XLX2,Xp)
可以為連續(xù)型變量、有序分類變量或二分類變
量。
1)觀察性研究:可以用逐步線性回歸尋找
(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變量
(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>
22
的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的
混雜作用
5.無序多分類有序的Logistic回歸:應(yīng)變
量為無序多分類變量,自變量(XLX2,Xp)
可以為連續(xù)型變量、有序分類變量或二分類變
量。
1)觀察性研究:可以用逐步線性回歸尋找
(擬)主要的影響因素
2)實(shí)驗(yàn)性研究:在保持主要研究因素變量
(干預(yù)變量)外,可以適當(dāng)?shù)匾胍恍┢渌赡?/p>
的混雜因素變量,以校正這些混雜因素對(duì)結(jié)果的
混雜作用。
?資料4
一.統(tǒng)計(jì)方法抉擇的條件
在臨床科研工作中,正確地抉擇統(tǒng)計(jì)分析方
法,應(yīng)充分考慮科研工作者的分析目的、臨床科
研設(shè)計(jì)方法、搜集到的數(shù)據(jù)資料類型、數(shù)據(jù)資料
的分布特征與所涉及的數(shù)理統(tǒng)計(jì)條件等。其中任
何一個(gè)問題沒考慮到或考慮有誤,都有可能導(dǎo)致
統(tǒng)計(jì)分析方法的抉擇失誤。
23
此外,統(tǒng)計(jì)分析方法的抉擇應(yīng)在科研的設(shè)計(jì)
階段來完成,而不應(yīng)該在臨床試驗(yàn)結(jié)束或在數(shù)據(jù)
的收集工作已完成之后。
對(duì)臨床科研數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析和進(jìn)行統(tǒng)計(jì)
方法抉擇時(shí),應(yīng)考慮下列因素:
1.分析目的
對(duì)于臨床醫(yī)生及臨床流行病醫(yī)生來說,在進(jìn)
行統(tǒng)計(jì)分析前,一定要明確利用統(tǒng)計(jì)方法達(dá)到研
究者的什么目的。一般來說,統(tǒng)計(jì)方法可分為描
述與推斷兩類方法。一是統(tǒng)計(jì)描述
(descriptivestatistics),二是統(tǒng)計(jì)推斷
(inferentialstatistics)o
統(tǒng)計(jì)描述,即利用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖或統(tǒng)計(jì)
表,對(duì)數(shù)據(jù)資料所進(jìn)行的最基本的統(tǒng)計(jì)分析,使
其能反映數(shù)據(jù)資料的基本特征,有利于研究者能
準(zhǔn)確、全面地了解數(shù)據(jù)資料所包涵的信息,以便
做出科學(xué)的推斷。統(tǒng)計(jì)表,如頻數(shù)表、四格表、
列聯(lián)表等;統(tǒng)計(jì)圖,如直方圖、餅圖,散點(diǎn)圖等;
統(tǒng)計(jì)指標(biāo),如均數(shù)、標(biāo)準(zhǔn)差、率及構(gòu)成比等。
統(tǒng)計(jì)推斷,即利用樣本所提供的信息對(duì)總體
進(jìn)行推斷(估計(jì)或比較),其中包括參數(shù)估計(jì)和
24
假設(shè)檢驗(yàn),如可信區(qū)間、t檢驗(yàn)、方差分析、
2檢驗(yàn)等,如要分析甲藥治療與乙藥治療兩組
的療效是否不相同、不同地區(qū)某病的患病率有無
差異等。
還有些統(tǒng)計(jì)方法,既包含了統(tǒng)計(jì)描述也包含
了統(tǒng)計(jì)推斷的內(nèi)容,如不同變量間的關(guān)系分析。
相關(guān)分析,可用于研究某些因素間的相互聯(lián)系,
以相關(guān)系數(shù)來衡量各因素間相關(guān)的密切程度和
方向,如高血脂與冠心病、慢性宮頸炎與宮頸癌
等的相關(guān)分析;回歸分析,可用于研究某個(gè)因素
與另一因素(變量)的依存關(guān)系,即以一個(gè)變量
去推測(cè)另一變量,如利用回歸分析建立起來的回
歸方程,可由兒童的年齡推算其體重。
2.資料類型
資料類型的劃分現(xiàn)多采用國際通用的分類
方法,將其分為兩類:數(shù)值變量
(numericalvariable)資料和分類變量
(categoricalvariable)資料。數(shù)值變量是指
其值是可以定量或準(zhǔn)確測(cè)量的變量,其表現(xiàn)為數(shù)
值大小的不同;而分類變量是指其值是無法定量
或不能測(cè)量的變量,其表現(xiàn)沒有數(shù)值的大小而只
25
有互不相容的類別或?qū)傩?。分類變量又可分為無
序分類變量和有序分類變量?jī)尚☆?,無序分類變
量表現(xiàn)為沒有大小之分的屬性或類別,如:性別
是兩類無序分類變量,血型是四類無序分類變
量;有序分類變量表現(xiàn)為各屬性或類別間有程度
之分,如:臨床上某種疾病的“輕、中、重”,治
療結(jié)果的“無效、顯效、好轉(zhuǎn)、治愈”。由此可
見,數(shù)值變量資料、無序分類變量資料和有序分
類變量資料又可叫做計(jì)量資料、計(jì)數(shù)資料和等級(jí)
資料。
資料類型的劃分與統(tǒng)計(jì)方法的抉擇有關(guān),在
多數(shù)情況下不同的資料類型,選擇的統(tǒng)計(jì)方法不
一樣。如數(shù)值變量資料的比較可選用t檢驗(yàn)、U
檢驗(yàn)等統(tǒng)計(jì)方法;而率的比較多用2檢驗(yàn)。
值得注意的是,有些臨床科研工作者,常常
人為地將數(shù)值變量的結(jié)果轉(zhuǎn)化為分類變量的臨
床指標(biāo),然后參與統(tǒng)計(jì)分析,如患者的血紅蛋白
含量,研究者常用正常、輕度貧血、中度貧血和
重度貧血來表示,這樣雖然照顧了臨床工作的習(xí)
慣,卻損失了資料所提供的信息量。換言之,在
多數(shù)情況下,數(shù)值變量資料提供的信息量最為充
分,可進(jìn)行統(tǒng)計(jì)分析的手段也較為豐富、經(jīng)典和
26
可靠,與之相比,分類變量在這些方面都不如數(shù)
值變量資料。因此,在臨床實(shí)驗(yàn)中要盡可能選擇
量化的指標(biāo)反映實(shí)驗(yàn)效應(yīng),若確實(shí)無法定量時(shí),
才選用分類數(shù)據(jù),通常不宜將定量數(shù)據(jù)轉(zhuǎn)變成分
類數(shù)據(jù)。
3.設(shè)計(jì)方法
在眾多的臨床科研設(shè)計(jì)方法中,每
一種設(shè)計(jì)方法都有與之相適應(yīng)的統(tǒng)計(jì)方法。在統(tǒng)
計(jì)方法的抉擇時(shí),必須根據(jù)不同的臨床科研設(shè)計(jì)
方法來選擇相應(yīng)的統(tǒng)計(jì)分析方法。如果統(tǒng)計(jì)方法
的抉擇與設(shè)計(jì)方法不一致,統(tǒng)計(jì)分析得到的任何
結(jié)論都是錯(cuò)誤的。
在常用的科研設(shè)計(jì)方法中,有成組設(shè)計(jì)(完
全隨機(jī)設(shè)計(jì))的t檢驗(yàn)、配對(duì)t檢驗(yàn)、成組設(shè)計(jì)
(完全隨機(jī)設(shè)計(jì))的方差分析、配伍設(shè)計(jì)(隨機(jī)
區(qū)組設(shè)計(jì))的方差分析等,都是統(tǒng)計(jì)方法與科研
設(shè)計(jì)方法有關(guān)的佐證。因此,應(yīng)注意區(qū)分成組設(shè)
計(jì)(完全隨機(jī)設(shè)計(jì))與配對(duì)和配伍設(shè)計(jì)(隨機(jī)區(qū)
組設(shè)計(jì)),在成組設(shè)計(jì)中又要注意區(qū)別兩組與多
組設(shè)計(jì)。最常見的錯(cuò)誤是將配對(duì)或配伍設(shè)計(jì)(隨
機(jī)區(qū)組設(shè)計(jì))的資料當(dāng)做成組設(shè)計(jì)(完全隨機(jī)設(shè)
27
計(jì))來處理,如配對(duì)設(shè)計(jì)的資料使用成組t檢驗(yàn)、
配伍設(shè)計(jì)(隨機(jī)區(qū)組設(shè)計(jì))使用成組資料的方差
分析;或?qū)⑷M及三組以上的成組設(shè)計(jì)(完全隨
機(jī)設(shè)計(jì))資料的比較采用多個(gè)t檢驗(yàn)、三個(gè)或多
個(gè)率的比較采用四格表的卡方檢驗(yàn)來進(jìn)行比較,
都是典型的錯(cuò)誤。如下表:
表1常見與設(shè)計(jì)方法有關(guān)的統(tǒng)計(jì)方法抉
擇錯(cuò)誤
表格1
設(shè)計(jì)方法錯(cuò)誤的統(tǒng)計(jì)正確統(tǒng)計(jì)方法
方法
兩個(gè)均數(shù)的比成組設(shè)計(jì)的t成組設(shè)計(jì)的秩和
較(成組設(shè)計(jì)、檢驗(yàn)檢驗(yàn)
完全隨機(jī)設(shè)
計(jì))
多個(gè)均數(shù)的比多個(gè)成組設(shè)完全隨機(jī)設(shè)計(jì)的
較(成組設(shè)計(jì)、計(jì)的t檢驗(yàn)方差分析及q檢
完全隨機(jī)設(shè)驗(yàn)、完全隨機(jī)設(shè)計(jì)
計(jì))的秩和檢驗(yàn)及兩
兩比較
數(shù)值變量的配成組設(shè)計(jì)的t配對(duì)t檢驗(yàn)、配對(duì)
對(duì)設(shè)檢驗(yàn)秩和檢驗(yàn)
28
計(jì)
隨機(jī)區(qū)組設(shè)計(jì)多個(gè)成組設(shè)隨機(jī)區(qū)組設(shè)計(jì)的
(配伍設(shè)計(jì)的t檢驗(yàn)、方差分析及q檢
計(jì))完全隨機(jī)設(shè)驗(yàn)、隨機(jī)區(qū)組設(shè)計(jì)
計(jì)的方差分的秩和檢驗(yàn)及兩
析兩比較
交叉設(shè)計(jì)成組設(shè)計(jì)的t交叉設(shè)計(jì)的方差
檢驗(yàn)、配對(duì)t分析、交叉設(shè)計(jì)的
檢驗(yàn)、配對(duì)秩秩和檢驗(yàn)
和檢驗(yàn)
4.分布特征及數(shù)理統(tǒng)計(jì)條件
數(shù)理統(tǒng)計(jì)和概率論是統(tǒng)計(jì)的理論
基礎(chǔ)。每種統(tǒng)計(jì)方法都要涉及數(shù)理統(tǒng)計(jì)公式,而
這些數(shù)理統(tǒng)計(jì)公式都是在一定條件下推導(dǎo)和建
立的。也就是說,只有當(dāng)某個(gè)或某些條件滿足時(shí),
某個(gè)數(shù)理統(tǒng)計(jì)公式才成立,反之若不滿足條件
時(shí),就不能使用某個(gè)數(shù)理統(tǒng)計(jì)公式。
在數(shù)理統(tǒng)計(jì)公式推導(dǎo)和建立的條件中,涉及
最多的是數(shù)據(jù)的分布特征。數(shù)據(jù)的分布特征是指
29
數(shù)據(jù)的數(shù)理統(tǒng)計(jì)規(guī)律,許多數(shù)理統(tǒng)計(jì)公式都是在
特定的分布下推導(dǎo)和建立的。若實(shí)際資料服從
(符合)某種分布,即可使用該分布所具有的數(shù)
理統(tǒng)計(jì)規(guī)律來分析和處理該實(shí)際資料,反之則不
能。在臨床資料的統(tǒng)計(jì)分析過程中,涉及得最多
的分布有正態(tài)分布、偏態(tài)分布、二項(xiàng)分布等。
許多統(tǒng)計(jì)方法對(duì)資料的分布有要求,如:均
數(shù)和標(biāo)準(zhǔn)差、t和U檢驗(yàn);方差分析都要求資料
服從正態(tài)分布,而中位數(shù)和四分位數(shù)間距、秩和
檢驗(yàn)等,可用于不服從正態(tài)分布的資料。所以,
臨床資料的統(tǒng)計(jì)分析過程中,應(yīng)考慮資料的分布
特征,最起碼的要求是熟悉正態(tài)分布與偏態(tài)分
布。
例如:在臨床科研中,許多資料的描述不考
慮資料的分布特征,而多選擇均數(shù)與標(biāo)準(zhǔn)差。如
某婦科腫瘤化療前的血象值,資料如下表:
某婦科腫瘤化療前的血象值
表格2
指標(biāo)名例均標(biāo)偏度P峰度P
數(shù)數(shù)準(zhǔn)系數(shù)值系數(shù)值
差
血紅蛋9811118.0.180.0.020.
30
白(g/D.9982045595
98
血小板9817387.1.350.1.840.
(X.5811300300
109/L)00
白細(xì)胞986.72.71.200.1.200.
(X93067700201
109/L)03
從上結(jié)果可見,若只看三項(xiàng)指標(biāo)的均數(shù)和
標(biāo)準(zhǔn)差,臨床醫(yī)生也許不會(huì)懷疑有什么問題。但
是經(jīng)正態(tài)性檢驗(yàn),病人的血紅蛋白服從正態(tài)分
布,而血小板和白細(xì)胞兩項(xiàng)指標(biāo)的偏度和峰度系
數(shù)均不服從正態(tài)分布(PC0.05)。因此,描述病
人的血小板和白細(xì)胞平均水平正確的指標(biāo)是中
位數(shù),而其變異程度應(yīng)使用四分位數(shù)間距。
除了數(shù)據(jù)的分布特征外,有些數(shù)理統(tǒng)計(jì)公式
還有其它一些的條件,如t檢驗(yàn)和方差分析的方
差齊性、卡方檢驗(yàn)的理論數(shù)⑴大小等。
總之,對(duì)于臨床科研工作者來說,
為正確地進(jìn)行統(tǒng)計(jì)方法的抉擇,首先要掌握或熟
悉上述影響統(tǒng)計(jì)方法抉擇因素;其次,還應(yīng)熟悉
和了解常用統(tǒng)計(jì)方法的應(yīng)用條件。
31
二.數(shù)據(jù)資料的描述
統(tǒng)計(jì)描述的內(nèi)容包括了統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖和
表,其目的是使數(shù)據(jù)資料的基本特征更加清晰地
表達(dá)。本節(jié)只討論統(tǒng)計(jì)指標(biāo)的正確選用,而統(tǒng)計(jì)
圖表的正確使用請(qǐng)參閱其他書籍。
1.數(shù)值變量資料的描述
描述數(shù)值變量資料的基本特征有兩類指標(biāo),
一是描述集中趨勢(shì)的指標(biāo),用以反映一組數(shù)據(jù)的
平均水平;二是描述離散程度的指標(biāo),用以反映
一組數(shù)據(jù)的變異大小。各指標(biāo)的名稱及適用范圍
等見表2。
表3描述數(shù)值變量資料的常用指標(biāo)
表格3
指標(biāo)名用途適用的資料
稱
均描述一組數(shù)據(jù)的正態(tài)分布或近似
數(shù)(X平均水平,集中位正態(tài)分布
一)置
中位與均數(shù)相同偏態(tài)分布、分布未
數(shù)(M)知、兩端無界
幾何均數(shù)與均數(shù)相同對(duì)數(shù)正態(tài)分布,等
32
(G)比資料
標(biāo)準(zhǔn)描述一組數(shù)據(jù)的正態(tài)分布或近似
差(變異大小,離散程正態(tài)分布
S)度
四分位數(shù)(QU-QL)與標(biāo)偏態(tài)分布、分布未
間距準(zhǔn)差相同知、兩端無界
極差與標(biāo)準(zhǔn)差相同觀察例數(shù)相近的
(R)數(shù)值變量
變異系數(shù)與標(biāo)準(zhǔn)差相同比較幾組資料間
(CV)的變異大小
從表中可看出,均數(shù)與標(biāo)準(zhǔn)差聯(lián)合
使用描述正態(tài)分布或近似正態(tài)分布資料的基本
特征;中位數(shù)與四分位數(shù)間距聯(lián)合使用描述偏態(tài)
分布或未知分布資料的基本特征。
這些描述指標(biāo)應(yīng)用時(shí),最常見的錯(cuò)誤是不考
慮其應(yīng)用條件的隨意使用,如:用均數(shù)和標(biāo)準(zhǔn)差
描述偏態(tài)分布、分布未知或兩端無界的資料,這
是目前在臨床研究文獻(xiàn)中較為普遍和典型的錯(cuò)
誤。
2.分類變量資料的描述
描述分類變量資料常用的指標(biāo)有
33
死亡率、患病率、發(fā)病率等。
臨床上,這類指標(biāo)的應(yīng)用較多,出
現(xiàn)的錯(cuò)誤也較多。這些錯(cuò)誤歸納起來大致有兩
類:一是以比代率,即誤將構(gòu)成比(proportion)
當(dāng)做率(rate)來描述某病發(fā)生的強(qiáng)度和頻率,如
用某病的病人數(shù)除以就診人數(shù)(或人次)得到“某
病患病率”或“某病發(fā)病率”,就是典型的以比
代率的例子。二是把各種不同的率相互混淆,如
把患病率與發(fā)病率、死亡率與病死率等概念混
同。
需要指出的是,單純利用醫(yī)院常規(guī)
資料,最易得到的指標(biāo)是構(gòu)成比。而描述疾病發(fā)
生強(qiáng)度和頻率的指標(biāo)的率反映如患病率、發(fā)病
率、死亡率等,很難利用醫(yī)院的常規(guī)資料(如醫(yī)
院醫(yī)院的病例檔案)獲得。因?yàn)?,醫(yī)院常規(guī)資料
無法得到計(jì)算這些率所需的分子和分母的資料。
所以,一旦研究者利用的是醫(yī)院常規(guī)資料,則無
法衡量疾病對(duì)人群的危害程度。常用描述指標(biāo)如
表3o
表4描述分類變量資料的常用指標(biāo)
表格4
指標(biāo)計(jì)算公式意義
34
名稱
率發(fā)生某現(xiàn)象的觀察描述事件發(fā)生的強(qiáng)
單位數(shù)可能發(fā)生度和頻率
某現(xiàn)象的觀察單位
總數(shù)XK
構(gòu)成AA+B+…X事物內(nèi)部各組成部
比100%分所占的比重
相對(duì)ABA指標(biāo)為B指標(biāo)的若
比干倍或百分之幾
三.數(shù)據(jù)資料的比較
在眾多的科研研究方法中,歸納起
來最基本的手段有兩種,一是對(duì)研究對(duì)象的全體
進(jìn)行研究,在實(shí)際工作中往往難以實(shí)現(xiàn);二是從
總體中抽取一定數(shù)量的樣本進(jìn)行抽樣研究,但要
考慮抽樣誤差對(duì)結(jié)果的影響。因此,若用樣本信
息去推斷其所代表的總體間有無差別時(shí),需要使
用假設(shè)檢驗(yàn)(hypothesistesting)或稱顯著性
檢驗(yàn)(significancetest)。
1.假設(shè)檢驗(yàn)的基本步驟
(1)建立檢驗(yàn)假設(shè)。
35
建立假設(shè)的過程應(yīng)有三個(gè)內(nèi)容。即
無效假設(shè)HO(nullhypothesis)>備擇假設(shè)
Hl(alternativehypothesis)和檢驗(yàn)水準(zhǔn)
(sizeoftest)o無效假設(shè)HO是研究者
想得到結(jié)論的對(duì)立事件的假設(shè),對(duì)于差異性檢驗(yàn)
而言,研究者想得到的是“有差別”的結(jié)論,故
首先應(yīng)假設(shè)各總體間無差別;備擇假設(shè)H1是其
對(duì)立的假設(shè),即是“有差別”的假設(shè);此外,還
應(yīng)確定有統(tǒng)計(jì)意義的概率水平,通常取
0.05o建立檢驗(yàn)假設(shè)的通常格式為:
H0:多個(gè)樣本來自同一總體,各樣本間的差
別是由于抽樣誤差所致
H1:多個(gè)樣本來自不同的總體,各
樣本間的差別是由于不同總體所致
=0.05
(2)計(jì)算統(tǒng)計(jì)量。
根據(jù)資料的類型、分布特征、科研設(shè)計(jì)方法
等條件,選擇不同的統(tǒng)計(jì)量計(jì)算方法,如t檢驗(yàn)、
u檢驗(yàn)等統(tǒng)計(jì)方法。
(3)根據(jù)統(tǒng)計(jì)量的值得到概率(P)值;再按
概率⑻值的大小得出結(jié)論。其結(jié)論只有兩種情
況,若PW時(shí),即概率小于我們事先確定好的
36
檢驗(yàn)水平概率(如P^o.05),我們就拒絕其無
差別假設(shè)H0,而接受HL認(rèn)為差別有統(tǒng)計(jì)學(xué)意
義,各樣本來自不同總體,樣本間的差別是總體
的不同所致;若P>時(shí),其概率大于我們事先
確定好的檢驗(yàn)水平(如P>0.05),我們就不拒
絕其無差別的假設(shè)H0,還不能認(rèn)為各總體間有
差別,樣本來自同一總體,即差別沒有統(tǒng)計(jì)學(xué)意
義。
2.假設(shè)檢驗(yàn)結(jié)論的兩類錯(cuò)誤
在假設(shè)檢驗(yàn)的兩種結(jié)論中無論做出何種結(jié)
論,都有可能犯錯(cuò)誤。
當(dāng)PW時(shí),做出“拒絕其無差別的假設(shè),
可認(rèn)為各總體間有差別”的結(jié)論時(shí)就有可能犯錯(cuò)
誤,這類錯(cuò)誤稱為第一類錯(cuò)誤(I型錯(cuò)誤,
typeIerror),其犯錯(cuò)誤的概率用表示,
若取0?05,此時(shí)犯I型錯(cuò)誤的概率小于或等
于0.05,若假設(shè)檢驗(yàn)的P值比0.05越小,犯一
類錯(cuò)誤的概率就越小。
當(dāng)P>時(shí),做出“不拒絕其無差別的假設(shè),
還不能認(rèn)為各總體間有差別”的結(jié)論時(shí),就有可
能犯第二類錯(cuò)誤(H型錯(cuò)誤,typeIIerror),
37
其犯錯(cuò)誤的概率用表示,在通常情況下犯n類
錯(cuò)誤的概率未知,雖然是個(gè)未知數(shù),但假設(shè)檢
驗(yàn)p值越大,犯二類錯(cuò)誤的概率就越小。
表5假設(shè)檢驗(yàn)的兩類錯(cuò)誤
表格5
11靈設(shè)檢驗(yàn)結(jié)
果
真實(shí)情況拒絕H0不拒絕H0
樣本來自推斷不正推斷正確
同一總體確()(1-)
樣本來自推斷正確推斷不正
不同總體(1_)確()
3.假設(shè)檢驗(yàn)的注意事項(xiàng)
(1)假設(shè)檢驗(yàn)比較的對(duì)象是總體,而研究
的方法是抽樣研究,即通過對(duì)樣本提供的信息去
推斷總體間有無差別。不能誤認(rèn)為假設(shè)檢驗(yàn)是樣
本間的比較,更不能將此體現(xiàn)在結(jié)論中。如果研
究方法是普查時(shí),由于不存在抽樣誤差,也不存
在用樣本提供的信息去推斷總體的問題。因此,
在這種情況下也就不能使用假設(shè)檢驗(yàn)的統(tǒng)計(jì)方
法。
38
(2)當(dāng)PW時(shí),概率(P)越小,
越有理由拒絕無差別的假設(shè),即拒絕假設(shè)的可信
程度就越大,這時(shí)概率(P)越小,其結(jié)論的可
靠性就越好。當(dāng)P>時(shí),概率(P)越大,越
有理由不拒絕無差別的假設(shè),即不拒絕無差別假
設(shè)的可信程度就越大。這時(shí)概率(P)越大,其
結(jié)論的可靠性就越好。因此,無論概率PW,
還是P>時(shí),都不能說明組間差別的大小。
(3)假設(shè)檢驗(yàn)的結(jié)論不能絕對(duì)化。
假設(shè)檢驗(yàn)的結(jié)論是根據(jù)概率(P)的大小得出的,
事實(shí)上當(dāng)PW時(shí),我們拒絕其無差別的假設(shè),
可認(rèn)為各總體間有差別,但是,只要PWO,我
們無法完全拒絕無差別的假設(shè),即不能肯定各總
體間有差別:同理,當(dāng)P>時(shí),我們不拒絕其
無差別的假設(shè),還不能認(rèn)為各總體間有差別,但
是,只要PW1,我們無法完全接受無差別的假
設(shè),即不能肯定各總體間無差別。因此,在做出
統(tǒng)計(jì)結(jié)論時(shí),要避免使用絕對(duì)的或肯定的語句,
如當(dāng)PW時(shí),使用“拒絕假設(shè),可認(rèn)為各組間
有差別";而當(dāng)P>時(shí),使用“不拒絕假設(shè),
還不能認(rèn)為各組間有差別”的語言進(jìn)行描述。
(4)假設(shè)檢驗(yàn)的方法與設(shè)計(jì)方案和
39
分布特征有關(guān),如:兩組比較的方法有t檢驗(yàn)、
U檢驗(yàn)、兩組秩和檢驗(yàn)、四格表和校正四格表的
2檢驗(yàn)等,這些方法只能用于兩組比較,而不
能用于多組的比較。在實(shí)際工作中錯(cuò)誤地使用兩
組比較的方法代替多組比較的情況并不少見,
如,三個(gè)均數(shù)比較用三個(gè)t檢驗(yàn)、四個(gè)均數(shù)比較
用六個(gè)t檢驗(yàn)等。多組比較可用方差分析、多組
秩和檢驗(yàn)、行乘列2檢驗(yàn)等。t、u檢驗(yàn)和方
差分析用于正態(tài)分布的資料,不服從正態(tài)分布的
資料可用秩和檢驗(yàn)。
4.常用假設(shè)檢驗(yàn)方法
(1)計(jì)量資料的假設(shè)檢驗(yàn)
表6常用計(jì)量資料假設(shè)檢驗(yàn)方法
表格6
比較目應(yīng)用條件統(tǒng)計(jì)方法
的
樣本與總體例數(shù)(n)較大,u檢驗(yàn)
的比較(任意分布)
例數(shù)(n)較t檢驗(yàn)
40
小,樣本來自
正態(tài)
兩組資料的(完全隨機(jī)設(shè)u檢驗(yàn)
比較計(jì))例
數(shù)(n)較大,
(任意分布)
例數(shù)(n)較成組設(shè)計(jì)的
小,來自正態(tài)t檢驗(yàn)
且方差齊
例數(shù)(n)較小成組設(shè)計(jì)的秩和
且非正態(tài)或方檢驗(yàn)、或成組設(shè)計(jì)
差不齊的檢驗(yàn)、或成
組設(shè)計(jì)的中位數(shù)
檢驗(yàn)
配對(duì)資料的例數(shù)(n)較大,對(duì)設(shè)計(jì)的U檢驗(yàn)
比較(配對(duì)(任意分布)
設(shè)計(jì))
例數(shù)(n)較小,配對(duì)設(shè)計(jì)的t檢
差值來自正態(tài)驗(yàn)
例數(shù)(n)較小,配對(duì)設(shè)計(jì)的秩
差值為非正態(tài)和檢驗(yàn)
多組資料的各組均數(shù)來自成組設(shè)計(jì)的方
41
比較(完全正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度全屋衣柜定制環(huán)保材料研究與開發(fā)合同3篇
- 2025年度全新官方版離婚協(xié)議書及婚姻財(cái)產(chǎn)分割執(zhí)行監(jiān)督協(xié)議3篇
- 二零二五年度內(nèi)墻膩?zhàn)邮┕づc智能家居控制系統(tǒng)合同3篇
- 2025年度智能汽車買賣與數(shù)據(jù)共享合作協(xié)議3篇
- 二零二五年度租賃房屋租賃保證金收取合同2篇
- 2025年度公司企業(yè)間智慧城市建設(shè)項(xiàng)目借款合同2篇
- 2025年度新能源電池研發(fā)與生產(chǎn)合同3篇
- 二零二五年度互聯(lián)網(wǎng)企業(yè)高管股權(quán)激勵(lì)聘用合同3篇
- 二零二五年度紙裝修工程節(jié)能評(píng)估合同3篇
- 2025年度養(yǎng)殖場(chǎng)季節(jié)性用工合同2篇
- 低壓電工常識(shí)及安全用電
- 2024五凌電力限公司招聘5人高頻考題難、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 市政公司3年戰(zhàn)略規(guī)劃方案
- 2024年全國中考英語試單選(動(dòng)詞時(shí)態(tài))
- 2024年江蘇護(hù)理職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 血糖儀使用規(guī)范課件
- DB21-T 2931-2018羊肚菌日光溫室栽培技術(shù)規(guī)程
- 貴州省黔東南州2023-2024學(xué)年九年級(jí)上學(xué)期期末文化水平測(cè)試化學(xué)試卷
- 《空調(diào)零部件介紹》課件
- 2024年度醫(yī)院內(nèi)分泌與代謝科述職報(bào)告課件
- 手術(shù)室無菌操作流程
評(píng)論
0/150
提交評(píng)論