《統(tǒng)計學(xué):卡方檢驗》課件_第1頁
《統(tǒng)計學(xué):卡方檢驗》課件_第2頁
《統(tǒng)計學(xué):卡方檢驗》課件_第3頁
《統(tǒng)計學(xué):卡方檢驗》課件_第4頁
《統(tǒng)計學(xué):卡方檢驗》課件_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué):2檢驗統(tǒng)計學(xué):

2檢驗(chisquaretest),常用于分類變量資料的統(tǒng)計推斷。理論依據(jù):

2分布(chisquaredistribution)擬合優(yōu)度檢驗(goodnessoffittest)本章:單個頻數(shù)分布的擬合優(yōu)度檢驗完全隨機設(shè)計下兩組頻數(shù)分布的比較多組頻數(shù)分布的比較配對設(shè)計下兩組頻數(shù)分布的比較精確概率法:

2檢驗失效時用不失效時用也可用第一節(jié)

2分布和擬合優(yōu)度檢驗

v=1v=4v=6v=9各種自由度的

2分布右側(cè)尾部面積為α?xí)r的臨界值記為(附表8)一、2分布

2分布本是一種連續(xù)型隨機變量的概率分布如果Z服從標準正態(tài)分布,那么Z2服從自由度為1的

2分布k個相互獨立的標準正態(tài)分布隨機變量的分布稱為自由度為ν的

2分布,記為自由度ν趨于∞時,

2分布逼近正態(tài)分布二、擬合優(yōu)度檢驗(大樣本)

擬合優(yōu)度檢驗:已知樣本的頻率分布,其總體分布是否等于某理論分布?步驟:1.建立檢驗假設(shè)原假設(shè)和對立假設(shè)分別為H0:總體分布等于給定的理論分布H1:總體分布不等于給定的理論分布2.計算檢驗統(tǒng)計量A:實際觀察到的頻數(shù)T:根據(jù)H0確定的理論頻數(shù)H0成立時,統(tǒng)計量

大樣本時近似地服從

2分布,自由度為ν=κ-1-(計算Ti時利用樣本資料估計的參數(shù)個數(shù))

大樣本:實踐中理論頻數(shù)不能小于5樣本量不大時,連續(xù)性校正

稱為Pearson

2統(tǒng)計量

樣本量不大時,連續(xù)性校正3.確定相應(yīng)的概率P,作出推斷結(jié)論。

例7-1對表7-1所示數(shù)據(jù)作正態(tài)分布擬合優(yōu)度檢驗。

已知136例體模骨密度測量值的均數(shù),標準差。檢驗的假設(shè)為

H0:總體分布是N(

,

2)

H1:總體分布不是該正態(tài)分布自由度

=10-1-2=7

可以認為該樣本服從正態(tài)分布。第二節(jié)完全隨機設(shè)計下

兩組頻數(shù)分布的

2檢驗

一、二分類情形----2×2列聯(lián)表例7-2某醫(yī)師研究用蘭芩口服液與銀黃口服液治療慢性咽炎療效有無差別,將病情相似的80名患者隨機分成兩組,分別用兩種藥物治療。

問題:這兩個頻數(shù)分布的總體分布是否相等?

2×2列聯(lián)表(contingencytable),又稱四格表檢驗步驟:(1)建立檢驗假設(shè)H0:兩藥的有效概率相同,

1=

2H1:兩藥有效概率不同,

1

2檢驗水準

=0.05(2)計算檢驗統(tǒng)計量H0成立時,兩組有效概率相同均近似地等于合并估計的有效概率統(tǒng)計量(3)確定p值(1)建立檢驗假設(shè)H0:兩藥的有效概率相同H1:兩藥有效概率不同(2)計算檢驗統(tǒng)計量

=(2-1)(2-1)=1(3)確定p值

20.025(1)=5.02,

P<0.025

一個有用的指標----“需處理數(shù)”

(numberneededtotreat,NNT)

為進一步描述兩藥效果的差別,可進一步計算兩個有效率之差91.1%-68.6%=22.5%

NNT=(有效率之差)-1=(91.1%-68.6%)-1=(22.5%)-1=4.44直觀意義:要想增加1例有效者,需要有4.44位患者從銀黃口服液組轉(zhuǎn)向蘭芩口服液組。

四格表專用公式本例

校正公式

當n≥40時,如果有某個格子出現(xiàn)1

T<5或其等價的形式例7-3將病情相似的淋巴系腫瘤患者隨機分成兩組,分別做單純化療與復(fù)合化療,兩組的緩解率見表7-4,問兩療法的總體緩解率是否不同?

20.1(1)=2.71,2.624<20.1(1),P>0.1,

尚不能認為兩種治療方案的總體緩解概率不同。

二、多分類的情形----2×C列聯(lián)表

定性變量具有多分類時,兩個頻數(shù)分布的數(shù)據(jù)可表示為一個2×C例7-4北京市1986年城市和農(nóng)村20至40歲已婚婦女避孕方法情況如表所示,試分析北京城市和農(nóng)村采用不同避孕方法的總體分布是否有差別。一切如前理論頻數(shù)統(tǒng)計量或自由度

=(行數(shù)―1)×(列數(shù)―1)等價形式

=(2-1)(5-1)=4

20.001(4)=18.47,153.25>18.47,P<0.001

可以認為,北京城市鄉(xiāng)已婚婦女避孕方法概率分布不同

第三節(jié)完全隨機設(shè)計下

多組頻數(shù)分布的

2檢驗

例7-5不同劑量鎮(zhèn)痛效果研究。將條件相似的53名產(chǎn)婦隨機分成三組,分別按三種不同劑量服用該藥,鎮(zhèn)痛效果如表7-8。分析思路、統(tǒng)計量、自由度等公式一切如前!檢驗假設(shè)略有不同,如拒絕零假設(shè),還需兩兩比較!H0:三種劑量鎮(zhèn)痛有效的概率相同。H1:不同劑量鎮(zhèn)痛有效的概率不全相同。自由度

=(3-1)(2-1)=2

20.025(2)=7.38,P<0.025,拒絕H0

可以認為三種劑量鎮(zhèn)痛有效的總體概率有差別。三個都不同?哪兩個間不同?兩兩比較根據(jù)比較的次數(shù)修正檢驗水準

=

需比較的次數(shù)本例,

=0.05

3=0.0167

第四節(jié)配對設(shè)計下兩組頻數(shù)分布的

2檢驗

一、二分類情形——2×2列聯(lián)表例7-6設(shè)有28份咽喉涂抹標本,把每份標本一分為二,依同樣的條件分別接種于甲、乙兩種白喉桿菌培養(yǎng)基上,觀察白喉桿菌的生長情況,結(jié)果如表7-10,問兩種培養(yǎng)基上白喉桿菌的生長概率有無差別?設(shè)計;兩份樣本實質(zhì)上是一樣的,不是互相獨立的;目的:推斷兩方法的陽性概率有無差別甲培養(yǎng)基的陽性率=

乙培養(yǎng)基的陽性率=

甲培養(yǎng)基的陽性率-乙培養(yǎng)基的陽性率=

比較兩種培養(yǎng)基的陽性概率是否有差別,只需考察白喉桿菌生長狀況不一致的兩個格子!McNemar檢驗

若H0成立,白喉桿菌生長狀況不一致的兩個格子理論頻數(shù)都應(yīng)該是由

2檢驗基本公式,有

化簡,

2統(tǒng)計量為若b+c<40,校正公式為自由度

ν=1

ν=1

20.05(1)=3.84,P<0.05,拒絕H0,可以認為,兩種培養(yǎng)基上白喉桿菌生長的陽性概率不相等

注意:我們將兩變量不一致的總例數(shù)(b+c)視為固定值,在此條件下進行推斷,無需考慮兩變量一致的總例數(shù)a和d的大小。這類方法在統(tǒng)計學(xué)中稱為條件推斷方法。當然,也有文獻報道對此類問題進行非條件推斷的方法,這時a和d的信息都能用上,但超出了本書的范圍。*二、多分類的情形

----配對R×R列聯(lián)表

例7-7對150名冠心病患者用兩種方法檢查室壁收縮運動的情況,檢測結(jié)果見表7-12。試比較兩種方法測定結(jié)果的概率分布有無差別。

McNemar檢驗的推廣

Spielman(1996)將上述方法用于多等位基因傳遞不平衡檢驗(transmissiondisequilibriumtest,TDT)搜集n對同胞,每一對中必須有一位是某疾病的患者,另一位未患該疾病;變量1為同胞對中患者在某位點的等位基因類別變量2為同胞對中未患者在該位點的等位基因類別檢驗:同胞對中,患病者等位基因的概率分布是否與未患病者等位基因的概率分布相同?

如果兩個概率分布不同,則該基因位點可能與該疾病有關(guān)。

第六節(jié)四格表的確切概率法

R.A.Fisher(1934年)確切概率法(exactprobability)

四格表資料,若有理論數(shù)小于1,或n<40,或作

2檢驗后所得概率P

接近檢驗水準

,需用此法直接計算概率,以作判斷?;舅枷耄核母癖磉吘壓嫌嫻潭ú蛔兊臈l件下,直接計算表內(nèi)四個格子數(shù)據(jù)各種組合的概率

例7-8將23名精神抑郁癥患者隨機分到兩組,分別用兩種藥物治療,結(jié)果如下,問兩種藥物的治療效果是否不同。在兩藥的理論有效率相等時,給定這樣的邊緣合計數(shù),出現(xiàn)這樣一份樣本的概率為在這份樣本中,甲藥的有效率p1=0.583

,乙藥的有效率p2

=0.286。兩者差值的絕對值為

0.583–0.286

=0.297在兩藥的理論有效率相等時,給定同樣的邊緣合計數(shù),可能還有其它組合的四格表比當前情況更極端,即兩組差異比0.297更大

各種組合的四格表計算的確切概率

找出差異絕對值比0.297更大的,確定P值并作出推斷(雙側(cè)檢驗)找出差異比0.297更大的,確定P值并作出推斷(單側(cè)檢驗)

注意:事實上在有計算機和統(tǒng)計軟件的條件下,大樣本四格表資料用SAS軟件作確切概率計算,速度并不慢,仍不失為一種很好的方法。小結(jié)

1.完全隨機設(shè)計下多組頻率分布相等的

2檢驗

----R

C列聯(lián)表

(1)模型:R組獨立樣本,C個類別

(2)一般要求:各格子內(nèi)的理論頻數(shù)均應(yīng)大于1,且T<5的格子數(shù)不宜多于格子總數(shù)的1/5。如果理論頻數(shù)太小,最好的辦法是增加觀察例數(shù)以增大理論頻數(shù)。當行或列大于2時也可將理論頻數(shù)太小的行(列)與鄰近的行(列)相合并,以增大理論頻數(shù)。

(3)兩個

2統(tǒng)計量Pearson

2統(tǒng)計量

似然比

2統(tǒng)計量

當樣本量相當大時,這兩個

2統(tǒng)計量都接近

2分布樣本量不夠大時,都偏離

2分布實踐中,這兩個統(tǒng)計量可以同時使用,結(jié)合起來下結(jié)論例7-2的似然比

2統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論