




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章
離散型分類計(jì)數(shù)資料的2檢驗(yàn)我們已學(xué)過連續(xù)型資料的t檢驗(yàn)和Z檢驗(yàn)方法,本章介紹離散型資料2檢驗(yàn)。理論基礎(chǔ):連續(xù)型變量的2分布,擬和優(yōu)度檢驗(yàn)。用途:
①比較兩獨(dú)立樣本頻率或多個(gè)獨(dú)立樣本頻率的假設(shè)檢驗(yàn);②配對(duì)設(shè)計(jì)分類資料的假設(shè)檢驗(yàn);③檢驗(yàn)兩個(gè)分類指標(biāo)是否有相關(guān)性;④檢驗(yàn)?zāi)硞€(gè)樣本是否服從某個(gè)分布的假設(shè)檢驗(yàn)。
第一節(jié)2分布和擬合優(yōu)度的2檢驗(yàn)一、2分布:
若互相獨(dú)立,則的分布稱為自由度為的2分布(Chi-squaredistribution),記為。性質(zhì):若互相獨(dú)立,則服從2分布,υ二、關(guān)于擬合優(yōu)度的2檢驗(yàn)(大樣本):1.建立檢驗(yàn)假設(shè):H0:樣本來自某理論分布。H1:樣本并非來自該理論分布。α=0.12.H0成立時(shí),大樣本時(shí),Pearson2統(tǒng)計(jì)量:
2值:反映了實(shí)際頻數(shù)與根據(jù)檢驗(yàn)假設(shè)算得的理論頻數(shù)的吻合程度。
*似然比統(tǒng)計(jì)量:自由度:-計(jì)算時(shí)利用樣本資料估計(jì)的參數(shù)個(gè)數(shù)
3.將觀察值代入得當(dāng)前值和相應(yīng)的P值。若P<α,則拒絕H0
,
否則,不拒絕H0。條件:★“大樣本”(都不小于5)。
第二節(jié)比較兩個(gè)獨(dú)立樣本頻率的2檢驗(yàn)表6.1反應(yīng)變量按二項(xiàng)分類的兩個(gè)獨(dú)立樣本資料(四格表類型之一)
例6.1164例用過洋地黃和51例沒用過洋地黃的肺心病人心率失常率是否不同?
表6.2肺心病患者心律失常觀察資料原始數(shù)據(jù)有四個(gè),即稱為實(shí)際頻數(shù),用f表示。其余的數(shù)據(jù)都是從這四個(gè)數(shù)據(jù)推算得來的。該資料稱四格表(fourfoldtable)資料。
1.建立檢驗(yàn)假設(shè):
α=0.05
2.計(jì)算統(tǒng)計(jì)量2值:
H0成立時(shí),,用近似地代替。一、四格表的基本思想和檢驗(yàn)步驟:
理論頻數(shù)的計(jì)算公式:
統(tǒng)計(jì)量為:(理論公式)
基本思想:式中fij和eij分別表示某一格的實(shí)際頻數(shù)和理論頻數(shù)。
2值:反映了實(shí)際頻數(shù)和根據(jù)檢驗(yàn)假設(shè)算得的理論頻數(shù)的吻合程度(差別的程度)。如H0成立,實(shí)際頻數(shù)和理論頻數(shù)的差別不會(huì)很大,出現(xiàn)大2值的概率P很?。怀霈F(xiàn)大2值時(shí),說明實(shí)際頻數(shù)和理論頻數(shù)相差較大,若2值時(shí),,我們就懷疑H0,因而拒絕它。反之,若,則不能拒絕它。
自由度:υ=(行數(shù)-1)(列數(shù)-1)=1對(duì)于例6.1,υ=(2–1)(2–1)=13.確定P值及決策:按,查附表7,得υ=1時(shí),臨界值,,P>0.05,故不拒絕,可認(rèn)為兩總體心率失常陽性率相等。
二、四格表資料專用公式:注:關(guān)于統(tǒng)計(jì)量*四格表時(shí),Z檢驗(yàn)和檢驗(yàn)完全等價(jià)。
三、連續(xù)性校正的公式:
四格表卡方檢驗(yàn)的應(yīng)用條件:(1)eij≥5,且n≥40時(shí),用不校正公式計(jì)算值。(2)1≤eij<5,且n≥40時(shí),用連續(xù)性校正檢驗(yàn)。(3)eij<1或n<40,用Fisher精確概率法。
第三節(jié)2×2交叉分類資料的2檢驗(yàn)
(配對(duì)四格表)
表6.32×2交叉分類資料表(四格表類型之二)根據(jù)研究目的不同可進(jìn)行兩種不同的2檢驗(yàn):
獨(dú)立性檢驗(yàn)和兩種處理概率相等的檢驗(yàn)。一、兩種屬性分布間獨(dú)立性檢驗(yàn)
(或稱關(guān)聯(lián)性檢驗(yàn)):如果一種屬性的概率分布與另一種屬性的概率分布無關(guān),則稱這兩種屬性相互獨(dú)立;否則稱這兩種屬性之間存在關(guān)聯(lián)性。
例6.2
有260份血清樣品,每份樣品一分為二,用二種不同的免疫學(xué)檢測(cè)方法檢驗(yàn)類風(fēng)濕因子,其結(jié)果如表6.4所示。試問這兩種免疫學(xué)檢驗(yàn)的結(jié)果是否相互獨(dú)立?表6.4兩種血清免疫學(xué)檢測(cè)結(jié)果1.建立檢驗(yàn)假設(shè):
H0:
屬性A和B互相獨(dú)立。
H1:屬性A和B互相關(guān)聯(lián)。
α=0.05
兩種屬性分布間獨(dú)立性檢驗(yàn)與兩獨(dú)立樣本資料頻率相等的假設(shè)檢驗(yàn)資料分析的計(jì)算方法相同,但設(shè)計(jì)和解釋不同。設(shè)計(jì):一份樣本;n=260;行和與列和事先是不定的;按兩種屬性交叉分類。
2.計(jì)算統(tǒng)計(jì)量2值:利用(6.8a)或(6.7a),
υ=(2-1)(2-1)=1
3.確定P值及決策:據(jù),查附表7,υ=1時(shí),=10.83,P<0.001,按=0.05,拒絕,可認(rèn)為兩種方法測(cè)定結(jié)果間有關(guān)聯(lián)。關(guān)聯(lián)程度的大小關(guān)聯(lián)系數(shù)表達(dá)。r=(取值在-1與+1之間)其中符號(hào)由關(guān)聯(lián)的方向決定,與的符號(hào)相同。上例中,故:二、兩種處理概率相等的2檢驗(yàn)
(McNemer檢驗(yàn))常用于配對(duì)設(shè)計(jì),數(shù)據(jù)結(jié)構(gòu)同上。問題不同。
例6.2
問兩種測(cè)定方法的陽性概率是否相等?*這里不是問是否關(guān)聯(lián),故不能用上面的辦法分析!*這里的兩份樣本,接受方法A的個(gè)體與接受方法B的個(gè)體有關(guān)聯(lián),故不能用前一節(jié)兩獨(dú)立樣本資料頻率比較的辦法分析!
兩樣本陽性率之差取決于觀察值f12和f21。
問題:f12和f21的差異是否是偶然的?1.建立檢驗(yàn)假設(shè):
α=0.052.計(jì)算統(tǒng)計(jì)量2值:
連續(xù)性校正公式:當(dāng)時(shí),3.確定P值及決策:查附表7,υ=1時(shí),,按水準(zhǔn),不拒絕,可以認(rèn)為兩種檢測(cè)方法的總體陽性率相等。第四節(jié)
R×C列聯(lián)表資料的2檢驗(yàn)
一、問題的提出:前面我們已經(jīng)學(xué)過用2檢驗(yàn)進(jìn)行兩個(gè)率(比率)差異的比較。在醫(yī)學(xué)研究中,常遇見多個(gè)率(比率)的比較??煞裼猛瑯拥乃悸泛头椒ㄈソ鉀Q這類問題?見表6.6的資料:表6.6不同疾病病人的血型分布這是三個(gè)三分類構(gòu)成比的比較。表6.11某病170例不同年齡患者的療效統(tǒng)計(jì)這是三個(gè)率的比較。二、R×C表資料的2檢驗(yàn):
我們可用同樣的思路,利用2檢驗(yàn)進(jìn)行多個(gè)率(比率)差異的比較,將資料整理成一個(gè)R×C表,可用R×C表資料的2檢驗(yàn)比較多個(gè)率或構(gòu)成比的差異?;竟剑?/p>
R×C表簡(jiǎn)化公式:
例6.4
在血型與疾病關(guān)系的研究中,隨機(jī)抽取胃潰瘍病人、胃癌病人及對(duì)照人群的樣本,根據(jù)ABO血型分類(本例中因AB血型的例數(shù)較少,故省略不計(jì)),觀測(cè)結(jié)果列于表6.6。試探討不同病種是否具有不同的血型分布。表6.6不同疾病病人的血型分布
1.建立檢驗(yàn)假設(shè):H0:三種疾病的血型構(gòu)成比相等。
H1:三種疾病的血型構(gòu)成比不全相等。α=0.052.計(jì)算2統(tǒng)計(jì)量:
思想:假設(shè)三個(gè)構(gòu)成比相等,等于什么?在沒其他信息時(shí),基于樣本信息,最可靠的估計(jì)值是等于合計(jì)的構(gòu)成比。每個(gè)格子的理論頻數(shù)就等于各疾病的總?cè)藬?shù)乘以相應(yīng)的合計(jì)構(gòu)成比,如胃潰瘍組A型血的理論頻數(shù)為:
e11=17960.424=761.5,其余格子相同。可用基本公式:或R×C表簡(jiǎn)化公式:
3.確定P值及決策:自由度=(3-1)(3-1)=4,查附表得=18.47,故P<0.001,按=0.05,拒絕H0,即認(rèn)為三種疾病的血型構(gòu)成比不等或不全相等。三、R×C表資料的關(guān)聯(lián)度測(cè)定:
對(duì)于交叉分類資料,用2檢驗(yàn)拒絕了兩有序分類特征變量間獨(dú)立的零假設(shè)之后,可用Pearson列聯(lián)系數(shù)來定量描述兩有序分類特征變量的關(guān)聯(lián)強(qiáng)度。
Pearson列聯(lián)系數(shù)(rP):
例6.5
某病不同年齡患者的治療效果資料列于表6.11中,進(jìn)行獨(dú)立性2檢驗(yàn)得到=23.582,=4,拒絕兩種屬性分類相互獨(dú)立的零假設(shè)。例6.5:表6.11某病170例不同年齡患者與療效統(tǒng)計(jì)現(xiàn)計(jì)算Pearson列聯(lián)系數(shù)rP為:
注意:列聯(lián)系數(shù)的符號(hào),當(dāng)頻數(shù)集中在正對(duì)角線的格子時(shí),取正值,集中在負(fù)對(duì)角線的格子時(shí),取負(fù)值。(本例為負(fù)值)。四、注意事項(xiàng):
1.同四格表資料一樣,2分布是建立在大樣本的假定上的,要求不能有1/5以上的格子理論頻數(shù)小于5,且不能有一個(gè)格子的理論頻數(shù)小于1。
解決辦法:①增大樣本量;②合理地合并相鄰的組別;③刪除理論數(shù)太小的行列;④電腦進(jìn)行精確概率計(jì)算。
2.當(dāng)多個(gè)樣本率(或構(gòu)成比)作2檢驗(yàn),結(jié)論為拒絕零假設(shè)時(shí),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的有差別,不能說明兩兩之間有差別。兩組間的比較可參考2分割的方法。第五節(jié)檢驗(yàn)頻數(shù)分布的2檢驗(yàn)
利用2檢驗(yàn)的性質(zhì),我們可以用于檢驗(yàn)任意實(shí)際分布與某個(gè)理論分布的符合程度。例如:某市成年男女的構(gòu)成比鼻咽癌在家族的分布儀器測(cè)量誤差的分布
例6.6
某地暴發(fā)流行細(xì)菌性痢疾。為了分析這次爆發(fā)流行是否存在家庭內(nèi)成員間的傳播,共調(diào)查了四口之家288戶。原始資料列于表6.12中第1及第2兩列。其步驟為:表6.12二項(xiàng)分布擬合優(yōu)度計(jì)算表1.
建立檢驗(yàn)假設(shè):H0:服從
=0.18576的二項(xiàng)分布,即不存在家庭內(nèi)傳播。H1:不服從二項(xiàng)分布,即存在家庭內(nèi)傳播。
=0.052.估計(jì),計(jì)算P(x)﹑理論家庭數(shù)ex及2分量:①發(fā)病率發(fā)病人數(shù)/調(diào)查人數(shù)本例=(0×167+1×51+…+4×3)/288×4=0.18576不發(fā)病率1-=0.81424。②發(fā)病人數(shù)為x的概率:
例如:P(x=0)=(0.18576)0(0.81424)4=0.43955③理論家庭數(shù):本例n=288為調(diào)查家庭總數(shù)。e0=288×0.43955=126.59④相應(yīng)的2分量為:=(167-126.59)2/126.59=12.90(條件:ex5)
3.計(jì)算2值:
4.確定P值及決策:自由度=4-1-1=2。查附表7,=2時(shí),
=5.99,故P<0.05,拒絕H0,可認(rèn)為本次調(diào)查的四口之家內(nèi)發(fā)病人數(shù)的分布不符合二項(xiàng)分布,此次流行可能存在家庭成員間的傳播。*第七節(jié)四格表精確概率檢驗(yàn)法前以述及,由于2分布為連續(xù)性分布,2檢驗(yàn)是基于大樣本假定,四格表時(shí),如果總例數(shù)小于40或任意一格子理論數(shù)小于1,大樣本假定不成立,則不能用2檢驗(yàn)。表6.14栓塞性脈管炎兩種治療方法的結(jié)果總例數(shù)n小于40,為小樣本資料,不能用2檢驗(yàn)。
1.建立檢驗(yàn)假設(shè):H0:1=2H1:1≠2α=0.052.計(jì)算各種可能組合的概率:用a,b,c,d代替四個(gè)格子的頻數(shù)。我們知道總的12個(gè)病人中有7人治愈,如治愈率與治療方法無關(guān)時(shí),可建立以下條件概率:
目前四格表資料的發(fā)生概率為:統(tǒng)計(jì)檢驗(yàn)的P值還
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 7 呼風(fēng)喚雨的世紀(jì) 教學(xué)設(shè)計(jì)-2024-2025學(xué)年統(tǒng)編版語文四年級(jí)上冊(cè)
- 2025年輪胎動(dòng)平衡試驗(yàn)機(jī)項(xiàng)目發(fā)展計(jì)劃
- Unit 1 Life choices Writing Workshop教學(xué)設(shè)計(jì) 2024-2025學(xué)年高中英語北師大版必修第一冊(cè)
- 開店合股合同范本
- 2-1《改造我們的學(xué)習(xí)》教學(xué)設(shè)計(jì) 2023-2024學(xué)年統(tǒng)編版高中語文選擇性必修中冊(cè)
- 10 能源開發(fā)與利用 教學(xué)設(shè)計(jì)-2023-2024學(xué)年科學(xué)六年級(jí)下冊(cè)青島版
- 2023-2024學(xué)年人教版高中信息技術(shù)必修一第四章第二節(jié)《利用智能工具解決問題》教學(xué)設(shè)計(jì)
- 7的乘法口訣(教學(xué)設(shè)計(jì))-2024-2025學(xué)年數(shù)學(xué)二年級(jí)上冊(cè)蘇教版
- 5 觀察物體(一)(教學(xué)設(shè)計(jì))-2024-2025學(xué)年二年級(jí)上冊(cè)數(shù)學(xué)人教版
- 2 我們有精神 ( 教學(xué)設(shè)計(jì))2023-2024學(xué)年統(tǒng)編版道德與法治一年級(jí)下冊(cè)
- 風(fēng)電場(chǎng)升壓站培訓(xùn)課件
- 志愿服務(wù)證明(多模板)
- 小區(qū)門窗拍攝方案
- 初中歷史期中考試分析報(bào)告
- 企業(yè)反商業(yè)賄賂法律法規(guī)培訓(xùn)
- 2023合同香港勞工合同
- 材料化學(xué)課件
- 智能傳感器芯片
- -《多軸數(shù)控加工及工藝》(第二版)教案
- 智能交通概論全套教學(xué)課件
- 生物醫(yī)學(xué)工程倫理 課件全套 第1-10章 生物醫(yī)學(xué)工程與倫理-醫(yī)學(xué)技術(shù)選擇與應(yīng)用的倫理問題
評(píng)論
0/150
提交評(píng)論