定性資料的統(tǒng)計(jì)分析_第1頁
定性資料的統(tǒng)計(jì)分析_第2頁
定性資料的統(tǒng)計(jì)分析_第3頁
定性資料的統(tǒng)計(jì)分析_第4頁
定性資料的統(tǒng)計(jì)分析_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于定性資料的統(tǒng)計(jì)分析第一頁,共五十九頁,編輯于2023年,星期一第七節(jié)四格表資料的2檢驗(yàn)第二頁,共五十九頁,編輯于2023年,星期一2檢驗(yàn)(chi-squaretest)是英國統(tǒng)計(jì)學(xué)家Pearson于1900年提出的一種應(yīng)用范圍很廣的統(tǒng)計(jì)方法。常用來推斷兩個(gè)及兩個(gè)以上總體率或構(gòu)成比是否有差異。根據(jù)設(shè)計(jì)類型的不同,四格表資料的2檢驗(yàn)可分為:完全隨機(jī)設(shè)計(jì)的兩樣本率比較的2檢驗(yàn)配對(duì)設(shè)計(jì)的2檢驗(yàn)。第三頁,共五十九頁,編輯于2023年,星期一一、2檢驗(yàn)的基本思想

u檢驗(yàn)與t檢驗(yàn)的思路相同,是用標(biāo)準(zhǔn)誤作為尺度,去衡量統(tǒng)計(jì)量與總體參數(shù)差別的大小。2檢驗(yàn)(chi-squaretest)的思路則與u檢驗(yàn)、t檢驗(yàn)不同,卻有著異曲同工之妙。第四頁,共五十九頁,編輯于2023年,星期一例、某醫(yī)院腫瘤科3年來共治療乳腺癌患者n=131例,每例觀察5年,其中單純手術(shù)治療組觀察n1=84例,存活x1=57例,聯(lián)合治療組觀察n2=47例,存活x2=39例。將資料整理成以下形式的分類頻數(shù)表。

組別存活數(shù)死亡數(shù)合計(jì)陽性率(%)聯(lián)合治療39(a)8(b)47(a+b)83.0單純手術(shù)57(c)27(d)84(c+d)67.9合計(jì)96(a+c)35(b+d)131(n)73.3第五頁,共五十九頁,編輯于2023年,星期一1、四格表的概念

a、b、c、d這四個(gè)格子的頻數(shù)是整個(gè)表的基本數(shù)據(jù),其余數(shù)據(jù)都是從這四個(gè)基本數(shù)據(jù)推算出來的,通常將這種資料稱為四格表資料(2×2表資料)。四格表資料多用來比較兩種處理的不同效果,而每種處理只產(chǎn)生兩種相互對(duì)立的結(jié)果。如生存與死亡、有效與無效、患病與未患病、陽性與陰性、檢出與未檢出等。第六頁,共五十九頁,編輯于2023年,星期一2、建立檢驗(yàn)假設(shè)

當(dāng)兩個(gè)樣本率不等時(shí),可能有兩種原因:差別僅由抽樣誤差所致;兩種處理的效果確有不同,而導(dǎo)致了樣本率的不同。為區(qū)別這兩種情況,分別建立檢驗(yàn)假設(shè):H0:兩總體存活率相等,即1=2;H1:兩總體存活率不等,即12。

=0.05。第七頁,共五十九頁,編輯于2023年,星期一3、H0條件下的理論頻數(shù)

H0假設(shè)認(rèn)為,兩個(gè)樣本來自同一總體,即“單純組”與“聯(lián)合組”的存活率相同,差別僅由抽樣誤差所致,則可用合計(jì)存活率73.3%(即96/131)作為總體率的點(diǎn)估計(jì)。H0條件下,單純組理論存活數(shù)應(yīng)為47×(96/131)=34.44例,聯(lián)合組理論存活數(shù)應(yīng)為84×(96/131)=61.56例;同理,兩組理論死亡數(shù)為12.56例和22.44例。這四個(gè)根據(jù)H0假設(shè)求得的數(shù)據(jù)稱為理論頻數(shù)T。第八頁,共五十九頁,編輯于2023年,星期一理論頻數(shù)T可用公式計(jì)算:式中TRC表示第R行、第C列的理論頻數(shù),nR為相應(yīng)行的合計(jì),nC為相應(yīng)列的合計(jì),n為總例數(shù)。第九頁,共五十九頁,編輯于2023年,星期一4、2檢驗(yàn)的思路

如果H0假設(shè)成立,則實(shí)際頻數(shù)A與理論頻數(shù)T應(yīng)該比較接近。如果實(shí)際頻數(shù)與理論頻數(shù)相差較大,超出了抽樣誤差所能解釋的范圍,則可以認(rèn)為H0假設(shè)不成立,即兩樣本對(duì)應(yīng)的總體率不等。

第十頁,共五十九頁,編輯于2023年,星期一實(shí)際頻數(shù)Ai與理論頻數(shù)Ti之間的抽樣誤差,可以用2統(tǒng)計(jì)量表示:2統(tǒng)計(jì)量服從2分布,反映了實(shí)際頻數(shù)A與理論頻數(shù)T吻合的程度。A與T相差越大,則2值就會(huì)越大。第十一頁,共五十九頁,編輯于2023年,星期一如果H0假設(shè)成立,則實(shí)際頻數(shù)與理論頻數(shù)之差異純系抽樣誤差所致,故2值不會(huì)很大。即在H0假設(shè)的前提下,一次隨機(jī)試驗(yàn)中,出現(xiàn)較大2值的概率P是很小的。如果手頭樣本求得很小的P,且P≤

,根據(jù)小概率原理,就有理由懷疑H0的真實(shí)性,故拒絕之;若P>,則沒有理由拒絕H0。2值與P值的對(duì)應(yīng)關(guān)系可查附表3的2界值表。第十二頁,共五十九頁,編輯于2023年,星期一根據(jù)計(jì)算公式,2值的大小除了和實(shí)際頻數(shù)與理論頻數(shù)的差值|A-T|有關(guān)還與格子數(shù)有關(guān),嚴(yán)格的講是和自由度有關(guān)。行×列表的自由度,是指在表中周邊合計(jì)數(shù)不變的前提下,基本數(shù)據(jù)可以自由變動(dòng)的格子數(shù)。四格表中有四個(gè)基本數(shù)據(jù),其中任何一個(gè)數(shù)據(jù)發(fā)生變化,其余三個(gè)數(shù)據(jù)由于受周邊合計(jì)數(shù)的限制,只能隨之相應(yīng)變動(dòng),故其自由度為1。

=(行數(shù)-1)(列數(shù)-1)第十三頁,共五十九頁,編輯于2023年,星期一二、完全隨機(jī)設(shè)計(jì)的兩樣本率的比較完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本率比較的目的是推斷兩個(gè)樣本率各自所代表的總體率是否相等。檢驗(yàn)方法可用u檢驗(yàn)或2檢驗(yàn)。例1、某醫(yī)院腫瘤科3年來治療乳腺癌患者n=131例,其中單純手術(shù)組觀察n1=84例,存活x1=57例,聯(lián)合治療組觀察n2=47例,存活x2=39例,問兩組存活率有無差別?第十四頁,共五十九頁,編輯于2023年,星期一首先將資料整理成四格表形式:第十五頁,共五十九頁,編輯于2023年,星期一第十六頁,共五十九頁,編輯于2023年,星期一例2、在某項(xiàng)治療牙科術(shù)后疼痛控制的雙盲臨床研究中,將178例患者隨機(jī)分成兩組,A藥組90人,有效人數(shù)為68人。B藥組88人,有效人數(shù)為58人。第十七頁,共五十九頁,編輯于2023年,星期一第十八頁,共五十九頁,編輯于2023年,星期一三、四格表資料專用公式理論頻數(shù)由四格表中實(shí)際頻數(shù)計(jì)算得來。對(duì)于四格表資料,可直接用專用公式計(jì)算2值,以簡(jiǎn)化計(jì)算過程。式中a、b、c、d分別為四格表的四個(gè)實(shí)際頻數(shù)即四格表的基本數(shù)據(jù),總例數(shù)n=a+b+c+d。第十九頁,共五十九頁,編輯于2023年,星期一分別將前面的兩個(gè)例子中的基本數(shù)據(jù)代入公式可以得到相同的2值。

398572768225830第二十頁,共五十九頁,編輯于2023年,星期一四、四格表2統(tǒng)計(jì)量的連續(xù)性校正

2分布是一種連續(xù)性分布,附表3中2界值是根據(jù)此連續(xù)性分布的理論公式計(jì)算得到。而兩個(gè)或多個(gè)率比較的原始數(shù)據(jù)卻屬離散型分布資料,是不連續(xù)的。因此,2檢驗(yàn)公式是一個(gè)近似計(jì)算公式。英國統(tǒng)計(jì)學(xué)家YatesF認(rèn)為,應(yīng)將實(shí)際頻數(shù)與理論頻數(shù)之差的絕對(duì)值減去0.5作連續(xù)性校正。第二十一頁,共五十九頁,編輯于2023年,星期一實(shí)際上,2值公式在四格表的基礎(chǔ)數(shù)據(jù)均不太小時(shí),近似程度相當(dāng)高。但是,只要四格表中的有一個(gè)基礎(chǔ)數(shù)據(jù)出現(xiàn)較小值,此時(shí)求得的2值往往偏大,相應(yīng)的P值偏小,從而擴(kuò)大了I型誤差。為校正這種偏差,可采用校正2,用C2表示。其計(jì)算公式為:第二十二頁,共五十九頁,編輯于2023年,星期一對(duì)四格表專用公式的校正為:兩者是等價(jià)的,這種校正稱為連續(xù)性校正,即Yate’s校正。第二十三頁,共五十九頁,編輯于2023年,星期一分析四格表資料時(shí),不同公式的選擇條件

在分析四格表資料時(shí),需根據(jù)具體情況作出不同處理,一般認(rèn)為:1、當(dāng)n≥40,且T≥5時(shí),用基本公式計(jì)算2值;2、當(dāng)n≥40,且1≤T<5時(shí),則用2檢驗(yàn)的連續(xù)性校正公式;3、當(dāng)n<40,或有T<1時(shí),不能用2檢驗(yàn),應(yīng)當(dāng)用四格表的確切概率法。4、當(dāng)2檢驗(yàn)所得P值接近檢驗(yàn)水準(zhǔn)時(shí),最好使用四格表確切概率法。

第二十四頁,共五十九頁,編輯于2023年,星期一例1、下表資料是單用甘磷酰芥(單純化療組)與復(fù)合使用爭(zhēng)光霉素、環(huán)磷酰胺等藥(復(fù)合化療組)對(duì)淋巴系統(tǒng)腫瘤的療效,問兩組患者總體的完全緩解率有無差別?第二十五頁,共五十九頁,編輯于2023年,星期一第二十六頁,共五十九頁,編輯于2023年,星期一例2、為觀察甲、乙兩藥對(duì)治療胃潰瘍的療效,將70名患者隨機(jī)分成兩組,一組30人服用甲藥,另一組40人服用乙藥。結(jié)果見下表。問兩種藥物的胃潰瘍治愈率有無差別?第二十七頁,共五十九頁,編輯于2023年,星期一第二十八頁,共五十九頁,編輯于2023年,星期一五、u檢驗(yàn)與2檢驗(yàn)的關(guān)系事實(shí)上,對(duì)兩樣本率的比較的雙側(cè)檢驗(yàn),u檢驗(yàn)和2檢驗(yàn)是等價(jià)的。即自由度為1的2=u2。因此,兩樣本率的比較,可以用u檢驗(yàn),也可以用2檢驗(yàn)。兩者的應(yīng)用條件是一樣的。但若需進(jìn)行單側(cè)檢驗(yàn),則應(yīng)選用u檢驗(yàn),因?yàn)?檢驗(yàn)理論上本身就是雙側(cè)檢驗(yàn)。第二十九頁,共五十九頁,編輯于2023年,星期一六、配對(duì)設(shè)計(jì)四格表的卡方檢驗(yàn)配對(duì)設(shè)計(jì)是醫(yī)學(xué)研究中常用的設(shè)計(jì)方法之一,二分類結(jié)果資料的配對(duì)研究常用于比較兩種檢驗(yàn)方法、兩種培養(yǎng)方法、兩種提取方法之間的差別。配對(duì)四格表設(shè)計(jì)的特點(diǎn)是對(duì)同一樣本的每一份檢品分別用甲、乙兩種方法處理,觀察其陽性與陰性例數(shù)。以推斷兩種處理的結(jié)果有無差別。

第三十頁,共五十九頁,編輯于2023年,星期一配對(duì)四格表資料結(jié)果的四種情況兩法均為陽性(a)、兩法均為陰性(d)、甲為陽性乙為陰性(b)、甲為陰性乙為陽性(c)。a、d為兩法結(jié)果相同部分;b、c為結(jié)果不同部分。

這樣的資料稱為配對(duì)四格表,其形式與普通四格表類似,但內(nèi)容及檢驗(yàn)方法卻不一樣。

第三十一頁,共五十九頁,編輯于2023年,星期一配對(duì)設(shè)計(jì)的兩個(gè)率的比較——配對(duì)2檢驗(yàn)。兩種方法若沒有差別,則總體B=C。樣本常表現(xiàn)為bc,是由于抽樣誤差的存在,還是兩種方法確有差別,必須進(jìn)行假設(shè)檢驗(yàn)。

a和d兩個(gè)格子在比較有無差異時(shí)不起作用,而配對(duì)2檢驗(yàn)只檢驗(yàn)結(jié)果不一致的對(duì)子數(shù)b和c之間的差別來反映兩種方法的差異。第三十二頁,共五十九頁,編輯于2023年,星期一配對(duì)2檢驗(yàn)計(jì)算公式的應(yīng)用條件1、當(dāng)b+c≥40時(shí),用非校正公式計(jì)算檢驗(yàn)統(tǒng)計(jì)量:

2、當(dāng)20≤b+c<40時(shí),用連續(xù)性校正公式來計(jì)算檢驗(yàn)統(tǒng)計(jì)量:3、當(dāng)b+c<20時(shí),用確切概率法計(jì)算。第三十三頁,共五十九頁,編輯于2023年,星期一例1、某研究室用甲、乙兩種血清學(xué)方法檢查410例確診的鼻咽癌患者,得結(jié)果如下表,問兩種方法檢出率有無不同?第三十四頁,共五十九頁,編輯于2023年,星期一第三十五頁,共五十九頁,編輯于2023年,星期一例2、用兩種檢驗(yàn)方法對(duì)某食品作沙門氏菌檢驗(yàn),結(jié)果如下表,試比較兩種方法的陽性結(jié)果是否有差別。

第三十六頁,共五十九頁,編輯于2023年,星期一第三十七頁,共五十九頁,編輯于2023年,星期一注意點(diǎn)資料判斷普通四格表資料-完全隨機(jī)設(shè)計(jì)配對(duì)四格表資料-配對(duì)設(shè)計(jì)第三十八頁,共五十九頁,編輯于2023年,星期一第八節(jié)行×列表資料的2檢驗(yàn)第三十九頁,共五十九頁,編輯于2023年,星期一對(duì)于單變量的計(jì)數(shù)資料,均可通過行列表形式表達(dá),其基本數(shù)據(jù)有R行C列,簡(jiǎn)稱R×C表。四格表是最簡(jiǎn)單的一種R×C表,即2×2表。R×C表資料卡方檢驗(yàn)可用于多個(gè)樣本率的比較、多個(gè)樣本構(gòu)成比的比較等等。第四十頁,共五十九頁,編輯于2023年,星期一R×C表2檢驗(yàn)的通式

式中,A為第R行第C列對(duì)應(yīng)的實(shí)際頻數(shù),nR為第R行的行合計(jì),nC為第C列的列合計(jì),n為總樣本含量。該公式同樣適用于四格表資料,等價(jià)于:第四十一頁,共五十九頁,編輯于2023年,星期一一、多個(gè)樣本率的比較如果是多個(gè)樣本率進(jìn)行比較時(shí),其基本數(shù)據(jù)有R行2列,構(gòu)成R×2表,用以表述R個(gè)樣本率的基本數(shù)據(jù)。R×2表的2檢驗(yàn)用于推斷R個(gè)樣本率各自所代表的總體率是否相等。第四十二頁,共五十九頁,編輯于2023年,星期一例1、某地調(diào)查了1995~1998四個(gè)年度中小學(xué)女生的貧血狀況,見下表,問各年度間學(xué)生貧血率有無差別?第四十三頁,共五十九頁,編輯于2023年,星期一第四十四頁,共五十九頁,編輯于2023年,星期一例2、將133例尿路感染患者隨機(jī)分成3組,第1組44例,接受甲方法治療;第2組45例,接受乙方法治療;第3組44例,接受丙方法治療。一個(gè)療程后,結(jié)果如下表,問3種治療方法的尿培養(yǎng)陰轉(zhuǎn)率有無差別?第四十五頁,共五十九頁,編輯于2023年,星期一第四十六頁,共五十九頁,編輯于2023年,星期一Attention:和方差分析一樣,前面例子的結(jié)論只能表明總的來說各組的總體率是有差別的,但不能認(rèn)為任意兩個(gè)組均有差別。需通過進(jìn)一步作多個(gè)率的兩兩比較,來明確究竟是哪些組別之間有差別。第四十七頁,共五十九頁,編輯于2023年,星期一二、多個(gè)率的多重比較當(dāng)多個(gè)樣本率比較的2檢驗(yàn),結(jié)論為拒絕H0時(shí),只能認(rèn)為各總體率之間總的說來有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。若要進(jìn)一步比較哪些率之間有差別,應(yīng)進(jìn)行多重比較。率的多重比較的原理多借鑒于均數(shù)的多重比較,方法較多(如Scheffé可信區(qū)間法、2分割法等等

)。第四十八頁,共五十九頁,編輯于2023年,星期一Scheffé可信區(qū)間法

通過構(gòu)建要比較的兩樣本率之差的可信區(qū)間來推斷組間有無差異。兩率之差的100(1-)%可信區(qū)間按下式計(jì)算:pA和pB為兩個(gè)比較組的樣本率;nA和nB為兩個(gè)比較組的樣本含量;k為所有的組數(shù)。

第四十九頁,共五十九頁,編輯于2023年,星期一例、某地調(diào)查了1995~1998四個(gè)年度中小學(xué)女生的貧血狀況,見下表,問各年度間學(xué)生貧血率有無差別?第五十頁,共五十九頁,編輯于2023年,星期一已知:2=281.6263,P<0.005,該地四個(gè)年份中小學(xué)女生貧血檢出率總的說來有差別,需用Scheffé可信區(qū)間法進(jìn)一步多重比較。按兩率之差的可信區(qū)間計(jì)算公式來計(jì)算各可信區(qū)間,如98與97兩年間學(xué)生貧血檢出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論