定性資料的統(tǒng)計分析課件_第1頁
定性資料的統(tǒng)計分析課件_第2頁
定性資料的統(tǒng)計分析課件_第3頁
定性資料的統(tǒng)計分析課件_第4頁
定性資料的統(tǒng)計分析課件_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

醫(yī)學統(tǒng)計學

定性資料的統(tǒng)計分析

statisticalanalysisforqualitativedata9-定性資料的統(tǒng)計分析1主要內容二項分布簡介總體率的可信區(qū)間估計Poisson分布簡介總體事件數的可信區(qū)間估計樣本率與總體率的比較兩樣本率比較的u檢驗四格表資料的

2檢驗行列表資料的

2檢驗確切概率法兩事件數的比較卡方檢驗應用的注意事項

9-定性資料的統(tǒng)計分析1第一節(jié)二項分布簡介9-定性資料的統(tǒng)計分析1二項分布的基本概念

在醫(yī)學研究中常常碰到一些情況,其結局只有兩種互相對立的結果。每個個體的觀察結果只能取其中之一。毒理試驗中,動物的生存與死亡;動物誘癌試驗中,動物的發(fā)癌與不發(fā)癌;流行病學觀察中,個體發(fā)病與不發(fā)病;在臨床治療中,病人的治愈與未愈;理化檢驗結果的陰性與陽性等等。常用二項分布(binomialdistribution)來描述其概率分布。9-定性資料的統(tǒng)計分析1概率的乘法法則:幾個獨立事件同時發(fā)生的概率,等于各獨立事件的概率之積。概率的加法法則:互不相容事件和的概率等于各事件的概率之和。9-定性資料的統(tǒng)計分析1例、設小白鼠接受某種毒物一定劑量時,其死亡率為

=80%,則對于每只小白鼠而言,其死亡概率為

=0.8,生存概率為1-

=0.2。若每組各用三只小白鼠(分別計為甲、乙、丙),對每只鼠獨立做實驗,故各鼠的實驗結果(生存或死亡)是互不影響的。觀察每組小白鼠存亡情況,如果計算生與死的順序,則共有8種排列方式;如果只計生存與死亡的數目,則只有4種組合方式。9-定性資料的統(tǒng)計分析1三只小白鼠存亡的排列和組合方式及其概率的計算

所有可能結果每種結果的概率死亡數生存數不同死亡數的概率甲、乙、丙Xn

X生生生0.2

0.2

0.2=0.008030.008生生死0.2

0.2

0.8=0.032生死生0.2

0.8

0.2=0.032120.096死生生0.8

0.2

0.2=0.032生死死0.2

0.8

0.8=0.128死生死0.8

0.2

0.8=0.128210.384死死生0.8

0.8

0.2=0.128死死死0.8

0.8

0.8=0.512300.5121.0001.0009-定性資料的統(tǒng)計分析1(0.2+0.8)3=(0.2)3+3×(0.2)2×(0.8)+3×(0.2)×(0.8)2+(0.8)3

三生二生一死一生二死三死9-定性資料的統(tǒng)計分析1

為總體陽性率;n為樣本例數;X為樣本陽性數;CnX為從n個中抽X個的組合數,其計算公式為:式中“!”為階乘符號,n!=1

2

3

4

n,并約定0!=1。9-定性資料的統(tǒng)計分析1二項展開式中的各項即對應于各死亡數(X)的發(fā)生概率P(X),類似的分布即稱作二項分布。從陽性率為π的總體中隨機抽取含量為n的樣本,恰有X例陽性的發(fā)生概率可表達為:X=0,1,2,…,n

稱X服從參數為n和

的二項分布,記為:X~B(n,

)。其中參數n由實驗者確定,而總體率

常常是未知的。9-定性資料的統(tǒng)計分析1例、已知n=3,

=0.8,則恰有1例陽性的概率P(1)為:9-定性資料的統(tǒng)計分析1二項分布的均數與標準差

若X~B(n,

),則陽性數X的總體均數

及其標準差

為:9-定性資料的統(tǒng)計分析1若均數與標準差不用絕對數X而用率p表示時,即對以上兩式分別除以n:

樣本率的標準差又稱為率的標準誤。9-定性資料的統(tǒng)計分析1二項分布的累計概率

常用的有左側累計和右側累計兩種方法。從陽性率為

的總體中隨機抽取n個個體,則:1、最多有k例陽性的概率:2、最少有k例陽性的概率:9-定性資料的統(tǒng)計分析1例1、據以往經驗,用某藥治療小兒上呼吸道感染、支氣管炎,有效率為85%,今有5個患者用該藥治療,問:①至少3人有效的概率為多少?②最多1人有效的概率為多少?

本例

=0.85,1-

=0.15,n=5

,依題意,①至少3人有效的概率:

P(X≥3)=P(3)+P(4)+P(5)=0.138178125+0.391504688+0.443705313=0.973388126②最多1人有效的概率為:P(X≤1)9-定性資料的統(tǒng)計分析1例2、經統(tǒng)計,某省用“中藥闌尾炎合劑”治療急性闌尾炎性腹膜炎的有效率為86%,試分別估計:①治療10例中至少9例有效的概率;②治療10例中至多7例有效的概率。本例

=0.86,1-

=0.14,n=10,依題意,①治療10例中至少9例有效的概率:②治療10例中至多7例有效的概率:9-定性資料的統(tǒng)計分析1二項分布的圖形

9-定性資料的統(tǒng)計分析1在實際應用中,n足夠大,且

不太大也不太小,即既不接近于0也不接近于1時,??捎谜龖B(tài)近似原理處理二項分布的問題。一般判斷標準:n

和n(1-

)均大于5。9-定性資料的統(tǒng)計分析1二項分布的應用條件二分類資料,即各觀察單位只能有互相對立的兩種結果之一。兩種對立結果發(fā)生的概率合計為1。觀察結果相互獨立,如疾病無傳染性、無家族聚集性。9-定性資料的統(tǒng)計分析1第二節(jié)率的可信區(qū)間估計

9-定性資料的統(tǒng)計分析1與定量資料的均數一樣,二項分布資料的樣本率同樣存在抽樣誤差。樣本率的標準差又稱為率的標準誤為:9-定性資料的統(tǒng)計分析1一、總體率

的可信區(qū)間估計

(一)正態(tài)近似法

當n較大、且p不太大也不太小時(??赏ㄟ^np與n(1-p)均大于5來判斷),樣本率p的抽樣分布近似服從正態(tài)分布。可利用正態(tài)分布原理來估計總體率的可信區(qū)間??尚哦葹?-α的可信區(qū)間為:

(p-u

Sp

,p+u

Sp),縮寫為:p±u

Sp

式中,u

為可信度為1-α時的u界值。可信度為95%時,u

=1.96可信度為99%時,u

=2.58。

9-定性資料的統(tǒng)計分析1例1、從某地人群中隨機抽取144人,檢查乙型肝炎表面抗原攜帶狀況,陽性率為9.03%,求該地人群的乙型肝炎表面抗原陽性率的95%可信區(qū)間。本例n=144,p=9.03%,可用近似正態(tài)法計算可信區(qū)間。95%可信限為:9.03%±1.96×2.388%,即該地人群的乙型肝炎表面抗原陽性率的95%可信區(qū)間為:4.35%~13.71%。9-定性資料的統(tǒng)計分析1例2、某醫(yī)院用復方當歸注射液靜脈滴注治療腦動脈硬化癥188例,其中顯效83例,試估計復方當歸注射液顯效率的99%可信區(qū)間。本例n=188,p=83/188=0.4415,np與n(1-p)均大于5,可用近似正態(tài)法計算可信區(qū)間。

99%可信區(qū)間為:0.4415±2.58×0.036,即復方當歸注射液顯效率的99%可信區(qū)間為:34.86%~53.44%。

9-定性資料的統(tǒng)計分析1(二)查表法

當n≤50,p很接近0或1時,樣本率p的抽樣分布不再近似服從正態(tài)分布。樣本資料呈二項分布。由于用二項分布法估計總體率的可信區(qū)間,計算復雜,故可使用查表法。查閱附表6,求得總體率的95%和99%可信區(qū)間。9-定性資料的統(tǒng)計分析1例、有人調查29名非吸毒婦女,出獄時有1名HIV(人免疫缺陷病毒)陽性,該研究者報導,陽性率為3.4%,用正態(tài)近似法計算其95%可信區(qū)間為:-3.1%~10.0%。陽性率不可能小于0。查表法,其95%可信區(qū)間為:0.1%~17.8%。

9-定性資料的統(tǒng)計分析1二、兩總體率之差的可信區(qū)間估計當樣本含量n1、n2足夠大,兩樣本率之差的可信區(qū)間可用正態(tài)分布近似法構造。設p1=r1/n1,p2=r2/n2是兩個樣本率,p1-p2是它們的差。如果n1p1,n1(1-p1),n2p2,n2(1-p2)均大于5,則可以用正態(tài)近似的方法求總體率之差

1-

2的可信區(qū)間:9-定性資料的統(tǒng)計分析1計算公式其中,為率之差值的標準誤9-定性資料的統(tǒng)計分析1第三節(jié)Poisson分布簡介9-定性資料的統(tǒng)計分析1Poisson分布的基本概念

對單位時間、單位空間內某獨立罕見事件發(fā)生數的研究每升水中大腸菌群數的分布粉塵在單位容積內計數的分布放射性物質在單位時間內放射出質點數的分布單位空間中某些野生動物或昆蟲數的分布每天交通事故發(fā)生數的分布人群中某種患病率很低的非傳染性疾病患病數或死亡數的分布用Poisson分布來描述其概率分布。

9-定性資料的統(tǒng)計分析1如某事件的發(fā)生完全隨機,在單位時間或單位空間內事件發(fā)生數的概率為:稱該事件的發(fā)生服從參數為

的Poisson分布,記為X~Poisson(

)。

是Poisson分布的總體均數,X為單位時間或單位空間內某事件的發(fā)生數,P(X)為事件數為X時發(fā)生概率,e為自然對數的底≈2.7183。

9-定性資料的統(tǒng)計分析1Poisson分布實例2002年韓日世界杯64場比賽中,各隊進球數有多有少。大部分是0,1,2個進球,個別隊是5個以上進球,最多的是8個進球,平均是1.2578個/場/隊。雖然強隊往往都能進球、贏球(如巴西隊),弱隊往往都不能進球(如中國隊),但宏觀上來說,各隊進球數服從Poisson分布!9-定性資料的統(tǒng)計分析1平均計數為1.2578的Poisson分布每場各隊進球數場次 理論數

0 37 36.39 1 47 45.77 2 27 28.78 3 13 12.07 4 2 3.79 5 1 0.95 ≥6 1 0.25

128 128.009-定性資料的統(tǒng)計分析1Poisson分布的均數與方差Poisson分布的總體方差

2與總體均數

相等,等于

2=

=

參數

表示單位空間或單位時間內事件平均發(fā)生的次數,又稱強度參數。9-定性資料的統(tǒng)計分析1Poisson分布的累計概率常用的有左側累計和右側累計兩種方法。單位空間或時間內事件發(fā)生的次數

:1、最多為k次的概率:2、最少為k次的概率:9-定性資料的統(tǒng)計分析1Poisson分布的圖形

9-定性資料的統(tǒng)計分析1Poisson分布為正偏態(tài)分布

越小,分布越偏隨著

的增大,分布逐漸趨于對稱當

=20時已基本接近對稱分布當

=50時,Poisson分布近似正態(tài)分布在實際工作中,當

≥50時可按正態(tài)分布原理處理相關的問題。

9-定性資料的統(tǒng)計分析1Poisson分布具有可加性

以較小的度量單位觀察某現象,如果發(fā)生數呈Poisson分布,那么將若干個小單位合并為一個大單位后,其總計數也呈Poisson分布。例、已知某放射性物質每10分鐘放射脈沖數呈Poisson分布,5次測量的結果,分別為35、34、36、38、34次。將5個10分鐘的放射脈沖數合計為50分鐘放射脈沖數(總計為177次)也呈Poisson分布。對于Poisson分布資料往往可以利用其可加性的特性使

≥50,然后用正態(tài)近似法處理。9-定性資料的統(tǒng)計分析1Poisson分布是二項分布的極限形式

在二項分布中,當

很小時(

<0.05),而n很大,此時二項分布則逼近Poisson分布。其中

=n

。n愈大,近似程度愈好。9-定性資料的統(tǒng)計分析1例、新生兒染色體異常率為1%,分別用二項分布和Poisson分布原理,求100名新生兒中發(fā)生X例(X=0,l,2…)染色體異常的概率。

9-定性資料的統(tǒng)計分析1Poisson分布的應用條件結果二分類事件發(fā)生相互獨立事件發(fā)生概率不變9-定性資料的統(tǒng)計分析1第四節(jié)總體事件數的可信區(qū)間估計9-定性資料的統(tǒng)計分析1

為總體計數,X(單位時間或單位空間內某事件的發(fā)生數)稱為樣本計數。由于抽樣誤差的客觀存在,樣本計數X一般與總體計數

不相等。總體計數往往是未知的,可利用抽樣誤差的規(guī)律,通過樣本計數來估計總體計數。9-定性資料的統(tǒng)計分析1一、正態(tài)近似法當樣本計數X>50時,可按正態(tài)近似原理求總體計數

的可信區(qū)間。為樣本事件數的標準誤即標準差。9-定性資料的統(tǒng)計分析1若有多個樣本計數X1,X2,…,Xn時A、先將多個計數求和,計算合計X的95%的可信區(qū)間,再除以n得到平均每個單位內的計數及其95%可信區(qū)間。B、先求樣本計數X1,X2,…,Xn的平均計數,再用以下計算公式求其95%可信區(qū)間:

9-定性資料的統(tǒng)計分析1例、用計數器兩次測得某放射性物質5分鐘內發(fā)出的脈沖數分別為42和48個。假設單位時間內脈沖數的發(fā)放符合Poisson分布,試估計該放射性物質每5分鐘平均脈沖數的95%可信區(qū)間。將5分鐘視為單位時間,利用Poisson分布可加性,先計算10分鐘內平均脈沖數的95%可信區(qū)間。X=42+48=90則平均每5分鐘,該放射性物質平均發(fā)出脈沖數為45.0個/5分鐘,其95%CI為:35.7~54.3個/5分鐘。

9-定性資料的統(tǒng)計分析1二、查表法當樣本計數X≤50,且樣本資料呈Poisson分布時,正態(tài)近似法不再適用,應根據Poisson分布的原理確定

的可信區(qū)間。查詢附表7“Poisson分布

的可信區(qū)間”得到總體事件數

的95%或99%可信區(qū)間。9-定性資料的統(tǒng)計分析1例、從一份混合均勻的自來水中取1L水樣,檢出3個大腸菌群。試估計自來水中平均每升水中大腸桿菌數的95%可信區(qū)間。查詢附表7,可得平均每升水中大腸桿菌數的95%可信區(qū)間為0.62~8.77個。9-定性資料的統(tǒng)計分析1第五節(jié)樣本率與總體率的比較9-定性資料的統(tǒng)計分析1樣本率與總體率比較的目的是推斷該樣本是否來自某已知總體。由于抽樣誤差的存在,從總體率為

0的總體中所得樣本,樣本率p一般不會正好等于總體率。樣本率與總體率的差異究竟是本質上的差別還是抽樣誤差,需用假設檢驗進行推斷。

9-定性資料的統(tǒng)計分析1當n較大且p不太小也不太大時,二項分布的累計概率與正態(tài)分布的累計概率相近,故可用正態(tài)近似方法。習慣上以np>5同時n(1-p)>5為界限,符合此條件者可用正態(tài)近似檢驗。統(tǒng)計量u的計算為:當n和p不符合上述條件時,可利用二項分布原理直接計算其概率,根據是否小概率事件來推斷;或計算率的可信區(qū)間,是否包含已知總體率來推斷。9-定性資料的統(tǒng)計分析1一、正態(tài)近似法當np>5同時n(1-p)>5時,可用正態(tài)近似檢驗。例、據臨床經驗,一般的胃潰瘍病患者有20%會出現胃出血癥狀。某醫(yī)院觀察了304例65歲的胃潰瘍病患者,其中有96例發(fā)生胃出血,占31.58%,問老年患者是否較一般患者易出血?

9-定性資料的統(tǒng)計分析19-定性資料的統(tǒng)計分析1例2、從某地人群中隨機抽取144人,檢查乙型肝炎表面抗原攜帶狀況,陽性率為9.20%,而正常人群的乙型肝炎表面抗原陽性率為1.20%,能否認為該地人群為高危人群?9-定性資料的統(tǒng)計分析19-定性資料的統(tǒng)計分析1二、直接計算概率法當n和p不符合上述條件時,可利用二項分布原理直接計算其概率。依據小概率事件原理,作出統(tǒng)計推斷。例、一種鴨通常感染某種傳染病的概率為0.2,現將某種藥物注射到25只鴨后發(fā)現有1只鴨發(fā)生感染,試判斷這種藥物對預防感染是否有效。9-定性資料的統(tǒng)計分析19-定性資料的統(tǒng)計分析1例、18世紀天花在人群中的自然感染率高達90%。1798年英國醫(yī)生琴納對23名志愿者作接種牛痘免疫實驗,發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論