二項分布與泊松分布課件_第1頁
二項分布與泊松分布課件_第2頁
二項分布與泊松分布課件_第3頁
二項分布與泊松分布課件_第4頁
二項分布與泊松分布課件_第5頁
已閱讀5頁,還剩117頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節(jié)二項分布和總體率的估計一、二項分布(一)二項分布的概念在生命科學研究中,經(jīng)常會遇到一些事物,其結(jié)果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養(yǎng)的陽性與陰性等,這些都可以根據(jù)某種性狀的出現(xiàn)與否而分為非此即彼的對立事件。這種非此即彼事件構(gòu)成的總體,就稱為二項總體(binomialpopulation)。二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節(jié)1第一節(jié)二項分布和總體率的估計一、二項分布(一)二項分布的概念

在生命科學研究中,經(jīng)常會遇到一些事物,其結(jié)果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養(yǎng)的陽性與陰性等,這些都可以根據(jù)某種性狀的出現(xiàn)與否而分為非此即彼的對立事件。這種非此即彼事件構(gòu)成的總體,就稱為二項總體(binomialpopulation)。第一節(jié)二項分布和總體率的估計一、二項分布第一節(jié)二項分布和總體率的估計二項分布(binomialdistribution)就是對這種只具有兩種互斥結(jié)果的離散型隨機變量的規(guī)律性進行描述的一種概率分布。由于這一種分布規(guī)律是由瑞士學者貝努里(Bernoulli)首先發(fā)現(xiàn)的,又稱貝努里分布。

第一節(jié)二項分布和總體率的估計二項分二項分布有兩個基本假設(shè):

1.各事件是相互獨立的,即任一事件的發(fā)生與否,不影響其它事件的發(fā)生概率;

2.各個隨機事件只能產(chǎn)生相互排斥的兩種結(jié)果。

二項分布有兩個基本假設(shè):定理:幾個相互獨立事件同時發(fā)生的概率等于各獨立事件的概率之積。定理:在幾個互不相容的事件中,任一事件發(fā)生的概率等于這幾個事件的概率之和。抓中兩黑一白的概率:P(2)=3×0.125=0.375抓中三個黑球的概率:P(3)=0.5×0.5×0.5=0.125定理:幾個相互獨立事件同時發(fā)生的概率等于各獨立事件的概率之積二項分布與泊松分布課件二項分布與泊松分布課件

各種可能發(fā)生的結(jié)果對應的概率相當于展開后的各項數(shù)值,即:

前例:π=0.8,1-π=0.2,n=3各種可能發(fā)生的結(jié)果對應的概率相當于展開后的各二項分布的概率公式

如果一個事件A,在n次獨立試驗中,每次試驗都具有概率π

,那么,這一事件A將在n次試驗中出現(xiàn)x次的概率為:

式中:稱二項系數(shù)。二項分布的概率公式如果一個事件A,在n次獨立試(二)二項分布的應用條件

1.各觀察單位只能具有互相對立的一種結(jié)果,屬于二項分類資料;

2.已知發(fā)生某一結(jié)果的概率為π,其對立結(jié)果的概率則為1-π

。實際工作中要求π是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;3.n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的結(jié)果。

(二)二項分布的應用條件1.各觀察單位只能具有互相對立的(三)二項分布的性質(zhì)

1.二項分布的均數(shù)和標準差二項分布的平均數(shù):μ=nπ

上式的意義:做n次獨立試驗,某事件平均出現(xiàn)的次數(shù)為nπ次,這一結(jié)果較為符合人們的直觀想法。如果,生男孩這一事件的概率是1/2,則100個新生兒中可期望有nπ=100×1/2=50個是男孩。當用率表示時,μ=π

(三)二項分布的性質(zhì)1.二項分布的均數(shù)和標準差(三)二項分布的性質(zhì)二項分布的標準差:標準差表示x取值的離散度或變異的大小。如n=5,π=5/6,1-π=1-5/6,則:(三)二項分布的性質(zhì)二項分布的標準差:(三)二項分布的性質(zhì)二項分布的標準誤

若以比值或百分數(shù)表示,則標準誤為

:

σp被稱為率的標準誤(standarderrorofrate),用來反映隨機抽樣獲得的樣本率p與總體π之間的抽樣誤差大小。

(三)二項分布的性質(zhì)二項分布的標準誤(三)二項分布的性質(zhì)二項分布的標準誤

若以比值或百分數(shù)表示,則標準誤為

:實際工作中常用p作為π

的估計值,得:(三)二項分布的性質(zhì)二項分布的標準誤(三)二項分布的性質(zhì)

2.二項分布的累計概率常用的有左側(cè)累計和右側(cè)累計2種方法。從陽性率為π

的總體中隨機抽取n個個體,則(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)二項分布的性質(zhì)2.二項分布的累計概率(三)二項分布的性質(zhì)

3.二項分布的圖形二項分布的圖形,取決于兩個方面,其一為事件發(fā)生的概率π

,其二為樣本含量n。當π

=1-π

=1/2時,二項分布的圖形是對稱的;當π

<1/2時,二項分布的圖形呈左偏態(tài);當π

>1/2時,二項分布的圖形呈右偏態(tài);當π與1-π不變時,即使π

≠1-π

,但隨著n的增大,二項分布的的偏態(tài)程度會逐漸降低而趨于對稱。

(三)二項分布的性質(zhì)3.二項分布的圖形二項分布總體不同樣本例數(shù)時的抽樣分布

二項分布總體不同樣本例數(shù)時的抽樣分布二、二項分布的應用

(一)、總體率的估計

有點值估計和區(qū)間估計。1查表法:當n較小,如n≤50時,特別是p很接近于0或1時,可由附表6百分率的置信區(qū)間表直接查出。P709orp817例:某地對13名輸卵管結(jié)扎的育齡婦女經(jīng)壺腹部吻合術(shù)后,觀察其受孕情況,發(fā)現(xiàn)有6人受孕,據(jù)此估計該吻合術(shù)婦女的受孕的95%可信區(qū)間此例:n=13,x=6

查表得95%CI為:19%~75%。二、二項分布的應用(一)、總體率的估計二、二項分布的應用

(一)、總體率的估計

1查表法:附表6百分率的置信區(qū)間表直接列出了X≤n/2的部分。其余部分可以查n-x的陰性部分的QL~QU再相減得PLand

pUPL=1-QL1-QU例:某地調(diào)查50名兒童蛔蟲感染情況,發(fā)現(xiàn)有10人大便中有蛔蟲卵,問兒童蛔蟲感染率的95%置信區(qū)間是多少?此例:n=50,x=10

查表得95%CI為:10%~34%。二、二項分布的應用(一)、總體率的估計二項分布的應用

2正態(tài)近似法:應用條件:np及n(1?p)均≥5p±uαsp

例:在某地隨機抽取329人,做HBsAg檢驗,得陽性率為8.81%,求陽性率95%置信區(qū)間。已知:p=8.81%,n=329,故:

95%CI:8.81±1.96×1.56;即5.75%~11.87%。二項分布的應用2正態(tài)近似法:應用條件:np及n(1二項分布下表是用P±Uasp時要求的P值與N的大小參考數(shù)字。PnnP0.530150.450200.380240.2200400.1600600.05140070二項分布下表是用P±Uasp時要求的P值與N的大小參二項分布的應用(二)差異的顯著性檢驗1直接法例某醫(yī)院用甲藥治療某病,其治愈率為70%,今用乙藥治療該病10人,治愈9人,問甲乙兩藥療效有無差別?已知:π=0.7,1-π=0.3,假設(shè)兩藥療效無差別,則治愈與非治愈的概率應符合二項分布,即:

二項分布的應用(二)差異的顯著性檢驗如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療10人應治愈7人,實際治愈9人,相差2人。雙側(cè)檢驗,計算相差±2人及2人以上的總概率,即x≥9和x≤5的概率之和:ΣP=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:ΣP=1-(0.200121+0.266828+0.233474)=0.299577如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療1

P=0.299577>0.05,差異無統(tǒng)計學意義,尚不能認為乙藥療效優(yōu)于甲藥。

本例如采用單側(cè)檢驗,即要求判斷乙藥療效優(yōu)于甲藥?此時只需計算相差2人及以上的總概率:ΣP=P(9)+P(10)=0.121061+0.028248=0.149309P>0.05,差異無統(tǒng)計學意義,尚不能認為乙藥療效優(yōu)于甲藥。P=0.299577>0.05,差異無統(tǒng)計學意義,尚不3.研究疾病的家族聚集性

例某單位發(fā)生乙肝暴發(fā)流行,經(jīng)調(diào)查4口之家共288戶,其中無病例的167戶,發(fā)生1例的51戶,2例的50戶,3例的17戶,全家發(fā)病的3戶,問乙肝的發(fā)病是否具有家族集聚性?

π=214/1152=0.1858,1-π=0.8142

計算發(fā)病數(shù)x=0,1,2,3,4時的理論概率和理論戶數(shù)。列表,比較實際戶數(shù)與理論戶數(shù)差別有無顯著性意義。

3.研究疾病的家族聚集性二項分布展開計算表發(fā)病人數(shù)展開式概率理論戶數(shù)實際戶數(shù)xCxnπ

x(1-π)n-xPT=P×288A0C04

(0.1858)0(0.8142)40.4395126.571671C14

(0.1858)1(0.8142)30.4011115.52

512C24

(0.1858)2(0.8142)20.1373

39.54

503C34

(0.1858)3(0.8142)10.0209

6.02

174C44

(0.1858)4(0.8142)00.0012

0.35

3二項分布展開計算表發(fā)病人數(shù)展開式概率理論戶數(shù)實際戶數(shù)xCxn二項分布擬合優(yōu)度的χ2檢驗發(fā)病人數(shù)實際戶數(shù)理論戶數(shù)(A-T)2(A-T)2xATT0167126.571634.5812.911

51115.524162.8336.042

50

39.54

109.41

2.773

17

6.02

120.5620.034

3

0.35

7.0220.06χ2=91.81,按ν=組數(shù)-2=5-2=3查χ2界值表得:χ20.01(3)=11.345,故P<0.01,說明該疾病的家庭分布不符合二項分布,可以認為該病有家族集聚性。二項分布擬合優(yōu)度的χ2檢驗發(fā)病人數(shù)實際戶數(shù)理論戶數(shù)(A-T)(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分析樣本根據(jù)二項分布的原理:1份混合樣本中含有k份陽性的概率為P(k)=(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反映的是混合樣品陰性的概率當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反(五)群檢驗當收集的樣本數(shù)量很大時,全部檢驗費時費力可以用群檢驗的方法進行解決,若每個標本的陽性概率為π,則其陰性概率為Q=1-πQm便是某個群m個標本均為陰性的概率,一個群為陰性的群的概率,而1-Qm就為一個群陽性的概率。假設(shè)受檢的n個群中有X個陽性群,用x/n作為陽性群概率的估計值(五)群檢驗當收集的樣本數(shù)量很大時,全部檢驗費時費力(五)群檢驗

1-Qm=X/n從而Q=√P=1-Q(五)群檢驗1-Qm=X/n從而Q=√P=1-Q第四節(jié)泊松分布(Poissondistribution)

一、Poisson分布

(一)泊松分布的概念泊松分布(舊譯普哇松分布)是離散型隨機變量的另一重要分布,最早由S.D.Poisson于1837年提出。

定義:若離散型隨機變量x的取值為非負整數(shù),且相應的概率函數(shù)為:

則稱隨機變量X服從泊松分布。第四節(jié)泊松分布(Poissondistribution泊松分布(Poissondistribution)

泊松分布的數(shù)學表達式:在n個取樣單位內(nèi),出現(xiàn)X=0,1,2,…,n個陽性事件的理論概率分別為下列公式的展開各項:

式中:P(X)為出現(xiàn)陽性事件例數(shù)為X的理論概率。實際應用時,可以用樣本均數(shù)作為總體均數(shù)μ的估計值。泊松分布(Poissondistribution)泊松分(二)Poisson分布的應用條件

在二項分布中,如果π很小,而試驗次數(shù)n很大,nπ趨向于一個常數(shù)μ時,則可以用參數(shù)為μ的泊松分布近似地表示。泊松分布還有其獨特的意義,它對于描述隨機現(xiàn)象在大面積(時間、空間)上的分布情況很有用。例如在單位面積的水中的細菌數(shù)的分布,計數(shù)室中細菌數(shù)的分布,放射性物質(zhì)在單位時間內(nèi)放射次數(shù)的分布等都屬于泊松分布。(二)Poisson分布的應用條件在泊松分布(Poissondistribution)

服從泊松分布的條件與二項分布一樣,其中之一是各事件相互獨立。例如,某一昆蟲是否落入,某人是否患某病與他人是否患病無關(guān)等。如果不符合這一條件就不呈泊松分布。因此,也可以用泊松分布來研究某些疾病是否有家族聚集性、傳染性等。泊松分布(Poissondistribution)(三)Poisson分布的性質(zhì)

1.Poisson分布是一種單參數(shù)的離散型分布,其參數(shù)為μ,它表示單位時間或空間內(nèi)某事件平均發(fā)生的次數(shù),又稱強度參數(shù)。

(三)Poisson分布的性質(zhì)1.Poisson分(三)Poisson分布的性質(zhì)

2.Poisson分布的均數(shù)和方差相等對于符合泊松分布的資料,其n很大,而π很小,因此,泊松分布的平均數(shù)為:μ=nπ

當π→0,(1-π)→1時,泊松分布的標準差為:也就是說,泊松分布的平均數(shù)與它的方差相等:μ=σ2(三)Poisson分布的性質(zhì)2.Poisson分(三)分布的性質(zhì)

3.Poisson分布的累計概率常用的有左側(cè)累計和右側(cè)累計2種方法。累計概率為單位時間或空間內(nèi)某事件發(fā)生的次數(shù)。(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)分布的性質(zhì)3.Poisson分布的累計概率(三)分布的性質(zhì)

4.Poisson分布的圖形泊松分布的圖形是由平均數(shù)μ來確定的,當μ較小時,泊松分布不對稱的程度較為顯著,通常呈左偏分布;隨著μ值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而且,和二項分布一樣,也逐漸趨向正態(tài)分布。一般說來,當平均數(shù)μ>50時(有人認為當μ>20),泊松分布就近似于正態(tài)分布。(三)分布的性質(zhì)4.Poisson分布的圖形Poisson分布總體均數(shù)不同時的抽樣分布

Poisson分布總體均數(shù)不同時的抽樣分布(三)Poisson分布的性質(zhì)當n很大,p很小,np=μ為一常數(shù)時,二項分布近似于泊松分布。p愈小,近似程度愈好。

例:據(jù)以往經(jīng)驗,新生兒染色體異常率為1%,試分別用二項分布和泊松分布原理,求100名新生兒中發(fā)生x例(x=1,2,3......)染色體異常的概率。

(三)Poisson分布的性質(zhì)當n很大二項分布與泊松分布的比較

由上表可見,二者計算結(jié)果非常接近,當n愈大其接近程度愈好,但泊松分布的P(X)計算較為簡便。

XP(X)

二項分布

泊松分布

0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計1.0000

1.0000

二項分布與泊松分布的比較由上表可

5.Poisson分布的可加性如果相互獨立的k個隨機變量都服從泊松分布,則它們之和仍服從泊松分布,且其均數(shù)為k個隨機變量的均數(shù)之和。此稱為泊松分布的可加性。5.Poisson分布的可加性

例:已知某放射性物質(zhì)每10分鐘放射脈沖數(shù)呈泊松分布,5次測量的結(jié)果分別為35、34、36、38、34次,那么,50分鐘總計的脈沖數(shù)177次,亦呈泊松分布。因此,泊松分布資料可利用可加性原理使μ>20,這樣就可以用正態(tài)近似法處理。

例:已知某放射性物質(zhì)每10分鐘放射脈沖數(shù)呈泊松分布Poisson分布的應用

置信區(qū)間的估計對于小樣本資料的泊松分布置信區(qū)間估計,可以查附表7。p448

例由一份混合好的自來水中取1ml水樣,培養(yǎng)得細菌5個,請估計原水中每ml細菌數(shù)95%的置信區(qū)間。查附表7:樣本計數(shù)X=5,95%CI:1.6~11.7。Poisson分布的應用置信區(qū)間的估計Poisson分布的應用

置信區(qū)間的估計對于大樣本資料(X>50)的置信區(qū)間估計,可以近似地運用正態(tài)分布法進行,即:95%置信區(qū)間為:99%置信區(qū)間為:例同一份樣品分別用10個平皿進行培養(yǎng),共數(shù)得菌落數(shù)1460個,試估計該樣品菌落數(shù)95%置信區(qū)間。本例:X=1460/10=146(個)95%CI:,即122.32~169.68。

Poisson分布的應用置信區(qū)間的估計Poisson分布的應用泊松分布的配合

例:將培養(yǎng)皿中的細菌稀釋液置于血球計上,數(shù)出小方格中的細菌數(shù),共計128個方格,計數(shù)結(jié)果見下表。問此分布是否符合泊松分布?

表×

細菌在計數(shù)小方格中的分布

每小格細菌數(shù)(X)

觀察的方格數(shù)(f)

01234264038177Poisson分布的應用泊松分布的配合每小格細菌數(shù)(X)Poisson分布的應用計算過程:求出樣本均數(shù)以代替μ,按照泊松分布的概率公式求出X=0,1,2,3,4時的概率P(X)。本例μ=1.5234,代入公式得:

P(0)=e-μμx/x!=e-1.5234(1.5234)0/0!=0.2180P(1)=e-1.5234(1.5234)1/1!=0.3321P(2)=e-1.5234(1.5234)2/2!=0.2529P(3)=e-1.5234(1.5234)3/3!=0.1284P(3)=e-1.5234(1.5234)4/4!=0.0489Poisson分布的應用計算過程:也可按下面的遞推公式計算:也可按下面的遞推公式計算:

驗算:P(0)+P(1)+P(2)+……+P(n)=1

本例:0.2180+0.3321+0.2529+0.1284+0.0489=0.9803

以各組的概率P(X)乘以n即為X=0,1,2,3,4按泊松分布的理論頻數(shù)。

將理論頻數(shù)與實際頻數(shù)比較(χ2-test),判斷此分布是否符合泊松分布。

驗算:P(0)+P(1)+P(2)+……+P(n)=Poisson分布擬合優(yōu)度檢驗計算表

χ2=Σ(A-T)2/T=1.3606

因擬合泊松分布時用了n和μ,故ν=組數(shù)-2=5-2=3。查χ2界值表得χ20.05(3)=7.81,故P>0.05

結(jié)論:實際分布與理論分布差別無統(tǒng)計學意義,可認為符合泊松分布。

xATA-T(A-T)2(A-T)2T0123426403817727.9042.5032.3716.446.26-1.90-2.505.630.560.743.61046.265131.64580.31380.54600.12940.14740.97750.01910.1872Poisson分布擬合優(yōu)度檢驗計算表χ2=ΣPoisson分布資料的差異顯著性檢驗例:某種生物制劑的異常反應發(fā)生率一般在1/萬左右,今試用該生物制劑新制品,在受試者100人中發(fā)現(xiàn)1人有異常反應,問該生物制劑的異常反應率是否高于一般?假設(shè)新制品反應率與一般反應率相同,則100人中反應的平均數(shù)為:H0:π=π0μ=100×1/10000=0.01本例π=0.0001,很小,n=100,很大,可用泊松分布作近似計算,100人中1例異常反應也不出現(xiàn)的概率為:

Poisson分布資料的差異顯著性檢驗例:某種Poisson分布資料的差異顯著性檢驗100人中1例異常反應也不出現(xiàn)的概率為:

出現(xiàn)1例及1例以上的概率:P(x≥1)=1-P(0)=1-0.990050=0.009950

P<0.01,差異有高度顯著性意義,說明新制品的異常反應率高于一般。

Poisson分布資料的差異顯著性檢驗100人中1例異常反應Poisson分布資料的差異顯著性檢驗例:用甲乙兩種培養(yǎng)基對水樣進行細菌培養(yǎng),在相同的條件下,用甲培養(yǎng)基的菌落為100,用乙培養(yǎng)基的菌落為150,問兩培養(yǎng)基菌落數(shù)的差別有無顯著性?本例平均數(shù)μ>50,可用正態(tài)近似法進行泊松分布的檢驗。

H0:兩種培養(yǎng)基的菌落數(shù)相同,

H1:兩種培養(yǎng)基的菌落數(shù)不同。

α=0.05。

Poisson分布資料的差異顯著性檢驗例:用甲乙兩種培養(yǎng)基Poisson分布資料的差異顯著性檢驗在對泊松分布資料進行顯著性檢驗時,如兩樣本觀察單位數(shù)相同,則采用下式:

Σx1、Σx2分別為兩樣本各觀察單位的計數(shù)之和。如兩樣本觀察單位數(shù)不等,則檢驗時用下式:

Poisson分布資料的差異顯著性檢驗在對泊松分布Poisson分布資料的差異顯著性檢驗本例是在相同條件下培養(yǎng)計數(shù)菌落數(shù),因此可認為觀察單位數(shù)相等。ΣX1=100、ΣX2=150,則:

u0.01=2.58,故P<0.01,說明甲乙兩種培養(yǎng)基細菌培養(yǎng)結(jié)果有極顯著性意義。

Poisson分布資料的差異顯著性檢驗本例應用Poisson分布應注意的問題

Poisson分布的X雖為樣本計數(shù),由于觀察單位(時間、面積、容積等)是固定的,可看成n=1,故均數(shù)為率的含義,按泊松分布特性:μ=σ2,而標準誤=,在n=1時,標準差與標準誤相等,故式中樣本標準誤的平方等于均數(shù)X。當觀察單位不同時,標準誤=,因此,與前面的兩均數(shù)(或率)之差的標準誤是一致的。

當利用正態(tài)近似法時,要滿足μ>20的條件。為此,可利用泊松分布的可加性,把若干個觀察單位合并。應用Poisson分布應注意的問題Poi應用Poisson分布應注意的問題

兩均數(shù)比較時,要注意觀察單位(時間、面積、容積、人口基數(shù)等)是否相同,若不相同,須化為相同的觀察單位后再作比較。而且,只能將大單位化為小單位,不能將小單位化為大單位。例如,將人口基數(shù)不足10萬查得的結(jié)果,按比例把基數(shù)擴大為10萬的結(jié)果是不合適的。再者以10萬人口為觀察單位時,兩樣本均數(shù)的差別有顯著性,不等于以1萬人口為觀察單位時,兩樣本均數(shù)的差別亦有顯著性。所以,確定泊松分布的觀察單位是很重要的。二項分布用于描述二項分類變量兩種觀察結(jié)果的出現(xiàn)頻率,泊松分布是二項分布的特例,常用于分析小概率事件的發(fā)生規(guī)律。

應用Poisson分布應注意的問題作業(yè)1.根據(jù)已往經(jīng)驗,用一般療法治療某疾病的治愈率為60%。今用某種新藥治療該病病人11例,其中9例治愈。問該種新藥的療效是否優(yōu)于一般療法??

作業(yè)1.根據(jù)已往經(jīng)驗,用一般療法治療某疾病的治愈率為60%。作業(yè)2.用某種新藥治療某寄生蟲病,50例病人在服藥后有1人出現(xiàn)某種精神癥狀,該精神癥狀在此病患者中也曾有發(fā)生,過去普查結(jié)果發(fā)生率約為千分之一。問該藥病人出現(xiàn)精神癥狀是否與服藥有關(guān)?

作業(yè)2.用某種新藥治療某寄生蟲病,50例病人在服藥后有1人 謝謝大家! 謝謝大家!61二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節(jié)二項分布和總體率的估計一、二項分布(一)二項分布的概念在生命科學研究中,經(jīng)常會遇到一些事物,其結(jié)果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養(yǎng)的陽性與陰性等,這些都可以根據(jù)某種性狀的出現(xiàn)與否而分為非此即彼的對立事件。這種非此即彼事件構(gòu)成的總體,就稱為二項總體(binomialpopulation)。二項分布與泊松分布二項分布與泊松分布二項分布與泊松分布第一節(jié)62第一節(jié)二項分布和總體率的估計一、二項分布(一)二項分布的概念

在生命科學研究中,經(jīng)常會遇到一些事物,其結(jié)果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養(yǎng)的陽性與陰性等,這些都可以根據(jù)某種性狀的出現(xiàn)與否而分為非此即彼的對立事件。這種非此即彼事件構(gòu)成的總體,就稱為二項總體(binomialpopulation)。第一節(jié)二項分布和總體率的估計一、二項分布第一節(jié)二項分布和總體率的估計二項分布(binomialdistribution)就是對這種只具有兩種互斥結(jié)果的離散型隨機變量的規(guī)律性進行描述的一種概率分布。由于這一種分布規(guī)律是由瑞士學者貝努里(Bernoulli)首先發(fā)現(xiàn)的,又稱貝努里分布。

第一節(jié)二項分布和總體率的估計二項分二項分布有兩個基本假設(shè):

1.各事件是相互獨立的,即任一事件的發(fā)生與否,不影響其它事件的發(fā)生概率;

2.各個隨機事件只能產(chǎn)生相互排斥的兩種結(jié)果。

二項分布有兩個基本假設(shè):定理:幾個相互獨立事件同時發(fā)生的概率等于各獨立事件的概率之積。定理:在幾個互不相容的事件中,任一事件發(fā)生的概率等于這幾個事件的概率之和。抓中兩黑一白的概率:P(2)=3×0.125=0.375抓中三個黑球的概率:P(3)=0.5×0.5×0.5=0.125定理:幾個相互獨立事件同時發(fā)生的概率等于各獨立事件的概率之積二項分布與泊松分布課件二項分布與泊松分布課件

各種可能發(fā)生的結(jié)果對應的概率相當于展開后的各項數(shù)值,即:

前例:π=0.8,1-π=0.2,n=3各種可能發(fā)生的結(jié)果對應的概率相當于展開后的各二項分布的概率公式

如果一個事件A,在n次獨立試驗中,每次試驗都具有概率π

,那么,這一事件A將在n次試驗中出現(xiàn)x次的概率為:

式中:稱二項系數(shù)。二項分布的概率公式如果一個事件A,在n次獨立試(二)二項分布的應用條件

1.各觀察單位只能具有互相對立的一種結(jié)果,屬于二項分類資料;

2.已知發(fā)生某一結(jié)果的概率為π,其對立結(jié)果的概率則為1-π

。實際工作中要求π是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;3.n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的結(jié)果。

(二)二項分布的應用條件1.各觀察單位只能具有互相對立的(三)二項分布的性質(zhì)

1.二項分布的均數(shù)和標準差二項分布的平均數(shù):μ=nπ

上式的意義:做n次獨立試驗,某事件平均出現(xiàn)的次數(shù)為nπ次,這一結(jié)果較為符合人們的直觀想法。如果,生男孩這一事件的概率是1/2,則100個新生兒中可期望有nπ=100×1/2=50個是男孩。當用率表示時,μ=π

(三)二項分布的性質(zhì)1.二項分布的均數(shù)和標準差(三)二項分布的性質(zhì)二項分布的標準差:標準差表示x取值的離散度或變異的大小。如n=5,π=5/6,1-π=1-5/6,則:(三)二項分布的性質(zhì)二項分布的標準差:(三)二項分布的性質(zhì)二項分布的標準誤

若以比值或百分數(shù)表示,則標準誤為

:

σp被稱為率的標準誤(standarderrorofrate),用來反映隨機抽樣獲得的樣本率p與總體π之間的抽樣誤差大小。

(三)二項分布的性質(zhì)二項分布的標準誤(三)二項分布的性質(zhì)二項分布的標準誤

若以比值或百分數(shù)表示,則標準誤為

:實際工作中常用p作為π

的估計值,得:(三)二項分布的性質(zhì)二項分布的標準誤(三)二項分布的性質(zhì)

2.二項分布的累計概率常用的有左側(cè)累計和右側(cè)累計2種方法。從陽性率為π

的總體中隨機抽取n個個體,則(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)二項分布的性質(zhì)2.二項分布的累計概率(三)二項分布的性質(zhì)

3.二項分布的圖形二項分布的圖形,取決于兩個方面,其一為事件發(fā)生的概率π

,其二為樣本含量n。當π

=1-π

=1/2時,二項分布的圖形是對稱的;當π

<1/2時,二項分布的圖形呈左偏態(tài);當π

>1/2時,二項分布的圖形呈右偏態(tài);當π與1-π不變時,即使π

≠1-π

,但隨著n的增大,二項分布的的偏態(tài)程度會逐漸降低而趨于對稱。

(三)二項分布的性質(zhì)3.二項分布的圖形二項分布總體不同樣本例數(shù)時的抽樣分布

二項分布總體不同樣本例數(shù)時的抽樣分布二、二項分布的應用

(一)、總體率的估計

有點值估計和區(qū)間估計。1查表法:當n較小,如n≤50時,特別是p很接近于0或1時,可由附表6百分率的置信區(qū)間表直接查出。P709orp817例:某地對13名輸卵管結(jié)扎的育齡婦女經(jīng)壺腹部吻合術(shù)后,觀察其受孕情況,發(fā)現(xiàn)有6人受孕,據(jù)此估計該吻合術(shù)婦女的受孕的95%可信區(qū)間此例:n=13,x=6

查表得95%CI為:19%~75%。二、二項分布的應用(一)、總體率的估計二、二項分布的應用

(一)、總體率的估計

1查表法:附表6百分率的置信區(qū)間表直接列出了X≤n/2的部分。其余部分可以查n-x的陰性部分的QL~QU再相減得PLand

pUPL=1-QL1-QU例:某地調(diào)查50名兒童蛔蟲感染情況,發(fā)現(xiàn)有10人大便中有蛔蟲卵,問兒童蛔蟲感染率的95%置信區(qū)間是多少?此例:n=50,x=10

查表得95%CI為:10%~34%。二、二項分布的應用(一)、總體率的估計二項分布的應用

2正態(tài)近似法:應用條件:np及n(1?p)均≥5p±uαsp

例:在某地隨機抽取329人,做HBsAg檢驗,得陽性率為8.81%,求陽性率95%置信區(qū)間。已知:p=8.81%,n=329,故:

95%CI:8.81±1.96×1.56;即5.75%~11.87%。二項分布的應用2正態(tài)近似法:應用條件:np及n(1二項分布下表是用P±Uasp時要求的P值與N的大小參考數(shù)字。PnnP0.530150.450200.380240.2200400.1600600.05140070二項分布下表是用P±Uasp時要求的P值與N的大小參二項分布的應用(二)差異的顯著性檢驗1直接法例某醫(yī)院用甲藥治療某病,其治愈率為70%,今用乙藥治療該病10人,治愈9人,問甲乙兩藥療效有無差別?已知:π=0.7,1-π=0.3,假設(shè)兩藥療效無差別,則治愈與非治愈的概率應符合二項分布,即:

二項分布的應用(二)差異的顯著性檢驗如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療10人應治愈7人,實際治愈9人,相差2人。雙側(cè)檢驗,計算相差±2人及2人以上的總概率,即x≥9和x≤5的概率之和:ΣP=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:ΣP=1-(0.200121+0.266828+0.233474)=0.299577如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療1

P=0.299577>0.05,差異無統(tǒng)計學意義,尚不能認為乙藥療效優(yōu)于甲藥。

本例如采用單側(cè)檢驗,即要求判斷乙藥療效優(yōu)于甲藥?此時只需計算相差2人及以上的總概率:ΣP=P(9)+P(10)=0.121061+0.028248=0.149309P>0.05,差異無統(tǒng)計學意義,尚不能認為乙藥療效優(yōu)于甲藥。P=0.299577>0.05,差異無統(tǒng)計學意義,尚不3.研究疾病的家族聚集性

例某單位發(fā)生乙肝暴發(fā)流行,經(jīng)調(diào)查4口之家共288戶,其中無病例的167戶,發(fā)生1例的51戶,2例的50戶,3例的17戶,全家發(fā)病的3戶,問乙肝的發(fā)病是否具有家族集聚性?

π=214/1152=0.1858,1-π=0.8142

計算發(fā)病數(shù)x=0,1,2,3,4時的理論概率和理論戶數(shù)。列表,比較實際戶數(shù)與理論戶數(shù)差別有無顯著性意義。

3.研究疾病的家族聚集性二項分布展開計算表發(fā)病人數(shù)展開式概率理論戶數(shù)實際戶數(shù)xCxnπ

x(1-π)n-xPT=P×288A0C04

(0.1858)0(0.8142)40.4395126.571671C14

(0.1858)1(0.8142)30.4011115.52

512C24

(0.1858)2(0.8142)20.1373

39.54

503C34

(0.1858)3(0.8142)10.0209

6.02

174C44

(0.1858)4(0.8142)00.0012

0.35

3二項分布展開計算表發(fā)病人數(shù)展開式概率理論戶數(shù)實際戶數(shù)xCxn二項分布擬合優(yōu)度的χ2檢驗發(fā)病人數(shù)實際戶數(shù)理論戶數(shù)(A-T)2(A-T)2xATT0167126.571634.5812.911

51115.524162.8336.042

50

39.54

109.41

2.773

17

6.02

120.5620.034

3

0.35

7.0220.06χ2=91.81,按ν=組數(shù)-2=5-2=3查χ2界值表得:χ20.01(3)=11.345,故P<0.01,說明該疾病的家庭分布不符合二項分布,可以認為該病有家族集聚性。二項分布擬合優(yōu)度的χ2檢驗發(fā)病人數(shù)實際戶數(shù)理論戶數(shù)(A-T)(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分析樣本根據(jù)二項分布的原理:1份混合樣本中含有k份陽性的概率為P(k)=(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反映的是混合樣品陰性的概率當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反(五)群檢驗當收集的樣本數(shù)量很大時,全部檢驗費時費力可以用群檢驗的方法進行解決,若每個標本的陽性概率為π,則其陰性概率為Q=1-πQm便是某個群m個標本均為陰性的概率,一個群為陰性的群的概率,而1-Qm就為一個群陽性的概率。假設(shè)受檢的n個群中有X個陽性群,用x/n作為陽性群概率的估計值(五)群檢驗當收集的樣本數(shù)量很大時,全部檢驗費時費力(五)群檢驗

1-Qm=X/n從而Q=√P=1-Q(五)群檢驗1-Qm=X/n從而Q=√P=1-Q第四節(jié)泊松分布(Poissondistribution)

一、Poisson分布

(一)泊松分布的概念泊松分布(舊譯普哇松分布)是離散型隨機變量的另一重要分布,最早由S.D.Poisson于1837年提出。

定義:若離散型隨機變量x的取值為非負整數(shù),且相應的概率函數(shù)為:

則稱隨機變量X服從泊松分布。第四節(jié)泊松分布(Poissondistribution泊松分布(Poissondistribution)

泊松分布的數(shù)學表達式:在n個取樣單位內(nèi),出現(xiàn)X=0,1,2,…,n個陽性事件的理論概率分別為下列公式的展開各項:

式中:P(X)為出現(xiàn)陽性事件例數(shù)為X的理論概率。實際應用時,可以用樣本均數(shù)作為總體均數(shù)μ的估計值。泊松分布(Poissondistribution)泊松分(二)Poisson分布的應用條件

在二項分布中,如果π很小,而試驗次數(shù)n很大,nπ趨向于一個常數(shù)μ時,則可以用參數(shù)為μ的泊松分布近似地表示。泊松分布還有其獨特的意義,它對于描述隨機現(xiàn)象在大面積(時間、空間)上的分布情況很有用。例如在單位面積的水中的細菌數(shù)的分布,計數(shù)室中細菌數(shù)的分布,放射性物質(zhì)在單位時間內(nèi)放射次數(shù)的分布等都屬于泊松分布。(二)Poisson分布的應用條件在泊松分布(Poissondistribution)

服從泊松分布的條件與二項分布一樣,其中之一是各事件相互獨立。例如,某一昆蟲是否落入,某人是否患某病與他人是否患病無關(guān)等。如果不符合這一條件就不呈泊松分布。因此,也可以用泊松分布來研究某些疾病是否有家族聚集性、傳染性等。泊松分布(Poissondistribution)(三)Poisson分布的性質(zhì)

1.Poisson分布是一種單參數(shù)的離散型分布,其參數(shù)為μ,它表示單位時間或空間內(nèi)某事件平均發(fā)生的次數(shù),又稱強度參數(shù)。

(三)Poisson分布的性質(zhì)1.Poisson分(三)Poisson分布的性質(zhì)

2.Poisson分布的均數(shù)和方差相等對于符合泊松分布的資料,其n很大,而π很小,因此,泊松分布的平均數(shù)為:μ=nπ

當π→0,(1-π)→1時,泊松分布的標準差為:也就是說,泊松分布的平均數(shù)與它的方差相等:μ=σ2(三)Poisson分布的性質(zhì)2.Poisson分(三)分布的性質(zhì)

3.Poisson分布的累計概率常用的有左側(cè)累計和右側(cè)累計2種方法。累計概率為單位時間或空間內(nèi)某事件發(fā)生的次數(shù)。(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)(三)分布的性質(zhì)3.Poisson分布的累計概率(三)分布的性質(zhì)

4.Poisson分布的圖形泊松分布的圖形是由平均數(shù)μ來確定的,當μ較小時,泊松分布不對稱的程度較為顯著,通常呈左偏分布;隨著μ值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而且,和二項分布一樣,也逐漸趨向正態(tài)分布。一般說來,當平均數(shù)μ>50時(有人認為當μ>20),泊松分布就近似于正態(tài)分布。(三)分布的性質(zhì)4.Poisson分布的圖形Poisson分布總體均數(shù)不同時的抽樣分布

Poisson分布總體均數(shù)不同時的抽樣分布(三)Poisson分布的性質(zhì)當n很大,p很小,np=μ為一常數(shù)時,二項分布近似于泊松分布。p愈小,近似程度愈好。

例:據(jù)以往經(jīng)驗,新生兒染色體異常率為1%,試分別用二項分布和泊松分布原理,求100名新生兒中發(fā)生x例(x=1,2,3......)染色體異常的概率。

(三)Poisson分布的性質(zhì)當n很大二項分布與泊松分布的比較

由上表可見,二者計算結(jié)果非常接近,當n愈大其接近程度愈好,但泊松分布的P(X)計算較為簡便。

XP(X)

二項分布

泊松分布

0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計1.0000

1.0000

二項分布與泊松分布的比較由上表可

5.Poisson分布的可加性如果相互獨立的k個隨機變量都服從泊松分布,則它們之和仍服從泊松分布,且其均數(shù)為k個隨機變量的均數(shù)之和。此稱為泊松分布的可加性。5.Poisson分布的可加性

例:已知某放射性物質(zhì)每10分鐘放射脈沖數(shù)呈泊松分布,5次測量的結(jié)果分別為35、34、36、38、34次,那么,50分鐘總計的脈沖數(shù)177次,亦呈泊松分布。因此,泊松分布資料可利用可加性原理使μ>20,這樣就可以用正態(tài)近似法處理。

例:已知某放射性物質(zhì)每10分鐘放射脈沖數(shù)呈泊松分布Poisson分布的應用

置信區(qū)間的估計對于小樣本資料的泊松分布置信區(qū)間估計,可以查附表7。p448

例由一份混合好的自來水中取1ml水樣,培養(yǎng)得細菌5個,請估計原水中每ml細菌數(shù)95%的置信區(qū)間。查附表7:樣本計數(shù)X=5,95%CI:1.6~11.7。Poisson分布的應用置信區(qū)間的估計Poisson分布的應用

置信區(qū)間的估計對于大樣本資料(X>50)的置信區(qū)間估計,可以近似地運用正態(tài)分布法進行,即:95%置信區(qū)間為:99%置信區(qū)間為:例同一份樣品分別用10個平皿進行培養(yǎng),共數(shù)得菌落數(shù)1460個,試估計該樣品菌落數(shù)95%置信區(qū)間。本例:X=1460/10=146(個)95%CI:,即122.32~169.68。

Poisson分布的應用置信區(qū)間的估計Poisson分布的應用泊松分布的配合

例:將培養(yǎng)皿中的細菌稀釋液置于血球計上,數(shù)出小方格中的細菌數(shù),共計128個方格,計數(shù)結(jié)果見下表。問此分布是否符合泊松分布?

表×

細菌在計數(shù)小方格中的分布

每小格細菌數(shù)(X)

觀察的方格數(shù)(f)

01234264038177Poisson分布的應用泊松分布的配合每小格細菌數(shù)(X)Poisson分布的應用計算過程:求出樣本均數(shù)以代替μ,按照泊松分布的概率公式求出X=0,1,2,3,4時的概率P(X)。本例μ=1.5234,代入公式得:

P(0)=e-μμx/x!=e-1.5234(1.5234)0/0!=0.2180P(1)=e-1.5234(1.5234)1/1!=0.3321P(2)=e-1.5234(1.5234)2/2!=0.2529P(3)=e-1.5234(1.5234)3/3!=0.1284P(3)=e-1.5234(1.5234)4/4!=0.0489Poisson分布的應用計算過程:也可按下面的遞推公式計算:也可按下面的遞推公式計算:

驗算:P(0)+P(1)+P(2)+……+P(n)=1

本例:0.2180+0.3321+0.2529+0.1284+0.0489=0.9803

以各組的概率P(X)乘以n即為X=0,1,2,3,4按泊松分布的理論頻數(shù)。

將理論頻數(shù)與實際頻數(shù)比較(χ2-test),判

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論