第六章 幾種離散型變量的分布及其應用課件_第1頁
第六章 幾種離散型變量的分布及其應用課件_第2頁
第六章 幾種離散型變量的分布及其應用課件_第3頁
第六章 幾種離散型變量的分布及其應用課件_第4頁
第六章 幾種離散型變量的分布及其應用課件_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第六章

幾種離散型變量的分布及其應用DistributionandApplicationofDiscreteData第六章幾種離散型變量的分布及其應用BinomialdistributionPoissindistributionContent第六章幾種離散型變量的分布及其應用

隨機變量有連續(xù)型和離散型之分,相應的概率分布就可分為連續(xù)型分布和離散型分布。有關連續(xù)型分布如正態(tài)分布、t分布和F分布等在前面的章節(jié)中已作了介紹。本章主要介紹在醫(yī)學中較為常用的離散型分布,即二項分布、Poisson分布。第六章幾種離散型變量的分布及其應用第一節(jié)

二項分布

第六章幾種離散型變量的分布及其應用二項分布(binomialdistribution)是指在只會產(chǎn)生兩種可能結果如“陽性”或“陰性”之一的n次獨立重復試驗(常常稱為n重Bernoulli試驗)中,當每次試驗的“陽性”概率保持不變時,出現(xiàn)“陽性”的次數(shù)X=0,1,2,…,n的一種概率分布。

第六章幾種離散型變量的分布及其應用

在醫(yī)學中類似如這種n重Bernoulli試驗的情形較為常見。如用某種藥物治療某種疾病,其療效分為有效或無效;在動物的致死性試驗中,動物的死亡或生存;接觸某種病毒性疾病的傳播媒介后,感染或非感染等。

第六章幾種離散型變量的分布及其應用

若從陽性率(死亡率、感染率等)為π的總體中隨機抽取大小為n的樣本,則出現(xiàn)陽性數(shù)為X的概率分布即呈二項分布,記為X~B(n,π).第六章幾種離散型變量的分布及其應用二項分布有兩個參數(shù):總體率樣本含量記作:X~B(n,π)

第六章幾種離散型變量的分布及其應用在n個獨立的個體中出現(xiàn)X個陽性的概率可由下式求出:

第六章幾種離散型變量的分布及其應用例6-1某種藥物治療某種非傳染性疾病的有效率為0.70。今用該藥治療該疾病患者10人,試分別計算這10人中有6人、7人、8人有效的概率。本例n=10,π=0.70,X=6,7,8。按公式(6-1)計算相應的概率為

0.20012第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用一、二項分布的適用條件和性質(zhì)(一)二項分布的適用條件1.每次試驗只會發(fā)生兩種對立的可能結果之一,即分別發(fā)生兩種結果的概率之和恒等于1;2.每次試驗產(chǎn)生某種結果(如“陽性”)的概率π固定不變;3.重復試驗是相互獨立的,即任何一次試驗結果的出現(xiàn)不會影響其它試驗結果出現(xiàn)的概率。第六章幾種離散型變量的分布及其應用

在上面的例6-1中,對這10名非傳染性疾病患者的治療,可看作10次獨立的重復試驗,其療效分為有效與無效,且每一名患者治療有效的概率(π=0.70)是恒定的。這樣,10人中發(fā)生有效的人數(shù)X~B(10,0.70)。第六章幾種離散型變量的分布及其應用(二)二項分布的性質(zhì)1.二項分布的均數(shù)與標準差在n次獨立重復試驗中,出現(xiàn)“陽性”次數(shù)X的總體均數(shù)為總體方差為總體標準差為

第六章幾種離散型變量的分布及其應用若以率表示,則樣本率p的總體均數(shù)為總體方差為總體標準差為

第六章幾種離散型變量的分布及其應用樣本率的標準差也稱為率的標準誤,可用來描述樣本率的抽樣誤差,率的標準誤越小,則率的抽樣誤差就越小。在一般情形下,總體率π往往并不知道。此時若用樣本資料計算樣本率p=X/n作為π的估計值,則的估計為:第六章幾種離散型變量的分布及其應用2.二項分布的圖形

對于二項分布而言,當π=0.5時,分布是對稱的,見圖6-1;

第六章幾種離散型變量的分布及其應用當0.5時,分布是偏態(tài)的,但隨著n的增大,分布趨于對稱。當n時,只要π不太靠近0或1,二項分布則接近正態(tài)分布,見圖6-2。第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用二、二項分布的應用(一)總體率的區(qū)間估計1.查表法2.正態(tài)近似法第六章幾種離散型變量的分布及其應用1.查表法

對于n50的小樣本資料,直接查附表6百分率的95%或99%可信區(qū)間表,即可得到其總體率的可信區(qū)間。例6-2在對13名輸卵管結扎的育齡婦女經(jīng)壺腹部-壺腹部吻合術后,觀察其受孕情況,發(fā)現(xiàn)有6人受孕,據(jù)此資料估計該吻合術婦女受孕率的95%可信區(qū)間。第六章幾種離散型變量的分布及其應用

本例n=13,X=6。查附表6,取0.05時,在n=13(橫行)與X=6(縱列)的交叉處數(shù)值為19~75,即該吻合術婦女受孕率的95%可信區(qū)間為(19%,75%)。附表6只列出

的部分。當時,可先按“陰性”數(shù)n-X查得總體陰性率的可信區(qū)間QL~QU,再用下面的公式轉換成所需的陽性率的可信區(qū)間。

PL=1-QU,PU=1-QL

第六章幾種離散型變量的分布及其應用2.正態(tài)近似法

根據(jù)數(shù)理統(tǒng)計學的中心極限定理可得,當n較大、π不接近0也不接近1時,二項分布B(n,π)近似正態(tài)分布,而相應的樣本率p的分布也近似正態(tài)分布。為此,當n較大、p和1-p均不太小,如np和n(1-p)均大于5時,可利用樣本率p的分布近似正態(tài)分布來估計總體率的可信區(qū)間。

第六章幾種離散型變量的分布及其應用

的可信區(qū)間為:如:的95%可信區(qū)間為的99%可信區(qū)間為第六章幾種離散型變量的分布及其應用例6-3在觀測一種藥物對某種非傳染性疾病的治療效果時,用該藥治療了此種非傳染性疾病患者100人,發(fā)現(xiàn)55人有效,試據(jù)此估計該藥物治療有效率的95%可信區(qū)間。第六章幾種離散型變量的分布及其應用(二)樣本率與總體率的比較1.直接法

在諸如療效評價中,利用二項分布直接計算有關概率,對樣本率與總體率的差異進行有無統(tǒng)計學意義的比較。比較時,經(jīng)常遇到單側檢驗,即“優(yōu)”或“劣”的問題。那么,在總體陽性率為π的n次獨立重復試驗中,下面兩種情形的概率計算是不可少的。第六章幾種離散型變量的分布及其應用(1)出現(xiàn)“陽性”的次數(shù)至多為k次的概率為:(2)出現(xiàn)“陽性”的次數(shù)至少為k次的概率為第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用例6-4據(jù)報道,對輸卵管結扎了的育齡婦女實施壺腹部-壺腹部吻合術后,受孕率為0.55。今對10名輸卵管結扎了的育齡婦女實施峽部-峽部吻合術,結果有9人受孕。問實施峽部-峽部吻合術婦女的受孕率是否高于壺腹部-壺腹部吻合術?顯然,這是單側檢驗的問題,其假設檢驗為H0:π=0.55H1:π>0.55=0.05第六章幾種離散型變量的分布及其應用對這10名實施峽部-峽部吻合術的婦女,按0.55的受孕率,若出現(xiàn)至少9人受孕的概率大于0.05,則不拒絕H0;否則,拒絕H0,接受H1。本例n=10,π=0.55,k=9。按公式(6-12)有:第六章幾種離散型變量的分布及其應用

按=0.05水準,拒絕H0,接受H1,即認為實施峽部-峽部吻合術婦女的受孕率要高于壺腹部-壺腹部吻合術。第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用2.正態(tài)近似法

當n較大、p和1-p均不太小,如np和n(1-p)均大于5時,利用樣本率的分布近似正態(tài)分布的原理,可作樣本率p與已知總體率π0的比較。檢驗統(tǒng)計量u值的計算公式為:

第六章幾種離散型變量的分布及其應用例6-6對某疾病采用常規(guī)治療,其治愈率為45%?,F(xiàn)改用新的治療方法,并隨機抽取180名該疾病患者進行了新療法的治療,治愈117人。問新治療方法是否比常規(guī)療法的效果好?本例是單側檢驗,記新治療方法的治愈率為π,而π0=0.45。其假設檢驗為H0:π=0.45H1:π>0.45=0.05第六章幾種離散型變量的分布及其應用本例n=180,p=117/180=0.65查u界值表(t界值表中為∞的一行)得單側。按а=0.05水準,拒絕H0,接受H1,即新的治療方法比常規(guī)療法的效果好。第六章幾種離散型變量的分布及其應用(三)兩樣本率的比較兩樣本率的比較,目的在于對相應的兩總體率進行統(tǒng)計推斷。設兩樣本率分別為p1和p2,當n1與n2均較大,且p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1)及n2p2、n2(1-p2)均大于5時,可利用樣本率的分布近似正態(tài)分布,以及獨立的兩個正態(tài)變量之差也服從正態(tài)分布的性質(zhì),采用正態(tài)近似法對兩總體率作統(tǒng)計推斷。

第六章幾種離散型變量的分布及其應用檢驗統(tǒng)計量u的計算公式為:

第六章幾種離散型變量的分布及其應用例6-7為研究某職業(yè)人群頸椎病發(fā)病的性別差異,今隨機抽查了該職業(yè)人群男性120人和女性110人,發(fā)現(xiàn)男性中有36人患有頸椎病,女性中有22人患有頸椎病。試作統(tǒng)計推斷。記該職業(yè)人群頸椎病的患病率男性為π1,女性為π2,其檢驗假設為H0:π1=π2H1:π1≠π2

=0.05第六章幾種離散型變量的分布及其應用本例n1=120,X1=36,p1=X1/n1=36/120=0.30;n2=110,X2=22,p2=X2/n2=22/110=0.20查u界值表得0.05<P<0.10。按=0.05水準,不拒絕H0,即尚不能認為該職業(yè)人群頸椎病的發(fā)病有性別差異。第六章幾種離散型變量的分布及其應用(四)研究非遺傳性疾病的家族集聚性非遺傳性疾病的家族集聚性(clusteringinfamilies),系指該種疾病的發(fā)生在家族成員間是否有傳染性?如果沒有傳染性,即該種疾病無家族集聚性,家族成員患病應是獨立的。此時以家族為樣本,在n個成員中,出現(xiàn)X個成員患病的概率分布呈二項分布;否則,便不服從二項分布。第六章幾種離散型變量的分布及其應用例6-8某研究者為研究某種非遺傳性疾病的家族集聚性,對一社區(qū)82戶3口人的家庭進行了該種疾病患病情況調(diào)查,所得數(shù)據(jù)資料見表6-1中的第(1)、(2)欄。試分析其家族集聚性。第六章幾種離散型變量的分布及其應用

表6-1患病數(shù)據(jù)資料與二項分布擬合優(yōu)度的2c檢驗

X

(1)

實際戶數(shù)A

(2)

概率P(X)

(3)

理論戶數(shù)T=82P(X)

(4)

AT-

(5)

2)(AT-

(6)

TAT2)(-(7)

0

26

0.13265

10.8774

-15.1226

228.6936

21.0247

1

10

0.38235

31.3525

21.3525

455.9273

14.5420

2

28

0.36735

30.1229

2.1229

4.5069

0.1496

3

18

0.11765

9.6472

-8.3528

69.7690

7.2320

合計

82

82.0000

42.9483

第六章幾種離散型變量的分布及其應用如果該社區(qū)的此種疾病存在家族集聚性,則以每戶3口人的家庭為樣本,在3個家庭成員中,出現(xiàn)X(=0,1,2,3)個成員患病的概率分布即不服從二項分布。為此,可作如下假設檢驗。H0:該疾病的發(fā)生無家族集聚性H1:該疾病的發(fā)生有家族集聚性

=0.10第六章幾種離散型變量的分布及其應用本例調(diào)查的總人數(shù)為:N=82×3=246(人)其中患病人數(shù)為:D=0×26+1×10+2×28+3×18=120(人)以這246人的患病率估計總體的患病率,即π=D/N=120/246=0.49。

第六章幾種離散型變量的分布及其應用在n=3、π=0.49時,利用二項分布,求得X=0,1,2,3的概率P(X),并以此得到相應的理論戶數(shù)。對理論戶數(shù)與實際戶數(shù)進行擬合優(yōu)度(goodnessoffit)的檢驗。此時,自由度為=組數(shù)-2=4-2=2。計算結果列于表6-1中的第(3)至(7)欄。第六章幾種離散型變量的分布及其應用(五)群檢驗在工作中有時會遇到需對收集的一大批標本進行實驗室檢驗,以了解其陽性率的問題。但要在實驗室對所有標本一一作陽性認定往往需要大量的人力和物力,也不切實際,使用所謂的群檢驗技術即可解決這一問題。第六章幾種離散型變量的分布及其應用群檢驗的具體做法是,將N個標本分成n群,每群m個標本,即N=mn。每個群都送試驗室檢驗是否為陽性群。對于某群,一旦檢驗出陽性標本就停止此群中剩余標本的檢驗,該群即為陽性群。顯然,只有對陰性群,才需檢驗群中所有的m個標本,這樣可大大地減少檢驗標本的個數(shù)。

第六章幾種離散型變量的分布及其應用若記每個標本為陽性的概率為π,則1-π=Q是每個標本為陰性的概率,Qm便是某群m個標本均為陰性的概率,即一個群為陰性群的概率,而1-Qm就是一個群為陽性群的概率。假定受檢的n個群中有X個群是陽性群,用X/n作為一個群為陽性群概率的估計值,于是便有第六章幾種離散型變量的分布及其應用這樣,陽性概率π的估計值為:第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用第二節(jié)Poisson分布第六章幾種離散型變量的分布及其應用Poisson分布(Poissondistribution)作為二項分布的一種極限情況,已發(fā)展成為描述小概率事件發(fā)生規(guī)律性的一種重要分布。Poisson分布是描述單位面積、體積、時間、人群等內(nèi)稀有事件(或罕見事件)發(fā)生數(shù)的分布。第六章幾種離散型變量的分布及其應用

醫(yī)學上:諸如人群中遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病的發(fā)病或患病人數(shù)的分布,

單位時間內(nèi)(或單位空間、容積內(nèi))某罕見事件發(fā)生次數(shù)的分布,如分析在單位面積或容積內(nèi)細菌數(shù)的分布,在單位空間中某種昆蟲或野生動物數(shù)的分布等。

第六章幾種離散型變量的分布及其應用

所謂隨機變量X服從Poisson分布,是指在足夠多的n次獨立Bernoulli試驗中,取值X的概率為第六章幾種離散型變量的分布及其應用

一、Poisson分布的適用條件和性質(zhì)第六章幾種離散型變量的分布及其應用(二)Poisson分布的性質(zhì)1.總體均數(shù)與總體方差相等是Poisson分布的重要特征。2.當n很大,而π很小,且n/π=為常數(shù)時,二項分布近似Poisson分布。3.當增大時,Poisson分布漸近正態(tài)分布。一般而言,≥20時,Poisson分布資料可作為正態(tài)分布處理。第六章幾種離散型變量的分布及其應用4.Poisson分布具備可加性。即對于服從Poisson分布的m個互相獨立的隨機變量X1,X2,……,Xm,它們之和也服從Poisson分布,且其均數(shù)為這m個隨機變量的均數(shù)之和。第六章幾種離散型變量的分布及其應用(三)Poisson分布的圖形不同的參數(shù)對應不同的Poisson分布,即的大小決定了Poisson分布的圖形特征,見圖6-3。當越小,分布就越偏態(tài);當越大時,Poisson分布則越漸近正態(tài)分布。當≥1時,隨X取值的變大,P(X)值反而變?。划?lt;1時,隨X取值的變大,P(X)值先增大而后變小。如若是整數(shù),則P(X)在X=和X=-1位置取得最大值。

第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用二、Poisson分布的應用(一)總體均數(shù)的區(qū)間估計利用服從Poisson分布的樣本資料可估計其總體均數(shù)的可信區(qū)間。估計方法如下:1.

查表法

對于獲得的樣本計數(shù)X,當X≤50時,直接查附表7的Poisson分布可信區(qū)間表,即可得到其總體均數(shù)的95%或99%可信區(qū)間。第六章幾種離散型變量的分布及其應用

例6-10某工廠在環(huán)境監(jiān)測中,對一實施了技術改造的生產(chǎn)車間作空氣中粉塵濃度的檢測,1立升空氣中測得粉塵粒子數(shù)為21。假定車間空氣中的粉塵分布均勻,試估計該車間平均每立升空氣中所含粉塵顆粒數(shù)的95%和99%可信區(qū)間。本例,X=21,查查附表7,該車間平均每立升空氣所含粉塵顆粒數(shù)的95%可信區(qū)間為13.0~32.0;99%可信區(qū)間為11.0~35.9。第六章幾種離散型變量的分布及其應用2.正態(tài)近似法

當X>50時,可采用正態(tài)近似法估計總體均數(shù)的可信區(qū)間,計算公式為:如:的95%可信區(qū)間為第六章幾種離散型變量的分布及其應用例6-11某研究者對某社區(qū)12000名居民進行了健康檢查,發(fā)現(xiàn)其中有68名胃癌患者。估計該社區(qū)胃癌患病數(shù)的95%和99%可信區(qū)間。第六章幾種離散型變量的分布及其應用(二)樣本均數(shù)與總體均數(shù)的比較對于Poisson分布資料而言,進行樣本均數(shù)與總體均數(shù)的比較有兩種方法。1.直接法

當總體均數(shù)<20時,可采用直接計算概率的方式對樣本均數(shù)與已知總體均數(shù)間的差別進行有無統(tǒng)計學意義的比較,這實質(zhì)上是對以樣本計數(shù)X為代表的總體率π與已知的總體率π0是否有差別進行推斷。第六章幾種離散型變量的分布及其應用例6-12一般人群先天性心臟病的發(fā)病率為8‰,某研究者為探討母親吸煙是否會增大其小孩的先天性心臟病的發(fā)病危險,對一群20~25歲有吸煙嗜好的孕婦進行了生育觀察,在她們生育的120名小孩中,經(jīng)篩查有4人患了先天性心臟病。試作統(tǒng)計推斷。

第六章幾種離散型變量的分布及其應用對于這樣一種低發(fā)病率的樣本計數(shù)資料可看作服從Poisson分布。在120名被調(diào)查的小孩中,按π0=0.008的發(fā)病水平,若有4名及以上的小孩患先天性心臟病的概率大于0.05,則尚不能認為母親吸煙會增大其小孩的先天性心臟病的發(fā)病危險;否則,即說明母親吸煙會增大其小孩的先天性心臟病的發(fā)病危險。為此,本例可作如下的假設檢驗。第六章幾種離散型變量的分布及其應用第六章幾種離散型變量的分布及其應用2.正態(tài)近似法

根據(jù)Poisson分布的性質(zhì),當l320時,可用正

態(tài)分布來近似。樣本計數(shù)X與已知總體均數(shù)l的比較,采用下式計算標準正態(tài)檢驗統(tǒng)計量

第六章幾種離散型變量的分布及其應用例6-13有研究表明,一般人群精神發(fā)育不全的發(fā)生率為3‰,今調(diào)查了有親緣血統(tǒng)婚配關系的后代25000人,發(fā)現(xiàn)123人精神發(fā)育不全,問有親緣血統(tǒng)婚配關系的后代其精神發(fā)育不全的發(fā)生率是否要高于一般人群?可以認為人群中精神發(fā)育不全的發(fā)生數(shù)服從Poisson分布。本例n=25000,X=123,π0=0.003,=nπ0=2500

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論