浙江大學(xué)統(tǒng)計(jì)學(xué)第七講二項(xiàng)分布與泊松分布_第1頁(yè)
浙江大學(xué)統(tǒng)計(jì)學(xué)第七講二項(xiàng)分布與泊松分布_第2頁(yè)
浙江大學(xué)統(tǒng)計(jì)學(xué)第七講二項(xiàng)分布與泊松分布_第3頁(yè)
浙江大學(xué)統(tǒng)計(jì)學(xué)第七講二項(xiàng)分布與泊松分布_第4頁(yè)
浙江大學(xué)統(tǒng)計(jì)學(xué)第七講二項(xiàng)分布與泊松分布_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章二項(xiàng)分布與泊松分布

二項(xiàng)分布、泊松〔Poisson〕分布和正態(tài)分布是統(tǒng)計(jì)學(xué)中三種重要的分布。正態(tài)分布在第二章介紹過,本章將介紹另兩種分布。第一節(jié)二項(xiàng)分布的概念一、Bernoulli試驗(yàn)在醫(yī)學(xué)衛(wèi)生領(lǐng)域中的許多試驗(yàn)〔或觀察〕中人們感興趣的是某事件是否發(fā)生。例如,用白鼠作某藥物的毒性試驗(yàn),感興趣的是白鼠是否死亡;某新療法臨床試驗(yàn),感興趣的是患者是否治愈;某指標(biāo)的化驗(yàn),感興趣的是其結(jié)果是否呈陽(yáng)性。假設(shè)稱感興趣的事件A出現(xiàn)為“成功〞,不出現(xiàn)為“失敗〞,相應(yīng)的這類試驗(yàn)就稱為“成一敗型〞試驗(yàn)或稱為Bernoulli試驗(yàn)。二、Bernoulli試驗(yàn)序列滿足以下三個(gè)條件的n次試驗(yàn)構(gòu)成的序列被稱為是Bernoulli試驗(yàn)序列?!?〕每次試驗(yàn)結(jié)果,只能是兩個(gè)互斥的結(jié)果之一〔A或非A〕。〔2〕每次試驗(yàn)的條件不變。即每次試驗(yàn)中,結(jié)果A發(fā)生的概率不變,均為π。〔3〕各次試驗(yàn)獨(dú)立。即一次試驗(yàn)出現(xiàn)什么樣的結(jié)果與前面已出現(xiàn)的結(jié)果無關(guān)。例如,用小白鼠作一定劑量某種毒物的毒性試驗(yàn)。因?yàn)槊看卧囼?yàn)即每只白鼠用藥后的結(jié)果是死或活兩個(gè)互斥結(jié)果之一,所以滿足Bernoulli試驗(yàn)序列條件〔1〕。所謂的每次試驗(yàn)條件不變,即要求實(shí)驗(yàn)用白鼠用此劑量毒藥后發(fā)生死亡的概率相同。假設(shè)體重、種屬、性別影響用藥結(jié)果,而實(shí)驗(yàn)用白鼠性別不同〔或種屬不同,或體重相差較大〕,那么各白鼠的死亡概率不同,也就不滿足第〔2〕個(gè)條件。為滿足條件〔2〕,實(shí)驗(yàn)用鼠必須是同種屬、同性別且體重相近的白鼠。各次試驗(yàn)獨(dú)立,是指一只鼠的死與活不受其他鼠的死與活的影響,這是容易滿足的。故只要我們能控制實(shí)驗(yàn)用的n只白鼠在用同劑量毒物后發(fā)生死亡的概率相同,這n只鼠的毒性試驗(yàn)就構(gòu)成一個(gè)n次Bernoulli試驗(yàn)序列。三、成功次數(shù)的概率分布一二項(xiàng)分布例7-l設(shè)實(shí)驗(yàn)用白鼠共3只,且它們有相同死亡概率,記事件“白鼠用藥后死亡〞為A,相應(yīng)死亡概率為π。記事件“白鼠用藥后不死亡〞為,相應(yīng)不死亡概率為l-π。記經(jīng)試驗(yàn)后3只白鼠中死亡白鼠數(shù)為X,那么X的可能取值為0、1、2和3,取這些值的概率見表7-l。表7-13只白鼠各種試驗(yàn)結(jié)果及其發(fā)生概率死亡數(shù)存活數(shù)試驗(yàn)結(jié)果試驗(yàn)結(jié)果概率X取值概率X3-X甲乙丙03生生生(l-π)(l-π)(l-π)

12死生生π(l-π)(l-π)

生死生(l-π)

π(l-π)

生生死(l-π)(l-π)

π

21死死生π

π(l-π)

死生死π(l-π)

π

生死死(l-π)

π

π

30死死死π

π

π

一般地構(gòu)成Bernoulli試驗(yàn)序列的n次試驗(yàn)中事件A出現(xiàn)的次數(shù)X有概率分布為:其中k=0,l,…,n。由于是二項(xiàng)式[π·〔l-π〕]n〞展開式中的各項(xiàng),故稱此分布為二項(xiàng)分布。顯然對(duì)于不同的n,不同的π有不同的二項(xiàng)分布。n、π是二項(xiàng)分布的兩個(gè)參數(shù)。假設(shè)一個(gè)隨機(jī)變量X,它的可能取值是0,l,…,n,且相應(yīng)的取值概率為:P〔X=k〕=那么稱此隨機(jī)變量X服從以n、π為參數(shù)的二項(xiàng)分布,記為X~B〔n,π〕。醫(yī)學(xué)領(lǐng)域中存在許多服從二項(xiàng)分布的變量。例如,由某人群.中隨機(jī)抽取6人,只要6人中每人是否患某病不受其他人患該病與否的影響,那么6人中患某病的人數(shù)服從二項(xiàng)分布B〔6,π〕,其中π是該群體中此病的患病率。四、二項(xiàng)分布的概率計(jì)算例7-2如果例7-l中的π=0.4,那么3只白鼠中死亡白鼠數(shù)X服從以n=3、π=0.4的二項(xiàng)分布,即X~B〔3,0.4〕,據(jù)式〔7-l〕可算得X各取值的概率:

由公式〔7-l〕可得二項(xiàng)分布概率計(jì)算的遞推公式π

據(jù)此遞推公式可證明,當(dāng)nπ為整數(shù)時(shí),此二項(xiàng)分布在X=nπ處取最大值;當(dāng)nπ不是整數(shù)時(shí),相應(yīng)的二項(xiàng)分布在X=[nπ]或X=[nπ]+1處取最大值〔[nπ]表示nπ的取整函數(shù)〕。如本例在X=[nπ]=[3*0.4]=1處的概率最大。第二節(jié)二項(xiàng)分布的性質(zhì)一、二項(xiàng)分布的均數(shù)與方差假設(shè)X~B〔n,π〕,那么X的均數(shù)μx=nπ〔7-2〕X的方差X的標(biāo)準(zhǔn)差例7-3例7-1中假設(shè)π=0.4,那么3只鼠中死亡鼠數(shù)X的總體均數(shù)μx=3×0.4=1.2總體方差=3×0.4×0.6=0.72總體標(biāo)準(zhǔn)差二、二項(xiàng)分布的正態(tài)近似假設(shè)n與π,那么按公式〔7-1〕可計(jì)算不同X取值時(shí)的概率,然后以X為橫軸,取值概率P為縱軸,可繪制出二項(xiàng)分布的圖形〔如圖7-la、b、c、d〕??梢园l(fā)現(xiàn)二項(xiàng)分布圖的形狀取決于n、π的取值。當(dāng)π=0.5時(shí),圖形對(duì)稱;當(dāng)π≠5時(shí),圖形呈偏態(tài),但隨n的增大,圖形逐漸對(duì)稱。利用數(shù)理統(tǒng)計(jì)中的中心極限定理可得,當(dāng)n較大、π不接近0也不接近1時(shí),二項(xiàng)分布B〔n,π〕近似正態(tài)分布N〔nπ,〕。正態(tài)分布是許多統(tǒng)計(jì)方法的應(yīng)用根底,二項(xiàng)分布的正態(tài)近似拓寬了二項(xiàng)分布的應(yīng)用范圍。三、樣本率的正態(tài)近似一般地,從一個(gè)陽(yáng)性率為π的總體中,隨機(jī)抽取含量為n的樣本,那么樣本中的陽(yáng)性數(shù)X服從二項(xiàng)分布B〔n,π〕,X有概率分布:

從而樣本陽(yáng)性率P有概率分布:注意,樣本陽(yáng)性率的分布與陽(yáng)性數(shù)的分布雖有相同的取值概率但取值范圍是不同的。樣本率P的總體均數(shù)樣本率P的總體標(biāo)準(zhǔn)差X的概率分布陽(yáng)性數(shù)X的取值01…N概率P(X)…樣本陽(yáng)性率P的概率分布樣本率P的取值0/n1/n…n/n概率P…例7-4從陽(yáng)性率π為0.7的總體中,隨機(jī)抽取含量為3的樣本,那么樣本陽(yáng)性率P的總體均數(shù),即設(shè)想由此總體中抽取無數(shù)個(gè)含量為3的樣本,由這無數(shù)個(gè)樣本算得的樣本率的均數(shù)μp=0.7,標(biāo)準(zhǔn)差:

象樣本均數(shù)的標(biāo)準(zhǔn)差被稱為均數(shù)的標(biāo)準(zhǔn)誤一樣,樣本率的標(biāo)準(zhǔn)差被稱為率的標(biāo)準(zhǔn)誤,它描述樣本率分布的離散程度,因?yàn)闃颖韭实木鶖?shù)為總體率π,故樣本率的標(biāo)準(zhǔn)差,也就是率的標(biāo)準(zhǔn)誤的大小描述了樣本率相對(duì)于總體率分布的離散程度,當(dāng)樣本含量n較大,總體陽(yáng)性率π不接近0也不接近1時(shí),樣本中的陽(yáng)性數(shù)近似正態(tài)分布N〔π,〕,從而樣本陽(yáng)性率也近似正態(tài)分布N〔π,σP〕,故95%的樣本率滿足:|P-π|≤1.96σP即當(dāng)n較大,π不接近0也不接近1時(shí),對(duì)隨機(jī)抽取的一個(gè)樣本而言,95%可能樣本率與總體率間的誤差不超過1.96σP。所以,當(dāng)樣本率近似正態(tài)分布時(shí),率的標(biāo)準(zhǔn)誤可用來描述樣本率的抽樣誤差,率的標(biāo)準(zhǔn)誤越小,率的抽樣誤差越小。實(shí)際工作中總體率π一般是未知的,在率的標(biāo)準(zhǔn)誤計(jì)算公式〔7-6〕中以樣本率p代替總體率π,所得的統(tǒng)計(jì)量被稱為是率的標(biāo)準(zhǔn)誤的估計(jì),記為SP,其計(jì)算公式為:例7-5抽查某地居民300人的糞便,檢出蛔蟲陽(yáng)性60人,求SP

第三節(jié)二項(xiàng)分布的應(yīng)用

二項(xiàng)分布的應(yīng)用較廣,本節(jié)主要講述利用二項(xiàng)分布作統(tǒng)計(jì)推斷。一、總體率的區(qū)間估計(jì)當(dāng)想利用隨機(jī)抽取的一個(gè)樣本估計(jì)總體率時(shí),可用樣本率作為總體率的點(diǎn)估計(jì),也可根據(jù)樣本提供的信息尋找達(dá)一定可信度的區(qū)間來估計(jì)總體率,這個(gè)區(qū)間就是總體率的可信區(qū)間。求總體率的可信區(qū)間一般有兩種方法:〔一〕查表法總體率的可信區(qū)間可據(jù)二項(xiàng)分布的理論求得,但計(jì)算很煩,為方便后人的使用,統(tǒng)計(jì)學(xué)家編制了據(jù)樣本容量n與樣本中陽(yáng)性例數(shù)X的大小查總體率95%和99%可信區(qū)間的表格〔附表7〕。當(dāng)n≤50時(shí)可查表求總體率的95%或99%可信區(qū)間。〔二〕正態(tài)近似法當(dāng)n較大,p和1-p均不太小〔如np與n〔1-p〕均大于5〕時(shí),因?yàn)闃颖韭蕄近似正態(tài)分布,所以可利用正態(tài)分布的理論求總體率的1-α可信區(qū)間如下:〔p-uαSα,p+uαSα〕〔7-8〕式中:uα為標(biāo)準(zhǔn)正態(tài)分布α水平雙側(cè)臨界值,如α=0.05時(shí),uα=1.96;α=0.01時(shí),uα=2.58。當(dāng)n很大p或l-p很小時(shí),也可利用后面將介紹的Poisson分布求總體率的可信區(qū)間。查表法和正態(tài)近似法求總體率可信區(qū)間的實(shí)例見第四章第五節(jié)。二、樣本率與總體率的比較例7-6據(jù)以往經(jīng)驗(yàn)新生兒染色體異常率為0.01,某研究者想了解當(dāng)?shù)匦律鷥喝旧w異常是否低于一般,他隨機(jī)抽查當(dāng)?shù)?00名新生兒,結(jié)果1名染色體異常,請(qǐng)作統(tǒng)計(jì)推斷。分析:①因?yàn)檠芯磕康闹婚g當(dāng)?shù)匦律鷥喝旧w異常率是否低于一般,故這是個(gè)單側(cè)檢驗(yàn)問題。設(shè)當(dāng)?shù)匦律鷥喝旧w異常π不低于一般,即假設(shè)H0:π≥0.01,相應(yīng)的備擇假設(shè)為H1:π<0.01。②可以證明此問題可簡(jiǎn)化為檢驗(yàn)“無效假設(shè)H0:π=0.01,相對(duì)于備擇假設(shè)H1:π<0.01〞的假設(shè)檢驗(yàn)問題。③按π=0.01,那么隨機(jī)抽查400名新生兒中,染色體異常人數(shù)X服從二項(xiàng)分布B〔400,0.01〕。據(jù)二項(xiàng)分布的概率計(jì)算公式,可算得事件“X≤1〞的概率。P〔X≤1〕=P〔X=0〕+P〔X=l〕假設(shè)P〔X≤1〕很小,那么按“小概率事件在一次試驗(yàn)中幾乎不發(fā)生〞的實(shí)際推斷原那么,隨機(jī)一次試驗(yàn)中不應(yīng)發(fā)生事件“X≤l〞。故假設(shè)P〔X≤1〕很小,且實(shí)際發(fā)生了事件“X≤1〞,那么可拒絕π=0.01的假設(shè)。假設(shè)P〔X≤l〕不很小,而實(shí)際發(fā)生了事件“X≤l〞,那么無理由拒絕π=0.01的假設(shè)。H0:π=0.01,H1:π<0.01,α=0.05P〔X≤1〕=P〔X=0〕+P〔X=1〕=0.0180+0.0725=0.0905因?yàn)镻〔X≤1〕=0.0905>α,故無理由拒絕H0,即據(jù)此樣本不能說該地新生兒染色體異常率低于一般新生兒。值得注意的是,本例研究目的“某研究者想了解當(dāng)?shù)匦律鷥喝旧w異常是否低于一般〞是在他隨機(jī)抽查之前確定的,他的抽查結(jié)果可能是高于一般,也可能低于一般。不管抽查的結(jié)果如何,這個(gè)單側(cè)檢驗(yàn)的P值總等于P〔X≤他實(shí)際上抽到的染色體異常人數(shù)〕。假設(shè)此研究者在抽樣之前確定他想了解當(dāng)?shù)匦律鷥喝旧w異常是否高于一般,不管抽查的結(jié)果如何,這個(gè)單側(cè)檢驗(yàn)的P值總等于P〔X≥他實(shí)際上抽到的染色體異常人數(shù)〕。假設(shè)研究者在抽樣前并沒有明確想了解當(dāng)?shù)匦律鷥喝旧w異常是否高于〔或低于一般〕,只是想了解與一般是否相同,但當(dāng)他看到抽樣結(jié)果是400名新生兒1名染色體異常〔1/400低于0.01〕時(shí),才提出問題“當(dāng)?shù)匦律鷥喝旧w異常是否低于一般?〞,對(duì)于這種先有抽樣結(jié)果才提出研究目的的問題,即使所提的問題形式上也像單側(cè)檢驗(yàn)問題,但也只能作雙側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)問題中的P值等于實(shí)際樣本出現(xiàn)的概率及更極端事件〔即更背離無效假設(shè)的事件〕的概率之和。例7-6假設(shè)修改為:據(jù)以往經(jīng)驗(yàn)新生兒染色體異常率為0.01。某研究者隨機(jī)抽查當(dāng)?shù)?00名新生兒,結(jié)果1名染色體異常,問當(dāng)?shù)匦律鷥喝旧w異常是否低于一般,請(qǐng)作統(tǒng)計(jì)推斷。分析:實(shí)際上樣本陽(yáng)性數(shù)X=l,比實(shí)際上樣本更極端點(diǎn)是指滿足P〔X=i〕≤P〔X=l〕的i。滿足P〔X=i〕≤P〔X=l〕的i為:l、0、7、8、…、400。故P=P〔X≤l〕+P〔X≥7〕。H0:π=0.01,H1:π≠0.01,α=0.05P=P〔X≤1〕+P〔X≥7〕=0.0905+0.1096=0.2001>0.05,故無理由拒絕H0,不能認(rèn)為該地新生兒染色體異常不同于一般。三、兩樣本率的比較根據(jù)二項(xiàng)分布近似正態(tài)分布的原理,當(dāng)n較大,p與〔l-p〕均不太小時(shí),樣本率的分布近似正態(tài)。再根據(jù)獨(dú)立的兩個(gè)正態(tài)分布變量的差還服從正態(tài)分布的性質(zhì),當(dāng)兩個(gè)樣本的含量n1與n2較大,且p1,〔1-p1〕,p2,〔1-p2〕均不太小,例如n1p1、n1〔1-p1〕、n2p2、n2〔1-p2〕均大于5時(shí),可用以下介紹的u檢驗(yàn),由兩個(gè)樣本對(duì)相應(yīng)的兩個(gè)總體率作出統(tǒng)計(jì)推斷。統(tǒng)計(jì)量u的計(jì)算公式為

其中,X1與X2為兩樣本的陽(yáng)性例數(shù)例7-7為研究A、B兩地學(xué)生的肺吸蟲感染率是否相同,某研究者隨機(jī)抽取80名A地學(xué)生和85名B地學(xué)生,查得感染人數(shù)A地23,B地13。請(qǐng)作統(tǒng)計(jì)推斷。本例n1=80,n1p1=23,n1〔1-p1〕=57;n2=85,n2p2=13,n2〔1-p2〕=72,可認(rèn)為兩地學(xué)生的肺吸蟲感染樣本率近似正態(tài)分布,故可用u檢驗(yàn)。

記A地學(xué)生肺吸蟲感染率為π1;B地學(xué)生肺吸蟲感染率為π2。H0:π1=π2,H1:π1≠π2

因?yàn)閡0.05=1.96,本例u=2.0915>u0.05,故P<0.05,拒絕H0,即據(jù)這兩個(gè)樣本資料可認(rèn)為A、B兩地學(xué)生肺吸蟲感染率不同。第四節(jié)泊松分布的概念

一、泊松分布一個(gè)分布規(guī)定了隨機(jī)變量的取值范圍和相應(yīng)取值概率。第一節(jié)介紹X服從二項(xiàng)分布,是指X的取值范圍為0,1,…,n;其相應(yīng)取值概率為:P〔X=x〕=,X~B〔n,π〕。本節(jié)將介紹泊松〔Poisson〕分布。所謂隨機(jī)變量X服從Poisson分布,是指X取值范圍為0,l,…;其相應(yīng)取值概率為

式中e為自然對(duì)數(shù)的底,μ是大于0的常數(shù),被稱為Poisson分布的參數(shù)。X服從以μ為參數(shù)的Poisson分布可記為X~P〔μ〕Poisson分布主要用于描述在單位時(shí)間〔空間〕中稀有事件的發(fā)生數(shù)。醫(yī)學(xué)衛(wèi)生領(lǐng)域中有些指標(biāo)服從Poisson分布,例如:放射性物質(zhì)在單位時(shí)間內(nèi)的放射次數(shù);在單位容積充分搖勻的水中的細(xì)菌數(shù);野外單位空間中的某種昆蟲數(shù)等。二、泊松分布的概率計(jì)算據(jù)Poisson分布概率計(jì)算公式可推得其概率計(jì)算的遞推公式:

據(jù)此遞推公式可證明,當(dāng)μ為整數(shù)時(shí),此Poisson分布在X=μ處取最大值;當(dāng)μ不是整數(shù)時(shí),相應(yīng)的Poisson分布在X=[μ]處取最大值〔[μ]表示μ的取整函數(shù)〕。例7-8假設(shè)隨機(jī)變量X服從以3.6為均數(shù)的泊松分布,即X~P〔3.6〕,那么X的取值概率可計(jì)算如下:P〔X=0〕=exp〔-3.6〕=0.0273P〔X=1〕=〔3.6/l〕P〔X=0〕=0.0984P〔X=2〕=〔3.6/2〕P〔X=l〕=0.1771P〔X=3〕=〔3.6/3〕P〔X=2〕=0.2125P〔X=4〕=〔3.6/4〕P〔X=3〕=0.1912第五節(jié)泊松分布的性質(zhì)一、Poisson分布的均數(shù)與方差由Poisson分布計(jì)算概率公式〔7-11〕式可見Poisson分布只有一個(gè)參數(shù)μ。這個(gè)參數(shù)就是Poisson分布的總體均數(shù)。不同的μ對(duì)應(yīng)于不同的Poisson分布。

例7-9設(shè)甲地某河中,平均每毫升河水中有6個(gè)細(xì)菌,那么由該河中隨機(jī)抽取1毫升水中的細(xì)菌數(shù)X服從以μ=6為參數(shù)的Poisson分布。

假設(shè)在該河中隨機(jī)抽取無數(shù)個(gè)1毫升水,顯然各1毫升水中的細(xì)菌數(shù)X各不相同,且在抽水樣前無法預(yù)測(cè)這X確實(shí)切數(shù)值,即X是隨機(jī)變量。此X的總體均數(shù)即Poisson分布的參數(shù)p,而且此X的總體方差也等于此參數(shù)μ??傮w均數(shù)等于總體方差是Poisson分布的特性。 二、Poisson分布的可加性如果X1,X2,…,Xk相互獨(dú)立,且它們分別服從以μ1,μ2,…,μk為參數(shù)的Poisson分布,那么T=X1+X2+…+Xk也服從Poisson分布,其參數(shù)為μ1+μ2+…+μk。例7-10設(shè)某放射性物質(zhì)平均每分鐘放射計(jì)數(shù)為4?,F(xiàn)考慮測(cè)3個(gè)1分鐘的放射計(jì)數(shù),分別記為X1,X2,X3。那么Xi~P〔4〕i=1,2,3。據(jù)Poisson分布的可加性可得X1+X2+X3~P〔12〕。三、Poisson分布的正態(tài)近似假設(shè)參數(shù)μ的取值,那么可按公式〔7-11〕計(jì)算不同X值時(shí)的概率,然后以X為橫軸,以取值概率P為縱軸,可繪制出Poisson分布的圖形〔如圖7-2〕??梢园l(fā)現(xiàn)隨μ的增大,Poisson分布的對(duì)稱性越來越好。由數(shù)理統(tǒng)計(jì)知識(shí)可得當(dāng)μ相當(dāng)大時(shí),Poisson分布近似正態(tài)分布N〔μ,〕。利用Poisson分布的正態(tài)近似性,可解決不少Poisson分布的統(tǒng)計(jì)推斷問題。四、二項(xiàng)分布的Poisson分布近似

設(shè)Xi-B〔niπi〕,那么當(dāng)ni→∞且niπi=C保持不變時(shí),可以證明Xi的極限分布是以C為參數(shù)的Poisson分布。由公式〔7-1〕可發(fā)現(xiàn)當(dāng)n很大時(shí),二項(xiàng)分布概率的計(jì)算相當(dāng)困難。利用二項(xiàng)分布的Poisson近似這一性質(zhì),當(dāng)n很大且π很小時(shí),可以用Poisson分布概率計(jì)算替代二項(xiàng)分布的概率計(jì)算。例7-1l設(shè)一般人群食管癌患病率為30/10萬(wàn),某研究者為了解當(dāng)?shù)厥彻馨┗疾÷适欠窀哂谝话闳巳?,隨機(jī)抽查當(dāng)?shù)?00人,結(jié)果6人患食管癌。請(qǐng)作統(tǒng)計(jì)推斷。H0:該地食管癌患病率與一般人群相同,即π=0.0003H1:該地食管癌患病率高于一般人群,即π>0.0003α=0.05因?yàn)楫?dāng)H0真時(shí)500人中患食管癌人數(shù)X~B〔500,0.0003〕,故可利用公式〔7-1〕計(jì)算P〔X≥6〕P〔X≥6〕=l-P〔X<6〕=l-P〔X=0〕+P〔X=l〕+P〔X=2〕+…+P〔X=5〕]=l-[++…+]此計(jì)算相當(dāng)繁。因?yàn)閚=500相當(dāng)大,且π=0.0003相當(dāng)小,所以X近似服從以μ=500×0.0003=0.15為參數(shù)的Poisson分布,故可近似計(jì)算如下:

P〔X≥6〕≈l-[+++++]=1-0.99999986086=0.000000013914因?yàn)镻〔X≥6〕<0.05,故拒絕H0,認(rèn)為該地人群食管癌患病率高于一般。五、服從Poisson分布的條件

本章第一節(jié)講到服從二項(xiàng)分布的三個(gè)條件:①每次試驗(yàn)只能是互斥的兩個(gè)結(jié)果之一,②每次試驗(yàn)的條件不變,③各次試驗(yàn)獨(dú)立。服從Poisson分布也有三個(gè)條件:①平穩(wěn)性X的取值與觀察單位的位置無關(guān),只與觀察單位的大小有關(guān)。②獨(dú)立增量性〔無后效性〕在某個(gè)觀察單位上X的取值與前面各觀察單位上X的取值獨(dú)立〔無關(guān)〕。③普通性在充分小的觀察單位上X的取值最多為1。滿足這三個(gè)條件的隨機(jī)變量X服從Poisson分布。第六節(jié)Poisson分布的應(yīng)用

一、Poisson總體均數(shù)的區(qū)間估計(jì)

象正態(tài)分布一樣,Poisson分布總體均數(shù)估計(jì)也有點(diǎn)估計(jì)與區(qū)間估計(jì)之分。Poisson分布也以樣本均數(shù)作為總體均數(shù)的點(diǎn)估計(jì)。其總體均數(shù)的區(qū)間估計(jì)一般有以下兩種求法。l.查表法Poisson總體均數(shù)可信區(qū)間可據(jù)Poisson分布的理論計(jì)算而得,但計(jì)算較復(fù)雜,為方便使用,也有統(tǒng)計(jì)學(xué)家編制了據(jù)樣本計(jì)數(shù)X查Poisson總體均數(shù)μ的95%和99%可信區(qū)間的表格〔附表8〕。當(dāng)X≤50時(shí),可以很方便地從附表8查得到總體均數(shù)的95%或99%可信區(qū)間。例7-12將一個(gè)面積為100cm2的培養(yǎng)皿置于某病室中,l小時(shí)后取出,培養(yǎng)24小時(shí),查得8個(gè)菌落,求該病室平均1小時(shí)100cm2細(xì)菌數(shù)的95%可信區(qū)間。本例X=8,查附表8樣本計(jì)數(shù)8的一行得p的95%可信區(qū)間下限為3.4,上限為15.8。故該病室平均1小時(shí)100cm2細(xì)菌數(shù)的95%可信區(qū)間為〔3.4,15.8〕。如果本例欲求該病室平均1小時(shí)50cm2細(xì)菌數(shù)的95%可信區(qū)間,那么因?yàn)樵摬∈?小時(shí)50cm2細(xì)菌數(shù)的總體均數(shù)為1小時(shí)100cm2細(xì)菌數(shù)的總體均數(shù)的一半,故只需將平均1小時(shí)100cm2細(xì)菌數(shù)95%可信區(qū)間的下、上限3.4和15.8各除以2即可得,故該病室平均1小時(shí)50cm2細(xì)菌數(shù)的95%可信區(qū)間為〔1.7,7.9〕。值得注意的是不能將樣本觀察值8除以2得4,然后查附表8中X=4這一行的95%可信區(qū)間的下限與上限。因?yàn)檠芯空咧怀槿×?小時(shí)100cm2的樣本計(jì)數(shù)X=8,而X是隨機(jī)變化的,因此不能由1小時(shí)100cm2的樣本計(jì)數(shù)X=8推出1小時(shí)50cm2的樣本計(jì)數(shù)為X=4。2.正態(tài)近似法當(dāng)樣本計(jì)數(shù)X>50時(shí),附表8上查不到相應(yīng)的可信區(qū)間,但此時(shí)可利用Poisson分布的正態(tài)近似性,計(jì)算其總體均數(shù)〔1-α〕可信區(qū)間如下:

式中X為樣本計(jì)數(shù);uα為標(biāo)準(zhǔn)正態(tài)分布α水平雙側(cè)臨界值。例7-13用計(jì)數(shù)器測(cè)得某放射性物質(zhì)半小時(shí)內(nèi)發(fā)出的脈沖數(shù)為360個(gè),試估計(jì)該放射性物質(zhì)平均每10分鐘脈沖計(jì)數(shù)。本例,樣本觀察單位不同于所要估計(jì)的總體均數(shù)的觀察單位,應(yīng)該注意:不能變動(dòng)樣本觀察單位??捎蒟=360,先按公式〔7-12〕計(jì)算得平均每半小時(shí)脈沖計(jì)數(shù)的95%可信區(qū)間再求平均每10分鐘脈沖計(jì)數(shù)的95%可信區(qū)間〔322.8/3,397.2/3〕=〔10.6,132.4〕,即估計(jì)該放射性物質(zhì)平均每30分鐘脈沖計(jì)數(shù)的在范圍107.6-132.4內(nèi)。二、Poisson分布樣本均數(shù)與總體均數(shù)的比較樣本均數(shù)與總體均數(shù)比較的目的是推斷此樣本所代表的未知總體均數(shù)μ是否等于〔大于或小于〕數(shù)μ0,常用的方法有兩種:〔一〕直接計(jì)算概率法

例7-14據(jù)以往大量觀察得某溶液中平均每毫升有細(xì)菌3個(gè)。某研究者想了解該溶液放在5℃冰箱中3天,溶液中細(xì)菌數(shù)是否會(huì)增長(zhǎng)。他采取已放在5℃冰箱中3天的該溶液1毫升,測(cè)得細(xì)菌5個(gè),請(qǐng)作統(tǒng)計(jì)推斷。本例無效假設(shè)為:設(shè)放置5℃冰箱中3天,溶液中的細(xì)菌數(shù)不會(huì)增長(zhǎng),即設(shè)平均每毫升放置5℃冰箱3天的溶液中的細(xì)菌數(shù)不超過3,即H0:μ≤3H1:μ>3α=0.05溶液中細(xì)菌數(shù)服從Poisson分布,故可利用Poisson分布直接計(jì)算概率:P〔X≥5〕=1-[P〔X=0〕+P〔X=1〕+…+P〔X=4〕]=1-[++++]=1-0.8153=0.1847

因?yàn)镻〔X≥5〕>α,故無理由拒絕H0,即不能認(rèn)為該溶液在5℃冰箱中放置3天,會(huì)引起溶液中細(xì)菌數(shù)增長(zhǎng)。注意:假設(shè)備擇假設(shè)H1:μ<數(shù)μ0。,那么直接計(jì)算概率P=〔K≤樣本計(jì)數(shù)〕;假設(shè)備擇假設(shè)H1:μ>數(shù)μ0,那么直接計(jì)算概率P=〔X≥樣本計(jì)數(shù)〕;假設(shè)備擇假設(shè)H1:μ≠數(shù)μ0,那么P值等于實(shí)際樣本出現(xiàn)的概率及更極端事件〔即更背離無效假設(shè)的事件〕的概率之和,即P=ΣP〔X=i〕,其中i滿足P〔X=i〕≤P〔X=樣本計(jì)數(shù)〕?!捕痴龖B(tài)近似法因?yàn)镻oisson分布當(dāng)總體均數(shù)相當(dāng)大時(shí)近似正態(tài)分布,故當(dāng)μ0相當(dāng)大時(shí),可用標(biāo)準(zhǔn)正態(tài)統(tǒng)計(jì)量u

檢驗(yàn)H0:μ=μ0是否成立。例7-15某溶液原來平均每毫升有細(xì)菌100個(gè),現(xiàn)欲研究某低劑量輻射能否殺菌。研究者以此低劑量輻射該溶液后取1毫升,培養(yǎng)得細(xì)菌40個(gè),請(qǐng)作統(tǒng)計(jì)推斷。H0:此低劑量輻射不能殺菌,即輻射后該溶液中平均每毫升細(xì)菌數(shù)μ=100H1:此低劑量輻射能殺菌,即μ<100

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論