第10章 二項分布和Poisson分布及其應(yīng)用_第1頁
第10章 二項分布和Poisson分布及其應(yīng)用_第2頁
第10章 二項分布和Poisson分布及其應(yīng)用_第3頁
第10章 二項分布和Poisson分布及其應(yīng)用_第4頁
第10章 二項分布和Poisson分布及其應(yīng)用_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、陳衛(wèi)中陳衛(wèi)中 副教授副教授公共衛(wèi)生系流行病與衛(wèi)生統(tǒng)計學(xué)教研室公共衛(wèi)生系流行病與衛(wèi)生統(tǒng)計學(xué)教研室20222022年年6 6月月2626日星期日日星期日 統(tǒng)計描述:用統(tǒng)計圖、表、指標(biāo)等描述變統(tǒng)計描述:用統(tǒng)計圖、表、指標(biāo)等描述變量在量在群體群體中的分布特征中的分布特征 統(tǒng)計推斷:在統(tǒng)計推斷:在抽樣研究抽樣研究中,在中,在概率概率基礎(chǔ)上,基礎(chǔ)上,用觀察得到的樣本信息推斷未知總體特征用觀察得到的樣本信息推斷未知總體特征 定性定性變量變量:變量值為:變量值為定性定性描述描述 按該變量的特征表現(xiàn)為若干窮盡,且互斥的按該變量的特征表現(xiàn)為若干窮盡,且互斥的類類別別分類變量分類變量 從群體角度出發(fā)從群體角度出發(fā),

2、考察考察該變量該變量各類別的觀察對各類別的觀察對象數(shù)象數(shù)計數(shù)計數(shù)變量變量 從群體的角度,從群體的角度,描述定性變量描述定性變量的的分布特征分布特征的指標(biāo)的指標(biāo) 絕對數(shù)絕對數(shù):群體中發(fā)生某群體中發(fā)生某事件事件(某類別某類別)的頻數(shù)的頻數(shù) 相對數(shù):率或構(gòu)成相對數(shù):率或構(gòu)成比比 抽樣研究中,亦為樣本統(tǒng)計量抽樣研究中,亦為樣本統(tǒng)計量 頻數(shù):數(shù)值頻數(shù):數(shù)值只能用自然數(shù)或整數(shù)單位表只能用自然數(shù)或整數(shù)單位表達(dá)達(dá)離散型變量離散型變量(discrete variable) 常見常見描述描述離散離散型型變量取值變量取值及其概率的分布及其概率的分布形式形式 0-1分布分布(0-1 distribution) 二項分

3、布二項分布(Binomial distribution) 泊松分布泊松分布(Poisson distribution) 超幾何分布超幾何分布(Hypergeometric distribution) 對對某化學(xué)制品的毒性進(jìn)行某化學(xué)制品的毒性進(jìn)行鑒定鑒定 設(shè)設(shè)某化學(xué)某化學(xué)制品對小鼠的致死率為制品對小鼠的致死率為60% 對對符合符合實驗要求的實驗要求的3只小只小鼠注射鼠注射規(guī)定劑量的該規(guī)定劑量的該化學(xué)化學(xué)制品制品 觀察指標(biāo):是否死亡,即死亡或未死亡觀察指標(biāo):是否死亡,即死亡或未死亡 計算計算在本次毒性試驗中在本次毒性試驗中2只小鼠死亡的概率只小鼠死亡的概率P(2) 該化學(xué)制品的毒性試驗該化學(xué)制品的

4、毒性試驗利用利用3只小鼠重復(fù)只小鼠重復(fù)試驗該化學(xué)制品的毒性試驗該化學(xué)制品的毒性 每次觀察每次觀察(每只小鼠每只小鼠)只有兩種可能結(jié)果只有兩種可能結(jié)果死亡死亡或未死亡或未死亡 每次觀察每次觀察(每只小鼠每只小鼠)死亡的死亡的概率概率P(死亡死亡)= ,且,且保持保持不變不變 每次觀察每次觀察(每只小鼠每只小鼠)結(jié)果間彼此保持結(jié)果間彼此保持獨立獨立 瑞士數(shù)學(xué)家瑞士數(shù)學(xué)家Jakob Bernoulli所發(fā)展所發(fā)展 每一次試驗只有兩個結(jié)果,一個記為每一次試驗只有兩個結(jié)果,一個記為“發(fā)生發(fā)生”,一個記為一個記為“未發(fā)生未發(fā)生”,P(發(fā)生發(fā)生)= ,P(未發(fā)未發(fā)生生)=1- 發(fā)生的發(fā)生的概率概率 在在每次

5、試驗中保持不變每次試驗中保持不變 各次試驗之間相互獨立各次試驗之間相互獨立Bernoulli distribution 一次一次Bernoulli試驗中,事件試驗中,事件的發(fā)生次數(shù)的發(fā)生次數(shù)Y取取值為值為0或或1 則則Y的概率分布形式的概率分布形式為:為: 稱稱Y服從服從參數(shù)參數(shù)為為 的的兩點分布,記作兩點分布,記作XB(1, )Y10P(Y) 1- 事件事件的發(fā)生的發(fā)生次數(shù)次數(shù)X的分布服從參數(shù)為的分布服從參數(shù)為n、 的的二項分布二項分布(binomial distribution),記作記作XB(n, ) 本本例:例:XB(3, 0.6)Y1 1 0 1 0 1 0 1n發(fā)生次數(shù)發(fā)生次數(shù) Y

6、 X 3只小鼠注射規(guī)定劑量的該化學(xué)制品,該化只小鼠注射規(guī)定劑量的該化學(xué)制品,該化學(xué)制品對小鼠的致死率為學(xué)制品對小鼠的致死率為60% “死亡數(shù)死亡數(shù)”X事先不能確定,事先不能確定,0, 1, 2, 3都有可能都有可能發(fā)生發(fā)生 在在n重伯努利試驗中,發(fā)生次數(shù)為變量重伯努利試驗中,發(fā)生次數(shù)為變量 記為記為X,X=0, 1, 2, , k, , n “死亡數(shù)死亡數(shù)”的發(fā)生概率的發(fā)生概率()( ),0,1,P XkP kkn可能的可能的死亡數(shù)死亡數(shù)排列方式排列方式甲甲 乙乙 丙丙每種每種排列概率排列概率每種每種組合概率組合概率0生生 生生 生生0.40.40.40.431死死 生生 生生0.60.40.

7、40.60.42生生 死死 生生0.40.60.40.60.42生生 生生 死死0.40.40.60.60.422死死 死死 生生0.60.60.40.620.4死死 生生 死死0.60.40.60.620.4生生 死死 死死0.40.60.60.620.43死死 死死 死死0.60.60.60.6300330.60.4C 3只小鼠存亡分析只小鼠存亡分析11230.60.4C 22130.60.4C 33130.60.4C ()( )1n kkknP XkP kC n重重Bernoulli 試驗中,試驗中,X為事件為事件A在在 n 次試次試驗中發(fā)生的次數(shù)驗中發(fā)生的次數(shù) ,P (A) = ,若,

8、若:則則稱稱X服從服從參數(shù)為參數(shù)為n, 的的二項分布,記二項分布,記作作XB(n, ) 兩點分布是二項分布兩點分布是二項分布n=1時的特殊形式時的特殊形式 在在n重重Bernoulli試驗中,發(fā)生某種結(jié)果試驗中,發(fā)生某種結(jié)果A(如死如死亡亡)次數(shù)的一種次數(shù)的一種概率分布概率分布( )()(1),0,1,.,kkn knP kP XkCkn 本例本例XB(3, 0.6)X0123P(X)0.064 0.288 0.432 0.216 在在n重重試驗中發(fā)生的次數(shù)試驗中發(fā)生的次數(shù)X服從參數(shù)為服從參數(shù)為n, 的的二項分布二項分布 1n kkknP XkC 101kiP XkPPP kP Xi 1ni

9、kP XkP kP kP nP Xi 00.10.20.30.40.5-10123400.10.20.30.40.5-10123400.10.20.3-10123456789101100.10.2-1 13579 11 13 15 17 19 21 23 25 27 29 31X B(3,0.6)X B(3,0.5)X B(10,0.6)X B(30,0.6) 分布分布形式形式 當(dāng)當(dāng) =0.5時,二項分布圖形是對稱時,二項分布圖形是對稱的的 當(dāng)當(dāng) 0.5時,圖形是偏態(tài)的時,圖形是偏態(tài)的 隨著隨著n的增大,圖形趨于的增大,圖形趨于對稱對稱 當(dāng)當(dāng)n+ 時,時,只要只要 不太靠近不太靠近0或或1,近

10、似,近似于于正態(tài)分布正態(tài)分布 當(dāng)當(dāng)n 和和n(1 )都大于都大于5 分布分布特征特征 集中趨勢集中趨勢 離散離散趨勢趨勢 反映隨機變量的平均取值大小,又稱反映隨機變量的平均取值大小,又稱數(shù)學(xué)數(shù)學(xué)期望,即均數(shù)期望,即均數(shù) 是以相應(yīng)概率作為是以相應(yīng)概率作為“權(quán)重權(quán)重”的的加權(quán)平均加權(quán)平均00()( )(1)nknkkn knkE Xk P kk Cn 度量隨機變量偏離度量隨機變量偏離(背離背離)數(shù)學(xué)期望數(shù)學(xué)期望(即即均數(shù)均數(shù)) 程度的指標(biāo)程度的指標(biāo) 實際值與期望值之差平方的期望值實際值與期望值之差平方的期望值 偏離平均值的平均偏離程度偏離平均值的平均偏離程度 22()()(1)V XE XE Xn

11、 (1)n分布形式分布形式表示方法表示方法均數(shù)均數(shù)E(X)方差方差V(X)兩點分布兩點分布XB(1, )二項分布二項分布XB(n, )n1n1二項分布和二項分布和兩點分布及其分布特征描述指標(biāo)兩點分布及其分布特征描述指標(biāo),XB n1,XNnn1,pNn1pn1ppppSn 01,1nXN nn 不太靠近 或n 和和n(1- )均大于均大于514005815.560.64A藥治療藥治療90例缺血性貧血患者效果例缺血性貧血患者效果差值差值(D)是否是否有效有效(E)1101811513111102412,DN 21,1EB2,DN nn515,1nnEB nEN nn 2,DNn1,XpNnnXX定

12、量變量定量變量定性變量定性變量2,XN 分布未知2,XN nnn足夠大2,XXNnn1,XB,XB nn足夠大,1XN nn1,XpNnn0,1XZNn XttSn0,11pZNppn已知未知 在在n次實際觀測中,發(fā)生概率為次實際觀測中,發(fā)生概率為 的某事件的某事件發(fā)生次數(shù)發(fā)生次數(shù)X及其發(fā)生頻率及其發(fā)生頻率p的分布形式的分布形式 考察二分類考察二分類(發(fā)生發(fā)生/未發(fā)生未發(fā)生)定性變量的分布特征定性變量的分布特征 抽樣研究抽樣研究 一般發(fā)生概率一般發(fā)生概率 未知未知 有關(guān)有關(guān)樣本統(tǒng)計量樣本統(tǒng)計量(發(fā)生發(fā)生次數(shù)次數(shù)X及其發(fā)生頻率及其發(fā)生頻率p)的的分布形式分布形式 說明樣本統(tǒng)計量與其相對應(yīng)的總體參

13、數(shù)間的關(guān)系說明樣本統(tǒng)計量與其相對應(yīng)的總體參數(shù)間的關(guān)系 二項分布的基本特征:只有兩種二項分布的基本特征:只有兩種結(jié)局、結(jié)局、恒恒定定、獨立獨立 實驗:考察施加干預(yù)措施后,出現(xiàn)某種結(jié)果的實驗:考察施加干預(yù)措施后,出現(xiàn)某種結(jié)果的發(fā)生數(shù)及其發(fā)生頻率發(fā)生數(shù)及其發(fā)生頻率 觀察觀察:結(jié)果已經(jīng)存在,從陽性率:結(jié)果已經(jīng)存在,從陽性率(如死亡率如死亡率、患、患病率病率等等)為為 的的總體中,隨機抽取大小為總體中,隨機抽取大小為n的的樣本樣本 有返還抽樣有返還抽樣 無返還抽樣無返還抽樣 無限總體無限總體 有限總體有限總體n/N0.1 抽樣研究中利用樣本信息推斷未知的總體抽樣研究中利用樣本信息推斷未知的總體特征特征

14、抽樣誤差客觀存在抽樣誤差客觀存在 參數(shù)估計:參數(shù)估計:p 假設(shè)檢驗:利用樣本信息完成總體率的比較假設(shè)檢驗:利用樣本信息完成總體率的比較 單單樣本率與已知率的比較樣本率與已知率的比較 獨立獨立樣本率的比較樣本率的比較 配對樣本率的比較配對樣本率的比較 點估計:點估計:p 區(qū)間估計區(qū)間估計 在給定的在給定的置信水平置信水平(1- )條件下,利用特定的分條件下,利用特定的分布形式,估計總體參數(shù)所在的區(qū)間,該區(qū)間為布形式,估計總體參數(shù)所在的區(qū)間,該區(qū)間為可信區(qū)間或置信區(qū)間可信區(qū)間或置信區(qū)間1LUP pp 精確精確估計估計 利用分布形式:利用分布形式:二項分布二項分布 一般適用條件:一般適用條件:n 5

15、0 估計方法:查附表估計方法:查附表7:百分率的置信區(qū)間:百分率的置信區(qū)間(P447) 據(jù)據(jù)GB/T 4088-2008 數(shù)據(jù)的統(tǒng)計處理和數(shù)據(jù)的統(tǒng)計處理和解釋解釋二項分二項分布布參數(shù)的估計與參數(shù)的估計與檢驗檢驗 當(dāng)當(dāng)n10時,置信區(qū)間一般太寬,無應(yīng)用價值時,置信區(qū)間一般太寬,無應(yīng)用價值122122112 ,2(1),2LpnxxF 212122112 ,2,21UpnxxF 例例10.4 某醫(yī)院腫瘤科收治某種罕見腫瘤患某醫(yī)院腫瘤科收治某種罕見腫瘤患者者40例,例,1年內(nèi)死亡年內(nèi)死亡5例。試估計該例。試估計該病年病病年病死率。死率。 點估計:點估計:該病年病死該病年病死率為率為12.5% 區(qū)間估

16、計:區(qū)間估計:n=4050,根據(jù),根據(jù)n=40, x=5, 1- =0.95查查附表附表7:百分率的置信區(qū)間:百分率的置信區(qū)間(P447),得:,得: 95%置信區(qū)間為置信區(qū)間為:(4%27%)5100%12.5%40p 正態(tài)正態(tài)近似法近似法 利用分布形式:近似利用分布形式:近似正態(tài)分布正態(tài)分布 條件:條件: n+ 時,只要時,只要 不太靠近不太靠近0或或1當(dāng)當(dāng)np和和n(1p)都大于都大于5時時 估計估計方法:方法:ppz221ppP pzSpzS 0,1ppSppNS-3-2-101231- -z /2z /2,1pNn 例例10.3 某醫(yī)院用注射用阿奇霉素對某醫(yī)院用注射用阿奇霉素對110

17、名兒名兒童肺炎患者進(jìn)行治療,其中痊愈童肺炎患者進(jìn)行治療,其中痊愈50例,試?yán)?,試估計注射用阿奇霉素治療兒童肺炎痊愈率估計注射用阿奇霉素治療兒童肺炎痊愈率的?5%置信區(qū)間。置信區(qū)間。 痊愈人數(shù):痊愈人數(shù):np=50,未痊愈人數(shù),未痊愈人數(shù)n(1-p)=60,均,均大于大于5,故,故p N ( , n (1- )500.4545110p 10.0475pppsn0.05 21.96z20.4545 1.96 0.0475ppzs 判斷判斷A市的地中海貧血基因攜帶率是否低于市的地中海貧血基因攜帶率是否低于該省平均該省平均水平水平10% 在在A市進(jìn)行市進(jìn)行抽樣調(diào)查抽樣調(diào)查 共調(diào)查共調(diào)查30人人 1人

18、陽性,攜帶人陽性,攜帶該該基因基因 研究目的研究目的:判斷判斷A市的地中海貧血基因攜帶市的地中海貧血基因攜帶率是否低于該省平均水平率是否低于該省平均水平10% 研究假設(shè):研究假設(shè): 0=10% 設(shè)計類型:設(shè)計類型:調(diào)查研究調(diào)查研究,單樣本設(shè)計單樣本設(shè)計 變量類型:是否攜帶有地中海貧血基因變量類型:是否攜帶有地中海貧血基因(是是/否否) 二分類定性變量二分類定性變量 已知條件:觀察了已知條件:觀察了30人,人,1人陽性人陽性 陽性率為陽性率為p=1/30=3.33%1.建立建立檢驗假設(shè),確立檢驗檢驗假設(shè),確立檢驗水準(zhǔn)水準(zhǔn)H0: =0.1,即,即A市的地中海貧血基因攜帶率與市的地中海貧血基因攜帶率

19、與該省平均水平該省平均水平相等相等H1: 0.1,即,即A市的地中海貧血基因攜帶率低市的地中海貧血基因攜帶率低于該省平均于該省平均水平水平單側(cè)單側(cè) =0.0530,XBH0: =0.130, 0.1XBXB(30, 0.1)概率分布概率分布P Xc0.0500.05P X P值為當(dāng)值為當(dāng)H0成立的條件下,所得到的樣本觀察結(jié)果及比其成立的條件下,所得到的樣本觀察結(jié)果及比其更極端結(jié)果的發(fā)生更極端結(jié)果的發(fā)生概率,更概率,更極端:比所得到的樣本觀察結(jié)果發(fā)極端:比所得到的樣本觀察結(jié)果發(fā)生概率更小生概率更小(1)(0)(1)0.1837P XPPX012345678P(X)0.0424 0.1413 0.

20、2277 0.2361 0.1771 0.1023 0.0474 0.0180 0.0058 X91011121314151617P(X)0.0016 0.0004 0.0001 0.0001 0.00010.00010.00010.00010.0001X181920212223242526P(X) 0.00010.00010.00010.00010.00010.00010.00010.00010.0001X27282930P(X) 0.00010.00010.00010.05,故按,故按 =0.05水準(zhǔn),不拒絕水準(zhǔn),不拒絕 H0 ,差異無統(tǒng)計學(xué)意義,尚不能認(rèn)為,差異無統(tǒng)計學(xué)意義,尚不能認(rèn)為A

21、市的地中海貧血基因攜帶率低于該省平均水平。市的地中海貧血基因攜帶率低于該省平均水平。 大量大量文獻(xiàn)顯示,某罕見非傳染性疾病的病文獻(xiàn)顯示,某罕見非傳染性疾病的病死率為死率為60%。某醫(yī)院收治的該病患者。某醫(yī)院收治的該病患者15人,人,死亡死亡10例。問該醫(yī)院該非傳染性疾病的病例。問該醫(yī)院該非傳染性疾病的病死率是否與文獻(xiàn)結(jié)果不同?死率是否與文獻(xiàn)結(jié)果不同?1(9)10.20660.7934PP XXB(15, 0.6)概率分布概率分布X01234567P(X)0.0000 0.0000 0.0003 0.0016 0.0074 0.0245 0.0612 0.1181 X89101112131415

22、P(X)0.1771 0.2066 0.1859 0.1268 0.0634 0.0219 0.0047 0.0005 吸毒吸毒人群的艾滋病知識知曉率是否高于人群的艾滋病知識知曉率是否高于一一般人群般人群的艾滋病知識知曉率為的艾滋病知識知曉率為65% 對對該該市市150名名吸毒人員進(jìn)行調(diào)查吸毒人員進(jìn)行調(diào)查 調(diào)查指標(biāo):艾滋病知識是否正確調(diào)查指標(biāo):艾滋病知識是否正確 調(diào)查結(jié)果:調(diào)查結(jié)果:130人回答人回答正確正確 研究目的研究目的:吸毒人群的艾滋病知識知曉率吸毒人群的艾滋病知識知曉率是否高于一般人群是否高于一般人群 研究假設(shè):研究假設(shè): 0=65% 設(shè)計類型:設(shè)計類型:調(diào)查研究調(diào)查研究 變量類型變

23、量類型:艾滋病知識是否正確艾滋病知識是否正確(是是/否否)二分類定性變量二分類定性變量 已知條件已知條件:抽樣觀察了:抽樣觀察了150名名吸毒吸毒人員,人員,130人正確,正確率人正確,正確率p=130/150=86.7%,XB n1,XNnn1,pNn1pn01,1nXN nn 不太靠近 或n 和和n(1- )均大于均大于5-3-2-10123(1)( ,)150pN2(0.65,0.039 )pNH0: =0.650.65(0,1)0.039pZN =0.051.650.8670.655.5720.039ZP(z 1.65)=0.051.建立檢驗假設(shè),確定檢驗建立檢驗假設(shè),確定檢驗水準(zhǔn)水準(zhǔn)

24、H0: =0.65,即該市吸毒人群的艾滋病知識知,即該市吸毒人群的艾滋病知識知曉率等于該市一般曉率等于該市一般人群人群H1: 0.65,即該市吸毒人群的艾滋病知識知,即該市吸毒人群的艾滋病知識知曉率高于該市一般曉率高于該市一般人群人群單側(cè)單側(cè) =0.052.計算計算檢驗統(tǒng)計量檢驗統(tǒng)計量本本例知曉數(shù)為例知曉數(shù)為150,不知曉數(shù)為,不知曉數(shù)為20,均大于,均大于5,符合正態(tài)近似符合正態(tài)近似條件,因此在正態(tài)分布下確定是否發(fā)條件,因此在正態(tài)分布下確定是否發(fā)生了小概率事件。生了小概率事件。0.8670.655.5720.039Z3.確定確定P值,作出統(tǒng)計推斷值,作出統(tǒng)計推斷查查附表附表3:t界值表界值表

25、( = ),得,得P0.0005,按,按 =0.05水準(zhǔn),拒絕水準(zhǔn),拒絕H0,接受接受H1,差異有統(tǒng)計學(xué)意義,差異有統(tǒng)計學(xué)意義,可以認(rèn)為該市吸毒人群的艾滋病知識知曉率高于該可以認(rèn)為該市吸毒人群的艾滋病知識知曉率高于該市一般市一般人群。人群。 為為了解某校本科生體測合格率的了解某校本科生體測合格率的性別差異性別差異 隨機隨機抽查了本科男生抽查了本科男生110人和女生人和女生130人人 觀察觀察體測體測是否合格是否合格 男生男生有有100人合格,女生有人合格,女生有70人人合格合格性別性別合格合格不合格不合格合計合計合格率合格率(%)男男1001011090.91 女女706013053.85 合

26、計合計1707024070.83 某某校校240名本科生名本科生體測體測合格率合格率 分析目的:性別對本科生分析目的:性別對本科生體測體測合格率的影合格率的影響響 研究假設(shè):男女合格率有差異,即研究假設(shè):男女合格率有差異,即 男男 女女 設(shè)計類型:調(diào)查研究設(shè)計類型:調(diào)查研究兩獨立樣本兩獨立樣本 變量類型:變量類型:體測是否體測是否合格,二分類定性變合格,二分類定性變量量 已知條件:樣本觀測數(shù)據(jù),并根據(jù)性別不已知條件:樣本觀測數(shù)據(jù),并根據(jù)性別不同組織形成列聯(lián)表同組織形成列聯(lián)表1.建立檢驗假設(shè),確定檢驗水準(zhǔn)建立檢驗假設(shè),確定檢驗水準(zhǔn)H0: 1= 2= c=70.83%,即不同性別,即不同性別體測體

27、測合格合格率相等率相等H1: 2 2,即不同性別體側(cè)合格率不等,即不同性別體側(cè)合格率不等 =0.05性別性別合格合格不合格不合格合計合計合格率合格率(%)男男1001011090.91 女女706013053.85 合計合計1707024070.83 某某校校240名本科生名本科生體測體測合格率合格率2.計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量n1p1和和n1(1-p1)及及n2p2和和n2(1-p2)均大于均大于5,則樣本,則樣本率服從正態(tài)分布。率服從正態(tài)分布。121122121211,pNpNnn121122121211,ppNnn1201212:110,cccccHppNnn3.確定確定P值,作出統(tǒng)

28、計推斷值,作出統(tǒng)計推斷查查P439附表附表3:t界值表界值表( = ),得,得P 0且且大小適中,大小適中,則對固定則對固定k的發(fā)生的發(fā)生概率有:概率有:lim(1)!0,1,2,.,kkkn knnCekkn Poisson distribution 由二項分布的近似計算產(chǎn)生的一種隨機變由二項分布的近似計算產(chǎn)生的一種隨機變量的量的概率分布概率分布 若若 其中其中 0,為一常數(shù),則稱,為一常數(shù),則稱X服從參數(shù)服從參數(shù) 為的為的Poisson分布,記為分布,記為:X P( ) 二項分布中稀有事件發(fā)生次數(shù)的二項分布中稀有事件發(fā)生次數(shù)的分布分布(),0,1,2,!kP Xkekk L L0.00 0

29、.05 0.10 0.15 0.20 0.25 -1012345678910 11 12 130.00 0.05 0.10 0.15 0.20 -1012345678910 11 12 130.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 -1 13579 11 13 15 17 19 21 23 25 27 290.00 0.02 0.04 0.06 0.08 0.10 -14914192429343944 =3 =5 =10 =20 分布分布形式形式 當(dāng)當(dāng) 較小時,較小時, Poisson分布呈分布呈偏態(tài)分布偏態(tài)分布 隨著隨著 增大,迅速接近增大,迅速接近對稱

30、分布對稱分布 當(dāng)當(dāng) 20時,可以認(rèn)為近似時,可以認(rèn)為近似正態(tài)分布正態(tài)分布 分布分布特征特征 集中趨勢集中趨勢 離散趨勢離散趨勢 反映隨機變量的平均取值大小,又稱數(shù)學(xué)反映隨機變量的平均取值大小,又稱數(shù)學(xué)期望期望 是以相應(yīng)概率作為權(quán)的加權(quán)平均是以相應(yīng)概率作為權(quán)的加權(quán)平均0()( )nkE Xk P k 度量隨機變量偏離度量隨機變量偏離(背離背離)數(shù)學(xué)期望數(shù)學(xué)期望(即即均數(shù)均數(shù)) 程度的指標(biāo)程度的指標(biāo) 實際值與期望值之差平方的期望值實際值與期望值之差平方的期望值 偏離平均值的平均偏離程度偏離平均值的平均偏離程度 22()()V XE XE X 20時,可以認(rèn)為近似正態(tài)分布時,可以認(rèn)為近似正態(tài)分布 2

31、,XN 當(dāng)當(dāng)n很大,很大, 很小,且很小,且n 大小適中大小適中,Poisson分布是二項分布的極限分布分布是二項分布的極限分布 總體均數(shù)總體均數(shù)E(X)與總體方差與總體方差V(X)相等相等,都是,都是 20時,時,Poisson分布可作為正態(tài)分布處理分布可作為正態(tài)分布處理 Poisson分布具備可分布具備可加性加性 服從服從Poisson分布的分布的m個相互獨立的隨機變量個相互獨立的隨機變量X1, X2, , Xm,它們之和也服從,它們之和也服從Poisson分布,且其分布,且其均數(shù)為這均數(shù)為這m個隨機變量的均數(shù)之個隨機變量的均數(shù)之和和 12mEX 與二項分布相同與二項分布相同 只有某事件發(fā)

32、生或不發(fā)生兩種可能結(jié)果只有某事件發(fā)生或不發(fā)生兩種可能結(jié)果 該事件發(fā)生該事件發(fā)生的的概率概率 恒定恒定 n次次重復(fù)重復(fù)觀察相互獨立觀察相互獨立 特殊要求特殊要求 重復(fù)觀察次數(shù)重復(fù)觀察次數(shù)n足夠大足夠大 事件的發(fā)生概率事件的發(fā)生概率 足夠小足夠小 稀有事件發(fā)生次數(shù)的稀有事件發(fā)生次數(shù)的分布:分布: n 較大,較大, 較小較小 研究大人群中不具傳染性、無遺傳性、無永久研究大人群中不具傳染性、無遺傳性、無永久免疫,且免疫,且發(fā)病率很低的疾病發(fā)生數(shù)的分布發(fā)病率很低的疾病發(fā)生數(shù)的分布 研究研究特定特定時間時間、空間或容積內(nèi)某罕見事件發(fā)生、空間或容積內(nèi)某罕見事件發(fā)生數(shù)的分布數(shù)的分布 某時段內(nèi)醫(yī)院急診病人數(shù)或發(fā)

33、生的某時段內(nèi)醫(yī)院急診病人數(shù)或發(fā)生的交通事故次數(shù)交通事故次數(shù) 單位體積內(nèi)粉塵的計數(shù)單位體積內(nèi)粉塵的計數(shù) 血細(xì)胞或微生物在顯微鏡下的計數(shù)血細(xì)胞或微生物在顯微鏡下的計數(shù) 單位面積內(nèi)細(xì)菌單位面積內(nèi)細(xì)菌計數(shù)計數(shù) 把把時間、空間分成時間、空間分成n(n)個極小的個極小的時間片時間片或部分或部分 由于被由于被分的足夠小,分的足夠小,每個時間片每個時間片/部分內(nèi)部分內(nèi)最多只最多只可能發(fā)生可能發(fā)生1次次 由于被分的足夠小,出現(xiàn)某事件是稀有事件,由于被分的足夠小,出現(xiàn)某事件是稀有事件,即即 很小很小 在在每個每個時間片時間片/部分內(nèi)事件部分內(nèi)事件隨機、等概率隨機、等概率( )發(fā)發(fā)生生 查表查表法法 樣本樣本計數(shù)計

34、數(shù)X 50時,查附表時,查附表8:Poisson分布分布 的的置信區(qū)間表置信區(qū)間表(P450) 對一實施了技術(shù)改造的潔凈廠房進(jìn)行環(huán)境對一實施了技術(shù)改造的潔凈廠房進(jìn)行環(huán)境監(jiān)測,測得空氣中粉塵的濃度為每監(jiān)測,測得空氣中粉塵的濃度為每1L空氣空氣中含中含10顆粉塵。假定粉塵在空氣中分布均顆粉塵。假定粉塵在空氣中分布均勻勻,估計,估計該潔凈廠房平均每升空氣中所含該潔凈廠房平均每升空氣中所含粉塵顆粒數(shù)的粉塵顆粒數(shù)的95%置信區(qū)間。置信區(qū)間。 根據(jù)根據(jù)x=10 50,查,查附表附表8:Poisson分布分布 的置信的置信區(qū)間表區(qū)間表(P450) 該潔凈廠房平均每升空氣中所含粉塵顆粒數(shù)的該潔凈廠房平均每升空

35、氣中所含粉塵顆粒數(shù)的95%置信區(qū)間為置信區(qū)間為(4.7, 18.4) 正態(tài)正態(tài)近似法近似法 當(dāng)當(dāng)X 20時時,可采用正態(tài)近似法估計總體均數(shù)的,可采用正態(tài)近似法估計總體均數(shù)的(1- )置信區(qū)間置信區(qū)間/2XZX 2,XN-3-2-101231- -z /2z /2Xz 某某市市2002年年抽樣調(diào)查了抽樣調(diào)查了10萬男性,其中因萬男性,其中因惡性腫瘤死亡惡性腫瘤死亡132人,人,試據(jù)此估計試據(jù)此估計2002年該年該市男性人群惡性腫瘤死亡率的市男性人群惡性腫瘤死亡率的95%置信區(qū)置信區(qū)間。間。 x=13220,根據(jù),根據(jù)Poisson分布的正態(tài)近似法分布的正態(tài)近似法 每每10萬人死亡數(shù)的萬人死亡數(shù)的

36、95%置信區(qū)間為:置信區(qū)間為: 男性人群惡性腫瘤死亡率的男性人群惡性腫瘤死亡率的95%置信區(qū)間為:置信區(qū)間為:132 1.96132,109.48,154.52即109.48 10,154.52 10萬萬 直接法直接法 利用利用Poisson分布計算相應(yīng)概率,確定是否發(fā)生分布計算相應(yīng)概率,確定是否發(fā)生了小概率事件,進(jìn)而作出結(jié)論了小概率事件,進(jìn)而作出結(jié)論 正態(tài)近似法正態(tài)近似法 當(dāng)當(dāng) 20(兩獨立樣本兩獨立樣本 1 20且且 2 20)時,時,Poisson分布近似到正態(tài)分布,利用正態(tài)分布確定是否分布近似到正態(tài)分布,利用正態(tài)分布確定是否發(fā)生了小概率事件,進(jìn)而作出結(jié)論發(fā)生了小概率事件,進(jìn)而作出結(jié)論 某某病在我國男性中的患病率約為病在我國男性中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論