幾種常見的概率分布率 (1)_第1頁
幾種常見的概率分布率 (1)_第2頁
幾種常見的概率分布率 (1)_第3頁
幾種常見的概率分布率 (1)_第4頁
幾種常見的概率分布率 (1)_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、離散型概率分布 二項(xiàng)分布(binomial distribution) 泊松分布(poisson distribution) 超幾何分布(hypergeometric probability distritution) 負(fù)二項(xiàng)分布(Negative binomial distribution)u貝努利試驗(yàn)(Bernoulli trial) : 我們把只有兩種可能觀測值(每次試驗(yàn)只可能是兩個(gè)對立事件之一)的隨機(jī)試驗(yàn)統(tǒng)稱為貝努利試驗(yàn)。這種試驗(yàn)在實(shí)際中廣泛存在,如觀察某一實(shí)驗(yàn)動(dòng)物的卵孵化與否、某一實(shí)驗(yàn)動(dòng)物是雌性還是雄性、實(shí)驗(yàn)反應(yīng)是陰性還是陽性等。un次獨(dú)立地貝努利試驗(yàn)稱為n重貝努利試驗(yàn),其試驗(yàn)結(jié)果的

2、分布(一種結(jié)果出現(xiàn)x次的概率是多少的分布)即為二項(xiàng)分布。 u應(yīng)用二項(xiàng)分布的重要條件是:每一種試驗(yàn)結(jié)果在每次試驗(yàn)中都有恒定的概率,各試驗(yàn)之間是重復(fù)獨(dú)立的。3.1 二項(xiàng)分布 B(nB(n, p), p) 例:例3.1注意:1)放回式抽樣適用于二項(xiàng)分布,非放回式抽樣適用于超幾何分布;2)通式為:n = 試驗(yàn)次數(shù); x = 在n次試驗(yàn)中事件A出現(xiàn)的次數(shù)p= 事件A發(fā)生的概率(每次試驗(yàn)都是恒定的)1p= 事件 發(fā)生的概率P(x) = X 的概率函數(shù)為 P(X=x); F(x) = P( Xx )AxnxxnppcxP-=)1 ()(例3.1 從雌雄各半的100只動(dòng)物中抽樣(放回式抽樣),抽樣共進(jìn)行10次

3、,問其中包括3只雄性動(dòng)物的概率是多少?包括3只及3只以下的概率是多少?即求P(X3)和P(X3) 此例中:n=10, x=3,p=0.5,求P(3) 和F(3)。則,將x0,1,2,3代入通式,可得到出現(xiàn)0,1,2,3只雄性動(dòng)物的概率。 P(0) 0.0009766 P(1) 0.0097656 P(2) 0.0439453 P(3) 0.1171876所以,抽到3只和3只以下雄性動(dòng)物的概率為: F(3)P(0)P(1)P(2)P(3)0.1718751 733105 . 015 . 03-= CP一、 服從二項(xiàng)分布的隨機(jī)變量的特征數(shù)平均數(shù)平均數(shù):np , p (用比率表示時(shí)) 方差方差: (

4、用比率表示時(shí)) 偏斜度:偏斜度:峭度:峭度:從以上公式可以看出二項(xiàng)分布決定于兩個(gè)參考數(shù):試驗(yàn)次數(shù)n 和概率P,因此其圖形變化趨勢與這兩個(gè)參數(shù)有關(guān)。npppnp)1 ( ),1 (22-=-=)1 (211pnpp-=npnp6)1 (12-=n=10,p0.0100.20.40.60.810246810n=100,p0.0100.10.20.30.40.50255075100n=500,p0.0100.10.20.30.40.50100200300400500n=10,p0.1000.10.20.30.40.50246810n=100,p0.1000.050.10.150.2025507510

5、0n=500,p0.1000.020.040.060.080.10100200300400500n=10,p0.5000.10.20.30246810n=100,p0.5000.020.040.060.080.10255075100n=500,p0.5000.010.020.030.040.050100200300400500例3.2 用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔雜交,F(xiàn)1代為黑色正常毛長的家兔(BbRr), F1代自交,F(xiàn)2代表型比為:9/16B_R_ : 3/16B_rr : 3/16bbR_ : 1/16bbrr。問最少需要多少F2代家兔,才能以99的概率得到一

6、個(gè)棕色短毛兔(bbrr)? 解解: 設(shè)設(shè)p為非棕色短毛兔出現(xiàn)的概率,則為非棕色短毛兔出現(xiàn)的概率,則1p就為棕色短毛就為棕色短毛兔出現(xiàn)的概率。兔出現(xiàn)的概率。 在在p(1p)n的展開式中只有第一項(xiàng)的展開式中只有第一項(xiàng)pn無棕色短毛兔無棕色短毛兔出現(xiàn),因此出現(xiàn),因此n值可由值可由pn10.99求出。求出。 pn (15/16)n 0.01 n(lg15lg16) lg0.01 -0.02803n 2.00000 n 71.4二、 二項(xiàng)分布應(yīng)用實(shí)例二項(xiàng)分布的應(yīng)用條件有三: (1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或陰性, 生存或死亡等, 屬于二項(xiàng)分類資料; (2)已知發(fā)生某一結(jié)果 (如死亡)

7、的概率為p,其對立結(jié)果的概率則為1-p=q,實(shí)際中要求 p 是從大量觀察中獲得的比較穩(wěn)定的數(shù)值; (3)n個(gè)觀察單位的觀察結(jié)果互相獨(dú)立,即每個(gè)觀察單位的觀察結(jié)果不會(huì)影響到其它觀察單位的觀察結(jié)果。3. 2 泊松分布P() 在生物學(xué)研究中,有許多事件出現(xiàn)的概率很小,而樣本容量或試驗(yàn)次數(shù)卻往往很大,即有很小的p值和很大的n值。這時(shí)二項(xiàng)分布就變成另外一種特殊的分布,即泊松分布。 如,顯微鏡視野內(nèi)染色體有變異的細(xì)胞計(jì)數(shù)、單位容積的水中細(xì)菌數(shù)目的分布、作物種子內(nèi)雜草的分布以及樣方內(nèi)少見植物的個(gè)體數(shù)等都屬于泊松分布。 其概率函數(shù)可由二項(xiàng)分布的概率函數(shù)推導(dǎo)。一、泊松分布概率函數(shù)的推導(dǎo)xnxxnxxnxxnpp

8、xxnnnnppxnxnppcxp-=-=-=)1 (!) 1()2)(1()1 ()!( !)1 ()((將系數(shù)的分子分母同乘以(將系數(shù)的分子分母同乘以nx)!)1 ()()11 ()11 ( 1xpnpnxnxnx-=xnxpx-=)1 (!)(1)1(!xnppxpx-=ep)(1lim ,z)(1lime p10pz10z=-=-=exx!平均數(shù):平均數(shù):=方差:方差: 2 = 偏斜度:偏斜度:峭度:峭度: 概率函數(shù)內(nèi)的概率函數(shù)內(nèi)的 ,不但是它的平均數(shù),而且是不但是它的平均數(shù),而且是它的方差。它的方差。 很大時(shí),很大時(shí), 1和和2則接近于則接近于0,這時(shí)的泊松分布近,這時(shí)的泊松分布近似

9、于正態(tài)分布。似于正態(tài)分布。 二、 服從泊松分布的隨機(jī)變量的特征數(shù) 1 1 = = 12= =三、 泊松分布應(yīng)用實(shí)例例3.5 在麥田中,平均每10m2有一株雜草,問每100m2麥田中,有0株、1株、2株、雜草的概率是多少? 解: 先求出每100m2麥田中,平均雜草數(shù) 100/10 10株 將代入泊松分布的概率密度函數(shù)中, p(x) = 10 x/(x!e10),( e=2.71828) 即可求出x 0,1,2, 時(shí)所相應(yīng)的概率。 例:為監(jiān)測飲用水的污染情況, 現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù) , 共得400個(gè)記錄如下: 試分析飲用水中細(xì)菌數(shù)的分布是否服從泊松分布,計(jì)算每毫升水中細(xì)菌數(shù)的概率及理論

10、次數(shù)并將頻率分布與泊松分布作直觀比較。 解:經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù)為0.500 x 0.5,s20.496,兩者相接近,可認(rèn)為服從泊松分布 代入泊松分布公式1ml水中細(xì)菌數(shù)0123合計(jì)次數(shù)f2431203164005.0!5.0)(-=ekkxPk 注意,二項(xiàng)分布的應(yīng)用條件也是泊松分布的應(yīng)用條件。比如二項(xiàng)分布要求n 次試驗(yàn)是相互獨(dú)立的,這也是泊松分布的要求。然而一些具有傳染性的罕見疾病的發(fā)病數(shù),因?yàn)槭桌l(fā)生之后可成為傳染源,會(huì)影響到后續(xù)病例的發(fā)生,所以不符合泊松分布的應(yīng)用條件。1ml水中細(xì)菌數(shù)0123合計(jì)實(shí)際次數(shù)f243120316400頻率0.60750.30000.07750.015

11、01.00概率0.60650.30330.07580.01441.00理論頻數(shù)242.60121.3230.325.764003. 3 正態(tài)分布 在生物統(tǒng)計(jì)學(xué)中,正態(tài)分布占有極其重要的地位。許多生物學(xué)現(xiàn)象所產(chǎn)生的數(shù)據(jù),都服從正態(tài)分布。一、 正態(tài)分布(xN (,2))的密度函數(shù)與分布函數(shù)正態(tài)曲線正態(tài)分布的規(guī)律是數(shù)據(jù)分布集正態(tài)分布的規(guī)律是數(shù)據(jù)分布集中在平均數(shù)附近,并且在平均中在平均數(shù)附近,并且在平均數(shù)的兩側(cè)成對稱分布。正態(tài)分?jǐn)?shù)的兩側(cè)成對稱分布。正態(tài)分布布密度函數(shù)密度函數(shù)的圖像,稱為正態(tài)的圖像,稱為正態(tài)曲線。曲線。密度函數(shù):密度函數(shù):分布(累積)函數(shù):分布(累積)函數(shù):0,21)(222)( -=

12、=- - - xexfxdueduufxXpxFxxu-=222)(21)()()(正態(tài)分布密度曲線特點(diǎn): 密度曲線以x=直線為對稱; x=和x=-所確定的點(diǎn)為曲線的兩個(gè)“拐點(diǎn)”; 曲線向左、向右無限延伸,以x軸為漸近線; x= 時(shí),f(x) 具有最大值,其值為 ; 的大小,決定曲線的“胖”、“瘦”程度(展開程度),越小,曲線越“瘦”,數(shù)據(jù)越集中,越大,曲線越“胖”,數(shù)據(jù)越分散。 固定時(shí),值決定曲線的位置,當(dāng)增大時(shí)曲線向右平移,當(dāng)減少時(shí)曲線向左平移,但曲線形狀不變。 21二、 標(biāo)準(zhǔn)正態(tài)分布-=udeuUPuF2221)()(=0,=1時(shí)的正態(tài)分布稱為時(shí)的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布。密

13、度函數(shù):密度函數(shù):分布函數(shù):分布函數(shù):-=-ueufu,21)(22-=xu標(biāo)準(zhǔn)正態(tài)分布有以下特性: =0時(shí),概率密度值最大; 概率密度曲線向左、向右無限延伸,以x軸為漸近線;左右對稱 u =1和u =1是概率分布曲線的兩個(gè)拐點(diǎn); 曲線與橫坐標(biāo)軸所夾的圖形面積為1; 累積分布函數(shù)曲線從到0平穩(wěn)上升,圍繞點(diǎn)(0,0.5)對稱; 標(biāo)準(zhǔn)正態(tài)分布的偏斜度1和峭度2均為零。以下一些特征值很重要: P P(-1u-1u1 1)=0.6826=0.6826 P P(-2u-2u2 2)=0.9545=0.9545 P P(-3u-3u3 3)=0.9973=0.9973以下一些特征值很重要: P(-1.96

14、u1.96)=0.95P (-2.58u2.58) =0.99三、 正態(tài)分布表的查法 對于標(biāo)準(zhǔn)正態(tài)分布,其累積分布函數(shù)值F(u)可直接查表(書p315附表1)得到,其值等于標(biāo)準(zhǔn)正態(tài)曲線與橫坐標(biāo)軸從到u所夾的面積,該曲線下的面積即表示隨機(jī)變量U 落入?yún)^(qū)間(,u)的概率; 標(biāo)準(zhǔn)正態(tài)分布查表常用的幾個(gè)關(guān)系式:P(0U u1)=F(u1)=1F(u1)P(Uu1)=2F(u1)P(Uu1)=1 2F(u1)P(u1U u2)=F(u2)F(u1) x=5= 109.2正態(tài)分布正態(tài)分布u=0 = 10.42標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布v對于一般正態(tài)分布,要先進(jìn)行標(biāo)準(zhǔn)化,再查表對于一般正態(tài)分布,要先進(jìn)行標(biāo)準(zhǔn)化

15、,再查表; 標(biāo)準(zhǔn)化的公式為:標(biāo)準(zhǔn)化的公式為:-=xu例3.7 查標(biāo)準(zhǔn)正態(tài)分布u-0.82 及u1.15時(shí)的F(u)的值例3.8 隨機(jī)變量u服從正態(tài)分布N(0,1),問隨機(jī)變量u的值落在(0,1.21)區(qū)間的概率?例3.9 已知隨機(jī)變量u服從正態(tài)分布N(0,1),問隨機(jī)變量u的值落在(-1.96,1.96)區(qū)間的概率是多少?例3.10 已知某高粱品種的株高X服從正態(tài)分布N(156.2,4.822),求:00. 182. 42 .156161= =- -= =- - x62. 182. 42 .156164= =- -= =- - x20. 182. 42 .156162= =- -= =- -

16、x87. 082. 42 .156152- -= =- -= =- - x利用公式利用公式P(0Uu)=F(u)0.5利用公式利用公式 P( U u)=1 2F(u) 或或 P(u1Uua)=時(shí)的ua值;下側(cè)分位數(shù): P(uua/2 )=時(shí)的ua值(從附表2中以 /2查出的ua即可);大數(shù)定律與中心極限定理的應(yīng)用 樣本容量越大,樣本統(tǒng)計(jì)數(shù)與總體參數(shù)之差越小。 對于容量大于30的樣本,樣本均值的分布可以較好地用一個(gè)正態(tài)分布近似(其中均值為 ,即,樣本均值的平均值,標(biāo)準(zhǔn)差為 ,即,樣本均值的標(biāo)準(zhǔn)差)樣本容量越大,近似的效果越好。 如果原始總體就是正態(tài)分布,則對于任意樣本容量n,樣本均值都將是正態(tài)分

17、布的。n EXCEL在本章內(nèi)容的應(yīng)用在本章內(nèi)容的應(yīng)用EXCELEXCEL電子表格提供的粘帖函數(shù)電子表格提供的粘帖函數(shù)BINOMDIST 計(jì)算二項(xiàng)式分布的概率值NORMDIST 計(jì)算正態(tài)分布的累積函數(shù)NORMINV 計(jì)算正態(tài)分布累積函數(shù)的逆函數(shù)NORMSDIST 計(jì)算標(biāo)準(zhǔn)正態(tài)分布的累積函數(shù)NORMSINV計(jì)算標(biāo)準(zhǔn)正態(tài)分布累積函數(shù)的逆函數(shù)POISSON 計(jì)算泊松分布的概率AVERAGE計(jì)算算術(shù)平均值GEOMEAN 計(jì)算幾何平均數(shù)MAX 計(jì)算最大值MEDIAN計(jì)算一組給定數(shù)字的中位數(shù)STDEV計(jì)算樣本標(biāo)準(zhǔn)差STDEVP計(jì)算樣本總體的標(biāo)準(zhǔn)差VAR計(jì)算樣本的方差VARP計(jì)算樣本總體的方差各種分布函數(shù)計(jì)算

18、1、二項(xiàng)分布工具mnmmnqpCmP-=)()!( !mnmnCmn-=平均數(shù)、方差和標(biāo)準(zhǔn)差np=npq=2npq=二項(xiàng)分布的概率函數(shù)為二項(xiàng)分布函數(shù)的概率及累積概率的計(jì)算實(shí)例二項(xiàng)分布函數(shù)的概率及累積概率的計(jì)算實(shí)例 已知某種豬病的死亡率為30%,現(xiàn)有10頭病豬,如不給予治療,問死亡4頭及死亡4頭和4頭以下的概率為多少?解:死亡4頭的概率計(jì)算公式為:200. 07 . 03 . 0)4(64410= CP死亡4頭和4頭以下累積概率的計(jì)算公式為:85. 0)()4()4(40=xxPxPF用粘帖函數(shù) BINOMDIST 計(jì)算死亡4頭的概率計(jì)算本計(jì)算在編緝欄中為本計(jì)算在編緝欄中為BINOMDISTBI

19、NOMDIST(4 4,1010,0.300.30,F(xiàn)ALSEFALSE) 死亡4頭和4頭以下概率的計(jì)算本計(jì)算在編緝欄中為BINOMDIST(4,10,0.30,TRUE) 利用BINOMDIST函數(shù)和填充柄計(jì)算2 2、泊松分布工具、泊松分布工具 泊松分布的概率函數(shù) 為常數(shù),它等于平均數(shù)等于方差 -=ekkPk!)(=2 泊松分布概率的計(jì)算實(shí)例泊松分布概率的計(jì)算實(shí)例 已知某一地區(qū),出現(xiàn)怪胎的事件服從泊松分布P(2),請計(jì)算該地區(qū)出現(xiàn)3次怪胎的概率,及出現(xiàn)3次和3次以下怪胎的概率為多少? 出現(xiàn)3次怪胎概率的公式為:出現(xiàn)3次和3次以下怪胎的概率計(jì)算公式為:1804. 0! 32)3(23=-eP8

20、571. 0! 32! 22! 12! 02)() 3(2322212030=-=eeeekPkPk用用POISSONPOISSON粘帖函數(shù)計(jì)算粘帖函數(shù)計(jì)算出現(xiàn)3次怪胎概率的計(jì)算本計(jì)算在編緝欄中顯示POISSON(3,2,F(xiàn)ALSE) 出現(xiàn)3次和3次以下怪胎的概率計(jì)算本計(jì)算編緝欄中顯示POISSON(3,2,TRUE) 3 3、正態(tài)分布工具、正態(tài)分布工具 用符號(hào)N(,2) 表示(1)、正態(tài)分布的概率函數(shù)為:222)(21)(-=xexf0,-xNORMDIST粘帖函數(shù):計(jì)算累積函數(shù)粘帖函數(shù):計(jì)算累積函數(shù) NORMINV粘帖函數(shù):計(jì)算逆函數(shù)粘帖函數(shù):計(jì)算逆函數(shù) 已知某品種成年豬體重的總體平均數(shù)=100kg,總體標(biāo)準(zhǔn)差=20kg。試計(jì)算成年豬體重在70kg以下的概率。計(jì)算公式如下: -=70202)100(0668. 02201)70(22dxexPx用正態(tài)分布粘帖函數(shù)的計(jì)算用NORMDIST粘帖函數(shù)計(jì)算概率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論