第二章隨機(jī)變量的概率分布與數(shù)字特征_第1頁(yè)
第二章隨機(jī)變量的概率分布與數(shù)字特征_第2頁(yè)
第二章隨機(jī)變量的概率分布與數(shù)字特征_第3頁(yè)
第二章隨機(jī)變量的概率分布與數(shù)字特征_第4頁(yè)
第二章隨機(jī)變量的概率分布與數(shù)字特征_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 隨機(jī)變量的概率分布與數(shù)字特征在第一章中,我們介紹了隨機(jī)事件及其概率,可以看到很多事件都可以采取數(shù)值標(biāo)識(shí)。如一個(gè)人的身高、體重、血壓、脈搏;抽檢產(chǎn)品時(shí)出現(xiàn)的廢品個(gè)數(shù);擲骰子出現(xiàn)的點(diǎn)數(shù)等對(duì)于那些表現(xiàn)為某種屬性的非數(shù)值標(biāo)識(shí)的隨機(jī)事件,實(shí)際上也可以給它們以數(shù)值標(biāo)識(shí)。例如,對(duì)新生兒的性別,可以0表示女,1表示男;對(duì)生化檢驗(yàn)的結(jié)果,可以0表示為陰性,1表示為陽(yáng)性;對(duì)生產(chǎn)的產(chǎn)品,可以2表示為優(yōu)質(zhì)品,1表示為次品,0表示為廢品等。這樣一來(lái),隨機(jī)事件就都可以用數(shù)量來(lái)描述,從而,隨機(jī)試驗(yàn)的結(jié)果可用一個(gè)變量來(lái)表示,隨機(jī)試驗(yàn)的不同結(jié)果(隨機(jī)事件)表現(xiàn)為變量取不同的值。因此,本章先引入隨機(jī)變量的概念,把對(duì)隨機(jī)事

2、件及其概率的研究轉(zhuǎn)變成為對(duì)隨機(jī)變量及其概率分布的研究,本章主要討論兩類(lèi)常用的隨機(jī)變量的概率分布及幾個(gè)常用的數(shù)字特征。§2-1離散型隨機(jī)變量及其概率分布2-1.1隨機(jī)變量例如一位隱性遺傳疾病的攜帶者有三個(gè)女兒,則每個(gè)女兒都有1/2的可能性從母親那里得到一個(gè)致病的X染色體而成為攜帶者(假設(shè)父親正常),以A,B,C分別表示大女兒、二女兒和小女兒是攜帶者。若用X表示她們中的攜帶者人數(shù),那么X=0,1,2,3是變量。但X等于多少要與試驗(yàn)結(jié)果聯(lián)系在一起。如“X=0”=“X=3”=ABC“X1”=A+B+C等等,X取特定的值或特定范圍里的值是一個(gè)隨機(jī)事件,隨機(jī)事件的出現(xiàn)總是有一定的概率的,因而,變

3、量取特定值或某些值也有確定的概率。如:P(X=0)=P()=P()P()P()=()3=0.125P(X=3)=P(ABC)=P(A)P(B)P(C)= ()3=0.125P(X<)=P(X=0)+P(X=1)+P(X=2)+P(X=3)=P()=1通過(guò)該例,我們可對(duì)表示隨機(jī)試驗(yàn)結(jié)果的變量下一個(gè)定義。定義1若對(duì)隨機(jī)試驗(yàn)E的每一個(gè)可能的結(jié)果e,··都有惟一的實(shí)數(shù)x(e)與之對(duì)應(yīng),則稱x(e)是隨機(jī)變量,記為X。亦可用Y,Z等表示。隨機(jī)變量通過(guò)隨機(jī)事件與概率聯(lián)系起來(lái),對(duì)任何形式的隨機(jī)變量都有性質(zhì)1隨機(jī)變量取任何值的概率均為非負(fù)。性質(zhì)2隨機(jī)變量取所有可能取的值的概率為1。按

4、隨機(jī)變量的取值情況通常將其分為兩種基本類(lèi)型,即離散型隨機(jī)變量和非離散型隨機(jī)變量,而非離散型隨機(jī)變量中最重要的也是實(shí)際工作中經(jīng)常遇到的是連續(xù)型隨機(jī)變量。本書(shū)只簡(jiǎn)單介紹離散型及連續(xù)型這兩種隨機(jī)變量。(1) 離散型隨機(jī)變量其可取值是有限個(gè)或可列個(gè)。(2) 連續(xù)型隨機(jī)變量可以取得某一區(qū)間內(nèi)的任何數(shù)值或在整個(gè)數(shù)軸上取值。2-1.2離散型隨機(jī)變量的概率分布對(duì)一個(gè)隨機(jī)變量進(jìn)行研究,首先要判斷它的取值范圍以及可能取哪些值,其次還要知道它取這些值的概率,也就是要知道它的取值規(guī)律。隨機(jī)變量X的取值規(guī)律稱為X的概率分布,簡(jiǎn)稱分布。通常用隨機(jī)變量的概率函數(shù)(或概率密度函數(shù))、分布函數(shù)來(lái)描述隨機(jī)變量的分布。定義2設(shè)離散

5、型隨機(jī)變量X的所有可能取值為xi(i=1,2,n),X取各個(gè)值的對(duì)應(yīng)概率為pi(i=1,2,,n),則稱P(X=xi)=pi(i=1,2,n)(2-1)為離散型隨機(jī)變量X的概率函數(shù)(又稱分布律)。概率函數(shù)也可用列表的方式來(lái)表示(表2-1):表2-1Xx1x2xixnP(X=xi)p1P2pipn這張表稱為X的概率分布表(又稱分布列)。概率函數(shù)具有下列基本性質(zhì):(1)Pi0(i=1,2,n)(2)(2-2)從概率函數(shù)中能夠得到所有像“X=xi”這樣事件的概率,但有時(shí),我們更關(guān)心如“Xxi”或“Xxi”這類(lèi)事件的概率,如病人的身體狀況至多能承受多大劑量的放射治療;從失效率為1%的針劑中任取10支,

6、取到2支以上失效的概率是多少等,就需要計(jì)算事件Xxi或Xxi的概率,即P(Xxi)或P(Xxi)。定義3設(shè)X是隨機(jī)變量(可以是離散型的,也可以是非離散型的),對(duì)任何實(shí)數(shù)x,令F(x)=P(Xx)(-<x<+)(2-3)稱F(x)是隨機(jī)變量X的分布函數(shù)。對(duì)于任意實(shí)數(shù)x1<x2,有P(x1<Xx2)=P(Xx2)-P(Xx1)故P(x1<Xx2)=F(x2)-F(x1)因此,若已知X的分布函數(shù)F(x),就能知道X在任何一個(gè)區(qū)間上取值的概率。從這個(gè)意義上來(lái)說(shuō),分布函數(shù)完整地描述了隨機(jī)變量的變化情況,它具有下列性質(zhì):(1) 0F(x)1(-<x<+);(2)

7、F(x)是x的不減函數(shù);(3) F(-)=F(x)=0,F(+)=F(x)=1;(4) F(x)至多有可列個(gè)間斷點(diǎn),且在間斷點(diǎn)右連續(xù)。對(duì)于離散型隨機(jī)變量有F(xi)=P(Xxi)=P(X=x1)+P(X=x2)+P(X=xi)(2-4)即F(xi)=p1+p2+pi而pi=P(X=xi)=P(Xxi)-P(Xxi-1)=F(xi)-F(xi-1)(2-5)例1設(shè)某藥檢所從送檢的藥品中先后抽檢3件,如果送檢的10件中有2件失效,試列出檢得次品數(shù)的概率分布表,求出分布函數(shù)。解檢得次品數(shù)為隨機(jī)變量,設(shè)為X,則X的可取值為0,1,2,由第一章中古典概率的定義可計(jì)算得P(X=0)=0.4667P(X=1

8、)=0.4667P(X=2)=0.0666所以,其概率分布表為(如表2-2)表2-2X012Pi0.46670.46670.0666X的分布函數(shù)為:當(dāng)x<0時(shí),F(xiàn)(x)=P(Xx)=0;當(dāng)0x<1時(shí),F(xiàn)(x)=P(Xx)=p1=0.4667;當(dāng)1x2時(shí),F(xiàn)(x)=P(Xx)=p1+p2=0.9334;當(dāng)x2時(shí),F(xiàn)(x)=P(Xx)=p1+p2+p3=1于是,X的分布函數(shù)為如果取X的值于橫軸,pi的值于縱軸,便得到X的概率函數(shù)圖,它由幾條函數(shù)線組成,每條線長(zhǎng)的值等于該點(diǎn)上的概率;如果仍取X的值于橫軸,而取F(x)的值于縱軸,便得到X的概率分布函數(shù)圖,它的圖形呈遞增臺(tái)階形,在分段點(diǎn)右連

9、續(xù)。本例X的概率函數(shù)圖如圖2-1,分布函數(shù)圖如圖2-2。圖2-1圖2-22-1.3二項(xiàng)分布、泊松分布及其他常見(jiàn)的離散型變量的分布一、 伯努利模型為了說(shuō)明二項(xiàng)分布,先介紹伯努利模型。在醫(yī)藥領(lǐng)域內(nèi),許多試驗(yàn)只有兩種互斥的結(jié)果,如對(duì)病人治療的結(jié)果,有效或無(wú)效;生化檢驗(yàn)的結(jié)果,陰性或陽(yáng)性;毒性試驗(yàn)的結(jié)果,存活或死亡;射擊試驗(yàn)的結(jié)果,擊中與未擊中等。為了找到這些試驗(yàn)結(jié)果的規(guī)律性,往往需要在相同條件下做n次獨(dú)立重復(fù)試驗(yàn),我們把這種試驗(yàn)結(jié)果具有對(duì)立性的n重獨(dú)立重復(fù)試驗(yàn)稱為n重伯努利試驗(yàn),簡(jiǎn)稱伯努利試驗(yàn)。伯努利試驗(yàn)的共同特點(diǎn)是:(1) 對(duì)立性,每次試驗(yàn)的結(jié)果只能是對(duì)立事件中的一個(gè),要么出現(xiàn)A,要么出現(xiàn)。(2)

10、 獨(dú)立重復(fù)性,每次試驗(yàn)的結(jié)果互不影響,且各次試驗(yàn)中事件A出現(xiàn)的概率都相等,設(shè)為p,當(dāng)然事件出現(xiàn)的概率亦相等,設(shè)為q,則q=1-p。例2某藥治某病的治愈率為p,今用此藥試治該病5例,問(wèn)治愈3例的概率是多少?解設(shè)Ai=第i例治愈,則=第i例未愈(i=1,2,,5),B=治愈3例,在5例治療中各例的治愈率都相等,即P(Ai)=p(i=1,2,,5),且各例間的治療結(jié)果是獨(dú)立的,故治療5例就是做5次伯努利試驗(yàn)。治療5例治愈3例的情況有種:A1A2A3,,于是+由于各例治療是相互獨(dú)立的,因此有=又由于種事件是互斥的,因此即治療5例治愈3例的概率為。這類(lèi)問(wèn)題的一般情形如下面的定理所述。定理1(伯努利公式)

11、在伯努利試驗(yàn)中,若事件A在一次試驗(yàn)中出現(xiàn)的概率為p,則在n次試驗(yàn)中事件A恰好出現(xiàn)k次的概率為(2-6)如果上例的治愈率為0.7,那么治療5例治愈3例的概率是例3作抽球試驗(yàn),每次抽球一個(gè):(1) 袋中裝有白球20個(gè)和黑球10個(gè),作有放回抽取5次,求抽到白球3次的概率;(2) 袋中裝有白球2個(gè)和黑球1個(gè),作有放回抽取5次,求抽到白球3次的概率;(3) 袋中裝有白球20個(gè)和黑球10個(gè),作無(wú)放回抽取5次,求抽到白球3次的概率。解(1) 有放回抽球?qū)俨囼?yàn),令A(yù)=抽到白球,有,所以(2) 屬伯努利試驗(yàn),。(3) 無(wú)放回抽球不屬伯努利試驗(yàn),無(wú)放回抽球5次,可轉(zhuǎn)換成一次抽5個(gè)球,此時(shí)抽球的概率,參照1-

12、2.2古典概率例2的算法,有P(抽白球3次)對(duì)于伯努利模型應(yīng)當(dāng)注意的是要區(qū)別P(A)和Pn(k)的含義。前者體現(xiàn)一般性(每次試驗(yàn)中A 發(fā)生的概率),后者體現(xiàn)特殊性(n次試驗(yàn)中A恰好發(fā)生k次的概率)。兩者的關(guān)系是P(A)=P1(1)。二、 二項(xiàng)分布定義4若隨機(jī)變量X的概率函數(shù)為(k=0,1,n)其中0<p<1,則稱X服從參數(shù)為n,p的二項(xiàng)分布,記為XB(k;n,p)或XB(n,p)由于諸概率函數(shù)值(k=0,1,n),正好是二項(xiàng)式p+(1-p)n展開(kāi)式中按p的升冪排列的對(duì)應(yīng)各項(xiàng),故名二項(xiàng)分布。顯然二項(xiàng)分布對(duì)應(yīng)于n重伯努利試驗(yàn),其概率函數(shù)具有離散型隨機(jī)變量概率函數(shù)的兩個(gè)基本性質(zhì),即(1)

13、(2-7)(2)(2-8)它的分布函數(shù)為(k=0,1,2,n)(2-9)對(duì)于二項(xiàng)分布的有關(guān)計(jì)算,可直接用概率函數(shù)、分布函數(shù)的公式進(jìn)行計(jì)算,但通常n較大計(jì)算較煩,這時(shí)可利用書(shū)后附表1即二項(xiàng)分布累積概率P(Xk)(n30時(shí))表進(jìn)行查表計(jì)算。例4設(shè)XB(k;20,0.20),求P(X=4),F(xiàn)(4),P(26)的值。解用公式計(jì)算用查表法計(jì)算較簡(jiǎn)便,P(X=4)=P(X4)-P(X5)=0.58855-0.37035=0.2182F(4)=P(X4)=1-P(X5)=1-0.37035=0.62965P(2<X<6)=P(3X5)=P(X3)-P(X6)=0.79392-0.19579=0

14、.59813對(duì)于二項(xiàng)分布中概率p較大(p>0.5)時(shí),就不能直接查表計(jì)算,但可以轉(zhuǎn)化為其對(duì)立事件(p<0.5,且亦服從二項(xiàng)分布)的概率計(jì)算。因?yàn)槎?xiàng)分布對(duì)應(yīng)于n重伯努利試驗(yàn),若事件A出現(xiàn)的次數(shù)XB(k;n,p),則其對(duì)立事件出現(xiàn)的次數(shù)YB(k;n,1-p)(k=0,1,2,n),兩變量取值間受如下關(guān)系的限制k+k=n,因此通過(guò)上述轉(zhuǎn)換式可將對(duì)X的有關(guān)概率的計(jì)算轉(zhuǎn)化為對(duì)Y的有關(guān)概率的計(jì)算。例5設(shè)XB(k;10,0.7),求P(X7)。解 設(shè)Y為X所代表的事件的對(duì)立事件,則YB(k;10,0.3), k+k=10,所以P(X7)=P(Y3)=1-P(Y4)=1-0.35039=0.64

15、961在二項(xiàng)分布中,X取不同值k(k=0,1,2,n)的概率是不同的,使P(X=k)取最大值的k(記為k0)稱為二項(xiàng)分布的最可能值,即n次獨(dú)立重復(fù)試驗(yàn)中事件A最可能出現(xiàn)次數(shù)。因?yàn)轱@然,當(dāng)k<(n+1)p時(shí),有單調(diào)增加,k>(n+1)p時(shí),有單調(diào)下降,因此,當(dāng)k在(n+1)p附近時(shí),P(X=k)達(dá)最大值。若(n+1)p為整數(shù),則,故最可能值k0為(n+1)p和(n+1)p-1;若(n+1)p為非整數(shù)時(shí),則最可能值k0為(n+1)p取整數(shù)。例如:最可能值為4;最可能值為3和2;最可能值為2;最可能值為0。例6據(jù)報(bào)道,有10%的人對(duì)某藥有腸道反應(yīng)。為考察此藥的質(zhì)量,現(xiàn)隨機(jī)選5人服用此藥,

16、試求:(1)其中k個(gè)人(k=0,1,2,3,4,5)有反應(yīng)的概率;(2) 不多于2人有反應(yīng)的概率;(3) 有人有反應(yīng)的概率。解隨機(jī)選5人服藥,各人間對(duì)藥物的反應(yīng)具有獨(dú)立性,且每人服藥后有反應(yīng)的概率均可視為0.10,這相當(dāng)于做5次獨(dú)立重復(fù)試驗(yàn),即p=0.10,n=5的伯努利試驗(yàn)。因而反應(yīng)的人數(shù)X服從二項(xiàng)分布B(k;5,0.10)。按二項(xiàng)分布公式計(jì)算得概率分布表如下(1) k個(gè)人(k=0,1,2,3,4,5)有反應(yīng)的概率如表2-3。表2-3X=k012345P(X=k)0.590490.328050.072900.008100.000450.00001(2) 不多于2人有反應(yīng)的概率為這就是說(shuō),服藥

17、的人中不多于2人有反應(yīng)幾乎是肯定的,而多于2人有反應(yīng)幾乎不可能。因此,如果試驗(yàn)結(jié)果超過(guò)2人有反應(yīng),則可認(rèn)為10%的人有反應(yīng)的報(bào)道是值得懷疑的。(3) 有人有反應(yīng)的概率P(X1)=1-P(X=0)=1-0.59049=0.40951例7某批產(chǎn)品有80%的一等品,若進(jìn)行重復(fù)抽樣試驗(yàn),共取出4個(gè)樣品,求其中一等品數(shù)X的最可能值k0,并用二項(xiàng)分布公式驗(yàn)證這一結(jié)果。若4個(gè)樣品中沒(méi)有或只有1個(gè)一等品,試說(shuō)明此產(chǎn)品的質(zhì)量。解依題意,抽檢4個(gè)樣品,相當(dāng)于做4重伯努利試驗(yàn),其中一等品的個(gè)數(shù)X應(yīng)服從二項(xiàng)分布B(k;4,0.8),因?yàn)?n+1)P=5×0.8=4為整數(shù),所以X的最可能值為4和3,即k取k0

18、=3和k0=4時(shí),概率為最大。若用二項(xiàng)分布公式計(jì)算X取各值的概率列表2-4:表2-4X=k01234P(X=k)0.00160.02560.15360.40960.4096由上表可以看出,當(dāng)X=3和X=4時(shí)概率最大,與前面所推測(cè)結(jié)果一致。另從上表中可知,4個(gè)樣品中沒(méi)有或只有一個(gè)一等品的概率為P(X1)=0.0016+0.0256=0.0272通常約定,概率不超過(guò)0.05的事件算作小概率事件。因?yàn)楦怕市?,可以認(rèn)為這種事件在一次試驗(yàn)中幾乎不會(huì)出現(xiàn),此謂“小概率原理”。如果它一旦出現(xiàn),便被視為反常,從而有理由懷疑以至否定導(dǎo)致它出現(xiàn)的原因。例7中事件發(fā)生的概率為0.0272,屬于少概率事件。可見(jiàn)出現(xiàn)這

19、種情況的可能性很小,如果在一次抽檢中出現(xiàn),說(shuō)明80%的一等品的說(shuō)法是可疑的。三、 泊松分布(稀有事件模型)在很多實(shí)際問(wèn)題中,n次獨(dú)立重復(fù)試驗(yàn)中的n往往很大,p往往很小。例如某人獨(dú)立射擊,每次射擊的命中率為0.02,射擊400次,若按二項(xiàng)分布來(lái)計(jì)算擊中次數(shù)X的概率分布是很麻煩的,如果np=又是個(gè)較小的常數(shù)時(shí),便可根據(jù)下面的泊松分布公式進(jìn)行近似計(jì)算。定義5如果隨機(jī)變量X的概率函數(shù)為(2-10)其中>0,則稱X服從參數(shù)為的泊松分布。記為XP(k;)。對(duì)于泊松分布同樣有性質(zhì):(1)(2-11)(2)(2-12)它的分布函數(shù)為(2-13)此外,它還有一個(gè)規(guī)律(2-14)當(dāng)需要計(jì)算一連串概率函數(shù)值時(shí)

20、,可利用此規(guī)律進(jìn)行遞推計(jì)算。服從泊松分布的隨機(jī)變量在實(shí)際中是很多的,例如三胞胎出生次數(shù),癌癥發(fā)病人數(shù),放射的粒子個(gè)數(shù),特大洪水發(fā)生的年數(shù),抽檢大量產(chǎn)品中出現(xiàn)次品的件數(shù),同類(lèi)型的設(shè)備在工作中出現(xiàn)故障的臺(tái)數(shù)等等。例8已知某廠生產(chǎn)的針劑的廢品率為0.01,400支針劑中,廢品有5支以上的概率是多少? 解由題意知針劑中出現(xiàn)廢品的支數(shù)X應(yīng)服從二項(xiàng)分布,即XB(k;400,0.01),有由于n=400較大,P=0.01較小,且np=400×0.01=4<5。故X可認(rèn)為近似地服從泊松分布,=np=4,可按泊松分布來(lái)計(jì)算概率。按公式計(jì)算查表計(jì)算,按=4,k=5,查附表2得P(X5)=0.371

21、163例9某人在一次試驗(yàn)中遇到危險(xiǎn)的概率是1%,如果他在一年里每天都要獨(dú)立重復(fù)做一次這樣的試驗(yàn),那么他在一年中至少遇到一次危險(xiǎn)的概率是多少?解因?yàn)樗?dú)立重復(fù)做365次試驗(yàn),所以n=365,p=0.01,=np=365×0.01=3.65。P365次試驗(yàn)中至少遇到一次危險(xiǎn)=1-P365次試驗(yàn)都未遇到危險(xiǎn)此結(jié)果表明,即使在一次試驗(yàn)中很難碰到危險(xiǎn),當(dāng)試驗(yàn)經(jīng)常重復(fù)時(shí),至少遇到一次危險(xiǎn)的概率仍然可以達(dá)到很大。四、 其他離散型變量的分布(1) 二點(diǎn)分布定義6設(shè)隨機(jī)變量X的概率函數(shù)為P(X=k)=pkq1-k(k=0,1)(2-15)即其中0<p<1,則稱X服從二點(diǎn)分布。例10一批產(chǎn)

22、品共100件,其中有95件正品,5件廢品,從中任取一件,其結(jié)果用隨機(jī)變量X來(lái)描述,試求X的概率分布。解設(shè)X=0表示“抽到正品”,X=1表示“抽到廢品”,由古典概型可知即X服從二點(diǎn)分布二點(diǎn)分布是特殊的伯努利模型,即為n=1時(shí)的二項(xiàng)分布。(2) 幾何分布定義7設(shè)隨機(jī)變量X的概率函數(shù)為(k=1,2,) (2-16)其中0<p<1,q=1-p,則稱X服從幾何分布。在伯努利試驗(yàn)中,若事件A的概率為p,那么首次出現(xiàn)A時(shí)所做過(guò)的試驗(yàn)次數(shù)X(包括A出現(xiàn)的那一次)服從幾何分布。pqk-1就是等待A出現(xiàn)共等了k-1次的概率。如袋中裝有白球3個(gè),黑球2個(gè),今有放回地多次抽球,每次抽一個(gè)球。有p=P(白)

23、=0.6,那么到第6次才首次抽到白球的概率是P(X=6)=0.6×0.45=0.006144(3) 超幾何分布定義8設(shè)隨機(jī)變量X的概率函數(shù)為(k=0,1,2,,l)(2-17)其中nN-M,l=min(M,n),則稱X服從超幾何分布。設(shè)N個(gè)產(chǎn)品中有M個(gè)正品,現(xiàn)在無(wú)放回地抽取n次,每次抽一個(gè),那么所抽n個(gè)中的正品個(gè)數(shù)X服從超幾何分布。因?yàn)樗菬o(wú)放回抽取,各次抽取試驗(yàn)非獨(dú)立,所以不屬于伯努利試驗(yàn)。而當(dāng)N時(shí),有,能證明這就是說(shuō),如果產(chǎn)品總數(shù)很多,無(wú)放回地抽取可以當(dāng)作有放回抽取來(lái)看待,即可按二項(xiàng)分布計(jì)算,這時(shí)。§2-2連續(xù)型隨機(jī)變量及其概率分布由于連續(xù)型隨機(jī)變量能夠取某區(qū)間中的所有

24、值,它不能像離散型變量那樣將其可取值與對(duì)應(yīng)概率一一列出,因而不能用概率函數(shù)來(lái)描述,另外,從實(shí)際出發(fā),沒(méi)有必要確認(rèn)連續(xù)型變量X取某一值的概率,如追究人的體溫恰好等于37001度的概率未必有現(xiàn)實(shí)意義,人們關(guān)心的是體溫屬于正常值范圍的概率,故也沒(méi)必要用概率函數(shù)來(lái)描述。在這一節(jié)中我們引入概率密度函數(shù)來(lái)描述連續(xù)型隨機(jī)變量的概率分布,并介紹一些常見(jiàn)的連續(xù)型變量的概率分布。2-2.1連續(xù)型變量的概率分布定義1對(duì)于隨機(jī)變量X,如果存在一個(gè)非負(fù)的可積函數(shù)f(x)(-<x<+),使對(duì)任意a,b(a<b),都有P(a<x<b)=(2-18)則稱X為連續(xù)型隨機(jī)變量,稱f(x)為X的概率密

25、度函數(shù),有時(shí)簡(jiǎn)稱為概率密度或密度函數(shù)。概率密度函數(shù)具有以下性質(zhì):(1)f(x)0;(2)。對(duì)于連續(xù)型隨機(jī)變量X來(lái)說(shuō),它取任意一指定的實(shí)數(shù)值x0的概率為零,即P(X=x0)=0。事實(shí)上由定義式有0P(X=x0)P(x0-x<Xx0)=令x0,則上式右端0,故P(X=x0)=0。據(jù)此,對(duì)于連續(xù)型隨機(jī)變量X有P(x1<X<x2)=P(x1Xx2)=P(x1Xx2)=P(x1Xx2)(x1<x2)即在計(jì)算X落在某區(qū)間里的概率時(shí),可以不考慮區(qū)間是開(kāi)的、閉的或半開(kāi)半閉的情況。這里要說(shuō)明一點(diǎn),P(X=x0)=0并不意味著X=x0為不可能事件,它是可能會(huì)發(fā)生的。也就是說(shuō)零概率事件也是有

26、可能發(fā)生的。如X為被測(cè)試某地大學(xué)生的身高,若大學(xué)生的身高都在1.60m以上,則P(X=1.60)=0,但事件X=1.60是可能發(fā)生的??梢?jiàn),不可能事件的概率為零,但概率為零的事件不一定是不可能事件。同理,必然事件的概率為1,但概率為1的事件不一定是必然事件。由定義和上述性質(zhì)可以看出(2-19) 即f(x)表示了隨機(jī)變量X在區(qū)間 (x,x+x)上的平均概率,它與物理學(xué)中線密度的定義類(lèi)似,故稱為密度函數(shù)。它是連續(xù)函數(shù)。若不計(jì)高階無(wú)窮小,則當(dāng)x很小時(shí),由上式可得P(x<Xx+x)f(x)x從幾何上看,介于概率密度函數(shù)曲線y=f(x)與x軸間平面圖形的面積為1(圖2-3),而X落在區(qū)間(x,x+

27、x)里的概率等于圖2-4中陰影部分的面積。圖2-3圖2-4定義2設(shè)X為連續(xù)型隨機(jī)變量,稱(2-20)為隨機(jī)變量X的分布函數(shù)。它具有以下性質(zhì):(1) 0F(x)1;(2) F(x)是不減的函數(shù);(3)另由定義有P(x1<X<x2)=(x1<x2)(2-21)P(X>x)=1-P(Xx)=1-F(x)從幾何上看F(x)等于曲線y=f(x)與x軸間平面圖形在點(diǎn)x處左邊部分的面積。分布函數(shù)F(x)與概率密度函數(shù)互為逆運(yùn)算關(guān)系,即(x)連續(xù)型隨機(jī)變量的概率分布就是指概率密度函數(shù)和分布函數(shù)。2-2.2正態(tài)分布及其他常見(jiàn)的連續(xù)型變量的分布一、 正態(tài)分布(1) 正態(tài)分布的定義定義3若隨

28、機(jī)變量X的概率密度函數(shù)為(-<x<+)(2-22)其中和>0是常數(shù),則稱隨機(jī)變量X服從參數(shù)為和的正態(tài)分布(或高斯分布),記為XN(,)。其分布函數(shù)為(2-23)(2) 正態(tài)分布的圖形與性質(zhì)。正態(tài)分布的概率密度函數(shù)f(x)和分布函數(shù)F(x)的圖形見(jiàn)圖2-5,2-6。圖2-5圖2-6從正態(tài)分布的概率密度曲線可以看出正態(tài)分布的以下性質(zhì):1) 概率密度函數(shù)f(x)>0,曲線y=f(x)以x=為對(duì)稱軸,以x軸為水平漸近線,在x=±處有拐點(diǎn),當(dāng)x=時(shí)取得取大值的單峰鐘形曲線。2),即曲線與x軸間平面圖形的面積恒為1。當(dāng)固定時(shí),改變的值,y=f(x)的圖形沿x軸平行移動(dòng)而不

29、改變形狀,故又稱為位置參數(shù)。若固定,改變的值,則y=f(x)的圖形的形狀隨的增大而變得平坦,隨的減小而變得陡峭,故稱為形狀參數(shù)。(3) 標(biāo)準(zhǔn)正態(tài)分布定義4稱參數(shù)=0,的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布,記為XN(0,1)。其概率密度函數(shù)記為(2-24)其分布函數(shù)記為(2-25)標(biāo)準(zhǔn)正態(tài)分布具有正態(tài)分布的一切性質(zhì),只是因?yàn)?0,y=(x)的圖形關(guān)于x=0對(duì)稱,因而具有更特殊的性質(zhì):(-x)=(x)和(-x)=1-(x),如圖2-7所示。標(biāo)準(zhǔn)正態(tài)分布非常重要,它是我們解決一般正態(tài)分布和許多其他統(tǒng)計(jì)分布的工具和橋梁。為了使用方便,前人已編制了標(biāo)準(zhǔn)正態(tài)分布概率密度函數(shù)(x)值表(附表3)和標(biāo)準(zhǔn)正態(tài)分布分布函數(shù)(

30、x)值表(附表4),以供查用。(4) 正態(tài)分布的有關(guān)計(jì)算1) 對(duì)標(biāo)準(zhǔn)正態(tài)分布,(x)和(x)的值可借助于圖2-7附表3、附表4進(jìn)行查表計(jì)算。如查表得(0)=0.3989,(-1.45)=(1.45)=0.1394(-2.42)=0.007760或(-2.42)=1-(2.42)=1-0.992240=0.0077602) 對(duì)于一般正態(tài)分布,可先將其標(biāo)準(zhǔn)化。設(shè)XN(,),則即得(2-26)(2-27)通過(guò)上兩式可將一般正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布再利用(x)和(x)值表進(jìn)行計(jì)算。例1設(shè)XN(0,1),求:(1) P(X<-4.64);(2) P(X>2.58);(3) P(X<1

31、.96)。解(1) P(X<-4.64)=(-4.64)=0.000001742(2) P(X>2.58)=1-P(X<2.58)=1-(2.58)=1-0.995060=0.00494(3)P(X<1.96)=P(-1.96<X<1.96)=(1.96)-(-1.96)=0.97500-0.02500=0.9500例2設(shè)XN(1.5,4),計(jì)算:(1) f(5.5);(2) P(-4<X<2)。解(1)(2) P(-4<X<2)=F(2)-F(-4)=例3設(shè)XN(,),求:(1) P(X-<1.96);(2) P(X-<

32、2.58)。解(1) P(X-<1.96)=P(-1.96<X-<1.96)=P(-1.96<X<+1.96)=F(+1.96)-F(-1.96)=(1.96)-(-1.96)=0.975-0.025=0.95(2) 同理可得P(X-<2.58)=0.99該例說(shuō)明,若XN,則在試驗(yàn)中X的取值落在區(qū)間(-1.96,+1.96)的概率為95%,落在區(qū)間(-2.58,+2.58)的概率為99%。用上例中同樣的方法還可求得P(X-<3)=0.9974說(shuō)明在一次試驗(yàn)中,X落在區(qū)間(-3,+3)內(nèi)的概率相當(dāng)大,即X幾乎必然落在上述區(qū)間內(nèi)?;蛘哒f(shuō),在一般情形下,X在

33、一次試驗(yàn)中落在區(qū)間(-3,+3)以外的概率可以忽略不計(jì),這就是通常所說(shuō)的3原理。例4設(shè)XN(,2),求X以95%的概率所落入的區(qū)間(關(guān)于的對(duì)稱區(qū)間)。解設(shè)X落入的區(qū)間是(-m,+m),由題意知反查值表得m=1.96故X以95%的概率落入的區(qū)間是用同樣的方法可求出X以99%的概率落入的區(qū)間是醫(yī)學(xué)上,常把正態(tài)變量的95%或99%的概率的落入?yún)^(qū)間即(±1.96)或(±2.58)稱為正常值范圍。對(duì)于標(biāo)準(zhǔn)正態(tài)分布而言,正常值范圍為(-1.96,1.96)或(-2.58,2.58)。在自然現(xiàn)象和社會(huì)現(xiàn)象中,存在許多服從正態(tài)分布的隨機(jī)變量。如測(cè)定正常人的各項(xiàng)生理指標(biāo),一臺(tái)機(jī)器所生產(chǎn)藥丸的

34、丸重,對(duì)一個(gè)物理量在相同的條件下進(jìn)行多次重復(fù)測(cè)試的結(jié)果,一種農(nóng)作物的產(chǎn)量等等都服從正態(tài)分布,它們都可以看做由許多微小的、獨(dú)立的隨機(jī)因素作用的結(jié)果,且每種因素都不起壓倒其他因素的主導(dǎo)作用。凡具有這種特點(diǎn)的隨機(jī)變量,都可認(rèn)為近似地服從正態(tài)分布,故正態(tài)分布又稱為隨機(jī)誤差模型。另外,許多其他分布在一定條件下也常用正態(tài)分布作為近似分布,因此正態(tài)分布在概率論與數(shù)理統(tǒng)計(jì)中特別重要。二、 其他連續(xù)型變量的分布(1) 均勻分布定義5若隨機(jī)變量X的概率密度函數(shù)為(2-28)則稱X在區(qū)間a,b上服從均勻分布。由定義式顯然有f(x)0,f(x)的圖形如圖2-8所示。顯然,X落在區(qū)間(a,b)以外的概率為零??紤]X落在

35、區(qū)間(c,c+l)(ac<c+lb)上的概率這表明X落在區(qū)間(a,b)中任意長(zhǎng)度相同的子區(qū)間的概率是相同的,或者說(shuō)X落在子區(qū)間的概率只與子區(qū)間的長(zhǎng)度有關(guān)而與子區(qū)間的位置無(wú)關(guān)。在a,b上服從均勻分布的隨機(jī)變量X的分布函數(shù)為(2-29)分布函數(shù)F(x)的圖形如圖2-9所示。圖2-8圖2-9(2) 對(duì)數(shù)正態(tài)分布定義6若隨機(jī)變量X的概率密度函數(shù)為(2-30)其中>0,為常數(shù),則稱X服從對(duì)數(shù)正態(tài)分布。因變量X的對(duì)數(shù)lgXN(,2)而得名。顯然有f(x)0,且在實(shí)際中,當(dāng)驗(yàn)證某一隨機(jī)變量服從正態(tài)分布失敗時(shí),接著考慮的常常是對(duì)數(shù)正態(tài)分布。(3) 韋布爾分布定義7若隨機(jī)變量X的概率密度函數(shù)為(2-

36、31)則稱X服從韋布爾分布。其中m>0稱為形狀參數(shù),稱為位置參數(shù),>0稱為尺度參數(shù)。顯然有f(x)0,且=1韋布爾分布的概率密度函數(shù)和分布函數(shù)的圖形分別如圖2-10(a),2-10(b)所示。圖2-10韋布爾分布最有用的特殊情況之一是指數(shù)分布,它的密度函數(shù)為(2-32)它是在式2-31中取參數(shù)的結(jié)果。指數(shù)分布在實(shí)際中亦有重要意義,許多元件或設(shè)備的壽命、一些動(dòng)物的壽命等都服從指數(shù)分布。憑借形狀參數(shù)m的調(diào)節(jié),使得韋布爾分布可以概括許多不同類(lèi)型的情況。近年來(lái),它在藥學(xué)領(lǐng)域中獲得了廣泛的應(yīng)用。(4) 分布定義8若隨機(jī)變量X的概率密度函數(shù)為(2-33)其中>-1,>0,則稱X服從

37、分布。記為X()。這里是微積分中所熟知的函數(shù)。順便指出,當(dāng)=0時(shí),我們?cè)俅斡煞植济芏群瘮?shù)得出了指數(shù)分布的密度函數(shù)。分布在推導(dǎo)統(tǒng)計(jì)學(xué)中有重要地位的2分布,t分布,F(xiàn)分布中很有用,它是一種非常重要的非正態(tài)分布。§2-3隨機(jī)變量的數(shù)字特征前面介紹的概率分布能完整地描述隨機(jī)變量的統(tǒng)計(jì)規(guī)律,然而在一些實(shí)際問(wèn)題中要確定一個(gè)隨機(jī)變量的概率分布卻并非容易,且有些實(shí)際問(wèn)題并不需要知道它的完整的分布,而只需知道它的某些特征,對(duì)隨機(jī)變量的全貌有個(gè)概括的了解就可以了。這些特征的數(shù)字表示就稱為隨機(jī)變量的數(shù)字特征。這節(jié)中我們將介紹其中最重要也是最常用的兩種數(shù)字特征,均數(shù)和方差。2-3.1均數(shù)(數(shù)學(xué)期望)例1設(shè)有

38、一批藥材是由1等、2等、3等這三個(gè)等級(jí)的藥材組成,今任取一件藥材觀察它的等級(jí)X。顯然X是隨機(jī)變量,且它所有可能的取值為1,2,3。如果有放回地抽取10件,在取得的10件中有5件1等,3件2等,2件3等,那么所取的10件產(chǎn)品的平均等級(jí)是多少?解如果用(1+2+3)/3=2作為平均等級(jí)顯然不合理,因?yàn)?,2,3三個(gè)等級(jí)在所取10件藥材中的地位不平等,如1等品的件數(shù)比3等品的件數(shù)的兩倍還多。那么自然會(huì)想到按算術(shù)平均的方法去計(jì)算:把上式換個(gè)寫(xiě)法這種把每個(gè)等級(jí)與相應(yīng)的頻率乘積的和,稱為1,2,3等分別以為權(quán)的加權(quán)平均。我們知道,如果再抽取10件,1,2,3等品出現(xiàn)的件數(shù)就不一定是5,3,2了,也就是它的

39、頻率不一定是了,因此平均等級(jí)就不一定是1.7(等)了。可見(jiàn)由于抽樣不同,抽樣的平均等級(jí)亦不同,它也是一個(gè)隨機(jī)變量。但是,隨著試驗(yàn)(抽取藥材)的次數(shù)增大,出現(xiàn)1,2,3等品的頻率就會(huì)逐漸穩(wěn)定在各自的概率附近,設(shè)pi表示第i(i=1,2,3)等藥材出現(xiàn)的概率,在求藥材平均等級(jí)時(shí),用概率代替頻率,所得平均等級(jí)數(shù)1×p1+2×p2+3×p3就是一個(gè)確定的數(shù),它表示該批藥材的平均等級(jí)。我們稱這種加權(quán)平均值為均數(shù)(數(shù)學(xué)期望)。下面分別對(duì)離散型隨機(jī)變量和連續(xù)型隨機(jī)變量的均數(shù)給出定義。定義1設(shè)離散型隨機(jī)變量X的概率分布表如表(2-5)表2-5Xx1x2xiP(X=xi)p1p2p

40、i則規(guī)定X的均數(shù)(2-34)這里,當(dāng)X的可取值為無(wú)窮可數(shù)多個(gè)時(shí),等式右端是一個(gè)無(wú)窮級(jí)數(shù)。由于平均值應(yīng)該與x1,x2,,xi的排列次序無(wú)關(guān),因此要求這級(jí)數(shù)絕對(duì)收斂。所以,只有當(dāng)級(jí)數(shù)收斂時(shí)才說(shuō)X的均數(shù)存在。均數(shù)是反映隨機(jī)變量取值的集中趨勢(shì)的一個(gè)數(shù)字特征。例2甲乙二射手在同樣條件下進(jìn)行射擊,它們命中的環(huán)數(shù)X、Y的概率分布表分別如表2-6,表2-7:表2-6X678910P(X=xi)0.100.200.300.300.10表2-7Y678910P(Y=yi)0.150.150.250.250.20試問(wèn)誰(shuí)的射擊水平較高?解由定義得甲平均命中環(huán)數(shù)為EX=6×0.10+7×0.20+8

41、×0.30+9×0.30+10×0.10=8.10(環(huán))乙的平均命中環(huán)數(shù)為EY=6×0.15+7×0.15+8×0.25+9×0.25+10×0.20=8.2(環(huán))可見(jiàn)乙的平均射擊水平較高。對(duì)于連續(xù)型隨機(jī)變量,由于它沒(méi)有像離散型變量那樣的分布律,因此不能以級(jí)數(shù)去定義它的均數(shù)。但是可設(shè)想把連續(xù)型變量X的取值區(qū)間分成無(wú)窮多個(gè)小區(qū)間(xk,xk+xk),然后求出它在每個(gè)小區(qū)間上取值的概率。設(shè)f(x)為連續(xù)型隨機(jī)變量X的分布密度,當(dāng)xk很小時(shí)有Pxk<X<xk+xkf(xk)xk仿定義1得這樣自然會(huì)想到利用此式

42、右端的極限(若存在),即去定義X的均數(shù)。定義2設(shè)連續(xù)型隨機(jī)變量X的概率密度函數(shù)為f(x),則規(guī)定X的均數(shù)為(2-35)與離散型變量類(lèi)似,這里只有在右端的廣義積分收斂時(shí),才說(shuō)EX存在。例3求在區(qū)間a,b上服從均勻分布的隨機(jī)變量X的均數(shù)。解依題意有由式(2-35)得X的均數(shù)為下面我們?cè)偾蟪R?jiàn)的二項(xiàng)分布、泊松分布和正態(tài)分布的均數(shù)。例4若XB(k;n,p),求EX。解例5若XP(k;),求EX。解例6若XN(,求EX。解令,有,則均數(shù)有如下一些基本性質(zhì):(1) E(c)=c(c為常數(shù));(2) E(kX)=kEX(k為常數(shù));(3) E(kX+b)=kEX+b(k,b為常數(shù));(4) E(X±

43、;Y)=EX±EY(可推廣到有限個(gè)變量的情形);(5) E(XY)=EX·EY(X與Y獨(dú)立)。2-3.2方差和標(biāo)準(zhǔn)差均數(shù)反映了隨機(jī)變量取值的平均情況,它是隨機(jī)變量的一個(gè)重要數(shù)字特征。但只看均數(shù)是不夠的,還應(yīng)該知道隨機(jī)變量的取值對(duì)均數(shù)的偏離程度。例如,設(shè)有甲、乙兩臺(tái)制丸機(jī)生產(chǎn)同一種藥丸的直徑(單位:mm)的概率分布表分別如下表2-8,表2-9:表2-8X56789P(X=xi)0.050.10.70.10.05表2-9Y45678910P(Y=yi)0.050.10.20.30.20.10.05如果藥丸的標(biāo)準(zhǔn)直徑為7,問(wèn)哪臺(tái)機(jī)器的性能更好?容易算出EX=EY=7,可見(jiàn)兩臺(tái)機(jī)器

44、都是按標(biāo)準(zhǔn)生產(chǎn)的。但是從分布表可見(jiàn),甲機(jī)器生產(chǎn)的丸徑比乙穩(wěn)定,也就是甲機(jī)器生產(chǎn)的丸徑與標(biāo)準(zhǔn)丸徑的總離差要小。因此,甲機(jī)器的生產(chǎn)性能比乙更好。為了用一個(gè)數(shù)字來(lái)刻畫(huà)隨機(jī)變量X取值對(duì)其均數(shù)EX的偏離程度,容易想到取(X-EX)的均數(shù)E(X-EX),但這樣常常會(huì)造成正、負(fù)抵消,從而掩蓋實(shí)際偏差的大小,如果用E(X-EX)則可以反映全部偏差的大小,但絕對(duì)值運(yùn)算起來(lái)不方便。因此常用E(X-EX)2來(lái)刻畫(huà)隨機(jī)變量X的取值對(duì)其均數(shù)EX的偏離程度,或刻畫(huà)X取值對(duì)其均數(shù)的波動(dòng)程度。定義3 設(shè)X是一個(gè)隨機(jī)變量,則稱E(X-EX)2為X的方差,記作DX。即DX=E(X-EX)2(2-36)而DX稱為X的標(biāo)準(zhǔn)差。離散型

45、隨機(jī)變量X的方差為(2-37)其中pi=P(X=xi)(i=1,2,)連續(xù)型隨機(jī)變量X的方差為(2-38)其中f(x)是X的概率密度函數(shù)為了便于計(jì)算方差,可以由DX=E(X-EX)2推導(dǎo)出實(shí)用計(jì)算公式為DX=EX2-(EX)2(2-39)因?yàn)楦鶕?jù)均數(shù)的性質(zhì)有DX=E(X-EX)2=EX2-2XEX+(EX)2=EX2-2(EX)·(EX)+(EX)2=EX2-(EX)2例7設(shè)X的概率分布表如表2-10:表2-10X01Pi1-pp求DX。解EX=0·(1-p)+1·p=p,EX2=p若記1-p=q,則DX=E(X-EX)2=(0-p)2(1-p)+(1-p)2&#

46、183;p=p2(1-p)+(1-p)2p=p(1-p)=pq或DX=E(X2)-(EX)2=p-p2=p(1-p)=pq例8設(shè)X的概率密度為求DX。解由本節(jié)例3已知又于是下面再計(jì)算常用的二項(xiàng)分布、泊松分布和正態(tài)分布的方差及標(biāo)準(zhǔn)差。例9若XB(k;n,p),求DX和。解由本節(jié)例4知EX=np,又所以例10若XP(k;),求DX和。解由本節(jié)例5知EX=,又所以例11若XN(,2),求DX和。解由本節(jié)例6知EX=,又令u=,x=u+,dx=du,得從以上例題可以看出,上述三種重要分布完全可由它們的均數(shù)和方差所確定。方差有如下一些基本性質(zhì):(1) D(C)=0(C為常數(shù));(2) D(kX)=k2D

47、X(k為常數(shù));(3) D(X±Y)=DX+DY(X與Y相互獨(dú)立)(可推廣到任意有限個(gè)相互獨(dú)立隨機(jī)變量的情況)。2-3.3變異系數(shù)用方差或標(biāo)準(zhǔn)差來(lái)描述一個(gè)隨機(jī)變量取值的離散程度固然滿意,但在比較兩個(gè)變量取值的離散程度時(shí),如果兩個(gè)變量的均數(shù)相差懸殊或者取值單位不同,這時(shí)用方差或標(biāo)準(zhǔn)差就不行了。為此,引入又一數(shù)字特征,稱隨機(jī)變量X的標(biāo)準(zhǔn)差與均值之比為X的變異系數(shù),記為CVX。即(2-40)變異系數(shù)是標(biāo)準(zhǔn)差相對(duì)于均數(shù)的變化率,它同樣是描述隨機(jī)變量的離散程度,因其無(wú)量綱,更便于對(duì)不同隨機(jī)變量之間波動(dòng)程度的比較。例12據(jù)調(diào)查,某地18歲男子身高均數(shù)為165.08cm,標(biāo)準(zhǔn)差為4.98cm,體重

48、均數(shù)為51.60kg,標(biāo)準(zhǔn)差為5.01kg,試比較該地男子的身高和體重波動(dòng)程度哪個(gè)大。解因?yàn)樯砀吆腕w重單位不同,直接用標(biāo)準(zhǔn)差比較波動(dòng)程度不合適,應(yīng)該用變異系數(shù)來(lái)比較。×100%=3.02%×100%=9.71%可見(jiàn),體重的相對(duì)波動(dòng)程度大于身高的相對(duì)波動(dòng)程度。§2-4三種重要分布的漸近關(guān)系離散型變量的二項(xiàng)分布、泊松分布和連續(xù)型變量的正態(tài)分布,是三種最基本也是最重要的概率分布,它們之間有著密切的漸近關(guān)系,也即:當(dāng)n時(shí),二項(xiàng)分布B(k;n,p)以泊松分布P(k;np)為極限分布。當(dāng)n時(shí),二項(xiàng)分布B(k;n,p)以正態(tài)分布N(np,npq)為極限分布。當(dāng)n增大時(shí),泊松分布

49、P(k;)以正態(tài)分布N(,)為極限分布。2-4.1二項(xiàng)分布的泊松近似定理1對(duì)于二項(xiàng)分布B(k;n,p),若,則(2-41)證明從略。由此可得,當(dāng)n充分大時(shí),二項(xiàng)分布的概率函數(shù)可用泊松近似表示。例1某車(chē)間送檢一批針劑,其中次品的概率是0.01,問(wèn)抽檢500支針劑,有5支次品的概率是多少?解抽檢500支針劑中,檢出次品的支數(shù)為XB(k;500,0.01),有5支次品的概率為(2-42)由于用二項(xiàng)分布公式直接計(jì)算難度很大,又n=500,因此可以近似化為泊松分布來(lái)計(jì)算,即是(2-43)有5支次品的概率是0.1755。2-4.2二項(xiàng)分布的正態(tài)近似定理2如果X表示在n次獨(dú)立試驗(yàn)中的成功次數(shù),p為每單一試驗(yàn)

50、成功的概率,則當(dāng)試驗(yàn)次數(shù)無(wú)限增大時(shí),變量X的分布趨于具有均數(shù)為np,標(biāo)準(zhǔn)差為的正態(tài)分布。這個(gè)定理表明,當(dāng)n為大數(shù)時(shí),某事件成功的概率的近似值,可用正態(tài)分布求得。二項(xiàng)分布的正態(tài)近似的幾何意義如圖2-11。當(dāng)n大時(shí),二項(xiàng)分布概率函數(shù)的包絡(luò)近似于正態(tài)概率密度曲線f(x)。從數(shù)值上看,二項(xiàng)分布概率函數(shù)值P(X=k)近似于正態(tài)分布概率密度f(wàn)(k)值。即(2-44)接著討論二項(xiàng)分布累積概率的正態(tài)近似。設(shè)二項(xiàng)分布B(k;n,p)的概率函數(shù)如圖2-12所示,則其累積概率P(k1Xk2)等于從k1到k2共k2-k1+1條概率函數(shù)線之和,注意到小區(qū)間k-0.5,k+0.5的長(zhǎng)度為1,因而概率函數(shù)P(X=k),在數(shù)

51、值上正好等于該小區(qū)間上,高為P(X=k)的矩形面積,又因?yàn)閄每相鄰兩個(gè)取值點(diǎn)的間隔為1。因此,二項(xiàng)分布累積概率P(k1Xk2)在數(shù)值上應(yīng)等于區(qū)間k1-0.5,k2+0.5上的k2-k1+1個(gè)矩形所組成的階梯形的面積,而這面積可以近似等于該區(qū)間上那條近似正態(tài)曲線所圍成的曲邊梯形的面積。因此,可得二項(xiàng)分布累積概率的正態(tài)近似圖2-11 圖2-12(2-45)若化成標(biāo)準(zhǔn)正態(tài)近似,可得(2-46)其中np,。有了二項(xiàng)分布的兩個(gè)近似計(jì)算,可以總結(jié)一下二項(xiàng)分布問(wèn)題中的計(jì)算方法的選擇:(1) 當(dāng)n為一個(gè)小的數(shù)時(shí),可直接應(yīng)用二項(xiàng)分布公式計(jì)算;(2) 當(dāng)n是一個(gè)大的數(shù),而且p值很小或接近于1,np不很大,則應(yīng)用泊

52、松分布近似計(jì)算;(3) 當(dāng)n是一個(gè)大的數(shù),p不是很小或不是接近于1時(shí),可應(yīng)用正態(tài)分布近似計(jì)算。例2對(duì)于某一癌癥高發(fā)病地區(qū)進(jìn)行普查結(jié)果,其患癌癥的概率是0.005,現(xiàn)有這地區(qū)一萬(wàn)人的鄉(xiāng)村,試推測(cè):(1) 這個(gè)鄉(xiāng)有70人患癌癥的概率;(2) 有30至50人患癌癥的概率;(3) 有不少于50人患癌癥的概率。解全鄉(xiāng)1萬(wàn)人中患癌癥人數(shù)X服從二項(xiàng)分布。因?yàn)閚=104,p=0.005,np=104×0.005=50,可用正態(tài)近似計(jì)算。(1)(2)(3)有70人患癌癥的概率為0.001;有30至50人患癌癥的概率為0.4977;全鄉(xiāng)不少于50人患癌癥的概率為0.5557。2-4.3泊松分布的正態(tài)近似

53、上面已討論過(guò),當(dāng)n大時(shí),二項(xiàng)分布B(k;n,p)近似于泊松分布P(k;np),同時(shí)它又近似于正態(tài)分布N(np,npq),由此可推出當(dāng)n大時(shí),泊松分布也會(huì)近似于正態(tài)分布,一般說(shuō),當(dāng)變量X服從泊松分布時(shí),p的值較小,因此q的值可以近似看為1,則從二項(xiàng)分布的參數(shù)推算可得,,所以,對(duì)于P(k;)向N(,2)逼近的參數(shù)替換為。 經(jīng)標(biāo)準(zhǔn)化,可得到泊松分布的標(biāo)準(zhǔn)正態(tài)近似。(2-47)(2-48)其中例3某藥廠大批量生產(chǎn)外用藥,平均每個(gè)月的廢品數(shù)為35件,試估計(jì)該廠:(1) 下個(gè)月內(nèi)出現(xiàn)廢品件數(shù)為65件的概率;(2) 下個(gè)月內(nèi)出現(xiàn)廢品少于40件的概率。解此廠出現(xiàn)廢品屬于伯努利試驗(yàn)之稀有事件,可認(rèn)為其每月出現(xiàn)廢

54、品的件數(shù)X服從參數(shù)=35的泊松分布,泊松分布可用正態(tài)近似:,。(1)(2)該廠下個(gè)月內(nèi)出現(xiàn)廢品為65件的概率為0;出現(xiàn)廢品少于40件的概率為0.7517。§2-5大數(shù)定律及中心極限定理所謂極限定理,就是采用極限的方法得出隨機(jī)變量分布的一系列定理,也就是說(shuō),極限定理是研究隨機(jī)變量的極限分布的。一般可以分為兩類(lèi),第一類(lèi)極限定理,是闡述若干個(gè)隨機(jī)變量的均數(shù)的極限定理,統(tǒng)稱為大數(shù)定律。第二類(lèi)極限定理是闡述在怎樣的條件下,當(dāng)n時(shí),獨(dú)立隨機(jī)變量之和的極限分布為正態(tài)分布,有關(guān)第二類(lèi)極限定理的命題統(tǒng)稱為中心極限定理。下面我們簡(jiǎn)單地不加證明地給出有關(guān)的一些定理。2-5.1切比雪夫不等式我們知道,一個(gè)隨

55、機(jī)變量離均差平方的數(shù)學(xué)期望就是它的方差,而方差又是用來(lái)描述隨機(jī)變量取值的分散程度。切比雪夫不等式就是研究隨機(jī)變量的離差與方差之間關(guān)系的工具。定理1(切比雪夫不等式)設(shè)隨機(jī)變量X有均值EZ及方差DZ,則對(duì)任給的0,有(2-49)或(2-50)切比雪夫不等式只利用均值及方差就描述了隨機(jī)變量的變化情況,如(2-50)斷言不管X的分布是什么,X落在(EZ-,EZ+)中的概率不小于。 因此它在理論研究及實(shí)際應(yīng)用中很有價(jià)值。例1某地區(qū)調(diào)查10000名某疾病的患者,該病需住院治療的概率是07,估計(jì)10000名患者中同時(shí)需住院治療的人數(shù)在6800與7200之間的概率。解令Z表示同時(shí)住院的患者數(shù),它服從二項(xiàng)分布,P=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論