理論分布(正式)_第1頁
理論分布(正式)_第2頁
理論分布(正式)_第3頁
理論分布(正式)_第4頁
理論分布(正式)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章第二章 概率與理論分布概率與理論分布第二節(jié)、理論分布2.2.1二項(xiàng)式分布二項(xiàng)式分布2.2.1.1二項(xiàng)總體及二項(xiàng)式分布二項(xiàng)總體及二項(xiàng)式分布 二項(xiàng)總體二項(xiàng)總體(binary population):間斷性隨機(jī)變數(shù)):間斷性隨機(jī)變數(shù)的總體包含兩項(xiàng),即非此即彼的兩項(xiàng),它們構(gòu)成的總的總體包含兩項(xiàng),即非此即彼的兩項(xiàng),它們構(gòu)成的總體稱為二項(xiàng)總體。體稱為二項(xiàng)總體。 如小麥種子的發(fā)芽與不發(fā)芽,大豆子葉為黃色和如小麥種子的發(fā)芽與不發(fā)芽,大豆子葉為黃色和綠色,調(diào)查荔枝蒂蛀蟲為害分為受害株和不受害株等綠色,調(diào)查荔枝蒂蛀蟲為害分為受害株和不受害株等等。等。 通常將二項(xiàng)總體中的通常將二項(xiàng)總體中的“此此”事件以變量事

2、件以變量“1”表示,表示,具概率具概率p;將;將“彼彼”事件以變量事件以變量“0”表示,具概率表示,具概率q。因而二項(xiàng)總體又稱為因而二項(xiàng)總體又稱為0、1總體,其概率則有總體,其概率則有p+q=1或或者者q=p-1。 第二節(jié)、理論分布2.2.1二項(xiàng)式分布二項(xiàng)式分布2.2.1.1二項(xiàng)總體及二項(xiàng)式分布二項(xiàng)總體及二項(xiàng)式分布 二項(xiàng)式分布二項(xiàng)式分布(binomial distribution):):從二項(xiàng)總體中抽取從二項(xiàng)總體中抽取n個個體,則間斷性變量個個體,則間斷性變量y就就有有n+1種取值,這種取值,這n+1種取值各有其概率,因種取值各有其概率,因而由變量及其概率就構(gòu)成了一個分布,這個分而由變量及其概

3、率就構(gòu)成了一個分布,這個分布就是二項(xiàng)式分布(又稱二項(xiàng)分布或者二項(xiàng)式布就是二項(xiàng)式分布(又稱二項(xiàng)分布或者二項(xiàng)式概率分布。概率分布。 第二節(jié)、理論分布2.2.1二項(xiàng)式分布二項(xiàng)式分布2.2.1.1二項(xiàng)總體及二項(xiàng)式分布二項(xiàng)總體及二項(xiàng)式分布 如如觀察使用某種農(nóng)藥后供試觀察使用某種農(nóng)藥后供試5只蚜蟲的死亡數(shù)目只蚜蟲的死亡數(shù)目,記記 “死死”為為“0”,記,記 “活活”為為“1”,觀察結(jié)果將出,觀察結(jié)果將出現(xiàn)現(xiàn)6個事件:個事件:5只全死,只全死,4死死1活,活,3死死2活,活,2死死3活,活,1死死4活,活,5只全活,這只全活,這6個事件就構(gòu)成一個完全事件系,個事件就構(gòu)成一個完全事件系,但但6個事件的概率不同

4、,將完全事件系的總概率個事件的概率不同,將完全事件系的總概率1分布分布到到6個事件中去,就是所謂的個事件中去,就是所謂的概率分布概率分布。如果將活的。如果將活的蟲數(shù)蟲數(shù)y來代表相應(yīng)的事件,便得到了關(guān)于變量來代表相應(yīng)的事件,便得到了關(guān)于變量y的概率的概率分布。分布。2.2.1.2二項(xiàng)分布的概率計(jì)算方法二項(xiàng)分布的概率計(jì)算方法 大豆子葉的顏色受一對等位基因控制,黃大豆子葉的顏色受一對等位基因控制,黃色(色(Y)對綠色()對綠色(G)為顯性,則)為顯性,則F2代按代按3:1比例分離,黃色子葉的概率為比例分離,黃色子葉的概率為0.75(3/4),綠色子葉的概率為綠色子葉的概率為0.25(1/4),這是二

5、項(xiàng)總體,這是二項(xiàng)總體的概率分布。若從總體中抽取的概率分布。若從總體中抽取n粒,那么粒,那么y粒粒是黃子葉的概率是多少呢?是黃子葉的概率是多少呢?1以二粒莢為例:出現(xiàn)黃色子葉種子數(shù)(以二粒莢為例:出現(xiàn)黃色子葉種子數(shù)(y)可能就)可能就有有2+1種取值,即為種取值,即為0、1或或2個。個。 出現(xiàn)出現(xiàn)0個個y的概率:的概率:P(y=0)= 出現(xiàn)一黃一綠的概率:出現(xiàn)一黃一綠的概率:P(YG)= P(GY)= 這兩個為互斥事件這兩個為互斥事件所以所以P(y=1)為)為3/16+3/16=6/16 出現(xiàn)出現(xiàn)2個個Y的概率:的概率:P(y=2)= 故,出現(xiàn)故,出現(xiàn)黃子葉種子數(shù)黃子葉種子數(shù)0,1,2三個事件三

6、個事件A0.A1.A2構(gòu)成一完構(gòu)成一完全事件系。全事件系。 P(A0)+P(A1)+P(A2)=黃子葉數(shù)(黃子葉數(shù)(y) 0 1 2黃子葉出現(xiàn)黃子葉出現(xiàn)y次的概率次的概率 1/16 6/16 9/16 合計(jì)為合計(jì)為1161)41)(41(163)41)(43(163)43)(41(169)43)(43(2以三粒為例:出現(xiàn)黃色子葉的種子數(shù)(以三粒為例:出現(xiàn)黃色子葉的種子數(shù)(y)可能為)可能為0.1.2或或3個。個。 出現(xiàn)出現(xiàn)0個個y的概率:的概率:P(y=0)= 出現(xiàn)出現(xiàn)1個個y的概率:的概率:P(GGY)= , P(GYG)= P(YGG)= ,故故 P(y=1)= 出現(xiàn)出現(xiàn)2個個Y的概率:的

7、概率:P(YYG)= , P(YGY)= P(GYY)= , 故故P(y=2)= 出現(xiàn)出現(xiàn)3個個Y的概率:的概率:P(GGG)= P(y=3)=所以完全事件系所以完全事件系P(A0)+P(A1)+P(A2)+ P(A3)=641)41)(41)(41(643)43)(41)(41(643)41)(43)(41(643)41)(41)(43(649643643643649)41)(43)(43(64964964276427164276427649641從以上可看出,每一復(fù)合事件的概率必等于該從以上可看出,每一復(fù)合事件的概率必等于該事出現(xiàn)的組合數(shù)乘以單個事件的概率。事出現(xiàn)的組合數(shù)乘以單個事件的概率

8、。組合數(shù)公式為:組合數(shù)公式為:n相當(dāng)于豆莢內(nèi)的種子總數(shù),相當(dāng)于豆莢內(nèi)的種子總數(shù),y相當(dāng)于黃色的種相當(dāng)于黃色的種子數(shù),所以:子數(shù),所以:P(y)=例如:例如:n=3,y=2 P(y=2)=)!( !ynynCynynyynC)41()43(6427)41()43(! 1 ! 2! 32二項(xiàng)式中包括兩項(xiàng),這兩項(xiàng)的概率為p、q,則變量y的概率函數(shù)為:這一分布律也稱為貝努里(貝努里(Bernoulli)分布,且有二項(xiàng)分布的概率之和等于1。n0y1)y(py-nyynqpc)y(p2.2.1.3二項(xiàng)式分布概率的計(jì)算例例1、棉田盲椿象危害的統(tǒng)計(jì)概率是從調(diào)查、棉田盲椿象危害的統(tǒng)計(jì)概率是從調(diào)查2000株后獲得

9、的近似值株后獲得的近似值p=0.35,現(xiàn)受害株事,現(xiàn)受害株事件為件為A,其概率為,其概率為p(A)=0.35,未受害株事件,未受害株事件為對立事件,其概率為為對立事件,其概率為q=1-p=0.65。這一試。這一試驗(yàn)是可以重復(fù)的。假定作了多次試驗(yàn),即抽驗(yàn)是可以重復(fù)的。假定作了多次試驗(yàn),即抽出出n株為一個抽樣單位,那么,試問出現(xiàn)有株為一個抽樣單位,那么,試問出現(xiàn)有y株是受害的,其概率應(yīng)為多少?株是受害的,其概率應(yīng)為多少? n=1受害株樹受害株樹y=0,1 n=5受害株樹受害株樹y=0,1,2,3,4,5 P(y=k)= ynyynqpc2.2.1.3二項(xiàng)式分布概率的計(jì)算例例1、n=1時(shí),時(shí),由于已

10、知由于已知 P(A)=0.35,P( )=1-0.35=0.65 總體的理論分布則以總體的理論分布則以n乘上述概率分布,即乘上述概率分布,即np和和n(1-p),所以有所以有2000*0.35=700株受害和株受害和2000*0.65=1300株未受害。株未受害。n=5 時(shí),受害株數(shù)時(shí),受害株數(shù) y=0,1,2,3,4,5 ,變量,變量y相應(yīng)相應(yīng)的概率函數(shù)的概率函數(shù) P(y=i)= ,其累積函,其累積函數(shù)數(shù)F(y)就如)就如P54頁的公式。頁的公式。調(diào)查單位為調(diào)查單位為5株的概率分布表就如株的概率分布表就如P55的表的表4.2。A Aynyynqpc例例2、某種昆蟲在某地區(qū)的死亡率為、某種昆蟲

11、在某地區(qū)的死亡率為40%,即,即p=0.4,現(xiàn)對這種害蟲用一種新藥進(jìn)行治蟲試驗(yàn),每次抽樣現(xiàn)對這種害蟲用一種新藥進(jìn)行治蟲試驗(yàn),每次抽樣10頭作為一組治療。試問新藥無療效,在頭作為一組治療。試問新藥無療效,在10頭中頭中死死3頭、頭、2頭、頭、1頭,以及全部愈好的概率為多少?頭,以及全部愈好的概率為多少?10頭中不超過兩頭死亡的概率各為多少?頭中不超過兩頭死亡的概率各為多少? n=10 p=0.4 q=0.6 求求 P(y=3) p(y=2) p(y=1) p(y=0) P(y=3)= p(y=2)= p(y=1)= p(y=0)= 733100.60.4c=0.21499822100.60.4c

12、911100.60.4c1000100.60.4c=0.12093=0.04031=0.00605F(2) =p(y=0)+p(y=1)+p(y=2)= 0.00605 + 0.04031 +0.12093= 0.16729如果問超過兩頭死去的概率是多少如果問超過兩頭死去的概率是多少? = P(y=3)+ P(y=4)+ P(y=5)+ P(y=6)+ P(y=7)+ P(y=8)+ P(y=9)+ P(y=10)如用對立事件來解則容易的多如用對立事件來解則容易的多:1-103)y(p20)y(pF(2) =1-20)y(p=1-0.16729=0.832712.2.1.4二項(xiàng)分布的形狀及參數(shù)

13、二項(xiàng)分布的形狀及參數(shù) 二項(xiàng)分布定義如下:二項(xiàng)分布定義如下: 設(shè)隨機(jī)變量設(shè)隨機(jī)變量y所有可能取的值為零或正整數(shù):所有可能取的值為零或正整數(shù):0,1,2,,n,且有,且有 Pn(y=k) = k=0,1,2,n其中其中p0,q0,p+q=1,則稱則稱隨機(jī)變量隨機(jī)變量y服從參數(shù)為服從參數(shù)為n和和p的二項(xiàng)分布的二項(xiàng)分布(binomial distribution),記為記為 yB(n,p)。knckpknq二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。參數(shù)二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。參數(shù)n稱為離散參數(shù)稱為離散參數(shù) , 只能取正整數(shù);只能取正整數(shù); p 是連續(xù)參數(shù),它是連續(xù)參數(shù),它能取能取0與與1

14、之間的任何數(shù)值之間的任何數(shù)值,q由由p確定,故不是另一個確定,故不是另一個獨(dú)立參數(shù)。獨(dú)立參數(shù)。二項(xiàng)分布由二項(xiàng)分布由n和和p兩個參數(shù)決定:兩個參數(shù)決定: 1、當(dāng)、當(dāng)p值較小且值較小且n不大時(shí)不大時(shí) ,分,分 布布 是偏倚的。但隨是偏倚的。但隨著著n的增大的增大 ,分布逐漸趨于對稱,如,分布逐漸趨于對稱,如圖圖42 所示;所示; 圖42 n值不同的二項(xiàng)分布比較 圖43 p值不同的二項(xiàng)分布比較2、當(dāng)、當(dāng) p 值值 趨趨 于于 0.5 時(shí)時(shí) ,分,分 布布 趨于對稱,趨于對稱, 如如圖圖43所示;所示;3、對于固定的、對于固定的n及及p,當(dāng),當(dāng)k增加時(shí),增加時(shí),Pn(k)先隨先隨之增加并達(dá)到其極大值,

15、以后又下降。之增加并達(dá)到其極大值,以后又下降。 此外此外 ,在,在n較大,較大,np、nq 較接近時(shí)較接近時(shí) ,二項(xiàng)分,二項(xiàng)分布接近于正態(tài)分布;當(dāng)布接近于正態(tài)分布;當(dāng)n時(shí),二項(xiàng)分布的時(shí),二項(xiàng)分布的極限分布是正態(tài)分布。極限分布是正態(tài)分布。二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差 統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量的隨機(jī)變量y平平均數(shù)均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差與參數(shù)與參數(shù)n、p有如下關(guān)系:有如下關(guān)系: =np = 2=npq如果如果n適當(dāng)大適當(dāng)大,如大于如大于30,而而 p值又不太小值又不太小,并且并且np及及nq均不小于均不小于5時(shí)時(shí),那么這個二項(xiàng)分布趨近于

16、即將介紹的正那么這個二項(xiàng)分布趨近于即將介紹的正態(tài)分布態(tài)分布npq2.2.1.4多項(xiàng)式分布 多項(xiàng)總體:多項(xiàng)總體: 若總體中包含幾種特性或者分類標(biāo)志,可將總?cè)艨傮w中包含幾種特性或者分類標(biāo)志,可將總體中的個體分為幾類。這種將變數(shù)資料分為體中的個體分為幾類。這種將變數(shù)資料分為3類類或者多類的總體稱為或者多類的總體稱為多項(xiàng)總體多項(xiàng)總體。 例如某種農(nóng)藥在防治某種病害的效果時(shí)可能例如某種農(nóng)藥在防治某種病害的效果時(shí)可能有的效果好,有的無效果,有的有副作用,這些有的效果好,有的無效果,有的有副作用,這些構(gòu)成的總體就是多項(xiàng)總體。構(gòu)成的總體就是多項(xiàng)總體。 研究多項(xiàng)總體的隨機(jī)變量的概率分布可使用研究多項(xiàng)總體的隨機(jī)變量

17、的概率分布可使用多項(xiàng)式分布(多項(xiàng)式分布(multinomial distribution)。2.2.1.4多項(xiàng)式分布 設(shè)總體中共包含有設(shè)總體中共包含有k項(xiàng)事件,它們的概率分別為項(xiàng)事件,它們的概率分別為p1、p2、p3、p4pk,且,且p1+p2+p3+pk=1。若從這種總體中隨機(jī)抽取。若從這種總體中隨機(jī)抽取n個個體,個個體,那么可能那么可能得到這得到這k項(xiàng)的個數(shù)分別為項(xiàng)的個數(shù)分別為y1、y2、y3yk,顯然,顯然y1+y2+y3+yk=n。這樣一個事件的概率應(yīng)該是這樣一個事件的概率應(yīng)該是:P(y1、y2、y3yk) =這一概率分布稱為這一概率分布稱為多項(xiàng)式分布多項(xiàng)式分布。!y!.y!y!y!n

18、k321ykky22y11p.pp2.2.1.4多項(xiàng)式分布 例例3、某藥對病人有效的概率為、某藥對病人有效的概率為1/2,對病人無效的,對病人無效的概率為概率為1/3,有副作用的概率為,有副作用的概率為1/6,若隨機(jī)抽取,若隨機(jī)抽取2個試驗(yàn)該藥的病人,那么我們抽取的結(jié)果包括個試驗(yàn)該藥的病人,那么我們抽取的結(jié)果包括這樣幾個事件:這樣幾個事件:2個病人有副作用;個病人有副作用;1個無效,個無效,1個有副作用;個有副作用;2個無效;個無效;1個有效,個有效,1個有副作用;個有副作用;1個有效,個有效,1個無效;個無效;2個均有效。這幾個事件的個均有效。這幾個事件的概率可用以上公式計(jì)算。如概率可用以上

19、公式計(jì)算。如P57頁頁2.2.1.5泊松分布二項(xiàng)分布的一種極限分布泊松分布泊松分布 (Poisson distribution) 在二項(xiàng)分布中,當(dāng)某事件出現(xiàn)的概率 p或q 值比較小 (如小于 0.1 ), 而樣本容量又很大,二項(xiàng)分布就接近泊松分布了。主要描述大量實(shí)驗(yàn)中隨機(jī)稀疏現(xiàn)象。如將np=m(n比較大,而m比較小時(shí)),其概率密度函數(shù)為:P(y) =e=2.71828!yemmy, y=0,1,2其參數(shù)為:其參數(shù)為: 即:平均數(shù)、方差與標(biāo)準(zhǔn)差如下:即:平均數(shù)、方差與標(biāo)準(zhǔn)差如下:=m, 2 2 =m,= 不同不同m值的分布及例子如書本第值的分布及例子如書本第58頁圖頁圖4.4和例和例4.4。 m

20、的大小決定其分布形狀,當(dāng)?shù)拇笮Q定其分布形狀,當(dāng)m值很小時(shí)值很小時(shí)分布呈很偏斜形狀,分布呈很偏斜形狀,m增大后則逐漸對稱,增大后則逐漸對稱,趨向于后面要介紹的正態(tài)分布。趨向于后面要介紹的正態(tài)分布。 泊松分布有一特性泊松分布有一特性:即兩個或兩個以上的:即兩個或兩個以上的泊松分布之和,也是一個泊松分布。泊松分布之和,也是一個泊松分布。m2.2.2正態(tài)分布正態(tài)分布 正態(tài)分布正態(tài)分布(normal distribution)是一種很是一種很重要的連續(xù)型隨機(jī)變量的概率分布。生物現(xiàn)象重要的連續(xù)型隨機(jī)變量的概率分布。生物現(xiàn)象中有許多變量是服從或近似服從正態(tài)分布的。中有許多變量是服從或近似服從正態(tài)分布的。許

21、多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的。許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的。此外,還有不少隨機(jī)變量的概率分布在一定條此外,還有不少隨機(jī)變量的概率分布在一定條件下以正態(tài)分布為其極限分布。件下以正態(tài)分布為其極限分布。因此在統(tǒng)計(jì)學(xué)因此在統(tǒng)計(jì)學(xué)中,正態(tài)分布無論在理論研究上還是實(shí)際應(yīng)用中,正態(tài)分布無論在理論研究上還是實(shí)際應(yīng)用中中 , 均占有重要的地位。均占有重要的地位。 2.2.2.1二項(xiàng)分布的極限正態(tài)分布 以二項(xiàng)分布棉株受害率為例,假定受害率以二項(xiàng)分布棉株受害率為例,假定受害率p=0.5,q=p=0.5,現(xiàn)假定每個抽,現(xiàn)假定每個抽樣單位包括樣單位包括20株,這樣株,這樣y有有21種取值,其受害株的概

22、率種取值,其受害株的概率p(y)=于是概率分布計(jì)算如下:于是概率分布計(jì)算如下: 將這些概率繪于圖。此圖是對稱的。將這些概率繪于圖。此圖是對稱的。 如如p=q,不論,不論n值大或小,二項(xiàng)分布的多邊形圖必形成對稱;如值大或小,二項(xiàng)分布的多邊形圖必形成對稱;如pq,而,而n很大時(shí),多邊形圖仍趨對稱。很大時(shí),多邊形圖仍趨對稱。n 增加到無窮多時(shí),每組的直方形都一一變增加到無窮多時(shí),每組的直方形都一一變?yōu)榭v軸線,此時(shí)的多邊形邊變?yōu)橐还饣€。此光滑曲線是二項(xiàng)分布的極為縱軸線,此時(shí)的多邊形邊變?yōu)橐还饣€。此光滑曲線是二項(xiàng)分布的極限曲線。此極限曲線屬于連續(xù)性變數(shù)分布曲線。這一曲線一般稱之為限曲線。此極限曲

23、線屬于連續(xù)性變數(shù)分布曲線。這一曲線一般稱之為正態(tài)正態(tài)分布曲線或正態(tài)概率密度曲線分布曲線或正態(tài)概率密度曲線。如圖。如圖4-4 )y20(yy205 . 05 . 0c00000. 000002. 000018. 000002. 000000. 021121202119021202112121202020202020圖44 正態(tài)分布密度曲線2.2.2.2正態(tài)分布的定義及其特征正態(tài)分布的定義及其特征 (一)(一) 正態(tài)分布的定義正態(tài)分布的定義 若連續(xù)型隨機(jī)變量若連續(xù)型隨機(jī)變量y的概的概率分布密度函數(shù)為率分布密度函數(shù)為 (4-6) 其中其中為平均數(shù),為平均數(shù),2為方差,則稱隨機(jī)變量為方差,則稱隨機(jī)變量

24、y服從服從正態(tài)分布正態(tài)分布(normal distribution), 記為記為yN(,2)。相應(yīng)的概率分布函數(shù)為相應(yīng)的概率分布函數(shù)為 (4-7)222)(212)(2121)(yyNeeyfyydyeyF222)(21)( 分布密度曲線如分布密度曲線如圖圖44所示。所示。 (二二) 正態(tài)分布的特征正態(tài)分布的特征 1、正態(tài)分布密度曲線是單峰、對稱的懸鐘、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為形曲線,對稱軸為y=;算術(shù)平均數(shù)、中數(shù)和;算術(shù)平均數(shù)、中數(shù)和眾數(shù)是相等的;眾數(shù)是相等的; 2、f(y) 在在 y = 處達(dá)處達(dá) 到到 極極 大大 , 極大極大值值 ; 3、f(y)是非負(fù)函數(shù),以

25、是非負(fù)函數(shù),以y軸為漸近線,分布軸為漸近線,分布從從-至至+; 21)(f 4、曲線在、曲線在y=處各有一個拐點(diǎn),即曲線在處各有一個拐點(diǎn),即曲線在(-,-)和和(+,+) 區(qū)間上是下凸的,在區(qū)間上是下凸的,在-,+區(qū)區(qū)間內(nèi)是上凸的,曲線兩尾向左右延伸,永不接觸橫軸;間內(nèi)是上凸的,曲線兩尾向左右延伸,永不接觸橫軸; 5、正態(tài)分布有兩個參數(shù),即平均數(shù)、正態(tài)分布有兩個參數(shù),即平均數(shù)和標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差,在在3 范圍內(nèi)包括了絕大多數(shù)頻率范圍內(nèi)包括了絕大多數(shù)頻率 。 是位置參數(shù),如是位置參數(shù),如圖圖45所示。所示。 當(dāng)當(dāng)恒定時(shí),恒定時(shí),愈愈大,則曲線沿大,則曲線沿y軸愈向右移動;反之,軸愈向右移動;反之,愈

26、小,曲線沿愈小,曲線沿y軸愈向左移動。軸愈向左移動。 是變異度參數(shù),是變異度參數(shù), 如如圖圖46所示所示 。 當(dāng)當(dāng)恒定時(shí),恒定時(shí), 愈大,表示愈大,表示 y 的取值愈分散,的取值愈分散, 曲線愈曲線愈“胖胖”;愈小,愈小,y的取值愈集中在的取值愈集中在附近,曲線愈附近,曲線愈“瘦瘦”。圖45 相同而不同的三個正態(tài)分布圖46 相同而不同的三個正態(tài)分布0 1 2 6、分布密度曲線與橫軸所夾的面積為、分布密度曲線與橫軸所夾的面積為1,即:,即: 區(qū)間區(qū)間1 面積或概率面積或概率= 0.6827 2 = 0.9545 3 = 0.9973 1.960 = 0.9500 2.576 = 0.9900 1

27、21)(222)(dyeyPy 2.2.2.2標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布 由上述正態(tài)分布的特征可知由上述正態(tài)分布的特征可知 ,正態(tài)分布是依,正態(tài)分布是依賴于參數(shù)賴于參數(shù)和和2 (或或) 的一簇的一簇 分布分布 , 正態(tài)曲線之正態(tài)曲線之位置及形態(tài)隨位置及形態(tài)隨和和2的不同而不同的不同而不同 。 這就給研究這就給研究具體的正態(tài)總體帶來困難,具體的正態(tài)總體帶來困難, 如以新變量如以新變量u來代替來代替,令令 u= ,則將一般的,則將一般的N(,2) 轉(zhuǎn)轉(zhuǎn) 換為換為 = 0,2=1的正態(tài)分布,的正態(tài)分布, u 稱為稱為正態(tài)離差正態(tài)離差。y 我們稱我們稱=0,2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布的正態(tài)分布為標(biāo)準(zhǔn)

28、正態(tài)分布(standard normal distribution)。 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作別記作(u)和和(u),由,由 (4-6)及及(4-7) 式得:式得: (4-8) (4-9) 隨機(jī)變量隨機(jī)變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作服從標(biāo)準(zhǔn)正態(tài)分布,記作uN(0,1),分布密度曲線如,分布密度曲線如圖圖47所示。所示。 2221)(ueudueuuu22121)(圖47 標(biāo)準(zhǔn)正態(tài)分布密度曲線 對于任何一個服從正態(tài)分布對于任何一個服從正態(tài)分布N(,2)的隨機(jī)的隨機(jī)變量變量y,都可以通過標(biāo)準(zhǔn)化變換:,都可以通過標(biāo)準(zhǔn)化變換: u=(y-) (

29、4-10) 將將 y其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量u。 u 稱稱 為為 標(biāo)標(biāo) 準(zhǔn)準(zhǔn) 正正 態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(standard normal deviate)。 2.2.2.3正態(tài)分布的概率計(jì)算正態(tài)分布的概率計(jì)算 (一)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算(一)標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算 設(shè)設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則服從標(biāo)準(zhǔn)正態(tài)分布,則 u 在在u1,u2 )內(nèi)取值的)內(nèi)取值的概率為:概率為: (u2)(u1) (4-11) 而而(u1)與與(u2)可由可由附表附表2累積正態(tài)分布累積正態(tài)分布FN(y)值)值表表查得。查得。 dueduedueuuuPuu

30、uuuuu122221221212121212121)( 例如,例如,u=1.75 ,1.7放在第一列放在第一列0.05放在第一行放在第一行 。 在在附表附表2累積正態(tài)分布累積正態(tài)分布FN(y)值)值中中 , 1.7所在行與所在行與 0.05 所在列相交處的數(shù)值為所在列相交處的數(shù)值為0.95994,即,即 (1.75)=0.95994 有有 時(shí)時(shí) 會會 遇遇 到到 給給 定定 (u) 值值 , 例例 如如 (u)=0.284, 反過來查反過來查u值。這只要在值。這只要在附表附表2累積正態(tài)分布累積正態(tài)分布FN(y)值)值中找到與中找到與 0.284 最接近的值最接近的值0.2843,對應(yīng)行的第一

31、列數(shù),對應(yīng)行的第一列數(shù) -0.5, 對應(yīng)列的第一行數(shù)對應(yīng)列的第一行數(shù) 值值 0.07 ,即相應(yīng)的,即相應(yīng)的u值為值為 u = - 0.57,即,即 (-0.57)=0.284 如果要求更精確的如果要求更精確的u值,可用線性插值法計(jì)算。值,可用線性插值法計(jì)算。 由由(4-11) 式及正態(tài)分布的對稱性可推出下列關(guān)系式,式及正態(tài)分布的對稱性可推出下列關(guān)系式, 再借助再借助附表附表2累積正態(tài)分布累積正態(tài)分布FN(y)值)值, 便能很方便地便能很方便地計(jì)算有關(guān)概率(有時(shí)要利用分布曲線的對稱性來解題):計(jì)算有關(guān)概率(有時(shí)要利用分布曲線的對稱性來解題): P(0uu1)(u1)-0.5 P(uu1) =(-

32、u1) P(uu1)=2(-u1) (4-12) P(uu1)1-2(-u1) P(u1uu2)(u2)-(u1) 【例【例4.6】 已知已知uN(0,1),試求:,試求: (1) P(u-1.64)? (2) P (u2.58)=? (3) P (u2.56)=? (4) P(0.34u1.53) =? 利用利用(4-12)式,查式,查附表附表2累積正態(tài)分布累積正態(tài)分布FN(y)值)值得:得: (1) P(u-1.64)=0.05050 (2) P (u2.58)=(-2.58)=0.024940 (3) P (u2.56) =2(-2.56)=20.005234 =0.010468 (4)

33、 P (0.34u1.53) =(1.53)-(0.34) =0.93669-0.6331=0.30389 關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記: P(-1u1)=0.6826 P(-2u2)=0.9545 P(-3u3)=0.9973 P(-1.96u1.96)=0.95P (-2.58u2.58)=0.99 圖圖48 標(biāo)準(zhǔn)正態(tài)分布的三個常用概率標(biāo)準(zhǔn)正態(tài)分布的三個常用概率圖48 標(biāo)準(zhǔn)正態(tài)分布的三個常用概率 u變量在上述區(qū)間以外取值的概率分別為:變量在上述區(qū)間以外取值的概率分別為: P(u1)=2(-1)=1- P(-1u1) =1-0.6826=0.

34、3174 P(u2)=2(-2) =1- P(-2u2) =1-0.9545=0.0455 P(u3)=1-0.9973=0.0027 P(u1.96)=1-0.95=0.05 P(u2.58)=1-0.99=0.01 (二)一般正態(tài)分布的概率計(jì)算(二)一般正態(tài)分布的概率計(jì)算 正正 態(tài)態(tài) 分分 布布 密度曲線和橫軸圍成的一個區(qū)密度曲線和橫軸圍成的一個區(qū)域,其面積為域,其面積為1,這實(shí)際上表明了,這實(shí)際上表明了“隨機(jī)變量隨機(jī)變量y取值在取值在-與與+之間之間”是一個必然事件,其概率是一個必然事件,其概率為為1。 若隨機(jī)變量若隨機(jī)變量 y服從正態(tài)分布服從正態(tài)分布N(,2),則,則y的的取值落在任意

35、區(qū)間取值落在任意區(qū)間 y1, y2) 的概率的概率 ,記作,記作P(y1 y y2),等于,等于圖圖49 中陰影部分曲邊梯中陰影部分曲邊梯形面積。即:形面積。即:圖49 正態(tài)分布的概率 (4-13) 對對 (4-13)式作變換式作變換u=(y-),得,得dy=du,故有故有其中,其中,dxexxxPxxx21222)(2121)(dueduexxxPxxuxxx/ )(/ )(212)(2121221222121)()()(122121221uudueuuu2211,xuxu 這表明服從正態(tài)分布這表明服從正態(tài)分布N(,2)的隨機(jī)變量的隨機(jī)變量y 在在 y1 ,y2 )內(nèi)取值的概率)內(nèi)取值的概率

36、 , 等等 于服于服 從從 標(biāo)標(biāo) 準(zhǔn)準(zhǔn) 正正 態(tài)態(tài) 分分 布布 的的 隨隨 機(jī)機(jī) 變變 量量 u 在在(y1-)/, (y2-)/)內(nèi)取值的概率)內(nèi)取值的概率 。 因此,計(jì)算一般正態(tài)分布的概率時(shí),因此,計(jì)算一般正態(tài)分布的概率時(shí), 只要只要將區(qū)間的上下限作適當(dāng)變換將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化), 就可用就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。 【例【例4.7】 設(shè)設(shè)y服從服從=30.26,2=5.102的正態(tài)分布,試求的正態(tài)分布,試求P(21.64y32.98)。 令令 則則u服從標(biāo)準(zhǔn)正態(tài)分布,故服從標(biāo)準(zhǔn)正態(tài)分布,故 =P(-1.69u0.

37、53) =(0.53)-(-1.69) =0.7019-0.04551 =0.6564 )10. 526.3098.3210. 526.3010. 526.3064.21()98.3264.21(xPxP10.526.30 xu 上述關(guān)于正態(tài)分布的結(jié)論,可用一實(shí)例上述關(guān)于正態(tài)分布的結(jié)論,可用一實(shí)例來印證。來印證。 例如上章水稻例如上章水稻140行產(chǎn)量資料的樣本分行產(chǎn)量資料的樣本分布表現(xiàn)出接近正態(tài)分布布表現(xiàn)出接近正態(tài)分布 ,其,其 平均數(shù)平均數(shù) =157.9 (g) ,標(biāo),標(biāo) 準(zhǔn)準(zhǔn) 差差S=36.4(g) ,算出平,算出平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間內(nèi)均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間內(nèi) 所包括的所包括的

38、次數(shù)與頻率次數(shù)與頻率 ,列于表,列于表42。 x表表42 140行水稻產(chǎn)量在行水稻產(chǎn)量在 kS 區(qū)間內(nèi)所包括的次數(shù)與頻率區(qū)間內(nèi)所包括的次數(shù)與頻率 kS 數(shù)值數(shù)值 區(qū)間區(qū)間 區(qū)間內(nèi)包括的次數(shù)區(qū)間內(nèi)包括的次數(shù) 次數(shù)次數(shù) % 1S 157.9 36.4 121.5194.3 99 70.712S 157.9 72.8 85.1 230.7 134 95.71 3S 157.9 109.2 48.7 267.1 140 100yyyyy 由表由表42可見,實(shí)際頻率與理論概率相當(dāng)可見,實(shí)際頻率與理論概率相當(dāng)接近,說明接近,說明140行水稻產(chǎn)量資料的頻率分布接近行水稻產(chǎn)量資料的頻率分布接近正態(tài)分布正態(tài)分布

39、 ,從而可推斷水稻產(chǎn)量這一隨機(jī)變量,從而可推斷水稻產(chǎn)量這一隨機(jī)變量很可能是服從正態(tài)分布的。很可能是服從正態(tài)分布的。 生物統(tǒng)計(jì)中,不僅注意隨機(jī)變量生物統(tǒng)計(jì)中,不僅注意隨機(jī)變量y落在平均落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(-k,+k)之內(nèi)的之內(nèi)的概率而且概率而且 也很也很 關(guān)心關(guān)心 y落在此區(qū)間之外的概率。落在此區(qū)間之外的概率。 我們把隨機(jī)變量我們把隨機(jī)變量y落在平均數(shù)落在平均數(shù)加減不同倍加減不同倍數(shù)標(biāo)準(zhǔn)差數(shù)標(biāo)準(zhǔn)差區(qū)間之外的概率稱為區(qū)間之外的概率稱為雙側(cè)概率雙側(cè)概率(兩尾兩尾概率概率),記作記作。 對應(yīng)于雙側(cè)概率可以求得隨機(jī)變量對應(yīng)于雙側(cè)概率可以求得隨機(jī)變量y小于小于-k或大

40、于或大于+k的概率,稱為的概率,稱為單側(cè)概率單側(cè)概率(一尾概率一尾概率),記作記作2。 例如,例如,y落在落在(-1.96,+1.96)之外的雙側(cè)之外的雙側(cè)概率為概率為0.05,而單側(cè)概率為,而單側(cè)概率為0.025。即。即 P(y-1.96)= P(y+1.96)=0.025 雙側(cè)概率或單側(cè)概率如雙側(cè)概率或單側(cè)概率如圖圖410所示。所示。 y落在落在(-2.58,+2.58)之外的雙側(cè)概率為之外的雙側(cè)概率為0.01,而單側(cè)概率,而單側(cè)概率 P(y-2.58)= P(y+2.58)=0.005 圖410 雙側(cè)概率與單側(cè)概率 附表附表3給出了滿足給出了滿足P (u )=的雙側(cè)的雙側(cè)分位分位 的數(shù)值

41、。因此,的數(shù)值。因此, 只要已知雙側(cè)概率只要已知雙側(cè)概率的的值,由附表值,由附表3就可直接查出對應(yīng)的雙側(cè)分位就可直接查出對應(yīng)的雙側(cè)分位數(shù)數(shù) ,查法與附表,查法與附表2相同。相同。 例如,已知例如,已知uN(0,1)試求:試求: (1) P(u- )+P(u )=0.10的的 (2) P(- u =0.86的的 因?yàn)楦奖硪驗(yàn)楦奖?中的中的值是:值是:uuudueuuu221211uuuuuu所以所以 (1) P(u- )+ P(u ) =1- P(- u =0.10=由附表由附表3查得:查得: =1.644854 (2) P (- u ) =0.86 , =1- P (- u )=1-0.86=

42、0.14 由附表由附表3查得:查得: =1.475791 對于對于yN(,2),只要將其轉(zhuǎn)換為,只要將其轉(zhuǎn)換為uN(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。即可求得相應(yīng)的雙側(cè)分位數(shù)。 10. 0u14. 0uuuuuuuuu 例例4.4 假定假定y是一隨機(jī)變數(shù)具有正態(tài)分布,平均數(shù)是一隨機(jī)變數(shù)具有正態(tài)分布,平均數(shù) =30,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差 =5,試計(jì)算小于,試計(jì)算小于26,小于,小于40的概率,的概率,介乎介乎26和和40區(qū)間的概率以及大于區(qū)間的概率以及大于40的概率。的概率。 首先計(jì)算:首先計(jì)算:)26()26(NFyP先將先將y轉(zhuǎn)換為轉(zhuǎn)換為u值值 p63 8053026.yu同理可得:同理可得:

43、FN(40)=0.9773 所以:所以:P(26y40)=FN(40)FN(26)=0.97730.2119 = 0.7654 P(y40)=1P(y40)=10.9773 =0.0227 查附表查附表2,當(dāng),當(dāng)u=0.8時(shí),時(shí),F(xiàn)N(26)=0.2119,說明這,說明這一分布從一分布從到到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,或者說,y26概率為概率為0.2119.10152025303540450.0000.0040.0080.0120.0160.02010152025303540450.0000.0040.0080.0120.0160.02010152025303540450.0000.0040.0080.0120.0160.02010152025303540450.0000.0040.0080.0120.0160.020)(yfN)(yfN)(yfN)(yfN2119. 0)26(yP9773. 0)40(yP7654. 0)4026( yP0227. 0)40(yP圖4.12 概率計(jì)算圖示 p63 例例4.5 在應(yīng)用正態(tài)分布時(shí),經(jīng)常要討論隨機(jī)變數(shù)在應(yīng)用正態(tài)分布時(shí),經(jīng)常要討論隨機(jī)變數(shù)y離其平均數(shù)的差數(shù)大于或小于若干個值的概率。例如計(jì)離其平均數(shù)的差數(shù)大于或小于若干個值的概率。例如計(jì)算離均差絕對值等于小于和等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論