常用概率分布_第1頁
常用概率分布_第2頁
常用概率分布_第3頁
常用概率分布_第4頁
常用概率分布_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

常用概率分布第一頁,共八十四頁,2022年,8月28日第一節(jié)概率基礎(chǔ)知識

一、概念:1、事件:必然事件不可能事件隨機事件2、頻率:設(shè)事件A在n次重復(fù)試驗中發(fā)生了m次,其比值m/n稱為事件A發(fā)生的頻率。[0,1]3、概率:某事件A在n次重復(fù)試驗中發(fā)生了m次,當(dāng)試驗次數(shù)n不斷增大時,事件A發(fā)生的頻率就越接近某一確定值p第二頁,共八十四頁,2022年,8月28日表3-1拋擲硬幣發(fā)生正面朝上的試驗記錄第三頁,共八十四頁,2022年,8月28日在一般情況下,隨機事件的概率p是不可能準(zhǔn)確得到的。通常以試驗次數(shù)n充分大時隨機事件A的頻率作為該隨機事件概率的近似值。即P(A)=p≈m/n

(n充分大)第四頁,共八十四頁,2022年,8月28日

二、概率的古典定義

若隨機試驗具有以下特征:

1、試驗的所有可能結(jié)果只有有限個;

2、各可能結(jié)果出現(xiàn)的可能性相等;

3、各可能結(jié)果兩兩互不相容。可稱為隨機試驗的古典概型。其概率可定義如下:

設(shè)樣本空間由n個等可能的基本事件所構(gòu)成,其中事件A包含有m個基本事件,則事件A的概率為m/n,即

P(A)=m/n第五頁,共八十四頁,2022年,8月28日

【例4.1】在編號為1、2、3、…、10的十頭豬中隨機抽取1頭,求下列隨機事件的概率。(1)A=“抽得一個編號≤4”;(2)B=“抽得一個編號是2的倍數(shù)”。

第六頁,共八十四頁,2022年,8月28日該試驗樣本空間由10個等可能的基本事件構(gòu)成,即n=10,而事件A所包含的基本事件有4個,即抽得編號為1,2,3,4中的任何一個,事件A便發(fā)生,于是mA=4,所以P(A)=mA/n=4/10=0.4

同理,事件B所包含的基本事件數(shù)mB=5,即抽得編號為2,4,6,8,10中的任何一個,事件B便發(fā)生,故

P(B)=mB/n=5/10=0.5。

第七頁,共八十四頁,2022年,8月28日概率的性質(zhì)

1、對于任何事件A,有0≤P(A)≤1;

2、必然事件的概率為1,即P(Ω)=1;

3、不可能事件的概率為0,即P(ф)=0。第八頁,共八十四頁,2022年,8月28日三、概率的計算1、事件的相互關(guān)系:和事件積事件互斥事件獨立事件完全事件系:如果多個事件A1、A2、…An兩兩互斥,且每次試驗結(jié)果必然發(fā)生其一,則稱這些事件為完全事件系。第九頁,共八十四頁,2022年,8月28日2、法則:加法定理:互斥事件A和Bp(A+B)=p(A)+p(B)對立事件p(A)=1-p(A)乘法定理:獨立事件A和Bp(A.B)=p(A).P(B)【例4.2】:播種玉米時,每穴播種兩粒種子,已知玉米種子的發(fā)芽率為90%,試求每穴兩粒種子均發(fā)芽的概率和一粒種子發(fā)芽的概率第十頁,共八十四頁,2022年,8月28日練習(xí):今有兩頭懷胎母牛,求下列概率:(1)產(chǎn)兩頭母犢;(2)產(chǎn)一頭母犢和一頭公犢雛雞20只,雌雄各半,從中任意取出4只,求下列概率:(1)4只皆雌雞;(2)恰有2只雌雞第十一頁,共八十四頁,2022年,8月28日【例4.3】在N頭奶牛中,有M頭曾有流產(chǎn)史,從這群奶牛中任意抽出n頭奶牛,試求:(1)其中恰有m頭有流產(chǎn)史奶牛的概率是多少?(2)若N=30,M=8,n=10,m=2,其概率是多少?從N頭奶牛中任意抽出n頭奶牛的基本事件總數(shù)為;事件A

所包含的基本事件數(shù)為;因此所求事件A的概率為:第十二頁,共八十四頁,2022年,8月28日將N=30,M=8,n=10,m=2代入上式,得

=0.0695

即在30頭奶牛中有8頭曾有流產(chǎn)史,從這群奶牛隨機抽出10頭奶牛其中有2頭曾有流產(chǎn)史的概率為6.95%。

第十三頁,共八十四頁,2022年,8月28日

四、小概率事件實際不可能性原理隨機事件的概率表示了隨機事件在一次試驗中出現(xiàn)的可能性大小。若隨機事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件。在統(tǒng)計學(xué)上,把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件,稱為小概率事件實際不可能性原理,亦稱為小概率原理。是統(tǒng)計學(xué)上進行假設(shè)檢驗(顯著性檢驗)的基本依據(jù)。

第十四頁,共八十四頁,2022年,8月28日第二節(jié)概率分布事件的概率表示了一次試驗?zāi)骋粋€結(jié)果發(fā)生的可能性大小。若要全面了解試驗,則必須知道試驗的全部可能結(jié)果及各種可能結(jié)果發(fā)生的概率,即必須知道隨機試驗的概率分布。隨機變量:離散型隨機變量連續(xù)型隨機變量第十五頁,共八十四頁,2022年,8月28日一、離散型隨機變量的概率分布將離散型隨機變量x的一切可能取值xi

(i=1,2,…),及其對應(yīng)的概率pi,記作

P(x=xi)=pi

i=1,2,…(4-3)

則稱(4-3)式為離散型隨機變量x的概率分布或分布。常用分布列來表示離散型隨機變量:

x1x2

…xn

….p1p2

…pn

顯然離散型隨機變量的概率分布具有pi≥0和Σpi=1這兩個基本性質(zhì)。

第十六頁,共八十四頁,2022年,8月28日二、連續(xù)型隨機變量的概率分布

如果從總體中抽取樣本容量n相當(dāng)大,則頻率分布就趨于穩(wěn)定,近似于總體概率分布。對于一個連續(xù)型隨機變量x,取值于區(qū)間[a,b]內(nèi)的概率,p(a≤x<b)=此為概率密度函數(shù)。第十七頁,共八十四頁,2022年,8月28日連續(xù)型隨機變量概率分布的性質(zhì):1、分布密度函數(shù)總是大于或等于0,即f(x)≥0;2、當(dāng)隨機變量x取某一特定值時,其概率等于0;即

(c為任意實數(shù))

因而,對于連續(xù)型隨機變量,僅研究其在某一個區(qū)間內(nèi)取值的概率,而不去討論取某一個值的概率。第十八頁,共八十四頁,2022年,8月28日

3、在一次試驗中隨機變量x之取值必在

-∞<x<+∞范圍內(nèi),為一必然事件。所以

(4-5)

(4—5)式表示分布密度曲線下、橫軸上的全部面積為1。第十九頁,共八十四頁,2022年,8月28日第三節(jié)二項分布非此即彼事件所構(gòu)成的總體,為二項總體,其分布稱二項分布.如種子的發(fā)芽與不發(fā)芽,穗子有芒與無芒,后代的成活與死亡.對于二項總體,在進行重復(fù)抽樣試驗中,具有如下共同特征:1.每次試驗只有兩個對立結(jié)果,它們出現(xiàn)的概率分別為p與q;2.具有重復(fù)性和獨立性.以k表示在n次試驗中事件A出現(xiàn)的次數(shù),其概率分布函數(shù)為:k=0,1,2…,n第二十頁,共八十四頁,2022年,8月28日二項分布的意義及性質(zhì)

二項分布定義如下:設(shè)隨機變量x所有可能取的值為零和正整數(shù):0,1,2,…,n,且有

=k=0,1,2…,n

其中p>0,q>0,p+q=1,則稱隨機變量x服從參數(shù)為n和p的二項分布

(binomialdistribution),記為

x~B(n,p)。第二十一頁,共八十四頁,2022年,8月28日二項分布的平均數(shù)與標(biāo)準(zhǔn)差

統(tǒng)計學(xué)證明,服從二項分布B(n,p)的隨機變量之平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、p有如下關(guān)系:當(dāng)試驗結(jié)果以事件A發(fā)生次數(shù)k表示時

μ=npσ=第二十二頁,共八十四頁,2022年,8月28日三、二項分布的概率計算及應(yīng)用條件

【例4.9】純種白豬與純種黑豬雜交,根據(jù)孟德爾遺傳理論,子二代中白豬與黑豬的比率為3∶1。求窩產(chǎn)仔10頭,有7頭白豬的概率。根據(jù)題意,n=10,p=3/4=0.75,q=1/4=0.25。設(shè)10頭仔豬中白色的為x頭,則x為服從二項分布B(10,0.75)的隨機變量。于是窩產(chǎn)10頭仔豬中有7頭是白色的概率為:第二十三頁,共八十四頁,2022年,8月28日

【例4.10】仔豬黃痢病在常規(guī)治療下死亡率為20%,求5頭病豬治療后死亡頭數(shù)各可能值相應(yīng)的概率。設(shè)5頭病豬中死亡頭數(shù)為x,則x服從二項分布B(5,0.2),其所有可能取值為0,1,…,5,按(4-6)式計算概率,用分布列表示如下:

012345

0.32770.40960.20480.05120.00640.0003第二十四頁,共八十四頁,2022年,8月28日

二項分布的應(yīng)用條件有三:(1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或陰性,生存或死亡等,屬于二項分類資料;(2)已知發(fā)生某一結(jié)果(如死亡)的概率為p,其對立結(jié)果的概率則為1-P=q,實際中要求p

是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;(3)n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的觀察結(jié)果。第二十五頁,共八十四頁,2022年,8月28日

【例4.11】求【例4.10】平均死亡豬數(shù)及死亡數(shù)的標(biāo)準(zhǔn)差。以p=0.2,n=5代入(4-18)和(4-19)式得:平均死亡豬數(shù)μ=5×0.20=1.0(頭)

標(biāo)準(zhǔn)差σ===0.894(頭)第二十六頁,共八十四頁,2022年,8月28日

當(dāng)試驗結(jié)果以事件A發(fā)生的頻率k/n表示時

(4-20)(4-21)

也稱為總體百分?jǐn)?shù)標(biāo)準(zhǔn)誤,當(dāng)p未知時,常以樣本百分?jǐn)?shù)來估計。此時(4-21)式改寫為:

=(4-22)

稱為樣本百分?jǐn)?shù)標(biāo)準(zhǔn)誤。第二十七頁,共八十四頁,2022年,8月28日第四節(jié)波松分布波松分布是一種可以用來描述和分析隨機地發(fā)生在單位空間或時間里的稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。如,一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù),畜群中遺傳的畸形怪胎數(shù),每升飲水中大腸桿菌數(shù),計數(shù)器小方格中血球數(shù)都是服從波松分布的。第二十八頁,共八十四頁,2022年,8月28日一、波松分布的意義若隨機變量x(x=k)只取零和正整數(shù)值0,1,2,…,且其概率分布為,k=0,1,……(4-23)

其中λ>0;e=2.7182…

是自然對數(shù)的底數(shù),則稱x服從參數(shù)為λ的波松分布(Poisson‘sdistribution),記為x~P(λ)。第二十九頁,共八十四頁,2022年,8月28日波松分布重要的特征:

平均數(shù)和方差相等,都等于常數(shù)λ,即

μ=σ2=λ【例4.13】調(diào)查某種豬場閉鎖育種群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)的分布情況如表4-3所示。試判斷畸形仔豬數(shù)是否服從波松分布。第三十頁,共八十四頁,2022年,8月28日

表4-13畸形仔豬數(shù)統(tǒng)計分布樣本均數(shù)和方差S2計算結(jié)果如下:

=Σfk/n=(120×0+62×1+15×2+2×3+1×4)/200=0.51第三十一頁,共八十四頁,2022年,8月28日

=0.51,S2=0.52,這兩個數(shù)是相當(dāng)接近的,因此可以認(rèn)為畸形仔豬數(shù)服從波松分布。

第三十二頁,共八十四頁,2022年,8月28日

λ是波松分布所依賴的唯一參數(shù)。λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對稱(如圖4-11所示)。當(dāng)λ=20時分布接近于正態(tài)分布;當(dāng)λ=50時,可以認(rèn)為波松分布呈正態(tài)分布。所以在實際工作中,當(dāng)λ≥20時就可以用正態(tài)分布來近似地處理波松分布的問題。

第三十三頁,共八十四頁,2022年,8月28日如【例4.13】中已判斷畸形仔豬數(shù)服從波松分布,并已算出樣本平均數(shù)=0.51。將0.51代替公式(4-23)中的λ得:

(k=0,1,2,…)

因為e-0.51=1.6653,所以畸形仔豬數(shù)各項的概率為:P(x=0)=0.510/(0!×1.6653)=0.6005P(x=1)=0.511/(1!×1.6653)=0.3063P(x=2)=0.512/(2!×1.6653)=0.0781第三十四頁,共八十四頁,2022年,8月28日P(x=3)=0.513/(3!×1.6653)=0.0133P(x=4)=0.514/(4!×1.6653)=0.0017

把上面各項概率乘以總觀察窩數(shù)(n=200)即得各項按波松分布的理論窩數(shù)。波松分布與相應(yīng)的頻率分布列于表4—7中。第三十五頁,共八十四頁,2022年,8月28日表4—4畸形仔豬數(shù)的波松分布將實際計算得的頻率與根據(jù)λ=0.51的泊松分布計算的概率相比較,發(fā)現(xiàn)畸形仔豬的頻率分布與λ=0.51的波松分布是吻合得很好的。這進一步說明了畸形仔豬數(shù)是服從波松分布的。第三十六頁,共八十四頁,2022年,8月28日

【例4.14】為監(jiān)測飲用水的污染情況,現(xiàn)檢驗?zāi)成鐓^(qū)每毫升飲用水中細菌數(shù),共得400個記錄如下:試分析飲用水中細菌數(shù)的分布是否服從波松分布。若服從,按波松分布計算每毫升水中細菌數(shù)的概率及理論次數(shù)并將頻率分布與波松分布作直觀比較。第三十七頁,共八十四頁,2022年,8月28日經(jīng)計算得每毫升水中平均細菌數(shù)=0.500,方差S2=0.496。兩者很接近,故可認(rèn)為每毫升水中細菌數(shù)服從波松分布。以=0.500代替(4-23)式中的λ,得

(k=0,1,2…)計算結(jié)果如表4—5所示。第三十八頁,共八十四頁,2022年,8月28日表4—5細菌數(shù)的波松分布可見細菌數(shù)的頻率分布與λ=0.5的波松分布是相當(dāng)吻合的,進一步說明用波松分布描述單位容積(或面積)中細菌數(shù)的分布是適宜的。第三十九頁,共八十四頁,2022年,8月28日注意:二項分布的應(yīng)用條件也是波松分布的應(yīng)用條件。比如二項分布要求n

次試驗是相互獨立的,這也是波松分布的要求。然而一些具有傳染性的罕見疾病的發(fā)病數(shù),因為首例發(fā)生之后可成為傳染源,會影響到后續(xù)病例的發(fā)生,所以不符合波松分布的應(yīng)用條件。對于在單位時間、單位面積或單位容積內(nèi),所觀察的事物由于某些原因分布不隨機時,如細菌在牛奶中成集落存在時,亦不呈波松分布。第四十頁,共八十四頁,2022年,8月28日第五節(jié)正態(tài)分布正態(tài)分布是一種連續(xù)型隨機變量的概率分布。許多變量服從或近似服從正態(tài)分布。許多統(tǒng)計分析方法以正態(tài)分布為基礎(chǔ)的。大多隨機變量的概率分布在一定條件下以正態(tài)分布為其極限分布。第四十一頁,共八十四頁,2022年,8月28日一、正態(tài)分布的定義及其特征

(一)正態(tài)分布的定義若連續(xù)型隨機變量x的概率分布密度函數(shù)為

(4-6)

其中μ為平均數(shù),σ2為方差,則稱隨機變量x服從正態(tài)分布,記為x~N(μ,σ2)。相應(yīng)的概率分布函數(shù)為

(4-7)

第四十二頁,共八十四頁,2022年,8月28日

(二)

正態(tài)分布的特征

1、正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x=μ;

2、f(x)在x=μ處達到極大,;

3、f(x)是非負函數(shù),以x軸為漸近線,分布從-∞至+∞;第四十三頁,共八十四頁,2022年,8月28日

4、曲線在x=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;

5、正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。

6、分布密度曲線與橫軸所夾的面積為1,即:

第四十四頁,共八十四頁,2022年,8月28日二、標(biāo)準(zhǔn)正態(tài)分布μ=0,σ2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布.

標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及概率累積函數(shù)分別記作f(u)和F(u),由(4-6)及(4-7)式得:

(4-8)(4-9)

隨機變量u服從標(biāo)準(zhǔn)正態(tài)分布,記作u~N(0,1)第四十五頁,共八十四頁,2022年,8月28日

對于任何一個服從正態(tài)分布N(μ,σ2)的隨機變量x,都可以通過標(biāo)準(zhǔn)化變換:

u=(x-μ)/σ(4-10)u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)。

第四十六頁,共八十四頁,2022年,8月28日三、正態(tài)分布的概率計算

(一)標(biāo)準(zhǔn)正態(tài)分布的概率計算

設(shè)u服從標(biāo)準(zhǔn)正態(tài)分布,則u在[u1,u2

) 區(qū)間內(nèi)取值的概率為:=F(u2)-F(u1)(4-11)而F(u1)與F(u2)可由附表1查得。第四十七頁,共八十四頁,2022年,8月28日

例如,u=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行與0.05所在列相交處的數(shù)值為0.95994,即F(1.75)=0.95994。若給定F(u)值,例如F(u)=0.284,反過來查u值。這只要在附表1中找到與0.284最接近的值0.2843,對應(yīng)行的第一列數(shù)-0.5,對應(yīng)列的第一行數(shù)值0.07,即相應(yīng)的u值為u=-0.57,亦即F(-0.57)=0.284。如果要求更精確的u值,可用線性插值法計算。第四十八頁,共八十四頁,2022年,8月28日

由(4-11)式及正態(tài)分布的對稱性可推出下列關(guān)系式,再借助附表1,便能很方便地計算有關(guān)概率:

P(u≥u1)=F(-u1)

P(|u|≥u1)=2F(-u1)

P(|u|<u1)=1-2F(-u1)

P(u1

≤u<u2)=F(u2)-F(u1)第四十九頁,共八十四頁,2022年,8月28日

【例4.6】已知u~N(0,1),試求:

(1)P(u<-1.64)=?(2)P(u≥2.58)=?(3)P(|u|≥2.56)=?(4)P(0.34≤u<1.53)=?第五十頁,共八十四頁,2022年,8月28日利用(4-12)式,查附表1得:

(1)P(u<-1.64)=0.05050(2)P(u≥2.58)=F(-2.58)=0.024940(3)P(|u|≥2.56)=2F(-2.56)=2×0.005234=0.010468(4)P(0.34≤u<1.53)=F(1.53)-F(0.34)=0.93669-0.6331=0.30389第五十一頁,共八十四頁,2022年,8月28日關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記:

P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99

第五十二頁,共八十四頁,2022年,8月28日

u變量在上述區(qū)間以外取值的概率分別為:

P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)

=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01第五十三頁,共八十四頁,2022年,8月28日

(二)一般正態(tài)分布的概率計算

X~N(μ,σ2),則x的取值落在任意區(qū)間[x1,x2)的概率,記作P(x1≤x<x2),即:(4-13)

對(4-13)式作變換u=(x-μ)/σ,得dx=σdu,故有第五十四頁,共八十四頁,2022年,8月28日

【例4.7】設(shè)x服從μ=30.26,σ2=5.102的正態(tài)分布,試求P(21.64≤x<32.98)。令則u服從標(biāo)準(zhǔn)正態(tài)分布,故

=P(-1.69≤u<0.53)=F(0.53)-F(-1.69)=0.6564

第五十五頁,共八十四頁,2022年,8月28日關(guān)于一般正態(tài)分布,以下幾個概率(即隨機變量x落在μ加減不同倍數(shù)σ區(qū)間的概率)是經(jīng)常用到的。

P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99第五十六頁,共八十四頁,2022年,8月28日例:126頭基礎(chǔ)母羊體重資料的次數(shù)分布接近正態(tài)分布,現(xiàn)根據(jù)其平均數(shù)=52.26(kg),標(biāo)準(zhǔn)差S=5.10(kg),算出平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間內(nèi)所包括的次數(shù)與頻率,列于表4—2。試計算:母羊體重的95%正常值范圍;體重大于70kg的概率第五十七頁,共八十四頁,2022年,8月28日表4—2126頭基礎(chǔ)母羊體重在±kS

區(qū)間內(nèi)所包括的次數(shù)與頻率第五十八頁,共八十四頁,2022年,8月28日由上表可見,實際頻率與理論概率相當(dāng)接近,說明126頭基礎(chǔ)母羊體重資料的頻率分布接近正態(tài)分布,從而可推斷基礎(chǔ)母羊體重這一隨機變量很可能服從正態(tài)分布。(1)查附表2,得兩尾概率U0.05=1.96,于是:上限為:下限為:(2)求得U=查附表1,F(U),P(x≥70)=1-F(U)=第五十九頁,共八十四頁,2022年,8月28日例如,x落在(μ-1.96σ,μ+1.96σ)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025。即

P(x<μ-1.96σ==P(x>μ+1.96σ)=0.025

雙側(cè)概率或單側(cè)概率區(qū)別如下:

x落在(μ-2.58σ,μ+2.58σ)之外的雙側(cè)概率為0.01,而單側(cè)概率

P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.005第六十頁,共八十四頁,2022年,8月28日

附表2給出了滿足P(|u|>)=α的雙側(cè)分位的數(shù)值。因此,只要已知雙側(cè)概率α的值,由附表2就可直接查出對應(yīng)的雙側(cè)分位數(shù),查法與附表1相同。例如,已知u~N(0,1)試求:

(1)P(u<-)+P(u≥)=0.10的

(2)P(-≤u<﹚=0.86的因為附表2中的α值是:第六十一頁,共八十四頁,2022年,8月28日所以(1)P(u<-)+P(u≥)=1-P(-≤u<﹚=0.10=α由附表2查得:=1.644854(2)P(-≤u<)=0.86,

α=1-P(-≤u<)=1-0.86=0.14

由附表2查得:=1.475791

對于x~N(μ,σ2),只要將其轉(zhuǎn)換為u~N(0,1),即可求得相應(yīng)的雙側(cè)分位數(shù)。第六十二頁,共八十四頁,2022年,8月28日三個分布函數(shù)的主要特征:適應(yīng)范圍、概率函數(shù)、表示形式、參數(shù)第六十三頁,共八十四頁,2022年,8月28日前面討論的三個重要的概率分布的關(guān)系如下:

對于二項分布,在n→∞,p→0,且np=λ(較小常數(shù))情況下,二項分布趨于波松分布。在這種場合,波松分布中的參數(shù)λ用二項分布的np代之;在n→∞,p→0.5時,二項分布趨于正態(tài)分布。在這種場合,正態(tài)分布中的μ、σ2用二項分布的np、np

q代之。在實際計算中,當(dāng)p<0.1且n很大時,二項分布可由波松分布近似;當(dāng)p>0.1且n很大時,二項分布可由正態(tài)分布近似。第六十四頁,共八十四頁,2022年,8月28日對于波松分布,當(dāng)λ→∞時,波松分布以正態(tài)分布為極限。在實際計算中,當(dāng)λ≥20(也有人認(rèn)為λ≥6)時,用波松分布中的λ代替正態(tài)分布中的μ及σ2,即可由后者對前者進行近似計算。第六十五頁,共八十四頁,2022年,8月28日第六節(jié)樣本平均數(shù)的抽樣分布統(tǒng)計的主要研究內(nèi)容:抽樣分布的問題---從總體到樣本;統(tǒng)計推斷問題---從樣本到總體.樣本統(tǒng)計量也是隨機變量,也有其概率分布。因此,把統(tǒng)計量的概率分布稱為抽樣分布。第六十六頁,共八十四頁,2022年,8月28日一、樣本平均數(shù)抽樣分布設(shè)有一總體,平均數(shù)為μ,方差為σ2。從總體中隨機抽取含量為n的樣本,樣本平均數(shù)記。如做可放回抽樣,可抽出很多甚至無窮多個含量為n的樣本。樣本平均數(shù)有大有小,與μ相比存有不同程度的差異。這種差異是由隨機抽樣造成的,稱為抽樣誤差。樣本平均數(shù)也是一個隨機變量,其概率分布叫做樣本平均數(shù)的抽樣分布。由樣本平均數(shù)構(gòu)成的總體稱為樣本平均數(shù)的抽樣總體,其平均數(shù)和標(biāo)準(zhǔn)差分別記為和。是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡稱標(biāo)準(zhǔn)誤,它表示平均數(shù)抽樣誤差的大小。第六十七頁,共八十四頁,2022年,8月28日總體的兩個參數(shù)與x

總體的兩個參數(shù)關(guān)系如下:

例:設(shè)有一個N=4的有限總體,變數(shù)為2、3、3、4。根據(jù)μ=Σx/N和σ2=Σ(x-μ)2/N求得該總體的μ、σ2、σ為:μ=3,σ2=1/2,σ==0.707第六十八頁,共八十四頁,2022年,8月28日從有限總體作返置隨機抽樣,所有可能的樣本數(shù)為Nn其中n為樣本含量。以上述總體而論,如果從中抽取n=2的樣本,共可得42=16個樣本;如果樣本含量n為4,則一共可抽得44=256個樣本。分別求這些樣本的平均數(shù),其次數(shù)分布如表4—6所示。根據(jù)表4—6,在n=2的試驗中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為:第六十九頁,共八十四頁,2022年,8月28日

=4/16=1/4=(1/2)/2=第七十頁,共八十四頁,2022年,8月28日表4—6N=4,n=2和n=4時的次數(shù)分布第七十一頁,共八十四頁,2022年,8月28日同理,可得n=4時:這就驗證了=μ,的正確性。

第七十二頁,共八十四頁,2022年,8月28日二、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差)的大小反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。與σ成正比,與n的平方根成反比。從某特定總體抽樣,因為σ是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。第七十三頁,共八十四頁,2022年,8月28日

對于大樣本資料,常將樣本標(biāo)準(zhǔn)差S與樣本平均數(shù)配合使用,記為±S,用以說明所考察性狀或指標(biāo)的優(yōu)良性與穩(wěn)定性。

對于小樣本資料,常將樣本標(biāo)準(zhǔn)誤與樣本平均數(shù)配合使用,記為±,用以表示所考察性狀或指標(biāo)的優(yōu)良性與抽樣誤差的大小。第七十四頁,共八十四頁,2022年,8月28日第七節(jié)

t

分布由樣本平均數(shù)抽樣分布的性質(zhì)知道:若x~N(μ,σ2),則~N(μ,σ2/n)。將隨機變量標(biāo)準(zhǔn)化得:,則u~N(0,1)。當(dāng)總體標(biāo)準(zhǔn)差σ未知時,以樣本標(biāo)準(zhǔn)差S代替σ所得到的統(tǒng)計量記為t。在計算時,由于采用S來代替σ,使得t

變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(t-distribution)。它的概率分布密度函數(shù)如下:第七十五頁,共八十四頁,2022年,8月28日

(4-26)

式中,t的取值范圍是(-∞,+∞);

df=n-1為自由度。

t分布的平均數(shù)和標(biāo)準(zhǔn)差為:μt=0(df>1),(df>2)(4-27)t分布密度曲線如圖4-13所示,其特點是:第七十六頁,共八十四頁,2022年,8月28日

1、t分布受自由度的制約,每一個自由度都有一條t分布密度曲線。

2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t=0時,分布密度函數(shù)取得最大值。

3、與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論