本科“統(tǒng)計(jì)學(xué)”-第五章 概率分布與抽樣分布_第1頁
本科“統(tǒng)計(jì)學(xué)”-第五章 概率分布與抽樣分布_第2頁
本科“統(tǒng)計(jì)學(xué)”-第五章 概率分布與抽樣分布_第3頁
本科“統(tǒng)計(jì)學(xué)”-第五章 概率分布與抽樣分布_第4頁
本科“統(tǒng)計(jì)學(xué)”-第五章 概率分布與抽樣分布_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五

章概率分布與抽樣分布第一節(jié)隨機(jī)事件與概率分布第二節(jié)抽樣分布及其性質(zhì)學(xué)習(xí)目標(biāo)了解隨機(jī)事件及概率分布理解抽樣分布的意義了解抽樣分布的形成過程理解中心極限定理理解抽樣分布的性質(zhì)第一節(jié)隨機(jī)事件與概率分布一、隨機(jī)試驗(yàn)與隨機(jī)事件必然現(xiàn)象(確定性現(xiàn)象)變化結(jié)果是事先可以確定的,一定的條件必然導(dǎo)致某一結(jié)果這種關(guān)系通??梢杂霉交蚨蓙肀硎倦S機(jī)現(xiàn)象(有不確定性,但不等同于偶然現(xiàn)象)在相同條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象個(gè)別觀察的結(jié)果完全是偶然的、隨機(jī)會而定大量觀察的結(jié)果會呈現(xiàn)出某種規(guī)律性

(隨機(jī)性中寓含著規(guī)律性)

——統(tǒng)計(jì)規(guī)律性十五的夜晚能看見月亮?十五的月亮比初十圓!隨機(jī)試驗(yàn)嚴(yán)格意義上的隨機(jī)試驗(yàn)滿足三個(gè)條件:試驗(yàn)可以在相同的條件下重復(fù)進(jìn)行;每次試驗(yàn)的可能結(jié)果不止一個(gè),但試驗(yàn)的所有可能結(jié)果在試驗(yàn)之前是明確可知的;每次試驗(yàn)只能觀察到可能結(jié)果中的一個(gè),但在試驗(yàn)結(jié)束之前不能肯定哪一個(gè)結(jié)果會出現(xiàn)。廣義的隨機(jī)試驗(yàn)是指對隨機(jī)現(xiàn)象的觀察(或?qū)嶒?yàn))實(shí)際應(yīng)用中多數(shù)試驗(yàn)不能同時(shí)滿足上述條件,常常從廣義角度來理解。隨機(jī)事件(事件)隨機(jī)事件(簡稱事件)隨機(jī)試驗(yàn)的每一個(gè)可能結(jié)果常用大寫英文字母A、B、……、來表示基本事件(樣本點(diǎn))——中國足球隊(duì)勝、負(fù)、平不可能再分成為兩個(gè)或更多事件的事件:樣本空間(Ω)在一項(xiàng)隨機(jī)試驗(yàn)中,每一個(gè)基本事件稱為一個(gè)樣本點(diǎn),而所有樣本點(diǎn)構(gòu)成這項(xiàng)試驗(yàn)的樣本空間。顯然,樣本空間等同于集合論中的全集,基本事件對應(yīng)于全集中的元素,滿足某些規(guī)定性質(zhì)的隨機(jī)事件就是集合論中的一個(gè)子集。隨機(jī)事件(續(xù))隨機(jī)事件的兩種特例必然事件在一定條件下,每次試驗(yàn)都必然發(fā)生的事件必然事件發(fā)生的概率為1

不可能事件在一定條件下,每次試驗(yàn)都必然不會發(fā)生的事件不可能事件是一個(gè)空集(Φ)二、隨機(jī)事件的概率概率用來度量隨機(jī)事件發(fā)生的可能性大小的數(shù)值必然事件的概率為1,表示為P(

)=1不可能事件發(fā)生的可能性是零,P(

)=0隨機(jī)事件A的概率介于0和1之間,0<P(A)<1概率的統(tǒng)計(jì)定義當(dāng)試驗(yàn)次數(shù)n

很大時(shí),事件A發(fā)生頻率m/n穩(wěn)定地在某一常數(shù)p上下波動,而且這種波動的幅度一般會隨著試驗(yàn)次數(shù)增加而縮小,則定義p為事件A發(fā)生的概率當(dāng)n相當(dāng)大時(shí),可用事件發(fā)生的頻率m/n作為其概率的一個(gè)近似值——計(jì)算概率的統(tǒng)計(jì)方法(頻率方法):貝努利概型事件的概率例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)n的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右試驗(yàn)的次數(shù)正面/試驗(yàn)次數(shù)1.000.000.250.500.750255075100125實(shí)驗(yàn)次數(shù)正面正面/實(shí)驗(yàn)次數(shù)111.00210.50310.33410.25520.40630.50740.57850.63960.671070.701180.731290.751390.691490.641590.6016100.6317100.5918100.5619110.5820120.6021130.6222140.6423150.6524160.6725160.64歷史上有很多人都曾經(jīng)做過拋硬幣試驗(yàn):試驗(yàn)者試驗(yàn)次數(shù)正面出現(xiàn)的頻率蒲豐40400.5069K.皮爾遜120000.5016K.皮爾遜240000.5005羅曼諾夫斯基806400.4979三、隨機(jī)變量的概念隨機(jī)變量——表示隨機(jī)試驗(yàn)結(jié)果的變量取值是隨機(jī)的,事先不能確定取哪一個(gè)值一個(gè)取值對應(yīng)隨機(jī)試驗(yàn)的一個(gè)可能結(jié)果用大寫字母如X、Y、Z...來表示,具體取值則用相應(yīng)的小寫字母如x、y、z…來表示根據(jù)取值特點(diǎn)的不同,可分為:離散型隨機(jī)變量——取值可以一一列舉連續(xù)型隨機(jī)變量——取值不能一一列舉離散型隨機(jī)變量隨機(jī)變量X取有限個(gè)值或所有取值都可以逐個(gè)列舉出來X1,X2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營業(yè)一天電腦公司一個(gè)月的銷售銷售一輛汽車取到次品的個(gè)數(shù)顧客數(shù)銷售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1連續(xù)型隨機(jī)變量隨機(jī)變量X取無限個(gè)值所有可能取值不可以逐個(gè)列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)連續(xù)型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測量一個(gè)產(chǎn)品的長度使用壽命(小時(shí))半年后工程完成的百分比測量誤差(cm)X00

X100X0四、隨機(jī)變量的概率分布

1.離散型隨機(jī)變量的概率分布

2.連續(xù)型隨機(jī)變量的概率密度

3.分布函數(shù)不同的隨機(jī)試驗(yàn),其樣本空間的具體構(gòu)成千差萬別。但是,實(shí)質(zhì)上,如果把具體內(nèi)容抽象掉,將隨機(jī)事件數(shù)量化,就會發(fā)現(xiàn)許多隨機(jī)試驗(yàn)中概率的計(jì)算具有某種共同性,遵循某一種概率分布模型。只要能找到這些概率分布模型,就會為我們計(jì)算概率和研究同類隨機(jī)現(xiàn)象的規(guī)律性提供方便?!虼耍S機(jī)變量及其概率分布是描述隨機(jī)現(xiàn)象的重要工具。概率函數(shù)P(X=xi)=pi離散型概率分布的表示:1.離散型隨機(jī)變量的概率分布離散變量X的概率分布

——離散型隨機(jī)變量X的每一個(gè)可能的取值xi與其概率pi(i=1,2,3,…,n)之間所確立的對應(yīng)關(guān)系稱為這個(gè)離散型隨機(jī)變量的分布。概率分布具有如下兩個(gè)基本性質(zhì):(1)pi≥0,i=1,2,…,n;(2)X=xix1x2…xnP(X=xi)=pip1p2…pn離散型隨機(jī)變量的概率分布

(實(shí)例)【例】如規(guī)定打靶中域Ⅰ得2分,中域Ⅱ得1分,中域Ⅲ及中域外得0分。今某射手每100次射擊,平均有30次中域Ⅰ,60次中域Ⅱ,10次中Ⅲ及中域外。則考察每次射擊得分為0,1,2這一離散型隨機(jī)變量,求其概率分布。射擊得分的概率分布表示:分布圖0.60.30012xP(x)圖3-5例3-9的概率分布X=xi012P(X=xi)pi0.10.60.32.連續(xù)型隨機(jī)變量的概率密度對于連續(xù)型隨機(jī)變量,我們關(guān)心的往往不是它取某個(gè)特定值的概率,而是該隨機(jī)變量落在一定區(qū)間內(nèi)的概率;連續(xù)型隨機(jī)變量的概率分布只能表示為:數(shù)學(xué)函數(shù)——概率密度函數(shù)f(x)和分布函數(shù)F(x)圖形——概率密度曲線和分布函數(shù)曲線概率密度函數(shù)f(x)的函數(shù)值不是概率;而x軸以上、概率密度曲線下方面積才表示概率。f(x)xab隨機(jī)變量X在一定區(qū)間(a,b)上的概率為:

什么是

概率密度?

連續(xù)數(shù)據(jù)的概率分布:表

零件尺寸的分組表按零件尺寸分組頻數(shù)(個(gè))105~110110~115115~120120~125125~130130~135135~140358141064合計(jì)50頻數(shù)直方圖頻數(shù)(個(gè))1512963105110115120125130135140零件尺寸圖

零件尺寸分布頻數(shù)的直方圖問題:曲線下面積為1嗎?連續(xù)數(shù)據(jù)的概率分布:表

零件按尺寸數(shù)據(jù)的分組表按零件尺寸分組頻數(shù)(個(gè))頻率105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.08合計(jì)501頻率=頻數(shù)/總數(shù)頻率直方圖頻率

0.32

0.240.180.120.06105110115120125130135140零件尺寸圖

零件尺寸分布頻率的直方圖問題:曲線下面積為1嗎?連續(xù)數(shù)據(jù)的概率分布:表

零件按尺寸數(shù)據(jù)的分組表按零件尺寸分組頻數(shù)(個(gè))頻率頻率密度105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.080.0120.0200.0320.0560.0400.0240.016合計(jì)501-----頻率密度=頻率/組距頻率密度直方圖頻率密度

0.060

0.0480.0360.0240.012105110115120125130135140

零件尺寸圖

零件尺寸分布頻率密度的直方圖問題:曲線下面積為1嗎?頻數(shù)直方圖—頻率直方圖—頻率密度直方圖在頻數(shù)分布直方圖中,如果按各組的頻率密度來測定各直條的高,則第i個(gè)直條的面積等于該組的頻率,所有直條的面積之和等于1。與直方圖的直條高為頻率密度相仿,曲線上某一點(diǎn)的縱坐標(biāo)為隨機(jī)變量在相應(yīng)橫坐標(biāo)附近的一個(gè)狹小區(qū)間內(nèi)(在這個(gè)狹小區(qū)間的寬度趨近于零的過程中)取值概率的概率密度(即概率/區(qū)間寬度)。所以,這條曲線叫做隨機(jī)變量的(分布)密度曲線。今后可以看到,概率密度曲線可以用適當(dāng)?shù)臄?shù)學(xué)解析式來描述。我們把密度曲線以及相應(yīng)的數(shù)據(jù)解析式所表達(dá)的數(shù)學(xué)函數(shù)關(guān)系稱作隨機(jī)變量的(分布)密度函數(shù)。密度函數(shù)刻畫了連續(xù)型隨機(jī)變量的分布規(guī)律。相對于由頻率直方圖來描述的隨機(jī)變量的經(jīng)驗(yàn)分布來講,由密度函數(shù)所刻畫的連續(xù)型隨機(jī)變量的概率分布規(guī)律稱為它的理論分布。連續(xù)型隨機(jī)變量的分布綜上所述,連續(xù)型隨機(jī)變量X的一系列取值區(qū)間和隨機(jī)變量在該區(qū)間取值的概率之間確立的對應(yīng)關(guān)系,稱作這個(gè)連續(xù)型隨機(jī)變量的分布。連續(xù)型隨機(jī)變量的分布可以用密度函數(shù)來描述,隨機(jī)變量X的密度函數(shù)記作f(x)。頻數(shù)分布直方圖是用各組的頻率密度作直條的高來畫圖的。當(dāng)分組數(shù)無窮多,而組距(即直條的底邊長趨近于0時(shí),直方圖演變成平滑的曲線。這時(shí),直條的高就成為f(x)。連續(xù)型隨機(jī)變量X在某一數(shù)值區(qū)間[a,b]

內(nèi)取值的概率等于豎立在該區(qū)間上的、以密度曲線為上底的曲邊梯形的面積。記作:概率密度f(x)的性質(zhì)(1)f(x)≥0。概率密度是非負(fù)函數(shù)。(2)即:所有區(qū)域上取值的概率總和為1。只要滿足上述兩條性質(zhì),即可認(rèn)為是一個(gè)概率密度。f(x)xab

隨機(jī)變量X在一定區(qū)間(a,b)上的概率為:

密度曲線是把分布加以理想化之后產(chǎn)生的圖形,對于描繪大量觀測值的時(shí)候最為有用。密度曲線的結(jié)構(gòu)是利用曲線底下的面積表示落在該區(qū)的觀測值的比例。因此,必須選擇適當(dāng)?shù)某叨?,使得曲線底下的面積恰恰是1,這樣就得到一個(gè)密度曲線。3.分布函數(shù)適用于兩類隨機(jī)變量概率分布的描述分布函數(shù)的定義:F(x)=P{X≤x}連續(xù)型隨機(jī)變量的分布函數(shù)離散型隨機(jī)變量的分布函數(shù)

F(x)=f(x)xx0F(x0

)分布函數(shù)與概率密度4.隨機(jī)變量的數(shù)字特征

隨機(jī)變量的數(shù)學(xué)期望

隨機(jī)變量的方差和標(biāo)準(zhǔn)差

兩個(gè)隨機(jī)變量的協(xié)方差和相關(guān)系數(shù)(1)

隨機(jī)變量的數(shù)學(xué)期望又稱均值描述一個(gè)隨機(jī)變量的概率分布的中心位置離散型隨機(jī)變量X的數(shù)學(xué)期望:——相當(dāng)于所有可能取值以概率為權(quán)數(shù)的平均值連續(xù)型隨機(jī)變量X的數(shù)學(xué)期望:數(shù)學(xué)期望的主要數(shù)學(xué)性質(zhì)若k是一常數(shù),則

E(kX)=kE(X)對于任意兩個(gè)隨機(jī)變量X、Y,有

E(X+Y)=E(X)+E(Y)若兩個(gè)隨機(jī)變量X、Y相互獨(dú)立,則

E(XY)=E(X)E(Y)

(2)隨機(jī)變量的方差方差是它的各個(gè)可能取值偏離其均值的離差平方的均值,記為D(x)或σ2公式:離散型隨機(jī)變量的方差:連續(xù)型隨機(jī)變量的方差:方差和標(biāo)準(zhǔn)差(續(xù))標(biāo)準(zhǔn)差=方差的平方根方差和標(biāo)準(zhǔn)差都反映隨機(jī)變量取值的分散程度。它們的值越大,說明離散程度越大,其概率分布曲線越扁平。方差的主要數(shù)學(xué)性質(zhì):若k是一常數(shù),則D(k)=0;D(kX)=k2D(X)

若兩個(gè)隨機(jī)變量X、Y相互獨(dú)立,則

D(X+Y)=D(X)+D(Y)

【例3-10】試求優(yōu)質(zhì)品件數(shù)的數(shù)學(xué)期望、方差和標(biāo)準(zhǔn)差。解:σ=0.6xi012pi0.10.60.3(3)兩個(gè)隨機(jī)變量的協(xié)方差協(xié)方差的定義如果X,Y獨(dú)立(不相關(guān)),則

Cov(X,Y)=0即E(XY)=E(X)E(Y)

協(xié)方差在一定程度上反映了X、Y之間的相關(guān)性協(xié)方差受兩個(gè)變量本身量綱的影響。(4)兩個(gè)隨機(jī)變量的相關(guān)系數(shù)相關(guān)系數(shù)ρ具有如下的性質(zhì):相關(guān)系數(shù)ρ是一個(gè)無量綱的值

0≤|ρ|≤0當(dāng)ρ=0,兩個(gè)變量不相關(guān)(不存在線性相關(guān))當(dāng)|ρ|=1,兩個(gè)變量完全線性相關(guān)五、常見的概率分布現(xiàn)實(shí)世界中的隨機(jī)現(xiàn)象有無限多種,相應(yīng)地,隨機(jī)變量及其概率分布也無窮無盡。但在不同應(yīng)用背景下,隨機(jī)變量往往具有相同的性質(zhì)。在概率論發(fā)展的歷程中,數(shù)學(xué)家們總結(jié)出了很多概率模型,為我們解決不同類型的大量現(xiàn)實(shí)問題提供了極大的方便。常用概率分布及其均值、方差σ2μN(yùn)(μ,σ2)NORMDIST正態(tài)分布(a+b)/2均勻分布np(p=M/N)H(n,N,M)HYPGEOM-DIST超幾何分布λλP(λ)POISSON泊松分布p(1-p)pB(1,p)二點(diǎn)分布np(1-p)npB(n,p)BINOMDIST二項(xiàng)分布方差均值記號名稱1.二項(xiàng)試驗(yàn)

(貝努里試驗(yàn))二項(xiàng)分布與貝努里試驗(yàn)有關(guān)貝努里試驗(yàn)具有如下屬性試驗(yàn)包含了n

個(gè)相同的試驗(yàn)每次試驗(yàn)只有兩個(gè)可能的結(jié)果,即“成功”和“失敗”出現(xiàn)“成功”的概率p對每次試驗(yàn)結(jié)果是相同的;“失敗”的概率q也相同,且p+q=1n次試驗(yàn)是相互獨(dú)立的二項(xiàng)分布在n重貝努里試驗(yàn)中,“成功”的次數(shù)X服從參數(shù)為n、p的二項(xiàng)分布,記為X~B(n,p)二項(xiàng)分布的概率函數(shù):二項(xiàng)分布的數(shù)學(xué)期望和方差:n=1時(shí),二項(xiàng)分布就成了二點(diǎn)分布(0-1分布)二項(xiàng)分布圖形p=0.5時(shí),二項(xiàng)分布是以均值為中心對稱p≠0.5時(shí),二項(xiàng)分布總是非對稱的p<0.5時(shí)峰值在中心的左側(cè)p>0.5時(shí)峰值在中心的右側(cè)隨著n無限增大,二項(xiàng)分布趨近于正態(tài)分布p=0.3p=0.5p=0.7二項(xiàng)分布圖示2.泊松分布(應(yīng)用背景)通常是作為稀有事件發(fā)生次數(shù)X的概率分布模型。一段時(shí)間內(nèi)某繁忙十字路口發(fā)生交通事故的次數(shù)一定時(shí)間段內(nèi)某電話交換臺接到的電話呼叫次數(shù)…服從泊松分布的現(xiàn)象的共同特征在任意兩個(gè)很小的時(shí)間或空間區(qū)間內(nèi)事件發(fā)生次數(shù)是相互獨(dú)立的;各區(qū)間內(nèi)事件發(fā)生次數(shù)只與區(qū)間長度成比例,與區(qū)間起點(diǎn)無關(guān);在一段充分小的區(qū)間內(nèi)事件發(fā)生兩次或兩次以上的概率可以忽略不計(jì)泊松分布X服從泊松分布,記為X~P(λ):E(X)=D(X)=λ當(dāng)λ很小時(shí),泊松分布呈偏態(tài),并隨著λ增大而趨于對稱當(dāng)λ為整數(shù)時(shí),λ和(λ-1)是最可能值3.超幾何分布

N個(gè)單位的有限總體中有M個(gè)單位具有某特征。用不重復(fù)抽樣方法從總體中抽取n個(gè)單位,樣本中具有某種特征的單位數(shù)X服從超幾何分布,記為X~H(n,N,M)數(shù)學(xué)期望和方差:N很大而n相對很小時(shí),趨于二項(xiàng)分布(p=M/N)4.均勻分布X只在一有限區(qū)間[a,b]上取值且概率密度是一個(gè)常數(shù)其概率密度為:X落在子區(qū)間[c,d]

內(nèi)的概率與該子區(qū)間的長度成正比,與具體位置無關(guān)f(x)ac

dbxP(c≤X≤d)5.正態(tài)分布X~N(μ、σ2

),其概率密度為:正態(tài)分布的均值和標(biāo)準(zhǔn)差

均值E(X)=μ

方差D(X)=σ2

-∞<x<∞

正態(tài)密度曲線σ相同而μ不同的正態(tài)密度曲線

2xf(x)μ相同而σ不同的正態(tài)密度曲線f(x)σ較小σ較大x正態(tài)密度曲線的主要特性關(guān)于x=μ對稱的鐘形曲線參數(shù)μ決定正態(tài)曲線的中心位置參數(shù)σ

決定正態(tài)曲線的陡峭或扁平程度以X軸為漸近線,即當(dāng)x→±∞時(shí),f(x)→0正態(tài)密度曲線的性質(zhì)只要給出了平均數(shù)和標(biāo)準(zhǔn)差,就可以完全描述特定的正態(tài)曲線平均數(shù)決定分布的中心;標(biāo)準(zhǔn)差決定曲線的形狀:標(biāo)準(zhǔn)差就是從平均數(shù)到其左側(cè)或右側(cè)的曲率轉(zhuǎn)變點(diǎn)的距離圖6-12常用的正態(tài)概率值(在一般正態(tài)分布及標(biāo)準(zhǔn)正態(tài)分布中)-3

-2

-10

+1+2+3z-3σ-2σ-σ

+2σ+3σx99.73%95.45%68.27%3σ

原則(68-95-99.7規(guī)則)圖6-12常用的正態(tài)概率值(在一般正態(tài)分布及標(biāo)準(zhǔn)正態(tài)分布中)

-3

-2

-10

+1+2+3z-3σ-2σ-σ

+2σ+3σx99.73%95.45%68.27%|X-μ|>3σ的概率很小,因此可認(rèn)為正態(tài)隨機(jī)變量的取值幾乎全部集中在[μ-3σ,μ+3σ]區(qū)間內(nèi)——但要記住,沒有哪組資料是百分之百用正態(tài)分布描述的,68-95-99.7規(guī)則只是大體正確。利用正態(tài)分布做參數(shù)估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65xGhiselietal.1981)在他們的研究中指出:要判斷數(shù)據(jù)是否服從正態(tài)分布主要是檢驗(yàn)數(shù)據(jù)的偏度(skewness)和峰度(kurtosis)這兩個(gè)指標(biāo),檢驗(yàn)標(biāo)準(zhǔn)如下:如果數(shù)據(jù)的均值(mean)和中位數(shù)(median)相近,且斜度小于2,峰度值小于5就可以認(rèn)為該數(shù)據(jù)滿足正態(tài)分布要求;如果峰度和斜度的絕對值都超過2,那么該樣本數(shù)據(jù)就不滿足正態(tài)分布的要求。參考:符合正態(tài)分布的判斷標(biāo)準(zhǔn)正態(tài)分布最常用、最重要大千世界中許多常見的隨機(jī)現(xiàn)象服從或近似服從正態(tài)分布例如,測量誤差,同齡人的身高、體重,一批棉紗的抗拉強(qiáng)度,一種設(shè)備的使用壽命,農(nóng)作物的產(chǎn)量…特點(diǎn)是“中間多兩頭少”由于正態(tài)分布特有的數(shù)學(xué)性質(zhì),正態(tài)分布在很多統(tǒng)計(jì)理論中都占有十分重要的地位正態(tài)分布是許多概率分布的極限分布,如二項(xiàng)式分布。根據(jù)中心極限定理,不論總體服從何種分布,只要其數(shù)學(xué)期望和方差存在,對這一總體進(jìn)行重復(fù)抽樣時(shí),當(dāng)樣本量n充分大,所有樣本之和以及樣本均值就趨于正態(tài)分布。該定理為均值的抽樣推斷奠定了理論基礎(chǔ)。統(tǒng)計(jì)推斷中許多重要的分布(如χ2分布、t分布、F分布)都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的。用正態(tài)分布近似二項(xiàng)分布用正態(tài)分布近似二項(xiàng)分布的前提n很大,p不能太接近0或1(否則二項(xiàng)分布太偏)一般要求——np和np(1-p)都要大于5如果np

或np(1-p)小于5,二項(xiàng)分布可以用泊松分布來近似標(biāo)準(zhǔn)正態(tài)分布μ=0、σ=1的正態(tài)分布,記為N(0,1)其概率密度φ(x),分布函數(shù)Ф(x)X~N(μ、σ2),則:Z~N(0,1

)若Z~N(0,1

),則有:

P(|Z|≤a)=2Ф(a)-1Ф(-a)=1-Ф(a)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)正態(tài)曲線

-a

0aφ(z)zΦ(a)【例6-14】例6-14某廠生產(chǎn)的某種節(jié)能燈管的使用壽命服從正態(tài)分布,對某批產(chǎn)品測試的結(jié)果,平均使用壽命為1050小時(shí),標(biāo)準(zhǔn)差為200小時(shí)。試求:(a)使用壽命在500小時(shí)以下的燈管占多大比例?(b)使用壽命在850~1450小時(shí)的燈管占多大比例?(c)以均值為中心,95%的燈管的使用壽命在什么范圍內(nèi)?解:

X=使用壽命,X~N(1050,2002

)=Ф(2)-Ф(-1)=0.97725-0.15865=0.818695%的燈管壽命在均值左右392(即658~1442)小時(shí)=1-Ф(2.75)=1-0.99702=0.00298Excel計(jì)算正態(tài)分布的概率值方法一:先標(biāo)準(zhǔn)化——查標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表方法二:利用Excel來計(jì)算首先標(biāo)準(zhǔn)化,再選擇函數(shù)“NORMSDIST”插入函數(shù)fx——選擇“統(tǒng)計(jì)”-“NORMSDIST”,進(jìn)入“函數(shù)參數(shù)”對話框中,在Z后填入正態(tài)隨機(jī)變量的Z值;計(jì)算隨機(jī)變量取值小于等于指定Z值的累積概率值。Excel計(jì)算正態(tài)分布的概率值利用Excel來計(jì)算時(shí),也可不必標(biāo)準(zhǔn)化,此時(shí)應(yīng)利用函數(shù)“NORMDIST”插入函數(shù)fx——選擇“統(tǒng)計(jì)”-“NORMDIST”,進(jìn)入“函數(shù)參數(shù)”對話框中,在X后填入正態(tài)隨機(jī)變量的取值區(qū)間點(diǎn);在Mean后填入正態(tài)分布的均值;在Standard_dev后填入正態(tài)分布的標(biāo)準(zhǔn)差;在Cumulative后填入1(或TRUE),表示計(jì)算隨機(jī)變量取值小于等于指定值x的累積概率值。已知隨機(jī)變量的取值x,求概率值:也可在選定的輸出單元格中,順次輸入函數(shù)名和參數(shù)值即可如輸入“=NORMDIST(500,1050,200,1)”,確定后即可得到所求概率值0.0029798。已知概率值F(X≤x),求隨機(jī)變量取值的區(qū)間點(diǎn)x:選擇函數(shù)“NORMINV”

如輸入“=NORMINV(0.0029798,1050,200)”,顯示計(jì)算結(jié)果為500?!绻龖B(tài)分布本身已經(jīng)標(biāo)準(zhǔn)化,則可直接使用函數(shù)NORMSDIST和NORMSINV計(jì)算正態(tài)分布的概率值常用概率分布及其均值、方差σ2μN(yùn)(μ,σ2)NORMDIST正態(tài)分布(a+b)/2均勻分布np(p=M/N)H(n,N,M)HYPGEOM-DIST超幾何分布λλP(λ)POISSON泊松分布p(1-p)pB(1,p)二點(diǎn)分布np(1-p)npB(n,p)BINOMDIST二項(xiàng)分布方差均值記號名稱練習(xí)題1.美國家庭日常交通費(fèi)用年平均支出為6312美元(Money,2001.8)。假定交通費(fèi)用服從正態(tài)分布。(1)若已知5%的美國家庭的日常交通費(fèi)用支出低于1000美元,求日常交通費(fèi)用支出的標(biāo)準(zhǔn)差;(2)日常交通費(fèi)用支出最高的3%家庭的年化費(fèi)有多大?2.某公司正考慮提供一項(xiàng)特殊服務(wù)合同,以負(fù)擔(dān)服務(wù)工作所要求的設(shè)備租憑的總成本。根據(jù)經(jīng)驗(yàn),公司經(jīng)理估計(jì)年勞務(wù)成本近似服從正態(tài)分布,均值150元,標(biāo)準(zhǔn)差25元。(1)如果公司以每年200元的價(jià)格向客戶提供這種服務(wù)合同,則一名客戶勞務(wù)成本超過200元的合同價(jià)格概率是多少?(2)該公司每個(gè)勞務(wù)合同的期望利潤是多少?第二節(jié)抽樣分布與中心極限定理一、抽樣分布的概念二、樣本均值的抽樣分布三、樣本比率的抽樣分布四、樣本方差的抽樣分布總體概率分布與抽樣分布:如果已知總體的概率分布,就可以直接利用前面描述統(tǒng)計(jì)的有關(guān)知識計(jì)算總體的均值和方差等參數(shù);但是,在大多數(shù)的實(shí)踐應(yīng)用中,總體的概率分布是難以確知的,真實(shí)的總體均值和方差也是未知、需要我們進(jìn)行估計(jì)的;因此,我們必須先在總體中抽取樣本,根據(jù)抽樣分布計(jì)算樣本的統(tǒng)計(jì)量,并通過樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)??傮w參數(shù)

樣本統(tǒng)計(jì)量平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)統(tǒng)計(jì)量xsp總體樣本樣本統(tǒng)計(jì)量本身是隨機(jī)變量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布.抽樣分布是樣本統(tǒng)計(jì)量的概率分布,是一種理論分布即在大量重復(fù)抽樣試驗(yàn)的基礎(chǔ)上,根據(jù)統(tǒng)計(jì)量取值的集合以及相應(yīng)的概率,進(jìn)而通過判斷與比較得到統(tǒng)計(jì)量的概率分布。在實(shí)際應(yīng)用中,統(tǒng)計(jì)量的抽樣分布是通過數(shù)學(xué)推導(dǎo)或在計(jì)算機(jī)上利用程序進(jìn)行模擬而得到的.提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)

一、抽樣分布

(samplingdistribution)抽樣分布的形成過程

(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本樣本均值x是推斷總體均值

的理論基礎(chǔ)。樣本均值x的抽樣分布的形式與原有總體的分布和樣本容量n

有關(guān)。如果原有總體是正態(tài)分布,則無論樣本容量大小,樣本均值的抽樣分布都服從正態(tài)分布;如果原有總體的分布是非正態(tài)分布,就要看樣本容量的大小了。隨著樣本容量n的增大(通常要求n>30),樣本均值的抽樣分布將趨于正態(tài)分布;在樣本均值的抽樣分布符合正態(tài)分布條件時(shí),樣本均值的數(shù)學(xué)期望為總體均值,方差為總體方差的

1/n。

——(中心極限定理)二、樣本均值的抽樣分布樣本均值的抽樣分布

(一個(gè)例子)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下均值和方差總體分布14230.1.2.3樣本均值的抽樣分布

(一個(gè)例子)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布

(一個(gè)例子)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n樣本均值的分布與總體分布的比較抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X

的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論