理論分布與抽樣分布_第1頁
理論分布與抽樣分布_第2頁
理論分布與抽樣分布_第3頁
理論分布與抽樣分布_第4頁
理論分布與抽樣分布_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

理論分布與抽樣分布第一頁,共四十八頁,編輯于2023年,星期日Section3.1

二項分布

TheBinomialDistributions第二頁,共四十八頁,編輯于2023年,星期日一、二項分布設(shè)定

TheBinomialSetting固定的觀察次數(shù)n。n次的觀察都獨立,每次的觀察都不會對其他觀察提供任何信息。每次的觀察都只有兩種可能的結(jié)果,多假設(shè)為“成功”或“失敗”兩種。每次的觀察“成功”的概率都一樣,設(shè)定為p。第三頁,共四十八頁,編輯于2023年,星期日二、二項分布

BinomialDistribution滿足二項分布設(shè)定的試驗,以X記錄n次觀察中“成功”的次數(shù),則稱X的分布為參數(shù)為n與p的二項分布(binomial),記為B(n,p)。X的所有可能取值為{0,1,…,n}。對應(yīng)的概率函數(shù)為P(X=x)=P(x)。第四頁,共四十八頁,編輯于2023年,星期日

[例]有一批食品,其合格率為0.85,今在該批食品中隨機抽取6分該食品,求正好有5份食品合格的概率?

由前述所知,在二項分布中n辭試驗正好有k次發(fā)生的概率公式就:

三、二項分布概率的計算第五頁,共四十八頁,編輯于2023年,星期日若問最多有4個合格的概率為多少?則應(yīng)該應(yīng)用累積函數(shù),即第六頁,共四十八頁,編輯于2023年,星期日四、二項分布的期望值與標(biāo)準(zhǔn)差期望值:E(X)=np方差: Var(X)=np(1-p)標(biāo)準(zhǔn)差:第七頁,共四十八頁,編輯于2023年,星期日Section3.2

NormalDistributions

正態(tài)分布第八頁,共四十八頁,編輯于2023年,星期日一、特點正態(tài)曲線所有正態(tài)曲線都有相同的外型具有對稱、單峰及鐘形的特性。正態(tài)曲線所代表的分布即為正態(tài)分布(normaldistribution)每一正態(tài)分布都有其平均值μ與標(biāo)準(zhǔn)差σ

第九頁,共四十八頁,編輯于2023年,星期日ms第十頁,共四十八頁,編輯于2023年,星期日正態(tài)曲線σ較大ms第十一頁,共四十八頁,編輯于2023年,星期日正態(tài)曲線的拐點拐點落在一個σ處拐點落在-σ處第十二頁,共四十八頁,編輯于2023年,星期日二、為什么這么重要Gooddescriptionsforsomedistributionsofrealdata身高,體重,考試成績GoodapproximationstotheresultsofmanykindsofchanceoutcomesTossingacoinmanytimesManystatisticalinferenceproceduresarebasedonnormaldistributions第十三頁,共四十八頁,編輯于2023年,星期日三、68-95-99.7規(guī)則正態(tài)分布有其特定的數(shù)據(jù)分布規(guī)則:平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布68%的觀察資料落在m的1σ之內(nèi)95%的觀察資料落在m的2σ之內(nèi)99.7%的觀察資料落在m的3σ之內(nèi)第十四頁,共四十八頁,編輯于2023年,星期日0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的資料95%的資料99.7%的資料第十五頁,共四十八頁,編輯于2023年,星期日四、變量標(biāo)準(zhǔn)化(Standardization)令觀察值x服從平均值為μ,標(biāo)準(zhǔn)差為σ的分布,則x的標(biāo)準(zhǔn)化值(standardizedvalue)定義為標(biāo)準(zhǔn)化值又稱為z-值(z-score)。第十六頁,共四十八頁,編輯于2023年,星期日標(biāo)準(zhǔn)化變量可以證明z的平均值為0z的標(biāo)準(zhǔn)差為1

第十七頁,共四十八頁,編輯于2023年,星期日五、標(biāo)準(zhǔn)正態(tài)分布變量X服從平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布,簡記為X~N(μ,σ2)。X經(jīng)過標(biāo)準(zhǔn)化后為Z(=(X-μ)/s),則Z也服從正態(tài)分布,并且平均值為0,標(biāo)準(zhǔn)差為1,即Z

~N(0,1)。我們稱Z服從標(biāo)準(zhǔn)正態(tài)(standardnormal)。第十八頁,共四十八頁,編輯于2023年,星期日六、標(biāo)準(zhǔn)正態(tài)表z表列數(shù)字是z左邊的面積z=-0.44z左邊的面積為0.33-0.440.33第十九頁,共四十八頁,編輯于2023年,星期日z表列數(shù)字是z左邊的面積z=0.44z左邊的面積為0.67第二十頁,共四十八頁,編輯于2023年,星期日七、雙側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方與左方的面積和為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a的雙側(cè)臨界值??刹楸?。m=0面積為a/2面積為a/2第二十一頁,共四十八頁,編輯于2023年,星期日八、單側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方的面積為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a的單側(cè)臨界值??刹楸?。m=0面積為a第二十二頁,共四十八頁,編輯于2023年,星期日

[例]假定y是一隨機變數(shù)具有正態(tài)分布,平均數(shù)

=30,標(biāo)準(zhǔn)差=5,試計算小于26,小于40的概率,介乎26和40區(qū)間的概率以及大于40的概率。首先計算:先將x轉(zhuǎn)換為u值

九、計算第二十三頁,共四十八頁,編輯于2023年,星期日同理可得:

FN(40)=0.9773

所以:P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654

P(x>40)=1-P(x≤40)=1-0.9773=0.0227查附表,當(dāng)u=-0.8時,F(xiàn)N(26)=0.2119,說明這一分布從-∞到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,x≤26概率為0.2119.第二十四頁,共四十八頁,編輯于2023年,星期日[例]在應(yīng)用正態(tài)分布時,經(jīng)常要討論隨機變數(shù)x離其平均數(shù)的差數(shù)大于或小于若干個值的概率。例如計算離均差絕對值等于小于和等于大于1的概率為:也可以簡寫為

第二十五頁,共四十八頁,編輯于2023年,星期日相應(yīng)地,離均差絕對值等于小于2、等于大于2、等于小于3和等于大于3的概率值為:第二十六頁,共四十八頁,編輯于2023年,星期日[例]計算正態(tài)分布曲線的中間概率為0.99時,其y或u值應(yīng)等于多少?

因為正態(tài)分布是對稱的,故在曲線左邊從-∞到-

u的概率和在曲線右邊從u到∞的概率都應(yīng)等于1/2(1-0.99)=0.005。查表,u=-2.58時,fN(x)

=0.00494≈0.005。于是知,當(dāng)±2.58時,在其范圍內(nèi)包括99%的變量,僅有1%變量在此范圍之外。上述結(jié)果寫作:第二十七頁,共四十八頁,編輯于2023年,星期日同理可求得:第二十八頁,共四十八頁,編輯于2023年,星期日同理,亦可寫成:以上

乃正態(tài)曲線下左邊一尾x從-∞到

上的面積和右邊一尾y從到∞上的面積之和,亦可寫成:第二十九頁,共四十八頁,編輯于2023年,星期日Section3.3

SamplingDistributions

抽樣分布第三十頁,共四十八頁,編輯于2023年,星期日統(tǒng)計學(xué)的一個主要任務(wù)是研究總體和樣本之間的關(guān)系。

兩個方向從總體到樣本的方向,即本節(jié)所要討論的抽樣分布。從樣本到總體的方向,即統(tǒng)計推斷問題。抽樣分布(samplingdistribution)是統(tǒng)計推斷的基礎(chǔ)。第三十一頁,共四十八頁,編輯于2023年,星期日一、統(tǒng)計數(shù)的抽樣及其分布參數(shù)從總體中隨機抽樣得到樣本,獲得樣本觀察值后可以計算一些統(tǒng)計數(shù),統(tǒng)計數(shù)分布稱為抽樣分布。抽樣

復(fù)置抽樣,指將抽得的個體放回總體后再繼續(xù)抽樣不復(fù)置抽樣,指將抽得的個體不放回總體而繼續(xù)進行抽樣第三十二頁,共四十八頁,編輯于2023年,星期日(一)樣本平均數(shù)的抽樣及其分布參數(shù)總體隨機樣本123無窮個樣本……

如圖從一個總體進行隨機抽樣可以得到許多樣本,如果總體是無限總體,那么可以得到無限多個隨機樣本。

第三十三頁,共四十八頁,編輯于2023年,星期日如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到個樣本(所有可能的樣本個數(shù))。抽樣所得到的每一個樣本可以計算一個平均數(shù),全部可能的樣本都被抽取后可以得到許多平均數(shù),如等。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構(gòu)成一個新的總體,平均數(shù)就成為這個新總體的變量。由平均數(shù)構(gòu)成的新總體的分布,稱為平均數(shù)的抽樣分布。隨機樣本的任何一種統(tǒng)計數(shù)都可以是一個變量,這種變量的分布稱為統(tǒng)計數(shù)的抽樣分布。除平均數(shù)抽樣分布外還有總和數(shù)、方差的抽樣分布等。第三十四頁,共四十八頁,編輯于2023年,星期日新總體與母總體在特征參數(shù)上存在函數(shù)關(guān)系。以平均數(shù)抽樣分布為例,這種關(guān)系可表示為以下兩個方面。

(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)相等。(2)該抽樣分布的方差與母總體方差間存在如下關(guān)系:

其中n為樣本容量。抽樣分布的標(biāo)準(zhǔn)差又稱為標(biāo)準(zhǔn)誤,它可以度量抽樣分布的變異。第三十五頁,共四十八頁,編輯于2023年,星期日設(shè)有一總體N=3(例2,4,6)。以樣本容量n=1、n=2、n=4及n=8,從總體中進行復(fù)置抽樣,抽出全部樣本于表1。表1中列出這些不同樣本容量的抽樣分布,并在圖1用方柱形圖表示其分布形狀。由表中第一列當(dāng)N=3,n=1的總體平均數(shù)和方差為:

當(dāng)樣本容量依次為2、4、8時,其相應(yīng)為4、4、4;其相應(yīng)為4/3、2/3、1/3。即,。第三十六頁,共四十八頁,編輯于2023年,星期日n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均數(shù)4444方差8/34/32/31/3表1各種不同樣本容量的樣本平均數(shù)()的抽樣分布

第三十七頁,共四十八頁,編輯于2023年,星期日n=1n=2圖4.15各種不同樣本容量的

分布方柱形圖第三十八頁,共四十八頁,編輯于2023年,星期日圖4.15各種不同樣本容量的

分布方柱形圖n=4n=8第三十九頁,共四十八頁,編輯于2023年,星期日(二)兩個獨立隨機樣本平均數(shù)差數(shù)的抽樣及其分布參數(shù)如果從一個總體隨機地抽取一個樣本容量為n1的樣本,同時隨機獨立地從另一個總體抽取一個樣本容量為n2的樣本,那么可以得到分別屬于兩個總體的樣本,這兩個獨立隨機抽取的樣本平均數(shù)間差數(shù)()的抽樣分布參數(shù)與兩個母總體間存在如下關(guān)系:(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)之差相等。(2)該抽樣分布的方差與母總體方差間的關(guān)系為:第四十頁,共四十八頁,編輯于2023年,星期日二、正態(tài)總體的抽樣分布(一)樣本平均數(shù)的分布從正態(tài)總體抽取的樣本平均數(shù)的分布一般為N(,)。圖1給出樣本容量n=1,4與9時的分布,從圖中可以看出隨著樣本容量的增加,分布的集中程度增加了,說明方差減少了。圖1不同樣本容量的抽樣分布第四十一頁,共四十八頁,編輯于2023年,星期日由中心極限定理知,只要樣本容量適當(dāng)大,不論總體分布形狀如何,其的分布都可看作為正態(tài)分布,且具平均數(shù)和方差。在實際應(yīng)用上,如n>30就可以應(yīng)用這一定理。

平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù)轉(zhuǎn)換為u變數(shù)。第四十二頁,共四十八頁,編輯于2023年,星期日(二)兩個獨立樣本平均數(shù)差數(shù)的分布假定有兩個正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為,和,,從第一個總體隨機抽取n1個觀察值,同時獨立地從第二個總體隨時機抽取n2個觀察值。這樣計算出樣本平均數(shù)和標(biāo)準(zhǔn)差,s1和,s2。從統(tǒng)計理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)()的抽樣分布,具有以下特性:

(1)如果兩個總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)()準(zhǔn)確地遵循正態(tài)分布律,無論樣本容量大或小,都有N(,)。第四十三頁,共四十八頁,編輯于2023年,星期日(2)兩個樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個總體平均數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論