版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
理論分布與抽樣分布第一頁,共四十八頁,編輯于2023年,星期日Section3.1
二項分布
TheBinomialDistributions第二頁,共四十八頁,編輯于2023年,星期日一、二項分布設(shè)定
TheBinomialSetting固定的觀察次數(shù)n。n次的觀察都獨立,每次的觀察都不會對其他觀察提供任何信息。每次的觀察都只有兩種可能的結(jié)果,多假設(shè)為“成功”或“失敗”兩種。每次的觀察“成功”的概率都一樣,設(shè)定為p。第三頁,共四十八頁,編輯于2023年,星期日二、二項分布
BinomialDistribution滿足二項分布設(shè)定的試驗,以X記錄n次觀察中“成功”的次數(shù),則稱X的分布為參數(shù)為n與p的二項分布(binomial),記為B(n,p)。X的所有可能取值為{0,1,…,n}。對應(yīng)的概率函數(shù)為P(X=x)=P(x)。第四頁,共四十八頁,編輯于2023年,星期日
[例]有一批食品,其合格率為0.85,今在該批食品中隨機抽取6分該食品,求正好有5份食品合格的概率?
由前述所知,在二項分布中n辭試驗正好有k次發(fā)生的概率公式就:
三、二項分布概率的計算第五頁,共四十八頁,編輯于2023年,星期日若問最多有4個合格的概率為多少?則應(yīng)該應(yīng)用累積函數(shù),即第六頁,共四十八頁,編輯于2023年,星期日四、二項分布的期望值與標(biāo)準(zhǔn)差期望值:E(X)=np方差: Var(X)=np(1-p)標(biāo)準(zhǔn)差:第七頁,共四十八頁,編輯于2023年,星期日Section3.2
NormalDistributions
正態(tài)分布第八頁,共四十八頁,編輯于2023年,星期日一、特點正態(tài)曲線所有正態(tài)曲線都有相同的外型具有對稱、單峰及鐘形的特性。正態(tài)曲線所代表的分布即為正態(tài)分布(normaldistribution)每一正態(tài)分布都有其平均值μ與標(biāo)準(zhǔn)差σ
第九頁,共四十八頁,編輯于2023年,星期日ms第十頁,共四十八頁,編輯于2023年,星期日正態(tài)曲線σ較大ms第十一頁,共四十八頁,編輯于2023年,星期日正態(tài)曲線的拐點拐點落在一個σ處拐點落在-σ處第十二頁,共四十八頁,編輯于2023年,星期日二、為什么這么重要Gooddescriptionsforsomedistributionsofrealdata身高,體重,考試成績GoodapproximationstotheresultsofmanykindsofchanceoutcomesTossingacoinmanytimesManystatisticalinferenceproceduresarebasedonnormaldistributions第十三頁,共四十八頁,編輯于2023年,星期日三、68-95-99.7規(guī)則正態(tài)分布有其特定的數(shù)據(jù)分布規(guī)則:平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布68%的觀察資料落在m的1σ之內(nèi)95%的觀察資料落在m的2σ之內(nèi)99.7%的觀察資料落在m的3σ之內(nèi)第十四頁,共四十八頁,編輯于2023年,星期日0123-1-2-3mm+sm+2sm+3sm-sm-2sm-3s68%的資料95%的資料99.7%的資料第十五頁,共四十八頁,編輯于2023年,星期日四、變量標(biāo)準(zhǔn)化(Standardization)令觀察值x服從平均值為μ,標(biāo)準(zhǔn)差為σ的分布,則x的標(biāo)準(zhǔn)化值(standardizedvalue)定義為標(biāo)準(zhǔn)化值又稱為z-值(z-score)。第十六頁,共四十八頁,編輯于2023年,星期日標(biāo)準(zhǔn)化變量可以證明z的平均值為0z的標(biāo)準(zhǔn)差為1
第十七頁,共四十八頁,編輯于2023年,星期日五、標(biāo)準(zhǔn)正態(tài)分布變量X服從平均值為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布,簡記為X~N(μ,σ2)。X經(jīng)過標(biāo)準(zhǔn)化后為Z(=(X-μ)/s),則Z也服從正態(tài)分布,并且平均值為0,標(biāo)準(zhǔn)差為1,即Z
~N(0,1)。我們稱Z服從標(biāo)準(zhǔn)正態(tài)(standardnormal)。第十八頁,共四十八頁,編輯于2023年,星期日六、標(biāo)準(zhǔn)正態(tài)表z表列數(shù)字是z左邊的面積z=-0.44z左邊的面積為0.33-0.440.33第十九頁,共四十八頁,編輯于2023年,星期日z表列數(shù)字是z左邊的面積z=0.44z左邊的面積為0.67第二十頁,共四十八頁,編輯于2023年,星期日七、雙側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方與左方的面積和為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a的雙側(cè)臨界值??刹楸?。m=0面積為a/2面積為a/2第二十一頁,共四十八頁,編輯于2023年,星期日八、單側(cè)臨界值在標(biāo)準(zhǔn)正態(tài)曲線圖下,右方的面積為a,則稱為標(biāo)準(zhǔn)正態(tài)分布概率為a的單側(cè)臨界值??刹楸?。m=0面積為a第二十二頁,共四十八頁,編輯于2023年,星期日
[例]假定y是一隨機變數(shù)具有正態(tài)分布,平均數(shù)
=30,標(biāo)準(zhǔn)差=5,試計算小于26,小于40的概率,介乎26和40區(qū)間的概率以及大于40的概率。首先計算:先將x轉(zhuǎn)換為u值
九、計算第二十三頁,共四十八頁,編輯于2023年,星期日同理可得:
FN(40)=0.9773
所以:P(26<x≤40)=FN(40)-FN(26)=0.9773-0.2119=0.7654
P(x>40)=1-P(x≤40)=1-0.9773=0.0227查附表,當(dāng)u=-0.8時,F(xiàn)N(26)=0.2119,說明這一分布從-∞到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,x≤26概率為0.2119.第二十四頁,共四十八頁,編輯于2023年,星期日[例]在應(yīng)用正態(tài)分布時,經(jīng)常要討論隨機變數(shù)x離其平均數(shù)的差數(shù)大于或小于若干個值的概率。例如計算離均差絕對值等于小于和等于大于1的概率為:也可以簡寫為
第二十五頁,共四十八頁,編輯于2023年,星期日相應(yīng)地,離均差絕對值等于小于2、等于大于2、等于小于3和等于大于3的概率值為:第二十六頁,共四十八頁,編輯于2023年,星期日[例]計算正態(tài)分布曲線的中間概率為0.99時,其y或u值應(yīng)等于多少?
因為正態(tài)分布是對稱的,故在曲線左邊從-∞到-
u的概率和在曲線右邊從u到∞的概率都應(yīng)等于1/2(1-0.99)=0.005。查表,u=-2.58時,fN(x)
=0.00494≈0.005。于是知,當(dāng)±2.58時,在其范圍內(nèi)包括99%的變量,僅有1%變量在此范圍之外。上述結(jié)果寫作:第二十七頁,共四十八頁,編輯于2023年,星期日同理可求得:第二十八頁,共四十八頁,編輯于2023年,星期日同理,亦可寫成:以上
乃正態(tài)曲線下左邊一尾x從-∞到
上的面積和右邊一尾y從到∞上的面積之和,亦可寫成:第二十九頁,共四十八頁,編輯于2023年,星期日Section3.3
SamplingDistributions
抽樣分布第三十頁,共四十八頁,編輯于2023年,星期日統(tǒng)計學(xué)的一個主要任務(wù)是研究總體和樣本之間的關(guān)系。
兩個方向從總體到樣本的方向,即本節(jié)所要討論的抽樣分布。從樣本到總體的方向,即統(tǒng)計推斷問題。抽樣分布(samplingdistribution)是統(tǒng)計推斷的基礎(chǔ)。第三十一頁,共四十八頁,編輯于2023年,星期日一、統(tǒng)計數(shù)的抽樣及其分布參數(shù)從總體中隨機抽樣得到樣本,獲得樣本觀察值后可以計算一些統(tǒng)計數(shù),統(tǒng)計數(shù)分布稱為抽樣分布。抽樣
復(fù)置抽樣,指將抽得的個體放回總體后再繼續(xù)抽樣不復(fù)置抽樣,指將抽得的個體不放回總體而繼續(xù)進行抽樣第三十二頁,共四十八頁,編輯于2023年,星期日(一)樣本平均數(shù)的抽樣及其分布參數(shù)總體隨機樣本123無窮個樣本……
如圖從一個總體進行隨機抽樣可以得到許多樣本,如果總體是無限總體,那么可以得到無限多個隨機樣本。
第三十三頁,共四十八頁,編輯于2023年,星期日如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到個樣本(所有可能的樣本個數(shù))。抽樣所得到的每一個樣本可以計算一個平均數(shù),全部可能的樣本都被抽取后可以得到許多平均數(shù),如等。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構(gòu)成一個新的總體,平均數(shù)就成為這個新總體的變量。由平均數(shù)構(gòu)成的新總體的分布,稱為平均數(shù)的抽樣分布。隨機樣本的任何一種統(tǒng)計數(shù)都可以是一個變量,這種變量的分布稱為統(tǒng)計數(shù)的抽樣分布。除平均數(shù)抽樣分布外還有總和數(shù)、方差的抽樣分布等。第三十四頁,共四十八頁,編輯于2023年,星期日新總體與母總體在特征參數(shù)上存在函數(shù)關(guān)系。以平均數(shù)抽樣分布為例,這種關(guān)系可表示為以下兩個方面。
(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)相等。(2)該抽樣分布的方差與母總體方差間存在如下關(guān)系:
其中n為樣本容量。抽樣分布的標(biāo)準(zhǔn)差又稱為標(biāo)準(zhǔn)誤,它可以度量抽樣分布的變異。第三十五頁,共四十八頁,編輯于2023年,星期日設(shè)有一總體N=3(例2,4,6)。以樣本容量n=1、n=2、n=4及n=8,從總體中進行復(fù)置抽樣,抽出全部樣本于表1。表1中列出這些不同樣本容量的抽樣分布,并在圖1用方柱形圖表示其分布形狀。由表中第一列當(dāng)N=3,n=1的總體平均數(shù)和方差為:
當(dāng)樣本容量依次為2、4、8時,其相應(yīng)為4、4、4;其相應(yīng)為4/3、2/3、1/3。即,。第三十六頁,共四十八頁,編輯于2023年,星期日n=1n=2n=4n=8yffff24611123456123212.02.53.03.54.04.55.05.56.0141016191610412.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.001836112266504784101611071016784504266112368139816561平均數(shù)4444方差8/34/32/31/3表1各種不同樣本容量的樣本平均數(shù)()的抽樣分布
第三十七頁,共四十八頁,編輯于2023年,星期日n=1n=2圖4.15各種不同樣本容量的
分布方柱形圖第三十八頁,共四十八頁,編輯于2023年,星期日圖4.15各種不同樣本容量的
分布方柱形圖n=4n=8第三十九頁,共四十八頁,編輯于2023年,星期日(二)兩個獨立隨機樣本平均數(shù)差數(shù)的抽樣及其分布參數(shù)如果從一個總體隨機地抽取一個樣本容量為n1的樣本,同時隨機獨立地從另一個總體抽取一個樣本容量為n2的樣本,那么可以得到分別屬于兩個總體的樣本,這兩個獨立隨機抽取的樣本平均數(shù)間差數(shù)()的抽樣分布參數(shù)與兩個母總體間存在如下關(guān)系:(1)該抽樣分布的平均數(shù)與母總體的平均數(shù)之差相等。(2)該抽樣分布的方差與母總體方差間的關(guān)系為:第四十頁,共四十八頁,編輯于2023年,星期日二、正態(tài)總體的抽樣分布(一)樣本平均數(shù)的分布從正態(tài)總體抽取的樣本平均數(shù)的分布一般為N(,)。圖1給出樣本容量n=1,4與9時的分布,從圖中可以看出隨著樣本容量的增加,分布的集中程度增加了,說明方差減少了。圖1不同樣本容量的抽樣分布第四十一頁,共四十八頁,編輯于2023年,星期日由中心極限定理知,只要樣本容量適當(dāng)大,不論總體分布形狀如何,其的分布都可看作為正態(tài)分布,且具平均數(shù)和方差。在實際應(yīng)用上,如n>30就可以應(yīng)用這一定理。
平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù)轉(zhuǎn)換為u變數(shù)。第四十二頁,共四十八頁,編輯于2023年,星期日(二)兩個獨立樣本平均數(shù)差數(shù)的分布假定有兩個正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為,和,,從第一個總體隨機抽取n1個觀察值,同時獨立地從第二個總體隨時機抽取n2個觀察值。這樣計算出樣本平均數(shù)和標(biāo)準(zhǔn)差,s1和,s2。從統(tǒng)計理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)()的抽樣分布,具有以下特性:
(1)如果兩個總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)()準(zhǔn)確地遵循正態(tài)分布律,無論樣本容量大或小,都有N(,)。第四十三頁,共四十八頁,編輯于2023年,星期日(2)兩個樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個總體平均數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化學(xué)礦產(chǎn)業(yè)集約化生產(chǎn)和資源綜合利用考核試卷
- 文具批發(fā)商的市場調(diào)研數(shù)據(jù)分析技巧應(yīng)用考核試卷
- 物流行業(yè)教育與創(chuàng)新人才培養(yǎng)
- 電子健康卡的移動支付解決方案研究
- 現(xiàn)代企業(yè)人才招聘與選拔策略研究
- 2025-2030年手術(shù)室無影燈無線控制系統(tǒng)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 2025-2030年商場停車導(dǎo)航機器人行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 2025-2030年發(fā)光臺球夜間對戰(zhàn)企業(yè)制定與實施新質(zhì)生產(chǎn)力戰(zhàn)略研究報告
- 2024年12月廣東廣州市白云區(qū)樞紐管理辦公室第二次公開招聘政府雇員3人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 電商生態(tài)下的智能供應(yīng)鏈建設(shè)
- 小學(xué)班會-交通安全伴我行(共25張課件)
- 消防安全一懂三會四能
- 起重吊裝工程安全監(jiān)理細則模版(3篇)
- 《VAVE價值工程》課件
- 四川政采評審專家入庫考試基礎(chǔ)題復(fù)習(xí)試題及答案(一)
- 分享二手房中介公司的薪酬獎勵制度
- 安徽省2022年中考道德與法治真題試卷(含答案)
- GB 4793-2024測量、控制和實驗室用電氣設(shè)備安全技術(shù)規(guī)范
- 廣電雙向網(wǎng)改造技術(shù)建議書
- 項目人員管理方案
- 重大火災(zāi)隱患判定方法
評論
0/150
提交評論