統(tǒng)計學 賈俊平 第3章 概率、概率分布與抽樣分布_第1頁
統(tǒng)計學 賈俊平 第3章 概率、概率分布與抽樣分布_第2頁
統(tǒng)計學 賈俊平 第3章 概率、概率分布與抽樣分布_第3頁
統(tǒng)計學 賈俊平 第3章 概率、概率分布與抽樣分布_第4頁
統(tǒng)計學 賈俊平 第3章 概率、概率分布與抽樣分布_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學Statistics31 統(tǒng)計學Statistics32學習目標學習目標理解隨機事件的概念、了解事件之間的關(guān)系理解隨機事件的概念、了解事件之間的關(guān)系理解概率的三種定義,掌握概率運算的法則理解概率的三種定義,掌握概率運算的法則理解隨機變量及其概率分布的概念理解隨機變量及其概率分布的概念掌握二項分布、泊松分布和超幾何分布的背掌握二項分布、泊松分布和超幾何分布的背景、均值和方差及其應(yīng)用景、均值和方差及其應(yīng)用掌握正態(tài)分布的主要特征和應(yīng)用,了解均勻掌握正態(tài)分布的主要特征和應(yīng)用,了解均勻分布的應(yīng)用分布的應(yīng)用理解大數(shù)定律和中心極限定理的重要意義理解大數(shù)定律和中心極限定理的重要意義統(tǒng)計學Statisti

2、cs333.1 隨機事件及其概率隨機事件及其概率 一、隨機試驗與隨機事件一、隨機試驗與隨機事件 二、隨機事件的概率二、隨機事件的概率 三、概率的運算法則三、概率的運算法則統(tǒng)計學Statistics34必然現(xiàn)象與隨機現(xiàn)象必然現(xiàn)象與隨機現(xiàn)象必然現(xiàn)象(確定性現(xiàn)象)必然現(xiàn)象(確定性現(xiàn)象) 變化結(jié)果是事先可以確定的,一定的條件必然導(dǎo)變化結(jié)果是事先可以確定的,一定的條件必然導(dǎo)致某一結(jié)果致某一結(jié)果 這種關(guān)系通??梢杂霉交蚨蓙肀硎具@種關(guān)系通??梢杂霉交蚨蓙肀硎倦S機現(xiàn)象(偶然現(xiàn)象、不確定現(xiàn)象)隨機現(xiàn)象(偶然現(xiàn)象、不確定現(xiàn)象) 在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象

3、個別觀察的結(jié)果完全是偶然的、隨機會而定個別觀察的結(jié)果完全是偶然的、隨機會而定 大量觀察的結(jié)果會呈現(xiàn)出某種規(guī)律性大量觀察的結(jié)果會呈現(xiàn)出某種規(guī)律性 (隨機性中寓含著規(guī)律性)(隨機性中寓含著規(guī)律性) 統(tǒng)計規(guī)律性統(tǒng)計規(guī)律性十五的夜晚能看見月亮?十五的月亮比初十圓!統(tǒng)計學Statistics35隨機試驗隨機試驗嚴格意義上的隨機試驗滿足三個條件:嚴格意義上的隨機試驗滿足三個條件: 試驗可以在系統(tǒng)條件下重復(fù)進行;試驗可以在系統(tǒng)條件下重復(fù)進行; 試驗的所有可能結(jié)果是明確可知的;試驗的所有可能結(jié)果是明確可知的; 每次試驗前不能肯定哪一個結(jié)果會出現(xiàn)。每次試驗前不能肯定哪一個結(jié)果會出現(xiàn)。廣義的隨機試驗是指對隨機現(xiàn)象

4、的觀察廣義的隨機試驗是指對隨機現(xiàn)象的觀察(或?qū)嶒灒?。(或?qū)嶒灒?實際應(yīng)用中多數(shù)試驗不能同時滿足上述條件,實際應(yīng)用中多數(shù)試驗不能同時滿足上述條件,常常從廣義角度來理解。常常從廣義角度來理解。統(tǒng)計學Statistics36隨機事件(事件)隨機事件(事件)隨機事件(簡稱事件)隨機事件(簡稱事件) 隨機試驗的每一個可能結(jié)果隨機試驗的每一個可能結(jié)果 常用大寫英文字母常用大寫英文字母A、B、 、來表示、來表示基本事件(樣本點)基本事件(樣本點) 不可能再分成為兩個或更多事件的事件不可能再分成為兩個或更多事件的事件樣本空間(樣本空間() 基本事件的全體(全集)基本事件的全體(全集)統(tǒng)計學Statistic

5、s37隨機事件(續(xù))隨機事件(續(xù))復(fù)合事件復(fù)合事件 由某些基本事件組合而成的事件由某些基本事件組合而成的事件 樣本空間中的子集樣本空間中的子集隨機事件的兩種特例隨機事件的兩種特例 必然事件必然事件 在一定條件下,每次試驗都必然發(fā)生的事件在一定條件下,每次試驗都必然發(fā)生的事件 只有樣本空間只有樣本空間 才是必然事件才是必然事件 不可能事件不可能事件 在一定條件下,每次試驗都必然不會發(fā)生的事件在一定條件下,每次試驗都必然不會發(fā)生的事件 不可能事件是一個空集(不可能事件是一個空集()統(tǒng)計學Statistics38隨機事件的概率隨機事件的概率概率概率 用來度量隨機事件發(fā)生的可能性大小的數(shù)用來度量隨機事

6、件發(fā)生的可能性大小的數(shù)值值 必然事件的概率為必然事件的概率為1,表示為,表示為P ( )=1 不可能事件發(fā)生的可能性是零,不可能事件發(fā)生的可能性是零,P( )=0 隨機事件隨機事件A的概率介于的概率介于0和和1之間,之間,0P(A)1 ,顯然顯然P(AB) P(A)P(B) 因為因為A和和B存在共同部分存在共同部分AB5,7,9,P(AB)3/10。在在P(A)+P(B) 中中P(AB) 被重復(fù)計算了。被重復(fù)計算了。正確計算是:正確計算是: P(AB)5/106/103/108/100.8統(tǒng)計學Statistics323乘法公式乘法公式用于計算兩個事件同時發(fā)生的概率。用于計算兩個事件同時發(fā)生的

7、概率。也即也即 “A發(fā)生且發(fā)生且B發(fā)生發(fā)生”的概率的概率 P(AB) 先關(guān)注事件是否相互獨立先關(guān)注事件是否相互獨立 統(tǒng)計學Statistics324條件概率條件概率條件概率條件概率在某些附加條件下計算的概率在某些附加條件下計算的概率在已知事件在已知事件B已經(jīng)發(fā)生的條件下已經(jīng)發(fā)生的條件下A發(fā)生的條發(fā)生的條件概率件概率P(A|B)條件概率的一般公式:條件概率的一般公式: )()()|(BPABPBAP 其中 P(B) 0 統(tǒng)計學Statistics325【例例3-5】某公司甲乙兩廠生產(chǎn)同種產(chǎn)品。甲廠生產(chǎn)某公司甲乙兩廠生產(chǎn)同種產(chǎn)品。甲廠生產(chǎn)400件,其中一件,其中一級品為級品為280件;乙廠生產(chǎn)件;

8、乙廠生產(chǎn)600件,其中一級品有件,其中一級品有360件。若件。若要從該廠的全部產(chǎn)品中任意抽取一件,試求:已知抽出要從該廠的全部產(chǎn)品中任意抽取一件,試求:已知抽出產(chǎn)品為一級品的條件下該產(chǎn)品出自甲廠的概率;已知抽產(chǎn)品為一級品的條件下該產(chǎn)品出自甲廠的概率;已知抽出產(chǎn)品出自甲廠的條件下該產(chǎn)品為一級品的概率。出產(chǎn)品出自甲廠的條件下該產(chǎn)品為一級品的概率。解:設(shè)解:設(shè)A“甲廠產(chǎn)品甲廠產(chǎn)品”,B“一級品一級品”,則:,則: P(A)0.4, P(B) 0.64,P(AB)0.28 所求概率為事件所求概率為事件B發(fā)生條件下發(fā)生條件下A發(fā)生的條件概率發(fā)生的條件概率 P(A|B)0.28/0.64所求概率為事件所求

9、概率為事件A發(fā)生條件下發(fā)生條件下B發(fā)生的條件概率發(fā)生的條件概率 P(B|A)0.28/0. 4統(tǒng)計學Statistics326P(A|B)在在B發(fā)生的所有可能結(jié)果中發(fā)生的所有可能結(jié)果中AB發(fā)生發(fā)生的概率的概率即在樣本空間即在樣本空間中考慮的條件概率中考慮的條件概率P(A|B),就變成在新的樣本空間就變成在新的樣本空間B中計算事件中計算事件AB的概的概率問題了率問題了條件概率(續(xù))條件概率(續(xù))一旦事件B已發(fā)生ABABBAB統(tǒng)計學Statistics327乘法公式的一般形式:乘法公式的一般形式: P(AB) P(A)P(B|A) 或或 P(AB) P(B)P(A|B) 【例例3-6】對例對例3-

10、1中的問題(從這中的問題(從這50件中任取件中任取2件件產(chǎn)品,可以看成是分兩次抽取,每次只抽取一件,產(chǎn)品,可以看成是分兩次抽取,每次只抽取一件,不放回抽樣)不放回抽樣)解:解:A1第一次抽到合格品,第一次抽到合格品,A2第二次抽到第二次抽到合格品,合格品,A1A2抽到兩件產(chǎn)品均為合格品抽到兩件產(chǎn)品均為合格品P(A1 A2)P(A1)P(A2| A1) 8082. 02450198049445045 統(tǒng)計學Statistics328事件的獨立性事件的獨立性兩個事件獨立兩個事件獨立 一個事件的發(fā)生與否并不影響另一個事一個事件的發(fā)生與否并不影響另一個事件發(fā)生的概率件發(fā)生的概率 P(A|B)P(A),

11、或,或 P(B|A)P(B)獨立事件的乘法公式:獨立事件的乘法公式: P(AB) P(A)P(B)1 1n n1 12 2n n 統(tǒng)計學Statistics329全概率公式全概率公式完備事件組完備事件組 事件事件A1、 A2、An互不相容,互不相容, A1A2An 且且P(Ai ) 0(i=1、2、.、n)對任一事件對任一事件B,它總是與完備事件組,它總是與完備事件組A1、 A2、An之一同時發(fā)生,則有求之一同時發(fā)生,則有求P(B)的的全概率公式全概率公式: niiiABPAPBP1)|()()(統(tǒng)計學Statistics330例例3-7假設(shè)有一道四選一的選擇題,某學生知道假設(shè)有一道四選一的選

12、擇題,某學生知道正確答案的可能性為正確答案的可能性為2/3,他不知道正確答,他不知道正確答案時猜對的概率是案時猜對的概率是1/4。試問該生作出作答。試問該生作出作答的概率?的概率?解:解:設(shè)設(shè) A知道正確答案,知道正確答案,B選擇正確。選擇正確。 “選擇正確選擇正確”包括:包括: “知道正確答案而選擇正確知道正確答案而選擇正確”(即(即AB) “不知道正確答案但選擇正確不知道正確答案但選擇正確”(即(即 )P(B)(2/3)1(1/3)(1/4)3/4BA)|()()|()()()()(ABPAPABPAPBAPABPBP 統(tǒng)計學Statistics331全概率公式全概率公式貝葉斯公式貝葉斯公

13、式統(tǒng)計學Statistics332貝葉斯公式貝葉斯公式若若A1、 A2、An為完備事件組,則對為完備事件組,則對于任意隨機事件于任意隨機事件B,有:,有: niiiiiiiABPAPABPAPBPBAPBAP1)|()()|()()()()|(計算事件計算事件Ai在給定在給定B條件下的條件概率公式。條件下的條件概率公式。 公式中,公式中,P(Ai)稱為事件稱為事件Ai的先驗概率的先驗概率 P(Ai|B)稱為事件稱為事件Ai的后驗概率的后驗概率 統(tǒng)計學Statistics3333.2 隨機變量及其概率分布隨機變量及其概率分布 一、隨機變量的概念一、隨機變量的概念 二、隨機變量的概率分布二、隨機變

14、量的概率分布 三、隨機變量的數(shù)字特征三、隨機變量的數(shù)字特征 四、常見的離散型概率分布四、常見的離散型概率分布 五、常見的連續(xù)型概率分布五、常見的連續(xù)型概率分布統(tǒng)計學Statistics334隨機變量的概念隨機變量的概念隨機變量隨機變量表示隨機試驗結(jié)果的變量表示隨機試驗結(jié)果的變量 取值是隨機的,事先不能確定取哪一個值取值是隨機的,事先不能確定取哪一個值 一個取值對應(yīng)隨機試驗的一個可能結(jié)果一個取值對應(yīng)隨機試驗的一個可能結(jié)果 用大寫字母如用大寫字母如X、Y、Z.來表示,具體取值來表示,具體取值則用相應(yīng)的小寫字母如則用相應(yīng)的小寫字母如x、y、z來表示來表示 根據(jù)取值特點的不同,可分為根據(jù)取值特點的不同

15、,可分為: 離散型離散型隨機變量隨機變量取值可以一一列舉取值可以一一列舉 連續(xù)型連續(xù)型隨機變量隨機變量取值不能一一列舉取值不能一一列舉統(tǒng)計學Statistics335離散型隨機變量的概率分布離散型隨機變量的概率分布X的的概率分布概率分布X的有限個可能取值為的有限個可能取值為xi與其概率與其概率 pi(i=1,2,3,n)之間)之間的對應(yīng)關(guān)系。的對應(yīng)關(guān)系。概率分布具有如下兩個基本性質(zhì)概率分布具有如下兩個基本性質(zhì): (1) pi0,i=1,2,n; (2)1iip統(tǒng)計學Statistics336離散型概率分布的表示:離散型概率分布的表示:概率函數(shù):概率函數(shù):P(X= xi)= pi分布列:分布列:

16、分布圖分布圖X = xix1x2xnP(X =xi)=pip1p2pn0.60.300 1 2 xP( x )圖圖3-5 例例3-9的概率分布的概率分布統(tǒng)計學Statistics337連續(xù)型隨機變量的概率密度連續(xù)型隨機變量的概率密度 連續(xù)型隨機變量的概率分布只能表示為:連續(xù)型隨機變量的概率分布只能表示為: 數(shù)學函數(shù)數(shù)學函數(shù)概率密度函數(shù)概率密度函數(shù)f (x)和分布函數(shù)和分布函數(shù)F (x) 圖圖 形形概率密度曲線和分布函數(shù)曲線概率密度曲線和分布函數(shù)曲線概率密度函數(shù)概率密度函數(shù)f (x)的函數(shù)值不是概率。的函數(shù)值不是概率。連續(xù)型隨機變量取某個特定值的概率等于連續(xù)型隨機變量取某個特定值的概率等于0只能

17、計算隨機變量落在一定區(qū)間內(nèi)的概率只能計算隨機變量落在一定區(qū)間內(nèi)的概率由由x軸以上、概率密度曲線下方面積來表示軸以上、概率密度曲線下方面積來表示統(tǒng)計學Statistics338概率密度概率密度f (x) 的性質(zhì)的性質(zhì)(1) f (x)0。概率密度是非負函數(shù)。概率密度是非負函數(shù)。(2)1d )(xxf所有區(qū)域上取值的概率總和為所有區(qū)域上取值的概率總和為1。 隨機變量隨機變量X在一定區(qū)間(在一定區(qū)間(a,b)上的概率:)上的概率: dxxfbXaPba)()(xab統(tǒng)計學Statistics339分布函數(shù)分布函數(shù)適用于兩類隨機變量概率分布的描述適用于兩類隨機變量概率分布的描述分布函數(shù)的定義:分布函數(shù)

18、的定義: F(x)PXx xxiip連續(xù)型隨機變量的分布函數(shù)連續(xù)型隨機變量的分布函數(shù)dxxfxFx )()( 離散型隨機變量的分布函數(shù)離散型隨機變量的分布函數(shù) F(x)xx0分布函數(shù)分布函數(shù)與與概率密度概率密度統(tǒng)計學Statistics340隨機變量的數(shù)學期望隨機變量的數(shù)學期望又稱均值又稱均值描述一個隨機變量的概率分布的中心位置描述一個隨機變量的概率分布的中心位置離散型隨機變量離散型隨機變量 X的數(shù)學期望的數(shù)學期望: 相當于所有可能取值以概率為權(quán)數(shù)的平均值相當于所有可能取值以概率為權(quán)數(shù)的平均值連續(xù)型隨機變量連續(xù)型隨機變量X 的數(shù)學期望:的數(shù)學期望: iiipxXE )(dxxxfxE )()(

19、 統(tǒng)計學Statistics341數(shù)學期望的主要數(shù)學性質(zhì)數(shù)學期望的主要數(shù)學性質(zhì)若若k是一常數(shù),則是一常數(shù),則 E (k X) k E(X) 對于任意兩個隨機變量對于任意兩個隨機變量X、Y,有,有 E(X+Y)E(X)E(Y) 若兩個隨機變量若兩個隨機變量X、Y相互獨立,則相互獨立,則 E(XY)E(X) E(Y) 統(tǒng)計學Statistics342隨機變量的方差隨機變量的方差方差是它的各個可能取值偏離其均值的方差是它的各個可能取值偏離其均值的離差平方的均值,記為離差平方的均值,記為D(x)或或2公式:公式: 離散型隨機變量的方差:離散型隨機變量的方差: 連續(xù)型隨機變量的方差:連續(xù)型隨機變量的方差

20、:22)()( XEXDdxxfxxD )()(22 iiipxXD22)()( 統(tǒng)計學Statistics343方差和標準差方差和標準差(續(xù))(續(xù))標準差標準差方差的平方根方差的平方根方差和標準差都反映隨機變量取值的分散方差和標準差都反映隨機變量取值的分散程度。程度。 它們的值越大,說明離散程度越大,其概率它們的值越大,說明離散程度越大,其概率分布曲線越扁平。分布曲線越扁平。方差的主要數(shù)學性質(zhì):方差的主要數(shù)學性質(zhì): 若若k是一常數(shù),則是一常數(shù),則 D(k)0;D(kX)k2 D(X) 若兩個隨機變量若兩個隨機變量X、Y相互獨立,則相互獨立,則 D(X+Y)D(X)D(Y) 統(tǒng)計學Statis

21、tics344【例例3-10】試求優(yōu)質(zhì)品件數(shù)的數(shù)學期望、方差和標試求優(yōu)質(zhì)品件數(shù)的數(shù)學期望、方差和標準差。準差。解:解:2 . 13 . 026 . 011 . 00)(iiipxXE36. 03 . 0) 2 . 12(6 . 0) 2 . 11 (1 . 0) 2 . 10()()(2222 iiipxXD 0.6xi012pi0.10.60.3統(tǒng)計學Statistics345兩個隨機變量的協(xié)方差和相關(guān)系數(shù)兩個隨機變量的協(xié)方差和相關(guān)系數(shù)協(xié)方差的定義協(xié)方差的定義)()(),(YEYXEXEYXCov )()()(YEXEXYE 如果如果X,Y獨立(不相關(guān)),則獨立(不相關(guān)),則 Cov(X,Y

22、)0 即即 E(XY)E(X) E(Y) 協(xié)方差在一定程度上反映了協(xié)方差在一定程度上反映了X、Y之間的相關(guān)性之間的相關(guān)性協(xié)方差受兩個變量本身量綱的影響。協(xié)方差受兩個變量本身量綱的影響。 統(tǒng)計學Statistics346相關(guān)系數(shù)相關(guān)系數(shù)相關(guān)系數(shù)相關(guān)系數(shù)具有如下的性質(zhì):具有如下的性質(zhì):相關(guān)系數(shù)相關(guān)系數(shù)是一個無量綱的值是一個無量綱的值 0| | 1 當當=0,兩個變量不相關(guān),兩個變量不相關(guān)(不存在線(不存在線性相關(guān))性相關(guān)) 當當 | |=1,兩個變量完全線性相關(guān),兩個變量完全線性相關(guān) YXXYYXCov ),( 統(tǒng)計學Statistics347二項分布二項分布(背景)(背景)(背景)(背景)n重貝

23、努里試驗:重貝努里試驗: 一次試驗只有兩種可能結(jié)果一次試驗只有兩種可能結(jié)果 用用“成功成功”代表所關(guān)心的結(jié)果,相代表所關(guān)心的結(jié)果,相反的結(jié)果為反的結(jié)果為“失敗失敗” 每次試驗中每次試驗中“成功成功”的概率都是的概率都是 p n 次試驗相互獨立。次試驗相互獨立。統(tǒng)計學Statistics348二項分布二項分布在在n重貝努里試驗中,重貝努里試驗中,“成功成功”的次數(shù)的次數(shù)X服從參數(shù)為服從參數(shù)為n、p的二項分布,的二項分布,記為記為 X B(n , p)二項分布的概率函數(shù):二項分布的概率函數(shù): xnxxnppCxXP )1 ()(二項分布的數(shù)學期望和方差:二項分布的數(shù)學期望和方差: )1 ()(,)

24、(2pnpXDnpXE n1時,二項分布就成了二點分布(時,二項分布就成了二點分布(0-1分布)分布)統(tǒng)計學Statistics349二項分布圖形二項分布圖形p0.5時,二項分布是以均值為中心對稱時,二項分布是以均值為中心對稱p0.5時,二項分布總是非對稱的時,二項分布總是非對稱的 p0.5時峰值在中心的右側(cè)時峰值在中心的右側(cè)隨著隨著n無限增大,二項分布趨近于正態(tài)分布無限增大,二項分布趨近于正態(tài)分布p=0.3p=0.5p=0.7二項分布圖示二項分布圖示統(tǒng)計學Statistics350【例例3-11】某單位有某單位有4輛汽車,假設(shè)每輛車在一年中至多只發(fā)輛汽車,假設(shè)每輛車在一年中至多只發(fā)生一次損失

25、且損失的概率為生一次損失且損失的概率為0.1。試求在一年內(nèi)該。試求在一年內(nèi)該單位:(單位:(1)沒有汽車發(fā)生損失的概率;()沒有汽車發(fā)生損失的概率;(2)有)有1輛汽車發(fā)生損失的概率;(輛汽車發(fā)生損失的概率;(3)發(fā)生損失的汽車不)發(fā)生損失的汽車不超過超過2輛的概率。輛的概率。解:解:每輛汽車是否發(fā)生損失相互獨立的,且損失的每輛汽車是否發(fā)生損失相互獨立的,且損失的概率相同,因此,據(jù)題意,在概率相同,因此,據(jù)題意,在4輛汽車中發(fā)生損失輛汽車中發(fā)生損失的汽車數(shù)的汽車數(shù)X B(4,0.1)。 (1) pbinom(0,4,0.1) 1 0.6561(2) pbinom(1,4,0.1)-pbinom

26、(0,4,0.1) 1 0.2916(3) pbinom(2,4,0.1) 1 0.9963統(tǒng)計學Statistics351利用利用Excel計算二項分布概率計算二項分布概率進入進入Excel表格界面,點擊任一空白單元格(作表格界面,點擊任一空白單元格(作為輸出單元格)為輸出單元格)點擊表格界面上的點擊表格界面上的 fx 命令命令 在在 “選擇類別選擇類別”中點擊中點擊“統(tǒng)計統(tǒng)計”,在,在“選擇函選擇函數(shù)數(shù)”中點擊中點擊“BINOMDIST” 在在Number_s后填入試驗成功次數(shù)后填入試驗成功次數(shù) x (本例為本例為2); 在在Trials后填入總試驗次數(shù)后填入總試驗次數(shù) n (本例為本例為

27、4) ; 在在Probability_s后填入成功概率后填入成功概率 p (本例為本例為0.1); 在在Cumulative后填入后填入0 (或或FALSE),表示計算成功次,表示計算成功次數(shù)等于指定值的概率數(shù)等于指定值的概率“BINOMDIST(2,4,0.1,0)” 用用EXCEL計算二項計算二項分布的概率分布的概率統(tǒng)計學Statistics352泊松分布泊松分布 X 服從泊松分布,記為服從泊松分布,記為XP():e!)(xxXPxE(X)=D(X)=當當 很小時,泊松分布呈偏態(tài),并隨著很小時,泊松分布呈偏態(tài),并隨著增增大而趨于對稱大而趨于對稱當當為整數(shù)時,為整數(shù)時, 和(和(-1)是最可

28、能值)是最可能值統(tǒng)計學Statistics353泊松分布(應(yīng)用背景)泊松分布(應(yīng)用背景)通常是作為稀有事件發(fā)生次數(shù)通常是作為稀有事件發(fā)生次數(shù)X的概率分布模的概率分布模型。型。一段時間內(nèi)某繁忙十字路口發(fā)生交通事故的次一段時間內(nèi)某繁忙十字路口發(fā)生交通事故的次數(shù)數(shù)一定時間段內(nèi)某一定時間段內(nèi)某 交換臺接到的交換臺接到的 呼叫次數(shù)呼叫次數(shù)服從泊松分布的現(xiàn)象的共同特征服從泊松分布的現(xiàn)象的共同特征在任意兩個很小的時間或空間區(qū)間內(nèi)事件發(fā)生在任意兩個很小的時間或空間區(qū)間內(nèi)事件發(fā)生次數(shù)是相互獨立的;次數(shù)是相互獨立的;各區(qū)間內(nèi)事件發(fā)生次數(shù)只與區(qū)間長度成比例,各區(qū)間內(nèi)事件發(fā)生次數(shù)只與區(qū)間長度成比例,與區(qū)間起點無關(guān);與

29、區(qū)間起點無關(guān);在一段充分小的區(qū)間內(nèi)事件發(fā)生兩次或兩次以在一段充分小的區(qū)間內(nèi)事件發(fā)生兩次或兩次以上的概率可以忽略不計上的概率可以忽略不計統(tǒng)計學Statistics354【例例3-12】 設(shè)某種報刊的每版上錯別字個數(shù)服從設(shè)某種報刊的每版上錯別字個數(shù)服從 =2的泊松分布。隨機翻看一版,求:的泊松分布。隨機翻看一版,求:(1)沒有錯別字的概率;)沒有錯別字的概率;(2)至多有)至多有5個錯別字的概率。個錯別字的概率。解:解:設(shè)設(shè)X每版上錯別字個數(shù),則所求概每版上錯別字個數(shù),則所求概率為:率為:0.1353e! 02)0(20XP0.9834e!2) 5(502xxxXP利用利用EXCEL計算泊松分布的

30、概率計算泊松分布的概率 ppois(0,2)1 0.1353353 ppois(5,2)1 0.9834364統(tǒng)計學Statistics355二項分布的泊松近似二項分布的泊松近似【前提前提】當當n很大而很大而 p又很小時,二項分布可又很小時,二項分布可用參數(shù)用參數(shù)np 的泊松分布近似的泊松分布近似 【例例3-13】一工廠有某種設(shè)備一工廠有某種設(shè)備80臺,配備了臺,配備了3個維修工。假設(shè)每臺設(shè)備的維修只需要一個維個維修工。假設(shè)每臺設(shè)備的維修只需要一個維修工,設(shè)備發(fā)生故障是相互獨立的,且每臺設(shè)修工,設(shè)備發(fā)生故障是相互獨立的,且每臺設(shè)備發(fā)生故障的概率都是備發(fā)生故障的概率都是0.01。求設(shè)備發(fā)生故障。

31、求設(shè)備發(fā)生故障而不能及時維修的概率是多少?而不能及時維修的概率是多少?解:解:XB(n=80,p=0.01),由于,由于np=0.8很小,很小,可以用可以用0.8的泊松分布來近似計算其概率的泊松分布來近似計算其概率:30.800.8(4) 1(3) 1e1 0.990920.00908!xxP XP Xx 1-ppois(3,0.8)1 0.009079858 1-pbinom(3,80,0.01)1 0.008659189統(tǒng)計學Statistics356超幾何分布超幾何分布 N個單位的有限總體中有個單位的有限總體中有M個單位具有某特個單位具有某特征。用不重復(fù)抽樣方法從總體中抽取征。用不重復(fù)抽

32、樣方法從總體中抽取n個單個單位,樣本中具有某種特征的單位數(shù)位,樣本中具有某種特征的單位數(shù)X服從超服從超幾何分布,記為幾何分布,記為XH(n,N,M ) nNxnMNxMCCCxXP )(1)1()(,)(2 NnNpnpXDnpXE 數(shù)學期望和方差數(shù)學期望和方差:N很大而很大而n相對很小時,趨于二項分布相對很小時,趨于二項分布(p=M/N)統(tǒng)計學Statistics357五、常見的連續(xù)型概率分布五、常見的連續(xù)型概率分布均勻分布均勻分布 X只在一有限區(qū)間只在一有限區(qū)間 a,b 上取值上取值 且概率密度是一個常數(shù)且概率密度是一個常數(shù) 其概率密度為:其概率密度為:bxaabxf ,1)(X 落在子區(qū)

33、間落在子區(qū)間 c,d 內(nèi)的內(nèi)的概率與該子區(qū)間的長度成正概率與該子區(qū)間的長度成正比,與具體位置無關(guān)比,與具體位置無關(guān)f(x)a c d b xP(cXd)統(tǒng)計學Statistics358正態(tài)分布正態(tài)分布XN (、 2 ),其概率密度為:,其概率密度為:222)(21)( xexf正態(tài)分布的均值和方差正態(tài)分布的均值和方差 均值均值 E(X) = 方差方差 D(X)= 2 - x 3 的概率很小,因此可認為正的概率很小,因此可認為正態(tài)隨機變量的取值幾乎全部集中在態(tài)隨機變量的取值幾乎全部集中在 - 3,+ 3 區(qū)間內(nèi)區(qū)間內(nèi)廣泛應(yīng)用廣泛應(yīng)用: 產(chǎn)品質(zhì)量控制產(chǎn)品質(zhì)量控制 判斷異常情況判斷異常情況 圖圖3-

34、12 常用的正態(tài)概率值常用的正態(tài)概率值(在一般正態(tài)分布及標準正態(tài)分布中)(在一般正態(tài)分布及標準正態(tài)分布中) -3 -2 -1 0 +1 +2 +3 z -3 -2 - + +2 +3 x99.73%95.45%68.27%統(tǒng)計學Statistics364正態(tài)分布最常用、最重要正態(tài)分布最常用、最重要大千世界中許多常見的隨機現(xiàn)象服從或近似服從正大千世界中許多常見的隨機現(xiàn)象服從或近似服從正態(tài)分布態(tài)分布 例如,測量誤差,同齡人的身高、體重,一批棉紗的抗例如,測量誤差,同齡人的身高、體重,一批棉紗的抗拉強度,一種設(shè)備的使用壽命,農(nóng)作物的產(chǎn)量拉強度,一種設(shè)備的使用壽命,農(nóng)作物的產(chǎn)量 特點是特點是 “中間多

35、兩頭少中間多兩頭少”由于正態(tài)分布特有的數(shù)學性質(zhì),正態(tài)分布在很多統(tǒng)由于正態(tài)分布特有的數(shù)學性質(zhì),正態(tài)分布在很多統(tǒng)計理論中都占有十分重要的地位計理論中都占有十分重要的地位 正態(tài)分布是許多概率分布的極限分布正態(tài)分布是許多概率分布的極限分布 統(tǒng)計推斷中許多重要的分布(如統(tǒng)計推斷中許多重要的分布(如2分布、分布、t分布、分布、F分布)分布)都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的。都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的。統(tǒng)計學Statistics365用正態(tài)分布近似二項分布用正態(tài)分布近似二項分布XB (n,p) ,當,當n充分大時,充分大時, XN (n p,np(1-p)【例例3-15】假設(shè)有一批種子的發(fā)芽率為假設(shè)有

36、一批種子的發(fā)芽率為0.7?,F(xiàn)有這種種子現(xiàn)有這種種子1000顆,試求其中有顆,試求其中有720顆以上顆以上發(fā)芽的概率。發(fā)芽的概率。解:解:設(shè)設(shè)X發(fā)芽種子顆數(shù),發(fā)芽種子顆數(shù),XB(1000,0.7)。近似地近似地 XN (700,210)。 P(X720)P(Z1.38)1P(Z1.38) 10.91620.0838 700720700210210X 1-pbinom(720,1000,0.7)1 0.077879統(tǒng)計學Statistics366用正態(tài)分布近似二項分布用正態(tài)分布近似二項分布用正態(tài)分布近似二項分布的用正態(tài)分布近似二項分布的前提前提 n很大,很大, p不能太接近不能太接近 0 或或 1

37、(否則二項分布太偏)(否則二項分布太偏) 一般要求一般要求np和和np(1-p)都要大于都要大于5如果如果np或或np(1-p)小于小于5,二項分布可以用,二項分布可以用泊松分布來近似泊松分布來近似 統(tǒng)計學Statistics367計算正態(tài)分布的概率值計算正態(tài)分布的概率值方法一:方法一:先標準化先標準化查標準正態(tài)分布函數(shù)值表查標準正態(tài)分布函數(shù)值表方法二:利用方法二:利用Excel來計算(不必標準化)來計算(不必標準化) 插入函數(shù)插入函數(shù)fx選擇選擇“統(tǒng)計統(tǒng)計”“NORMDIST”,進入,進入“函數(shù)參數(shù)函數(shù)參數(shù)”對話框中,對話框中, 在在X后填入正態(tài)隨機變量的取值區(qū)間點;后填入正態(tài)隨機變量的取值

38、區(qū)間點; 在在Mean后填入正態(tài)分布的均值;后填入正態(tài)分布的均值; 在在Standard_dev后填入正態(tài)分布的標準差;后填入正態(tài)分布的標準差; 在在Cumulative后填入后填入1(或或TRUE),表示計算隨,表示計算隨機變量取值小于等于指定值機變量取值小于等于指定值x的累積概率值。的累積概率值。 統(tǒng)計學Statistics368也可在選定的輸出單元格中,順次輸入也可在選定的輸出單元格中,順次輸入函數(shù)名和參數(shù)值即可函數(shù)名和參數(shù)值即可 如輸入如輸入“=NORMDIST(500,1050,200,1)”,確定后即可得到所求概率值確定后即可得到所求概率值0.0029798。根據(jù)概率值根據(jù)概率值F

39、(Xx)求隨機變量取值的區(qū)求隨機變量取值的區(qū)間點間點 x,選擇函數(shù),選擇函數(shù)“NORMINV”。 如輸入如輸入“=NORMINV(0.0029798,1050,200)”,顯示計算結(jié)果為顯示計算結(jié)果為500。計算正態(tài)分布的概率值計算正態(tài)分布的概率值統(tǒng)計學Statistics3693.3 常用抽樣方法常用抽樣方法一、簡單隨機抽樣一、簡單隨機抽樣二、分層抽樣二、分層抽樣三、系統(tǒng)抽樣三、系統(tǒng)抽樣四、整群抽樣四、整群抽樣統(tǒng)計學Statistics370統(tǒng)計學Statistics371統(tǒng)計學Statistics372統(tǒng)計學Statistics373統(tǒng)計學Statistics3743.4 抽樣分布抽樣分布

40、一、抽樣分布的概念一、抽樣分布的概念二、樣本均值抽樣分布的形式二、樣本均值抽樣分布的形式三、樣本均值抽樣分布的特征三、樣本均值抽樣分布的特征四、樣本比例的抽樣分布四、樣本比例的抽樣分布五、樣本方差的抽樣分布五、樣本方差的抽樣分布六、兩個樣本統(tǒng)計量的抽樣分布六、兩個樣本統(tǒng)計量的抽樣分布統(tǒng)計學Statistics375統(tǒng)計學Statistics376統(tǒng)計學Statistics377統(tǒng)計學Statistics3785 . 21NxNii25. 1)(122NxNii統(tǒng)計學Statistics379 3,4 3,3 3,2 3,1 3 2,4 2,3 2,2 2,1 2 4,4 4,3 4,2 4,1

41、 4 1,4 4 1,3 3 2 1 1,2 1,1 1 第二個觀察值第二個觀察值 第一個第一個 觀察值觀察值統(tǒng)計學Statistics3803.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第二個觀察值第一第一個個觀察觀察值值統(tǒng)計學Statistics3815 . 2x625. 02x統(tǒng)計學Statistics382)(xEnx22122NnNnx統(tǒng)計學Statistics383為樣本數(shù)目MnMxnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 .

42、10 . 11Mxniix統(tǒng)計學Statistics384 E p2. 樣本比率的方差 重復(fù)抽樣不重復(fù)抽樣21pn211pNnnN統(tǒng)計學Statistics385222211nsn2,XN 當總體抽取容量為n的樣本,則2221xxn統(tǒng)計學Statistics3862212121212,xxNnn兩個正態(tài)總體:非正態(tài)總體:兩個樣本容量大于等于30時,仍用正態(tài)分布近似統(tǒng)計學Statistics387112212121211,ppNnn統(tǒng)計學Statistics3882112221,1sF nns統(tǒng)計學Statistics3893.5 中心極限定理的應(yīng)用中心極限定理的應(yīng)用一、大數(shù)定律一、大數(shù)定律二、

43、中心極限定理二、中心極限定理統(tǒng)計學Statistics390獨立同分布大數(shù)定律獨立同分布大數(shù)定律大數(shù)定律是闡述大量同類隨機現(xiàn)象的平均大數(shù)定律是闡述大量同類隨機現(xiàn)象的平均結(jié)果的穩(wěn)定性的一系列定理的總稱。結(jié)果的穩(wěn)定性的一系列定理的總稱。獨立同分布大數(shù)定律獨立同分布大數(shù)定律設(shè)設(shè)X1, X2, 是獨是獨立同分布的隨機變量序列,且存在有限的立同分布的隨機變量序列,且存在有限的數(shù)學期望數(shù)學期望E(Xi)和方差和方差D(Xi ) 2(i=1,2,),則對任意小的正數(shù)),則對任意小的正數(shù), 有:有: 1|1|lim1 niinXnP統(tǒng)計學Statistics391大數(shù)定律(續(xù))大數(shù)定律(續(xù))該大數(shù)定律表明:當

44、該大數(shù)定律表明:當n充分大時,相互獨充分大時,相互獨立且服從同一分布的一系列隨機變量取立且服從同一分布的一系列隨機變量取值的算術(shù)平均數(shù),與其數(shù)學期望值的算術(shù)平均數(shù),與其數(shù)學期望的偏差的偏差任意小的概率接近于任意小的概率接近于1。 該定理給出了平均值具有穩(wěn)定性的科學該定理給出了平均值具有穩(wěn)定性的科學描述,從而為使用樣本均值去估計總體描述,從而為使用樣本均值去估計總體均值(數(shù)學期望)提供了理論依據(jù)。均值(數(shù)學期望)提供了理論依據(jù)。 統(tǒng)計學Statistics392貝努里大數(shù)定律貝努里大數(shù)定律設(shè)設(shè)m是是n次獨立重復(fù)試驗中事件次獨立重復(fù)試驗中事件A發(fā)生的次發(fā)生的次數(shù),數(shù),p是每次試驗中事件是每次試驗中

45、事件A發(fā)生的概率,則發(fā)生的概率,則對任意的對任意的 0,有:,有:1|lim pnmPn它表明,當重復(fù)試驗次數(shù)它表明,當重復(fù)試驗次數(shù)n充分大時,事充分大時,事件件A發(fā)生的頻率發(fā)生的頻率m/n依概率收斂于事件依概率收斂于事件A發(fā)發(fā)生的概率生的概率 闡明了頻率具有穩(wěn)定性,提供了用頻率估計闡明了頻率具有穩(wěn)定性,提供了用頻率估計概率的理論依據(jù)。概率的理論依據(jù)。 統(tǒng)計學Statistics393獨立同分布的中心極限定理獨立同分布的中心極限定理(也稱列維一林德伯格定理)(也稱列維一林德伯格定理)設(shè)設(shè)X1, X2, 是獨立同分布的隨機變量序列是獨立同分布的隨機變量序列,且存在有限的且存在有限的和方差和方差2

46、(i=1,2,),當),當n 時,時,)(21 nnNXnii, )/(2nNX ,或或iXX或就趨于正態(tài)分布。 統(tǒng)計學Statistics394上述定理表明上述定理表明 獨立同分布的隨機變量序列不管服從什么分獨立同分布的隨機變量序列不管服從什么分布,其布,其n項總和的分布趨近于正態(tài)分布。項總和的分布趨近于正態(tài)分布??傻贸鋈缦驴傻贸鋈缦陆Y(jié)論結(jié)論: 不論總體服從何種分布,只要其數(shù)學期望和不論總體服從何種分布,只要其數(shù)學期望和方差存在,對這一總體進行重復(fù)抽樣時,當方差存在,對這一總體進行重復(fù)抽樣時,當樣本量樣本量n充分大,就趨于正態(tài)分布。充分大,就趨于正態(tài)分布。 該定理為均值的抽樣推斷奠定了理論基

47、礎(chǔ)。該定理為均值的抽樣推斷奠定了理論基礎(chǔ)。 統(tǒng)計學Statistics395【例例3-16】有一測繪小組對甲乙兩地之間的距離采用分段有一測繪小組對甲乙兩地之間的距離采用分段測量的方法進行了測量,將甲乙之間的距離分測量的方法進行了測量,將甲乙之間的距離分成為成為100段。設(shè)每段測量值的誤差(單位:段。設(shè)每段測量值的誤差(單位:cm)服從區(qū)間(服從區(qū)間(1,1)上的)上的均勻分布均勻分布。試問:對。試問:對甲乙兩地之間距離的測量值的總誤差絕對值超甲乙兩地之間距離的測量值的總誤差絕對值超過過10cm的概率是多少?的概率是多少?解:解:設(shè)設(shè) Xi第第i段測量誤差(段測量誤差(i=1,2,),由于),由

48、于Xi服從均勻分布,服從均勻分布,E(Xi)0,D(Xi )21(1)2/12=1/3。根據(jù)上述中心極限定理,可。根據(jù)上述中心極限定理,可得,得,總誤差總誤差YXiN(0,100/3)。 統(tǒng)計學Statistics396棣莫佛拉普拉斯中心極限定理棣莫佛拉普拉斯中心極限定理設(shè)隨機變量設(shè)隨機變量X服從二項分布服從二項分布B(n,p)的,那的,那么當么當n 時,時,X服從均值為服從均值為np、方差為、方差為 np(1-p) 的正態(tài)分布,即:的正態(tài)分布,即: )1(pnpnpNX ,)10()1(,NpnpnpX 或:或:上述定理表明:上述定理表明: n很大,很大,np 和和 np(1p)也都不太小時,二項也都不太小時,二項分布可以用正態(tài)分布去近似。分布可以用正態(tài)分布去近似。統(tǒng)計學Statistics397為什么很多隨機現(xiàn)象

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論