一些重要的概率分布_第1頁
一些重要的概率分布_第2頁
一些重要的概率分布_第3頁
一些重要的概率分布_第4頁
一些重要的概率分布_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關于一些重要的概率分布§1、正態(tài)分布1.1什么是正態(tài)分布?對于連續(xù)型隨機變量而言,正態(tài)分布是最重要的一種概率分布,其形狀似“鐘型”。經驗表明:對于其值依賴于眾多微小因素且每一因素均產生微小的或正或負影響的連續(xù)型隨機變量來說,正態(tài)分布是一個相當好的描述模型。如身高、體重、考試成績等。第2頁,共50頁,2024年2月25日,星期天為了方便,通常用:表示隨機變量X服從正態(tài)分布。符號~表示隨機變量服從什么樣的分布;N表示正態(tài)分布;,2為正態(tài)分布的(總體)均值(或期望)和方差。X是一個連續(xù)型隨機變量,可在區(qū)間(-∞,+∞)內任意取值。第3頁,共50頁,2024年2月25日,星期天

-

-2

2

68%(近似)3

-3

95%(近似)99.7%(近似)正態(tài)曲線下的區(qū)域示意圖第4頁,共50頁,2024年2月25日,星期天1.2正態(tài)分布的性質:⑴正態(tài)分布曲線以均值

為中心,對稱分布。⑵正態(tài)分布的概率密度函數(shù)呈中間高、兩邊低,在均值處達到最高,向兩邊逐漸降低,即隨機變量在遠離均值處取值的概率逐漸變小。⑶正態(tài)曲線下的面積約有68%位于±兩值之間;約有95%面積位于±2之間;約有99.7%的面積位于±3之間。這些區(qū)域可用作概率的度量。第5頁,共50頁,2024年2月25日,星期天⑷正態(tài)分布可由兩個參數(shù),2來描述,即一旦知道,2的值,就可以根據(jù)附錄表查到隨機變量X落于某一區(qū)間的概率值。⑸兩個(或多個)正態(tài)分布隨機變量的線性組合仍服從正態(tài)分布。該性質很重要,解釋如下:⑹正態(tài)分布的偏度為0,峰度為3。第6頁,共50頁,2024年2月25日,星期天令:假定X和Y相互獨立,設a、b為常數(shù),考慮線性組合:W=aX+bY則有:其中,第7頁,共50頁,2024年2月25日,星期天例:令X表示在曼哈頓非商業(yè)區(qū)一花商每日出售玫瑰花數(shù)量,Y表示在曼哈頓商業(yè)區(qū)一花商每日出售玫瑰花的數(shù)量,假定X和Y均服從正態(tài)分布,且相互獨立。已知:X~N(100,64),Y~N(150,81),求兩天內兩花商出售玫瑰花數(shù)量的期望和方差。W=2X+2Y根據(jù)上述公式,得:

E(W)=2E(X)+2E(Y)=500Var(W)=4Var(X)+4Var(Y)=580因此,W服從均值為500,方差為580的正態(tài)分布,即

W~N(500,580)第8頁,共50頁,2024年2月25日,星期天1.3標準正態(tài)分布由于期望和方差的不同,正態(tài)分布之間會存在一定的區(qū)別(見下圖),如何將其簡單化,從而引入標準正態(tài)分布。

1

2不同均值,同方差的兩個正態(tài)分布圖第9頁,共50頁,2024年2月25日,星期天

1

2

1=

2不同均值,不同方差相同均值,不同方差第10頁,共50頁,2024年2月25日,星期天標準正態(tài)分布如果變量X的均值為,方差為,定義一個新的變量Z,則根據(jù)性質5,變量Z的均值為0,方差為1。在統(tǒng)計學中,我們稱之為單位或標準正態(tài)變量,用符號表示為:任一給定均值和方差的正態(tài)變量都可轉化為標準正態(tài)變量,將其標準化可以大大簡化計算。第11頁,共50頁,2024年2月25日,星期天例:變量X表示面包房每日出售的面包量,假定它服從均值為70、方差為9的正態(tài)分布,即X~(70,9),求任給一天,出售面包數(shù)量大于75條的概率。首先,定義變量Z,Z=(75-70)/3≈1.67求:P(Z>1.67)查正態(tài)分布表得:P(0≦Z≦1.67)=0.4525則:P(Z>1.67)=0.5-0.4525=0.0475即每天出售面包的數(shù)量超過75條的概率為0.0475。第12頁,共50頁,2024年2月25日,星期天1.6700.45250.0475f(Z)標準正態(tài)變量概率密度函數(shù)第13頁,共50頁,2024年2月25日,星期天§2樣本均值的抽樣分布或概率分布引言:樣本均值是總體均值的估計量,但是由于樣本均值是依靠某一給定樣本而定,因此它的值會因隨機樣本的不同而變化。由此,我們將樣本均值看作隨機變量,在樣本是隨機抽取得到的條件下,求樣本均值的概率密度函數(shù)。隨機抽樣:表示總體中每一個個體有同等機會被選入樣本。獨立同分布隨機變量:由X1、X2,…,Xn構成容量為n的隨機樣本Xs,如果所有的Xs是從同一個概率密度(Xi有相同的概率密度函數(shù))中獨立抽取得到的,稱Xs為獨立同分布隨機變量。第14頁,共50頁,2024年2月25日,星期天2.1樣本均值的概率密度例:已知正態(tài)分布的均值為10,方差為4,即N(10,4)?,F(xiàn)在從這個正態(tài)總體中抽取20個隨機樣本,每個樣本包括20個觀察值,對抽取的每一個樣本,得到其樣本均值,因此,共有20個樣本均值。來自N(10,4)的20個樣本均值9.64110.13410.04010.2499.17410.32110.4809.50411.3868.6219.7409.7399.93710.18410.2509.76510.33410.41010.5710.57求和=201.05第15頁,共50頁,2024年2月25日,星期天20個樣本的頻率分布樣本均值范圍頻數(shù)頻率

8.5~9.010.059.0~9.520.109.5~10.050.2510.0~10.590.4510.5~11.020.1011.0~11.510.05第16頁,共50頁,2024年2月25日,星期天

8.759.259.7510.2510.7511.250.500.050.25樣本均值來自N(10,4)總體的20個樣本均值的分布第17頁,共50頁,2024年2月25日,星期天理論依據(jù):若X1,X2,X3,…,Xn是來自于均值為,方差為2的正態(tài)總體的一隨機樣本。則樣本均值也服從正態(tài)分布,其均值為,方差為2/n,即:也就是說,樣本均值的抽樣(或概率)分布,同樣服從正態(tài)分布。第18頁,共50頁,2024年2月25日,星期天2.2樣本均值概率分布的標準正態(tài)變量:將樣本均值的概率密度轉化為標準正態(tài)分布后,可以從標準正態(tài)分布表中計算某一給定樣本均值大于或小于給定的總體均值的概率。第19頁,共50頁,2024年2月25日,星期天例:令X代表某一型號汽車每消耗一加侖汽油所行駛的距離(英里)。已知X~(20,4)。則對于由一個25輛汽車組成的隨機樣本,求:每消耗一加侖汽油所行駛的平均距離大于21英里的概率。分析:由于X服從均值為20,方差為4的正態(tài)分布,則樣本均值也服從正態(tài)分布,其均值為20,方差為4/25。那么,第20頁,共50頁,2024年2月25日,星期天Z服從標準正態(tài)分布,求:查標準正態(tài)概率密度表得:即每消耗一加侖汽油所行駛的平均距離大于21英里的概率為0.0062。第21頁,共50頁,2024年2月25日,星期天2.3中心極限定理引言:從正態(tài)總體中抽樣,其樣本均值服從正態(tài)分布,那么,如果從其他總體中抽樣,情況如何呢?中心極限定理:如果X1,X2,…,Xn是來自(均值為,方差為2)任一總體的隨機樣本,隨著樣本容量的無限增大,其樣本均值趨于正態(tài)分布,其均值為,方差為2/n。第22頁,共50頁,2024年2月25日,星期天§3、

2分布3.1何謂

2分布?

2分布是統(tǒng)計學中常用的一種概率分布,它與正態(tài)分布有緊密的關系。統(tǒng)計理論證明:標準正態(tài)變量的平方服從自由度為1的

2分布,用符號表示為,其中,Z是標準正態(tài)變量,即Z~N(0,1);x2的下標(1)表示自由度。自由度是指平方和中獨立觀察值的個數(shù)。因為我們考慮的是一個標準正態(tài)變量的平方,故自由度為1。第23頁,共50頁,2024年2月25日,星期天現(xiàn)在令Z1,Z2,…,Zk為k個獨立的標準正態(tài)變量(即每一個變量都是均值為0,方差為1的正態(tài)變量),現(xiàn)在對所有的變量Zs平方,則它們的平方和服從自由度為k的X2分布,即公式里的自由度為k,因為在所有變量的平方和中,有k個獨立的觀察值。第24頁,共50頁,2024年2月25日,星期天

2分布的幾何圖形:f(

2)概率密度

2K=2K=5K=10

2變量的密度函數(shù)0第25頁,共50頁,2024年2月25日,星期天3.2

2分布的性質⑴與正態(tài)分布不同,

2分布只取正值(它是平方和的分布),并且取值范圍從0到無限大。⑵與正態(tài)分布不同,

2分布是斜分布,其偏度取決于自由度的大小,自由度越小,越向右偏,但是隨著自由度的增大,逐漸呈對稱,接近于正態(tài)分布。⑶

2分布的期望值為k,方差為2k。k為

2分布的自由度。即

2分布的方差是其均值的2倍。⑷若E1、E2分別為自由度為k1,k2的兩個相互獨立的

2變量,則其和(Z1+Z2)也是一個

2變量,其自由度為(k1+k2)。第26頁,共50頁,2024年2月25日,星期天可以證明:樣本方差與總體方差的比值與自由度(n-1)的積服從自由度為(n-1)的

2分布。公式表示為:其中,

2為總體方差,S2為樣本方差,樣本容量為n。第27頁,共50頁,2024年2月25日,星期天§4、t分布回憶:若樣本均值,則變量Z服從標準正態(tài)分布。即:假定已知和2的估計量S2,則可以用樣本標準差(S)代替總體標準差(),得到一個新的變量t。第28頁,共50頁,2024年2月25日,星期天根據(jù)統(tǒng)計理論得知:變量t服從自由度為(n-1)的t分布。注意:在這里,自由度為(n-1),而不是n。結論:從正態(tài)總體中抽取隨機樣本,若該正態(tài)總體的均值為,但方差2用其估計量S2來代替,則其樣本均值服從t分布。通常用符號tk表示,其中k表示自由度。第29頁,共50頁,2024年2月25日,星期天k=120(正態(tài))K=20K=50不同自由度下的t分布第30頁,共50頁,2024年2月25日,星期天t分布的性質⑴t分布與正態(tài)分布相類似,具有對稱性。⑵t分布的均值與標準正態(tài)分布均值相同,為0,但方差為k/(n-2)。由此,在求t分布的方差時定義自由度必須大于2。標準正態(tài)分布的方差等于1,因此,t分布方差總大于標準分布的方差,也就是說,t分布比正態(tài)分布略“胖”些。第31頁,共50頁,2024年2月25日,星期天t分布與正態(tài)分布:當k增大時,t分布的方差接近于標準正態(tài)分布方差值1。例如:當k=10時,t分布的方差為10/8=1.25;當k=30時,t分布的方差為30/28=1.07;當k=100時,t分布的方差為100/98=1.02;結論:隨著自由度的逐漸增大,t分布近似于正態(tài)分布。注意:對于t分布,不要求其樣本容量很大,k=30時,t分布與正態(tài)分布已很近似。第32頁,共50頁,2024年2月25日,星期天t分布表的使用:0-1.8121.812例:自由度為10,P(t>1.812)=P(t<-1.812)=0.05P(︱t︱>1.812)=P(t>1.812)+P(t<-1.812)=0.10.050.05第33頁,共50頁,2024年2月25日,星期天t分布表舉例:例:變量X表示面包房每日出售的面包量,在15天內,出售面包的樣本方差為16。假定真實的出售量為70條,求任意15天內出售面包平均數(shù)量為74條的概率。分析:本例中已知樣本方差S2=16,則S=4,總體均值(真實的出售量)=70,運用t變量公式得:第34頁,共50頁,2024年2月25日,星期天查t分布表,自由度為(n-1)=15-1=14當自由度為14時,查表得,t值大于等于2.977的概率為0.005,大于等于4.140的概率為0.0005,所以,t值大于等于3.873的概率介于0.0005~0.005之間。練習1:上例中其他條件不變,現(xiàn)假定15天內出售面包的平均數(shù)量為72條,求獲得此數(shù)量的概率。第35頁,共50頁,2024年2月25日,星期天按照上述步驟,首先運用t變量公式,求出t變量。查t分布表,當自由度為14時,t值大于等于1.761的概率為0.05,大于等于2.145的概率為0.025,因此,t值取1.936的概率介于0.025與0.05之間。第36頁,共50頁,2024年2月25日,星期天查t分布表的注意事項:⑴自由度為(n-1),而不是n。⑵t分布表具有對稱性,t值大于等于某一特定值的概率與t值小于等于該特定值相反數(shù)的概率相等。第37頁,共50頁,2024年2月25日,星期天§5、F分布F分布是如何定義的?令隨機樣本X1,X2,X3,…,Xm來自均值為

x和方差為

x2的正態(tài)總體,其樣本容量為m;隨機樣本Y1,Y2,Y3,…,Yn來自均值為

y和方差為

y2的正態(tài)總體,其樣本容量為n;且這兩個樣本相互獨立。假設知道這兩個隨機樣本的樣本方差Sx2和Sy2(兩個總體方差的估計量)。第38頁,共50頁,2024年2月25日,星期天第39頁,共50頁,2024年2月25日,星期天定義一個新的變量F,第40頁,共50頁,2024年2月25日,星期天分析F值:如果這兩個總體方差真實相等,則計算出的F值接近于1,如果兩個總體方差真實值不相等,則F值不等于1;兩總體方差相差越大,則F值越大。統(tǒng)計理論表明:如果

x2=

y2(即兩總體方差相等),則F服從分子自由度為k1=(m-1),分母自由度為k2=(n-1)的F分布。第41頁,共50頁,2024年2月25日,星期天需要說明一點:在概率論與數(shù)理統(tǒng)計中,更準確的說法是:(Sx2/

x2)/(Sy2/

y2)服從F分布,但我們上式給出,

x2=

y2,故樣本方差之比服從F分布。F分布又稱為方差比分布,通常用符號表示為:其中的雙下標表明了分子與分母的自由度。在計算F值時,將方差大的值放在上面,故F值總是大于或等于1。

第42頁,共50頁,2024年2月25日,星期天F分布的性質⑴與

2分布類似,F(xiàn)分布也是斜分布,向右偏,其取值范圍也為0到無限大(見下圖)。0Ff(F)概率密度F2,2F50,50F10,2第43頁,共50頁,2024年2月25日,星期天⑵與

2分布類似,當自由度k1,k2逐漸增大時,F(xiàn)分布近似于正態(tài)分布。⑶t分布變量的平方服從分子自由度為1,分母自由度為k的F分布,即⑷

2變量與其自由度之比近似為分母自由度為m,分子自由度很大(無限大)的F變量,即當n∞第44頁,共50頁,2024年2月25日,星期天對于大容量的樣本,我們可以用

2分布來代替F分布;同樣,也可用F分布代替

2分布。性質3也可以改寫為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論