第4章用概率分布描述隨機(jī)變量_第1頁(yè)
第4章用概率分布描述隨機(jī)變量_第2頁(yè)
第4章用概率分布描述隨機(jī)變量_第3頁(yè)
第4章用概率分布描述隨機(jī)變量_第4頁(yè)
第4章用概率分布描述隨機(jī)變量_第5頁(yè)
已閱讀5頁(yè),還剩107頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第4章用概率分布描述隨機(jī)變量數(shù)學(xué)定律不能百分百確切地用在現(xiàn)實(shí)生活里;能百分百確切地用數(shù)學(xué)定理描述的,就不是現(xiàn)實(shí)生活。

——AlbertEinstein戶(hù)數(shù)比重(%)252015105按純收入分組(元)1000500←15002000250030003500400045005000→4.1度量事件發(fā)生的可能性

—概率probability明天降雨的可能性有多大?你買(mǎi)彩票中獎(jiǎng)的可能性有多大?你購(gòu)買(mǎi)一只股票周一上漲的可能性有多大?這些對(duì)事件發(fā)生可能性大小的度量就是概率什么是概率?

(probability)概率是對(duì)事件發(fā)生的可能性大小的度量你購(gòu)買(mǎi)一只股票明天上漲的可能性有多大明天降水的概率是80%。這里的80%就是對(duì)降水這一事件發(fā)生的可能性大小的一種數(shù)值度量一個(gè)介于0和1之間的一個(gè)值事件A的概率記為P(A)怎樣獲得概率?重復(fù)試驗(yàn)獲得概率當(dāng)試驗(yàn)的次數(shù)很多時(shí),概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來(lái)逼近在相同條件下,重復(fù)進(jìn)行n次試驗(yàn),事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫(xiě)為

用類(lèi)似的比例來(lái)逼近一家餐館將生存5年的概率,可以用已經(jīng)生存了5年的類(lèi)似餐館所占的比例作為所求概率一個(gè)近似值主觀概率有人投擲一枚硬幣,隨著投擲次數(shù)n的增大,出現(xiàn)正面(或反面)的頻率穩(wěn)定在1/2左右。試驗(yàn)的次數(shù)1.000.000.250.500.750255075100125正面/試驗(yàn)次數(shù)利用概率知識(shí)幫助判案在瑞典的一次庭審中,管理泊車(chē)的警察作證說(shuō)他記錄了一輛車(chē)某一邊的兩個(gè)輪胎氣閥的位置。后來(lái)等他重新回到該處時(shí),氣閥還在原來(lái)的位置。(這個(gè)警察的做法是把氣閥的位置記成最接近的“鐘點(diǎn)”位置。例如在下圖中,氣閥是在“10:00”和“3:00”。)在這種情況下他開(kāi)了一張超時(shí)泊車(chē)的罰單。但是車(chē)主卻聲稱(chēng)他已經(jīng)在其間用過(guò)車(chē)子,只不過(guò)?;氐搅嗽瓉?lái)的泊車(chē)位。概率的基本性質(zhì)1.P(Φ)=0,P(Ω)=12.有限可加性:當(dāng)n個(gè)事件A1,A2,A3…,An兩兩互不相容時(shí),P(A1∪...∪An)=P(A1)+...+P(An)。3.對(duì)于任意一個(gè)事件A:P(A)=1-P(非A)4.當(dāng)事件A,B滿(mǎn)足A包含于B時(shí):P(B-A)=P(B)-P(A),P(A)≤P(B)。5.對(duì)于任意一個(gè)事件A,有0≤P(A)≤1。6.對(duì)任意兩個(gè)事件A和B,P(B-A)=P(B)-P(AB).7.加法公式:對(duì)任意兩個(gè)事件A和B,P(A∪B)=P(A)+P(B)-P(AB)。當(dāng)事件A和B互不相容時(shí)P(A∪B)=P(A)+P(B)這里:事件(AB)表示A和B同時(shí)發(fā)生。若A和B相互獨(dú)立:P(AB)=P(A)·P(B)【例題】

:據(jù)經(jīng)驗(yàn)統(tǒng)計(jì),甲運(yùn)動(dòng)員投籃命中(A)概率為80%,乙運(yùn)動(dòng)員投籃命中(B)概率為90%,若兩人各獨(dú)立投一次,有下列結(jié)果:

1)兩人都投中的概率:P(AB)=P(A)·P(B)=80%×90%=72%2)兩人都投不中的概率P(非A非B)=(1-P(A))(1-P(B))=20%*10% 3)甲投中乙投不中的概率P(A)·(1-P(B))=80%×10%=8%4)乙投中而甲投不中的概率(1-P(A))·P(B)=20%×90%=18%5)甲乙至少有一人投中的概率P(A∪B)=P(A)+P(B)-P(AB)=80%+90%-72%=98%4.2隨機(jī)變量的概率分布隨機(jī)變量是變量數(shù)值具有隨機(jī)性的變量。離散型隨機(jī)變量只能取有限多個(gè)數(shù)值.連續(xù)型隨機(jī)變量可以取某一區(qū)間范圍內(nèi)的任意值。4.2.1隨機(jī)變量(randomvariables)事先不知道會(huì)出現(xiàn)什么結(jié)果投擲兩枚硬幣出現(xiàn)正面的數(shù)量一座寫(xiě)字樓,每平方米的出租價(jià)格一個(gè)消費(fèi)者對(duì)某一特定品牌飲料的偏好一般用X,Y,Z來(lái)表示根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量離散型隨機(jī)變量

(discreterandomvariables)隨機(jī)變量X

取有限個(gè)值或所有取值都可以逐個(gè)列舉出來(lái)x1,x2,…以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查100個(gè)產(chǎn)品一家餐館營(yíng)業(yè)一天電腦公司一個(gè)月的銷(xiāo)售銷(xiāo)售一輛汽車(chē)取到次品的個(gè)數(shù)顧客數(shù)銷(xiāo)售量顧客性別0,1,2,…,1000,1,2,…0,1,2,…男性為0,女性為1連續(xù)型隨機(jī)變量(continuousrandomvariables)可以取一個(gè)或多個(gè)區(qū)間中任何值所有可能取值不可以逐個(gè)列舉出來(lái),而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)連續(xù)型隨機(jī)變量的一些例子試驗(yàn)隨機(jī)變量可能的取值抽查一批電子元件新建一座住宅樓測(cè)量一個(gè)產(chǎn)品的長(zhǎng)度使用壽命(小時(shí))半年后工程完成的百分比測(cè)量誤差(cm)X00

X100X0離散型隨機(jī)變量的期望值(expectedvalue)描述離散型隨機(jī)變量取值的集中程度離散型隨機(jī)變量X的所有可能取值xi與其取相對(duì)應(yīng)的概率pi乘積之和記為或E(X)計(jì)算公式為離散型隨機(jī)變量的方差(variance)隨機(jī)變量X的每一個(gè)取值與期望值的離差平方和的數(shù)學(xué)期望,記為2或D(X)描述離散型隨機(jī)變量取值的分散程度計(jì)算公式為方差的平方根稱(chēng)為標(biāo)準(zhǔn)差,記為或D(X)連續(xù)型隨機(jī)變量的期望和方差連續(xù)型隨機(jī)變量的期望值方差例如根據(jù)人口普查數(shù)據(jù),我國(guó)的出生嬰兒男、女性比重如表嬰兒的性別情況表

性別X0(男)1(女)概率P0.5170.4834.2.2離散型隨機(jī)變量概率分布一般地,假定隨機(jī)變量的所有取值為x1,x2,……,xk,對(duì)應(yīng)發(fā)生的概率分別為p(x1)p(x2)……p(xk),可以以下列分布列表示。離散型隨機(jī)變量概率分布的表格形式

Xx1x2……xk……p(X=xi)p(x1)p(x2)……(xk)……【實(shí)例】姚明每次罰球具有一定的隨機(jī)性,那么他三次罰球的得分結(jié)果可能是什么?1.投進(jìn)零個(gè)球———0分2.投進(jìn)一個(gè)球———1分3.投進(jìn)兩個(gè)球———2分4.投進(jìn)三個(gè)球———3分結(jié)果可用得分?jǐn)?shù)這個(gè)隨機(jī)變量X進(jìn)行描述,X的取值為0,1,2,3。其分布列可表示為:X0123p(X)p1p2p3p4【實(shí)例】每次拋兩個(gè)硬幣,記錄正、反面結(jié)果。結(jié)果可記錄為:1.硬幣1正面朝上,硬幣2正面朝上:2個(gè)正面2.硬幣1正面朝上,硬幣2反面朝上:1個(gè)正面3.硬幣1反面朝上,硬幣2正面朝上:1個(gè)正面4.硬幣1反面朝上,硬幣2反面朝上:0個(gè)正面在此,正面數(shù)是一個(gè)隨機(jī)變量,記為X,我們通常對(duì)X的每個(gè)取值的概率感興趣。X的取值為0、1、2。其分布列可表示為:X012p(X)0.250.50.25離散型隨機(jī)變量分布的性質(zhì)(1)(2)掌握隨機(jī)變量概率分布的好處:只要確知一個(gè)離散隨機(jī)變量的概率分布并用一定的公式表達(dá)出來(lái),就能根據(jù)這一分布計(jì)算隨機(jī)變量取任一值的概率二項(xiàng)試驗(yàn)

(伯努利試驗(yàn))

二項(xiàng)分布與伯努利試驗(yàn)有關(guān)貝努里試驗(yàn)滿(mǎn)足下列條件一次試驗(yàn)只有兩個(gè)可能結(jié)果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗(yàn)“成功”的概率為p,失敗的概率為q=1-p,且概率p對(duì)每次試驗(yàn)都是相同的

試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行n次

在n次試驗(yàn)中,“成功”的次數(shù)對(duì)應(yīng)一個(gè)離散型隨機(jī)變量X

二項(xiàng)分布

(Binomialdistribution)重復(fù)進(jìn)行

n次試驗(yàn),出現(xiàn)“成功”的次數(shù)的概率分布稱(chēng)為二項(xiàng)分布,記為X~B(n,p)設(shè)X為n次重復(fù)試驗(yàn)中出現(xiàn)成功的次數(shù),X取x的概率為二項(xiàng)分布

(期望值和方差)期望值

=E(X)=np方差2

=D(X)=npq0.00.20.40.6012345XP(X)n=5p=0.50.20.40.6012345XP(X)n=5p=0.1二項(xiàng)分布

(例題分析)【例】已知一批產(chǎn)品的次品率為4%,從中任意有放回地抽取5個(gè)。求5個(gè)產(chǎn)品中(1)沒(méi)有次品的概率是多少?(2)恰好有1個(gè)次品的概率是多少?(3)有3個(gè)以下次品的概率是多少?二項(xiàng)分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel工作表中,直接點(diǎn)擊【fx】(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類(lèi)”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),在“函數(shù)名”中點(diǎn)擊【BINOMDIST】選項(xiàng),然后確定第4步:在【Number_s】后填入試驗(yàn)成功次數(shù)(本例為1)在【Trials】后填入總試驗(yàn)次數(shù)(本例為5)在【Probability_s】后填入試驗(yàn)的成功概率(本例為0.04)在【Cumulative】后填入0(或FALSE),表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值)

用Excel計(jì)算概率Excel二項(xiàng)分布函數(shù)BINOMDIST

一個(gè)推銷(xiāo)員打了六個(gè)電話,每次推銷(xiāo)成功的概率是0.3,建立推銷(xiāo)成功次數(shù)的概率分布圖表。泊松分布

(Poissondistribution)1837年法國(guó)數(shù)學(xué)家泊松(D.Poisson,1781—1840)首次提出用于描述在一指定時(shí)間范圍內(nèi)或在一定的長(zhǎng)度、面積、體積之內(nèi)每一事件出現(xiàn)次數(shù)的分布泊松分布的例子一定時(shí)間段內(nèi),某航空公司接到的訂票電話數(shù)一定時(shí)間內(nèi),到車(chē)站等候公共汽車(chē)的人數(shù)一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù)一定時(shí)間段內(nèi),放射性物質(zhì)放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點(diǎn)個(gè)數(shù)一定頁(yè)數(shù)的書(shū)刊上出現(xiàn)的錯(cuò)別字個(gè)數(shù)

泊松分布

(概率分布函數(shù))—給定的時(shí)間間隔、長(zhǎng)度、面積、體積內(nèi)“成功”的平均數(shù)e=2.71828x—給定的時(shí)間間隔、長(zhǎng)度、面積、體積內(nèi)“成功”的次數(shù)泊松分布

(期望值和方差)期望值

E(X)=方差

D(X)=

0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)l

=6l

=0.5泊松分布

(例題分析)【例】假定某航空公司預(yù)訂票處平均每小時(shí)接到42次訂票電話,那么10分鐘內(nèi)恰好接到6次電話的概率是多少?解:設(shè)X=10分鐘內(nèi)航空公司預(yù)訂票處接到的電話次數(shù)

泊松分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊【f(x)】命令第3步:在復(fù)選框“函數(shù)分類(lèi)”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),并在“函數(shù)名”中點(diǎn)擊【POISSON】選項(xiàng),然后【確定】第4步:在【X】后填入事件出現(xiàn)的次數(shù)(本例為6)在【Means】后填入泊松分布的均值(本例為7)在【Cumulative】后填入0(或FALSE),表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值)

用Excel計(jì)算概率超幾何分布

(hypergeometricdistribution)采用不重復(fù)抽樣,各次試驗(yàn)并不獨(dú)立,成功的概率也互不相等總體元素的數(shù)目N很小,或樣本容量n相對(duì)于N來(lái)說(shuō)較大時(shí),樣本中“成功”的次數(shù)則服從超幾何概率分布概率分布函數(shù)為超幾何分布

(例題分析)【例】假定有10支股票,其中有3支購(gòu)買(mǎi)后可以獲利,另外7支購(gòu)買(mǎi)后將會(huì)虧損。如果你打算從10支股票中選擇4支購(gòu)買(mǎi),但你并不知道哪3支是獲利的,哪7支是虧損的。求(1)有3支能獲利的股票都被你選中的概率有多大?(2)3支可獲利的股票中有2支被你選中的概率有多大?

解:設(shè)N=10,M=3,n=4超幾何分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel工作表中,直接點(diǎn)擊【f(x)】(插入函數(shù))命令第3步:在復(fù)選框“函數(shù)分類(lèi)”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),并在“函數(shù)名”中點(diǎn)擊【HYPGEOMDIST】選項(xiàng),然后【確定】第4步:在【Sample_s】后填入樣本中成功的次數(shù)x(本例為3)

在【Number_sample】后填入樣本容量n(本例為4)

在【Population_s】后填入總體中成功的次數(shù)M(本例為3)

在【Number_pop】后填入總體中的個(gè)體總數(shù)N

(本例為10)

用Excel計(jì)算概率4.2.3連續(xù)型概率分布4.2隨機(jī)變量的概率分布調(diào)查某市150戶(hù)家庭,獲得家庭人均收入數(shù)據(jù)如下(上組限不在內(nèi)):

:上表數(shù)據(jù)的直方圖如果樣本量很大,組段很多,矩形頂端組成的階梯型曲線可變成光滑的分布曲線。

可采用一個(gè)函數(shù)擬合這一光滑曲線。這種函數(shù)稱(chēng)為概率密度函數(shù)。

戶(hù)數(shù)比重(%)252015105按純收入分組(元)1000500←15002000250030003500400045005000→連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量的概率分布連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值它取任何一個(gè)特定的值的概率都等于0不能列出每一個(gè)值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來(lái)描述常用連續(xù)型概率分布正態(tài)分布

(normaldistribution)由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對(duì)頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來(lái)描述可用于近似離散型隨機(jī)變量的分布例如:二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)xf(x)概率密度函數(shù)

f(x)=隨機(jī)變量X的頻數(shù)

=正態(tài)隨機(jī)變量X的均值

=正態(tài)隨機(jī)變量X的方差

=3.1415926;e=2.71828

x=隨機(jī)變量的取值(-<x<+)正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱(chēng)鐘形曲線,且峰值在x=處均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1

和對(duì)正態(tài)曲線的影響xf(x)CAB=1/212=1正態(tài)分布的概率概率是曲線下的面積!abxf(x)標(biāo)準(zhǔn)正態(tài)分布

(standardizenormaldistribution)標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)標(biāo)準(zhǔn)正態(tài)分布Xms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布

(用Excel計(jì)算概率)第1步:進(jìn)入Excel表格界面,將鼠標(biāo)停留在某一空白單元格第2步:在Excel表格界面中,直接點(diǎn)擊【f(x)】(粘貼函數(shù))命令第3步:在復(fù)選框“函數(shù)分類(lèi)”中點(diǎn)擊【統(tǒng)計(jì)】選項(xiàng),并在“函數(shù)名”中點(diǎn)擊【NORMDIST】選項(xiàng),然后【確定】第4步:在【X】后填入正態(tài)分布函數(shù)計(jì)算的區(qū)間點(diǎn)(本例為40)在【Mean】后填入正態(tài)分布的均值(本例為50)

在【PStandard_dev】后填入標(biāo)準(zhǔn)差

(本例為10)

在【Cumulative】后填入1(或TRUE)表示計(jì)算事件出現(xiàn)次數(shù)小于或等于指定數(shù)值的累積概率值正態(tài)分布

(例題分析)【例】計(jì)算以下概率(1)

X~N(50,102),求和(2)

Z~N(0,1),求和(3)正態(tài)分布概率為0.05時(shí),求標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)的反函數(shù)值z(mì)

用Excel的統(tǒng)計(jì)函數(shù)計(jì)算概率

數(shù)據(jù)正態(tài)性的評(píng)估對(duì)數(shù)據(jù)畫(huà)出頻數(shù)分布的直方圖或莖葉圖若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似求出樣本數(shù)據(jù)的四分位差Qd和標(biāo)準(zhǔn)差s,然后計(jì)算比值Qd/s。若數(shù)據(jù)近似服從正態(tài)分布,則有

Qd/s1.3繪制正態(tài)概率圖正態(tài)概率圖的繪制

(normalprobabilityplots)正態(tài)概率圖可以在概率紙上繪制,也可以在普通紙上繪制。在普通紙上繪制正態(tài)概率圖的步驟第1步:將樣本觀察值從小到大排列第2步:求出樣本觀察值的標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zi。標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)滿(mǎn)足第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為標(biāo)準(zhǔn)正態(tài)概率圖正態(tài)概率圖的繪制

(例題分析)【例】一家電腦公司連續(xù)10天的銷(xiāo)售額(單位:萬(wàn)元)分表為176,191,214,,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷該組數(shù)據(jù)是否服從正態(tài)分布用SPSS繪制正態(tài)概率圖

用SPSS繪制正態(tài)概率圖第1步:選擇【Graphs】下拉菜單,并選擇【Q-Q】選項(xiàng)進(jìn)入主對(duì)話框第2步:在主對(duì)話框中將變量選入【Variables】,點(diǎn)擊【OK】正態(tài)概率圖的繪制

(例題分析)電腦公司銷(xiāo)售額的正態(tài)概率圖

正態(tài)概率圖的繪制

(SPSS繪制的例2.3的正態(tài)概率圖)正態(tài)概率圖的分析

(normalprobabilityplots)正態(tài)概率圖有時(shí)也稱(chēng)為分位數(shù)—分位數(shù)圖,或稱(chēng)Q-Q圖實(shí)際應(yīng)用中,只有樣本數(shù)據(jù)較多時(shí)正態(tài)概率圖的效果才比較好。當(dāng)然也可以用于小樣本,但此時(shí)可能會(huì)出現(xiàn)與正態(tài)性有較大偏差的情況在分析正態(tài)概率圖時(shí),最好不要用嚴(yán)格的標(biāo)準(zhǔn)去衡量數(shù)據(jù)點(diǎn)是否在一條直線上,只要近似在一條直線上即可對(duì)于樣本點(diǎn)中數(shù)值最大或最小的點(diǎn)也可以不用太關(guān)注,除非這些點(diǎn)偏離直線特別遠(yuǎn),因?yàn)檫@些點(diǎn)通常會(huì)與直線有偏離。如果某個(gè)點(diǎn)偏離直線特別遠(yuǎn),而其他點(diǎn)又基本上在直線上時(shí),這個(gè)點(diǎn)可能是離群點(diǎn),可不必考慮Excel正態(tài)分布函數(shù)

NORMDIST已知某國(guó)男性的身高X~N(170,2^2),請(qǐng)問(wèn):身高為166至174的男性占男性的比率有多大?=NORMDIST(166,170,2,1)

=NORMDIST(174,170,2,1)

=NORMDIST(65,50,10,1)

=NORMDIST(65,60,4,1)

由甲地到乙地有兩條路線可供選擇。第一條路線路程較短,但交通擁擠,所需時(shí)間X~N(50,10^2);另一條路線路程較長(zhǎng),但較通暢,所需時(shí)間Y~N(60,4^2)(單位min)。如果要求在65分鐘內(nèi)從甲地到達(dá)乙地,應(yīng)走哪條路線?解:由于而故從走概率較大而保險(xiǎn)的角度看,應(yīng)該走第一條路線。4.3由正態(tài)分布導(dǎo)出的幾個(gè)重要分布

2分布

t分布

F分布由阿貝(Abbe)

于1863年首先給出,后來(lái)由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來(lái)設(shè),則令,則y服從自由度為1的2分布,即對(duì)于n個(gè)正態(tài)隨機(jī)變量y1,y2,yn,則隨機(jī)變量稱(chēng)為具有n個(gè)自由度的2分布,記為4.3.1c2-分布(2-distribution)分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱(chēng)的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱(chēng)期望為:E(2)=n,方差為:D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布c2-分布

(性質(zhì)和特點(diǎn))不同自由度的c2-分布c2n=1n=4n=10n=20c2-分布

(用Excel計(jì)算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計(jì)函數(shù),計(jì)算c2分布右單尾的概率值語(yǔ)法:CHIDIST(x,degrees_freedom)

,其中df為自由度,x,是隨機(jī)變量的取值利用【CHIINV】函數(shù)則可以計(jì)算給定右尾概率和自由度時(shí)相應(yīng)的反函數(shù)值

語(yǔ)法:CHIINV(probability,degrees_freedom)

用Excel計(jì)算c2分布的概率4.3.3t-分布

(t-distribution)提出者是WilliamGosset,也被稱(chēng)為學(xué)生分布(student’st)

t分布是類(lèi)似正態(tài)分布的一種對(duì)稱(chēng)分布,通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴(lài)于稱(chēng)之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)zt-分布

(用Excel生成t分布的臨界值表)利用Excel中的【TDIST】統(tǒng)計(jì)函數(shù),可以計(jì)算給定值和自由度時(shí)分布的概率值語(yǔ)法:TDIST(x,degrees_freedom,tails)

利用【TINV】函數(shù)則可以計(jì)算給定概率和自由度時(shí)的相應(yīng)

語(yǔ)法:TINV(probability,degrees_freedom)

用Excel生成t分布的臨界值表為紀(jì)念統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)

以其姓氏的第一個(gè)字母來(lái)命名則設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨(dú)立,則稱(chēng)F為服從自由度n1和n2的F分布,記為4.3.3F-分布(F

distribution)不同自由度的F分布(圖示)F(1,10)(5,10)(10,10)F-分布

(用Excel計(jì)算F分布的概率)利用Excel提供的【FDIST】統(tǒng)計(jì)函數(shù),計(jì)算分布右單尾的概率值語(yǔ)法:FDIST(x,degrees_freedom1,degrees_freedom2)利用【FINV】函數(shù)則可以計(jì)算給定單尾概率和自由度時(shí)的相應(yīng)

語(yǔ)法:FINV(probability,degrees_freedom1,degrees_freedom2)

用Excel計(jì)算F分布的概率3.4樣本統(tǒng)計(jì)量的抽樣分布

3.4.1樣本均值的抽樣分布3.4.2其他統(tǒng)計(jì)量的抽樣分布3.4.3統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差第3章用概率分布描述隨機(jī)變量樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取樣本量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布

隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布

(samplingdistribution)3.4.1樣本均值的抽樣分布3.4樣本統(tǒng)計(jì)量的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布樣本均值的抽樣分布

(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布

(例題分析)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x的期望值為μ,方差為σ2/n。即x~N(μ,σ2/n)中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過(guò)程3.4.2其他統(tǒng)計(jì)量的抽樣分布3.4樣本統(tǒng)計(jì)量的抽樣分布總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的抽樣分布

(proportion)在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似,即

樣本比例的抽樣分布樣本方差的分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即樣本方差的分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即重要概率分布連續(xù)型隨機(jī)變量正態(tài)分布

分布t分布F分布離散型隨機(jī)變量二項(xiàng)分布泊松分布超幾何分布μ不同時(shí)的正態(tài)分布

σ不同時(shí)的正態(tài)分布

正態(tài)概率密度曲線圖性質(zhì)1.關(guān)于x=μ對(duì)稱(chēng)2.在x=μ曲線最高3.在x=μ±σ處各有一個(gè)拐點(diǎn)4.曲線下面積(以x軸為界)為15.若σ固定,隨μ值不同,曲線位置不同,故稱(chēng)μ為位置參數(shù)6.若μ固定,σ大時(shí),曲線矮而胖;小時(shí),曲線瘦而高,故稱(chēng)為形狀參數(shù)正態(tài)分布表示方法若隨機(jī)變量X服從均值為μ方差為的正態(tài)分布,記:X~N(μ,)標(biāo)準(zhǔn)正態(tài)分布Z~N(0,1)一般正態(tài)分布隨機(jī)變量X可標(biāo)準(zhǔn)化為標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量Z:Z=(X-μ)/σ正態(tài)分布曲線下的面積若隨機(jī)變量X~N(μ,)

密度曲線下的總面積為1(這是所有密度函數(shù)的性質(zhì))-Zα/21-aa/2Zα/2a/2μ正態(tài)分布置信度落在正態(tài)分布圖尾部區(qū)域的X是小概率事件。其概率我們記為α。而稱(chēng)1-α為可信程度或置信度。通常置信度取90%,95%,99%正態(tài)分布曲線下的面積與臨界值正態(tài)分布模型的概率計(jì)算當(dāng)X~N(0,1)時(shí),有其中Φ(x)是標(biāo)準(zhǔn)正態(tài)分布密度函數(shù),取值可在Excel里得到。因?yàn)橹唤o出X>0的結(jié)果,所以當(dāng)X<0時(shí),可用Φ(-x)=1-Φ(x)求出。若隨機(jī)變量X~N(μ,)時(shí),樣本統(tǒng)計(jì)量的抽樣分布樣本均值的分布樣本比例的分布樣本方差的分布抽樣分布正態(tài)或t分布Χ2分布正態(tài)或t分布樣本均值的分布

設(shè)X1,X2,…,Xn是來(lái)自正態(tài)總體N~(μ,σ2)的一個(gè)樣本,則樣本均值服從均值為μ方差為σ^2/n的正態(tài)分布。

設(shè)X1,X2,…,Xn是來(lái)自任總體的一個(gè)大(n>30)樣本,則樣本均值近似服從均值為μ方差為s^2/n的正態(tài)分布。樣本均值的分布

設(shè)X1,X2,…,Xn是來(lái)自非正態(tài)總體的一個(gè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論