概率論與數(shù)理統(tǒng)計(jì)第四章_第1頁
概率論與數(shù)理統(tǒng)計(jì)第四章_第2頁
概率論與數(shù)理統(tǒng)計(jì)第四章_第3頁
概率論與數(shù)理統(tǒng)計(jì)第四章_第4頁
概率論與數(shù)理統(tǒng)計(jì)第四章_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)學(xué)期望方差矩和協(xié)方差矩陣第四章變量的數(shù)字特征協(xié)方差和相關(guān)系數(shù)

第一節(jié)數(shù)學(xué)期望在前面的課程中,我們討論了隨機(jī)變量及其分布,如果知道了隨機(jī)變量X的概率分布,那么X的全部概率特征也就知道了。然而,在實(shí)際問題中,概率分布一般是較難確定的。而在一些實(shí)際應(yīng)用中,人們并不需要知道隨機(jī)變量的一切概率性質(zhì),只要知道它的某些數(shù)字特征就夠了。因此,在對(duì)隨機(jī)變量的研究中,確定某些數(shù)字特征是重要的。在這些數(shù)字特征中,最常用的是數(shù)學(xué)期望、方差、協(xié)方差和相關(guān)系數(shù)起源:法國數(shù)學(xué)家帕斯卡(Pascal,1623—1662)

法國數(shù)學(xué)家費(fèi)馬(Fermat,1601—1665)法國軍人德.梅勒(DeMere,1607—1684)一、離散型隨機(jī)變量的數(shù)學(xué)期望帕斯卡德.梅勒約定先贏5局,獲全部賭金A:4B:3分賭金寫信費(fèi)馬假設(shè)再賭一局A贏獲全賭金:1A輸獲賭金:1/2A最后獲賭金:1/2×1+1/2×1/2=3/4B最后獲賭金:1/2×0+1/2×1/2=1/4期望(提前分錢)朋友引例1

某車間對(duì)工人的生產(chǎn)情況進(jìn)行考察。車工小張每天生產(chǎn)的次品數(shù)X是一個(gè)隨機(jī)變量。如何確定小張每天生產(chǎn)的次品數(shù)的平均值呢?我們先觀察小張100天的生產(chǎn)情況(假定小張每天至多出現(xiàn)三件次品)若統(tǒng)計(jì)100天,

32天沒有出次品;30天每天出一件次品;17天每天出兩件次品;21天每天出三件次品;可以得到這100天中每天的平均次品數(shù)為這個(gè)數(shù)能否作為X的平均值嗎?可以想象,若另外統(tǒng)計(jì)100天,車工小張不出次品,出一件、二件、三件次品的天數(shù)與前面的100天一般不會(huì)完全相同,這另外100天每天的平均次品數(shù)也不一定是1.27。n0天沒有出次品;n1天每天出一件次品;n2天每天出兩件才品;n3天每天出三件次品.可以得到n天中每天的平均次品數(shù)為一般來說,若統(tǒng)計(jì)n天,(假定小張每天至多出三件廢品)以頻率為權(quán)的加權(quán)平均

當(dāng)n很大時(shí),頻率接近于概率,所以我們?cè)谇蟠纹窋?shù)X的平均值時(shí),用概率代替頻率,得平均值為以概率為權(quán)的加權(quán)平均這是一個(gè)確定的數(shù)。我們就用這個(gè)數(shù)作為隨機(jī)變量X的平均值。注:離散型隨機(jī)變量的數(shù)學(xué)期望是一個(gè)絕對(duì)收斂的級(jí)數(shù)的和。數(shù)學(xué)期望是隨機(jī)變量的平均值,與X的取值x

k的順序無關(guān)(唯一性),所以要求級(jí)數(shù)絕對(duì)收斂。若級(jí)數(shù)絕對(duì)收斂,則稱此級(jí)數(shù)的和為X

的數(shù)學(xué)期望。設(shè)離散型隨機(jī)變量X

的分布律為定義4.1簡(jiǎn)稱期望或均值,記為E(X)。即例4.1甲乙兩人射擊,他們的射擊水平由下表給出試問哪個(gè)人的射擊水平較高?解

甲乙的平均環(huán)數(shù)可求得:因此,從平均環(huán)數(shù)上看,甲的射擊水平要比乙的好。X:甲擊中的環(huán)數(shù)Y:乙擊中的環(huán)數(shù)解

設(shè)試開次數(shù)為X,于是某人的一串鑰匙上有n把鑰匙,其中只有一把能打開自己的家門,他隨意地試用這串鑰匙中的某一把去開門。若每把鑰匙試開一次后除去,求打開門時(shí)試開次數(shù)的數(shù)學(xué)期望。例4.2一旅客8:20到車站,求他候車時(shí)間的數(shù)學(xué)期望。按規(guī)定,某車站每天8:00~9:00,9:00~10:00都恰有一輛客車到站,但到站時(shí)刻是隨機(jī)的,且兩者到站的時(shí)間相互獨(dú)立。其規(guī)律為:

例4.3解:設(shè)旅客的候車時(shí)間為X(以分計(jì),其分布率為)設(shè)A為事件“第一班車8:10到站”,B為事件“第二班車9:30到站”。候車時(shí)間X的數(shù)學(xué)期望為二、連續(xù)型隨機(jī)變量的數(shù)學(xué)期望設(shè)X是連續(xù)型隨機(jī)變量,其密度函數(shù)為f(x),在數(shù)軸上取很密的分點(diǎn)x0<x1<x2<…,則X落在小區(qū)間[xi,xi+1)的概率是這正是的漸近和式。因此X與以概率f(xi)Δxi,取值xi的離散型r.v.近似,該離散型r.v

的數(shù)學(xué)期望是由此啟發(fā)我們引進(jìn)如下定義。定義4.2

設(shè)X是連續(xù)型隨機(jī)變量,其密度函數(shù)為f(x),如果積分絕對(duì)收斂,則稱此積分值為X的數(shù)學(xué)期望,即注:

連續(xù)型隨機(jī)變量的數(shù)學(xué)期望是一個(gè)絕對(duì)收斂的積分。例4.4若將這兩個(gè)電子裝置串聯(lián)連接組成整機(jī),求整機(jī)壽命(以小時(shí)計(jì))N

的數(shù)學(xué)期望。例4.5有2個(gè)相互獨(dú)立工作的電子裝置,它們的壽命Xk(k=1,2)服從同一指數(shù)分布,其概率密度為的分布函數(shù)為三、隨機(jī)變量函數(shù)的數(shù)學(xué)期望

問題的提出:設(shè)已知隨機(jī)變量X的分布,我們需要計(jì)算的不是X的期望,而是X的某個(gè)函數(shù)的期望,比如說g(X)的期望。那么應(yīng)該如何計(jì)算呢?一種方法是,因?yàn)間(X)也是隨機(jī)變量,故應(yīng)有概率分布,它的分布可以由已知的X的分布求出來。一旦我們知道了g(X)的分布,就可以按照期望的定義把E[g(X)]計(jì)算出來。解已知X的分布律為求X2及的數(shù)學(xué)期望。同理例4.6那么是否可以不先求g(X)的分布而只根據(jù)X的分布求得E[g(X)]呢?下面的定理指出,答案是肯定的。

使用這種方法必須先求出隨機(jī)變量函數(shù)g(X)的分布,一般是比較復(fù)雜的。(1)當(dāng)X為離散型時(shí),它的分布率為P(X=xk)=pk;(2)當(dāng)X為連續(xù)型時(shí),它的密度函數(shù)為f(x)。若定理4.3

設(shè)Y是隨機(jī)變量X的函數(shù):Y=g(X)(g是連續(xù)函數(shù))該公式的重要性在于:當(dāng)我們求E[g(X)]時(shí),不必知道g(X)的分布,只需知道X的分布就可以了。設(shè)隨機(jī)變量X的概率密度為求E(1/X)。解例4.7某公司按季度銷售某商品的量X服從[2000,4000]上的均勻分布,銷售1公斤獲利3元,屯倉1公斤虧損1元,為獲利最大,該公司應(yīng)進(jìn)貨多少公斤?(最佳決策問題)解

設(shè)S為進(jìn)貨量,則2000≤S≤4000,獲得利潤為由題意可得則平均利潤為例4.8求S使E(Y)最大可得S=3500(公斤)定理4.4

設(shè)(X,Y)是二維隨機(jī)變量,g(X,Y)是二元連續(xù)函數(shù)Z=g(X,Y)⑴設(shè)(X,Y)為離散型隨機(jī)變量,其聯(lián)合分布律為若級(jí)數(shù)絕對(duì)收斂,則Z

的數(shù)學(xué)期望為⑵設(shè)X為連續(xù)型隨機(jī)變量,其概率密度為f(x,y),若絕對(duì)收斂,則Z的數(shù)學(xué)期望為已知(X,Y)的概率密度求E(X),E(Y),E(XY)解同理例4.9一般來說,E(XY)≠E(X)E(Y),那么何時(shí)相等?1.設(shè)C是常數(shù),則E(C)=C;2.若C是常數(shù),則E(CX)=CE(X);3.E(X+Y)=E(X)+E(Y);四、數(shù)學(xué)期望的性質(zhì)4.設(shè)X、Y相互獨(dú)立,則E(XY)=E(X)E(Y)。注意:由E(XY)=E(X)E(Y)不一定能推出X,Y獨(dú)立五、幾種重要分布的數(shù)學(xué)期望Ⅰ.X為離散型隨機(jī)變量⑴(0—1)分布⑵泊松分布⑶二項(xiàng)分布任何一個(gè)服從二項(xiàng)分布的隨機(jī)變量X都可表示n個(gè)服從(0-1)分布的獨(dú)立的隨機(jī)變量Xi相加的形式:X=X1+X2+…+XnⅡ.X為連續(xù)型隨機(jī)變量⑴均勻分布X~U(a,b),則⑵指數(shù)分布X~E(λ)則分部積分法⑶正態(tài)分布已知X~N(2,4),Y服從參數(shù)為3的指數(shù)分布,X,Y相互獨(dú)立,U=3X-6Y+9,V=XY+2X-3Y。求E(U),E(V)。解

由隨機(jī)變量的性質(zhì)可知例4.10EU=3EX-6EY+9=3*2-6*(1/3)+9=13EV=E(X)E(Y)+2E(X)-3E(Y)=2/3+4-1=11/3六、數(shù)學(xué)期望性質(zhì)的應(yīng)用求二項(xiàng)分布的數(shù)學(xué)期望。解:若X~B(n,p),則X表示n重貝努里試驗(yàn)中的“成功”次數(shù)?,F(xiàn)在我們來求X的數(shù)學(xué)期望。例4.11若設(shè)i=1,2,…,n則X=X1+X2+…+Xn因?yàn)镻(Xi=1)=p,P(Xi=0)=1-p=np所以E(X)=E(Xi)=1*p+0*(1-p)=p

把數(shù)字1,2,…,n任意地排成一列,如果數(shù)字k恰好出現(xiàn)在第k個(gè)位置上,則稱為一個(gè)巧合,求巧合個(gè)數(shù)的數(shù)學(xué)期望。由于E(Xk)=P(Xk=1)解:設(shè)巧合個(gè)數(shù)為X,引入

k=1,2,…,n則故例4.12

一民航送客車載有20位旅客自機(jī)場(chǎng)開出,旅客有10個(gè)車站可以下車,如到達(dá)一個(gè)車站沒有旅客下車就不停車。以X表示停車的次數(shù),求E(X)。(設(shè)每位旅客在各個(gè)車站下車是等可能的,并設(shè)各旅客是否下車相互獨(dú)立)例4.13按題意

第二節(jié)方差

上一節(jié)我們介紹了隨機(jī)變量的數(shù)學(xué)期望,它體現(xiàn)了隨機(jī)變量取值的平均水平,是隨機(jī)變量的一個(gè)重要的數(shù)字特征。但是在一些場(chǎng)合,僅僅知道平均值是不夠的。

引例:

甲、乙兩個(gè)合唱隊(duì)都由5名成員組成,身高如下:甲:1.60、1.62、1.59、1.60、1.59乙:1.80、1.60、1.50、1.50、1.60那個(gè)合唱隊(duì)演出效果好?分析:易見,甲乙兩隊(duì)的平均身高都為1.60,但顯然甲隊(duì)比乙隊(duì)整齊,身高相對(duì)集中在1.60米左右,演出效果好。又如,甲、乙兩門炮同時(shí)向一目標(biāo)射擊10發(fā)炮彈,其落點(diǎn)距目標(biāo)的位置如圖:你認(rèn)為哪門炮射擊效果好一些呢?甲炮射擊結(jié)果乙炮射擊結(jié)果乙炮因?yàn)橐遗诘膹椫c(diǎn)較集中在中心附近

中心中心由此可見,研究隨機(jī)變量與其均值的偏離程度是十分必要的。那么,用怎樣的量去度量這個(gè)偏離程度呢?容易看到(1)能度量隨機(jī)變量與其均值E(X)的偏離程度。但由于上式帶有絕對(duì)值,運(yùn)算不方便,通常用量(2)來度量隨機(jī)變量X與其均值E(X)的偏離程度。這個(gè)數(shù)字特征就是我們這一講要介紹的方差。(1)(2)一、方差的定義定義4.5

設(shè)X是一個(gè)隨機(jī)變量,若E[(X-E(X)]2存在,稱E[(X-E(X)]2為X的方差。記為D(X)或Var(X),即D(X)=Var(X)=E[X-E(X)]2方差的算術(shù)平方根稱為均方差或標(biāo)準(zhǔn)差。方差刻劃了隨機(jī)變量的取值對(duì)于其數(shù)學(xué)期望的離散程度。若X的取值比較集中,則方差D(X)較??;若X的取值比較分散,則方差D(X)較大。因此,D(X)是刻畫X取值分散程度的一個(gè)量,它是衡量X取值分散程度的一個(gè)尺度。由定義知,方差是隨機(jī)變量X的函數(shù)

g(X)=[X-E(X)]2的數(shù)學(xué)期望。二、方差的計(jì)算計(jì)算方差的一個(gè)簡(jiǎn)化公式

D(X)=E(X2)-[E(X)]2

證:D(X)=E[X-E(X)]2=E{X2-2XE(X)+[E(X)]2}=E(X2)-2[E(X)]2+[E(X)]2=E(X2)-[E(X)]2解由公式因此,0-1分布設(shè)隨機(jī)變量X具有(0-1)分布,其分布率為求D(X)。例4.14解X的分布率為例4.15因此,泊松分布解因此,均勻分布例4.16解由此可知,指數(shù)分布設(shè)隨機(jī)變量X服從指數(shù)分布,其概率密度為例4.17三、方差的性質(zhì)1.設(shè)C是常數(shù),則D(C)=0;2.若C是常數(shù),則D(CX)=C2

D(X);3.設(shè)X與Y是兩個(gè)隨機(jī)變量,則

D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}4.

D(X)=0,就是指P{X=C}=1,這里C=E(X)下面我們證明性質(zhì)3證明若X,Y相互獨(dú)立,由數(shù)學(xué)期望的性質(zhì)4得此性質(zhì)可以推廣到有限多個(gè)相互獨(dú)立的隨機(jī)變量之和的情況。設(shè)X~B(n,p),求E(X)和D(X)。若設(shè)i=1,2,…,n解X~B(n,p),則X表示n重努里試驗(yàn)中的“成功”次數(shù)。例4.18由于X1,X2,…,Xn相互獨(dú)立i=1,2,…,nE(Xi)=p,D(Xi)=

p(1-p),

則是n次試驗(yàn)中“成功”的次數(shù)于是=np(1-p)解于是例4.19設(shè)X,Y是兩個(gè)相互獨(dú)立的且服從正態(tài)分布的隨機(jī)變量,且X~N(-3,1),Y~N(2,1),則求隨機(jī)變量Z=X-2Y+7服從什么分布?解

Z為正態(tài)隨機(jī)變量的線性組合,所以仍然服從正態(tài)分布,且其參數(shù)為故Z~N(0,5)例4.20設(shè)X,Y是兩個(gè)相互獨(dú)立的且均服從正態(tài)分布N(0,1/2)的隨機(jī)變量,則求隨機(jī)變量|X-Y|的數(shù)學(xué)期望。解

記Z=X-Y,則E(X-Y)=E(X)-E(Y)=0。故Z~N(0,1)例4.21D(X-Y)=D(X)+D(Y)=1設(shè)X的可能取值為x1=-1,x2=0,x3=1,且E(X)=0.1,D(X)=0.89,求X的分布律。所以例4.21解設(shè)

X的分布律為解

由題意可知已知的次數(shù),求對(duì)X獨(dú)立觀察4次,Y表示X

的觀察值大于例4.22設(shè)U~[-2,2],且⑴求X和

Y的分布律;⑵求X+Y的方差。解

X,Y的取值都為-1和1,則例4.23⑵X+Y

的分布律為

第三節(jié)協(xié)方差和相關(guān)系數(shù)問題對(duì)于二維隨機(jī)變量(X,Y):已知聯(lián)合分布邊緣分布對(duì)二維隨機(jī)變量,除每個(gè)隨機(jī)變量各自的概率特性外,相互之間可能還有某種聯(lián)系,問題是用一個(gè)怎樣的數(shù)去反映這種聯(lián)系?反映了隨機(jī)變量X,Y之間的某種關(guān)系⑶Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)⑴Cov(X,Y)=Cov(Y,X)一、協(xié)方差性質(zhì)⑵Cov(aX,bY)=abCov(X,Y)a,b是常數(shù)定義4.6量E{[X-E(X)][Y-E(Y)]}稱為隨機(jī)變量X和Y的協(xié)方差,記為Cov(X,Y),即Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}特別地

Cov(X,Y)=E(XY)-E(X)E(Y)可見,若X與Y獨(dú)立,Cov(X,Y)=0。計(jì)算協(xié)方差的一個(gè)簡(jiǎn)單公式由協(xié)方差的定義及期望的性質(zhì),可得Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)即特別地D(X+Y)=D(X)+D(Y)+2Cov(X,Y)隨機(jī)變量和的方差與協(xié)方差的關(guān)系協(xié)方差的大小在一定程度上反映了X和Y相互間的關(guān)系,但它還受X與Y本身度量單位的影響。例如:Cov(kX,kY)=k2Cov(X,Y)為了克服這一缺點(diǎn),對(duì)協(xié)方差進(jìn)行標(biāo)準(zhǔn)化,這就引入了相關(guān)系數(shù)

。二、相關(guān)系數(shù)為隨機(jī)變量X和Y的相關(guān)系數(shù)。定義4.7

設(shè)D(X)>0,D(Y)>0,稱在不致引起混淆時(shí),記

為。1)2)的充要條件是X與Y以概率1呈線性關(guān)系。即其中a,b(a≠0)為常數(shù)定理4.8

設(shè)隨機(jī)變量X和Y的相關(guān)系數(shù)存在,則證⑴則Cauchy-Schwarz不等式所以證⑵僅有一個(gè)重根t0說明相關(guān)系數(shù)只是X與Y之間線性關(guān)系的一種度量。,X與Y的線性關(guān)系越顯著;,X與Y的線性關(guān)系越不顯著;四個(gè)等價(jià)命題2)3)4)1)相關(guān)系數(shù)則稱X與Y不相關(guān);

設(shè)隨機(jī)變量Y是X的線性函數(shù)Y=aX+b,則求X和

Y的相關(guān)系數(shù)。解法一

由已知可得所以解法二

由已知可得所以例4.24不相關(guān):

X與Y之間沒有線性關(guān)系,并不表示它們之間沒有任何關(guān)系。所以,當(dāng)X和Y獨(dú)立時(shí),Cov(X,Y)=0。故但由并不一定能推出X和Y獨(dú)立。請(qǐng)看下例獨(dú)立:

X與Y之間沒有任何函數(shù)關(guān)系。設(shè)隨機(jī)變量(X,Y)的概率密度為問X和

Y是否相互獨(dú)立,是否不相關(guān)?解

先求關(guān)于X和Y的邊緣概率密度

例4.25因?yàn)樗訶和

Y不相互獨(dú)立。⑵

求X和Y的相關(guān)系數(shù)

所以故X和

Y不相關(guān)。獨(dú)立不相關(guān)若(X,Y)服從二維正態(tài)分布,則X與Y獨(dú)立X與Y不相關(guān)特例若(X,Y)服從二維正態(tài)分布。是Y與X的相關(guān)系數(shù)。以下畫出取幾個(gè)不同值時(shí)(X,Y)的密度函數(shù)圖。132頁例292頁推廣(n維正態(tài)分布的幾條重要性質(zhì))136頁1.

X=(X1,X2,…,Xn)服從n元正態(tài)分布,對(duì)一切不全為0的實(shí)數(shù)a1,a2,…,an,a1X1+a2

X2+…+anXn均服從正態(tài)分布。2.

X=(X1,X2,…,Xn)服從n元正態(tài)分布,Y1,Y2,…,Yk是Xj(j=1,2,…,n)的線性函數(shù),則(Y1,Y2,…,Yk

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論