統(tǒng)計教材課件_第1頁
統(tǒng)計教材課件_第2頁
統(tǒng)計教材課件_第3頁
統(tǒng)計教材課件_第4頁
統(tǒng)計教材課件_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

在概率的研究中為什么需要引入隨機(jī)變量?

引入隨機(jī)變量是研究隨機(jī)現(xiàn)象統(tǒng)計規(guī)律性的需要。為了便于數(shù)學(xué)推理和計算,有必要將隨機(jī)試驗的結(jié)果數(shù)量化,使得可以用高等數(shù)學(xué)課程中的理論與方法來研究隨機(jī)試驗,研究和分析其結(jié)果的規(guī)律性,因此,隨機(jī)變量是研究隨機(jī)試驗的重要而有效的工具。隨機(jī)變量及其分布隨機(jī)變量、概率分布、分布函數(shù)離散型隨機(jī)變量及其分布律連續(xù)型隨機(jī)變量及其概率密度返回退出如何引入隨機(jī)變量的概念?為了全面地研究隨機(jī)試驗的結(jié)果,揭示隨機(jī)現(xiàn)象的統(tǒng)計規(guī)律性,我們將隨機(jī)試驗的結(jié)果與實數(shù)對應(yīng)起來,將隨機(jī)試驗的結(jié)果數(shù)量化,引入隨機(jī)變量的概念。在隨機(jī)現(xiàn)象中,有很大一部分問題與數(shù)值發(fā)生關(guān)系,例如在產(chǎn)品檢驗問題中,我們關(guān)心的是抽樣中出現(xiàn)的廢品數(shù);在車間供電問題中,我們關(guān)心的是某時刻正在工作的車床數(shù);在電話問題中關(guān)心的是某段時間中的話務(wù)量,它與呼叫的次數(shù)及各次呼叫占用交換設(shè)備的時間長短有關(guān)。此外如測量時的誤差,氣體分子運(yùn)動的速度,信號接收機(jī)所收到的信號(用電壓表示或數(shù)字表示)的大小,也都與數(shù)值有關(guān)。有些初看起來與數(shù)值無關(guān)的隨機(jī)現(xiàn)象,也常常能聯(lián)系數(shù)值來描述,例如在擲硬幣問題中,每次出現(xiàn)的結(jié)果為正面或反面,與數(shù)值沒有關(guān)系,但是我們能用下面方法使它與數(shù)值聯(lián)系起來,當(dāng)出現(xiàn)正面時對應(yīng)數(shù)“1”,而出現(xiàn)反面時對應(yīng)數(shù)“0”,為了計算n次投擲中出現(xiàn)的正面數(shù)就只須計算其中“1”出現(xiàn)的次數(shù)了。如何引入隨機(jī)變量的概念?一般地,如果A為某個隨機(jī)事件,則一定可以通過如下示性函數(shù)使它與數(shù)值發(fā)生聯(lián)系:如果A發(fā)生如果A不發(fā)生這些例子中,試驗的結(jié)果能用一個數(shù)x來表示,這個數(shù)x是隨著試驗的結(jié)果的不同而變化的,也即它是樣本點的一個函數(shù),這種量以后稱為隨機(jī)變量。下面我們就來考慮應(yīng)當(dāng)如何給這種量以嚴(yán)格的數(shù)學(xué)定義。正如對隨機(jī)事件一樣,我們所關(guān)心的不僅是試驗會出現(xiàn)的結(jié)果,更重要的是要知道這些結(jié)果將以怎樣的概率出現(xiàn),也即對隨機(jī)變量我們不但要知道它取什么數(shù)值,而且要知道它取這些數(shù)值的概率。例1:將一枚硬幣拋擲3次,我們感興趣的是三次投擲中,出現(xiàn)H的總次數(shù),而對H,T出現(xiàn)的次序不關(guān)心。以X記三次投擲中出現(xiàn)H的總次數(shù),那么對于樣本空間S={e}中的每一個樣本點e,X都有一個值與之對應(yīng),即有樣本點HHHHHTHTHTHHHTTTHTTTHTTTX的值32221110我們注意到,隨機(jī)變量的取值隨試驗的結(jié)果而定,而試驗的各個結(jié)果出現(xiàn)有一定的概率,因而隨機(jī)變量的取值有一定的概率。如,當(dāng)且僅當(dāng)事件A={HHT,HTH,THH}發(fā)生時有{x=2},而且P(A)=3/8,則P{x=2}=3/8。設(shè)隨機(jī)試驗的樣本空間為S={e},X=X(e)是定義在樣本空間S上的單值實函數(shù),稱X=X(e)為隨機(jī)變量。概率分布

一般,若L是一個實數(shù)集合,將X在L上取值寫成{X∈L},它表示事件B={e∣X(e)∈L},即B是由S中使得X(e)∈L的所有樣本點e所組成的事件,此時有P{X∈L}=P(B)=P{e∣X(e)∈L}。P{X∈L}稱為隨機(jī)變量X的概率分布。隨機(jī)變量設(shè)X是一個隨機(jī)變量,x是任意實數(shù),函數(shù)F(x)=P{X≤x}=P{e∣X(e)∈(-∞,x]}稱為X的分布函數(shù)。分布函數(shù)設(shè)X(e)是定義于概率空間(S,F,P)上的單值實函數(shù),如果對于直線上任意波雷爾點集B,有

{e∣X(e)∈B}則稱X(e)為隨機(jī)變量。概率分布而P{X(e)∈B}稱為隨機(jī)變量X(e)的概率分布。隨機(jī)變量特別地,取B=(-∞,x),稱F(x)=P{X(e)<x},-∞<x<∞為隨機(jī)變量X(e)的分布函數(shù)。分布函數(shù)[思考]對于有限樣本空間,或者由可列個點構(gòu)成的樣本空間,我們只要知道每一個樣本點所構(gòu)成的基本事件的概率,便可了解整個樣本空間的統(tǒng)計規(guī)律性。但是對于由不可列個點構(gòu)成的樣本空間,我們不可能逐點去認(rèn)識它的統(tǒng)計規(guī)律性,即不可能把隨機(jī)變量X取每個實數(shù)的概率一一列舉,更何況對于連續(xù)性隨機(jī)變量取任意指定的實數(shù)值的概率都等于0。在實際中,我們感興趣的往往是隨機(jī)變量X取值于某個區(qū)間(a,b)的概率,或取值于若干個這種區(qū)間的概率,如測量誤差小于某個數(shù)的概率,壽命大于某個數(shù)的概率,雨量介于100毫米到120毫米之間的概率,等等。前面我們給出了分布函數(shù)的定義,而分布函數(shù)F(x)在x處的函數(shù)值就表示隨機(jī)變量X取值于區(qū)間(-∞,x]上的概率,如果我們已知隨機(jī)變量X的分布函數(shù)F(x),那么隨機(jī)變量X取其它值的概率便可由此計算,如對于任意實數(shù)x1,x2(x1<x2),有P{x1<X≤x2}=P{X≤X2}-P{X≤X1}=F(x2)-F(x1)分布函數(shù)的基本性質(zhì)分布函數(shù)F(x)具有下列性質(zhì):⑴F(x)是一個不減函數(shù)。即對于任意實數(shù)x1,x2(x1<x2),有F(x1)≤F(x2);⑵⑶F(x)是右連續(xù)的。即F(x+0)=F(x)為什么分布函數(shù)定義為右連續(xù)?定義左連續(xù)或者右連續(xù)只是一種習(xí)慣。目前,俄羅斯和東歐國家一般定義左連續(xù);西歐和美國一般定義右連續(xù);我國的大多數(shù)書籍也采用右連續(xù)。左連續(xù)和右連續(xù)的區(qū)別在于計算F(x)時,X=x點的概率是否計算在內(nèi)。對于連續(xù)型隨機(jī)變量而言,因為一點上的概率等于零,定義左連續(xù)和右連續(xù)沒有什么區(qū)別;對于離散型隨機(jī)變量,如果P{X=x}≠0,則左連續(xù)和右連續(xù)時的F(x)值就不相同了。因此,在閱讀關(guān)于概率論的參考書時,要注意作者是定義左連續(xù)還是右連續(xù)的,以免出錯。返回X取其各個可能值xk(k=1,2,…)的概率P{X=xk}=pk,稱為離散型隨機(jī)變量X的概率函數(shù)(概率分布或分布律)。分布率也可以用表格的形式來表示:稱為隨機(jī)變量X的分布列。如果隨機(jī)變量X的取值是有限個或可列無限多個,則稱X為離散型隨機(jī)變量。離散型隨機(jī)變量的概念Xx1x2…xn…pkp1p2…pn…離散型隨機(jī)變量的概率分布離散型隨機(jī)變量分布函數(shù)的計算有了分布列,可以通過下式求得分布函數(shù)顯然這時F(x)是一個跳躍函數(shù),我們可以用分布列或分布函數(shù)來描述離散型隨機(jī)變量。例2:設(shè)一汽車在開往目的地的道路上需經(jīng)過四組信號燈,每組信號燈以1/2的概率允許或禁止汽車通過。以X表示汽車首次停下時,它已通過的信號燈的組數(shù)(設(shè)各組信號燈的工作是相互獨立的),求X的分布律。解以p表示每組信號燈禁止汽車通過的概率,易知X的分布律為或?qū)懗蒔{X=k}=(1-p)kp,k=0,1,2,3,P{X=4}=(1-p)4以p=1/2代入得X01234pkp(1-p)p(1-p)2p(1-p)3p(1-p)4X01234pk0.50.250.1250.06250.0625例3設(shè)隨機(jī)變量X的分布律為求X的分布函數(shù),并求P{X≤1/2},P{3/2<X≤5/2},P{2≤X≤3}.解X-123pk1/41/21/4F(X)的圖形如下F(x)O1-1321X例4:一個靶子是半徑為2米的圓盤,設(shè)擊中靶上任意同心圓盤上的點的概率與該圓盤的面積成正比,并設(shè)射擊都能擊中靶,以X表示彈著點于圓心的距離。試求隨機(jī)變量X的分布函數(shù)。解若X<0,則{X≤x}是不可能事件,于是F(x)=P{X≤x}=0若0≤x≤2,由題意,P{0≤X≤x}=kx2,k是某一常數(shù),為確定k的值,取x=2,有P{0≤X≤2}=22k,但已知P{0≤X≤2}=1,故得k=1/4,即P{0≤X≤x}=x2/4.于是F(x)=P{X≤x}=P{X<0}+P{0≤X≤x}=x2/4.若X>2,由題意,有F(x)=P{X≤x}=1.綜合上述,即得X的分布函數(shù)為O1321X1/2F(x)退化分布若隨機(jī)變量a只取常數(shù)值c,即P{x=c}=1這時分布函數(shù)為(0—1)分布的分布律也可寫成(0—1)分布設(shè)隨機(jī)變量X只可能取0與1兩個值,它的分布律是P{X=k}=pk(1一p)1-k,k=0,1(0<p<1),則稱X服從(0—1)分布或兩點分布。X01pk1-pp關(guān)于(0—1)分布對于一個隨機(jī)試驗,如果它的樣本空間只包含兩個元素,即S={e1,e2},我們總能在S上定義一個服從(0一1)分布的隨機(jī)變量來描述這個隨機(jī)試驗的結(jié)果。例如,對新生嬰兒的性別進(jìn)行登記,檢查產(chǎn)品的質(zhì)量是否合格,某車間的電力消耗是否超過負(fù)荷以及前面多次討論過的“拋硬幣”試驗等都可以用(0—1)分布的隨機(jī)變量來描述。(0一1)分布是經(jīng)常遇到的一種分布。伯努利試驗設(shè)試驗E只有兩個可能結(jié)果:A及,則稱E為伯努利(Bernoulli)試驗。設(shè)P(A)=p(0<p<1),此時P()=1-p。將E獨立地重復(fù)地進(jìn)行n次,則稱這一串重復(fù)的獨立試驗為n重伯努利試驗。這里“重復(fù)”是指在每次試驗中P(A)=p保持不變;“獨立是指各次試驗的結(jié)果互不影響,即若以Ci記第i次試驗的結(jié)果,Ci為A或,i=1,2,…,n.“獨立”是指P{C1C2…Cn}=P(C1)P(C2)…P(Cn).n重伯努利試驗是一種很重要的數(shù)學(xué)模型.它有廣泛的應(yīng)用,是研究最多的模型之一。n重伯努利試驗例如,E是拋一枚硬幣觀察得到正面或反面。A表示得正面,這是一個伯努利試驗.如將硬幣拋n次,就是n重伯努利試驗。又如拋一顆骰子,若A表示得到“1點”,表示得到“非l點”。將骰子拋n次,就是n重伯努利試驗。再如在袋中裝有a只白球,b只黑球。試驗E是在袋中任取一只球,觀察其顏色。以A表示“取到白球”,P(A)=a/(a+b)。若連續(xù)取球n次作放回抽樣,這就是n重伯努利試驗。然而,若作不放回抽樣,則每次試驗都有P(A)=a/(a+b),但各次試驗不再相互獨立,因而不再是n重伯努利試驗了。伯努利試驗設(shè)試驗E只有兩個可能結(jié)果:A及,則稱E為伯努利(Bernoulli)試驗。n重伯努利試驗考慮n重伯努里試驗中,事件A恰出現(xiàn)k次的概率。以X表示n重伯努利試驗中事件A發(fā)生的次數(shù),X是一個隨機(jī)變量,我們來求它的分布律。X所有可能取的值為o,1,2,…,n.由于各次試驗是相互獨立的,故在n次試驗中,事件A發(fā)生k次的概率為伯努利試驗與二項分布伯努利試驗與二項分布從圖中可以看出,對于固定的n及p,當(dāng)k增加時,b(k;n,p)險隨之增加并達(dá)到某極大值,以后又下降。此外,當(dāng)概率p越與1/2接近時,分布越接近對稱。固定n和p,當(dāng)k取何值時,b(k;n,p)取最大值?由于對0<p<1,因此當(dāng)k<(n+1)p時,b(k;n,p)>b(k-1;n,p)當(dāng)k=(n+1)p時,b(k;n,p)=b(k-1;n,p)當(dāng)k>(n+1)p時,b(k;n,p)<b(k-1;n,p)因為(n+1)p不一定是正整數(shù),所以存在正整數(shù)m,使得(n+1)p-1<m≤(n+1)P,當(dāng)k=m時達(dá)到極大值。例5:按規(guī)定,某種型號電子元件的使用壽命超過1500小時的為一級品。已知某一大批產(chǎn)品的一級品率為0.2,現(xiàn)在從中隨機(jī)地抽查20只。問20只元件中恰有k只(k=0,,…,20)為一級品的概率是多少?解這是不放回抽樣。但由于這批元件的總數(shù)很大,且抽查的元件的數(shù)量相對于元件的總數(shù)來說又很小,因而可以當(dāng)作放回抽樣來處理,這樣做會有一些誤差,但誤差不大。我們將檢查一只元件看它是否為一級品看成是一次試驗,檢查20只元件相當(dāng)于做20重伯努利試驗。以X記20只元件中一級品的只數(shù),那么,X是一個隨機(jī)變量,且有X~b(20,0.2)。即得所求概率為例6:某人進(jìn)行射擊,設(shè)每次射擊的命中率為0.02,獨立射擊400次,試求至少擊中兩次的概率。解:將一次射擊看成是一次試驗.設(shè)擊中的次數(shù)為X,則X~b(400,0.02)。X的分布律為什么是小概率事件?它有什么實際意義?小概率事件是指一次試驗中發(fā)生的概率很小的事件。但從理論上講,一個事件發(fā)生的概率不論多小,只要不斷重復(fù)試驗下去,事件遲早會出現(xiàn)的,概率是1。因為,若設(shè)P(A)=>0,Ak為A在第k次試驗中出現(xiàn),則

,于是在前n次試驗中,A至少出現(xiàn)一次的概率為其實際意義是,我們可以借助它判斷事情的真實性。因為根據(jù)實際推斷原理,小概率事件在一次試驗中幾乎是不可能發(fā)生的。而某一認(rèn)為概率很小的事件,居然在一次試驗中發(fā)生了,人們就有理由懷疑其正確性。例7:設(shè)有80臺同類型設(shè)備,各臺工作是相互獨立的,發(fā)生故障的概率都是0.01,且一臺設(shè)備的故障能由一個人處理。考慮兩種配備維修工人的方法,其一是由4人維護(hù),每人負(fù)責(zé)20臺;其二是由3人共同維護(hù)80臺.試比較這兩種方法在設(shè)備發(fā)生故障時不能及時維修的概率的大小。解按第一種方法。以X記“第1人維護(hù)的20臺中同一時刻發(fā)生故障的臺數(shù)”,以Ai(i=1,2,3,4)表示事件“第i人維護(hù)的20臺中發(fā)生故障不能及時維修”,則知80臺中發(fā)生故障而不能及時維修的概率為P(A1UA2UA3UA4)≥P(A1)=P{X≥2}.而X~b(20,0.01),故有按第二種方法.以Y記80臺中同一時刻發(fā)生故障的臺數(shù)。此時,Y~b(80,0.01),故80臺中發(fā)生故障而不能及時維修的概率為我們發(fā)現(xiàn),在后一種情況盡管任務(wù)重了(每人平均維護(hù)約27臺),但工作效率不僅沒有降低,反而提高了。例8保險事業(yè)是最早使用概率論的部門之一。保險公司為了估計企業(yè)的利潤,需要計算各種各樣的概率,下面是典型問題之一。若一年中某類保險者里面每個人死亡的概率等于0.005,現(xiàn)有10000個這類人參加人壽保險,試求在來來一年中在這些保險者里面,(1)有40個人死亡的概率;(2)死亡人數(shù)不超過70個的概率。解]作為初步近似,可以利用貝努里概型,n=10000.p=0.005,設(shè)為未來一年中這些人里面死亡的人數(shù),則所求的概率分別為(1)b(40;10000,0.005)直接計算這些數(shù)值相當(dāng)困難,要有更好的計算方法。可以利用概率論中的極限定理來實現(xiàn)近似計算。關(guān)于極限定理后面將討論。對某批N件產(chǎn)品進(jìn)行不放回抽樣檢查,若這批產(chǎn)品中有M件次品,現(xiàn)從整批產(chǎn)品中隨機(jī)抽出n件產(chǎn)品,則在這n件產(chǎn)品中出現(xiàn)的次品數(shù)v是隨機(jī)變量,它取值0,1,2,…,n,其概率分布為超幾何分布。超幾何分布幾何分布在事件A發(fā)生的概率為p的貝努利試驗中,若以記A首次出現(xiàn)時的試驗次數(shù),則為隨機(jī)變量,它可能取的值為1,2,3…,其概率分布為幾何分布。g(k,p)=P{=k}=qk-1p,k=1,2,…巴斯卡分布在事件A發(fā)生的概率為p的貝努利試驗中,若以記A第r次出現(xiàn)時的試驗次數(shù),則為隨機(jī)變量,它可能取的值為r,r+1,…,其概率分布為巴斯卡分布。顯然當(dāng)r=1時,即為幾何分布。返回連續(xù)型隨機(jī)變量、概率密度函數(shù)如果對于隨機(jī)變量X的分布函數(shù)F(x),存在非負(fù)函數(shù)f(x)使對于任一實數(shù)x,有則稱X為連續(xù)型隨機(jī)變量。函數(shù)f(x)稱為X的概率密度函數(shù)。由數(shù)學(xué)分析的知識知,連續(xù)性隨機(jī)變量的分布函數(shù)一定是連續(xù)函數(shù)。概率密度函數(shù)的性質(zhì)由分布函數(shù)的性質(zhì)可知,概率密度函數(shù)具有以下性質(zhì):(1)f(x)≥0,函數(shù)曲線位于x軸上方;

反之,對于定義在(-∞,∞)上的可積函數(shù)f(x),若它滿足性質(zhì)1和性質(zhì)2,則由它定義的F(x)是一個分布函數(shù),即它滿足分布函數(shù)所必須具備的三個性質(zhì)。連續(xù)型隨機(jī)變量在任何一點的概率對于連續(xù)性隨機(jī)變量X,X取任一指定實數(shù)值a的概率均為0,即P{X=a}=0。證X的分布函數(shù)為F(x),⊿x>0,則由{X=a){a-⊿x

<X≤a)得0≤P{X=a}≤P{a-⊿x<X≤a}=F(a)一F(a-⊿x)。在上述不等式中令⊿x→0,并注意到X為連續(xù)型隨機(jī)變量,其分布函數(shù)F(x)是連續(xù)的。即得P{X=a}=0[注意}在計算連續(xù)型隨機(jī)變量落在某一區(qū)間的概率時,可以不必區(qū)分該區(qū)間是開區(qū)間或閉區(qū)間或半閉區(qū)間。例如有P{a<X≤b}=P{a≤X≤b}=P{a<X<b>。在這里,事件{X=a)并非不可能事件,但有P{X=a}=0.這就是說,若A是不可能事件,則有P(A)=0;反之,若P(A)=0,并不一定意味著A是不可能事件。以后當(dāng)我們提到一個隨機(jī)變量X的“概率分布”時,指的是它的分布函數(shù);或者,當(dāng)X是連續(xù)型時指的是它的概率密度,當(dāng)X是離散型時指的是它的分布律。連續(xù)型隨機(jī)變量的f(x)⊿x在概率中的含義由概率密度f(x)的性質(zhì)4,有

若不計高階無窮小,有P{x<X≤x+⊿x}≈f(x)⊿x這表示X落在小區(qū)間(x,x+⊿x]上的概率近似地等f(x)⊿x。例11設(shè)隨機(jī)變量X具有概率密度⑴確定常數(shù)k;⑵求X的分布函數(shù)F(x);⑶求P{1<X≤7/2}。相應(yīng)的分布函數(shù)為:均勻分布設(shè)連續(xù)型隨機(jī)變量X具有概率密度則稱X在區(qū)間(a,b)上服從均勻分布。記為X~U(a,b).分布函數(shù)均勻分布的密度函數(shù)與分布函數(shù)例12設(shè)電阻值R是一個隨機(jī)變量,均勻分布在900~1100。求R的概率密度及R落在950~1050的概

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論