數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第1頁(yè)
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第2頁(yè)
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第3頁(yè)
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第4頁(yè)
數(shù)理統(tǒng)計(jì)學(xué)的基本概念_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章數(shù)理統(tǒng)計(jì)的基本概念一、教學(xué)要求1 .理解總體、個(gè)體、簡(jiǎn)單隨機(jī)樣本和統(tǒng)計(jì)量的概念,掌握樣本均值、樣本方差及樣本矩的計(jì)算。2 ,了解必分布、t分布和F分布的定義和性質(zhì),了解分位數(shù)的概念并會(huì)查表計(jì)算。3 .掌握正態(tài)總體的某些常用統(tǒng)計(jì)量的分布。4 ,了解最大次序統(tǒng)計(jì)量和最小次序統(tǒng)計(jì)量的分布。本章重點(diǎn):統(tǒng)計(jì)量的概念及其分布。二、主要內(nèi)容1 .總體與個(gè)體我們把研究對(duì)象的全體稱為總體(或母體),把組成總體的每個(gè)成員稱為個(gè)體。在實(shí)際問(wèn)題中,通常研究對(duì)象的某個(gè)或某幾個(gè)數(shù)值指標(biāo),因而常把總體的數(shù)值指標(biāo)稱為總體。設(shè)x為總體的某個(gè)數(shù)值指標(biāo),常稱這個(gè)總體為總體X。X的分布函數(shù)稱為總體分布函數(shù)。當(dāng)X為離散型隨機(jī)變量

2、時(shí),稱X的概率函數(shù)為總體概率函數(shù)。當(dāng)X為連續(xù)型隨機(jī)變量時(shí),稱X的密度函數(shù)為總體密度函數(shù)。當(dāng)X服從正態(tài)分布叫冉“,時(shí),稱總體X為正態(tài)總體。正態(tài)總體有以下三種類型:(1)"未知,但已知;/未知,但其已知;(3)出和丁均未知。2 .簡(jiǎn)單隨機(jī)樣本數(shù)理統(tǒng)計(jì)方法實(shí)質(zhì)上是由局部來(lái)推斷整體的方法,即通過(guò)一些個(gè)體的特征來(lái)推斷總體的特征。要作統(tǒng)計(jì)推斷,首先要依照一定的規(guī)則抽取n個(gè)個(gè)體,然后對(duì)這些個(gè)體進(jìn)行測(cè)試或觀察得到一組數(shù)據(jù)工,這一過(guò)程稱為抽樣。由于抽樣前無(wú)法知道得到的數(shù)據(jù)值,因而站在抽樣前的立場(chǎng)上,設(shè)有可能得到的值為用名Xn維隨機(jī)向量(茍,£,')稱為樣本。n稱為樣本容量。(&quo

3、t;、/)稱為樣本觀測(cè)值。如果樣本(,一'-')滿足3 1)'工相互獨(dú)立;(2)Ll,。服從相同的分布,即總體分布;則稱(為,無(wú)產(chǎn)區(qū))為簡(jiǎn)單隨機(jī)樣本。簡(jiǎn)稱樣本。設(shè)總體X的概率函數(shù)(密度函數(shù))為,,則樣本(為冗)的聯(lián)合概率函數(shù)(聯(lián)合密度函數(shù)為)3 .統(tǒng)計(jì)量完全由樣本確定的量,是樣本的函數(shù)。即:設(shè)“,不是來(lái)自總體X的一個(gè)樣本,是一個(gè)n元函數(shù),如果目中不含任何總體的未知參數(shù),則稱/乙,乙,,/)為一個(gè)統(tǒng)計(jì)量,經(jīng)過(guò)抽樣后得到一組樣本觀測(cè)值勺,叼,一,七,則稱g卜,右,一,4)為統(tǒng)計(jì)量觀測(cè)值或統(tǒng)計(jì)量值04 .常用統(tǒng)計(jì)量一I*,=£苞(1)樣本均值:-鏟=-尹=-第(2)

4、樣本方差:.一,,二s=哥二尺空(3)樣本標(biāo)準(zhǔn)差:'7-12它們的觀察值分別為:=,弓"一對(duì)=,±工;一這些觀察值仍分別稱為樣本均值、樣本方差和樣本標(biāo)準(zhǔn)差。(4)樣本(k階)原點(diǎn)矩1 .nkAkXi,k=1,2,nii(5)樣本(k階)中心矩2 nBk(XiX)k,k=2,3,ni11n其中樣本二階中心矩Bk=1Z(Xi-X)2,又稱為未修正樣本萬(wàn)差ni1(6)順序統(tǒng)計(jì)量將樣本中的各個(gè)分量由小到大的重排成XMX-X(n)則稱X(1),X,X(n)為樣本順序統(tǒng)計(jì)量,X(n)X為樣本的極差。rxy(7)樣本相關(guān)系數(shù):n_%(xi-x)(yi-y)i1n_、(Xi-x)(

5、Yi-y)i=1SxSy1X(xx)2*£(yi;)2其中:X,亍分別為數(shù)據(jù)。,yj的樣本均值,Sx,Sy分別為樣本a標(biāo)準(zhǔn)差。5、直方圖與箱線圖(1)直方圖先將所有采集的數(shù)據(jù)進(jìn)行整理,得到順序統(tǒng)計(jì)量,找出其中的最小值x(1),最大值x(n),即所有的數(shù)據(jù)都落在區(qū)間(1),x(n/上,現(xiàn)取區(qū)間X)-k,x(n)+kj(其中k可取0.5,1.5等),該區(qū)間能覆蓋區(qū)間7,x(n)|,將區(qū)間入k,x(n)+k等分為m個(gè)小區(qū)間(先取一個(gè)區(qū)間,其下限比最小的數(shù)據(jù)稍小,其上限比最大的數(shù)據(jù)稍大,然后將這一區(qū)間等分為m個(gè)小區(qū)間,通常n較大時(shí)m取10:20,當(dāng)n<50時(shí)則m取5:6。若m取得過(guò)大,

6、則會(huì)出現(xiàn)某些區(qū)間內(nèi)頻數(shù)為零,分點(diǎn)通常取比數(shù)據(jù)精度高一位,以避免數(shù)據(jù)落在分點(diǎn)上),小區(qū)間的長(zhǎng)度記為,=(X(1)+k)一(X(n)一k)=l,稱為組距,小區(qū)間的端點(diǎn)稱為組限,數(shù)出數(shù)據(jù)落mf在每個(gè)小區(qū)間內(nèi)的數(shù)據(jù)的頻數(shù)先,算出頻率一(i=1,2,I),然后自左至右依次n在各個(gè)小區(qū)間上做以"n/(i=1,2,I)為高的小矩形,這樣的圖形就稱其為頻率f:直方圖。顯然這種小矩形的面積就等于數(shù)據(jù)落在該小區(qū)間的頻率上(i=12I),n直方圖的外廓曲線接近于總體X的概率密度曲線。(2)p分位數(shù)定義設(shè)有容量為n的樣本觀察值X),x2,xn,樣本p(0<p<1)分為數(shù)記為xp,它具有以下性質(zhì):

7、(1)至少有nP個(gè)觀察值小于或等于xp;(2)至少有n(1-p)個(gè)觀察值大于或等于xpp樣本p分位數(shù)可按以下法則求得:將x1,x2,,xn按從小到大的順序排成x(1)<x(2)W<x(n)1°,若np不是整數(shù),則只有一個(gè)數(shù)據(jù)滿足定義中的兩點(diǎn)要求,這一數(shù)據(jù)位于大于np的最小整數(shù)處,即為位于Inp+1處的數(shù)。20,若np是整數(shù),則xnp,xnp中都符合性質(zhì)要求,故xp取xnp,*np書的平均值。x(hp)n/是整綜上可得:xp=12|l_x(np)-x(np1)np是整1xn1(2)nw特別的:x0,5=med=11-2代廣,(丸n偶0.25分位數(shù)又稱為第一四分位數(shù),又記為Q

8、"0.75分位數(shù)又稱為第三四分位數(shù),又記為Q3(3)箱線圖:數(shù)據(jù)集的箱線圖是由箱子和直線組成的圖形,它是在基于以下5個(gè)數(shù)據(jù)的圖形概括:最小值Min,Q1,M,Q3,最大值Max,做法如下:(1)畫一水平數(shù)軸,在軸上標(biāo)記最小值Min,Q1,M,Q3,最大值Max,在數(shù)軸上方畫一個(gè)上下側(cè)平行于數(shù)軸的矩形箱子,箱子的左右兩側(cè)分別位于Q,Q的上方,在M點(diǎn)的上方畫一條垂直線段,線段位于箱子的內(nèi)部;(2)自箱子的左側(cè)中點(diǎn)引一條水平線直至最小值上方;在同一水平高度自箱子右側(cè)引一條水平線直至最大值上方。箱線圖完成。在數(shù)據(jù)集中某一個(gè)觀察值不尋常的大于或小于該數(shù)集中的其他數(shù)據(jù),稱為疑似異常值。第一四分位

9、數(shù)Q與第三四分位數(shù)Q3之間的距離:IQR=Q3-Qi稱為四分位數(shù)間距,若數(shù)據(jù)小于Q-1.5IQR或大于Q3+1.5IQR,就認(rèn)為他是疑似異常值。將上述箱線圖的做法修改如下:(1)同(1(2)計(jì)算IQR=Q3Q1,若一個(gè)數(shù)據(jù)小于Q11.5IQR或大于Q3+1.5IQR,則認(rèn)為它是一個(gè)異常值,并以“表示;(3')自箱子的左側(cè)中點(diǎn)引一條水平線直至數(shù)據(jù)中除去疑似異常值之后的最小值上方,再自箱子的右側(cè)中點(diǎn)引一條水平線直至數(shù)據(jù)中除去疑似異常值之后的最大值上方;這樣做出的箱線圖稱為修正箱線圖。6關(guān)于分布(1) r(Gamnrja函數(shù)-(-0=0x二"e,dx,(s0)它具有以下運(yùn)算性質(zhì):.

10、(.二+1)=二:(:);'(n)=(n-1)!,nN;特別地:(1)=1(2)二一1二二(金)=0xedxrdr二I令、x=t=x=t2,dx=2tdto所以'百”(2)設(shè)隨機(jī)變量x服從r分布,即:x:r(a,e),其密度函數(shù)為:f(x)-1一(-:)0xx,e71x00,i0qitafx(x)-十(二)0定理:設(shè)隨機(jī)變量x,y都服從r分布且相互獨(dú)立,即:x:r(a,6),X:)其密度函數(shù)分別為:x:-4xex0.0,10qitay二,e-y0.:0,u0qitayfY(y)-丁(二)0則2=x+丫服從參數(shù)為a+P用的r分布,即:x+y:r(豆+P,e)7、經(jīng)驗(yàn)分布函數(shù)設(shè)X1

11、,X2,Xn是總體F的一個(gè)樣本,用S(x),(q<x<收)表示X1,X2:Xn中不大于x的隨機(jī)變量的個(gè)數(shù),定義經(jīng)驗(yàn)分布函數(shù)為:一,、1一-Fn(x)=-S(x),(T>-'x>二)n例題1:設(shè)總體F有一個(gè)樣本值1,2,3,則經(jīng)驗(yàn)分布函數(shù)為:%F3(x)=«,%,1<x:二2,2<x二3x<11,x>3例題2:設(shè)總體F有一個(gè)樣本值1,1,2,則經(jīng)驗(yàn)分布函數(shù)為:0,x:1F3(x)=23,1<x二21,x_2格里汶科定理:(1933年)對(duì)于任意一實(shí)數(shù)x,當(dāng)nT8時(shí),F(xiàn)n(x)以概率1收斂于分布函數(shù)F(x)PlimsupFn(x

12、)-F(x)=01=1n-二-;x一二二8.三個(gè)重要分布(D設(shè)為,為為獨(dú)立標(biāo)準(zhǔn)正態(tài)變量,稱隨機(jī)變量"=瑞的分布為自由度為n的爐分布,記為U"。其密度函數(shù)為:1 1n二一1xf(x)=2n2-(n)20X工01x2e2x0性質(zhì):(1)若72:72(n),則E(玲=n,D«2)=2n因?yàn)閄iN(0,1)所以:E(XJ=0,D(Xi)=12E(X:)=D(Xi)=1nE(2)=EX;)二ni1又D(X:)=E(X4)-(E(X:)2=E(X4)-1=3-1=2,(i=1,2,n)其中:t4joO2211te2dtt3e2d(2二-二-(tde2)2_3tde2二jod*

13、-oO二3-;tde-oQ-bee_OQf)_2t2方32dt.F3t3de2二-二t2一2'2tedt2二-二t2-2L(te2)而L-bn-be.:et24dt=-2dt=3.2二-二(2)爐分布的可加性并且相互獨(dú)立,則有:設(shè)":72(門)芯:*(叫),:2:2(ni(3)始分布的分位點(diǎn)對(duì)于給定的正數(shù)£(0<a.<1),稱滿足條件P(22(n)=2(n)f(x)dx=:的點(diǎn)匕(n)為?2(n)分布的上口分位點(diǎn)。(2) t分布設(shè)隨機(jī)變量X與Y獨(dú)立,X八血1)¥一0,則稱的分布為自由度n的t分布,記為丁一小)。t分布又稱為學(xué)生氏分布,其密度函數(shù)

14、為:-l(n1)21t2-21h(t)(1一)2,-二;t:二二n二(n2)nt分布的分位點(diǎn):對(duì)于給定的正數(shù)«(0<«<1),稱滿足條件P(tt.(n)=t(n)h(t)dt=:的點(diǎn)10f(n)為t(n)分布的上a分位點(diǎn)。其中:3)=-ta(n)(3) F分布設(shè)隨機(jī)變量U與V相互獨(dú)立,*(就),則稱的分布為自由度(明明勺F分布,記為八網(wǎng)凡m)。nmn22,()2y2一2m密度函數(shù)為:n加y>0(n)(mM1r22-m-y<00由定義知:若1_則尸:F(m,n)F分布的分位點(diǎn)對(duì)于給定的正數(shù)a(0<a<1),稱稱滿足:P(FF(n,m)=F:

15、mJ(y)dy=:(n,m)的點(diǎn)己%網(wǎng))為F分布的口上分位點(diǎn),且有y2.9.抽樣分布(1)有限總體的抽樣分布定理1、設(shè)總體中個(gè)體總數(shù)(也稱總體大小)為N,樣本容量為n(n<N)且總體有有限均值方差。2,則(i)E(X)=(ii)當(dāng)抽樣是有放回時(shí)。(X)=;=.n當(dāng)抽樣是無(wú)放回時(shí)c-(X)=N-n-N-1n其中。(X)即為X的標(biāo)準(zhǔn)差。(2)單正態(tài)總體的抽樣分布設(shè)總體X(不管服從什么分布,只要均值和方差存在)的均值為N,方差為仃2X1,X2,Xn是來(lái)自X的一個(gè)樣本,X,S2分別是樣本均值和樣本方差,則有:_2E(X)=,D(X)n21J-212-2E(S)=E=(XiX)=E”XinX)n-

16、1im_n-1i11n21n22二-222而=-|ZE(X:)-nE(X)卜一-|Z(d+N2)-n(+N2)l=。2n1/3-n-1|_i凸n_E(S2)=;2定理2、設(shè)X1,X2,Xn是來(lái)自正態(tài)總體X:N(巴。2)的一個(gè)樣本,X是樣本均值,則有:2x(i)X:N(,一);(ii)X:N(0,1)nn定理3、設(shè)X1,X2,Xn是來(lái)自正態(tài)總體X:N(N,。2)的一個(gè)樣本,X,S2分別是樣本均值和樣本方差,則有:憶12S2二工(Xi-X)2:72(n-1)'i1(ii)X與S2相互獨(dú)立。定理4、設(shè)X1,X2,Xn是來(lái)自正態(tài)總體X:N(d。2)的一個(gè)樣本,X,S2分別是樣本均值和樣本方差,

17、則有:(n2s2=2n(XiN)2:?2(n)、-i-i4X-1(ii)T-t(n-1)sn注:XN(0,1),VS2:2(n-1)、nT=X-CT.n(3)雙正態(tài)總體的抽樣分布定理5、設(shè)X1,X2,X與MM,丫”分別是來(lái)自正態(tài)總體N(%2)和N(與,式)的樣本,且這兩個(gè)樣本相互獨(dú)立,設(shè)-1叫-1%X=1zXi,Y=1zYi分別是這兩個(gè)樣本的樣本均值;nyn2im1n1一12_S2=,£(XiX)2,s2(Yi-Y)2分別是這兩個(gè)樣本的樣本方差。則n1-1i15-1i1有:S2s2(1)2:F-1,“-1);二2(2)當(dāng)crj=o;=1時(shí)(XY)-(-2)t(n1n2-2)苴中.S2=(n17)§2gfS;S=£w,w,Dwn1n2-2證明:(1)(n,-1)Si22(ni-1),(n-1)S22(n2-1)因?yàn)镾12,S;相互

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論