概率論與數(shù)理統(tǒng)計(jì)課件(第六章)_第1頁(yè)
概率論與數(shù)理統(tǒng)計(jì)課件(第六章)_第2頁(yè)
概率論與數(shù)理統(tǒng)計(jì)課件(第六章)_第3頁(yè)
概率論與數(shù)理統(tǒng)計(jì)課件(第六章)_第4頁(yè)
概率論與數(shù)理統(tǒng)計(jì)課件(第六章)_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章 統(tǒng)計(jì)量及其抽樣分布6.1 引言引言6.2 總體和樣本總體和樣本6.3 統(tǒng)計(jì)量及其分布統(tǒng)計(jì)量及其分布6.16.1引引 言言u(píng) 在我們的現(xiàn)實(shí)生活中,許多問題的不確定現(xiàn)象都是由隨機(jī)因素的影響所造成的u 通常情況下,需要經(jīng)過對(duì)實(shí)際中大量數(shù)據(jù)的處理或理論分析,可以確定這些隨機(jī)因素所要服從的概率分布,根據(jù)其概率分布規(guī)律利用一些統(tǒng)計(jì)方法可對(duì)所研究的問題做出估計(jì)、推斷和預(yù)測(cè)u 具體地講,數(shù)理統(tǒng)計(jì)方法是研究從一定總體中隨機(jī)抽取一部分(稱為樣本)的性質(zhì),來推斷和預(yù)測(cè)總體的性質(zhì)的一類有效方法u概率論與數(shù)理統(tǒng)計(jì)之間的關(guān)系:概率論與數(shù)理統(tǒng)計(jì)之間的關(guān)系:數(shù)理統(tǒng)計(jì)學(xué)是一門數(shù)理統(tǒng)計(jì)學(xué)是一門研究怎樣去有效地收集、整理和

2、分析帶研究怎樣去有效地收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以對(duì)所考察的問題做出推測(cè)和預(yù)測(cè),直至有隨機(jī)性的數(shù)據(jù),以對(duì)所考察的問題做出推測(cè)和預(yù)測(cè),直至采取一定的決策和行動(dòng)提供依據(jù)和建議的數(shù)學(xué)分支學(xué)科。采取一定的決策和行動(dòng)提供依據(jù)和建議的數(shù)學(xué)分支學(xué)科。統(tǒng)計(jì)方法的數(shù)學(xué)理論要用到很多近代數(shù)學(xué)知識(shí),如函數(shù)論、統(tǒng)計(jì)方法的數(shù)學(xué)理論要用到很多近代數(shù)學(xué)知識(shí),如函數(shù)論、拓?fù)鋵W(xué)、矩陣代數(shù)、組合數(shù)學(xué)等等,拓?fù)鋵W(xué)、矩陣代數(shù)、組合數(shù)學(xué)等等,但關(guān)系最密切的是概率論,故可以這這樣說:但關(guān)系最密切的是概率論,故可以這這樣說:概率論是數(shù)概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),數(shù)理統(tǒng)計(jì)學(xué)是概率論的一種應(yīng)用理統(tǒng)計(jì)的基礎(chǔ),數(shù)理統(tǒng)計(jì)學(xué)是概率論的一種應(yīng)用.

3、但是它們但是它們是兩個(gè)并列的數(shù)學(xué)分支學(xué)科,并無從屬關(guān)系是兩個(gè)并列的數(shù)學(xué)分支學(xué)科,并無從屬關(guān)系前面講的知識(shí)都屬于概率論的范疇,在那里,隨機(jī)變量及其概率分布全面描述了隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。在概率論的許多問題中,概率分布通常被假定為已知的,而一切的計(jì)算推理均基于這個(gè)已知的分布進(jìn)行。例如,已知隨機(jī)變量 求其數(shù)學(xué)期望和方差(3)XE這里的參數(shù)我們是假定已知的,在實(shí)際問題中事先 并不知道,需要我們自己去加以判定。再來看一個(gè)例子:再來看一個(gè)例子: 某公司要采購(gòu)一批產(chǎn)品,每件產(chǎn)品要么是正品,要么是次品。若設(shè)這批產(chǎn)品的次品率為p(一般是未知的),則從該批產(chǎn)品中隨機(jī)抽取一件,用X表示抽到的次品數(shù),不難看出X服從0

4、-1分布。當(dāng)分布中的參數(shù)p是不知道的。而p的大小決定了該批產(chǎn)品的質(zhì)量,它直接影響采購(gòu)行為的經(jīng)濟(jì)效益,因此人們對(duì)p提出一些問題,例如,“p的大小是多少?”,“p大概落在什么范圍內(nèi)” 從這個(gè)例子中我們可以看出,在概率論中研究的隨機(jī)變量,它們的分布往往假定為已知的。但在實(shí)際問題中,我們所考察的隨機(jī)現(xiàn)象雖然可以用某個(gè)隨機(jī)變量X去描述它們,但隨機(jī)變量X的概率分布往往是未知的,這就需要我們用數(shù)理統(tǒng)計(jì)的方法來解決此類實(shí)際問題。一、總體與個(gè)體一、總體與個(gè)體總體總體:研究對(duì)象的全體。如一批燈泡。個(gè)體:個(gè)體:組成總體的每個(gè)元素。如某個(gè)燈泡。注:對(duì)多數(shù)實(shí)際問題,總體中的個(gè)體是一些實(shí)在的人或物。比如,我們要研究某大學(xué)

5、的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問題的總體,而每個(gè)學(xué)生即是一個(gè)個(gè)體。 事實(shí)上,每個(gè)學(xué)生都有許多特征:性別、年齡、身高、體重等等,而在該問題中,我們關(guān)心的只是該校學(xué)生的身高如何,對(duì)其他的特征不予考慮。這樣,每個(gè)學(xué)生(個(gè)體)所具有的數(shù)量指標(biāo)值身高就是個(gè)體,而將所有的身高全體看成總體。 6.2 總體和樣本總體和樣本 這樣一來,若拋開實(shí)際背景,總體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)機(jī)會(huì)多,有的出現(xiàn)機(jī)會(huì)少,因此用一個(gè)概率分布去描述和歸納是恰當(dāng)?shù)?從這個(gè)意義上看,總體就是一個(gè)分布總體就是一個(gè)分布,而其數(shù)量指標(biāo)而其數(shù)量指標(biāo)就是服從這個(gè)分布的隨機(jī)變量,就是服從這個(gè)分布的隨機(jī)變量,以后說“從總體中抽樣

6、”與“從某分布中抽樣”是同一個(gè)意思。例1:考察某廠的產(chǎn)品質(zhì)量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體=該廠生產(chǎn)的全部合格品與不合格品=由0或1組成的一堆數(shù) 設(shè)P表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示XP011-PP不同的P反映了總體的差異。比如:兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為:XP010.9830.017XP010.9150.085 顯然第一個(gè)工廠的產(chǎn)品質(zhì)量?jī)?yōu)于第二個(gè)工廠,但是在實(shí)際中,分布中的不合格品率是未知的,如何對(duì)之進(jìn)行估計(jì)是統(tǒng)計(jì)學(xué)要研究的問題。二、樣本二、樣本樣本:樣本:為了了解總體的分布,我們從總體中隨機(jī)地抽取n個(gè)個(gè)體

7、,記其指標(biāo)值為 , 則nxxx,.,21nxxx,.,21稱為總體的一個(gè)樣本,n稱為樣本容量稱為樣本容量,或簡(jiǎn)稱樣本量,樣品:樣品:樣本中的個(gè)體例2:啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g,由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640g?,F(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測(cè)定其凈含量,得到如下結(jié)果:641 635 640 637 642 638 645 643 639 640這是一個(gè)容量為這是一個(gè)容量為10的樣本的觀測(cè)值,對(duì)應(yīng)的總體為該廠生產(chǎn)的樣本的觀測(cè)值,對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。的瓶裝啤酒的凈含量。抽樣:抽樣:從總體X中抽取有限個(gè)個(gè)體對(duì)總體進(jìn)行觀察的取值過程。 從

8、總體中抽取樣本可以有不同的抽法,為了能由樣本對(duì)總體作出較可靠的推斷,就希望樣本能很好的代表總體。這就需要對(duì)抽樣方法提出一些要求,最常用的是“簡(jiǎn)單隨機(jī)抽樣”簡(jiǎn)單隨機(jī)樣本:簡(jiǎn)單隨機(jī)樣本:滿足以下兩個(gè)條件的隨機(jī)樣本(x1,x2,xn)稱為簡(jiǎn)單隨機(jī)樣本。1. 樣本具有隨機(jī)性:每一個(gè)樣品Xi與總體X具有相同的分布(要求總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本)2. 樣本具有獨(dú)立性:x1,x2,xn是相互獨(dú)立的隨機(jī)變量(即要求樣本中每一個(gè)樣品的取值不影響其他樣品的取值)說明說明:后面提到的樣本均指簡(jiǎn)單隨機(jī)樣本,由:后面提到的樣本均指簡(jiǎn)單隨機(jī)樣本,由概率論知,若總體概率論知,若總體X具有密度函數(shù)具有密度函數(shù)f

9、(x),則樣本,則樣本(x1,x2,xn)具有聯(lián)合密度函數(shù):)具有聯(lián)合密度函數(shù):niinnnxfxfxfxfxxxf12121)()()()(),(例3:設(shè)某種電燈泡的壽命X服從指數(shù)分布E(),其概率密度為0, 00,)(xxexfxX則來自這一總體的簡(jiǎn)單隨機(jī)樣本 的聯(lián)合概率密度為nxxx,.,21其他, 0),.,2 , 1(0,)()()(121nixexfxfxfixnnXXXnii例4:考慮電話交換臺(tái)一小時(shí)內(nèi)的呼喚次數(shù)X,求來自這一總體的簡(jiǎn)單隨機(jī)樣本 的樣本分布。解:由概率論知識(shí),X服從泊松分布P(),其分布律為)0(!)(exxXpxpxX則來自這一總體的簡(jiǎn)單隨機(jī)樣本 的聯(lián)合分布律為

10、nxxx,.,21nnxnXXXexxxxpxpxpnii!)()()(21211nxxx,.,216.3 統(tǒng)計(jì)量及其分布統(tǒng)計(jì)量及其分布 樣本來自總體,樣本觀測(cè)值中含有總體的各種信息,但這些信息較為分散,有時(shí)顯得雜亂無章。為將這些分散在樣本中的有關(guān)總體的信息集中起來以反映總體的各種特征,需要對(duì)樣本進(jìn)行加工,其中最常用的一種方法就是構(gòu)造關(guān)其中最常用的一種方法就是構(gòu)造關(guān)于樣本的函數(shù),不同的函數(shù)反映總體的不同特征。于樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義:設(shè)定義:設(shè) 為取自總體的樣本,若關(guān)于樣本的函為取自總體的樣本,若關(guān)于樣本的函數(shù)數(shù) 中不含有任何未知參數(shù),則稱中不含有任何未知參數(shù),則稱T為

11、統(tǒng)為統(tǒng)計(jì)量。計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。抽樣分布。例如:若x1,x2,xn為樣本,則 都是統(tǒng)計(jì)量;而當(dāng) 未知時(shí),211,nniiiixx, 2211() ,nniiiixx都不是統(tǒng)計(jì)量。nxxx,.,21),.,(21nxxxTT 一些常用的統(tǒng)計(jì)量一些常用的統(tǒng)計(jì)量一些常用的統(tǒng)計(jì)量一些常用的統(tǒng)計(jì)量例如:某單位收集到20名青年人某月的娛樂支出費(fèi)用數(shù)據(jù)79 84 84 88 92 93 94 97 98 99 100 101 101 102 102 108 110 113 118 125樣本均值4 .99X樣本方差9368.133)4 .99125()4 .9984()4 .9979(1201)

12、(11222122niiXXns樣本標(biāo)準(zhǔn)差5731.119368.1332ss-4-2024600.050.10.150.20.250.30.350.4 正態(tài)分布正態(tài)分布),(2N密度函數(shù):222)(21)(pxexp分布函數(shù):dyexFyx222)(21)(p其中為均值,2為方差,x.標(biāo)準(zhǔn)正態(tài)分布:N(0,1)密度函數(shù)2221)(xexpjdyexyx2221)(Fp, 分布函數(shù) 幾個(gè)在統(tǒng)計(jì)中常用的概率分布幾個(gè)在統(tǒng)計(jì)中常用的概率分布 有許多統(tǒng)計(jì)推斷是基于正態(tài)分布總體的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量在實(shí)際中有著廣泛的應(yīng)用。這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的

13、密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”0510152000.020.040.060.080.10.120.140.16分位數(shù)。的卡方分布的為自由度為的稱滿足(,對(duì)給定的當(dāng)隨機(jī)變量nnnPn)()() 10)(22222注:分位數(shù)的值可以人表中查到。307.18)10(,05. 0,1005. 02n例如:-6-4-2024600.050.10.150.20.250.30.350.4分位數(shù)。分布的的為自由度為的稱滿足(,對(duì)給定的當(dāng)隨機(jī)變量tnntnttPntt)()() 10)(注:分位數(shù)的值可以人表中查到。8125. 1)10(,05. 0,1005. 0tn例如:00.51

14、1.522.5300.10.20.30.40.50.60.70.80.91F分布F(10,50)的密度函數(shù)曲線分位數(shù)。分布的的與為自由度為的稱滿足(對(duì)給定的當(dāng)隨機(jī)變量FnmnmFnmFFPnmFF),(),() 10),(注:分位數(shù)的值可以人表中查到。33. 3)10, 5(,05. 0,10, 505. 0Fnm例如:3 . 033. 31)10, 5(1)5 ,10(),(),(05. 095. 01FFnmFnmF本章小結(jié)本章小結(jié)1. 總體、個(gè)體、簡(jiǎn)單隨機(jī)樣本總體、個(gè)體、簡(jiǎn)單隨機(jī)樣本2. 統(tǒng)計(jì)量及其常用分布統(tǒng)計(jì)量及其常用分布3. 分布、分布、t分布、分布、F分布分布24. 正態(tài)總體的抽樣

15、分布正態(tài)總體的抽樣分布總體、個(gè)體、簡(jiǎn)單隨機(jī)樣本的概念,要求:識(shí)記識(shí)記考核的知識(shí)點(diǎn)考核的知識(shí)點(diǎn)1. 總體與樣本總體與樣本2. 統(tǒng)計(jì)量統(tǒng)計(jì)量2.1 統(tǒng)計(jì)量的概念,要求:識(shí)記識(shí)記2.2 樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本矩的概念,要求:識(shí)記識(shí)記3. 幾種統(tǒng)計(jì)量的分別幾種統(tǒng)計(jì)量的分別3.1 分布、t分布、F分布的結(jié)構(gòu)性定義及性質(zhì),要求:識(shí)記識(shí)記23.2 分位數(shù)的概念,要求:領(lǐng)會(huì)領(lǐng)會(huì)3.3 查表計(jì)算常用分布的分位數(shù),要求:簡(jiǎn)單應(yīng)用簡(jiǎn)單應(yīng)用4. 正態(tài)總體的抽樣分布正態(tài)總體的抽樣分布正態(tài)總體的抽樣分布,要求:簡(jiǎn)單應(yīng)用簡(jiǎn)單應(yīng)用定義定義 6.1 (統(tǒng)計(jì)量統(tǒng)計(jì)量)12,nx xx設(shè)為取自某總體的樣本,若樣本12

16、(,),.nTT x xxT不函數(shù)中則稱含有任何未知數(shù)為統(tǒng)計(jì)參量量統(tǒng)計(jì)量的分布成為抽樣分布抽樣分布.21211(1),.nnniiiix xxxx注: 若為樣本 則都是統(tǒng)計(jì)量2211(2),() ,.niixx 當(dāng) ,未知時(shí)等均不是統(tǒng)計(jì)量121211.,1nnniix xxxxxxnnxx樣樣本均值:設(shè)為取自某總體的樣本,其算術(shù)平均值稱為,一般用 表示,即本本均均值值1222122.,1()1.nniix xxsxsxxns樣本方差:設(shè)為取自某總體的樣本 則它關(guān)于樣本均值 的平均偏差平方和樣方差稱為,其算術(shù)平方根稱為樣本標(biāo)準(zhǔn)差本本幾個(gè)重要概念幾個(gè)重要概念123.,nx xx樣本矩設(shè)是樣本,則統(tǒng)

17、計(jì)量11nkkiiaxnk稱為,特別地,樣本一階原點(diǎn)矩就是樣本 階原點(diǎn)矩樣本均值.統(tǒng)計(jì)量11()nkkiibxxn2.nSk稱為 表示二階樣本樣本 階中心中心矩矩幾個(gè)重要的統(tǒng)計(jì)量的分布幾個(gè)重要的統(tǒng)計(jì)量的分布21(.)卡布方分布分12,(0,1),nXXXN定義設(shè)獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布則2222122,nXXXn的分布稱為自由度為 的分布分布22( ).n記為2. F分布分布221212( ),( ),Xm Xn XX定義設(shè)與相互獨(dú)立 則稱12,( , )mnFFFXmXnnFm的分布是自由度為 與 的 分布 記為,.mn其中 稱為稱分子自由度分母自由度為( , ),0,( , )( , )FF m nP FF m nF m nmnF當(dāng)隨機(jī)變量時(shí) 對(duì)給定的稱滿足的數(shù)是自由度為 與 的 分布的 分位數(shù).11( ,)( , )F n mFm n注:3 .t分布分布21212(0,1),( ),XXXNXn定義設(shè)與相互獨(dú)立,且則稱12,XtXnnt的分布是自由度為 的 分布(.)tt n記為2.xs一般正態(tài)總體的和樣本的抽均值樣本方樣分布差重要結(jié)論重要結(jié)論212,( ,),nx xxN 定理 設(shè)是來自正態(tài)總體的樣本 其樣本均值和樣本方差分別為11niixxn2211()1niisxxn和和則有則有2(1);xs與 相互獨(dú)立222(1)(2)(1).nsn() (1).n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論