版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六章樣本及抽樣分布第六章樣本及抽樣分布本章轉(zhuǎn)入課程的第二部分
———數(shù)理統(tǒng)計(jì)數(shù)理統(tǒng)計(jì)的特點(diǎn)是應(yīng)用面廣,分支較多。社會(huì)的發(fā)展不斷向統(tǒng)計(jì)提出新的問題。本章轉(zhuǎn)入課程的第二部分?jǐn)?shù)理統(tǒng)計(jì)的特點(diǎn)是應(yīng)用面廣,分支較多。社從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,說明人們很早就開始了統(tǒng)計(jì)的工作。但是當(dāng)時(shí)的統(tǒng)計(jì),只是對(duì)有關(guān)事實(shí)的簡(jiǎn)單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷。到了十九世紀(jì)末二十世紀(jì)初,隨著近代數(shù)學(xué)和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計(jì)學(xué)這門學(xué)科。從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科。它是研究怎樣以有效的方式收集、整理和分析受隨機(jī)影響的數(shù)據(jù),并對(duì)所考察的問題作出推斷和預(yù)測(cè),直至為采取決策和行動(dòng)提供依據(jù)和建議。數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科。它是研究怎樣以有效的方
數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。數(shù)理統(tǒng)計(jì)的任務(wù)就是研究怎樣有效地收集、整理、分析所獲得的有限的、局部的資料,對(duì)所研究問題的整體,盡可能地作出精確而可靠的結(jié)論。數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用在數(shù)理統(tǒng)計(jì)中,不是對(duì)所研究的對(duì)象全體(稱為總體)進(jìn)行觀察,而是抽取其中的部分(稱為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對(duì)總體進(jìn)行推斷。由于推斷是基于抽樣數(shù)據(jù),抽樣數(shù)據(jù)又不能包括研究對(duì)象的全部信息。因而由此獲得的結(jié)論必然包含不肯定性。所以,在數(shù)理統(tǒng)計(jì)中必然要用到概率論的理論和方法。在數(shù)理統(tǒng)計(jì)中,不是對(duì)所研究的對(duì)象全體(稱為總體)進(jìn)行觀察,而由此也可以說:概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重要應(yīng)用。但它們是并列的兩個(gè)學(xué)科,并無從屬關(guān)系。由此也可以說:概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重需要強(qiáng)調(diào)說明一點(diǎn):統(tǒng)計(jì)方法具有“部分推斷整體”的特征。
因?yàn)槲覀兪菑囊恍〔糠謽颖居^察值去推斷該全體對(duì)象(總體)情況,即由部分推斷全體。這里使用的推理方法是“歸納推理”。需要強(qiáng)調(diào)說明一點(diǎn):統(tǒng)計(jì)方法具有“部分推斷整體”的特征。這種歸納推理不同于數(shù)學(xué)中的“演繹推理”。
它在作出結(jié)論時(shí),是根據(jù)所觀察到的大量個(gè)別情況,“歸納”起來所得,而不是從一些假設(shè)、命題、已知的事實(shí)等出發(fā),按一定的邏輯推理去得出來的。但此時(shí)還應(yīng)記住畢竟是由“局部”推斷“整體”,因而仍可能犯錯(cuò)誤,結(jié)論往往又是在某個(gè)“可靠性水平”之下得出的。這種歸納推理不同于數(shù)學(xué)中的“演繹推理”。它在§6.1隨機(jī)樣本1.總體與個(gè)體
一個(gè)統(tǒng)計(jì)問題總有它明確的研究對(duì)象。研究對(duì)象的全體稱為總體(母體),總體中每個(gè)成員稱為個(gè)體?!?.1隨機(jī)樣本1.總體與個(gè)體一個(gè)統(tǒng)計(jì)問題總有它明確
然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況。這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體。該批燈泡壽命的全體就是總體某品牌轎車百公里耗油量的全體就是總體某批燈泡的壽命某品牌轎車百公里耗油量然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每
由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指標(biāo)的出現(xiàn)也帶有隨機(jī)性。從而可以把這種數(shù)量指標(biāo)看作一個(gè)隨機(jī)變量,因此隨機(jī)變量的分布就是該數(shù)量指標(biāo)在總體中的分布。
這樣,總體就可以用一個(gè)隨機(jī)變量及其分布來描述。由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指
統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性質(zhì)。
由于我們關(guān)心的是總體中的個(gè)體的某項(xiàng)指標(biāo)(如人的身高、體重,燈泡的壽命,汽車的耗油量…),所謂總體的性質(zhì),無非就是這些指標(biāo)值的集體的性質(zhì)。
而概率分布正是刻劃這種集體性質(zhì)的適當(dāng)工具。因此在理論上可以把總體與概率分布等同起來。統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性在數(shù)理統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:———總體就是一個(gè)概率分布。-50005001000150020000510152025在數(shù)理統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:———總體就是一個(gè)概率分2.樣本
為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個(gè)體稱為樣本。樣本中所包含的個(gè)體數(shù)目稱為樣本容量。從某品牌轎車中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為52.樣本為推斷總體分布及各種特征,按一定規(guī)容量為n的樣本(也稱為子樣)可以看作
n維隨機(jī)變量:(X1,X2,…,Xn)
但是,一旦取定一組樣本,得到的是n個(gè)具體的數(shù)(x1,x2,…,xn),稱為樣本的一次觀察值,簡(jiǎn)稱樣本觀察值。容量為n的樣本(也稱為子樣)可以看作n維隨機(jī)變量:(由于抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法。最常用的一種抽樣方法叫作“簡(jiǎn)單隨機(jī)抽樣”,它要求抽取的樣本滿足下面兩點(diǎn):1.
代表性:
X1,X2,…,Xn中每一個(gè)與所考察的總體有相同的分布。2.
獨(dú)立性:X1,X2,…,Xn
是相互獨(dú)立的隨機(jī)變量。由于抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很由簡(jiǎn)單隨機(jī)抽樣得到的樣本(子樣)稱為簡(jiǎn)單隨機(jī)樣本(子樣)。用(X1,X2,…,Xn
)表示。
簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到(X1,X2,…,Xn)是取自某總體的樣本時(shí),若不特別說明,就指簡(jiǎn)單隨機(jī)樣本。由簡(jiǎn)單隨機(jī)抽樣得到的樣本(子樣)稱為簡(jiǎn)單隨機(jī)樣本(子樣)。3.總體、樣本、樣本值的關(guān)系總體(理論分布)樣本
樣本值總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體。3.總體、樣本、樣本值的關(guān)系總體(理論分布)§6.2抽樣分布一、樣本數(shù)據(jù)的處理辦法1、頻數(shù)頻率分布表;2、圖形顯示:直方圖(頻率)、箱線圖3、計(jì)算經(jīng)驗(yàn)分布函數(shù)來近似總體的分布函數(shù)4、構(gòu)造統(tǒng)計(jì)量獲得對(duì)總體各種參數(shù)的認(rèn)識(shí)§6.2抽樣分布一、樣本數(shù)據(jù)的處理辦法1、頻數(shù)頻率分布3、經(jīng)驗(yàn)分布函數(shù)設(shè)為取自總體X的一個(gè)樣本,分布函數(shù)F(x)未知若將樣本觀測(cè)值由小到大進(jìn)行排列為則用有序樣本定義如下函數(shù):稱為有序樣本3、經(jīng)驗(yàn)分布函數(shù)設(shè)為取自總體X的一個(gè)樣本,分布函數(shù)F(x)未則是一非負(fù)又連續(xù)函數(shù),且滿足稱為經(jīng)驗(yàn)分布函數(shù)。說明:對(duì)每一個(gè)x,是樣本中事件發(fā)生的頻率當(dāng)n固定時(shí),樣本的函數(shù),它是一個(gè)隨機(jī)變量*由伯努利達(dá)數(shù)定理:只要n相當(dāng)大,以概率收斂于F(x)Glivenko定理:設(shè)是取自總體X分布函數(shù)為F(x)的樣本,是其經(jīng)驗(yàn)分布函數(shù)表明:當(dāng)n相當(dāng)大時(shí),來自樣本的經(jīng)驗(yàn)分布函數(shù)是總體分布函數(shù)F(x)的一個(gè)良好近似,故經(jīng)典統(tǒng)計(jì)學(xué)中一切統(tǒng)計(jì)推斷都已樣本為依據(jù)。則是一非負(fù)又連續(xù)函數(shù),且滿足稱為經(jīng)驗(yàn)分布函數(shù)。說明:對(duì)每一個(gè)例某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱得凈重為(單位g)351、347、355、344、351,經(jīng)排序得容量為5的有序樣本:344、347、351、351、355,其經(jīng)驗(yàn)分布函數(shù)為例某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱4、統(tǒng)計(jì)量
由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來。
這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量。它是完全由樣本決定的量。統(tǒng)計(jì)量的分布稱為抽樣分布。例如是統(tǒng)計(jì)量當(dāng)未知時(shí),等均不是統(tǒng)計(jì)量4、統(tǒng)計(jì)量由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行
二、常見統(tǒng)計(jì)量極其抽樣分布樣本均值反映了總體均值的信息相應(yīng)觀察值為樣本中數(shù)據(jù)與樣本均值的偏差之和為0二、常見統(tǒng)計(jì)量極其抽樣分布樣本均值反映了總體均值的信息相定理:設(shè)是來自某總體的樣本,為樣本均值。(1)若總體分布為N(μ,σ2),
則的精確分布為N(μ,σ2/n)
;(2)若總體分布未知或不是正態(tài)分布,則的極限分布為N(μ,σ2/n)
;定理:設(shè)是來樣本方差與樣本標(biāo)準(zhǔn)差樣本方差與樣本標(biāo)準(zhǔn)差定理設(shè)總體X具有二階矩,EX=μ,DX=σ2<+∞,設(shè)X1,X2,…,Xn是從該總體得到的樣本,則:定理設(shè)總體X具有二階矩,EX=μ,DX=σ2樣本k階原點(diǎn)矩它反映了總體k階矩的信息樣本k階中心矩
k=1,2,…它反映了總體k階中心矩的信息樣本k階原點(diǎn)矩樣本k階中心矩k=1,2,…它反映了總體k
統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個(gè)分布叫做統(tǒng)計(jì)量的“抽樣分布”.
統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,三大抽樣分布分布1、定義:設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),
則稱隨機(jī)變量:
所服從的分布為自由度為
n
的分布.記為:Person三大抽樣分布分布1、定義:設(shè)分布的密度函數(shù)為:來定義.其中伽瑪函數(shù)通過積分分布的密度函數(shù)為:來定義.其中伽瑪函數(shù)由分布的定義,不難得到:1.
設(shè)相互獨(dú)立,都服從正態(tài)分布則2.設(shè)且X1,X2相互獨(dú)立,則這個(gè)性質(zhì)叫分布的可加性.由分布的定義,不難得到:1.
設(shè)若則可以求得,
EX=n,DX=2n應(yīng)用中心極限定理可得,若
,則當(dāng)n充分大時(shí),的分布近似正態(tài)分布N(0,1).若則可以求得,EX=n,DX=2n應(yīng)用中心極限定2、t分布
定義:設(shè)X~N(0,1),Y~,且X與Y相互獨(dú)立,則稱變量所服從的分布為自由度為n的t分布。記為:T~t(n).Student2、t分布定義:設(shè)X~N(0,1),Y~T的密度函數(shù)為:具有自由度為n的t分布的隨機(jī)變量T的數(shù)學(xué)期望和方差為:
E(T)=0;D(T)=n/(n-2),對(duì)n>2
不難看到,當(dāng)n充分大時(shí),t分布近似N
(0,1)分布。但對(duì)于較小的n,t分布與N(0,1)分布相差很大。T的密度函數(shù)為:具有自由度為n的t分布的隨機(jī)變量T的數(shù)學(xué)期3、F分布定義:設(shè)X與Y相互獨(dú)立,則稱統(tǒng)計(jì)量服從自由度為n1及n2的F分布,n1稱為第一自由度,n2稱為第二自由度,記作:
F~F(n1,n2).由定義可見,~F(n2,n1)3、F分布定義:設(shè)若X~F(n1,n2),X的概率密度為X的數(shù)學(xué)期望為:若n2>2即它的數(shù)學(xué)期望并不依賴于第一自由度n1.若X~F(n1,n2),X的概率密度為X的數(shù)學(xué)期望為:若n分位點(diǎn)1.6452.326-2.3262.4469-2.446914.4401.2379.20一般地,分位點(diǎn)1.6452.326-2.3262.4469-2.44=0.1605=0.1605四、幾個(gè)重要的抽樣分布定理
定理1(樣本均值的分布)設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,則有:四、幾個(gè)重要的抽樣分布定理定理1(樣本均值的分布)設(shè)n取不同值時(shí)樣本均值的分布n取不同值時(shí)樣本均值的分布
定理2(樣本方差的分布)設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有:定理2(樣本方差的分布)設(shè)X1,X2,…,說明:說明:n取不同值時(shí)的分布n取不同值時(shí)的分布
定理3
設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有:定理3設(shè)X1,X2,…,Xn是取自正態(tài)總證明:獨(dú)立證明:獨(dú)立
定理4(兩總體樣本均值差的分布)
分別是這兩個(gè)樣本的且X與Y獨(dú)立,X1,X2,…,是取自X的樣本,取自Y的樣本,分別是這兩個(gè)樣本的樣本方差,均值,則有:Y1,Y2,…,是樣本定理4(兩總體樣本均值差的分布)分別是這兩個(gè)樣本的其中其中證明:證明:
定理5
(兩總體樣本方差比的分布)
分別是這兩個(gè)樣本的且X與Y獨(dú)立,X1,X2,…,是取自X的樣本,取自Y的樣本,分別是這兩個(gè)樣本的樣本方差,均值,則有:Y1,Y2,…,是樣本定理5(兩總體樣本方差比的分布)分別是這兩個(gè)樣本的證明:獨(dú)立證明:獨(dú)立第六章樣本與抽樣分布課件第六章樣本及抽樣分布第六章樣本及抽樣分布本章轉(zhuǎn)入課程的第二部分
———數(shù)理統(tǒng)計(jì)數(shù)理統(tǒng)計(jì)的特點(diǎn)是應(yīng)用面廣,分支較多。社會(huì)的發(fā)展不斷向統(tǒng)計(jì)提出新的問題。本章轉(zhuǎn)入課程的第二部分?jǐn)?shù)理統(tǒng)計(jì)的特點(diǎn)是應(yīng)用面廣,分支較多。社從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等等的記載,說明人們很早就開始了統(tǒng)計(jì)的工作。但是當(dāng)時(shí)的統(tǒng)計(jì),只是對(duì)有關(guān)事實(shí)的簡(jiǎn)單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷。到了十九世紀(jì)末二十世紀(jì)初,隨著近代數(shù)學(xué)和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計(jì)學(xué)這門學(xué)科。從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、地震、水災(zāi)等數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科。它是研究怎樣以有效的方式收集、整理和分析受隨機(jī)影響的數(shù)據(jù),并對(duì)所考察的問題作出推斷和預(yù)測(cè),直至為采取決策和行動(dòng)提供依據(jù)和建議。數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科。它是研究怎樣以有效的方
數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。數(shù)理統(tǒng)計(jì)的任務(wù)就是研究怎樣有效地收集、整理、分析所獲得的有限的、局部的資料,對(duì)所研究問題的整體,盡可能地作出精確而可靠的結(jié)論。數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用在數(shù)理統(tǒng)計(jì)中,不是對(duì)所研究的對(duì)象全體(稱為總體)進(jìn)行觀察,而是抽取其中的部分(稱為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對(duì)總體進(jìn)行推斷。由于推斷是基于抽樣數(shù)據(jù),抽樣數(shù)據(jù)又不能包括研究對(duì)象的全部信息。因而由此獲得的結(jié)論必然包含不肯定性。所以,在數(shù)理統(tǒng)計(jì)中必然要用到概率論的理論和方法。在數(shù)理統(tǒng)計(jì)中,不是對(duì)所研究的對(duì)象全體(稱為總體)進(jìn)行觀察,而由此也可以說:概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重要應(yīng)用。但它們是并列的兩個(gè)學(xué)科,并無從屬關(guān)系。由此也可以說:概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重需要強(qiáng)調(diào)說明一點(diǎn):統(tǒng)計(jì)方法具有“部分推斷整體”的特征。
因?yàn)槲覀兪菑囊恍〔糠謽颖居^察值去推斷該全體對(duì)象(總體)情況,即由部分推斷全體。這里使用的推理方法是“歸納推理”。需要強(qiáng)調(diào)說明一點(diǎn):統(tǒng)計(jì)方法具有“部分推斷整體”的特征。這種歸納推理不同于數(shù)學(xué)中的“演繹推理”。
它在作出結(jié)論時(shí),是根據(jù)所觀察到的大量個(gè)別情況,“歸納”起來所得,而不是從一些假設(shè)、命題、已知的事實(shí)等出發(fā),按一定的邏輯推理去得出來的。但此時(shí)還應(yīng)記住畢竟是由“局部”推斷“整體”,因而仍可能犯錯(cuò)誤,結(jié)論往往又是在某個(gè)“可靠性水平”之下得出的。這種歸納推理不同于數(shù)學(xué)中的“演繹推理”。它在§6.1隨機(jī)樣本1.總體與個(gè)體
一個(gè)統(tǒng)計(jì)問題總有它明確的研究對(duì)象。研究對(duì)象的全體稱為總體(母體),總體中每個(gè)成員稱為個(gè)體?!?.1隨機(jī)樣本1.總體與個(gè)體一個(gè)統(tǒng)計(jì)問題總有它明確
然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況。這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體。該批燈泡壽命的全體就是總體某品牌轎車百公里耗油量的全體就是總體某批燈泡的壽命某品牌轎車百公里耗油量然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每
由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指標(biāo)的出現(xiàn)也帶有隨機(jī)性。從而可以把這種數(shù)量指標(biāo)看作一個(gè)隨機(jī)變量,因此隨機(jī)變量的分布就是該數(shù)量指標(biāo)在總體中的分布。
這樣,總體就可以用一個(gè)隨機(jī)變量及其分布來描述。由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指
統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性質(zhì)。
由于我們關(guān)心的是總體中的個(gè)體的某項(xiàng)指標(biāo)(如人的身高、體重,燈泡的壽命,汽車的耗油量…),所謂總體的性質(zhì),無非就是這些指標(biāo)值的集體的性質(zhì)。
而概率分布正是刻劃這種集體性質(zhì)的適當(dāng)工具。因此在理論上可以把總體與概率分布等同起來。統(tǒng)計(jì)的任務(wù),是根據(jù)從總體中抽取的樣本,去推斷總體的性在數(shù)理統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:———總體就是一個(gè)概率分布。-50005001000150020000510152025在數(shù)理統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:———總體就是一個(gè)概率分2.樣本
為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個(gè)體稱為樣本。樣本中所包含的個(gè)體數(shù)目稱為樣本容量。從某品牌轎車中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為52.樣本為推斷總體分布及各種特征,按一定規(guī)容量為n的樣本(也稱為子樣)可以看作
n維隨機(jī)變量:(X1,X2,…,Xn)
但是,一旦取定一組樣本,得到的是n個(gè)具體的數(shù)(x1,x2,…,xn),稱為樣本的一次觀察值,簡(jiǎn)稱樣本觀察值。容量為n的樣本(也稱為子樣)可以看作n維隨機(jī)變量:(由于抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法。最常用的一種抽樣方法叫作“簡(jiǎn)單隨機(jī)抽樣”,它要求抽取的樣本滿足下面兩點(diǎn):1.
代表性:
X1,X2,…,Xn中每一個(gè)與所考察的總體有相同的分布。2.
獨(dú)立性:X1,X2,…,Xn
是相互獨(dú)立的隨機(jī)變量。由于抽樣的目的是為了對(duì)總體進(jìn)行統(tǒng)計(jì)推斷,為了使抽取的樣本能很由簡(jiǎn)單隨機(jī)抽樣得到的樣本(子樣)稱為簡(jiǎn)單隨機(jī)樣本(子樣)。用(X1,X2,…,Xn
)表示。
簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到(X1,X2,…,Xn)是取自某總體的樣本時(shí),若不特別說明,就指簡(jiǎn)單隨機(jī)樣本。由簡(jiǎn)單隨機(jī)抽樣得到的樣本(子樣)稱為簡(jiǎn)單隨機(jī)樣本(子樣)。3.總體、樣本、樣本值的關(guān)系總體(理論分布)樣本
樣本值總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體。3.總體、樣本、樣本值的關(guān)系總體(理論分布)§6.2抽樣分布一、樣本數(shù)據(jù)的處理辦法1、頻數(shù)頻率分布表;2、圖形顯示:直方圖(頻率)、箱線圖3、計(jì)算經(jīng)驗(yàn)分布函數(shù)來近似總體的分布函數(shù)4、構(gòu)造統(tǒng)計(jì)量獲得對(duì)總體各種參數(shù)的認(rèn)識(shí)§6.2抽樣分布一、樣本數(shù)據(jù)的處理辦法1、頻數(shù)頻率分布3、經(jīng)驗(yàn)分布函數(shù)設(shè)為取自總體X的一個(gè)樣本,分布函數(shù)F(x)未知若將樣本觀測(cè)值由小到大進(jìn)行排列為則用有序樣本定義如下函數(shù):稱為有序樣本3、經(jīng)驗(yàn)分布函數(shù)設(shè)為取自總體X的一個(gè)樣本,分布函數(shù)F(x)未則是一非負(fù)又連續(xù)函數(shù),且滿足稱為經(jīng)驗(yàn)分布函數(shù)。說明:對(duì)每一個(gè)x,是樣本中事件發(fā)生的頻率當(dāng)n固定時(shí),樣本的函數(shù),它是一個(gè)隨機(jī)變量*由伯努利達(dá)數(shù)定理:只要n相當(dāng)大,以概率收斂于F(x)Glivenko定理:設(shè)是取自總體X分布函數(shù)為F(x)的樣本,是其經(jīng)驗(yàn)分布函數(shù)表明:當(dāng)n相當(dāng)大時(shí),來自樣本的經(jīng)驗(yàn)分布函數(shù)是總體分布函數(shù)F(x)的一個(gè)良好近似,故經(jīng)典統(tǒng)計(jì)學(xué)中一切統(tǒng)計(jì)推斷都已樣本為依據(jù)。則是一非負(fù)又連續(xù)函數(shù),且滿足稱為經(jīng)驗(yàn)分布函數(shù)。說明:對(duì)每一個(gè)例某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱得凈重為(單位g)351、347、355、344、351,經(jīng)排序得容量為5的有序樣本:344、347、351、351、355,其經(jīng)驗(yàn)分布函數(shù)為例某食品廠生產(chǎn)聽裝飲料,現(xiàn)從生產(chǎn)線上隨機(jī)抽取5聽飲料,稱4、統(tǒng)計(jì)量
由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來。
這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量。它是完全由樣本決定的量。統(tǒng)計(jì)量的分布稱為抽樣分布。例如是統(tǒng)計(jì)量當(dāng)未知時(shí),等均不是統(tǒng)計(jì)量4、統(tǒng)計(jì)量由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行
二、常見統(tǒng)計(jì)量極其抽樣分布樣本均值反映了總體均值的信息相應(yīng)觀察值為樣本中數(shù)據(jù)與樣本均值的偏差之和為0二、常見統(tǒng)計(jì)量極其抽樣分布樣本均值反映了總體均值的信息相定理:設(shè)是來自某總體的樣本,為樣本均值。(1)若總體分布為N(μ,σ2),
則的精確分布為N(μ,σ2/n)
;(2)若總體分布未知或不是正態(tài)分布,則的極限分布為N(μ,σ2/n)
;定理:設(shè)是來樣本方差與樣本標(biāo)準(zhǔn)差樣本方差與樣本標(biāo)準(zhǔn)差定理設(shè)總體X具有二階矩,EX=μ,DX=σ2<+∞,設(shè)X1,X2,…,Xn是從該總體得到的樣本,則:定理設(shè)總體X具有二階矩,EX=μ,DX=σ2樣本k階原點(diǎn)矩它反映了總體k階矩的信息樣本k階中心矩
k=1,2,…它反映了總體k階中心矩的信息樣本k階原點(diǎn)矩樣本k階中心矩k=1,2,…它反映了總體k
統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個(gè)分布叫做統(tǒng)計(jì)量的“抽樣分布”.
統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,三大抽樣分布分布1、定義:設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),
則稱隨機(jī)變量:
所服從的分布為自由度為
n
的分布.記為:Person三大抽樣分布分布1、定義:設(shè)分布的密度函數(shù)為:來定義.其中伽瑪函數(shù)通過積分分布的密度函數(shù)為:來定義.其中伽瑪函數(shù)由分布的定義,不難得到:1.
設(shè)相互獨(dú)立,都服從正態(tài)分布則2.設(shè)且X1,X2相互獨(dú)立,則這個(gè)性質(zhì)叫分布的可加性.由分布的定義,不難得到:1.
設(shè)若則可以求得,
EX=n,DX=2n應(yīng)用中心極限定理可得,若
,則當(dāng)n充分大時(shí),的分布近似正態(tài)分布N(0,1).若則可以求得,EX=n,DX=2n應(yīng)用中心極限定2、t分布
定義:設(shè)X~N(0,1),Y~,且X與Y相互獨(dú)立,則稱變量所服從的分布為自由度為n的t分布。記為:T~t(n).Student2、t分布定義:設(shè)X~N(0,1),Y~T的密度函數(shù)為:具有自由度為n的t分布的隨機(jī)變量T的數(shù)學(xué)期望和方差為:
E(T)=0;D(T)=n/(n-2),對(duì)n>2
不難看到,當(dāng)n充分大時(shí),t分布近似N
(0,1)分布。但對(duì)于較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度民辦學(xué)校校車服務(wù)合同2篇
- 2025版新能源汽車銷售與服務(wù)合同模板下載4篇
- 2025年度農(nóng)業(yè)科技項(xiàng)目知識(shí)產(chǎn)權(quán)保護(hù)合同8篇
- 2025版綠色建筑節(jié)能技術(shù)實(shí)施合同4篇
- 2025年度高端培訓(xùn)學(xué)校副校長(zhǎng)職務(wù)聘任合同4篇
- 二零二五年度農(nóng)家樂土地流轉(zhuǎn)與鄉(xiāng)村旅游發(fā)展合同
- 二零二五年度農(nóng)家樂房屋出租與鄉(xiāng)村旅游開發(fā)合同
- 2025年度汽車租賃合同車輛違章處理范本3篇
- 案外人另案確權(quán)訴訟與執(zhí)行異議之訴的關(guān)系處理
- 二零二五年度民間借款擔(dān)保與資產(chǎn)保全服務(wù)合同樣本3篇
- 盤式制動(dòng)器中英文對(duì)照外文翻譯文獻(xiàn)
- 社會(huì)系統(tǒng)研究方法的重要原則
- 重癥醫(yī)學(xué)科健康宣教手冊(cè)
- 2022版《義務(wù)教育英語課程標(biāo)準(zhǔn)》解讀培訓(xùn)課件
- 科技進(jìn)步類現(xiàn)代軌道交通綜合體設(shè)計(jì)理論與關(guān)鍵技術(shù)公
- 五個(gè)帶頭方面談心談話范文三篇
- 互聯(lián)網(wǎng)的發(fā)展歷程
- 部編人教版五年級(jí)道德與法治下冊(cè)全冊(cè)課件(完整版)
- 廣西貴港市2023年中考物理試題(原卷版)
- 外觀質(zhì)量評(píng)定報(bào)告
- 窒息的急救解讀課件
評(píng)論
0/150
提交評(píng)論