04-統(tǒng)計推斷的理論基礎(chǔ)課件_第1頁
04-統(tǒng)計推斷的理論基礎(chǔ)課件_第2頁
04-統(tǒng)計推斷的理論基礎(chǔ)課件_第3頁
04-統(tǒng)計推斷的理論基礎(chǔ)課件_第4頁
04-統(tǒng)計推斷的理論基礎(chǔ)課件_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)第四章統(tǒng)計推斷的理論基礎(chǔ)學(xué)習目標理解概率及概率分布的意義;掌握抽樣的基本概念以及抽樣分布的概念;本章內(nèi)容概率與概率分布隨機變量的數(shù)值特征與隨機向量大數(shù)定理與正態(tài)分布定理抽樣分布隨機事件與概率隨機現(xiàn)象的特點:

在基本條件不變的情況下,一系列的試驗或觀測會得到不同的結(jié)果,并且在試驗或觀測前不能預(yù)見何種結(jié)果將出現(xiàn)。了解隨機現(xiàn)象的方法:隨機試驗隨機實驗(簡稱實驗)的特點:

每次試驗的可能結(jié)果不是惟一的;每次試驗之前不能確定何種結(jié)果會出現(xiàn);試驗在相同條件下重復(fù)進行隨機現(xiàn)象與確定現(xiàn)象隨機試驗與事件隨機事件:隨機試驗中可能出現(xiàn)也可能不出現(xiàn)的結(jié)果,簡稱為事件簡單事件:也稱為基本事件,它是不可以再分解的事件,其也被稱為樣本點。復(fù)雜事件:也稱為復(fù)合事件,由簡單事件組合而成的事件?;臼录脖环Q為樣本點。設(shè)試驗有n個基本事件,分別記為i,(i=1,2,…,n),集合={1,2,…,n}稱為樣本空間,中的元素就是樣本點。隨機事件與概率隨機試驗與事件例:投擲骰子的實驗基本事件:

出現(xiàn)點數(shù)為1,2,3,4,5或6的事件復(fù)雜事件:出現(xiàn)點數(shù)是奇數(shù)的事件出現(xiàn)點數(shù)是偶數(shù)的事件我們常用A、B、……來表示隨機事件。設(shè)A表示“出現(xiàn)點數(shù)是奇數(shù)”,則A={1,3,5}隨機事件與概率隨機試驗與事件必然事件——必然出現(xiàn)的實驗結(jié)果

用樣本空間表示。不可能事件——不可能出現(xiàn)的試驗結(jié)果

用空集表示。A發(fā)生或B發(fā)生事件記為A∪B;A與B同時發(fā)生事件記為A∩B,或AB;前面的例子中,A∪B=是必然事件;AB=是不可能事件。如果AB=

,稱為A與B不相容隨機事件與概率隨機試驗與事件定義:概率也稱為機率,是指隨機事件發(fā)生的可能性,或者說對隨機事件發(fā)生可能性的度量隨機事件與概率概率概率的計算:進行重復(fù)試驗,通過試驗的頻率來計算概率。例如,不斷重復(fù)地投擲一枚均勻的硬幣,出現(xiàn)正面的頻率會穩(wěn)定在0.5附近。歷史上,有人為此做過實驗,結(jié)果如下:表:頻率試驗結(jié)果實驗者投擲硬幣的次數(shù)(n)正面朝上的次數(shù)(m)頻率(=m/n)DemorganBuffonPearson(1)Pearson(2)204840401200024000106120486019120120.5180.50690.50160.5005隨機事件與概率概率概率的統(tǒng)計定義:進行n次重復(fù)試驗,隨機事件A發(fā)生的次數(shù)是m次,發(fā)生的頻率是m/n,當試驗的次數(shù)n很大時,如果頻率在某一數(shù)值p附近擺動時,而且隨著試驗次數(shù)n的不斷增加,頻率的擺動幅度越來越小,則稱p為事件A發(fā)生的概率,記為:

P(A)=p,0p1隨機事件與概率概率如果隨機試驗的樣本空間是有限集合,所有樣本點出現(xiàn)的可能性相同,則事件A的概率可根據(jù)以下公式計算:樣本點總數(shù)A包含的樣本點個數(shù)nmP(A)=—=——————————隨機事件與概率概率概率的性質(zhì):性質(zhì)1(非負性):P(A)0

性質(zhì)2(規(guī)范性):P()=1

推論:不可能事件的概率為0,即:P()=0

性質(zhì)3(可加性):若事件A與事件B互不相容,則有:P(A∪B)=P(A)+P(B)

推論:設(shè)A表示A的對立事件,則有:

P(A)=1-P(A)獨立事件:對事件A和B,若p(AB)=p(A)p(B)隨機變量隨機變量:產(chǎn)生于對隨機試驗的結(jié)果進行量化處理的需要。隨機變量X是定義在樣本空間上的一個函數(shù),這個函數(shù)的取值隨試驗的結(jié)果不同而變化。對任意實數(shù)x,X<x是隨機事件,且概率存在。隨機變量離散型隨機變量的概率分布設(shè)離散型隨機變量X的所有可能取值為x1,x2,…,xn,…,,相應(yīng)的概率為p(x1),p(x2),…,p(xn),…,稱為離散型隨機變量X的概率分布。簡記為:p(X=xi)=p(xi)(i=1,2,…)概率分布的性質(zhì):0p(xi)1(i=1,2,…),p(xi)=1Xx1x2…xn…Pp(x1)p(x2)…p(xn)…隨機變量連續(xù)型隨機變量的概率分布分布函數(shù):對任意實數(shù)x,X<x是一隨機事件,可求其概率。記F(x)=p(X<x),該函數(shù)就是隨機變量的分布函數(shù)。密度函數(shù):對分布函數(shù)求導(dǎo),可得密度函數(shù),記為f(x)通過對密度函數(shù)積分,可得到隨機變量X在點x附近或一個區(qū)間上取值的概率。注:連續(xù)型隨機變量取一個固定值的概率為0隨機變量連續(xù)型隨機變量的概率分布密度函數(shù)的性質(zhì):表示隨機變量X的取值在區(qū)間(a,b)內(nèi)的概率。隨機變量連續(xù)型隨機變量的概率分布正態(tài)分布:如果連續(xù)型隨機變量X的密度函數(shù)為則稱隨機變量X服從均值為,方差為2的正態(tài)分布,記為X~N(,2)=0.6=1=2隨機變量連續(xù)型隨機變量的概率分布標準正態(tài)分布:如果正態(tài)分布的密度函數(shù)中,=0,=1,則這樣的正態(tài)分布稱為標準正態(tài)分布。標準正態(tài)隨機變量在區(qū)間[-Z,Z]取值的概率F(Z)可通過查標準正態(tài)分布概率表獲得。隨機變量連續(xù)型隨機變量的概率分布例:設(shè)隨機變量Z服從標準正態(tài)分布,求以下概率的大小:(1)p(-1<Z<1)(2)p(0<Z<1.25)(3)p(1<Z<1.25)(4)p(Z>1)隨機變量連續(xù)型隨機變量的概率分布正態(tài)分布的標準化變換:設(shè)隨機變量X服從正態(tài)分布N(,2),則隨機變量Z=(X-)/服從標準正態(tài)分布,即Z~N(0,1)例:假定學(xué)生某門學(xué)科的考試成績服從均值為60分,標準差為12分的正態(tài)分布,問某一學(xué)生的成績在60分到75分之間的概率應(yīng)為多少?解:隨機變量連續(xù)型隨機變量的概率分布【例】

:設(shè)隨機變量X服從正態(tài)分布N(,2),試分別求X落在以為中心,以,1.96,2,3為半徑的區(qū)間內(nèi)的。解:本章內(nèi)容概率與概率分布隨機變量的數(shù)值特征與隨機向量大數(shù)定理與正態(tài)分布定理抽樣分布隨機變量的數(shù)值特征分布函數(shù)完整地描述了隨機變量的統(tǒng)計規(guī)律性,但實際上,一方面常常不知道隨機變量的分布函數(shù),另一方面也可能不需要知道它,而只需要知道隨機變量的某些特征。討論隨機變量的數(shù)值特征對于了解隨機變量有重要意義。隨機變量的數(shù)值特征隨機變量的(數(shù)學(xué))期望離散型隨機變量X的數(shù)學(xué)期望(也即均值):

=E(X)=xip(xi)

連續(xù)型隨機變量的數(shù)學(xué)期望:如果Y=g(X),則:隨機變量數(shù)學(xué)期望的性質(zhì):E(X1+X2)=E(X1)+E(X2)該性質(zhì)可推廣到多個隨機變量的情形貝努里試驗:只有兩種結(jié)果的試驗n重貝努里試驗:設(shè)A出現(xiàn)的概率為p,重復(fù)進行n次貝努里試驗二項分布以Bk表示n重貝努里試驗中事件A正好出現(xiàn)k次這一事件,則有:K012…nP(Bk)…隨機變量的數(shù)值特征隨機變量的(數(shù)學(xué))期望離散型隨機變量的方差:

2=var(X)=E(X-)2=(xi-)2p(xi)連續(xù)型隨機變量的方差:方差的性質(zhì):Var(X)=2Var(X)Var(X)=E(X2)-[E(X)]2隨機變量的數(shù)值特征隨機變量的方差與標準差方差開平方即為標準差。二元(維)隨機向量離散型隨機向量的概率分布連續(xù)型隨機向量的概率分布隨機向量的數(shù)值特征二元正態(tài)分布其他常用的連續(xù)型隨機變量的分布隨機變量與獨立性其它常用的連續(xù)型隨機變量的分布:2-分布:設(shè)X1,X2,…,Xn是相互獨立且服從標準正態(tài)分布的隨機變量,則稱隨機變量2=Xi2所服從的分布為自由度為n的2-分布。t-分布:設(shè)X服從標準正態(tài)分布,Y服從自由度為n的分布,且它們相互獨立,則隨機變量T=X/Y/n所服從的分布為自由度為n的t-分布。當n30時,t-分布與標準正態(tài)分布的差別非常小,可用標準正態(tài)分布代替。F-分布:設(shè)X和Y是相互獨立的分布,自由度分別是m和n,則稱隨機變量F=(X/Y).(n/m)所服從的分布為F-分布,稱為它的自由度。本章內(nèi)容概率與概率分布隨機變量的數(shù)值特征與隨機向量大數(shù)定理與正態(tài)分布定理抽樣分布大數(shù)定理與正態(tài)分布定理大數(shù)定理大數(shù)定理又稱作大數(shù)法則。人們在觀察個別事物時,是連同一切個別的特性來觀察的。個別現(xiàn)象受偶然因素影響,有各自不同的表現(xiàn)。但是,對總體的大量觀察后進行平均,就能使偶然因素的影響相互抵消,消除由個別偶然因素引起的極端性影響,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律,這就是大數(shù)定理的意義。大數(shù)定理與正態(tài)分布定理大數(shù)定理大數(shù)定理:獨立同分布的隨機變量X1,X2,…,Xn,…設(shè)它們的平均數(shù)為,方差為2。則對任意正數(shù),有:大數(shù)定理與正態(tài)分布定理中心極限定理與正態(tài)逼近

正態(tài)分布的再生定理相互獨立的兩個正態(tài)隨機變量相加之和仍服從正態(tài)分布,這就是正態(tài)分布的再生性。因此,從服從正態(tài)分布的總體中抽出一個容量是n的樣本,則樣本平均數(shù)也服從正態(tài)分布。如果總體的平均是,標準差是(X),則樣本平均數(shù)所服從的正態(tài)分布的中心仍是,標準差是抽樣平均誤差。

大數(shù)定理與正態(tài)分布定理中心極限定理:隨機變量X1,X2,…,Xn,…相互獨立,且服從同一分布,該分布存在有限的期望和方差:E(Xi)=,Var(Xi)=2,(i=1,2,…)。令則中心極限定理與正態(tài)逼近大數(shù)定理與正態(tài)分布定理也就是說,當n趨于無窮大時,Yn近似服從標準正態(tài)分布。中心極限定理與正態(tài)逼近大數(shù)定理與正態(tài)分布定理推論1:均值的分布趨向于正態(tài)分布推論2:n項和的分布趨向于正態(tài)分布中心極限定理與正態(tài)逼近例:4-19(P107)本章內(nèi)容概率與概率分布隨機變量的數(shù)值特征與隨機向量大數(shù)定理與中心極限定理抽樣分布統(tǒng)計推斷與簡單隨機抽樣推斷統(tǒng)計:就是通過抽取樣本,并利用樣本信息來推斷總體的各種性質(zhì)或特征。推斷統(tǒng)計包括:參數(shù)估計和假設(shè)檢驗。推斷統(tǒng)計的基本內(nèi)容抽樣推斷涉及的基本概念:

1.總體與樣本

2.樣本容量與樣本個數(shù)

3.總體參數(shù)與樣本統(tǒng)計量

4.重復(fù)抽樣與不重復(fù)抽樣統(tǒng)計推斷與簡單隨機抽樣推斷統(tǒng)計的基本內(nèi)容樣本容量:指樣本包含的總體單位數(shù),一般用n表示。一般地說,樣本容量大,抽樣誤差會小,但調(diào)查費用會增加,反之,樣本容量過小,又將導(dǎo)致抽樣誤差增大,甚至失去抽樣推斷的價值。因此,在抽樣設(shè)計中應(yīng)根據(jù)調(diào)查目的和要求認真考慮合適的樣本容量。樣本個數(shù):樣本個數(shù)又稱樣本可能數(shù)目,它是指從一個總體中可能抽取多少個樣本。樣本個數(shù)的多少與抽樣方法有關(guān)。關(guān)于樣本個數(shù)的計算我們將在“重復(fù)抽樣與不重復(fù)抽樣”中介紹。注意:

這個概念只是對有限總體有意義,對無限總體沒有意義!

若總體X的樣本X1,…,Xn滿足:Xi與X同分布,Xi與Xj相互獨立,則稱它為簡單隨機樣本。如果總體X的密度函數(shù)為f(x),則簡單隨機樣本的聯(lián)合分布的密度函數(shù)為:統(tǒng)計推斷與簡單隨機抽樣簡單隨機樣本例:設(shè)Xi(i=1,…,n)是來自指數(shù)分布總體X的簡單隨機樣本。求它的聯(lián)合分布密度。解:指數(shù)分布密度為:故該樣本的聯(lián)合分布密度為:總體參數(shù):總體分布的參數(shù)往往是總體的數(shù)量特征,也是統(tǒng)計推斷的對象。常見的總體參數(shù)有:總體平均數(shù)指標,總體成數(shù)(比率)指標,總體分布的方差、標準差,等等。它們都是反映總體分布特征的重要指標??傮w成數(shù)(也稱總體比率)指標是指總體中具有某性質(zhì)的單位數(shù)目在總體中所占的比重,它反映了總體的結(jié)構(gòu)特征。統(tǒng)計量與統(tǒng)計分布樣本統(tǒng)計量樣本統(tǒng)計量:通俗地說,樣本統(tǒng)計量是樣本的函數(shù)。由于樣本是從總體中隨機地抽出來的,因此,樣本統(tǒng)計量也是隨機變量。我們利用樣本統(tǒng)計量來估計或推斷總體的參數(shù)和數(shù)量特征。設(shè)已有樣本(X1,X2,…,Xn),常見的統(tǒng)計量有:樣本統(tǒng)計量統(tǒng)計量與統(tǒng)計分布樣本統(tǒng)計量樣本平均數(shù)樣本成數(shù)樣本方差樣本標準差樣本極差統(tǒng)計量與統(tǒng)計分布例:從一批瓷器中隨機抽取10件,測得其重量如下,求這組樣本值的均值和方差。123456789102.102.431.852.402.152.281.962.352.001.99解:重復(fù)抽樣(或重置抽樣)是指從總體中抽出一個樣本單位,記錄其標志值后,又將其放回總體中繼續(xù)參加下一輪抽樣。

重復(fù)抽樣的特點:

n個單位構(gòu)成的樣本是n次試驗的結(jié)果;每次試驗是獨立的,即其試驗的結(jié)果與前次、后次的結(jié)果無關(guān);每次試驗是在相同條件下進行的,每個單位在每次試驗中選中的機會(概率)是相同的。在重復(fù)試驗中,樣本可能的個數(shù)是Nn,N為總體單位數(shù),n為樣本容量。抽樣分布統(tǒng)計量與統(tǒng)計分布關(guān)于重復(fù)抽樣與不重復(fù)抽樣不重復(fù)抽樣亦稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,不參加下一輪抽樣。下一次繼續(xù)從總體中余下的單位抽取樣本。

不重復(fù)抽樣的特點:

n個單位的樣本由n次試驗結(jié)果構(gòu)成,但由于每次抽出不重復(fù),所以實質(zhì)上相當于從總體中同時抽取n個樣本單位。如果考慮順序,其樣本可能個數(shù)為如果不考慮順序,其樣本可能個數(shù)為抽樣分布統(tǒng)計量與統(tǒng)計分布關(guān)于重復(fù)抽樣與不重復(fù)抽樣

一個統(tǒng)計量的抽樣分布就是該統(tǒng)計量的概率分布,尋求抽樣分布是統(tǒng)計學(xué)的基本任務(wù)之一。只有知道了統(tǒng)計量的抽樣分布,才能對該統(tǒng)計量做全面的了解和掌握。抽樣分布統(tǒng)計量與統(tǒng)計分布抽樣分布重復(fù)抽樣分布

設(shè)從總體中抽出的樣本為X1,X2,…,Xn,由于是重復(fù)抽樣,每個Xi,(i=1,2,…,n)都是從總體中隨機抽出的,都是與總體同分布的隨機變量,并且是相互獨立的。我們設(shè)總體的平均數(shù)為,方差為2,則樣本平均數(shù)的期望值與方差分別是:樣本平均數(shù)的抽樣分布抽樣分布重復(fù)抽樣分布

由概率論知,如果總體是正態(tài)分布的,則樣本平均數(shù)的抽樣分布是如下正態(tài)分布這是一個非常重要的結(jié)論,有廣泛的應(yīng)用。樣本樣本平均數(shù)樣本樣本平均數(shù)34,3434,3834,4234,4634,5038,3438,3838,4238,4638,5042,3442,3842,4242,4642,5034363840423638404244384042444646,3446,3846,4246,4646,5050,3450,3850,4250,4650,5040424446484244464850例:某班組5個工人的日工資為34、38、42、46、50元?,F(xiàn)用重置抽樣的方法從5人中隨機抽2個構(gòu)成樣本。共有52=25個樣本。樣本平均數(shù)頻數(shù)343638404244464850123454321合計25結(jié)論(重復(fù)抽樣):

此指標(抽樣平均數(shù)的標準差)反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。抽樣分布重復(fù)抽樣分布

總體成數(shù)p是指具有某種特征的單位在總體中的比重。在前面我們已經(jīng)知道,成數(shù)是一個特殊平均數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設(shè)X是0、1變量,即:總體單位有該特征,則X取1,否則取0,則有:樣本成數(shù)的抽樣分布抽樣分布重復(fù)抽樣分布樣本成數(shù)的抽樣分布

現(xiàn)從總體中抽出n個單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成數(shù)是:

P也是一個隨機變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:

E(P)=p抽樣分布不重復(fù)抽樣分布樣本平均數(shù)的抽樣分布

某班組5個工人的日工資為34、38、42、46、50元。

現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論