![華科統(tǒng)計學雙學位課件ch抽樣與抽樣分布_第1頁](http://file4.renrendoc.com/view/a124664447f22c3339960b8a5a8e0e69/a124664447f22c3339960b8a5a8e0e691.gif)
![華科統(tǒng)計學雙學位課件ch抽樣與抽樣分布_第2頁](http://file4.renrendoc.com/view/a124664447f22c3339960b8a5a8e0e69/a124664447f22c3339960b8a5a8e0e692.gif)
![華科統(tǒng)計學雙學位課件ch抽樣與抽樣分布_第3頁](http://file4.renrendoc.com/view/a124664447f22c3339960b8a5a8e0e69/a124664447f22c3339960b8a5a8e0e693.gif)
![華科統(tǒng)計學雙學位課件ch抽樣與抽樣分布_第4頁](http://file4.renrendoc.com/view/a124664447f22c3339960b8a5a8e0e69/a124664447f22c3339960b8a5a8e0e694.gif)
![華科統(tǒng)計學雙學位課件ch抽樣與抽樣分布_第5頁](http://file4.renrendoc.com/view/a124664447f22c3339960b8a5a8e0e69/a124664447f22c3339960b8a5a8e0e695.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
Ch5抽樣與抽樣分布統(tǒng)計學原理§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)當前1頁,總共109頁。主要介紹:隨機抽樣,隨機變量的分布,抽樣分布,抽樣方法與抽樣誤差。Ch5主要內(nèi)容Ch5抽樣與抽樣分布§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)當前2頁,總共109頁。Ch5學習目的1,掌握隨機抽樣及其性質2,掌握抽樣方法與抽樣誤差的關系Ch5抽樣與抽樣分布§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)當前3頁,總共109頁。Ch5抽樣與抽樣分布統(tǒng)計學原理§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)當前4頁,總共109頁。§5.1隨機抽樣§5.1.1現(xiàn)象的隨機化§5.1.2樣本空間、事件、概率、分布函數(shù)§5.1.3隨機抽樣§5.1.4樣本統(tǒng)計量Ch5抽樣與抽樣分布§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)返回當前5頁,總共109頁?!鲈谇懊娴膸渍吕?,我們用統(tǒng)計整理和統(tǒng)計描述的方法,研究了現(xiàn)象總體的數(shù)量特征和數(shù)量關系,比如計算總體平均數(shù)、總體的標準差、總體的方差和總體的分布,通過對這些指標的計算,我們得到了研究現(xiàn)象的規(guī)律性認識。■我們亦可以用同樣的方法,去研究樣本的平均數(shù)、樣本的標準差、樣本的方差和樣本分布,并且還可以利用樣本的平均數(shù)、樣本的標準差、樣本的方差和樣本分布,去反推總體的數(shù)量特征和數(shù)量關系,從而得到現(xiàn)象總體規(guī)律性的認識。■用樣本的資料去估計總體的方法,就是抽樣估計?!?.1.1現(xiàn)象的隨機化Ch5抽樣與抽樣分布§5.1隨機抽樣(new)當前6頁,總共109頁?!鎏剿骺陀^規(guī)律的過程§5.1.1現(xiàn)象的隨機化Ch5抽樣與抽樣分布§5.1隨機抽樣(new)隨機理論總體內(nèi)在的數(shù)量規(guī)律性,F(xiàn)(x;)統(tǒng)計整理和統(tǒng)計描述總體數(shù)據(jù)樣本數(shù)據(jù)圖5-1探索客觀規(guī)律的統(tǒng)計過程抽樣估計和統(tǒng)計推斷反映客觀現(xiàn)象的統(tǒng)計數(shù)據(jù)樣本數(shù)據(jù)當前7頁,總共109頁?!龀闃庸烙嬍且环N比較經(jīng)濟的估計方法。它的特點是利用隨機抽樣的理論,用比較少的數(shù)據(jù)及比較小的誤差去達到處理大量數(shù)據(jù)的目標,從而得到現(xiàn)象總體規(guī)律性的認識。它是一種數(shù)據(jù)處理的優(yōu)化方法■為保證抽樣理論的完整性和科學性,從這一節(jié)開始,我們將對所研究的現(xiàn)象進行隨機化處理,即用概率的理論去研究現(xiàn)象的規(guī)律性?!?.1.1現(xiàn)象的隨機化Ch5抽樣與抽樣分布§5.1隨機抽樣(new)當前8頁,總共109頁。■抽樣估計的過程可靠性總體分布函數(shù)F(x;)樣本數(shù)據(jù)X樣本統(tǒng)計量樣本分布函數(shù)F(X;)隨機樣本可靠性總體參數(shù)樣本參數(shù)抽樣分布F(
)E(X)=E(x)=D(x)=2D(X)=S2D(
)E(
)=|-|當前9頁,總共109頁。數(shù)理統(tǒng)計概率統(tǒng)計數(shù)學表示客觀現(xiàn)象試驗抽樣試驗試驗的結果、樣本組成單位、個體基本事件、樣本點、元素i;i=1,2,3,…,N。樣本的所有可能結果、樣本空間S、總體基本事件全集S={
i;i=1,2,3,…,N。}。頻率、事件A在S中出現(xiàn)的頻率、fn(A)=n/N概率、事件A在S中出現(xiàn)的可能性Pro(A|S)=Pro{A()|S}數(shù)據(jù)X變量XX事件A量化為數(shù)據(jù)X、樣本數(shù)據(jù)X(A)隨機變量X(A)X(A)←A={
i;i=1,2,3,…,n。nN}事件S量化為數(shù)據(jù)X、總體數(shù)據(jù)X(S)隨機變量X(S)X(S)←S={
i;i=1,2,3,…,N。}基本事件
i量化為數(shù)據(jù)Xii
→Xi()如果i=1,2,3,…,n。則Xi()表示樣本數(shù)據(jù),X={Xi();i=1,2,3,..,n};如果i=1,2,3,..,N。則Xi()表示總體數(shù)據(jù),x={Xi();i=1,2,3,..,N}。X,x
R統(tǒng)計分布概率分布總體F(x;);樣本F(X;)特征指標分布參數(shù)總體特征指標總體分布參數(shù)樣本特征指標樣本統(tǒng)計量、分布參數(shù)變量(X)
表5-1現(xiàn)象隨機化一攬表返回當前10頁,總共109頁?!?.1.2樣本空間、事件、概率、分布函數(shù)Ch5抽樣與抽樣分布§5.1隨機抽樣(new)隨機現(xiàn)象X在個別試驗中其結果呈現(xiàn)不確定性;在大量的重復試驗中其結果又具有規(guī)律性的現(xiàn)象,我們稱為隨機現(xiàn)象。比如我們感興趣的現(xiàn)象總體,如果具有上述特征,那么這個現(xiàn)象總體就是一個隨機現(xiàn)象。通常,我們所研究的總體都是隨機現(xiàn)象。隨機現(xiàn)象總體表現(xiàn)記為X。隨機事件(試驗)(X)VU在某種隨機現(xiàn)象里,在一定條件下,可能發(fā)生也可能不發(fā)生的事件,就是隨機事件。比如,在總體中的某個樣本,在一定條件下,可能被抽取出來,也可能沒有抽取出來,那么這個樣本{Xi}是否能夠出現(xiàn),就是一個隨機事件。隨機事件一個偶然事件,通常用(X)表示。反之,在同樣條件下不可能出現(xiàn)的事件,叫不可能事件;不可能事件用V表示。在同樣條件下一定出現(xiàn)的事件,叫必然事件;必然事件用U表示。在概率統(tǒng)計里,U和V本身也是一個隨機事件。VU。當前11頁,總共109頁。樣本空間S={X()}
S
隨機事件的所有可能結果所組成的集合,稱為樣本空間。樣本空間記為S,S={}或S={X()}或者S={Xi;i=1,2,3,..,N}。樣本空間的每個結果,稱為樣本點。對于樣本空間S,滿足給定性質的樣本點集合A,就是事件A。事件A是樣本空間的一個樣本。樣本A由若干個樣本點組成。顯然,樣本空間S是一個必然事件,S=U;空集是一個不可能事件,=V。于是,也有
S。當然,
A
S。樣本空間,是隨機事件的變化范圍。隨機變量(X)X()在抽樣過程中,每次抽取出來的樣本結果都是不可預知的。因此,常常把樣本叫做隨機樣本;這個樣本的特征表現(xiàn),就叫一個隨機變量。比如我們抽取的樣本數(shù)據(jù),其數(shù)據(jù)結果就是一個隨機變量。隨機變量是隨機事件數(shù)量化的結果,常常用X()表示。如果建立事件與數(shù)量序數(shù)i的對應關系,則隨機變量又可用Xi表示。在大多數(shù)情況下,隨機事件和隨機變量是等同使用的。當前12頁,總共109頁。概率
SU0Pro{|S}1在相同條件S下隨機實驗N次,事件出現(xiàn)n次,nN,于是比值n/N就稱為事件發(fā)生的頻率,并且隨著N的增大,該頻率圍繞某一常數(shù)p上下波動,且波動的幅度逐漸減小,趨于穩(wěn)定,則這個穩(wěn)定的頻率值就是概率。記為(5.1.1)因此,概率是指隨機事件發(fā)生的可能性大小。它是定義在樣本空間所有的集合上的實值函數(shù)。是對事件頻率可能觀察到的規(guī)律性所做的數(shù)學概括。因為nN,所以0Pro{|S}1,(5.1.2)對不可能事件V和必然事件U,由于
S,有Pro{=V=
|S}=0,Pro{=U=S|S}=1。(5.1.3)由于→X(),則隨機事件的概率表示一般又為Pro{|S}=Pro{X()|S}=
Pro{X=Xi
|S};i=1,2,3,..,N(5.1.4).其中,最常見的表示為Pro{X=Xi
|S};i=1,2,3,..,N.(5.1.5)當前13頁,總共109頁?!?.1.2樣本空間、事件、概率、分布函數(shù)Ch5抽樣與抽樣分布§5.1隨機抽樣(new)概率分布函數(shù)隨機變量X的所有可能結果,與其相應的概率Pro{X()|S}排列,就是X的概率分布。如Pro{X=xi
|S};i=1,2,3,..,N.(5.1.6)定義:由X所決定的概率函數(shù)Pro{X()|S}為一個分布函數(shù),記為F(x)=Pro{Xx}.(5.1.7)其中:x表示Xi中的任何一個值,它既表示X的所有可能變化范圍,又表示樣本觀察值的全集;Xx表示一個X在一個相對固定的數(shù)量集x上的變化;而F(x)則表示X的概率在某個范圍Xx上的連續(xù)累積,它反映了X在某個值域上的概率變化規(guī)律,是對隨機變量X統(tǒng)計規(guī)律性的完整描述。當前14頁,總共109頁。概率分布函數(shù)(續(xù))當X是分離的值時,F(xiàn)(x)是離散分布函數(shù),離散分布函數(shù)表示為(5.1.8)如果X是連續(xù)的變量,F(xiàn)(x)則是連續(xù)分布函數(shù),F(xiàn)(x)為(5.1.9)其中,f(X)是連續(xù)分布函數(shù)的概率密度函數(shù)。對于一個具體的分布函數(shù)F(x),決定F(x)值的因素,除了隨機變量X外,還有分布的參數(shù),是決定分布形狀的重要指標,因此,分布函數(shù)常常又表示為F(x;)。比如(5.1.10)返回當前15頁,總共109頁?!?.1.3隨機抽樣Ch5抽樣與抽樣分布§5.1隨機抽樣(new)所謂抽樣{X1,X2,X3,…,Xn}就是從總體中按一定的抽樣技術抽取若干個體,所抽取的若干個體稱為一個樣本;樣本的抽取過程就稱為抽樣。樣本中所含個體的數(shù)量稱為樣本容量。樣本中每個個體的值就叫樣本觀察值。其一般數(shù)量表示是:設X1,X2,X3,…,Xn是從總體X得到的一個容量為n的簡單樣本;如果X是具有分布函數(shù)F的隨機變量,則樣本X1,X2,X3,…,Xn就是一個具有同一分布F的、相互獨立的隨機變量,隨機變量組X1,X2,X3,…,Xn就為從總體X得到的容量為n的簡單隨機樣本;樣本的觀察值x1,x2,x3,…,xn稱為樣本值,又稱為X的n個獨立的觀察值。當前16頁,總共109頁?!龀闃樱ɡm(xù))因此,若X1,X2,X3,…,Xn為F的一個樣本,則X1,X2,X3,…,Xn的聯(lián)合分布函數(shù)為(5.1.11)如果X具有概率密度f,則X1,X2,X3,…,Xn的聯(lián)合概率密度函數(shù)為(5.1.12)這個結論,從分布的特征表示角度理解,就是樣本與總體應該具有相似性與獨立性。抽樣的目的是為了推斷總體的某些重要特征,即利用樣本推測總體分布特征和分布函數(shù)。具體地說,就是求F(x;)和?!?.1.3隨機抽樣Ch5抽樣與抽樣分布§5.1隨機抽樣(new)返回當前17頁,總共109頁?!鰳颖窘y(tǒng)計量樣本是進行統(tǒng)計推斷的依據(jù)。在應用時,往往不是直接使用樣本本身,而是針對不同的問題構造樣本的函數(shù),利用這些樣本函數(shù)進行統(tǒng)計推斷。這些與樣本有關的函數(shù),就是樣本統(tǒng)計量。樣本統(tǒng)計量定義為:設X1,X2,X3,…,Xn是來自總體X的一個樣本,Z(X1,X2,X3,…,Xn)是X1,X2,X3,…,Xn的函數(shù),若Z是連續(xù)函數(shù)且Z中不含任何未知參數(shù),則稱Z(X1,X2,X3,…,Xn)是一樣本統(tǒng)計量,簡稱統(tǒng)計量。樣本統(tǒng)計量統(tǒng)一簡記為Zn=Z(X1,X2,X3,…,Xn)。下面列出的是幾個常用的統(tǒng)計量?!?.1.4樣本統(tǒng)計量Ch5抽樣與抽樣分布§5.1隨機抽樣(new)當前18頁,總共109頁。理論公式觀察值樣本平均數(shù)樣本方差樣本標準差樣本k階原點矩樣本k階中心矩樣本成數(shù)§5.1.4樣本統(tǒng)計量當前19頁,總共109頁。■樣本統(tǒng)計量(續(xù))如果樣本是一個隨機樣本,X1,X2,X3,…,Xn1是一個隨機變量,則樣本統(tǒng)計量也將變成一個隨機變量。樣本統(tǒng)計量Zn=Z(X1,X2,X3,…,Xn)是隨機變量X的函數(shù)。由于樣本統(tǒng)計量是反映總體特征參數(shù)的函數(shù),它與抽樣有關,因此樣本統(tǒng)計量分布又叫抽樣分布??梢宰C明,在抽樣條件下,可以用樣本的統(tǒng)計均值去估計總體的期望值E(X)=1,用樣本的統(tǒng)計方差S2去估計總體的方差2,…,等等。1,2是總體參數(shù)的一部分。§5.1.4樣本統(tǒng)計量Ch5抽樣與抽樣分布§5.1隨機抽樣(new)返回當前20頁,總共109頁?!?.2隨機變量的分布§5.2.1隨機變量的分布§5.2.2分布的數(shù)量特征§5.2.3二項分布§5.2.4正態(tài)分布§5.2.5大數(shù)定律與中心極限定理Ch5抽樣與抽樣分布§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)返回當前21頁,總共109頁?!?.2.1隨機變量的分布Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)統(tǒng)計估計的核心問題是求F(x;)和。求F(x;)和就必須掌握X的分布和的分布。的分布又叫參數(shù)分布。這里先了解基本隨機變量X的分布。抽樣分布將在下一節(jié)討論。
F(x;)F(X;
)∴F(X;
)∵=(X)F(X)F(
)隨機變量的分布隨機變量函數(shù)的分布、參數(shù)分布、抽樣分布。n,N比較小時,可列出?!郌(
)n,N比較大時,可求出精確分布或者極限分布。當前22頁,總共109頁?!?.2.1隨機變量的分布Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)設X是一個隨機變量,x是一個任意實數(shù),則由(5.1.7)所定義的函數(shù)F(x)=Pro{Xx}.(5.2.1)就為X的分布函數(shù)。對于任意的實數(shù)x1,x2,我們有Pro{x1<Xx2
}=Pro{Xx2
}-Pro{Xx1
}(5.2.2)=F(x2)-F(x1).因此,只要知道X的分布函數(shù),就可知道落在任一區(qū)間(x1,x2)上的概率。如果將X看成是數(shù)軸上隨機點的坐標,那么,F(xiàn)(x)在x處的函數(shù)值就表示X落在區(qū)間(-∞,x)上的概率。當前23頁,總共109頁?!?.2.1隨機變量的分布Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)顯然,對于離散型隨機變量,有(5.2.3)對于連續(xù)型隨機變量,有(5.2.4)其中,f(X)是連續(xù)分布函數(shù)的概率密度函數(shù)。并且由(5.1.10)有最典型的分布,離散型為二項分布,連續(xù)型為正態(tài)分布。返回當前24頁,總共109頁。§5.2.2分布的數(shù)量特征■分布的數(shù)量特征就是指分布F(x;)的參數(shù)。分布參數(shù)是決定分布形狀及分布特征的重要指標。常用的參數(shù)指標有:數(shù)學期望,方差,…?!鰯?shù)學期望設離散型隨機變量X的分布律為Pro{X=Xi
}=Pi;i=1,2,3,...(5.2.5)如果級數(shù)絕對收斂,則稱級數(shù)的和為離散型隨機變量X的數(shù)學期望,記為E(X),即(5.2.6)Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前25頁,總共109頁?!?.2.2分布的數(shù)量特征■數(shù)學期望(續(xù))設連續(xù)型隨機變量X的概率密度為f(x),若積分絕對收斂,則稱積分的值為連續(xù)型隨機變量X的數(shù)學期望,記為E(X),即(5.2.7)數(shù)學期望簡稱為期望,又稱為均值。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前26頁,總共109頁?!?.2.2分布的數(shù)量特征■方差設X是一隨機變量,如果E{[X-E(X)]2}存在,則稱E{[X-E(X)]2}為X的方差,記為D(X)或者Var(X),即D(X)=Var(X)=E{[X-E(X)]2}.(5.2.8)D(X)刻畫了X的取值與其數(shù)學期望的偏離程度。如果X取值比較集中,則D(X)較小,反之,則D(X)比較大。因此,D(X)是衡量X取值分散程度的一個尺度。有D(X)=E(X2)-[E(X)]2.(5.2.9)對D(X)開平方根,記為(X),(5.2.10)(X)稱為標準差或均方差。(X)是與隨機變量具有相同量綱的量。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前27頁,總共109頁。§5.2.2分布的數(shù)量特征Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)協(xié)方差與相關系數(shù)如果X,Y不是相互獨立,而是存在一定的關系,E{[X-E(X)]·[Y-E(Y)]}≠0.,則稱E{[X-E(X)]·[Y-E(Y)]}為的X與Y的協(xié)方差。記為Cov(X,Y),即
Cov(X,Y)=E{[X-E(X)]·[Y-E(Y)]}.(5.2.11)而(5.2.12)稱為隨機變量X與Y的相關系數(shù)。
XY也是一個無量綱的量。可以證明Cov(X,Y)=E(X·Y)-E(X)·
E(Y).(5.2.13)0|
XY|1.(5.2.14)XY是一個表征X與Y之間線性相關程度的量。當|XY|較大時,X,Y線性相關程度較好;當|XY|較小時,X,Y線性相關程度較差;當|XY|=0時,X,Y線性不相關;當|XY|=1時,X,Y之間以概率1存在線性相關關系。當前28頁,總共109頁?!?.2.2分布的數(shù)量特征■矩設X與Y是隨機變量,如果E(Xk);k=1,2,….(5.2.15)存在,稱它為X的k階原點矩,簡稱為k階矩。若E[X-E(X)]k;k=1,2,….(5.2.16)存在,稱它為X的k階中心矩。如果E(XkYl);k,l=1,2,….(5.2.17)存在,稱它為X和Y的k+l階混合矩。若E[X-E(X)]k·E[Y-E(Y)]l;k,l=1,2,….(5.2.18)存在,稱它為X和Y的k+l階混合中心矩。顯然,E(X)是X的一階原點矩,D(X)是X的二階中心矩,Cov(X,Y)是X與Y的1+1階混合中心矩。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前29頁,總共109頁?!?.2.2分布的數(shù)量特征■位置表征滿足不等式Pro{Xx}p,Pro{Xx}1-p;(0<p<1)(5.2.19)的x值為p階分位數(shù),記為xp。如果隨機變量X是連續(xù)型的,那么p階分位數(shù)就是滿足方程F(x)=Pro{Xx}=p;(5.2.20)的x值??赡苡袔讉€x值滿足不等式(5.2.19)或者方程(5.2.20)。這時每一個數(shù)值都稱為p階分位數(shù)。通常較小的稱為p階下分位數(shù),較大的稱為p階上分位數(shù)。例如,p=1/2,x1/2稱為1/2分位數(shù);p=1/4,x1/4稱為1/4分位數(shù)。分位數(shù)及它的函數(shù)通稱為位置表征。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)返回當前30頁,總共109頁?!?.2.3二項分布■設有n次試驗,各次試驗是彼此獨立的,每次實驗事件A出現(xiàn)的概率都是P,事件A不出現(xiàn)記為ā,它的概率都是q=1-P,這種重復試驗叫做重復實驗。■在n次重復試驗中,如果事件A出現(xiàn)X=0,1,2,…,n次的概率,依次為二項展開式(P+q)n=Cn0Pn+Cn1Pn-1q+Cn2Pn-2q2+…..+Cnn-1P1qn-1+Cnnqn.的各相應項,即(5.2.21)則這個概率分布就叫二項分布。Bernoulli最先研究了這個分布,所以又叫Bernoulli分布?!龆椃植己唵斡洖閄~b(x;n,P);b(x;n,P)=CnxPxqn-x。
Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前31頁,總共109頁。§5.2.3二項分布■二項分布(續(xù))二項分布的數(shù)值,取決于試驗的次數(shù)n和每次事件A出現(xiàn)的概率P。如果n=1,則二項分布就是二點分布。二點分布是二項分布的特例,X只能是0,1記為X~b(x;1,P)。二項分布的分布函數(shù)為(5.2.22)其期望值和方差為E(X)=nP;D(X)=nPq;(5.2.23)Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前32頁,總共109頁。x值域(0,1,2,3,….n)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)np方差D(x)np(1-p)偏度skew(1-2p)(np-np2)1/2峰度kurt3+(1-6p+6p2)/(np-np2)矩母函數(shù)MGF特征函數(shù)CF二項分布Binomialx;n,p當前33頁,總共109頁?!?.2.3二項分布■二項分布(續(xù))特別地,當P很小,n為極大,nP恒定保持為一個常數(shù),nP=時,有(5.2.24)但當n為極大,P不是很小,則為(5.2.25)它表示,如果X表示在n次獨立試驗中成功的次數(shù),P為每單一試驗成功的概率,則當試驗次數(shù)無限增大時,在P很小或者不是很小時,變量X的分布分別趨近于兩種不同的分布:前者為泊松分布;后者則是正態(tài)分布。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前34頁,總共109頁?!?.2.3二項分布■二項分布(續(xù))Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)圖5-2二項分布密度與分布函數(shù)P(x)xx二項分布函數(shù)二項分布密度F(x)n=10,P=0.50123456789100.20.30.2n=10,P=0.5000.10.61012345678910返回當前35頁,總共109頁?!?.2.4正態(tài)分布Normal
■如果隨機變量X是一個連續(xù)變量,且X的概率密度為(5.2.26)則稱X服從正態(tài)分布N(,2);簡記為X~N(,2)??梢宰C明:E(X)=
;D(X)=2
;Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)圖5-3正態(tài)分布密度與分布函數(shù)f(X)X0x0正態(tài)分布函數(shù)正態(tài)分布密度F(x)=0.5=2=110.5當前36頁,總共109頁?!?.2.4正態(tài)分布■正態(tài)分布N(,2)f(X)的圖形呈對稱鐘形,對稱軸為X=;f(X)的最大值在X=,在X=有拐點;當X→∞時,曲線以X軸為漸近線。當大時,曲線平緩;當小時,曲線陡峭。如果=0,2=1,則N(0,1)就稱為標準正態(tài)分布。它的概率密度為(5.2.27)
Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前37頁,總共109頁?!?.2.4正態(tài)分布■正態(tài)分布(續(xù))如果X~N(,2),則X的分布函數(shù)可表示為(5.2.28)因為只要令Z=(X-)/,z=(x-)/,就有(5.2.29)則證明,如果X~N(,2),則隨機變量Z=(X-)/~N(0,1)。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前38頁,總共109頁?!?.2.4正態(tài)分布■正態(tài)分布(續(xù))進一步,令(5.2.30)容易得,
(-x)=1-(x)。已經(jīng)編制了(x)的函數(shù)表在附表,供查用。■于是正態(tài)分布函數(shù)可表示為Pro(Xx)=(x)?!隹梢宰C明,正態(tài)分布N(,2)的E(X)=,D(X)=2?!鲲@然,當n為極大,P不是很小,如果二項分布的極限分布是正態(tài)分布,則其平均數(shù)為nP、方差為nP(1-P)。Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前39頁,總共109頁?!?.2.4正態(tài)分布圖5-4標準正態(tài)分布與上分位點f(Z)Z0Z0正態(tài)分布上分位點標準正態(tài)分布1-Zf(z)由N(0,1)分布圖形的對稱性質知:1-分位點Z1-=-Z,N(0,1)分布的分位點Z可查表求得!當前40頁,總共109頁。數(shù)理統(tǒng)計標準正態(tài)分布表Z(Z)Z(Z)Z(Z)0.000.5000001.100.8643342.000.9772500.100.5398281.200.8849302.100.9821360.200.5792601.300.9031992.200.9860970.300.6179111.400.9192432.300.9892760.400.6554221.500.9331932.400.9918020.500.6914621.600.9452012.500.9937900.600.7257471.640.9494972.600.9953390.700.7580361.700.9554352.700.9965330.800.7881451.800.9640702.800.9974450.900.7881451.900.9712842.900.9981341.000.8413451.960.9750023.000.998650當前41頁,總共109頁。統(tǒng)計學(p385)標準正態(tài)分布表返回Z/2F(Z/2)Z/2F(Z/2)Z/2F(Z/2)0.000.0000001.100.7286682.000.9545000.100.0796561.200.769862.100.9642720.200.1585201.300.8063982.200.9721940.300.2358221.400.8384862.300.9785520.400.3108441.500.8663862.400.9836040.500.3829241.600.8904022.500.9875800.600.4514941.640.8989942.600.9906780.700.5160721.700.9108702.700.9930660.800.5762901.800.9281402.800.9948900.900.5762901.900.9425682.900.9962681.000.6826901.960.9500043.000.997300當前42頁,總共109頁。x變化范圍分布密度函數(shù)伽瑪分布(0,)貝塔分布(0,+1)對數(shù)正態(tài)分布2(0,)指數(shù)分布Exponential(0,)拉普拉斯分布Laplace(,)極值分布ExtremeValue(,)邏輯分布Logistic(0,1)(,)雙曲正割分布Sech(0,1)(,)柯西分布Cauchy(0,1)(,)補充:若干連續(xù)分布當前43頁,總共109頁。X值域(0,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)方差D(x)2偏度skew21/2峰度kurt3+6矩母函數(shù)MGF特征函數(shù)CF伽瑪分布x;當前44頁,總共109頁。X值域(0,1)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)(+)方差D(x)(+)-2(++1)-1偏度skew2(-)(++1)1/2(++2)-2()-1/2峰度kurt比較復雜矩母函數(shù)MGF特征函數(shù)CF比較復雜貝塔分布x;當前45頁,總共109頁。X值域(0,1)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)12方差D(x)1/8偏度skew0峰度kurt3/2矩母函數(shù)MGF特征函數(shù)CF比較復雜反正弦分布Arcsine
當前46頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)方差D(x)2偏度skew0峰度kurt3矩母函數(shù)MGF特征函數(shù)CF正態(tài)分布Nx;2當前47頁,總共109頁。X值域(0,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)exp2方差D(x)exp2exp2偏度skewexp2+2exp21/2
峰度kurtexp42+2exp32+3exp22-3矩母函數(shù)MGF比較復雜特征函數(shù)CF對數(shù)正態(tài)分布x;2當前48頁,總共109頁。X值域(0,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)1方差D(x)1/2偏度skew2峰度kurt9矩母函數(shù)MGF特征函數(shù)CF指數(shù)分布Exponential當前49頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)0方差D(x)2/2偏度skew0峰度kurt6矩母函數(shù)MGF特征函數(shù)CF拉普拉斯分布Laplace當前50頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)-==0.5772…(歐拉數(shù))方差D(x)2偏度skew1.29857..峰度kurt5.4矩母函數(shù)MGF特征函數(shù)CF極值分布ExtremeValue當前51頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)0方差D(x)23偏度skew0峰度kurt4.2矩母函數(shù)MGF特征函數(shù)CF邏輯分布Logistic(0,1)當前52頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)0方差D(x)24偏度skew0峰度kurt5.0矩母函數(shù)MGF特征函數(shù)CF雙曲正割分布Sech(0,1)當前53頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)0方差D(x)1/(-3),>3偏度skew0峰度kurt3+6/(-5),>5矩母函數(shù)MGF特征函數(shù)CF比較復雜StudentZ()分布當前54頁,總共109頁。X值域(-,)密度函數(shù)CDF分布函數(shù)PDF期望值E(x)不存在方差D(x)不存在偏度skew不存在峰度kurt不存在矩母函數(shù)MGF不存在特征函數(shù)CF柯西分布Cauchy(0,1)返回當前55頁,總共109頁?!?.2.5大數(shù)定律與中心極限定理■大數(shù)定律是反映算術平均數(shù)穩(wěn)定性與頻率穩(wěn)定性的定律。它們由以下三組定理組成:定理一契比雪夫定理特例。定理二貝努利定理。定理三辛欽定理。是隨機變量函數(shù)的分布的基礎。
Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前56頁,總共109頁?!?.2.5大數(shù)定律與中心極限定理■定理一契比雪夫定理特例。設隨機變量X1,X2,X3,…,Xn,…相互獨立,且具有相同的數(shù)學期望和方差,E(Xi)=,D(Xi)=2,i=1,2,..。作前n個隨機變量的算術平均(5.2.31)則對于任意的正數(shù)ε有(5.2.32)或者表達為:設隨機變量X1,X2,X3,…,Xn,…相互獨立,且具有相同的數(shù)學期望和方差,E(Xi)=,D(Xi)=2,i=1,2,..。則序列Yn依概率收斂于。記為(5.2.33)Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前57頁,總共109頁?!?.2.5大數(shù)定律與中心極限定理■定理二貝努利定理。設nA是n次獨立重復試驗中事件A發(fā)生的次數(shù)。P是事件A在每次試驗中發(fā)生的概率,則對于任意的正數(shù)ε有(5.2.34)在抽樣統(tǒng)計里,nA/n也叫抽樣成分數(shù),簡稱為成數(shù)。■定理三辛欽定理。設隨機變量X1,X2,X3,…,Xn,…相互獨立,服從相同的分布,且具有數(shù)學期望E(Xi)=,i=1,2,..。則對于任意的正數(shù)ε有
(5.2.35)Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前58頁,總共109頁?!?.2.5大數(shù)定律與中心極限定理■中心極限定理在客觀實際中有許多隨機變量,它們是由大量的相互獨立的隨機因素的綜合影響所形成。而其中每一個個別因素,在總體中的影響作用都是很小的。這種隨機變量,往往近似地服從正態(tài)分布。它同樣由3組定理組成:定理一獨立同分布的中心極限定理。定理二Lyapunov中心極限定理。定理三DeMoivre—Laplace定理。
Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前59頁,總共109頁?!?.2.5大數(shù)定律與中心極限定理■定理一獨立同分布的中心極限定理。設隨機變量X1,X2,X3,…,Xn,…相互獨立,服從相同的分布,且具有相同的數(shù)學期望和方差,E(Xi)=,D(Xi)=2,i=1,2,..。則隨機變量(5.2.36)的分布函數(shù)Fn(x),對于任意的x滿足(5.2.37)■Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)當前60頁,總共109頁?!龆ɡ矶﨤yapunov中心極限定理。設隨機變量X1,X2,X3,…,Xn,…相互獨立,它們有數(shù)學期望和方差,E(Xi)=i,D(Xi)=i2,i=1,2,..。記(5.2.38)如果存在正數(shù),使得當n→∞時,(5.2.39)則隨機變量(5.2.40)的分布函數(shù)Fn(x),對于任意的x滿足
(5.2.41)即不論X服從什么分布,只要n→∞,隨機變量Zn將近似地服從標準正態(tài)分布。當前61頁,總共109頁。§5.2.5大數(shù)定律與中心極限定理■定理三DeMoivre—Laplace定理。設隨機變量n服從參數(shù)為n,P的二項分布,則對于任意的x,恒有(5.2.42)這個定理表明,正態(tài)分布是二項分布的極限分布。即(5.2.43)在抽樣統(tǒng)計里,n/n也叫抽樣成數(shù)。
Ch5抽樣與抽樣分布§5.2隨機變量的分布(new)返回當前62頁,總共109頁。統(tǒng)計估計的核心問題是求F(x;
)和。求F(x;
)和就必須掌握X的分布和的分布。
的分布又叫參數(shù)分布。在上一節(jié),我們了解了隨機變量X的分布。在這里了解可列的抽樣分布??闪械某闃臃植?,就是樣本的所有可能取值與相應的概率組成。F(x;)F(X;
)∴F(X;
)∵=(X)F(X)F(
)隨機變量的分布隨機變量函數(shù)的分布、參數(shù)分布、抽樣分布。n,N比較小時,可列出?!郌(
)n,N比較大時,可求出精確分布或者極限分布?!?.3抽樣分布Ch5抽樣與抽樣分布§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)當前63頁,總共109頁。樣本統(tǒng)計量的分布,統(tǒng)稱為抽樣分布。抽樣分布,就是樣本統(tǒng)計量Zn=Z(X1,X2,X3,…,Xn;
)的分布。樣本統(tǒng)計量是樣本的函數(shù),它是一隨機變量。在使用統(tǒng)計量進行統(tǒng)計推斷時,常需知道它的分布。對于任意一個給定統(tǒng)計量Zn=Z(X1,X2,X3,…,Xn;
),其分布的確定,一般有兩種情況:第一種是,當總體的分布函數(shù)已知時,Zn的分布是可精確確定的,但這種情況極少,絕大多數(shù)只能求出它們的極限分布,即樣本數(shù)目n→∞時統(tǒng)計量Zn的漸近分布;另一種是,總體的分布函數(shù)為未知時,只能求出的樣本統(tǒng)計量的極限分布。支持統(tǒng)計量極限分布的理論依據(jù),是概率函數(shù)序列中的極限定理。下面我們順序給出若干統(tǒng)計量的分布結論,并假定樣本都是簡單隨機樣本,不涉及它們的證明。§5.3抽樣分布當前64頁,總共109頁。§5.3抽樣分布§5.3.1樣本均值分布與中心極限定理§5.3.2樣本成數(shù)的分布§5.3.32分布與2階原點矩的分布
§5.3.4t分布§5.3.5樣本方差的分布與樣本標準差的分布
§5.3.6F分布與兩個樣本方差比的分布§5.3.7樣本相關系數(shù)的分布§5.3.8樣本矩的極限分布Ch5抽樣與抽樣分布§5.1隨機抽樣(new)§5.2隨機變量的分布(new)§5.3抽樣分布(new)§5.4抽樣方法與抽樣誤差(new)返回當前65頁,總共109頁。樣本平均數(shù)的分布(可列的)總體中全部樣本平均數(shù)的可能取值與相應的概率排列。重置抽樣不重置抽樣【例5-1】(p111)總體{34,38,42,46,50},=42,2=32。重置抽取2個構成樣本。求樣本平均數(shù)的分布。解:重置抽取2個構成樣本,其樣本總數(shù)為C51
C51
=25。其樣本平均數(shù)的全部可能數(shù)據(jù)為Ch5抽樣與抽樣分布§5.3抽樣分布(new)樣本變量3438424650343436384042383638404244423840424446464042444648504244464850§5.3.1樣本均值分布與中心極限定理當前66頁,總共109頁。整理數(shù)據(jù),可得樣本平均數(shù)的分布。同時得樣本平均數(shù)的期望值和樣本平均數(shù)的方差,以及樣本與總體的關系樣本平均數(shù)頻數(shù)fi頻率3411/253622/253833/254044/254255/254444/254633/254822/255011/25合計251fi343638404244464850當前67頁,總共109頁?!纠?-2】(p115)總體{34,38,42,46,50},=42,2=32。不重置抽取2個構成樣本。求樣本平均數(shù)的分布。解:不重置抽取2個構成樣本,其樣本總數(shù)為A52
=C51
C41=20。其樣本平均數(shù)的全部可能數(shù)據(jù)為Ch5抽樣與抽樣分布§5.3抽樣分布(new)樣本變量343842465034-363840423836-404244423840-444646404244-485042444648-§5.3.1樣本均值分布與中心極限定理當前68頁,總共109頁。整理數(shù)據(jù),可得樣本平均數(shù)的分布。同時得樣本平均數(shù)的期望值和樣本平均數(shù)的方差,以及樣本與總體的關系樣本平均數(shù)頻數(shù)fi頻率3622/203822/204044/204244/204444/204622/204822/20合計201fi343638404244464850當前69頁,總共109頁。當n,N比較小時,可得可列的樣本平均數(shù)的分布。但如果n,N非常大時,其樣本平均數(shù)的分布是怎樣的呢?一、精確分布:如果X~N(,2),X1,X2,X3,…,Xn是X的一個樣本,則樣本平均數(shù)其中重置抽樣不重置抽樣二、中心極限定理(極限分布):如果X的均值為,方差為2,X1,X2,X3,…,Xn是X的一個樣本,則不論X服從什么分布,只要X存在矩母函數(shù),總有(5.3.3)并且,當n≥30時,近似服從N(,2/n)。因此,亦可有返回當前70頁,總共109頁?!?.3.2樣本成數(shù)的分布Ch5抽樣與抽樣分布§5.3抽樣分布(new)返回從任一總體成數(shù)為P,方差為P·(1-P)的(0,1)分布中,抽取樣本容量為n的樣本,其樣本成數(shù)p的分布,當樣本單位數(shù)n25時,其分布為二項分布;當n
25時,其分布趨近于平均數(shù)為E(p)=P,標準差為
p的正態(tài)分布。即p~N(P,
p2)其中,當抽樣為簡單重置抽樣時,當抽樣為簡單不重置抽樣時,當前71頁,總共109頁?!?.3.32分布與2階原點矩的分布
■2分布如果X1,X2,X3,…,Xn是來自總體N(0,1)的樣本,則統(tǒng)計量
2=X12+X22+X32+…+Xn2(5.3.4)服從自由度為n的2分布,記為2~2(n)。其中,自由度是指獨立變量的個數(shù)。
2分布的概率密度為(5.3.5)f(y=2)的圖形如圖5-5所示。Ch5抽樣與抽樣分布§5.3抽樣分布(new)當前72頁,總共109頁。■2分布(續(xù))2分布的期望值和方差為E(2)=n;D(2)=2n;(5.3.6)Ch5抽樣與抽樣分布§5.3抽樣分布(new)圖5-5
2分布與上分位點f(y)y0y0f(y)2分布n=11-2(n)n=5n=152分布上分位點當前73頁,總共109頁?!?分布(續(xù))又由于,(5.3.7)于是,可知2分布也是一個特殊的分布。對于給定的正數(shù),0<<1,則滿足條件(5.3.8)的點2(n)為2(n)分布的上分位點,如圖所示。對于不同的,n,上分位點的值已制成表格,可以查用。例如,對于=0.1,n=25,查表得2(n)=34.382?!霎斍?4頁,總共109頁。統(tǒng)計學(p388)2分布表2(n)
=0.950=0.900=0.500=0.250=0.050=0.025=0.010n=10.0039320.0157910.4549361.32330413.8414555.0239036.634891n=20.1025860.2107211.3862932.77259045.9914767.3777799.210351n=103.9402954.8651789.34181612.54885818.3070320.483223.20929n=157.2609358.54675314.3388518.24508424.995827.4883630.57795n=2010.850812.442619.3374323.82768931.4104234.1695837.56627n=2514.611416.4734124.3365829.33884637.6524940.646544.31401n=3018.4926720.5992429.3360234.79973543.7729546.9792250.89218n=4026.509329.0505239.3353445.61600655.7584959.3416863.69077n=50n=100n=當前75頁,總共109頁?!?.3.32分布與2階原點矩的分布
■2階原點矩的分布如果X1,X2,X3,…,Xn是來自總體N(0,1)的樣本,定義統(tǒng)計量
2=X12+X22+X32+…+Xn2.A2=2/n=(X12+X22+X32+…+Xn2)/n.因為2~2(n),所以
2/n
=A2~(n/2,n/2)。(5.3.9)于是,2階原點矩的分布的期望值和方差為E(A2)=1;D(A2)=2/n;(5.3.10)顯然,2階原點矩的抽樣平均誤差,是一個與抽樣數(shù)目n有關的數(shù)。但如果X1,X2,X3,…,Xn是來自總體N(0,2)的樣本,則
2~(n/2,1/22).;A2
~(n/2,n/22).(5.3.11)于是有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- HO-PEG3-CH2-6-Cl-生命科學試劑-MCE-6427
- CP-LC-0743-生命科學試劑-MCE-6886
- 5-Hydroxy-9-S-hexahydrocannabinol-生命科學試劑-MCE-2639
- 二零二五年度互聯(lián)網(wǎng)醫(yī)療企業(yè)股權并購協(xié)議
- 二零二五年度白酒新品全國市場推廣與銷售代理協(xié)議
- 2025年度二零二五年度終止股權轉讓終止協(xié)議
- 二零二五年度終止體育賽事組織勞務終止合同
- 二零二五年度蔬菜大棚租賃與農(nóng)業(yè)循環(huán)經(jīng)濟合作協(xié)議
- 施工現(xiàn)場施工防生物戰(zhàn)爭威脅制度
- 施工圍蔽項目特征描述
- 沈陽市第一屆“舒心傳技 莘紳向陽”職業(yè)技能大賽技術工作文件-27-全媒體運營師
- 安全生產(chǎn)網(wǎng)格員培訓
- 統(tǒng)編版語文三年級下冊第三單元綜合性學習中華傳統(tǒng)節(jié)日 活動設計
- 降低順產(chǎn)產(chǎn)婦產(chǎn)后2小時失血率PDCA成果匯報書
- 小學數(shù)學分數(shù)四則混合運算300題帶答案
- 林下野雞養(yǎng)殖建設項目可行性研究報告
- 心肺復蘇術課件2024新版
- 苜蓿青貯料質量分級DB41-T 1906-2019
- 新鮮牛肉購銷合同模板
- 2024年內(nèi)蒙古呼和浩特市中考文科綜合試題卷(含答案)
- 大型商場招商招租方案(2篇)
評論
0/150
提交評論