理論分布和抽樣分布_第1頁
理論分布和抽樣分布_第2頁
理論分布和抽樣分布_第3頁
理論分布和抽樣分布_第4頁
理論分布和抽樣分布_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章 理論分布和抽樣分布本章的二項式分布和正態(tài)分布在數(shù)學上已講過,在本書中不作為重點內(nèi)容。 自學內(nèi)容:1、 事件:事件的概念、事件間的關(guān)系、事件的運算2、 概率:概率的概念、計算概率的法則3、 二項式分布:二項總體及二項式分布、二項式分布的概率計算方法、二項式分布的形狀和參數(shù)。4、 正態(tài)分布:正態(tài)分布的意義、正態(tài)分布曲線的特征、標準化正態(tài)分布、正態(tài)分布的概率計算。第一節(jié) 概率一、事件及其類型事物發(fā)生某種情況或?qū)嶒炛蝎@得的某種結(jié)果稱為某一事件必然事件(U)在一定條件下必然會出現(xiàn)的不可能事件(V)在一定條件下必然不會出現(xiàn)的隨機事件(A)在一定條件下必然可能出現(xiàn)也可能不出現(xiàn)事件關(guān)系:a 事件和:至

2、少發(fā)生一個事件。 b 事件積:同時發(fā)生事件。c 事件差:A發(fā)生而B不發(fā)生。d 互不相容事件: 不能同時發(fā)生的事件關(guān)系,如一胎生1只和生2只豬。e 對立事件: 嚴格的不相容事件,是一種非此即彼的事件關(guān)系。如男和女,生和死,A和非A。f 獨立事件: 互不影響發(fā)生的事件關(guān)系,如張三生男孩和李四生女孩。二、頻率與概率A正面向上aA出現(xiàn)的次數(shù)n總次數(shù)a/nA出現(xiàn)的頻率P(A)A的概率,若實驗或觀察的次數(shù)n無限大,則A發(fā)生的頻率a/n必穩(wěn)定以某一定值p為中心上下做微小的擺動,那么這個p就稱為隨機事件A的概率 三、“小概率事件實際不可能”原理小概率事件如果一個事件的概率小于一個很小的數(shù)值,如5%或

3、者1%,則稱其為小概率事件。小概率事件不可能原理小概率事件在一次試驗中,實際上可以認為不可能發(fā)生。 四、概率的計算法則(一)加法定理P(A+B)=P(A)+P(B),A與B是互斥事件。(二)乘法定理P(AB)=P(A)P(B),A與B是相互獨立的。五、隨 機 變 量 隨機變量:是指從隨機變數(shù)中所取得的某一實數(shù)值。 隨機變量:可分為離散型隨機變量和連續(xù)型隨機變量離散型隨機變量:試驗只有幾個確定的結(jié)果,并可一一列出,變量y的取值可用實數(shù)表示,且y取某一值時,其概率是確定的,這種類型的變量稱為離散型隨機變量。將這種變量所有可能取值及其對應概率一一列出所形成的分布稱離散型隨機變量的概率分布,

4、也可用函數(shù)f(y)表示,稱為概率函數(shù)。連續(xù)型隨機變量:變量y的取值僅是一個范圍,且y在該范圍內(nèi)取值時,其概率是確定的。這時取y為一固定值是無意義的,因為在連續(xù)尺度上一點的概率幾乎為0。這種類型的變量稱為連續(xù)型隨機變量。第二節(jié) 二項式分布一、二項總體及二項式分布1、 二項總體(binary population):由非此即彼的對立事件構(gòu)成的總體。例如:小麥種子發(fā)芽和不發(fā)芽,硬幣的正面與反面,調(diào)查棉田盲椿象為害分為受害株和不受害株等等。這類變數(shù)均屬間斷性隨機變數(shù)。為便于研究,通常將二項總體中的“此”事件以變量“1”表示,具概率p;將“彼”事件以變量“0”表示,具概率q。因而二項總體又稱為0、1總體

5、,其概率則顯然有:p+q=1或q=1-p2、 二項分布:從二項總體抽取n個個體,將有n+1種取值,這n+1種取值各有其概率,這些概率構(gòu)成的分布就是二項分布。例如觀察施用某種農(nóng)藥后供試5只蚜蟲的死亡數(shù)目,記“死”為0,記“活”為1,觀察結(jié)果將出現(xiàn)6種事件,它們是5只全死、4死1活、3死2活、2死2活、1死4活、5只全活、這6種事件構(gòu)成了一個完全事件系,但6個事件的概率不同,將完全事件系的總概率1分布到6個事件中去,就是所謂的概率分布。如果將活的蟲數(shù)y來代表相應的事件,便得到了關(guān)于變量y的概率分布。下面將給出二項分布的概率計算方法。二、二項式分布的概率計算方法數(shù)學上的組合公式為:n相當于抽樣單位數(shù)

6、,y相當于某種事件發(fā)生的次數(shù)。因此y的概率函數(shù)為:p(y)變量y發(fā)生的概率,p為此事件發(fā)生的概率,q為彼事件發(fā)生概率例4.1棉田盲椿象為害的統(tǒng)計概率乃從調(diào)查2000株后獲得近似值p=0.35?,F(xiàn)受害株事件為A,其概率為p=0.35,未受害株事件為對立事件,其概率q=(1-0.35)=0.65。這一試驗是可以重復的。假定做了n次試驗,即抽出n株為一個抽樣單位,那么,試問出現(xiàn)有y株是受害的,其概率應有多少?假定n=1,即抽出一株為一個抽樣單位,那么,總體2000個單位中有多少株受害?多少株未受害?這里已知P(A)=0.35和P(A)=0.65,總體的理論次數(shù)分布則以n乘上述概率分布,即np和n(1

7、-p),所以有2000×0.35=700株受害和2000×0.65=1300株未受害。如調(diào)查5株為一個抽樣單位,即n=5,則受害株數(shù)y=0,1,2,3,4和5的概率可以計算出來,如表4.2。棉株受害數(shù)乃一隨機變數(shù)(y) ,可以計算變量y相應的概率函數(shù)P(y=i)=Cinpiqn-i和累計函數(shù)如果每次抽5個單株,抽n=400次,則理論上我們能夠得到y(tǒng)=2的次數(shù)應為:理論次數(shù)=400×P(2)=400×0.3364=134.56(次)對于任意y,其理論次數(shù)為:理論次數(shù)=Np(y)三、二項式分布的形狀和參數(shù)1、形狀:如果p=q,二項式分布呈對稱形狀,如果p&#

8、185;q,則表現(xiàn)為偏斜形狀,但當n很大時,即使p¹q,它也呈接近對稱形狀。2、參數(shù):凡描述一個總體分布,平均數(shù)和方差(或標準差)兩個參數(shù)是重要的。例如抽取5株中受害標數(shù)的多少(y)作為統(tǒng)計指標的話,從總體中可以抽取的所有樣本均有一個y, 這樣所有的y構(gòu)成了一個新總體,該總體也屬于二項式總體,其平均數(shù)、方差2和標準差如下式=np, 2=npq, 該總體的概率計算方法同于前述的二項式總體,只是由于統(tǒng)計指標的變化,使平均數(shù)和標準差有所不同。第三節(jié) 正態(tài)分布(normal distribution)一、 正態(tài)分布的意義:正態(tài)分布是一種連續(xù)性隨機變量的理論分布,它的分布狀態(tài)是多數(shù)變量都圍繞在

9、平均值附近,從平均值到分布的兩側(cè),變量數(shù)減少。在理論和實踐問題上都具有非常重要意義??陀^世界中有許多現(xiàn)象的數(shù)據(jù)是服從正態(tài)分布的,因此我們可通過這些現(xiàn)象的樣本分布從而發(fā)現(xiàn)這些現(xiàn)象的理論分布。在適當條件下,它可用來做二項分布及其它間斷性或連續(xù)性變數(shù)分布的近似分布,這樣就能用正態(tài)分布代替其它分布以計算概率和進行統(tǒng)計推論。雖然有些總體并不做正態(tài)分布,但從總體中抽出的樣本平均數(shù)及其它一些統(tǒng)計數(shù)的分布,在樣本容量適當大時仍然趨近正態(tài)分布,因此可用它來研究這些統(tǒng)計數(shù)的抽樣分布。二、正態(tài)分布正態(tài)分布是二項分布的極限分布,正態(tài)分布的概率密度函數(shù)為: y是所研究的變數(shù);fN(y)是某一定值y出現(xiàn)的函數(shù),一般稱概率

10、密度函數(shù);=3.1419;e=2.71828;為總體平均數(shù);為總體標準差。這里y是從負無窮大到正無窮大的數(shù)值區(qū)間中的一個點,討論變量處在這個點的概率是沒有意義的,而且從正態(tài)總體抽取的變數(shù)資料的每一個觀察值均是從具有一定概率的數(shù)值區(qū)間中抽取的,所以討論正態(tài)變數(shù)在某一取值區(qū)間的概率才有意義。 因為不同總體具不同的值和值,因此每個總體就對應的一條正態(tài)曲線,這樣我們研究某一變量所處的概率區(qū)間時就很不方便,為簡化計算,一般以一個新變數(shù)u替代y變數(shù) 這里參數(shù)=0,2=1記作N(0,1)。各種不同平均數(shù)和標準差的正態(tài)分布均可以經(jīng)過適當轉(zhuǎn)換用標準化分布表示出來。二、正態(tài)分布曲線的特性1、正態(tài)分布曲線是一個對稱

11、曲線,以為對稱軸,相左右兩側(cè)對稱分布。2、正態(tài)分布曲線以參數(shù)和的不同而表現(xiàn)為一系列曲線,所以它是一個曲線簇而不僅是一個曲線。3、正態(tài)分布在資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中于算術(shù)平均數(shù)附近,離相應的次數(shù)越少;且在左右相等y-范圍內(nèi)具有相等次數(shù);在y-3以上其次數(shù)極少。4、正態(tài)曲線在y-=1處有“拐點”。曲線兩尾向左右伸展,永不接觸橫軸,所以當y±,分布曲線以y 軸為漸近線,因之曲線全距從-到+。5、正態(tài)曲線與橫軸之間的總面積等于1任兩個變量u值之間概率結(jié)果均可通過查附表2計算得出,下面為幾對常見的區(qū)間與其相對應的面積或概率的數(shù)字:區(qū)間±1 面積或概率=0.6827±

12、2 =0.9545±3 =0.9973±1.960 =0.9500±2.57 =0.9900 三、正態(tài)分布區(qū)間概率的計算方法1、 首先將變量y值轉(zhuǎn)化成u值2、 查附表即可得出相應的區(qū)間概率下面我們以一個例題來說明求解方法假定y是一隨機變數(shù)具有正態(tài)分布,平均數(shù)=30,標準差=5,試計算小于26,小于40的概率。介乎26和40區(qū)間的概率以及大于40的概率。首先計算:P(y26)=FN(26)計算FN(26)必須先將y轉(zhuǎn)換為u值。查附表2,當u=-0.8時,F(xiàn)N(26)=0.2119,說明這一分布從-到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說,y26概率為0

13、.2119.同樣計算:P(y40)=FN(40)查附表2,當U=+0.2JF ,F(xiàn)N(40)=0.9773,這是指從-到40范圍內(nèi)的變量數(shù)占全部變量數(shù)的97.73%,或者說y40概率為 0.9773。計算:P(26y40=Fn(40)-FN(26)=0.9773-0.2119=0.7654,或者寫為(26y40=P(-0.8u2.0)=0.9773-0.2119-0.7654.計算:P(y40)=1-P(y40)=1-0.9773=0.0227第四節(jié) 抽樣分布(sampling distribution)生物統(tǒng)計學是研究樣本與總體之間關(guān)系的科學。其方法是從總體中抽取一個含有若干個個體的樣本加以

14、研究,這樣的樣本可以連續(xù)抽取幾次,抽取樣本的單位數(shù)就是試驗的重復次數(shù)。本節(jié)重要內(nèi)容是討論衍生總體的參數(shù)與母總體參數(shù)之間的關(guān)系。 N() 體總樣 本3樣 本1樣 本2總體與樣本之間的關(guān)系可以從兩方面進行研究統(tǒng)計推斷抽 樣總體 樣本從總體到樣本:即從一般到特殊的方向,目的是了解總體到樣本的變異特點,研究樣本分布的形狀及其統(tǒng)計數(shù)。從樣本到總體:即從特殊到一般的方向,目的是用樣本的試驗結(jié)果去推斷總體的特征數(shù),也就是統(tǒng)計推斷問題。一、統(tǒng)計數(shù)的抽樣及其分布參數(shù)抽樣分布:從總體中隨機抽樣得到樣本,獲得樣本觀察值后可以計算一些統(tǒng)計數(shù),統(tǒng)計數(shù)的分布稱為抽樣分布。抽樣分為復置抽樣和不復置抽樣,前者指將抽得的個體放

15、回總體后再繼續(xù)抽樣的方法,后者指將抽得的個體不放回總體而繼續(xù)進行抽樣的方法。討論抽樣分布時考慮的是復置抽樣方法。一)樣本平均數(shù)的抽樣及其分布參數(shù)從一個總體里以一定的樣本容量進行隨機抽樣,可以抽取許多個樣本,如果總體容量為N,樣本容量為n則能抽取Nn個樣本,求出所抽樣本的平均數(shù),那么所有樣本的平均數(shù)就組成了一個新的總體,這個新的總體稱為衍生總體,被抽總體稱為母總體。下面我們以一個實例講解衍生總體的參數(shù)與母總體的參數(shù)之間的關(guān)系。樣本平均數(shù)衍生總體的平均數(shù)用表示,方差用表示,標準差用表示。例:現(xiàn)有一總體,觀察值為2、4、6,分別以樣本容量n=1,n=2,n=3,從總體中進行復置抽樣,試分析衍生總體參

16、數(shù)與母總體參數(shù)之間的關(guān)系。首先我們計算母總體的參數(shù)從母總體中以樣本容量n=1進行抽樣: 從母總體中以樣本容量n=2進行抽樣:得到樣本9個:2,2 4,2 4,22,4 4,4 4,42,6 4,6 4,6 f2 13 24 35 26 1 從母總體中以樣本容量n=3進行抽樣:得到樣本27個:2: 2,2,2 8/3: 2,4,2 2,2,4 4,2,210/3: 2,6,2 2,2,6 6,2,2 4,4,2 4,2,4 2,4,44: 2,4,6 2,6,4 4,2,6 4,6,2 6,2,4 6,4,2 4,4,4 14/3: 6,4,4 4,6,4 4,4,6 6,6,2 6,2,6 2

17、,6,2 16/3: 6,4,6 6,6,4 4,6,6 6:6,6,6 從上我們可以看出,衍生總體的平均數(shù)和方差與母總體的平均數(shù)和方差有如下關(guān)系: 由于總體的平均數(shù)和方差往往是未知的,因此我們一般用樣本的平均數(shù)和方差來作為總體平均數(shù)和方差的估計值,因此可進一步推出: (二)兩個獨立隨機樣本平均數(shù)差數(shù)的抽樣及其分布參數(shù)如果從一個總體隨機地抽取一個樣本容量為n1,同時隨機獨立地從另一個總體抽取一個樣本容量為n2的樣本,那么可以得到分別屬于兩個總體的樣本,這兩個樣本的平均數(shù)作和表示。設(shè)這兩個樣本所來自的兩個總體的平均數(shù)分別為1和2,它們的方差分別為。和22。兩個獨立隨機抽取的樣本平均數(shù)間差數(shù)()的

18、抽樣分布參數(shù)與兩個母總體間存在如下關(guān)系:(1) 該抽樣分布的平均數(shù)y1-y2與母總體的平均數(shù)之差相等。 (2) 該抽樣分布的方差y12-y2與母總體方差的關(guān)系為 二、正態(tài)總體抽樣的分布規(guī)律 前面介紹了統(tǒng)計數(shù)抽樣分布的主要特征及其和母總體特征數(shù)間的關(guān)系,以下將討論統(tǒng)計數(shù)抽樣分布的規(guī)律。一)樣本平均數(shù)的分布定理1:若母總體呈正態(tài)分布,從母總體中抽出的樣本,不論其樣本容量大小,由樣本平均數(shù)構(gòu)成的衍生總體,也呈正態(tài)分布。定理2:中心極限定理:母總體的分布不呈正態(tài)分布,但只要樣本容量足夠大(n>30),樣本平均數(shù)的分布也趨近于正態(tài)分布。作用:這個定理很重要,因為我們往往不清楚抽樣總體的性質(zhì),有了這個定理,就可通過增大樣本容量的方法,使衍生總體呈正態(tài)分布,從而可以利用以正態(tài)分布為前題的統(tǒng)計方法進行抽樣估計或假設(shè)測驗,使問題簡化。如已知 求=10-16的概率?首先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論