版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計學(xué)基礎(chǔ)知識詳解演示文稿當(dāng)前1頁,總共76頁。(優(yōu)選)統(tǒng)計學(xué)基礎(chǔ)知識當(dāng)前2頁,總共76頁。
為了能可靠地從樣本來估計總體,要求樣本必須能夠代表總體,才能正確估計總體。只有從總體中隨機(jī)抽取的樣本才具有代表性。
隨機(jī)抽取的樣本——是指總體中的每一個個體都有同等的機(jī)會被抽取組成樣本。(等可能性)
總體中所包含的每個總體單元都是相互獨立、相互無依存關(guān)系,被抽取的每個個體必須具有偶然性,這是隨機(jī)抽樣應(yīng)遵守的基本原理。第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念當(dāng)前3頁,總共76頁。樣本中所包含的個體數(shù)目叫樣本容量或大小(samplesize),常記為n。小樣本:
n≤30的樣本;大樣本:
n>30的樣本?!魟澐执髽颖竞托颖臼潜匾?,因為二者的統(tǒng)計方法不同。
研究的目的是要了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念當(dāng)前4頁,總共76頁。二、隨機(jī)變量第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念
按變量的性質(zhì)不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級)資料(一)數(shù)量性狀資料(quantitativetrait)數(shù)量性狀——是指測試、調(diào)查的對象具有可度量或計數(shù)的性質(zhì),觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量狀資料。
連續(xù)型變量——又稱計量資料,能用量測手段直接測定。
離散型變量(不連續(xù)性或間斷性)——若某變量各變量之間只能以整數(shù)斷開而不能表現(xiàn)為小數(shù)的。它只能用計數(shù)的方法取得。當(dāng)前5頁,總共76頁。(二)質(zhì)量性狀資糧質(zhì)量性狀——是指能觀察到而不能之間測量的性狀。
如葉片的顏色,麥芒的有無等;污染水體的顏色、污染物的氣味等。賦值法——統(tǒng)計分析。第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念(三)半定量或等級資料半定量或等級資料——是指觀察單位按所考察的性狀或指標(biāo)的等級順序分組,然后清點各組觀察單位的次數(shù)而得到的資料。當(dāng)前6頁,總共76頁。三、參數(shù)與統(tǒng)計數(shù)第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念
在同質(zhì)性的前提下,總體具有變異性和大量性的特性。用于反映總體內(nèi)部個體間的變異程度或集中性趨勢等特征的指標(biāo)為總體參數(shù),簡稱參數(shù)。常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ2表示總體方差;參數(shù)是反映某類事物的總體規(guī)律的數(shù)值,科研上目的就在于求得對總體參數(shù)的了解,總體參數(shù)是常數(shù),但不易獲得。
利用樣本資料計算得到的用于描述樣本內(nèi)部個體間的變異程度或集中趨勢等特征的一些指標(biāo),如樣本的平均數(shù)x、樣本的標(biāo)準(zhǔn)差S等成為樣本統(tǒng)計數(shù),簡稱統(tǒng)計數(shù),它是總體參數(shù)的估計值。當(dāng)前7頁,總共76頁。四、誤差與錯誤(一)誤差系統(tǒng)誤差:由某種確定的原因所引起的誤差。特點是在相同條件下重復(fù)測定時,可重復(fù)出現(xiàn)。是可以測定并校正或消除的。來源:(1)方法誤差;(2)儀器誤差;(3)試劑誤差;(4)操作誤差;(5)環(huán)境條件的變化誤差。偶然誤差:是由很多不可避免且無法控制的偶然因素引起的誤差。產(chǎn)生的原因不確定,其誤差大小無規(guī)律性,不具“單向性”和“重現(xiàn)性”。偶然誤差雖不可避免,也不能校正,但若在同樣條件下對同一試樣進(jìn)行多次測定,就會發(fā)現(xiàn)隨機(jī)誤差的出現(xiàn)是服從統(tǒng)計規(guī)律的??梢岳脭?shù)理統(tǒng)計方法對試驗數(shù)據(jù)進(jìn)行分析處理,增加重復(fù)次數(shù)。第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念當(dāng)前8頁,總共76頁。四、誤差與錯誤(二)錯誤由于工作人員的粗心大意或不負(fù)責(zé)任(如儀器使用不當(dāng),錯讀數(shù)據(jù),記錄不準(zhǔn),任意涂改,憑空杜撰等)所產(chǎn)生的測定值與真值的偏差,稱為錯誤?!?/p>
錯誤不是統(tǒng)計學(xué)的研究內(nèi)容◆在試驗和調(diào)查中,錯誤應(yīng)當(dāng)、同時也可以加以消滅第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念當(dāng)前9頁,總共76頁。五、準(zhǔn)確性與精確性準(zhǔn)確性——是指觀測對象的觀察值與其真值的偏離程度,偏離越小則試驗越準(zhǔn)確。精確性——是指同一觀測對象的重復(fù)觀察值之間的彼些相符程度,即試驗誤差的大小,誤差越小則試驗越精確。在統(tǒng)計工作中,常用樣本的統(tǒng)計數(shù)來估計總體參數(shù)。因此,我們用統(tǒng)計數(shù)接近參數(shù)的程度來衡量統(tǒng)計數(shù)的準(zhǔn)確性高低,而用統(tǒng)計數(shù)的變異程度來衡量統(tǒng)計數(shù)的精確性高低??梢?,準(zhǔn)確性與精確性是不同的概念。在一般試驗中真值為未知數(shù),所以試驗的準(zhǔn)確性難以確定。精確性一般是指試驗誤差,是可以估計的。如何正確估計試驗誤差,并減小試驗誤差以提高試驗精度是試驗方法設(shè)計的主要內(nèi)容。第二章統(tǒng)計學(xué)基礎(chǔ)知識第一節(jié)基本概念當(dāng)前10頁,總共76頁。一、隨機(jī)現(xiàn)象與隨機(jī)事件(一)確定性現(xiàn)象與隨機(jī)現(xiàn)象根據(jù)客觀現(xiàn)象的特征,一般將其分為兩類:一類是在一定條件下必然出現(xiàn)(或不出現(xiàn))某種結(jié)果的現(xiàn)象,稱之為確定性現(xiàn)象。另一類現(xiàn)象是在一定條件下具有多種可能過結(jié)果,具體出現(xiàn)哪一種結(jié)果事先是不能確定的,這種在給定條件下不能確定哪一種結(jié)果會出現(xiàn)的現(xiàn)象,稱之為隨機(jī)現(xiàn)象。隨機(jī)現(xiàn)象是概率論中的主要研究對象。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前11頁,總共76頁。對隨機(jī)現(xiàn)象進(jìn)行觀測稱作隨機(jī)試驗。隨機(jī)試驗應(yīng)具下列有三個特性:可重復(fù)性:即可以在相同的條件下重復(fù)進(jìn)行試驗;非唯一性:即每次試驗的可能結(jié)果不止一個,并且事先能明確試驗的所有可能結(jié)果;隨機(jī)性:即進(jìn)行一次試驗之前,不能確定哪一個結(jié)果會出現(xiàn)。隨機(jī)試驗的每一種結(jié)果或隨機(jī)現(xiàn)象的每一種表現(xiàn)稱作隨機(jī)事件,簡稱為事件。一般用字母A,B,C,……(必要時加下標(biāo))表示事件。有時也可用{……}表示事件,括號中寫明事件的內(nèi)容。
第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)(二)隨機(jī)試驗與隨機(jī)事件當(dāng)前12頁,總共76頁。二、概率的概念及其計算對于一個隨機(jī)事件來說,它在一次試驗中,可能發(fā)生,也可能不發(fā)生。既然是可能性,就有可能性的大小問題。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)(一)概率的概念在相同條件下,重復(fù)進(jìn)行統(tǒng)一隨機(jī)試驗,A是這個試驗的一個結(jié)果(事件)。設(shè)試驗的次數(shù)為n,在n次重復(fù)試驗中A出現(xiàn)的次數(shù)為m,則事件A的頻率為:當(dāng)前13頁,總共76頁。二、概率的概念及其計算(一)概率的概念當(dāng)試驗次數(shù)n較小時,頻率的數(shù)值有較大的波動;當(dāng)n充分大時,頻率數(shù)值的波動明顯減小,并且隨著n的增大會趨于穩(wěn)定在某個常數(shù)P。通過大量觀測可以發(fā)現(xiàn),隨機(jī)試驗的頻率具有隨試驗次數(shù)增加而趨向穩(wěn)定的性質(zhì),而頻率的穩(wěn)定值可以用來反映事件發(fā)生的可能性的大小。因此,可以說頻率的穩(wěn)定值P是隨機(jī)事件A的概率。即第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前14頁,總共76頁。二、概率的概念及其計算設(shè)事件A的概率為P(A),它則具有如下性質(zhì):非負(fù)性,即0≤P(A)≤1規(guī)范性,即P(Ω)=1(必然事件)
P(Φ)=0(不可能事件)對于兩兩互不相容事件Ai(i=1,2,…),則有(二)概率的性質(zhì)第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前15頁,總共76頁。小概率事件:隨機(jī)事件的概率很小。例如小于0.05、0.01、0.001,這樣的時間被稱為小概率事件。小概率原理:把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率事件實際不可能性原理是統(tǒng)計學(xué)上進(jìn)行假設(shè)檢驗(顯著性檢驗)的基本依據(jù)。(二)概率的性質(zhì)二、概率的概念及其計算第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前16頁,總共76頁。例1:袋中盛有除顏色外其他完全相同的50個不同顏色的小球,其中有10個白球,充分混勻后隨意摸出一球。求所摸為白球的概率。(三)概率的計算1、古典型概率
——如果一項隨機(jī)試驗的全部基本事件總數(shù)有限,并且各基本事件出現(xiàn)的可能性都相同,事件A由若干基本事件所組成,則A的概率可用下式計算第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前17頁,總共76頁。2、概率的加法公式(1)任意事件加法公式任意兩個事件和(并)的概率,等于兩事件概率的和再減去兩事件同時發(fā)生的概率。即P(A+B)=P(A)+P(B)-P(AB)(2)互斥事件的加法公式兩個互斥事件A與B之和的概率,等于這兩個事件的概率之和。即P(A+B)=P(A)+P(B)(三)概率的計算第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前18頁,總共76頁。3、條件概率和乘法公式在實際問題中,除了要知道事件A發(fā)生概率外,有時還需要知道在“事件B已發(fā)生”的條件下,事件A發(fā)生的概率,這種概率成為條件概率,記作P(A︱B)。(三)概率的計算例2:在某廠一天兩個班次生產(chǎn)的350件產(chǎn)品中,第一班生產(chǎn)200件,含次品9件;第二班生產(chǎn)150件,含次品4件?,F(xiàn)隨機(jī)抽出一件產(chǎn)品,發(fā)現(xiàn)它是次品。問這件產(chǎn)品出自第一班的概率是多少?第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前19頁,總共76頁。把上式的分子、分母同時除以350,得這里AB={所抽產(chǎn)品是第一班生產(chǎn)的次品}。解:記A={所抽產(chǎn)品是第一班生產(chǎn)的},B={所抽產(chǎn)品是次品}。顯然有但在已知事件B發(fā)生的條件下,A發(fā)生的概率就不同了,可以直觀的寫出條件概率為:把第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前20頁,總共76頁。由這個定義,可得到概率的乘法公式:設(shè)A與B是任意兩個事件,且P(A)>0,P(B)>0,則P(AB)=P(B)P(A︱B)P(AB)=P(A)P(B︱A)■這就導(dǎo)出了條件概率下列一般定義:設(shè)A,B是任意兩個事件,且P(B)>0,則稱為“在事件B發(fā)生的條件下,事件A發(fā)生的條件概率”,簡稱“A關(guān)于B的條件概率”。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前21頁,總共76頁。例3:設(shè)一批產(chǎn)品共N件,其中有M件次品,不放回地抽取2件,求事件{第一件抽到的是正品,第二件抽到的是次品}的概率。解:記A={第一件是正品},B={第二件是次品},所求事件為AB。根據(jù)乘法公式,有P(AB)=P(A)P(B︱A)
=第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前22頁,總共76頁。4、全概率公式當(dāng)計算比較復(fù)雜事件的概率時,如果可以把它分解成互不相容的一些簡單事件,就可以用全概率公式計算其概率。
全概率公式表述如下:設(shè)B1,B2,…,Bn為n個互不相容事件,且P(Bi)>0(i=1,2,…,n)。則任一事件A的概率為:第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前23頁,總共76頁。例4:有3個工人被指定制作一批產(chǎn)品。第一個人制作這批產(chǎn)品的40%,第二個人制作35%,第三個人制作25%。第一個人廢品率為0.04,第二個人廢品率為0.06,第三個人廢品率為0.03。現(xiàn)隨機(jī)抽取一件產(chǎn)品,問這件產(chǎn)品為廢品的概率是多少?解:記A={抽出的一件產(chǎn)品是次品},
Bi
={抽出的產(chǎn)品是第i個工人制作的},(i=1,2,3)。顯然,B1+B2+B3=Ω,且B1,B2,B3兩兩互不相容。所以可以用全概率公式算出所抽一件是廢品的概率。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前24頁,總共76頁。5、貝葉斯公式
由全概率公式可導(dǎo)出另一個重要公式——貝葉斯公式,它是由英國數(shù)學(xué)家貝葉斯(BayesThomas)在1763年發(fā)表的,其陳述如下:設(shè)B1,B2,…,Bn為n個互不相容事件,且P(Bi)>0(i=1,2,…,n)。A是任一事件,且P(A)>0。則對任一Bi(i=1,2,…,n),有第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前25頁,總共76頁。例5:在例4中,若隨機(jī)抽出的一件產(chǎn)品為廢品,那么,這件產(chǎn)品由第一個、第二個、第三個工人所制作的概率各是多少?解:
第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前26頁,總共76頁。貝葉斯公式的意義在于:設(shè)事件A已發(fā)生,我們需要判斷引起A發(fā)生的“原因”。如果已知A發(fā)生的可能“原因”共有n個:B1,B2,?,Bn且兩兩互不相容。那么我們希望知道其中某個“Bi”的概率,也就是條件概率P(Bi/A)
。在實際應(yīng)用中,我們往往要求出每一個P(Bi/A)(i=1,2,?,n),然后找出其中最大的一個P(Bi/A),則Bi就是引起事件A發(fā)生的最可能的“原因”。貝葉斯公式在“風(fēng)險決策”、“模式識別”等中有著廣泛的應(yīng)用。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前27頁,總共76頁。6、事件的獨立性對于兩個事件A和B,假若事件B的發(fā)生會對事件A發(fā)生的概率產(chǎn)生影響,即P(A︱B)≠P(A),稱事件A與B之間統(tǒng)計相依。假若事件B的發(fā)生并不影響事件A發(fā)生的概率,稱事件A與B之間統(tǒng)計獨立?!鲈谑录嗀與B獨立時,顯然有P(A︱B)=P(A),這時,乘法公式成為:
P(AB)=P(B)P(A︱B))=P(A)P(B)通常把這個關(guān)系式作為事件獨立性的定義。即設(shè)A與B是任意兩個事件,如果滿足
P(AB)=P(A)P(B)
則稱事件A與B獨立,否則稱事件A與B相依。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前28頁,總共76頁。(一)隨機(jī)變量的概率分布隨機(jī)變量的概率——隨機(jī)變量的一切可能值的集合(值域)及其相應(yīng)的概率。在隨機(jī)試驗中,隨機(jī)變量的各種取值是由一定的概率規(guī)律的,這種規(guī)律就是隨機(jī)變量的概率分布。隨機(jī)變量有離散型隨機(jī)變量和連續(xù)型隨機(jī)變量兩類,因而,其概率分布也也分為離散型概率分布和連續(xù)型概率分布。三、隨機(jī)變量的概率分布第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前29頁,總共76頁。離散型隨機(jī)變量x的每一個可能取值xi和隨機(jī)變量取該值的概率p(xi)之間所確立的對應(yīng)關(guān)系稱作這個離散型隨機(jī)變量的概率分布。這里x通過點數(shù)取得,其取值是離散的。P(x=xi)=pi(i=1,2,3,…)稱作離散型隨機(jī)變量x的概率分布或概率函數(shù)。三、隨機(jī)變量及其概率分布(二)離散型隨機(jī)變量的概率分布概率分布的性質(zhì)第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前30頁,總共76頁。離散型隨機(jī)變量的分布律也可表示為第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前31頁,總共76頁。連續(xù)型隨機(jī)變量其概率用概率分布密度函數(shù)來確定。即經(jīng)測度取得的數(shù)值分布于某一數(shù)值區(qū)間,無法一一列舉,只能列出隨機(jī)變量的取值區(qū)間及其相應(yīng)概率,或列出隨機(jī)變量取值小于某一值的累積概率;連續(xù)型隨機(jī)變量的概率分布可以用對應(yīng)于一定區(qū)間的函數(shù)曲線下的面積來表示概率。對應(yīng)于一連續(xù)型隨機(jī)變量的整個取值區(qū)間,函數(shù)曲線下的面積設(shè)為1,該區(qū)建制內(nèi)的某段對應(yīng)的函數(shù)曲線下的面積為大于0且小于1的一個數(shù)值。(三)連續(xù)型隨機(jī)變量的概率分布第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)當(dāng)前32頁,總共76頁。概率分布的性質(zhì)分布密度函數(shù)綜述大于或等于0,即f(x)≥0當(dāng)隨機(jī)變量取某一特定值時,其概率等于0;即在一次試驗中,隨機(jī)變量的取值必在-∞<x<+∞范圍內(nèi),為一必然事件。所以上式表示分布密度曲線下、橫軸上的全部面積為1。第二章統(tǒng)計學(xué)基礎(chǔ)知識第二節(jié)概率基礎(chǔ)(三)連續(xù)型隨機(jī)變量的概率分布當(dāng)前33頁,總共76頁。1、正態(tài)分布的重要性⑶正態(tài)分布可以作為許多分布的近似分布.⑴正態(tài)分布是自然界及工程技術(shù)中最常見的分布之一,大量的隨機(jī)現(xiàn)象都是服從或近似服從正態(tài)分布的。可以證明,如果一個隨機(jī)指標(biāo)受到諸多因素的影響,但其中任何一個因素都不起決定性作用,則該隨機(jī)指標(biāo)一定服從或近似服從正態(tài)分布.⑵正態(tài)分布有許多良好的性質(zhì),這些性質(zhì)是其它許多分布所不具備的.一、正態(tài)分布第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前34頁,總共76頁。2、正態(tài)分布的定義
正態(tài)分布又稱高斯(Gauss)分布,是一種連續(xù)型隨機(jī)變量的概率分布,應(yīng)用非常廣泛。它的分布狀態(tài)是多數(shù)變量都圍繞在均值左右,由均值到分布的兩側(cè),變量數(shù)減少。一、正態(tài)分布第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前35頁,總共76頁。正態(tài)分布的概率密度函數(shù)為:則稱隨機(jī)變量x服從參數(shù)μ,σ2的正態(tài)分布,記作x~N(μ,σ2)。f(x)是一給定變量值x的概率密度。
第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前36頁,總共76頁。3、正態(tài)分布的特征正態(tài)分布密度曲線是單峰、對稱的懸鐘形曲線,對稱軸為x=μ。f(x)在x=μ處達(dá)到極大,極大值f(x)是非負(fù)函數(shù),以x軸為漸近線,分布從-∞至+∞。曲線在x=μ±σ處各有一個拐點,即曲線在(-∞,μ-σ)和(μ+σ,+∞)區(qū)間上是下凸的,在[μ-σ,μ+σ]區(qū)間內(nèi)是上凸的;正態(tài)分布有兩個參數(shù),即平均數(shù)μ和標(biāo)準(zhǔn)差σ。μ是位置參數(shù),確定它在x軸上的位置;σ是變異度參數(shù),確定正態(tài)分布的變異度。分布密度曲線與橫軸所夾的面積為1,即:第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前37頁,總共76頁。
μ值不同σ值相同的三條正態(tài)曲線μ值相同σ值不同的三條正態(tài)曲線第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前38頁,總共76頁。4、標(biāo)準(zhǔn)正態(tài)分布一個正態(tài)分布,μ確定了它的中心位置,σ確定了它的變異度。但不同的正態(tài)分布有不同的μ和σ,所以N(μ,σ2)不是一條曲線,而是一個曲線系統(tǒng)。為了便于一般化的應(yīng)用,需將正態(tài)分布標(biāo)準(zhǔn)化。首先,將隨機(jī)變量x標(biāo)準(zhǔn)化,令:
u稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差,它表示離開均值μ有幾個標(biāo)準(zhǔn)差σ。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前39頁,總共76頁。正態(tài)分布的概率密度函數(shù)即可標(biāo)準(zhǔn)化為:
φ(u)為標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù),即縱坐標(biāo)高度。根據(jù)u
的不同取值,就可繪出標(biāo)準(zhǔn)正態(tài)分布的圖形:標(biāo)準(zhǔn)正態(tài)分布曲線
通過標(biāo)準(zhǔn)化,使正態(tài)分布的均值μ=0,標(biāo)準(zhǔn)差σ=1。因此,標(biāo)準(zhǔn)正態(tài)分布可記作N(0,1)。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布4、標(biāo)準(zhǔn)正態(tài)分布當(dāng)前40頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布5、正態(tài)分布的概率計算對任何一個服從正態(tài)分布N(μ,σ2)的隨機(jī)變量x,通過標(biāo)準(zhǔn)變換后,如果u為任意實數(shù),可按下式計算:Φ0(u)=直接查表u>00.5u=01-Φ0(-u)
u<0當(dāng)前41頁,總共76頁。對標(biāo)準(zhǔn)正態(tài)分布的區(qū)間概率計算方法如下:第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前42頁,總共76頁。例:已知某河段的懸浮物濃度服從正態(tài)分布,其平均值為600mg/L,標(biāo)準(zhǔn)差為100mg/L,求該河段懸浮物濃度在小于800mg/L和大于400mg/L區(qū)間的概率?并求大于800mg/L的發(fā)生概率?第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前43頁,總共76頁。在數(shù)理統(tǒng)計分析中,不僅注意隨機(jī)變量x落在平均數(shù)加減不同倍數(shù)標(biāo)準(zhǔn)差區(qū)間(μ-kσ,μ+kσ)之內(nèi)的概率,更關(guān)心的是x落在此區(qū)間之外的概率。把隨機(jī)變量x落在平均數(shù)μ加減不同倍數(shù)標(biāo)準(zhǔn)差σ區(qū)間之外的概率稱為雙側(cè)概率(兩尾概率),記作α。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布
對應(yīng)于雙側(cè)概率,也可以求得隨機(jī)變量x小于μ-kσ或大于μ+kσ的概率,稱為單側(cè)概率(一尾概率),記作α/2。
6、單側(cè)概率與雙側(cè)概率當(dāng)前44頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布1、貝努利試驗及其概率公式將某隨機(jī)試驗重復(fù)進(jìn)行n次,若各次試驗結(jié)果互不影響,即每次試驗結(jié)果出現(xiàn)的概率都不依賴于其它各次試驗的結(jié)果,則稱這n次試驗是獨立的。在生物學(xué)研究中,我們經(jīng)常碰到的一類離散型隨機(jī)變量,如入孵n枚種蛋的出雛數(shù)、n頭病畜治療后的治愈數(shù)、n
尾魚苗的成活數(shù)等,可用貝努利試驗來概括。當(dāng)前45頁,總共76頁。在n重貝努利試驗中,事件A可能發(fā)生0,1,2,…,n次,現(xiàn)在我們來求事件A
恰好發(fā)生k(0≤k≤n)次的概率Pn(k)。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布1、貝努利試驗及其概率公式先取n=4,k=2來討論。在4次試驗中,事件A發(fā)生2次的方式當(dāng)前46頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布1、貝努利試驗及其概率公式當(dāng)前47頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布2、二項分布的定義及性質(zhì)當(dāng)前48頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布2、二項分布的定義及性質(zhì)當(dāng)前49頁,總共76頁。二項分布由n和p兩個參數(shù)決定:(1)當(dāng)p值較小且n不大時,分布是偏倚的。但隨著n的增大,分布逐漸趨于對稱;(2)當(dāng)p值趨于0.5時,分布趨于對稱;n值不同的二項分布比較p值不同的二項分布比較第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布2、二項分布的定義及性質(zhì)(3)對于固定的n及p,當(dāng)k增加時,Pn(k)先隨之增加并達(dá)到其極大值,以后又下降。(4)此外,在n較大,np、nq較接近時,二項分布接近于正態(tài)分布;當(dāng)n→∞時,二項分布的極限分布是正態(tài)分布2、二項分布的定義及性質(zhì)當(dāng)前50頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布3、二項分布的平均數(shù)和標(biāo)準(zhǔn)差統(tǒng)計學(xué)證明,服從二項分布B(n,p)的隨機(jī)變量x的平均數(shù)μ、標(biāo)準(zhǔn)差σ與參數(shù)n、p有如下關(guān)系。設(shè)x~
B(n,p),那么,二項分布的總體特征數(shù)為:均值μ=np標(biāo)準(zhǔn)差σ=方差σ2=npq當(dāng)前51頁,總共76頁。例:在毒理學(xué)試驗中,試驗金魚染毒后,死亡率為20%,求5條金魚染毒后死亡數(shù)各可能值相應(yīng)的概率。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布4、二項分布的概率計算及應(yīng)用條件解:設(shè)5條金魚染毒后死亡數(shù)為x,則x服從二項分布(5,0.2),其所有可能取值為0,1,2,…,5,則計算概率用分布列表示如下:當(dāng)前52頁,總共76頁。二項分布的應(yīng)用條件有三:(1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或陰性,生存或死亡等,屬于二項分類資料;(2)已知發(fā)生某一結(jié)果(如死亡)的概率為p,其對立結(jié)果的概率則為1-p=q,實際中要求p
是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;(3)n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的觀察結(jié)果。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布二、二項分布4、二項分布的概率計算及應(yīng)用條件當(dāng)前53頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布波松分布是一種可以用來描述和分析隨機(jī)地發(fā)生在單位空間或時間里的稀有事件的概率分布。要觀察到這類事件,樣本含量n必須很大。在生物、醫(yī)學(xué)研究中,服從泊松分布的隨機(jī)變量是常見的。如,一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù),畜群中遺傳的畸形怪胎數(shù),每升飲水中大腸桿菌數(shù),計數(shù)器小方格中血球數(shù),單位空間中某些野生動物或昆蟲數(shù),醫(yī)院門診單位時間內(nèi)就診患者數(shù)等,都是服從波松分布的。當(dāng)前54頁,總共76頁。泊松分布的背景及應(yīng)用二十世紀(jì)初盧瑟福和蓋克兩位科學(xué)家在觀察與分析放射性物質(zhì)放出的粒子個數(shù)的情況時,他們做了2608次觀察(每次時間為7.5秒)發(fā)現(xiàn)放射性物質(zhì)在規(guī)定的一段時間內(nèi),其放射的粒子數(shù)X服從泊松分布.第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前55頁,總共76頁。電話呼喚次數(shù)交通事故次數(shù)商場接待的顧客數(shù)地震火山爆發(fā)特大洪水第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前56頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布1、定義若隨機(jī)變量x(x=k)只取零和正整數(shù)值0,1,2,…,且其概率分布為k=0,1,……,其中λ>0;則稱x服從參數(shù)為λ的波松分布,記為x~P(λ)。波松分布作為一種離散型隨機(jī)變量的概率分布有一個重要的特征,這就是它的平均數(shù)和方差相等,都等于常數(shù)λ,即μ=σ2=λ。利用這一特征,可以初步判斷一個離散型隨機(jī)變量是否服從波松分布。當(dāng)前57頁,總共76頁。波松分布的意義
λ是波松分布所依賴的唯一參數(shù)。λ值愈小分布愈偏倚,隨著λ的增大,分布趨于對稱。當(dāng)λ=20時分布接近于正態(tài)分布;當(dāng)λ=50時,可以認(rèn)為波松分布呈正態(tài)分布。所以在實際工作中,當(dāng)λ≥20時就可以用正態(tài)分布來近似地處理波松分布的問題。不同λ的波松分布第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布當(dāng)前58頁,總共76頁。波松分布的概率計算,依賴于參數(shù)λ的確定,只要參數(shù)λ確定了,把k=0,1,2,…代入公式即可求得各項的概率。但是在大多數(shù)服從波松分布的實例中,分布參數(shù)λ往往是未知的,只能從所觀察的隨機(jī)樣本中計算出相應(yīng)的樣本平均數(shù)作為λ的估計值,將其代替式中的λ,計算出k=0,1,2,…時的各項概率。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計算當(dāng)前59頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計算例:為監(jiān)測飲用水的污染情況,檢驗了某社區(qū)每毫升飲用水中細(xì)菌總數(shù),共得400個記錄,結(jié)果見下表。試分析飲用水中細(xì)菌數(shù)的分布是否服從泊松分布。若服從,按泊松分布計算每毫升水中細(xì)菌數(shù)的概率及理論次數(shù)并將次數(shù)分布與泊松分布作直觀比較。1ml水中細(xì)菌數(shù)012≥3合計次數(shù)f243120316400經(jīng)計算得每毫升水中平均細(xì)菌數(shù)=0.5,方差S2=0.496當(dāng)前60頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計算1ml水中細(xì)菌數(shù)012≥3合計實際次數(shù)243120316400頻率概率理論次數(shù)當(dāng)前61頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布三、泊松分布2、泊松分布的概率計算1ml水中細(xì)菌數(shù)012≥3合計實際次數(shù)243120316400頻率0.60750.30000.07750.01501.00概率0.060650.30330.07580.01441.00理論次數(shù)242.60121.3230.325.76400當(dāng)前62頁,總共76頁。前面討論的三個重要的概率分布中,前1個屬連續(xù)型隨機(jī)變量的概率分布,后2個屬離散型隨機(jī)變量的概率分布。三者間的關(guān)系如下:對于二項分布,在n→∞,p→0,且np=λ(較小常數(shù))情況下,二項分布趨于波松布。在這種場合,波松分布中的參數(shù)λ用二項分布的np代之;在n→∞,p→0.5時,二項分布趨于正態(tài)分布。在這種場合,正態(tài)分布中的μ、σ2用二項分布的np、np
q代之。在實際計算中,當(dāng)p<0.1且n很大時,二項分布可由波松分布近似;當(dāng)p>0.1且n很大時,二項分布可由正態(tài)分布近似。對于波松分布,當(dāng)λ→∞時,波松分布以正態(tài)分布為極限。在實際計算中,當(dāng)λ≥20(也有人認(rèn)為λ≥6)時,用波松分布中的λ代替正態(tài)分布中的μ及σ2,即可由后者對前者進(jìn)行近似計算。第二章統(tǒng)計學(xué)基礎(chǔ)知識第三節(jié)幾種常見的概率分布當(dāng)前63頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第四節(jié)抽樣分布
研究總體與所抽取的樣本之間的關(guān)系是統(tǒng)計學(xué)的中心內(nèi)容。對這種關(guān)系的研究從兩方面著手:一是從總體到樣本,這就是研究抽樣分布(samplingdistribution)的問題;二是從樣本到總體,這就是統(tǒng)計推斷(statisticalinference)問題。當(dāng)前64頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第四節(jié)抽樣分布★總體隨機(jī)抽樣(randomsampling)的方法可分為有返置抽樣和不返置抽樣兩種。★前者指每次抽出一個個體后,這個個體應(yīng)返置回原總體;后者指每次抽出的個體不返置回原總體?!飳τ跓o限總體,返置與否都可保證各個體被抽到的機(jī)會相等。對于有限總體,就應(yīng)該采取返置抽樣,否則各個體被抽到的機(jī)會就不相等。當(dāng)前65頁,總共76頁。第二章統(tǒng)計學(xué)基礎(chǔ)知識第四節(jié)抽樣分布由總體中隨機(jī)地抽取若干個體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計量(如,S)也將隨著樣本的不同而有所不同,因而樣本統(tǒng)計量也是隨機(jī)變量,也有其概率分布。我們把統(tǒng)計量的概率分布稱為抽樣分布。…(x1,x2,…xn)(x1,x2,…xn)(x1,x2,…xn)樣本值1樣本值2樣本值nX1,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年交通安全課件:深入理解交通標(biāo)志
- 基于2024年安全心理學(xué)課件的在線學(xué)習(xí)平臺構(gòu)建
- 2024年教案趨勢分析:小學(xué)教育學(xué)的新方向
- 《單價數(shù)量總價》的評課稿范文4篇
- 《HTML5+CSS3+JavaScript網(wǎng)頁設(shè)計基礎(chǔ)與實戰(zhàn)》課程大綱(42學(xué)時)
- 2023年注冊巖土工程師考試題庫標(biāo)準(zhǔn)卷
- 弘揚(yáng)民族文化:《創(chuàng)意美術(shù)字》與少數(shù)民族文字設(shè)計的融合
- 2020年全國企業(yè)員工全面質(zhì)量管理知識競賽題庫及答案
- 小數(shù)加減法教學(xué)新策略:2024年課件設(shè)計展望
- 護(hù)理倫理與衛(wèi)生法律法規(guī)-第四章-護(hù)理人際關(guān)系倫理
- 團(tuán)播主持人協(xié)議
- 《急救藥品》課件
- 氯酸鹽行業(yè)分析
- 國開電大 可編程控制器應(yīng)用實訓(xùn) 形考任務(wù)6實訓(xùn)報告
- GB/T 34120-2023電化學(xué)儲能系統(tǒng)儲能變流器技術(shù)要求
- 跨國企業(yè)中方外派人員的跨文化適應(yīng)
- 《道路交叉設(shè)計》課件
- 《活著》讀后感-課件
- 體檢報告匯總分析中風(fēng)險的防范
- 村里建群管理制度
- 【城市軌道交通運(yùn)營安全管理研究5300字】
評論
0/150
提交評論