生物統(tǒng)計概率和概率分布省公開課金獎全國賽課一等獎微課獲獎課件_第1頁
生物統(tǒng)計概率和概率分布省公開課金獎全國賽課一等獎微課獲獎課件_第2頁
生物統(tǒng)計概率和概率分布省公開課金獎全國賽課一等獎微課獲獎課件_第3頁
生物統(tǒng)計概率和概率分布省公開課金獎全國賽課一等獎微課獲獎課件_第4頁
生物統(tǒng)計概率和概率分布省公開課金獎全國賽課一等獎微課獲獎課件_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章概率和概率分布2.1概率基本概念2.2概率分布2.3總體特征數(shù)2.4幾個常見概率分布律2024/4/131/49第二章概率和概率分布2.1概率基本概念自然現(xiàn)象:確定性現(xiàn)象和非確定性現(xiàn)象(隨機現(xiàn)象)從隨機現(xiàn)象中做大量研究,能從其偶然性中揭示內在規(guī)律統(tǒng)計學所研究是非確定性現(xiàn)象,2024/4/132/49概率統(tǒng)計定義是在大量試驗中,以頻率穩(wěn)定性為基礎上提出來。設k次隨機試驗,成功事件A出現(xiàn)l次,則稱l/k是K次隨機試驗中成功頻率。頻率是由樣本數(shù)據(jù)計算得到。因為樣本分布不恒定性,不一樣隨機試驗,事件A出現(xiàn)頻率也不一樣,伴隨K改變,頻率也有一定波動。伴隨K增大,頻率l/k將圍繞著某一確定常數(shù)P做平均幅度愈來愈小變動,這就是所謂頻率穩(wěn)定性,其中P即為事件A概率。簡單說概率就是頻率穩(wěn)定值。在試驗次數(shù)較多時,能夠用頻率作為概率近似值。(P23表2-1)2.1.1概率統(tǒng)計定義2024/4/133/49

概率是事件在試驗結果中出現(xiàn)可能性大小定量計算,是事件固有屬性,有以下顯著性質:任何事件A概率均滿足:0≤P(A)≤1必定事件W概率為1,即P(W)=1不可能事件(V)概率為0,即P(V)=02.1.1

概率統(tǒng)計定義(續(xù))2024/4/134/49概率統(tǒng)計定義是在大量試驗中,以頻率穩(wěn)定性為基礎上提出來。不需要做試驗就能夠確定事件出現(xiàn)概率,稱為古典概率,含有以下特點:隨機試驗全部可能結果(基本事件數(shù))是有限;各基本事件間是互不相容且等可能。缺點:要求各基本事件是等概率且有限。2.1.2概率古典定義2024/4/135/49隨機變量隨機變量就是在隨機試驗中被測定量,所取得值稱為觀察值。可分為離散型隨機變量和連續(xù)型隨機變量。離散型隨機變量:可能取得數(shù)值為有限個或可數(shù)無窮個孤立數(shù)值。連續(xù)型隨機變量:可取某一(有限或無限)區(qū)間內任何數(shù)值。2.2概率分布2024/4/136/49將隨機變量X所取得值x概率P(X=x)寫成x函數(shù)p(x),稱為隨機變量X概率函數(shù)公式為p(x)=P(X=x)。概率函數(shù)應滿足:

p(x)0p(x)=12.2.1離散型隨機變量概率分布2024/4/137/49將X一切可能值x1,x2,x3……,xn,……,以及取得這些值概率P(x1),P(x2),…..,p(xn),…..排列起來,組成了離散型隨機變量概率分布。慣用概率分布表或概率分布圖表示。2.2.1離散型隨機變量概率分布(續(xù))離散型隨機變量概率分布表x1x2…xn…p(x1)p(x2)…p(xn)…2024/4/138/49離散型隨機變量概率分布圖2024/4/139/49離散型變量概率分布函數(shù):離散型變量概率累積。其公式為2.2.1離散型隨機變量概率分布(續(xù))指隨機變量等于或小于某一可能值(x0)概率。2024/4/1310/49對于離散型隨機變量任何值,都能夠求出它概率。而連續(xù)型隨機變量則不一樣,因為試驗中能夠取某一區(qū)間內任何值,這些數(shù)值組成不可數(shù)無窮集合。任何值概率都等于0,這并不是說這種事件不會出現(xiàn),只是因為技術上限制,在測量時不可能無限提升準確度。在研究連續(xù)型隨機變量時,實際觀察值只能是落在一定區(qū)間內,其概率能夠不為0,當然這種區(qū)間能夠很小。2.2.2連續(xù)型隨機變量概率分布2024/4/1311/49

隨機變量X值落在區(qū)間(x,x+△x)內概率為P(x<X<x+△x),其中△x為區(qū)間長度。當△x趨于零時,此時區(qū)間概率稱為密度函數(shù):概率密度圖形y=f(x)稱為分布曲線。2.2.2連續(xù)型隨機變量概率分布(續(xù))2024/4/1312/49

分布函數(shù)(或稱為累積分布函數(shù))是隨機變量X取得小于X0值概率對于任意兩點a和b(a<b),下式成立:

P(X≤a)+P(a<X≤b)=P(X≤b)或P(a<X≤b)=F(b)-F(a)2.2.2連續(xù)型隨機變量概率分布(續(xù))2024/4/1313/49經(jīng)過樣本數(shù)據(jù)得到頻率分布稱為統(tǒng)計分布或經(jīng)驗分布,描述總體概率分布稱為理論分布或總體分布。頻率分布可出現(xiàn)各種類型:兩側對稱,不對稱,但對于不一樣頻率分布都有對應理論分布,即隨機變量改變規(guī)律理想化數(shù)學模型。即使極難與實際情況完全一致,但近似得非常好,所以能夠用建立在概率分布基礎上統(tǒng)計規(guī)律來處理實際問題。假如我們從總體中取出了一個很大樣本,可把這個樣本分布近似作為總體分布。2.2.3概率分布與頻率分布關系2024/4/1314/49樣本特征數(shù)是描述頻率分布特征:統(tǒng)計量總體特征數(shù)是描述概率分布特征:參數(shù)總體特征數(shù)包含隨機變量數(shù)學期望(理論平均數(shù)),方差和各階矩,能夠用類似求樣本特征數(shù)方法求得。2.3總體特征數(shù)2024/4/1315/49總體特征數(shù):描述概率分布特征數(shù)字,包含數(shù)學期望、方差和各階矩。所謂X或X函數(shù)數(shù)學期望,即它們理論平均數(shù)。樣本平均數(shù):2.3.1隨機變量數(shù)學期望和方差伴隨n充分增加,平均數(shù)穩(wěn)定于總體平均數(shù)2024/4/1316/49頻數(shù)資料樣本方差和標準差2.3.1隨機變量數(shù)學期望和方差(續(xù))總體方差和標準差2024/4/1317/49

X或X函數(shù)數(shù)學期望可用通式表示2.3.1隨機變量數(shù)學期望和方差(續(xù))隨機變量數(shù)學期望就是這個隨機變量全部可能值,以其對應概率為權加權平均數(shù)。2024/4/1318/49

連續(xù)型隨機變量數(shù)學期望定義為2.3.1隨機變量數(shù)學期望和方差(續(xù))連續(xù)型隨機變量方差定義為2024/4/1319/492.3.2數(shù)學期望和方差運算2024/4/1320/492.4幾個常見概率分布律2.4.1二項分布二項分布在生物學中應用很廣,其特征以下:每次試驗只有兩個對立結果(A和?。籒次試驗是重復,獨立?;胤攀匠闃舆m合于二項分布;非回放式抽樣適合于超幾何分布。二項分布概率函數(shù)2024/4/1321/492.4.1二項分布(續(xù))服從二項分布隨機變量特征數(shù)(用比率表示時)平均數(shù)方差偏斜度峭度(用比率表示時)2024/4/1322/49二項分布決定于兩個參考數(shù):試驗次數(shù)和概率,所以其圖形改變趨勢與這兩個參數(shù)相關隨試驗次數(shù)增大圖形分布趨于對稱;而且當概率趨于0.5時分布趨于對稱偏斜度和峭度是與試驗次數(shù)和概率相關。當相同時,隨樣本含量增加,γ1和γ2逐步靠近于0(正態(tài)分布);或樣本含量相同時,愈靠近于0.5,γ1和γ2愈靠近于0。表3-1P37二項式分布應用實例

2.4.1二項分布(續(xù))2024/4/1323/49

在生物統(tǒng)計學中,正態(tài)分布占有極其主要地位。許多生物學現(xiàn)象所產(chǎn)生數(shù)據(jù),都服從正態(tài)分布。正態(tài)分布密度函數(shù)圖像稱為正態(tài)曲線正態(tài)分布密度函數(shù)圖像,稱為正態(tài)曲線。2.4.2正態(tài)分布2024/4/1324/49平均數(shù)為μ,標準差為

正態(tài)分布,其密度函數(shù):累積分布函數(shù):正態(tài)曲線2024/4/1325/49正態(tài)分布規(guī)律是數(shù)據(jù)分布兩頭少,中間多,兩側對稱。密度曲線以X=μ直線為對稱;X=

-

和X=

+

所確定點為曲線兩個“拐點”;曲線向左、向右無限延伸,以x軸為漸近線;x越趨向于μ,f(x)取值越大;X=μ時,f(x)含有最大值,其值為:正態(tài)曲線特點2024/4/1326/49

σ大小,決定曲線“胖”、“瘦”程度,σ越小,曲線越“瘦”,數(shù)據(jù)越集中,σ越大,曲線越“胖”,數(shù)據(jù)越分散。σ固定時,μ值決定曲線位置,當μ增大時曲線向右平移,當μ降低時曲線向左平移,但曲線形狀不變。正態(tài)曲線特點(續(xù))2024/4/1327/49

標準正態(tài)分布μ=0,σ=1時正態(tài)分布稱為標準正態(tài)分布N(0,1)

。其密度函數(shù)和累積分布函數(shù)分別為:2024/4/1328/49在u=0時,

(u)到達最大值,概率密度值最大;當u遠離0時,e

指數(shù)變得愈大,所以(u)值愈?。磺€兩側對稱,即

(u)=

(-u);曲線在u=1和u=-1處有兩個拐點;曲線下面積為等于1;累積分布函數(shù)

(u)值可查表;累積分布函數(shù)

(u)曲線從-∞到0平穩(wěn)上升,圍繞點(0,0.5)對稱;標準正態(tài)分布有以下特征2024/4/1329/49u=-1

到u=1

面積為0.6827u=-2

到u=2

面積為0.9543u=-3

到u=3

面積為0.9973u=-1.960

到u=1.960面積為0.9500u=-2.576

到u=2.576

面積為0.9900正態(tài)分布偏斜度和峭度都為0。主要特征值:2024/4/1330/49正態(tài)分布表慣用幾個關系式P(0≤u<u1)=Φ(u1)-0.5P(u≥u1)=Φ(-u1)P(|u|≥u1)=2Φ(-u1)P(|u|<u1)==1-2Φ(-u1)P(u1≤u<u2)=Φ(u2)-Φ(u1)正態(tài)分布表正態(tài)分布表(附表2)查法2024/4/1331/49對于標準正態(tài)分布,其累積分布函數(shù)值可直接查表(附表2)得到;例查u=-0.82及u=1.15時Φ(u)值。u=-0.82時,Φ(u)=0.20611u=1.15時,Φ(u)=0.87493在分布曲線上畫出Φ(u)所代表面積。正態(tài)分布表(附表2)查法2024/4/1332/49對于普通正態(tài)分布,要先將進行標準化:再查標準正態(tài)分布表也很輕易得到。令代入概率密度函數(shù)因為所以正態(tài)分布表(附表2)查法(續(xù))2024/4/1333/49例3.10:已知高粱品種“三尺三”株高服從正態(tài)分布N(156.2,4.822),求(1)X<161cm概率:(2)X>164cm概率;(3)X在152-162cm概率。(1)P(X<161)=?(2)P(X>164)=?(3)P(152<X<162)=?正態(tài)分布表查法(續(xù))2024/4/1334/49正態(tài)分布單側分位數(shù)和雙側分位數(shù)(附表3)上側分位數(shù):P(U>uα)=

時u

值;下側分位數(shù):P(U<uα)=

時u

值;雙側分位數(shù):P(lUl>u

/2)=

時u

/2值(從附表3中以

/2查出u

/2即可。附表3與附表2查法恰好相反。2024/4/1335/49正態(tài)分布單側分位數(shù)和雙側分位數(shù)(附表3)2024/4/1336/49在生物界中,把一個隨機變量看作許多影響微小而又相互獨立隨機變量之和。當這些獨立隨機變量數(shù)量很大時,每一隨機變量對總和影響則相對變小。為了研究數(shù)量很大時隨機變量和所含有規(guī)律性,應使用極限原理和方法。已證實在上述情況下,隨機變量和分布趨于正態(tài)分布。研究隨機變量和極限分布是正態(tài)分布一類定理,稱為中心極限定理。中心極限定理2024/4/1337/49

假設被研究隨機變量X,能夠表示為許多相互獨立隨機變量Xi和。那么,假如Xi數(shù)量很大,而且每一個別Xi對于X所起作用很小,則能夠被認為X服從或近似地服從正態(tài)分布。中心極限定理含義2024/4/1338/49若已知總體平均數(shù)為μ,標準差為σ,那么不論該總體是否為正態(tài)分布,對于從該總體所抽取含量為N樣本,當樣本含量充分大時,其平均數(shù)漸近服從正態(tài)分布N(μ,σ2/n)(見公式)。中心極限定理在生物統(tǒng)計學占有極其主要地位。有了這個定理,才能從單個樣本n個數(shù)據(jù)所得到統(tǒng)計量對總體進行預計。中心極限定理推論2024/4/1339/49從一個包含兩種不一樣類型個體有限總體做非放回式抽樣,抽中某種類型個體數(shù)服從超幾何分布。概率函數(shù)2.4.3超幾何分布N:總體中個數(shù)K:兩種類型中某一個類型個體數(shù)n:非放回式抽樣次數(shù)x:在n次抽樣中某一個類型個體數(shù)2024/4/1340/492.4.3超幾何分布(續(xù))服從超幾何分布隨機變量總體特征數(shù):例:野生動物考查時,常需要了解野生動物群體大小.一個方法是先捕捉一定數(shù)目標動物,做上標識,把他們放回到群體中.然后再捕捉第二個樣本,計算其中有標識動物數(shù).依據(jù)以上資料預計群體大小.捕捉第二個樣本時,捉到有標識動物數(shù),是一個隨從超幾何分布隨機變量.方差平均數(shù)2024/4/1341/49結束2.14X為垂釣者在1h內釣上魚數(shù),其概率分布以下表:作業(yè):P32x0123456p(x)0.0010.0100.0600.1850.3240.3020.118問(1)期望1h內釣到魚數(shù)?(2)它們方差?2024/4/1342/49結束3.4依據(jù)以往經(jīng)驗,用普通療法治療某種疾病,其死亡率為40%,治愈率為60%。今用一個新藥治療染上該病5名患者,這5人均治愈了,問該新藥是否顯著優(yōu)于普通療法?作業(yè):P512024/4/1343/49結束3.14.已知習題1.2中,250株小麥高度分布服從正態(tài)分布N(63.33,2.882),問:(1)株高在60cm以下概率?(2)株高在69cm以上概率?(3)株高在62-6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論