數(shù)學(xué)分布(泊松分布、二項分布、正態(tài)分布、均勻分布、指數(shù)分布)+生存分析+貝葉斯概率公式+全概率公式_第1頁
數(shù)學(xué)分布(泊松分布、二項分布、正態(tài)分布、均勻分布、指數(shù)分布)+生存分析+貝葉斯概率公式+全概率公式_第2頁
數(shù)學(xué)分布(泊松分布、二項分布、正態(tài)分布、均勻分布、指數(shù)分布)+生存分析+貝葉斯概率公式+全概率公式_第3頁
數(shù)學(xué)分布(泊松分布、二項分布、正態(tài)分布、均勻分布、指數(shù)分布)+生存分析+貝葉斯概率公式+全概率公式_第4頁
數(shù)學(xué)分布(泊松分布、二項分布、正態(tài)分布、均勻分布、指數(shù)分布)+生存分析+貝葉斯概率公式+全概率公式_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)期望:隨機(jī)變量最基本的數(shù)學(xué)特征之一。它反映隨機(jī)變量平均取值的大小。又稱期望或均值。它是簡單算術(shù)平均的一種推廣。例如某城市有10萬個家庭,沒有孩子的家庭有1000個,有一個孩子的家庭有9萬個,有兩個孩子的家庭有6000個,有3個孩子的家庭有3000個, 則此城市中任一個家庭中孩子的數(shù)目是一個隨機(jī)變量,記為X,它可取值0,1,2,3,其中取0的概率為0.01,取1的概率為0.9,取2的概率為0.06,取3的概率為0.03,它的數(shù)學(xué)期望為0×0.011×0.92×0.063×0.03等于1.11,即此城市一個家庭平均有小孩1.11個,用數(shù)學(xué)式子表示為:E(

2、X)=1.11。也就是說,我們用數(shù)學(xué)的方法分析了這個概率性的問題,對于每一個家庭,最有可能它家的孩子為1.11個??梢院唵蔚睦斫鉃榍笠粋€概率性事件的平均狀況。各種數(shù)學(xué)分布的方差是:1、 一個完全符合分布的樣本2、 這個樣本的方差概率密度的概念是:某種事物發(fā)生的概率占總概率(1)的比例,越大就說明密度越大。比如某地某次考試的成績近似服從均值為80的正態(tài)分布,即平均分是80分,由正態(tài)分布的圖形知x=80時的函數(shù)值最大,即隨機(jī)變量在80附近取值最密集,也即考試成績在80分左右的人最多。下圖為概率密度函數(shù)圖(F(x)應(yīng)為f(x),表示概率密度):離散型分布:二項分布、泊松分布連續(xù)型分布:指數(shù)分布、正態(tài)

3、分布、X2分布、t分布、F分布抽樣分布抽樣分布只與自由度,即樣本含量(抽樣樣本含量)有關(guān)二項分布(binomial distribution):例子拋硬幣1、 重復(fù)試驗(n個相同試驗,每次試驗兩種結(jié)果,每種結(jié)果概率恒定伯努利試驗)2、3、 P(X=0), P(X=1), P(X=3), .所有可能的概率共同組成了一個分布,即二項分布泊松分布(possion distribution):1、 一個單位內(nèi)(時間、面積、空間)某稀有事件2、 此事件發(fā)生K次的概率3、P(X=0), P(X=1), P(X=3), .所有可能的概率共同組成了一個分布,即泊松分布二項分布與泊松分布的關(guān)系:二項分布在事件發(fā)

4、生概率很小,重復(fù)次數(shù)n很大的情況下,其分布近似泊松分布均勻分布(uniform distribution):分為連續(xù)型均勻分布和離散型均勻分布離散型均勻分布:1、 n種可能的結(jié)果2、 每個可能的概率相等(1/n)連續(xù)型均勻分布:1、 可能的結(jié)果是連續(xù)的2、 每個可能的概率相等()連續(xù)型均勻分布概率密度函數(shù)如下圖:指數(shù)分布(exponential distribution):用來表示獨立隨機(jī)事件發(fā)生的時間間隔,比如旅客進(jìn)機(jī)場的時間間隔、中文維基百科新條目出現(xiàn)的時間間隔等等。指數(shù)分布常用于各種“壽命”分布的近似。1、連續(xù)型分布,每個點的概率:2、無記憶性。已經(jīng)使用了s小時的元件,它能再使用t小時的

5、概率,與一個從未使用過的元件使用t小時的概率相同。即它對已經(jīng)使用過的s小時沒有記憶。指數(shù)分布的概率密度函數(shù)如下圖:正態(tài)分布(normal distribution):又稱高斯分布。1、 描述一個群體的某個指標(biāo)。2、 這個指標(biāo)是連續(xù)的。3、 每個特定指標(biāo)在整個群體中都有一個概率()。4、 所有指標(biāo)概率共同組成了一個分布,這個分布就是正態(tài)分布。正態(tài)分布的概率密度函數(shù)如下圖:中心極限定理:不論總體的分布形式如何(正態(tài)或非正態(tài)),只要樣本(抽樣樣本)含量n足夠大時,樣本均數(shù)的分布就近似正態(tài)分布,且均數(shù)與總體均數(shù)相等,標(biāo)準(zhǔn)差為(總體標(biāo)準(zhǔn)差)/(n的開方)。中心極限定理使得t分布、F分布和X2分布在抽樣樣

6、本含量很大時不需要對總體樣本是否正態(tài)有要求。t分布(student t distribution): 1、t分布是以0為中心的一簇曲線,每個自由度決定一個曲線2、自由度是一個抽樣小樣本中的具體觀測值的個數(shù)(抽樣樣本含量)-13、總體樣本呈正態(tài)分布(抽樣樣本含量較小時,要求總體樣本呈正態(tài)分布,如果抽樣樣本含量很大(eg. n >= 100),由中心極限定理可知抽樣樣本均數(shù)也近似正態(tài)分布,因而“差值”的概率也呈正態(tài)分布,而t分布的每一條曲線實際上都是正態(tài)分布曲線)4、從一個總體樣本中抽取很多個小樣本抽樣5、每個小樣本都有一個均值6、每個小樣本的均值與總體樣本均值有一個差值,這個差值用t估計7

7、、可能有多個小樣本的差值估計都是t,t出現(xiàn)的次數(shù)占所有小樣本的比例可以用一個概率衡量8、所有t值的概率組成一個分布,就是t分布的一個曲線9、另外做一個抽樣,每個小樣本包含的觀測值不同,則形成t分布的另外一個曲線10、自由度越大,則曲線越接近于標(biāo)準(zhǔn)正態(tài)分布11、t分布只與自由度相關(guān)t分布的概率密度函數(shù)如下圖(v為自由度):X2分布(chi square distribution):1、X2分布也是一簇曲線,每個自由度決定一個曲線2、自由度是一個抽樣小樣本中的具體觀測值的個數(shù)(抽樣樣本含量)-12、總體樣本呈正態(tài)分布(抽樣樣本含量(n)較小時,要求總體樣本呈正態(tài)分布)3、從總體樣本中抽取n個觀測值

8、:z1,z2,z3抽樣4、將它們平方后求和,這個和用一個新變量表示,即X25、重復(fù)抽樣并獲得多個X2:X12,X22,X32,X426、可能有多次抽樣的X2值相同,同一個X2值的抽樣次數(shù)占總次數(shù)的比例可以用一個概率表示7、所有的概率值共同組成一個分布,就是X2分布的一條曲線8、另外做一次,只要從總體中選取觀測值數(shù)目n不同,得到的就是另外一條曲線10、自由度越大,則曲線越接近于標(biāo)準(zhǔn)正態(tài)分布11、X2分布只與自由度相關(guān)X2分布的概率密度函數(shù)如下圖(n在這里為自由度):F分布(F-distribution):1、F分布也是一簇曲線,每對自由度決定一個曲線2、自由度是一個抽樣小樣本中的具體觀測值的個數(shù)

9、(抽樣樣本含量)-12、兩總體樣本方差比的分布3、總體樣本呈正態(tài)分布(抽樣樣本含量(n)較小時,要求總體樣本呈正態(tài)分布)4、從總體樣本中抽取兩個樣本, 兩個樣中的觀測值數(shù)目可相同也可不同,分別記為n1和n25、分別計算出X2:X1,X26、構(gòu)建一個新變量F:7、重復(fù)抽取樣本,計算多個F值:F1,F(xiàn)2,F(xiàn)3.8、可能有多次抽樣的F值相同,同一個F值的抽樣次數(shù)占總次數(shù)的比例可以用一個概率表示9、所有的概率值共同組成一個分布,就是F分布的一條曲線10、另外做一次,只要從總體中選取觀測值數(shù)目n不同,得到的就是另外一條曲線10、兩個自由度越大,則曲線越接近于標(biāo)準(zhǔn)正態(tài)分布11、F分布只與自由度相關(guān)F分布的

10、概率密度函數(shù)如下圖(m,n在這里為自由度):【在推估總體平均值時,基于樣本平均數(shù)的抽樣分布】 t分布【在用樣本方差來推估總體方差時,必須知道樣本方差的抽樣分布】 X2分布【比較兩個總體的方差是否相等時,必須知道樣本方差的聯(lián)合抽樣分布】 F分布生存分析(survival analysis):1、 多種影響慢性疾病的因素(不同手術(shù)方法、不同藥物)2、 隨訪一群患者3、 一段時間后統(tǒng)計生存和死亡3、最終給出的結(jié)果是一個評價各種因素對生存時間的影響(生存時間、生存率有無差異)貝葉斯公式(bayes formula):1、 描述兩個條件概率之間的關(guān)系P(Bi|A)與P(A|Bi),A為事件,Bi 為一個劃分2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論