生物統(tǒng)計學考試總結_第1頁
生物統(tǒng)計學考試總結_第2頁
生物統(tǒng)計學考試總結_第3頁
生物統(tǒng)計學考試總結_第4頁
生物統(tǒng)計學考試總結_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物統(tǒng)計學考試總結第一章生物統(tǒng)計學:是數(shù)理統(tǒng)計在生物學研究中的應用,它是應用數(shù)理統(tǒng)計的原理和方法來分析和解釋生物界各種現(xiàn)象和試驗調查資料的一門學科,屬于應用統(tǒng)計學的一個分支。內容:試驗設計:試驗設計的基本原則、試驗設計方案的制定和常用試驗設計的方法統(tǒng)計分析:數(shù)據(jù)資料的搜集、整理和特征數(shù)的計算、統(tǒng)計推斷、方差分析、回歸和相關分析、協(xié)方差分析等生物統(tǒng)計學的作用:1. 提供整理、描述數(shù)據(jù)資料的科學方法并確定其特征2. 判斷試驗結果的可靠性3. 提供由樣本推斷總體的方法4. 試驗設計的原則相關概念:1.總體:研究對象的全體,是具有相同性質的個體所組成的集合2.個體:組成總體的基本單元3.樣本:由總體中

2、抽出的若干個體所構成的集合 n30 大樣本; n30 小樣本4.參數(shù):描述總體特征的數(shù)量5.統(tǒng)計數(shù):描述樣本特征的數(shù)量由于總體一般很大,有時候甚至不可能取得,所以總體參數(shù)一般不可能計算出來,而采用樣本統(tǒng)計數(shù)來估計總體的參數(shù)6.效應:由因素而引起試驗差異的作用 7. 互作:兩個或兩個以上處理因素間的相互作用產生的效應生物統(tǒng)計學的研究包括了兩個過程:1. 從總體抽取樣本的過程抽樣過程2. 從樣本的統(tǒng)計數(shù)到總體參數(shù)的過程統(tǒng)計推斷過程第二章1算術平均數(shù):是所有觀察值的和除以觀察的個數(shù) 平均數(shù)(AVERAGE)特性:(1)樣本中各觀測值與平均數(shù)之差離均差的總和等于零(2)樣本中各觀測值與其平均數(shù)之差平方

3、的總和,比各觀測值與任一數(shù)值離均差的平方和小,即離均差平方和最小 2中位數(shù):將試驗或調查資料中所有觀測依從大小順序排列,居于中間位置的觀測值稱為中位數(shù),以Md表示3眾數(shù):在一個樣本的所有觀察值中,發(fā)生頻率最大的一個值稱為樣本的眾數(shù),以Mo表示4幾何平均數(shù):資料中有n個觀測值,其乘積開n次方所得的數(shù)值,以G表示。5.極差(全距):樣本數(shù)據(jù)資料中最大觀測值與最小觀測值的差值Rmaxx1,x2,xn mixx1,x2,xn 6樣本方差: 總體方差:用n1代替n作,可以避免偏小估計,從而實現(xiàn)樣本方差對總體方差的無偏估計在統(tǒng)計上,自由度(df n1 )是指樣本內獨立而能自由變動的觀測值的個數(shù)在計算其他統(tǒng)

4、計數(shù)時,如果受到k個條件的限制,則其自由度為nk7樣本標準差: 總體標準差:(1)標準差的大小,受多個觀測值的影響,如果觀測值與觀測值間差異大,標準差就大(2)在計算標準差的時候,如果對各個觀測值加上或者減去一個常數(shù)a,其標準差不變;如果乘以或除以一個常數(shù)a,則標準差擴大或者縮小a倍STDEV: 基于給定樣本的標準偏差STDEVP:基于給定樣本總體的標準偏差8變異系數(shù)(CV):樣本標準差除以樣本的平均數(shù),得到百分比(1)變異系數(shù)是樣本變量的相對變量,是不帶單位的純數(shù)(2)用變異系數(shù)可以比較不同樣本相對變異程度的大小第三章概率的計算法則:(1)乘法定理:如果A和B為獨立事件,則事件A和B同時發(fā)生

5、的概率等于各自事件的概率的乘積(2)加法定理:互斥事件A和B的和的概率等于事件A和事件B的概率之和加法定理推理1: 如果A1、A2、An為n個互斥事件,則其和事件的概率為: P(A1A2An)=P(A1)+P(A2)P(An)加法定理:如果A和B是任何兩件事件,則概率分布:(1)離散型隨機變量的概率分布變量(x) x1 x2 x3 xn概率(P) p1 p2 p3 pnP(x=xi)=pi (i=1,2, n)離散隨機變量的方差(2)連續(xù)型隨機變量的概率分布連續(xù)型隨機變量的概率分布1. 連續(xù)型隨機變量可以取某一區(qū)間或整個實數(shù)軸上的任意一個值2. 它取任何一個特定的值的概率都等于03. 不能列出

6、每一個值及其相應的概率4. 通常研究它取某一區(qū)間值的概率5. 用數(shù)學函數(shù)的形式和分布函數(shù)的形式來描述概率密度函數(shù):(1)設X為一連續(xù)型隨機變量,x 為任意實數(shù),X的概率密度函數(shù)記為f(x),它滿足條件(2) ,f(x)不是概率幾種常見的概率分布:(適用范圍,尾函數(shù),自由度)1. 二項分布的概率函數(shù) 記作B(n,p)或者B(n,)(1)每次試驗只有兩個對立結果,分布記為A與 ,它們出現(xiàn)的概率分布為p與q(q1-p)(2)試驗具有重復性和獨立性二項式分布的概率累積函數(shù):若隨機變量x服從二項式分布,則有二項分布的總體平均數(shù)為二項分布的總體標準差為:二項成數(shù)(百分數(shù))分布的平均數(shù):二項成數(shù)(百分數(shù))分

7、布的標準差:B(n, p)BINOMDISTxnumber_s實驗成功次數(shù)ntrials獨立實驗次數(shù)pprobability_s一次實驗中成功的概率cumulativeTrue: False:例:假設年齡6064歲的100名男性在1986年注射了一種新的流感疫苗而在第二年內死亡5人,這正常嘛?(注:1986年,6064歲的男性老人第二年的死亡率約為0.02)解:要知道100個男性的樣本死亡5人是不是“異?!笔录?,這種估計的一個準則是尋找至少5人死亡的概率。注:通常是把概率值為0.05或者更小的概率事件識別為異常(稀有事件)。由于至少5人死亡的概率是0.05,可見100人中至少死亡5人是稍微有點

8、異常,但不是很異常。 如果至少死亡10人,那么概率是3.44*10-5,這就很不正常,因而,在沒有其他證據(jù)顯示此疫苗有效前,應考慮停止使用。2. 泊松分布二項式分布中,如果p值很小而n值很大( p0.1 和np5 ),則泊松分布 式中: 為參數(shù),泊松分布的平均數(shù)、方差、標準差POISSONxX事件出現(xiàn)的次數(shù)mean期望值cumulativeTrue: False:例:假如我們研究乳腺癌的遺傳敏感性。我們發(fā)現(xiàn),母親曾患有乳腺癌的1000名4049歲的婦女,在研究開始后的1年中,有4人患有乳腺癌,而我們從大總體中知道在這相同的時間內,1000人中有1個人發(fā)生乳腺癌。試問乳腺癌有沒有敏感性?解:如果

9、用二項分布,則n1000,p1/1000,BINOMDISTnumber_sTrialsprobability_scumulative310000.001Ture0.9810.019解:如果用泊松分布,則n1000,p1/1000, 則平均值 1POISSIONxmeancumulative31Ture0.9810.019則:這個事件是異常事件,則認為有乳腺癌的婦女,她們的子代具有遺傳敏感性3. 正態(tài)分布(高斯分布)為總體平均數(shù), 為總體標準差正態(tài)分布的特征1. 當 時,f(x)有最大值2. 當 的絕對值相等的時候,f(x)值也相等3. 當 的絕對值越大,f(x)值就越小,但永遠不等于04.

10、正態(tài)分布曲線完全由函數(shù) 和 來決定5. 正態(tài)分布曲線在 處各有一個拐點6. 正態(tài)分布求和為0NORMDISTxiX函數(shù)值的區(qū)間點Mean算術平均值Standard_dev標準差cumulativeTrue: 累積False:概率密度函數(shù)值 標準正態(tài)分布:NORMSDISTxiZ標準正態(tài)分布的區(qū)間點 NORMSINVuprobability正態(tài)分布概率,介于01之間,含0,14 t分布:是小樣本分布,小樣本分布一般是指n t) = probability,即P(|X| t) = P(X t) 2)單尾 t 值可通過用兩倍概率替換概率而求得 eg:如果概率為 0.05 而自由度為 10 , 雙尾值

11、由 TINV(0.05,10) 計算得到2.28139; 而同樣概率和自由度的單尾值由 TINV(2*0.05,10) 計算得到 1.。 5.卡方分布 P456.F分布1、概率抽樣:根據(jù)已知的概率選取樣本簡單隨機抽樣:完全隨機地抽選樣本分層抽樣:總體分成不同的“層”,然后在每一層內進行抽樣整群抽樣:將一組被調查者(群)作為一個抽樣單位等距抽樣:在樣本框中每隔一定距離抽選一個被調查者2、非概率抽樣:不是完全按隨機原則選取樣本非隨機抽樣:由調查人員自由選取被調查者判斷抽樣:通過某些條件過濾來選擇被調查者3、配額抽樣:選擇一群特定數(shù)目、滿足特定條件的被調查者抽樣分布:從一個給定的總體中抽取(不論是否

12、有放回)容量(或大?。閚的所有可能的樣本,對于每一個樣本,計算出某個統(tǒng)計量(如樣本均值或標準差)的值,不同的樣本得到的該統(tǒng)計量的值是不一樣的,由此得到這個統(tǒng)計量的分布,稱之為抽樣分布1. 所有樣本指標(如均值、比例、方差等)所形成的分布稱為抽樣分布2. 是一種理論概率分布3. 隨機變量是 樣本統(tǒng)計量樣本均值, 樣本比例等4 結果來自容量相同的所有可能樣本(符號)樣本平均數(shù)的基本性質: (1)樣本均值的均值(數(shù)學期望)等于總體均值定義: 一個參數(shù) 的估計量是 ,如果,則稱 是 的無偏估計(2)樣本均值的方差等于總體方差的1/n (3)樣本平均數(shù)的標準誤差的定義(4)當總體服從正態(tài)分布N(, 2

13、 )時,來自該總體的所有容量為n的樣本的均值 也服從正態(tài)分布, 的數(shù)學期望為,方差為2/n。即 N(, 2/n)中心極限定理:設從均值為m,方差為s 2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布兩個獨立樣本平均數(shù)差數(shù)的分布 P44第四章假設檢驗:又稱顯著性檢驗:根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設,然后由樣本的實際結果,經(jīng)過一定的計算,做出在一定概率意義上應該接受的那種假設的推斷。 如果抽樣結果使小概率事件發(fā)生,則拒絕假設。 如果抽樣結果沒有使小概率事件發(fā)生,則接受假設特點:(1)采用邏輯

14、上的反證法(2)依據(jù)統(tǒng)計學上的小概率原理生物統(tǒng)計學上,一般認為:等于或小于0.05或0.01的概率為小概率在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率。假設檢驗的步驟: 1、提出假設 2、確定適當?shù)臋z驗統(tǒng)計量 3、確定顯著性水平a 4、計算概率 5、推斷是否接受假設兩類:1)棄真錯誤;2)取偽錯誤一大樣本平均數(shù)的假設檢驗u檢驗應用范圍:1)總體方差 已知2)總體方差 未知,但樣本為大樣本( ), 用s2來代替 兩個樣本平均數(shù)比較的u檢驗二、小樣本平均數(shù)的假設檢驗t檢驗應用范圍: 總體方差 未知,且樣本為小樣本( ), 采用t檢驗當總體方差 為未知時,當樣本容量小于30,檢驗一個樣本平均數(shù)

15、是否屬于平均數(shù)為 的指定總體,其 遵循自由度為dfn1的t分布T分布的計算:2、成組數(shù)據(jù)平均數(shù)比較的t 檢驗 成組數(shù)據(jù)資料是兩個樣本的各個變量從各自總體中抽取的,即兩個抽樣樣本彼此獨立。這樣,不論兩樣本容量是否相同,所得數(shù)據(jù)皆為成組數(shù)據(jù)。兩個樣本的總體方差相等,自由度dfn1n22兩個樣本的總體方差不相等,但抽樣樣本數(shù)相等,自由度dfn13、成對數(shù)據(jù)平均數(shù)比較的t 檢驗第五章統(tǒng)計假設:H0:觀測值與理論值的差異是由隨機誤差引起 HA:觀測值與理論值之間有真實差異 所以卡方值是度量實際觀測值與理論值偏南程度的一個統(tǒng)計量 卡方值越小,表明觀測值與理論值越接近 卡方值越大,表明觀測值與理論值相差越大

16、 卡方值為0,表明H0嚴格成立,且它不會有下側否定區(qū),只能進行右尾檢驗連續(xù)性:由于離散型資料的卡方檢驗只是近似地服從連續(xù)型變量的卡方分布,所以在對離散型資料進行卡方檢驗計算的時,結果常常偏低,特別是當自由度df=1時,有較大偏差,為此需要進行矯正,當自由度df1時,與連續(xù)型隨機變量卡方分相近似,這時可以不做連續(xù)性矯正 注意:要求各個組內的理論次數(shù)不小于5,如某組理論次數(shù)小于5,則應把它與其相鄰的一組或幾組合并,直到理論次數(shù)大于5為止適合性檢驗(吻合性檢驗或擬合優(yōu)度檢驗)步驟: 1. 提出無效假設,即認為觀測值和理論值之間沒有差異 2. 規(guī)定顯著性水平 3. 計算樣本卡方值 4. 根據(jù)規(guī)定的顯著

17、水平和自由度計算出卡方值,再和實際計算的卡方值進行比較獨立性檢驗步驟: 1. 提出無效假設,即認為所觀測的各屬性之間沒有關聯(lián) 2. 規(guī)定顯著性水平 3. 根據(jù)無效假設計算出理論數(shù) 4. 根據(jù)規(guī)定的顯著水平和自由度計算出卡方值,再和計算的卡方值進行比較。 如果接受假設,則說明因子之間無相關聯(lián),是相互獨立的 如果拒絕假設,則說明因子之間的關聯(lián)是顯著的,不獨立第六章方差分析又稱 F 檢驗 (F -test);方差分析是關于k(k3)個樣本平均數(shù)的假設測驗方法,是將總變異按照來源分為處理效應和試驗誤差,并做出其數(shù)量估計。 發(fā)現(xiàn)各變異原因在總變異中相對重要程度的一種統(tǒng)計分析方法。 總變異分解為組間變異和

18、組內變異。組內變異是個體差異所致,是抽樣誤差。組間變異可能由兩種原因所致,一是抽樣誤差;二是處理不同。在抽樣研究中抽樣誤差是不可避免的,故導致組間變異的第一種原因肯定存在;第二種原因是否存在,需通過假設檢驗作出推斷方差分析基本思想:1、把k個總體當作一個整體看待2、把觀察值的總變異的平方和及自由度分解為不同來源的平方和及自由度3、計算不同方差估計值的比值4、檢驗各樣本所屬的平均數(shù)是否相等 實際上是觀察值變異原因的數(shù)量分析方差分析應用條件: 1、各樣本須是相互獨立的隨機樣本 2、各樣本來自正態(tài)分布總體 3、各總體方差相等,即方差齊 方差分析基本用途: 1、多個樣本平均數(shù)的比較 2、多個因素間的交

19、互作用 3、回歸方程的假設檢驗 4、方差的同質性檢驗總平方和=處理間平方和處理內平方和總自由度=處理間自由度處理內自由度統(tǒng)計假設的顯著性檢驗F檢驗:F檢驗的目的:推斷處理間的差異是否存在方差分析中的F檢驗總是單尾檢驗,而且為右尾檢驗 F越大,越說明組間方差是主要方差來源,因子影響越顯著; F越小,越說明隨機方差是主要的方差來源, 因子的影響越不顯著F檢驗如果否定了H0,接受了HA,表明試驗的總變異主要來源于處理間的變異多重比較:多個平均數(shù)的相互比較 常用的:1、最小顯著差數(shù)法(LSD法) 2、最小顯著極差法(LSR法)新復極差檢驗(SSR法)q檢驗總結:差異不顯著標同一字母,差異顯著標不同字母

20、最小顯著極差法(LSR法) 把平均數(shù)的差異看成是平均數(shù)的極差(range) 根據(jù)極差范圍內所包括的處理數(shù)(稱為秩次距)k的不同,而采用不同的檢驗尺度叫做 最小顯著極差LSR 秩次距是指當平均數(shù)由大到小排序后,相比較的兩個平均數(shù)之間(含這兩個平均數(shù))包含的平均數(shù)個數(shù) I類錯誤下降、工作量加大新復極差法q檢驗法兩因素方差分析:互作:某一因素在另一因素的不同水平上所產生的效應不同,則二因素間存在交互作用,簡稱互作?;プ餍獙嶋H是由于兩個或多個試驗因素的相互作用而產生的效應采用EXCEL計算重復觀測值的二因素方差分析:1、數(shù)據(jù)輸入?yún)^(qū)域必須有標題2、直接分析結果僅適用用固定模型第七章 相關系數(shù)的顯著性檢

21、驗 上述根據(jù)實際觀測值計算得來的相關系數(shù)r是樣本相關系數(shù), 它是雙變量正態(tài)總體中的總體相關系數(shù)的估計值。樣本相關系數(shù)r是否來自0的總體,還須對樣本相關系數(shù)r 進行顯著性檢驗。 此 時 無 效 假 設、備 擇 假 設 為HO:=0,HA:0。 與直線回歸關系顯著性檢驗一樣,可采用t檢驗法與F檢驗法對相關系數(shù)r的顯著性進行檢驗。 第八章對于同一組實測數(shù)據(jù),根據(jù)散點圖的形狀,可用若干相近的曲線擬合,同時建立若干曲線回歸方程,然后根據(jù)R2的大小和生物學等相關專業(yè)知識,選擇即符合生物學規(guī)律,擬合度又較高的曲線回歸方程來描述兩個變量間的曲線回歸關系第九章樣本容量的確定第十章實驗設計的基本原則和作用常用的試驗設計的方法:1、對比設計2、隨機區(qū)組設計3、裂區(qū)組設計4、正交設計對比設計及其統(tǒng)計分析: 對比設計試驗結果的統(tǒng)計分析: 分析步驟:3、試驗結論分析:對鄰近CK的百分數(shù)越高(大于100),就越可能優(yōu)于對照,但絕不能認為超過100的所有處理都顯著地優(yōu)于對照,因為將處理與相鄰CK相比只是減少了誤差,實際誤差仍然存在,要 判斷某個處理確實優(yōu)于對照,一般至少要超過對照10;凡僅超過對照5的,均宜繼續(xù)試驗再做結論。該判斷方法由于不同試驗的誤差大小不同,僅是一種參考隨機區(qū)組設計及其統(tǒng)計分析:設計方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論