生物統(tǒng)計(jì)學(xué)全套課件978p_第1頁(yè)
生物統(tǒng)計(jì)學(xué)全套課件978p_第2頁(yè)
生物統(tǒng)計(jì)學(xué)全套課件978p_第3頁(yè)
生物統(tǒng)計(jì)學(xué)全套課件978p_第4頁(yè)
生物統(tǒng)計(jì)學(xué)全套課件978p_第5頁(yè)
已閱讀5頁(yè),還剩973頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物統(tǒng)計(jì)學(xué)2023/9/291

第一節(jié)

生物統(tǒng)計(jì)學(xué)的概念及主要內(nèi)容第一章概論2023/9/292一、概念

生物統(tǒng)計(jì)學(xué)(Biostatistics)是數(shù)理統(tǒng)計(jì)在生物學(xué)研究中的應(yīng)用,它是用數(shù)理統(tǒng)計(jì)的原理和方法來(lái)認(rèn)識(shí)、分析、推斷和解釋生命過(guò)程中的各種現(xiàn)象和試驗(yàn)調(diào)查資料的科學(xué)。屬于生物數(shù)學(xué)的范疇。2023/9/293二、主要內(nèi)容生的物基統(tǒng)本計(jì)內(nèi)學(xué)容試驗(yàn)設(shè)計(jì)統(tǒng)計(jì)分析基本原則方案制定常用試驗(yàn)設(shè)計(jì)方法資料的搜集和整理數(shù)據(jù)特征數(shù)的計(jì)算統(tǒng)計(jì)推斷方差分析回歸和相關(guān)分析協(xié)方差分析主成分分析聚類分析對(duì)比設(shè)計(jì)隨機(jī)區(qū)組設(shè)計(jì)裂區(qū)設(shè)計(jì)拉丁方設(shè)計(jì)正交設(shè)計(jì)2023/9/294三生物統(tǒng)計(jì)學(xué)的基本作用:提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定某些性狀和特性的數(shù)量特征。運(yùn)用顯著檢驗(yàn),判斷試驗(yàn)結(jié)果的可靠性或可行性。提供由樣本推斷總體的方法。提供試驗(yàn)設(shè)計(jì)的的一些重要原則。2023/9/295第二節(jié)生物統(tǒng)計(jì)學(xué)發(fā)展概況

統(tǒng)計(jì)發(fā)展史可以追溯到遠(yuǎn)古的原始社會(huì),但是,能使人類的統(tǒng)計(jì)實(shí)踐上升到理論上予以概括總結(jié)的程度,即開始成為一門系統(tǒng)的學(xué)科統(tǒng)計(jì)學(xué),卻是近代的事情,距今只有三百余年的短暫歷史。

現(xiàn)代統(tǒng)計(jì)學(xué)起源于17世紀(jì),主要有兩個(gè)來(lái)源:1政治科學(xué)需要,2當(dāng)時(shí)貴族階層對(duì)機(jī)率數(shù)學(xué)理論很感興趣而發(fā)展起來(lái)的。另外,研究天文學(xué)的需要也促進(jìn)了統(tǒng)計(jì)學(xué)的發(fā)展。統(tǒng)計(jì)學(xué)發(fā)展的概貌,大致可劃分為古典記錄統(tǒng)計(jì)學(xué)、近代描述統(tǒng)計(jì)學(xué)和現(xiàn)代推斷統(tǒng)計(jì)學(xué)三種形態(tài)。2023/9/296一、發(fā)展概況原始社會(huì)奴隸社會(huì)封建社會(huì)資本主義社會(huì)迅速發(fā)展形成分支生物統(tǒng)計(jì)學(xué)2023/9/297形成不同學(xué)派:1.政治算術(shù)學(xué)派起源于17世紀(jì)60年代的英國(guó)代表人物:威廉.配第(WilliamPetty,1623~1687)約翰.格朗托(JohnGraunt,1620~1674)代表作:《政治算術(shù)》但未采用“統(tǒng)計(jì)學(xué)”這個(gè)詞2023/9/2982.國(guó)勢(shì)學(xué)派,又叫記述學(xué)派創(chuàng)建于17世紀(jì)的德國(guó)代表人物:海爾曼.康令(HermanConring,1606~1681)

阿痕瓦爾(GottfriedAchenwall,1791~1772)代表作:《近代歐洲各國(guó)國(guó)勢(shì)論》首次采用“stastistik”

德國(guó)經(jīng)濟(jì)學(xué)家和統(tǒng)計(jì)學(xué)家克尼斯(K.G.AKnies,1821~1898)在1850年發(fā)表的論文《獨(dú)立科學(xué)的統(tǒng)計(jì)學(xué)》中主張把“國(guó)家論”作為“國(guó)勢(shì)學(xué)”的科學(xué)命名,“統(tǒng)計(jì)學(xué)”作為“政治算術(shù)”的科學(xué)命名。2023/9/2993.數(shù)理統(tǒng)計(jì)學(xué)派產(chǎn)生于19世紀(jì)中葉代表人物:阿道夫.凱特勒(L.A.JQuetelet,1796~1874)

高爾登(F.Galtonl,1822~1911)

皮爾遜(K.Pearson,1857~1936)逐漸形成一門獨(dú)立的應(yīng)用數(shù)學(xué)。

1867年韋特斯坦(T.Wittstein)把既是數(shù)學(xué),又是統(tǒng)計(jì)學(xué)的新生科學(xué)命名為數(shù)理統(tǒng)計(jì)學(xué)。2023/9/29104.社會(huì)統(tǒng)計(jì)學(xué)派以德國(guó)為中心,創(chuàng)建于19世紀(jì)后期代表人物:恩格爾(C.I.E.Engel,1821~1896)

梅爾(C.G.V.Mager,1841~1925)認(rèn)為統(tǒng)計(jì)學(xué)研究的對(duì)象是社會(huì)科學(xué),而數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用數(shù)學(xué)。19世紀(jì)中葉誕生了馬克思主義的統(tǒng)計(jì)理論,后來(lái),列寧對(duì)其進(jìn)行了豐富和發(fā)展。2023/9/2911二、統(tǒng)計(jì)學(xué)發(fā)展史中的重大事件與重要代表人物J.Bernoulli(貝努里,瑞士,1654~1705)

系統(tǒng)論證了“大數(shù)定律”,即樣本容量越大,樣本統(tǒng)計(jì)數(shù)與總體參數(shù)之差越小。P.S.Laplace(拉普拉斯,法國(guó),1749~1827)

最早系統(tǒng)的把概率論方法運(yùn)用到統(tǒng)計(jì)學(xué)研究中去,建立了嚴(yán)密的概率數(shù)學(xué)理論,并應(yīng)用到人口統(tǒng)計(jì)、天文學(xué)等方面的研究上。2023/9/2912Gauss(高斯,德國(guó),1777~1855)

正態(tài)分布理論最早由DeMoiver于1733年發(fā)現(xiàn),后來(lái)Gauss在進(jìn)行天文觀察和研究土地測(cè)量誤差理論時(shí)又一次獨(dú)立發(fā)現(xiàn)了正態(tài)分布(又稱常態(tài)分布)的理論方程,提出“誤差分布曲線”,后人為了紀(jì)念他,將正態(tài)分布也稱為Gauss分布。2023/9/2913F.Galton(高爾登,英國(guó),1822~1911)

19世紀(jì)末統(tǒng)計(jì)學(xué)開始用于生物學(xué)的研究。1882年Galton開設(shè)“人體測(cè)量實(shí)驗(yàn)室”,測(cè)量9337人的資料,探索能把大量數(shù)據(jù)加以描述與比較的方法和途徑,引入了中位數(shù)、百分位數(shù)、四分位數(shù)、四分位差以及分布、相關(guān)、回歸等重要的統(tǒng)計(jì)學(xué)概念與方法。1889年發(fā)表第一篇生物統(tǒng)計(jì)論文《自然界的遺傳》。1901年Galton和他的學(xué)生Pearson創(chuàng)辦了“Biometrika(生物統(tǒng)計(jì)學(xué)報(bào))”雜志,首次明確“Biometry(生物統(tǒng)計(jì))”一詞。所以后人推崇Galton為生物統(tǒng)計(jì)學(xué)的創(chuàng)始人。2023/9/2914K.Pearson(卡.皮爾遜,英國(guó),1857~1936)

Pearson的一生是統(tǒng)計(jì)研究的一生。他首創(chuàng)頻數(shù)分布表與頻數(shù)分布圖,如今已成為最基本的統(tǒng)計(jì)方法之一;觀察到許多生物的度量并不呈現(xiàn)正態(tài)分布,利用相對(duì)斜率得到矩形分布、J型分布、U型分布或鈴型分布等;1900年獨(dú)立發(fā)現(xiàn)了X2分布,提出了有名的卡方檢驗(yàn)法,后經(jīng)Fisher補(bǔ)充,成為小樣本推斷統(tǒng)計(jì)的早期方法之一;Pearson對(duì)“回歸與相關(guān)”進(jìn)一步作了發(fā)展,在1897~1905年,Pearson還提出復(fù)相關(guān)、總相關(guān)、相關(guān)比等概念,不僅發(fā)展了Galton的相關(guān)理論,還為之建立了數(shù)學(xué)基礎(chǔ)。2023/9/2915W.S.Gosset(歌賽特,英國(guó),1777~1855)

在生產(chǎn)實(shí)踐中對(duì)樣本標(biāo)準(zhǔn)差進(jìn)行了大量研究。于1908年以“Student(學(xué)生)”為筆名在該年的Biometrika上發(fā)表了論文《平均數(shù)的概率誤差》,創(chuàng)立了小樣本檢驗(yàn)代替大樣本檢驗(yàn)的理論,即t分布和t檢驗(yàn)法,也稱為學(xué)生式分布。t檢驗(yàn)已成為當(dāng)代生物統(tǒng)計(jì)工作的基本工具之一,為多元分析理論的形成和應(yīng)用奠定了基礎(chǔ),為此,許多統(tǒng)計(jì)學(xué)家把1908年看作是統(tǒng)計(jì)推斷理論發(fā)展史上的里程碑。2023/9/2916R.A.Fisher(費(fèi)歇爾,英國(guó),1890~1962)

Fisher一生論著頗多,共寫了329篇。他跨進(jìn)統(tǒng)計(jì)學(xué)界是從研究概率分布開始,1915年在Biometrika上發(fā)表論文《無(wú)限總體樣本相關(guān)系數(shù)值的頻率分布》,被稱為現(xiàn)代推斷統(tǒng)計(jì)學(xué)的第一篇論文。1923年發(fā)展了顯著性檢驗(yàn)及估計(jì)理論,提出了F分布和F檢驗(yàn),1918年在《孟德爾遺傳試驗(yàn)設(shè)計(jì)間的相對(duì)關(guān)系》一文中首創(chuàng)“方差”和“方差分析”兩個(gè)概念,1925年提出隨機(jī)區(qū)組和正交拉丁方試驗(yàn)設(shè)計(jì),并在盧桑姆斯坦德農(nóng)業(yè)試驗(yàn)站得到檢驗(yàn)與應(yīng)用,他還在試驗(yàn)設(shè)計(jì)中提出“隨機(jī)化”原則,1938年和Yates合編了FisherYates隨機(jī)數(shù)字表。2023/9/2917另外

Neyman(1894~1981)和S.Pearson進(jìn)行了統(tǒng)計(jì)理論研究,分別與1936和1938年提出一種統(tǒng)計(jì)假說(shuō)檢驗(yàn)學(xué)說(shuō)。P.C.Mabeilinrobis對(duì)作物抽樣調(diào)查、A.Waecl對(duì)序貫抽樣、Finney對(duì)毒理統(tǒng)計(jì)、K.Mather對(duì)生統(tǒng)遺傳學(xué)、F.Yates對(duì)田間試驗(yàn)設(shè)計(jì)等都作出了杰出貢獻(xiàn)。2023/9/2918三、統(tǒng)計(jì)學(xué)在中國(guó)的傳播

我國(guó)在解放前,社會(huì)經(jīng)濟(jì)發(fā)展緩慢,統(tǒng)計(jì)的應(yīng)用和發(fā)展受到了很大的限制。1913年,顧澄教授(1882~?)翻譯了英國(guó)統(tǒng)計(jì)學(xué)家尤爾的著作《統(tǒng)計(jì)學(xué)之理論》(1911),即為英美數(shù)理統(tǒng)計(jì)學(xué)傳入中國(guó)之始。之后又有一些英美統(tǒng)計(jì)著作被翻譯成中文,F(xiàn)isher的理論和方法也很快傳入中國(guó)。在20世紀(jì)30年代,《生物統(tǒng)計(jì)與田間試驗(yàn)》就作為農(nóng)學(xué)系的必修課,1935年王綬(1876~1972)編著出版的《實(shí)用生物統(tǒng)計(jì)法》是我國(guó)出版最早的生物統(tǒng)計(jì)專著之一。隨后1942年范福仁出版了《田間試驗(yàn)技術(shù)》等,這些對(duì)推動(dòng)我國(guó)農(nóng)業(yè)生物統(tǒng)計(jì)和田間試驗(yàn)方法的應(yīng)用都產(chǎn)生了很大影響。2023/9/2919

新中國(guó)成立后,許多學(xué)者翻譯、編著了統(tǒng)計(jì)學(xué)論著,有力的推動(dòng)了數(shù)理統(tǒng)計(jì)方法在中國(guó)的普及和應(yīng)用。1978年12月國(guó)家統(tǒng)計(jì)局在四川峨眉召開了統(tǒng)計(jì)教學(xué)、科研規(guī)劃座談會(huì),全面引進(jìn)了前蘇聯(lián)的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)理論和統(tǒng)計(jì)制度,對(duì)我國(guó)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)的發(fā)展起到了一定的積極作用。這以后有關(guān)統(tǒng)計(jì)學(xué)的教材與論著如雨后春筍般涌現(xiàn),統(tǒng)計(jì)工作和統(tǒng)計(jì)科研迅速發(fā)展。1984年1月1日頒布實(shí)施《中華人民共和國(guó)統(tǒng)計(jì)法》,1987年2月國(guó)家統(tǒng)計(jì)局又發(fā)布《中華人民共和國(guó)統(tǒng)計(jì)法實(shí)施細(xì)則》,1996年5月八屆人大十九次會(huì)議通過(guò)了《關(guān)于修改<中華人民共和國(guó)統(tǒng)計(jì)法>的決定》。隨著計(jì)算機(jī)的迅速普及,統(tǒng)計(jì)電算程序SAS(StatisticalAnalysisSystem)、SPSS(StatisticalPackageforSocialScience)、Excel等的引進(jìn),統(tǒng)計(jì)學(xué)在中國(guó)的應(yīng)用與研究出現(xiàn)了嶄新的局面。2023/9/2920第三節(jié)常用統(tǒng)計(jì)學(xué)術(shù)語(yǔ)一、總體與樣本具有相同性質(zhì)或?qū)傩缘膫€(gè)體所組成的集合稱為總體

(population),它是指研究對(duì)象的全體;組成總體的基本單元稱為個(gè)體(individual);從總體中抽出若干個(gè)體所構(gòu)成的集合稱為樣本(sample);總體又分為有限總體和無(wú)限總體:含有有限個(gè)個(gè)體的總體稱為有限總體(finitudepopuoation);包含有極多或無(wú)限多個(gè)體的總體稱為無(wú)限總體(infinitudepopuoation).2023/9/2921

構(gòu)成樣本的每個(gè)個(gè)體稱為樣本單位;樣本中所包含的個(gè)體數(shù)目叫樣本容量或樣本大小(samplesize),樣本容量常記為n。一般在生物學(xué)研究中,通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。對(duì)于小樣本和大樣本,在一些統(tǒng)計(jì)數(shù)的計(jì)算和分析檢驗(yàn)上是不一樣的。研究的目的是要了解總體,然而能觀測(cè)到的卻是樣本,通過(guò)樣本來(lái)推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。2023/9/2922二、變量與常量

變量,或變數(shù),指相同性質(zhì)的事物間表現(xiàn)差異性或差異特征的數(shù)據(jù)。

常數(shù),表示能代表事物特征和性質(zhì)的數(shù)值,通常由變量計(jì)算而來(lái),在一定過(guò)程中是不變的。2023/9/2923變量定性變量定量變量連續(xù)變量非連續(xù)變量只有整數(shù)出現(xiàn)可以有任何小數(shù)出現(xiàn)2023/9/2924

為了表示總體和樣本的數(shù)量特征,需要計(jì)算出幾個(gè)特征數(shù),包括平均數(shù)和變異數(shù)(極差、方差、標(biāo)準(zhǔn)差等)。描述總體特征的數(shù)量稱為參數(shù)(parameter),也稱參量。常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標(biāo)準(zhǔn)差;描述樣本特征的數(shù)量稱為統(tǒng)計(jì)數(shù)(staistic),也稱統(tǒng)計(jì)量。常用拉丁字母表示統(tǒng)計(jì)數(shù),例如用表示樣本平均數(shù),用S表示樣本標(biāo)準(zhǔn)差。三、參數(shù)與統(tǒng)計(jì)數(shù)2023/9/2925四、效應(yīng)與互作

通過(guò)施加試驗(yàn)處理,引起試驗(yàn)差異的作用稱為效應(yīng)。效應(yīng)是一個(gè)相對(duì)量,而非絕對(duì)量,表現(xiàn)為施加處理前后的差異。效應(yīng)有正效應(yīng)與負(fù)效應(yīng)之分。

互作,又叫連應(yīng),是指兩個(gè)或兩個(gè)以上處理因素間相互作用產(chǎn)生的效應(yīng)?;プ饕灿姓?yīng)(協(xié)同作用)與負(fù)效應(yīng)(拮抗作用)之分。2023/9/2926五、機(jī)誤與錯(cuò)誤變異效應(yīng)誤差隨機(jī)誤差/機(jī)誤(Randomerror)系統(tǒng)誤差/錯(cuò)誤(Systematicerror)2023/9/2927

隨機(jī)誤差,也叫抽樣誤差(samplingerror)。這是由于試驗(yàn)中無(wú)法控制的內(nèi)在和外在的偶然因素所造成。如試驗(yàn)動(dòng)物的初始條件、飼養(yǎng)條件、管理措施等盡管在試驗(yàn)中力求一致,但也不可能達(dá)到絕對(duì)一致,所以隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心也是不可避免的。如果通過(guò)良好的試驗(yàn)設(shè)計(jì)、正確的試驗(yàn)操作,增加抽樣或試驗(yàn)次數(shù),隨機(jī)誤差可能減小,但不可能完全消滅。統(tǒng)計(jì)上的試驗(yàn)誤差一般都指隨機(jī)誤差。隨機(jī)誤差越小,試驗(yàn)精確性越高。2023/9/2928

系統(tǒng)誤差,也叫片面誤差

(lopsidederror)。這是由于試驗(yàn)條件控制不一致、測(cè)量?jī)x器不準(zhǔn)、試劑配制不當(dāng)、試驗(yàn)人員粗心大意使稱量、觀測(cè)、記載、抄錄、計(jì)算中出現(xiàn)錯(cuò)誤等人為因素而引起的。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。只要以認(rèn)真負(fù)責(zé)的態(tài)度和細(xì)心的工作作風(fēng)是完全可以避免的。2023/9/2929六、準(zhǔn)確性與精確性

準(zhǔn)確性(accuracy),也叫準(zhǔn)確度,指在調(diào)查或試驗(yàn)中某一試驗(yàn)指標(biāo)或性狀的觀測(cè)值與其真值接近的程度。設(shè)某一試驗(yàn)指標(biāo)或性狀的真值為μ,觀測(cè)值為

x,若x與μ相差的絕對(duì)值|x-μ|越小,則觀測(cè)值x的準(zhǔn)確性越高;反之則低。

精確性(precision),也叫精確度,指調(diào)查或試驗(yàn)中同一試驗(yàn)指標(biāo)或性狀的重復(fù)觀測(cè)值彼此接近的程度。若觀測(cè)值彼此接近,即任意二個(gè)觀測(cè)值xi、xj

相差的絕對(duì)值|xi-xj|越小,則觀測(cè)值精確性越高;反之則低。2023/9/2930試驗(yàn)資料的整理特征數(shù)的計(jì)算與第二章2023/9/2931第一節(jié):試驗(yàn)資料的搜集與整理一、試驗(yàn)資料的類型二、試驗(yàn)資料的搜集三、試驗(yàn)資料的整理2023/9/2932對(duì)試驗(yàn)資料進(jìn)行分類是統(tǒng)計(jì)歸納的基礎(chǔ)。試驗(yàn)資料類型數(shù)量性狀資料質(zhì)量性狀資料/屬性性狀資料計(jì)數(shù)資料/非連續(xù)變量資料計(jì)量資料/連續(xù)變量資料2023/9/2933

數(shù)量性狀(quantitativecharacter)是指能夠以計(jì)數(shù)和測(cè)量或度量的方式表示其特征的性狀。觀察測(cè)定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料

(dataofquantitativecharacteristics)。數(shù)量性狀資料的獲得有計(jì)數(shù)和測(cè)量?jī)煞N方式,因而數(shù)量性狀資料又分為計(jì)數(shù)資料和計(jì)量資料兩種。一、數(shù)量性狀資料2023/9/2934

1、計(jì)數(shù)資料

指用計(jì)數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個(gè)觀察值只能以整數(shù)表示,在兩個(gè)相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn),因此各觀察值是不連續(xù)的,所以該類資料也稱為非連續(xù)變量資料或間斷變量資料或離散變量資料。2023/9/2935

2、計(jì)量資料

指用測(cè)量或度量法獲得的數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測(cè)定獲得的數(shù)據(jù)資料。其數(shù)據(jù)是用長(zhǎng)度、重量、容積、溫度、濃度等來(lái)表示,要帶單位。這種資料的各個(gè)觀測(cè)值不一定是整數(shù),兩個(gè)相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精確度而定,它們之間的變異是連續(xù)性的,因此計(jì)量資料也稱為連續(xù)變量資料。2023/9/2936

二、質(zhì)量性狀資料

質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測(cè)量的性狀。觀察質(zhì)量性狀而獲得的數(shù)據(jù)就是質(zhì)量性狀資料(dataofqualitativecharacteristics),也稱為屬性性狀資料。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對(duì)其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:2023/9/2937

1、統(tǒng)計(jì)次數(shù)法

在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計(jì)其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,在研究豌豆的花色遺傳時(shí),紅花與白花雜交,子二代中紅花、紫花和白花的株數(shù)分類統(tǒng)計(jì)如下表。株數(shù)頻率紅花26626.6%紫花49449.4%白花24024.0%總計(jì)1000100.0%這種由質(zhì)量性狀數(shù)量化得來(lái)的資料又叫次數(shù)資料。2023/9/2938

2、評(píng)分法

對(duì)某一質(zhì)量性狀分成不同級(jí)別,對(duì)不同級(jí)別進(jìn)行評(píng)分來(lái)表示其性狀差異的方法。從而將質(zhì)量性狀進(jìn)行數(shù)量化,以便統(tǒng)計(jì)分析。2023/9/2939第一節(jié):試驗(yàn)資料的搜集與整理一、試驗(yàn)資料的類型二、試驗(yàn)資料的搜集三、試驗(yàn)資料的整理2023/9/2940調(diào)查試驗(yàn)資料搜集的方法2023/9/2941一、調(diào)查

調(diào)查是對(duì)已經(jīng)存在的事情的資料按某種方案進(jìn)行收集的方法。資料的調(diào)查又可以分為兩種:普查和抽樣調(diào)查。1、普查

是對(duì)研究對(duì)象的全部個(gè)體逐一進(jìn)行調(diào)查的方法。普查一般要求在一定的時(shí)間或范圍進(jìn)行,要求準(zhǔn)確和全面。2023/9/29422、抽樣調(diào)查

是根據(jù)一定的原則從研究對(duì)象中抽取一部分具有代表性的個(gè)體進(jìn)行調(diào)查的方法。通過(guò)抽樣將獲得的樣本資料進(jìn)行統(tǒng)計(jì)處理,然后利用樣本的特征數(shù)對(duì)總體進(jìn)行推斷。生物學(xué)研究中,進(jìn)行普查的情況較少,多數(shù)情況下還是進(jìn)行抽樣調(diào)查。隨機(jī)抽樣必須滿足2個(gè)條件:一是總體中每個(gè)個(gè)體被抽中的機(jī)會(huì)是均等的;二是總體中任意一個(gè)個(gè)體是相互獨(dú)立的,是否被抽中不受其他個(gè)體的影響。2023/9/2943二、試驗(yàn)

試驗(yàn)是對(duì)已有的或沒(méi)有的事物加以處理的方法。常見的試驗(yàn)設(shè)計(jì)方法有:對(duì)比設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、平衡不完全區(qū)組設(shè)計(jì)、裂區(qū)設(shè)計(jì)、拉丁方設(shè)計(jì)、正交設(shè)計(jì)、正交旋轉(zhuǎn)設(shè)計(jì)等等。試驗(yàn)設(shè)計(jì)須遵循的三大原則是:隨機(jī)、重復(fù)和局部控制。2023/9/2944第一節(jié):試驗(yàn)資料的搜集與整理一、試驗(yàn)資料的類型二、試驗(yàn)資料的搜集三、試驗(yàn)資料的整理2023/9/2945三、試驗(yàn)資料的整理(一)原始資料的檢查與核對(duì)調(diào)查試驗(yàn)原始數(shù)據(jù)核對(duì)檢查訂正

檢查和核對(duì)原始資料的目的:確保原始資料的完整性和正確性。2023/9/2946三、試驗(yàn)資料的整理(二)次數(shù)分布表統(tǒng)計(jì)表的結(jié)構(gòu)和要求:結(jié)構(gòu)簡(jiǎn)單,層次分明,安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確。總橫標(biāo)目(或空白)縱標(biāo)目1縱標(biāo)目2……橫標(biāo)目1橫標(biāo)目2數(shù)字資料……表號(hào)標(biāo)題1、標(biāo)題簡(jiǎn)明扼要、準(zhǔn)確地說(shuō)明表的內(nèi)容,有時(shí)須注明時(shí)間、地點(diǎn)。2、標(biāo)目標(biāo)目分橫標(biāo)目和縱標(biāo)目?jī)身?xiàng)。橫標(biāo)目列在表的左側(cè),縱標(biāo)目列在表的上端,標(biāo)目需注明計(jì)算單位,如%、kg、cm等等。3、數(shù)字一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致,無(wú)數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。4、線條多用三線表,上下兩條邊線略粗。2023/9/2947三、試驗(yàn)資料的整理1計(jì)數(shù)資料的整理計(jì)數(shù)資料基本上采用單項(xiàng)式分組法進(jìn)行整理。特點(diǎn):用樣本變量自然值進(jìn)行分組,每組用一個(gè)或幾個(gè)變量值來(lái)表示。2023/9/29481712141314121114131614141317151414161414151514141411131214131413151413151413141516161413141513151315151514141614151713161416151314141414161213121412151615161413151714131412171415表2-1

100只來(lái)亨雞每月的產(chǎn)蛋數(shù)11~17來(lái)亨雞每月產(chǎn)蛋數(shù)變動(dòng)范圍:分為7組統(tǒng)計(jì)各組次數(shù)計(jì)算頻率和累積頻率制表2023/9/2949每月產(chǎn)蛋數(shù)次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.00表2-2

100只來(lái)亨雞每月產(chǎn)蛋數(shù)次數(shù)分布表2023/9/2950每月產(chǎn)蛋數(shù)次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.28

14350.350.6315210.210.8416110.110.951750.051.00表2-2

100只來(lái)亨雞每月產(chǎn)蛋數(shù)次數(shù)分布表1自然值進(jìn)行分組,最大值17,最小值11。2數(shù)據(jù)主要集中在14,向兩側(cè)分布逐漸減少。2023/9/2951表2-3小麥品種300個(gè)麥穗穗粒數(shù)的次數(shù)分布表每穗粒數(shù)次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent

18-2230.01000.010023-27180.06000.0700

28-32

380.12670.1967

33-37510.17000.3667

38-42680.22670.5934

43-47530.17660.7700

48-52410.13670.906753-57220.07330.980058-6260.02001.000045組?9組2023/9/2952三、試驗(yàn)資料的整理2計(jì)量資料的整理計(jì)量資料一般采用組距式分組法。全距組數(shù)組距組限歸組制表2023/9/2953表2-4

150尾鰱魚體長(zhǎng)(cm)56496278414765455855596569627352526051627866455858605752514856465870727677566658585553506563576585

5958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263(1)求全距,又稱極差

(range):R=Xmax-Xmin

=85-37=48(cm)2023/9/2954(2)確定組數(shù)和組距(classboundary)

組數(shù)是根據(jù)樣本觀測(cè)數(shù)的多少及組距的大小來(lái)確定的,同時(shí)考慮到對(duì)資料要求的精確度以及進(jìn)一步計(jì)算是否方便。組數(shù)組距多小統(tǒng)計(jì)數(shù)精確,計(jì)算不方便少大統(tǒng)計(jì)數(shù)不精確,計(jì)算方便2023/9/2955組數(shù)的確定樣本容量分組數(shù)

30~60

5~860~100

7~10100~200

9~12200~500

10~18>500

15~30表2-5樣本容量與分組數(shù)的關(guān)系組距的確定即每組內(nèi)的上下限范圍。組距=全距/組數(shù)=48/10=4.810組5cm2023/9/2956(3)確定組限(classlimit)和組中值(classmidvalue)組限

是指每個(gè)組變量值的起止界限。上限下限組中值是兩個(gè)組限的中間值。組中值=下限+上限

2=組距2下限+=組距2上限-2023/9/2957表2-4

150尾鰱魚體長(zhǎng)(cm)56496278414765455855596569627352526051627866455858605752514856465870727677566658585553506563576585

5958546248634661625738585254556652485675725737

467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263最小一組的下限必須小于資料中的最小值,最大一組的上限必須大于資料中的最大值;臨界值就高不就低。35~,40~,45~,…,85~。2023/9/2958(4)分組

確定好組數(shù)和各組上下限后,可按原始資料中各觀測(cè)值的次序,將各個(gè)數(shù)值歸于各組,計(jì)算各組的觀測(cè)數(shù)次數(shù)、頻率、累積頻率,制成一個(gè)次數(shù)分布表。計(jì)數(shù)的方法卡片法唱票法畫“正”字畫“”2023/9/2959

組限組中值次數(shù)頻率累積頻率

FrequencyPercentCumulativePercent35~37.530.02000.020040~42.540.02670.046745~47.5170.11330.160050~52.5280.18670.3467

55~57.540

0.26660.613360~62.5250.16670.780065~67.5170.11330.897370~72.560.04000.933375~77.570.04670.980080~82.520.01330.993385~87.510.00671.0000表2-6

150尾鰱魚體長(zhǎng)的次數(shù)分布表2023/9/2960三、試驗(yàn)資料的整理(三)次數(shù)分布圖和頻率分布圖定義:把次數(shù)(頻率)分布資料畫成統(tǒng)計(jì)圖形。特點(diǎn):直觀、形象包括:條形圖、直方圖、多邊形圖、餅圖和散點(diǎn)圖2023/9/2961三、試驗(yàn)資料的整理統(tǒng)計(jì)圖繪制的基本要求:(1)標(biāo)題簡(jiǎn)明扼要,列于圖的下方;(2)縱、橫兩軸應(yīng)有刻度,注明單位;(3)橫軸由左至右,縱軸由下而上,數(shù)值由小到大;圖形長(zhǎng)寬比例約5:4或6:5;(4)圖中需用不同顏色或線條代表不同事物時(shí),應(yīng)有圖例說(shuō)明2023/9/2962圖2.1月產(chǎn)蛋數(shù)次數(shù)分布柱形圖圖2.2月產(chǎn)蛋數(shù)頻率分布柱形圖條形圖(barchart),又稱柱形圖計(jì)數(shù)資料特點(diǎn):柱形之間要間隔一定的距離

屬性資料2023/9/29632餅圖(piechart)圖1來(lái)亨雞月產(chǎn)蛋次數(shù)分布圖計(jì)數(shù)資料質(zhì)量性狀資料35%19%21%11%5%7%2%2023/9/2964圖2.3鰱魚體長(zhǎng)次數(shù)分布圖3直方圖(histogram),又稱矩形圖計(jì)量資料354045505560657075808590特點(diǎn):各組之間沒(méi)有距離

2023/9/2965三、試驗(yàn)資料的整理圖2.3鰱魚體長(zhǎng)次數(shù)分布圖3540455055606570758085902023/9/29664多邊形圖(polygon),又稱折線圖(broken-linechart)計(jì)量資料圖2.3鰱魚體長(zhǎng)次數(shù)分布圖2023/9/29675散點(diǎn)圖(scatter)123456432112345643211234564321a.正向直線關(guān)系b.負(fù)向直線關(guān)系c.曲線關(guān)系2023/9/2968試驗(yàn)資料的整理特征數(shù)的計(jì)算與第二章2023/9/2969第二節(jié)試驗(yàn)資料特征數(shù)的計(jì)算集中性

是變量在趨勢(shì)上有著向某一中心聚集,或者說(shuō)以某一數(shù)值為中心而分布的性質(zhì)。離散性

是變量有著離中分散變異的性質(zhì)。變量的分布具有兩種明顯的基本特征:集中性和離散性。2023/9/2970集中性離散性平均數(shù)變異數(shù)算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)極差方差標(biāo)準(zhǔn)差變異系數(shù)調(diào)和平均數(shù)特征數(shù)2023/9/2971一、平均數(shù)

平均數(shù)平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,是計(jì)量資料的代表值,表示資料中觀測(cè)數(shù)的中心位置,并且可作為資料的代表與另一組相比較,以確定二者的差異情況。2023/9/2972一、平均數(shù)(一)平均數(shù)的種類算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)調(diào)和平均數(shù)2023/9/2973一、平均數(shù)1.算術(shù)平均數(shù)(arithmeticmean)定義:總體或樣本資料中所有觀測(cè)數(shù)的總和除以觀測(cè)數(shù)的個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)、均數(shù)或均值??傮w:μ=x1+x2+x3+…+xNN=N1樣本:=x1+x

x2+x3+…+xnnx

x=n12023/9/2974一、平均數(shù)2.中位數(shù)(median)

資料中所有觀測(cè)數(shù)依大小順序排列,居于中間位置的觀測(cè)數(shù)稱為中位數(shù)或中數(shù)。Md2023/9/29751、當(dāng)觀測(cè)值個(gè)數(shù)n為奇數(shù)時(shí),(n+1)/2位置的觀測(cè)值,即x(n+1)/2為中位數(shù):

Md=

2、當(dāng)觀測(cè)值個(gè)數(shù)為偶數(shù)時(shí),n/2和(n/2+1)位置的兩個(gè)觀測(cè)值之和的1/2為中位數(shù),即:

2023/9/2976一、平均數(shù)3.眾數(shù)(mode)

資料中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值或中點(diǎn)值。M0注意:(1)對(duì)于某些數(shù)據(jù)而言,如均勻分布,并不存在眾數(shù);(2)對(duì)于某些數(shù)據(jù)存在兩個(gè)或兩個(gè)以上的眾數(shù);(3)主要用來(lái)描述頻率分布。2023/9/2977一、平均數(shù)4.幾何平均數(shù)(geometricmean)資料中有n個(gè)觀測(cè)數(shù),其乘積開n次方所得數(shù)值。G適用范圍:幾何均數(shù)適用于變量X為對(duì)數(shù)正態(tài)分布,經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈正態(tài)分布的資料。G=2023/9/2978一、平均數(shù)5.調(diào)和平均數(shù)(harmonicmean)資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。H適用范圍:主要用于反映生物不同階段的平均增長(zhǎng)率或不同規(guī)模的平均規(guī)模。H=12023/9/2979一、平均數(shù)(二)算術(shù)平均數(shù)的計(jì)算方法直接計(jì)算法減去常數(shù)法加權(quán)平均法2023/9/29801、直接計(jì)算法主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。例:隨機(jī)抽取20株小麥測(cè)量它們的株高(cm)分別為:

79858486848382838384818081828182828280

求小麥的平均株高。=Σxn=20(82+79+…+80)=82.3(cm)2023/9/29812、減去(加上)常數(shù)法

若變量的值都比較大(或都比較?。医咏骋怀?shù)a時(shí),可將它們的值都減去(或加上)常數(shù)a,得到一組新的數(shù)據(jù),在計(jì)算其平均數(shù)。例:設(shè)a為80(cm)則有:

798584868483828383

2-154643233818081828182828280

4101212220=20(2-1+5+…+0)=82.3(cm)+80“-80”2023/9/29823、加權(quán)平均法

對(duì)于樣本含量n>30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為:若為計(jì)數(shù)資料,不分組,且Σf=n,此時(shí)直接用自然值乘以次數(shù)來(lái)計(jì)算,即=Σfx/n。

第i組的次數(shù)fi是權(quán)衡第i個(gè)自然值xi在資料中所占比重大小的數(shù)量,因此將fi稱為是xi的“權(quán)數(shù)”,加權(quán)法也由此而得名。2023/9/2983例:=201=82.3(cm)×(79×1+80×2+…+86×1)株高x次數(shù)ffx7917980216081324382649283324984325285185861862023/9/2984式中:—

第i組的組中值;

第i組的次數(shù);

分組數(shù)

若為分組資料,則用每組組中值乘以該組次數(shù)之和再除以總次數(shù)來(lái)計(jì)算:2023/9/2985例:將100頭長(zhǎng)白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。

表100頭長(zhǎng)白母豬仔豬一月窩重次數(shù)分布表組別組中值(x)次數(shù)(f)fx10~1534520~25615030~352691040~4530135050~5524132060~65852070~753225合計(jì)1004520即這100頭長(zhǎng)白母豬仔豬一月齡平均窩重為45.2kg2023/9/2986

計(jì)算若干個(gè)來(lái)自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)采用加權(quán)法計(jì)算。

例:某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體重為多少?此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以兩個(gè)牛群牛的頭數(shù)為權(quán),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即:2023/9/2987離均差之和等于零。離均差平方和最小。Σ(x-x)=0Σ(x-x)2<Σ(x-a)2

(三)算術(shù)平均數(shù)的重要性質(zhì)2023/9/2988Σ(x-x-)=x1+x2+…….+xn–n.x-

=Σx-nΣx/n=Σx-Σx=0Σ(x-a)2=Σ[(x-x-)+(x--a)]2=Σ[(x-x-)2+2(x-x-)(x--a)+(x--a)2]=Σ(x-x-)2+Σ(x--a)2=Σ(x-x-)2+n(x--a)2

2023/9/2989一、平均數(shù)(四)算術(shù)平均數(shù)的作用(1)指出一組數(shù)據(jù)資料內(nèi)變量的中心位置,標(biāo)志著資料所代表性狀的數(shù)量水平和質(zhì)量水平。(2)作為樣本或資料的代表數(shù)與其他資料進(jìn)行比較。(3)通過(guò)平均數(shù)提供計(jì)算樣本變異數(shù)的基本數(shù)據(jù)。(4)用樣本的平均數(shù)估計(jì)總體平均數(shù)。2023/9/2990二、變異數(shù)變異數(shù)的種類極差方差標(biāo)準(zhǔn)差變異系數(shù)2023/9/2991二、變異數(shù)(一)極差(全距,range)

極差是數(shù)據(jù)分布的兩端變異的最大范圍,即樣本變量值最大值和最小值之差,用R表示。它是資料中各觀測(cè)值變異程度大小的最簡(jiǎn)便的統(tǒng)計(jì)量。例:150尾鰱魚體長(zhǎng)R=85-37=48(cm)R=max{x1,x2,……,xn}-min{x1,x2,……,xn}={x1,x2,……,xn}max-{x1,x2,……,xn}min2023/9/2992二、變異數(shù)簡(jiǎn)單明了當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用極差。(1)除了最大、最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異。優(yōu)點(diǎn)缺點(diǎn)用途(2)樣本較大時(shí)抽到較大值與較小值的可能性也較大,因而樣本極差也較大,故樣本含量相差較大時(shí),不宜用極差來(lái)比較分布的離散度。極差2023/9/2993二、變異數(shù)如何準(zhǔn)確地表示樣本內(nèi)各個(gè)觀測(cè)值的變異程度平均數(shù)可以求出各個(gè)觀測(cè)值與平均數(shù)的離差,即離均差。離均差可以反映出一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度。離均差之和為零。(x-x)=0?

方差2023/9/2994二、變異數(shù)平方和(SS)平方和的平均數(shù)(x-x)2(x-x)2

n2023/9/2995二、變異數(shù)(x-x)2n(x-x)2n-1自由度(degreeoffreedom)2023/9/2996二、變異數(shù)(x-x)2n-1均方(meansquare,MS)方差(variance)2023/9/2997二、變異數(shù)(二)方差(Variance)(x-x)2n-1S2=σ2=(x-μ)2N樣本總體2023/9/2998二、變異數(shù)

樣本方差帶有原觀測(cè)單位的平方單位,在僅表示一個(gè)資料中各觀測(cè)值的變異程度而不作其它分析時(shí),常需要與平均數(shù)配合使用,這時(shí)應(yīng)將平方單位還原,即求出樣本方差的平方根。標(biāo)準(zhǔn)差2023/9/2999二、變異數(shù)(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)S

=(x-x)2n-1σ=(x-μ)2N樣本總體2023/9/29100二、變異數(shù)(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)(x-x)2n-1S

=S

=x2-x)2(nn-12023/9/29101二、變異數(shù)x=411x2=18841X’=6X’2=76

表2-89名男子前臂長(zhǎng)(cm)標(biāo)準(zhǔn)差計(jì)算

前臂長(zhǎng)x2x’=x-45x’245202500421764-39441936-11411681-4164722092450250052547220924462116114924014162023/9/29102二、變異數(shù)18841-411*41199-1S==3.0(cm)76-6*699-1S==3.0(cm)2023/9/29103二、變異數(shù)(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)fx2

fx)2(n-n-1S=2023/9/29104例:=201=82.3(cm)×(79×1+80×2+…+86×1)株高x次數(shù)ffxfx279179624180216012800813243196838264924034483324920667843252211688518572258618673962023/9/29105二、變異數(shù)(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)特性標(biāo)準(zhǔn)差的大小,受多個(gè)觀測(cè)數(shù)影響,如果觀測(cè)數(shù)與觀測(cè)數(shù)間差異較大,則離均差也大,因而標(biāo)準(zhǔn)差也大,反之則小。1各觀測(cè)數(shù)加上或減去一個(gè)常數(shù),其標(biāo)準(zhǔn)差不變;2各觀測(cè)數(shù)乘以或除以一個(gè)常數(shù)a,其標(biāo)準(zhǔn)差擴(kuò)大或縮小a倍。2023/9/29106二、變異數(shù)(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)3正態(tài)分布2s3s68.27%95.46%99.73%2023/9/29107二、變異數(shù)(三)標(biāo)準(zhǔn)差(standarddeviation,Sd)作用1表示變量分布的離散程度。4估計(jì)平均數(shù)的標(biāo)準(zhǔn)誤。3進(jìn)行平均數(shù)的區(qū)間估計(jì)和變異系數(shù)計(jì)算。2可以概括估計(jì)出變量的次數(shù)分布及各類觀測(cè)數(shù)在總體中所占的比例。2023/9/29108二、變異數(shù)(四)變異系數(shù)(coefficientofvariability,CV)定義:樣本的標(biāo)準(zhǔn)差除以樣本平均數(shù),所得到的比值就是變異系數(shù)。CV=s/x×100%特點(diǎn):是樣本變量的相對(duì)變異量,不帶單位??梢员容^不同樣本相對(duì)變異程度的大小。2023/9/29109二、變異數(shù)(四)變異系數(shù)(coefficientofvariability,CV)中粳“農(nóng)墾57”大田,穗粒數(shù)44.6,標(biāo)準(zhǔn)差18.9豐產(chǎn)田,穗粒數(shù)65.0,標(biāo)準(zhǔn)差18.3大田,CV=42.38%豐產(chǎn)田,CV=28.15%豐產(chǎn)田中粳穗粒數(shù)的整齊度優(yōu)于大田2023/9/29110二、變異數(shù)(四)變異系數(shù)(coefficientofvariability,CV)用途1比較度量衡單位不同的多組資料的變異度。例:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg。比較身高與體重的變異情況。身高:CV=2.98%體重:CV=9.23%該地20歲男子體重的變異大于身高的變異。2023/9/29111二、變異數(shù)(四)變異系數(shù)(coefficientofvariability,CV)用途2比較均數(shù)相差懸殊的多組資料的變異度

表某地不同年齡組男子身高(CM)的變異程度年齡組人數(shù)均數(shù)標(biāo)準(zhǔn)差變異系數(shù)3-3.5歲10096.13.10.03230-35歲100170.25.00.032023/9/29112概率概率分布與第三章2023/9/29113第一節(jié):概率基礎(chǔ)知識(shí)一、概率的概念二、概率的計(jì)算三、概率的分布四、大數(shù)定律2023/9/29114一、概率基本概念(一)事件定義:在一定條件下,某種事物出現(xiàn)與否就稱為是事件。自然界和社會(huì)生活上發(fā)生的現(xiàn)象是各種各樣的,常見的有兩類。2023/9/291151、在一定條件下必然出現(xiàn)某種結(jié)果或必然不出現(xiàn)某種結(jié)果。確定性事件必然事件(U)(certainevent)不可能事件(V)(impossibleevent)一、概率基本概念2023/9/291162、在一定條件下可能發(fā)生也可能不發(fā)生。隨機(jī)事件(randomevent)不確定事件(indefiniteevent)一、概率基本概念為了研究隨機(jī)現(xiàn)象,需要進(jìn)行大量重復(fù)的調(diào)查、實(shí)驗(yàn)、測(cè)試等,這些統(tǒng)稱為試驗(yàn)。2023/9/29117一、概率基本概念(二)頻率(frequency)若在相同的條件下,進(jìn)行了n次試驗(yàn),在這n次試驗(yàn)中,事件A出現(xiàn)的次數(shù)m稱為事件A出現(xiàn)的頻數(shù),比值m/n稱為事件A出現(xiàn)的頻率(frequency),記為W(A)=m/n。0≤W(A)≤12023/9/29118一、概率基本概念

表3-1玉米種子發(fā)芽試驗(yàn)結(jié)果種子總數(shù)(n)1020501002005001000發(fā)芽種子數(shù)(m)9194791186458920種子發(fā)芽率(m/n)0.9000.9500.9400.9100.9300.9180.920

種子發(fā)芽與否是不能事先確定的,但從表中可以看出,試驗(yàn)隨著n值的不同,種子發(fā)芽率也不相同,當(dāng)n充分大時(shí),發(fā)芽率在0.92附近擺動(dòng)。例:2023/9/29119一、概率基本概念

頻率表明了事件頻繁出現(xiàn)的程度,因而其穩(wěn)定性說(shuō)明了隨機(jī)事件發(fā)生的可能性大小,是其本身固有的客觀屬性,提示了隱藏在隨機(jī)現(xiàn)象中的規(guī)律性。概率2023/9/29120一、概率基本概念(三)概率(probability,P)概率的統(tǒng)計(jì)定義:設(shè)在相同的條件下,進(jìn)行大量重復(fù)試驗(yàn),若事件A的頻率穩(wěn)定地在某一確定值p的附近擺動(dòng),則稱p為事件A出現(xiàn)的概率。P(A)=p統(tǒng)計(jì)概率(statisticsprobability)后驗(yàn)概率(posteriorprobability)2023/9/29121統(tǒng)計(jì)概率一、概率基本概念

拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄實(shí)驗(yàn)者投擲次數(shù)發(fā)生正面朝上的次數(shù)頻率(m/n)

蒲豐404020480.5069K皮爾遜1200060190.5016K皮爾遜24000120120.5005隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這個(gè)事件發(fā)生的頻率穩(wěn)定接近0.5,我們稱0.5作為這個(gè)事件的概率。2023/9/29122一、概率基本概念(三)概率(probability,P)P(A)=p=lim

在一般情況下,隨機(jī)事件的概率P是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí),隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。mnmn2023/9/29123概率的古典定義一、概率基本概念對(duì)于某些隨機(jī)事件,不用進(jìn)行多次重復(fù)試驗(yàn)來(lái)確定其概率,而是根據(jù)隨機(jī)事件本身的特性直接計(jì)算其概率。隨機(jī)事件(1)試驗(yàn)的所有可能結(jié)果只有有限個(gè),即樣本空間中的基本事件只有有限個(gè);(2)各個(gè)試驗(yàn)的可能結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;(3)試驗(yàn)的所有可能結(jié)果兩兩互不相容。2023/9/29124概率的古典定義一、概率基本概念具有上述特征的隨機(jī)試驗(yàn),稱為古典概型(classicalmodel).設(shè)樣本空間有n個(gè)等可能的基本事件所構(gòu)成,其中事件A包含有m個(gè)基本事件,則事件A的概率為m/n,即P(A)=m/n。古典概率(classicalprobability)先驗(yàn)概率(priorprobability)2023/9/29125一、概率基本概念12345678910隨機(jī)抽取一個(gè)球,求下列事件的概率;(1)事件A=抽得一個(gè)編號(hào)<4(2)事件B=抽得一個(gè)編號(hào)是2的倍數(shù)

該試驗(yàn)樣本空間由10個(gè)等可能的基本事件構(gòu)成,即n=10,而事件A所包含的基本事件有3個(gè),即抽得編號(hào)為1、2、3中的任何一個(gè),事件A便發(fā)生。P(A)=3/10=0.3P(B)=5/10=0.52023/9/29126一、概率基本概念12345678910A=“一次取一個(gè)球,取得紅球的概率”10個(gè)球中取一個(gè)球,其可能結(jié)果有10個(gè)基本事件(即每個(gè)球被取到的可能性是相等的),即n=10事件A:取得紅球,則A事件包含3個(gè)基本事件,即m=3P(A)=3/10=0.32023/9/29127一、概率基本概念12345678910B=“一次取5個(gè)球,其中有2個(gè)紅球的概率”10個(gè)球中任意取5個(gè),其可能結(jié)果有C105個(gè)基本事件,即n=C105事件B=5個(gè)球中有2個(gè)紅球,則B包含的基本事件數(shù)m=C32C73P(B)=C32C73/

C105=0.4172023/9/29128一、概率基本概念0≤P(A)≤1

任何事件P(U)=1

必然事件P(V)=0

不可能事件0<P(A)<1

隨機(jī)事件概率的基本性質(zhì)2023/9/29129概率的計(jì)算第二部分2023/9/29130二、概率的計(jì)算(一)事件的相互關(guān)系和事件積事件互斥事件對(duì)立事件獨(dú)立事件完全事件系2023/9/29131二、概率的計(jì)算1和事件

事件A和事件B中至少有一個(gè)發(fā)生而構(gòu)成的新事件稱為事件A和事件B的和事件,記作A+B。n個(gè)事件的和,可表示為A1+A2+…+An2023/9/29132二、概率的計(jì)算2積事件

事件A和事件B中同時(shí)發(fā)生而構(gòu)成的新事件稱為事件A和事件B的積事件,記作A?B。n個(gè)事件的積,可表示為A1?

A2?

…?An2023/9/29133二、概率的計(jì)算3互斥事件(互不相容事件)

事件A和事件B不能同時(shí)發(fā)生,則稱這兩個(gè)事件A和B互不相容或互斥。A?B=Vn個(gè)事件兩兩互不相容,則稱這n個(gè)事件互斥。如血型:A\B\O\AB\2023/9/29134二、概率的計(jì)算4對(duì)立事件事件A和事件B必有一個(gè)發(fā)生,但二者不能同時(shí)發(fā)生,且A和B的和事件組成整個(gè)樣本空間。即A+B=U,AB=V。我們稱事件B為事件A的對(duì)立事件。如:新生兒男或女。B=A2023/9/29135二、概率的計(jì)算5獨(dú)立事件事件A和事件B的發(fā)生無(wú)關(guān),事件B的發(fā)生與事件A的發(fā)生無(wú)關(guān),則事件A和事件B為獨(dú)立事件。如:種子發(fā)芽。如果多個(gè)事件A1、A2、A3、…、An

彼此獨(dú)立,則稱之為獨(dú)立事件群。2023/9/29136二、概率的計(jì)算6完全事件系如果多個(gè)事件A1、A2、A3、…、An兩兩互斥,且每次試驗(yàn)結(jié)果必然發(fā)生其一,則稱事件A1、A2、A3、…、An為完全事件系。完全事件系的和事件概率為1,任何一個(gè)事件發(fā)生的概率為1/n。即:

P(A1+A2+…+An)=12023/9/29137二、概率的計(jì)算(二)概率的計(jì)算法則

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論