生物統(tǒng)計學(xué)(1)_第1頁
生物統(tǒng)計學(xué)(1)_第2頁
生物統(tǒng)計學(xué)(1)_第3頁
生物統(tǒng)計學(xué)(1)_第4頁
生物統(tǒng)計學(xué)(1)_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、概 論一、生物統(tǒng)計學(xué)的概念(一)統(tǒng)計學(xué) 統(tǒng)計學(xué)統(tǒng)計學(xué)(Statistics)是數(shù)學(xué)的一個分支,用以搜集、整理、分析數(shù)據(jù),進(jìn)而推導(dǎo)分析結(jié)果的科學(xué)方法,因而有學(xué)者也將統(tǒng)計學(xué)統(tǒng)稱為統(tǒng)計方法(Statistical Method)。統(tǒng)計不但用來簡化和表示一組數(shù)據(jù),而且主要是在探討如何從一組數(shù)據(jù)的總體中(總體,Population),以某一抽取過程(抽樣,Sampling)抽出部分?jǐn)?shù)據(jù)(樣本,Sample),來研究如何利用這一部分?jǐn)?shù)據(jù)去估計、檢驗(yàn)或預(yù)測數(shù)據(jù)總體的某些未知的特性值。 1搜集數(shù)據(jù) 統(tǒng)計工作的第一步,即要搜集相關(guān)的統(tǒng)計數(shù)據(jù),無論是原始數(shù)據(jù)(如已調(diào)查或?qū)嶒?yàn)所得的數(shù)據(jù))還是二次數(shù)據(jù)(例如政府公布的

2、統(tǒng)計數(shù)據(jù))。統(tǒng)計數(shù)據(jù)的搜集必須切合統(tǒng)計分析的目的,否則將浪費(fèi)許多時間和金錢,卻得到一大堆無法使用的數(shù)據(jù)。 2.整理數(shù)據(jù) 所搜集的數(shù)據(jù)通常是雜亂無章的,尤其是原始數(shù)據(jù)。所以需要加以整理,以計算出想要的統(tǒng)計數(shù)字或繪制出統(tǒng)計圖表。此部分包括分類、歸類、列表和繪圖,通常是用電腦來加以整理。 3分析數(shù)據(jù) 所計算出的統(tǒng)計數(shù)字仍只是一大堆數(shù)字結(jié)果,并不是每個人都能夠看得懂,必須由受過統(tǒng)計訓(xùn)練的專家來分析,才能解釋出其涵義。例如,分析其集中趨勢、方差、差異性、相關(guān)性、周期性等。此部分即描述性統(tǒng)計(Descriptive Statistics),主要是描述和敘述事物的現(xiàn)象。 4推論數(shù)據(jù) 如果分析對象只是一部分樣

3、本,則仍需要推論其分析結(jié)果,來推斷總體的可能結(jié)果。例如,用樣本統(tǒng)計量推算總體的參數(shù)(Parameter),或以樣本的結(jié)果證實(shí)或否定一些有關(guān)總聲的假設(shè)。此部分即推論統(tǒng)計的工作,利用樣本所收集的數(shù)據(jù)推論總體的狀況。(二)生物統(tǒng)計學(xué) 生物統(tǒng)計學(xué)生物統(tǒng)計學(xué)是統(tǒng)計學(xué)在生物學(xué)研究中的應(yīng)用,它是用統(tǒng)計學(xué)的原理和方法來分析和解釋生物界各種現(xiàn)象和試驗(yàn)調(diào)查資料的科學(xué)。 隨著生物學(xué)研究的不斷發(fā)展,運(yùn)用統(tǒng)計學(xué)方法來認(rèn)識、推斷和解釋生命過程中的各種現(xiàn)象,也越來越廣泛。盡管生物統(tǒng)計在應(yīng)用過程中曾經(jīng)受到過一些批評,但絕大多數(shù)生物學(xué)家、農(nóng)學(xué)家、園藝學(xué)家、育種學(xué)家、畜牧學(xué)家、醫(yī)學(xué)工作者以及人口學(xué)家還是在自己的研究領(lǐng)域越來越普遍

4、地應(yīng)用生物統(tǒng)計分析方法,并把它變?yōu)閷W(xué)科自身發(fā)展的需要。 生物學(xué)研究的對象是復(fù)雜的生物有機(jī)體,與非生物相比,它具有更加特殊的復(fù)雜性。 生物有機(jī)體的生長發(fā)育、生理活動、生化變化及有機(jī)體受外界環(huán)境因素的影響等,都使生物學(xué)研究的試驗(yàn)結(jié)果有較大的差異性,這種差異性往往會掩蓋生物體本身的特殊規(guī)律。在生物學(xué)研究中,大量試驗(yàn)資料內(nèi)在的規(guī)律性,也容易被雜亂無章的數(shù)據(jù)所迷惑,容易被人們所忽視。因此,在生物學(xué)研究中,應(yīng)用生物統(tǒng)計學(xué)就顯得特別重要。生物學(xué)研究的實(shí)踐證明,只有正確地應(yīng)用生物統(tǒng)計原理和分析方法對生物學(xué)試驗(yàn)進(jìn)行合理設(shè)計,對數(shù)據(jù)進(jìn)行客觀分析,才能得出科學(xué)的結(jié)論。 在對事物的研究過程中,人們往往是通過某事物的一

5、部分(樣本),來估計事物全部(總體)的特征的,目的是為了以樣本的特征對未知總體進(jìn)行推斷,從特殊推導(dǎo)一般,對所研究的總體作出合乎邏輯的推論,得到對客觀并物本質(zhì)的和規(guī)律性的認(rèn)識。在生物學(xué)研究中,我們所期望的是總體,而不是樣本。但是在具體的試驗(yàn)過程中,我們所得到的卻是樣本而不是總體。因此,從某種意義上講,生物統(tǒng)計學(xué)是研究生命過程中以樣本來推斷總體的一門學(xué)科。 生物統(tǒng)計學(xué)是在生物學(xué)研究過程中,逐漸與數(shù)學(xué)的發(fā)展相結(jié)合所形成的,它是應(yīng)用數(shù)學(xué)的一個分支,屬于生物數(shù)學(xué)的范疇。生物統(tǒng)計學(xué)以數(shù)學(xué)的概率論為基礎(chǔ),也涉及到數(shù)列、排列、組合、矩陣、微積分等知識。生物統(tǒng)計學(xué)作為一個重要的工具課,一般不過多討論數(shù)學(xué)原理,而

6、主要偏重于統(tǒng)計原理的介紹和具體分析方法的應(yīng)用。二、生物統(tǒng)計學(xué)的主要內(nèi)容 生物統(tǒng)計學(xué)的基本內(nèi)容,概括起來主要包括試驗(yàn)設(shè)計和統(tǒng)計分析兩大部分。 在試驗(yàn)設(shè)計中,主要介紹試驗(yàn)設(shè)計的有關(guān)概念、試驗(yàn)設(shè)計的基本原則、試驗(yàn)設(shè)計方案的制定、常用試驗(yàn)設(shè)計方法,其中主要的有對比設(shè)計、隨機(jī)區(qū)組設(shè)計、拉丁方設(shè)計、裂區(qū)設(shè)計以及正交設(shè)計等。 在統(tǒng)計分析中,主要包括數(shù)據(jù)資料的搜集和整理、數(shù)據(jù)特征的計算、統(tǒng)計推斷、方差分析、回歸和相關(guān)分析、協(xié)方差分析、主成分分析、聚類分析等。 從生物統(tǒng)計學(xué)的基本作用上來講,其任務(wù)可以概括為以下幾個方面: (1)提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定某些性狀和特性的數(shù)量特征。一批試驗(yàn)或數(shù)據(jù)資料,

7、若不整理則雜亂無章,不能說明任何問題。統(tǒng)計方法提供了整理資料、化繁為簡的科學(xué)程序,它可以從眾多的數(shù)據(jù)資料中,歸納出幾個特征數(shù)或繪出一定形式的圖表,使試驗(yàn)研究者能從少數(shù)的特征數(shù)或一些簡單的圖表中了解大批資料所蘊(yùn)藏的信息。 (2)判斷試驗(yàn)結(jié)果的可靠性。一般在試驗(yàn)中要求除試驗(yàn)因素以外,其他條件都應(yīng)控制一致,但在實(shí)踐中無論試驗(yàn)條件控制得如何嚴(yán)格,其試驗(yàn)結(jié)果總是受試驗(yàn)因素和其他偶然因素的影響。偶然因素的影響就是造成試驗(yàn)誤差的重要原因。一個試驗(yàn)結(jié)果,是由試驗(yàn)因素造成的還是試驗(yàn)誤差造成的,要正確判斷就必須應(yīng)用統(tǒng)計分析方法。 (3)提供由樣本推斷總體的方法。試驗(yàn)的目的在于認(rèn)識總體規(guī)律,但由于總體龐大,一般無法

8、實(shí)施,在研究過程中都是抽取總體中的部分作為樣本,用統(tǒng)計方法以樣本來推斷總體的規(guī)律性,在這種推斷中,統(tǒng)計原理和方法起到了理論上的保證作用。 (4)提供試驗(yàn)設(shè)計的一些重要原則。為了以較少的人力、物力和財力取得較多的試驗(yàn)信息和較好的試驗(yàn)結(jié)果,在一些生物學(xué)研究中,就需要科學(xué)地進(jìn)行試驗(yàn)設(shè)計,如對樣本容量的確定、抽樣方法、處理設(shè)置、重復(fù)次數(shù)的確定以及試驗(yàn)的安排等,都必須以統(tǒng)計學(xué)原理為依據(jù)。從統(tǒng)計分析和試驗(yàn)設(shè)計的關(guān)系來看,統(tǒng)計學(xué)原理可以為試驗(yàn)設(shè)計提供合理的依據(jù),而試驗(yàn)設(shè)計又是統(tǒng)計分析方法的進(jìn)一步運(yùn)用。以統(tǒng)計學(xué)原理為指導(dǎo),進(jìn)行科學(xué)合理的試驗(yàn)設(shè)計時,可以使在較少人力、物力、時間和條件下,得出可靠而準(zhǔn)確的數(shù)據(jù)和信

9、息。以往有一些試驗(yàn)資料,由于設(shè)計不當(dāng)而喪失了大量的試驗(yàn)信息,究其原因多半是由于缺乏一定的統(tǒng)計知識,使試驗(yàn)的效率大大降低。當(dāng)然,統(tǒng)計原理和分析方法對試驗(yàn)設(shè)計有著積極的指導(dǎo)意義,但它絕對不可能代替試驗(yàn)設(shè)計。如果試驗(yàn)?zāi)康?、要求不明確,設(shè)計不合理,試驗(yàn)條件不合適,統(tǒng)計數(shù)據(jù)不準(zhǔn)確,這種試驗(yàn)也絕對不會成功,統(tǒng)計原理和分析方法都不可能挽救試驗(yàn)的這種失敗。三、生物統(tǒng)計學(xué)發(fā)展概況 現(xiàn)代統(tǒng)計學(xué)起源于17世紀(jì),它主要有兩個來源,一是政治科學(xué)的需要,二是當(dāng)時貴族階層對機(jī)率數(shù)學(xué)理論很感興趣而發(fā)展起來的。另外,研究天文學(xué)的需要也促進(jìn)了統(tǒng)計學(xué)的發(fā)展。瑞士數(shù)學(xué)家JBernouli(16541705)系統(tǒng)論證了大數(shù)定律。后來,

10、JBernouli的后代DBernouli(17001782)將概率論的理論應(yīng)用到醫(yī)學(xué)和人類保險。 正態(tài)分布理論對研究生物統(tǒng)計的理論是十分重要的,它最早是由 De Moiver于 1733年發(fā)現(xiàn)的,后來德國天文學(xué)和數(shù)學(xué)家Gauss (1771855)在研究觀察誤差理論時,也獨(dú)立發(fā)現(xiàn)了正態(tài)分布的理論方程,因此,常有人將正態(tài)分布稱為Gauss分布。 統(tǒng)計學(xué)用于生物學(xué)的研究,開始于19世紀(jì)末。1870年,美國遺傳學(xué)家Gallon(18221911)在19世紀(jì)末應(yīng)用統(tǒng)計方法研究人種特性,分析父母與子女的變異,探索其遺傳規(guī)律,提出了相關(guān)與回歸的概念,開辟了生物學(xué)研究的新領(lǐng)域。盡管他的研究當(dāng)時并未成功,但

11、由于他開創(chuàng)性將統(tǒng)計方法應(yīng)用于生物學(xué)研究,后人推崇他為生物統(tǒng)計學(xué)的創(chuàng)始人。 在此之后,Gallon和他的繼承人KPlarson(18571936)經(jīng)過共同努力于1895年成立了倫敦大學(xué)生物統(tǒng)計實(shí)驗(yàn)室,于1889年發(fā)表了自然的遺傳一書。在該書中,KPlarson首先提出了回歸分析問題,并給出了計算簡單相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)的計算公式。KPlarson在研究樣本誤差效應(yīng)時,提出了測量實(shí)際值與理論值之間偏離度的指數(shù)卡方(X)的檢驗(yàn)問題,它在屬性統(tǒng)計分析中有著廣泛的應(yīng)用。例如,在遺傳上孟德爾豌豆雜交試驗(yàn),高豌豆品種與低豌豆品種雜交后,它的后代理論比率應(yīng)該是3:1,但實(shí)際后代數(shù)是否符合3:1,需用進(jìn)行檢驗(yàn)。

12、 KPlarson的學(xué)生Gosset(1871937)對樣本標(biāo)準(zhǔn)差進(jìn)行了大量研究,于 1908年以筆名“Student”在該年的生物統(tǒng)計學(xué)報(Biometrika)上發(fā)表論文,創(chuàng)立了小樣本檢驗(yàn)代替大樣本檢驗(yàn)的理論和方法,即t分布和t檢驗(yàn)法。t檢驗(yàn)已成為當(dāng)代生物統(tǒng)計工作的基本工具之一,它也為多元分析的理論形成和應(yīng)用奠定了基礎(chǔ)。 英國統(tǒng)計學(xué)家Fisher干1923年發(fā)展了顯著性檢驗(yàn)及估計理論,提出了F分布和F檢驗(yàn)。他在從事農(nóng)業(yè)試驗(yàn)及數(shù)據(jù)分析研究時,創(chuàng)立了正交試驗(yàn)設(shè)計和方差分析。在生物統(tǒng)計中,方差分析有著廣泛的應(yīng)用,特別是在他發(fā)表了試驗(yàn)研究工作中的統(tǒng)計方法專著后,對推動和促進(jìn)農(nóng)業(yè)科學(xué)、生物學(xué)和遺傳學(xué)

13、的研究與發(fā)展,起到了奠基作用。自20年代Fisher的方差分析問世以來,各種數(shù)理統(tǒng)計方法不但在實(shí)驗(yàn)室中成為研究人員的分析工具,而且在田間試驗(yàn)、飼養(yǎng)試驗(yàn)、臨床試驗(yàn)等農(nóng)學(xué)、醫(yī)學(xué)和生物學(xué)領(lǐng)域也得到了廣泛應(yīng)用。 Neyman(18941981)和SPearson進(jìn)行了統(tǒng)計理論的研究工作,分別于 1936年和1938年提出了一種統(tǒng)計假說檢驗(yàn)學(xué)說。假說檢驗(yàn)和區(qū)間估計作為數(shù)學(xué)上的最優(yōu)化問題,對促進(jìn)統(tǒng)計理論研究和對試驗(yàn)作出正確結(jié)論具有非常實(shí)用的價值。 另外,PCMabellnrobis對作物抽樣調(diào)查、 A Waecl對序貫抽樣、 Finney對毒理統(tǒng)計、 K Mather對生統(tǒng)遺傳學(xué)、F Yates對田間試驗(yàn)

14、設(shè)計等都做出了杰出的貢獻(xiàn)。 國內(nèi)對生物統(tǒng)計學(xué)的應(yīng)用始于30年代。中華人民共和國成立以后,許多生物學(xué)研究工作者積極從事統(tǒng)計學(xué)理論和實(shí)踐的應(yīng)用研究,使生物統(tǒng)計學(xué)在農(nóng)業(yè)科學(xué)、醫(yī)學(xué)科學(xué)、生物學(xué)、遺傳學(xué)、生態(tài)學(xué)等學(xué)科領(lǐng)域發(fā)揮了重要作用。應(yīng)用試驗(yàn)設(shè)計方法和統(tǒng)計分析理論,進(jìn)行農(nóng)作物品種產(chǎn)量比較試驗(yàn)、病蟲害的預(yù)測預(yù)報、動物飼養(yǎng)試驗(yàn)、飼料配方、毒理試驗(yàn)、動植物資源的調(diào)查與分析、動植物育種中遺傳資源和親子代遺傳的分析等都取得了較好成果。 近年來,生物統(tǒng)計學(xué)發(fā)展迅速,從中又分支出生統(tǒng)遺傳學(xué)(群體遺傳學(xué))、生態(tài)統(tǒng)計學(xué)、生物分類統(tǒng)計學(xué)、毒理統(tǒng)計學(xué)等。由于數(shù)學(xué)與生物學(xué)和農(nóng)學(xué)的應(yīng)用,使生物數(shù)學(xué)成為一門新的學(xué)科,生物統(tǒng)計學(xué)只

15、是它的一個分支學(xué)科。1974年,聯(lián)合國教科文組織在編制學(xué)科分類目錄時,第一次把生物數(shù)學(xué)作為一門獨(dú)立的學(xué)科列入生命科學(xué)類中。隨著計算機(jī)的普及和生物學(xué)研究的不斷深入,生物統(tǒng)計學(xué)的研究和應(yīng)用必將越來越廣泛,越來越深入。第一章 數(shù)據(jù)的整理及基本統(tǒng)計第一節(jié) 常用統(tǒng)計學(xué)術(shù)語 一 總體與樣方 具有相同性質(zhì)的個體所組成的集合稱為總體,它是指研究對象的全體,而組成總體的基本單元稱為個體??傮w按總體單位的數(shù)目可分為有限總體和無限總體。個體極多或無限多的總體稱為無限總體。例如,某一地區(qū)棉田棉鈴蟲的頭數(shù),可以認(rèn)為是無限總體。另外,也可從抽象意義上來理解無限總體,比如通過臨床試驗(yàn)來推斷某一種藥品比另一種藥品的治愈率高,

16、這里無限總體指的是一個理論性總體。個體有限的總體稱為有限總體,如對某一班學(xué)生身高進(jìn)行調(diào)查,這時總體是指這一班中每一名學(xué)生的身高。 要研究總體的性質(zhì),一般情況下我們無法一對總體中的個體全部取出進(jìn)行調(diào)查或研究。因?yàn)樵趯?shí)際研究過程中,我們常常會遇到兩種難以克服的困難:一是總體的個體數(shù)目較多,甚至無限多;二是有時總體的數(shù)目雖然不多,但試驗(yàn)具有破壞性,或者試驗(yàn)費(fèi)用很高,不允許做更多的試驗(yàn),因而只能采取抽樣的方法,從總體中抽取一部分個體進(jìn)行研究,作為統(tǒng)計的依據(jù)。 從總體中抽出的若干個個體所構(gòu)成的集合稱為樣本,構(gòu)成樣本的每個個體稱為樣本單位,樣本個體數(shù)目的大小稱為樣本容量。通過從樣本計買出來的統(tǒng)計數(shù),如平均

17、數(shù)、標(biāo)準(zhǔn)差等,來對該總體在一定可靠程度上進(jìn)行推斷。樣本的作用在于估計總體。例如可以調(diào)查某一地區(qū)棉田100株棉花上的棉鈴蟲頭數(shù),來推斷該地區(qū)棉鈴蟲的發(fā)生狀況,以采取相應(yīng)的對策。一般在生物學(xué)研究中,樣本容量在30個以下稱為小樣本,30個以上稱為大樣本。在一些計算和分析檢驗(yàn)方法上,大樣本和小樣本是不同的。 抽樣 從總體中獲得樣本的過程稱為抽樣(sampling)。抽樣的目的,是希望通過對樣本的研究,推斷其總體。這就要求樣本應(yīng)能在最大程度上代表總體的情況。例如,測量18歲青年的身高。為此,在從總體中抽取樣本時,總體中的每一個個體被抽中的機(jī)會必須都一樣,不能帶有偏見,不能多抽一些高個的或矮個的,這樣得到

18、的樣本沒有代表性,屬于偏性抽樣,不能代表總體的情況。我們需要的樣本應(yīng)該是一個總體的縮影。為了達(dá)到這個目的,就需要用隨機(jī)抽樣(random sampling)的方法獲得樣本。 隨機(jī)抽樣的方法很多,例如抽簽等。最好的方法是使用隨機(jī)數(shù)字進(jìn)行抽樣。從一有限總體中抽樣,可分為放回式抽樣(sampling with replacement)和非放回式抽樣(sampling withot replacement)。所謂放回式抽樣是指:從總體中抽出一個個體,記下它的特征后,放回總體中,再做第二次抽樣。這種抽樣方式可能會重復(fù)抽中某一個體。非放回式抽樣是指:從總體中抽出個體后,不再放回。在測量身高,在測量了某個人

19、的身高后,再放回人群中,則為放回式抽樣;若將此人排除在人群之外,則為非放回式抽樣。對于無限總體來說,放回式抽樣和非放回式抽樣,實(shí)際上沒有區(qū)別。 樣本的含量越大越有代表性。 利用樣本研究的主要原因是: 1經(jīng)濟(jì) 研究整個總體可能太花金錢,若總體數(shù)目很大,光印刷及郵寄問卷的花費(fèi)就很可觀;更不用說用人員來進(jìn)行面訪。同時,想獲得整個總體全部的回卷,也幾乎是不可能的。 2.時效 無論對研究者還是對決策者而言,時效是非常重要的考慮因素。若一個研究因?yàn)橐∽逭麄€總體的數(shù)據(jù)而拖延時間,等研究結(jié)果出爐,其結(jié)論可能已不合時宜。對企業(yè)的決策者將無法提供任何幫助。 3.難以接觸 事實(shí)上,可能根本無法找出整個總體的全體成

20、員。例如,要針對全國20歲以上的月有人來調(diào)查是否贊成某一政策?談何容易!這些人東跑西跑的分散在各地,有的在高山或島嶼,有的人還不在國內(nèi),怎么可能將其全部找出來?理論上,雖然還是可以接觸到,但其成本將難以估計。 4.總體過大 很多研究對象的總體確實(shí)很大。像一些暢銷全球的汽車、電器、日用品等,消費(fèi)者搜以萬計或千萬計,且散居全球各地,根本就不可能進(jìn)行普查。 5毀壞性 若研究整個總體,每個商品都進(jìn)行測試則可能會沒有剩下的商品可以出售。例如,要測試輪胎的耐磨程度,將所生產(chǎn)的每一個輪胎都拿來進(jìn)行路面實(shí)際駕駛或以機(jī)器來磨,以便查其是否合乎品質(zhì)要求,磨完或駕駛過后的輪胎,就無法再送回到市面上銷售了。 6.正確

21、性 普查費(fèi)時、費(fèi)力、費(fèi)錢,到最后往往會草率了之,所獲得的數(shù)據(jù)的正確性卻并不是可靠。還不如針對較少數(shù)的抽樣,進(jìn)行仔細(xì)的數(shù)據(jù)搜集。所以,我們通常只能對總體進(jìn)行 。 (二)變量與常數(shù) 變量(variables)是用來描述總體中成員的某一特性,即相同性質(zhì)的事物間表現(xiàn)差異性或差異特征的數(shù)據(jù)稱為變量或變數(shù),它是表示在一個界限內(nèi)變動著的性狀的數(shù)值。自然界同類事物中,都存在著一定的變異,如人的身高、體重,棉花的株高、分枝數(shù),同窩動物的身長及各項生理指標(biāo)等都會存在一定的差異。所有這些差異均可用量來表示,通常記為x,如 10個人的身高在 155180cm之間,共有 158,167,173,155,180,165,

22、175,178,170,162cm,l0個變量值,記作xi (i= 1,2,10),表示x1 到x10之間任一數(shù)值,亦稱xi為隨機(jī)變量。 變量按其性質(zhì)可分為連續(xù)變量和非連續(xù)變量。 連續(xù)變量表示在變量范圍內(nèi)可抽出某一范圍的所有值,這種變量之間是連續(xù)的、無限的。如小麥的株高在80一90cm,在此范圍內(nèi)可以取得無數(shù)個變量。這類變量在理論上,任意兩個值之間都可能存在第三個值。 非連續(xù)變量,也稱為離散變量,表示在變量數(shù)列中,僅能取得固定數(shù)值。如菌落中的菌數(shù)、單位面積水稻的莖數(shù)、小白鼠每胎產(chǎn)仔數(shù)等。任意兩個值之間不可能存在第三個值。 變量可以是定性的,也可以是定量的。定性的變量往往表示某個體屬于幾種互不相

23、容的類型中的一種,如果蠅的翅有長翅與殘翅,人的血型有A、B、AB和O型,豌豆花的顏色有白色、紅色和紫色,等等。定量的變量是指可測量的,如出欄時豬的重量、花生的百仁重、電泳酶譜上的帶數(shù)等。 常數(shù)表示能代表事物特征和性質(zhì)的數(shù)值,通常由變量計算而來,在一定過程中是不變的。如某樣本平均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)等。 (三)、參數(shù)與統(tǒng)計數(shù) 觀察值觀察值 觀測一個實(shí)驗(yàn)或統(tǒng)計問題,所記錄下來的結(jié)果被稱為觀察值(observation)通常以小寫x來表示。例如,為找出大學(xué)生每月零用錢的平均數(shù),由每位受訪者(受測樣本)所提供的每月零用錢的數(shù)值就是一個觀察值。 參數(shù)也稱參量,是對一個總體特征的度量。如總體平均數(shù)、總體標(biāo)

24、準(zhǔn)差等均為參數(shù)。因?yàn)榭傮w一般都很大,有的甚至不可能取得,所以總體參數(shù)一般不可能計算出來。可以通過 對總體抽取樣本,計算樣本的統(tǒng)計數(shù),來估計總體參數(shù)。從樣本中計算所得的數(shù)值稱為統(tǒng)計數(shù),它是總體參數(shù)的估計值。 統(tǒng)計量統(tǒng)計量 相對于參數(shù),統(tǒng)計量(statistic)又稱估計值(estimate ),是樣本的數(shù)值性敘述值,也就是用來描述樣本某一特性的數(shù)字。例如,代表樣本某一屬性的數(shù)值:樣本均值、樣本標(biāo)準(zhǔn)差。這些值是根據(jù)樣本所求得到,準(zhǔn)備用來估計總體的參數(shù)值。 (四)效應(yīng)與交互作用 引起試驗(yàn)差異的作用稱為效應(yīng),如不同飼料使動物的體重增加表現(xiàn)出差異,不同品種的玉米產(chǎn)量不同等。 交互作用也稱連應(yīng),是指兩個或

25、兩個以上處理因素相互作用產(chǎn)生的效應(yīng)。如氮、磷肥共施會對作物產(chǎn)量產(chǎn)生交互作用交互作用效應(yīng)。交互作用有正效應(yīng),也有負(fù)效應(yīng),如果氮、磷共施的產(chǎn)量效應(yīng)大于氮、磷單施效應(yīng)之和,說明氮磷交互作用為正效應(yīng),如果氮、磷共施的產(chǎn)量效應(yīng)小于氮、磷單施效應(yīng)之和,說明氮磷交互作用為負(fù)效應(yīng)。 (五)機(jī)誤與錯誤 機(jī)誤,也叫試驗(yàn)誤差,是指試驗(yàn)中由于無法控制的隨機(jī)因素所引起的差異。如在抽樣中,會出現(xiàn)較大或較小的數(shù)據(jù),這是由于總體中的個體間存在一定的差異,它是不可避免的,試驗(yàn)中只能設(shè)法減小,而不能完全消滅。增加抽樣或試驗(yàn)次數(shù),可以降低機(jī)誤的數(shù)值。 錯誤是指在試驗(yàn)過程中,人為的作用所引起的差錯。如試驗(yàn)人員粗心大意,使儀器校正不準(zhǔn)

26、、藥品配制比例不當(dāng)、稱量不準(zhǔn)確、將數(shù)據(jù)抄錯、計算出現(xiàn)錯誤等都是由于人為因素造成的,在試驗(yàn)中是完全可以避免的。 (六)準(zhǔn)確性與精確性 統(tǒng)計工作是用樣本的統(tǒng)計數(shù)來推斷總體參數(shù)的。我們用統(tǒng)計數(shù)接近參數(shù)真值的程度,來衡量統(tǒng)計數(shù)準(zhǔn)確性的高低,用樣本中的各個變量間變異程度的大小,來衡量該樣本精確性的高低。因此,準(zhǔn)確性不等于精確性。準(zhǔn)確性是說明測定值對真值符合程度的大小,而精確性則是多次測定值的變異程度。第二節(jié) 常用統(tǒng)計軟件簡介 一、 Excel中的數(shù)據(jù)分析簡介 Microsoft Excel 提供了一組“分析工具庫” 工具,稱為數(shù)據(jù)分析,在建立復(fù)雜統(tǒng)計或工程分析時可節(jié)省步驟。只需為每一個分析工具提供必要的

27、數(shù)據(jù)和參數(shù),該工具就會使用適宜的統(tǒng)計方法或工程函數(shù),在輸出表格中顯示相應(yīng)的結(jié)果。其中有些工具在生成輸出表格時還能同時生成圖表。 要查看可用的分析工具,請單擊“工具”菜單中的“數(shù)據(jù)分析”命令,簡捷、方便的完成相應(yīng)統(tǒng)計分析。如果“工具”菜單中沒有“數(shù)據(jù)分析”命令,則需要安裝“分析工具庫”。 1 1 安裝分析工具庫安裝分析工具庫 在“工具”菜單中,單擊“加載宏”命令(如圖1.1)。 如果“加載宏”對話框中沒有“分析工具庫”,應(yīng)運(yùn)行“安裝”程序。 選中“分析工具庫”及“分析數(shù)據(jù)庫”復(fù)選框。單擊確定。 在計算機(jī)的光驅(qū)中裝入“Office 2000”光盤,根據(jù)提示完成安裝過程。 注意注意 Office 9

28、7 通常在安裝過程中不需要第三步。 2 使用分析工具庫 在“工具”菜單中,單擊“數(shù)據(jù)分析”標(biāo)簽(如圖1.2),就會出現(xiàn)分析工具對話框(如圖1.3)。 在“分析工具”列表框中,單擊想要使用的工具。 鍵入相應(yīng)的輸入?yún)^(qū)域和輸出區(qū)域,并選擇需要的選項。 注意注意 圖1.2 僅顯示了部分分析工具,移動分析工具列表框右側(cè)的滾動條,可以查看所有的分析工具。3 分析工具分析工具在安裝了分析工具后,Excel 中不僅增加了統(tǒng)計分析的有關(guān)函數(shù),而且也增加了一些相關(guān)的工作表函數(shù),包括其他一些統(tǒng)計、財務(wù)和工程工作表函數(shù)。某些統(tǒng)計函數(shù)是內(nèi)置函數(shù),而其他一些函數(shù)只有在安裝了“分析工具庫”之后才能使用。 分析工具包括:方差

29、分析、相關(guān)系數(shù)分析、協(xié)方差分析、描述統(tǒng)計、指數(shù)平滑分析、傅立葉分析、指數(shù)平滑分析、傅立葉分析、“F - 檢驗(yàn):雙樣本方差分析”、直方圖分析、移動平均分析、t - 檢驗(yàn)分析隨機(jī)數(shù)發(fā)生器分析工具、排位與百分比排位分析工具、回歸分析”分析工具、抽樣分析分析工具、“z - 檢驗(yàn):雙樣本平均差檢驗(yàn)”分析工具 要使用這些工具,用戶還必須熟悉需要進(jìn)行分析的統(tǒng)計學(xué)或工程學(xué)的特定領(lǐng)域。隨后章節(jié)將介紹統(tǒng)計學(xué)基礎(chǔ)知識及分析工具的使用方法。Book2-1二、SPSS SPSS的全稱是:Statistical Program for Social Sciences,即社會科學(xué)統(tǒng)計程序。該軟件是公認(rèn)的最優(yōu)秀的統(tǒng)計分析軟件

30、包之一。SPSS原是為大型計算機(jī)開發(fā)的,其版本為SPSSx,80年代初,微機(jī)開始普及以后,它率先推出了微機(jī)版本(版本為SPSS/PC+ x.x),占領(lǐng)了微機(jī)市場,大大地擴(kuò)大了自己的用戶量 1 SPSS的安裝 2 SPSS的啟動 3 SPSS的主窗口 4變量名稱變量名稱 5 SPSS的文件類型 1 SPSS的安裝SPSS的安裝步驟:1、啟動Windows,在程序管理器中選“文件”菜單的“運(yùn)行”項,彈出“運(yùn)行”對話框,點(diǎn)擊“瀏覽.”鈕,根據(jù)安裝盤所在的驅(qū)動器(A:或B:或光盤)及其路徑,找到SPSSINST.EXE文件,點(diǎn)擊“確定”鈕返回“運(yùn)行”對話框,再點(diǎn)擊“確定”鈕,即運(yùn)行安裝程序。2、安裝程

31、序運(yùn)行后,出現(xiàn)安裝選項對話框(如圖1.1所示)。用戶可根據(jù)自己的需要選擇欲安裝的模塊:即在所需的模塊名前“”內(nèi)點(diǎn)擊,使“”內(nèi)出現(xiàn)“”表明選中;若再點(diǎn)擊使“”轉(zhuǎn)為“”表明取消選擇。選擇完畢后點(diǎn)擊OK鈕。3、指定安裝的目標(biāo)盤和安裝文件的路徑。4、輸入軟件系列號碼、用戶姓名和單位名稱。5、根據(jù)安裝過程的提示,依次順序插換原盤直至安裝完成。 2 SPSS的啟動在Windows的程序管理器中雙擊SPSS FOR WINDOWS圖標(biāo)以打開SPSS程序組,選擇SPSS圖標(biāo)并雙擊之,即可啟動SPSS。SPSS啟動成功后出現(xiàn)SPSS的封面及主窗口,5秒鐘后或點(diǎn)擊鼠標(biāo)左鍵,封面消失,呈現(xiàn)SPSS的預(yù)備工作狀態(tài)。

32、3 SPSS的主窗口SPSS的主窗口名為SPSS for Windows,此為窗口的標(biāo)題欄,當(dāng)它呈藍(lán)底白字時,表示該窗口為活動窗口,意即用戶可對之進(jìn)行操作。非活動窗口的標(biāo)題欄呈白底黑字,用戶對之不能操作。激活窗口的方法是點(diǎn)擊該窗口的標(biāo)題欄。 標(biāo)題欄的左側(cè)(即窗口的左上角)為窗口控制鈕,點(diǎn)擊它選擇窗口的還原、移動、大小變換、最小化、最大化、關(guān)閉和與其它窗口的切換。標(biāo)題欄右側(cè)(即窗口右上角)的兩個鈕:箭頭向下的為最小化鈕,點(diǎn)擊它使窗口縮小為圖標(biāo)(但不是關(guān)閉窗口);箭頭向上的為最大化鈕,點(diǎn)擊它使窗口充滿整個屏幕。該窗口的底部為系統(tǒng)狀態(tài)欄系統(tǒng)狀態(tài)欄,顯示系統(tǒng)即刻的工作狀況,這對用戶了解系統(tǒng)情況十分有益

33、。 在SPSS的主窗口中還有兩個窗口兩個窗口,一個是數(shù)據(jù)管理窗口數(shù)據(jù)管理窗口,其標(biāo)題名稱是“Newdata”,且默認(rèn)為激活狀態(tài)。數(shù)據(jù)管理器是一種典型的電子表格形式,用戶可通過定義變量名、格式化數(shù)據(jù)類型后輸入原始數(shù)值,并可根據(jù)需要對數(shù)據(jù)進(jìn)行增刪、剪貼、修改、存儲等操作。 另一個是結(jié)果輸出窗口輸出窗口,標(biāo)題名稱是“!Output1”,啟動時為非活動窗口,只有當(dāng)完成一項處理后,才在該窗口顯示處理過程提示和計算結(jié)果。 4變量變量 4.1變量名稱變量名稱 輸入字符(漢字和英文)作為變量的名稱,本例為,樣地1,樣地2,樣地3。如不輸入名稱,系統(tǒng)依次默認(rèn)為“var00001”、“var00002”、“var

34、00003” 。變量應(yīng)遵循下列原則: 首字符必須是字母或漢字,不能以下劃線“_”或圓點(diǎn)“,”結(jié)尾。 變量不能有空格或某些特殊符號,如“???*”等。 變量名不能與SPSS的關(guān)鍵字相同,即不能用ALL、AND、BY、EQ、GT、LE等。 4.1 變量的數(shù)據(jù)類型變量的數(shù)據(jù)類型 當(dāng)鼠標(biāo)指針移至單元格,單擊后該單元格的右邊就會顯示一個“”按鈕,單擊該按鈕就會顯示一個數(shù)據(jù)類型設(shè)置窗口,如下圖所示。 變量標(biāo)簽(變量標(biāo)簽(Label):):有的時候變量名不能正確反映變量含義,有必要給它貼上標(biāo)簽以便識別。這個時候,就在變量定義的標(biāo)簽欄里輸入你的注釋。 變量值標(biāo)簽(變量值標(biāo)簽(Values):):變量值標(biāo)簽是用來

35、幫助解釋某些變量,特別是分類變量的數(shù)值含義。例如,有一個數(shù)值變量,0表示女性,1表示男性。此時,為了便于識別這些數(shù)值,我們是用變量值標(biāo)簽。 5 SPSS的文件類型的文件類型 數(shù)據(jù)文件:擴(kuò)展名為“.sav” 結(jié)果文件:擴(kuò)展名為“.spo” 圖形文件:擴(kuò)展名為“.cht” 語句命令文件:擴(kuò)展名為“.sps” 第三節(jié)第三節(jié) 數(shù)據(jù)整理和簡單統(tǒng)計方法數(shù)據(jù)整理和簡單統(tǒng)計方法 一、數(shù)據(jù)的類型 1 連續(xù)型數(shù)據(jù) 非整數(shù)型數(shù)據(jù) 2 離散型數(shù)據(jù) 整數(shù)性數(shù)據(jù)(計數(shù)) 二、頻數(shù) 數(shù)據(jù)的變化規(guī)律 1 頻 數(shù)(率)表和頻數(shù)(圖)目的編繪 離散型數(shù)據(jù)頻數(shù)(率)表的組限可以是離散數(shù)據(jù)中出現(xiàn)的所有數(shù)字,也可以是一個區(qū)間。連續(xù)型數(shù)

36、據(jù)的組限一定是一個區(qū)間。十二個學(xué)生某門課程考試成績?nèi)缦拢菏€學(xué)生某門課程考試成績?nèi)缦拢?78.0 65.0 66.0 71.0 76.0 77.0 84.0 60.0 88.0 62.0 91.0 98.0 按每10分計各分?jǐn)?shù)段分布頻率。 可以使用統(tǒng)計分析工具中直方圖工具統(tǒng)計頻數(shù)表,累計百分率等。 統(tǒng)計分析方法如下: 1作表A1至A12中輸入以上數(shù)據(jù),在B1至B2中輸入分段數(shù)據(jù)(60.0 65.0)。 2選B1和 B2,將鼠標(biāo)移動到B2右下腳,鼠標(biāo)箭頭變?yōu)槭中?,拖動鼠?biāo)至B9,在B列中產(chǎn)生分?jǐn)?shù)段表。 3單擊工具菜單中的分析工具,在統(tǒng)計分析工具列表中雙擊直方圖,出現(xiàn)如圖1.3所示的直方圖對話

37、框。 選擇輸入?yún)^(qū)域和接收區(qū)域,單擊輸入?yún)^(qū)域右側(cè)的小方塊,在工作表中拖動鼠標(biāo)自A1至A13選定成績表中的標(biāo)題和所有數(shù)據(jù),單擊表示單元格一行右側(cè)的小方塊,表示選定(下同);接受區(qū)域?yàn)榉謹(jǐn)?shù)段部分。 根據(jù)需要,選擇可選項。 最后單擊確定,統(tǒng)計結(jié)果會顯示在輸出區(qū)域,如圖1.4,表1.1。 Book2-1 標(biāo)志復(fù)選項標(biāo)志復(fù)選項 選擇是表示所選擇的第一行為標(biāo)志行,未選擇是第一行為數(shù)據(jù)行。添加標(biāo)志行可以在圖表中有關(guān)變量名稱,使圖表一目了然。 輸出選項輸出選項 輸出選項有三項。 輸出區(qū)域 表示在工作表指定的輸出區(qū)域中輸出統(tǒng)計結(jié)果(常用)。 新工作表組 表示以輸入的工作表組為名稱,統(tǒng)計結(jié)果輸出到新工作表組中。 新

38、工作簿 表示統(tǒng)計結(jié)果輸出到新工作簿中,名稱自動添加。 統(tǒng)計圖表復(fù)選項統(tǒng)計圖表復(fù)選項 表示可以選擇的圖表,不選擇,僅輸出頻率表(如表1.1 左半部分)。 圖表輸出 表示不僅輸出頻率表,而且輸出頻率直方圖(按接受區(qū)域的數(shù)據(jù)順序排列直方圖。(如圖1.4) 累計百分?jǐn)?shù) 計算累計百分?jǐn)?shù)及繪制百分表曲線。(如圖1.5 表1.1) 柏拉圖 直方圖的排列以頻數(shù)多少排列。(如圖1.5 表1.1右半部分) 頻數(shù)分布直方圖和累計百分率累積圖 Book2-1直方圖02460708090100分?jǐn)?shù)段頻率.00%50.00%100.00%150.00%頻率累積 % 2頻數(shù)圖繪制 頻數(shù)分布結(jié)果統(tǒng)計出來后,根據(jù)統(tǒng)計結(jié)果可以繪

39、制頻數(shù)圖。最常用的頻數(shù)圖有三種,即直方圖、累積頻數(shù)圖、多邊形圖??筛鶕?jù)第一部分的創(chuàng)建圖表去完成。 3研究頻頗數(shù)(率)分布的意義 根據(jù)編繪的頻數(shù)(率)表或頻數(shù)(率)圖,可以明顯地看出數(shù)據(jù)的三個重要特征。 首先首先,根據(jù)頻數(shù)(率)分布,可以看出數(shù)據(jù)的集中情況。一般來說,不論是離散型數(shù)據(jù),還是連續(xù)型數(shù)據(jù)都有聚集于某一范圍內(nèi)的趨勢,常常用平均值(avenge vale)表示全部數(shù)據(jù)的集中點(diǎn)。使用最廣泛的平均數(shù)(average)是算術(shù)平均值(arithmetic mean)、中位數(shù)(media)、眾數(shù)(mode)。 算術(shù)平均數(shù)算術(shù)平均數(shù) 均數(shù)使用的最多,它是一群數(shù)據(jù)的重心所在。 中位數(shù)中位數(shù) 它是在累積

40、頻數(shù)圖中1/2總頻數(shù)位置上的數(shù)值。 眾數(shù)眾數(shù) 離散型數(shù)據(jù)的眾數(shù)是頻數(shù)圖中頻數(shù)最高的組值。連續(xù)型數(shù)據(jù)的眾數(shù)是頻數(shù)圖中頻數(shù)最高的中值。 其次其次,從頻數(shù)(率)表或頻數(shù)(率)圖中,可以直觀地看出數(shù)據(jù)的變異情況:這群數(shù)據(jù)是集中在平均數(shù)附近,還是分散在平均數(shù)的兩側(cè)。如果數(shù)據(jù)大部分集中在平均數(shù)附近,遠(yuǎn)離平均數(shù)的兩側(cè)數(shù)據(jù)比較少,這樣的數(shù)據(jù)是比較整齊比較整齊的;若分布在平均數(shù)附近的數(shù)據(jù)個數(shù)與分布在遠(yuǎn)離平均數(shù)的兩側(cè)數(shù)據(jù)個數(shù)相差無幾,這樣的數(shù)據(jù)則是比較分散比較分散的。 第三,從頻數(shù)(率)分布圖中,還可以看出圖形的形狀。例如,有些分布從零頻數(shù)開始平穩(wěn)地上升,直到最高頻數(shù),然后平穩(wěn)地下降直到零頻數(shù)。結(jié)果得到一個對稱的

41、直方圖或多邊形圖。而另一些分布,在上升階段可能要經(jīng)過很多步,到達(dá)最高頻數(shù)后,突然下降;或者相反,上升很快,下降很慢。 此外,頻數(shù)表或頻數(shù)圖還可以顯示一些不規(guī)則的情況。例如,在一個分布中,出現(xiàn)一個或幾個頻數(shù)突然高出正常頻數(shù)的情況,這是一種異常分布,可能是由于條件不一致,或由于度量時的失誤造成的。當(dāng)出現(xiàn)這樣一些不規(guī)則情況時,需要認(rèn)真研究,盡可能找出原因。 4 頻數(shù)(率)分布的不恒定性 用隨機(jī)抽樣的方法,從某一總體中抽取兩個含量相同的樣本,分別編制出它們的頻數(shù)分布表,并進(jìn)行比較。這時會發(fā)現(xiàn),雖然它們都是從同一總體中隨機(jī)抽取的,但其頻數(shù)分布并不完全相同,有時差距還很大。若另外再取一個樣本時,可能與前兩

42、個又不一樣。出現(xiàn)這種現(xiàn)象并不奇怪,是抽樣時經(jīng)常遇到的現(xiàn)象。當(dāng)用隨機(jī)抽樣方法獲得樣本時,由于偶然性,有時在一個樣本中抽到的數(shù)值偏高,而另一個樣本中數(shù)值偏低,使兩個樣本的頻數(shù)分布出現(xiàn)不同。由于樣本分布的不恒定性,當(dāng)用樣本去推斷總體時,推斷的結(jié)果也會有所不同。這就需要考察當(dāng)用某一樣本去推斷總體時所得結(jié)果與真正總體之間有多大失誤,或者說所得結(jié)果的可信度有多高。為了回答這一問題,首先要對總體分布有所了解。 三、樣本的特征數(shù)三、樣本的特征數(shù) 數(shù)據(jù)集中點(diǎn)的度量平均數(shù),數(shù)據(jù)變異程度的度量一標(biāo)準(zhǔn)差和數(shù)據(jù)分布的對稱程度及陡峭程度的度量一斜度和峭度。這些數(shù)字是描述樣本頻率分布特征的,稱為樣本數(shù)字特征或簡稱為樣本特征

43、數(shù)(sample characteristics)。 1 平均數(shù)平均數(shù) 平均數(shù)包括:平均值、中位數(shù),眾數(shù)。使用最多的是算術(shù)平均值,簡稱為平均值(mean)。樣本算術(shù)平均值的符號是。若用x1,x2,xn表示組成樣本的每一個數(shù),則它們的算術(shù)平均值為, X=(x1+x2+.+xn)/n(1l) 或簡寫為 X=xi/n I=1,2,3,n 其中“”是求和的符號,n為樣本含量。 總體的平均值 =xi/N i=1,2,3,N 關(guān)于算術(shù)平均值的幾個簡單的運(yùn)算法則如下: 算術(shù)平均數(shù)有以下幾個基本特性: 算術(shù)平均數(shù)的計算與樣本內(nèi)的每個值都有關(guān),它的大小受每個值的影響。 若每個Xi都乘以相同的數(shù)k,則平均數(shù)亦應(yīng)除

44、以k。 若每個Xi都加上相同的數(shù)A,則平均數(shù)亦應(yīng)減去A。 如果了X1是n1個數(shù)的平均數(shù),X2是n2個數(shù)的平均數(shù),那么全部n1n2個數(shù)的算術(shù)平均數(shù)是加權(quán)平均數(shù)(weighted mean): X=(n1x1+n2x2)/(n1+n2) 平均數(shù)在理論上和在抽樣實(shí)踐中,還有更多的特性,主要表現(xiàn)在樣本與總體的關(guān)系上。 第二種平均數(shù)稱為中位數(shù)中位數(shù)。所謂中位數(shù)是指位于有序數(shù)列中點(diǎn)上的數(shù)。具體計算方法是:將樣本中的n個數(shù)從小到大,或從大到小排列好,位于中間位置上的那個數(shù)即為中位數(shù)。n為奇數(shù)時,很容易從數(shù)列中找出中間位置的數(shù)。但當(dāng)n為偶數(shù)時,就需將中間位置上的兩個數(shù)取其算術(shù)平均值作為中位數(shù)。 中位數(shù)有許多特

45、性。算術(shù)平均數(shù)的第2、第3條性質(zhì),中位數(shù)也具備,但卻不具有第1條性質(zhì),中位數(shù)直接與樣本含量n有關(guān),而不是與具體的某個數(shù)有關(guān)。只要中間數(shù)值不改變,排列順序不改變,兩翼數(shù)字任意改變也不會影響中位數(shù)值。中位數(shù)不存在算術(shù)平均數(shù)的第4條特性,中位數(shù)也沒有那么多抽樣特性。 第三種平均數(shù)稱為眾數(shù)眾數(shù)。眾數(shù)是具有最高頻數(shù)的組值或中值。眾數(shù)具有算術(shù)平均數(shù)的第2、第3條特性,但不具有第1、第4條特性。眾數(shù)主要用來描述頻數(shù)分布。例如,具有兩個分開的高頻數(shù)分布稱為雙眾數(shù)(bimedal)。中位數(shù)和眾數(shù)在生物統(tǒng)計學(xué)中很少使用。 2 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 對于數(shù)據(jù)的變異程度,經(jīng)常使用的度量方法有三種,它們是:范圍范圍(rang)

46、或稱為極差稱為極差、平均平均離差離差(mean deviatdri)和標(biāo)準(zhǔn)離差標(biāo)準(zhǔn)離差(standard deviation)或稱為標(biāo)準(zhǔn)差。其中最重要的是標(biāo)準(zhǔn)差。 范圍是一組數(shù)據(jù)中的最大值與最小值的差, =max(x)min(x) (18) 例如,有5個數(shù):96.4、 96.6、97.2、 97.4、 97.8(mL)。它們的范圍(R) R97.8- 96.41.4 mL 平均離差平均離差 MD= Xi-X/n 方差方差 一組數(shù)據(jù)與它們的平均數(shù)之間的標(biāo)準(zhǔn)的,或平均的不符合程度常用樣本方差(sample variance)表示(s2 )。 S2= (xi-X)2 /(n-1) 總體的方差: 2=(xi-X)2 /N 方差在實(shí)際應(yīng)用中廣泛被應(yīng)用,但它不能直接反映某個數(shù)與平均數(shù)之間的偏離程度。常用標(biāo)準(zhǔn)差s來衡量x與平均數(shù)之間的離散程度。標(biāo)準(zhǔn)差有時也記為SD。 S=(xi-X)2 / (n-1) 樣本平均值的標(biāo)準(zhǔn)誤差(標(biāo)準(zhǔn)誤SD):X=/n1/2 總之,衡量數(shù)據(jù)離散程度時。用抽樣理論可以證明:用標(biāo)準(zhǔn)差估計總體離散程度最可靠,平均離差次之。但是當(dāng)樣本較?。ㄈ缰挥?5個數(shù))而且變異又不是很大時,為了簡化起見,也可以用范圍。Book2-1 變異系數(shù) CV=s/x 變異系數(shù)可用小數(shù)表示,也可用百分?jǐn)?shù)表示。 上例兩品種的變異系數(shù)分別為: CVA=0042和CVB=0057 雖然B品種的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論