生物統(tǒng)計(jì)學(xué)(1)

上傳人：q*** IP屬地：湖北上傳時(shí)間：2022-06-27 格式：PPT 頁(yè)數(shù)：68 大?。?71.50KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩63頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、概論一、生物統(tǒng)計(jì)學(xué)的概念（一）統(tǒng)計(jì)學(xué) 統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)(Statistics)是數(shù)學(xué)的一個(gè)分支，用以搜集、整理、分析數(shù)據(jù)，進(jìn)而推導(dǎo)分析結(jié)果的科學(xué)方法，因而有學(xué)者也將統(tǒng)計(jì)學(xué)統(tǒng)稱為統(tǒng)計(jì)方法（Statistical Method）。統(tǒng)計(jì)不但用來(lái)簡(jiǎn)化和表示一組數(shù)據(jù)，而且主要是在探討如何從一組數(shù)據(jù)的總體中（總體，Population)，以某一抽取過程（抽樣，Sampling）抽出部分?jǐn)?shù)據(jù)（樣本，Sample），來(lái)研究如何利用這一部分?jǐn)?shù)據(jù)去估計(jì)、檢驗(yàn)或預(yù)測(cè)數(shù)據(jù)總體的某些未知的特性值。 1搜集數(shù)據(jù) 統(tǒng)計(jì)工作的第一步，即要搜集相關(guān)的統(tǒng)計(jì)數(shù)據(jù)，無(wú)論是原始數(shù)據(jù)（如已調(diào)查或?qū)嶒?yàn)所得的數(shù)據(jù)）還是二次數(shù)據(jù)（例如政府公布的

2、統(tǒng)計(jì)數(shù)據(jù)）。統(tǒng)計(jì)數(shù)據(jù)的搜集必須切合統(tǒng)計(jì)分析的目的，否則將浪費(fèi)許多時(shí)間和金錢，卻得到一大堆無(wú)法使用的數(shù)據(jù)。 2.整理數(shù)據(jù) 所搜集的數(shù)據(jù)通常是雜亂無(wú)章的，尤其是原始數(shù)據(jù)。所以需要加以整理，以計(jì)算出想要的統(tǒng)計(jì)數(shù)字或繪制出統(tǒng)計(jì)圖表。此部分包括分類、歸類、列表和繪圖，通常是用電腦來(lái)加以整理。 3分析數(shù)據(jù) 所計(jì)算出的統(tǒng)計(jì)數(shù)字仍只是一大堆數(shù)字結(jié)果，并不是每個(gè)人都能夠看得懂，必須由受過統(tǒng)計(jì)訓(xùn)練的專家來(lái)分析，才能解釋出其涵義。例如，分析其集中趨勢(shì)、方差、差異性、相關(guān)性、周期性等。此部分即描述性統(tǒng)計(jì)(Descriptive Statistics），主要是描述和敘述事物的現(xiàn)象。 4推論數(shù)據(jù) 如果分析對(duì)象只是一部分樣

3、本，則仍需要推論其分析結(jié)果，來(lái)推斷總體的可能結(jié)果。例如，用樣本統(tǒng)計(jì)量推算總體的參數(shù)（Parameter），或以樣本的結(jié)果證實(shí)或否定一些有關(guān)總聲的假設(shè)。此部分即推論統(tǒng)計(jì)的工作，利用樣本所收集的數(shù)據(jù)推論總體的狀況。（二）生物統(tǒng)計(jì)學(xué) 生物統(tǒng)計(jì)學(xué)生物統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)學(xué)在生物學(xué)研究中的應(yīng)用，它是用統(tǒng)計(jì)學(xué)的原理和方法來(lái)分析和解釋生物界各種現(xiàn)象和試驗(yàn)調(diào)查資料的科學(xué)。隨著生物學(xué)研究的不斷發(fā)展，運(yùn)用統(tǒng)計(jì)學(xué)方法來(lái)認(rèn)識(shí)、推斷和解釋生命過程中的各種現(xiàn)象，也越來(lái)越廣泛。盡管生物統(tǒng)計(jì)在應(yīng)用過程中曾經(jīng)受到過一些批評(píng)，但絕大多數(shù)生物學(xué)家、農(nóng)學(xué)家、園藝學(xué)家、育種學(xué)家、畜牧學(xué)家、醫(yī)學(xué)工作者以及人口學(xué)家還是在自己的研究領(lǐng)域越來(lái)越普遍

4、地應(yīng)用生物統(tǒng)計(jì)分析方法，并把它變?yōu)閷W(xué)科自身發(fā)展的需要。生物學(xué)研究的對(duì)象是復(fù)雜的生物有機(jī)體，與非生物相比，它具有更加特殊的復(fù)雜性。生物有機(jī)體的生長(zhǎng)發(fā)育、生理活動(dòng)、生化變化及有機(jī)體受外界環(huán)境因素的影響等，都使生物學(xué)研究的試驗(yàn)結(jié)果有較大的差異性，這種差異性往往會(huì)掩蓋生物體本身的特殊規(guī)律。在生物學(xué)研究中，大量試驗(yàn)資料內(nèi)在的規(guī)律性，也容易被雜亂無(wú)章的數(shù)據(jù)所迷惑，容易被人們所忽視。因此，在生物學(xué)研究中，應(yīng)用生物統(tǒng)計(jì)學(xué)就顯得特別重要。生物學(xué)研究的實(shí)踐證明，只有正確地應(yīng)用生物統(tǒng)計(jì)原理和分析方法對(duì)生物學(xué)試驗(yàn)進(jìn)行合理設(shè)計(jì)，對(duì)數(shù)據(jù)進(jìn)行客觀分析，才能得出科學(xué)的結(jié)論。在對(duì)事物的研究過程中，人們往往是通過某事物的一

5、部分（樣本），來(lái)估計(jì)事物全部（總體）的特征的，目的是為了以樣本的特征對(duì)未知總體進(jìn)行推斷，從特殊推導(dǎo)一般，對(duì)所研究的總體作出合乎邏輯的推論，得到對(duì)客觀并物本質(zhì)的和規(guī)律性的認(rèn)識(shí)。在生物學(xué)研究中，我們所期望的是總體，而不是樣本。但是在具體的試驗(yàn)過程中，我們所得到的卻是樣本而不是總體。因此，從某種意義上講，生物統(tǒng)計(jì)學(xué)是研究生命過程中以樣本來(lái)推斷總體的一門學(xué)科。生物統(tǒng)計(jì)學(xué)是在生物學(xué)研究過程中，逐漸與數(shù)學(xué)的發(fā)展相結(jié)合所形成的，它是應(yīng)用數(shù)學(xué)的一個(gè)分支，屬于生物數(shù)學(xué)的范疇。生物統(tǒng)計(jì)學(xué)以數(shù)學(xué)的概率論為基礎(chǔ)，也涉及到數(shù)列、排列、組合、矩陣、微積分等知識(shí)。生物統(tǒng)計(jì)學(xué)作為一個(gè)重要的工具課，一般不過多討論數(shù)學(xué)原理，而

6、主要偏重于統(tǒng)計(jì)原理的介紹和具體分析方法的應(yīng)用。二、生物統(tǒng)計(jì)學(xué)的主要內(nèi)容生物統(tǒng)計(jì)學(xué)的基本內(nèi)容，概括起來(lái)主要包括試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析兩大部分。在試驗(yàn)設(shè)計(jì)中，主要介紹試驗(yàn)設(shè)計(jì)的有關(guān)概念、試驗(yàn)設(shè)計(jì)的基本原則、試驗(yàn)設(shè)計(jì)方案的制定、常用試驗(yàn)設(shè)計(jì)方法，其中主要的有對(duì)比設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、拉丁方設(shè)計(jì)、裂區(qū)設(shè)計(jì)以及正交設(shè)計(jì)等。在統(tǒng)計(jì)分析中，主要包括數(shù)據(jù)資料的搜集和整理、數(shù)據(jù)特征的計(jì)算、統(tǒng)計(jì)推斷、方差分析、回歸和相關(guān)分析、協(xié)方差分析、主成分分析、聚類分析等。從生物統(tǒng)計(jì)學(xué)的基本作用上來(lái)講，其任務(wù)可以概括為以下幾個(gè)方面：（1）提供整理和描述數(shù)據(jù)資料的科學(xué)方法，確定某些性狀和特性的數(shù)量特征。一批試驗(yàn)或數(shù)據(jù)資料，

7、若不整理則雜亂無(wú)章，不能說明任何問題。統(tǒng)計(jì)方法提供了整理資料、化繁為簡(jiǎn)的科學(xué)程序，它可以從眾多的數(shù)據(jù)資料中，歸納出幾個(gè)特征數(shù)或繪出一定形式的圖表，使試驗(yàn)研究者能從少數(shù)的特征數(shù)或一些簡(jiǎn)單的圖表中了解大批資料所蘊(yùn)藏的信息。（2）判斷試驗(yàn)結(jié)果的可靠性。一般在試驗(yàn)中要求除試驗(yàn)因素以外，其他條件都應(yīng)控制一致，但在實(shí)踐中無(wú)論試驗(yàn)條件控制得如何嚴(yán)格，其試驗(yàn)結(jié)果總是受試驗(yàn)因素和其他偶然因素的影響。偶然因素的影響就是造成試驗(yàn)誤差的重要原因。一個(gè)試驗(yàn)結(jié)果，是由試驗(yàn)因素造成的還是試驗(yàn)誤差造成的，要正確判斷就必須應(yīng)用統(tǒng)計(jì)分析方法。（3）提供由樣本推斷總體的方法。試驗(yàn)的目的在于認(rèn)識(shí)總體規(guī)律，但由于總體龐大，一般無(wú)法

8、實(shí)施，在研究過程中都是抽取總體中的部分作為樣本，用統(tǒng)計(jì)方法以樣本來(lái)推斷總體的規(guī)律性，在這種推斷中，統(tǒng)計(jì)原理和方法起到了理論上的保證作用。（4）提供試驗(yàn)設(shè)計(jì)的一些重要原則。為了以較少的人力、物力和財(cái)力取得較多的試驗(yàn)信息和較好的試驗(yàn)結(jié)果，在一些生物學(xué)研究中，就需要科學(xué)地進(jìn)行試驗(yàn)設(shè)計(jì)，如對(duì)樣本容量的確定、抽樣方法、處理設(shè)置、重復(fù)次數(shù)的確定以及試驗(yàn)的安排等，都必須以統(tǒng)計(jì)學(xué)原理為依據(jù)。從統(tǒng)計(jì)分析和試驗(yàn)設(shè)計(jì)的關(guān)系來(lái)看，統(tǒng)計(jì)學(xué)原理可以為試驗(yàn)設(shè)計(jì)提供合理的依據(jù)，而試驗(yàn)設(shè)計(jì)又是統(tǒng)計(jì)分析方法的進(jìn)一步運(yùn)用。以統(tǒng)計(jì)學(xué)原理為指導(dǎo)，進(jìn)行科學(xué)合理的試驗(yàn)設(shè)計(jì)時(shí)，可以使在較少人力、物力、時(shí)間和條件下，得出可靠而準(zhǔn)確的數(shù)據(jù)和信

9、息。以往有一些試驗(yàn)資料，由于設(shè)計(jì)不當(dāng)而喪失了大量的試驗(yàn)信息，究其原因多半是由于缺乏一定的統(tǒng)計(jì)知識(shí)，使試驗(yàn)的效率大大降低。當(dāng)然，統(tǒng)計(jì)原理和分析方法對(duì)試驗(yàn)設(shè)計(jì)有著積極的指導(dǎo)意義，但它絕對(duì)不可能代替試驗(yàn)設(shè)計(jì)。如果試驗(yàn)?zāi)康摹⒁蟛幻鞔_，設(shè)計(jì)不合理，試驗(yàn)條件不合適，統(tǒng)計(jì)數(shù)據(jù)不準(zhǔn)確，這種試驗(yàn)也絕對(duì)不會(huì)成功，統(tǒng)計(jì)原理和分析方法都不可能挽救試驗(yàn)的這種失敗。三、生物統(tǒng)計(jì)學(xué)發(fā)展概況現(xiàn)代統(tǒng)計(jì)學(xué)起源于17世紀(jì)，它主要有兩個(gè)來(lái)源，一是政治科學(xué)的需要，二是當(dāng)時(shí)貴族階層對(duì)機(jī)率數(shù)學(xué)理論很感興趣而發(fā)展起來(lái)的。另外，研究天文學(xué)的需要也促進(jìn)了統(tǒng)計(jì)學(xué)的發(fā)展。瑞士數(shù)學(xué)家JBernouli（16541705）系統(tǒng)論證了大數(shù)定律。后來(lái)，

10、JBernouli的后代DBernouli（17001782）將概率論的理論應(yīng)用到醫(yī)學(xué)和人類保險(xiǎn)。正態(tài)分布理論對(duì)研究生物統(tǒng)計(jì)的理論是十分重要的，它最早是由 De Moiver于 1733年發(fā)現(xiàn)的，后來(lái)德國(guó)天文學(xué)和數(shù)學(xué)家Gauss （1771855）在研究觀察誤差理論時(shí)，也獨(dú)立發(fā)現(xiàn)了正態(tài)分布的理論方程，因此，常有人將正態(tài)分布稱為Gauss分布。統(tǒng)計(jì)學(xué)用于生物學(xué)的研究，開始于19世紀(jì)末。1870年，美國(guó)遺傳學(xué)家Gallon（18221911）在19世紀(jì)末應(yīng)用統(tǒng)計(jì)方法研究人種特性，分析父母與子女的變異，探索其遺傳規(guī)律，提出了相關(guān)與回歸的概念，開辟了生物學(xué)研究的新領(lǐng)域。盡管他的研究當(dāng)時(shí)并未成功，但

11、由于他開創(chuàng)性將統(tǒng)計(jì)方法應(yīng)用于生物學(xué)研究，后人推崇他為生物統(tǒng)計(jì)學(xué)的創(chuàng)始人。在此之后，Gallon和他的繼承人KPlarson（18571936）經(jīng)過共同努力于1895年成立了倫敦大學(xué)生物統(tǒng)計(jì)實(shí)驗(yàn)室，于1889年發(fā)表了自然的遺傳一書。在該書中，KPlarson首先提出了回歸分析問題，并給出了計(jì)算簡(jiǎn)單相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)的計(jì)算公式。KPlarson在研究樣本誤差效應(yīng)時(shí)，提出了測(cè)量實(shí)際值與理論值之間偏離度的指數(shù)卡方（X）的檢驗(yàn)問題，它在屬性統(tǒng)計(jì)分析中有著廣泛的應(yīng)用。例如，在遺傳上孟德爾豌豆雜交試驗(yàn)，高豌豆品種與低豌豆品種雜交后，它的后代理論比率應(yīng)該是3：1，但實(shí)際后代數(shù)是否符合3：1，需用進(jìn)行檢驗(yàn)。

12、 KPlarson的學(xué)生Gosset（1871937）對(duì)樣本標(biāo)準(zhǔn)差進(jìn)行了大量研究，于 1908年以筆名“Student”在該年的生物統(tǒng)計(jì)學(xué)報(bào)（Biometrika）上發(fā)表論文，創(chuàng)立了小樣本檢驗(yàn)代替大樣本檢驗(yàn)的理論和方法，即t分布和t檢驗(yàn)法。t檢驗(yàn)已成為當(dāng)代生物統(tǒng)計(jì)工作的基本工具之一，它也為多元分析的理論形成和應(yīng)用奠定了基礎(chǔ)。英國(guó)統(tǒng)計(jì)學(xué)家Fisher干1923年發(fā)展了顯著性檢驗(yàn)及估計(jì)理論，提出了F分布和F檢驗(yàn)。他在從事農(nóng)業(yè)試驗(yàn)及數(shù)據(jù)分析研究時(shí)，創(chuàng)立了正交試驗(yàn)設(shè)計(jì)和方差分析。在生物統(tǒng)計(jì)中，方差分析有著廣泛的應(yīng)用，特別是在他發(fā)表了試驗(yàn)研究工作中的統(tǒng)計(jì)方法專著后，對(duì)推動(dòng)和促進(jìn)農(nóng)業(yè)科學(xué)、生物學(xué)和遺傳學(xué)

13、的研究與發(fā)展，起到了奠基作用。自20年代Fisher的方差分析問世以來(lái)，各種數(shù)理統(tǒng)計(jì)方法不但在實(shí)驗(yàn)室中成為研究人員的分析工具，而且在田間試驗(yàn)、飼養(yǎng)試驗(yàn)、臨床試驗(yàn)等農(nóng)學(xué)、醫(yī)學(xué)和生物學(xué)領(lǐng)域也得到了廣泛應(yīng)用。 Neyman（18941981）和SPearson進(jìn)行了統(tǒng)計(jì)理論的研究工作，分別于 1936年和1938年提出了一種統(tǒng)計(jì)假說檢驗(yàn)學(xué)說。假說檢驗(yàn)和區(qū)間估計(jì)作為數(shù)學(xué)上的最優(yōu)化問題，對(duì)促進(jìn)統(tǒng)計(jì)理論研究和對(duì)試驗(yàn)作出正確結(jié)論具有非常實(shí)用的價(jià)值。另外，PCMabellnrobis對(duì)作物抽樣調(diào)查、 A Waecl對(duì)序貫抽樣、 Finney對(duì)毒理統(tǒng)計(jì)、 K Mather對(duì)生統(tǒng)遺傳學(xué)、F Yates對(duì)田間試驗(yàn)

14、設(shè)計(jì)等都做出了杰出的貢獻(xiàn)。國(guó)內(nèi)對(duì)生物統(tǒng)計(jì)學(xué)的應(yīng)用始于30年代。中華人民共和國(guó)成立以后，許多生物學(xué)研究工作者積極從事統(tǒng)計(jì)學(xué)理論和實(shí)踐的應(yīng)用研究，使生物統(tǒng)計(jì)學(xué)在農(nóng)業(yè)科學(xué)、醫(yī)學(xué)科學(xué)、生物學(xué)、遺傳學(xué)、生態(tài)學(xué)等學(xué)科領(lǐng)域發(fā)揮了重要作用。應(yīng)用試驗(yàn)設(shè)計(jì)方法和統(tǒng)計(jì)分析理論，進(jìn)行農(nóng)作物品種產(chǎn)量比較試驗(yàn)、病蟲害的預(yù)測(cè)預(yù)報(bào)、動(dòng)物飼養(yǎng)試驗(yàn)、飼料配方、毒理試驗(yàn)、動(dòng)植物資源的調(diào)查與分析、動(dòng)植物育種中遺傳資源和親子代遺傳的分析等都取得了較好成果。近年來(lái)，生物統(tǒng)計(jì)學(xué)發(fā)展迅速，從中又分支出生統(tǒng)遺傳學(xué)（群體遺傳學(xué)）、生態(tài)統(tǒng)計(jì)學(xué)、生物分類統(tǒng)計(jì)學(xué)、毒理統(tǒng)計(jì)學(xué)等。由于數(shù)學(xué)與生物學(xué)和農(nóng)學(xué)的應(yīng)用，使生物數(shù)學(xué)成為一門新的學(xué)科，生物統(tǒng)計(jì)學(xué)只

15、是它的一個(gè)分支學(xué)科。1974年，聯(lián)合國(guó)教科文組織在編制學(xué)科分類目錄時(shí)，第一次把生物數(shù)學(xué)作為一門獨(dú)立的學(xué)科列入生命科學(xué)類中。隨著計(jì)算機(jī)的普及和生物學(xué)研究的不斷深入，生物統(tǒng)計(jì)學(xué)的研究和應(yīng)用必將越來(lái)越廣泛，越來(lái)越深入。第一章數(shù)據(jù)的整理及基本統(tǒng)計(jì)第一節(jié) 常用統(tǒng)計(jì)學(xué)術(shù)語(yǔ) 一總體與樣方具有相同性質(zhì)的個(gè)體所組成的集合稱為總體，它是指研究對(duì)象的全體，而組成總體的基本單元稱為個(gè)體?？傮w按總體單位的數(shù)目可分為有限總體和無(wú)限總體。個(gè)體極多或無(wú)限多的總體稱為無(wú)限總體。例如，某一地區(qū)棉田棉鈴蟲的頭數(shù)，可以認(rèn)為是無(wú)限總體。另外，也可從抽象意義上來(lái)理解無(wú)限總體，比如通過臨床試驗(yàn)來(lái)推斷某一種藥品比另一種藥品的治愈率高，

16、這里無(wú)限總體指的是一個(gè)理論性總體。個(gè)體有限的總體稱為有限總體，如對(duì)某一班學(xué)生身高進(jìn)行調(diào)查，這時(shí)總體是指這一班中每一名學(xué)生的身高。要研究總體的性質(zhì)，一般情況下我們無(wú)法一對(duì)總體中的個(gè)體全部取出進(jìn)行調(diào)查或研究。因?yàn)樵趯?shí)際研究過程中，我們常常會(huì)遇到兩種難以克服的困難：一是總體的個(gè)體數(shù)目較多，甚至無(wú)限多；二是有時(shí)總體的數(shù)目雖然不多，但試驗(yàn)具有破壞性，或者試驗(yàn)費(fèi)用很高，不允許做更多的試驗(yàn)，因而只能采取抽樣的方法，從總體中抽取一部分個(gè)體進(jìn)行研究，作為統(tǒng)計(jì)的依據(jù)。從總體中抽出的若干個(gè)個(gè)體所構(gòu)成的集合稱為樣本，構(gòu)成樣本的每個(gè)個(gè)體稱為樣本單位，樣本個(gè)體數(shù)目的大小稱為樣本容量。通過從樣本計(jì)買出來(lái)的統(tǒng)計(jì)數(shù)，如平均

17、數(shù)、標(biāo)準(zhǔn)差等，來(lái)對(duì)該總體在一定可靠程度上進(jìn)行推斷。樣本的作用在于估計(jì)總體。例如可以調(diào)查某一地區(qū)棉田100株棉花上的棉鈴蟲頭數(shù)，來(lái)推斷該地區(qū)棉鈴蟲的發(fā)生狀況，以采取相應(yīng)的對(duì)策。一般在生物學(xué)研究中，樣本容量在30個(gè)以下稱為小樣本，30個(gè)以上稱為大樣本。在一些計(jì)算和分析檢驗(yàn)方法上，大樣本和小樣本是不同的。抽樣從總體中獲得樣本的過程稱為抽樣（sampling）。抽樣的目的，是希望通過對(duì)樣本的研究，推斷其總體。這就要求樣本應(yīng)能在最大程度上代表總體的情況。例如，測(cè)量18歲青年的身高。為此，在從總體中抽取樣本時(shí)，總體中的每一個(gè)個(gè)體被抽中的機(jī)會(huì)必須都一樣，不能帶有偏見，不能多抽一些高個(gè)的或矮個(gè)的，這樣得到

18、的樣本沒有代表性，屬于偏性抽樣，不能代表總體的情況。我們需要的樣本應(yīng)該是一個(gè)總體的縮影。為了達(dá)到這個(gè)目的，就需要用隨機(jī)抽樣（random sampling）的方法獲得樣本。隨機(jī)抽樣的方法很多，例如抽簽等。最好的方法是使用隨機(jī)數(shù)字進(jìn)行抽樣。從一有限總體中抽樣，可分為放回式抽樣（sampling with replacement）和非放回式抽樣（sampling withot replacement）。所謂放回式抽樣是指：從總體中抽出一個(gè)個(gè)體，記下它的特征后，放回總體中，再做第二次抽樣。這種抽樣方式可能會(huì)重復(fù)抽中某一個(gè)體。非放回式抽樣是指：從總體中抽出個(gè)體后，不再放回。在測(cè)量身高，在測(cè)量了某個(gè)人

19、的身高后，再放回人群中，則為放回式抽樣；若將此人排除在人群之外，則為非放回式抽樣。對(duì)于無(wú)限總體來(lái)說，放回式抽樣和非放回式抽樣，實(shí)際上沒有區(qū)別。樣本的含量越大越有代表性。利用樣本研究的主要原因是： 1經(jīng)濟(jì) 研究整個(gè)總體可能太花金錢，若總體數(shù)目很大，光印刷及郵寄問卷的花費(fèi)就很可觀；更不用說用人員來(lái)進(jìn)行面訪。同時(shí)，想獲得整個(gè)總體全部的回卷，也幾乎是不可能的。 2.時(shí)效無(wú)論對(duì)研究者還是對(duì)決策者而言，時(shí)效是非常重要的考慮因素。若一個(gè)研究因?yàn)橐∽逭麄€(gè)總體的數(shù)據(jù)而拖延時(shí)間，等研究結(jié)果出爐，其結(jié)論可能已不合時(shí)宜。對(duì)企業(yè)的決策者將無(wú)法提供任何幫助。 3.難以接觸事實(shí)上，可能根本無(wú)法找出整個(gè)總體的全體成

20、員。例如，要針對(duì)全國(guó)20歲以上的月有人來(lái)調(diào)查是否贊成某一政策？談何容易！這些人東跑西跑的分散在各地，有的在高山或島嶼，有的人還不在國(guó)內(nèi)，怎么可能將其全部找出來(lái)？理論上，雖然還是可以接觸到，但其成本將難以估計(jì)。 4.總體過大很多研究對(duì)象的總體確實(shí)很大。像一些暢銷全球的汽車、電器、日用品等，消費(fèi)者搜以萬(wàn)計(jì)或千萬(wàn)計(jì)，且散居全球各地，根本就不可能進(jìn)行普查。 5毀壞性若研究整個(gè)總體，每個(gè)商品都進(jìn)行測(cè)試則可能會(huì)沒有剩下的商品可以出售。例如，要測(cè)試輪胎的耐磨程度，將所生產(chǎn)的每一個(gè)輪胎都拿來(lái)進(jìn)行路面實(shí)際駕駛或以機(jī)器來(lái)磨，以便查其是否合乎品質(zhì)要求，磨完或駕駛過后的輪胎，就無(wú)法再送回到市面上銷售了。 6.正確

21、性普查費(fèi)時(shí)、費(fèi)力、費(fèi)錢，到最后往往會(huì)草率了之，所獲得的數(shù)據(jù)的正確性卻并不是可靠。還不如針對(duì)較少數(shù)的抽樣，進(jìn)行仔細(xì)的數(shù)據(jù)搜集。所以，我們通常只能對(duì)總體進(jìn)行。（二）變量與常數(shù) 變量（variables）是用來(lái)描述總體中成員的某一特性，即相同性質(zhì)的事物間表現(xiàn)差異性或差異特征的數(shù)據(jù)稱為變量或變數(shù)，它是表示在一個(gè)界限內(nèi)變動(dòng)著的性狀的數(shù)值。自然界同類事物中，都存在著一定的變異，如人的身高、體重，棉花的株高、分枝數(shù)，同窩動(dòng)物的身長(zhǎng)及各項(xiàng)生理指標(biāo)等都會(huì)存在一定的差異。所有這些差異均可用量來(lái)表示，通常記為x，如 10個(gè)人的身高在 155180cm之間，共有 158，167，173，155，180，165，

22、175，178，170，162cm，l0個(gè)變量值，記作xi （i= 1，2，10），表示x1 到x10之間任一數(shù)值，亦稱xi為隨機(jī)變量。變量按其性質(zhì)可分為連續(xù)變量和非連續(xù)變量。連續(xù)變量表示在變量范圍內(nèi)可抽出某一范圍的所有值，這種變量之間是連續(xù)的、無(wú)限的。如小麥的株高在80一90cm，在此范圍內(nèi)可以取得無(wú)數(shù)個(gè)變量。這類變量在理論上，任意兩個(gè)值之間都可能存在第三個(gè)值。非連續(xù)變量，也稱為離散變量，表示在變量數(shù)列中，僅能取得固定數(shù)值。如菌落中的菌數(shù)、單位面積水稻的莖數(shù)、小白鼠每胎產(chǎn)仔數(shù)等。任意兩個(gè)值之間不可能存在第三個(gè)值。變量可以是定性的，也可以是定量的。定性的變量往往表示某個(gè)體屬于幾種互不相

23、容的類型中的一種，如果蠅的翅有長(zhǎng)翅與殘翅，人的血型有A、B、AB和O型，豌豆花的顏色有白色、紅色和紫色，等等。定量的變量是指可測(cè)量的，如出欄時(shí)豬的重量、花生的百仁重、電泳酶譜上的帶數(shù)等。常數(shù)表示能代表事物特征和性質(zhì)的數(shù)值，通常由變量計(jì)算而來(lái)，在一定過程中是不變的。如某樣本平均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)等。（三）、參數(shù)與統(tǒng)計(jì)數(shù) 觀察值觀察值觀測(cè)一個(gè)實(shí)驗(yàn)或統(tǒng)計(jì)問題，所記錄下來(lái)的結(jié)果被稱為觀察值(observation)通常以小寫x來(lái)表示。例如，為找出大學(xué)生每月零用錢的平均數(shù)，由每位受訪者（受測(cè)樣本）所提供的每月零用錢的數(shù)值就是一個(gè)觀察值。參數(shù)也稱參量，是對(duì)一個(gè)總體特征的度量。如總體平均數(shù)、總體標(biāo)

24、準(zhǔn)差等均為參數(shù)。因?yàn)榭傮w一般都很大，有的甚至不可能取得，所以總體參數(shù)一般不可能計(jì)算出來(lái)?？梢酝ㄟ^ 對(duì)總體抽取樣本，計(jì)算樣本的統(tǒng)計(jì)數(shù)，來(lái)估計(jì)總體參數(shù)。從樣本中計(jì)算所得的數(shù)值稱為統(tǒng)計(jì)數(shù)，它是總體參數(shù)的估計(jì)值。統(tǒng)計(jì)量統(tǒng)計(jì)量相對(duì)于參數(shù)，統(tǒng)計(jì)量（statistic)又稱估計(jì)值（estimate )，是樣本的數(shù)值性敘述值，也就是用來(lái)描述樣本某一特性的數(shù)字。例如，代表樣本某一屬性的數(shù)值：樣本均值、樣本標(biāo)準(zhǔn)差。這些值是根據(jù)樣本所求得到，準(zhǔn)備用來(lái)估計(jì)總體的參數(shù)值。（四）效應(yīng)與交互作用引起試驗(yàn)差異的作用稱為效應(yīng)，如不同飼料使動(dòng)物的體重增加表現(xiàn)出差異，不同品種的玉米產(chǎn)量不同等。交互作用也稱連應(yīng)，是指兩個(gè)或

25、兩個(gè)以上處理因素相互作用產(chǎn)生的效應(yīng)。如氮、磷肥共施會(huì)對(duì)作物產(chǎn)量產(chǎn)生交互作用交互作用效應(yīng)。交互作用有正效應(yīng)，也有負(fù)效應(yīng)，如果氮、磷共施的產(chǎn)量效應(yīng)大于氮、磷單施效應(yīng)之和，說明氮磷交互作用為正效應(yīng)，如果氮、磷共施的產(chǎn)量效應(yīng)小于氮、磷單施效應(yīng)之和，說明氮磷交互作用為負(fù)效應(yīng)。（五）機(jī)誤與錯(cuò)誤機(jī)誤，也叫試驗(yàn)誤差，是指試驗(yàn)中由于無(wú)法控制的隨機(jī)因素所引起的差異。如在抽樣中，會(huì)出現(xiàn)較大或較小的數(shù)據(jù)，這是由于總體中的個(gè)體間存在一定的差異，它是不可避免的，試驗(yàn)中只能設(shè)法減小，而不能完全消滅。增加抽樣或試驗(yàn)次數(shù)，可以降低機(jī)誤的數(shù)值。錯(cuò)誤是指在試驗(yàn)過程中，人為的作用所引起的差錯(cuò)。如試驗(yàn)人員粗心大意，使儀器校正不準(zhǔn)

26、、藥品配制比例不當(dāng)、稱量不準(zhǔn)確、將數(shù)據(jù)抄錯(cuò)、計(jì)算出現(xiàn)錯(cuò)誤等都是由于人為因素造成的，在試驗(yàn)中是完全可以避免的。（六）準(zhǔn)確性與精確性統(tǒng)計(jì)工作是用樣本的統(tǒng)計(jì)數(shù)來(lái)推斷總體參數(shù)的。我們用統(tǒng)計(jì)數(shù)接近參數(shù)真值的程度，來(lái)衡量統(tǒng)計(jì)數(shù)準(zhǔn)確性的高低，用樣本中的各個(gè)變量間變異程度的大小，來(lái)衡量該樣本精確性的高低。因此，準(zhǔn)確性不等于精確性。準(zhǔn)確性是說明測(cè)定值對(duì)真值符合程度的大小，而精確性則是多次測(cè)定值的變異程度。第二節(jié) 常用統(tǒng)計(jì)軟件簡(jiǎn)介一、 Excel中的數(shù)據(jù)分析簡(jiǎn)介 Microsoft Excel 提供了一組“分析工具庫(kù)” 工具，稱為數(shù)據(jù)分析，在建立復(fù)雜統(tǒng)計(jì)或工程分析時(shí)可節(jié)省步驟。只需為每一個(gè)分析工具提供必要的

27、數(shù)據(jù)和參數(shù)，該工具就會(huì)使用適宜的統(tǒng)計(jì)方法或工程函數(shù)，在輸出表格中顯示相應(yīng)的結(jié)果。其中有些工具在生成輸出表格時(shí)還能同時(shí)生成圖表。要查看可用的分析工具，請(qǐng)單擊“工具”菜單中的“數(shù)據(jù)分析”命令，簡(jiǎn)捷、方便的完成相應(yīng)統(tǒng)計(jì)分析。如果“工具”菜單中沒有“數(shù)據(jù)分析”命令，則需要安裝“分析工具庫(kù)”。 1 1 安裝分析工具庫(kù)安裝分析工具庫(kù) 在“工具”菜單中，單擊“加載宏”命令（如圖1.1）。如果“加載宏”對(duì)話框中沒有“分析工具庫(kù)”，應(yīng)運(yùn)行“安裝”程序。選中“分析工具庫(kù)”及“分析數(shù)據(jù)庫(kù)”復(fù)選框。單擊確定。在計(jì)算機(jī)的光驅(qū)中裝入“Office 2000”光盤，根據(jù)提示完成安裝過程。注意注意 Office 9

28、7 通常在安裝過程中不需要第三步。 2 使用分析工具庫(kù) 在“工具”菜單中，單擊“數(shù)據(jù)分析”標(biāo)簽（如圖1.2），就會(huì)出現(xiàn)分析工具對(duì)話框（如圖1.3）。在“分析工具”列表框中，單擊想要使用的工具。鍵入相應(yīng)的輸入?yún)^(qū)域和輸出區(qū)域，并選擇需要的選項(xiàng)。注意注意圖1.2 僅顯示了部分分析工具,移動(dòng)分析工具列表框右側(cè)的滾動(dòng)條，可以查看所有的分析工具。3 分析工具分析工具在安裝了分析工具后，Excel 中不僅增加了統(tǒng)計(jì)分析的有關(guān)函數(shù)，而且也增加了一些相關(guān)的工作表函數(shù)，包括其他一些統(tǒng)計(jì)、財(cái)務(wù)和工程工作表函數(shù)。某些統(tǒng)計(jì)函數(shù)是內(nèi)置函數(shù)，而其他一些函數(shù)只有在安裝了“分析工具庫(kù)”之后才能使用。分析工具包括：方差

29、分析、相關(guān)系數(shù)分析、協(xié)方差分析、描述統(tǒng)計(jì)、指數(shù)平滑分析、傅立葉分析、指數(shù)平滑分析、傅立葉分析、“F - 檢驗(yàn)：雙樣本方差分析”、直方圖分析、移動(dòng)平均分析、t - 檢驗(yàn)分析隨機(jī)數(shù)發(fā)生器分析工具、排位與百分比排位分析工具、回歸分析”分析工具、抽樣分析分析工具、“z - 檢驗(yàn)：雙樣本平均差檢驗(yàn)”分析工具要使用這些工具，用戶還必須熟悉需要進(jìn)行分析的統(tǒng)計(jì)學(xué)或工程學(xué)的特定領(lǐng)域。隨后章節(jié)將介紹統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)及分析工具的使用方法。Book2-1二、SPSS SPSS的全稱是：Statistical Program for Social Sciences，即社會(huì)科學(xué)統(tǒng)計(jì)程序。該軟件是公認(rèn)的最優(yōu)秀的統(tǒng)計(jì)分析軟件

30、包之一。SPSS原是為大型計(jì)算機(jī)開發(fā)的，其版本為SPSSx，80年代初，微機(jī)開始普及以后，它率先推出了微機(jī)版本（版本為SPSS/PC+ x.x），占領(lǐng)了微機(jī)市場(chǎng)，大大地?cái)U(kuò)大了自己的用戶量 1 SPSS的安裝 2 SPSS的啟動(dòng) 3 SPSS的主窗口 4變量名稱變量名稱 5 SPSS的文件類型 1 SPSS的安裝SPSS的安裝步驟：1、啟動(dòng)Windows，在程序管理器中選“文件”菜單的“運(yùn)行”項(xiàng)，彈出“運(yùn)行”對(duì)話框，點(diǎn)擊“瀏覽.”鈕，根據(jù)安裝盤所在的驅(qū)動(dòng)器（A：或B：或光盤）及其路徑，找到SPSSINST.EXE文件，點(diǎn)擊“確定”鈕返回“運(yùn)行”對(duì)話框，再點(diǎn)擊“確定”鈕，即運(yùn)行安裝程序。2、安裝程

31、序運(yùn)行后，出現(xiàn)安裝選項(xiàng)對(duì)話框（如圖1.1所示）。用戶可根據(jù)自己的需要選擇欲安裝的模塊：即在所需的模塊名前“”內(nèi)點(diǎn)擊，使“”內(nèi)出現(xiàn)“”表明選中；若再點(diǎn)擊使“”轉(zhuǎn)為“”表明取消選擇。選擇完畢后點(diǎn)擊OK鈕。3、指定安裝的目標(biāo)盤和安裝文件的路徑。4、輸入軟件系列號(hào)碼、用戶姓名和單位名稱。5、根據(jù)安裝過程的提示，依次順序插換原盤直至安裝完成。 2 SPSS的啟動(dòng)在Windows的程序管理器中雙擊SPSS FOR WINDOWS圖標(biāo)以打開SPSS程序組，選擇SPSS圖標(biāo)并雙擊之，即可啟動(dòng)SPSS。SPSS啟動(dòng)成功后出現(xiàn)SPSS的封面及主窗口，5秒鐘后或點(diǎn)擊鼠標(biāo)左鍵，封面消失，呈現(xiàn)SPSS的預(yù)備工作狀態(tài)。

32、3 SPSS的主窗口SPSS的主窗口名為SPSS for Windows，此為窗口的標(biāo)題欄，當(dāng)它呈藍(lán)底白字時(shí)，表示該窗口為活動(dòng)窗口，意即用戶可對(duì)之進(jìn)行操作。非活動(dòng)窗口的標(biāo)題欄呈白底黑字，用戶對(duì)之不能操作。激活窗口的方法是點(diǎn)擊該窗口的標(biāo)題欄。標(biāo)題欄的左側(cè)（即窗口的左上角）為窗口控制鈕，點(diǎn)擊它選擇窗口的還原、移動(dòng)、大小變換、最小化、最大化、關(guān)閉和與其它窗口的切換。標(biāo)題欄右側(cè)（即窗口右上角）的兩個(gè)鈕：箭頭向下的為最小化鈕，點(diǎn)擊它使窗口縮小為圖標(biāo)（但不是關(guān)閉窗口）；箭頭向上的為最大化鈕，點(diǎn)擊它使窗口充滿整個(gè)屏幕。該窗口的底部為系統(tǒng)狀態(tài)欄系統(tǒng)狀態(tài)欄，顯示系統(tǒng)即刻的工作狀況，這對(duì)用戶了解系統(tǒng)情況十分有益

33、。在SPSS的主窗口中還有兩個(gè)窗口兩個(gè)窗口，一個(gè)是數(shù)據(jù)管理窗口數(shù)據(jù)管理窗口，其標(biāo)題名稱是“Newdata”，且默認(rèn)為激活狀態(tài)。數(shù)據(jù)管理器是一種典型的電子表格形式，用戶可通過定義變量名、格式化數(shù)據(jù)類型后輸入原始數(shù)值，并可根據(jù)需要對(duì)數(shù)據(jù)進(jìn)行增刪、剪貼、修改、存儲(chǔ)等操作。另一個(gè)是結(jié)果輸出窗口輸出窗口，標(biāo)題名稱是“!Output1”，啟動(dòng)時(shí)為非活動(dòng)窗口，只有當(dāng)完成一項(xiàng)處理后，才在該窗口顯示處理過程提示和計(jì)算結(jié)果。 4變量變量 4.1變量名稱變量名稱輸入字符（漢字和英文）作為變量的名稱，本例為，樣地1，樣地2，樣地3。如不輸入名稱，系統(tǒng)依次默認(rèn)為“var00001”、“var00002”、“var

34、00003” 。變量應(yīng)遵循下列原則：首字符必須是字母或漢字，不能以下劃線“_”或圓點(diǎn)“，”結(jié)尾。變量不能有空格或某些特殊符號(hào)，如“！？*”等。變量名不能與SPSS的關(guān)鍵字相同，即不能用ALL、AND、BY、EQ、GT、LE等。 4.1 變量的數(shù)據(jù)類型變量的數(shù)據(jù)類型當(dāng)鼠標(biāo)指針移至單元格，單擊后該單元格的右邊就會(huì)顯示一個(gè)“”按鈕，單擊該按鈕就會(huì)顯示一個(gè)數(shù)據(jù)類型設(shè)置窗口，如下圖所示。變量標(biāo)簽（變量標(biāo)簽（Label）：）：有的時(shí)候變量名不能正確反映變量含義，有必要給它貼上標(biāo)簽以便識(shí)別。這個(gè)時(shí)候，就在變量定義的標(biāo)簽欄里輸入你的注釋。變量值標(biāo)簽（變量值標(biāo)簽（Values）：）：變量值標(biāo)簽是用來(lái)

35、幫助解釋某些變量，特別是分類變量的數(shù)值含義。例如，有一個(gè)數(shù)值變量，0表示女性，1表示男性。此時(shí)，為了便于識(shí)別這些數(shù)值，我們是用變量值標(biāo)簽。 5 SPSS的文件類型的文件類型數(shù)據(jù)文件：擴(kuò)展名為“.sav” 結(jié)果文件：擴(kuò)展名為“.spo” 圖形文件：擴(kuò)展名為“.cht” 語(yǔ)句命令文件：擴(kuò)展名為“.sps” 第三節(jié)第三節(jié) 數(shù)據(jù)整理和簡(jiǎn)單統(tǒng)計(jì)方法數(shù)據(jù)整理和簡(jiǎn)單統(tǒng)計(jì)方法一、數(shù)據(jù)的類型 1 連續(xù)型數(shù)據(jù) 非整數(shù)型數(shù)據(jù) 2 離散型數(shù)據(jù) 整數(shù)性數(shù)據(jù)（計(jì)數(shù)）二、頻數(shù) 數(shù)據(jù)的變化規(guī)律 1 頻數(shù)（率）表和頻數(shù)（圖）目的編繪離散型數(shù)據(jù)頻數(shù)（率）表的組限可以是離散數(shù)據(jù)中出現(xiàn)的所有數(shù)字，也可以是一個(gè)區(qū)間。連續(xù)型數(shù)

36、據(jù)的組限一定是一個(gè)區(qū)間。十二個(gè)學(xué)生某門課程考試成績(jī)?nèi)缦拢菏€(gè)學(xué)生某門課程考試成績(jī)?nèi)缦拢?78.0 65.0 66.0 71.0 76.0 77.0 84.0 60.0 88.0 62.0 91.0 98.0 按每10分計(jì)各分?jǐn)?shù)段分布頻率。可以使用統(tǒng)計(jì)分析工具中直方圖工具統(tǒng)計(jì)頻數(shù)表，累計(jì)百分率等。統(tǒng)計(jì)分析方法如下： 1作表A1至A12中輸入以上數(shù)據(jù)，在B1至B2中輸入分段數(shù)據(jù)（60.0 65.0）。 2選B1和 B2，將鼠標(biāo)移動(dòng)到B2右下腳，鼠標(biāo)箭頭變?yōu)槭中?，拖?dòng)鼠標(biāo)至B9，在B列中產(chǎn)生分?jǐn)?shù)段表。 3單擊工具菜單中的分析工具，在統(tǒng)計(jì)分析工具列表中雙擊直方圖，出現(xiàn)如圖1.3所示的直方圖對(duì)話

37、框。選擇輸入?yún)^(qū)域和接收區(qū)域，單擊輸入?yún)^(qū)域右側(cè)的小方塊，在工作表中拖動(dòng)鼠標(biāo)自A1至A13選定成績(jī)表中的標(biāo)題和所有數(shù)據(jù)，單擊表示單元格一行右側(cè)的小方塊，表示選定（下同）；接受區(qū)域?yàn)榉謹(jǐn)?shù)段部分。根據(jù)需要，選擇可選項(xiàng)。最后單擊確定，統(tǒng)計(jì)結(jié)果會(huì)顯示在輸出區(qū)域，如圖1.4，表1.1。 Book2-1 標(biāo)志復(fù)選項(xiàng)標(biāo)志復(fù)選項(xiàng) 選擇是表示所選擇的第一行為標(biāo)志行，未選擇是第一行為數(shù)據(jù)行。添加標(biāo)志行可以在圖表中有關(guān)變量名稱，使圖表一目了然。輸出選項(xiàng)輸出選項(xiàng) 輸出選項(xiàng)有三項(xiàng)。輸出區(qū)域表示在工作表指定的輸出區(qū)域中輸出統(tǒng)計(jì)結(jié)果（常用）。新工作表組表示以輸入的工作表組為名稱，統(tǒng)計(jì)結(jié)果輸出到新工作表組中。新

38、工作簿表示統(tǒng)計(jì)結(jié)果輸出到新工作簿中，名稱自動(dòng)添加。統(tǒng)計(jì)圖表復(fù)選項(xiàng)統(tǒng)計(jì)圖表復(fù)選項(xiàng) 表示可以選擇的圖表，不選擇，僅輸出頻率表(如表1.1 左半部分)。圖表輸出表示不僅輸出頻率表，而且輸出頻率直方圖（按接受區(qū)域的數(shù)據(jù)順序排列直方圖。（如圖1.4）累計(jì)百分?jǐn)?shù) 計(jì)算累計(jì)百分?jǐn)?shù)及繪制百分表曲線。（如圖1.5 表1.1）柏拉圖直方圖的排列以頻數(shù)多少排列。（如圖1.5 表1.1右半部分）頻數(shù)分布直方圖和累計(jì)百分率累積圖 Book2-1直方圖02460708090100分?jǐn)?shù)段頻率.00%50.00%100.00%150.00%頻率累積 % 2頻數(shù)圖繪制頻數(shù)分布結(jié)果統(tǒng)計(jì)出來(lái)后，根據(jù)統(tǒng)計(jì)結(jié)果可以繪

39、制頻數(shù)圖。最常用的頻數(shù)圖有三種,即直方圖、累積頻數(shù)圖、多邊形圖?？筛鶕?jù)第一部分的創(chuàng)建圖表去完成。 3研究頻頗數(shù)（率）分布的意義根據(jù)編繪的頻數(shù)（率）表或頻數(shù)（率）圖，可以明顯地看出數(shù)據(jù)的三個(gè)重要特征。首先首先，根據(jù)頻數(shù)（率）分布，可以看出數(shù)據(jù)的集中情況。一般來(lái)說，不論是離散型數(shù)據(jù)，還是連續(xù)型數(shù)據(jù)都有聚集于某一范圍內(nèi)的趨勢(shì)，常常用平均值（avenge vale）表示全部數(shù)據(jù)的集中點(diǎn)。使用最廣泛的平均數(shù)（average）是算術(shù)平均值（arithmetic mean）、中位數(shù)（media）、眾數(shù)（mode）。算術(shù)平均數(shù)算術(shù)平均數(shù) 均數(shù)使用的最多，它是一群數(shù)據(jù)的重心所在。中位數(shù)中位數(shù) 它是在累積

40、頻數(shù)圖中1/2總頻數(shù)位置上的數(shù)值。眾數(shù)眾數(shù) 離散型數(shù)據(jù)的眾數(shù)是頻數(shù)圖中頻數(shù)最高的組值。連續(xù)型數(shù)據(jù)的眾數(shù)是頻數(shù)圖中頻數(shù)最高的中值。其次其次，從頻數(shù)（率）表或頻數(shù)（率）圖中，可以直觀地看出數(shù)據(jù)的變異情況：這群數(shù)據(jù)是集中在平均數(shù)附近，還是分散在平均數(shù)的兩側(cè)。如果數(shù)據(jù)大部分集中在平均數(shù)附近，遠(yuǎn)離平均數(shù)的兩側(cè)數(shù)據(jù)比較少，這樣的數(shù)據(jù)是比較整齊比較整齊的；若分布在平均數(shù)附近的數(shù)據(jù)個(gè)數(shù)與分布在遠(yuǎn)離平均數(shù)的兩側(cè)數(shù)據(jù)個(gè)數(shù)相差無(wú)幾，這樣的數(shù)據(jù)則是比較分散比較分散的。第三，從頻數(shù)（率）分布圖中，還可以看出圖形的形狀。例如，有些分布從零頻數(shù)開始平穩(wěn)地上升，直到最高頻數(shù)，然后平穩(wěn)地下降直到零頻數(shù)。結(jié)果得到一個(gè)對(duì)稱的

41、直方圖或多邊形圖。而另一些分布，在上升階段可能要經(jīng)過很多步，到達(dá)最高頻數(shù)后，突然下降；或者相反，上升很快，下降很慢。此外，頻數(shù)表或頻數(shù)圖還可以顯示一些不規(guī)則的情況。例如，在一個(gè)分布中，出現(xiàn)一個(gè)或幾個(gè)頻數(shù)突然高出正常頻數(shù)的情況，這是一種異常分布，可能是由于條件不一致，或由于度量時(shí)的失誤造成的。當(dāng)出現(xiàn)這樣一些不規(guī)則情況時(shí)，需要認(rèn)真研究，盡可能找出原因。 4 頻數(shù)（率）分布的不恒定性用隨機(jī)抽樣的方法，從某一總體中抽取兩個(gè)含量相同的樣本，分別編制出它們的頻數(shù)分布表，并進(jìn)行比較。這時(shí)會(huì)發(fā)現(xiàn)，雖然它們都是從同一總體中隨機(jī)抽取的，但其頻數(shù)分布并不完全相同，有時(shí)差距還很大。若另外再取一個(gè)樣本時(shí)，可能與前兩

42、個(gè)又不一樣。出現(xiàn)這種現(xiàn)象并不奇怪，是抽樣時(shí)經(jīng)常遇到的現(xiàn)象。當(dāng)用隨機(jī)抽樣方法獲得樣本時(shí)，由于偶然性，有時(shí)在一個(gè)樣本中抽到的數(shù)值偏高，而另一個(gè)樣本中數(shù)值偏低，使兩個(gè)樣本的頻數(shù)分布出現(xiàn)不同。由于樣本分布的不恒定性，當(dāng)用樣本去推斷總體時(shí)，推斷的結(jié)果也會(huì)有所不同。這就需要考察當(dāng)用某一樣本去推斷總體時(shí)所得結(jié)果與真正總體之間有多大失誤，或者說所得結(jié)果的可信度有多高。為了回答這一問題，首先要對(duì)總體分布有所了解。三、樣本的特征數(shù)三、樣本的特征數(shù) 數(shù)據(jù)集中點(diǎn)的度量平均數(shù)，數(shù)據(jù)變異程度的度量一標(biāo)準(zhǔn)差和數(shù)據(jù)分布的對(duì)稱程度及陡峭程度的度量一斜度和峭度。這些數(shù)字是描述樣本頻率分布特征的，稱為樣本數(shù)字特征或簡(jiǎn)稱為樣本特征

43、數(shù)（sample characteristics）。 1 平均數(shù)平均數(shù) 平均數(shù)包括：平均值、中位數(shù)，眾數(shù)。使用最多的是算術(shù)平均值，簡(jiǎn)稱為平均值（mean）。樣本算術(shù)平均值的符號(hào)是。若用x1，x2，xn表示組成樣本的每一個(gè)數(shù)，則它們的算術(shù)平均值為， X=（x1+x2+.+xn）/n（1l）或簡(jiǎn)寫為 X=xi/n I=1,2,3,n 其中“”是求和的符號(hào)，n為樣本含量。總體的平均值 =xi/N i=1,2,3,N 關(guān)于算術(shù)平均值的幾個(gè)簡(jiǎn)單的運(yùn)算法則如下：算術(shù)平均數(shù)有以下幾個(gè)基本特性：算術(shù)平均數(shù)的計(jì)算與樣本內(nèi)的每個(gè)值都有關(guān)，它的大小受每個(gè)值的影響。若每個(gè)Xi都乘以相同的數(shù)k，則平均數(shù)亦應(yīng)除

44、以k。若每個(gè)Xi都加上相同的數(shù)A，則平均數(shù)亦應(yīng)減去A。如果了X1是n1個(gè)數(shù)的平均數(shù)，X2是n2個(gè)數(shù)的平均數(shù)，那么全部n1n2個(gè)數(shù)的算術(shù)平均數(shù)是加權(quán)平均數(shù)（weighted mean）： X=(n1x1+n2x2)/(n1+n2) 平均數(shù)在理論上和在抽樣實(shí)踐中，還有更多的特性，主要表現(xiàn)在樣本與總體的關(guān)系上。第二種平均數(shù)稱為中位數(shù)中位數(shù)。所謂中位數(shù)是指位于有序數(shù)列中點(diǎn)上的數(shù)。具體計(jì)算方法是：將樣本中的n個(gè)數(shù)從小到大，或從大到小排列好，位于中間位置上的那個(gè)數(shù)即為中位數(shù)。n為奇數(shù)時(shí)，很容易從數(shù)列中找出中間位置的數(shù)。但當(dāng)n為偶數(shù)時(shí)，就需將中間位置上的兩個(gè)數(shù)取其算術(shù)平均值作為中位數(shù)。中位數(shù)有許多特

45、性。算術(shù)平均數(shù)的第2、第3條性質(zhì)，中位數(shù)也具備，但卻不具有第1條性質(zhì)，中位數(shù)直接與樣本含量n有關(guān)，而不是與具體的某個(gè)數(shù)有關(guān)。只要中間數(shù)值不改變，排列順序不改變，兩翼數(shù)字任意改變也不會(huì)影響中位數(shù)值。中位數(shù)不存在算術(shù)平均數(shù)的第4條特性，中位數(shù)也沒有那么多抽樣特性。第三種平均數(shù)稱為眾數(shù)眾數(shù)。眾數(shù)是具有最高頻數(shù)的組值或中值。眾數(shù)具有算術(shù)平均數(shù)的第2、第3條特性，但不具有第1、第4條特性。眾數(shù)主要用來(lái)描述頻數(shù)分布。例如，具有兩個(gè)分開的高頻數(shù)分布稱為雙眾數(shù)（bimedal）。中位數(shù)和眾數(shù)在生物統(tǒng)計(jì)學(xué)中很少使用。 2 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差對(duì)于數(shù)據(jù)的變異程度，經(jīng)常使用的度量方法有三種，它們是：范圍范圍（rang）

46、或稱為極差稱為極差、平均平均離差離差（mean deviatdri）和標(biāo)準(zhǔn)離差標(biāo)準(zhǔn)離差（standard deviation）或稱為標(biāo)準(zhǔn)差。其中最重要的是標(biāo)準(zhǔn)差。范圍是一組數(shù)據(jù)中的最大值與最小值的差， =max(x)min(x) （18）例如，有5個(gè)數(shù)：96.4、 96.6、97.2、 97.4、 97.8（mL）。它們的范圍（R） R97.8- 96.41.4 mL 平均離差平均離差 MD= Xi-X/n 方差方差一組數(shù)據(jù)與它們的平均數(shù)之間的標(biāo)準(zhǔn)的，或平均的不符合程度常用樣本方差(sample variance)表示（s2 ）。 S2= （xi-X）2 /（n-1）總體的方差： 2=（xi-X）2 /N 方差在實(shí)際應(yīng)用中廣泛被應(yīng)用，但它不能直接反映某個(gè)數(shù)與平均數(shù)之間的偏離程度。常用標(biāo)準(zhǔn)差s來(lái)衡量x與平均數(shù)之間的離散程度。標(biāo)準(zhǔn)差有時(shí)也記為SD。 S=（xi-X）2 / （n-1）樣本平均值的標(biāo)準(zhǔn)誤差（標(biāo)準(zhǔn)誤SD）：X=/n1/2 總之，衡量數(shù)據(jù)離散程度時(shí)。用抽樣理論可以證明：用標(biāo)準(zhǔn)差估計(jì)總體離散程度最可靠，平均離差次之。但是當(dāng)樣本較?。ㄈ缰挥?5個(gè)數(shù)）而且變異又不是很大時(shí)，為了簡(jiǎn)化起見，也可以用范圍。Book2-1 變異系數(shù) CV=s/x 變異系數(shù)可用小數(shù)表示，也可用百分?jǐn)?shù)表示。上例兩品種的變異系數(shù)分別為： CVA=0042和CVB=0057 雖然B品種的

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

生物統(tǒng)計(jì)學(xué)(1)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

生物統(tǒng)計(jì)學(xué)(1)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔