統(tǒng)計數(shù)據(jù)的收集與整理_第1頁
統(tǒng)計數(shù)據(jù)的收集與整理_第2頁
統(tǒng)計數(shù)據(jù)的收集與整理_第3頁
統(tǒng)計數(shù)據(jù)的收集與整理_第4頁
統(tǒng)計數(shù)據(jù)的收集與整理_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計數(shù)據(jù)的收集與整理第一頁,共一百二十頁,2022年,8月28日第一節(jié)生物統(tǒng)計的概述

合理地進行調(diào)查或試驗設(shè)計、科學(xué)地整理、分析所收集得來的資料是生物統(tǒng)計(Biometrics)的根本任務(wù)。

生物統(tǒng)計是數(shù)理統(tǒng)計的原理和方法在生物科學(xué)研究中的應(yīng)用,是一門應(yīng)用數(shù)學(xué)。一、提供試驗或調(diào)查設(shè)計的方法

試驗設(shè)計這一概念有廣義與狹義之分:第二頁,共一百二十頁,2022年,8月28日

廣義的試驗設(shè)計是指試驗研究課題設(shè)計,也就是指整個試驗計劃的擬定,包含課題名稱、試驗?zāi)康?,研究依?jù)、內(nèi)容及預(yù)期達到的效果,試驗方案,供試單位的選取、重復(fù)數(shù)的確定、試驗單位的分組,試驗的記錄項目和要求,試驗結(jié)果的分析方法,經(jīng)濟效益或社會效益的估計,已具備的條件,需要購置的儀器設(shè)備,參加研究人員的分工,試驗時間、地點、進度安排和經(jīng)費預(yù)算,成果鑒定,學(xué)術(shù)論文撰寫等內(nèi)容。第三頁,共一百二十頁,2022年,8月28日

狹義的試驗設(shè)計主要是指試驗單位(如動物試驗的畜、禽)的選取、重復(fù)數(shù)目的確定及試驗單位的分組。生物統(tǒng)計中的試驗設(shè)計主要指狹義的試驗設(shè)計。合理的試驗設(shè)計能控制和降低試驗誤差,提高試驗的精確性,為統(tǒng)計分析獲得試驗處理效應(yīng)和試驗誤差的無偏估計提供必要的數(shù)據(jù)。第四頁,共一百二十頁,2022年,8月28日

二、提供整理、分析資料的方法整理資料的基本方法是根據(jù)資料的特性將其整理成統(tǒng)計表、繪制成統(tǒng)計圖。通過統(tǒng)計表、圖可以大致看到所得資料集中、離散的情況。并利用所收集得來的數(shù)據(jù)計算出幾個統(tǒng)計量,以表示該資料的數(shù)量特征、估計相應(yīng)的總體參數(shù)。第五頁,共一百二十頁,2022年,8月28日統(tǒng)計分析最重要的內(nèi)容是差異顯著性檢驗。通過抽樣調(diào)查或控制試驗,獲得的是具有變異的資料。產(chǎn)生變異的原因是什么?是由于進行比較的處理間,例如不同品種、不同飼料配方間有實質(zhì)性的差異或是由于無法控制的偶然因素所引起?顯著性檢驗的目的就在于承認并盡量排除這些無法控制的偶然因素的干擾,將處理間是否存在本質(zhì)差異揭示出來。顯著性檢驗的方法很多,常用的有:第六頁,共一百二十頁,2022年,8月28日

t檢驗——主要用于檢驗兩個處理平均數(shù)差異是否顯著;

方差分析——主要用于檢驗多個處理平均數(shù)間差異是否顯著;

檢驗——

主要用于由質(zhì)量性狀得來的次數(shù)資料的顯著性檢驗等。第七頁,共一百二十頁,2022年,8月28日統(tǒng)計分析的另一個重要內(nèi)容是對試驗指標或畜禽性狀間的關(guān)系進行研究,或者研究它們之間的聯(lián)系性質(zhì)和程度,或者尋求它們之間的聯(lián)系形式,即進行相關(guān)分析與回歸分析。通過對資料進行相關(guān)、回歸分析,可以揭示出試驗指標或性狀間的內(nèi)在聯(lián)系,為畜禽、水產(chǎn)新品種選育等提供強有力的依據(jù)。第八頁,共一百二十頁,2022年,8月28日還有一類統(tǒng)計分析方法不考慮資料的分布類型,也不事先對有關(guān)總體參數(shù)進行估算,這類統(tǒng)計分析方法叫非參數(shù)檢驗法。非參數(shù)檢驗法計算簡便。當通常的檢驗方法對畜禽、水產(chǎn)科研中的某些資料無能為力時,非參數(shù)檢驗法則正好發(fā)揮作用。第九頁,共一百二十頁,2022年,8月28日第二節(jié)生物統(tǒng)計的常用術(shù)語

一、總體與樣本根據(jù)研究目的確定的研究對象的全體稱為總體(population);總體中的一個研究單位稱為個體

(individual);總體的一部分稱為樣本(sample);含有有限個個體的總體稱為有限總體;包含有無限多個個體的總體叫無限總體;第十頁,共一百二十頁,2022年,8月28日在實際研究中還有一類假想總體。例如進行幾種飼料的飼養(yǎng)試驗,實際上并不存在用這幾種飼料進行飼養(yǎng)的總體,只是假設(shè)有這樣的總體存在,把所進行的試驗看成是假想總體的一個樣本;樣本中所包含的個體數(shù)目叫樣本容量或大小(samplesize),樣本容量常記為n。通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。研究的目的是要了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。第十一頁,共一百二十頁,2022年,8月28日為了能可靠地從樣本來推總體,要求樣本具有一定的含量和代表性。只有從總體隨機抽取的樣本才具有代表性。所謂隨機抽取(randomsampling)的樣本是指總體中的每一個個體都有同等的機會被抽取組成樣本。樣本畢竟只是總體的一部分,盡管樣本具有一定的含量也具有代表性,通過樣本來推斷總體也不可能是百分之百的正確。有很大的可靠性但有一定的錯誤率這是統(tǒng)計分析的又一特點。第十二頁,共一百二十頁,2022年,8月28日

二、參數(shù)與統(tǒng)計量為了表示總體和樣本的數(shù)量特征,需要計算出幾個特征數(shù)。由總體計算的特征數(shù)叫參數(shù)(parameter);由樣本計算的特征數(shù)叫統(tǒng)計量(staistic)。常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標準差;常用拉丁字母表示統(tǒng)計量,例如用表示樣本平均數(shù),用S表示樣本標準差。第十三頁,共一百二十頁,2022年,8月28日

總體參數(shù)由相應(yīng)的統(tǒng)計量來估計,例如用估計μ,用S估計σ等。

三、準確性與精確性

準確性(accuracy)也叫準確度,指在調(diào)查或試驗中某一試驗指標或性狀的觀測值與其真值接近的程度。設(shè)某一試驗指標或性狀的真值為μ,觀測值為

x,若x與μ相差的絕對值|x-μ|小,則觀測值x的準確性高;反之則低。第十四頁,共一百二十頁,2022年,8月28日精確性(precision)也叫精確度,指調(diào)查或試驗中同一試驗指標或性狀的重復(fù)觀測值彼此接近的程度。若觀測值彼此接近,即任意二個觀測值xi

、xj

相差的絕對值|xi-xj|小,則觀測值精確性高;反之則低。調(diào)查或試驗的準確性、精確性合稱為正確性。第十五頁,共一百二十頁,2022年,8月28日在調(diào)查或試驗中應(yīng)嚴格按照調(diào)查或試驗計劃進行,準確地進行觀測記載,力求避免人為差錯,特別要注意試驗條件的一致性,即除所研究的各個處理外,供試畜禽的初始條件如品種、性別、年齡、健康狀況、飼養(yǎng)條件、管理措施等應(yīng)盡量控制一致,并通過合理的調(diào)查或試驗設(shè)計努力提高試驗的準確性和精確性。

由于真值μ常常不知道,所以準確性不易度量,但利用統(tǒng)計方法可度量精確性。第十六頁,共一百二十頁,2022年,8月28日

四、隨機誤差與系統(tǒng)誤差隨機誤差(randomerror)與系統(tǒng)誤差(systematicerror)

隨機誤差也叫抽樣誤差(samplingerror),這是由于許多無法控制的內(nèi)在和外在的偶然因素所造成。隨機誤差帶有偶然性質(zhì),在試驗中,即使十分小心也難以消除。隨機誤差影響試驗的精確性。第十七頁,共一百二十頁,2022年,8月28日統(tǒng)計上的試驗誤差指隨機誤差。這種誤差愈小,試驗的精確性愈高。

系統(tǒng)誤差也叫片面誤差(lopsidederror),這是由于試驗動物的初始條件相差較大,飼料種類、品質(zhì)、數(shù)量、飼養(yǎng)條件未控制相同,測量的儀器不準、標準試劑未經(jīng)校正,以及觀測、記載、抄錄、計算中的錯誤所引起。系統(tǒng)誤差影響試驗的準確性。第十八頁,共一百二十頁,2022年,8月28日第三節(jié)資料的分類

正確地進行資料的分類是資料整理的前提。在調(diào)查或試驗中,由觀察、測量所得的數(shù)據(jù)按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級)資料三大類。

一、數(shù)量性狀資料第十九頁,共一百二十頁,2022年,8月28日數(shù)量性狀(quantitativecharacter)是指能夠以量測或計數(shù)的方式表示其特征的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料(dataofquantitativecharacteristics)。數(shù)量性狀資料的獲得有量測和計數(shù)兩種方式,因而數(shù)量性狀資料又分為計量資料和計數(shù)資料兩種。第二十頁,共一百二十頁,2022年,8月28日

(一)計量資料指用量測方式獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)量性狀資料。其數(shù)據(jù)是用長度、容積、重量等來表示。這種資料的各個觀測值不一定是整數(shù),兩個相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計量資料也稱為連續(xù)性變異資料。第二十一頁,共一百二十頁,2022年,8月28日

(二)計數(shù)資料指用計數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個觀察值只能以整數(shù)表示,在兩個相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。這些觀察值只能以整數(shù)來表示,各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。第二十二頁,共一百二十頁,2022年,8月28日

二、質(zhì)量性狀資料

質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測量的性狀,如顏色、性別、生死等。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:第二十三頁,共一百二十頁,2022年,8月28日

(一)統(tǒng)計次數(shù)法

在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,在研究豬的毛色遺傳時,白豬與黑豬雜交,子二代中白豬、黑豬和花豬的頭數(shù)分類統(tǒng)計如下表。第二十四頁,共一百二十頁,2022年,8月28日

表2-1白豬和黑豬子二代的毛色分離情況第二十五頁,共一百二十頁,2022年,8月28日

這種由質(zhì)量性狀數(shù)量化得來的資料又叫次數(shù)資料。

(二)評分法

對某一質(zhì)量性狀,因其類別不同,分別給予評分。例如,在研究豬的肉色遺傳時,常用的方法是將屠宰后2小時的豬眼肌橫切面與標準圖譜對比,由淺到深分別給予15分的評分,以便統(tǒng)計分析。

第二十六頁,共一百二十頁,2022年,8月28日

三、半定量(等級)資料

半定量或等級資料(semi-quantitativeorrankeddata)是指將觀察單位按所考察的性狀或指標的等級順序分組,然后清點各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點,又有程度或量的不同。第二十七頁,共一百二十頁,2022年,8月28日如糞便潛血試驗的陽性反應(yīng)是在涂有糞便的棉簽上加試劑后觀察顏色出現(xiàn)的快慢及深淺程度分為六個等級;又如用某種藥物治療畜禽的某種疾病,療效分為“無效”、“好轉(zhuǎn)”、“顯效”和“控制”四個級別;然后統(tǒng)計各級別的供試畜禽數(shù)。半定量資料在獸醫(yī)研究中是常見的。第二十八頁,共一百二十頁,2022年,8月28日三種不同類型的資料相互間是有區(qū)別的,但有時可根據(jù)研究的目的和統(tǒng)計方法的要求將一種類型資料轉(zhuǎn)化成另一種類型的資料。例如,獸醫(yī)臨床化驗動物的白細胞總數(shù)得到的資料屬于計數(shù)資料,根據(jù)化驗的目的,可按白細胞總數(shù)正常或不正常分為兩組,清點各組的次數(shù),計數(shù)資料就轉(zhuǎn)化為質(zhì)量性狀次數(shù)資料;如果按白細胞總數(shù)過高、正常、過低分為三組,清點各組次數(shù),就轉(zhuǎn)化成了半定量資料。第二十九頁,共一百二十頁,2022年,8月28日第四節(jié)資料的整理

一、資料的檢查與核對檢查和核對原始資料的目的在于確保原始資料的完整性和正確性。所謂完整性是指原始資料無遺缺或重復(fù)。所謂正確性是指原始資料的測量和記載無差錯或未進行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識作出判斷)。對于有重復(fù)、異常或遺漏的資料,應(yīng)予以刪除或補齊;對有錯誤、相互矛盾的資料應(yīng)進行更正,必要時進行復(fù)查或重新試驗。第三十頁,共一百二十頁,2022年,8月28日

二、資料的整理方法當觀測值不多(n≤30)時,不必分組,直接進行統(tǒng)計分析。當觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。

(一)計數(shù)資料的整理現(xiàn)以50枚受精種蛋孵化出雛雞的天數(shù)為例,說明計數(shù)料的整理。第三十一頁,共一百二十頁,2022年,8月28日表2-250枚受精種蛋孵化出雛雞的天數(shù)

小雞出殼天數(shù)在19─24天范圍內(nèi)變動,有6個不同的觀察值。用各個不同觀察值進行分組,共分為6組,可得表2-3形式的次數(shù)分布表。第三十二頁,共一百二十頁,2022年,8月28日

表2-350枚受精種蛋出雛天數(shù)的次數(shù)分布表第三十三頁,共一百二十頁,2022年,8月28日有些計數(shù)資料,觀察值較多,變異范圍較大,若以每一觀察值為一組,則組數(shù)太多,而每組內(nèi)包含的觀察值太少,資料的規(guī)律性顯示不出來。對于這樣的資料,可擴大為以幾個相鄰觀察值為一組,適當減少組數(shù),這樣資料的規(guī)律性就較明顯,對資料進一步計算分析也比較方便。例如觀測某品種100只蛋雞每年每只第三十四頁,共一百二十頁,2022年,8月28日雞產(chǎn)蛋數(shù)(原始資料略),其變異范圍為200299枚。這樣的資料如以每個觀察值為一組,則組數(shù)太多(該資料最多可分為100組),如間隔10枚為一組,則可使組數(shù)適當減少。經(jīng)初步整理后分為10組,資料的規(guī)律性就比較明顯,見表2-4。第三十五頁,共一百二十頁,2022年,8月28日表2-4100只蛋雞每年產(chǎn)蛋數(shù)的次數(shù)分布表第三十六頁,共一百二十頁,2022年,8月28日

(二)計量資料的整理

計量資料在分組前需要確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測值劃線計數(shù)歸組。

【例2.1】將126頭基礎(chǔ)母羊的體重資料(見表2-5)整理成次數(shù)分布表。第三十七頁,共一百二十頁,2022年,8月28日表2-5126頭基礎(chǔ)母羊的體重資料單位:kg第三十八頁,共一百二十頁,2022年,8月28日

1、求全距

全距是資料中最大值與最小值之差,又稱為極差(range),用R表示,即

R=Max(x)-Min(x)

本例R=65.0-37.0=28.0(kg)第三十九頁,共一百二十頁,2022年,8月28日

2、確定組數(shù)

組數(shù)的多少視樣本含量及資料的變動范圍大小而定,一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當,不宜過多,亦不宜過少。分組越多所求得的統(tǒng)計量越精確,但增大了運算量;若分組過少,資料的規(guī)律性就反映不出來,計算出的統(tǒng)計量的精確性也較差。一般組數(shù)的確定,可參考表2-6。第四十頁,共一百二十頁,2022年,8月28日表2-6樣本含量與組數(shù)

本例中,n=126,根據(jù)表2-6,初步確定組數(shù)為10組。第四十一頁,共一百二十頁,2022年,8月28日

3、確定組距每組最大值與最小值之差稱為組距,記為i。分組時要求各組的組距相等。組距的計算公式為:組距(i)=全距/組數(shù)本例i=28.0/10≈3.0第四十二頁,共一百二十頁,2022年,8月28日

4、確定組限及組中值

各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點值稱為組中值,它是該組的代表值。組中值與組限、組距的關(guān)系如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距由于相鄰兩組的組中值間的距離等于組距,所以當?shù)谝唤M的組中值確定以后,加上組距就是第二組的組中值,第二組的組中值加上組距就是第三組的組中值,其余類推。第四十三頁,共一百二十頁,2022年,8月28日組距確定后,首先要選定第一組的組中值。在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。注意,最末一組的上限應(yīng)大于資料中的最大值。第四十四頁,共一百二十頁,2022年,8月28日表2-5中,最小值為37.0,第一組的組中值取37.5,因組距已確定為3.0,所以第一組的下限為:

37.5-(1/2)×3.0=36.0;第一組的上限也就是第二組的下限為:

36.0+3.0=39.0;第二組的上限也就是第三組的下限為:

39.0+3.0=42.0,……,以此類推,一直到某一組的上限大于資料中的最大值為止。于是可分組為:

36.039.0,39.042.0,……。第四十五頁,共一百二十頁,2022年,8月28日為了使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確切歸組,約定將其歸入后一組。通常將上限略去不寫。第一組記為36.0

,第二組記為39.0

,

……

5、歸組劃線計數(shù),作次數(shù)分布表分組結(jié)束后,將資料中的每一觀測值逐一歸組,劃線計數(shù),然后制成次數(shù)分布表。第四十六頁,共一百二十頁,2022年,8月28日表2-7126頭基礎(chǔ)母羊的體重的次數(shù)分布表第四十七頁,共一百二十頁,2022年,8月28日在歸組劃線時應(yīng)注意,不要重復(fù)或遺漏,歸組劃線后將各組的次數(shù)相加,結(jié)果應(yīng)與樣本含量相等,如不等,證明歸組劃線有誤,應(yīng)予糾正。在分組后所得實際組數(shù),有時和最初確定的組數(shù)不同,如第一組下限和資料中的最小值相差較大或?qū)嶋H組距比計算的組距為小,則實際分組的組數(shù)將比原定組數(shù)多;反之則少。第四十八頁,共一百二十頁,2022年,8月28日

(三)質(zhì)量性狀資料、半定量(等級)資料的整理對于質(zhì)量性狀資料、半定量(等級)資料,可按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。第四十九頁,共一百二十頁,2022年,8月28日

表2-8F2代山羊的有角無角分離情況第五十頁,共一百二十頁,2022年,8月28日

表2-9仔豬死亡情況第五十一頁,共一百二十頁,2022年,8月28日第五節(jié)常用統(tǒng)計表與統(tǒng)計圖

一、統(tǒng)計表

(一)統(tǒng)計表的結(jié)構(gòu)和要求統(tǒng)計表由標題、橫標目、縱標目、線條、數(shù)字及合計構(gòu)成,其基本格式如下表:第五十二頁,共一百二十頁,2022年,8月28日表號標題編制統(tǒng)計表的總原則:結(jié)構(gòu)簡單,層次分明,內(nèi)容安排合理,重點突出,數(shù)據(jù)準確,便于理解和比較分析。具體要求如下:第五十三頁,共一百二十頁,2022年,8月28日

1、標題標題要簡明扼要、準確地說明表的內(nèi)容,有時須注明時間、地點。

2、標目標目分橫標目和縱標目兩項。橫標目列在表的左側(cè),用以表示被說明事物的主要標志;縱標目列在表的上端,說明橫標目各統(tǒng)計指標內(nèi)容,并注明計算單位,如%、kg、cm等等。第五十四頁,共一百二十頁,2022年,8月28日

3、數(shù)字一律用阿拉伯數(shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。

4、線條表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可省去,表的左上角一般不用斜線。第五十五頁,共一百二十頁,2022年,8月28日

(二)統(tǒng)計表的種類

統(tǒng)計表可根據(jù)縱、橫標目是否有分組分為簡單表和復(fù)合表兩類。

1、簡單表由一組橫標目和一組縱標目組成,縱橫標目都未分組。此類表適于簡單資料的統(tǒng)計,如表2-10。第五十六頁,共一百二十頁,2022年,8月28日表2-10某品種雞雜種二代冠形分離情況第五十七頁,共一百二十頁,2022年,8月28日

2、復(fù)合表由兩組或兩組以上的橫標目與一組縱標目結(jié)合而成,或由一組橫標目與兩組或兩組以上的縱標目結(jié)合而成,或由兩組或兩組以上的橫、縱標目結(jié)合而成。此類表適用于復(fù)雜資料的統(tǒng)計,如表2-11。第五十八頁,共一百二十頁,2022年,8月28日表2-11幾種動物性食品的營養(yǎng)成分第五十九頁,共一百二十頁,2022年,8月28日

二、統(tǒng)計圖常用的統(tǒng)計圖有長條圖

(barchart)、圓圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖(broken-linechart)等。一般情況下,計量資料采用直方圖和折線圖,計數(shù)資料、質(zhì)量性狀資料、半定量(等級)資料常用長條圖、線圖或圓圖。第六十頁,共一百二十頁,2022年,8月28日(一)統(tǒng)計圖繪制的基本要求

1、標題簡明扼要,列于圖的下方。

2、縱、橫兩軸應(yīng)有刻度,注明單位。

3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。

4、圖中需用不同顏色或線條代表不同事物時,應(yīng)有圖例說明。第六十一頁,共一百二十頁,2022年,8月28日

(二)常用統(tǒng)計圖及其繪制方法

1、長條圖

它用等寬長條的長短或高低表示按某一研究指標劃分屬性種類或等級的次數(shù)或頻率分布。如果只涉及一項指標,則采用單式長條圖;如果涉及兩個或兩個以上的指標,則采用復(fù)式長條圖。第六十二頁,共一百二十頁,2022年,8月28日在繪制長條圖時,應(yīng)注意以下幾點:(1)縱軸尺度從“0”開始,間隔相等,標明所表示指標的尺度及單位。(2)橫軸是長條圖的共同基線,應(yīng)標明各長條的內(nèi)容。長條的寬度要相等,間隔相同。間隔的寬度可與長條寬度相同或者是其一半。(3)在繪制復(fù)式長條圖時,將同一屬性種類、等級的兩個或兩個以上指標的長條繪制在一起,各長條所表示的指標用圖例說明,同一屬性種類、等級的各長條間不留間隔。第六十三頁,共一百二十頁,2022年,8月28日

2、圓圖用于表示計數(shù)資料、質(zhì)量性狀資料或半定量(等級)資料的構(gòu)成比。所謂構(gòu)成比,就是各類別、等級的觀測值個數(shù)(次數(shù))與觀測值總個數(shù)(樣本含量)的百分比。把園圖的全面積看成100%,按各類別、等級的構(gòu)成比將園面積分成若干分,以扇形面積的大小表分別表示各類別、等級的比例。第六十四頁,共一百二十頁,2022年,8月28日繪制圓圖時,應(yīng)注意以下三點:(1)圓圖每3.6°園心角所對應(yīng)的扇形面積為1%。(2)圓圖上各部分按資料順序或大小順序,以時鐘9時或12時為起點,順時針方向排列。(3)圓圖中各部分用線條分開,注明簡要文字及百分比。例如根據(jù)表2-11中的數(shù)據(jù)用圓圖繪出四種動物性食品的營養(yǎng)成分,見下圖。第六十五頁,共一百二十頁,2022年,8月28日第六十六頁,共一百二十頁,2022年,8月28日

3、線圖用來表示事物或現(xiàn)象隨時間而變化發(fā)展的情況。線圖有單式和復(fù)式兩種。

(1)單式線圖表示某一事物或現(xiàn)象的動態(tài)。

(2)復(fù)式線圖在同一圖上表示兩種或兩種以上事物或現(xiàn)象的動態(tài)。這時可用實線“”,斷線“------”,點線“····”,橫點線“-?-?-?-”等來標志區(qū)別。第六十七頁,共一百二十頁,2022年,8月28日

4、直方圖(柱形圖、矩形圖)

對計量資料,可根據(jù)次數(shù)分布表作出直方圖以表示資料的分布情況。其作法是:在橫軸上標記組限,縱軸標記次數(shù)(f),在各組上作出其高等于次數(shù)的矩形,即得次數(shù)分布直方圖。第六十八頁,共一百二十頁,2022年,8月28日

5、折線圖對于計量資料,還可根據(jù)次數(shù)分布表作出次數(shù)分布折線圖。其作法是:在橫軸上標記組中值,縱軸上標記次數(shù),以各組組中值為橫坐標,次數(shù)為縱坐標描點,用線段依次連接各點,即可得次數(shù)分布折線圖。第六十九頁,共一百二十頁,2022年,8月28日第六節(jié)樣本的幾個特征數(shù)平均數(shù)、標準差與變異系數(shù)第七十頁,共一百二十頁,2022年,8月28日平均數(shù)是統(tǒng)計學(xué)中最常用的統(tǒng)計量,用來表明資料中各觀測值相對集中較多的中心位置。平均數(shù)主要包括有:

算術(shù)平均數(shù)(arithmeticmean)

中位數(shù)(median)

眾數(shù)(mode)

幾何平均數(shù)(geometricmean)

調(diào)和平均數(shù)(harmonicmean)

平均數(shù)第七十一頁,共一百二十頁,2022年,8月28日

一、算術(shù)平均數(shù)

算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù)。算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。

(一)直接法

主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計算。第七十二頁,共一百二十頁,2022年,8月28日設(shè)某一資料包含n個觀測值:x1、x2、…、xn,則樣本平均數(shù)可通過下式計算:(3-1)

其中,Σ為總和符號;表示從第一個觀測值x1累加到第n個觀測值xn。當在意義上已明確時,可簡寫為Σx,(3-1)式可改寫為:第七十三頁,共一百二十頁,2022年,8月28日

【例3.1】某種公牛站測得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均數(shù)。由于Σx=500+520+535+560+585+600+480+510+505+490=5285,

n=10

第七十四頁,共一百二十頁,2022年,8月28日得:即10頭種公牛平均體重為528.5kg。

(二)加權(quán)法對于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù),計算公式為:(3-2)第七十五頁,共一百二十頁,2022年,8月28日式中:—第i組的組中值;

—第i組的次數(shù);

—分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占比重大小的數(shù)量,因此將fi

稱為是xi的“權(quán)”,加權(quán)法也由此而得名。

【例3.2】將100頭長白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。第七十六頁,共一百二十頁,2022年,8月28日表3—1100頭長白母豬仔豬一月窩重次數(shù)分布表第七十七頁,共一百二十頁,2022年,8月28日利用(3—2)式得:即這100頭長白母豬仔豬一月齡平均窩重為45.2kg。計算若干個來自同一總體的樣本平均數(shù)的平均數(shù)時,如果樣本含量不等,也應(yīng)采用加權(quán)法計算。第七十八頁,共一百二十頁,2022年,8月28日

【例3.3】某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個牛群混合在一起,其混合后平均體重為多少?此例兩個牛群所包含的牛的頭數(shù)不等,要計算兩個牛群混合后的平均體重,應(yīng)以兩個牛群牛的頭數(shù)為權(quán),求兩個牛群平均體重的加權(quán)平均數(shù),即第七十九頁,共一百二十頁,2022年,8月28日即兩個牛群混合后平均體重為738.89kg。

(三)平均數(shù)的基本性質(zhì)

1、樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等于零?;蚝唽懗傻诎耸?,共一百二十頁,2022年,8月28日

2、樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。

(xi-)2<(xi-a)2

(常數(shù)a≠)或簡寫為:<

對于總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:(3-3)第八十一頁,共一百二十頁,2022年,8月28日證明:離均差平方和為最小第八十二頁,共一百二十頁,2022年,8月28日式中,N表示總體所包含的個體數(shù)。當一個統(tǒng)計量的數(shù)學(xué)期望等于所估計的總體參數(shù)時,則稱此統(tǒng)計量為該總體參數(shù)的無偏估計量。統(tǒng)計學(xué)中常用樣本平均數(shù)()作為總體平均數(shù)(μ)的估計量,并已證明樣本平均數(shù)是總體平均數(shù)μ的無偏估計量。第八十三頁,共一百二十頁,2022年,8月28日二、中位數(shù)

將資料內(nèi)所有觀測值從小到大依次排列,位于中間的那個觀測值,稱為中位數(shù),記為Md。

當觀測值的個數(shù)是偶數(shù)時,則以中間兩個觀測值的平均數(shù)作為中位數(shù)。當所獲得的數(shù)據(jù)資料呈偏態(tài)分布時,中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。中位數(shù)的計算方法因資料是否分組而有所不同。第八十四頁,共一百二十頁,2022年,8月28日

(一)未分組資料中位數(shù)的計算方法

對于未分組資料,先將各觀測值由小到大依次排列。第八十五頁,共一百二十頁,2022年,8月28日

1、當觀測值個數(shù)n為奇數(shù)時,(n+1)/2位置的觀測值,即x(n+1)/2為中位數(shù):

Md=

2、當觀測值個數(shù)為偶數(shù)時,n/2和(n/2+1)位置的兩個觀測值之和的1/2為中位數(shù),即:(3-4)第八十六頁,共一百二十頁,2022年,8月28日

【例3.4】觀察得9只西農(nóng)莎奶山羊的妊娠天數(shù)為144、145、147、149、150、151、153、156、157,求其中位數(shù)。此例n=9,為奇數(shù),則:

Md==150(天)即西農(nóng)莎奶山羊妊娠天數(shù)的中位數(shù)為150天。第八十七頁,共一百二十頁,2022年,8月28日

【例3.5】某犬場發(fā)生犬瘟熱,觀察得10只仔犬發(fā)現(xiàn)癥狀到死亡分別為7、8、8、9、11、12、12、13、14、14天,求其中位數(shù)。此例n=10,為偶數(shù),則:

(天)

即10只仔犬從發(fā)現(xiàn)癥狀到死亡天數(shù)的中位數(shù)為11.5天。

(二)已分組資料中位數(shù)的計算方法第八十八頁,共一百二十頁,2022年,8月28日

若資料已分組,編制成次數(shù)分布表,則可利用次數(shù)分布表來計算中位數(shù),其計算公式為:

(3—5)式中:L—

中位數(shù)所在組的下限;

i—

組距;

f—

中位數(shù)所在組的次數(shù);

n—

總次數(shù);

c—

小于中數(shù)所在組的累加次數(shù)。第八十九頁,共一百二十頁,2022年,8月28日

【例3.6】某奶牛場68頭健康母牛從分娩到第一次發(fā)情間隔時間整理成次數(shù)分布表如表3—2所示,求中位數(shù)。表3—268頭母牛從分娩到第一次發(fā)情間隔時間次數(shù)分布表第九十頁,共一百二十頁,2022年,8月28日由表3—2可見:i=15,n=68,因而中位數(shù)只能在累加頭數(shù)為36所對應(yīng)的“57—71”這一組,于是可確定L=57,f=20,c=16,代入公式(3—5)得:

(天)

即奶牛頭胎分娩到第一次發(fā)情間隔時間的中位數(shù)為70.5天。第九十一頁,共一百二十頁,2022年,8月28日三、幾何平均數(shù)

n個觀測值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于畜牧業(yè)、水產(chǎn)業(yè)的生產(chǎn)動態(tài)分析,畜禽疾病及藥物效價的統(tǒng)計分析。如畜禽、水產(chǎn)養(yǎng)殖的增長率,抗體的滴度,藥物的效價,畜禽疾病的潛伏期等,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。其計算公式如下:

(3-6)第九十二頁,共一百二十頁,2022年,8月28日為了計算方便,可將各觀測值取對數(shù)后相加除以n,得lgG,再求lgG的反對數(shù),即得G值,即

(3-7)【例3.7】某波爾山羊群1997—2000年各年度的存欄數(shù)見表3—3,試求其年平均增長率。第九十三頁,共一百二十頁,2022年,8月28日表3—3某波爾山羊群各年度存欄數(shù)與增長率第九十四頁,共一百二十頁,2022年,8月28日利用(3—7)式求年平均增長率

G==lg-1[(–0.602)]=lg-1(-0.456)=0.3501

即年平均增長率為0.3501或35.01%。第九十五頁,共一百二十頁,2022年,8月28日四、眾數(shù)

資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。如表2-3所列的50枚受精種蛋出雛天數(shù)次數(shù)分布中,以22出現(xiàn)的次數(shù)最多,則該資料的眾數(shù)為22天。又如【例3.6】所列出的次數(shù)分布表中,57—71這一組次數(shù)最多,其組中值為64天,則該資料的眾數(shù)為64天。第九十六頁,共一百二十頁,2022年,8月28日

五、調(diào)和平均數(shù)

資料中各觀測值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H,即(3—8)

調(diào)和平均數(shù)主要用于反映畜群不同階段的平均增長率或畜群不同規(guī)模的平均規(guī)模。第九十七頁,共一百二十頁,2022年,8月28日

【例3.8】某保種牛群不同世代牛群保種的規(guī)模分別為:0世代200頭,1世代220頭,2世代210頭;3世代190頭,4世代210頭,試求其平均規(guī)模。利用(3—9)式求平均規(guī)模:

(頭)

即保種群平均規(guī)模為208.33頭。

第九十八頁,共一百二十頁,2022年,8月28日對于同一資料:算術(shù)平均數(shù)>幾何平均數(shù)>調(diào)和平均數(shù)上述五種平均數(shù),最常用的是算術(shù)平均數(shù)。第九十九頁,共一百二十頁,2022年,8月28日標準差

一、標準差的意義用平均數(shù)作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是不全面的,還需引入一個表示資料中觀測值變異程度大小的統(tǒng)計量。第一百頁,共一百二十頁,2022年,8月28日

全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計量。但是全距只利用了資料中的最大值和最小值,并不能準確表達資料中各觀測值的變異程度,比較粗略。當資料很多而又要迅速對資料的變異程度作出判斷時,可以利用全距這個統(tǒng)計量。第一百零一頁,共一百二十頁,2022年,8月28日為了準確地表示樣本內(nèi)各個觀測值的變異程度,人們首先會考慮到以平均數(shù)為標準,求出各個觀測值與平均數(shù)的離差,(),稱為離均差。雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度,但因為離均差有正、有負,離均差之和為零,即()=0,因而不能用離均差之和Σ()來表示資料中所有觀測值的總偏離程度。

第一百零二頁,共一百二十頁,2022年,8月28日

為了解決離均差有正、有負,離均差之和為零的問題,可先求離均差的絕對值并將各離均差絕對值之和除以觀測值個數(shù)n求得平均絕對離差,即Σ||/n。雖然平均絕對離差可以表示資料中各觀測值的變異程度,但由于平均絕對離差包含絕對值符號,使用很不方便,在統(tǒng)計學(xué)中未被采用。第一百零三頁,共一百二十頁,2022年,8月28日

我們還可以采用將離均差平方的辦法來解決離均差有正、有負,離均差之和為零的問題。先將各個離均差平方,即()2

,再求離均差平方和,即,簡稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即,求出離均差平方和的平均數(shù);第一百零四頁,共一百二十頁,2022年,8月28日

為了使所得的統(tǒng)計量是相應(yīng)總體參數(shù)的無偏估計量,統(tǒng)計學(xué)證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量n,而用自由度n-1,于是,我們采用統(tǒng)計量表示資料的變異程度。統(tǒng)計量稱為均方(meansquare縮寫為MS),又稱樣本方差,記為S2,即

S2=(3—9)第一百零五頁,共一百二十頁,2022年,8月28日相應(yīng)的總體參數(shù)叫總體方差,記為σ2。對于有限總體而言,σ2的計算公式為:(3—10)第一百零六頁,共一百二十頁,2022年,8月28日

由于樣本方差帶有原觀測單位的平方單位,在僅表示一個資料中各觀測值的變異程度而不作其它分析時,常需要與平均數(shù)配合使用,這時應(yīng)將平方單位還原,即應(yīng)求出樣本方差的平方根。統(tǒng)計學(xué)上把樣本方差S2的平方根叫做樣本標準差,記為S,即:

(3-11)第一百零七頁,共一百二十頁,2022年,8月28日由于所以(3-11)式可改寫為:(3-12)第一百零八頁,共一百二十頁,2022年,8月28日

相應(yīng)的總體參數(shù)叫總體標準差,記為σ。對于有限總體而言,σ的計算公式為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論