第2章實驗數(shù)據(jù)分析統(tǒng)計資料的整理與分析_第1頁
第2章實驗數(shù)據(jù)分析統(tǒng)計資料的整理與分析_第2頁
第2章實驗數(shù)據(jù)分析統(tǒng)計資料的整理與分析_第3頁
第2章實驗數(shù)據(jù)分析統(tǒng)計資料的整理與分析_第4頁
第2章實驗數(shù)據(jù)分析統(tǒng)計資料的整理與分析_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第二章統(tǒng)計資料的整理與分析下一張

主頁

退出

上一張

1數(shù)理統(tǒng)計中的常用術語

1.1總體與樣本

總體:根據(jù)研究目的確定的研究對象的全體稱為總體(population);

個體:總體中的每一個研究單位稱為個體(individual);

樣本:依據(jù)一定方法由總體中抽取部分個體所組成的集合稱為樣本(sample);

有限總體:含有有限個個體的總體稱為有限總體;

無限總體:包含有無限多個個體的總體稱為無限總體;下一張

主頁

退出

上一張

樣本容量:樣本中所包含的個體數(shù)目叫樣本容量或大小(samplesize),樣本容量常記為n。通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。試驗研究的目的:了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。下一張

主頁

退出

上一張

為了能可靠地從樣本來推斷總體,要求樣本具有一定的含量和代表性。如何獲取有代表性的樣本?采用隨機抽取。所謂隨機抽取(randomsampling)是指總體中的每一個個體都有同等的機會被抽取到樣本中。樣本畢竟只是總體的一部分,盡管樣本具有一定的含量也具有代表性,通過樣本來推斷總體也不可能是百分之百的正確。有很大的可靠性但有一定的錯誤率這是統(tǒng)計分析的特點。下一張

主頁

退出

上一張

1.2參數(shù)與統(tǒng)計量為了表示總體和樣本的數(shù)量特征,需要計算特征數(shù)。

參數(shù):由總體計算的特征數(shù)叫參數(shù)(parameter);常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標準差;統(tǒng)計量:由樣本計算的特征數(shù)叫統(tǒng)計量(staistic)。常用拉丁字母表示統(tǒng)計量,例如用表示樣本平均數(shù),用s表示樣本標準差,用R表示極差。下一張

主頁

退出

上一張

總體樣本參數(shù)統(tǒng)計量sμσσ2方差s2標準差平均數(shù)R極差抽樣推斷、估計為了了解總體分布、特征構(gòu)造

總體參數(shù)由相應的樣本統(tǒng)計量來估計,例如用估計μ,用S估計σ等。

1.3準確性與精確性

準確性(accuracy)也叫準確度,指觀測值與其真值的接近程度。設某一試驗指標或性狀的真值為μ,觀測值為

x,若x與μ相差的絕對值|x-μ|越小,則觀測值x的準確性越高;反之則低。下一張

主頁

退出

上一張

精確性(precision)也叫精確度,指同一試驗指標或性狀的重復觀測值彼此接近的程度。若觀測值彼此接近,即任意二個觀測值xi

、xj

相差的絕對值|xi-xj|越小,則觀測值精確性越高;反之則低。準確性、精確性的意義見圖2-1。下一張

主頁

退出

上一張

圖2-1準確性與精確性的關系示意圖隨機誤差也叫抽樣誤差(samplingerror),是由于許多無法控制的內(nèi)在和外在的偶然因素所造成的。隨機誤差帶有偶然性質(zhì),在試驗中,即使十分小心的進行試驗操作也難以消除。隨機誤差不可避免,但可減少。隨機誤差影響試驗的精確性。下一張

主頁

退出

上一張

1.4

隨機誤差(randomerror)與系統(tǒng)誤差(systematicerror)統(tǒng)計上的試驗誤差是指隨機誤差。這種誤差愈小,試驗的精確性愈高。

系統(tǒng)誤差也叫片面誤差(lopsidederror),這是由于試驗對象相差較大,測量的儀器不準、標準試劑未經(jīng)校正,以及觀測、記載、抄錄、計算中的錯誤等等所引起。系統(tǒng)誤差可以通過改進方法、正確試驗設計來避免、消除。系統(tǒng)誤差影響試驗的準確性。下一張

主頁

退出

上一張

正確地進行試驗數(shù)據(jù)資料的分類是統(tǒng)計資料整理的前提。在調(diào)查或試驗中,由觀察、測量所得的數(shù)據(jù)資料按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級)資料三大類。下一張

主頁

退出

上一張

2統(tǒng)計資料的分類

數(shù)量性狀(quantitativecharacter)是指能夠以測量、計量或計數(shù)的方式表示其特征的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料數(shù)量性狀資料的獲得有測量和計數(shù)兩種方式,因而數(shù)量性狀資料又分為計量資料和計數(shù)資料兩種。下一張

主頁

退出

上一張

2.1數(shù)量性狀資料用測量方式獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)量性狀資料。其數(shù)據(jù)是用長度、容積、重量等來表示。資料的各個觀測值不一定是整數(shù),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計量資料也稱為連續(xù)性變異資料。下一張

主頁

退出

上一張

2.1.1計量資料

度量衡是計量長短、多少、輕重的統(tǒng)稱.其中,度是計量長短的尺度,量是計量多少的器具,衡是計量輕重的器具.

2.1.2計數(shù)資料

用計數(shù)方式獲得的數(shù)量性狀資料。這類資料的各個觀察值只能以整數(shù)表示,在兩個相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。下一張

主頁

退出

上一張

2.2質(zhì)量性狀資料

質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測量的,只能用文字來描述其特征的性狀,如食品顏色、風味等等。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:下一張

主頁

退出

上一張

2.2.1統(tǒng)計次數(shù)法

在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,蘋果中全紅果個數(shù)與半紅果個數(shù)。由質(zhì)量性狀數(shù)量化而得來的資料又叫次數(shù)資料。下一張

主頁

退出

上一張

2.2.2評分法

對某一質(zhì)量性狀,因其類別不同,分別給予評分。例如,分析面包的質(zhì)量,可以按照國際面包評分細則進行打分,綜合評價面包質(zhì)量。新產(chǎn)品開發(fā)中的評價打分等等。

2.3半定量(等級)資料

半定量或等級資料(semi-quantitativeorrankeddata)是指將觀察單位按所考察的性狀或指標的等級順序分組,然后清點各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點,又有程度或量的不同。如某種果實的褐變程度是視果實變色面積將其分組,然后統(tǒng)計各級別果數(shù)。

三種不同類型的資料相互間是有區(qū)別的,但有時可根據(jù)研究的目的和統(tǒng)計方法的要求將一種類型資料轉(zhuǎn)化成另一種類型的資料。例如,酸奶中的乳桿菌總數(shù)得到的資料屬于計數(shù)資料,根據(jù)化驗的目的,可按乳桿菌總數(shù)正?;虿徽7譃閮山M,清點各組的次數(shù),計數(shù)資料就轉(zhuǎn)化為質(zhì)量性狀次數(shù)資料;如果按乳桿菌總數(shù)過高、正常、過低分為三組,清點各組次數(shù),就轉(zhuǎn)化成了半定量資料。下一張

主頁

退出

上一張

3數(shù)據(jù)資料的整理3.1數(shù)據(jù)資料的檢查與核對目的:在于確保原始資料的完整性和正確性。所謂完整性是指原始資料無遺缺或重復。所謂正確性是指原始資料的測量和記載無差錯或未進行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識作出判斷)。對于有重復、異?;蜻z漏的資料,應予以刪除或補齊;對有錯誤、相互矛盾的資料應進行更正,必要時進行復查或重新試驗。下一張

主頁

退出

上一張

未整理的資料為原始資料,是零星的、孤立的和雜亂無章,無規(guī)律可循,通過科學的整理和分析,可發(fā)現(xiàn)其規(guī)律性,揭示事物內(nèi)在本質(zhì)。3.2數(shù)據(jù)資料的整理方法當觀測值不多(n≤30)時,不必分組,可直接進行統(tǒng)計分析。當觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。

下一張

主頁

退出

上一張

3.2連續(xù)性資料(計量資料)的整理

連續(xù)性資料的整理,需要先確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測值計數(shù)歸組。

【例2.1】為了分析某生產(chǎn)廠的罐頭質(zhì)量,現(xiàn)隨機抽取100聽罐頭樣品,分別稱取其凈重,數(shù)據(jù)資料見表2-1。下一張

主頁

退出

上一張

342.1340.7348.4346.0343.4342.7346.0341.1344.0348.0346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2344.0353.3340.2336.3348.9340.2356.1346.0345.6346.2340.6339.7342.3352.8342.6350.3348.5344.0350.0335.1340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7341.1347.1342.5350.0343.5345.6345.0348.6344.2341.1346.8350.2339.9346.6339.9344.3346.2338.0341.1347.3347.2339.8344.4347.2341.0341.0343.3342.3339.5343.0表2-1100聽罐頭樣品的凈重g

1、求全距

R

全距是數(shù)據(jù)資料中的最大值與最小值之差,又稱為極差(range),用R表示。即

R=Max(xi)-Min(xi)xi為觀測值

本例Max=358.2Min=331.2

R=358.2-331.2=27.0下一張

主頁

退出

上一張

2、確定組數(shù)

k

組數(shù)的多少視樣本含量及資料的變動范圍大小而定,一般以達到既簡化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當,不宜過多,亦不宜過少。分組越多所求得的統(tǒng)計量越精確,但增大了運算量;若分組過少,資料的規(guī)律性就反映不出來,計算出的統(tǒng)計量的精確性也較差。一般組數(shù)的確定,可參考表2-2。下一張

主頁

退出

上一張

下一張

主頁

退出

上一張

樣本含量(n)組數(shù)60-1007-10100-2009-12200-50012-17500以上17-30本例中,n=100,初步確定組數(shù)為9組。表2-2樣本含量與組數(shù)

3、確定組距i

每一組中的最大值與最小值之差稱為組距(Classinterval),記為i。分組時一般要求各組的組距相等。組距(i)=全距R/組數(shù)k

本例

i=27/9=3下一張

主頁

退出

上一張

4、確定組限及組中值

各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點值稱為組中值,它是該組的代表值。組中值與組限、組距的關系如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距

下一張

主頁

退出

上一張

組距確定后,首先要選定第一組的組中值。在分組時為了避免第一組中觀察值過多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。注意:最末一組的上限應大于資料中的最大值。

表2-1中,最小值為331.2,第一組的組中值取331.0,因組距為3.0,因此第一組的下限應為:

331.0-(1/2)×3.0=329.5;第一組的上限也就是第二組的下限應為:

329.5+3.0=332.5;第二組的上限也就是第三組的下限為:

332.5+3.0=335.5,……,依此類推,一直到某一組的上限大于資料中的最大值為止。依次類推分組為:

329.5-332.5,332.5-335.5,……

下一張

主頁

退出

上一張

將正好等于前一組上限和后一組下限的數(shù)據(jù),一般約定將其歸入后一組。通常將上限略去不寫。第一組記為36.0

,第二組記為39.0

……

5、制作次數(shù)分布表分組結(jié)束后,將資料中的每一觀測值逐一歸組,統(tǒng)計每組內(nèi)所包含的觀測值個數(shù),制作次數(shù)分布表。下一張

主頁

退出

上一張

表2-3100聽罐頭凈重的次數(shù)分布下一張

主頁

退出

上一張

組限組中值(x)次數(shù)(f)329.5-331.0332.5-334.0335.5-337.0338.5-340.0341.5-343.0344.5-346.0347.5-349.0350.5-352.0353.5-355.0356.5-358.011621322312211

100聽罐頭的單聽凈重多數(shù)集中在343g,約占觀測值總個數(shù)的1/3,用它來描述罐頭單聽凈重的平均水平,有較強的代表性。由次數(shù)分布表可以看出,每聽罐頭凈重小于332.5g及大于356.5g的為極少數(shù)。100聽罐頭凈重分布基本以343.0g為中心,向兩邊做遞減對稱分布。表2-4100盒鮮棗每盒檢出不合格棗數(shù)下一張

主頁

退出

上一張

3.3間斷性資料(計數(shù)資料)的整理

以100盒鮮棗每盒檢出不合格棗數(shù)為例,說明間斷性資料的整理。18291924221924222220232021232126222324222324252422242324222523252623222523202225262526262526242321262123222424212324242122232022232623242224262824272324222623202625252625252625242225262524252625252728計數(shù)資料觀察值較多時,變異范圍較大,若以每一觀察值為一組,則組數(shù)太多,而每組內(nèi)包含的觀察值太少,資料的規(guī)律性顯示不出來。對于這樣的資料,可擴大為以幾個相鄰觀察值為一組,適當減少組數(shù),這樣資料的規(guī)律性就較明顯,對資料進一步計算分析也比較方便。下一張

主頁

退出

上一張

表2-5100盒鮮棗每盒檢出不合格棗數(shù)次數(shù)分布表下一張

主頁

退出

上一張

不合格棗數(shù)次數(shù)(f)18-19320-211122-233124-253526-271728-2933.4質(zhì)量性狀資料、半定量(等級)資料的整理對于質(zhì)量性狀資料、半定量(等級)資料,可按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。下一張

主頁

退出

上一張

3.5常用統(tǒng)計表與統(tǒng)計圖3.5.1統(tǒng)計表(1)統(tǒng)計表的結(jié)構(gòu)和要求統(tǒng)計表由標題、橫標目、縱標目、線條、數(shù)字及合計構(gòu)成,其基本格式如下表:

表號標題下一張

主頁

退出

上一張

表號標題編制統(tǒng)計表的總原則:結(jié)構(gòu)簡單,層次分明,內(nèi)容安排合理,重點突出,數(shù)據(jù)準確,便于理解和比較分析。下一張

主頁

退出

上一張

統(tǒng)計表編制具體要求如下:

標題標題要簡明扼要、準確地說明表的內(nèi)容,有時須注明時間、地點。

②標目標目分橫標目和縱標目兩項。橫標目列在表的左側(cè),用以表示被說明事物的主要標志(水平取值);縱標目列在表的上端,說明橫標目各統(tǒng)計指標內(nèi)容(影響因素和結(jié)果指標),并注明計算單位,如%、kg、cm等等。

③數(shù)字一律用阿拉伯數(shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。

④線條表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可省去,表的左上角一般不用斜線。(三線圖)

下一張

主頁

退出

上一張

(2)統(tǒng)計表的種類

統(tǒng)計表可根據(jù)縱、橫標目是否有分組分為簡單表和復合表兩類。

簡單表由一組橫標目和一組縱標目組成,縱橫標目都未分組。此類表適于簡單資料的統(tǒng)計,如表2-6。下一張

主頁

退出

上一張

②復合表由兩組或兩組以上的橫標目與一組縱標目結(jié)合而成,或由一組橫標目與兩組或兩組以上的縱標目結(jié)合而成,或由兩組或兩組以上的橫、縱標目結(jié)合而成。此類表適用于復雜資料的統(tǒng)計,如表2-11。下一張

主頁

退出

上一張

表2-11幾種動物性食品的營養(yǎng)成分3.5.2統(tǒng)計圖常用的統(tǒng)計圖有散點圖、長條圖

(barchart)、園餅圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖(broken-linechart)等。一般情況下,計量資料采用直方圖和折線圖,計數(shù)資料、質(zhì)量性狀資料、半定量(等級)資料常用長條圖、線圖或園餅圖。下一張

主頁

退出

上一張

統(tǒng)計圖繪制的基本要求

1、標題簡明扼要,列于圖的下方。

2、縱、橫兩軸應有刻度,注明單位。

3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5。

4、圖中需用不同顏色或線條代表不同處理、樣品等時,應有圖例說明。下一張

主頁

退出

上一張

Excel軟件應用工具-加載宏-分析數(shù)據(jù)庫數(shù)據(jù)分析方差分析回歸分析統(tǒng)計假設檢驗直方圖描述統(tǒng)計4.1平均數(shù)(mean,average)下一張

主頁

退出

上一張

4統(tǒng)計資料的特征數(shù)

平均數(shù)是統(tǒng)計學中最常用的統(tǒng)計量,反映數(shù)據(jù)資料的相對集中位置。平均數(shù)主要包括有:

算術平均數(shù)(arithmeticmean)中位數(shù)(median)眾數(shù)(mode)

幾何平均數(shù)(geometricmean)

調(diào)和平均數(shù)(harmonicmean)

4.1.1算術平均數(shù)(arithmeticmean)

算術平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù),記為。算術平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計算。

1.直接法

主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計算。下一張

主頁

退出

上一張

設某一資料包含n個觀測值:

x1、x2、…、xn,

則樣本平均數(shù)可通過下式計算:(2-1)

其中,Σ為總和符號;表示從第一個觀測值x1累加到第n個觀測值xn。當在意義上已明確時,可簡寫為Σx,(3-1)式可改寫為:下一張

主頁

退出

上一張

例:對食品科學專業(yè)2004級1班10位同學的體重進行測定,測定結(jié)果分別為50.0、52.0、53.5、56.0、58.5、60.0、48.0、51.0、50.5、49.0(kg),求其平均數(shù)。

由于Σx=50.0+52.0+53.5+56.0+58.5+60.0+48.0+51.0+50.5+49.0=528.5,

n=10

下一張

主頁

退出

上一張

那么

10位同學的平均體重為52.85kg。

2.加權(quán)法對于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎上采用加權(quán)法計算平均數(shù),計算公式為:(2-2)下一張

主頁

退出

上一張

式中:—第i組的組中值;

—第i組的次數(shù);

—分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占的比重大小,因此將fi

稱為是xi的“權(quán)”,加權(quán)法也由此而得名。

【例】100聽罐頭凈重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。下一張

主頁

退出

上一張

表2-3100聽罐頭凈重的次數(shù)分布下一張

主頁

退出

上一張

組限組中值(x)次數(shù)(f)329.5-331.01332.5-334.03335.5-337.010338.5-340.026341.5-343.031344.5-346.017347.5-349.08350.5-352.02353.5-355.01356.5-358.01利用加權(quán)法計算平均數(shù)公式計算:

100聽罐頭每聽凈重的加權(quán)平均數(shù)為342.67g。

注意:

計算若干個來自同一總體的樣本平均數(shù)的平均數(shù)時,如果樣本含量不等,也應采用加權(quán)法計算。

下一張

主頁

退出

上一張

【例】某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個牛群混合在一起,其混合后平均體重為多少?此例兩個牛群所包含的牛的頭數(shù)不等,要計算兩個牛群混合后的平均體重,應以兩個牛群牛的頭數(shù)為權(quán),求兩個牛群平均體重的加權(quán)平均數(shù),即下一張

主頁

退出

上一張

即兩個牛群混合后平均體重為738.89kg。3.平均數(shù)的基本性質(zhì)(1)樣本各觀測值與平均數(shù)之差的和為零,即離均差之和等于零?;蚝唽懗上乱粡?/p>

主頁

退出

上一張

(2)樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。

(xi-)2<(xi-a)2

(常數(shù)a≠)

或簡寫為:<

對于總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:下一張

主頁

退出

上一張

(2-3)式中,N表示總體所包含的個體數(shù)

統(tǒng)計學中常用樣本平均數(shù)()作為總體平均數(shù)(μ)的估計量,并已證明樣本平均數(shù)是總體平均數(shù)μ的無偏估計量。當一個統(tǒng)計量的數(shù)學期望(數(shù)學意義上的均值)等于所估計的總體參數(shù)時,則稱此統(tǒng)計量為該總體參數(shù)的無偏估計量。下一張

主頁

退出

上一張

4.1.2中位數(shù)(median)

將資料內(nèi)所有觀測值由小到大依次排列,位于中間的那個觀測值,稱為中位數(shù),記為Md。

當觀測值的個數(shù)是偶數(shù)時,則以中間兩個觀測值的平均數(shù)作為中位數(shù)。當所獲得的數(shù)據(jù)資料呈偏態(tài)分布時,中位數(shù)的代表性優(yōu)于算術平均數(shù)。下一張

主頁

退出

上一張

(1)當觀測值個數(shù)n為奇數(shù)時,第(n+1)/2位置的觀測值,即x(n+1)/2為中位數(shù):

Md=

(2)當觀測值個數(shù)為偶數(shù)時,第n/2和第(n/2+1)位置的兩個觀測值之和的1/2為中位數(shù),即:

下一張

主頁

退出

上一張

(2-4)

【例】對9個小麥品種的容重進行測定,測定結(jié)果為750、760、767、769、773、775、778、780、800(已排序),求其中位數(shù)。此例n=9,為奇數(shù),則:

Md==773(g)

即九個小麥品種的中位數(shù)為773g。下一張

主頁

退出

上一張

4.1.3幾何平均數(shù)(geometricmean)

n個觀測值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應用于科學研究中的動態(tài)分析,如微生物的增長率、人口的增長率等等。當觀測值呈幾何級數(shù)變化時,用幾何平均數(shù)比用算術平均數(shù)更能代表其平均水平。其計算公式如下:

下一張

主頁

退出

上一張

(2-6)為了計算方便,可將各觀測值取對數(shù)后相加除以n,得lgG,再求lgG的反對數(shù),即得G值,即

下一張

主頁

退出

上一張

4.1.4眾數(shù)(mode)

資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。

下一張

主頁

退出

上一張

4.1.5調(diào)和平均數(shù)(harmonicmean)

,資料中各觀測值倒數(shù)的算術平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H,即(2—8)計算平均速率4.2變異數(shù)變異數(shù)的意義

用平均數(shù)作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是不全面的,還需引入度量資料中觀測值變異程度大小的統(tǒng)計量。常用的表示變異程度的統(tǒng)計量有全距、方差、標準差和變異系數(shù)。下一張

主頁

退出

上一張

4.2.1全距(Range)

全距(極差)是表示資料中各觀測值變異程度大小最簡便的統(tǒng)計量。

R=Max-MinR值越大,平均數(shù)的代表性越差。但是全距只利用了資料中的最大值和最小值,沒有充分利用全部資料,并不能準確表達資料中各觀測值的變異程度,是比較粗略的。當資料很多而又要迅速對資料的變異程度作出判斷時,可以利用全距這個統(tǒng)計量。下一張

主頁

退出

上一張

為了準確地表示樣本內(nèi)各個觀測值的變異程度,人們首先會考慮到以平均數(shù)為標準,求出各個觀測值與平均數(shù)的離差,(),稱為離均差。雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì)和程度,但因為離均差有正、有負,離均差之和為零,即Σ

=0,因而不能用離均差之和Σ()來表示資料中所有觀測值的總偏離程度。下一張

主頁

退出

上一張

4.2.2方差(Variance)為了解決離均差有正、有負,離均差之和為零的問題,可先求離均差的絕對值并將各離均差絕對值之和除以觀測值個數(shù)n求得平均絕對離差,即Σ||/n。雖然平均絕對離差可以表示資料中各觀測值的變異程度,但由于平均絕對離差包含絕對值符號,使用很不方便,在統(tǒng)計學中未被采用。

采用將離均差平方的辦法來解決離均差有正、有負,離均差之和為零的問題。先將各個離均差平方,即()2

,再求離均差平方和,即

,簡稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即

,求出離均差平方和的平均數(shù);下一張

主頁

退出

上一張

為了使所得的統(tǒng)計量是相應總體參數(shù)的無偏估計量,統(tǒng)計學證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量n,而用自由度n-1,所以,我們采用統(tǒng)計量

表示資料的變異程度。統(tǒng)計量

稱為均方

(meansquare縮寫為MS),又稱樣本方差,記為S2,即,VARS2=(2—9)下一張

主頁

退出

上一張

相應的總體參數(shù)叫總體方差,記為σ2。對于有限總體而言,σ2的計算公式為:(2—10)統(tǒng)計學上把樣本方差

S2的平方根叫做樣本標準差,記為S,即:STDEV

下一張

主頁

退出

上一張

4.2.3標準差(Standdeviation)(2-11)由于所以(2-11)式可改寫為:下一張

主頁

退出

上一張

相應的總體參數(shù)叫總體標準差,記為σ。對于有限總體而言,σ的計算公式為:

(2-12)

在統(tǒng)計學中,常用樣本標準差S估計總體標準差σ。

下一張

主頁

退出

上一張

4.2.4標準差的計算方法1.直接法

對于未分組或小樣本資料,可直接利用定義公式來計算標準差。

【例】10瓶罐頭的凈重(g)分別為450,450,500,500,500,550,550,550,600,600,650

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論