第2章實(shí)驗(yàn)數(shù)據(jù)分析統(tǒng)計(jì)資料的整理與分析_第1頁(yè)
第2章實(shí)驗(yàn)數(shù)據(jù)分析統(tǒng)計(jì)資料的整理與分析_第2頁(yè)
第2章實(shí)驗(yàn)數(shù)據(jù)分析統(tǒng)計(jì)資料的整理與分析_第3頁(yè)
第2章實(shí)驗(yàn)數(shù)據(jù)分析統(tǒng)計(jì)資料的整理與分析_第4頁(yè)
第2章實(shí)驗(yàn)數(shù)據(jù)分析統(tǒng)計(jì)資料的整理與分析_第5頁(yè)
已閱讀5頁(yè),還剩78頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章統(tǒng)計(jì)資料的整理與分析下一張

主頁(yè)

退出

上一張

1數(shù)理統(tǒng)計(jì)中的常用術(shù)語(yǔ)

1.1總體與樣本

總體:根據(jù)研究目的確定的研究對(duì)象的全體稱為總體(population);

個(gè)體:總體中的每一個(gè)研究單位稱為個(gè)體(individual);

樣本:依據(jù)一定方法由總體中抽取部分個(gè)體所組成的集合稱為樣本(sample);

有限總體:含有有限個(gè)個(gè)體的總體稱為有限總體;

無(wú)限總體:包含有無(wú)限多個(gè)個(gè)體的總體稱為無(wú)限總體;下一張

主頁(yè)

退出

上一張

樣本容量:樣本中所包含的個(gè)體數(shù)目叫樣本容量或大小(samplesize),樣本容量常記為n。通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。試驗(yàn)研究的目的:了解總體,然而能觀測(cè)到的卻是樣本,通過(guò)樣本來(lái)推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。下一張

主頁(yè)

退出

上一張

為了能可靠地從樣本來(lái)推斷總體,要求樣本具有一定的含量和代表性。如何獲取有代表性的樣本?采用隨機(jī)抽取。所謂隨機(jī)抽取(randomsampling)是指總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取到樣本中。樣本畢竟只是總體的一部分,盡管樣本具有一定的含量也具有代表性,通過(guò)樣本來(lái)推斷總體也不可能是百分之百的正確。有很大的可靠性但有一定的錯(cuò)誤率這是統(tǒng)計(jì)分析的特點(diǎn)。下一張

主頁(yè)

退出

上一張

1.2參數(shù)與統(tǒng)計(jì)量為了表示總體和樣本的數(shù)量特征,需要計(jì)算特征數(shù)。

參數(shù):由總體計(jì)算的特征數(shù)叫參數(shù)(parameter);常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標(biāo)準(zhǔn)差;統(tǒng)計(jì)量:由樣本計(jì)算的特征數(shù)叫統(tǒng)計(jì)量(staistic)。常用拉丁字母表示統(tǒng)計(jì)量,例如用表示樣本平均數(shù),用s表示樣本標(biāo)準(zhǔn)差,用R表示極差。下一張

主頁(yè)

退出

上一張

總體樣本參數(shù)統(tǒng)計(jì)量sμσσ2方差s2標(biāo)準(zhǔn)差平均數(shù)R極差抽樣推斷、估計(jì)為了了解總體分布、特征構(gòu)造

總體參數(shù)由相應(yīng)的樣本統(tǒng)計(jì)量來(lái)估計(jì),例如用估計(jì)μ,用S估計(jì)σ等。

1.3準(zhǔn)確性與精確性

準(zhǔn)確性(accuracy)也叫準(zhǔn)確度,指觀測(cè)值與其真值的接近程度。設(shè)某一試驗(yàn)指標(biāo)或性狀的真值為μ,觀測(cè)值為

x,若x與μ相差的絕對(duì)值|x-μ|越小,則觀測(cè)值x的準(zhǔn)確性越高;反之則低。下一張

主頁(yè)

退出

上一張

精確性(precision)也叫精確度,指同一試驗(yàn)指標(biāo)或性狀的重復(fù)觀測(cè)值彼此接近的程度。若觀測(cè)值彼此接近,即任意二個(gè)觀測(cè)值xi

、xj

相差的絕對(duì)值|xi-xj|越小,則觀測(cè)值精確性越高;反之則低。準(zhǔn)確性、精確性的意義見(jiàn)圖2-1。下一張

主頁(yè)

退出

上一張

圖2-1準(zhǔn)確性與精確性的關(guān)系示意圖隨機(jī)誤差也叫抽樣誤差(samplingerror),是由于許多無(wú)法控制的內(nèi)在和外在的偶然因素所造成的。隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心的進(jìn)行試驗(yàn)操作也難以消除。隨機(jī)誤差不可避免,但可減少。隨機(jī)誤差影響試驗(yàn)的精確性。下一張

主頁(yè)

退出

上一張

1.4

隨機(jī)誤差(randomerror)與系統(tǒng)誤差(systematicerror)統(tǒng)計(jì)上的試驗(yàn)誤差是指隨機(jī)誤差。這種誤差愈小,試驗(yàn)的精確性愈高。

系統(tǒng)誤差也叫片面誤差(lopsidederror),這是由于試驗(yàn)對(duì)象相差較大,測(cè)量的儀器不準(zhǔn)、標(biāo)準(zhǔn)試劑未經(jīng)校正,以及觀測(cè)、記載、抄錄、計(jì)算中的錯(cuò)誤等等所引起。系統(tǒng)誤差可以通過(guò)改進(jìn)方法、正確試驗(yàn)設(shè)計(jì)來(lái)避免、消除。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。下一張

主頁(yè)

退出

上一張

正確地進(jìn)行試驗(yàn)數(shù)據(jù)資料的分類是統(tǒng)計(jì)資料整理的前提。在調(diào)查或試驗(yàn)中,由觀察、測(cè)量所得的數(shù)據(jù)資料按其性質(zhì)的不同,一般可以分為數(shù)量性狀資料、質(zhì)量性狀資料和半定量(等級(jí))資料三大類。下一張

主頁(yè)

退出

上一張

2統(tǒng)計(jì)資料的分類

數(shù)量性狀(quantitativecharacter)是指能夠以測(cè)量、計(jì)量或計(jì)數(shù)的方式表示其特征的性狀。觀察測(cè)定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料數(shù)量性狀資料的獲得有測(cè)量和計(jì)數(shù)兩種方式,因而數(shù)量性狀資料又分為計(jì)量資料和計(jì)數(shù)資料兩種。下一張

主頁(yè)

退出

上一張

2.1數(shù)量性狀資料用測(cè)量方式獲得的數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測(cè)定獲得的數(shù)量性狀資料。其數(shù)據(jù)是用長(zhǎng)度、容積、重量等來(lái)表示。資料的各個(gè)觀測(cè)值不一定是整數(shù),其小數(shù)位數(shù)的多少由度量工具的精度而定,它們之間的變異是連續(xù)性的。因此,計(jì)量資料也稱為連續(xù)性變異資料。下一張

主頁(yè)

退出

上一張

2.1.1計(jì)量資料

度量衡是計(jì)量長(zhǎng)短、多少、輕重的統(tǒng)稱.其中,度是計(jì)量長(zhǎng)短的尺度,量是計(jì)量多少的器具,衡是計(jì)量輕重的器具.

2.1.2計(jì)數(shù)資料

用計(jì)數(shù)方式獲得的數(shù)量性狀資料。這類資料的各個(gè)觀察值只能以整數(shù)表示,在兩個(gè)相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn)。各觀察值是不連續(xù)的,因此該類資料也稱為不連續(xù)性變異資料或間斷性變異資料。下一張

主頁(yè)

退出

上一張

2.2質(zhì)量性狀資料

質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測(cè)量的,只能用文字來(lái)描述其特征的性狀,如食品顏色、風(fēng)味等等。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對(duì)其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:下一張

主頁(yè)

退出

上一張

2.2.1統(tǒng)計(jì)次數(shù)法

在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計(jì)其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,蘋果中全紅果個(gè)數(shù)與半紅果個(gè)數(shù)。由質(zhì)量性狀數(shù)量化而得來(lái)的資料又叫次數(shù)資料。下一張

主頁(yè)

退出

上一張

2.2.2評(píng)分法

對(duì)某一質(zhì)量性狀,因其類別不同,分別給予評(píng)分。例如,分析面包的質(zhì)量,可以按照國(guó)際面包評(píng)分細(xì)則進(jìn)行打分,綜合評(píng)價(jià)面包質(zhì)量。新產(chǎn)品開發(fā)中的評(píng)價(jià)打分等等。

2.3半定量(等級(jí))資料

半定量或等級(jí)資料(semi-quantitativeorrankeddata)是指將觀察單位按所考察的性狀或指標(biāo)的等級(jí)順序分組,然后清點(diǎn)各組觀察單位的次數(shù)而得的資料。這類資料既有次數(shù)資料的特點(diǎn),又有程度或量的不同。如某種果實(shí)的褐變程度是視果實(shí)變色面積將其分組,然后統(tǒng)計(jì)各級(jí)別果數(shù)。

三種不同類型的資料相互間是有區(qū)別的,但有時(shí)可根據(jù)研究的目的和統(tǒng)計(jì)方法的要求將一種類型資料轉(zhuǎn)化成另一種類型的資料。例如,酸奶中的乳桿菌總數(shù)得到的資料屬于計(jì)數(shù)資料,根據(jù)化驗(yàn)的目的,可按乳桿菌總數(shù)正?;虿徽7譃閮山M,清點(diǎn)各組的次數(shù),計(jì)數(shù)資料就轉(zhuǎn)化為質(zhì)量性狀次數(shù)資料;如果按乳桿菌總數(shù)過(guò)高、正常、過(guò)低分為三組,清點(diǎn)各組次數(shù),就轉(zhuǎn)化成了半定量資料。下一張

主頁(yè)

退出

上一張

3數(shù)據(jù)資料的整理3.1數(shù)據(jù)資料的檢查與核對(duì)目的:在于確保原始資料的完整性和正確性。所謂完整性是指原始資料無(wú)遺缺或重復(fù)。所謂正確性是指原始資料的測(cè)量和記載無(wú)差錯(cuò)或未進(jìn)行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識(shí)作出判斷)。對(duì)于有重復(fù)、異?;蜻z漏的資料,應(yīng)予以刪除或補(bǔ)齊;對(duì)有錯(cuò)誤、相互矛盾的資料應(yīng)進(jìn)行更正,必要時(shí)進(jìn)行復(fù)查或重新試驗(yàn)。下一張

主頁(yè)

退出

上一張

未整理的資料為原始資料,是零星的、孤立的和雜亂無(wú)章,無(wú)規(guī)律可循,通過(guò)科學(xué)的整理和分析,可發(fā)現(xiàn)其規(guī)律性,揭示事物內(nèi)在本質(zhì)。3.2數(shù)據(jù)資料的整理方法當(dāng)觀測(cè)值不多(n≤30)時(shí),不必分組,可直接進(jìn)行統(tǒng)計(jì)分析。當(dāng)觀測(cè)值較多(n>30)時(shí),宜將觀測(cè)值分成若干組,以便統(tǒng)計(jì)分析。將觀測(cè)值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。

下一張

主頁(yè)

退出

上一張

3.2連續(xù)性資料(計(jì)量資料)的整理

連續(xù)性資料的整理,需要先確定全距、組數(shù)、組距、組中值及組限,然后將全部觀測(cè)值計(jì)數(shù)歸組。

【例2.1】為了分析某生產(chǎn)廠的罐頭質(zhì)量,現(xiàn)隨機(jī)抽取100聽(tīng)罐頭樣品,分別稱取其凈重,數(shù)據(jù)資料見(jiàn)表2-1。下一張

主頁(yè)

退出

上一張

342.1340.7348.4346.0343.4342.7346.0341.1344.0348.0346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2344.0353.3340.2336.3348.9340.2356.1346.0345.6346.2340.6339.7342.3352.8342.6350.3348.5344.0350.0335.1340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7341.1347.1342.5350.0343.5345.6345.0348.6344.2341.1346.8350.2339.9346.6339.9344.3346.2338.0341.1347.3347.2339.8344.4347.2341.0341.0343.3342.3339.5343.0表2-1100聽(tīng)罐頭樣品的凈重g

1、求全距

R

全距是數(shù)據(jù)資料中的最大值與最小值之差,又稱為極差(range),用R表示。即

R=Max(xi)-Min(xi)xi為觀測(cè)值

本例Max=358.2Min=331.2

R=358.2-331.2=27.0下一張

主頁(yè)

退出

上一張

2、確定組數(shù)

k

組數(shù)的多少視樣本含量及資料的變動(dòng)范圍大小而定,一般以達(dá)到既簡(jiǎn)化資料又不影響反映資料的規(guī)律性為原則。組數(shù)要適當(dāng),不宜過(guò)多,亦不宜過(guò)少。分組越多所求得的統(tǒng)計(jì)量越精確,但增大了運(yùn)算量;若分組過(guò)少,資料的規(guī)律性就反映不出來(lái),計(jì)算出的統(tǒng)計(jì)量的精確性也較差。一般組數(shù)的確定,可參考表2-2。下一張

主頁(yè)

退出

上一張

下一張

主頁(yè)

退出

上一張

樣本含量(n)組數(shù)60-1007-10100-2009-12200-50012-17500以上17-30本例中,n=100,初步確定組數(shù)為9組。表2-2樣本含量與組數(shù)

3、確定組距i

每一組中的最大值與最小值之差稱為組距(Classinterval),記為i。分組時(shí)一般要求各組的組距相等。組距(i)=全距R/組數(shù)k

本例

i=27/9=3下一張

主頁(yè)

退出

上一張

4、確定組限及組中值

各組的最大值與最小值稱為組限。最小值稱為下限,最大值稱為上限。每一組的中點(diǎn)值稱為組中值,它是該組的代表值。組中值與組限、組距的關(guān)系如下:組中值=(組下限+組上限)/2=組下限+1/2組距=組上限-1/2組距

下一張

主頁(yè)

退出

上一張

組距確定后,首先要選定第一組的組中值。在分組時(shí)為了避免第一組中觀察值過(guò)多,一般第一組的組中值以接近或等于資料中的最小值為好。第一組組中值確定后,該組組限即可確定,其余各組的組中值和組限也可相繼確定。注意:最末一組的上限應(yīng)大于資料中的最大值。

表2-1中,最小值為331.2,第一組的組中值取331.0,因組距為3.0,因此第一組的下限應(yīng)為:

331.0-(1/2)×3.0=329.5;第一組的上限也就是第二組的下限應(yīng)為:

329.5+3.0=332.5;第二組的上限也就是第三組的下限為:

332.5+3.0=335.5,……,依此類推,一直到某一組的上限大于資料中的最大值為止。依次類推分組為:

329.5-332.5,332.5-335.5,……

下一張

主頁(yè)

退出

上一張

將正好等于前一組上限和后一組下限的數(shù)據(jù),一般約定將其歸入后一組。通常將上限略去不寫。第一組記為36.0

,第二組記為39.0

,

……

5、制作次數(shù)分布表分組結(jié)束后,將資料中的每一觀測(cè)值逐一歸組,統(tǒng)計(jì)每組內(nèi)所包含的觀測(cè)值個(gè)數(shù),制作次數(shù)分布表。下一張

主頁(yè)

退出

上一張

表2-3100聽(tīng)罐頭凈重的次數(shù)分布下一張

主頁(yè)

退出

上一張

組限組中值(x)次數(shù)(f)329.5-331.0332.5-334.0335.5-337.0338.5-340.0341.5-343.0344.5-346.0347.5-349.0350.5-352.0353.5-355.0356.5-358.011621322312211

100聽(tīng)罐頭的單聽(tīng)凈重多數(shù)集中在343g,約占觀測(cè)值總個(gè)數(shù)的1/3,用它來(lái)描述罐頭單聽(tīng)凈重的平均水平,有較強(qiáng)的代表性。由次數(shù)分布表可以看出,每聽(tīng)罐頭凈重小于332.5g及大于356.5g的為極少數(shù)。100聽(tīng)罐頭凈重分布基本以343.0g為中心,向兩邊做遞減對(duì)稱分布。表2-4100盒鮮棗每盒檢出不合格棗數(shù)下一張

主頁(yè)

退出

上一張

3.3間斷性資料(計(jì)數(shù)資料)的整理

以100盒鮮棗每盒檢出不合格棗數(shù)為例,說(shuō)明間斷性資料的整理。18291924221924222220232021232126222324222324252422242324222523252623222523202225262526262526242321262123222424212324242122232022232623242224262824272324222623202625252625252625242225262524252625252728計(jì)數(shù)資料觀察值較多時(shí),變異范圍較大,若以每一觀察值為一組,則組數(shù)太多,而每組內(nèi)包含的觀察值太少,資料的規(guī)律性顯示不出來(lái)。對(duì)于這樣的資料,可擴(kuò)大為以幾個(gè)相鄰觀察值為一組,適當(dāng)減少組數(shù),這樣資料的規(guī)律性就較明顯,對(duì)資料進(jìn)一步計(jì)算分析也比較方便。下一張

主頁(yè)

退出

上一張

表2-5100盒鮮棗每盒檢出不合格棗數(shù)次數(shù)分布表下一張

主頁(yè)

退出

上一張

不合格棗數(shù)次數(shù)(f)18-19320-211122-233124-253526-271728-2933.4質(zhì)量性狀資料、半定量(等級(jí))資料的整理對(duì)于質(zhì)量性狀資料、半定量(等級(jí))資料,可按性狀或等級(jí)進(jìn)行分組,分別統(tǒng)計(jì)各組的次數(shù),然后制成次數(shù)分布表。下一張

主頁(yè)

退出

上一張

3.5常用統(tǒng)計(jì)表與統(tǒng)計(jì)圖3.5.1統(tǒng)計(jì)表(1)統(tǒng)計(jì)表的結(jié)構(gòu)和要求統(tǒng)計(jì)表由標(biāo)題、橫標(biāo)目、縱標(biāo)目、線條、數(shù)字及合計(jì)構(gòu)成,其基本格式如下表:

表號(hào)標(biāo)題下一張

主頁(yè)

退出

上一張

表號(hào)標(biāo)題編制統(tǒng)計(jì)表的總原則:結(jié)構(gòu)簡(jiǎn)單,層次分明,內(nèi)容安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確,便于理解和比較分析。下一張

主頁(yè)

退出

上一張

統(tǒng)計(jì)表編制具體要求如下:

標(biāo)題標(biāo)題要簡(jiǎn)明扼要、準(zhǔn)確地說(shuō)明表的內(nèi)容,有時(shí)須注明時(shí)間、地點(diǎn)。

②標(biāo)目標(biāo)目分橫標(biāo)目和縱標(biāo)目?jī)身?xiàng)。橫標(biāo)目列在表的左側(cè),用以表示被說(shuō)明事物的主要標(biāo)志(水平取值);縱標(biāo)目列在表的上端,說(shuō)明橫標(biāo)目各統(tǒng)計(jì)指標(biāo)內(nèi)容(影響因素和結(jié)果指標(biāo)),并注明計(jì)算單位,如%、kg、cm等等。

③數(shù)字一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致,無(wú)數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。

④線條表的上下兩條邊線略粗,縱、橫標(biāo)目間及合計(jì)用細(xì)線分開,表的左右邊線可省去,表的左上角一般不用斜線。(三線圖)

下一張

主頁(yè)

退出

上一張

(2)統(tǒng)計(jì)表的種類

統(tǒng)計(jì)表可根據(jù)縱、橫標(biāo)目是否有分組分為簡(jiǎn)單表和復(fù)合表兩類。

簡(jiǎn)單表由一組橫標(biāo)目和一組縱標(biāo)目組成,縱橫標(biāo)目都未分組。此類表適于簡(jiǎn)單資料的統(tǒng)計(jì),如表2-6。下一張

主頁(yè)

退出

上一張

②復(fù)合表由兩組或兩組以上的橫標(biāo)目與一組縱標(biāo)目結(jié)合而成,或由一組橫標(biāo)目與兩組或兩組以上的縱標(biāo)目結(jié)合而成,或由兩組或兩組以上的橫、縱標(biāo)目結(jié)合而成。此類表適用于復(fù)雜資料的統(tǒng)計(jì),如表2-11。下一張

主頁(yè)

退出

上一張

表2-11幾種動(dòng)物性食品的營(yíng)養(yǎng)成分3.5.2統(tǒng)計(jì)圖常用的統(tǒng)計(jì)圖有散點(diǎn)圖、長(zhǎng)條圖

(barchart)、園餅圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖(broken-linechart)等。一般情況下,計(jì)量資料采用直方圖和折線圖,計(jì)數(shù)資料、質(zhì)量性狀資料、半定量(等級(jí))資料常用長(zhǎng)條圖、線圖或園餅圖。下一張

主頁(yè)

退出

上一張

統(tǒng)計(jì)圖繪制的基本要求

1、標(biāo)題簡(jiǎn)明扼要,列于圖的下方。

2、縱、橫兩軸應(yīng)有刻度,注明單位。

3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長(zhǎng)寬比例約5:4或6:5。

4、圖中需用不同顏色或線條代表不同處理、樣品等時(shí),應(yīng)有圖例說(shuō)明。下一張

主頁(yè)

退出

上一張

Excel軟件應(yīng)用工具-加載宏-分析數(shù)據(jù)庫(kù)數(shù)據(jù)分析方差分析回歸分析統(tǒng)計(jì)假設(shè)檢驗(yàn)直方圖描述統(tǒng)計(jì)4.1平均數(shù)(mean,average)下一張

主頁(yè)

退出

上一張

4統(tǒng)計(jì)資料的特征數(shù)

平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,反映數(shù)據(jù)資料的相對(duì)集中位置。平均數(shù)主要包括有:

算術(shù)平均數(shù)(arithmeticmean)中位數(shù)(median)眾數(shù)(mode)

幾何平均數(shù)(geometricmean)

調(diào)和平均數(shù)(harmonicmean)

4.1.1算術(shù)平均數(shù)(arithmeticmean)

算術(shù)平均數(shù)是指資料中各觀測(cè)值的總和除以觀測(cè)值個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)或均數(shù),記為。算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加權(quán)法計(jì)算。

1.直接法

主要用于樣本含量n≤30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。下一張

主頁(yè)

退出

上一張

設(shè)某一資料包含n個(gè)觀測(cè)值:

x1、x2、…、xn,

則樣本平均數(shù)可通過(guò)下式計(jì)算:(2-1)

其中,Σ為總和符號(hào);表示從第一個(gè)觀測(cè)值x1累加到第n個(gè)觀測(cè)值xn。當(dāng)在意義上已明確時(shí),可簡(jiǎn)寫為Σx,(3-1)式可改寫為:下一張

主頁(yè)

退出

上一張

例:對(duì)食品科學(xué)專業(yè)2004級(jí)1班10位同學(xué)的體重進(jìn)行測(cè)定,測(cè)定結(jié)果分別為50.0、52.0、53.5、56.0、58.5、60.0、48.0、51.0、50.5、49.0(kg),求其平均數(shù)。

由于Σx=50.0+52.0+53.5+56.0+58.5+60.0+48.0+51.0+50.5+49.0=528.5,

n=10

下一張

主頁(yè)

退出

上一張

那么

10位同學(xué)的平均體重為52.85kg。

2.加權(quán)法對(duì)于樣本含量n≥30以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為:(2-2)下一張

主頁(yè)

退出

上一張

式中:—第i組的組中值;

—第i組的次數(shù);

—分組數(shù)第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占的比重大小,因此將fi

稱為是xi的“權(quán)”,加權(quán)法也由此而得名。

【例】100聽(tīng)罐頭凈重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。下一張

主頁(yè)

退出

上一張

表2-3100聽(tīng)罐頭凈重的次數(shù)分布下一張

主頁(yè)

退出

上一張

組限組中值(x)次數(shù)(f)329.5-331.01332.5-334.03335.5-337.010338.5-340.026341.5-343.031344.5-346.017347.5-349.08350.5-352.02353.5-355.01356.5-358.01利用加權(quán)法計(jì)算平均數(shù)公式計(jì)算:

100聽(tīng)罐頭每聽(tīng)凈重的加權(quán)平均數(shù)為342.67g。

注意:

計(jì)算若干個(gè)來(lái)自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)采用加權(quán)法計(jì)算。

下一張

主頁(yè)

退出

上一張

【例】某牛群有黑白花奶牛1500頭,其平均體重為750kg,而另一牛群有黑白花奶牛1200頭,平均體重為725kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體重為多少?此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以兩個(gè)牛群牛的頭數(shù)為權(quán),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即下一張

主頁(yè)

退出

上一張

即兩個(gè)牛群混合后平均體重為738.89kg。3.平均數(shù)的基本性質(zhì)(1)樣本各觀測(cè)值與平均數(shù)之差的和為零,即離均差之和等于零?;蚝?jiǎn)寫成下一張

主頁(yè)

退出

上一張

(2)樣本各觀測(cè)值與平均數(shù)之差的平方和為最小,即離均差平方和為最小。

(xi-)2<(xi-a)2

(常數(shù)a≠)

或簡(jiǎn)寫為:<

對(duì)于總體而言,通常用μ表示總體平均數(shù),有限總體的平均數(shù)為:下一張

主頁(yè)

退出

上一張

(2-3)式中,N表示總體所包含的個(gè)體數(shù)

統(tǒng)計(jì)學(xué)中常用樣本平均數(shù)()作為總體平均數(shù)(μ)的估計(jì)量,并已證明樣本平均數(shù)是總體平均數(shù)μ的無(wú)偏估計(jì)量。當(dāng)一個(gè)統(tǒng)計(jì)量的數(shù)學(xué)期望(數(shù)學(xué)意義上的均值)等于所估計(jì)的總體參數(shù)時(shí),則稱此統(tǒng)計(jì)量為該總體參數(shù)的無(wú)偏估計(jì)量。下一張

主頁(yè)

退出

上一張

4.1.2中位數(shù)(median)

將資料內(nèi)所有觀測(cè)值由小到大依次排列,位于中間的那個(gè)觀測(cè)值,稱為中位數(shù),記為Md。

當(dāng)觀測(cè)值的個(gè)數(shù)是偶數(shù)時(shí),則以中間兩個(gè)觀測(cè)值的平均數(shù)作為中位數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分布時(shí),中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。下一張

主頁(yè)

退出

上一張

(1)當(dāng)觀測(cè)值個(gè)數(shù)n為奇數(shù)時(shí),第(n+1)/2位置的觀測(cè)值,即x(n+1)/2為中位數(shù):

Md=

(2)當(dāng)觀測(cè)值個(gè)數(shù)為偶數(shù)時(shí),第n/2和第(n/2+1)位置的兩個(gè)觀測(cè)值之和的1/2為中位數(shù),即:

下一張

主頁(yè)

退出

上一張

(2-4)

【例】對(duì)9個(gè)小麥品種的容重進(jìn)行測(cè)定,測(cè)定結(jié)果為750、760、767、769、773、775、778、780、800(已排序),求其中位數(shù)。此例n=9,為奇數(shù),則:

Md==773(g)

即九個(gè)小麥品種的中位數(shù)為773g。下一張

主頁(yè)

退出

上一張

4.1.3幾何平均數(shù)(geometricmean)

n個(gè)觀測(cè)值相乘之積開n次方所得的方根,稱為幾何平均數(shù),記為G。它主要應(yīng)用于科學(xué)研究中的動(dòng)態(tài)分析,如微生物的增長(zhǎng)率、人口的增長(zhǎng)率等等。當(dāng)觀測(cè)值呈幾何級(jí)數(shù)變化時(shí),用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平均水平。其計(jì)算公式如下:

下一張

主頁(yè)

退出

上一張

(2-6)為了計(jì)算方便,可將各觀測(cè)值取對(duì)數(shù)后相加除以n,得lgG,再求lgG的反對(duì)數(shù),即得G值,即

下一張

主頁(yè)

退出

上一張

4.1.4眾數(shù)(mode)

資料中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值,稱為眾數(shù),記為M0。

下一張

主頁(yè)

退出

上一張

4.1.5調(diào)和平均數(shù)(harmonicmean)

,資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記為H,即(2—8)計(jì)算平均速率4.2變異數(shù)變異數(shù)的意義

用平均數(shù)作為樣本的代表,其代表性的強(qiáng)弱受樣本資料中各觀測(cè)值變異程度的影響。僅用平均數(shù)對(duì)一個(gè)資料的特征作統(tǒng)計(jì)描述是不全面的,還需引入度量資料中觀測(cè)值變異程度大小的統(tǒng)計(jì)量。常用的表示變異程度的統(tǒng)計(jì)量有全距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。下一張

主頁(yè)

退出

上一張

4.2.1全距(Range)

全距(極差)是表示資料中各觀測(cè)值變異程度大小最簡(jiǎn)便的統(tǒng)計(jì)量。

R=Max-MinR值越大,平均數(shù)的代表性越差。但是全距只利用了資料中的最大值和最小值,沒(méi)有充分利用全部資料,并不能準(zhǔn)確表達(dá)資料中各觀測(cè)值的變異程度,是比較粗略的。當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用全距這個(gè)統(tǒng)計(jì)量。下一張

主頁(yè)

退出

上一張

為了準(zhǔn)確地表示樣本內(nèi)各個(gè)觀測(cè)值的變異程度,人們首先會(huì)考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各個(gè)觀測(cè)值與平均數(shù)的離差,(),稱為離均差。雖然離均差能表示一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度,但因?yàn)殡x均差有正、有負(fù),離均差之和為零,即Σ

=0,因而不能用離均差之和Σ()來(lái)表示資料中所有觀測(cè)值的總偏離程度。下一張

主頁(yè)

退出

上一張

4.2.2方差(Variance)為了解決離均差有正、有負(fù),離均差之和為零的問(wèn)題,可先求離均差的絕對(duì)值并將各離均差絕對(duì)值之和除以觀測(cè)值個(gè)數(shù)n求得平均絕對(duì)離差,即Σ||/n。雖然平均絕對(duì)離差可以表示資料中各觀測(cè)值的變異程度,但由于平均絕對(duì)離差包含絕對(duì)值符號(hào),使用很不方便,在統(tǒng)計(jì)學(xué)中未被采用。

采用將離均差平方的辦法來(lái)解決離均差有正、有負(fù),離均差之和為零的問(wèn)題。先將各個(gè)離均差平方,即()2

,再求離均差平方和,即

,簡(jiǎn)稱平方和,記為SS;由于離差平方和常隨樣本大小而改變,為了消除樣本大小的影響,用平方和除以樣本大小,即

,求出離均差平方和的平均數(shù);下一張

主頁(yè)

退出

上一張

為了使所得的統(tǒng)計(jì)量是相應(yīng)總體參數(shù)的無(wú)偏估計(jì)量,統(tǒng)計(jì)學(xué)證明,在求離均差平方和的平均數(shù)時(shí),分母不用樣本含量n,而用自由度n-1,所以,我們采用統(tǒng)計(jì)量

表示資料的變異程度。統(tǒng)計(jì)量

稱為均方

(meansquare縮寫為MS),又稱樣本方差,記為S2,即,VARS2=(2—9)下一張

主頁(yè)

退出

上一張

相應(yīng)的總體參數(shù)叫總體方差,記為σ2。對(duì)于有限總體而言,σ2的計(jì)算公式為:(2—10)統(tǒng)計(jì)學(xué)上把樣本方差

S2的平方根叫做樣本標(biāo)準(zhǔn)差,記為S,即:STDEV

下一張

主頁(yè)

退出

上一張

4.2.3標(biāo)準(zhǔn)差(Standdeviation)(2-11)由于所以(2-11)式可改寫為:下一張

主頁(yè)

退出

上一張

相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為σ。對(duì)于有限總體而言,σ的計(jì)算公式為:

(2-12)

在統(tǒng)計(jì)學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計(jì)總體標(biāo)準(zhǔn)差σ。

下一張

主頁(yè)

退出

上一張

4.2.4標(biāo)準(zhǔn)差的計(jì)算方法1.直接法

對(duì)于未分組或小樣本資料,可直接利用定義公式來(lái)計(jì)算標(biāo)準(zhǔn)差。

【例】10瓶罐頭的凈重(g)分別為450,450,500,500,500,550,550,550,600,600,650

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論