試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)_第1頁(yè)
試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)_第2頁(yè)
試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)_第3頁(yè)
試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)_第4頁(yè)
試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章第一章 試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì)試驗(yàn)設(shè)計(jì)與描述性統(tǒng)計(jì) field experiment design and discriptive Stat. 基本概念基本概念(Basic Concepts)第一節(jié)第一節(jié) 試驗(yàn)設(shè)計(jì)試驗(yàn)設(shè)計(jì)(experiment design)第二節(jié)第二節(jié) 描述性統(tǒng)計(jì)描述性統(tǒng)計(jì)(discriptive Stat.)基本概念(基本概念(Basic Concepts)1. 總體(總體(population): 具有共同性質(zhì)的個(gè)體所組成的集團(tuán)。具有共同性質(zhì)的個(gè)體所組成的集團(tuán)。分為有限總體和無(wú)限總體。分為有限總體和無(wú)限總體。2. 樣本(樣本(Sample):從總體中抽出的若干個(gè)個(gè)體

2、組成樣本。):從總體中抽出的若干個(gè)個(gè)體組成樣本。3. 觀察值(觀察值(Observed Value):每一個(gè)體的某一性狀、特性):每一個(gè)體的某一性狀、特性的測(cè)定數(shù)值。的測(cè)定數(shù)值。4. 變數(shù)(變數(shù)(Variable):凡表現(xiàn)出變異的觀察值稱為變數(shù)。):凡表現(xiàn)出變異的觀察值稱為變數(shù)。5. 參數(shù)(參數(shù)(Parameter):由總體的全部觀察值而計(jì)算得到的):由總體的全部觀察值而計(jì)算得到的總體特征數(shù),如總體平均數(shù)等??傮w特征數(shù),如總體平均數(shù)等。6. 統(tǒng)計(jì)數(shù)(統(tǒng)計(jì)數(shù)(Statistic):測(cè)定樣本中的各個(gè)體而得到的特征):測(cè)定樣本中的各個(gè)體而得到的特征數(shù),如樣本平均數(shù)等。數(shù),如樣本平均數(shù)等。7. 隨機(jī)樣

3、本(隨機(jī)樣本(Random Sample):從總體中隨機(jī)抽取的樣本。):從總體中隨機(jī)抽取的樣本。水平(水平(Level):因素內(nèi)設(shè)置的不同處理級(jí)別。):因素內(nèi)設(shè)置的不同處理級(jí)別。處理(處理(Treatment):幾個(gè)因素不同水平的組合。):幾個(gè)因素不同水平的組合。準(zhǔn)確度(準(zhǔn)確度(Accuracy):同一處理的觀察值與其真實(shí)值的接):同一處理的觀察值與其真實(shí)值的接近程度。近程度。精確度(精確度(Precision):同一處理的重復(fù)觀察值間彼此接近):同一處理的重復(fù)觀察值間彼此接近程度。程度。試驗(yàn)單元(試驗(yàn)單元(Experimental Unit):是指接受某種處理的最):是指接受某種處理的最小的

4、一個(gè)獨(dú)立的試驗(yàn)材料單位。如一張葉片、一個(gè)果實(shí)、小的一個(gè)獨(dú)立的試驗(yàn)材料單位。如一張葉片、一個(gè)果實(shí)、一個(gè)枝條、一個(gè)植株等。一個(gè)枝條、一個(gè)植株等。13. 誤差(誤差(Error):觀察值與處理真實(shí)值間的偏離程度。):觀察值與處理真實(shí)值間的偏離程度。14. 系統(tǒng)誤差(系統(tǒng)誤差(Systematic Error):觀察值與處理真實(shí)值間):觀察值與處理真實(shí)值間 出現(xiàn)有一定方向的系統(tǒng)偏離,如供試材料的遺傳背景、儀出現(xiàn)有一定方向的系統(tǒng)偏離,如供試材料的遺傳背景、儀器等方面存在的可辨識(shí)的差別所造成的誤差。器等方面存在的可辨識(shí)的差別所造成的誤差。15. 隨機(jī)誤差(隨機(jī)誤差(Random Error):觀察值與處理

5、真實(shí)值間出):觀察值與處理真實(shí)值間出現(xiàn)的大小、方向不同的微小差異。如在試驗(yàn)單元、管理方現(xiàn)的大小、方向不同的微小差異。如在試驗(yàn)單元、管理方法、操作方法等方面存在的不可辨識(shí)的差別所造成的誤差。法、操作方法等方面存在的不可辨識(shí)的差別所造成的誤差。16. 樣本含量(樣本含量(Sample Size/Capacity):樣本中所包含的個(gè)):樣本中所包含的個(gè)體數(shù)目。體數(shù)目。第一節(jié)第一節(jié) 試驗(yàn)設(shè)計(jì)試驗(yàn)設(shè)計(jì)experiment design試驗(yàn)和實(shí)驗(yàn)試驗(yàn)和實(shí)驗(yàn)試驗(yàn)是在人為控制條件下有目的地進(jìn)行的一種實(shí)踐活動(dòng)。試驗(yàn)是在人為控制條件下有目的地進(jìn)行的一種實(shí)踐活動(dòng)。一、試驗(yàn)類型(一)一、試驗(yàn)類型(一)1. 田間試驗(yàn)田

6、間試驗(yàn)2. 溫室試驗(yàn)溫室試驗(yàn)3. 實(shí)驗(yàn)室試驗(yàn)實(shí)驗(yàn)室試驗(yàn)4. 皿內(nèi)試驗(yàn)皿內(nèi)試驗(yàn)5. 人工氣候室內(nèi)試驗(yàn)等等人工氣候室內(nèi)試驗(yàn)等等二、試驗(yàn)的基本要求:二、試驗(yàn)的基本要求:1. 目的明確目的明確2. 結(jié)果可靠結(jié)果可靠3. 試驗(yàn)條件有代表性試驗(yàn)條件有代表性4. 試驗(yàn)結(jié)果能夠重復(fù)試驗(yàn)結(jié)果能夠重復(fù)精確度準(zhǔn)確度即準(zhǔn)確又精確即準(zhǔn)確又精確準(zhǔn)確而不精確準(zhǔn)確而不精確即不準(zhǔn)確又不精確即不準(zhǔn)確又不精確精確而不準(zhǔn)確精確而不準(zhǔn)確試驗(yàn)?zāi)P驮囼?yàn)?zāi)P凸┰圀w供試體輸入輸入處理處理輸出輸出試驗(yàn)指標(biāo)試驗(yàn)指標(biāo)隨機(jī)干擾隨機(jī)干擾Fig. 1 General model of experimentUxFig. 1 Mathematical mod

7、el of experiment),(ufx 離散的測(cè)定幾個(gè)點(diǎn),采用統(tǒng)計(jì)學(xué)的方法經(jīng)驗(yàn)的估計(jì)離散的測(cè)定幾個(gè)點(diǎn),采用統(tǒng)計(jì)學(xué)的方法經(jīng)驗(yàn)的估計(jì) xf(U)(如上圖所示),顯然觀測(cè)點(diǎn)未必都在曲線上。如果估計(jì)出了(如上圖所示),顯然觀測(cè)點(diǎn)未必都在曲線上。如果估計(jì)出了xf(U),我們就掌握了,我們就掌握了x隨隨U而變化的規(guī)律,就可以進(jìn)行預(yù)而變化的規(guī)律,就可以進(jìn)行預(yù)測(cè)和控制。測(cè)和控制。三、處理設(shè)計(jì)三、處理設(shè)計(jì)田間試驗(yàn)按試驗(yàn)小區(qū)大小、試驗(yàn)?zāi)攴?、試?yàn)地點(diǎn)等可分為田間試驗(yàn)按試驗(yàn)小區(qū)大小、試驗(yàn)?zāi)攴?、試?yàn)地點(diǎn)等可分為若干類,但最基本的是根據(jù)試驗(yàn)因素可將田間試驗(yàn)分為:若干類,但最基本的是根據(jù)試驗(yàn)因素可將田間試驗(yàn)分為:?jiǎn)我?/p>

8、素試驗(yàn)(單因素試驗(yàn)(Singlefactor experiment)僅研究某一僅研究某一個(gè)問(wèn)題,如施肥對(duì)產(chǎn)量的影響,可以包含肥料的不同等級(jí)。個(gè)問(wèn)題,如施肥對(duì)產(chǎn)量的影響,可以包含肥料的不同等級(jí)。優(yōu)點(diǎn):試驗(yàn)簡(jiǎn)單,容易分析、但是不能了解各因素之間的優(yōu)點(diǎn):試驗(yàn)簡(jiǎn)單,容易分析、但是不能了解各因素之間的關(guān)系。關(guān)系。多因素試驗(yàn)(多因素試驗(yàn)(Multiple-factor experiment)中包含了不中包含了不同因素及不同水平的組合。優(yōu)點(diǎn):便于了解各因素之間的同因素及不同水平的組合。優(yōu)點(diǎn):便于了解各因素之間的相互關(guān)系,試驗(yàn)復(fù)雜,設(shè)計(jì)不妥時(shí)不便于分析。相互關(guān)系,試驗(yàn)復(fù)雜,設(shè)計(jì)不妥時(shí)不便于分析。綜合試驗(yàn)(綜合

9、試驗(yàn)(Comprehensive experiment)是在進(jìn)行多因是在進(jìn)行多因素研究之后,將重要因素重新組合,進(jìn)行試驗(yàn)分析,各因素研究之后,將重要因素重新組合,進(jìn)行試驗(yàn)分析,各因素的水平不需要構(gòu)成平衡處理。素的水平不需要構(gòu)成平衡處理。四、試驗(yàn)單元的排列方式四、試驗(yàn)單元的排列方式 試驗(yàn)設(shè)計(jì)的目的是避免系統(tǒng)誤差,縮小隨機(jī)誤差,以保證試驗(yàn)設(shè)計(jì)的目的是避免系統(tǒng)誤差,縮小隨機(jī)誤差,以保證試驗(yàn)的準(zhǔn)確度和精確度。試驗(yàn)的準(zhǔn)確度和精確度。試驗(yàn)設(shè)計(jì)的三個(gè)基本原理:試驗(yàn)設(shè)計(jì)的三個(gè)基本原理:1.重復(fù)(重復(fù)(Replication):重復(fù)的作用():重復(fù)的作用(1)若試驗(yàn)中沒(méi)有系統(tǒng)誤)若試驗(yàn)中沒(méi)有系統(tǒng)誤差存在,只有隨

10、機(jī)誤差,則可用處理多次重復(fù)觀察值間的參差差存在,只有隨機(jī)誤差,則可用處理多次重復(fù)觀察值間的參差不棄程度來(lái)估計(jì)隨機(jī)誤差。只有不棄程度來(lái)估計(jì)隨機(jī)誤差。只有1次重復(fù)就無(wú)法估計(jì)隨機(jī)誤差次重復(fù)就無(wú)法估計(jì)隨機(jī)誤差(2)同一處理多次觀察值的平均值是處理真值的最好估計(jì)。)同一處理多次觀察值的平均值是處理真值的最好估計(jì)。2.隨機(jī)化(隨機(jī)化(Randomization):通過(guò)試驗(yàn)單元的隨機(jī)化排列來(lái)消):通過(guò)試驗(yàn)單元的隨機(jī)化排列來(lái)消除試驗(yàn)單元間的系統(tǒng)誤差。除試驗(yàn)單元間的系統(tǒng)誤差。3.局部控制(局部控制(Local control):將整個(gè)試驗(yàn)空間分成若干個(gè)各):將整個(gè)試驗(yàn)空間分成若干個(gè)各自相對(duì)均勻的局部(區(qū)組),所

11、以的區(qū)組構(gòu)成區(qū)組因素。作用自相對(duì)均勻的局部(區(qū)組),所以的區(qū)組構(gòu)成區(qū)組因素。作用(1)可將系統(tǒng)誤差分離出來(lái)增加準(zhǔn)確度;()可將系統(tǒng)誤差分離出來(lái)增加準(zhǔn)確度;(2)區(qū)組內(nèi)保證試)區(qū)組內(nèi)保證試驗(yàn)單元的一致性,增加精確度。驗(yàn)單元的一致性,增加精確度。nxx/隨機(jī)化排列隨機(jī)化排列 重重復(fù)復(fù) I重重復(fù)復(fù) IIbcdefgck2ckckheabcfgdaabcdefghck1 1、田間試驗(yàn)設(shè)計(jì)、田間試驗(yàn)設(shè)計(jì)ckabcgedf利用查表或產(chǎn)生隨機(jī)數(shù)的方法進(jìn)行設(shè)計(jì)利用查表或產(chǎn)生隨機(jī)數(shù)的方法進(jìn)行設(shè)計(jì)ck2五、局部控制五、局部控制1 1、田間試驗(yàn)設(shè)計(jì)、田間試驗(yàn)設(shè)計(jì)abcdefck設(shè)置重復(fù)設(shè)置重復(fù)隨機(jī)化排列隨機(jī)化排列局

12、部控制局部控制消除系統(tǒng)誤差,消除系統(tǒng)誤差,無(wú)偏試驗(yàn)誤差估計(jì)無(wú)偏試驗(yàn)誤差估計(jì)估計(jì)和降低估計(jì)和降低隨機(jī)誤差隨機(jī)誤差與隨機(jī)化結(jié)合與隨機(jī)化結(jié)合分離系統(tǒng)誤差分離系統(tǒng)誤差降低隨機(jī)誤差降低隨機(jī)誤差提高準(zhǔn)確度和精確度提高準(zhǔn)確度和精確度保證統(tǒng)計(jì)推斷的可靠性保證統(tǒng)計(jì)推斷的可靠性試驗(yàn)類型(二) 試驗(yàn)設(shè)計(jì)可以歸納為全面實(shí)施試驗(yàn)和部分實(shí)施試試驗(yàn)設(shè)計(jì)可以歸納為全面實(shí)施試驗(yàn)和部分實(shí)施試驗(yàn)兩種類型。驗(yàn)兩種類型。 全面實(shí)施試驗(yàn)分為順序排列的試驗(yàn)設(shè)計(jì)和隨全面實(shí)施試驗(yàn)分為順序排列的試驗(yàn)設(shè)計(jì)和隨機(jī)排列的試驗(yàn)設(shè)計(jì)兩大類。前者常用在處理數(shù)量機(jī)排列的試驗(yàn)設(shè)計(jì)兩大類。前者常用在處理數(shù)量大、精確度要求不高、不須作統(tǒng)計(jì)推斷的預(yù)備試大、精確度要求

13、不高、不須作統(tǒng)計(jì)推斷的預(yù)備試驗(yàn),容易發(fā)生系統(tǒng)誤差;后者強(qiáng)調(diào)有合理的試驗(yàn)驗(yàn),容易發(fā)生系統(tǒng)誤差;后者強(qiáng)調(diào)有合理的試驗(yàn)誤差估計(jì),常用于對(duì)精確度要求較高的試驗(yàn)。誤差估計(jì),常用于對(duì)精確度要求較高的試驗(yàn)。全面實(shí)施試驗(yàn)(全因子試驗(yàn))全面實(shí)施試驗(yàn)(全因子試驗(yàn))一、順序排列的試驗(yàn)設(shè)計(jì)一、順序排列的試驗(yàn)設(shè)計(jì)1. 對(duì)比法設(shè)計(jì)(contrast design) 常用于少數(shù)處理試驗(yàn)及示范性試驗(yàn),其試驗(yàn)單元排列特點(diǎn)是處理單元直接排列在對(duì)照區(qū)旁邊,使每一小區(qū)可與其鄰旁的對(duì)照區(qū)直接比較。IIIIII1CK23CK 45678CKCK7CK81CK 23456CKCK5CK67CK 81234CKCK2. 間比法設(shè)計(jì)(inte

14、rval contrast design) 常用處理試驗(yàn)單元較多的試驗(yàn),要求不高,但用隨機(jī)區(qū)組排列有困難的試驗(yàn)。其試驗(yàn)單元排列特點(diǎn)是第一個(gè)小區(qū)和末尾小區(qū)一定是對(duì)照,每二個(gè)對(duì)照之間排列相同數(shù)目的處理小區(qū),通常是4或9個(gè),重復(fù)24次。CKCKCKCK123456789 10 11 1212個(gè)小麥品種的間比法排列個(gè)小麥品種的間比法排列二、隨機(jī)排列的試驗(yàn)設(shè)計(jì)二、隨機(jī)排列的試驗(yàn)設(shè)計(jì)1. 完全隨機(jī)設(shè)計(jì)(completely random design) 將各個(gè)處理隨機(jī)分配到各個(gè)試驗(yàn)單元(或小區(qū))中,每一個(gè)處理的重復(fù)數(shù)可以相等或不相等。這種設(shè)計(jì)靈活機(jī)動(dòng),單因素和多因素均可使用。2. 隨機(jī)區(qū)組設(shè)計(jì)(rando

15、mized blocks design)亦稱完全隨機(jī)區(qū)組設(shè)計(jì)(random complete block design) 根據(jù)局部控制的原則將試驗(yàn)地劃分為等于重復(fù)次數(shù)的區(qū)組,一個(gè)區(qū)組安排一個(gè)重復(fù),區(qū)組內(nèi)各處理都獨(dú)立隨機(jī)排列。主要特點(diǎn)(1)簡(jiǎn)單;(2)適應(yīng)性廣;(3)能提供無(wú)偏的誤差估計(jì),降低誤差;(4)對(duì)試驗(yàn)地形要求不嚴(yán)格;(5)試驗(yàn)的處理數(shù)目一般不要超過(guò)20。74211317368548732164524887566532IIIIIIIV肥力梯度:肥力梯度:8個(gè)品種個(gè)品種4次重復(fù)的隨機(jī)區(qū)組排列次重復(fù)的隨機(jī)區(qū)組排列3. 拉丁方設(shè)計(jì)(latin square design) 將各個(gè)處理從縱橫兩個(gè)

16、方向排列為區(qū)組(或重復(fù)),使每一個(gè)處理在每一列和每一行中出現(xiàn)的次數(shù)相等(通常一次)。所以它比隨機(jī)區(qū)組多一個(gè)方向進(jìn)行局部控制的隨機(jī)排列設(shè)計(jì)。拉丁方設(shè)計(jì)具有雙向控制土壤差異的作用,有較高的精確度,但缺乏伸縮性,適應(yīng)于48個(gè)處理的試驗(yàn)設(shè)計(jì)。ABCDEBCDEACDEABDEABCEABCD4. 裂區(qū)設(shè)計(jì)(split-plot design) 是多因素試驗(yàn)的一種設(shè)計(jì)形式。先按一個(gè)因素設(shè)計(jì)主處理小區(qū)(main plot),然后在這個(gè)主處理小區(qū)內(nèi)引進(jìn)第二個(gè)因素的各個(gè)處理的小區(qū)(副區(qū)或裂區(qū),split-plot)。152541243634362651高高低低中中653231163142465254低低中中高

17、高246532142135461653高高中中低低IIIIII5. 再裂區(qū)設(shè)計(jì)(split-split plot design) 若在裂區(qū)試驗(yàn)中需要引進(jìn)第三個(gè)因素時(shí),可以進(jìn)一步裂區(qū),將第三個(gè)因素的各個(gè)處理隨機(jī)排列在裂區(qū)內(nèi)。6. 條區(qū)設(shè)計(jì)(strip blocks design) 條區(qū)設(shè)計(jì)是裂區(qū)設(shè)計(jì)的一種衍生設(shè)計(jì),當(dāng)要研究的兩個(gè)因素都需要較大的小區(qū)面積,且為了便于觀察和管理,將每個(gè)區(qū)組劃分為縱向長(zhǎng)條形小區(qū),安排第一個(gè)因素的各個(gè)處理,再將各個(gè)區(qū)組劃分為若干個(gè)橫向長(zhǎng)條形小區(qū),安排第二個(gè)因素的各個(gè)處理。部分實(shí)施試驗(yàn)(部分因子試驗(yàn))部分實(shí)施試驗(yàn)(部分因子試驗(yàn))正交設(shè)計(jì)(正交設(shè)計(jì)(orthogonal d

18、esign):):兩個(gè)重要的特點(diǎn):兩個(gè)重要的特點(diǎn):(1)每列中因素各水平數(shù)字出現(xiàn)的次數(shù)相等,即整)每列中因素各水平數(shù)字出現(xiàn)的次數(shù)相等,即整齊可比性;齊可比性;(2)任兩列放在一起,他們的行構(gòu)成一個(gè)有序數(shù)對(duì),)任兩列放在一起,他們的行構(gòu)成一個(gè)有序數(shù)對(duì),這樣的數(shù)對(duì)出現(xiàn)的次數(shù)也相等。或者說(shuō)任兩列之間的這樣的數(shù)對(duì)出現(xiàn)的次數(shù)也相等?;蛘哒f(shuō)任兩列之間的所有可能的水平組合都出現(xiàn),且出現(xiàn)的次數(shù)均等。即所有可能的水平組合都出現(xiàn),且出現(xiàn)的次數(shù)均等。即均衡分散性。均衡分散性。 具有這樣特點(diǎn)的數(shù)表稱為正交表。正交表是正交具有這樣特點(diǎn)的數(shù)表稱為正交表。正交表是正交拉丁方的推廣。一般用拉丁方的推廣。一般用LN(mk)表示

19、正交表,表示正交表,N為試為試驗(yàn)次數(shù);驗(yàn)次數(shù);k為所能容納的最多因素?cái)?shù);為所能容納的最多因素?cái)?shù);m為每個(gè)因素為每個(gè)因素的水平數(shù)。如的水平數(shù)。如L8(27)。)。 假設(shè)我們要做一個(gè)三因素二水平的試驗(yàn),若已知不需要考慮任何假設(shè)我們要做一個(gè)三因素二水平的試驗(yàn),若已知不需要考慮任何交互作用,可以用交互作用,可以用L4(23)表,)表,但在這種情況下,誤差項(xiàng)但在這種情況下,誤差項(xiàng)Sse分離不出來(lái),分離不出來(lái),無(wú)法作統(tǒng)計(jì)檢驗(yàn),只能直觀比較哪個(gè)水平好。若存在交互作用,就會(huì)迭無(wú)法作統(tǒng)計(jì)檢驗(yàn),只能直觀比較哪個(gè)水平好。若存在交互作用,就會(huì)迭加在其它列上,從而得到錯(cuò)誤的結(jié)果。因此,若不能排除存在交互作用加在其它列上

20、,從而得到錯(cuò)誤的結(jié)果。因此,若不能排除存在交互作用的可能,則應(yīng)利用的可能,則應(yīng)利用L8(27)表)表。12345671111111121112222312211224122221152121212621221217221122182212112ColRow表頭設(shè)計(jì): 首先將A、B放在第1,2列上,查交互作用表,他們的交互作用AB在第3列,因此,C因素不能放在第3列上,應(yīng)放在第4列上,AC放在第5列上,BC放在第6列上,ABC放在第7列上,真正安排時(shí)只用1,2,4列。若ABC不存在,則第7列可作為誤差e,這樣就得到了表頭設(shè)計(jì)如下:因素ABABCACBCe列號(hào)1234567第二節(jié) 描述性統(tǒng)計(jì)一、試

21、驗(yàn)資料的性質(zhì)與分類一、試驗(yàn)資料的性質(zhì)與分類1. 數(shù)量性狀資料(數(shù)量性狀資料(quantitative trait) 采用計(jì)數(shù)和采用計(jì)數(shù)和量測(cè)兩種方式所得到的數(shù)據(jù)。量測(cè)兩種方式所得到的數(shù)據(jù)。間斷性變數(shù)間斷性變數(shù)Discontinuous or discrete variable連續(xù)性變數(shù)連續(xù)性變數(shù)continuous variable小麥基本苗數(shù)、菌落數(shù)、穗數(shù)、分孽數(shù)等等病斑長(zhǎng)度、作物產(chǎn)量、株高、土壤水分含量等等2. 質(zhì)量性狀資料(質(zhì)量性狀資料(qualitative trait) 觀察而不能量觀察而不能量測(cè)性狀,如菌落的顏色、麥穗有無(wú)芒等等。測(cè)性狀,如菌落的顏色、麥穗有無(wú)芒等等。統(tǒng)計(jì)次數(shù)法統(tǒng)計(jì)

22、次數(shù)法給分法給分法統(tǒng)計(jì)具有某個(gè)性狀的個(gè)體數(shù)目及具有不同性狀的個(gè)體數(shù)目,按類別計(jì)其次數(shù)或相對(duì)次數(shù)給予每類性狀以相對(duì)數(shù)量的方法,如小麥籽粒有紅白兩種顏色,可用0表示白色,用1表示紅色二、次數(shù)分布表二、次數(shù)分布表 將試驗(yàn)所得到的大量未加整理的數(shù)據(jù),按觀察值大小將試驗(yàn)所得到的大量未加整理的數(shù)據(jù),按觀察值大小或數(shù)據(jù)類別進(jìn)行分組,制成關(guān)于觀察值不同組別或不同分或數(shù)據(jù)類別進(jìn)行分組,制成關(guān)于觀察值不同組別或不同分類單位的次數(shù)分布表,就可以看出資料中不同表現(xiàn)的觀察類單位的次數(shù)分布表,就可以看出資料中不同表現(xiàn)的觀察值與其頻率間的規(guī)律性,從而對(duì)資料有一個(gè)初步概念。值與其頻率間的規(guī)律性,從而對(duì)資料有一個(gè)初步概念。1.

23、 間斷性資料的整理間斷性資料的整理 參見參見 P13 例例2。2. 連續(xù)性資料的整理連續(xù)性資料的整理 參加參加 P14 例例3。3. 屬性變數(shù)資料的整理屬性變數(shù)資料的整理 在整理前,將資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等在整理前,將資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分于組數(shù),然后根據(jù)各個(gè)體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可以得到屬性分布的規(guī)律性認(rèn)識(shí)。別歸入相應(yīng)的組中,即可以得到屬性分布的規(guī)律性認(rèn)識(shí)。三、次數(shù)分圖三、次數(shù)分圖0255075100t MIDPOINT11.11 %22.22 %27.78 %16.67 %22.22 %條

24、形圖(條形圖(bar diagram)適合于間斷性變數(shù)和屬性資料3月0.020.040.060.080.0100.0120.012345673月條形圖(條形圖(bar diagram)適合于間斷性變數(shù)和屬性資料多邊形圖(多邊形圖(polygon)適合于連續(xù)性變數(shù)資料方柱形圖(histogram)適合于連續(xù)性變數(shù)資料2-Jun11-Jun16-Jun22-Jun27-Jun3-Jul餅圖(餅圖(pie diagram)適合于間斷性變數(shù)和屬性資料12月1234567餅圖(餅圖(pie diagram)適合于間斷性變數(shù)和屬性資料四、平均數(shù)四、平均數(shù)1. 算術(shù)平均數(shù)(算術(shù)平均數(shù)(arithmetic

25、mean),Mean2. 中數(shù)(中數(shù)(median)Md3. 眾數(shù)(眾數(shù)(mode),Mo4. 幾何平均數(shù)(幾何平均數(shù)(geometric mean),GnxnxxxG*.*3*2*1算術(shù)平均數(shù)的兩個(gè)重要特性:算術(shù)平均數(shù)的兩個(gè)重要特性:(1)離均差之和等于零。)離均差之和等于零。0).21()(.)3()2()1()(xnxixnxnxxxxnxxxxxxxxi(2)離均差平方和最小。)離均差平方和最小。設(shè)設(shè)a為任意數(shù),但為任意數(shù),但a不等于不等于x的平均數(shù),則的平均數(shù),則 xa( 為一定量,但 )2222222)(2)()(2)()()()(nxxxxxxxxxxxxax222)()(00

26、xxaxn0樣本平均數(shù)一般用樣本平均數(shù)一般用 表示。表示。n為觀察值的個(gè)數(shù)。為觀察值的個(gè)數(shù)??傮w平均數(shù)一般用總體平均數(shù)一般用 表示。表示。N為有限總體中觀察值的個(gè)數(shù)。為有限總體中觀察值的個(gè)數(shù)。Nyi/ )(xnxxi/ )(五、變異數(shù)五、變異數(shù)1. 極差(極差(Range) R=Xmax-Xmin,當(dāng),當(dāng)n10時(shí),常時(shí),常采用采用R來(lái)表示資料的變異度。例如兩個(gè)小麥品種的來(lái)表示資料的變異度。例如兩個(gè)小麥品種的每穗小穗數(shù)見下表。每穗小穗數(shù)見下表。品種每穗小穗數(shù)每穗小穗數(shù)總和平均R甲131415171818192122231801810乙16161718181818192020180184 說(shuō)明甲品

27、種級(jí)差較乙品種的大,其變異范圍較大,平說(shuō)明甲品種級(jí)差較乙品種的大,其變異范圍較大,平均數(shù)的代表較差;乙品種的極差較小,其變異幅度較小,均數(shù)的代表較差;乙品種的極差較小,其變異幅度較小,平均數(shù)的代表性較好。平均數(shù)的代表性較好。 極差只是兩個(gè)極端數(shù)據(jù)所決定的,沒(méi)有充分利用資料極差只是兩個(gè)極端數(shù)據(jù)所決定的,沒(méi)有充分利用資料的全部信息,所以用它代表整個(gè)樣本的變異度是有缺陷的。的全部信息,所以用它代表整個(gè)樣本的變異度是有缺陷的。2. 方差或均方(方差或均方(Variance)用觀察值數(shù)目除離均差平方和)用觀察值數(shù)目除離均差平方和(簡(jiǎn)稱平方和)。(簡(jiǎn)稱平方和)。 樣本均方(樣本均方(S2) 1)(1)(/

28、)(21)(/)(21)(2121)(22222222222222nnxxnnxnxxnnxnnxxnnxnxxxnxxxxnxxis總體方差(總體方差(2)Nxi22)( 方差是根據(jù)全部觀察值來(lái)度量資料的變異度的,是方差是根據(jù)全部觀察值來(lái)度量資料的變異度的,是能夠正確反映資料的變異度的度量方法。能夠正確反映資料的變異度的度量方法。3. 標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)差(Standard Deviation)是方差的正根值,可)是方差的正根值,可以很好的表示資料的變異度,其單位與觀察值的度量以很好的表示資料的變異度,其單位與觀察值的度量單位相同單位相同。 樣本標(biāo)準(zhǔn)差(樣本標(biāo)準(zhǔn)差(S) 總體標(biāo)準(zhǔn)差(總體標(biāo)準(zhǔn)差()

29、1)(2nxxsiNxi2)(1)(2iiifxxfs自由度(自由度(degree of freedom,所寫為,所寫為DF)解釋之一:解釋之一: 對(duì)于一個(gè)具有對(duì)于一個(gè)具有n個(gè)觀察值的樣本,每個(gè)個(gè)觀察值的樣本,每個(gè)x與其平均數(shù)比較與其平均數(shù)比較時(shí),雖然具有時(shí),雖然具有n個(gè)離均差,但因受到離均差之和等于個(gè)離均差,但因受到離均差之和等于0的限制,的限制,所以只能有所以只能有n1個(gè)是自由的。個(gè)是自由的。 例如:有例如:有5個(gè)觀察值,其個(gè)觀察值,其4個(gè)的離均差為個(gè)的離均差為3,2,3,6,則第則第5個(gè)離均差必定為個(gè)離均差必定為8,才能保證離均差之和等于,才能保證離均差之和等于0。 所以,在估計(jì)其他統(tǒng)計(jì)

30、數(shù)時(shí),如果該統(tǒng)計(jì)數(shù)受所以,在估計(jì)其他統(tǒng)計(jì)數(shù)時(shí),如果該統(tǒng)計(jì)數(shù)受K個(gè)條件個(gè)條件限制,則其自由度應(yīng)該為限制,則其自由度應(yīng)該為nK。 在應(yīng)用上,小樣本一定要用自由度來(lái)估算標(biāo)準(zhǔn)差;若為在應(yīng)用上,小樣本一定要用自由度來(lái)估算標(biāo)準(zhǔn)差;若為大樣本,因大樣本,因n和和n1相差較小,可直接用相差較小,可直接用n作除數(shù),但大樣本作除數(shù),但大樣本的界限沒(méi)有統(tǒng)一規(guī)定,一般以的界限沒(méi)有統(tǒng)一規(guī)定,一般以30以上為大樣本。以上為大樣本。 比較以上兩式可以發(fā)現(xiàn),樣本標(biāo)準(zhǔn)差不以樣本容量比較以上兩式可以發(fā)現(xiàn),樣本標(biāo)準(zhǔn)差不以樣本容量n而以而以n1作為除數(shù)。這是因?yàn)橥ǔN覀冎荒苷莆諛颖举Y料,作為除數(shù)。這是因?yàn)橥ǔN覀冎荒苷莆諛颖举Y料,不知道總體平均數(shù)的數(shù)值,不得不用樣本平均數(shù)代替總體不知道總體平均數(shù)的數(shù)值,不得不用樣本平均數(shù)代替總體平均數(shù)。但由于離均差平方和最小,即平均數(shù)。但由于離均差平方和最小,即解釋之二:解釋之二:1)(2nxxisNxi2)(22)()(xxx因此,采用因此,采用 nxxis2)( 計(jì)算出的標(biāo)準(zhǔn)差將失之過(guò)小。將分母用計(jì)算出的標(biāo)準(zhǔn)差將失之過(guò)小。將分母用n1代替,可以代替,可以避免偏小的弊病,可以做到對(duì)總體標(biāo)準(zhǔn)差的較好的估計(jì)。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論