數(shù)據(jù)組織和表達

上傳人：n*** IP屬地：廣東上傳時間：2022-07-09 格式：PPTX 頁數(shù)：37 大小：287.34KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩32頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、Section 2.1Data and Data Type數(shù)據(jù)與數(shù)據(jù)類型一、原始數(shù)據(jù)的組織資料以電子表格(spreadsheet)方式記錄。包括個體 (Individual)：一筆數(shù)據(jù)所描述的對象(object)。電子表格中輸入在一行。及變量( Variable ) ：描述任何一個個體的特征，一個變量對不同的個體取不同的數(shù)值(value)。電子表格中輸入在一列。(一) 數(shù)量性狀資料數(shù)量性狀(quantitative trait)的度量有計數(shù)和量測兩種方式，其所得變數(shù)不同。 1. 不連續(xù)性或間斷性變數(shù)( discontinuous or discrete variable ) 指用計數(shù)方法獲

2、得的數(shù)據(jù)。 2. 連續(xù)性變數(shù)( continuous variable ) 指稱量、度量或測量方法所得到的數(shù)據(jù)，其各個觀察值并不限于整數(shù)，在兩個數(shù)值之間可以有微量數(shù)值差異的第三個數(shù)值存在。二、試驗資料的性質(zhì)與分類(二) 質(zhì)量性狀資料質(zhì)量性狀( qualitative trait )指能觀察而不能量測的狀即屬性性狀，如花藥、子粒、穎殼等器官的顏色、芒的有無、絨毛的有無等。要從這類性狀獲得數(shù)量資料，可采用以下兩種方法：統(tǒng)計次數(shù)法于一定總體或樣本內(nèi)，統(tǒng)計其具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目，按類別計其次數(shù)或相對次數(shù)。 2. 給分法給予每類性狀以相對數(shù)量的方法二、試驗資料的性質(zhì)與分

3、類Section 2.2次數(shù)分布表表1 100個麥穗的每穗小穗數(shù)18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917一、間斷性變數(shù)資料的整理每穗小穗數(shù)( y )次數(shù)( f )1561615173218251917205總次數(shù)( n )100表2 1

4、00個麥穗每穗小穗數(shù)的次數(shù)分布表從表2中看到，一堆雜亂的原始資料表，經(jīng)初步整理后，就可了解資料的大致情況，另外，經(jīng)過整理的資料也便于進一步的分析。每穗小穗數(shù)在1520的范圍內(nèi)變動，把所有觀察值按每穗小穗數(shù)多少加以歸類，共分為6組，組與組間相差為1小穗，稱為組距。這樣可得表2形式的次數(shù)分布表。一、間斷性變數(shù)資料的整理二、連續(xù)性變數(shù)資料的整理177215197 97123159245119119131149152167104161214125175219118192176175 95136199116165214 9515883137 80138151187126196134206137 9

5、8 97129143179174159165136108101141148168163176102194145173 75130149150161155111158131189 91142140154152163123205149155131209183 97119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表3 140行水

6、稻產(chǎn)量(單位：克) 具體步驟： 1. 數(shù)據(jù)排序(sort) 首先對數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)。 2. 求極差(range) 所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù)，稱為極差，亦即整個樣本的變異幅度。從表3中查到最大觀察值為254g，最小觀察值為75g，極差為25475=179g。二、連續(xù)性變數(shù)資料的整理 3. 確定組數(shù)和組距( class interval ) 根據(jù)極差分為假設(shè)干組，每組的距離相等，稱為組距。在確定組數(shù)和組距時應(yīng)考慮： (1)觀察值個數(shù)的多少； (2)極差的大??； (3)便于計算； (4)能反映出資料的真實面貌等方面。樣本大小(即樣本內(nèi)包含觀察值的

7、個數(shù)的多少)與組數(shù)多少的關(guān)系可參照表4來確定。二、連續(xù)性變數(shù)資料的整理表4樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個數(shù)分組時的組數(shù)50 510100 81620010203001224500153010002040 組數(shù)確定后，還須確定組距。組距=極差/組數(shù)。以表3中140行水稻產(chǎn)量為例，樣本內(nèi)觀察值的個數(shù)為140，查表4可分為816組，假定分為12組，那么組距為179/12=14.9g，為分組方便起見，可以15g作為組距。二、連續(xù)性變數(shù)資料的整理 4. 選定組限( class limit )和組中點值( 組值，class value ) 以表3中140行水稻產(chǎn)量為例，選定第一組的中點值為7

8、5g，與最小觀察值75g相等；那么第二組的中點值為75+15=90g，余類推。各組的中點值選定后，就可以求得各組組限。每組有兩個組限，數(shù)值小的稱為下限( lower limit )，數(shù)值大的稱為上限( upper limit )。上述資料中，第一組的下限為該組中點值減去1/2組距，即75(15/2)=67.5g，上限為中點值加1/2組距，即75+(15/2)=82.5g。故第一組的組限為67.582.5g。按照此法計算其余各組的組限。二、連續(xù)性變數(shù)資料的整理 5. 把原始資料的各個觀察值按分組數(shù)列的各組組限歸組可按原始資料中各觀察值的次序，逐個把數(shù)值歸于各組。待全部觀察值歸組后，即可求

9、得各組的次數(shù)，制成一個次數(shù)分布表。例如表3中第一個觀察值177應(yīng)歸于表5中第8組，組限為172.5187.5；第二個觀察值149應(yīng)歸于第6組，組限為142.5157.5；。依次把140個觀察值都進行歸組，即可制成140行水稻產(chǎn)量的次數(shù)分布表(表5)。二、連續(xù)性變數(shù)資料的整理表5 140行水稻的次數(shù)分布組限中點值( y )次數(shù)( f ) 67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.513517142.5157.515020157.5172.516525172.5187.518021187.5202.51951

10、3202.5217.52109217.5232.52253232.5247.52402247.5262.52551合計( n )140 注：前面提到分為12組，但由于第一組的中點值接近于最小觀察值，故第一組的下限小于最小觀察值，實際上差不多增加了1/2組；這樣也使最后一組的中點值接近于最大值，又增加了1/2組，故實際的組數(shù)比原來確定的要多一個組，為13組。二、連續(xù)性變數(shù)資料的整理三、屬性變數(shù)資料的整理屬性變數(shù)的資料，也可以用類似次數(shù)分布的方法來整理。在整理前，把資料按各種質(zhì)量性狀進行分類，分類數(shù)等于組數(shù)，然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn)，分別歸入相應(yīng)的組中，即可得到屬性分布的規(guī)律性

11、認(rèn)識。例如，某水稻雜種第二代植株米粒性狀的別離情況，歸于表6。表6 水稻雜種二代植株米粒性狀的別離情況屬性分組( y )次數(shù)( f )紅米非糯96紅米糯稻37白米非糯31白米糯稻15合計( n )179Section 2.3次數(shù)分布圖一、方柱形圖方柱形圖( histogram )適用于表示連續(xù)性變數(shù)的次數(shù)分布。現(xiàn)以表3的140行水稻產(chǎn)量的次數(shù)分布表為例加以說明。即成方柱形次數(shù)分布圖1。圖1 140行水稻產(chǎn)量次數(shù)分布方柱形圖二、多邊形圖多邊形圖( polygon )也是表示連續(xù)性變數(shù)資料的一種普通的方法，且在同一圖上可比較兩組以上的資料。仍以140行水稻產(chǎn)量次數(shù)分布為例，所成圖形即為

12、次數(shù)多邊形圖(圖2)。圖2 140行水稻產(chǎn)量次數(shù)分布多邊形圖三、條形圖條形圖(bar)適用于間斷性變數(shù)和屬性變數(shù)資料，用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點值或分類性狀，縱軸標(biāo)出次數(shù)。現(xiàn)以表6水稻雜種第二代米粒性狀的別離情況為例，可畫成水稻雜種第二代植株4種米粒性狀別離情況條形圖(圖3)。圖3 水稻F2代米粒性狀別離條形圖四、餅圖餅圖( pie )適用于間斷性變數(shù)和屬性變數(shù)資料，用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個數(shù)中的百分比。如圖4中白米糯稻在F2群體中占8%，白米非糯、紅米糯稻和紅米非糯分別占17%、21%和54%。圖4 水稻F2代米粒

13、性狀分離的餅圖Section 2.4平均數(shù) 一、平均數(shù)的意義和種類平均數(shù)的意義: 平均數(shù)( average )是數(shù)據(jù)的代表值，表示資料中觀察值的中心位置，并且可作為資料的代表而與另一組資料相比較，借以明確二者之間相差的情況。平均數(shù)的種類 : (1) 算術(shù)平均數(shù) 一個數(shù)量資料中各個觀察值的總和除以觀察值個數(shù)所得的商數(shù)，稱為算術(shù)平均數(shù)( arithmetic mean )，記作。因其應(yīng)用廣泛，常簡稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。 (2) 中數(shù) 將資料內(nèi)所有觀察值從大到小排序，居中間位置的觀察值稱為中數(shù)( median )，計作Md。如觀察值個數(shù)為偶數(shù)，那么以中間二

14、個觀察值的算術(shù)平均數(shù)為中數(shù)。一、平均數(shù)的意義和種類 (3) 眾數(shù) 資料中最常見的一數(shù)，或次數(shù)最多一組的中點值，稱為眾數(shù)( mode )，計作MO。如棉花纖維檢驗時所用的主體長度即為眾數(shù)。 (4) 幾何平均數(shù) 如有n個觀察值，其相乘積開n次方，即為幾何平均數(shù)( geometric mean )，用G代表。一、平均數(shù)的意義和種類二、算術(shù)平均數(shù)的計算方法假設(shè)樣本較小，即資料包含的觀察值個數(shù)不多，可直接計算平均數(shù)。設(shè)一個含有n個觀察值的樣本，其各個觀察值為x1、x2、x3、xn，那么算術(shù)平均數(shù)由下式算得：假設(shè)樣本較大，且已進行了分組，可采用加權(quán)法計算算術(shù)平均數(shù)，即用組中點值代表該組出現(xiàn)的觀測值以計

15、算平均數(shù)，其公式為其中yi 為第i 組中點值，fi 為第 i 組變數(shù)出現(xiàn)次數(shù)。例1 在水稻品種比較試驗中，湘矮早四號的5個小區(qū)產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg，求該品種的小區(qū)平均產(chǎn)量。例2 利用表5資料計算平均每行水稻產(chǎn)量。假設(shè)采用直接法， =157.47。因此，兩者的結(jié)果十分相近。二、算術(shù)平均數(shù)的計算方法三、總體平均數(shù) 總體平均數(shù)用來代表，它同樣具有算術(shù)平均數(shù)所具有的特性。上式Xi 代表各個觀察值，N代表有限總體所包含的個體數(shù)，表示總體內(nèi)各個觀察值的總和。Section 2.5變異數(shù) 一、極差極差( range )，又稱全距，記作R，是資料中最大觀

16、察值與最小觀察值的差數(shù)。表7 兩個小麥品種的每穗小穗數(shù)品種名稱每穗小穗數(shù)總和平均甲13 14 15 17 18 18 19 21 22 2318018乙16 16 17 18 18 18 18 19 20 2018018甲品種R=2313=10；乙品種R=2016=4。兩品種的平均同為18，但甲品種的極差大，平均數(shù)的代表性差；乙品種的極差小，平均數(shù)代表性好。二、方差離均差平方和(簡稱平方和)SS 樣本SS= 總體SS= 均方或方差(variance)樣本均方(mean square) ：總體方差：樣本均方是總體方差的無偏估計值三、標(biāo)準(zhǔn)差(一) 標(biāo)準(zhǔn)差的定義樣本標(biāo)準(zhǔn)差：總體標(biāo)準(zhǔn)差：樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計值。 (二) 自由度樣本n-1稱為自由度,記作DF，其具體數(shù)值那么常用表示。統(tǒng)計意義：是指樣本內(nèi)獨立而能自由變動的離均差個數(shù)。三、標(biāo)準(zhǔn)差(三) 標(biāo)準(zhǔn)差的計算方法 1. 直接法例3 設(shè)某一水稻單株粒重的樣本有5個觀察值，以克為單位，其數(shù)為2、8、7、5、4。計算項目yy223.210.24482.87.846471.83.244950.20.042541.21.44

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)組織和表達

文檔簡介

溫馨提示

最新文檔

評論

數(shù)據(jù)組織和表達

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔