




已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第2章數(shù)據(jù)的組織與表達(dá) ArrangementandPresentationofData Section2 1DataandDataType數(shù)據(jù)與數(shù)據(jù)類型 一 原始數(shù)據(jù)的組織 資料以電子表格 spreadsheet 方式記錄 包括個體 Individual 一筆數(shù)據(jù)所描述的對象 object 電子表格中輸入在一行 及變量 Variable 描述任何一個個體的特征 一個變量對不同的個體取不同的數(shù)值 value 電子表格中輸入在一列 一 數(shù)量性狀資料數(shù)量性狀 quantitativetrait 的度量有計數(shù)和量測兩種方式 其所得變數(shù)不同 1 不連續(xù)性或間斷性變數(shù) discontinuousordiscretevariable 指用計數(shù)方法獲得的數(shù)據(jù) 2 連續(xù)性變數(shù) continuousvariable 指稱量 度量或測量方法所得到的數(shù)據(jù) 其各個觀察值并不限于整數(shù) 在兩個數(shù)值之間可以有微量數(shù)值差異的第三個數(shù)值存在 二 試驗資料的性質(zhì)與分類 二 質(zhì)量性狀資料質(zhì)量性狀 qualitativetrait 指能觀察而不能量測的狀即屬性性狀 如花藥 子粒 穎殼等器官的顏色 芒的有無 絨毛的有無等 要從這類性狀獲得數(shù)量資料 可采用下列兩種方法 統(tǒng)計次數(shù)法于一定總體或樣本內(nèi) 統(tǒng)計其具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目 按類別計其次數(shù)或相對次數(shù) 2 給分法給予每類性狀以相對數(shù)量的方法 二 試驗資料的性質(zhì)與分類 Section2 2次數(shù)分布表 表1100個麥穗的每穗小穗數(shù) 一 間斷性變數(shù)資料的整理 表2100個麥穗每穗小穗數(shù)的次數(shù)分布表 從表2中看到 一堆雜亂的原始資料表 經(jīng)初步整理后 就可了解資料的大致情況 另外 經(jīng)過整理的資料也便于進(jìn)一步的分析 每穗小穗數(shù)在15 20的范圍內(nèi)變動 把所有觀察值按每穗小穗數(shù)多少加以歸類 共分為6組 組與組間相差為1小穗 稱為組距 這樣可得表2形式的次數(shù)分布表 一 間斷性變數(shù)資料的整理 二 連續(xù)性變數(shù)資料的整理 表3140行水稻產(chǎn)量 單位 克 具體步驟 1 數(shù)據(jù)排序 sort 首先對數(shù)據(jù)按從小到大排列 升序 或從大到小排列 降序 2 求極差 range 所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù) 稱為極差 亦即整個樣本的變異幅度 從表3中查到最大觀察值為254g 最小觀察值為75g 極差為254 75 179g 二 連續(xù)性變數(shù)資料的整理 3 確定組數(shù)和組距 classinterval 根據(jù)極差分為若干組 每組的距離相等 稱為組距 在確定組數(shù)和組距時應(yīng)考慮 1 觀察值個數(shù)的多少 2 極差的大小 3 便于計算 4 能反映出資料的真實面貌等方面 樣本大小 即樣本內(nèi)包含觀察值的個數(shù)的多少 與組數(shù)多少的關(guān)系可參照表4來確定 二 連續(xù)性變數(shù)資料的整理 表4樣本容量與組數(shù)多少的關(guān)系 組數(shù)確定后 還須確定組距 組距 極差 組數(shù) 以表3中140行水稻產(chǎn)量為例 樣本內(nèi)觀察值的個數(shù)為140 查表4可分為8 16組 假定分為12組 則組距為179 12 14 9g 為分組方便起見 可以15g作為組距 二 連續(xù)性變數(shù)資料的整理 4 選定組限 classlimit 和組中點(diǎn)值 組值 classvalue 以表3中140行水稻產(chǎn)量為例 選定第一組的中點(diǎn)值為75g 與最小觀察值75g相等 則第二組的中點(diǎn)值為75 15 90g 余類推 各組的中點(diǎn)值選定后 就可以求得各組組限 每組有兩個組限 數(shù)值小的稱為下限 lowerlimit 數(shù)值大的稱為上限 upperlimit 上述資料中 第一組的下限為該組中點(diǎn)值減去1 2組距 即75 15 2 67 5g 上限為中點(diǎn)值加1 2組距 即75 15 2 82 5g 故第一組的組限為67 5 82 5g 按照此法計算其余各組的組限 二 連續(xù)性變數(shù)資料的整理 5 把原始資料的各個觀察值按分組數(shù)列的各組組限歸組可按原始資料中各觀察值的次序 逐個把數(shù)值歸于各組 待全部觀察值歸組后 即可求得各組的次數(shù) 制成一個次數(shù)分布表 例如表3中第一個觀察值177應(yīng)歸于表5中第8組 組限為172 5 187 5 第二個觀察值149應(yīng)歸于第6組 組限為142 5 157 5 依次把140個觀察值都進(jìn)行歸組 即可制成140行水稻產(chǎn)量的次數(shù)分布表 表5 二 連續(xù)性變數(shù)資料的整理 表5140行水稻的次數(shù)分布 注 前面提到分為12組 但由于第一組的中點(diǎn)值接近于最小觀察值 故第一組的下限小于最小觀察值 實際上差不多增加了1 2組 這樣也使最后一組的中點(diǎn)值接近于最大值 又增加了1 2組 故實際的組數(shù)比原來確定的要多一個組 為13組 二 連續(xù)性變數(shù)資料的整理 三 屬性變數(shù)資料的整理 屬性變數(shù)的資料 也可以用類似次數(shù)分布的方法來整理 在整理前 把資料按各種質(zhì)量性狀進(jìn)行分類 分類數(shù)等于組數(shù) 然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn) 分別歸入相應(yīng)的組中 即可得到屬性分布的規(guī)律性認(rèn)識 例如 某水稻雜種第二代植株米粒性狀的分離情況 歸于表6 表6水稻雜種二代植株米粒性狀的分離情況 Section2 3次數(shù)分布圖 一 方柱形圖 方柱形圖 histogram 適用于表示連續(xù)性變數(shù)的次數(shù)分布 現(xiàn)以表3的140行水稻產(chǎn)量的次數(shù)分布表為例加以說明 即成方柱形次數(shù)分布圖1 二 多邊形圖 多邊形圖 polygon 也是表示連續(xù)性變數(shù)資料的一種普通的方法 且在同一圖上可比較兩組以上的資料 仍以140行水稻產(chǎn)量次數(shù)分布為例 所成圖形即為次數(shù)多邊形圖 圖2 三 條形圖 條形圖 bar 適用于間斷性變數(shù)和屬性變數(shù)資料 用以表示這些變數(shù)的次數(shù)分布狀況 一般其橫軸標(biāo)出間斷的中點(diǎn)值或分類性狀 縱軸標(biāo)出次數(shù) 現(xiàn)以表6水稻雜種第二代米粒性狀的分離情況為例 可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖 圖3 圖3水稻F2代米粒性狀分離條形圖 四 餅圖 餅圖 pie 適用于間斷性變數(shù)和屬性變數(shù)資料 用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個數(shù)中的百分比 如圖4中白米糯稻在F2群體中占8 白米非糯 紅米糯稻和紅米非糯分別占17 21 和54 Section2 4平均數(shù) 一 平均數(shù)的意義和種類 平均數(shù)的意義 平均數(shù) average 是數(shù)據(jù)的代表值 表示資料中觀察值的中心位置 并且可作為資料的代表而與另一組資料相比較 借以明確二者之間相差的情況 平均數(shù)的種類 1 算術(shù)平均數(shù)一個數(shù)量資料中各個觀察值的總和除以觀察值個數(shù)所得的商數(shù) 稱為算術(shù)平均數(shù) arithmeticmean 記作 因其應(yīng)用廣泛 常簡稱平均數(shù)或均數(shù) mean 均數(shù)的大小決定于樣本的各觀察值 2 中數(shù)將資料內(nèi)所有觀察值從大到小排序 居中間位置的觀察值稱為中數(shù) median 計作Md 如觀察值個數(shù)為偶數(shù) 則以中間二個觀察值的算術(shù)平均數(shù)為中數(shù) 一 平均數(shù)的意義和種類 3 眾數(shù)資料中最常見的一數(shù) 或次數(shù)最多一組的中點(diǎn)值 稱為眾數(shù) mode 計作MO 如棉花纖維檢驗時所用的主體長度即為眾數(shù) 4 幾何平均數(shù)如有n個觀察值 其相乘積開n次方 即為幾何平均數(shù) geometricmean 用G代表 一 平均數(shù)的意義和種類 二 算術(shù)平均數(shù)的計算方法 若樣本較小 即資料包含的觀察值個數(shù)不多 可直接計算平均數(shù) 設(shè)一個含有n個觀察值的樣本 其各個觀察值為x1 x2 x3 xn 則算術(shù)平均數(shù)由下式算得 若樣本較大 且已進(jìn)行了分組 可采用加權(quán)法計算算術(shù)平均數(shù) 即用組中點(diǎn)值代表該組出現(xiàn)的觀測值以計算平均數(shù) 其公式為 其中yi為第i組中點(diǎn)值 fi為第i組變數(shù)出現(xiàn)次數(shù) 例1 在水稻品種比較試驗中 湘矮早四號的5個小區(qū)產(chǎn)量分別為20 0 19 0 21 0 17 5 18 5kg 求該品種的小區(qū)平均產(chǎn)量 例2 利用表5資料計算平均每行水稻產(chǎn)量 若采用直接法 157 47 因此 兩者的結(jié)果十分相近 二 算術(shù)平均數(shù)的計算方法 三 總體平均數(shù) 總體平均數(shù)用來代表 它同樣具有算術(shù)平均數(shù)所具有的特性 上式Xi代表各個觀察值 N代表有限總體所包含的個體數(shù) 表示總體內(nèi)各個觀察值的總和 Section2 5變異數(shù) 一 極差 極差 range 又稱全距 記作R 是資料中最大觀察值與最小觀察值的差數(shù) 表7兩個小麥品種的每穗小穗數(shù) 甲品種R 23 13 10 乙品種R 20 16 4 兩品種的平均同為18 但甲品種的極差大 平均數(shù)的代表性差 乙品種的極差小 平均數(shù)代表性好 二 方差 離均差平方和 簡稱平方和 SS 樣本SS 總體SS 均方或方差 variance 樣本均方 meansquare 總體方差 樣本均方是總體方差的無偏估計值 三 標(biāo)準(zhǔn)差 一 標(biāo)準(zhǔn)差的定義樣本標(biāo)準(zhǔn)差 總體標(biāo)準(zhǔn)差 樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計值 二 自由度 樣本n 1稱為自由度 記作DF 其具體數(shù)值則常用表示 統(tǒng)計意義 是指樣本內(nèi)獨(dú)立而能自由變動的離均差個數(shù) 三 標(biāo)準(zhǔn)差 三 標(biāo)準(zhǔn)差的計算方法 1 直接法 例3 設(shè)某一水稻單株粒重的樣本有5個觀察值 以克為單位 其數(shù)為2 8 7 5 4 三 標(biāo)準(zhǔn)差 2 矯正數(shù)法 其中項稱為矯正數(shù) 記作C 在上例中 將有關(guān)數(shù)字代入即有 三 標(biāo)準(zhǔn)差 3 加權(quán)法若樣本較大 已生成次數(shù)分布表 可采用加權(quán)法計算標(biāo)準(zhǔn)差 其公式為 三 標(biāo)準(zhǔn)差 例4 利用表5的次數(shù)分布資料計算每行水稻產(chǎn)量的標(biāo)準(zhǔn)差 若采用直接法 其標(biāo)準(zhǔn)差s 36 23 g 由此可見 直接法和加權(quán)法的結(jié)果是很相近的 三 標(biāo)準(zhǔn)差 四 變異系數(shù) 變異系數(shù) co
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 金融科技私募基金認(rèn)購及創(chuàng)新業(yè)務(wù)合作協(xié)議
- 河北省唐縣第一中學(xué)2024-2025學(xué)年高二下學(xué)期4月期中物理試題
- 2025至2031年中國銅飾品市場現(xiàn)狀分析及前景預(yù)測報告
- 2025至2031年中國3D軟皮本市場現(xiàn)狀分析及前景預(yù)測報告
- 2025至2030年中國高支架滑輪市場分析及競爭策略研究報告
- 2025至2030年中國男式遠(yuǎn)紅外線內(nèi)褲行業(yè)投資前景及策略咨詢報告
- 2025至2030年中國冷凝式燃?xì)庹羝仩t市場分析及競爭策略研究報告
- 2025-2030年中國立式鉆攻兩用機(jī)數(shù)據(jù)監(jiān)測研究報告
- 2025-2030年中國90度回輸耳數(shù)據(jù)監(jiān)測研究報告
- 2024至2030年中國直拉桿接頭總成市場調(diào)查研究報告-市場調(diào)查研究報告-市場調(diào)研
- 公文筐的測試題及答案
- 2025靜脈治療規(guī)范
- 航道、通航建筑物及航運(yùn)樞紐大壩運(yùn)行安全風(fēng)險辨識評估管控指南
- 《測繪生產(chǎn)成本費(fèi)用定額》(2025版)
- 第11課《浪花》課件-2024-2025學(xué)年統(tǒng)編版語文一年級下冊
- 《休閑農(nóng)業(yè)》課件 項目六 休閑農(nóng)業(yè)經(jīng)營管理
- 教師省骨干考試題及答案
- T-CWEC 40-2023 防汛排澇抗旱一體化泵車
- 廣東省廣州市白云區(qū)2024-2025學(xué)年高三下學(xué)期2月統(tǒng)測英語試卷(含答案)
- 幼教培訓(xùn)課件:《幼兒園思維共享的組織與實施》
- 《飼料添加劑》課件
評論
0/150
提交評論