版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章統(tǒng)計(jì)數(shù)據(jù)的收集與整理第一節(jié)總體與樣本1.什么是生物統(tǒng)計(jì)學(xué)?2.生物統(tǒng)計(jì)學(xué)的一些重要術(shù)語(yǔ)3.本課程的主線1.什么是生物統(tǒng)計(jì)學(xué)生物統(tǒng)計(jì)學(xué)(Biostatistics)是數(shù)理統(tǒng)計(jì)學(xué)的原理和方法在生物科學(xué)研究中的應(yīng)用,是用統(tǒng)計(jì)學(xué)方法分析和解釋生物界各種現(xiàn)象與數(shù)量資料的一門學(xué)科生物統(tǒng)計(jì)學(xué)本質(zhì)上是一門應(yīng)用數(shù)學(xué)。1,不要怕,本課程比較基礎(chǔ),不涉及太多的微積分和線性代數(shù)的內(nèi)容2,練習(xí)的重要性生物統(tǒng)計(jì)學(xué)的主要研究?jī)?nèi)容: (1)如何根據(jù)生物學(xué)研究的目的合理地調(diào)查或進(jìn)行試驗(yàn)設(shè)計(jì) (2)如何科學(xué)地整理、分析所收集來(lái)的資料2.生物統(tǒng)計(jì)學(xué)的一些重要術(shù)語(yǔ)2.1總體與樣本(PopulationandSample)這是統(tǒng)計(jì)學(xué)最基本的兩個(gè)概念,十分重要總體:根據(jù)研究目的所確定的研究的全體對(duì)象。構(gòu)成總體的每個(gè)成員稱為個(gè)體??傮w有限總體:無(wú)限總體:例如研究南京大學(xué)本科生的平均身高時(shí),總體是所有南京大學(xué)本科生身高的觀測(cè)值構(gòu)成的全體例如在研究某種條件下生長(zhǎng)的小麥的株高時(shí),總體是所有這種條件下生長(zhǎng)的小麥株高觀測(cè)值構(gòu)成的全體。因?yàn)闊o(wú)法統(tǒng)計(jì)這種條件下生長(zhǎng)的小麥的數(shù)量,可以設(shè)想這一總體是無(wú)限的??傮w的兩個(gè)特征:(1)個(gè)體間有變異性(不齊性)
(2)總體的容量一般較大,對(duì)總體的每個(gè)成員進(jìn)行調(diào)查(普查)耗時(shí)耗力,不切實(shí)際??傮w的這兩個(gè)特征給科學(xué)研究帶來(lái)了難度。如何克服?解決辦法:采用隨機(jī)抽樣的辦法。通過(guò)從總體中隨機(jī)抽樣獲得一定數(shù)量的樣本,然后通過(guò)對(duì)樣本的分析來(lái)推斷原始總體的情況。樣本:總體的一部分。樣本內(nèi)包含的個(gè)體的數(shù)目稱為樣本容量(SampleSize)。樣本容量常記為n;總體容量常記為N。2.2隨機(jī)抽樣(RandomSampling)抽得的樣本必須對(duì)總體有代表性,隨機(jī)抽樣是實(shí)現(xiàn)這一代表性的常用方法。隨機(jī)抽樣:總體中的每個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取組成樣本如何實(shí)現(xiàn)隨機(jī)抽樣:一般用隨機(jī)數(shù)字表(課本附表1,第251頁(yè))例一.如何從2000名學(xué)生中獲得n=20的隨機(jī)樣本?首先將2000名學(xué)生編號(hào):1,2,3,…,2000。解:采用隨機(jī)數(shù)字表獲得20個(gè)處于1~2000之間的隨機(jī)數(shù):隨機(jī)從表中選取一點(diǎn),然后以每四位數(shù)字為一節(jié)連續(xù)讀下去:0411 1828 8634 2331 7247 3230 00320768 1024 4934 … … … …選出位于1~2000的數(shù):411,1828,32,768,1024,…,滿20個(gè)數(shù)為止。這20個(gè)數(shù)對(duì)應(yīng)的學(xué)生就是一個(gè)隨機(jī)樣本注意:在本課程中,樣本除特殊說(shuō)明外,均指隨機(jī)樣本3.本書的主線本書的主線是圍繞樣本、總體以及如何從樣本推斷總體來(lái)展開(kāi)的第一章統(tǒng)計(jì)數(shù)據(jù)收集與整理如何來(lái)歸納樣本所含信息第二章概率和概率分布第三章幾種常見(jiàn)的概率分布率第四章抽樣分布第五章統(tǒng)計(jì)推斷第六章參數(shù)估計(jì)第七章~第十章方差及回歸分析第十二章實(shí)驗(yàn)設(shè)計(jì)統(tǒng)計(jì)分析方法的理論基礎(chǔ):概率論從樣本推斷總體的基本方法:最基本的統(tǒng)計(jì)分析理論及方法樣本數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜時(shí)(實(shí)際研究往往如此),如何統(tǒng)計(jì)分析:實(shí)際研究中常用統(tǒng)計(jì)分析方法根據(jù)不同的研究目的如何設(shè)計(jì)實(shí)驗(yàn)得到樣本第二節(jié)數(shù)據(jù)類型及頻數(shù)(率)分布數(shù)據(jù)類型用圖和表對(duì)樣本數(shù)據(jù)進(jìn)行定性歸納:頻數(shù)表和頻數(shù)圖1.數(shù)據(jù)類型:連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)數(shù)據(jù)連續(xù)型數(shù)據(jù):(度量數(shù)據(jù))離散型數(shù)據(jù):(計(jì)數(shù)數(shù)據(jù))指用量測(cè)手段得到的數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測(cè)定的數(shù)量性狀資料。其數(shù)據(jù)是長(zhǎng)度、容積、重量等來(lái)表示。例如:身高、產(chǎn)奶量、體重、綿羊剪毛量等。這類數(shù)據(jù)通常是非整數(shù),數(shù)據(jù)的變異是連續(xù)的。由記錄不同類別個(gè)體的數(shù)目所得到的數(shù)據(jù)。各個(gè)觀測(cè)值只能以整數(shù)表示,在相鄰的整數(shù)間不得有帶小數(shù)的數(shù)值出現(xiàn)。例如:豬的產(chǎn)仔數(shù)、雞的產(chǎn)蛋數(shù)、魚的尾數(shù)等。2.用圖和表對(duì)樣本數(shù)據(jù)進(jìn)行定性歸納:頻數(shù)表和頻數(shù)圖2.1離散型數(shù)據(jù)頻數(shù)表和頻數(shù)圖的繪制例一.以50枚受精種蛋孵化出雛雞的天數(shù)(數(shù)據(jù)見(jiàn)表1)為例,繪制頻數(shù)表和頻數(shù)圖表150枚受精種蛋孵化出雛雞的天數(shù)21202021232222222122202322232219222324221922212121222224222121222223222221222223222322222223232221222120202123222222212220232223221922232422192221212122222422212122222322222122222322232222222323222122解:小雞出殼的天數(shù)在19~24天范圍內(nèi)變動(dòng),有6個(gè)不同的觀測(cè)值。以各個(gè)不同觀測(cè)值分組,共分為6組,開(kāi)始建立頻數(shù)(率)表:組值(孵化天數(shù))頻數(shù)計(jì)算頻數(shù)頻率1920.042030.0621100.2022240.482390.182420.04總計(jì)501.00打正字或劃線從表中我們可以迅速而直觀地看出:孵化天數(shù)大多集中在21~23天,以22天的最多,孵化天數(shù)較短(19~20天)和較長(zhǎng)(24天)的都較少頻數(shù)(率)圖是頻數(shù)(率)的圖形表示:注意:離散型數(shù)據(jù)頻數(shù)圖上方條間有間隙2.2連續(xù)型數(shù)據(jù)頻數(shù)表和頻數(shù)圖的繪制例二.以120頭母羊的體重資料(數(shù)據(jù)見(jiàn)表2)為例,繪制頻數(shù)表和頻數(shù)直方圖表2120母羊的體重資料(單位:kg)53505157565148466251615662584648465054564053515754595247575954505254625050535154565052505243534850605852645047
3752464542535847505045556251504353425654455654
65
6147524949514552544857455354575454454452505252555054435756544955504846564545514649
解:通過(guò)以下步驟進(jìn)行:(1)從原始數(shù)據(jù)中找出最大值和最小值,并求出極差max=65,min=37,極差R=max-min=65-37=28(2)決定劃分組數(shù)。一般來(lái)說(shuō),50~100個(gè)數(shù)分為7~10組。因?yàn)楸绢}中n=120,所以初步確定組數(shù)為10組。(3)根據(jù)極差與組數(shù)確定組距和組限。組距=極差/組數(shù)=28/10=2.8≈3 (組距一般取整數(shù))組限就是依據(jù)原始數(shù)據(jù)用來(lái)分組的每組的上下限,它的確定根據(jù)最小值和組距進(jìn)行。組限組界組中值頻數(shù)頻率374043。。。64組下限組限組界組中值頻數(shù)頻率37~3940~4243~45。。。64~66(4)在頻數(shù)表中列出組界和中值。由于測(cè)量精度的原因,第一組(組限為37~39)實(shí)際代表從36.5kg到39.5kg的所有數(shù)據(jù),因?yàn)檫B續(xù)型數(shù)據(jù)一般是小數(shù),這里只是因?yàn)闇y(cè)量精度以及記錄的方便以整數(shù)表示出來(lái)。例如,真實(shí)值為39.3公斤的數(shù)據(jù)會(huì)四舍五入成39公斤被記錄,它會(huì)被包括在第一組內(nèi)。36.5~39.5稱為組界,表示組的實(shí)際界限。組限組界組中值頻數(shù)頻率37~3936.5~39.53840~4239.5~42.54143~4542.5~45.544。。。。。。。。。64~6663.5~66.565(5)統(tǒng)計(jì)每組頻數(shù),完成頻數(shù)表。組限組界組中值頻數(shù)頻率37~3936.5~39.53810.00840~4239.5~42.54130.02543~4542.5~45.544120.10046~4845.5~48.547150.12549~5148.5~51.550270.22552~5451.5~54.553310.25855~5754.5~57.556170.14258~6057.5~60.55960.05061~6360.5~63.56260.05064~6663.5~66.56520.017連續(xù)型數(shù)據(jù)頻數(shù)直方圖的繪制:首先得到頻數(shù)表,然后以組界為橫坐標(biāo),以頻數(shù)為縱坐標(biāo)作直方圖。注意:(1)連續(xù)型直方圖方條間沒(méi)有間隙,因?yàn)樗越M界為方條的底部坐標(biāo)(2)但方條的標(biāo)識(shí)可以用組限標(biāo)出,如上圖,為了直觀的需要。其它的統(tǒng)計(jì)圖:請(qǐng)參考課本第三節(jié)樣本的幾個(gè)特征數(shù)這節(jié)里,我們定量地研究樣本數(shù)據(jù)地特征。有四個(gè)特征我們感興趣:(1)數(shù)據(jù)的集中性(以哪點(diǎn)為中心集中分布):(2)數(shù)據(jù)的變異性(數(shù)據(jù)間相互差異程度):(3)數(shù)據(jù)分布的對(duì)稱性:(4)數(shù)據(jù)分布的陡峭性:以平均數(shù)衡量以標(biāo)準(zhǔn)差或變異系數(shù)衡量以峭度衡量以偏斜度衡量注意:(1)(2)是重點(diǎn);(3)(4)作一般了解1.平均數(shù)平均數(shù)主要包括有算術(shù)平均數(shù)(以后簡(jiǎn)稱為平均數(shù))、中位數(shù)、眾數(shù)等。1.1算術(shù)平均數(shù)(arithmeticmean)算術(shù)平均數(shù)是指資料中各觀測(cè)值的總和除以觀測(cè)值個(gè)數(shù)所得的商。算術(shù)平均數(shù)的計(jì)算根據(jù)樣本的大小以及分組情況分為: 直接法和加權(quán)法。(一)直接法:主要用于未經(jīng)分組資料平均數(shù)的計(jì)算。此時(shí)樣本含量往往較小,如n≤30。求和號(hào)“∑”以后經(jīng)常用到,這里提醒以下它的常用的三個(gè)運(yùn)算法則(高中內(nèi)容):例一,某種公牛站測(cè)得10頭成年公牛的體重分別為500,520,535,560,585,600,480,510,505,490(kg),求其平均體重。(一)加權(quán)法:主要用于樣本含量大且已經(jīng)分組的資料(或稱頻數(shù)資料)平均數(shù)的計(jì)算。在獲得頻數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為:例二,根據(jù)本章第二節(jié)例二得到的120頭母羊體重資料的頻數(shù)表,計(jì)算這個(gè)樣本的平均數(shù)。組限組界組中值頻數(shù)頻率37~3936.5~39.53810.00840~4239.5~42.54130.02543~4542.5~45.544120.10046~4845.5~48.547150.12549~5148.5~51.550270.22552~5451.5~54.553310.25855~5754.5~57.556170.14258~6057.5~60.55960.05061~6360.5~63.56260.05064~6663.5~66.56520.0171.2中位數(shù)(median)將樣本內(nèi)所有觀測(cè)值從小到大排列,位于中間的那個(gè)值,稱為中位數(shù)。中位數(shù)的計(jì)算方法:首先將樣本從小到大排列
(1)樣本容量n為奇數(shù)時(shí),中位數(shù)即為位于中間位置的數(shù)(2)樣本容量n為偶數(shù)時(shí),中位數(shù)是位于中間位置上的兩個(gè)數(shù)的平均值例三,求下面兩個(gè)樣本的中位數(shù)(1)7只家兔從發(fā)病到死亡的日期分別為4,15,12,8,8,6,10(2)某犬場(chǎng)發(fā)生瘟熱,觀察得10只仔犬從發(fā)現(xiàn)癥狀到死亡的天數(shù)分別為7,8,8,8,11,12,12,13,14,141.3眾數(shù)(mode)樣本中出現(xiàn)次數(shù)最多的那個(gè)值或?qū)τ诜纸M資料而言頻數(shù)最多哪組的組中值,稱為眾數(shù)。例如,例三(1)中眾數(shù)為8,(2)中眾數(shù)為8。
1.4算術(shù)平均數(shù)、中位數(shù)和眾數(shù)的比較算術(shù)平均數(shù)優(yōu)于中位數(shù)和眾數(shù)(課本85頁(yè)上有理論說(shuō)明),因而被廣泛使用中位數(shù)和眾數(shù)在描述分布極不對(duì)稱的數(shù)據(jù)的平均數(shù)時(shí)有一定的優(yōu)勢(shì)。2.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standarddeviation)用于衡量一個(gè)樣本數(shù)據(jù)的變異程度。
假設(shè)有一樣本A:1,4,5,5,10,如何衡量數(shù)據(jù)間的變異程度?
相對(duì)于另一平均數(shù)同樣為5的樣本B:4,5,5,5,6,樣本A的變異程度明顯大,如何定量地說(shuō)明?思考一個(gè)問(wèn)題討論:145510總和-4-10050161002542但如何基于離差構(gòu)造一個(gè)衡量樣本總變異性的量化的指標(biāo)呢?但由于離均差平方和常隨樣本的大小而改變,為了消
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全生產(chǎn)事故隱患報(bào)告制度和舉報(bào)獎(jiǎng)勵(lì)制度范文(五篇)
- 2025高一物理預(yù)習(xí)講第7講.牛頓運(yùn)動(dòng)定律基礎(chǔ)含答案
- 2025年陜西省職教高考《語(yǔ)文》核心考點(diǎn)必刷必練試題庫(kù)(含答案)
- 土方開(kāi)挖運(yùn)輸合同
- 幼兒園圓形教學(xué)活動(dòng)策劃方案五篇
- 代理藥品銷售合同范本
- 公司口罩采購(gòu)合同范本
- 標(biāo)識(shí)的采購(gòu)合同
- 咨詢策劃合同范本
- 電氣設(shè)備安裝合同
- 《梅大高速茶陽(yáng)路段“5·1”塌方災(zāi)害調(diào)查評(píng)估報(bào)告》專題警示學(xué)習(xí)
- 2024年09月北京中信銀行北京分行社會(huì)招考(917)筆試歷年參考題庫(kù)附帶答案詳解
- 《大健康解讀》課件
- 2025年度交通運(yùn)輸規(guī)劃外聘專家咨詢協(xié)議3篇
- 2024年公司領(lǐng)導(dǎo)在新年動(dòng)員會(huì)上的講話樣本(3篇)
- 人教版道德與法治二年級(jí)下冊(cè)《第一單元 讓我試試看》大單元整體教學(xué)設(shè)計(jì)2022課標(biāo)
- 2024年3季度青島房地產(chǎn)市場(chǎng)季度簡(jiǎn)報(bào)
- 《物流市場(chǎng)營(yíng)銷環(huán)境》課件
- 網(wǎng)咖成本預(yù)算明細(xì)表
- 醫(yī)務(wù)科運(yùn)用PDCA循環(huán)提高門診醫(yī)生準(zhǔn)時(shí)出診率PDCA成果匯報(bào)
- 模具生產(chǎn)車間員工績(jī)效考核表模板
評(píng)論
0/150
提交評(píng)論