




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、概論名詞:生物統(tǒng)計:將概率論和數(shù)理統(tǒng)計的原理應用到牛物學中以分析和解釋其數(shù)量資料的科學 試驗設計:試驗丄作未進行z前應用生物統(tǒng)計原理,來制定合理的試驗方案,包括選擇動物, 分組和對比以及相應的資料搜集整理和統(tǒng)計分析的方法。總體與樣本數(shù)據(jù)具有不齊性。根據(jù)研究目的確定的研究對象的全體稱為總體(population);含有有限個個體的總體稱為有限總體;包含有無限多個個體的總體叫無限總體;總體中的一個研究單位稱為個體(individual);從總體中隨機抽出一部分具冇代表性的個體稱為樣木(sample);樣本中所包含的個休數(shù)目叫樣本容量或大小,常記為小 通常把/?<30的樣本叫小樣本,川>
2、30的樣本叫大樣本。隨機抽取(random sampling)的樣木是指總體中的每一個個體都冇同等的機會被抽取組成 樣本。變數(shù)與變異數(shù)列、變量:變數(shù):研究中對樣本個體的觀察值。變罐:相同性質的事物間表現(xiàn)差異性的某種特征。女口:身高、體重。變異數(shù)列:將變數(shù)按從小到大的順序排列的一組數(shù)列。參數(shù)與統(tǒng)計量山總體計算的特征數(shù)叫參數(shù)(parameter);由樣本計算的特征數(shù)叫統(tǒng)計量(staistic)o準確性與精確性準確性(accuracy)也叫準確度,指觀測值與其真值接近的程度。若兀與相差的 絕對值lr “i小,則觀測值x的準確性高;反z則低。精確性(precision)也叫精確度,指重復觀測值彼此接近
3、的程度。若觀測值彼此接 近,即任意二個觀測值xi. xj相差的絕對值舊一勸i小,則觀測值精確性高;反之 則低。調查或試驗的準確性、精確性合稱為正確性。由于真值常常不知道,所以準確性 不易度量,但利用統(tǒng)計方法可度量精確性。隨機誤差與系統(tǒng)誤差隨機誤差也叫抽樣誤差(sampling error),是由于許多無法控制的內在和外在的偶然因素所 造成。帶有偶然性質,在試驗中,即使i-分小心也難以消除。隨機誤差影響試驗的精確性。 統(tǒng)計上的試驗誤差指隨機誤差。這種誤差愈小,試驗的精確性愈高。系統(tǒng)誤差也叫片面誤差(lopsided error),是試驗處理z外的其他條件明顯不一致所帶來的偏 差。是山于試驗動物的
4、初始條件相差較大,飼料種類、品質、數(shù)量、飼養(yǎng)條件未控制相同, 測量的儀器不準、標準試劑未經(jīng)校正,以及觀測、記載、抄錄、計算中的錯謀所引起。系統(tǒng) 課差影響試驗的準確性。系統(tǒng)浜差是一種冇原因的偏差,因而在試驗過程中要防止這種偏差的出現(xiàn)。隨機誤差是偶然 性的。整個試驗過程小涉及的隨機波動因素愈多,試驗的環(huán)節(jié)愈多,吋間愈長,隨機誤差發(fā) 生的町能性及波動程度愈大。隨機誤差不可避免,但可減少,這主要依賴控制試驗過程,尤 其那些隨機波動性人的因索。系統(tǒng)誤差是町以通過試驗條件及試驗過程的仔細操作而控制 的。實際上一些主要的系統(tǒng)性偏壽較易控制,而白些細微偏并則較難控制。平均數(shù)、標準差無偏估計量:當一個統(tǒng)計量的數(shù)
5、學期望等于所估計的總體參數(shù)時,則稱此統(tǒng)計疑為該總體參 數(shù)的無偏估計屋中位數(shù)的計算方法因資料是否分組而有所不同。分組資料中位數(shù)的計算方法1、當八為奇數(shù)時:md= %+1)/22、當n為偶數(shù)時:m _ xn/2±x(n/2+)d _ 2已分組資料中位數(shù)的計算方法若資料已分組,編制成次數(shù)分布表,則可利用次數(shù)分布表來計算中位數(shù),其計算公式為:m產(chǎn) l+ 1 (”_c)f 2l中位數(shù)所在組的下限;i組距;/-中位數(shù)所在組的次數(shù);n總次數(shù);c小于屮數(shù)所在紐的累加次數(shù)。例題:某奶牛場68頭健康母牛從分娩到第一次發(fā)情間隔時間整理成次數(shù)分布表如表所示, 求中位數(shù)。間隔時間(d) 4頭數(shù)(/)2累加頭數(shù)
6、心1226p222741 a233a42一56心13p1和577120p3和7286血52心871016加10211642小66p£11"2卩68=£+ 1 (j) = 57+& (68_i6)= 70.5" f 220 2例題:將100頭長口母豬的仔豬一月窩重(單位:畑)資料整理成次數(shù)分布衣如下,求其加 權數(shù)平均數(shù)。10-32025ag3035<2百"40245230p5055-2460q6570q75合計214nil ioop"豁=需皿.2(如平均數(shù)適用于對稱分布,特別是正態(tài)分布資料。中位數(shù)適用于各種分布類型的資料,
7、特別適合大樣木偏態(tài)分布資料或者一端或兩端無確切數(shù) 值的資料。幾何平均數(shù):n個觀測值相乘之積開«次方所得的方根,稱為兒何平均數(shù),記為g。年度卩存欄數(shù)(只)4増長率(r) p1997卩140-p199加200p0.4290.3682199知280p0.400-0.398p2000p3520.252-0.602p2靈勞1.3亦g= lg_,- (lg 坷 + lg 兀2 + + lg x”)g ig f冋+仗七+覽斗)例題:某波爾山羊群1997-2000年各年度的存欄數(shù)見表3-3,試求其年平均增長率。n=7g-/ (-0.368-0.398-0.602)=zg-l (-0.456) =0.
8、3501例題:有8份血清的抗體效價分別為1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗體 效價。g = 5x10x20x40x80x160x320x640 = 56.57平均抗體效價為:1: 57幾何平均數(shù):適用于成等比數(shù)列的資料,特別是服從對數(shù)正態(tài)分布資料。如畜禽、水產(chǎn)養(yǎng) 殖的增長率,抗體的滴度,藥物的效價,畜禽疾病的潛伏期等。眾數(shù):資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值,稱為眾數(shù),記為m0。適用于大樣本;較粗糙如前述的50枚受精種蛋出雛天數(shù)次數(shù)分布屮,以22出現(xiàn)的次數(shù)最多,則該資料的眾數(shù)為22天。標準差:用平均數(shù)作為樣本
9、的代表,其代表性的強弱受樣本資料中各觀測值變開程度的彫響。 全距(極差):是表示變異程度最簡便的統(tǒng)計量。當資料很多而又要迅速對變異程度作岀判 斷,可以用全距。但是全距只利用了資料中的最大值和最小值,i:色粗略。離均差以平均數(shù)為標準,求出各個觀測值與平均數(shù)的離差,(兀一元)。離均差能表示一個 觀測值偏離平均數(shù)的性質和程度,但因為離均差有正、有負,離均差之和為零,即(x-x )=0 ,而不能用離均差之和工(x-x )表示所有觀測值的總偏離程度。平均絕對離差:si x-x %。平均絕對離差可以表示資料屮各觀測值的變異程度,但 包含絕對值符號,使用很不方便。先將各個離均差平方,即(兀元)2 ,再求離均
10、差平方和,即工(x-x)2 ,簡稱 平方和,記為ss;為了消除樣本大小的影響,需求出離均差平方和的平均數(shù)工(x-x)2/n 為使所得的統(tǒng)計量是相應總體參數(shù)的無偏估計量,統(tǒng)計學證明,在求離均差平方和的平均數(shù) 吋,分母用自由度 心,于是,采用統(tǒng)計量(x-x)2/1表示資料的變異程度。統(tǒng)計最 工(x x)2 /n l 稱為 均方(mean square縮寫為ms),乂稱樣本方差,記為s2,即s2=(% x)2 / 1自由度:樣本內能獨立而自市變動的觀察值的個數(shù),df=n-k, k為限制條件的個數(shù)。相應的總體參數(shù)叫總體方差,記為。2。對于有限總體而言,。2的計算公式為:(j2 =為(兀-兀)2 /n由
11、于樣本方差帶有原觀測單位的平方單位,統(tǒng)計學上把樣本方差s2的平方根叫做樣本 標準差,記為s,相應的總體參數(shù)叫總體標準差,記為。對于有限總體而言,。的計算公式為:1 工/n在統(tǒng)計學中,常用樣本標準差s估計總體標準差。 標準差的計算方法對于未分組或小樣本資料,可直接利用公式來計算標準差。對于次數(shù)分布表的大樣本資料,采用加權法計算標準差。計算公式為:口(兀-切2 _ ;xa2-(ea)2/s/11 滬式中,/為各組次數(shù);x為各組的組中值;f=n為總次數(shù)。 例:用某純系蛋雞200枚蛋重資料的次數(shù)分布表計算標準差組別2組中值3 2次教sv聲”44.1545.2cvsxl00%p6075.245.8546
12、.7xp13085.3447.5548.416<p774 ap37480.9649.2550 22"1102.255220.2250.9551.8431554.280497.20p52.6553.52442354.2125939.0254.3555.28<p1545.285317.1256.0556.9p301707.09712&3257.7558.612q703.241207.5259.4560.35q301.518180.4561.1562.op4卩248.015376.00合計柑s/=200si工京2-(工肉2/工/575507.1 1-10705. 1 2
13、/200=3.5524200 - 1標準差的特性標準差的大小,受資料中每個觀測值的影響,如觀測值間變異大,標準差也大,反z則小。 在各觀測值加上或減去一個常數(shù),其數(shù)值不變。每個觀測值乘以或除以一個常數(shù)a,則所得的標準差是原來標準差的。倍或/a倍。資料服從正態(tài)分布時,_ 68.26%的觀測值在(±s)范圍內; 95.43%的觀測值在(x ±2s)范圍內; 99.73%的觀測值在(兀±3s)范圍內。也就是說全距近似地等于6倍標準差,可用(全距/6)來粗略估計標準差。變異系數(shù):衡量資料中各觀測值變異程度的另一個統(tǒng)計屋o標準差與平均數(shù)的比值稱為變異系數(shù),記為c*。變片系數(shù)
14、可以消除單位和(或)平均數(shù)不同刈兩個或多個資料變界程度比較的影響。vcv= x100%x注意,變異系數(shù)的人小,同時受平均數(shù)和標準差兩個統(tǒng)計量的影響,因而在利用變異系數(shù)表 示資料的變界程度吋,最好將平均數(shù)和標準差也列出。常用概率分布隨機現(xiàn)象或不確定性現(xiàn)象,有如下特點:對一次或少數(shù)幾次觀察或試驗而言,其結果呈現(xiàn)偶然性、不確定性;在相同條件下進行大量重復試驗時,其試驗結果呈現(xiàn)出某種特定的規(guī)律性頻率的穩(wěn)定 性,稱z為隨機現(xiàn)彖的統(tǒng)計規(guī)律性。隨機試驗與隨機事件隨機試驗 根據(jù)某一研究目的,在一定條件卜對白然現(xiàn)象所進行的觀察或試驗統(tǒng)稱為試驗。 滿足下述三個特性稱為一個隨機試驗(random trial),簡稱
15、試驗:(1)試驗可以在相同條件下多次重復進行;(2)每次試驗的可能結果不止一個,并且事先知道會有哪些可能的結果:(3)每次試驗總是恰好出現(xiàn)這些可能結果中的一個,但在一次試驗之前卻不能肯定這 次試驗會出現(xiàn)哪一個結果。隨機事件隨機試驗的每一種可能結果,稱為隨機事件(random event),簡稱事件(event),通常用4、 b、c等來表不°基本事件:不能再分的事件稱為基本事件(elementary event),也稱為樣本sample point)o 復合事件:由若干個基本事件組合而成的事件。如“取得一個編號是2的倍數(shù)”是一個復合事件。由“取得一個編號是2”、“是4"、“是
16、 6、“是曠、“是1(t5個基本事件組合而成。必然事件(certain event在一定條件下必然會發(fā)生的事件,用q表示。如,在嚴格按妊娠 期母豬飼養(yǎng)管理的要求飼養(yǎng)的條件下,妊娠正常的母豬經(jīng)114天左右產(chǎn)仔。不可能事件(impossible event),在一定條件下不可能發(fā)生的事件,用巾表示。必然事件與不可能事件實際上是確定性現(xiàn)象,為了方便起見,把它們看作為兩個特殊的隨機 事件。概率:在相同條件下進行n次重復試驗,如果隨機事件a發(fā)牛的次數(shù)為加,那么諭稱為 隨機事件4的頻率(frequency);當試驗重復數(shù)逐漸增人時,隨機事件4的頻率越來越穩(wěn) 定地接近某一數(shù)值”,p稱為隨機事件4的概率。這樣
17、的概率稱為統(tǒng)計概率或者后驗概率。概率的古典定義:有很多隨機試驗具冇以下特征:樣木空間屮的基木事件只有有限個;所冇 基本事件的發(fā)牛是等可能的;試驗的所有可能結果兩兩互不相容。具有上述特征的隨機試驗, 稱為古典概型。若隨機事件的概率很小,例如小于().05、().01、0.001,稱之為小概率事件。把小概率事件在一次試驗中看成是實際不可能發(fā)生的事件稱為小概率事件實際不可能性原 理,亦稱為小概率原理。小概率事件實際不可能性原理是統(tǒng)計學上進行假設檢驗(顯著性檢 驗)的基本依據(jù)。例:患結核病為3%,患沙眼為4%,貝ij 10000 >|'患任一種病的概率、人數(shù)p ( aub ) = p (
18、a) +p (b) 一 p (aqb)=0.03+0.040.03x0.04=0.06880.0688 x 10000= 688 人標準正態(tài)分布的概率計算利用下列關系式,可計算常用概率:p(0m<m7)=0(w7)-0.5p(心)=叭加)p( u (呻)p( u <«/)=l-2o(-w7)o(w2)-o(m7)例已知弘n(0, 1),試求:(1) p(w<-1.64) = ? =0.05050(2) p (心2.58)=?=0(-2.58)=0.024940(3) p ( i « i $2.56)=? =2 0 (-2.56)=2 x 0.005234
19、=0.010468(4) p().34w“<1.53) =?二(1.53)(0.34)=0.93669-0.6331=0.30389關于標準正態(tài)分布,以下幾種概率應當熟記:p=0.6826 p (2w“v2) =0.9545 p (3w“v3) =0.9973 p (196w“v1.96)=0.95 p (-2.58w<2.58)=0.99p(u - a w兀v p + o )=0.6826p( p 2 o wx v u+2o ) =0.9545p(u-3a wx v u +3 o ) =0.9973p (u -1.96 0 0 v u +1.96 a ) =0.95p (u 25
20、8 a+2.58 a )=0.99雙側概率(兩尾概率)和單側概率隨機變量x落在平均數(shù)m加減不同倍數(shù)標準差。區(qū)間z外的概率稱為雙側概率(兩尾概率), 記作a。對應于雙側概率町以求得隨機變量x小于或大于p+i的概率,稱為單側概率(一尾 概率),記作a /2o例題 已知豬血紅蛋白含量兀服從正態(tài)分布n( 12.86,1.332),若p(x < li )=().()3, p(x m l2)=0.03,求 li , l2 解:由題意可知,a / 2=0.03, a =0.06山附表2查得: =1.880794,所以(li -12.86)/1.33=-1.880794(l2 12.86)/1.33=1
21、.880794即 li f0.36, l2 =15.36。二項分布"成功一失敗型”試驗稱為bernoulli試驗(1) 每次試驗結杲,只能是兩個互斥的結果z(a或非a)o(2) 每次試驗的條件不變。即每次試驗屮,結果a發(fā)生的概率不變,均為p o(3) 各次試驗獨立。即一次試驗出現(xiàn)什么樣的結果與前面已出現(xiàn)的結果無關。二項分布的性質二項分布山n和卩兩個參數(shù)決定:1、當p值較小且"不大時(np<5),分布是偏倚的。但隨著"的增人,分布逐漸趨于 對稱;2、當p值趨于0.5時,分布趨于對稱;3、對于固定的幾及”,當k增加吋,pn(燈先隨z增加并達到其極大值,以后又下降
22、。 在"較大,np、nq (叩>5, p不接近0, 1)較接近時,二項分布接近于正 態(tài)分布;當況一8時,p >0.1, 一項分布的極限分布是疋態(tài)分布。例題:設在家畜屮感染某種疾病的概率為20%,現(xiàn)有兩種疫苗,用疫茁a注射了 15頭家 畜后無一感染,用疫苗b注射15頭家畜后有1頭感染。設各頭家畜沒有相互傳染疾病的 可能,問:應該如何評價這兩種疫苗?解:假設疫苗a完全無效,注射后的家畜感染的概率仍為20%,則15頭家畜中染 病頭數(shù)*0的概率為p(x = 0) = c0.20°0.8015 = 0.0352同理,如果疫苗b完全無效,則15頭家畜中鼓多冇1頭感染的概率為
23、p(x <1) = 6;0.2。0.薩 +供020.8山=0671可知,注射a疫苗無效的概率為0.0352,比b疫苗無效的概率0.1671小得多。因此,可 以認為a疫苗是有效的,但不能認為b疫苗也是有效的。例題:棕色正常毛(bbrr)和黑色短毛(bbrr)朵交,問需多少f2代家兔才能以99%的 概率獲得一個棕色範毛兔? 解:非 bbrr 為 15/16,bbrr 為 1/16出現(xiàn) 1 個 bbir: r( 1 ij5”_i16 16出現(xiàn)2個bbrr:八16八16)”一2 出現(xiàn) n 個 bbrr: c: ()a,(心)"“ 所以 出現(xiàn)()個 bbrr:廠o 1=1-0.99=0.
24、015尿)(憶) n=(lg 15-lgl 6)=0.01 ,n=71.4二項分布的應用條件:(1)各觀察單位只具有互相對立的一種結果;(2)已知發(fā)生某一結果(如死亡)的概率為卩,其對立結果的概率則為-p=q,實際中 要求卩是從大雖觀察中獲得的比較穩(wěn)定的數(shù)值;(3)斤個觀察單位的觀察結果互相獨立。二項分布的平均數(shù)與標準差當試驗結果以事件4發(fā)牛次數(shù)r表示時u x=np o x=當試驗結果以事件人發(fā)牛的頻率k/n示時=pj 也稱為總體百分數(shù)標準誤,當p耒知時,常以樣本百分數(shù)p來估計。此時:sp = j(丙)/矜1-"sp稱為樣本百分數(shù)標準誤。波松分布用來描述和分析隨機地發(fā)生在單位空間或時
25、間里的稀有事件的概率分布。p().1, n-8np 5應用:如,一定畜群中某種患病率很低的非傳染性疾病患病數(shù)或死亡數(shù),畜群中遺傳的畸 形怪胎數(shù),每升飲水中大腸桿菌數(shù),計數(shù)器小方格中血球數(shù),單位空間中某些野生動物或 昆蟲數(shù)等。波松分布的意義若隨機變fix(x=k)只取零和正整數(shù)值0, 1, 2,jl其概率分布為其屮入(); e=2.7182.是自然對數(shù)的底數(shù),則稱x服從 參數(shù)為入的波 松分布 (poisson's distribution),記為兀p(入)。波松分布重要的特征:平均數(shù)和方差相等,都等于常數(shù)入,即u = «2=x性質:1. 入是波松分布所依賴的唯一參數(shù)。2. 入值
26、愈小分布愈偏倚,隨著入的增人,分布趨于對稱。當x = 20時分布接近于正態(tài)分布;當x =50吋,可以認為波松分布呈正態(tài)分布波松分布的概率計算調杳某種豬場冇種群仔豬畸形數(shù),共記錄200窩,畸形仔豬數(shù)的分布情況如表43所示。 試判斷畸形仔豬數(shù)是否服從波松分布22q合訊窩數(shù)沖120622p2樣本均數(shù)和方差s2計算結果如下:= 2fk/n=(120x0+62x 1 +15x2+2x3+1x4)/200=0.51一 2 工幾2一(工幾)2九s n 一 i(120 x02 +62xp + 15x22 + 2x32 +1x42 -102 2)/200200 -1= 0.52這兩個數(shù)是相當接近的,因此可以認為
27、畸形仔豬數(shù)服從波松分布。 將0.51代替公式(4-23)中的入得:p(x = k)=k伙=0,1,2,.)因為-().51 = 1.6653,所以畸形仔豬數(shù)各項的概率為:p(x=0)=0.510 / (0! x 1.6653)=0.6005p(x= 1)=0.511 / (1!x 1.6653)=0.3063"2)=0.512 / (2! x 1.6653)=0.0781p(兀=3)=0.513 / (3! x 1.6653)=0.0133p(x=4)=0.514 /(4!x 1.6653)=0.00174p(x > 4) = 1 _工卩(兀=燈=1-0.9999 = 0.0(
28、)01r=o每窩畸形數(shù)好腫2233 口$4心合計q窩數(shù)卩12m62卩15卩2卩2200頻率心0.60000.310010.07500.01000.00501.00概率卩0.60050.3063 卩0.07810.01330.001 陰1.00理論窩數(shù)卩1加.以61.2615伽2血0.342200進一步說明了畸形仔豬數(shù)是服從波松分布的例:某小麥品種在田間的變異概率為0.0045,計算:(1)調查100株,獲2株或2株以上的變異植株的概率(2)期望以99%獲得1株或1株以上的變異植株,至少要調杳多少株? 解:x =np= 100x0.0045=0.4504寧嚴p (0) = a=0.6376a占嚴
29、sp(i)=11= 0.2869p (xm2) =1-p (0) -p (1) =0.0755(2) p (0)=0.01n=l()23 株一些具有傳染性的罕見疾病的發(fā)病數(shù),因為首例發(fā)住z后可成為傳染源,會影響到后續(xù)病例 的發(fā)生,所以不符合波松分布的應用條件。対于在單位時間、單位面積或單位容積內,所觀察的事物由于某些原因分布不隨 機時,如細菌在牛奶中成集落存在時,亦不呈波松分布。正態(tài)分布、二項分布、波松分布三者間關系:二項分布:8, p-*0 (p<0.1),且”=入(較小常數(shù)v5)情況下,趨于波 松分布。 n->oo?p->o 5 (p>0.1),趨于正態(tài)分布。波松分
30、布:入一8 (入220)時,以正態(tài)分布為極限。樣本平均數(shù)的抽樣分布研究總體與樣木之間的關系是統(tǒng)計學的屮心內容,其研究從兩方面著手:-是從總體到樣本抽樣分布二是從樣本到總休統(tǒng)計推斷扌11樣分布(sampling distribution)是統(tǒng)計推斷的基礎從總體中按一定的樣木容量隨機地抽取所冇可能的樣木,其統(tǒng)計量(如,s)將隨樣木的不同而有所不同,樣本統(tǒng)計量(隨機變量)的概率分布統(tǒng)計量的概率分布稱為抽樣分布 樣本平均數(shù)抽樣分布由總體隨機抽樣的方法可分為有返置抽樣和不返置抽樣兩種。對于無限總體,返置與否都可保證各個體被抽到的機會相等。對于有限總體,就應該采取返 置抽樣。設有一個總體,總體平均數(shù)為p
31、,方差為。2,總體中各變數(shù)為%,將此總體稱為原總 體?,F(xiàn)從總體中隨機抽取含量為”的樣木,樣本平均數(shù)記為。樣本平均數(shù)是一個隨機變量,具概率分布叫做樣本平均數(shù)的抽樣分布。由樣木平均數(shù)構成的總體稱為樣木平均數(shù)的抽樣總體。其平均數(shù)和標準差分別記%_和ogr是樣本平均數(shù)篩總體的標準差,簡稱標準誤(standard error),表示平均數(shù)抽 樣誤差的大小。統(tǒng)計學上已證明總體的兩個參數(shù)與兀總體的兩個參數(shù)有如下關系:可以看出,原總體并非正態(tài)分布,但從中隨機抽収樣本,即使樣本含量很小s=2, h=4), 樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量川的增大,樣本平均數(shù)的分布愈 來愈從不連續(xù)趨向于連續(xù)的正
32、態(tài)分布。當n>30時,x的分布就近似正態(tài)分布了中心極限定理標準誤(平均數(shù)抽樣總體的標準差)反映樣本平均數(shù)的抽樣誤差的大小,即精確性的高低。 因為。是一常數(shù),所以只有增大樣本含量才能降低樣本平均數(shù)的抽樣誤差。實際尸l總體標準差o往往是未知的,因而無法求得v©可用樣本標準差s佔計0。于是, 以s/j/2估計”-。記為s/巫,稱作樣木標準謀或均數(shù)標準誤。樣木標準謀s丘是平均數(shù)抽樣誤差的估計值。若樣本中各觀測值為x_s_ |工(兀_對2 _ |工兀2 -(q)s' 4n n(n-l) n(n -1)注意,樣本標準差少樣本標準誤區(qū)別:- 樣本標準差s是反映樣本中各觀測值變界程度大
33、小的一個指標,說明 了兀對該樣本代表性的強弱_ _樣本標準誤是樣木平均數(shù)x,x2,.,xk的標準差,是抽樣課差的估計值,其人 小說明了樣本間變異程度的大小及精確性的高低。資料的整理資料的分類一)有效數(shù)值(一)數(shù)值:有量綱表示事物大小和尺度的數(shù)(二)冇效數(shù)字的識讀小數(shù)點后第一位不為零的數(shù)字讀起,小數(shù)點之前的零不算。(三)有效數(shù)字的定位與計算1. 以讀取儀器中戢小刻度以下再估讀一位作為有效數(shù)字,所有變數(shù)的有效位數(shù)一致。2. 有效數(shù)字運算的結果有效位數(shù)不能高于運算因了屮的最小位數(shù)。3. 常數(shù)的冇效位數(shù)據(jù)需要而定。4“四舍六入五取雙”原則5.大于四位平均有效數(shù)字加大一倍。二)數(shù)據(jù)的分類正確地進行資料的
34、分類是資料整理、統(tǒng)計歸納的前提。數(shù)據(jù)按性質,一般分為數(shù)量性狀資料、質量性狀資料和半定量(等級)資料三大類 數(shù)量性狀資料數(shù)量性狀(quantitative character)是指能夠以量測或計數(shù)的方式表示其特征的性狀。觀察測定 數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料(data of quantitative characteristics)o 數(shù)量性狀資料的獲得有量測和計數(shù)兩種方式,因而又分為計量資料和計數(shù)資料兩種。(一)計量資料指用雖測方式獲得資料,即用度、雖:、衡等計雖工貝直接測定獲得的資料。用長度、容積、 重量等來表示。各個觀測值不一定是整數(shù),其小數(shù)位數(shù)的多少由度量工具的精度而定,變異是連
35、續(xù)性的。 也稱為連續(xù)性變異資料。(二)計數(shù)資料指用計數(shù)方式獲得的資料。各個觀察值只能以整數(shù)表示,各觀察值是不連續(xù)的,也稱為不連續(xù)性變界資料或間斷性變界 資料。質量性狀(qualitative character)指能觀察到而不能宜接測量的性狀,如顏色、性別、生死 等。不能直接用數(shù)值表示,須對其觀察結果作數(shù)雖化處理,方法冇以下兩種:(一)統(tǒng)計次數(shù)法在一定的總體或樣本中,根據(jù)某一質量性狀的類別統(tǒng)計英次數(shù),以次數(shù)作為數(shù)據(jù)。例如,研究豬的毛色遺傳,口豬與黑豬雜交,子二代屮口豬、黑豬和花豬的頭數(shù)分類統(tǒng)計 這種由質雖性狀數(shù)量化得來的資料乂叫次數(shù)資料。二)評分法對某一質量性狀,因其類別不同,分別給予評分。例
36、如,在研究豬的肉色遺傳時,將屠宰后2小時的豬眼肌橫切面與標準圖譜對比,由淺到 深分別給予15分的評分,以便統(tǒng)計分析。三、半定量(等級)資料半定雖:或等級資料(semi-quantitative or ranked data)是指將觀察單位按所考察的性狀或指標 的等級順序分組,然后清點各組觀察單位的次數(shù)而得的資料。既有次數(shù)資料的特點,乂有程度或量的不同。如用某種藥物治療畜禽的某種疾病,療效分為“無效”、“好轉”、“顯效”和“控制”四個級別; 然后統(tǒng)計各級別的供試畜禽數(shù)。半定量資料在獸醫(yī)研究中是常見的。三類資料冇區(qū)別,但可根據(jù)研究的冃的和統(tǒng)計方法的要求相互轉化。例如,獸醫(yī)臨床化驗動物的口細胞總數(shù)得
37、到的資料屬于計數(shù)資料。根據(jù)化驗的目的,可按口細胞總數(shù)正?;虿徽7譃閮山M,清點各組的次數(shù),計數(shù)資料轉化 為次數(shù)資料;按白細胞總數(shù)過高、正常、過低分為三組,清點各組次數(shù),轉化成半定最資料。資料的整理資料的檢查與核對目的在于確保原始資料的完整性和正確性。完整性是指原始資料無遺缺或重復。正確性是指原始資料的測量和記載無差錯或未進行不合理的歸并。要特別注意特大、特小和界常'數(shù)據(jù)(可結合專業(yè)知識作出判斷)。対于有重復、界常或遺漏 的資料,應予以刪除或補齊;對有錯誤、相互矛盾的資料應進行更正,必要時進行復查或重 新試驗。資料的整理方法層30,不必分組,直接進行統(tǒng)計分析。n>30f分成若干組,
38、以便統(tǒng)計分析。分紐后,制成次數(shù)分布表,即可看到資料的集屮和變異情況。(一)計數(shù)資料的整理一單項式分組法。以50枚受精種蛋孵化出雛雞的天數(shù)為例。用變數(shù)自然值進行分組,每組組值均用一個變數(shù)值表示,將每個變數(shù)歸入相應組, 統(tǒng)計頻數(shù),制成頻數(shù)分布表。小雞出殼天數(shù)在19-24天范圍內變動,有6個不同的觀察值。用各個不同觀察值進行分纟r, 共分為6組。合并分組法觀察值較多的計數(shù)資料,以兒個相鄰觀察值為組,適當減少組數(shù),資料的規(guī)律性就較明顯, 進一步計算分析也比較方便。如觀測某品種10()只蛋雞每年每只雞產(chǎn)蛋數(shù)(原始資料略),其變異范圍為200-299枚。 如間隔10枚為組,可使組數(shù)適當減少。經(jīng)初步整理后分
39、為10組,資料的規(guī)律性就比較明 顯。(二)計量資料的整理組距式分組法在分組前需確定全距、紐數(shù)、紐距、紐屮值及紐限,然后將全部觀測值劃線計數(shù)歸紐。將126頭基礎母羊的體重資料整理成次數(shù)分布表1、求全距 全距是資料中最大值與最小值之差,乂稱為極grange),用r表示2、確定組數(shù)(經(jīng)驗)視樣本含量及資料的變動范圍而定,既簡化資料乂不影響反映資料的規(guī)律性。組數(shù)要適當,分組越多所求得的統(tǒng)計量越精確,但增大了運©fi;分組過少,資料的規(guī)律性 就反映不出來,計算出的統(tǒng)計量的精確性也較差。n < 50, 5-6 組; n >50, 7-20 組。樣本含壘(和)4組數(shù)心601004710
40、100200*91242005001212500以上417303、確定組距每紐最大值與最小值之差稱為組距,記為zo要求各組的組距相等。組距(i)=全距/組數(shù)木例 z=28.0/ 103.0 (一般用整數(shù)、避免計算的麻煩)4、確定組限及組中值各組的最大值與最小值稱為組限。最小值為下限,最人值為上限。每一組的中點值稱為組中值,是該組的代表值。組中值=(組下限+組上限)/2=組下限+1/2組距=組上限一 1/2組距當?shù)谝唤M的組中值確定以后,加上組距就是第二組的組中值,其余類推。首先要選定第一組的組中值。為避免第一組中觀察值過多,第一組的組中值以接近或等于資料中的最小值為好。第一組組中值、組限確定后,
41、其余各組的組中值、組限也可相繼確定。注意,最末一組的上限應大于資料中的最大值。最小值為37.0,第一組的組中值取37.5,組距為3.0。第一組的下限為:37.5-(1 qx3.0=36.0;第一組的上限也就是第二組的下限為:36.0+3.0=39.0;以此類推。于是可分組為:36.0 39.0, 39.0 42.0, 。為使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確切歸組,約定將其歸入后一組:第一組記為36.0,第二組記為39.0,5、歸紐劃線計數(shù),作次數(shù)分布表分組結束后,將資料屮的每一觀測值逐一歸組,劃線計數(shù),然后制成次數(shù)分布表。 在歸組劃線時應注意,不要重復或遺漏。分紐后所得實際紐數(shù),有時和
42、最初確定的紐數(shù)不同。(三) 質量性狀資料、半定量(等級)資料的整理按性狀或等級進行分組,分別統(tǒng)計各組的次數(shù),然后制成次數(shù)分布表。常用統(tǒng)計表與統(tǒng)計圖一、統(tǒng)計表(-)統(tǒng)計表的結構和要求統(tǒng)計表由標題、橫標日、縱標日、線條、數(shù)字及合計構成。編制統(tǒng)計表的總原則:結構簡單,層次分明,內容安排合理,重點突出,數(shù)據(jù)準確,便于理 解和比較分析。具體要求如門1、標題 簡明扼要、準確說明表的內容,有時須注明時間、地點。2、標冃 標hl分橫標hl和縱標hl兩項。橫標ii列在表的左側,用以表示被說明事物的主要 標志;縱標1=1列在表的上端,說明橫標1=1各統(tǒng)計指標內容,并注明計算單位,如、kg、cm 等等,用/隔開。3
43、、數(shù)字 一律用阿拉伯數(shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“一”表示, 數(shù)字是“0”的,則填寫“0”。4、線條 三線圖:表的上下兩條邊線略粗,總橫標目、縱標目間及合計用細線與下而橫標 目、縱標目分組及合計分開,表的左上角一般不用斜線(二)統(tǒng)計表的種類統(tǒng)計表可根據(jù)縱、橫標目是否有分組分為簡單表和復合表兩類。1、簡單表 由一組橫標h和一組縱標冃組成,縱橫標h都耒分組。適于簡單資料的統(tǒng)計。2、復合表 由兩紐或兩紐以上的橫標目與一組縱標目結合而成。此類表適用于復雜資料的 統(tǒng)計。二、統(tǒng)計圖常用有長條圖(bar chart)、園圖(pie chart)、線圖near chart) x直方圖(histogram)和折線圖(broken-line chart)等。一般,計量資料采用玄方圖和折線圖,計數(shù)資料、質量性狀資料、半定量(等級)資料常 用長條圖、線圖或園圖。(一)統(tǒng)計圖繪制的基本要求1、標題簡明扼要,列于圖的下方。2、縱、橫兩軸應有刻度,注明單位。3、橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5: 4或6: 5。4、圖中需用不同顏色或線條代表不同事物時,應有圖例說明。(二)常用統(tǒng)計圖及其繪制方法1、長條圖用等寬長條的氏觸或高低表示屬性種類或等級的次數(shù)或頻率分布。如果只涉及一項指標,則采用單式長條圖;如果涉及兩個或兩個以上的指標,則采用復式長條圖。長條圖注意以下幾點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度拓展訓練場地與高校合作教育項目協(xié)議
- 二零二五年度物流運輸企業(yè)員工入職保密協(xié)議及供應鏈保護
- 2025年度高端定制酒定制生產(chǎn)合同
- 二零二五年度足療中心員工勞動合同范本
- 2025年度終止勞動合同協(xié)議書:SS企業(yè)員工TT合同終止及離職手續(xù)辦理協(xié)議
- 二零二五年度醫(yī)療援助項目醫(yī)生聘用協(xié)議
- 二零二五年度口腔診所負責人侵權責任免除與賠償處理合同
- 二零二五年度上市公司股份回購退股協(xié)議
- 2025年度高科技園區(qū)土地租賃服務協(xié)議
- 二零二五年度房屋租賃合同租賃物能源消耗管理補充協(xié)議
- 機關檔案管理工作培訓PPT課件
- 大學生安全教育課件(ppt共41張)
- 初中物理人教版八年級下冊 第1節(jié)牛頓第一定律 課件
- 網(wǎng)站培訓內容trswcm65表單選件用戶手冊
- 監(jiān)理大綱(范本)
- 空調系統(tǒng)維保記錄表格模板
- 打印版-圓與二次函數(shù)綜合題精練(帶答案)
- 工程結算書標準
- 氧氣管道吹掃方案(共7頁)
- JJG-943-2011-總懸浮顆粒物采樣器
- 2018年湖北省襄陽市中考物理試卷
評論
0/150
提交評論