第1章統(tǒng)計數(shù)據(jù)的收集與整理_第1頁
第1章統(tǒng)計數(shù)據(jù)的收集與整理_第2頁
第1章統(tǒng)計數(shù)據(jù)的收集與整理_第3頁
第1章統(tǒng)計數(shù)據(jù)的收集與整理_第4頁
第1章統(tǒng)計數(shù)據(jù)的收集與整理_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第一章 統(tǒng)計數(shù)據(jù)的收集與整理 數(shù)據(jù)類型及頻數(shù)(率)分布 數(shù)據(jù)整理 樣本平均值 樣本標(biāo)準(zhǔn)差 變異系數(shù) 1. 數(shù)據(jù)類型及頻數(shù)(率)分布 連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù) 連續(xù)型數(shù)據(jù):與某種標(biāo)準(zhǔn)比較所得到的數(shù)據(jù),又稱度 量數(shù)據(jù) 離散型數(shù)據(jù):由記錄不同類別個體的 數(shù)目所得到的數(shù) 據(jù),又稱計數(shù)數(shù)據(jù),對離散型數(shù)據(jù)進行分析的方法通 常稱為屬性的方法。 頻數(shù)表或頻數(shù)圖是描述數(shù)據(jù)變化規(guī)律最簡 單的方法 頻數(shù)(率)表和頻數(shù)(率)圖的編繪 例1.1 調(diào)查每天出生的 10名新生兒中體重超過3kg的人 數(shù),共調(diào)查120d 0 10 20 30 40 50 012345678910 圖1-1 頻數(shù)圖 2. 數(shù)據(jù)整理 【例1.2 】

2、 將126頭基礎(chǔ)母羊的體重資料 表1-2 126頭母羊的體重資料(單位:kg) 1、求全距 全距是資料中最大值與最小值之差,又稱為極差 (range),用R表示,即 R=Max(x)-Min(x) 本例 R=65.0-37.0=28.0(kg) 計量資料在分組前需要確定全距、組數(shù)、組距、 組中值及組限,然后將全部觀測值劃線計數(shù)歸組。 2、確定組數(shù) 一般以達(dá)到既簡化資料又不影響反映資料的規(guī) 律性為原則。 樣本含量組數(shù) 60-1007-10 100-2009-12 200-50012-17 50017-30 本例中,n126,根據(jù)表2-6,初步確定組數(shù)為10組。 3、確定組距 每組最大值與最小值之

3、差稱為組距,記為 i。分組時 要求各組的組距相等。組距的計算公式為: 組距(i)全距組數(shù) 本例 i28.0103.0 4、確定組限及組中值 各組最大值與最小值稱為組限。最小值稱為下限, 最大值 稱為上限。每一組的中點值稱為組中值,它是該組的代 表值。組中值與組限、組距的關(guān)系如下: 組中值(組下限組上限)/2組下限1/ 2組距組上限 1/2組距 相鄰兩組的組中值間的距離等于組距。 組距確定后, 首先要選定第一組的組中值。在分組時為了 避免第一組中觀察值過多,一般第一組的組中值以接近 或等于資料中的最小值為好。第一組組中值確定后,該 組組限即可確定,其余各組的組中值和組限也可相繼確 定。 注意,最

4、末一組的上限應(yīng)大于資料中的最大值。 表1- 2中, 最小值為37.0, 第一組的組中值取37.5, 因組距已確定為3.0,所以第一組的下限為: 37.5-(1/2)3.036.0; 第一組的上限也就是第二組的下限為: 36.0+3.0=39.0; 第二組的上限也就是第三組的下限為: 39.0+3.0=42.0, 以此類推,一直到某一組的上限大于資料中的最大值 為止。 于是可分組為: 36.0 - 39.0,39.0- 42.0,。 為了使恰好等于前一組上限和后一組下限的數(shù)據(jù)能確 切歸組,約定將其歸入后一組。 通常將上限略去不寫。 第一組記為36.0 - , 第二組記為39.0 - , 5、歸組

5、劃線計數(shù),作次數(shù)分布表 分組結(jié)束后,將資料中的每一觀測值逐一歸組,劃線計 數(shù),然后制成次數(shù)分布表。 表1-3 126頭母羊的體重的次數(shù)分布表 在歸組劃線時應(yīng)注意,不要重復(fù)或遺漏,歸組劃 線后將各組的次數(shù)相加,結(jié)果應(yīng)與樣本含量相等,如 不等,證明歸組劃線有誤,應(yīng)予糾正。 在分組后所得實際組數(shù),有時和最初確定的組數(shù) 不同,如第一組下限和資料中的最小值相差較大或?qū)?際組距比計算的組距為小,則實際分組的組數(shù)將比原 定組數(shù)多;反之則少。 100株“三尺三”株高測量結(jié)果 155155153153159159155155150150159159157157159159151151152152 1591591

6、58158153153153153144144156156150150157157160160150150 150150150150160160156156160160155155160160151151157157155155 159159161161156156141141156156154154156156153153158158161161 157157149149153153153153155155162162154154152152162162155155 161161159159161161156156162162151151152152154154157157162162 15

7、8158155155153153151151157157156156153153147147158158155155 148148163163156156163163154154158158152152163163158158154154 164164155155156156158158164164148148164164154154157157165165 158158166166154154154154157157167167157157159159170170158158 1.00100總計 0.011159167.5170.5168170 0.033166164.5167.516516

8、7 0.1010正正163161.5164.5162164 0.1515正正正160158.5161.5159161 0.2828正正正正正157155.5158.5156158 0.2323正正正正154152.5155.5153155 0.1313正正151149.5152.5150152 0.044148146.5149.5147149 0.022145143.5146.5144146 0.011142140.5143.5141143 頻率頻數(shù)頻數(shù)計算中值組界/cm組限/cm 三尺三株高直方圖 170.0 167.5 165.0 162.5 160.0 157.5 155.0 152.5

9、 150.0 147.5 145.0 142.5 140.0 30 20 10 0 Std. Dev = 4.85 Mean = 156.2 N = 100.00 SPSS13.0 “三尺三”株高多邊形圖 170166164162160158156154152150148144 10 8 6 4 2 0 “三尺三”株高的累積頻數(shù)圖 167.00 165.00 163.00 161.00 159.00 157.00 155.00 153.00 151.00 149.00 147.00 141.00 Cumulative Frequency 120 100 80 60 40 20 0 3. 樣本平

10、均值 平均數(shù)是統(tǒng)計學(xué)中最常用的統(tǒng)計量,用來表明資料中 各觀測值相對集中較多的中心位置。平均數(shù)主要包括有: 中位數(shù)(median) 眾數(shù)(mode) 幾何平均數(shù)(geometric mean) 調(diào)和平均數(shù)(harmonic mean) 3.1 算術(shù)平均數(shù) 算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所 得的商,簡稱平均數(shù)或均數(shù),記為 。 算術(shù)平均數(shù)可根據(jù)樣本大小及分組情況而采用直接法或加 權(quán)法計算。 (一)直接法 主要用于樣本含量n30以下、未經(jīng)分組資料平均數(shù)的計 算。 x 設(shè)某一資料包含設(shè)某一資料包含n個觀測值:個觀測值: x1、x2、xn, 則樣本平均數(shù)可通過下式計算:則樣本平均數(shù)可通過

11、下式計算: (3-1) 其中,其中,為總和符號;為總和符號; 表示從第一個觀測值表示從第一個觀測值x1 累加到第累加到第n個觀測值個觀測值xn。當(dāng)。當(dāng) 在意義上已明確時,可在意義上已明確時,可 簡寫為簡寫為x,(,(3-1)式可改寫為:)式可改寫為: 121 n i ni x xxx x nn 1 n i i x x x n 1 n i i x 【例1. 3 】 某種公牛站測得10頭成年公牛的體重分別為 500、520、535、560、585、600、480、510、505、 490(kg),求其平均數(shù)。 由于 x=500+520+535+560+58+600+480+510+505+49 =

12、5285, n=10 得: 即10頭種公牛平均體重為528.5 kg。 5285 528.5(kg) 10 x x n ? (二)加權(quán)法 對于樣本含量 n30 以上且已分組的資料,可以在 次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計算平均數(shù),計算公 式為: (3-2) 1 1221 12 1 k ii kki k k i i f x fx f xf xf x x ffff f 式中: 第i組的組中值; 第i組的次數(shù); 分組數(shù) 第i組的次數(shù)fi是權(quán)衡第i組組中值xi在資料中所占比重大小的 數(shù)量,因此將fi 稱為是xi的“權(quán)”,加權(quán)法也由此而得名。 i x i f k 【例1.4】 將100頭長白母豬的仔豬一月

13、窩重(單位:kg) 資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。 表1-1 100頭長白母豬仔豬一月窩重次數(shù)分布表 組別組中值次數(shù)(f)fx 10-15345 20-256150 30-3526910 40-45301350 50-55241320 60-658520 70-753225 合計1004520 利用(3-2)式得: 即這100頭長白母豬仔豬一月齡平均窩重為 45.2kg。 計算若干個來自同一總體的樣本平均數(shù)的平均 數(shù)時,如果樣本含量不等,也應(yīng)采用加權(quán)法計算。 4520 45.2() 100 fx xkg f 【例3.3】 某牛群有黑白花奶牛 1500頭,其平均 體重為750 kg

14、 ,而另一牛群有黑白花奶牛1200頭,平 均體重為725 kg,如果將這兩個牛群混合在一起,其 混合后平均體重為多少? 此例兩個牛群所包含的牛的頭數(shù)不等,要計算兩 個牛群混合后的平均體重,應(yīng)以兩個牛群牛的頭數(shù)為 權(quán),求兩個牛群平均體重的加權(quán)平均數(shù),即 750 1500725 1200 738.89() 2700 fx xkg f 即兩個牛群混合后平均體重為738.89 kg。 ? (三)平均數(shù)的基本性質(zhì) 1、樣本各觀測值與平均數(shù)之差的和為零,即離均差之 和等于零。 或簡寫成 1 ()0 n i i xx ()0 i xx 2、樣本各觀測值與平均數(shù)之差的平方和為最小,即離均差平方 和為最小。 或

15、簡寫為: 對于總體而言,通常用表示總體平均數(shù),有限總體的平均數(shù)為: (3-3) 式中,N表示總體所包含的個體數(shù)。 1 N i i xN 22 11 ()() () nn ii ii xxxx 22 ()()xxx 當(dāng)一個統(tǒng)計量的數(shù)學(xué)期望等于所估計的總體參 數(shù)時,則稱此統(tǒng)計量為該總體參數(shù)的無偏估計量。 統(tǒng)計學(xué)中常用樣本平均數(shù)( )作為總體平均 數(shù)()的估計量,并已證明樣本平均數(shù)是總體平 均數(shù)的無偏估計量。 x 將資料內(nèi)所有觀測值從小到大依次排列,位于中 間的那個觀測值,稱為中位數(shù),記為Md。 當(dāng)觀測值的個數(shù)是偶數(shù)時,則以中間兩個觀測值 的平均數(shù)作為中位數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分 布時,中位數(shù)

16、的代表性優(yōu)于算術(shù)平均數(shù)。 中位數(shù)的計算方法因資料是否分組而有所不同。 3.2 中位數(shù) (一)未分組資料中位數(shù)的計算方法 對于未分組資料,先將各觀測值由小到大依次 排列。 1、當(dāng)觀測值個數(shù)n為奇數(shù)時,(n+1)/2位置的觀測值, 即x(n+1)/2為中位數(shù): 2、當(dāng)觀測值個數(shù)為 偶 數(shù) 時 ,n/2和(n/2+1)位置的 兩個觀測值之和的1/2為中位數(shù),即: (3-4) (1)/2dn Mx /2( /2 1) 2 nn d xx M 【例3.4】 觀察得9只西農(nóng)莎能奶山羊的妊娠天數(shù)為 144 、 145、 147、 149、150、151、153、156、157, 求其中位數(shù)。 此例 n=9,

17、為奇數(shù),則: Md= =150(天) 即西農(nóng)莎能奶山羊妊娠天數(shù)的中位數(shù)為150天。 (1)/2(9 1)/25n xxx 【例3.5】 某犬場發(fā)生犬瘟熱,觀察得10只仔犬發(fā)現(xiàn)癥狀到死亡分別 為7、8、8、9、11、12、12、13、14、14天,求其中位數(shù)。 此例n=10,為偶數(shù),則: (天) 即10只仔犬從發(fā)現(xiàn)癥狀到死亡天數(shù)的中位數(shù)為11.5天。 /2( /2 1) 56 11 12 11.5 222 nn d xx xx M (二)已分組資料中位數(shù)的計算方法 若資料已分組,編制成次數(shù)分布表,則可利用次數(shù)分布表來計算中位數(shù), 其計算公式為: (3-5) 式中:L 中位數(shù)所在組的下限; i 組

18、距; f 中位數(shù)所在組的次數(shù); n 總次數(shù); c 小于中數(shù)所在組的累加次數(shù)。 () 2 d in MLc f 【例3.6】某奶牛場68頭健康母牛從分娩到第一次發(fā) 情間隔時間 整理成次數(shù)分布表如表 3-2 所示,求中位數(shù)。 表3-2 68頭母牛從分娩到第一次發(fā)情間隔時間次數(shù)分布表 由表3-2可見:i=15,n=68,因而中位數(shù)只能在累 加頭數(shù)為36所對應(yīng)的“57-71”這一組,于是可確定 L=57,f=20,c=16,代入公式(3-5)得: (天) 即奶牛頭胎分娩到第一次發(fā)情間隔時間的中位數(shù)為 70.5天。 15 68 ()57(16)70.5 2202 d in MLc f 3.3 幾何平均數(shù)

19、 n 個觀測值相乘之積開 n 次方所得的方根,稱為幾何平均 數(shù),記為G。它主要應(yīng)用于動態(tài)分析,疾病及藥物效價的統(tǒng) 計分析 。 如養(yǎng)殖的增長率,抗體的滴度,藥物的效價,疾 病的潛伏期等,用幾何平均數(shù)比用算術(shù)平均數(shù)更能代表其平 均水平。其計算公式如下: (3-6) 1 123123 () nn nn Gx x xxx x xx 為了計算方便,可將各觀測值取對數(shù)后相加除以n,得 lgG,再求lgG的反對數(shù),即得G值,即 (3-7) 1 12 1 lg (lglglg) n Gxxx n 表3-3 某波爾山羊群各年度存欄數(shù)與增長率 【例3.7】 某波爾山羊群1997-2000年各年度的 存欄數(shù)見表3-

20、3,試求其年平均增長率。 利用(3-7)式求年平均增長率 G= =lg-1(-0.368-0.3980.602) =lg-1(-0.456)=0.3501 即年平均增長率為0.3501或35.01%。 1 12 1 lg (lglglg) n xxx n 3.4 眾 數(shù) 資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組 的組中值,稱為眾數(shù),記為M0。 如表2-3 所列 的 50枚受精種蛋出雛天數(shù)次數(shù)分布 中,以22出現(xiàn)的次數(shù)最多,則該資料的眾數(shù)為22天。 又如 【例3.6】 所 列 出 的 次數(shù)分布表中,57-71 這一組次數(shù)最多,其組中值為64天,則該資料的眾數(shù) 為64天。 3.5 調(diào)和平均數(shù)

21、資料中各觀測值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),稱為調(diào)和平均數(shù),記 為H,即 (3-8) 調(diào)和平均數(shù)主要用于反映畜群不同階段的平均增長率或畜群不同 規(guī)模的平均規(guī)模。 12 111111 11 () n nxxxnx H 【例3.8】 某保種牛群不同世代牛群保種的規(guī)模分別為:0世 代200頭,1世代220頭,2世代210頭; 3世代190頭,4世代210 頭,試求其平均規(guī)模。 利用(3-9)式求平均規(guī)模: 208.33 (頭) 即保種群平均規(guī)模為208.33頭。 1111111 5 2002202101902105 111 ()(0.024 )0.0048 H 對于同一資料: 算術(shù)平均數(shù)幾何平均數(shù)調(diào)和平均

22、數(shù) 上述五種平均數(shù),最常用的是算術(shù)平均數(shù)。 4. 標(biāo)準(zhǔn)差 4.1 標(biāo)準(zhǔn)差的意義 用平均數(shù)作為樣本的代表,其代表性的強 弱受樣本資料中各觀測值變異程度的影響。 僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是 不全面的,還需引入一個表示資料中觀測值 變異程度大小的統(tǒng)計量。 全距(極差)是表示資料中各觀測值變異程度 大小最簡便的統(tǒng)計量。但是全距只利用了資料中的 最大值和最小值,并不能準(zhǔn)確表達(dá)資料中各觀測值 的變異程度,比較粗略。當(dāng)資料很多而又要迅速對 資料的變異程度作出判斷時,可以利用全距這個統(tǒng) 計量。 為 了 準(zhǔn) 確 地 表示樣本內(nèi)各個觀測值的變異程 度 ,人們 首 先會考慮到以平均數(shù)為標(biāo)準(zhǔn),求出各 個觀

23、測值與平均數(shù)的離差,( ),稱為離均差。 雖然離均差能表示一個觀測值偏離平均數(shù)的性質(zhì) 和程度,但因為離均差有正、有負(fù) ,離均差之和為 零,即( )= 0 ,因而不能用離均差之和 來表示資料中所有觀測值的總偏離程度。 ()xx xx xx 為了解決離均差有正、有負(fù),離均差之和為零 的問 題,可先求離均差的絕對值并將各離均差絕對 值之和 除以觀測值個數(shù)n 求得平均絕對離差,即 雖然平均絕對離差可以表示資料中各觀測值的 變異程度,但由于平均絕對離差包含絕對值符號, 使用很不方便,在統(tǒng)計學(xué)中未被采用。 nxx/ 我們還可以采用將離均差平方的辦法來解決離均 差有正、有負(fù),離均差之和為零的問題。 先將各個

24、離均差平方,即 ,再求離均差平 方和,即 ,簡稱平方和,記為SS; 由于離差 平方和常隨樣本大小而改變,為了消除樣 本大小的影 響,用平方和除以樣本大小,即 ,求出離均差平方和的平均數(shù); 2 () /xxn 2 ()xx 2 ()xx 為了使所得的統(tǒng)計量是相應(yīng)總體參數(shù)的無偏估計量,統(tǒng)計 學(xué)證明,在求離均差平方和的平均數(shù)時,分母不用樣本含量 n,而用自由度 n-1, 于是,我們采用統(tǒng)計量 表 示資料的變異程度。 統(tǒng)計量 稱為均方(mean square縮寫為MS), 又稱樣本方差,記為S2,即 S2= (3-9) 2 () /1xxn 2 () /1x xn 2 () /1xxn 相應(yīng)的總體參數(shù)

25、叫總體方差 ,記為2。對于有 限總體而言,2的計算公式為: (3-10) 22 () /x xN 由于 樣本方差 帶有原觀測單位的 平方單位,在 僅表示一個資料中各觀測值的變異程度而不作其 它分析時,常需要與平均數(shù)配合使用,這 時應(yīng) 將 平方單位還原,即應(yīng)求出樣本方差的平方根。統(tǒng) 計學(xué)上把樣本方差 S2 的平方根叫做樣本標(biāo)準(zhǔn)差, 記為S,即: (3-11) 2 () 1 xx S n 由于 所以(3-11)式可改寫為: (3-12) 2 22 ()(2)xxxxxx 22 2xxxnx 2 22 () 2() xx xn nn 2 2 ()x x n 2 () 2 1 x n x S n 相應(yīng)

26、的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為相應(yīng)的總體參數(shù)叫總體標(biāo)準(zhǔn)差,記為。對于有限總體。對于有限總體 而言,而言,的計算公式為:的計算公式為: (3-13) 在統(tǒng)計學(xué)中,常用樣本標(biāo)準(zhǔn)差在統(tǒng)計學(xué)中,常用樣本標(biāo)準(zhǔn)差S估計總體標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差。 2 () /xN 4.2 標(biāo)準(zhǔn)差的計算方法 (一)直接法 對于未分組或小樣本資料,可直接利用(3-11) 或(3-12)式來計算標(biāo)準(zhǔn)差。 【 例3.9】計算10只遼寧絨山羊產(chǎn)絨量:450, 450, 500,500,500,550,550,550,600,600,650(g) 的標(biāo)準(zhǔn)差。 此例n=10,經(jīng)計算得:x=5400,x2=2955000, 代入(3-12)式得: (g) 即10只遼寧絨山羊產(chǎn)絨量的 標(biāo)準(zhǔn)差 為65.828g。 22 2 () / 29550005400 /10 65.828 110 1 xxn S n (二)加權(quán)法 對于已制成次數(shù)分布表的大樣本資料,可利用次數(shù)分布表, 采用加權(quán)法計算標(biāo)準(zhǔn)差。計算公式為: (3-14) 式中,f為各組次數(shù);x為各組的組中值;f = n為總次數(shù)。 222 ()() / 11 f xxfxfxf S ff 【例3.10】 利用某純系蛋雞200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論