




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
作為一個資料的代表,指資料中各變數集中較多的中心位置,用來與另一資料相比較。不同的平均數適合于不同的數據資料。例如:不同國家、地區(qū)、種族之間身高、體重等的比較;不同品種的家畜、家禽之間生產性能的比較集中趨勢的度量平均數的意義第一頁,共四十三頁,2022年,8月28日3.1.1算術平均數一、定義
一組資料中,所有觀測值的總和除以其個數所得到的商,稱為算術平均數,簡稱平均數或均數。
是最常用的一種集中趨勢度量指標。
樣本的平均數記為
總體平均數記為
集中趨勢的度量第二頁,共四十三頁,2022年,8月28日:第i個觀察值或變數n:觀察值或變數的個數∑:求和符號(sigma)計算公式:集中趨勢的度量3.5.1算術平均數第三頁,共四十三頁,2022年,8月28日Σ的性質第四頁,共四十三頁,2022年,8月28日例2.1:5頭豬的體重分別為70、72、80、83、88kg,問5頭豬的算術平均數是多少?
從計算結果看5頭豬都距78.6(kg)不遠,所以平均數是數量資料的代表值。
上述計算方法稱為直接法,適用于樣本小,即資料內包含變數個數不多,一般在30個變數以下未經分組的資料。集中趨勢的度量一、直接法第五頁,共四十三頁,2022年,8月28日1.分類資料:每個類別在某個指標上取相同的值。2.計數資料和連續(xù)性資料:頻率分布表
加權法,即計算時先將各個變數乘上它的權數,再經過總和,然后除以權數的總合,稱為加權平均數。集中趨勢的度量二、加權法第六頁,共四十三頁,2022年,8月28日
xi=變數值
fi=變數值xi出現的頻數計算公式:集中趨勢的度量二、加權法第七頁,共四十三頁,2022年,8月28日例:一個有1000個個體的群體,等位基因A的頻率為0.6,另一個400個個體的群體,等位基因A的頻率為0.3,這兩個群體的混合在一起,整個混合群體的等位基因A的頻率為:集中趨勢的度量二、加權法第八頁,共四十三頁,2022年,8月28日例:200頭大白豬的仔豬的一月窩重的資料組別組中值頻數(f)fx8-16-24-32-40-48-56-64-72-80-88-96-104-112-122028364452606876849210010811646910131726352821168434812025236057288415602380212817641472800432348總合20013120集中趨勢的度量二、加權法第九頁,共四十三頁,2022年,8月28日xi=組中值fi=組中值出現的頻數集中趨勢的度量二、加權法第十頁,共四十三頁,2022年,8月28日(一)離均差之和為零:一個樣本觀察值與平均數之差簡稱離均差?!疲▁i-)=(x1-)+(x2-)+……+(xn-)=x1+x2+……+xn+n?=∑xi-n?∑xi/n=0三、算術平均數的性質集中趨勢的度量第十一頁,共四十三頁,2022年,8月28日(二)離均差平方和最?。阂粋€樣本的各個觀察值與平均數之差的平方和比各個觀察值與任意其他數之差的平方和小。所以:平均數是與各個觀察值最接近的數值。所以:平均數代表這個樣本的集中趨勢。集中趨勢的度量三、算術平均數的性質第十二頁,共四十三頁,2022年,8月28日定義:將n個觀察值從小到大依次排隊,位于中間的那個觀察值稱為中位數。3.1.2中位數(Md)集中趨勢的度量第十三頁,共四十三頁,2022年,8月28日例:2.5現有一窩仔豬的出生重資料為:1.4,1.0,1.3,1.2,1.6kg,試求其中位數。解:首先排序:1.0,1.2,1.3,1.4,1.6;
(n+1)/2=(5+1)/2=3;Md=X3=1.3如果增加一頭仔豬,出生重為1.8kg,計算中位數:n/2=6/2=3(n/2)+1=3+1=4;Md=(X3+X4)/2=(1.3+1.4)/2=1.35集中趨勢的度量3.1.2中位數(Md)第十四頁,共四十三頁,2022年,8月28日對于頻數分布的資料,公式如下:Lmd:中位數所在組的組下限;fm:中位數所在組的頻數;C:從第一組到中位數所在組前一組的累計頻數n:樣本含量;
i:組距;例:表2-5集中趨勢的度量3.1.2中位數(Md)第十五頁,共四十三頁,2022年,8月28日集中趨勢的度量3.1.2中位數(Md)第十六頁,共四十三頁,2022年,8月28日定義:n個非負數的乘積開n次方的根稱為幾何平均數,用G表示。3.1.3幾何平均數集中趨勢的度量第十七頁,共四十三頁,2022年,8月28日為了計算方便,各變數先取對數,再相加除以n,即為logG,再求其反對數,即為G值。集中趨勢的度量3.1.3幾何平均數幾何平均數用于以百分率、比例表示的數據資料,如:增長率、利率、藥物效價、抗體滴度等。能夠消弱數據中個別過分偏大值的影響。第十八頁,共四十三頁,2022年,8月28日例:某奶牛場在1995年有100頭奶牛,已知在1996、1997、1998年的奶牛頭數分別為前一年的2,3和4.5倍,求其年平均增加率。?1998年的奶牛頭數為:100×2×3×4.5=2700頭或者100×33=2700頭集中趨勢的度量3.1.3幾何平均數第十九頁,共四十三頁,2022年,8月28日定義:在資料中某一個變數出現次數最多,就稱之為眾數。1.離散性資料:出現頻數最多的數。2.連續(xù)性資料:頻數分布表中,頻數出現最多的一組的組中值。?。∮械馁Y料可出現多個眾數,即多個數具有相同的最高頻數;有的資料沒有眾數,即所有數出現的頻數都相同。集中趨勢的度量3.1.4眾數第二十頁,共四十三頁,2022年,8月28日定義:各觀察值倒數的算術平均數的倒數3.1.5調和平均數簡單調和平均數集中趨勢的度量適用于極端右偏態(tài)第二十一頁,共四十三頁,2022年,8月28日3.1.5調和平均數集中趨勢的度量例:用某藥物救治12只中毒的小鼠,它們的存活天數記錄如下:8、8、8、10、10、7、13、10、9、14,另有兩只一直未死亡,求平均存活天數。由于數據極端右偏態(tài),用調和平均數較為合理。第二十二頁,共四十三頁,2022年,8月28日復習連續(xù)性資料分組方法集中趨勢(平均數)有哪幾種表示方式?算術平均數的性質第二十三頁,共四十三頁,2022年,8月28日2.2.3百分位數(百分位點)指將一組n個數據由小到大排列,如果小于某數值的數據個數為全體數據個數的x%,則稱該數為第x百分位數或x%分位數。
25%分位數或下四分位數:0.25n個數的后一個數。
50%分位數或中位數:0.5n個數的后一個數。
75%分位數或上四分位數:0.75n個數的后一個數。24第二十四頁,共四十三頁,2022年,8月28日一、各個集中趨勢度量指標之間的關系1.在完全對稱分布情況下,算數平均數、中位數和眾數三者相等。集中趨勢的度量第二十五頁,共四十三頁,2022年,8月28日
適用于正態(tài)分布資料。家畜的大多數數量性狀都是正態(tài)分布,因此算術平均數是最常用的,也是最重要的。集中趨勢的度量2、算術平均數但是當分布不對稱時,呈偏態(tài)時,用算術平均數則難以表示資料的集中趨勢。第二十六頁,共四十三頁,2022年,8月28日適用于非參數檢驗,如卡方檢驗。4、幾何平均數和調和平均數適用于右偏態(tài)分布。偏態(tài):是指大部分數值落在平均數的哪一邊,若分配較多的集中在低數值的方面視為正偏態(tài),或稱為右偏態(tài)集中趨勢的度量3、中位數第二十七頁,共四十三頁,2022年,8月28日平均數的代表程度與樣本的變異程度有關一個樣本內有很多的變數,用平均數作為樣本的代表,其代表程度決定于樣本內各個變數的變異程度。3.2標準差離散趨勢的度量第二十八頁,共四十三頁,2022年,8月28日即使兩個樣本的平均數相同,但是樣本內變數的變異程度不一定相同。產仔數總和甲8,4,16,12,22,17,6,14,6,511011乙14,8,11,9,11,12,10,14,13,811011離散趨勢的度量3.2標準差第二十九頁,共四十三頁,2022年,8月28日甲的變異程度大于乙甲的平均數的代表性小于乙的平均數所以,應該測定其變異程度離散趨勢的度量?甲、乙兩品種的平均產仔數相同,都是11頭。
從平均數來看,兩個品種沒有差異。從以上統(tǒng)計結果可知:?進一步觀察各個變數,二者變異程度并不相同。
甲:最小為4,最大為22;乙:最小為8,最大為14第三十頁,共四十三頁,2022年,8月28日1.如果各個變數相同或者變異程度比較小,則平均數能夠代表整個樣本。2.如果各個變數的變異程度比較大,則平均數的代表性就小。離散趨勢的度量
因此,單靠平均數不能全面、正確地了解樣本。也不能了解平均數作為樣本的變異程度。3.2標準差第三十一頁,共四十三頁,2022年,8月28日定義:全部變數的最大值與最小值之差
R=Max(x)-Min(x)3.2范圍(全距)范圍或全距可以反映變異程度的一部分,但是不能代表樣本內各變數之間的變異程度。
目前,被廣泛使用的是以標準差來度量變異程度。離散趨勢的度量第三十二頁,共四十三頁,2022年,8月28日如果一個樣本有n個觀察值x1,x2……
xn,設其算術平均數為,則該樣本的標準差為:標準差考慮了每個變數與平均數的離差。每個變數與平均數相差愈小,樣本變異程度愈小,反之,愈大。因此,標準差是離散程度的度量3.2.1標準差的定義離散趨勢的度量第三十三頁,共四十三頁,2022年,8月28日1.離均差=(x-)2.離均差之和=∑(x-)=03.離均差平方和SS=∑(x-)2為了合理地計算平均差異,用平方和的辦法來消除離均差的正負號,離均差平方相加,得到平方和(SS),但是由于不同樣本的觀察值個數不同,所以離均差平方和也不是理想指標離散趨勢的度量雖然離均差可以衡量變異程度,但是離均差之和為0,所以不是理想的指標3.2.2標準差公式的來源第三十四頁,共四十三頁,2022年,8月28日3.2.3樣本方差和樣本標準差將離均差平方和求平均數,稱為樣本方差,目的是消除觀察值個數的影響樣本方差開方,目的是使變異還原,即標準差。離散趨勢的度量第三十五頁,共四十三頁,2022年,8月28日總體是未知的,用樣本標準差估計和推斷總體標準差離散趨勢的度量3.2.4總體方差和樣本標準差第三十六頁,共四十三頁,2022年,8月28日如果一個樣本含有n個變數,從理論上講,n個變數都同樣用以計算標準差,n個變數與平均數相減有n個離均差。表面上雖有n個比較,但實質上僅有n-1個可以自由變動,最后一個離均差受到離均差之和這個條件的限制,所以不能自由。3.2.5自由度:
df,n-1第三十七頁,共四十三頁,2022年,8月28日例如:有3個變數,平均數等于5。問著三個變數可能是多少?離散趨勢的度量3.2.5自由度:(4、5、6)(2、4、9)(3、5、7)……他們的共同特點:前兩個數可以自由選擇,為了使平均數等于5,第三個數不用選就確定了。這時(3-1)=2就是所謂自由度。自由度:消除限制性因數后,所剩余的獨立變數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 心理定價策略在教育游戲化中的應用
- 2024-2025學年度江西應用工程職業(yè)學院單招《職業(yè)適應性測試》測試卷含完整答案詳解【易錯題】
- 中衛(wèi)市技工學校招聘真題
- 2024-2025學年湖南食品藥品職業(yè)學院單招《物理》過關檢測試卷【全優(yōu)】附答案詳解
- 江西信息應用職業(yè)技術學院單招《語文》通關考試題庫及參考答案詳解【預熱題】
- 新人教版2025年期末考試七年級下冊歷史試卷
- 關于4S店2025年績效考核辦法的通知
- 寫字樓產品培訓
- 2025年春節(jié)感想作文十篇
- 中煙機械技術中心招聘考試真題2024
- 2025高考全國一卷語文真題
- 2022年人教版二年級數學(下冊)期末試卷及答案(匯編)
- JIS G3125-2021 高級耐大氣腐蝕軋制鋼材
- (完整版)學生課堂學習自我評價表
- 梁俊嬌稅收籌劃課后思考題
- DTLDTC帶式輸送機工藝流程圖
- 熒光綠送貨單樣本excel模板
- 有機化學概述
- 復盛零件手冊
- 內外墻抹灰施工承包合同
- 《急救藥品》PPT課件.ppt
評論
0/150
提交評論