平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù).ppt_第1頁(yè)
平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù).ppt_第2頁(yè)
平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù).ppt_第3頁(yè)
平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù).ppt_第4頁(yè)
平均數(shù)、標(biāo)準(zhǔn)差和變異系數(shù).ppt_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

,在數(shù)理統(tǒng)計(jì)中,平均數(shù)是用來(lái)反映一組變數(shù)的集中趨勢(shì),即變數(shù)分布的中心位置。常用的度量指標(biāo)有:,1. 算術(shù)平均數(shù) 2. 中位數(shù)(M) 4. 幾何平均數(shù)(Mg) 3. 眾數(shù)(Mo) 5. 調(diào)和平均數(shù)(H),3.1 平均數(shù):,第三章 平均數(shù)、標(biāo)準(zhǔn)差 與變異系數(shù),作為一個(gè)資料的代表,指資料中各變數(shù)集中 較多的中心位置,用來(lái)與另一資料相比較。 不同的平均數(shù)適合于不同的數(shù)據(jù)資料。,例如:不同國(guó)家、地區(qū)、種族之間身高、體重等 的比較;不同品種的家畜、家禽之間生產(chǎn) 性能的比較,集中趨勢(shì)的度量,平均數(shù)的意義,3.1.1 算術(shù)平均數(shù),一、定義 一組資料中,所有觀測(cè)值的總和除以其個(gè)數(shù)所得到的商,稱為算術(shù)平均數(shù),簡(jiǎn)稱平均數(shù)或均數(shù)。 是最常用的一種集中趨勢(shì)度量指標(biāo)。 樣本的平均數(shù)記為 總體平均數(shù)記為,集中趨勢(shì)的度量,:第i個(gè)觀察值或變數(shù) n:觀察值或變數(shù)的個(gè)數(shù) :求和符號(hào)(sigma),二、計(jì)算公式:,集中趨勢(shì)的度量,(一)離均差之和為零: 一個(gè)樣本觀察值與平均數(shù)之差簡(jiǎn)稱離均差。,(xi- ) =(x1- )+(x2- )+(xn- ) = x1+x2+xn+n = xi- nxi/n = 0,三、算術(shù)平均數(shù)的性質(zhì),集中趨勢(shì)的度量,(二)離均差平方和最小: 一個(gè)樣本的各個(gè)觀察值與平均數(shù)之差的平方和比各個(gè)觀察值與任意其他數(shù)之差的平方和小。,所以:平均數(shù)是與各個(gè)觀察值最接近的數(shù)值。 平均數(shù)代表這個(gè)樣本的集中趨勢(shì)。,集中趨勢(shì)的度量,三、算術(shù)平均數(shù)的性質(zhì),樣本平均數(shù)常作為檢驗(yàn)對(duì)象的原因,1、離均差的平方和( - )2最小。說(shuō)明樣本平均數(shù)與樣本各個(gè)觀測(cè)值最接近,平均數(shù)是資料的代表數(shù)。 2、樣本平均數(shù)是總體平均數(shù)的無(wú)偏估計(jì)值,即E( )=。 3、根據(jù)統(tǒng)計(jì)學(xué)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布。,定義:將n個(gè)觀察值從小到大依次排隊(duì),位于中間的那個(gè)觀察值稱為中位數(shù)。,3.1.2 中位數(shù)(Md),集中趨勢(shì)的度量,對(duì)于頻數(shù)分布的資料,公式如下:,Lmd:中位數(shù)所在組的組下限; fm:中位數(shù)所在組的頻數(shù); C:從第一組到中位數(shù)所在組前一組的累計(jì)頻數(shù) n:樣本含量; i:組距;,集中趨勢(shì)的度量,3.1.2 中位數(shù)(Md),定義:n個(gè)非負(fù)數(shù)的乘積開(kāi)n次方的根稱為幾何平均 數(shù),用 G 表示。,3.1.3 幾何平均數(shù),集中趨勢(shì)的度量,為了計(jì)算方便,各變數(shù)先取對(duì)數(shù),再相加除以n,即為logG,再求其反對(duì)數(shù),即為G值。,集中趨勢(shì)的度量,3.1.3 幾何平均數(shù),幾何平均數(shù)用于以百分率、比例表示的數(shù)據(jù)資料,如:增長(zhǎng)率、利率、藥物效價(jià)、抗體滴度等。 能夠消弱數(shù)據(jù)中個(gè)別過(guò)分偏大值的影響。,定義:在資料中某一個(gè)變數(shù)出現(xiàn)次數(shù)最多,就稱 之為眾數(shù)。 1. 離散性資料:出現(xiàn)頻數(shù)最多的數(shù)。 2. 連續(xù)性資料:頻數(shù)分布表中,頻數(shù)出現(xiàn)最多的 一組的組中值。,!有的資料可出現(xiàn)多個(gè)眾數(shù),即多個(gè)數(shù)具有相同的最高頻數(shù);有的資料沒(méi)有眾數(shù),即所有數(shù)出現(xiàn)的頻數(shù)都相同。,集中趨勢(shì)的度量,3.1.4 眾數(shù),定義:各觀察值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),3.1.5 調(diào)和平均數(shù),集中趨勢(shì)的度量,適用于極端右偏態(tài),3.1.5 調(diào)和平均數(shù),集中趨勢(shì)的度量,例:用某藥物救治12只中毒的小鼠,它們的存活天數(shù)記錄如下:8、8、8、10、10、7、13、10、9、14,另有兩只一直未死亡,求平均存活天數(shù)。,由于數(shù)據(jù)極端右偏態(tài),用調(diào)和平均數(shù)較為合理。,1,15,2.2.3 百分位數(shù)(百分位點(diǎn)),指將一組 n 個(gè)數(shù)據(jù)由小到大排列,如果小于 某數(shù)值的數(shù)據(jù)個(gè)數(shù)為全體數(shù)據(jù)個(gè)數(shù)的x%,則稱該數(shù)為第 x 百分位數(shù)或 x% 分位數(shù)。 25%分位數(shù)或下四分位數(shù):0.25n個(gè)數(shù)的后一個(gè)數(shù)。 50%分位數(shù)或中位數(shù):0. 5n個(gè)數(shù)的后一個(gè)數(shù)。 75%分位數(shù)或上四分位數(shù):0.75n個(gè)數(shù)的后一個(gè)數(shù)。,適用于非參數(shù)檢驗(yàn),如卡方檢驗(yàn)。,4、幾何平均數(shù)和調(diào)和平均數(shù) 適用于右偏態(tài)分布。,集中趨勢(shì)的度量,3、中位數(shù),平均數(shù)的代表程度與樣本的變異程度有關(guān) 一個(gè)樣本內(nèi)有很多的變數(shù),用平均數(shù)作為樣本的代表,其代表程度決定于樣本內(nèi)各個(gè)變數(shù)的變異程度。,3.2標(biāo)準(zhǔn)差,離散趨勢(shì)的度量,即使兩個(gè)樣本的平均數(shù)相同,但是樣本內(nèi)變數(shù)的變異程度不一定相同。,離散趨勢(shì)的度量,3.2標(biāo)準(zhǔn)差,1.如果各個(gè)變數(shù)相同或者變異程度比較小,則平 均數(shù)能夠代表整個(gè)樣本。 2.如果各個(gè)變數(shù)的變異程度比較大,則平均數(shù)的代 表性就小。,離散趨勢(shì)的度量,3.2標(biāo)準(zhǔn)差,定義:全部變數(shù)的最大值與最小值之差 R= Max(x) -Min(x),3.2 范圍(全距),范圍或全距可以反映變異程度的一部分,但是不能代表樣本內(nèi)各變數(shù)之間的變異程度。 目前,被廣泛使用的是以標(biāo)準(zhǔn)差來(lái)度量變異程度。,離散趨勢(shì)的度量,如果一個(gè)樣本有n個(gè)觀察值 x1,x2 xn,設(shè)其算術(shù)平均數(shù)為 ,則該樣本的標(biāo)準(zhǔn)差為:,標(biāo)準(zhǔn)差考慮了每個(gè)變數(shù)與平均數(shù)的離差。 每個(gè)變數(shù)與平均數(shù)相差愈小,樣本變異程度愈小,反之,愈大。 因此,標(biāo)準(zhǔn)差是離散程度的度量,3.2.1 標(biāo)準(zhǔn)差的定義,離散趨勢(shì)的度量,1.離均差=(x- ) 2.離均差之和= (x- )=0 3.離均差平方和 SS= (x- )2,離散趨勢(shì)的度量,3.2.2 標(biāo)準(zhǔn)差公式的來(lái)源,3.2.3 樣本方差和樣本標(biāo)準(zhǔn)差,離散趨勢(shì)的度量,總體是未知的,用樣本標(biāo)準(zhǔn)差估計(jì)和推斷總體標(biāo)準(zhǔn)差,離散趨勢(shì)的度量,3.2.4 總體方差和樣本標(biāo)準(zhǔn)差,如果一個(gè)樣本含有n個(gè)變數(shù),從理論上講,n個(gè)變數(shù)都同樣用以計(jì)算標(biāo)準(zhǔn)差,n個(gè)變數(shù)與平均數(shù)相減有n個(gè)離均差。 表面上雖有n個(gè)比較,但實(shí)質(zhì)上僅有n-1個(gè)可以自由變動(dòng),最后一個(gè)離均差受到離均差之和這個(gè)條件的限制,所以不能自由。,3.2.5 自由度: df,n-1,例如:有3個(gè)變數(shù),平均數(shù)等于5。 問(wèn)著三個(gè)變數(shù)可能是多少?,離散趨勢(shì)的度量,3.2.5 自由度:,(4、5、6)(2、4、9)(3、5、7) 他們的共同特點(diǎn):前兩個(gè)數(shù)可以自由選擇,為了使平均數(shù)等于5,第三個(gè)數(shù)不用選就確定了。這時(shí)(31)2就是所謂自由度。,自由度: 消除限制性因數(shù)后,所剩余的獨(dú)立變數(shù)的個(gè)數(shù),用df表示。,三、方差和標(biāo)準(zhǔn)差的計(jì)算公式,離散趨勢(shì)的度量,1. 直接法,2. 加權(quán)法,3.2.6 標(biāo)準(zhǔn)差的性質(zhì),標(biāo)準(zhǔn)差的大小,受資料中每個(gè)觀測(cè)值的影響,如觀測(cè)值間變異大,求得的標(biāo)準(zhǔn)差也大,反之則小。 在計(jì)算標(biāo)準(zhǔn)差時(shí),在各觀測(cè)值加上或減去一個(gè)常數(shù),其數(shù)值不變。 當(dāng)每個(gè)觀測(cè)值乘以或除以一個(gè)常數(shù)a,則所得的標(biāo)準(zhǔn)差是原來(lái)標(biāo)準(zhǔn)差的a倍或1/a倍。,3.2.6 標(biāo)準(zhǔn)差的性質(zhì),在資料服從正態(tài)分布的條件下: 平均數(shù)左右一倍標(biāo)準(zhǔn)差( S)范圍: 約有68.26%的觀測(cè)值; 平均數(shù)左右兩倍標(biāo)準(zhǔn)差( 2S

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論