《統(tǒng)計(jì)學(xué)》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第1頁(yè)
《統(tǒng)計(jì)學(xué)》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第2頁(yè)
《統(tǒng)計(jì)學(xué)》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第3頁(yè)
《統(tǒng)計(jì)學(xué)》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第4頁(yè)
《統(tǒng)計(jì)學(xué)》第二版課件曾五一第3章數(shù)據(jù)分布特征描述(全套課件齊)_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章

數(shù)據(jù)分布特征描述統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定統(tǒng)計(jì)變量離散程度的測(cè)定變量分布偏度與峰度的描述第一節(jié)

統(tǒng)計(jì)變量集中趨勢(shì)的測(cè)定測(cè)定集中趨勢(shì)的意義位置代表值數(shù)值平均數(shù)一、測(cè)定集中趨勢(shì)的意義測(cè)定集中趨勢(shì)的指標(biāo)有:位置代表值和數(shù)值平均數(shù)。

位置代表值:在總體中將變量值按順序排列后得到的數(shù)列中某個(gè)特殊位置的值。常用的反應(yīng)集中趨勢(shì)的位置代表值有眾數(shù)、中位數(shù)等。

數(shù)值平均數(shù)就是均值,它是對(duì)總體中的所有數(shù)據(jù)計(jì)算平均值,用以反映所有數(shù)據(jù)的一般水平。由于計(jì)算方法不同,數(shù)值平均數(shù)有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)和冪平均數(shù)。測(cè)定集中趨勢(shì)的作用1、反映總體各單位變量分布的集中趨勢(shì)和一般水平。

2、比較同類現(xiàn)象在不同單位的發(fā)展水平。3、比較同類現(xiàn)象在不同時(shí)期的發(fā)展變化趨勢(shì)或規(guī)律。

4、分析現(xiàn)象之間的依存關(guān)系。二、位置代表值(一)眾數(shù)(Mode)眾數(shù)是總體中出現(xiàn)次數(shù)最多的那個(gè)數(shù)據(jù)值,在頻數(shù)分布中,眾數(shù)指頻數(shù)或頻率最大的標(biāo)志值用

表示。

(a)單眾數(shù)(b)雙眾數(shù)(c)五種無(wú)眾數(shù)的情形圖3-1眾數(shù)示意圖眾數(shù)的確定1.由品質(zhì)數(shù)列和單項(xiàng)式數(shù)量數(shù)列確定眾數(shù)2.由組距數(shù)量數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù),首先應(yīng)當(dāng)確定眾數(shù)組,然后通過(guò)比例插值法計(jì)算眾數(shù)。在等距分組條件下,眾數(shù)組就是次數(shù)最多的那一組;在不等距分組的條件下,眾數(shù)組則是頻數(shù)密度或頻率密度最高的那一組。

fMo

LMOMOUMOfMo-fMo+1fMo-fMo-1

3-2眾數(shù)與相鄰兩組的關(guān)系比例插值法圖示上限公式:

(3.1)下限公式:

(3.2)

MO代表眾數(shù);代表眾數(shù)組的下限;

代表眾數(shù)組的上限;

代表眾數(shù)組的次數(shù);

代表眾數(shù)組前一組的次數(shù);

代表眾數(shù)組后一組的次數(shù);

代表眾數(shù)組的組距。[例3-3]某地區(qū)農(nóng)民收入情況如表3-3,計(jì)算其人均純收入的眾數(shù)。表3-3農(nóng)民家庭年人均純收入情況表按年人均純收入分組(元)農(nóng)民家庭數(shù)(戶)1000~1200240120016001050160020002702000~22002102200~24001202400~260030合

計(jì)3000例3-3(續(xù))或(二)中位數(shù)(Median)

中位數(shù)和眾數(shù)一樣,也是一種位置代表值,但是,它不能用于定類數(shù)據(jù),只能在順序及以上的數(shù)據(jù)中使用,所以又稱為次序統(tǒng)計(jì)量,用Me表示。

中位數(shù)是將總體中的數(shù)據(jù)按順序排列后,處于數(shù)列中點(diǎn)位置上的那個(gè)數(shù)據(jù)值或變量值,或者說(shuō)中位數(shù)是累計(jì)頻率數(shù)列中,累計(jì)頻率為0.50所對(duì)應(yīng)的變量值。

1、由順序數(shù)據(jù)和未分組的數(shù)量數(shù)據(jù)確定中位數(shù)。順序數(shù)據(jù)中位數(shù)的位置:中位數(shù)位置=(3.3)未分組的數(shù)量數(shù)據(jù)中位數(shù)的位置:中位數(shù)位置=(3.4)

(3.5)

(3.6)[例3-4]某高校一次對(duì)食堂伙食滿意度的調(diào)查數(shù)據(jù)如表3-4所示。表3-4調(diào)查數(shù)據(jù)次數(shù)分布回答類別學(xué)生人數(shù)(人)累計(jì)學(xué)生數(shù)(向上累計(jì))非常不滿意240240不滿意10801320一般9302250滿意4502700非常滿意3003000合計(jì)3000—中位數(shù)位置=3000/2=1500從累計(jì)學(xué)生數(shù)看,中位數(shù)在第三組,所以:Me=一般。[例3-5]有8名工人,每人日產(chǎn)零件數(shù)按從底到高的順序排列如下:17、19、20、22、23、23、24、25(件/人)。則

中位數(shù)為22.5件/人,這個(gè)數(shù)字反映了工人總體日產(chǎn)零件數(shù)的一般水平。

2、由單項(xiàng)式分組數(shù)量數(shù)據(jù)確定中位數(shù)單項(xiàng)式數(shù)量數(shù)據(jù)分組已經(jīng)將數(shù)據(jù)順序化,這時(shí)數(shù)據(jù)個(gè)數(shù)即總體單位數(shù)n=∑f,確定中位數(shù)位置的方法要通過(guò)累計(jì)次數(shù)計(jì)算。

3、由組距式分組的數(shù)量數(shù)據(jù)確定中位數(shù)

在假定中位數(shù)組內(nèi)的各數(shù)據(jù)均勻分布的前提下,利用下面的公式計(jì)算中位數(shù)的近似值:下限公式:(3.7)

上限公式:

(3.8)

表示中位數(shù);

表示中位數(shù)所在組的下限;

表示中位數(shù)所在組的上限;

表示向上累計(jì)至中位數(shù)所在組前一組的次數(shù);

表示向下累計(jì)至中位數(shù)所在組后一組的次數(shù);

表示中位數(shù)所在組的次數(shù);

表示中位數(shù)所在組的組距。[例3-7]根據(jù)表3-3數(shù)據(jù)計(jì)算農(nóng)民家庭年人均純收入中位數(shù)表3-6農(nóng)民家庭年人均純收入累計(jì)次數(shù)表按年人均純收入分

(元)農(nóng)民家庭數(shù)(戶)累計(jì)戶數(shù)(戶)(向上累計(jì))累計(jì)戶數(shù)(戶)(向下累計(jì))1000~120024024030001200~140048072027601400~16001050177022801600~1800600237012301800~200027026406302000~220021028503602200~240012029701502400~260030300030合

計(jì)3000——[例3-7]續(xù)計(jì)算表明,這3000戶農(nóng)民家庭年人均純收入的中位數(shù)是1548.57元,也就是說(shuō),人均純收入在1548.57元以上的農(nóng)民家庭有1500戶,在1547.57元以下的也有1500戶。(三)其它分位數(shù)

1.四分位數(shù)(Quartile)

(1)順序數(shù)據(jù)中四分位數(shù)位置的確定。

(i=1,2,3)

(3.9)式中,Qi是第i個(gè)四分位數(shù),n是數(shù)據(jù)個(gè)數(shù)即總體單位數(shù)。[例3-8]利用例3-4的數(shù)據(jù)確定四分位數(shù)。=不滿意

=一般

=滿意(2)未分組和單項(xiàng)式分組的數(shù)量數(shù)據(jù)中四分位數(shù)位置的確定:

(i=1,2,3)

(3.10)第一個(gè)四分位數(shù)的位置:

(3.11)第二個(gè)四分位數(shù)的位置:

(3.12)第三個(gè)四分位數(shù)的位置:

(3.13)(3)組距式分組數(shù)量數(shù)據(jù)中四分位數(shù)位置的確定

(3.14)式中,

表示第i個(gè)分位數(shù)所在組的下限;數(shù)據(jù)個(gè)數(shù),即整體單位數(shù);向上累計(jì)至第i個(gè)分位數(shù)所在組前一組的次數(shù);表示第i個(gè)分位數(shù)所在組的次數(shù);表示第i個(gè)分位數(shù)所在組的組距。2、百分位數(shù)(Percentile)百分位數(shù)是數(shù)據(jù)順序排列后,將數(shù)據(jù)100等分,位于i(i=1,2,…,99)個(gè)等分點(diǎn)位置的數(shù)據(jù)值。

對(duì)第i百分位數(shù),嚴(yán)格的定義如下:

第i百分位數(shù)是這樣一個(gè)值,它使得至少有i%的數(shù)據(jù)項(xiàng)小于或等于這個(gè)值,且至少有(100-i)%的數(shù)據(jù)項(xiàng)大于或等于這個(gè)值。三、數(shù)值平均數(shù)(一)算術(shù)平均數(shù)(均值)

ArithmeticMean(Mean)1.基本形式

(3.15)2.簡(jiǎn)單算術(shù)平均數(shù)(simplearithmeticmean)簡(jiǎn)單算術(shù)平均數(shù)主要用于未分組數(shù)據(jù),計(jì)算公式如下:

(3.16)式中:

代表算術(shù)平均數(shù)xi表各單位標(biāo)志值n

代表總體單位數(shù)。3.加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)計(jì)算公式為:

(3.17)加權(quán)算術(shù)平均數(shù)主要用于數(shù)據(jù)已經(jīng)分組,并編制出次數(shù)分布的條件下。計(jì)算加權(quán)算術(shù)平均數(shù)需要注意的問(wèn)題(1)加權(quán)算術(shù)平均數(shù)的大小受兩個(gè)因素的影響:一是變量值大??;二是各組次數(shù)占總次數(shù)比重即頻率的影響。(2)在分組數(shù)列的條件下,當(dāng)各組標(biāo)志值出現(xiàn)的次數(shù)或各組次數(shù)所占比重均相等時(shí),權(quán)數(shù)就失去了權(quán)衡輕重的作用,這時(shí)用加權(quán)算術(shù)平均數(shù)計(jì)算的結(jié)果與用簡(jiǎn)單算術(shù)平均數(shù)計(jì)算的結(jié)果相同,因此可以把簡(jiǎn)單算術(shù)平均數(shù)理解為加權(quán)算術(shù)平均數(shù)當(dāng)f1=f2=…=fn時(shí)的特例。(3)關(guān)于加權(quán)算術(shù)平均數(shù)的權(quán)數(shù)選擇原則:各組標(biāo)志值×各組單位數(shù)=各組標(biāo)志總量.4、是非標(biāo)志的平均數(shù)通過(guò)給品質(zhì)數(shù)據(jù)賦值的方式,把品質(zhì)數(shù)據(jù)過(guò)渡為數(shù)量上的變異,然后計(jì)算平均數(shù)。

(3.18)p也稱為總體中具有某種屬性的單位成數(shù),所以成數(shù)是一種特殊的平均數(shù)——是非標(biāo)志的平均數(shù)。5、算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)(1)算術(shù)平均數(shù)與標(biāo)志值個(gè)數(shù)的乘積等于各標(biāo)志值的總和。(2)各個(gè)標(biāo)志值與算術(shù)平均數(shù)離差之和等于零。(3)各標(biāo)志值與算術(shù)平均數(shù)離差的平方和為最小值。

(3.21)(二)調(diào)和平均數(shù)harmean(HarmonicMean)調(diào)和平均數(shù)是總體中各單位標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又稱“倒數(shù)平均數(shù)”。1、簡(jiǎn)單調(diào)和平均數(shù)(3.22)應(yīng)用場(chǎng)合

各標(biāo)志值對(duì)應(yīng)的標(biāo)志總量相等。2、加權(quán)調(diào)和平均數(shù)

計(jì)算公式:(3.23)式中,m表示各單位或各組的標(biāo)志值對(duì)應(yīng)的標(biāo)志總量。當(dāng)各標(biāo)志值對(duì)應(yīng)的標(biāo)志總量不相等時(shí),就要用加權(quán)調(diào)和平均數(shù)。[例3-17]某種蔬菜價(jià)格和成交量資料如表3-10,求該種蔬菜一天平均價(jià)格。表3-10蔬菜價(jià)格和成交量資料時(shí)間批發(fā)價(jià)(元)成交量(公斤)成交額(元)

早市午市晚市0.700.680.74400020003000280013602220

合計(jì)

—70006380分析:如果已知資料是批發(fā)價(jià)和成交量采用算術(shù)平均數(shù)方法:如果已知資料是批發(fā)價(jià)和成交額,則要采用調(diào)和平均數(shù)方法:(三)幾何平均數(shù)Geomean(GeomatricMean)幾何平均數(shù)也稱幾何均值或?qū)?shù)平均數(shù),是一種有特定作用的平均數(shù)。幾何平均數(shù)是N個(gè)變量值(比率)連乘積的N次方根,通常用于時(shí)間上有聯(lián)系或有先后順序關(guān)系的比率求平均,凡是度量值的連乘積等于總比率或總速度的現(xiàn)象都必須使用幾何平均法計(jì)算均值。

1、簡(jiǎn)單幾何平均數(shù)

(3.24)式中:G表示幾何平均數(shù)xi表示各項(xiàng)標(biāo)志值

簡(jiǎn)單幾何平均數(shù)適用于計(jì)算未分組數(shù)列的平均比率或平均速度。[例3-18]某產(chǎn)品需經(jīng)四個(gè)工序的加工,已知第一工序加工合格率為97%,第二個(gè)工序加工合格率為95%,第三個(gè)工序加工合格率為96%,第四三個(gè)工序加工合格率為94%,求四個(gè)工序平均加工合格率。2、加權(quán)幾何平均數(shù)當(dāng)計(jì)算幾何平均數(shù)的各個(gè)標(biāo)志值的次數(shù)不相同時(shí),應(yīng)采用加權(quán)幾何平均數(shù)。加權(quán)幾何平均數(shù)是各標(biāo)志值fi次方的連乘積的

次方根,計(jì)算公式為:(3.26)適合于反映特定現(xiàn)象的平均水平——現(xiàn)象的總標(biāo)志值是各單位標(biāo)志值的連乘積。但是,如果數(shù)列中有一個(gè)標(biāo)志值等于0,或者數(shù)列中有一個(gè)標(biāo)志值是負(fù)值,又要開(kāi)偶次方根,就都無(wú)法計(jì)算幾何平均數(shù)。[例3-19]某2企業(yè)2000~2002年增加值發(fā)展速度如表3-11,試計(jì)算其2000~2002年增加值平均發(fā)展速度。表3-11環(huán)比發(fā)展速(%)時(shí)

期次數(shù)f1021990年~1993年31041993年~1998年5981998年~1999年11031999年~2001年2(四)冪平均數(shù)冪平均數(shù)是標(biāo)志值K次方的平均數(shù)的K次方根。

(3.27)當(dāng)k=1時(shí),冪平均數(shù)

為算術(shù)平均數(shù)。當(dāng)k=-1時(shí),冪平均數(shù)

為調(diào)和平均數(shù)。當(dāng)

時(shí),

冪平均數(shù)趨于幾何平均數(shù)。注意:當(dāng)K=0時(shí),平均數(shù)

為不定式。因?yàn)樗阈g(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)都是或近似冪平均數(shù)的k階數(shù)由1遞減為0又減為-1的特例,由此可知它們的一般數(shù)量關(guān)系為:

·調(diào)和平均數(shù)小于幾何平均數(shù)小于算術(shù)平均數(shù);

·當(dāng)各變量相等

時(shí),調(diào)和平均數(shù)等于幾何平均數(shù)等于算術(shù)平均數(shù)。(五)集中趨勢(shì)測(cè)定指標(biāo)的關(guān)系

1.眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系Mo<Me<

Mo=Me=右偏(正偏)分布

對(duì)稱分布

左偏(負(fù)偏)分布圖3-3中位數(shù)、眾數(shù)和平均數(shù)的位置2、算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的關(guān)系

在相同的數(shù)據(jù)中,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)在數(shù)值是的關(guān)系如下:計(jì)算和應(yīng)用集中趨勢(shì)測(cè)定指標(biāo)應(yīng)注意的問(wèn)題1、集中趨勢(shì)的測(cè)定指標(biāo)只能應(yīng)用于同質(zhì)總體;2、用組平均數(shù)和分配數(shù)列補(bǔ)充說(shuō)明總平均數(shù);3、集中趨勢(shì)指標(biāo)與離散程度指標(biāo)及具體分析相結(jié)合。第二節(jié)

統(tǒng)計(jì)變量離散程度的測(cè)定測(cè)定離散程度的意義極差、四分位差和平均差方差與標(biāo)準(zhǔn)差離散系數(shù)與異眾比率一、測(cè)定離散程度的意義1、反映現(xiàn)象總體中變量分布的離散程度。2、衡量均值的代表性。3、測(cè)定現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度。二、極差、四分位差和平均差1、極差(Range,R)又稱全距,離散程度的最簡(jiǎn)單測(cè)度值,是最大和最小觀測(cè)值之間的距離。

(3.30)

式中:

Umax代表最高組的上限;

Lmin代表最低組的下限。

2、四分位差(QuartileDeviation)四分位差是在數(shù)列中剔除最大和最小各四分之一的數(shù)據(jù),是第一和第三個(gè)

四分位數(shù)之間的差,也稱為四分位點(diǎn)內(nèi)距。

四分位差計(jì)算公式為:(3.31)式中:

QD表示四分位差,

Q3、Q1分別為第三個(gè)、第一個(gè)四分位數(shù)。

3、平均差(MeanAbsoluteDeviation)平均差是分配數(shù)列中各單位標(biāo)志值與其算術(shù)平均數(shù)之間離差絕對(duì)值的平均數(shù),一般用MD表示。(1)未分組數(shù)列:

(3.32)(2)分組數(shù)列:

(3.33)三、方差與標(biāo)準(zhǔn)差1、數(shù)量標(biāo)志的方差與標(biāo)準(zhǔn)差未分組數(shù)列的計(jì)算公式:

(3.34)分組數(shù)列的計(jì)算公式:

(3.35)式中,

表示方差;

表示標(biāo)準(zhǔn)差。方差和標(biāo)準(zhǔn)差一般用于定序數(shù)據(jù)和定比數(shù)據(jù)。2、是非標(biāo)志的方差和標(biāo)準(zhǔn)差用“1”表示“是”的變量值,用“0”表示“非”的變量值,則:

(3.37)(3.36)3、方差與標(biāo)準(zhǔn)差的數(shù)學(xué)性質(zhì)(1)變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方。即:

(3.38)(2)變量對(duì)算術(shù)平均數(shù)的方差小于對(duì)任意常數(shù)的方差。(3)n個(gè)同性質(zhì)獨(dú)立變量和的方差等于各個(gè)變量方差的和。(4)n個(gè)同性質(zhì)獨(dú)立變量平均數(shù)的方差等于各變量方差平均數(shù)的

。(5)變量線性變換的方差等于變量的方差乘以變量系數(shù)的平方。四、離散系數(shù)與異眾比率1.離散系數(shù)

(3.44)最常用的變異系數(shù)是標(biāo)準(zhǔn)差系數(shù):(3.43)

[例3-24]在例3-23中,假定生產(chǎn)條件相同,確定哪一品種具有較大穩(wěn)定性,宜于推廣?

計(jì)算結(jié)果說(shuō)明,乙品種的平均畝產(chǎn)量高于甲品種,離散系數(shù)低于甲品種,所以乙品種較高產(chǎn)且具有較大的穩(wěn)定性,宜于推廣。2、異眾比率異眾比率又稱離異比率或變差比,是指非眾數(shù)的次數(shù)與全部變量值總次數(shù)的比率。計(jì)算公式為:

(3.4)

第三節(jié)

變量分布偏度與峰度的描述矩偏度峰度一、矩矩也稱為動(dòng)差。它是總體中所有變量值與任意常數(shù)離差K次方的算術(shù)平均數(shù)。1、基本形式

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論