第五章 數(shù)據(jù)分布特征的測度_第1頁
第五章 數(shù)據(jù)分布特征的測度_第2頁
第五章 數(shù)據(jù)分布特征的測度_第3頁
第五章 數(shù)據(jù)分布特征的測度_第4頁
第五章 數(shù)據(jù)分布特征的測度_第5頁
已閱讀5頁,還剩171頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)安徽省重點(diǎn)學(xué)科財(cái)經(jīng)類核心課程統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

統(tǒng)計(jì)資料經(jīng)過加工整理形成分布數(shù)列后,我們對數(shù)據(jù)分布的類型和特征有了一個直觀的了解。然而,要作進(jìn)一步的統(tǒng)計(jì)分析僅靠這些直觀了解是遠(yuǎn)遠(yuǎn)不夠的。

為進(jìn)一步掌握數(shù)據(jù)分布的特征和規(guī)律,進(jìn)行更深入的分析,還需要找到反映數(shù)據(jù)分布特征的各個代表值。

描述指標(biāo)的分類:

在學(xué)習(xí)本章之前,首先應(yīng)概括了解描述數(shù)據(jù)分布特征的測度值(指標(biāo))都有哪些。對統(tǒng)計(jì)數(shù)據(jù)的分布特征,可以從以下方面進(jìn)行測度和描述:

描述數(shù)據(jù)分布集中趨勢的指標(biāo)——反映各數(shù)據(jù)向其中心值靠攏或聚集的程度——變量數(shù)列分布中心位置的度量

;描述數(shù)據(jù)分布離散程度的指標(biāo)——反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢——變量數(shù)列分布變異程度的度量

;描述分布偏度與峰度的指標(biāo)——變量數(shù)列分布形狀的度量。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度第一節(jié)集中趨勢的測度第二節(jié)離散程度的測度第三節(jié)分布偏態(tài)與峰度的測度第五章數(shù)據(jù)分布特征的測度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度要點(diǎn)學(xué)習(xí)目的與要求:通過本章學(xué)習(xí),掌握平均指標(biāo)與變異指標(biāo)的計(jì)算方法、應(yīng)用條件,平均指標(biāo)與變異指標(biāo)的關(guān)系。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)位置平均數(shù)平均指標(biāo)集中趨勢集中趨勢的含義測定集中趨勢的作用第一節(jié)集中趨勢的測度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度集中趨勢

指總體中總體單位的次數(shù)分布從兩邊向某一中心值集中(靠攏)的趨勢。

在分布數(shù)列中,越靠近中心值,標(biāo)志值出現(xiàn)的次數(shù)越多,而遠(yuǎn)離中心值的次數(shù)較少。

一、集中趨勢的含義

對集中趨勢進(jìn)行測度就是尋找總體一般水平的中心值或代表值。

變量數(shù)列是以平均數(shù)為中心而上下波動,故平均數(shù)反映了總體分布的集中趨勢,集中趨勢測度就是要計(jì)算變量數(shù)列的平均數(shù)

。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度集中趨勢二、測定集中趨勢的作用集中趨勢是現(xiàn)象共性的特征,是現(xiàn)象規(guī)律性的數(shù)量表現(xiàn)。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)位置平均數(shù)平均指標(biāo)測定集中趨勢的意義平均指標(biāo)的概念數(shù)值平均數(shù)與位置平均數(shù)第一節(jié)集中趨勢的測度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均指標(biāo)----總體分布集中趨勢的描述一、平均指標(biāo)的概念

在同質(zhì)總體內(nèi),將總體各單位在某一標(biāo)志下的數(shù)量差異抽象化,以反映總體在一定時間、地點(diǎn)和條件下所達(dá)到的一般水平的統(tǒng)計(jì)綜合指標(biāo),也稱統(tǒng)計(jì)平均數(shù)(均值)。平均指標(biāo)是統(tǒng)計(jì)中廣泛應(yīng)用的一種綜合指標(biāo)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均指標(biāo)二、數(shù)值平均數(shù)與位置平均數(shù)

取得集中趨勢代表值(即平均數(shù))的方法通常有兩種:一是根據(jù)總體所有標(biāo)志值計(jì)算。即從總體各單位標(biāo)志值中抽象出具有一般水平的量,這個量不是各個單位的具體標(biāo)志值,但又要反映總體各單位的一般水平,這種平均數(shù)稱為數(shù)值平均數(shù)。數(shù)值平均數(shù)有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)等形式。

二是根據(jù)標(biāo)志值所處的位置確定。

即先將總體各單位的標(biāo)志值按一定順序排列,然后取某一位置的標(biāo)志值來反映總體各單位的一般水平。把這個特殊位置上的數(shù)值看作是平均數(shù),稱作位置平均數(shù)。位置平均數(shù)有眾數(shù)、中位數(shù)、四分位數(shù)等形式。

數(shù)值平均數(shù)位置平均數(shù)平均指標(biāo)的概念測定集中趨勢的意義算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度第一節(jié)集中趨勢的測度返回

總體中各總體單位的某個數(shù)量標(biāo)志值的總和與總體單位數(shù)的比值,通常也稱為平均數(shù)(average)或均值(mean)。一般所稱的平均數(shù)常指算術(shù)平均數(shù)。用符號表示?!汹厔葜凶钪饕臏y度值

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)一、算術(shù)平均數(shù)1、基本公式

算術(shù)平均數(shù)的基本公式要求,總體標(biāo)志總量必須依附于總體單位數(shù)。

即公式的分子是分母具有的標(biāo)志值,分母是分子的承擔(dān)者。各標(biāo)志值與各單位之間是一一對應(yīng)的。例:平均工資=工資總額/職工人數(shù)平均成本=總成本/產(chǎn)量統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)2、計(jì)算方法

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)

根據(jù)總體資料是否分組,算術(shù)平均數(shù)具體計(jì)算方法可分為簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)兩種。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度(1)簡單算術(shù)平均數(shù)

如果掌握的資料是總體各單位的標(biāo)志值,而且沒有經(jīng)過分組,則可先將各單位的(某一)標(biāo)志值相加得出標(biāo)志總量,然后再除以總體單位數(shù),通過此種方法計(jì)算得到的平均數(shù)稱為簡單算術(shù)平均數(shù)。算術(shù)平均數(shù)(1)未經(jīng)分組整理的原始數(shù)據(jù)計(jì)算算術(shù)平均數(shù)

(2)在變量分配數(shù)列中,各組次數(shù)都相等適用條件:設(shè)總體各單位標(biāo)志值為,則:

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度簡單算術(shù)平均數(shù)06-07第二學(xué)期XX班40名學(xué)生《統(tǒng)計(jì)學(xué)》成績抄錄如下:

89、88、76、99、74、60、82、60、89、86、

92、85、70、93、99、94、82、77、79、97、

78、95、84、79、63、72、87、84、79、65、

98、67、59、83、66、65、73、81、56、77統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度簡單算術(shù)平均數(shù)06-07第二學(xué)期XX班40名學(xué)生《統(tǒng)計(jì)學(xué)》的平均成績:

簡單算術(shù)平均數(shù)之所以簡單,就是因?yàn)楦鱾€變量值出現(xiàn)的次數(shù)相同,因此,只要把各項(xiàng)變量值簡單相加再用項(xiàng)數(shù)去除就求出平均數(shù)了。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度簡單算術(shù)平均數(shù)

某工廠某生產(chǎn)班組有11名工人,各人日產(chǎn)量為15、17、19、20、22、22、23、23、25、26、30件,求平均日產(chǎn)量。

解:=(15+17+19+20+22+22+23+23+25+26+30)/11=22件開機(jī),2ndF,ON,在0的上方出現(xiàn)STAT15,M+,17,M+,19,M+,20,M+,22,M+,22M+,23M+,23M+,25M+,26M+,30M+,x→M

出現(xiàn)結(jié)果22統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度簡單算術(shù)平均數(shù)用統(tǒng)計(jì)功能計(jì)算

例2:5名工人日產(chǎn)零件數(shù)為12,13,14,14,15件,計(jì)算平均每人日產(chǎn)量。12,M+,13,M+,14,M+,14,M+,15,M+,RM,,5,=計(jì)算結(jié)果13.6,注意:每次開機(jī)后按x→M鍵,清內(nèi)存。用存儲功能算統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度簡單算術(shù)平均數(shù)按成績分組人數(shù)(人)50-6060-7070-8080-9090-1002711128合計(jì)(Σ)4089、88、76、99、74、60、82、60、89、86、92、85、70、93、99、94、82、77、79、97、78、95、84、79、63、72、87、84、79、65、98、67、59、83、66、65、73、81、56、77整理分組如何計(jì)算平均分?jǐn)?shù)呢?

07-08第一學(xué)期XX班《統(tǒng)計(jì)學(xué)》成績(2)加權(quán)算術(shù)平均數(shù)

如果掌握的資料是經(jīng)過分組整理編成了單項(xiàng)數(shù)列或組距數(shù)列,并且每組次數(shù)不同時,就應(yīng)采用加權(quán)算術(shù)平均數(shù)的方法計(jì)算算術(shù)平均數(shù)。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)

設(shè)原始數(shù)據(jù)被分成n組,各組的變量值分別為,各組變量值出現(xiàn)的次數(shù)分別為,則:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)的適用條件:

在分配數(shù)列(單項(xiàng)數(shù)列或組距數(shù)列)中,各組變量值的次數(shù)不等。加權(quán)算術(shù)平均數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

①單項(xiàng)式數(shù)列的加權(quán)算術(shù)平均數(shù)

基本的具體方法是:將各組標(biāo)志值分別乘以相應(yīng)的各組單位數(shù)(絕對權(quán)數(shù))求出各組標(biāo)志總量,并加總得到總體標(biāo)志總量,同時把各組單位數(shù)相加求出總體單位總數(shù),然后用總體標(biāo)志總量除以總體單位總數(shù),即得算術(shù)平均數(shù)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度加權(quán)算術(shù)平均數(shù)

例:某企業(yè)工人按日產(chǎn)量分組資料如下:日產(chǎn)量(件)(x)工人人數(shù)(人)(f)(f/∑f)15161718191020305040713203327合計(jì)150100要求:根據(jù)資料計(jì)算工人的平均日產(chǎn)量。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度返回單項(xiàng)式數(shù)列的加權(quán)算術(shù)平均數(shù)解:以次數(shù)為權(quán)數(shù)計(jì)算:=(15×10+16×20+17×30+18×50+19×40)/150=17.6(件)以比重為權(quán)數(shù)計(jì)算:=15×7%+16×13%+17×20%+18×33%+19×27%=17.6(件)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度單項(xiàng)式數(shù)列的加權(quán)算術(shù)平均數(shù)

成績組中值人數(shù)比重(cm)(cm)

(人)(%)

50-60552560-7065717.570-80751127.580-9085123090-10095820

總計(jì)40100某班《統(tǒng)計(jì)學(xué)》成績資料組距數(shù)列加權(quán)算術(shù)平均數(shù)

組距數(shù)列算術(shù)平均數(shù)的計(jì)算:以組中值代替變量x,爾后按公式計(jì)算。X此時為組中值,因此由此計(jì)算出的平均數(shù)是近似值。組距數(shù)列的加權(quán)算術(shù)平均數(shù)次數(shù)f頻率f/Σf變量值x

次數(shù)f的作用:當(dāng)比較大的變量值的次數(shù)多時,平均數(shù)就接近于變量值大的一方;當(dāng)比較小的變量值次數(shù)多時,平均數(shù)就接近于變量值小的一方??梢?,次數(shù)對變量值在平均數(shù)中的影響起著某種權(quán)衡輕重的作用,因此被稱為權(quán)數(shù)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

權(quán)數(shù):指變量數(shù)列中各組標(biāo)志值出現(xiàn)的次數(shù),反映了各組的標(biāo)志值對平均數(shù)的影響程度。

權(quán)數(shù)有兩種表現(xiàn)形式:絕對數(shù)權(quán)數(shù)和比重權(quán)數(shù),即頻數(shù)和頻率。

權(quán)數(shù)的意義不同的權(quán)數(shù)如何影響平均數(shù)?A、B兩班各10名學(xué)生的考試成績?nèi)缦拢篈:marks(x): 020100students(f):118B:marks(x): 020100students(f):811統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度權(quán)數(shù)的意義

選擇權(quán)數(shù)必須體現(xiàn)標(biāo)志值對平均數(shù)的作用的大小,它與各組標(biāo)志值或組中值相乘必須要有實(shí)際意義。如:以學(xué)號為權(quán)數(shù),計(jì)算全班統(tǒng)計(jì)學(xué)平均分?jǐn)?shù),則其子項(xiàng)“某組考分代表值學(xué)號”是沒有實(shí)際意義的。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度權(quán)數(shù)的意義

又如,匯率決定理論中的購買力平價方法()即是對兩個國家的一籃子商品的價格所進(jìn)行的加權(quán)平均。

例如,學(xué)生成績的評定,平時成績占20%,期末卷面成績占80%。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度權(quán)數(shù)的意義

簡單算術(shù)平均數(shù)其數(shù)值的大小只與變量值的大小有關(guān)。加權(quán)算術(shù)平均數(shù)其數(shù)值的大小不僅受各組變量值大小的影響,而且還受各組變量值出現(xiàn)的次數(shù)即權(quán)數(shù)大小的影響。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度權(quán)數(shù)的意義當(dāng)f1=f2=……

=fn=A,如果各組的次數(shù)(權(quán)數(shù))均相同,即

則權(quán)數(shù)的權(quán)衡輕重作用也就消失了。算術(shù)平均數(shù)。簡單算術(shù)平均數(shù)實(shí)質(zhì)上是加權(quán)算術(shù)平均數(shù)在權(quán)數(shù)相等條件下的一個特例。這時,加權(quán)算術(shù)平均數(shù)會變成簡單統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度簡單算術(shù)平均數(shù)與加權(quán)算術(shù)平均數(shù)(1)集中趨勢的最常用測度值(2)一組數(shù)據(jù)的均衡點(diǎn)所在(3)體現(xiàn)了數(shù)據(jù)的必然性特征(4)易受極端值的影響(5)用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)練習(xí)題:指出下列指標(biāo)中的算術(shù)平均數(shù):①商品銷售額除以商業(yè)服務(wù)人員數(shù);②商品銷售額除以商品平均庫存額;③商業(yè)服務(wù)人員數(shù)除以該地區(qū)居民數(shù);④該地區(qū)居民數(shù)除以商業(yè)服務(wù)人員數(shù);⑤某商品銷售額除以該商品銷售量。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

算術(shù)平均數(shù)在統(tǒng)計(jì)學(xué)中有著重要的地位,它是進(jìn)行統(tǒng)計(jì)分析和統(tǒng)計(jì)推斷的基礎(chǔ),下面有關(guān)算術(shù)平均數(shù)的命題是其重要的數(shù)學(xué)性質(zhì)。1.算術(shù)平均數(shù)與總體單位總量的乘積等于總體標(biāo)志總量。2.各變量值與算術(shù)平均數(shù)的離差之和等于零:3.各變量值與算術(shù)平均數(shù)的離差平方和為最小值。(這一性質(zhì)說明算術(shù)平均數(shù)是誤差最小的總體代表值)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)1、它是一個抽象化的數(shù)值(因?yàn)樗鼘⒖傮w各單位具體的數(shù)量差異抽象掉了)

2、它是一個代表性數(shù)值(因?yàn)樗靡粋€數(shù)值來代表總體各單位在具體條件下的一般水平)

3、它是一個特征值(因?yàn)樗从沉丝傮w分布的集中趨勢)和母項(xiàng)具有依存關(guān)系。4、只能對同質(zhì)總體求平均數(shù),計(jì)算平均數(shù)所依據(jù)的子項(xiàng)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)的特點(diǎn)

1.反映總體各單位變量分布的集中趨勢和一般水平。可用于同類現(xiàn)象在不同空間的對比;

2.反映同類現(xiàn)象在不同時間的發(fā)展水平,可用于同類現(xiàn)象在不同時間的對比;

3.作為評判事物的標(biāo)準(zhǔn);

4.可進(jìn)行數(shù)量估算。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均指標(biāo)的作用算術(shù)平均數(shù)與強(qiáng)度相對數(shù)的比較:相同點(diǎn):均有平均的含義,一般為復(fù)名數(shù)。不同點(diǎn):

(1)概念不同。強(qiáng)度相對數(shù)是兩個有聯(lián)系而性質(zhì)不同的總量指標(biāo)對比而形成相對數(shù)指標(biāo)。算術(shù)平均數(shù)是反映同質(zhì)總體單位標(biāo)志值一般水平的指標(biāo)。(2)主要作用不同。強(qiáng)度相對數(shù)反映兩不同總體現(xiàn)象形成的密度、強(qiáng)度。算術(shù)平均數(shù)反映同一現(xiàn)象在同一總體中的一般水平。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度(3)計(jì)算公式及內(nèi)容不同。算術(shù)平均數(shù)分子、分母分別是同一總體的標(biāo)志總量和總體單位數(shù),分子、分母的元素具有一一對應(yīng)的關(guān)系,而強(qiáng)度相對數(shù)是兩個總體現(xiàn)象之比,分子分母沒有一一對應(yīng)關(guān)系。

比較:人均糧食消費(fèi)量、人均糧食產(chǎn)量統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

在統(tǒng)計(jì)中,經(jīng)常需要將研究總體中的全部單位區(qū)分為非此即彼的兩大類,以研究它們之間的比例關(guān)系。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度返回

例如,合格品與不合格品,男工與女工等。這類以“是或非”、“有或無”來表述單位特征的標(biāo)志稱為是非標(biāo)志或交替標(biāo)志——其標(biāo)志表現(xiàn)只有兩種情況。具體體現(xiàn)在各總體單位要么具有該種屬性,要么不具有該種屬性。是非標(biāo)志的平均數(shù)分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計(jì)—為研究是非標(biāo)志總體的數(shù)量特征,令:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

(1)是非標(biāo)志:是非標(biāo)志又稱交替標(biāo)志,它是一個只有兩種標(biāo)志表現(xiàn)的標(biāo)志。具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)

(2)成數(shù):指是非標(biāo)志總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度是非標(biāo)志的平均數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度是非標(biāo)志的平均數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)二、調(diào)和平均數(shù)

假定有A、B兩家公司員工的月工資資料如下表的前三列。試分別計(jì)算其平均工資?!阈g(shù)平均數(shù)的變形

引例

兩公司員工工資情況表月工資(元)x工資總額(元)m(xf)員工人數(shù)(人)f=m/xA公司B公司A公司B公司80010001600合計(jì)480007000032000150000400004000040000120000607020150504025115統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)計(jì)算A公司的平均工資,得到:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)

在這里,平均工資作為“單位標(biāo)志平均數(shù)”仍然必須是標(biāo)志總量(工資總額)與單位總數(shù)(員工總數(shù))之比。依據(jù)給出的月工資水平和工資總額的分組資料,可以首先用前者來除后者,得到各組的員工人數(shù),進(jìn)而加總得到全公司的員工總數(shù)(表中后兩列),這樣就很容易計(jì)算出兩個公司各自的平均工資。將這些計(jì)算過程歸納起來,就是運(yùn)用了調(diào)和平均數(shù)的公式。

對于B公司,固然也可以采用加權(quán)調(diào)和平均數(shù)公式來計(jì)算其平均工資:

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)

然而在這里,由于各組的權(quán)數(shù)(工資總額)相同,實(shí)際上并沒有真正起到加權(quán)的作用。我們采用簡單調(diào)和平均數(shù)的公式來計(jì)算,可以得到完全相同的結(jié)果,而計(jì)算過程卻大大簡化了:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)

在統(tǒng)計(jì)分析中,有時會由于種種原因沒有頻數(shù)的資料,只有每組的變量值和相應(yīng)的標(biāo)志總量。這種情況下就不能直接運(yùn)用算術(shù)平均方法來計(jì)算了,而需要以迂回的形式,即用每組的標(biāo)志總量除以該組的變量值推算出各組的單位數(shù),才能計(jì)算出平均數(shù),我們可以用調(diào)和平均的方法完成這個計(jì)算。(加權(quán))調(diào)和平均數(shù)的公式原來只是計(jì)算時使用了不同的數(shù)據(jù)!統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。又稱倒數(shù)平均數(shù)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)

調(diào)和平均數(shù)作為算術(shù)平均數(shù)的變形公式使用。仍是總體的標(biāo)志總量與總體單位總量的對比,僅僅是因?yàn)橘Y料的不同,需要將算術(shù)平均數(shù)變形。

當(dāng)我們掌握的是各組標(biāo)志值和各組的標(biāo)志總量時,不能直接運(yùn)用算術(shù)平均數(shù)的方法計(jì)算,應(yīng)采用調(diào)和平均數(shù)的形式。

當(dāng)m=xf時,統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元)Xi成交額(元)Xifi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合計(jì)—3690048000【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計(jì)算三種蔬菜該日的平均批發(fā)價格統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)[例]某局所屬四個企業(yè)有關(guān)資料如下,試計(jì)算該工業(yè)局的產(chǎn)值平均計(jì)劃完成百分比。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度調(diào)和平均數(shù)

幾何平均數(shù)是N個變量值連乘積的N次方根。(簡單公式)(加權(quán)公式)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度數(shù)值平均數(shù)三、幾何平均數(shù)——適用于特殊的變量值

(總體的標(biāo)志總量等于各單位標(biāo)志值之積)

2、就用途而言,幾何平均方法通常用在總量等于各分量乘積的情形。比如,求某些平均比率,平均發(fā)展速度等。【例】某流水生產(chǎn)線有前后銜接的五道工序。某日各工序產(chǎn)品的合格率分別為95﹪、92﹪、90﹪、85﹪、80﹪,求整個流水生產(chǎn)線產(chǎn)品的平均合格率。簡單公式及應(yīng)用:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)設(shè)最初投產(chǎn)A個單位,則第一道工序的合格品為A×0.95;第二道工序的合格品為(A×0.95)×0.92;

……第五道工序的合格品為(A×0.95×0.92×0.90×0.85)×0.80;

因該流水線的最終合格品即為第五道工序的合格品,故該流水線總的合格品應(yīng)為A×0.95×0.92×0.90×0.85×0.80;則該流水線產(chǎn)品總的合格率為:結(jié)論:即該流水線總的合格率等于各工序合格率的連乘積,符合幾何平均數(shù)的適用條件,故需采用幾何平均法計(jì)算。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)加權(quán)公式及應(yīng)用:【例】某金融機(jī)構(gòu)以復(fù)利計(jì)息。近12年來的年利率有4年為3﹪,2年為5﹪,2年為8﹪,3年為10﹪,1年為15﹪。求平均年利率。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)設(shè)本金為V,則至各年末的本利和應(yīng)為:第1年末的本利和為:第2年的計(jì)息基礎(chǔ)第12年的計(jì)息基礎(chǔ)………………結(jié)論:即12年總本利率等于各年本利率的連乘積,符合幾何平均數(shù)的適用條件,故計(jì)算平均年本利率應(yīng)采用幾何平均法。第12年末的本利和為:第2年末的本利和為:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度可看作是均值的一種變形:

注意:當(dāng)變量值有一項(xiàng)為零或負(fù)值時,不宜用幾何平均數(shù)計(jì)算。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)

例:2003-2007年某市工業(yè)品的產(chǎn)量分別是上年的107.6%、102.5%、100.6%、102.7%、102.2%,計(jì)算這5年的平均發(fā)展速度。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)1.067,,1.025,,1.006,,1.027,,1.022,=,2ndF,,5,=出現(xiàn)結(jié)果:1.0309即103.1%計(jì)算器統(tǒng)計(jì)功能計(jì)算:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)

【例】一位投資者購持有一種股票,在2008、2009、2010和20011年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率。例:某投資銀行25年的年利率分別是:1年3%,4年5%,8年8%,10年10%,2年15%,求平均年利率。1.03,,(,1.05,yx,4,),,(,1.08,yx,8,),,(,1.1,yx,10,),,(,1.15,yx,2,),=,2ndF,出現(xiàn)結(jié)果:1.086即108.6%統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度幾何平均數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

數(shù)值平均數(shù)位置平均數(shù)平均指標(biāo)的概念測定集中趨勢的意義中位數(shù)眾數(shù)第一節(jié)集中趨勢的測度算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

中位數(shù)的著眼點(diǎn)在于尋求全部變量值按其大小順序排列,居中間位置的變量值。在中位數(shù)數(shù)值沒有重復(fù)的條件下,其中,一半數(shù)值小于中位數(shù),另一半數(shù)值大于中位數(shù),因而,可用來代表數(shù)列的一般水平。(一)

中位數(shù)的概念:將總體各單位標(biāo)志值按大小排列,居于中間位置的標(biāo)志值就是中位數(shù)Me

位置平均數(shù)一、中位數(shù)(Me)

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度外行看統(tǒng)計(jì)中位數(shù)(Me)

例如,現(xiàn)行我國住戶調(diào)查公布的人均可支配收入采用平均數(shù)。但是,由于居民收入分布是偏態(tài)分布,分布曲線偏向高收入,使得平均數(shù)偏離中位數(shù)和眾數(shù),隨著收入差距的擴(kuò)大,偏離程度也越來越大、收入水平達(dá)不到平均數(shù)的家庭比例不斷上升。

國家統(tǒng)計(jì)局根據(jù)對全國31個省份7.4萬戶農(nóng)村居民家庭和6.6萬戶城鎮(zhèn)居民家庭的抽樣調(diào)查顯示,2011年農(nóng)村居民收入方面,人均純收入為6977元,比上年增加1058元,城鎮(zhèn)居民人均可支配收入21810元,比上年增加2701元。國家統(tǒng)計(jì)局表示,由于調(diào)查的部分對象收入很高,此前公布的人均收入有可能會被高收入群體拉高,不能完全真實(shí)地反映部分人員收入情況;而中位數(shù)則更能反映出中低收入者的情況。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

2011年1月,國家統(tǒng)計(jì)局局長馬建堂在發(fā)布去年國民經(jīng)濟(jì)運(yùn)行情況時提到,將在近日發(fā)布收入中位數(shù)。20日,這項(xiàng)數(shù)據(jù)得以發(fā)布。

2011年,農(nóng)村居民人均純收入中位數(shù)為6194元,比上年增加995元,農(nóng)村居民人均純收入中位數(shù)比人均純收入低783元;城鎮(zhèn)居民方面,人均可支配收入中位數(shù)為19118元,比上年增加2279元,城鎮(zhèn)居民人均可支配收入中位數(shù)比人均可支配收入低2692元。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

我國人口年齡中位數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)

又如:人口的年齡分布往往近似J型:嬰兒數(shù)最多,隨著年齡的增大,人數(shù)逐漸下降,到了百歲左右,所剩的人數(shù)就很少了。如果計(jì)算年齡的算術(shù)平均數(shù),老年人口數(shù)雖然較少,但其年齡數(shù)值很高,這樣一來,計(jì)算的平均年齡就會偏向老年一方。因此,各國的人口統(tǒng)計(jì)資料中,平均年齡的計(jì)算一般采用中位數(shù)。

(二)中位數(shù)的確定【例】計(jì)算甲城市家庭對住房滿意狀況評價的中位數(shù)中位數(shù)的位次為:

300/2=150

從累計(jì)頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此

Me=一般表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計(jì)300—統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)1.定序數(shù)據(jù)的中位數(shù):首先確定中點(diǎn)位次,然后找出中點(diǎn)位次對應(yīng)的變量值。

首先確定中點(diǎn)位次,然后找出中點(diǎn)位次對應(yīng)的標(biāo)志值。①當(dāng)資料未分組時,中點(diǎn)位次=統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度2.數(shù)值型數(shù)據(jù)的中位數(shù)中位數(shù)(Me)當(dāng)N為奇數(shù)當(dāng)N為偶數(shù)

n為奇數(shù)中位數(shù)例子

原始數(shù)據(jù):24.1 22.621.523.7 22.6

由小到大排列:21.522.622.623.7 24.1

位次:12 34 5中位數(shù)位次Om中位數(shù)Me

22.6.

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)n為偶數(shù)中位數(shù)例子

原始數(shù)據(jù):10.34.98.9 11.7 6.37.7

由小到大排列:4.96.37.7

8.9 10.3 11.7

位次:1234 56中位數(shù)位次

Om中位數(shù)Me7.78.3028.9統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)[例]中點(diǎn)位次=

,

說明位于第90與第91個人之間,(1)當(dāng)資料已分組且形成單項(xiàng)式變量數(shù)列時,中點(diǎn)位次=統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)根據(jù)累計(jì)次數(shù)可確定中位數(shù)為第四組的變量值18歲。(2)資料已分組且形成組距式變量數(shù)列(插補(bǔ)法按比例推算)

(A)L為中位數(shù)所在組的下限,U為上限;(C)Sm-1

為小于中位數(shù)的各組次數(shù)之和;(D)Sm+1為大于中位數(shù)的各組次數(shù)之和;統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)(B)d為中位數(shù)所在組的組距;(E)fm為中位數(shù)所在組的次數(shù)。中位數(shù)

中位數(shù)實(shí)際上就是位于累計(jì)次數(shù)達(dá)到的這一組中的某個數(shù)值。該數(shù)值就是這一組下限加上按一定幾何比例分割組距所得的一段組距,或這一組上限減去按一定幾何比例分割組距所得的一段組距。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)

506070(L)80(U)90100

xy103060110150180(Sm-1)第90個人Me=L+x=U-y假定中位數(shù)組的變量值呈均勻分布,則采用比例插值法得統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)

(三)

中位數(shù)特點(diǎn)與應(yīng)用場合:

1.中位數(shù)一定存在,主要用于測度定序數(shù)據(jù)的集中趨勢。也適用于數(shù)值型數(shù)據(jù)。但不適用于定類數(shù)據(jù);2.是一個位置代表值,不受極端值的影響,比較穩(wěn)健。

3.中位數(shù)的取值只與中間位置的一或兩個數(shù)值有關(guān),利用信息不充分。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度中位數(shù)(Me)

中位數(shù)是將統(tǒng)計(jì)分布從中間分成相等的兩部分,與中位數(shù)性質(zhì)相似的還有四分位數(shù)、十分位數(shù)和百分位數(shù)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

三個數(shù)值可以將變量數(shù)列劃分為項(xiàng)數(shù)相等的四部分,這三個數(shù)值就定義為四分位數(shù)(Quartiles),分別稱為第一四分位數(shù)、第二四分位數(shù)和第三四分位數(shù),記作、和。對于不分組數(shù)據(jù)而言,三個四分位數(shù)的位置分別是:在處,在處,在處。可見就是中位數(shù)。(四)分位數(shù)

同理,十分位數(shù)(Dectile)和百分位數(shù)(Percentile)分別是將變量數(shù)列十等分和一百等分的數(shù)值。25%分位數(shù)50%分位數(shù)75%分位數(shù)最大

觀測值最小

觀測值中位數(shù)上四分位數(shù)下四

分位數(shù)(lowquartile)(upperquartile)50%的觀測值小于中位數(shù)50%的觀測值位于上下四分位數(shù)之間50%的觀測值大于中位數(shù)四分位數(shù):

回答類別頻頻累積次數(shù)

數(shù)

率%向上向下非常不滿意不滿意一般滿意非常滿意24108934530836311510241322252703003002761687530合計(jì)300100----Q1=不滿意Q3=滿意Me=一般甲城市家庭對住房增狀況的評價四分位數(shù)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度小時數(shù)燈泡數(shù)累積43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200Me=75.5QU=85QL=6750%燈泡的壽命在67-85小時之間200只燈泡使用壽命頻數(shù)分布表四分位數(shù)思考題

你是Prudential-Bache證券公司的金融分析員。你已經(jīng)收集了新發(fā)行股票的下列收盤價:17,16,21,18,13,16,12,11.

試描述股票價格的集中趨勢統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

某商場某季度男皮鞋銷售情況男皮鞋號碼/厘米銷售量/雙24.01224.58425.011825.554126.032026.510427.052合計(jì)1200統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

某制鞋廠要了解消費(fèi)者最需要哪種型號的男皮鞋,調(diào)查了某百貨商場某季度男皮鞋的銷售情況,得到資料如表:二、眾數(shù)(M0)位置平均數(shù)引例

從表中可以看到,25.5厘米的鞋號銷售量最多,如果我們計(jì)算算術(shù)平均數(shù),則平均號碼為25.65厘米,而這個號碼顯然是沒有實(shí)際意義的,而直接用25.5厘米作為顧客對男皮鞋所需尺寸的集中趨勢既便捷又符合實(shí)際。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)

眾數(shù)的著眼點(diǎn)在于尋求分布數(shù)列中頻數(shù)最多(出現(xiàn)次數(shù)最多的)的變量值。說明總體中大多數(shù)單位所達(dá)到的一般水平,具有普遍性。

(一)定義:眾數(shù)是分布數(shù)列(總體)中出現(xiàn)次數(shù)最多的變量值。

上面的例子中,鞋號25.5厘米就是眾數(shù)。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)

在統(tǒng)計(jì)實(shí)踐中,常利用眾數(shù)來近似反映現(xiàn)象的一般水平。比如,一位食品部經(jīng)理想按照預(yù)期的銷售量來分配貨物架的空間。從這個意義上來說,我們應(yīng)該依據(jù)眾數(shù),而不是算術(shù)平均數(shù)或中位數(shù)來確定,即過去具有最高銷售量的食品將得到最大限度的貨物架空間。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

用眾數(shù)價格代表某一商品的價格,用眾數(shù)儲蓄余額代表居民儲蓄的一般水平,還有,在服裝行業(yè),生產(chǎn)商、批發(fā)商在做有關(guān)生產(chǎn)或存貨的決策時,更感興趣的是最普遍的尺寸,即尺寸的眾數(shù)。眾數(shù)(M0)眾數(shù)適用于品質(zhì)數(shù)列和變量數(shù)列。

如:銷售量最多的服裝款式或色彩(所謂“流行款式”或“流行色”)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度返回眾數(shù)(M0)例:品質(zhì)數(shù)列(定類數(shù)據(jù))的眾數(shù)

某城市居民關(guān)注廣告類型的頻數(shù)分布廣告類型人數(shù)(人)比例頻率(%)

商品廣告

服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計(jì)2001100

這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)

例:品質(zhì)數(shù)列(定序數(shù)據(jù))的眾數(shù)

這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意

甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計(jì)300100.0統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)(二)變量數(shù)列計(jì)算M0的方法1.由單項(xiàng)數(shù)列確定的M0:先確定眾數(shù)組,再確定眾數(shù):Mo=2統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)家庭人口數(shù)戶數(shù)120266384551合計(jì)100

一般也可以次數(shù)最多的一組的組中值為眾數(shù),但這一數(shù)值往往隨著分組的不同而發(fā)生變動,為使M0更接近實(shí)際,在確定M0所在組后,計(jì)算M0的近似值——是按比例推算的近似值——用眾數(shù)組前后兩組的頻數(shù)作為決定眾數(shù)應(yīng)在眾數(shù)所在組組中值上面或下面的加權(quán)因子,理解如下:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)2.由組距數(shù)列確定的M0:fm-1fm-1fm-1fm+1fm+1fm+1fm頻數(shù)頻數(shù)頻數(shù)M0M0M0fmfm(a)(b)(c)眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān):眾數(shù)(M0)(a):相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)。(b)、(c)相鄰兩組的頻數(shù)不相等。

設(shè)眾數(shù)組的頻數(shù)為,眾數(shù)前一組的頻數(shù)為fm-1

,眾數(shù)后一組的頻數(shù)為fm+1

。當(dāng)眾數(shù)相鄰兩組的頻數(shù)相等時,即

fm-1=fm+1

,眾數(shù)組的組中值即為眾數(shù);當(dāng)眾數(shù)組的前一組的頻數(shù)多于眾數(shù)組后一組的頻數(shù)時,即fm-1>fm+1

,則眾數(shù)會向其前一組靠,眾數(shù)小于其組中值;當(dāng)眾數(shù)組后一組的頻數(shù)多于眾數(shù)組前一組的頻數(shù)時,即fm-1

<fm+1

,則眾數(shù)會向其后一組靠,眾數(shù)大于其組中值。基于這種思路,借助于幾何圖形而導(dǎo)出的分組數(shù)據(jù)眾數(shù)的計(jì)算公式。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)由組距式頻布表計(jì)算眾數(shù)眾數(shù)先確定眾數(shù)組;再用下述公式計(jì)算:符號含義:(A)L為眾數(shù)組的下限,U為上限;(B)d為眾數(shù)組的組距;(C)1=fm-fm-1,即眾數(shù)組的次數(shù)與前一組次數(shù)之差;

2=fm-fm+1,即眾數(shù)組的次數(shù)與后一組次數(shù)之差。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)小時數(shù)燈泡數(shù)43-48248-53153-58258-632163-682868-732873-783378-832683-882188-931993-981098-1036103-1082108-1130113-1181200只燈泡使用壽命頻數(shù)分布表200只燈泡使用壽命頻數(shù)分布直方圖眾數(shù)(三)眾數(shù)的特點(diǎn)及應(yīng)用場合

1.主要用于測度定類數(shù)據(jù)的集中趨勢,也適用于定序和數(shù)值型數(shù)據(jù)的集中趨勢的測度值。

2.

眾數(shù)是根據(jù)眾數(shù)組及相鄰組的頻數(shù)分布信息來確定數(shù)據(jù)中心點(diǎn)位置的,因此,眾數(shù)是一個位置代表值,它不受數(shù)據(jù)中極端值的影響。

3.由于眾數(shù)的確定并不涉及每一個變量值,故其對變量值的變化反映不靈敏。

4.有時分布數(shù)列中可能沒有眾數(shù)或有幾個眾數(shù),難以反映總體的一般水平。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度眾數(shù)(M0)M0M0M0M0M0若有兩個次數(shù)相等的眾數(shù),則稱復(fù)眾數(shù)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

①眾數(shù)的確定適用于總體單位數(shù)比較多,而且又有明顯的集中趨勢時才存在眾數(shù)。眾數(shù)(M0)下三圖無眾數(shù):

②在單位數(shù)很少,或單位數(shù)雖多但無明顯集中趨勢時,統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度計(jì)算眾數(shù)是沒有意義的。眾數(shù)(M0)數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)*眾數(shù)*中位數(shù)*均值*均值-四分位數(shù)眾數(shù)調(diào)和平均數(shù)-眾數(shù)中位數(shù)幾何平均數(shù)--四分位數(shù)中位數(shù)---四分位數(shù)---眾數(shù)適用的測度值數(shù)據(jù)的類型和所適用的集中趨勢測度值*為該數(shù)據(jù)類型最適用的測度值統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系眾數(shù)是觀測值的重點(diǎn)中位數(shù)是觀測值的中心均值是觀測值的重心眾數(shù)、中位數(shù)、均值的比較(1)對稱分布:此處三者均等于35。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

大部分?jǐn)?shù)據(jù)都屬于單峰鐘形分布,其眾數(shù)、中位數(shù)和算術(shù)平均數(shù)之間具有以下關(guān)系:算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系A(chǔ)、右(正)偏:說明數(shù)據(jù)中有極大值,必然拉動算術(shù)平均(2)偏態(tài)分布統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系數(shù)向大的數(shù)值靠近:

B、左(負(fù))偏:說明數(shù)據(jù)中有極小值出現(xiàn),必然拉動算術(shù)平統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系均數(shù)向小的數(shù)值靠近。

從上面的分析可以看出,當(dāng)頻數(shù)分布出現(xiàn)偏態(tài)時,極端值對算術(shù)平均數(shù)產(chǎn)生很大的影響,而對眾數(shù)、中位數(shù)沒有影響,此時,用眾數(shù)、中位數(shù)作為一組數(shù)據(jù)的中心值比算術(shù)平均數(shù)有較高的代表性。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

適度偏斜情況下,眾數(shù)與中位數(shù)之間的距離,大約為中位數(shù)到算術(shù)平均數(shù)之間距離的兩倍。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系卡爾.皮爾遜經(jīng)驗(yàn)公式

據(jù)某單位資料知道,職工年收入小于25000元的占總?cè)藬?shù)的一半,年收入22360元人數(shù)為最多。試問:該單位職工人均年收入估計(jì)為多少?收入分配是左偏還是右偏?統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的關(guān)系思考收入分配呈右偏統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

不同類型變量適用的集中趨勢測度指標(biāo)變量類型分類型順序型數(shù)值型集中趨勢測度指標(biāo)※眾數(shù)---※中位數(shù)四分位數(shù)眾數(shù)-※均值中位數(shù)四分位數(shù)眾數(shù)※為該類變量最適用的測度指標(biāo)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度本章目錄統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)志變異指標(biāo)離散程度什么是離散程度為什么要測定離散程度第二節(jié)離散程度的測度

如果你一只腳放在攝氏0度的冰水里,另一只腳放在攝氏100度的沸水里,按統(tǒng)計(jì)學(xué)理論,你一定感覺很舒服,因?yàn)槠骄疁?0度!統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度一則笑話漫畫——都是不懂統(tǒng)計(jì)的緣故

他的溺斃完全是因?yàn)椴欢y(tǒng)計(jì),他還以為只要知道河水的平均深度就行了呢。R.I.P—RestinPeace統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度Mo=可口可樂甲商店乙商店Mo=可口可樂

兩商店軟飲料購買頻數(shù)的眾數(shù)都是可口可樂,但數(shù)據(jù)的離散程度不同。01020可口可樂雪碧

仁露

騎士醒目01020可口可樂雪碧

仁露

騎士醒目離散趨勢Me=一般甲城市乙城市非常不滿意一般滿意非常

滿意Me=一般非常不滿意一般滿意非常

滿意

兩城市對住房條件評價的中位數(shù)都是一般,但數(shù)據(jù)的離散程度不同。不滿意不滿意離散趨勢兩組數(shù)據(jù)均值均為,但離散程度不同。離散趨勢離散程度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

分配數(shù)列中各標(biāo)志值背離中心值的程度,即現(xiàn)象總體中各單位標(biāo)志值間的變異狀況或差異程度。也稱為離中趨勢或離散趨勢,是數(shù)據(jù)分布的另一個重要特征。一、什么是離散程度

平均指標(biāo)是一個代表性數(shù)值,它反映總體各單位某一數(shù)量標(biāo)志的一般水平,而把總體各單位之間的差異抽象化了。但總體各單位之間的差異是客觀存在的,這種差異也是統(tǒng)計(jì)總體的重要特征之一。因此,要全面反映一個總體的特征,還必須測定總體各單位之間差異程度。二、為什么要測定離散程度統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度離散程度

標(biāo)志變異指標(biāo)(意義和作用)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

反映總體各單位標(biāo)志值之間差異程度大小的綜合指標(biāo),也稱做標(biāo)志變動度。

是說明總體分布的另一個重要特征值。一、標(biāo)志變異指標(biāo)的含義統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度1、衡量平均指標(biāo)代表性的大小的尺度甲、乙兩學(xué)生某次考試成績列表語文數(shù)學(xué)物理化學(xué)政治英語甲959065707585乙1107095508075二、標(biāo)志變異指標(biāo)的作用

標(biāo)志變異指標(biāo)(意義和作用)2、反映現(xiàn)象發(fā)展過程的均衡性或協(xié)調(diào)性、以及產(chǎn)品質(zhì)量的穩(wěn)定性供貨計(jì)劃完成百分比(%)季度總供貨計(jì)劃執(zhí)行結(jié)果一月二月三月鋼廠甲100323434乙100203050統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)志變異指標(biāo)測定離散程度的意義極差平均差第二節(jié)離散程度的測度標(biāo)準(zhǔn)差離散系數(shù)異眾比率

描述數(shù)據(jù)離散程度采用的測度值,主要有異眾比率、極差、四分位差、平均差、方差和標(biāo)準(zhǔn)差,以及測度相對離散程度的離散系數(shù)等。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

標(biāo)志變異指標(biāo)(種類和計(jì)算)

異眾比率:又稱離異比率或變差比,是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,計(jì)算公式為:式中,為異眾比率;為變量值的總頻數(shù);眾數(shù)組的頻數(shù)。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

標(biāo)志變異指標(biāo)(種類和計(jì)算)一、異眾比率統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

異眾比率的作用是衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)的頻數(shù)組占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性就越好。

異眾比率軟飲料頻數(shù)頻率%可口可樂1938雪碧1326杏仁露816新騎士510醒目510總計(jì)5010050次購買軟飲料的頻數(shù)分布異眾比統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

極差是總體各單位標(biāo)志的最大值和最小值之差,也稱全距,表示某一總體全部變量值的變動范圍。

R=Xmax-Xmin

例:某班學(xué)生外語成績中,最低分為48分,最高分為96分。極差=96-48=48(分)統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

標(biāo)志變異指標(biāo)(種類和計(jì)算)二、極差

未分組數(shù)據(jù)和變量數(shù)列中單項(xiàng)數(shù)列:用數(shù)列中最大變量值減最小變量值。

在組距數(shù)列中:

R=最高組上限—最低組下限極差統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度日產(chǎn)量(件)工人數(shù)(人)5~1010~2020~3030~4040~50102440206合計(jì)100例:某車間工人日產(chǎn)量資料如下表所示:

最高上限=50,最低下限=5,全距R=50-5=45(件)

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度㈡極差的特點(diǎn):

1、離散程度的最簡單測度值計(jì)算簡便,也易于理解,在實(shí)際工作中適用于度量變化比較穩(wěn)定的現(xiàn)象的離中趨勢;

2、只表示總體變動的范圍,且易受極端值影響不能全面反映總體各單位標(biāo)志值的差異程度及分布狀況,也不能用來評價平均指標(biāo)的代表性。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度極差評價方法:

極差值越小,說明標(biāo)志變異程度越小,總體變量值分布越集中;極差值越大,說明標(biāo)志變異程度越大,總體變量值分布越分散。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度極差統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度極差的應(yīng)用

在實(shí)際工作中,極差又稱為“公差”,它是對產(chǎn)品質(zhì)量制訂的一個容許變化的界限,常用來檢查產(chǎn)品質(zhì)量的穩(wěn)定性和進(jìn)行質(zhì)量控制。在正常生產(chǎn)條件下,極差在一定范圍內(nèi)波動,若極差超過給定的范圍,就說明有異常情況出現(xiàn)。因此,利用極差有助于及時發(fā)現(xiàn)問題,以便采取措施,保證產(chǎn)品質(zhì)量。

又如,描述社會成員的收入水平差異,是在極差的基礎(chǔ)上,計(jì)算得出最高收入與最低收入間相差的倍數(shù)。

國家統(tǒng)計(jì)局調(diào)查資料顯示:2006年,我國城鎮(zhèn)居民中10%最高收入組家庭人均可支配收入為31967.34元,10%最低收入組家庭人均可支配收入為為3568.73元;最高收入組為最低收入組的8.98倍。若以城市最高收入組與農(nóng)村最低收入組比較,更是高逾20倍。例

四分位差:是指第三四分位數(shù)與第一四分位數(shù)之差,也稱為內(nèi)距或四分間距,用表示。四分位差的計(jì)算公式為:

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

四分位差反映了中間50%數(shù)據(jù)的離散程度。其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極值影響,因此,在某種程度上彌補(bǔ)了極差的一個缺陷。四分位差

回答類別甲城市乙城市頻數(shù)頻率%頻數(shù)頻率%非常不滿意不滿意一般滿意非常滿意2410893453083631151021997864387332621.312.7合計(jì)300100300100甲乙兩城市家庭對住房狀況評價頻數(shù)分布數(shù)據(jù)編碼:令非常不滿意為1;不滿意為2;一般為3;滿意為4;非常滿意為5。則:結(jié)果說明50%的家庭對住房狀況在滿意與不滿意之間。四分位差統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度QU=85QL=6718小時數(shù)燈泡數(shù)累積43-482248-531353-582558-63212663-68285468-73288273-783311578-832614183-882116288-931918193-981019198-1036197103-1082199108-1130199113-1181200200只燈泡使用壽命頻數(shù)分布表四分位差與盒形圖50%的觀測值集中于盒子之內(nèi)。盒子越窄,表明集中程度越高,即離散程度越低。QU=85QL=67四分位差

平均差是各總體單位標(biāo)志值與其算術(shù)平均數(shù)離差絕對值的算術(shù)平均數(shù)。反映的是各標(biāo)志值對其平均數(shù)的平均差異程度。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)志變異指標(biāo)(種類和計(jì)算)三、平均差

由于各變量值與其平均數(shù)離差之和等于零,所以,在計(jì)算平均差時,是取絕對值形式的。根據(jù)掌握數(shù)據(jù)資料不同,平均差的計(jì)算采用兩種不同形式。計(jì)算公式:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均差平均差(meandeviation)的特點(diǎn):平均差統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

1、綜合反映了總體各單位標(biāo)志值的差異程度,較全距為優(yōu);

2、數(shù)學(xué)性質(zhì)較差,不便于作數(shù)學(xué)處理和參與統(tǒng)計(jì)分析運(yùn)算,實(shí)際應(yīng)用中受到很大限制。評價方法:

平均差越小,標(biāo)志變異程度越小,總體變量值分布越集中,平均數(shù)的代表性便越大;平均差越大,標(biāo)志變異程度越大,總體變量值分布越分散,平均數(shù)的代表性便越小。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均差例題分析:某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(xi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—2040統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度返回平均差

含義:每一天的銷售量與平均數(shù)相比,平均相差17臺

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均差

班級同學(xué)成績分布統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均差解:統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度平均差

標(biāo)準(zhǔn)差是總體各單位標(biāo)志值與其算術(shù)平均數(shù)離差平方和的算術(shù)平均數(shù)的平方根。又稱為均方差。

標(biāo)準(zhǔn)差的實(shí)質(zhì)與平均差基本相同,只是在數(shù)學(xué)處理方法上與平均差不同。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度返回標(biāo)志變異指標(biāo)(種類和計(jì)算)四、標(biāo)準(zhǔn)差

之所以稱其為標(biāo)準(zhǔn)差,是因?yàn)樵谡龖B(tài)分布條件下,它和平均數(shù)有明確的數(shù)量關(guān)系,是真正度量離中趨勢的標(biāo)準(zhǔn)。

計(jì)算公式:根據(jù)掌握的數(shù)據(jù)資料不同,有簡單式和加權(quán)式兩種。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)準(zhǔn)差統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)準(zhǔn)差

方差是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的平均數(shù),通常以σ2表示。方差的計(jì)量單位不便于從經(jīng)濟(jì)意義上進(jìn)行解釋(方差的計(jì)量單位是標(biāo)志值計(jì)量單位的平方),所以實(shí)際統(tǒng)計(jì)工作中多用方差的算術(shù)平方根——標(biāo)準(zhǔn)差來測度統(tǒng)計(jì)數(shù)據(jù)的差異程度,標(biāo)準(zhǔn)差的計(jì)量單位與觀測值計(jì)量單位是一致的。

標(biāo)準(zhǔn)差(StandardDeviation)特點(diǎn):

1.用平方的方法消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問題,可方便地用于數(shù)學(xué)處理和統(tǒng)計(jì)分析運(yùn)算。

2.應(yīng)用最廣泛的離散程度測度值。

統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)準(zhǔn)差評價方法:

均方差越大,標(biāo)志變動程度越大,總體變量值分布越分散,平均數(shù)的代表性便越?。痪讲钤叫?,標(biāo)志變動程度越小,總體變量值分布越集中,平均數(shù)的代表性便越大。標(biāo)準(zhǔn)差統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度班級同學(xué)成績分布統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的作用

標(biāo)準(zhǔn)差可以用來度量相對位置和異常值的檢測。Z分?jǐn)?shù)

標(biāo)準(zhǔn)化的數(shù)值,標(biāo)明Xi

距離其平均數(shù)的標(biāo)準(zhǔn)差個數(shù)。

某學(xué)生期末考試時,數(shù)學(xué)成績?yōu)?5分,據(jù)此計(jì)算的Z分?jǐn)?shù)為0.5;英語成績?yōu)?0分,Z分?jǐn)?shù)也是0.5。則說明該學(xué)生兩科考試成績的相對位置是相同的,即都高于平均成績0.5個標(biāo)準(zhǔn)差。

一個數(shù)據(jù)集中某個或某幾個數(shù)據(jù)反常地大或小,一般稱其為極端值或異常值,應(yīng)當(dāng)進(jìn)一步加以檢查、鑒別。一般的建議是:凡Z分?jǐn)?shù)小于-3或大于+3的數(shù)據(jù)均可以被認(rèn)為是異常值。統(tǒng)計(jì)學(xué)——第5章數(shù)據(jù)分布特征的測度

質(zhì)量控制統(tǒng)計(jì)中控制圖的原理控制下限控制上限中心線

若數(shù)據(jù)落在控制線外,則認(rèn)為生產(chǎn)過程失去控制,判斷錯誤的概率小于0.5%。標(biāo)準(zhǔn)差的應(yīng)用68.27%95.45%99.73%返回

對于接近正態(tài)分布的數(shù)據(jù)集,有如下的經(jīng)驗(yàn)法則:

約68%的數(shù)據(jù)與平均數(shù)的距離在1個標(biāo)準(zhǔn)差之內(nèi);約95%的數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論