數(shù)據(jù)指標章統(tǒng)計數(shù)據(jù)的描述度量_第1頁
數(shù)據(jù)指標章統(tǒng)計數(shù)據(jù)的描述度量_第2頁
數(shù)據(jù)指標章統(tǒng)計數(shù)據(jù)的描述度量_第3頁
數(shù)據(jù)指標章統(tǒng)計數(shù)據(jù)的描述度量_第4頁
數(shù)據(jù)指標章統(tǒng)計數(shù)據(jù)的描述度量_第5頁
已閱讀5頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)指標章統(tǒng)計數(shù)據(jù)的描述度量第1頁,共61頁,2023年,2月20日,星期五數(shù)據(jù)分布的特征集中趨勢(位置)離中趨勢

(分散程度)偏態(tài)和峰度(形狀)2023/4/102第2頁,共61頁,2023年,2月20日,星期五數(shù)據(jù)分布的特征和測度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰度四分位差變異系數(shù)偏態(tài)四分位數(shù)2023/4/103第3頁,共61頁,2023年,2月20日,星期五§3.1度量集中趨勢的平均指標平均指標是說明社會經(jīng)濟現(xiàn)象一般水平

的統(tǒng)計指標,反映標志值分布的集中趨勢

平均指標按計算方式可分為數(shù)值平均數(shù)和位置平均數(shù)兩大類2023/4/104第4頁,共61頁,2023年,2月20日,星期五——是根據(jù)總體各單位所有標志值計算出的平均數(shù)。包括算術(shù)平均數(shù)、幾何平均數(shù)。(一)算術(shù)平均數(shù)(ArithmeticMean)算術(shù)平均數(shù)的基本公式一.數(shù)值平均數(shù)

2023/4/105第5頁,共61頁,2023年,2月20日,星期五

(1)簡單算術(shù)平均數(shù)算術(shù)平均數(shù)的計算

n—總體單位總數(shù);xi—第i

個單位的標志值。

xi

—第i組的代表值(組中值或該組變量值);

fi—第i組的頻數(shù)。(2)加權(quán)算術(shù)平均數(shù)

2023/4/106第6頁,共61頁,2023年,2月20日,星期五單項數(shù)列分組數(shù)列2023/4/107第7頁,共61頁,2023年,2月20日,星期五使用Excel函數(shù)求加權(quán)算術(shù)平均數(shù)利用Excel“數(shù)學和三角函數(shù)”中的SUMPRODUCT函數(shù)可以方便地計算出分組數(shù)據(jù)的加權(quán)算術(shù)平均數(shù)。語法規(guī)則:格式:SUMPRODUCT(<區(qū)域1>,<區(qū)域2>,…)功能:返回兩個或多個區(qū)域中對應元素乘積之和。

例:利用比特啤酒公司各銷售點分組頻數(shù)分布數(shù)據(jù),求各銷售點的平均銷售量。

2023/4/108第8頁,共61頁,2023年,2月20日,星期五2023/4/109第9頁,共61頁,2023年,2月20日,星期五(二)幾何平均數(shù)(GeometricMean)當統(tǒng)計資料是各時期的發(fā)展速度等前后期的兩兩環(huán)比數(shù)據(jù),要求每時期的平均發(fā)展速度時,就需要使用幾何平均數(shù)。幾何平均數(shù)是n個數(shù)連乘積的n次方根。1.簡單幾何平均數(shù)

2.加權(quán)幾何平均數(shù)fi—各比率出現(xiàn)的頻數(shù)

2023/4/1010第10頁,共61頁,2023年,2月20日,星期五例:某公司原料成本隨時間增長的情況如下表求原料成本的平均年增長率。解一:解二:

年平均增長率=1.0688-1=6.88%

2023/4/1011第11頁,共61頁,2023年,2月20日,星期五50%decrease100%increase算術(shù)平均數(shù):幾何平均數(shù):2023/4/1012第12頁,共61頁,2023年,2月20日,星期五使用Excel求幾何平均數(shù)可以使用Excel統(tǒng)計函數(shù)中的GEOMEAN函數(shù)返回幾何平均數(shù)語法規(guī)則:格式:GEOMEAN(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的幾何平均數(shù)。

2023/4/1013第13頁,共61頁,2023年,2月20日,星期五位置平均數(shù)是根據(jù)總體標志值所處的特殊位置確定的一類平均指標。包括中位數(shù)和眾數(shù)兩種。(一)中位數(shù)(Median)——將總體各單位標志值按由小到大的順序排列后處于中間位置的標志值稱為中位數(shù),記為Me

。中位數(shù)是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。當統(tǒng)計資料中含有異常的或極端的數(shù)據(jù)時,中位數(shù)比算術(shù)平均數(shù)更具有代表性。比如有5筆付款:9元,10元,10元,11元,60元付款的均值為20元,顯然這并不是一個很好的代表值,而中位數(shù)

Me

=10元則更能代表平均每筆的付款數(shù)。二.位置平均數(shù)2023/4/1014第14頁,共61頁,2023年,2月20日,星期五使用Excel的統(tǒng)計函數(shù)返回未分組數(shù)據(jù)的中位數(shù)可以使用Excel統(tǒng)計函數(shù)中的MEDIAN函數(shù)返回未分組數(shù)據(jù)的中位數(shù)。格式:MEDIAN(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的中位數(shù)。

0123456789100123456789101214Median=5Median=52023/4/1015第15頁,共61頁,2023年,2月20日,星期五分組數(shù)據(jù)中位數(shù)的確定

對于分組數(shù)據(jù)的統(tǒng)計資料,中位數(shù)要用插值法來估算。

(1)計算各組的累計頻數(shù);

(2)確定中位數(shù)所在的組

——是累計頻數(shù)首次包含中位數(shù)Σf/2的組。其中:L—中位數(shù)所在組的下限;

Sm-1—中位數(shù)所在組前一組的累計頻數(shù);

fm—中位數(shù)所在組的頻數(shù);

d—中位數(shù)所在組的組距。

2023/4/1016第16頁,共61頁,2023年,2月20日,星期五例:計算下表數(shù)據(jù)的中位數(shù)解:Σf/2=27.5,中位數(shù)在“15-25”的組中,

2023/4/1017第17頁,共61頁,2023年,2月20日,星期五(二)眾數(shù)(Mode)——是總體中出現(xiàn)次數(shù)最多的標志值,記為M

0。眾數(shù)明確反映了數(shù)據(jù)分布的集中趨勢,也是一種位置平均數(shù),不受極端數(shù)據(jù)的影響。但并非所有數(shù)據(jù)集合都有眾數(shù),也可能存在多個眾數(shù)。在某些情況下,眾數(shù)是一個較好的代表值。例如在服裝行業(yè)中,生產(chǎn)商、批發(fā)商和零售商在進行生產(chǎn)和存貨決策時,更感興趣的是最普遍的尺寸而不是平均尺寸。又如,當要了解大多數(shù)家庭的收入狀況時,也要用到眾數(shù)。

2023/4/1018第18頁,共61頁,2023年,2月20日,星期五眾數(shù)

(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

985

5多于一個眾數(shù)

原始數(shù)據(jù):2528

28

3642

422023/4/1019第19頁,共61頁,2023年,2月20日,星期五未分組數(shù)據(jù)眾數(shù)的確定在數(shù)據(jù)量很大的時候,可以使用Excel統(tǒng)計函數(shù)中的MODE函數(shù)返回眾數(shù)。格式:MODE(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)功能:返回所有參數(shù)中數(shù)據(jù)的眾數(shù)。

01234567891011121314Mode=92023/4/1020第20頁,共61頁,2023年,2月20日,星期五分組數(shù)據(jù)眾數(shù)的確定對于分組數(shù)據(jù)的統(tǒng)計資料,眾數(shù)也要用插值法來估算。(1)確定眾數(shù)所在的組對于等距分組,眾數(shù)組是頻數(shù)最高的組;(2)使用以下插值公式計算其中:L—眾數(shù)組的下限Δ1—眾數(shù)組與前一組的頻數(shù)之差Δ2—眾數(shù)組與后一組的頻數(shù)之差

d—眾數(shù)組的組距Δ1Δ2眾數(shù)Ld2023/4/1021第21頁,共61頁,2023年,2月20日,星期五例:計算下表數(shù)據(jù)的眾數(shù)解:眾數(shù)組是“15-25”的組,則

2023/4/1022第22頁,共61頁,2023年,2月20日,星期五三.算術(shù)平均數(shù)和位置平均數(shù)間的關(guān)系1.頻數(shù)分布呈完全對稱的單峰分布,算術(shù)平均數(shù)、中位數(shù)和眾數(shù)三者相同0xf(Me,M0)0xfMeM00xfMeM02.頻數(shù)分布為右偏態(tài)時,眾數(shù)小于中位數(shù),算術(shù)平均數(shù)大于中位數(shù)3.頻數(shù)分布為左偏態(tài)時,眾數(shù)大于中位數(shù),算術(shù)平均數(shù)小于中位數(shù)2023/4/1023第23頁,共61頁,2023年,2月20日,星期五補充習題補充題:某地區(qū)私營企業(yè)注冊資金分組資料如下,求該地區(qū)私營企業(yè)注冊資金的平均數(shù)、中位數(shù)和眾數(shù)。2023/4/1024第24頁,共61頁,2023年,2月20日,星期五

答案Σf/2=143/2=71.5,中位數(shù)所在“100~150”的組,眾數(shù)組為“100~150”的組,2023/4/1025第25頁,共61頁,2023年,2月20日,星期五四分位數(shù)(Quartile)(概念要點)1.

集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值

3.不受極端值的影響

4.可用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%2023/4/1026第26頁,共61頁,2023年,2月20日,星期五四分位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N42023/4/1027第27頁,共61頁,2023年,2月20日,星期五未分組數(shù)據(jù)四分位數(shù)的確定規(guī)則1

如果結(jié)果是整數(shù),四分位數(shù)等于那個整數(shù)位置的數(shù)據(jù)。規(guī)則2

如果結(jié)果是半數(shù)(如2.5,3.5等),四分位數(shù)等于相鄰有序數(shù)據(jù)的平均數(shù)。規(guī)則3

如果結(jié)果既不是整數(shù)又不是半數(shù),結(jié)果取最接近的整數(shù),并選數(shù)據(jù)。2023/4/1028第28頁,共61頁,2023年,2月20日,星期五數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(7個數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 3032 282526排序:2123

2526283032位置:1 23 4567QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=302023/4/1029第29頁,共61頁,2023年,2月20日,星期五數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(6個數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 30 282526排序:212325262830位置:1 2 3 4 56QL=23QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=282023/4/1030第30頁,共61頁,2023年,2月20日,星期五

Excel中四分位數(shù)的計算過程

2023/4/1031第31頁,共61頁,2023年,2月20日,星期五原始數(shù)據(jù):

2321 30 282526排序:212325262830位置:1 2 3 4 56QL=23+0.25*(25-23)=23.5QL位置=N-14=QU位置=3(N-1)4=4.75QU=26+0.75(28-26)=27.51+數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(6個數(shù)據(jù)的算例)2.251+2023/4/1032第32頁,共61頁,2023年,2月20日,星期五數(shù)值型分組數(shù)據(jù)的四分位數(shù)

上四分位數(shù):

下四分位數(shù):

2023/4/1033第33頁,共61頁,2023年,2月20日,星期五QL位置=50/4=12.5QU位置=3×50/4=37.5表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—數(shù)值型分組數(shù)據(jù)的四分位數(shù)

【例】根據(jù)第三章表中的數(shù)據(jù),計算50名工人日加工零件數(shù)的四分位數(shù)2023/4/1034第34頁,共61頁,2023年,2月20日,星期五五數(shù)匯總和箱線圖Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%12304557702023/4/1035第35頁,共61頁,2023年,2月20日,星期五右偏Right-Skewed左偏Left-SkewedSymmetric五數(shù)匯總和箱線圖2023/4/1036第36頁,共61頁,2023年,2月20日,星期五x頻數(shù)要分析總體的分布規(guī)律,僅了解中心趨勢指標是不夠的,還需要了解數(shù)據(jù)的離散程度或差異狀況。幾個總體可以有相同的均值,但取值情況卻可以相差很大。

變異指標就是用來表示數(shù)據(jù)離散程度特征的。變異指標主要有:極差、平均差、標準差、變異系數(shù)和Z值。

§3.2度量離散程度的指標2023/4/1037第37頁,共61頁,2023年,2月20日,星期五【案例】道格拉斯公司應如何選擇供應商道森公司和克拉克公司是道格拉斯公司的兩家供貨商。兩家供貨商都表示大約需要10個工作日交付定貨。下表是兩家供應商定貨交付時間的歷史數(shù)據(jù)。今后道格拉斯公司應選擇哪家供應商供貨?2023/4/1038第38頁,共61頁,2023年,2月20日,星期五一.極差(Range)極差也稱全距,是一組數(shù)據(jù)的最大值和最小值之差,通常記為R。顯然,一組數(shù)據(jù)的差異越大,其極差也越大。極差是最簡單的變異指標,它廣泛應用于產(chǎn)品質(zhì)量管理中控制質(zhì)量的差異,一旦發(fā)現(xiàn)超過控制范圍,就采取措施加以糾正,以保證產(chǎn)品質(zhì)量的穩(wěn)定。但極差有很大的局限性,它僅考慮了兩個極端的數(shù)據(jù),沒有利用其余數(shù)據(jù)的信息,因而是一種比較粗糙的變異指標。

2023/4/1039第39頁,共61頁,2023年,2月20日,星期五第40頁,共61頁,2023年,2月20日,星期五2023/4/1041第41頁,共61頁,2023年,2月20日,星期五D4andD3arefromTable(n=5)第42頁,共61頁,2023年,2月20日,星期五UCL=8.232024681234567MinutesDayLCL=0R=3.894_Conclusion:Variationisincontrol2023/4/1043第43頁,共61頁,2023年,2月20日,星期五二、四分位差

1. 離散程度的測度值之一2. 也稱為內(nèi)距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差

QD

=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性2023/4/1044第44頁,共61頁,2023年,2月20日,星期五二、四分位差Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%1230455770Interquartilerange=57–30=272023/4/1045第45頁,共61頁,2023年,2月20日,星期五第46頁,共61頁,2023年,2月20日,星期五三.平均差平均差是各數(shù)據(jù)與其均值離差絕對值的算術(shù)平均數(shù),通常記為A·D。

平均差越大,反映數(shù)據(jù)間的差異越大。但由于使用了絕對值,其數(shù)學性質(zhì)很差,因而很少使用。

2023/4/1047第47頁,共61頁,2023年,2月20日,星期五四.方差(Variance)和標準差(StandardDeviation)方差和標準差是應用得最為廣泛的變異指標。標準差是方差的算術(shù)平方根,也稱均方差或根方差。

應注意總體方差、標準差與樣本方差、標準差是有區(qū)別的。1.總體方差(PopulationVariance)和總體標準差(PopulationStandardDeviation)總體方差是各總體數(shù)據(jù)與其均值差平方的均值,記為

2,總體標準差記為。2023/4/1048第48頁,共61頁,2023年,2月20日,星期五2.樣本方差與樣本標準差樣本方差記為

S

2,樣本標準差記為

S,在推斷統(tǒng)計中,它們分別是總體方差和標準差的優(yōu)良估計。其中:n為樣本容量,Xi為樣本觀察值為樣本均值。

2023/4/1049第49頁,共61頁,2023年,2月20日,星期五未分組數(shù)據(jù)方差和標準差的計算方差和標準差的手工計算非常煩瑣,只要求掌握以下兩種方法。(1)使用Excel的統(tǒng)計函數(shù) ①VARP(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的總體方差。 ②STDEVP(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的總體標準差。 ③VAR(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的樣本方差。 ④STDEV(<區(qū)域或數(shù)組1>,<區(qū)域或數(shù)組2>,…)

功能:返回所有參數(shù)中數(shù)據(jù)的樣本標準差。

2023/4/1050第50頁,共61頁,2023年,2月20日,星期五分組數(shù)據(jù)的方差與標準差如果得到的是分組的頻數(shù)分布數(shù)據(jù),則方差與標準差的公式如下:其中Xi

是第i

組的組中值或標志值。

2023/4/1051第51頁,共61頁,2023年,2月20日,星期五變異系數(shù)在對上海和南京兩地居民生活質(zhì)量調(diào)查發(fā)現(xiàn),上海居民平均月收入1800元,標準差為180元;南京居民平均月收入1200元,標準差為160元。問兩地居民收入差距哪個更大?2023/4/1052第52頁,共61頁,2023年,2月20日,星期五Z值通常,Z值小于-3.0或大于+3.0時,認為數(shù)據(jù)中含有極端值2023/4/1053第53頁,共61頁,2023年,2月20日,星期五是非標志的平均數(shù)和標準差在對社會經(jīng)濟現(xiàn)象進行分析時,經(jīng)常要將總體的所有單位按是否具有某種屬性劃分為兩組,即“是”與“非”的兩組。如將學生按性別分組,將產(chǎn)品按合格與否分組。又如在民意調(diào)查中,將被調(diào)查者按是否支持某位侯選人或是否贊成某項政策分為兩組等等。

2023/4/1054第54頁,共61頁,2023年,2月20日,星期五(1)比例的概念——比例是指具有某種性質(zhì)或?qū)傩缘膯挝粩?shù)占總體全部單位數(shù)的比重(也稱成數(shù)),記為P。N1——總體中具有某一屬性的單位數(shù);N——總體單位總數(shù)。如產(chǎn)品中的次品率;全部人口或某單位職工中男、女的比率;某地區(qū)全部家庭中高(如月收入≥10000元)、中、低(月收入≤1000元)收入家庭各占的比重等。

2023/4/1055第55頁,共61頁,2023年,2月20日,星期五(2)比例的平均數(shù)要計算比例的平均數(shù),需要將是非標志的標志表現(xiàn)進行量化處理。記1—代表具有某種屬性的標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論