第四章數(shù)據(jù)概括性度量伍_第1頁
第四章數(shù)據(jù)概括性度量伍_第2頁
第四章數(shù)據(jù)概括性度量伍_第3頁
第四章數(shù)據(jù)概括性度量伍_第4頁
第四章數(shù)據(jù)概括性度量伍_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、4 -,1,第,4,章,數(shù)據(jù)的概括性度量,4 -,2,第,4,章,數(shù)據(jù)的概括性度量,4.1,集中趨勢的度量,4.2,離散程度的度量,4.3,偏態(tài)與峰度的度量,4 -,3,學習目標,1.,集中趨勢各測度值的計算方法,2.,集中趨勢各測度值的特點及應用場合,3.,離散程度各測度值的計算方法,4.,離散程度各測度值的特點及應用場合,5.,偏態(tài)與峰態(tài)的測度方法,6.,用,excel,計算描述統(tǒng)計量并進行分析,4 -,4,數(shù)據(jù)分布的特征,集中趨勢,(,位置,),偏態(tài)和峰態(tài),(形狀),離中趨勢,(,分散程度,),4 -,5,數(shù)據(jù)的概括性度量,數(shù)據(jù)特征的測度,分布的形狀,集中趨勢,離散程度,眾,數(shù),中位數(shù),

2、均,值,離散系數(shù),方差和標準差,峰,態(tài),四分位差,異眾比率,偏,態(tài),4 -,6,4.1,集中趨勢的度量,一,.,分類數(shù)據(jù):眾數(shù),二,.,順序數(shù)據(jù):中位數(shù)和分位數(shù),三,.,數(shù)值型數(shù)據(jù):均值,四,.,眾數(shù)、中位數(shù)和均值的比較,4 -,7,數(shù)據(jù)分布特征的和度量,(,本節(jié)位置,),數(shù)據(jù)的特征和度量,分布的形狀,集中趨勢,離散程度,眾,數(shù),中位數(shù),均,值,離散系數(shù),方差和標準差,峰,態(tài),四分位差,異眾比率,偏,態(tài),4 -,8,集中趨勢,(Central tendency),1.,一組數(shù)據(jù)向其中心值靠攏的傾向和程度,2.,測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值,3.,不同類型的數(shù)據(jù)用不同的集中趨勢測

3、度值,4.,低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高,層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù),4 -,9,分類數(shù)據(jù):眾數(shù),4 -,10,眾數(shù),(mode),1.,出現(xiàn)次數(shù)最多的變量值,2.,不受極端值的影響,3.,一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù),4.,主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和,數(shù)值型數(shù)據(jù),4 -,11,眾數(shù),(,不唯一性,),無眾數(shù),原始數(shù)據(jù),: 10 5 9 12 6,8,一個眾數(shù),原始數(shù)據(jù),: 6,5,9 8,5 5,多于一個眾數(shù),原始數(shù)據(jù),: 25,28 28,36,42 42,4 -,12,分類數(shù)據(jù)的眾數(shù),(,例題分析,),不同品牌飲料的頻數(shù)分布,飲料品牌,頻數(shù)

4、,比例,百分比,(%),可口可樂,旭日升冰茶,百事可樂,匯源果汁,露露,15,11,9,6,9,0.30,0.22,0.18,0.12,0.18,30,22,18,12,18,合計,50,1,100,解,:,這里的變量為“飲料,品牌”,這是個分類變量,,不同類型的飲料就是變,量值,在所調(diào)查的,50,人中,,購買可口可樂的人數(shù)最多,,為,15,人,占總被調(diào)查,人數(shù)的,30%,,因此眾數(shù)為,“可口可樂”這一品牌,,即,M,o,可口可樂,4 -,13,順序數(shù)據(jù)的眾數(shù),(,例題分析,),解:,這里的數(shù)據(jù)為,順序數(shù)據(jù)。變量為,“回答類別”,甲,城,市,中,對,住,房表示不滿意的戶,數(shù),最,多,,,為,1

5、08,戶,,因此眾數(shù)為“不,滿意”這一類別,,即,M,o,不滿意,甲城市家庭對住房狀況評價的頻數(shù)分布,回答類別,甲城市,戶數(shù),(,戶,),百分比,(%),非常不滿意,不滿意,一般,滿意,非常滿意,24,108,93,45,30,8,36,31,15,10,合計,300,100.0,4 -,14,順序數(shù)據(jù):中位數(shù)和分位數(shù),4 -,15,中位數(shù),(median),1.,排序后處于中間位置上的值,M,e,50%,50%,2.,不受極端值的影響,3.,主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能,用于分類數(shù)據(jù),4.,各變量值與中位數(shù)的離差絕對值之和最小,即,min,1,?,?,?,?,n,i,e,i,M

6、,x,4 -,16,中位數(shù),(,位置的確定,),原始數(shù)據(jù):,順序數(shù)據(jù):,2,1,?,?,n,中位數(shù)位置,2,n,?,中位數(shù)位置,4 -,17,順序數(shù)據(jù)的中位數(shù),(,例題分析,),解:,中位數(shù)的位置為,300/2,150,從,累,計,頻,數(shù),看,,,中位數(shù)在“一般”這,一組別中。因此,M,e,=,一般,甲城市家庭對住房狀況評價的頻數(shù)分布,回答類別,甲城市,戶數(shù),(,戶,),累計頻數(shù),非常不滿意,不滿意,一般,滿意,非常滿意,24,108,93,45,30,24,132,225,270,300,合計,300,4 -,18,數(shù)值型數(shù)據(jù)的中位數(shù),(9,個數(shù)據(jù)的算例,),【例】:,9,個家庭的人均月收入

7、數(shù)據(jù),原始數(shù)據(jù),:,1500 750 780 1080 850 960 2000 1250 1630,排,序,:,750 780 850 960 1080 1250 1500 1630 2000,位,置,:,1 2 3 4,5,6 7 8 9,中位數(shù),?,1080,?,5,2,1,9,2,1,?,?,?,?,?,n,位置,4 -,19,數(shù)值型數(shù)據(jù)的中位數(shù),(10,個數(shù)據(jù)的算例,),【例】:,10,個家庭的人均月收入數(shù)據(jù),排,序,:,660,750 780 850 960 1080 1250 1500 1630 2000,位,置,:,1 2 3 4,5,6,7 8 9 10,?,5,.,5,2,

8、1,10,2,1,?,?,?,?,?,n,位置,1020,2,1080,960,?,?,?,中位數(shù),4 -,20,四分位數(shù),(quartile),1.,排序后處于,25%,和,75%,位置上的值,2.,不受極端值的影響,3.,主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),,但不能用于分類數(shù)據(jù),Q,L,Q,M,Q,U,25%,25%,25%,25%,4 -,21,四分位數(shù),(,位置的確定,),原始數(shù)據(jù):,?,?,?,?,?,?,?,?,?,?,?,4,),1,(,3,4,1,n,Q,n,Q,U,L,位置,位置,順序數(shù)據(jù):,?,?,?,?,?,?,?,?,?,4,3,4,n,Q,n,Q,U,L,位置,位置

9、,4 -,22,順序數(shù)據(jù)的四分位數(shù),(,例題分析,),解:,Q,L,位置,=,(300)/4,=75,Q,U,位置,=(3,300)/4,=225,從累計頻數(shù)看,,Q,L,在“,不滿意”這一組別中;,Q,U,在“一般”這一組別中。因,此,Q,L,=,不滿意,Q,U,=,一般,甲城市家庭對住房狀況評價的頻數(shù)分布,回答類別,甲城市,戶數(shù),(,戶,),累計頻數(shù),非常不滿意,不滿意,一般,滿意,非常滿意,24,108,93,45,30,24,132,225,270,300,合計,300,4 -,23,數(shù)值型數(shù)據(jù)的四分位數(shù),(9,個數(shù)據(jù)的算例,),【例】:,9,個家庭的人均月收入數(shù)據(jù),原始數(shù)據(jù),:,15

10、00 750 780 1080 850 960 2000 1250 1630,排,序,:,750 780 850 960 1080 1250 1500 1630 2000,位,置,:,1,2 3,4,5,6,7 8,9,?,5,.,7,4,),1,9,(,3,5,.,2,4,1,9,?,?,?,?,?,?,位置,位置,U,L,Q,Q,?,1565,2,1630,1500,815,2,850,780,?,?,?,?,?,?,U,L,Q,Q,4 -,24,數(shù)值型數(shù)據(jù)的四分位數(shù),(10,個數(shù)據(jù)的算例,),【例】:,10,個家庭的人均月收入數(shù)據(jù),排,序,:,660,750 780 850 960 10

11、80 1250 1500 1630 2000,位,置,:,1,2 3,4,5 6,7,8 9,10,?,25,.,8,4,),1,10,(,3,75,.,2,4,1,10,?,?,?,?,?,?,位置,位置,U,L,Q,Q,5,.,1532,),1500,1630,(,25,.,0,1500,5,.,772,),750,780,(,75,.,0,750,?,?,?,?,?,?,?,?,?,?,U,L,Q,Q,?,4 -,25,數(shù)值型數(shù)據(jù):均值,4 -,26,均值,(mean),1.,集中趨勢的最常用測度值,2.,一組數(shù)據(jù)的均衡點所在,3.,體現(xiàn)了數(shù)據(jù)的必然性特征,4.,易受極端值的影響,5.,

12、用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順,序數(shù)據(jù),4 -,27,簡單均值與加權(quán)均值,(simple mean / weighted mean),設一組數(shù)據(jù)為:,x,1,,,x,2,,,,,x,n,各組的組中值為:,M,1,,,M,2,,,,,M,k,相應的頻數(shù)為:,f,1,,,f,2,,,,,f,k,簡單均值,n,x,n,x,x,x,x,n,i,i,n,?,?,?,?,?,?,?,1,2,1,?,n,f,M,f,f,f,f,M,f,M,f,M,x,k,i,i,i,k,k,k,?,?,?,?,?,?,?,?,?,?,1,2,1,2,2,1,1,?,?,加權(quán)均值,4 -,28,已改至此!,某電腦公司銷

13、售量數(shù)據(jù)分組表,按銷售量分組,組中值,(M,i,),頻數(shù),(f,i,),M,i,f,i,140150,150160,160170,170180,180190,190200,200210,210220,220230,230240,145,155,165,175,185,195,205,215,225,235,4,9,16,27,20,17,10,8,4,5,580,1395,2640,4725,3700,3315,2050,1720,900,1175,合計,120,22200,185,120,22200,1,?,?,?,?,?,n,f,M,x,k,i,i,i,加權(quán)均值,(,例題分析,),4 -,

14、29,加權(quán)均值,(,權(quán)數(shù)對均值的影響,),甲乙兩組各有,10,名學生,他們的考試成績及其分布數(shù)據(jù)如下,甲組:,考試成績(,x,),:,0 20 100,人數(shù)分布(,f,):,1 1 8,乙組:,考試成績(,x,),:,0 20 100,人數(shù)分布(,f,):,8 1 1,),(,82,10,8,100,1,20,1,0,1,分,甲,?,?,?,?,?,?,?,?,?,?,n,x,x,n,i,i,),(,12,10,1,100,1,20,8,0,1,分,乙,?,?,?,?,?,?,?,?,?,?,n,x,x,n,i,i,4 -,30,均值,(,數(shù)學性質(zhì),),1.,各變量值與均值的離差之和等于零,2

15、.,各變量值與均值的離差平方和最小,?,?,?,?,n,i,i,x,x,1,2,min,),(,?,?,?,?,n,i,i,x,x,1,0,),(,4 -,31,調(diào)和平均數(shù),(harmonic mean),1.,均值的另一種表現(xiàn)形式,2.,易受極端值的影響,3.,計算公式為,?,?,?,?,?,?,i,i,i,i,i,i,i,i,m,f,f,M,M,f,M,f,M,H,4 -,32,調(diào)和平均數(shù),(,例題分析,),某日三種蔬菜的批發(fā)成交數(shù)據(jù),蔬菜,名稱,批發(fā)價格,(,元,),M,i,成交額,(,元,),M,i,f,i,成交量,(,公斤,),f,i,甲,乙,丙,1.20,0.50,0.80,180

16、00,12500,6400,15000,25000,8000,合計,36900,48000,【例,】,某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三,種蔬菜該日的平均批發(fā)價格,(元),批發(fā)價格,成交額,成交額,769,.,0,48000,36900,?,?,?,?,m,H,4 -,33,幾何平均數(shù),(geometric mean),1.,n,個變量值乘積的,n,次方根,2.,適用于對比率數(shù)據(jù)的平均,3.,主要用于計算平均增長率,4.,計算公式為,5.,可看作是均值的一種變形,n,n,i,i,n,n,m,x,x,x,x,G,?,?,?,?,?,?,?,1,2,1,?,n,x,x,x,x,n,G,

17、n,i,i,n,m,?,?,?,?,?,?,?,1,2,1,lg,),lg,lg,(lg,1,lg,?,4 -,34,幾何平均數(shù),(,例題分析,),【例】,某水泥生產(chǎn)企業(yè),1999,年的水泥產(chǎn)量為,100,萬,噸,,,2000,年,與,1999,年,相,比,增,長,率,為,9%,,,2001,年與,2000,年相比增長率為,16%,,,2002,年與,2001,年相比增長率為,20%,。求各年的年平均增,長率。,%,91,.,114,%,120,%,116,%,109,3,2,1,?,?,?,?,?,?,?,?,n,n,m,x,x,x,G,?,年平均增長率,114.91%-1=,14.91%,

18、4 -,35,幾何平均數(shù),(,例題分析,),【例】,一位投資者購持有一種股票,在,2000,、,2001,、,2002,和,2003,年收益率分別為,4.5%,、,2.1%,、,25.5%,、,1.9%,。計算該投資者在這四年內(nèi)的平,均收益率,%,0787,.,8,1,%,9,.,101,%,5,.,125,%,1,.,102,%,5,.,104,4,?,?,?,?,?,?,G,算術(shù)平均:,?,?,%,5,.,8,4,%,9,.,1,%,5,.,25,%,1,.,2,%,5,.,4,?,?,?,?,?,?,G,幾何平均:,4 -,36,眾數(shù)、中位數(shù)和均值的比較,4 -,37,眾數(shù)、中位數(shù)和均值

19、的關系,左偏分布,均值,中位數(shù),眾數(shù),對稱分布,均值,=,中位數(shù),=,眾數(shù),右偏分布,眾數(shù),中位數(shù),均值,4 -,38,眾數(shù)、中位數(shù)和均值的,特點和應用,1.,眾數(shù),?,不受極端值影響,?,具有不唯一性,?,數(shù)據(jù)分布偏斜程度較大時應用,2.,中位數(shù),?,不受極端值影響,?,數(shù)據(jù)分布偏斜程度較大時應用,3.,平均數(shù),?,易受極端值影響,?,數(shù)學性質(zhì)優(yōu)良,?,數(shù)據(jù)對稱分布或接近對稱分布時應用,4 -,39,數(shù)據(jù)類型與集中趨勢測度值,數(shù)據(jù)類型和所適用的集中趨勢測度值,數(shù)據(jù)類型,分類數(shù)據(jù),順序數(shù)據(jù),間隔數(shù)據(jù),比率數(shù)據(jù),適,用,的,測,度,值,眾數(shù),中位數(shù),均值,均值,四分位數(shù),眾數(shù),調(diào)和平均數(shù),眾數(shù),

20、中位數(shù),幾何平均數(shù),四分位數(shù),中位數(shù),四分位數(shù),眾數(shù),4 -,40,4.2,離散程度的度量,一.分類數(shù)據(jù):異眾比率,二.順序數(shù)據(jù):四分位差,三.數(shù)值型數(shù)據(jù):方差及標準差,四.相對位置的測量:標準分數(shù),五.相對離散程度:離散系數(shù),4 -,41,數(shù)據(jù)的特征和度量,(,本節(jié)位置,),數(shù)據(jù)的特征和度量,分布的形狀,離散程度,集中趨勢,眾,數(shù),中位數(shù),均,值,離散系數(shù),方差和標準差,峰,度,四分位差,異眾比率,偏,態(tài),4 -,42,離中趨勢,1.,數(shù)據(jù)分布的另一個重要特征,2.,反映各變量值遠離其中心值的程度(離散程度),3.,從另一個側(cè)面說明了集中趨勢測度值的代表程度,4.,不同類型的數(shù)據(jù)有不同的離散

21、程度測度值,4 -,43,分類數(shù)據(jù):異眾比率,4 -,44,異眾比率,(variation ratio),1.,對分類數(shù)據(jù)離散程度的測度,2.,非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,3.,計算公式為,4.,用于衡量眾數(shù)的代表性,?,?,?,?,?,?,?,i,m,i,m,i,r,f,f,f,f,f,v,1,4 -,45,異眾比率,(,例題分析,),解:,在所調(diào)查的,50,人當中,購,買,其,他,品,牌,飲,料,的,人,數(shù),占,70%,,異眾比率比較大。因,此,用“可口可樂”代表消,費者購買飲料品牌的狀況,,其代表性不是很好,%,70,7,.,0,50,15,1,50,15,50,?,?,?,?,?,?

22、,r,v,不同品牌飲料的頻數(shù)分布,飲料品牌,頻數(shù),比例,百分比,(%),可口可樂,旭日升冰茶,百事可樂,匯源果汁,露露,15,11,9,6,9,0.30,0.22,0.18,0.12,0.18,30,22,18,12,18,合計,50,1,100,4 -,46,順序數(shù)據(jù):四分位差,4 -,47,四分位差,(quartile deviation),1.,對順序數(shù)據(jù)離散程度的測度,2.,也稱為內(nèi)距或四分間距,3.,上四分位數(shù)與下四分位數(shù)之差,Q,D,=,Q,U,Q,L,4.,反映了中間,50%,數(shù)據(jù)的離散程度,5.,不受極端值的影響,6.,用于衡量中位數(shù)的代表性,4 -,48,四分位差,(,例題分

23、析,),解:,設非常不滿意為,1,不滿意為,2,一般為,3,滿意為,4,非常滿,意為,5,已知,Q,L,=,不滿意,=,2,Q,U,=,一般,=,3,四分位差:,Q,D,=,Q,U,-,Q,L,=,3,2,=,1,甲城市家庭對住房狀況評價的頻數(shù)分布,回答類別,甲城市,戶數(shù),(,戶,),累計頻數(shù),非常不滿意,不滿意,一般,滿意,非常滿意,24,108,93,45,30,24,132,225,270,300,合計,300,4 -,49,數(shù)值型數(shù)據(jù):方差和標準差,4 -,50,極差,(range),1.,一組數(shù)據(jù)的最大值與最小值之差,2.,離散程度的最簡單測度值,3.,易受極端值影響,4.,未考慮數(shù)

24、據(jù)的分布,7,8,9,10,7,8,9,10,R,= max(,x,i,) -,min(,x,i,),5.,計算公式為,4 -,51,平均差,(mean deviation),1.,各變量值與其均值離差絕對值的平均數(shù),2.,能全面反映一組數(shù)據(jù)的離散程度,3.,數(shù)學性質(zhì)較差,實際中應用較少,4.,計算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),n,x,x,M,n,i,i,d,?,?,?,?,1,n,f,x,M,M,k,i,i,i,d,?,?,?,?,1,4 -,52,平均差,(,例題分析,),某電腦公司銷售量數(shù)據(jù)平均差計算表,按銷售量分組,組中值,(,M,i,),頻數(shù),(,f,i,),140,150,15

25、0,160,160,170,170,180,180,190,190,200,200,210,210,220,220,230,230,240,145,155,165,175,185,195,205,215,225,235,4,9,16,27,20,17,10,8,4,5,40,30,20,10,0,10,20,30,40,50,160,270,320,270,0,170,200,240,160,250,合計,120,2040,x,M,i,?,i,i,f,x,M,?,4 -,53,平均差,(,例題分析,),),(,17,120,2040,1,臺,?,?,?,?,?,?,n,f,x,M,M,k,i,

26、i,i,d,含義:,每一天的銷售量平均數(shù)相比,,平均相差,17,臺,4 -,54,方差和標準差,(variance,and standard deviation),1.,數(shù)據(jù)離散程度的最常用測度值,2.,反映了各變量值與均值的平均差異,3.,根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標,準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方,差或標準差,4 6 8 10 12,?,x,=,8.3,4 -,55,樣本方差和標準差,(simple variance,and standard deviation),未分組數(shù)據(jù):,組距分組數(shù)據(jù):,未分組數(shù)據(jù):,組距分組數(shù)據(jù):,方差的計算公式,標準差的計算公式,注意:,樣本方差用

27、自,由度,n-1,去除,!,1,),(,1,2,2,?,?,?,?,?,n,x,x,s,n,i,i,1,),(,1,2,2,?,?,?,?,?,n,f,x,M,s,k,i,i,i,1,),(,1,2,?,?,?,?,?,n,x,x,s,n,i,i,1,),(,1,2,?,?,?,?,?,n,f,x,M,s,k,i,i,i,4 -,56,樣本方差,自由度,(degree of freedom),1.,一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù),2.,當樣本數(shù)據(jù)的個數(shù)為,n,時,若樣本均值,?,x,確定后,,只有,n,-1,個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則,不能自由取值,3.,例如,樣本有,3,個數(shù)

28、值,即,x,1,=2,,,x,2,=4,,,x,3,=9,,,則,?,x,=,5,。當,?,x,=,5,確定后,,x,1,,,x,2,和,x,3,有兩個數(shù)據(jù)可以,自由取值,另一個則不能自由取值,比如,x,1,=6,,,x,2,=7,,那么,x,3,則必然取,2,,而不能取其他值,4.,樣本方差用自由度去除,其原因可從多方面來解釋,,從實際應用角度看,在抽樣估計中,當用樣本方,差去估計總體方差,2,時,它是,2,的無偏估計量,4 -,57,樣本標準差,(,例題分析,),某電腦公司銷售量數(shù)據(jù)平均差計算表,按銷售量分組,組中值,(,M,i,),頻數(shù),(,f,i,),140,150,150,160,1

29、60,170,170,180,180,190,190,200,200,210,210,220,220,230,230,240,145,155,165,175,185,195,205,215,225,235,4,9,16,27,20,17,10,8,4,5,40,30,20,10,0,10,20,30,40,50,160,270,320,270,0,170,200,240,160,250,合計,120,55400,?,?,2,x,M,i,?,?,?,i,i,f,x,M,2,?,4 -,58,樣本標準差,(,例題分析,),含義:,每一天的銷售量與平均數(shù)相比,,平均相差,21.58,臺,),(,58

30、,.,21,1,120,55400,1,),(,1,2,臺,?,?,?,?,?,?,?,?,n,f,x,M,s,k,i,i,i,4 -,59,相對位置的測量:標準分數(shù),4 -,60,標準分數(shù),(standard score,),1.,也稱標準化值,2.,對某一個值在一組數(shù)據(jù)中相對位置的度量,3.,可用于判斷一組數(shù)據(jù)是否有離群點,4.,用于對變量的標準化處理,5.,計算公式為,s,x,x,z,i,i,?,?,4 -,61,標準分數(shù),(,性質(zhì),),1.,均值等于,0,2.,方差等于,1,0,0,1,),(,1,?,?,?,?,?,?,?,?,?,s,n,s,x,x,n,n,z,z,i,i,1,),

31、(,1,),0,(,),(,2,2,2,2,2,2,2,2,?,?,?,?,?,?,?,?,?,?,?,?,?,?,s,s,s,x,x,n,n,z,n,z,n,z,z,s,i,i,i,z,n-1,n-1,n-1,n-1,4 -,62,標準分數(shù),(,性質(zhì),),z,分數(shù)只是將原始數(shù)據(jù)進行了線性變換,它并沒有,改變一個數(shù)據(jù)在改組數(shù)據(jù)中的位置,也沒有改變該,組數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?0,,標準差為,1,。,4 -,63,標準化值,(,例題分析,),9,個家庭人均月收入標準化值計算表,家庭編號,人均月收入(元),標準化值,z,1,2,3,4,5,6,7,8,9,1500,750,780

32、,1080,850,960,2000,1250,1630,0.695,-1.042,-0.973,-0.278,-0.811,-0.556,1.853,0.116,0.996,4 -,64,經(jīng)驗法則,?,經(jīng)驗法則表明:當一組數(shù)據(jù)對稱分布時,?,約有,68%,的數(shù)據(jù)在平均數(shù)加減,1,個標準差,的范圍之內(nèi),?,約有,95%,的數(shù)據(jù)在平均數(shù)加減,2,個標準差,的范圍之內(nèi),?,約有,99%,的數(shù)據(jù)在平均數(shù)加減,3,個標準差,的范圍之內(nèi),4 -,65,切比雪夫不等式,(,Chebyshevs inequality,),1.,如果一組數(shù)據(jù)不是對稱分布,經(jīng)驗法則就不,再使用,這時可使用切比雪夫不等式,它對,

33、任何分布形狀的數(shù)據(jù)都適用,2.,切比雪夫不等式提供的是“下界”,也就是,“所占比例至少和多少”,3.,對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不,等式,至少有,的數(shù)據(jù)落在,k,個標準差之,內(nèi)。其中,k,是大于,1,的任意值,但不一定是整,數(shù),?,?,2,1,1,k,?,4 -,66,切比雪夫不等式,(,Chebyshevs inequality,),?,對于,k,=2,,,3,,,4,,該不等式的含義是,1.,至少有,75%,的數(shù)據(jù)落在平均數(shù)加減,2,個標,準差的范圍之內(nèi),2.,至少有,89%,的數(shù)據(jù)落在平均數(shù)加減,3,個標,準差的范圍之內(nèi),3.,至少有,94%,的數(shù)據(jù)落在平均數(shù)加減,4,個標,準

34、差的范圍之內(nèi),4 -,67,相對離散程度:離散系數(shù),4 -,68,離散系數(shù),(coefficient of variation),1.,標準差與其相應的均值之比,2.,對數(shù)據(jù)相對離散程度的測度,3.,消除了數(shù)據(jù)水平高低和計量單位的影響,4.,用于對不同組別數(shù)據(jù)離散程度的比較,5.,計算公式為,x,s,v,s,?,4 -,69,離散系數(shù),(,例題分析,),某管理局所屬,8,家企業(yè)的產(chǎn)品銷售數(shù)據(jù),企業(yè)編號,產(chǎn)品銷售額(萬元),x,1,銷售利潤(萬元),x,2,1,2,3,4,5,6,7,8,170,220,390,430,480,650,950,1000,8.1,12.5,18.0,22.0,26

35、.5,40.0,64.0,69.0,【,例,】,某管理局抽查了所屬的,8,家企業(yè),其產(chǎn)品銷售數(shù),據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度,4 -,70,離散系數(shù),(,例題分析,),結(jié)論:,計算結(jié)果表明,,v,1,v,2,,說明產(chǎn)品銷售額,的離散程度小于銷售利潤的離散程度,v,1,=,536.25,309.19,=,0.577,),(,19,.,309,),(,25,.,536,1,1,萬元,萬元,?,?,s,x,v,2,=,32.5215,23.09,=,0.710,),(,09,.,23,),(,5215,.,32,2,2,萬元,萬元,?,?,s,x,4 -,71,數(shù)據(jù)類型與離散程度測度

36、值,數(shù)據(jù)類型和所適用的離散程度測度,值,數(shù)據(jù)類型,分類數(shù)據(jù),順序數(shù)據(jù),數(shù)值型數(shù)據(jù),適,用,的,測,度,值,異眾比率,四分位差,方差或標準差,異眾比率,離散系數(shù)(比較時用),平均差,極差,四分位差,異眾比率,4 -,72,4.3,偏態(tài)與峰態(tài)的度量,一,.,偏態(tài)及其度量,二,.,峰態(tài)及其度量,4 -,73,數(shù)據(jù)的特征和度量,(,本節(jié)位置,),數(shù)據(jù)的特征和度量,分布的形狀,離散程度,眾,數(shù),中位數(shù),均,值,離散系數(shù),方差和標準差,峰,度,四分位差,異眾比率,偏,態(tài),集中趨勢,4 -,74,偏態(tài)與峰態(tài)分布的形狀,扁平分布,尖峰分布,偏態(tài),峰態(tài),左偏分布,右偏分布,與標準正態(tài),分布比較!,4 -,75,

37、偏,態(tài),4 -,76,偏態(tài),(skewness),1.,統(tǒng)計學家,Pearson,于,1895,年首次提出,2.,數(shù)據(jù)分布偏斜程度的測度,2.,偏態(tài)系數(shù),=0,為,對稱分布,3.,偏態(tài)系數(shù),0,為,右偏分布,4.,偏態(tài)系數(shù), 0,為,左偏分布,4 -,77,總體偏態(tài)系數(shù),(skewness coefficient),?,偏度系數(shù)的概念式,?,?,?,?,3,3,1,3,3,N,i,i,X,X,E,X,E,X,SK,N,?,?,?,?,?,?,?,?,?,?,?,?,4 -,78,樣本偏態(tài)系數(shù),(skewness coefficient),1.,根據(jù)原始數(shù)據(jù)計算,?,Excel,和,spss,均

38、采用這個公式計算,2.,根據(jù)分組數(shù)據(jù)計算,?,?,?,3,3,(,1)(,2),i,n,x,x,SK,n,n,s,?,?,?,?,?,?,3,1,3,(,),k,i,i,i,M,x,f,SK,ns,?,?,?,?,4 -,79,偏態(tài)系數(shù),(,例題分析,),某電腦公司銷售量偏態(tài)及峰度計算表,按銷售量份組,(,臺,),組中值,(,M,i,),頻數(shù),f,i,140,150,150,160,160,170,170,180,180,190,190,200,200,210,210,220,220,230,230,240,145,155,165,175,185,195,205,215,225,235,4,9

39、,16,27,20,17,10,8,4,5,-256000,-243000,-128000,-27000,0,17000,80000,216000,256000,625000,10240000,7290000,2560000,270000,0,170000,1600000,6480000,10240000,31250000,合計,120,540000,70100000,?,?,i,i,f,x,M,3,?,?,?,i,i,f,x,M,4,?,4 -,80,偏態(tài)系數(shù),(,例題分析,),?,10,3,3,1,1,3,3,3,(,),(,185),120,(21.58),540000,0.448,12

40、0,(21.58),k,i,i,i,i,i,i,M,x,f,M,f,SK,ns,?,?,?,?,?,?,?,?,?,?,?,?,結(jié)論:,偏態(tài)系數(shù)為正值,但與,0,的差異不大,說,明電腦銷售量為輕微右偏分布,即銷售量較少的,天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù),4 -,81,偏態(tài)與峰態(tài),(,從直方圖上觀察,),按銷售量分組,(,臺,),結(jié)論,:,1.,為右偏分布,2.,峰態(tài)適中,140,150,210,某電腦公司銷售量分布的直方圖,190,200,180,160,170,頻,數(shù),(,天,),25,20,15,10,5,30,220,230,240,4 -,82,偏態(tài),(,實例,),【例】,已

41、知,1997,年,我國農(nóng)村居民家庭,按純收入分組的有,關數(shù)據(jù)如表,4.9,。試,計算偏態(tài)系數(shù),1997,年農(nóng)村居民家庭純收入數(shù)據(jù),按純收入分組(元),戶數(shù)比重(,%,),500,以下,5001000,10001500,15002000,20002500,25003000,30003500,35004000,40004500,45005000,5000,以上,2.28,12.45,20.35,19.52,14.93,10.35,6.56,4.13,2.68,1.81,4.94,4 -,83,戶,數(shù),比,重,(%),25,20,15,10,5,農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖,偏態(tài)與峰度,(,從直方

42、圖上觀察,),按純收入分組,(,元,),1000,500,1500,2000,2500,3000,3500,4000,4500,5000,結(jié)論,:,1.,為右偏分布,2.,峰度適中,4 -,84,偏態(tài)系數(shù),(計算過程),農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計算表,按純收入分組,(百元),組中值,X,i,戶數(shù)比重,(%),F,i,(,X,i,-,X,),3,F,i,(,X,i,-,X,),4,F,i,5,以下,5,10,10,15,15,20,20,25,25,30,30,35,35,40,40,45,45,50,50,以上,2.5,7.5,12.5,17.5,22.5,27.5,32.5,37.5

43、,42.5,47.5,52.5,2.28,12.45,20.35,19.52,14.93,10.35,6.56,4.13,2.68,1.81,4.94,-154.64,-336.46,-144.87,-11.84,0.18,23.16,89.02,171.43,250.72,320.74,1481.81,2927.15,4686.51,1293.53,46.52,0.20,140.60,985.49,2755.00,5282.94,8361.98,46041.33,合計,100,1689.25,72521.25,4 -,85,偏態(tài)系數(shù),(,計算結(jié)果,),根據(jù)上表數(shù)據(jù)計算得,將計算結(jié)果代入公式得

44、,結(jié)論:,偏態(tài)系數(shù)為正值,而且數(shù)值較大,說明農(nóng)村居民家庭純,收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入,較高的家庭則占少數(shù),而且偏斜的程度較大,?,?,?,?,?,?,?,11,3,3,1,1,3,3,21.429,1689.25,0.956,1766.81,1,12.09,K,i,i,i,i,i,i,X,X,F,X,F,SK,N,?,?,?,?,?,?,?,?,?,?,?,?,1,1,21.429,K,i,i,K,i,i,i,F,X,X,F,?,?,?,?,?,?,?,&,&,(百元),?,?,2,1,1,12.09,K,i,i,K,i,i,i,F,X,X,F,?,?,?,?,?

45、,?,?,?,?,&,&,(百元),4 -,86,峰,態(tài),4 -,87,峰態(tài),(kurtosis),1.,統(tǒng)計學家,Pearson,于,1905,年首次提出,2.,數(shù)據(jù)分布扁平程度的測度,3.,峰態(tài)系數(shù),=0,扁平峰度適中,4.,峰態(tài)系數(shù),0,為,扁平分布,5.,峰態(tài)系數(shù),0,為,尖峰分布,4 -,88,總體峰態(tài)系數(shù),(kurtosis coefficient),?,峰度系數(shù)的概念式,?,?,?,?,4,4,1,4,4,3,3,N,i,i,X,X,E,X,E,X,K,N,?,?,?,?,?,?,?,?,?,?,?,?,?,?,4 -,89,樣本峰態(tài)系數(shù),(kurtosis coefficient),1.,根據(jù)原始數(shù)據(jù)計算,?,Excel,與,spss,均采用這個公式計算。,2.,根據(jù)分組數(shù)據(jù)計算,2,4,2,4,(,1),(,),3,(,),(,1),?,(,1)(,2)(,3),i,i,n,n,x,x,x,x,n,K,n,n,n,s,?,?,?,?,?,?,?,?,?,?,?,?,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論