統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的測度(第二版)1_第1頁
統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的測度(第二版)1_第2頁
統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的測度(第二版)1_第3頁
統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的測度(第二版)1_第4頁
統(tǒng)計(jì)學(xué)第4章 數(shù)據(jù)分布特征的測度(第二版)1_第5頁
已閱讀5頁,還剩119頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

主講:王光玲

歡迎學(xué)習(xí)《統(tǒng)計(jì)學(xué)》課程.《統(tǒng)計(jì)學(xué)》第四章數(shù)據(jù)分布特征的測度

濟(jì)南大學(xué)經(jīng)濟(jì)學(xué)院王光玲.客觀現(xiàn)象數(shù)量表現(xiàn)統(tǒng)計(jì)總體數(shù)量特征統(tǒng)計(jì)研究的程序統(tǒng)計(jì)研究目的統(tǒng)計(jì)設(shè)計(jì)推斷分析描述分析收集數(shù)據(jù)整理數(shù)據(jù)2023/4/223.本章相關(guān)內(nèi)容學(xué)習(xí)目標(biāo)重點(diǎn)、難點(diǎn)教學(xué)內(nèi)容參考資料

2023/4/224.學(xué)習(xí)目標(biāo)1.集中趨勢各測度值的計(jì)算方法2.集中趨勢各測度值的特點(diǎn)及應(yīng)用場合3.離散程度各測度值的計(jì)算方法4.離散程度各測度值的特點(diǎn)及應(yīng)用場合5.偏態(tài)與峰態(tài)的測度方法6.用Excel計(jì)算描述統(tǒng)計(jì)量并進(jìn)行分析2023/4/225.重點(diǎn)、難點(diǎn)重點(diǎn):平均指標(biāo)和變異指標(biāo)的概念、種類、計(jì)算方法。尤其是加權(quán)算術(shù)平均指標(biāo)和加權(quán)調(diào)和平均指標(biāo)的計(jì)算、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù)的計(jì)算。難點(diǎn):各綜合指標(biāo)的計(jì)算方法、適應(yīng)條件及其關(guān)系。利用EXSEL進(jìn)行統(tǒng)計(jì)處理。2023/4/226.教學(xué)內(nèi)容利用圖表展示數(shù)據(jù),可以對數(shù)據(jù)分布的形狀和特征有一個(gè)大致的了解。但要全面把握數(shù)據(jù)分布的特征,還要找到反映數(shù)據(jù)分布特征的各個(gè)代表值。數(shù)據(jù)分布的特征主要從三個(gè)方面進(jìn)行測度和描述:一是分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二是分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢;三是分布的形狀,反映數(shù)據(jù)分布偏斜程度和峰度。2023/4/227.數(shù)據(jù)分布的特征集中趨勢(聚集程度)離中趨勢

(分散程度)偏態(tài)和峰態(tài)(形狀)2023/4/228.數(shù)據(jù)分布特征的測度數(shù)據(jù)特征的測度眾數(shù)中位數(shù)平均數(shù)離散系數(shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)分布的形狀集中趨勢離散程度2023/4/229.4.1集中趨勢的測定4.2離散程度的測定4.3數(shù)據(jù)分布的偏態(tài)和峰度4.4用Excel計(jì)算描述統(tǒng)計(jì)量并進(jìn)行分析本節(jié)將重點(diǎn)討論數(shù)據(jù)分布特征各測度值的計(jì)算方法、特點(diǎn)及其應(yīng)用場合。教學(xué)內(nèi)容2023/4/2210.4.1集中趨勢的測定4.1.1集中趨勢的涵義4.1.2集中趨勢的度量2023/4/2211.集中趨勢(見P82)2023/4/2212.

(Centraltendency)

集中趨勢一組數(shù)據(jù)向其中心值靠攏的傾向和程度;測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值;不同類型的數(shù)據(jù)用不同的集中趨勢測度值;低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)。.平均數(shù)/平均指標(biāo)用一個(gè)概括性的數(shù)值反映總體各單位數(shù)量表現(xiàn)的一般水平。計(jì)算平均數(shù)是統(tǒng)計(jì)分析中最常用的一種方法。在統(tǒng)計(jì)分析中,除了用平均數(shù)表現(xiàn)數(shù)據(jù)資料的集中趨勢外,還常運(yùn)用平均數(shù)進(jìn)行靜態(tài)和動態(tài)的對比分析,運(yùn)用平均數(shù)分析現(xiàn)象之間的依存關(guān)系。平均數(shù)也是統(tǒng)計(jì)推斷的一個(gè)非常重要的參數(shù)。平均數(shù)反映了變量分布的集中趨勢,它是變量分布的重要特征值。2023/4/2214.表明同類社會經(jīng)濟(jì)現(xiàn)象在一定時(shí)間、地點(diǎn)條件下達(dá)到的一般水平,是總體內(nèi)各單位某一數(shù)量標(biāo)志的不同標(biāo)志值的代表值。平均數(shù)或平均指標(biāo)2023/4/2215.可以反映現(xiàn)象總體的客觀規(guī)定性,如計(jì)算平均年齡、平均成績、平均工資、平均畝產(chǎn)量等;可以對比同類現(xiàn)象在不同的時(shí)間、地點(diǎn)和條件下的一般水平;可以分析現(xiàn)象之間的依存關(guān)系。測定集中趨勢的意義:2023/4/2216.集中趨勢的度量(P82)2023/4/2217.平均指標(biāo)的種類及計(jì)算方法位置平均數(shù)★根據(jù)數(shù)據(jù)的類型和特點(diǎn)選用不同的測度值來反映數(shù)據(jù)的集中趨勢均值1.數(shù)值型數(shù)據(jù):

算術(shù)平均數(shù)

調(diào)和平均數(shù)

幾何平均數(shù)2.順序數(shù)據(jù):中位數(shù)

分位數(shù)3.分類數(shù)據(jù):眾數(shù)數(shù)值平均數(shù)2023/4/2218.數(shù)值型數(shù)據(jù):平均數(shù)2023/4/2219.(一)算術(shù)平均數(shù)(mean)

(見P82)1.也稱為均值2.集中趨勢的最常用測度值基本計(jì)算公式:x2023/4/2220.3.一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征4.易受極端值的影響5.有簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)之分6.根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體平均數(shù),記為;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為xx(一)算術(shù)平均數(shù)(mean)

(見P82)2023/4/2221.1.簡單算術(shù)平均數(shù)(Simplemean)

計(jì)算公式設(shè)一組數(shù)據(jù)為:x1,x2,…,xn

(總體數(shù)據(jù)XN)

樣本平均數(shù)總體平均數(shù).2.加權(quán)算術(shù)平均數(shù)(Weightedmean)

計(jì)算公式設(shè)各組的變量值(組中值)為:x1,x2,…,xk相應(yīng)的頻數(shù)為:f1,f2,…,fk樣本加權(quán)平均數(shù)總體加權(quán)平均數(shù).2.加權(quán)算術(shù)平均數(shù)(Weightedmean)

(例題分析)【例4-2】某汽車配件廠有40名工人,他們每人每日加工的某種零件數(shù),編制成單項(xiàng)數(shù)列資料如下表,計(jì)算40名工人平均每人每日加工零件數(shù)。(件/人)某汽車配件廠工人每人每日加工某種零件情況.【例4-3】已知某儲蓄所為120個(gè)企業(yè)的貸款情況見下表,求該儲蓄所平均為每個(gè)企業(yè)提供的貸款額。2.加權(quán)算術(shù)平均數(shù)(Weightedmean)

(例題分析)某儲蓄所貸款情況表(萬元).注意:加權(quán)算術(shù)平均數(shù)其數(shù)值的大小,不僅受各組變量值(xi)大小的影響,而且受各組變量值出現(xiàn)的頻數(shù)(fi)大小的影響。(見P84)所謂權(quán)數(shù)的大小,有時(shí)并不是權(quán)數(shù)本身數(shù)值的大小,而是各組頻數(shù)占總體單位數(shù)的比重(頻率)。加權(quán)均值的公式可變形為:2.加權(quán)算術(shù)平均數(shù)(Weightedmean)

(權(quán)數(shù)對均值的影響).【例4-4】某企業(yè)60名工人月工資分組情況如下表,試計(jì)算月平均工資.

某企業(yè)60名工人月工資分組表

873.36

100

60

--合計(jì)

86.71

6.67

4

1300

1200以上

183.37

16.67

10

1100

1000-1200

389.97

43.33

26

900

800-1000

163.31

23.33

14

700

600-800

50

10

6

500

600以下頻率(%)人數(shù)組中值月工資分組(元)2.加權(quán)算術(shù)平均數(shù)(Weightedmean)

(以頻率為權(quán)數(shù)計(jì)算均值).當(dāng)各組變量值出現(xiàn)的頻數(shù)或頻率相等,即當(dāng)3.加權(quán)算術(shù)平均數(shù)與簡單算術(shù)平均數(shù)的關(guān)系或時(shí),權(quán)數(shù)的作用就消失了,這就意味著各組變量值對總平均的結(jié)果所起的作用是一樣的,此時(shí),加權(quán)算術(shù)平均數(shù)就等于簡單算術(shù)平均數(shù)。.1.集中趨勢的測度值之一2.均值的另一種表現(xiàn)形式3.易受極端值的影響4.有簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)兩種(二)調(diào)和平均數(shù)(Harmonicmean)(見P86)2023/4/2229.【例4-7】某種蔬菜的價(jià)格,甲集市4.5元/千克,乙集市4元/千克,丙集市5.5元/千克。若在三個(gè)集市各買1元,求蔬菜的平均價(jià)格。1.簡單調(diào)和平均數(shù)2023/4/2230.1.簡單調(diào)和平均數(shù)簡單調(diào)和平均數(shù)又稱倒數(shù)平均數(shù)。計(jì)算公式為:

2023/4/2231.2.加權(quán)調(diào)和平均數(shù)在上例中,如果在甲集市花費(fèi)8元,乙集市花費(fèi)10元,丙集市花費(fèi)5元,購買這些蔬菜的平均價(jià)格是多少?

2023/4/2232.2.加權(quán)調(diào)和平均數(shù)設(shè),則計(jì)算公式為:原來只是計(jì)算時(shí)使用了不同的數(shù)據(jù)!2023/4/2233.某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價(jià)格(元)

xi成交額(元)mi=xifi成交量(公斤)fi=mi/xi甲乙丙1.200.500.801800012500640015000250008000合計(jì)—3690048000【例4-8】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格。計(jì)算欄2.加權(quán)調(diào)和平均數(shù)(例題分析).在實(shí)際應(yīng)用平均數(shù)時(shí),可掌握這樣的原則:當(dāng)平均數(shù)的分子資料未知時(shí),采用加權(quán)算術(shù)平均數(shù)方法計(jì)算平均數(shù);當(dāng)分母資料未知時(shí),采用加權(quán)調(diào)和平均數(shù)方法計(jì)算平均數(shù)。

2023/4/2235.(三)幾何平均數(shù)(geometricmean)

(見P87)1.n個(gè)變量值連乘積的

n次方根2.適用于對比率數(shù)據(jù)的平均,而且各比率的乘積等于總的比率3.主要用于計(jì)算平均比率或平均速度.(三)幾何平均數(shù)(geometricmean)

(計(jì)算公式)4.

計(jì)算公式(1)簡單幾何平均數(shù)2023/4/2237.(2)加權(quán)幾何平均數(shù)(三)幾何平均數(shù)(geometricmean)

(計(jì)算公式)2023/4/2238.(三)幾何平均數(shù)(geometricmean)

(例題分析)【例4-9】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率

幾何平均:.【例4-10】某投資銀行某筆投資的年利率是按復(fù)利計(jì)算的,若將過去25年的利率資料整理如下表所示的變量數(shù)列,求25年的平均年利率。投資年利率分組表年利率(%)本利率(%)x年數(shù)(頻數(shù))f

3481015

103104108110115

148102合計(jì)

--

25(三)幾何平均數(shù)(geometricmean)

(例題分析).用加權(quán)幾何平均法求25年的平均本利率:即25年的平均年利率為8.48%(三)幾何平均數(shù)(geometricmean)

(例題分析).練習(xí)題:P110第1、2、5、6題2023/4/2242.順序數(shù)據(jù):中位數(shù)和分位數(shù)2023/4/2243.(四)中位數(shù)(median)(見P90)1.排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即2023/4/2244.(四)中位數(shù)(位置和數(shù)值的確定)中位數(shù)位置:中位數(shù):.(四)順序數(shù)據(jù)的中位數(shù)

(例題分析)解:中位數(shù)的位置為

(300+1)/2=150.5

從累計(jì)頻數(shù)看,中位數(shù)在“一般”這一組別中中位數(shù)為

Me=一般甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)非常不滿意不滿意

一般滿意非常滿意

24108934530

24132225270300合計(jì)300—【例4-13】.(四)數(shù)值型數(shù)據(jù)的中位數(shù)

(9個(gè)數(shù)據(jù)的算例)【例4-14】

9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):

15007507801080850960200012501630排序:

7507808509601080

1250150016302000位置:123456789中位數(shù)=1080.(四)數(shù)值型數(shù)據(jù)的中位數(shù)

(10個(gè)數(shù)據(jù)的算例)【例4-15】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:1234

5678910.【例4-16】某企業(yè)某日工人的日產(chǎn)量資料如下:日產(chǎn)量(件)工人人數(shù)(人)向上累計(jì)次數(shù)(人)10111213147010038015010070170550700800合計(jì)800—計(jì)算該企業(yè)該日全部工人日產(chǎn)量的中位數(shù)。(四)數(shù)值型數(shù)據(jù)的中位數(shù)(單值數(shù)列)中位數(shù)的位次:.【例4-17】某車間50名工人月產(chǎn)量的資料如下:月產(chǎn)量(件)工人人數(shù)(人)向上累計(jì)次數(shù)(人)200以下200~400400~600600以上373283104250合計(jì)50—計(jì)算該車間工人月產(chǎn)量的中位數(shù)。(四)數(shù)值型數(shù)據(jù)的中位數(shù)(組距數(shù)列)先根據(jù)公式確定中位數(shù)的位置,并確定中位數(shù)所在的組.同理,中位數(shù)上限公式:2023/4/2251.(五)四分位數(shù)(Quartile)(P91)一組數(shù)據(jù)排序后處于25%和75%位置上的值,稱為四分位數(shù)或四分位點(diǎn)。四分位數(shù)是通過三個(gè)點(diǎn)將全部數(shù)據(jù)等分為四部分,其中每部分包含25%的數(shù)據(jù)。很顯然,中間的四分位數(shù)就是中位數(shù),因此,通常所說的四分位數(shù)是指處在25%位置上的數(shù)值(下四分位數(shù))和處在75%位置上的數(shù)值(上四分位數(shù))。根據(jù)未分組資料計(jì)算四分位數(shù)時(shí),首先對數(shù)據(jù)進(jìn)行排序,然后確定四分位數(shù)所在的位置。2023/4/2252.設(shè)下四分位數(shù)為,上四分位數(shù)為,未分組的原始數(shù)據(jù),各四分位數(shù)的位置為:當(dāng)四分位數(shù)的位置不在某一個(gè)數(shù)值上時(shí),可根據(jù)四分位數(shù)的位置,按比例分?jǐn)偹姆治粩?shù)兩側(cè)數(shù)值的差值。QLQMQU25%25%25%25%2023/4/2253.【例4-18】在某城市中隨機(jī)抽取9個(gè)家庭,調(diào)查得到每個(gè)家庭的人均月收入數(shù)據(jù)如下(單位:元),15007507801080850960200012501630,計(jì)算人均月收入的四分位數(shù)。解:

和之間包含了50%的數(shù)據(jù),因此,我們可以說有一半的家庭人均月收入在815元——1565元之間。數(shù)據(jù)排序:75078085096010801250150016302000(五)順序數(shù)據(jù)的四分位數(shù)

(例題分析).(五)順序數(shù)據(jù)的四分位數(shù)

(例題分析)解:QL位置=(300)/4=75QU位置=(3×300)/4=225從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中QU在“一般”這一組別中四分位數(shù)為:

QL

=不滿意

QU

=一般甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)非常不滿意

不滿意一般滿意非常滿意

2410893

4530

24132225270300合計(jì)300—【例4-19】.分類數(shù)據(jù):眾數(shù)2023/4/2256.(六)眾數(shù)(mode)(見P88)1.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,記作2.適合于數(shù)據(jù)量較多時(shí)使用3.不受極端值的影響4.一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)5.主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)2023/4/2257.(六)眾數(shù)(不惟一性)無眾數(shù)

原始數(shù)據(jù):10591268一個(gè)眾數(shù)

原始數(shù)據(jù):65

9855多于一個(gè)眾數(shù)

原始數(shù)據(jù):252828

3642422023/4/2258.(六)分類數(shù)據(jù)的眾數(shù)(例題分析)不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計(jì)501100解:這里的變量為“飲料品牌”,這是個(gè)分類變量,不同類型的飲料就是變量值所調(diào)查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即

Mo=可口可樂【例4-21】.(六)順序數(shù)據(jù)的眾數(shù)

(例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別”甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)非常不滿意不滿意一般滿意非常滿意

24108934530

836311510合計(jì)300100.0【例4-22】.日產(chǎn)量(件)工人人數(shù)(人)101112131470100380150100合計(jì)800【例4-23】已知某企業(yè)某日工人的日產(chǎn)量資料如下:(單值數(shù)列)計(jì)算該企業(yè)該日全部工人日產(chǎn)量的眾數(shù)。(六)數(shù)值型數(shù)據(jù)的眾數(shù)

(例題分析).(六)數(shù)值型分組數(shù)據(jù)的眾數(shù)

(組距數(shù)列)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4.

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2.相鄰兩組的頻數(shù)相等時(shí),眾數(shù)組的組中值即為眾數(shù)3.

相鄰兩組的頻數(shù)不相等時(shí),眾數(shù)采用下列近似公式計(jì)算MoMof-1f+1f-1f+1Mof.下限公式:

上限公式:

式中:表示眾數(shù)所在組的下限;表示眾數(shù)所在組的上限;表示眾數(shù)所在組的組距。

.數(shù)值型數(shù)據(jù)的眾數(shù)

(例題分析)(組距數(shù)列)【例4-24】某車間50名工人月產(chǎn)量的資料如下:月產(chǎn)量(件)工人人數(shù)(人)向上累計(jì)次數(shù)(人)200以下200~400400~600600以上373283104250合計(jì)50—計(jì)算該車間工人月產(chǎn)量的眾數(shù)。概約眾數(shù):眾數(shù)所在組的組中值,在本例為500件.當(dāng)數(shù)據(jù)分布存在明顯的集中趨勢,且有顯著的極端值時(shí),適合使用眾數(shù);當(dāng)數(shù)據(jù)分布的集中趨勢不明顯或存在兩個(gè)以上分布中心時(shí),不適合使用眾數(shù)(前者無眾數(shù),后者為雙眾數(shù)或多眾數(shù),也等于沒有眾數(shù))。眾數(shù)的原理及應(yīng)用.眾數(shù)、中位數(shù)和平均數(shù)的比較.眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值.眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時(shí)應(yīng)用2023/4/2268.4.2離中趨勢的測定4.2.1離中趨勢(也稱離散程度)的涵義4.2.2標(biāo)志變異指標(biāo)的種類及計(jì)算2023/4/2269.離中趨勢2023/4/2270.離中趨勢(見P93)數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度,即總體中各單位標(biāo)志值背離分布中心的規(guī)?;虺潭?從另一個(gè)側(cè)面說明了集中趨勢測度值的代表程度(變異指標(biāo)值越大,平均指標(biāo)的代表性越??;反之,平均指標(biāo)的代表性越大。

)不同類型的數(shù)據(jù)有不同的離散程度測度值.離散程度的度量2023/4/2272.離散程度測度值的類型分類數(shù)據(jù)異眾比率順序數(shù)據(jù)四分位差數(shù)值型數(shù)據(jù)方差和標(biāo)準(zhǔn)差相對位置的測量標(biāo)準(zhǔn)分?jǐn)?shù),經(jīng)驗(yàn)法則,切比雪夫不等式相對離散程度離散系數(shù)數(shù)據(jù)類型測量指標(biāo).

分類數(shù)據(jù):異眾比率(見P93)2023/4/2274.異眾比率(variationratio)作用:它是衡量眾數(shù)對一組數(shù)據(jù)的代表性程度的指標(biāo)。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重就越大,眾數(shù)的代表性就越差;反之,異眾比率越小,眾數(shù)的代表性就越好。計(jì)算公式:概念:非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,用表示。.不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計(jì)501100解:

在所調(diào)查的50人當(dāng)中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費(fèi)者購買飲料品牌的狀況,其代表性不是很好【例4-26】.【例4-27】為研究廣告市場的狀況,一家廣告公司在某城市隨機(jī)抽取200人就城市居民比較關(guān)心的哪一類廣告進(jìn)行了郵寄問卷調(diào)查。調(diào)查數(shù)據(jù)經(jīng)分類整理后形成頻數(shù)分布表如下,試計(jì)算異眾比率。2023/4/2277.順序數(shù)據(jù):四分位差

(見P94)2023/4/2278.四分位差(quartiledeviation概念:上四分位數(shù)與下四分位數(shù)之差,稱為四分位差,亦稱為內(nèi)距或四分間距(inter-quartilerange),用表示作用:1、四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。2、由于中位數(shù)處于數(shù)據(jù)的中間位置,因此,四分位差的大小在一定程度上也說明了中位數(shù)對一組數(shù)據(jù)的代表程度。公式:【例4-28】根據(jù)計(jì)算上下四分位數(shù)例4-18的例子,家庭人均月收入的四分位差為(元).甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)非常不滿意

不滿意一般滿意非常滿意

2410893

4530

24132225270300合計(jì)300—解:QL位置=(300)/4=75QU位置=(3×300)/4=225

從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中四分位數(shù)為:

QL

=不滿意

QU

=一般組距分組數(shù)據(jù)四分位差【例4-29】.解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5。已知

QL

=不滿意=2

QU

=一般=3四分位差:

Qd

=QU

-QL

=3–2

=1甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)非常不滿意

不滿意一般滿意非常滿意

2410893

4530

24132225270300合計(jì)300—四分位差【例4-29】.數(shù)值型數(shù)據(jù):方差和標(biāo)準(zhǔn)差

(常用標(biāo)志變異指標(biāo))

2023/4/2282.測定標(biāo)志變異度的絕對量指標(biāo)(與原變量值名數(shù)相同)測定標(biāo)志變異度的相對量指標(biāo)(表現(xiàn)為無名數(shù))全距平均差標(biāo)準(zhǔn)差全距系數(shù)平均差系數(shù)標(biāo)準(zhǔn)差系數(shù)標(biāo)志變異指標(biāo)的種類.(一)全距(range),又稱極差(P94)1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布,準(zhǔn)確程度差計(jì)算公式為最大變量值或最高組上限或開口組假定上限最小變量值或最低組下限或開口組假定下限.【例4-30】某售貨小組5人某天的銷售額分別為440元、480元、520元、600元、750元,則(一)極差(例題分析)2023/4/2285.【例4-31】某季度某工業(yè)公司18個(gè)工業(yè)企業(yè)產(chǎn)值計(jì)劃完成情況如下:計(jì)劃完成程度(﹪)組中值(﹪)企業(yè)數(shù)(個(gè))計(jì)劃產(chǎn)值(萬元)90以下90~100100~110110以上8595105115231038002500172004400合計(jì)—1824900計(jì)算該公司該季度計(jì)劃完成程度的全距。.(二)平均差(meandeviation)(見P95)1.各變量值與其平均數(shù)離差絕對值的平均數(shù)2.能全面反映一組數(shù)據(jù)的離散程度3.數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù).(二)平均差(meandeviation)

(例題分析)【例4-32】某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(xi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235

49162720171084540302010010203040501602703202700170200240160250合計(jì)—120—2040.(二)平均差(例題分析)含義:每一天的銷售量與平均數(shù)相比,平均相差17臺2023/4/2289.(三)方差和標(biāo)準(zhǔn)差

(varianceandstandarddeviation)4681012x=8.31)數(shù)據(jù)離散程度的最常用測度值2)反映了各變量值與均值的平均差異3)根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s).1.樣本方差和標(biāo)準(zhǔn)差(P97)

(samplevarianceandstandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!.1.樣本標(biāo)準(zhǔn)差

(例題分析)【例4-33】某電腦公司銷售量數(shù)據(jù)標(biāo)準(zhǔn)差計(jì)算表按銷售量分組組中值(xi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235

491627201710845-40-30-20-100102030405064008100640027000170040007200640012500合計(jì)—120—55400.

含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺1.樣本標(biāo)準(zhǔn)差

(例題分析).未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式2.總體方差和標(biāo)準(zhǔn)差(P96)

(PopulationvarianceandStandarddeviation).由同一資料計(jì)算的標(biāo)準(zhǔn)差的結(jié)果一般要略大于平均差。證明:當(dāng)a,b,c≥0時(shí),有3.標(biāo)準(zhǔn)差的特點(diǎn)不易受極端數(shù)值的影響,能綜合反映全部單位標(biāo)志值的實(shí)際差異程度;用平方的方法消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問題,可方便地用于數(shù)學(xué)處理和統(tǒng)計(jì)分析運(yùn)算..簡單標(biāo)準(zhǔn)差加權(quán)標(biāo)準(zhǔn)差4.標(biāo)準(zhǔn)差的簡捷計(jì)算避免離差平方和計(jì)算過程的出現(xiàn)。目的:變量值平方的平均數(shù)變量值平均數(shù)的平方.(四)是非標(biāo)志總體(P98)分組單位數(shù)變量值具有某一屬性不具有某一屬性10合計(jì)—為研究是非標(biāo)志總體的數(shù)量特征,令指總體中全部單位只具有“是”或“否”、“有”或“無”兩種表現(xiàn)形式的標(biāo)志,又叫交替標(biāo)志是非標(biāo)志.(五)是非標(biāo)志總體的指標(biāo)具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù)指是非標(biāo)志總體中具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位總數(shù)的比重。1.成數(shù).2.均值3.標(biāo)準(zhǔn)差(五)是非標(biāo)志總體的指標(biāo).4.方差5.標(biāo)準(zhǔn)差系數(shù)(五)是非標(biāo)志總體的指標(biāo).【例4-34】某廠某月份生產(chǎn)了400件產(chǎn)品,其中合格品380件,不合格品20件。求產(chǎn)品質(zhì)量分布的集中趨勢與離中趨勢。5.是非標(biāo)志總體的指標(biāo)(舉例)解:.相對位置的度量:標(biāo)準(zhǔn)分?jǐn)?shù).標(biāo)準(zhǔn)分?jǐn)?shù)(P99)

(standardscore)1.也稱標(biāo)準(zhǔn)化值2. 對某一個(gè)值在一組數(shù)據(jù)中相對位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)4. 用于對變量的標(biāo)準(zhǔn)化處理5.計(jì)算公式為如果某個(gè)數(shù)值的標(biāo)準(zhǔn)分?jǐn)?shù)為-1.5,我們就知道該數(shù)值低于均值1.5倍的標(biāo)準(zhǔn)差。2023/4/22103.標(biāo)準(zhǔn)分?jǐn)?shù)的特性:標(biāo)準(zhǔn)分?jǐn)?shù)均值為0,標(biāo)準(zhǔn)差為12023/4/22104.標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì))z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變該組數(shù)據(jù)分布的形狀,而只是使該組數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1比如,一組數(shù)據(jù)為25,28,31,34,40,43,其均值為34,標(biāo)準(zhǔn)差其變換圖示如下:.相對離散程度:離散系數(shù)

(見P101)2023/4/22106.可比變異系數(shù)指標(biāo).離散系數(shù)(coefficientofvariation)1. 一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2.對數(shù)據(jù)相對離散程度的測度3.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為.【例4-36】某年級一、二兩班某門課的平均成績分別為82分和76分,其成績的標(biāo)準(zhǔn)差分別為15.6分和14.8分,比較兩班平均成績代表性的大小。解:一班成績的標(biāo)準(zhǔn)差系數(shù)為:二班成績的標(biāo)準(zhǔn)差系數(shù)為:因?yàn)椋砸话嗥骄煽兊拇硇员榷啻蟆?4.3數(shù)據(jù)分布的偏態(tài)和峰度

4.3.1偏態(tài)與偏態(tài)系數(shù)4.3.2峰度與峰度系數(shù)2023/4/22110.偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論