統(tǒng)計(jì)學(xué)第二章_第1頁(yè)
統(tǒng)計(jì)學(xué)第二章_第2頁(yè)
統(tǒng)計(jì)學(xué)第二章_第3頁(yè)
統(tǒng)計(jì)學(xué)第二章_第4頁(yè)
統(tǒng)計(jì)學(xué)第二章_第5頁(yè)
已閱讀5頁(yè),還剩132頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、主講教師:王 超 21世紀(jì)經(jīng)濟(jì)管理專業(yè)應(yīng)用型精品教材世紀(jì)經(jīng)濟(jì)管理專業(yè)應(yīng)用型精品教材 統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué) (STATISTICS)o2.1 統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)數(shù)據(jù)的整理o2.2 分布集中趨勢(shì)的測(cè)度分布集中趨勢(shì)的測(cè)度o2.3 分布離散程度的測(cè)度分布離散程度的測(cè)度o2.4 分布偏態(tài)與峰態(tài)的測(cè)度分布偏態(tài)與峰態(tài)的測(cè)度o2.5 統(tǒng)計(jì)表與統(tǒng)計(jì)圖統(tǒng)計(jì)表與統(tǒng)計(jì)圖o 本章小結(jié)本章小結(jié)第 2章 統(tǒng)計(jì)數(shù)據(jù)的描述o2.1 統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)數(shù)據(jù)的整理o2.2 分布集中趨勢(shì)的測(cè)度分布集中趨勢(shì)的測(cè)度o2.3 分布離散程度的測(cè)度分布離散程度的測(cè)度o2.4 分布偏態(tài)與峰態(tài)的測(cè)度分布偏態(tài)與峰態(tài)的測(cè)度o2.5 統(tǒng)計(jì)表與統(tǒng)計(jì)圖統(tǒng)計(jì)表與統(tǒng)計(jì)

2、圖o 本章小結(jié)本章小結(jié)學(xué)習(xí)目標(biāo)o 掌握數(shù)值型數(shù)據(jù)的整理方法o 掌握數(shù)據(jù)集中趨勢(shì)和離散程度的測(cè)度方法o 掌握莖葉圖和箱線圖的制作方法o 掌握分布偏態(tài)與峰度的測(cè)度方法o 掌握統(tǒng)計(jì)表和統(tǒng)計(jì)圖的使用2.1 統(tǒng)計(jì)數(shù)據(jù)的整理o 2.1.0 數(shù)據(jù)的預(yù)處理o 2.1.1 統(tǒng)計(jì)數(shù)據(jù)的分組o 2.1.2 次數(shù)分配 o 2.1.3 次數(shù)分配直方圖o 2.1.4 洛倫茨曲線2.1.0 數(shù)據(jù)的預(yù)處理o 一、數(shù)據(jù)的審核n 對(duì)原始數(shù)據(jù),審核完整性和準(zhǔn)確性。前者指對(duì)原始數(shù)據(jù),審核完整性和準(zhǔn)確性。前者指調(diào)查單位是否遺漏、項(xiàng)目是否齊全等;后者調(diào)查單位是否遺漏、項(xiàng)目是否齊全等;后者指數(shù)據(jù)是否真實(shí)、是否錯(cuò)誤等。方法是邏輯指數(shù)據(jù)是否真

3、實(shí)、是否錯(cuò)誤等。方法是邏輯檢查和計(jì)算檢查。檢查和計(jì)算檢查。n 對(duì)二手?jǐn)?shù)據(jù)審核完整性和準(zhǔn)確性外,著重審對(duì)二手?jǐn)?shù)據(jù)審核完整性和準(zhǔn)確性外,著重審核數(shù)據(jù)的適用性和時(shí)效性。前者應(yīng)清楚數(shù)據(jù)核數(shù)據(jù)的適用性和時(shí)效性。前者應(yīng)清楚數(shù)據(jù)的來(lái)源、口徑和背景,后者應(yīng)注意數(shù)據(jù)的時(shí)的來(lái)源、口徑和背景,后者應(yīng)注意數(shù)據(jù)的時(shí)間,使用最新的數(shù)據(jù)。間,使用最新的數(shù)據(jù)。2.1.0 數(shù)據(jù)的預(yù)處理o 二、 數(shù)據(jù)的篩選n 剔除不符和要求的數(shù)據(jù)或錯(cuò)誤的數(shù)據(jù);剔除不符和要求的數(shù)據(jù)或錯(cuò)誤的數(shù)據(jù);n 篩選符合特定要求的數(shù)據(jù)。篩選符合特定要求的數(shù)據(jù)。o 三、數(shù)據(jù)的排序n 它是按照一定順序排列數(shù)據(jù),便于發(fā)現(xiàn)明顯特征趨它是按照一定順序排列數(shù)據(jù),便于發(fā)現(xiàn)明

4、顯特征趨勢(shì)或解決問(wèn)題的線索,有助于檢查糾錯(cuò)為歸類分組勢(shì)或解決問(wèn)題的線索,有助于檢查糾錯(cuò)為歸類分組提供依據(jù)。提供依據(jù)。n 對(duì)數(shù)字型數(shù)據(jù):遞增或遞減排序?qū)?shù)字型數(shù)據(jù):遞增或遞減排序n 對(duì)字母型數(shù)據(jù):升序降序排序?qū)ψ帜感蛿?shù)據(jù):升序降序排序n 對(duì)漢字型數(shù)據(jù):按拼音、字母、筆畫(huà)排序?qū)h字型數(shù)據(jù):按拼音、字母、筆畫(huà)排序2.1.1 統(tǒng)計(jì)數(shù)據(jù)的分組o 一、基本概念o 二、按品質(zhì)標(biāo)志分組o 三、按數(shù)量標(biāo)志分組一、基本概念o (1)統(tǒng)計(jì)分組n 它是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種它是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種特征或標(biāo)準(zhǔn)分成不同的組別。特征或標(biāo)準(zhǔn)分成不同的組別。o (2)分組標(biāo)志n 分組時(shí)所依據(jù)的特征或標(biāo)

5、準(zhǔn),有品質(zhì)標(biāo)志和分組時(shí)所依據(jù)的特征或標(biāo)準(zhǔn),有品質(zhì)標(biāo)志和數(shù)量標(biāo)志。前者說(shuō)明事物的性質(zhì)或?qū)傩蕴卣?,?shù)量標(biāo)志。前者說(shuō)明事物的性質(zhì)或?qū)傩蕴卣?,不能用?shù)值表現(xiàn),對(duì)應(yīng)定類、定序尺度,如不能用數(shù)值表現(xiàn),對(duì)應(yīng)定類、定序尺度,如產(chǎn)品等級(jí);后者說(shuō)明事物數(shù)量特征,可以表產(chǎn)品等級(jí);后者說(shuō)明事物數(shù)量特征,可以表現(xiàn)為數(shù)值,對(duì)應(yīng)間隔、現(xiàn)為數(shù)值,對(duì)應(yīng)間隔、 比例尺度。比例尺度。一、基本概念o (3)頻數(shù)分布n 根據(jù)分組計(jì)算出所有類別或數(shù)據(jù)在各組出現(xiàn)根據(jù)分組計(jì)算出所有類別或數(shù)據(jù)在各組出現(xiàn)的次數(shù),將全部數(shù)據(jù)按分組標(biāo)志在各組內(nèi)的的次數(shù),將全部數(shù)據(jù)按分組標(biāo)志在各組內(nèi)的分布狀況稱為頻數(shù)分布。分布狀況稱為頻數(shù)分布。o (4)頻數(shù)、頻率n

6、 分布在各組的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù);各組頻數(shù)分布在各組的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù);各組頻數(shù)與全部頻數(shù)之和的比值稱為頻率或比重。與全部頻數(shù)之和的比值稱為頻率或比重。二、按品質(zhì)標(biāo)志分組o 分組時(shí),如果按照性別、質(zhì)量等級(jí)等定性指標(biāo)分組。o 表2-3 某班學(xué)生按性別分組 按性別分組 人數(shù) 百分比 % 男生 女生 30 20 60 40 合計(jì) 50 100三、按數(shù)量標(biāo)志分組o 按照數(shù)量或數(shù)值等定量指標(biāo)分組,稱為按數(shù)量標(biāo)志分組。n (1)單變量分組:一個(gè)變量值為一組,適合離散)單變量分組:一個(gè)變量值為一組,適合離散變量,且變量值較少。步驟是先排序再分組。變量,且變量值較少。步驟是先排序再分組。n (2)組距分組:)組

7、距分組: 將全部變量值劃分為若干區(qū)間,并將這一區(qū)間的變量值將全部變量值劃分為若干區(qū)間,并將這一區(qū)間的變量值作為一組,適用于連續(xù)變量或變量值較多的情況。作為一組,適用于連續(xù)變量或變量值較多的情況。 需要遵循需要遵循“不重不漏不重不漏”的原則,可采用等距分組,也可的原則,可采用等距分組,也可采用不等距分組。采用不等距分組。2.1.2 次數(shù)分配o例2-1某生產(chǎn)車間30名工人周加工零件數(shù)如下(單位:件):2.1.2 次數(shù)分配o 一、單變量分組步驟n 首先對(duì)上面數(shù)據(jù)排序如下:首先對(duì)上面數(shù)據(jù)排序如下:n 84 85 88 91 91 94 95 96 97 99 101 101 103 105 105 1

8、05 106 106 106 106 107 107 109 110 111 111 118 119 121 1282.1.2 次數(shù)分配n 其次進(jìn)行單變量分組,形成頻數(shù)分布其次進(jìn)行單變量分組,形成頻數(shù)分布零件數(shù)(件) 頻數(shù)零件數(shù)件)頻數(shù)零件數(shù)(件)頻數(shù) 84 85 88 91 94 95 96 1 1 1 2 1 1 1 97 99 101 103 105 106 107 1 1 2 1 3 4 2 109 110 111 118 119 121 128 1 1 2 1 1 1 1 2.1.2 次數(shù)分配o 二、組距分組:n 將變量值的一個(gè)區(qū)間作為一組將變量值的一個(gè)區(qū)間作為一組n 適合于數(shù)值型變

9、量適合于數(shù)值型變量n 適合于變量值較多的情況適合于變量值較多的情況n 需要遵循需要遵循“不重不漏不重不漏”的原則的原則n 可采用等距分組,也可采用不等距可采用等距分組,也可采用不等距分組分組2.1.2 次數(shù)分配o 步驟:n 先排序先排序n 確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。的分布特征和規(guī)律為目的。n 可按斯特格斯(可按斯特格斯(Sturges)提出的經(jīng)驗(yàn)公式)提出的經(jīng)驗(yàn)公式確定組數(shù)確定組數(shù)K:K=1+1gN / 1g2,其中,其中N為數(shù)據(jù)個(gè)數(shù),計(jì)算結(jié)果取整。為數(shù)據(jù)個(gè)數(shù),計(jì)算結(jié)果取整。2.1.2 次數(shù)分配n 確定各組組距確定各組組距(

10、class width) :是一組:是一組上限與下限之差。組距分組又分等距、異距上限與下限之差。組距分組又分等距、異距分組:分組: 等距等距分組:各組組距相等,組距分組:各組組距相等,組距=(最大值(最大值最小最小值)值)/組數(shù),即全距組數(shù),即全距/組數(shù),組距宜取組數(shù),組距宜取5或或10的倍的倍數(shù)。數(shù)。 異距異距分組:各組組距不等,是某些特殊現(xiàn)象的需要,分組:各組組距不等,是某些特殊現(xiàn)象的需要,如對(duì)人口年齡分組:如對(duì)人口年齡分組: 06歲(嬰幼兒組)、歲(嬰幼兒組)、717歲(少年兒童組)、歲(少年兒童組)、1859歲(中青年組)、歲(中青年組)、60歲以上(老年組)。歲以上(老年組)。2.1

11、.2 次數(shù)分配n 確定組限:組限是組與組間的界限,各組確定組限:組限是組與組間的界限,各組有上限(有上限(upper limit)、下限、下限(low limit)。)。 組限的重疊與不重疊:連續(xù)型變量一般重疊,組限的重疊與不重疊:連續(xù)型變量一般重疊,離散型變量不重疊。 為了為了“不重不重”,上組限不在內(nèi)。,上組限不在內(nèi)。 第一組下限低于或等于最小值,最后一組上限高于第一組下限低于或等于最小值,最后一組上限高于最大值。最大值。 開(kāi)口組:為避免空白組或極值漏掉,第一或最后一開(kāi)口組:為避免空白組或極值漏掉,第一或最后一組采取組采取“以上以上”或或“以下以下”分組。分組。2.1.2 次數(shù)分配o 整理

12、成頻數(shù)分布表:計(jì)算各組頻數(shù)、頻率、組中值(class midpoint)、頻數(shù)密度、累計(jì)頻數(shù)。n 組中值是下限與上限之間的中點(diǎn)值反映各組數(shù)據(jù)的組中值是下限與上限之間的中點(diǎn)值反映各組數(shù)據(jù)的一般水平,組中值一般水平,組中值=(下限(下限+上限)上限)/ 2。 n 頻數(shù)密度頻數(shù)密度=頻數(shù)頻數(shù)/組距,等距分組的頻數(shù)分布不受組距,等距分組的頻數(shù)分布不受組距大小影響,異距分組的頻數(shù)分布受組距大小影組距大小影響,異距分組的頻數(shù)分布受組距大小影響,必須計(jì)算頻數(shù)密度。響,必須計(jì)算頻數(shù)密度。 n 累計(jì)頻數(shù)又分向上向下累計(jì):向上累積則是從變量累計(jì)頻數(shù)又分向上向下累計(jì):向上累積則是從變量值小的一一方向變量值大的一方累

13、加頻數(shù);向下累值小的一一方向變量值大的一方累加頻數(shù);向下累積相反。積相反。 2.1.2 次數(shù)分配o對(duì)于例2-1采用組距分組,計(jì)算組數(shù)K=1+1g30/ 1g2=5(組),組距=(128-84)/ 5=8.8,組距取10件,整理成頻數(shù)分布表2-3。按零件數(shù)分組頻數(shù)(人) 頻率(%) 向上累積 向下累積頻數(shù)(人)頻率(%)頻數(shù)(人)頻率(%) 8090 90100 100110 110120 120130 3 7 13 5 2 10.0 23.3 43.3 16.7 6.7 3 10 23 28 30 10.0 33.3 76.6 93.3100.0 30 27 20 7 2100.0 90.0

14、66.7 23.4 6.7 合計(jì) 30 100 2.1.3次數(shù)分配直方圖o (1)直方圖(histogram)n 用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布布n 在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖了一個(gè)矩形,即直方圖n 直方圖下的總面積等于直方圖下的總面積等于1 809010011012013004812分組數(shù)據(jù)的圖示(直方圖的繪制)o (2)

15、折線圖(frequency polygon) 也稱頻數(shù)多邊形圖,是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉o 折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是:n 第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸與其豎邊中點(diǎn)連接到橫軸n 折線圖下所圍成的面積與直方圖的面積相等,二者折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的所表示的頻數(shù)分布是一致的24分組數(shù)據(jù)的圖示(折線圖的繪制)809

16、010011012013004812 折線圖與直方圖下的面積相等!25o(3)分布曲線n正態(tài)分布:是一種對(duì)稱的鐘型分布,如市場(chǎng)正態(tài)分布:是一種對(duì)稱的鐘型分布,如市場(chǎng)的價(jià)格、身高、體重、成績(jī)等分布,如圖的價(jià)格、身高、體重、成績(jī)等分布,如圖2-3(a)26n偏態(tài)分布:如圖偏態(tài)分布:如圖2-3(b)人均收入分配27nJ型分布:有正型分布:有正J型,如經(jīng)濟(jì)學(xué)中的供給曲線;型,如經(jīng)濟(jì)學(xué)中的供給曲線;有反有反J型,如需求曲線。如圖型,如需求曲線。如圖2-3(c):):28nU型分布:兩端的頻數(shù)分布多,中間的少,型分布:兩端的頻數(shù)分布多,中間的少,如人和動(dòng)物的死亡率分布。如圖如人和動(dòng)物的死亡率分布。如圖2-

17、3(d):):p 一、洛倫茨曲線一、洛倫茨曲線20世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨(M.E. Lorentz)根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特(V. Pareto)提提出的收入分配公式繪制而成描述收入和財(cái)富分配性質(zhì)出的收入分配公式繪制而成描述收入和財(cái)富分配性質(zhì) 的曲線,分析該國(guó)家或地的曲線,分析該國(guó)家或地 區(qū)分配的平均程度區(qū)分配的平均程度 AB2.1.4 洛倫茨曲線p 二、基尼系數(shù)二、基尼系數(shù)1. 20世紀(jì)初意大利經(jīng)濟(jì)學(xué)世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼家基尼(G. Gini)根據(jù)洛倫根據(jù)洛倫茨曲線給出了衡量收入分配茨曲線給出了衡量收入分配平均程度的指

18、標(biāo)平均程度的指標(biāo)AB 其中,其中,A表示實(shí)際收入曲線表示實(shí)際收入曲線與絕對(duì)平均線之間的面積,與絕對(duì)平均線之間的面積,B表示實(shí)際收入曲線與絕對(duì)表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積不平均線之間的面積=AAB基尼系數(shù)基尼系數(shù)2. 評(píng)價(jià)標(biāo)準(zhǔn)評(píng)價(jià)標(biāo)準(zhǔn)(1)如果A=0,則基尼系數(shù)=0,表示收入絕對(duì)平均;(2)如果B=0,則基尼系數(shù)=1,表示收入絕對(duì)不平均;(3)基尼系數(shù)在0 和1之間取值;(4)基尼系數(shù)若小于0.2,表明分配平均但缺乏效率;(5)基尼系數(shù)在0.2至0.4之間是比較適當(dāng)?shù)?,即一個(gè)社會(huì)既有效率又沒(méi)有造成極大的分配不公;(6)基尼系數(shù)在0.4被認(rèn)為是收入分配不公平的警戒線,超過(guò)了0.4應(yīng)該采

19、取措施縮小這一差距。【2013年全國(guó)基尼系數(shù)為0.473】2.2 分布集中趨勢(shì)的測(cè)度o 2.2.1 眾數(shù)o 2.2.2 中位數(shù)o 2.2.3 四分位數(shù)o 2.2.4 均值o 2.2.5 調(diào)和平均數(shù)o 2.2.6 幾何平均數(shù)o 2.2.7 切尾均值o 2.2.8 眾數(shù)、中位數(shù)和均值的關(guān)系2.2.1 眾數(shù)o 一、眾數(shù)的概念n 1. 眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,適合于數(shù)據(jù)量較多時(shí)使用,主要用于分值,適合于數(shù)據(jù)量較多時(shí)使用,主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。在統(tǒng)計(jì)實(shí)踐中有時(shí)用眾數(shù)說(shuō)明現(xiàn)象的一般水在統(tǒng)計(jì)實(shí)踐中

20、有時(shí)用眾數(shù)說(shuō)明現(xiàn)象的一般水平,如了解市場(chǎng)需求量多的服裝款式。平,如了解市場(chǎng)需求量多的服裝款式。n 2. 從分布看,它是數(shù)據(jù)分布的最高峰點(diǎn),從分布看,它是數(shù)據(jù)分布的最高峰點(diǎn),若沒(méi)有最高峰點(diǎn),眾數(shù)可以不存在,也可以若沒(méi)有最高峰點(diǎn),眾數(shù)可以不存在,也可以有多個(gè)高峰點(diǎn),對(duì)應(yīng)多個(gè)眾數(shù)。有多個(gè)高峰點(diǎn),對(duì)應(yīng)多個(gè)眾數(shù)。無(wú)眾數(shù)無(wú)眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8o 二、眾數(shù)的確定與計(jì)算n (1)未分組未分組數(shù)據(jù)或單變量值分組數(shù)據(jù):找數(shù)據(jù)或單變量值分組數(shù)據(jù):找出出現(xiàn)次數(shù)最多的變量值。出出現(xiàn)次數(shù)最多的變量值。n (2)組距分組組距分組數(shù)據(jù):眾數(shù)數(shù)值與其相鄰兩數(shù)據(jù):眾數(shù)數(shù)值與其相鄰兩組的頻數(shù)分布有關(guān)。設(shè)眾數(shù)組

21、的頻數(shù)為組的頻數(shù)分布有關(guān)。設(shè)眾數(shù)組的頻數(shù)為f,前一組頻數(shù)為前一組頻數(shù)為f-1,后一組頻數(shù)為,后一組頻數(shù)為f+1。n 圖形確定:從眾數(shù)組直方圖的兩頂角向相圖形確定:從眾數(shù)組直方圖的兩頂角向相鄰兩組直方圖的兩頂角引直線,其交點(diǎn)向橫鄰兩組直方圖的兩頂角引直線,其交點(diǎn)向橫軸引垂線,交點(diǎn)為眾數(shù)。看圖軸引垂線,交點(diǎn)為眾數(shù)。看圖2-4:當(dāng)f-1=f+1時(shí)如圖(a),當(dāng)f-1f+1時(shí)如圖(b),當(dāng)f-1f+1時(shí)如圖(c)。 (a) (b) (c)n 公式計(jì)算:公式計(jì)算:上限公式上限公式下限公式下限公式n M0表示眾數(shù),表示眾數(shù),L表示眾數(shù)組的下限值,表示眾數(shù)組的下限值,U表示表示眾數(shù)組的上限值,眾數(shù)組的上限值

22、,i表示眾數(shù)組的組距。表示眾數(shù)組的組距。iffffffUM)()(1110) 1 . 2()()(1110iffffffLM38表2-9某車間30名工人加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人) 頻率(%) 向上累積 向下累積頻數(shù)(人)頻率(%)頻數(shù)(人)頻率(%) 8090 90100 100110 110120 120130 3 7 13 5 2 10.0 23.3 43.3 16.7 6.7 3 10 23 28 30 10.0 33.3 76.6 93.3100.0 30 27 20 7 2100.0 90.0 66.7 23.4 6.7 合計(jì) 30 100 例2-2n 根據(jù)本章表根據(jù)本章

23、表2-9的數(shù)據(jù),計(jì)算的數(shù)據(jù),計(jì)算30名工名工人周加工零件數(shù)的眾數(shù)。人周加工零件數(shù)的眾數(shù)。n 解:眾數(shù)組為解:眾數(shù)組為100110,其頻數(shù)為,其頻數(shù)為13,根據(jù)公式計(jì)算眾數(shù)為:,根據(jù)公式計(jì)算眾數(shù)為:0013710010104.29(137)(13529(137)(135)MM件)件)n (3 3)公式計(jì)算的假定:)公式計(jì)算的假定: 數(shù)據(jù)分布具有明顯的集中趨勢(shì),同時(shí)假定數(shù)據(jù)分布具有明顯的集中趨勢(shì),同時(shí)假定眾數(shù)組的頻數(shù)在該組內(nèi)是均勻分布的。眾數(shù)組的頻數(shù)在該組內(nèi)是均勻分布的。 若假定不存在,眾數(shù)的代表性會(huì)很差。若假定不存在,眾數(shù)的代表性會(huì)很差。o三、眾數(shù)的統(tǒng)計(jì)思想n 在一組數(shù)

24、據(jù)的中心點(diǎn)附近,變量值出在一組數(shù)據(jù)的中心點(diǎn)附近,變量值出現(xiàn)的頻數(shù)較高,根據(jù)眾數(shù)組及相鄰兩現(xiàn)的頻數(shù)較高,根據(jù)眾數(shù)組及相鄰兩組的頻數(shù)分布,確定中心點(diǎn)的位置。組的頻數(shù)分布,確定中心點(diǎn)的位置。n 因此,眾數(shù)是一個(gè)位置代表值,它不因此,眾數(shù)是一個(gè)位置代表值,它不受數(shù)據(jù)中極端值的影響。例如農(nóng)貿(mào)市受數(shù)據(jù)中極端值的影響。例如農(nóng)貿(mào)市場(chǎng)商品的價(jià)格。場(chǎng)商品的價(jià)格。2.2.2 中位數(shù)o一、中位數(shù)的概念n 它是一組數(shù)據(jù)按大小排序后,處于中間位置它是一組數(shù)據(jù)按大小排序后,處于中間位置上的變量值。主要用于順序數(shù)據(jù),也可用數(shù)上的變量值。主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)。值型數(shù)據(jù),但不能用于分類數(shù)據(jù)。n

25、中位數(shù)將全部數(shù)據(jù)等分成兩部分,一部分?jǐn)?shù)中位數(shù)將全部數(shù)據(jù)等分成兩部分,一部分?jǐn)?shù)據(jù)比中位數(shù)大,另一部分比中位數(shù)小,它也據(jù)比中位數(shù)大,另一部分比中位數(shù)小,它也是一個(gè)位置代表值。是一個(gè)位置代表值。原始數(shù)據(jù):分組數(shù)據(jù):o 二、中位數(shù)的位置二、中位數(shù)的位置n 1.1. 未分組未分組數(shù)據(jù)計(jì)算數(shù)據(jù)計(jì)算n(1) 9個(gè)數(shù)據(jù)的算例:個(gè)數(shù)據(jù)的算例:n【例例】 9個(gè)家庭的人均月收入數(shù)據(jù)個(gè)家庭的人均月收入數(shù)據(jù)n原始數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1

26、 2 3 4 5 6 7 8 9n(2) 10個(gè)數(shù)據(jù)的算例:個(gè)數(shù)據(jù)的算例:n【例例】 10個(gè)家庭的人均月收入數(shù)據(jù)個(gè)家庭的人均月收入數(shù)據(jù)n排排 序序: 660 750 780 850 960 1080 1250 1500 1630 2000n位置位置: 1 2 3 4 5 6 7 8 9 10n 2. 根據(jù)根據(jù)分組數(shù)據(jù)分組數(shù)據(jù)計(jì)算:計(jì)算: 先根據(jù)公式先根據(jù)公式 N/2 確定中位數(shù)的位置,確定中位數(shù)的位置,并確定其所在組,然后公式計(jì)算:并確定其所在組,然后公式計(jì)算:o 下限公式o 上限公式o 式中:N為數(shù)據(jù)的個(gè)數(shù),L、U為中位數(shù)所在組下限、上限,Sm-1為中位數(shù)所在組以前各組的向上累積頻數(shù),Sm+

27、1為中位數(shù)所在組之后各組的向下累積頻數(shù),fm為中位數(shù)所在組的頻數(shù),i為中位數(shù)所在組的組距。 ifSNLMmme 1212memNSMUif48表2-3某車間30名工人加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人) 頻率(%) 向上累積 向下累積頻數(shù)(人)頻率(%)頻數(shù)(人)頻率(%) 8090 90100 100110 110120 120130 3 7 13 5 2 10.0 23.3 43.3 16.7 6.7 3 10 23 28 30 10.0 33.3 76.6 93.3100.0 30 27 20 7 2100.0 90.0 66.7 23.4 6.7 合計(jì) 30 100 o 根據(jù)公式計(jì)算

28、例2-1的數(shù)據(jù),計(jì)算30名工人周加工零件數(shù)的中位數(shù)。o 解:中位數(shù)的位置=30/2=15,即它在100110一組,L=100,U=110,Sm-1=10,Sm+1=7,fm=13,i=10,代入公式得:3010210010103.8()13307211010103.8()13eeMM件件這樣計(jì)算假定中位數(shù)所在組頻數(shù)分布是均勻的。o 三、中位數(shù)的特點(diǎn)與性質(zhì)n (1)特點(diǎn):)特點(diǎn): 穩(wěn)健性,其數(shù)值不受極值的影響。穩(wěn)健性,其數(shù)值不受極值的影響。 當(dāng)數(shù)據(jù)大量重復(fù)某一數(shù)值時(shí),中位數(shù)不夠準(zhǔn)確。當(dāng)數(shù)據(jù)大量重復(fù)某一數(shù)值時(shí),中位數(shù)不夠準(zhǔn)確。n (2)性質(zhì):各變量值與中位數(shù)的離差絕對(duì))性質(zhì):各變量值與中位數(shù)的離差

29、絕對(duì)值之和最小,即值之和最小,即)min(1最小MXeNii2.2.3 四分位數(shù)一、四分位數(shù)的概念一、四分位數(shù)的概念 1. 排序后處于25%和75%位置上的值3. 二、四分位數(shù)的位置二、四分位數(shù)的位置四分位數(shù)的求法 (9個(gè)數(shù)據(jù)的算例)o【例例】:9 9個(gè)家庭的人均月收入數(shù)據(jù)個(gè)家庭的人均月收入數(shù)據(jù)o原始數(shù)據(jù)原始數(shù)據(jù): : 1500 750 780 1080 850 960 2000 1250 1500 750 780 1080 850 960 2000 1250 16301630o排序排序: 750 780 850 960 1080 1250 1500 1630 2000: 750 780 85

30、0 960 1080 1250 1500 1630 2000o位置位置: 1 2 3 4 5 6 7 8 9: 1 2 3 4 5 6 7 8 9四分位數(shù)的求法 (10個(gè)數(shù)據(jù)的算例)o【例例】:1010個(gè)家庭的人均月收入數(shù)據(jù)個(gè)家庭的人均月收入數(shù)據(jù)o排序排序: 660 750 780 850 960 1080 1250 1500 1630 2000: 660 750 780 850 960 1080 1250 1500 1630 2000o位置位置: 1 2 3 4 5 6 7 8 9 10 : 1 2 3 4 5 6 7 8 9 10 o 公式1123311121342434mmmemmmNS

31、QLifNSQMLifNSQLifo 算例:根據(jù)書(shū)上1973-1974年澳大利亞收入分布資料計(jì)算其四分位數(shù):另一個(gè)四分位數(shù)自己計(jì)算。元)(2793400%29. 6%82.184%10024001Q2.2.4 均值o一、均值的概念n 又稱算術(shù)平均數(shù),它是全部數(shù)據(jù)的算又稱算術(shù)平均數(shù),它是全部數(shù)據(jù)的算術(shù)平均,是集中趨勢(shì)的最主要測(cè)度值。術(shù)平均,是集中趨勢(shì)的最主要測(cè)度值。用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)和順序數(shù)據(jù)n 根據(jù)數(shù)據(jù)表現(xiàn)形式不同,均值的計(jì)算根據(jù)數(shù)據(jù)表現(xiàn)形式不同,均值的計(jì)算不同。不同。o 二、根據(jù)未分組數(shù)據(jù)計(jì)算均值n 1.公式:設(shè)總體數(shù)據(jù)為公式:設(shè)總體數(shù)

32、據(jù)為X1,X2,XN,樣,樣本數(shù)據(jù)本數(shù)據(jù)x1,x2,xn ,總體均值和樣本均值,總體均值和樣本均值的計(jì)算公式分別為:的計(jì)算公式分別為: 12121_1(2.3)(2.4)iNiNinniXXXXNNxxxxxnnn 2.例子:根據(jù)例例子:根據(jù)例2-1的數(shù)據(jù),計(jì)算的數(shù)據(jù),計(jì)算30名工人周加工名工人周加工零件數(shù)的均值為:零件數(shù)的均值為:)(5 .1033010111184106_件x這種方法計(jì)算又稱簡(jiǎn)單算術(shù)平均(simple mean) ,均值受變量值大小影響o 二、根據(jù)分組數(shù)據(jù)計(jì)算均值n 1.1.公式:設(shè)原始數(shù)據(jù)被分成公式:設(shè)原始數(shù)據(jù)被分成K K或或k k組,各組變組,各組變量值為量值為X X1

33、 1,X,X2 2, , ,X,XK K,或,或x x1 1,x,x2 2, , , ,x xk k,各組,各組變量值出現(xiàn)的頻數(shù)分別為變量值出現(xiàn)的頻數(shù)分別為F F1 1,F,F2 2, , ,F,FK K,或,或f f1 1,f,f2 2, , , ,f fk k,則總體均值和樣本均值的計(jì),則總體均值和樣本均值的計(jì)算公式為算公式為: : 11221211221121_11(2.5)(2.6)KiiKKiKKiiki ik kikkiiXFX FX FX FFFFFxfx fx fx fxffffn 2. 例:根據(jù)例例:根據(jù)例2-1的數(shù)據(jù),的數(shù)據(jù),計(jì)算計(jì)算30名工人名工人日加工零件數(shù)日加工零件數(shù)

34、均值。均值。n 解解:計(jì)算見(jiàn)表。計(jì)算見(jiàn)表。 表表2-4 某車間某車間30名工人日加工零件數(shù)均名工人日加工零件數(shù)均值計(jì)算表值計(jì)算表 例2-3o代入公式得:o 這樣計(jì)算用各組組中值代表各組實(shí)際數(shù)據(jù),假定各組數(shù)據(jù)在組內(nèi)均勻分布,與簡(jiǎn)單算術(shù)平均結(jié)果103.5比,差0.83件,是犧牲精度換來(lái)計(jì)算方便。(件)67.10230308011_KiiKiiiFFXxn 3. 這種算法又稱加權(quán)算術(shù)平均或加權(quán)均值這種算法又稱加權(quán)算術(shù)平均或加權(quán)均值(weighted mean) ,均值大小受各組變量值,均值大小受各組變量值Xi大小影響,又受各組變量值出現(xiàn)頻數(shù)多少大小影響,又受各組變量值出現(xiàn)頻數(shù)多少(權(quán)數(shù)(權(quán)數(shù)Fi大小

35、)的影響。大?。┑挠绊?。n 如果某一組的權(quán)數(shù)較大,說(shuō)明該組數(shù)據(jù)較多,如果某一組的權(quán)數(shù)較大,說(shuō)明該組數(shù)據(jù)較多,它對(duì)均值的影響就越大;反之,則越小。我它對(duì)均值的影響就越大;反之,則越小。我們?cè)倏醋冃喂健冊(cè)倏醋冃喂健?7 . 2(1111_KiiiKiiKiiKiiiFFXFFXX(2.6)式的變形2.2.5 調(diào)和平均數(shù)o 1. 調(diào)和平均的獨(dú)立形式:它是各個(gè)變量值倒數(shù)的算數(shù)平均數(shù)的倒數(shù),又稱倒數(shù)平均數(shù)。未分組資料公式:o 分組數(shù)據(jù)公式:xnxxxHnM111111121fxffxfxfxfffHnnnM1111221121例子o 某市場(chǎng)白菜價(jià)格,早市為每元1公斤,中市為每元1.5公斤,晚市為每

36、元2公斤,則白菜全天平均價(jià)為:)/(38. 117. 23215 . 111111111111121元公斤nMxxxHo 2.又稱調(diào)和均值,實(shí)際工作中由于所獲數(shù)據(jù)不同,有時(shí)不能直接采用均值公式計(jì)算這時(shí)需用調(diào)和平均數(shù)形式計(jì)算,是均值的另一形式。o 例子:某蔬菜批發(fā)市場(chǎng)三種蔬菜的日成交額數(shù)據(jù)見(jiàn)下表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格。2.2.5 調(diào)和平均數(shù) 表某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價(jià)(元) X i成交量() Fi成交額(元) Xi*Fi 甲 乙 丙 1.20 0.50 0.80 15000 25000 8000 18000 12500 6400 合計(jì) 48000 36900 例子的解法

37、o從實(shí)際意義,計(jì)算方法是平均價(jià)=成交額/成交量o若已知批發(fā)價(jià)、成交量,加權(quán)算術(shù)平均計(jì)算:(元)769.0480003690011_KiiKiiiFFXX 例子的解法 若已知批發(fā)價(jià)、成交額,需先求成交量,調(diào)和平均計(jì)算:o 這與算術(shù)平均計(jì)算結(jié)果一致,實(shí)際它是加權(quán)算術(shù)平均的變形,即:110.7691KiiiiMMKiiiiiiX FMHHX FMXX即( 元 )_ _1iiiMiiiMX FHXFMX2.2.6幾何平均數(shù)p 1. n 個(gè)變量值乘積的個(gè)變量值乘積的 n 次方根次方根p 2. 適用于對(duì)比率數(shù)據(jù)的平均適用于對(duì)比率數(shù)據(jù)的平均p 3. 主要用于計(jì)算平均增長(zhǎng)率主要用于計(jì)算平均增長(zhǎng)率p 4. 計(jì)算

38、公式為計(jì)算公式為幾何均值的求法 (例題分析)o 【例例】一位投資者購(gòu)持有一種股票,在一位投資者購(gòu)持有一種股票,在2000年、年、2001年、年、2002年和年和2003年收益率分別為年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年計(jì)算該投資者在這四年內(nèi)的平均收益率內(nèi)的平均收益率 o 【例例】我國(guó)1998-2002年各年的國(guó)內(nèi)生產(chǎn)總值如表,計(jì)算這幾年間國(guó)內(nèi)生產(chǎn)總值的平均速度。年份1998 1999 2000 2001 2002國(guó)內(nèi)生產(chǎn)總值(億元)78345.2 82067.5 89468.1 97314.8 104790.62.2.7切尾均值p1. 去掉大小兩端的若干

39、數(shù)值后計(jì)算中間數(shù)據(jù)去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值的均值p2. 在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用p3. 計(jì)算公式為計(jì)算公式為n 表示觀察值的個(gè)數(shù);表示觀察值的個(gè)數(shù); 表示切尾系數(shù)。表示切尾系數(shù)。 n 表示觀察值的個(gè)數(shù);表示觀察值的個(gè)數(shù); 表示切尾系數(shù)。表示切尾系數(shù)。n 表示觀察值的個(gè)數(shù);表示觀察值的個(gè)數(shù); 表示切尾系數(shù)。表示切尾系數(shù)。123456, , , , , ,9.22,9.25,9.20,9.30,9.65,9.30,xxxxxx7891011, , , , 9.27,

40、9.20,9.28,9.25,9.24xxxxx(1)(2)(3)(4)(5)(6), , , , , ,9.20, 9.20, 9.22, 9.24, 9.25, 9.25,xxxxxx【例例】某次比賽共有11名評(píng)委,對(duì)某位歌手的給分分別是: (7)(8)(9)(10)(11), , , , 9.27, 9.28, 9.30, 9.30, 9.65xxxxx 2.8.1眾數(shù)、中位數(shù)和均值的關(guān)系o 一、關(guān)系n 1. 從從分布分布的角度:眾數(shù)是一組數(shù)據(jù)分布的最高的角度:眾數(shù)是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,均值是全部數(shù)據(jù)的算術(shù)

41、平均。均值是全部數(shù)據(jù)的算術(shù)平均。n 如果數(shù)據(jù)有單一眾數(shù)且對(duì)稱分布如果數(shù)據(jù)有單一眾數(shù)且對(duì)稱分布:n 如果數(shù)據(jù)是左偏分布:如果數(shù)據(jù)是左偏分布:n 如果數(shù)據(jù)右偏分布如果數(shù)據(jù)右偏分布:_XMMeooeMMX_XMMeon 2. 從數(shù)值關(guān)系看從數(shù)值關(guān)系看,當(dāng)數(shù)據(jù)分布偏度不大時(shí),當(dāng)數(shù)據(jù)分布偏度不大時(shí),三者在數(shù)軸上的三點(diǎn)構(gòu)成一定的數(shù)量關(guān)系,三者在數(shù)軸上的三點(diǎn)構(gòu)成一定的數(shù)量關(guān)系,即眾數(shù)距離均值最遠(yuǎn),中位數(shù)在二者之間,即眾數(shù)距離均值最遠(yuǎn),中位數(shù)在二者之間,若把眾數(shù)與均值間距離作為若把眾數(shù)與均值間距離作為1,則中位數(shù)與,則中位數(shù)與均值的距離約為均值的距離約為1/3,中位數(shù)與眾數(shù)間距離約,中位數(shù)與眾數(shù)間距離約為為2

42、/3 。o 二、特點(diǎn)n1. 眾數(shù)是一組數(shù)據(jù)分布的峰值,是位置代表值。優(yōu)眾數(shù)是一組數(shù)據(jù)分布的峰值,是位置代表值。優(yōu)點(diǎn)是易理解,不受極值的影響。當(dāng)數(shù)據(jù)分布集中趨點(diǎn)是易理解,不受極值的影響。當(dāng)數(shù)據(jù)分布集中趨勢(shì)明顯時(shí),其代表性比均值好。缺點(diǎn)是不唯一。勢(shì)明顯時(shí),其代表性比均值好。缺點(diǎn)是不唯一。n 2. 中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,類似的中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,類似的有四分位數(shù)、十分位數(shù)、百分位數(shù)等。它不受極值有四分位數(shù)、十分位數(shù)、百分位數(shù)等。它不受極值的影響,當(dāng)數(shù)據(jù)偏態(tài)分布時(shí),代表性好于均值。的影響,當(dāng)數(shù)據(jù)偏態(tài)分布時(shí),代表性好于均值。n 3. 3. 均值是根據(jù)全部數(shù)據(jù)計(jì)算,具有優(yōu)良的

43、數(shù)學(xué)性質(zhì),均值是根據(jù)全部數(shù)據(jù)計(jì)算,具有優(yōu)良的數(shù)學(xué)性質(zhì),應(yīng)用最廣泛。缺點(diǎn)受極值影響,數(shù)據(jù)偏態(tài)分布時(shí),應(yīng)用最廣泛。缺點(diǎn)受極值影響,數(shù)據(jù)偏態(tài)分布時(shí),其代表性差。其代表性差。n 4. 4. 均值的變形幾何平均數(shù)、調(diào)和平均數(shù)適合特殊代均值的變形幾何平均數(shù)、調(diào)和平均數(shù)適合特殊代表值,前者用于計(jì)算比率的平均數(shù),后者用于不能表值,前者用于計(jì)算比率的平均數(shù),后者用于不能直接計(jì)算均值的數(shù)據(jù)直接計(jì)算均值的數(shù)據(jù)o 三、應(yīng)用場(chǎng)合:n 1.1.從分布看,數(shù)據(jù)接近對(duì)稱分布時(shí),選擇均從分布看,數(shù)據(jù)接近對(duì)稱分布時(shí),選擇均值作為代表值;對(duì)于偏態(tài)分布選擇眾數(shù)、中值作為代表值;對(duì)于偏態(tài)分布選擇眾數(shù)、中位數(shù)等位置代表值,代表性好于均值

44、。位數(shù)等位置代表值,代表性好于均值。n 2. 2. 從數(shù)據(jù)類型,定類、定序數(shù)據(jù)可以計(jì)算從數(shù)據(jù)類型,定類、定序數(shù)據(jù)可以計(jì)算眾數(shù)、中位數(shù),無(wú)法計(jì)算均值;定距、定比眾數(shù)、中位數(shù),無(wú)法計(jì)算均值;定距、定比數(shù)據(jù)可以計(jì)算均值、也可以計(jì)算眾數(shù)、中位數(shù)據(jù)可以計(jì)算均值、也可以計(jì)算眾數(shù)、中位數(shù);調(diào)和、幾何平均數(shù)不適合定距數(shù)據(jù),定數(shù);調(diào)和、幾何平均數(shù)不適合定距數(shù)據(jù),定比數(shù)據(jù)可以計(jì)算比數(shù)據(jù)可以計(jì)算2.3 分布離散程度的測(cè)度o本節(jié)內(nèi)容:考察變量值間的差異程度,研究數(shù)據(jù)的離散程度,就是變量值遠(yuǎn)離中心值的程度,又稱離中趨勢(shì)。o數(shù)據(jù)的離散程度反映了集中趨勢(shì)測(cè)度值的代表性,離散程度越大,說(shuō)明集中趨勢(shì)測(cè)度值的代表性越差,反之,越

45、好。o2.3.1 極差o2.3.2 內(nèi)距o2.3.3 方差和標(biāo)準(zhǔn)差o2.3.4 離散系數(shù)2.3 分布離散程度的測(cè)度o 一、極差n 又稱全距,它是一組數(shù)據(jù)的最大值與最小值又稱全距,它是一組數(shù)據(jù)的最大值與最小值之差,即之差,即 R =max(Xi)min(Xi) (2.9) 式中:式中:R表示極差,表示極差,max(Xi)和)和min(Xi)分別表示一組數(shù)據(jù)的最大、最小值。分別表示一組數(shù)據(jù)的最大、最小值。n 組距分組數(shù)據(jù)的極差可表示為:組距分組數(shù)據(jù)的極差可表示為: R最高組上限最高組上限最低組下限最低組下限2.3.1 極差o根據(jù)第二章例2-1中的數(shù)據(jù)計(jì)算極差:R=128-84=44128-84=4

46、4(件) 根據(jù)分組后的數(shù)據(jù)計(jì)算: R 130-80=50(件)o二、極差的特點(diǎn)n 計(jì)算簡(jiǎn)單,易于理解,實(shí)際中如股計(jì)算簡(jiǎn)單,易于理解,實(shí)際中如股票的最高價(jià)與最低價(jià)。票的最高價(jià)與最低價(jià)。n 但它受極值的影響,原因在它只是但它受極值的影響,原因在它只是用到兩端數(shù)據(jù),不能反映中間數(shù)據(jù)用到兩端數(shù)據(jù),不能反映中間數(shù)據(jù)的分布,實(shí)際中如比賽中要去掉一的分布,實(shí)際中如比賽中要去掉一個(gè)最高分、一個(gè)最低分。個(gè)最高分、一個(gè)最低分。2.3.2 內(nèi)距o 內(nèi)距也稱四分位差,上四分位數(shù)與下四分位數(shù)之差 內(nèi) 距= Q3 Q1o 反映了中間50%數(shù)據(jù)的離散程度o 不受極端值的影響o 可用于衡量中位數(shù)的代表性o 一、方差n 它是各

47、變量值與其均值離差平方的平均數(shù),它是各變量值與其均值離差平方的平均數(shù),是測(cè)度定距、定比數(shù)據(jù)離散程度的最主要方是測(cè)度定距、定比數(shù)據(jù)離散程度的最主要方法。法。n 根據(jù)總體數(shù)據(jù)和樣本數(shù)據(jù)計(jì)算方差在數(shù)學(xué)處根據(jù)總體數(shù)據(jù)和樣本數(shù)據(jù)計(jì)算方差在數(shù)學(xué)處理上略有不同。理上略有不同。2.3.3 方差和標(biāo)準(zhǔn)差91o 1. 設(shè)總體方差為2,對(duì)于未分組數(shù)據(jù),方差計(jì)算公式為:o 2. 對(duì)于分組數(shù)據(jù),公式為:212_ _(2 .1 0 )1NiiNXX2121_ _(2 .1 1)1KiiiKiiFFXX923.3.2總體方差和標(biāo)準(zhǔn)差o 二、標(biāo)準(zhǔn)差:方差的平方根即為標(biāo)準(zhǔn)差。n 未分組數(shù)據(jù):未分組數(shù)據(jù):n 分組數(shù)據(jù):分組數(shù)據(jù):

48、21_ _( 2 .1 2 )1NiiNXX211_ _( 2 .1 3 )1NiiiKiiFFXX o三、自由度(degree of freedom)n 自由度指一組數(shù)據(jù)中可自由取值的個(gè)數(shù)。自由度指一組數(shù)據(jù)中可自由取值的個(gè)數(shù)。當(dāng)樣本數(shù)據(jù)為當(dāng)樣本數(shù)據(jù)為n n,均值確定后只有,均值確定后只有n-1n-1個(gè)數(shù)個(gè)數(shù)據(jù)可以自由取值。例如,有據(jù)可以自由取值。例如,有2 2、4 4、9 9三個(gè)數(shù)三個(gè)數(shù)值,均值為值,均值為5 5,此后只有兩個(gè)值可以自由取,此后只有兩個(gè)值可以自由取,比如前兩個(gè)值為比如前兩個(gè)值為6 6、7 7,則第三個(gè)值只能是,則第三個(gè)值只能是2 2。n 樣本方差用自由度去除原因是抽樣估計(jì)中樣

49、本方差用自由度去除原因是抽樣估計(jì)中用用S S2 2n-1n-1估計(jì)估計(jì)2 ,是,是2的無(wú)偏估計(jì)量的無(wú)偏估計(jì)量o用例2-1分組的數(shù)據(jù)計(jì)算樣本標(biāo)準(zhǔn)差:o當(dāng)n很大時(shí),樣本方差與總體方差計(jì)算結(jié)果相差很小,可以用樣本方差公式計(jì)算。件)(47.1053.109151512167.102iiiiinffxS 例子o已知某產(chǎn)品的合格率為95%,求其合格率的標(biāo)準(zhǔn)差。o解:95%P%79.21%5%95)1 (PPo 離散系數(shù)又稱標(biāo)準(zhǔn)差系數(shù)(Coefficient of Variance) ,它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo)。n 方差和標(biāo)準(zhǔn)差是反映數(shù)據(jù)分散程度的絕對(duì)數(shù),方差和標(biāo)準(zhǔn)差是

50、反映數(shù)據(jù)分散程度的絕對(duì)數(shù),它受變量值大小和其均值大小的影響它受變量值大小和其均值大小的影響,且有單且有單位。位。n 對(duì)均值不同或計(jì)量單位不同的變量值,不能對(duì)均值不同或計(jì)量單位不同的變量值,不能直接比較。直接比較。n 引入離散系數(shù),剔除均值大小不等的影響。引入離散系數(shù),剔除均值大小不等的影響。2.3.4 離散系數(shù)o 計(jì)算公式為: 分別表示總體離散系數(shù)和樣本離散系數(shù)。o 例:某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如下表所示。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度。(2.18sSVVXx和)企業(yè)編號(hào)產(chǎn)品銷售額(萬(wàn)元) X1銷售利潤(rùn)(萬(wàn)元) X2 1 2 3 4 5 6 7 8 170 220 3

51、90 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0o 由于銷售額與利潤(rùn)額數(shù)據(jù)水平不同,不能直接用標(biāo)準(zhǔn)差比較,需要計(jì)算離散系數(shù)。由表中數(shù)據(jù)得: =536.25(萬(wàn)元) S1=309.19 (萬(wàn)元)V1=0.577 =32.5215(萬(wàn)元) S2=23.09(萬(wàn)元)V2=0.710o 計(jì)算結(jié)果表明V1V2,說(shuō)明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度。o 離散系數(shù)是從相對(duì)的角度觀察差異和離散程度,在比較相關(guān)事物差異的程度時(shí),較之直接比較標(biāo)準(zhǔn)差好些。1x2xo 對(duì)于一個(gè)未知的分布,不僅要掌握數(shù)據(jù)的集中趨勢(shì)和離散程度,還需要知

52、道數(shù)據(jù)分布的形狀是否對(duì)稱、偏斜程度以及分布的扁平程度。為此本節(jié)主要研究以下主要內(nèi)容:o 2.4.1 偏態(tài)及其測(cè)度o 2.4.2 峰度及其測(cè)度2.4 分布偏態(tài)與峰度測(cè)度2.4.1 偏態(tài)及其測(cè)度o 偏態(tài)(Skewness)是對(duì)分布偏斜方向及程度的測(cè)度。前面學(xué)過(guò)用眾數(shù)、中位數(shù)和均值間的關(guān)系判斷分布是左偏還是右偏,但不能測(cè)度偏斜程度,這需要計(jì)算偏態(tài)系數(shù),它是對(duì)分布偏斜程度的測(cè)度。o 公式為:313(2.15)kiiifiSKfxxs o 根據(jù)離差三次方的平均數(shù)再除以標(biāo)準(zhǔn)差的三次方,當(dāng)分布對(duì)稱時(shí),離差三次方后正負(fù)離差可以相互抵消,公式分子為0,則SK=0;o 當(dāng)分布不對(duì)稱時(shí),正負(fù)離差不能抵消, SK有正

53、負(fù)。 SK為正值表示正偏離差值較大,可以判斷正偏或右偏;反之, SK為負(fù)值表示負(fù)離差數(shù)值較大,可以判斷為負(fù)偏或左偏。o 在計(jì)算SK時(shí),將離差三次方的平均數(shù)除以標(biāo)準(zhǔn)差的三次方是把偏態(tài)系數(shù)轉(zhuǎn)化為相對(duì)數(shù), SK的絕對(duì)值越大,表示偏斜程度越大。o 例:已知1997年我國(guó)農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表2-6。計(jì)算偏態(tài)系數(shù)。表2-6農(nóng)村居民家庭按純收入分組的數(shù)據(jù)按純收入分(百元) 5以下510101515202025戶數(shù)比重(%)2.2812.4520.3519.5214.93按純收入分(百元)2530 303535404045455050以上戶數(shù)比重(%)10.356.564.132.681.8

54、14.94o 解:計(jì)算過(guò)程見(jiàn)表 (略),根據(jù)表數(shù)據(jù)計(jì)算得:_1121.429(iKiKiiifXxf百 元 )百元)(089.121112kiiniiffisxxo 將計(jì)算結(jié)果代入公式得:o 由結(jié)果知,偏態(tài)系數(shù)為正,且數(shù)值較大,說(shuō)明農(nóng)村家庭純收入的分布為右偏分布,即收入較少的家庭占多數(shù),收入較高的家庭占少數(shù),且偏斜的程較大。956. 07339.176625.1689313sxxikiiffiSKo峰度(kurtosis),記為K,是對(duì)數(shù)據(jù)分布平峰或尖峰程度的測(cè)度。分布集中趨勢(shì)高峰的形狀。它通常是與正態(tài)分布相比而言,在同一方差時(shí),若分布比正態(tài)分布更高更瘦,則為尖峰分布,反之,則為平峰分布,如圖

55、2-5所示把握以下問(wèn)題:2.4.2 峰度及其測(cè)度 如圖o o 峰度系數(shù)是離差四次方的平均數(shù),再除以標(biāo)準(zhǔn)差的四次方,公式為:4143(2.16)kiiifiKf sxx o 公式的理解:將離差的四次方除以標(biāo)準(zhǔn)差的四次方是為了將峰度系數(shù)轉(zhuǎn)化成相對(duì)數(shù)。o 用峰度系數(shù)說(shuō)明分布的尖峰和扁平程度,是與正態(tài)分布的峰度系數(shù)比較而言。由于正態(tài)分布的峰度系數(shù)為3,當(dāng)時(shí)K0為尖峰分布,當(dāng)時(shí)K0時(shí)為扁平分布。o 例:根據(jù)上例中的數(shù)據(jù),計(jì)算農(nóng)村居民家庭純收入分布的峰度系數(shù)。o 解:根據(jù)表2-15的計(jì)算結(jié)果,代入(2.16)式得:414472521.25-3-30.4112.089kiiifiKf sxxo 由于K =0

56、.40,說(shuō)明我國(guó)農(nóng)村居民家庭純收入的分布為 尖峰分布。o2.5.1 統(tǒng)計(jì)表o2.5.2 統(tǒng)計(jì)圖 2.5 統(tǒng)計(jì)表與統(tǒng)計(jì)圖2.5.1 統(tǒng)計(jì)表o 一、統(tǒng)計(jì)表的特點(diǎn)n 它是用語(yǔ)顯示統(tǒng)計(jì)數(shù)據(jù)的基本工具。它是用語(yǔ)顯示統(tǒng)計(jì)數(shù)據(jù)的基本工具。n 使用統(tǒng)計(jì)表可以使數(shù)據(jù)一目了然,清晰易懂,使用統(tǒng)計(jì)表可以使數(shù)據(jù)一目了然,清晰易懂,便于理解和分析。便于理解和分析。o 二、統(tǒng)計(jì)表的形式及構(gòu)成n 1. 形式多樣看下表形式多樣看下表19992000年城鎮(zhèn)居民家庭抽樣調(diào)查資料年城鎮(zhèn)居民家庭抽樣調(diào)查資料項(xiàng)目項(xiàng)目單單位位1999年年 2000年年 調(diào)查戶數(shù)調(diào)查戶數(shù) 平均每戶家庭人口平均每戶家庭人口 平均每戶就業(yè)人口平均每戶就業(yè)人口

57、 平均每戶就業(yè)面平均每戶就業(yè)面 平均一名就業(yè)者負(fù)擔(dān)人數(shù)平均一名就業(yè)者負(fù)擔(dān)人數(shù) 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消費(fèi)性支出平均每人消費(fèi)性支出戶戶人人人人%元元元元元元元元 400443.141.7756.431.775888.775854.024615.91 4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00資料來(lái)源:中國(guó)統(tǒng)計(jì)年鑒2001,中國(guó)統(tǒng)計(jì)出版社,2001,第305頁(yè)。注:本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查材料。 n 2.表的構(gòu)成:包括表頭、行標(biāo)題、列標(biāo)題、表的構(gòu)成:包括表頭、行標(biāo)題、列標(biāo)題、和數(shù)

58、字資料。必要時(shí)加上附加。和數(shù)字資料。必要時(shí)加上附加。n 表頭在表的上方,說(shuō)明表的主要內(nèi)容;行、表頭在表的上方,說(shuō)明表的主要內(nèi)容;行、列標(biāo)題在表的第一列和第一行,表示研究問(wèn)列標(biāo)題在表的第一列和第一行,表示研究問(wèn)題的類別名稱和指標(biāo)名稱。若是時(shí)間序列數(shù)題的類別名稱和指標(biāo)名稱。若是時(shí)間序列數(shù)據(jù),行、列標(biāo)題可以是時(shí)間,數(shù)據(jù)多時(shí),時(shí)據(jù),行、列標(biāo)題可以是時(shí)間,數(shù)據(jù)多時(shí),時(shí)間放在橫行標(biāo)題的位置。表的其余部分是具間放在橫行標(biāo)題的位置。表的其余部分是具體的數(shù)字資料;附加放在表的下方,包括資體的數(shù)字資料;附加放在表的下方,包括資料來(lái)源、指標(biāo)的注釋等。料來(lái)源、指標(biāo)的注釋等。 o 資料來(lái)源:中國(guó)統(tǒng)計(jì)年鑒1998,中國(guó)統(tǒng)

59、計(jì)出版社,1998年,第325頁(yè) 年份年份 城鎮(zhèn)居民城鎮(zhèn)居民 農(nóng)村居民農(nóng)村居民 1991 1992 1993 1994 1995 1996 1997 1700.6 2026.6 2577.4 3496.2 4283.0 4838.9 5160.3 708.6 784.0 921.6 1221.0 1577.7 1926.1 2091.1表 1991-1997年城鄉(xiāng)居民家庭人均收入o 3. 統(tǒng)計(jì)表編制的原則:科學(xué)、實(shí)用、簡(jiǎn)練、美觀。具體注意以下幾點(diǎn):n (1)合理安排統(tǒng)計(jì)表的結(jié)構(gòu))合理安排統(tǒng)計(jì)表的結(jié)構(gòu)n (2)總標(biāo)題內(nèi)容應(yīng)滿足)總標(biāo)題內(nèi)容應(yīng)滿足3W(where,when,what) 要求要求n

60、(3)數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo))數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明n (4)表中上下兩條橫線一般用粗線,其他線用細(xì))表中上下兩條橫線一般用粗線,其他線用細(xì)線線n (5)通常情況下,統(tǒng)計(jì)表的左右兩邊不封口)通常情況下,統(tǒng)計(jì)表的左右兩邊不封口n (6)表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以)表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一n (7)對(duì)于沒(méi)有數(shù)字的表格單元,一般用)對(duì)于沒(méi)有數(shù)字的表格單元,一般用“”表示表示n (8)必要時(shí)可在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論