




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第四章數(shù)據(jù)分布特征的描述集中趨勢(平均指標) (位置)離中趨勢(標志變異指標) (分散程度)偏態(tài)和峰度(形狀)一、數(shù)據(jù)分布的特征數(shù)據(jù)分布的特征和測度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾 數(shù)中位數(shù)均 值離散系數(shù)方差和標準差峰 度四分位差偏 態(tài) 第三節(jié) 平均指標 變量集中趨勢的測度一、集中趨勢指標的概念及作用1.概念也稱平均指標或平均數(shù)用來反映標志值的典型水平或標志值分布的中心位置或集中趨勢2.作用反映變量分布的集中趨勢和一般水平。可用來比較同一總體在不同空間的發(fā)展水平可用來分析現(xiàn)象之間的依存關系是統(tǒng)計推斷中一個重要的統(tǒng)計量。二、數(shù)值平均數(shù)(一)算術平均數(shù)最常用的平均數(shù)?;拘问绞菙?shù)據(jù)和除
2、以數(shù)據(jù)項數(shù)。1、簡單算術平均數(shù)應用條件:資料未分組,各組出現(xiàn)的次數(shù)都是12、加權算術平均數(shù)應用條件:適用于已分組的統(tǒng)計資料3、舉例例1:某車間20名工人加工某種零件資料: 按日產(chǎn)量分組(件)x工人數(shù)(人)f 14 2 15 4 16 8 17 5 18 1 合計 20日產(chǎn)總量 xf 28 60 128 85 18 319例3:由比重權數(shù)計算的應用條件:已知比重權數(shù)(次數(shù)是比重)按日產(chǎn)量分組(公斤)人數(shù)比重(%)組中值x 2030 5 25 3040 35 35 4050 45 45 5060 15 55抽獎返利,顧客真的受益? 某大商場策劃了一次“還利給顧客”活動,凡一次購物100元以上(含1
3、00元)均可當場抽獎。獎金分配見下表商場提醒 : 平均每份獎金249元,莫失良機呦!等級一等獎二等獎三等獎四等獎幸運獎獎金數(shù)15000800010008020中獎人次41070360560(三)是非標志的平均數(shù)是非標志:如果按照某種標志把總體只能分為具有某種特征的單位和不具有該種特征的單位兩部分,這個標志就是是非標志。(四)算術平均數(shù)的數(shù)學性質1、各個變量值與其算術平均數(shù)的離差之和等于零 對簡單算術平均數(shù): 對加權算術平均數(shù):算術平均數(shù)的數(shù)學性質2、各個變量值與其平均數(shù)離差平方和為最小值 或 算術平均數(shù)的數(shù)學性質4、給每個變量值乘以或除以一個任意數(shù)A,則算術平均數(shù)也相應擴大或縮小A倍。(五)算
4、術平均數(shù)的適用范圍1、當變量值是絕對數(shù)時,變量值之間是和的關系,在這種情況下,反映現(xiàn)象的平均水平用算術平均數(shù)。2、當變量值是相對數(shù)或平均數(shù)時,變量值之間既不存在和的關系,也不存在相乘的關系,而且已知的是分母資料,在這種情況下,反映現(xiàn)象的平均水平用算術平均數(shù)。(二)調和平均數(shù)又稱倒數(shù)平均數(shù),為各個標志值倒數(shù)的算術平均數(shù)的倒數(shù)。記m為各組標志總量,即m=xf,則公式為:例1速度 x 行走里程 m 20 1 15 2 10 3 合計 6 所需時間1、簡單調和平均數(shù)應用條件:資料未分組,各變量值次數(shù)都是1。計算公式:舉例:一個人步行兩里,走第一里時速度為每小時候10里,走第二里時為每小時20里,則平均
5、速度為: 2、加權調和平均數(shù)計算公式:應用條件:資料經(jīng)過分組,各組次數(shù)不同。3、調和平均數(shù)的適用范圍當變量值是絕對數(shù)時,變量值之間是和的關系,而且已知的是分子資料,在這種情況下,反映現(xiàn)象的平均水平用調和平均數(shù)。練習題:甲、乙兩地同種商品的資料如下表,比較哪個地區(qū)的平均價格高并說明原因等級價格甲地銷額(元)乙地銷量1級1.3130010002級1.2240010003級1.111002000合計_48004000簡單幾何平均數(shù) 例:某企業(yè)生產(chǎn)某種產(chǎn)品需經(jīng)過三個連續(xù)作業(yè)車間才能完成。總的產(chǎn)品合格率三個車間平均合格率車間投入量產(chǎn)出合格品量合格率% x 一 1000 800 80 二 800 720
6、90 三 720 504 70例: 將一筆錢存入銀行,存期10年,以復利計息,10年的利率分別是第1年至第2年為5%、第3年至5年為8%、第6年至第8年為10%、第9年至第10年12%,計算平均年利率。 設本金為年份累計存款額本利率%1105%2105%3108%10112%本利率x年數(shù)f 105% 2 108% 3 110% 3 112% 2 合 計 10平均年利率=8.77%3、幾何平均數(shù)的適用范圍當變量值是相對數(shù),而且變量值之間存在連乘關系,反映現(xiàn)象的一般水平時采用幾何平均數(shù)。三、眾數(shù)與中位數(shù)(一)眾數(shù)(概念要點)出現(xiàn)次數(shù)最多的變量值不受極端值的影響,可能沒有眾數(shù)或有幾個眾數(shù)主要用于定類
7、數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)無眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8一個眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5多個眾數(shù)原始數(shù)據(jù): 25 28 28 36 42 42定類數(shù)據(jù)的眾數(shù)(算例)表3-1 某城市居民關注廣告類型的頻數(shù)分布 廣告類型人數(shù)(人)比例頻率(%) 商品廣告 服務廣告 金融廣告 房地產(chǎn)廣告 招生招聘類 其他廣告112 51 91610 20.5600.2550.0450.0800.0500.01056.025.5 4.5 8.0 5.0 1.0合計 2001100.0【例】根據(jù)表3-1中的數(shù)據(jù),計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量
8、值。我們看到,在所調查的200人當中,關注商品廣告的人數(shù)最多,為112人,占總被調查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即 Mo商品廣告定序數(shù)據(jù)的眾數(shù)(算例)【例】根據(jù)表3-2中的數(shù)據(jù),計算眾數(shù)解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即 Mo不滿意表3-2 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)百分比 (%) 非常不滿意 不滿意 一般 滿意 非常滿意24108934530836311510合計300100.0數(shù)值型數(shù)據(jù)的眾數(shù)(算例)1、由未分組資料確定眾數(shù)例:7名工人日產(chǎn)量(件)
9、為4、5、6、6、6、7、8。 2、由單項數(shù)列確定眾數(shù)按日產(chǎn)量分組(件)工人數(shù)(人)2015213022202310則眾數(shù)是63、數(shù)值型分組數(shù)據(jù)的眾數(shù)(1) 眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(4) 該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布(2) 相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo(3)相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo3、數(shù)值型分組數(shù)據(jù)的眾數(shù)年人均純收入(千元)農(nóng)戶數(shù)(戶)5以下2405648067110078700893209以上160合計3000(1)確定眾數(shù)組(在67千元組)(2)計算眾數(shù)以下限公式為例:數(shù)值型分組數(shù)據(jù)的眾數(shù)(算例)表3-5 某車間50
10、名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例】根據(jù)表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)(二)中位數(shù) 和分位數(shù)1、概念1)按某一標志值大小順序排列后處于中間位置上的值Me50%50%2)不受極端值的影響3) 各變量值與中位數(shù)的離差絕對值之和最小,即2、中位數(shù)位置的確定未分組數(shù)據(jù):分組數(shù)據(jù):1)未分組數(shù)據(jù)的中位數(shù)(計算公式)3、中位數(shù)的計算數(shù)值型未分組數(shù)據(jù)的中位數(shù) (5個數(shù)據(jù)的算例)原始數(shù)據(jù): 24 22 21 26 20中位數(shù) 22 排
11、 序: 20 21 22 24 26 位 置: 1 2 3 4 5數(shù)值型未分組數(shù)據(jù)的中位數(shù) (6個數(shù)據(jù)的算例)原始數(shù)據(jù): 10 5 9 12 6 8位置N+126+123.5中位數(shù)8 + 928.5排 序: 5 6 8 9 10 12位 置: 1 2 3 4 5 62)由單項數(shù)列確定中位數(shù)例:中位數(shù)為第40 名的日產(chǎn)量 按日產(chǎn)量分組(件)x工人數(shù)(人)f2010221524302625合計80累計次數(shù)向上累計向下累計1080257055558025(1)根據(jù)位置公式確定中位數(shù)所在的組(2)采用下列近似公式計算(3) 該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布3、由組距式分組計算中位數(shù)數(shù)值型分組數(shù)
12、據(jù)的中位數(shù)(算例)表3-5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140358141064381630404650合計50【例】根據(jù)表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的中位數(shù)4、四分位數(shù)(概念要點)1)排序后處于25%和75%位置上的值2) 不受極端值的影響3)主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):4下四分位數(shù)(QL)位置 =N+1上四分位數(shù)(QU)位置 =3(N+1)4下四分位
13、數(shù)(QL)位置 =N4上四分位數(shù)(QL)位置 =3N4定序數(shù)據(jù)的四分位數(shù)(算例)【例】根據(jù)表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為: QL位置(300)/475 上四分位數(shù)(QL)的位置為: QU位置(3300)/4225從累計頻數(shù)看, QL在“不滿意”這一組別中; QU在“一般”這一組別中。因此 QL 不滿意 QU 一般表3-2 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計300數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (7個(N+1能被
14、4整除)數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 32 28 25 26QL= 23N+17+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QU = 30 排 序: 21 23 25 26 28 30 32 位 置: 1 2 3 4 5 6 7數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (6個(N+1不能被4整除)數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 28 25 26排 序: 21 23 25 26 28 30位 置: 1 2 3 4 5 6QL= 21+0.75(23-21) = 22. 5QL位置 =N+14=6+14= 1.75QU位置 =3(N+1)43(6+1)4=
15、5.25QU = 28+0.25(30-28) = 28.5數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算公式)上四分位數(shù): 下四分位數(shù): 數(shù)值型分組數(shù)據(jù)的四分位數(shù)(計算示例)QL位置50/412.5QU位置350/437.5表3-5 某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105110110115115120120125125130130135135140 3 5 81410 6 4381630404650合計50【例】根據(jù)表3-5中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的四分位數(shù)四、切尾平均數(shù)和溫氏化平均數(shù)(一)切尾平均數(shù)將變量值兩端的個別極值切去,對中間的變量值進行平均。缺點:極端
16、值未起任何作用(二)溫氏化平均數(shù)1、首先計算四分位數(shù): 例:某比賽中,11名評委對某歌手的打分分別為8.0 9.0 9.1 9.2 9.2 9.3 9.4 9.4 9.4 9.5 9.8 在 處 , 在 處 , 在 處2、溫氏化平均數(shù)返回眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的關系對稱分布 均值= 中位數(shù)= 眾數(shù)左偏分布 眾數(shù)中位數(shù)均值 右偏分布眾數(shù)中位數(shù)均值離散趨勢的測度第四節(jié) 標志變異指標一、離散程度指標及其作用也叫標志變異指標。反映各變量值遠離其中心值的程度,因此也稱為離中趨勢。作用:(1)說明數(shù)據(jù)離散程度(2)衡量集中趨勢測度值的代表程度(3)是統(tǒng)計推斷中重要尺度指標離散程度的測度
17、指標一. 極差、四分位差二平均差 三.方差及標準差四.相對離散程度:離散系數(shù)二、極差、四分位差和平均差(一)極差1. 一組數(shù)據(jù)的最大值與最小值之差2. 易受極端值影響7891078910未分組數(shù)據(jù) R = max(Xi) - min(Xi).=組距分組數(shù)據(jù) R 最高組上限 - 最低組下限3. 計算公式為(二)四分位差【例】根據(jù)表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差解:設非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2, QU = 一般 = 3四分位差: QD = QU - QL = 3 2 = 1表3-2 甲城市家庭對住
18、房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計300QD = QU - QL(三)平均差(概念要點及計算公式)1. 各變量值與其均值離差絕對值的平均數(shù)2. 能全面反映一組數(shù)據(jù)的離散程度3. 數(shù)學性質較差,實際中應用較少1、簡單平均差2、加權平均差舉例:前例按日產(chǎn)量分組kg)工人數(shù)f組中值x20301025304070354050904550603055合 計2001704902703901320平均差的優(yōu)缺點優(yōu)點:平均差是根據(jù)全部數(shù)值計算的,受極端值影響較全距小。缺點:由于采取絕對值的方法消
19、除離差的正負號,數(shù)學性質不是最好,因而應用較少。三、方差和標準差(概念要點)1.最常用的測度值2.反映了數(shù)據(jù)的分布3.反映了各變量值與均值的平均差異4.根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4 6 8 10 12X = 8.3標準差的計算1、簡單標準差公式:應用條件:資料未分組,各組次數(shù)都是1。2、加權標準差公式:應用條件:資料經(jīng)過分組,各組次數(shù)不同。例:日產(chǎn)量(kg)工人數(shù)f組中值x20301025304070354050904550603055合 計200288034308105070121903、是非標志的平均數(shù)是非標志:如果按照某種標志把總體
20、只能分為具有某種特征的單位和不具有該種特征的單位兩部分,這個標志就是是非標志。是非標志的平均數(shù)平均數(shù)的計算:把具有某種特征的用“1”表示,不具有該種特征的用“0”表示。 是非標志 x單位數(shù) f比重 1 0 合 計 N 1是非標志的標準差如前:是非標志的平均數(shù)為P。標志值x單位數(shù)f10合計N標準差在實際應用中最為廣泛。而方差有良好的數(shù)學性質4、方差的數(shù)學性質(1)常數(shù)的方差為0(2)所有變量都加上(或減去)常數(shù)a,方差不變(3)所有變量都乘以常數(shù)a,則方差將乘以a2(4)分組條件下,總體方差 等于組間方差 與平均組內(nèi)方差的和5、標準化值用于比較來自不同均值和標準差的個體的數(shù)據(jù)公式:實質上是把不同
21、均值和標準差的總體轉換為均值為0,標準差為1的總體,將各個體數(shù)據(jù)轉換為其在總體中的相對位置。6、對稱鐘形分布中的3 法則絕對數(shù)形式變異指標的適用條件當兩個或多個數(shù)列的平均水平相等時,對比數(shù)列標志值間的變異程度及平均水平的代表性,用絕對數(shù)形式的變異指標。指標值越大,說明變異程度越大,平均水平的代表性越不好;反之亦然。相對離散程度:四、離散系數(shù)離散系數(shù)(概念要點和計算公式)1.標準差與其相應的均值之比2.消除了數(shù)據(jù)水平高低和計量單位的影響3.測度了數(shù)據(jù)的相對離散程度4.用于對不同組別數(shù)據(jù)離散程度的比較5. 計算公式為離散系數(shù)(實例和計算過程)表4-7 某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品
22、銷售額(萬元)X1銷售利潤(萬元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表4.7。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)(計算結果)X1=536.25(萬元)S1=309.19(萬元)V1=536.25309.19=0.577S2=23.09(萬元)V2=32.521523.09=0.710X2=32.5215(萬元)結論: 計算結果表明,V1 0為右偏分布 5. 偏態(tài)系數(shù) 0為左偏分布偏 態(tài)(實例)【例】已知1997年我國農(nóng)村居民家庭按純收入
23、分組的有關數(shù)據(jù)如表4.9。試計算偏態(tài)系數(shù)表4-10 1997年農(nóng)村居民家庭純收入數(shù)據(jù)按純收入分組(元)戶數(shù)比重(%)500以下500100010001500150020002000250025003000300035003500400040004500450050005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94戶數(shù)比重(%)252015105農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖偏態(tài)與峰度(從直方圖上觀察)按純收入分組(元)100050015002000250030003500400045005000結論:1. 為右偏分布 2. 峰度適中偏態(tài)系數(shù)(計算過程)表4-10 農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計算表按純收入分組(百元)組中值Xi戶數(shù)比重(%)Fi(Xi- X ) 3 Fi(Xi- X ) 4Fi5以下5101015152020252530303535404045455050以上2.57.512.517.522.527.532.537.542
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級數(shù)學故事解讀
- 小王子書中純真之愛讀后感
- 自然資源開發(fā)與保護合作協(xié)議
- 智能家電銷售與保修協(xié)議
- 初中生歷史故事解讀
- 運輸合同運輸補充協(xié)議
- 辦公區(qū)域布局調研報告
- 環(huán)保咨詢服務協(xié)議
- 電子設備銷售及安裝維護合同
- 物流行業(yè)運輸損壞物品賠償協(xié)議
- 北京電子科技職業(yè)學院招聘考試題庫2024
- 貸款的培訓課件
- 無人系統(tǒng)自主控制
- 化工原理陳敏恒課件
- 景區(qū)保安投標方案(技術方案)
- 中建辦公、生活區(qū)臨時設施施工方案
- 中國金融書法家協(xié)會入會申請表
- 地下室頂板支撐回頂方案
- 痛經(jīng)教學講解課件
- 基于康耐視相機的視覺識別實驗指導書
- 水務集團有限公司人事管理制度
評論
0/150
提交評論