數(shù)據(jù)的特征值_第1頁
數(shù)據(jù)的特征值_第2頁
數(shù)據(jù)的特征值_第3頁
數(shù)據(jù)的特征值_第4頁
數(shù)據(jù)的特征值_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)的特征值第1頁,共108頁,2023年,2月20日,星期五2023/4/101本章重點(diǎn)與難點(diǎn)重點(diǎn):

了解和掌握算術(shù)平均數(shù)、眾數(shù)、中位數(shù)、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)分?jǐn)?shù)的含義及其計(jì)算方法;正確使用離散系數(shù)比較不同均值的代表性。難點(diǎn):

是偏度和峰度的含義及其計(jì)算方法。第2頁,共108頁,2023年,2月20日,星期五2023/4/102學(xué)習(xí)目標(biāo)正確理解平均指標(biāo)與變異指標(biāo)的概念的、意義與作用,明確其種類和區(qū)別;掌握平均指標(biāo)和變異指標(biāo)的計(jì)算方法,以及應(yīng)用的原則和條件;掌握偏度和峰度的含義及其計(jì)算方法;了解各種分位數(shù)的概念與意義。第3頁,共108頁,2023年,2月20日,星期五2023/4/103數(shù)據(jù)分布的特征:一、集中趨勢(shì):反映數(shù)據(jù)向其中心靠攏或聚集程度;二、離中趨勢(shì);數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)(又稱離散程度);三、偏態(tài)和峰態(tài);偏態(tài)是對(duì)數(shù)據(jù)分布對(duì)稱性的度量;峰度是指數(shù)據(jù)分布的平峰或尖峰程度(形狀)。第4頁,共108頁,2023年,2月20日,星期五2023/4/104數(shù)據(jù)分布的特征集中趨勢(shì):反映數(shù)據(jù)向其中心靠攏或聚集程度

(位置)偏態(tài)和峰態(tài);偏態(tài):反映數(shù)據(jù)偏斜程度;峰度:數(shù)據(jù)分布的平峰或尖峰程度(形狀)離中趨勢(shì);數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)

(分散程度)第5頁,共108頁,2023年,2月20日,星期五數(shù)據(jù)分布特征的測(cè)度數(shù)據(jù)特征的測(cè)度平均數(shù)眾數(shù)中位數(shù)離散系數(shù)標(biāo)準(zhǔn)分?jǐn)?shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)分布的形狀集中趨勢(shì)離散程度第6頁,共108頁,2023年,2月20日,星期五第一節(jié)集中趨勢(shì)——數(shù)值平均數(shù)

p75

一、算術(shù)平均數(shù)二、調(diào)和平均數(shù)三、幾何平均數(shù)數(shù)值型數(shù)據(jù)的平均數(shù)第7頁,共108頁,2023年,2月20日,星期五2023/4/107集中趨勢(shì)

(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值注意:低層次數(shù)據(jù)的測(cè)度方法也適用于高層次的數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度方法往往不適用于低層次的數(shù)據(jù)。第8頁,共108頁,2023年,2月20日,星期五2023/4/108一、算術(shù)平均數(shù)

均值(算術(shù)平均數(shù))定義:將一組數(shù)據(jù)相加后除以數(shù)據(jù)的個(gè)數(shù)所得到的一個(gè)數(shù)值,稱為算術(shù)平均數(shù)(average)或均值(mean)。

算數(shù)平均數(shù),又有簡(jiǎn)單算數(shù)平均數(shù)和加權(quán)平均數(shù)之分第9頁,共108頁,2023年,2月20日,星期五2023/4/109一、算術(shù)平均數(shù)

設(shè)一組數(shù)據(jù)為:x1,x2,…,xn(未分組數(shù)據(jù))各組的組中值為:x1,x2,…,xk

(組距分組數(shù)據(jù))

相應(yīng)的頻數(shù)為:f1,f2,…,fk簡(jiǎn)單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)第10頁,共108頁,2023年,2月20日,星期五【例3.1】根據(jù)表3.1中的數(shù)據(jù),計(jì)算職工通信費(fèi)用支出額平均水平。p72解:第11頁,共108頁,2023年,2月20日,星期五

身高組中值人數(shù)比重(cm)xi(cm)fi(人)(%)150-155152.533.61155-160157.51113.25160-165162.53440.96165-170167.52428.92170以上172.51113.25

總計(jì)--83100.00

例3.2分組資料均值的計(jì)算:某年級(jí)83名女生身高資料組距數(shù)據(jù)次數(shù)f頻率f/∑f變量值x加權(quán)算術(shù)平均數(shù)第12頁,共108頁,2023年,2月20日,星期五【例3.3】依據(jù)整理所得表3-5中的數(shù)據(jù),計(jì)算職工通信費(fèi)用支出額平均水平。p74解:或第13頁,共108頁,2023年,2月20日,星期五

計(jì)算算數(shù)平均數(shù),

注意:用各組的組中值代表其實(shí)際數(shù)據(jù)計(jì)算算術(shù)平均數(shù)時(shí),通常假定各組數(shù)據(jù)在組內(nèi)是均勻分布的,相應(yīng)的組中值近似等于各組的平均數(shù)。權(quán)數(shù):衡量變量值相對(duì)重要性的數(shù)值。各個(gè)變量值的權(quán)數(shù)要起作用必須具備兩個(gè)條件:一是各個(gè)變量值之間有差異;二是各個(gè)變量值的權(quán)數(shù)有差異。簡(jiǎn)單算術(shù)平均數(shù)是加權(quán)算術(shù)平均數(shù)在權(quán)數(shù)相等時(shí)的特例。第14頁,共108頁,2023年,2月20日,星期五2023/4/1014算術(shù)平均數(shù)的性質(zhì)p75-76

1.各變量值與其算術(shù)平均數(shù)的離差之和等于零,即。第15頁,共108頁,2023年,2月20日,星期五2023/4/1015算術(shù)平均數(shù)的性質(zhì)第16頁,共108頁,2023年,2月20日,星期五集中趨勢(shì)的最常用測(cè)度值;一組數(shù)據(jù)的均衡點(diǎn)所在;易受極端值的影響;各變量值與其均值的離差之和等于零;5、6.由組距分組資料計(jì)算的均值有近似值性質(zhì);7、用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)算術(shù)平均數(shù)(均值)特征:第17頁,共108頁,2023年,2月20日,星期五二、調(diào)和平均數(shù)調(diào)和平均數(shù)也稱“倒數(shù)平均數(shù)”,它是對(duì)變量的倒數(shù)求平均,然后再取倒數(shù)而得到的平均數(shù),以表示。根據(jù)掌握的資料不同,調(diào)和平均數(shù)也有簡(jiǎn)單調(diào)和平均數(shù)和加權(quán)平均數(shù)兩種形式。其計(jì)算公式為:

第18頁,共108頁,2023年,2月20日,星期五2023/4/1018例題分析【例3.4]假設(shè)甲、乙、丙三種蘋果的價(jià)格分別為每斤2.4元、1.8元及1.5元(1)若三種蘋果各買1元,試問所購蘋果的平均價(jià)格又為多少?(2)如果甲、乙、丙三種蘋果分別購買5元、8元和10元,試問其平均價(jià)格為多少?解:計(jì)算平均價(jià)格的是用所付金額除以所購數(shù)量。(1)(2)第19頁,共108頁,2023年,2月20日,星期五2023/4/1019計(jì)算調(diào)和平均數(shù),注意:1.從數(shù)學(xué)定義角度看算術(shù)平均數(shù)與調(diào)和平均數(shù)是不一樣的,但在社會(huì)經(jīng)濟(jì)應(yīng)用領(lǐng)域,調(diào)和平均數(shù)實(shí)際上只是算術(shù)平均數(shù)的另一種表現(xiàn)形式,二者本質(zhì)上是一致的,惟一的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。2.計(jì)算比率的平均數(shù)時(shí),如果已知比率及其基本計(jì)算式的分母資料,則采用加權(quán)算術(shù)平均法;如果已知比率及其基本計(jì)算式的分子資料,則采用加權(quán)調(diào)和平均法。第20頁,共108頁,2023年,2月20日,星期五2023/4/1020三、幾何平均數(shù)(geometricmean)p78幾何平均數(shù)也稱幾何均值,它是n個(gè)變量值乘積的n次方根。幾何平均法是計(jì)算平均比率或平均發(fā)展速度最適用的一種方法。如果分布數(shù)列中各變量值呈幾何級(jí)數(shù)變化或頻率分布極不對(duì)稱,也常采用幾何平均法來計(jì)算平均數(shù)。根據(jù)統(tǒng)計(jì)資料的不同,幾何平均數(shù)也有簡(jiǎn)單幾何平均數(shù)和加權(quán)幾何平均數(shù)之分。

第21頁,共108頁,2023年,2月20日,星期五2023/4/1021幾何平均數(shù)的計(jì)算公式用途:適用于對(duì)比率數(shù)據(jù)的平均。主要用于計(jì)算平均發(fā)展速度、平均增長率、平均比率對(duì)于未分組的資料,幾何平均數(shù)的計(jì)算公式為第22頁,共108頁,2023年,2月20日,星期五2023/4/1022補(bǔ)充:發(fā)展速度、增長速度概念及關(guān)系環(huán)比發(fā)展速度y1/y0y2/y1y3/y2yn/yn-1定基發(fā)展速度y1/y0y2/y0y3/y0yn/y0注意:環(huán)比發(fā)展速度的連乘積=相應(yīng)的定基發(fā)展速度增長速度=發(fā)展速度-1

環(huán)比增長速度=環(huán)比發(fā)展速度-1

定基增長速度=定基發(fā)展速度-1第23頁,共108頁,2023年,2月20日,星期五平均增長率(averagerateofincrease)①序列中各逐期環(huán)比值(也稱環(huán)比發(fā)展速度)的幾何平均數(shù)減1后的結(jié)果②描述現(xiàn)象在整個(gè)觀察期內(nèi)平均增長變化的程度③通常用幾何平均法求得。計(jì)算公式為第24頁,共108頁,2023年,2月20日,星期五例題分析【例3.8】已知某市2001~2005年國內(nèi)生產(chǎn)總值的發(fā)展速度(以上年為100)依次分別為112%、108%、114%、116%和113%。試計(jì)算這5年國內(nèi)生產(chǎn)總值的平均發(fā)展速度。如果已知的是各年的增長速度,要計(jì)算若干年的平均增長速度,則需要先將增長率加上100%得到發(fā)展速度,再根據(jù)上述方法計(jì)算平均發(fā)展速度,最后用平均發(fā)展速度減100%則得到平均增長速度。第25頁,共108頁,2023年,2月20日,星期五2023/4/1025例題分析【例3.9】甲投資銀行某項(xiàng)投資的年利率是按復(fù)利計(jì)算的,若將過去20年的年利率資料如表3.9所示.要求:試計(jì)算20年的平均年利率。解:第26頁,共108頁,2023年,2月20日,星期五2023/4/1026應(yīng)用幾何平均數(shù)時(shí)注意幾何平均數(shù)在實(shí)際應(yīng)用中受到很多限制;如果被平均的變量值中有一個(gè)為零,則不能計(jì)算幾何平均數(shù);如果變量值為負(fù)數(shù),開偶次根會(huì)形成虛根,失去意義;幾何平均數(shù)在實(shí)際應(yīng)用中的范圍比算術(shù)平均數(shù)要窄。第27頁,共108頁,2023年,2月20日,星期五2023/4/1027幾何平均數(shù)的特點(diǎn)

1.幾何平均數(shù)受極端值的影響較算術(shù)平均數(shù)小。2.如果變量值有負(fù)值,計(jì)算出的幾何平均數(shù)就會(huì)成為負(fù)數(shù)或虛數(shù)。3.它僅適用于具有等比或近似等比關(guān)系的數(shù)據(jù)。4.幾何平均數(shù)的對(duì)數(shù)是各變量值對(duì)數(shù)的算術(shù)平均數(shù)。第28頁,共108頁,2023年,2月20日,星期五2023/4/1028第二節(jié)集中趨勢(shì)—位置平均數(shù)p80一、眾數(shù)Mo二、中位數(shù)Me三、四分位數(shù)QU、QL第29頁,共108頁,2023年,2月20日,星期五2023/4/1029集中趨勢(shì)—位置平均數(shù)位置平均數(shù),就是根據(jù)總體中處于特殊位置上的個(gè)別單位或部分單位的標(biāo)志值來確定的代表值;對(duì)于整個(gè)總體來說,具有非常直觀的代表性,常用來反映分布的集中趨勢(shì);常用的位置平均數(shù)有眾數(shù)和中位數(shù)。第30頁,共108頁,2023年,2月20日,星期五2023/4/1030一、眾數(shù)p80(一)眾數(shù)的含義眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用表示。眾數(shù)直觀地說明分布的集中趨勢(shì),并用它作為反映變量值一般水平的代表值。在某些場(chǎng)合只有眾數(shù)才適合作為總體的代表值。第31頁,共108頁,2023年,2月20日,星期五2023/4/1031(二)眾數(shù)的計(jì)算方法1.觀察法求眾數(shù)如果數(shù)據(jù)已按單個(gè)變量值整理成頻率分布表或者是分類數(shù)據(jù)表,則次數(shù)出現(xiàn)最多或頻率最大的那個(gè)變量值即為眾數(shù)?!纠?.11】某制鞋廠要了解消費(fèi)者最需要哪種型號(hào)的男皮鞋,調(diào)查了某百貨商場(chǎng)2005年10月男皮鞋的銷售情況,得到資料如表3.10所示。第32頁,共108頁,2023年,2月20日,星期五2023/4/1032眾數(shù)的計(jì)算--例題分析要求:試根據(jù)上表資料計(jì)算男皮鞋銷售量的眾數(shù)。解:銷售量最多的是規(guī)格為25.5厘米的鞋號(hào),銷售量320雙,占32%,故眾數(shù)為25.5公分。第33頁,共108頁,2023年,2月20日,星期五眾數(shù)的計(jì)算--例題分析p81【例3.10】某高校電影院在安排2010年影片放映計(jì)劃時(shí),分別按性別隨機(jī)抽取200名男女學(xué)生,登記其對(duì)影片類型的取向。統(tǒng)計(jì)結(jié)果如表3.10所示。要求:試分析學(xué)生對(duì)影片取向的集中趨勢(shì)。解:

7種類型的影片中,男生最喜歡看動(dòng)作片,人數(shù)為48人,占24%,眾數(shù)即為動(dòng)作片這種影片類型;女生最喜歡看言情片,人數(shù)為46人,占23%,眾數(shù)即為言情片這種影片類型;男女生對(duì)影片類型的取向,綜合而言是動(dòng)作片,眾數(shù)為動(dòng)作片這種影片類型。

第34頁,共108頁,2023年,2月20日,星期五數(shù)值型數(shù)據(jù)眾數(shù)的確定方法單變量值分組資料某年級(jí)83名女生身高資料

身高人數(shù)(CM)(人)152115421552156415711582159216012161716281634

身高人數(shù)(CM)(人)1643165816651673168716911705171217231741總計(jì)83

STAT眾數(shù)第35頁,共108頁,2023年,2月20日,星期五2023/4/1035

注意:

眾數(shù)不僅適用于測(cè)度順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的集中趨勢(shì),而且適用于測(cè)度不能計(jì)算平均數(shù)的分類數(shù)據(jù)的集中趨勢(shì)。第36頁,共108頁,2023年,2月20日,星期五2023/4/1036眾數(shù)的計(jì)算方法2.插值法求眾數(shù)對(duì)于組距分組形成的分布數(shù)列,當(dāng)頻率分布屬于完全對(duì)稱分布,而眾數(shù)所在組的變量值分布比較均勻時(shí),可用觀察法求眾數(shù),即以眾數(shù)組的組中值作為所求的眾數(shù)。完全對(duì)稱分布不存在,眾數(shù)組前后各組的次數(shù)不一定相等,眾數(shù)就不等于組中值,因此需要采用插值法求眾數(shù)。第37頁,共108頁,2023年,2月20日,星期五2023/4/1037組距分組數(shù)據(jù),眾數(shù)的計(jì)算步驟1、先找到眾數(shù)所在的組;2、按該組次數(shù)與前后相鄰兩組分布次數(shù)之差所占的比重來推算眾數(shù)值。如果眾數(shù)組前一組的次數(shù)大于后一組的次數(shù),則眾數(shù)值小于其所在組的組中值;反之,眾數(shù)值則大于其所在組的組中值;若眾數(shù)組前后相鄰組的次數(shù)相等,則眾數(shù)值等于其所在組的組中值。3、計(jì)算眾數(shù)有上限和下限公式之分。

第38頁,共108頁,2023年,2月20日,星期五2023/4/1038眾數(shù)的計(jì)算方法第39頁,共108頁,2023年,2月20日,星期五2023/4/1039

身高人數(shù)比重(CM)(人)(%)150-15533.61155-1601113.25160-1653440.96165-1702428.92170以上1113.25

總計(jì)83100某年級(jí)83名女生身高資料③數(shù)值型數(shù)據(jù)眾數(shù)的確定方法組距分組資料STAT眾數(shù)組第40頁,共108頁,2023年,2月20日,星期五

眾數(shù)的特點(diǎn)1.眾數(shù)不受分布數(shù)列的極大或極小值的影響,眾數(shù)對(duì)分布數(shù)列有好的代表性。2.?dāng)?shù)據(jù)的分布沒有明顯的集中趨勢(shì)或最高峰點(diǎn),眾數(shù)可能不存在;3.有兩個(gè)或多個(gè)高峰點(diǎn),可以有兩個(gè)或多個(gè)眾數(shù)。眾數(shù)不具有唯一性。3.眾數(shù)缺乏敏感性。第41頁,共108頁,2023年,2月20日,星期五2023/4/1041二、中位數(shù)Mep83(一)中位數(shù)的含義中位數(shù)是將數(shù)據(jù)按大小順序排列起來,形成一個(gè)數(shù)列,居于數(shù)列中間位置的那個(gè)變量值稱為中位數(shù)。中位數(shù)用Me表示。特點(diǎn):在一個(gè)等差數(shù)列或一個(gè)正態(tài)分布數(shù)列中,中位數(shù)就等于算術(shù)平均數(shù)。中位數(shù)不受極端變量值的影響。第42頁,共108頁,2023年,2月20日,星期五2023/4/1042中位數(shù)的計(jì)算中位數(shù)概念:排序后處于中間位置上的值1.根據(jù)未分組數(shù)據(jù)計(jì)算中位數(shù)。Me50%50%第43頁,共108頁,2023年,2月20日,星期五2023/4/1043例題分析【例3.12】某班第一、二兩個(gè)小組統(tǒng)計(jì)學(xué)期末考試成績排序結(jié)果如表3.13所示。要求:分別計(jì)算兩小組成績的中位數(shù)解:兩個(gè)學(xué)習(xí)小組的考試成績已經(jīng)分別按由低到高排列。第一小組有7個(gè)學(xué)生,第4位為中位數(shù)的位置,Me=75.第二小組有8個(gè)學(xué)生,中位數(shù)的位置處于第四和第五個(gè)學(xué)生之間。第44頁,共108頁,2023年,2月20日,星期五2023/4/1044中位數(shù)的計(jì)算2.由分組資料確定中位數(shù)

如果由組距數(shù)列確定中位數(shù),應(yīng)先按的公式求出中位數(shù)所在組的位置,然后再按下限公式或上限公式確定中位數(shù)。第45頁,共108頁,2023年,2月20日,星期五2023/4/1045組距分組數(shù)據(jù)中位數(shù)的確定方法

身高fi人數(shù)累計(jì)(CM)(人)人數(shù)150-15533155-1601114160-1653448165-1702472170以上1183

總計(jì)83某年級(jí)83名女生身高資料STAT中位數(shù)組第46頁,共108頁,2023年,2月20日,星期五

中位數(shù)的特點(diǎn)1.不受分布數(shù)列的極大或極小值影響。2.有些離散型變量的單項(xiàng)式數(shù)列,當(dāng)次數(shù)分布偏態(tài)時(shí),中位數(shù)的代表性會(huì)受到影響。3.中位數(shù)缺乏敏感性。

第47頁,共108頁,2023年,2月20日,星期五2023/4/1047三、四分位數(shù)p85中位數(shù)是根據(jù)其在數(shù)列中所處的位置來確定的一個(gè)平均數(shù),作為各變量值的一個(gè)代表值,以反映分布數(shù)列的集中趨勢(shì)。為了進(jìn)一步了解一組數(shù)據(jù)分布的內(nèi)部結(jié)構(gòu),觀察變量值在各個(gè)區(qū)間的一般水平,還可以計(jì)算四分位數(shù)、十分位數(shù)和百分位數(shù)。

第48頁,共108頁,2023年,2月20日,星期五2023/4/1048

四分位數(shù)四分位數(shù)是通過3個(gè)點(diǎn)將全部數(shù)據(jù)等分為四個(gè)部分,其中每部分包含25%的數(shù)據(jù)。

QLMeQU25%25%25%25%處于25%和75%位置上的值即四分位數(shù)特點(diǎn):不受極端值的影響要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)(各種分位數(shù)可由spss計(jì)算)第49頁,共108頁,2023年,2月20日,星期五2023/4/1049四分位數(shù)的計(jì)算1.根據(jù)未分組數(shù)據(jù)計(jì)算四分位數(shù)時(shí),先對(duì)數(shù)據(jù)進(jìn)行排序,然后再確定四分位數(shù)所在的位置當(dāng)四分位數(shù)的位置不是整數(shù)時(shí),可根據(jù)四分位數(shù)的位置,按比例分?jǐn)偹姆治粩?shù)所在位置兩側(cè)變量值之差的數(shù)值。第50頁,共108頁,2023年,2月20日,星期五2023/4/1050四分位數(shù)的計(jì)算—例題分析【例3.14】將例3.13中兩個(gè)學(xué)習(xí)小組的統(tǒng)計(jì)學(xué)考試成績合并如下:

要求:(1)計(jì)算前15個(gè)學(xué)生統(tǒng)計(jì)學(xué)考試成績的四分位數(shù);(2)如果增加一個(gè)學(xué)生的成績95分,試計(jì)算16個(gè)學(xué)生統(tǒng)計(jì)學(xué)考試成績的四分位數(shù)。第51頁,共108頁,2023年,2月20日,星期五2023/4/1051四分位數(shù)的計(jì)算—例題分析第52頁,共108頁,2023年,2月20日,星期五2023/4/1052四分位數(shù)的計(jì)算2.根據(jù)組距數(shù)列計(jì)算四分位數(shù)

第53頁,共108頁,2023年,2月20日,星期五2023/4/1053四分位數(shù)的計(jì)算第54頁,共108頁,2023年,2月20日,星期五2023/4/1054(二)十分位數(shù)

十分位數(shù)是指將按大小順序排列的一組數(shù)據(jù)劃分為10等分的9個(gè)變量值,用以反映一組數(shù)據(jù)在各個(gè)區(qū)間的一般水平。第55頁,共108頁,2023年,2月20日,星期五2023/4/1055十分位數(shù)的計(jì)算十分位數(shù)的具體計(jì)算方法與計(jì)算四分位數(shù)類似,即先計(jì)算出各個(gè)十分位數(shù)所處的位置。如果為整數(shù),與計(jì)算的位置相對(duì)應(yīng)的變量值就是所求的十分位數(shù);如果不是整數(shù),每個(gè)位置的值出現(xiàn)小數(shù),此時(shí),所求的十分位數(shù)等于整數(shù)位的變量值加上小數(shù)乘以前后兩項(xiàng)變量值之差的數(shù)值。第56頁,共108頁,2023年,2月20日,星期五2023/4/1056(三)百分位數(shù)第57頁,共108頁,2023年,2月20日,星期五2023/4/1057百分位數(shù)的計(jì)算求出各個(gè)百分位數(shù)所處的位置后,具體計(jì)算每個(gè)百分位數(shù)的方法與四分位數(shù)類似,故不再詳細(xì)介紹。如果數(shù)據(jù)比較多,計(jì)算百分位數(shù)可以更詳細(xì)地反映數(shù)據(jù)分布中每個(gè)小區(qū)間的一般水平,用以補(bǔ)充說明平均數(shù)所反映的集中趨勢(shì)。第58頁,共108頁,2023年,2月20日,星期五2023/4/1058算術(shù)平均數(shù)簡(jiǎn)評(píng)算術(shù)平均數(shù):算術(shù)平均數(shù)符合上述六個(gè)條件,應(yīng)用范圍最廣。易受極端值的影響。當(dāng)分布數(shù)列中存在開口組時(shí),會(huì)影響平均數(shù)的準(zhǔn)確性。算術(shù)平均數(shù)適用于數(shù)值型數(shù)據(jù)。第59頁,共108頁,2023年,2月20日,星期五2023/4/1059(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系在數(shù)據(jù)分布呈完全對(duì)稱的正態(tài)分布時(shí),算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者相等。在次數(shù)分布非對(duì)稱時(shí),算術(shù)平均數(shù)、眾數(shù)和中位數(shù)三者不相等,但具有相對(duì)固定的關(guān)系。在尾巴拖在右邊的正偏態(tài)(或右偏態(tài))分布中,眾數(shù)最小,中位數(shù)適中,算術(shù)平均數(shù)最大。第60頁,共108頁,2023年,2月20日,星期五2023/4/1060

眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系

左偏分布均值

中位數(shù)

眾數(shù)對(duì)稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值對(duì)何種數(shù)據(jù)而言的?第61頁,共108頁,2023年,2月20日,星期五2023/4/1061眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系p84偏斜適度時(shí),三者的關(guān)系:第62頁,共108頁,2023年,2月20日,星期五2023/4/1062第三節(jié)離中趨勢(shì)的測(cè)度p85數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說明了集中趨勢(shì)測(cè)度值的代表性注意:數(shù)據(jù)的離散程度越大,集中趨勢(shì)的測(cè)度對(duì)該組數(shù)據(jù)的代表性越差;數(shù)據(jù)的離散程度越小,集中趨勢(shì)的測(cè)度值對(duì)該組數(shù)據(jù)的代表性越好。不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值第63頁,共108頁,2023年,2月20日,星期五2023/4/1063下面是兩個(gè)總體關(guān)于年齡分布的數(shù)據(jù),相對(duì)而言,那個(gè)總體的年齡分布分散,差異大些?46、47、48、49、50、51、52、53、548、15、20、30、5070、80、85、92總體1總體2第64頁,共108頁,2023年,2月20日,星期五2023/4/1064離中趨勢(shì);數(shù)據(jù)遠(yuǎn)離中心的趨勢(shì)

(分散程度)總體2總體1第65頁,共108頁,2023年,2月20日,星期五數(shù)值型數(shù)據(jù):①全距(或稱極差)(range)②平均差(meandeviation)③方差和標(biāo)準(zhǔn)差(Varianceandstandarddeviation)④相對(duì)離散程度:離散系數(shù)(CoefficientofVariation)分類數(shù)據(jù):異眾比率(variationratio)順序數(shù)據(jù):四分位差(quartilerange)離散程度的測(cè)度第66頁,共108頁,2023年,2月20日,星期五一、全距(Range)全距也稱為極差,是指一組數(shù)據(jù)的最大值與最小值之差,用R表示。即:R=最大變量值-最小變量值沒有開口組的組距分布數(shù)列計(jì)算全距,可以用最大組的上限值減去最小組的下限值,得到全距的近似值。全距可以反映一組數(shù)據(jù)的差異范圍。第67頁,共108頁,2023年,2月20日,星期五2023/4/1067全距的計(jì)算【例3.16】表3-14是兩組人口關(guān)于年齡分布的數(shù)據(jù),要求計(jì)算全距。解:第一組全距第二組全距

注意:如果組距分布數(shù)列中有開口組,則不能計(jì)算全距。全距計(jì)算簡(jiǎn)單,易理解,易受極端值的影響;不能反映中間數(shù)據(jù)分散狀況,不能準(zhǔn)確描述數(shù)據(jù)的分散程度。第68頁,共108頁,2023年,2月20日,星期五2023/4/1068

二、異眾比率

(variationratio)① 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率②計(jì)算公式為③用于對(duì)分類數(shù)據(jù)離散程度的測(cè)度

④用于衡量眾數(shù)的代表性第69頁,共108頁,2023年,2月20日,星期五異眾比率異眾比率主要用于衡量眾數(shù)對(duì)一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性越好。異眾比率適合測(cè)度分類數(shù)據(jù)、測(cè)度順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的離散程度。第70頁,共108頁,2023年,2月20日,星期五2023/4/1070異眾比率的應(yīng)用

p89【例3.17】根據(jù)例3.10(第34張)的數(shù)據(jù)計(jì)算學(xué)生對(duì)影片取向的異眾比率。【解】根據(jù)公式得說明:比較上面的三個(gè)異眾比率,全部樣本學(xué)生的異眾比率最大,說明其眾數(shù)的代表性最差;男生的異眾比率略小于女生的異眾比率,說明男生對(duì)影片取向的眾數(shù)的代表性略好于女生對(duì)影片取向的眾數(shù)的代表性。第71頁,共108頁,2023年,2月20日,星期五2023/4/1071三、四分位差p89

注意:①上四分位數(shù)與下四分位數(shù)之差

Qd=QU

–QL反映了中間50%數(shù)據(jù)的離散程度②對(duì)順序數(shù)據(jù)離散程度的測(cè)度③不受極端值的影響④用于衡量中位數(shù)的代表性第72頁,共108頁,2023年,2月20日,星期五2023/4/1072四分位差的應(yīng)用注意:四分位差不易受極端值的影響,可以測(cè)量含有開口組的數(shù)據(jù)分布的差異程度,但不能反映所有變量值的差異程度?!纠恳罁?jù)前面例3.16中兩組人口年齡的四分位差:

結(jié)論:第一、第二組的中位數(shù)均為50歲,但其代表性不同。第一小組的中位數(shù)代表性相對(duì)高些,因?yàn)橄鄬?duì)而言,四分位差小,數(shù)據(jù)分布集中。第二組年齡中位數(shù)代表性低些,因?yàn)樵摻M年齡差異大,年齡分布相對(duì)分散。第73頁,共108頁,2023年,2月20日,星期五2023/4/1073四、平均差(AverageDeviation)平均差就是各個(gè)變量值與其算術(shù)平均數(shù)離差的絕對(duì)值的平均數(shù),以AD表示。它綜合反映了各變量值的變動(dòng)程度,是各個(gè)離差的代表值。平均差越大,則表示變量值的離散程度越大,說明平均數(shù)的代表性越小;平均差越小,則表示變量值的離散程度越小,說明平均數(shù)的代表性越大。第74頁,共108頁,2023年,2月20日,星期五2023/4/1074平均差的計(jì)算①各變量值與其均值離差絕對(duì)值的平均數(shù)計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)諸變量值與均值的偏差②能全面反映一組數(shù)據(jù)的離散程度③數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少第75頁,共108頁,2023年,2月20日,星期五2023/4/1075平均差的計(jì)算【例3.18】

要求:根據(jù)例3.16所給的資料分別計(jì)算第一、第二組人口年齡的平均差,并比較其平均年齡的代表性。解:結(jié)論:

比較兩個(gè)平均差可知,兩組人口年齡平均數(shù)均為50歲,第一組平均差小,人口年齡分布的差異小,平均年齡的代表性好;第二組平均差大,年齡分布的離散水平大,平均年齡的代表性差些。第76頁,共108頁,2023年,2月20日,星期五2023/4/1076

平均差的計(jì)算【例3.19】根據(jù)表的資料計(jì)算120名職工通信費(fèi)用支出額的平均差。解:第77頁,共108頁,2023年,2月20日,星期五2023/4/1077平均差的含義:

每名職工通信費(fèi)用支出額有高有低,與平均數(shù)165元相比,差異有大有小。平均差表明:以平均通信費(fèi)用165元為中心,每名職工通信費(fèi)用支出額與平均水平的平均差距為42.42元。注意:平均差易理解、計(jì)算簡(jiǎn)便;可以說明數(shù)據(jù)分布的離中趨勢(shì);不適宜進(jìn)行代數(shù)運(yùn)算,其應(yīng)用范圍易受限制。第78頁,共108頁,2023年,2月20日,星期五五、方差與標(biāo)準(zhǔn)差p92方差是各個(gè)數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的平均數(shù),通常以表示總體方差,s2表示樣本方差。標(biāo)準(zhǔn)差又稱均方差,是方差的平方根,一般用表示總體標(biāo)準(zhǔn)差,以S表示樣本標(biāo)準(zhǔn)差。方差和標(biāo)準(zhǔn)差的計(jì)算也分為簡(jiǎn)單平均法和加權(quán)平均法。對(duì)于總體數(shù)據(jù)和樣本數(shù)據(jù),公式略有不同。

第79頁,共108頁,2023年,2月20日,星期五2023/4/1079方差與標(biāo)準(zhǔn)差注意:方差和標(biāo)準(zhǔn)差是根據(jù)全部數(shù)據(jù)計(jì)算的,它反映了每個(gè)數(shù)據(jù)與其均值相比平均相差的數(shù)值;它能準(zhǔn)確地反映出數(shù)據(jù)的離散程度;方差和標(biāo)準(zhǔn)差是應(yīng)用最廣泛的離散程度測(cè)度值。

第80頁,共108頁,2023年,2月20日,星期五2023/4/1080總體方差與標(biāo)準(zhǔn)差的計(jì)算公式總體標(biāo)準(zhǔn)差第81頁,共108頁,2023年,2月20日,星期五2023/4/1081樣本方差和標(biāo)準(zhǔn)差(記?。﹑92

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!第82頁,共108頁,2023年,2月20日,星期五方差與標(biāo)準(zhǔn)差的應(yīng)用【例3.20】要求:根據(jù)表中的數(shù)據(jù)計(jì)算120名職工通信費(fèi)用支出額的方差和標(biāo)準(zhǔn)差。第83頁,共108頁,2023年,2月20日,星期五2023/4/1083方差與標(biāo)準(zhǔn)差的計(jì)算【解】已知平均數(shù)為165元,因是隨機(jī)抽取的樣本資料,故依據(jù)樣本方差及標(biāo)準(zhǔn)差的公式計(jì)算。計(jì)算結(jié)果表明,樣本中每名職工月通信費(fèi)用支出額與月平均通信費(fèi)用支出額165元的水平相比,差異有大有小,但平均偏差是51.4元。第84頁,共108頁,2023年,2月20日,星期五2023/4/1084方差與標(biāo)準(zhǔn)差的應(yīng)用【例3.22】考察一臺(tái)機(jī)器的生產(chǎn)狀況,利用抽樣程序來檢驗(yàn)其生產(chǎn)出來的產(chǎn)品質(zhì)量是否穩(wěn)定。據(jù)行業(yè)標(biāo)準(zhǔn),如果樣本零件尺寸的標(biāo)準(zhǔn)差大于0.3公分,則表明該零件的質(zhì)量不穩(wěn)定,需要對(duì)該機(jī)器進(jìn)行停工檢修。數(shù)據(jù)如下:要求:根據(jù)資料,判斷該機(jī)器是否需要停工修。第85頁,共108頁,2023年,2月20日,星期五2023/4/1085方差與標(biāo)準(zhǔn)差的應(yīng)用解:計(jì)算的樣本標(biāo)準(zhǔn)差0.2126公分,小于0.3分,表明該臺(tái)機(jī)器不需要停工檢修。注意:標(biāo)準(zhǔn)差是一個(gè)重要的偏差,描述了各觀察值與均值的平均距離。第86頁,共108頁,2023年,2月20日,星期五六、離散系數(shù)p94離散系數(shù)(標(biāo)準(zhǔn)差系數(shù)或變異系數(shù))通常是用標(biāo)準(zhǔn)差來計(jì)算的,它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo),其計(jì)算公式為:式中:Vσ和Vs分別表示總體離散系數(shù)和樣本離散系數(shù)。第87頁,共108頁,2023年,2月20日,星期五2023/4/1087離散系數(shù)的應(yīng)用平均水平或計(jì)量單位不同的不同組別的變量值,不能直接用離散程度的測(cè)度值比較。平均水平或計(jì)量單位不同的不同組別進(jìn)行比較,需計(jì)算離散系數(shù)。離散系數(shù)大的說明該組數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說明該組數(shù)據(jù)的離散程度小。第88頁,共108頁,2023年,2月20日,星期五2023/4/1088離散系數(shù)的應(yīng)用【例3.22】從某管理局所屬的兩家企業(yè)中各隨機(jī)抽取10名職工,調(diào)查獲得他們的年收入數(shù)據(jù)如表所示:要求:根據(jù)上表數(shù)據(jù)計(jì)算男女生的平均身高以及標(biāo)準(zhǔn)差系數(shù),說明兩組數(shù)據(jù)的離散程度及平均數(shù)的代表性。第89頁,共108頁,2023年,2月20日,星期五2023/4/1089結(jié)論:

計(jì)算結(jié)果表明,v乙<v甲,說明乙企業(yè)職工年收入的離散程度小于甲企業(yè)的。說明乙企業(yè)職工年收入平均水平比的甲企業(yè)的更具有代表性。

注意:解決問題的程序與步驟。(四步)v甲=4667014354.25=30.76%v乙=5338015277.4=28.62%第90頁,共108頁,2023年,2月20日,星期五2023/4/1090七、標(biāo)準(zhǔn)分?jǐn)?shù)問題:某同學(xué)在期末考試中,英語成績91分,數(shù)學(xué)成績85分,問該同學(xué)這兩門課,哪門成績更好些?該班英語平均成績105分,標(biāo)準(zhǔn)差7分;該班數(shù)學(xué)平均成績80分標(biāo)準(zhǔn)差5分。該班80人,成績服從對(duì)稱分布標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式為:第91頁,共108頁,2023年,2月20日,星期五2023/4/1091標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算

(標(biāo)準(zhǔn)分?jǐn)?shù)又稱標(biāo)準(zhǔn)化值)

①對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量②可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(離群數(shù))③用于對(duì)變量值的標(biāo)準(zhǔn)化處理前例中,

Z<0,觀察值低于平均數(shù),位于平均值左側(cè);Z>0,觀察值高于平均水平,位于平均值右側(cè)。第92頁,共108頁,2023年,2月20日,星期五標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì))P97注意:

z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。

第93頁,共108頁,2023年,2月20日,星期五2023/4/1093標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì))一組數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù)的均值等于02. 一組數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù)的方差等于1第94頁,共108頁,2023年,2月20日,星期五2023/4/1094經(jīng)驗(yàn)法則

p97標(biāo)準(zhǔn)分?jǐn)?shù)可用以判斷一組數(shù)據(jù)是否有離群點(diǎn)。經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí),約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi);約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi);約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。第95頁,共108頁,2023年,2月20日,星期五2023/4/1095切比雪夫不等式

(Chebyshev’sinequality)p97如果一組數(shù)據(jù)不是對(duì)稱分布,經(jīng)驗(yàn)法則就不再適用。切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有1-1/k2的數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”第96頁,共108頁,2023年,2月20日,星期五2023/4/1096切比雪夫不等式

(Chebyshev’sinequality)p97至少有75%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍內(nèi)至少89%的數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論