偏態(tài)與峰度的測度課件_第1頁
偏態(tài)與峰度的測度課件_第2頁
偏態(tài)與峰度的測度課件_第3頁
偏態(tài)與峰度的測度課件_第4頁
偏態(tài)與峰度的測度課件_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章數(shù)據(jù)分布特征的測度第四章數(shù)據(jù)分布特征的測度1學習目標掌握眾數(shù)、中位數(shù)的概念、特點及其計算方法;了解四分位數(shù)概念;掌握算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)的概念、特點及計算方法;了解異眾比率、四分位差、全距、方差及標準差的概念、及計算方法;了解偏度和峰度的意義;能夠區(qū)分各種指標的應(yīng)用場合,根據(jù)不同數(shù)據(jù)類型運用不同測度指標。學習目標掌握眾數(shù)、中位數(shù)的概念、特點及其計算方法;2主要內(nèi)容:集中趨勢的測度1離散程度的測度

2偏態(tài)與峰度的測度

3主要內(nèi)容:集中趨勢的測度1離散程度的測度2偏態(tài)與峰3眾數(shù)四分位數(shù)中位數(shù)平均數(shù)偏度峰度方差和標準差全距異眾比率四分位差離散系數(shù)數(shù)據(jù)的特征和測度集中趨勢離散程度分布的形狀眾數(shù)四分位數(shù)中位數(shù)平均數(shù)偏度峰度方差和標準差全距異眾比率四分4第一節(jié)集中趨勢的測度

眾數(shù)中位數(shù)四分位數(shù)平均數(shù)第一節(jié)集中趨勢的測度眾數(shù)中位數(shù)四分位數(shù)平均數(shù)5●概念在次數(shù)分布數(shù)列中,就是出現(xiàn)次數(shù)最多的變量值,用表示。

主要用于測度定類數(shù)據(jù)的集中趨勢,當然也適用于作為定序數(shù)據(jù)以及定距和定比數(shù)據(jù)集中趨勢的測度值。一、眾數(shù)一、眾數(shù)6●計算眾數(shù)的方法(1)單項分配數(shù)列的眾數(shù)計算方法

出現(xiàn)次數(shù)最多的那一組變量值就是眾數(shù)

某商場某日連續(xù)銷售15雙皮鞋的尺碼組成情況如下:38,37,38,40,40,41,40,42,44,40,41,39,40,40,43出現(xiàn)次數(shù)最多的數(shù)是40,40就是某商場某日銷售皮鞋尺碼的眾數(shù)?!裼嬎惚姅?shù)的方法7(2)組距分配數(shù)列的眾數(shù)計算方法第一步:根據(jù)分配數(shù)列次數(shù)最多的組確定為眾數(shù)所在組。第二步:根據(jù)該組與前后相鄰兩組分配次數(shù)的關(guān)系推算眾數(shù)。

(2)組距分配數(shù)列的眾數(shù)計算方法8眾數(shù)與相鄰兩組的關(guān)系示意圖

,眾數(shù)組的組中值即為眾數(shù)的值。

,眾數(shù)會向其前一組靠,眾數(shù)小于其組中值

,眾數(shù)會向其后一組靠,眾數(shù)大于其組中值

Moff-1f+1MoMo眾數(shù)與相鄰兩組的關(guān)系示意圖Mof9其中,L,U分別表示眾數(shù)所在組的下限值和上限值,

i表示眾數(shù)組的組距。

根據(jù)上述關(guān)系,可以利用相似三角形推導(dǎo)出組距分配數(shù)列的眾數(shù)的計算公式如下:下限公式:

上限公式:

其中,L,U分別表示眾數(shù)所在組的下限值和上限值,

i表示眾數(shù)10某鄉(xiāng)3000農(nóng)戶按人均年純收入分組的資料如下表,試計算其眾數(shù)。人均年純收入(元)農(nóng)戶數(shù)2000-30003000-40004000-50005000-60006000-70007000-80008000-90009000-10000240480105060027021012030合計3000某鄉(xiāng)3000農(nóng)戶按人均年純收入分組的資料如下表,試計算其眾數(shù)11從表中可以看出,眾數(shù)所在的組為4000-5000,出現(xiàn)的最多次數(shù)為1050。按下限公式計算眾數(shù):

按上限公式計算眾數(shù):從表中可以看出,眾數(shù)所在的組為4000-5000,出現(xiàn)的最多12●眾數(shù)的優(yōu)缺點優(yōu)點①容易理解,②不受極值影響缺點①靈敏度和計算功能差②穩(wěn)定性差③具有不唯一性●眾數(shù)的優(yōu)缺點優(yōu)點13二、中位數(shù)和四分位數(shù)(一)中位數(shù)●概念是指對樣本數(shù)據(jù)由小到大排序后,處于中間位置上的變量值,用表示。是一個位置代表值,它主要用于測度定序數(shù)據(jù)的集中趨勢,當然也適用于定距數(shù)據(jù)和定比數(shù)據(jù)的集中趨勢,但不適用于定類數(shù)據(jù)。二、中位數(shù)和四分位數(shù)(一)中位數(shù)14●計算中位數(shù)的方法

(1)變量值未分組情況下:總體單位數(shù)n是奇數(shù),中間位置的變量值是中位數(shù)。總體單位數(shù)n是偶數(shù),中間位置的兩個變量值的算術(shù)平均數(shù)為中位數(shù)?!裼嬎阒形粩?shù)的方法15(2)變量值分組情況下:

下限公式:

上限公式:

(2)變量值分組情況下:下限公式:上限公式:16某鄉(xiāng)人均年純收入中位數(shù)計算表如下:年人均純收入(元)農(nóng)戶數(shù)向上累計向下累計2000-30003000-40004000-50005000-60006000-70007000-80008000-90009000-10000240480105060027021012030240720177023702640285029703000300027602280123063036015030合計3000────某鄉(xiāng)人均年純收入中位數(shù)計算表如下:年人均純收入(元)農(nóng)戶數(shù)向17按下限公式計算中位數(shù):按上限公式計算中位數(shù):按下限公式計算中位數(shù):18●優(yōu)缺點

優(yōu)點①容易理解,②不受極值影響③適宜于開口組資料和些不能用數(shù)字測定的事物缺點①靈敏度和計算功能差②間斷數(shù)Me●優(yōu)缺點優(yōu)點19(二)四分位數(shù)

中位數(shù)是從中間點將全部數(shù)據(jù)分為兩部分。與中位數(shù)類似的還有四分位數(shù)、十分位數(shù)、百分位數(shù)、四分位數(shù)就是對數(shù)據(jù)集合四等分的三個數(shù)值,其中的第二個四分位數(shù)即為中位數(shù)。例如某數(shù)據(jù)集合有101項數(shù)據(jù),則第26項、51項、76項三個數(shù)據(jù)可以把數(shù)據(jù)集合分為數(shù)目相等的四個等分,這三個數(shù)就分別是第一、第二、第三四分位數(shù),其中第一個四分位數(shù)稱為上四分位數(shù),第三個四分位數(shù)稱為下四分位數(shù),第二個四分位數(shù)就為中位數(shù)。(二)四分位數(shù)20三、數(shù)值平均數(shù):算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)●算術(shù)平均數(shù)主要適用于定居數(shù)據(jù)和定比數(shù)據(jù),但不適用于定類數(shù)據(jù)和定序數(shù)據(jù)三、數(shù)值平均數(shù):算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)●算術(shù)平211、簡單算術(shù)平均數(shù)2、加權(quán)算術(shù)平均數(shù)原始數(shù)據(jù)被分為k組,各組的組中值為各組變量值出現(xiàn)的頻數(shù)分別為

1、簡單算術(shù)平均數(shù)原始數(shù)據(jù)被分為k組,各組變量值出現(xiàn)的頻數(shù)分22某中學100名高中一年級男生身高(單位:厘米)的頻數(shù)分布如下表。求該校高一男生的平均身高。

身高155~160160~165165~170170~175175~180180~185人數(shù)282836188某中學100名高中一年級男生身高(單位:厘米)的頻數(shù)分布如下23當我們掌握的不是各組變量值出現(xiàn)的頻數(shù),而是頻率時,也可直接根據(jù)上式計算均值

請注意!當我們掌握的不是各組變量值出現(xiàn)的頻數(shù),而是頻率時,也可直接根24●調(diào)和平均數(shù)——該式與加權(quán)算術(shù)平均數(shù)公式的計算結(jié)果完全一致。實際上,上式只是加權(quán)算術(shù)平均數(shù)的另一種表現(xiàn)形式。

由此可見,調(diào)和平均數(shù)實際上是算術(shù)平均數(shù)的一種變形,二者在本質(zhì)上是一致的,唯一的區(qū)別就是計算時使用了不同的數(shù)據(jù)。

只適用于定比數(shù)據(jù),不適用于定距數(shù)據(jù)●調(diào)和平均數(shù)——該式與加權(quán)算術(shù)平均數(shù)公式的計算結(jié)果完全一致25●幾何平均數(shù)是n項變量值連乘積的n次方根。適合于計算現(xiàn)象的平均比率或平均速度,反應(yīng)現(xiàn)象增長率的平均水平。

因此,凡是現(xiàn)象的變量值的連乘積等于總比率或總速度,都可以使用幾何平均數(shù)來計算平均比率或平均速度。●幾何平均數(shù)因此,凡是現(xiàn)象的變量值的連乘積等于總比率或總速261、簡單幾何平均數(shù)適用于計算未分組數(shù)列的平均比率或平均速度。1994-1998年我國工業(yè)品的產(chǎn)量分別是上年的107.6%、102.5%、100.6%、102.7%、102.2%,計算這5年的平均發(fā)展速度。1、簡單幾何平均數(shù)1994-1998年我國工業(yè)品的產(chǎn)量分別是272、加權(quán)幾何平均數(shù)對于分組數(shù)列,應(yīng)該采用加權(quán)幾何平均數(shù)計算其平均比率或平均速度。某投資銀行25年的年利率分別是:1年3%,4年5%,8年8%,10年10%,2年15%,求平均年利率。2、加權(quán)幾何平均數(shù)某投資銀行25年的年利率分別是:1年3%,28第二節(jié)離散程度的測度離散系數(shù)異眾比率四分位差全距方差和標準差第二節(jié)離散程度的測度離散系數(shù)異眾比率四分位差全距方差和標29一、異眾比率是非眾數(shù)的次數(shù)與全部個案數(shù)目的比率,用表示。異眾比率是對眾數(shù)的補充,異眾比率越小,說明眾數(shù)的代表性越好;反之,異眾比率越大,則說明眾數(shù)的代表性越差。為眾數(shù)的頻數(shù),為變量值的總頻數(shù)。一、異眾比率是非眾數(shù)的次數(shù)與全部個案數(shù)目的比率,用30二、四分位差●概念也稱為內(nèi)距或四分間距,它是上四分位數(shù)與下四分位數(shù)之差,是對定序及定序以上測量尺度的變量離散程度的測量指標。

●計算方法

①求出上四分位數(shù)和下四分位數(shù)的位置

②計算這兩個四分位數(shù)之差二、四分位差●概念31◆

對原始資料調(diào)查11位同學的年齡如下:17歲、18歲、18歲、19歲、19歲、20歲、20歲、21歲、21歲、22歲、22歲。首先,求出Q1和Q3的位置:Q1的位置=

Q3的位置=

其次,從數(shù)序中找出Q1=18,Q3=21則四分位差Q=Q3—Q1=21—18=3◆對原始資料調(diào)查11位同學的年齡如下:17歲、18歲、1832◆對單值分組資料

如下表所示的學生學業(yè)成績:

等級學生人數(shù)向下累計↓向上累計↑甲乙丙丁5580202575305555258025總數(shù)80--Q1位置=

Q3位置=

從累積次數(shù)分布表中,很易看到在這兩個位置上的值分別是丁級和乙級,所以:四分位差Q=乙—丁=兩個等級。

◆對單值分組資料如下表所示的學生學業(yè)成績:等級學生33◆對組距分組資料

Q1和Q3的計算公式為:

其中,L1為Q1屬組之真實下限;L3為Q3屬組之真實下限;f1為Q1屬組之次數(shù);f3為Q3屬組之次數(shù);cf1為低于Q1屬組下限之累積次數(shù);cf3為低于Q3屬組下限之累積次數(shù);w1為Q1屬組之組距;w3為Q3屬組之組距;n為全部個案數(shù)。某企業(yè)100名職工收入的分布如下:

收入(元)職工數(shù)(人)累計頻數(shù)組中值XfXf100—19910101501500200—29910202502500300—399406035014000400—49920804509000500—5992010055011000合計100◆對組距分組資料Q1和Q3的計算公式為:其中,L1為Q134由上表知:Q1位置=

,所以Q1在300—399組內(nèi);

Q3位置=,所以Q3在400—499組內(nèi)。

所以四分位差Q=Q3-Q1=162.5由上表知:Q1位置=,所以Q1在300—399組內(nèi);Q335三、全距全距又稱極差,它是一組數(shù)據(jù)中最大值與最小值之差。

全距是對定序及以上尺度的變量離散程度的測量。極差越小,表明資料越集中,集中趨勢統(tǒng)計量的代表性越高。一般公式為:

某校3個系各選5名同學,參加智力競賽,他們的成績分別如下:中文系:78、79、80、81、82數(shù)學系:65、72、80、88、95英語系:35、78、89、98、100則三個代表隊的全距分別為:中文系:82-78=4(分)數(shù)學系:95-65=30(分)英語系:100-35=65(分)對于組距分組數(shù)據(jù),全距也可以近似表示為:三、全距全距又稱極差,它是一組數(shù)據(jù)中最大值與最小值之差。全36四、方差及標準差方差和標準差是衡量變異程度最常用的指標,方差通常用表示。標準差又稱均方差,方差的平方根即為標準差,通常用表示,分析定距變量的離散情況,最常用的方法是標準差。

對于未分組數(shù)據(jù),公式為:對于組距分組數(shù)據(jù),公式為:四、方差及標準差方差和標準差是衡量變異程度最常用的指標,方差371998年度品牌飛利浦索尼東芝松下LG長虹創(chuàng)維海爾康佳TCL費用24292054168416111607143014301355126911751999年度品牌飛利浦東芝索尼TCLLG松下創(chuàng)維海爾康佳海信費用3415192918181688144013631234108010751023根據(jù)下表中1998年度和1999年度電視機廣告前10名品牌廣告費用統(tǒng)計情況,計算兩個年度廣告費用的標準差。根據(jù)上表可以計算出1998年度和1999年度的平均廣告費用額分別為:1604.4萬元,1606.5萬元。

1998年度的標準差為:=361.7(萬元)同理可以計算1999年度的標準差為674.7萬元。1998年度品牌飛利浦索尼東芝松下LG長虹創(chuàng)維海爾康佳TCL38五、離散系數(shù)離散系數(shù)是標準差與平均數(shù)的比值,用百分比表示。記離散系數(shù)為V,則公式為:離散系數(shù)是一種相對的離散量數(shù)統(tǒng)計量,它使我們能夠?qū)ν豢傮w中的兩種不同的離散量數(shù)統(tǒng)計量進行比較,或者對兩個不同總體中的同一離散量數(shù)統(tǒng)計量進行比較。一項調(diào)查的結(jié)果如下,某市人均月收入為92元,標準差為17元,人均住房面積7.5平方米,標準差為1.8平方米。試比較該市人均收入和人均住房情況哪一個差異程度比較大。由題中數(shù)據(jù)得:人均收入的離散系數(shù)為人均住房面積的離散系數(shù)為可見人均住房面積的差異情況比人均收入的差異情況要大。五、離散系數(shù)離散系數(shù)是標準差與平均數(shù)的比值,用百分比表示。記39第三節(jié)偏態(tài)與峰度的測度一.偏態(tài)及其測度二.峰度及其測度第三節(jié)偏態(tài)與峰度的測度一.偏態(tài)及其測度40偏態(tài)與峰度分布的形狀扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布與標準正態(tài)分布比較!偏態(tài)與峰度分布的形狀扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布41◆

偏態(tài)

1.數(shù)據(jù)分布偏斜程度的測度,用表示。2.偏態(tài)系數(shù)=0為對稱分布3.偏態(tài)系數(shù)>0為右偏分布4.偏態(tài)系數(shù)<0為左偏分布5.計算公式為◆偏態(tài)

1.數(shù)據(jù)分布偏斜程度的測度,用表示。42α3=0α3>0α3<0(對稱分布)正偏態(tài)分布(右)負偏態(tài)分布(左)

α3=0α3>0α3<0(對稱分布)正偏態(tài)分布(右)負偏態(tài)分43偏度值α一般在-3~3之間。3為極度右偏斜-3為極度左偏斜絕大多數(shù)變量分布偏斜程度在-1~1之間偏度值α一般在-3~3之間。44某管理局所屬30個企業(yè)2005年3月份利潤額統(tǒng)計資料如右側(cè)表所示,要求計算該變量數(shù)列的偏斜狀況。

利潤額(萬元)企業(yè)數(shù)f組中值x10—3030—5050—7070—9021013520406080231219604683380-78608-274402808878802672672384160168482284880合計30—8120-153605358560某管理局所屬30個企業(yè)2005年3月份利潤額統(tǒng)計資料如右側(cè)表45根據(jù)上表數(shù)據(jù)計算得計算結(jié)果表明該管理局所屬企業(yè)利潤額的分布狀況呈輕微負偏分布。根據(jù)上表數(shù)據(jù)計算得計算結(jié)果表明該管理局所屬企業(yè)利潤額的分布狀46◆

峰度

1.數(shù)據(jù)分布扁平程度的測度,用表示。2.峰度系數(shù)=3為扁平程度適中3.峰度系數(shù)<3為扁平分布4.峰度系數(shù)>3為尖峰分布5.計算公式為f(X)◆峰度

1.數(shù)據(jù)分布扁平程度的測度,用表示。f(X47根據(jù)偏度例題:某管理局所屬30個企業(yè)2005年3月份利潤額統(tǒng)計資料如右側(cè)表所示,要求計算該變量數(shù)列的峰度。

利潤額(萬元)企業(yè)數(shù)f組中值x10—3030—5050—7070—9021013520406080231219604683380-78608-274402808878802672672384160168482284880合計30—8120-153605358560根據(jù)表中有關(guān)數(shù)據(jù)計算峰度系數(shù)如下:計算結(jié)果表明,上述企業(yè)間利潤額的分布呈平頂峰度,各變量值分布較為均勻。根據(jù)偏度例題:某管理局所屬30個企業(yè)2005年3月份利潤額統(tǒng)48第四章數(shù)據(jù)分布特征的測度第四章數(shù)據(jù)分布特征的測度49學習目標掌握眾數(shù)、中位數(shù)的概念、特點及其計算方法;了解四分位數(shù)概念;掌握算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)的概念、特點及計算方法;了解異眾比率、四分位差、全距、方差及標準差的概念、及計算方法;了解偏度和峰度的意義;能夠區(qū)分各種指標的應(yīng)用場合,根據(jù)不同數(shù)據(jù)類型運用不同測度指標。學習目標掌握眾數(shù)、中位數(shù)的概念、特點及其計算方法;50主要內(nèi)容:集中趨勢的測度1離散程度的測度

2偏態(tài)與峰度的測度

3主要內(nèi)容:集中趨勢的測度1離散程度的測度2偏態(tài)與峰51眾數(shù)四分位數(shù)中位數(shù)平均數(shù)偏度峰度方差和標準差全距異眾比率四分位差離散系數(shù)數(shù)據(jù)的特征和測度集中趨勢離散程度分布的形狀眾數(shù)四分位數(shù)中位數(shù)平均數(shù)偏度峰度方差和標準差全距異眾比率四分52第一節(jié)集中趨勢的測度

眾數(shù)中位數(shù)四分位數(shù)平均數(shù)第一節(jié)集中趨勢的測度眾數(shù)中位數(shù)四分位數(shù)平均數(shù)53●概念在次數(shù)分布數(shù)列中,就是出現(xiàn)次數(shù)最多的變量值,用表示。

主要用于測度定類數(shù)據(jù)的集中趨勢,當然也適用于作為定序數(shù)據(jù)以及定距和定比數(shù)據(jù)集中趨勢的測度值。一、眾數(shù)一、眾數(shù)54●計算眾數(shù)的方法(1)單項分配數(shù)列的眾數(shù)計算方法

出現(xiàn)次數(shù)最多的那一組變量值就是眾數(shù)

某商場某日連續(xù)銷售15雙皮鞋的尺碼組成情況如下:38,37,38,40,40,41,40,42,44,40,41,39,40,40,43出現(xiàn)次數(shù)最多的數(shù)是40,40就是某商場某日銷售皮鞋尺碼的眾數(shù)?!裼嬎惚姅?shù)的方法55(2)組距分配數(shù)列的眾數(shù)計算方法第一步:根據(jù)分配數(shù)列次數(shù)最多的組確定為眾數(shù)所在組。第二步:根據(jù)該組與前后相鄰兩組分配次數(shù)的關(guān)系推算眾數(shù)。

(2)組距分配數(shù)列的眾數(shù)計算方法56眾數(shù)與相鄰兩組的關(guān)系示意圖

,眾數(shù)組的組中值即為眾數(shù)的值。

,眾數(shù)會向其前一組靠,眾數(shù)小于其組中值

,眾數(shù)會向其后一組靠,眾數(shù)大于其組中值

Moff-1f+1MoMo眾數(shù)與相鄰兩組的關(guān)系示意圖Mof57其中,L,U分別表示眾數(shù)所在組的下限值和上限值,

i表示眾數(shù)組的組距。

根據(jù)上述關(guān)系,可以利用相似三角形推導(dǎo)出組距分配數(shù)列的眾數(shù)的計算公式如下:下限公式:

上限公式:

其中,L,U分別表示眾數(shù)所在組的下限值和上限值,

i表示眾數(shù)58某鄉(xiāng)3000農(nóng)戶按人均年純收入分組的資料如下表,試計算其眾數(shù)。人均年純收入(元)農(nóng)戶數(shù)2000-30003000-40004000-50005000-60006000-70007000-80008000-90009000-10000240480105060027021012030合計3000某鄉(xiāng)3000農(nóng)戶按人均年純收入分組的資料如下表,試計算其眾數(shù)59從表中可以看出,眾數(shù)所在的組為4000-5000,出現(xiàn)的最多次數(shù)為1050。按下限公式計算眾數(shù):

按上限公式計算眾數(shù):從表中可以看出,眾數(shù)所在的組為4000-5000,出現(xiàn)的最多60●眾數(shù)的優(yōu)缺點優(yōu)點①容易理解,②不受極值影響缺點①靈敏度和計算功能差②穩(wěn)定性差③具有不唯一性●眾數(shù)的優(yōu)缺點優(yōu)點61二、中位數(shù)和四分位數(shù)(一)中位數(shù)●概念是指對樣本數(shù)據(jù)由小到大排序后,處于中間位置上的變量值,用表示。是一個位置代表值,它主要用于測度定序數(shù)據(jù)的集中趨勢,當然也適用于定距數(shù)據(jù)和定比數(shù)據(jù)的集中趨勢,但不適用于定類數(shù)據(jù)。二、中位數(shù)和四分位數(shù)(一)中位數(shù)62●計算中位數(shù)的方法

(1)變量值未分組情況下:總體單位數(shù)n是奇數(shù),中間位置的變量值是中位數(shù)??傮w單位數(shù)n是偶數(shù),中間位置的兩個變量值的算術(shù)平均數(shù)為中位數(shù)。●計算中位數(shù)的方法63(2)變量值分組情況下:

下限公式:

上限公式:

(2)變量值分組情況下:下限公式:上限公式:64某鄉(xiāng)人均年純收入中位數(shù)計算表如下:年人均純收入(元)農(nóng)戶數(shù)向上累計向下累計2000-30003000-40004000-50005000-60006000-70007000-80008000-90009000-10000240480105060027021012030240720177023702640285029703000300027602280123063036015030合計3000────某鄉(xiāng)人均年純收入中位數(shù)計算表如下:年人均純收入(元)農(nóng)戶數(shù)向65按下限公式計算中位數(shù):按上限公式計算中位數(shù):按下限公式計算中位數(shù):66●優(yōu)缺點

優(yōu)點①容易理解,②不受極值影響③適宜于開口組資料和些不能用數(shù)字測定的事物缺點①靈敏度和計算功能差②間斷數(shù)Me●優(yōu)缺點優(yōu)點67(二)四分位數(shù)

中位數(shù)是從中間點將全部數(shù)據(jù)分為兩部分。與中位數(shù)類似的還有四分位數(shù)、十分位數(shù)、百分位數(shù)、四分位數(shù)就是對數(shù)據(jù)集合四等分的三個數(shù)值,其中的第二個四分位數(shù)即為中位數(shù)。例如某數(shù)據(jù)集合有101項數(shù)據(jù),則第26項、51項、76項三個數(shù)據(jù)可以把數(shù)據(jù)集合分為數(shù)目相等的四個等分,這三個數(shù)就分別是第一、第二、第三四分位數(shù),其中第一個四分位數(shù)稱為上四分位數(shù),第三個四分位數(shù)稱為下四分位數(shù),第二個四分位數(shù)就為中位數(shù)。(二)四分位數(shù)68三、數(shù)值平均數(shù):算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)●算術(shù)平均數(shù)主要適用于定居數(shù)據(jù)和定比數(shù)據(jù),但不適用于定類數(shù)據(jù)和定序數(shù)據(jù)三、數(shù)值平均數(shù):算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)●算術(shù)平691、簡單算術(shù)平均數(shù)2、加權(quán)算術(shù)平均數(shù)原始數(shù)據(jù)被分為k組,各組的組中值為各組變量值出現(xiàn)的頻數(shù)分別為

1、簡單算術(shù)平均數(shù)原始數(shù)據(jù)被分為k組,各組變量值出現(xiàn)的頻數(shù)分70某中學100名高中一年級男生身高(單位:厘米)的頻數(shù)分布如下表。求該校高一男生的平均身高。

身高155~160160~165165~170170~175175~180180~185人數(shù)282836188某中學100名高中一年級男生身高(單位:厘米)的頻數(shù)分布如下71當我們掌握的不是各組變量值出現(xiàn)的頻數(shù),而是頻率時,也可直接根據(jù)上式計算均值

請注意!當我們掌握的不是各組變量值出現(xiàn)的頻數(shù),而是頻率時,也可直接根72●調(diào)和平均數(shù)——該式與加權(quán)算術(shù)平均數(shù)公式的計算結(jié)果完全一致。實際上,上式只是加權(quán)算術(shù)平均數(shù)的另一種表現(xiàn)形式。

由此可見,調(diào)和平均數(shù)實際上是算術(shù)平均數(shù)的一種變形,二者在本質(zhì)上是一致的,唯一的區(qū)別就是計算時使用了不同的數(shù)據(jù)。

只適用于定比數(shù)據(jù),不適用于定距數(shù)據(jù)●調(diào)和平均數(shù)——該式與加權(quán)算術(shù)平均數(shù)公式的計算結(jié)果完全一致73●幾何平均數(shù)是n項變量值連乘積的n次方根。適合于計算現(xiàn)象的平均比率或平均速度,反應(yīng)現(xiàn)象增長率的平均水平。

因此,凡是現(xiàn)象的變量值的連乘積等于總比率或總速度,都可以使用幾何平均數(shù)來計算平均比率或平均速度。●幾何平均數(shù)因此,凡是現(xiàn)象的變量值的連乘積等于總比率或總速741、簡單幾何平均數(shù)適用于計算未分組數(shù)列的平均比率或平均速度。1994-1998年我國工業(yè)品的產(chǎn)量分別是上年的107.6%、102.5%、100.6%、102.7%、102.2%,計算這5年的平均發(fā)展速度。1、簡單幾何平均數(shù)1994-1998年我國工業(yè)品的產(chǎn)量分別是752、加權(quán)幾何平均數(shù)對于分組數(shù)列,應(yīng)該采用加權(quán)幾何平均數(shù)計算其平均比率或平均速度。某投資銀行25年的年利率分別是:1年3%,4年5%,8年8%,10年10%,2年15%,求平均年利率。2、加權(quán)幾何平均數(shù)某投資銀行25年的年利率分別是:1年3%,76第二節(jié)離散程度的測度離散系數(shù)異眾比率四分位差全距方差和標準差第二節(jié)離散程度的測度離散系數(shù)異眾比率四分位差全距方差和標77一、異眾比率是非眾數(shù)的次數(shù)與全部個案數(shù)目的比率,用表示。異眾比率是對眾數(shù)的補充,異眾比率越小,說明眾數(shù)的代表性越好;反之,異眾比率越大,則說明眾數(shù)的代表性越差。為眾數(shù)的頻數(shù),為變量值的總頻數(shù)。一、異眾比率是非眾數(shù)的次數(shù)與全部個案數(shù)目的比率,用78二、四分位差●概念也稱為內(nèi)距或四分間距,它是上四分位數(shù)與下四分位數(shù)之差,是對定序及定序以上測量尺度的變量離散程度的測量指標。

●計算方法

①求出上四分位數(shù)和下四分位數(shù)的位置

②計算這兩個四分位數(shù)之差二、四分位差●概念79◆

對原始資料調(diào)查11位同學的年齡如下:17歲、18歲、18歲、19歲、19歲、20歲、20歲、21歲、21歲、22歲、22歲。首先,求出Q1和Q3的位置:Q1的位置=

Q3的位置=

其次,從數(shù)序中找出Q1=18,Q3=21則四分位差Q=Q3—Q1=21—18=3◆對原始資料調(diào)查11位同學的年齡如下:17歲、18歲、1880◆對單值分組資料

如下表所示的學生學業(yè)成績:

等級學生人數(shù)向下累計↓向上累計↑甲乙丙丁5580202575305555258025總數(shù)80--Q1位置=

Q3位置=

從累積次數(shù)分布表中,很易看到在這兩個位置上的值分別是丁級和乙級,所以:四分位差Q=乙—丁=兩個等級。

◆對單值分組資料如下表所示的學生學業(yè)成績:等級學生81◆對組距分組資料

Q1和Q3的計算公式為:

其中,L1為Q1屬組之真實下限;L3為Q3屬組之真實下限;f1為Q1屬組之次數(shù);f3為Q3屬組之次數(shù);cf1為低于Q1屬組下限之累積次數(shù);cf3為低于Q3屬組下限之累積次數(shù);w1為Q1屬組之組距;w3為Q3屬組之組距;n為全部個案數(shù)。某企業(yè)100名職工收入的分布如下:

收入(元)職工數(shù)(人)累計頻數(shù)組中值XfXf100—19910101501500200—29910202502500300—399406035014000400—49920804509000500—5992010055011000合計100◆對組距分組資料Q1和Q3的計算公式為:其中,L1為Q182由上表知:Q1位置=

,所以Q1在300—399組內(nèi);

Q3位置=,所以Q3在400—499組內(nèi)。

所以四分位差Q=Q3-Q1=162.5由上表知:Q1位置=,所以Q1在300—399組內(nèi);Q383三、全距全距又稱極差,它是一組數(shù)據(jù)中最大值與最小值之差。

全距是對定序及以上尺度的變量離散程度的測量。極差越小,表明資料越集中,集中趨勢統(tǒng)計量的代表性越高。一般公式為:

某校3個系各選5名同學,參加智力競賽,他們的成績分別如下:中文系:78、79、80、81、82數(shù)學系:65、72、80、88、95英語系:35、78、89、98、100則三個代表隊的全距分別為:中文系:82-78=4(分)數(shù)學系:95-65=30(分)英語系:100-35=65(分)對于組距分組數(shù)據(jù),全距也可以近似表示為:三、全距全距又稱極差,它是一組數(shù)據(jù)中最大值與最小值之差。全84四、方差及標準差方差和標準差是衡量變異程度最常用的指標,方差通常用表示。標準差又稱均方差,方差的平方根即為標準差,通常用表示,分析定距變量的離散情況,最常用的方法是標準差。

對于未分組數(shù)據(jù),公式為:對于組距分組數(shù)據(jù),公式為:四、方差及標準差方差和標準差是衡量變異程度最常用的指標,方差851998年度品牌飛利浦索尼東芝松下LG長虹創(chuàng)維海爾康佳TCL費用24292054168416111607143014301355126911751999年度品牌飛利浦東芝索尼TCLLG松下創(chuàng)維海爾康佳海信費用3415192918181688144013631234108010751023根據(jù)下表中1998年度和1999年度電視機廣告前10名品牌廣告費用統(tǒng)計情況,計算兩個年度廣告費用的標準差。根據(jù)上表可以計算出1998年度和1999年度的平均廣告費用額分別為:1604.4萬元,1606.5萬元。

1998年度的標準差為:=361.7(萬元)同理可以計算1999年度的標準差為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論