版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第4章統(tǒng)計數(shù)據(jù)特征的描述4.1分布集中趨勢的測度4.2分布離散程度的測度4.3分布偏態(tài)與峰度的側(cè)度4.4莖葉圖與箱線圖4.5統(tǒng)計表與統(tǒng)計圖本章小結(jié)第4章統(tǒng)計數(shù)據(jù)特征的描述4.1分布集中趨勢的測1學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)集中趨勢和離散程度的測度方法掌握莖葉圖和箱線圖的制作方法掌握分布偏態(tài)與峰度的測度方法掌握統(tǒng)計表和統(tǒng)計圖的使用學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)集中趨勢和離散程度的測度方法2學(xué)習(xí)重點側(cè)度數(shù)據(jù)集中趨勢指標(biāo)的計算方法及應(yīng)用側(cè)度數(shù)據(jù)離散程度指標(biāo)的計算方法及應(yīng)用統(tǒng)計表與統(tǒng)計圖學(xué)習(xí)重點3學(xué)習(xí)難點方差、標(biāo)準(zhǔn)差、變異系數(shù)的實質(zhì)學(xué)習(xí)難點方差、標(biāo)準(zhǔn)差、變異系數(shù)的實質(zhì)4授課學(xué)時4學(xué)時授課學(xué)時4學(xué)時54.1分布集中趨勢的測度分布集中趨勢的測度值是反映數(shù)據(jù)一般水平的代表值或者數(shù)據(jù)分布的中心值。一、眾數(shù)二、中位數(shù)三、四分位數(shù)四、均值五、幾何均值六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較4.1分布集中趨勢的測度分布集中趨勢的測度值是反映數(shù)據(jù)一般水6
眾數(shù)眾數(shù)7眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)計算公式見書頁。眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值8眾數(shù)
(不惟一性)無眾數(shù)
一個眾數(shù)
多于一個眾數(shù)
眾數(shù)
(不惟一性)無眾數(shù)
一個眾數(shù)
多于一個眾數(shù)
9
中位數(shù)中位數(shù)10中位數(shù)
(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即中位數(shù)
(median)排序后處于中間位置上的值Me50%511中位數(shù)計算(1)為分組資料中位數(shù)位置=(n+1)/2(奇數(shù)項與偶數(shù)項)(2)分組資料中位數(shù)位置=n/2中位數(shù)在累計頻數(shù)剛剛大于中位數(shù)位置的組眾數(shù)計算公式見書頁。中位數(shù)計算(1)為分組資料12
四分位數(shù)四分位數(shù)13四分位數(shù)
(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)
(quartile)排序后處于25%和75%位置上14四分位數(shù)
(位置的確定)未分組數(shù)據(jù):分組數(shù)據(jù):四分位數(shù)
(位置的確定)未分組數(shù)據(jù):分組數(shù)據(jù):15
均值均值16均值(算數(shù)平均數(shù))
(mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)注意均值的平均性均值(算數(shù)平均數(shù))
(mean)集中趨勢的最常用測度值17簡單算數(shù)平均數(shù)
(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體均值樣本均值簡單算數(shù)平均數(shù)
(simplemean)設(shè)一組數(shù)據(jù)為:18加權(quán)算數(shù)平均數(shù)
(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn相應(yīng)的頻數(shù)為:f1,f2,…,fk總體均值樣本均值加權(quán)算數(shù)平均數(shù)
(weightedmean)設(shè)一組數(shù)據(jù)為:19加權(quán)算數(shù)平均數(shù)
(例題分析)
加權(quán)算數(shù)平均數(shù)
(例題分析)20均值
(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零2.各變量值與均值的離差平方和最小均值
(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零2.21幾何平均數(shù)幾何平均數(shù)22幾何平均數(shù)
(geometricmean)
n個變量值乘積的n次方根主要用于計算平均比率或平均速度計算公式為5.可看作是均值的一種變形幾何平均數(shù)
(geometricmean)n個變量值乘23幾何平均數(shù)
(例題分析)
【例】一位投資者購持有一種股票,在2000年、2001年、2002年和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:
幾何平均:幾何平均數(shù)
(例題分析)【例】一位投資者購持有一種24幾何平均數(shù)
(例題分析)【例】胡錦濤在十七大報告中提出,實現(xiàn)人均國內(nèi)生產(chǎn)總值(GDP)到2020年比2000年翻兩番。幾何平均數(shù)
(例題分析)25
切尾均值切尾均值26切尾均值
(trimmedMean)去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值在電視大獎賽、體育比賽及需要人們進行綜合評價的比賽項目中已得到廣泛應(yīng)用計算公式為n表示觀察值的個數(shù);α表示切尾系數(shù),
切尾均值
(trimmedMean)去掉大小兩端的若干數(shù)27切尾均值
(例題分析)【例】謀次比賽共有11名評委,對某位歌手的給分分別是:經(jīng)整理得到順序統(tǒng)計量值為去掉一個最高分和一個最低分,α取1/11
切尾均值
(例題分析)【例】謀次比賽共有11名評委,28眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的比較29眾數(shù)、中位數(shù)和均值的關(guān)系左偏(負(fù)偏)分布均值
中位數(shù)
眾數(shù)對稱(正態(tài))分布
均值=中位數(shù)=
眾數(shù)右偏(正偏)分布眾數(shù)
中位數(shù)均值眾數(shù)、中位數(shù)和均值的關(guān)系左偏(負(fù)偏)分布均值中位數(shù)眾30眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)314.2分布離散程度的測度分布離散程度的測度值反映數(shù)據(jù)分布離散和差異程度。主要包括:一、極差二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)4.2分布離散程度的測度分布離散程度的測度值反映數(shù)據(jù)分布32極差
(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布R
=max(xi)-min(xi)計算公式為極差
(range)一組數(shù)據(jù)的最大值與最小值之差33內(nèi)距
(Inter-QuartileRange,IQR)
也稱四分位差上四分位數(shù)與下四分位數(shù)之差
內(nèi)距=Q3
–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性內(nèi)距
(Inter-QuartileRange,IQR)34
方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差35方差和標(biāo)準(zhǔn)差
(VarianceandStandarddeviation)1. 反映了數(shù)據(jù)的分布離散程度和差異程度的最常用的測度值。2.反映了各變量值與均值的平均差異。3.根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差
(VarianceandStandard36總體方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式總體方差和標(biāo)準(zhǔn)差
(simplevarianceand37樣本方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式注意:樣本方差用自由度n-1去除!樣本方差和標(biāo)準(zhǔn)差
(simplevarianceand38樣本方差
自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為n
時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x
=5
確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差
自由度(degreeoffreedom)一組數(shù)39樣本標(biāo)準(zhǔn)差
(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—55400樣本標(biāo)準(zhǔn)差
(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表40樣本標(biāo)準(zhǔn)差
(例題分析)
含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺樣本標(biāo)準(zhǔn)差
(例題分析)41
離散系數(shù)離散系數(shù)42離散系數(shù)
(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為離散系數(shù)
(coefficientofvariation43在什么情況下使用離散系數(shù)呢?當(dāng)兩個數(shù)列的性質(zhì)相同且均值相等的情況下用標(biāo)準(zhǔn)差說明平均數(shù)代表性的高低。當(dāng)兩個數(shù)列的性質(zhì)不同或均值不同的情況下需要用離散系數(shù)說明平均數(shù)代表性的高低。在什么情況下使用離散系數(shù)呢?當(dāng)兩個數(shù)列的性質(zhì)相同且均值相等的44離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企45離散系數(shù)
(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710離散系數(shù)
(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說46例題:有甲、乙兩個品種的糧食作物,經(jīng)播種實驗后得知乙品種的平均畝產(chǎn)量為998公斤,標(biāo)準(zhǔn)差為162.7公斤,甲品種實驗資料如下,試研究兩個品種的平均畝產(chǎn)量,確定哪一品種具有較大穩(wěn)定性,更有推廣價值。
畝產(chǎn)量(公斤/畝)100095011009001050播種面積(畝)12111098例題:有甲、乙兩個品種的糧食作物,經(jīng)播種實驗后得知乙品種的474.3分布偏態(tài)與峰度的測度4.3分布偏態(tài)與峰度的測度48偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布49偏態(tài)及其測度(skewness)1.統(tǒng)計學(xué)家Pearson于1895年首次提出2.數(shù)據(jù)分布偏斜程度的測度3. 偏態(tài)系數(shù)=0為對稱分布4. 偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布計算公式:偏態(tài)及其測度(skewness)1.統(tǒng)計學(xué)家Pearso50偏態(tài)系數(shù)
(例題分析)
某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235
491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000
70100000
偏態(tài)系數(shù)
(例題分析)某電腦公司銷售量偏態(tài)及峰度計算表51偏態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)偏態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不52峰態(tài)及其測度(kurtosis)統(tǒng)計學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=3扁平峰度適中峰態(tài)系數(shù)<3為扁平分布峰態(tài)系數(shù)>3為尖峰分布計算公式峰態(tài)及其測度(kurtosis)統(tǒng)計學(xué)家Pearson于1953峰態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)小于3,但與3的差異不大,說明電腦銷售量為輕微扁平分布峰態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)小于3,但與3的差異不544.4莖葉圖與箱線圖一、莖葉圖二、箱線圖4.4莖葉圖與箱線圖一、莖葉圖55莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布。由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字(個位數(shù))。莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值。莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息。莖葉圖
(stem-and-leafdisplay)用于顯56莖葉圖
(例題分析P22表2.7)莖葉圖
(例題分析P22表2.7)57莖葉圖
(擴展的莖葉圖0~4,5~9)莖葉圖
(擴展的莖葉圖0~4,5~9)58箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布。箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成。箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)。連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接。箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布。59箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值60箱線圖
(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)10980859095100105110150120125130周加工零件數(shù)的箱線圖箱線圖
(例題分析)最小值最大值中位數(shù)下四分位數(shù)上四分位數(shù)861分布的形狀與箱線圖
對稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖分布的形狀與箱線圖對稱分布QL中位數(shù)QU左偏分布QL62未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟數(shù)學(xué)西方經(jīng)濟學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】從某大學(xué)經(jīng)63未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績的箱6411名學(xué)生8門課程考試成績的箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)11名學(xué)生8門課程考試成績的箱線圖min-max25%-7565
4.5統(tǒng)計表與統(tǒng)計圖4.5統(tǒng)計表與統(tǒng)計圖66統(tǒng)計表是顯示統(tǒng)計數(shù)據(jù)的工具。統(tǒng)計表由表頭、行標(biāo)題、列標(biāo)題、和數(shù)字資料四部分組成。表頭放在表的正上方,說明統(tǒng)計表的主要內(nèi)容。行標(biāo)題放在表的第一列,說明研究問題的類別。列標(biāo)題放在表的第一行,說明研究問題的指標(biāo)名稱。表的其余部分為統(tǒng)計數(shù)字。表外附加放在表的下方,指明資料來源,必要說明,指標(biāo)注釋等。統(tǒng)計表是顯示統(tǒng)計數(shù)據(jù)的工具。671999~2000年城鎮(zhèn)居民家庭抽樣調(diào)查資料項目單位1999年2000年
調(diào)查戶數(shù)平均每戶家庭人口平均每戶就業(yè)人口平均每戶就業(yè)面平均一名就業(yè)者負(fù)擔(dān)人數(shù)平均每人全部年收入??芍涫杖肫骄咳讼M性支出戶人人%元元元元
400443.141.7756.431.775888.775854.024615.91
4222.03.131.6853.671.866316.816279.984998.00資料來源:《中國統(tǒng)計年鑒2001》,中國統(tǒng)計出版社,2001,第305頁。注:本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查材料。
行標(biāo)題列標(biāo)題數(shù)字資料表頭附加1999~2000年城鎮(zhèn)居民家庭抽樣調(diào)查資料項目單位199968統(tǒng)計表的設(shè)計
統(tǒng)計表設(shè)計原則:科學(xué)、實用、簡練、美觀首先,合理安排統(tǒng)計表的結(jié)構(gòu)。其次,表頭一般應(yīng)包含標(biāo)號、總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容。(表頭包含時間、地點、何種數(shù)據(jù))。第三,通常情況下,統(tǒng)計表的左右兩邊不封口,上下兩條線要粗,中間其他線要細(xì)。列標(biāo)題用豎線隔開,行標(biāo)題之間一般不用橫線隔開。以小數(shù)點同一位數(shù)右對齊。第四,“—”表示沒有數(shù)據(jù),“…”表示缺少。第五,統(tǒng)計表的欄數(shù)較多,可以在表或各欄應(yīng)用(1)、(2)、(3)等數(shù)字編號;第六,統(tǒng)計表要注明計量單位和資料來源。數(shù)據(jù)計量單位相同時,可放在表的右上角標(biāo)明,不同時應(yīng)放在每個指標(biāo)后或單列出一列標(biāo)明。統(tǒng)計表的設(shè)計
統(tǒng)計表設(shè)計原則:科學(xué)、實用、簡練、美觀69統(tǒng)計表—某地區(qū)工業(yè)企業(yè)主要經(jīng)濟指標(biāo)經(jīng)濟類型企業(yè)數(shù)(個)年平均職工人數(shù)(人)工業(yè)增加值(萬元)年末固定資產(chǎn)凈值(萬元)國有經(jīng)濟集體經(jīng)濟外商經(jīng)濟其他經(jīng)濟合計統(tǒng)計表—某地區(qū)工業(yè)企業(yè)主要經(jīng)濟指標(biāo)經(jīng)濟類型企業(yè)數(shù)(個)年平均70統(tǒng)計表—某企業(yè)職工計劃完成程度統(tǒng)計表計劃完成程度(%)職工人數(shù)比重(%)80——9013.3390——100310.00100——1101756.67110——120620.00120——130310.00合計30100.00統(tǒng)計表—某企業(yè)職工計劃完成程度統(tǒng)計表計劃完成程度(%)職工人71統(tǒng)計表—某企業(yè)商品銷售統(tǒng)計表商品名稱計量單位價格(元)銷售量銷售額(元)(甲)(乙)(1)(2)(3)皮鞋雙帽子頂手套副合計—統(tǒng)計表—某企業(yè)商品銷售統(tǒng)計表商品名稱計量單位價格(元)銷售量72統(tǒng)計圖直方圖折線圖圓餅圖曲線圖統(tǒng)計圖直方圖73統(tǒng)計圖—直方圖統(tǒng)計圖—直方圖74統(tǒng)計圖—折線圖統(tǒng)計圖—折線圖75統(tǒng)計圖—圓餅圖統(tǒng)計圖—圓餅圖76統(tǒng)計圖—曲線圖統(tǒng)計圖—曲線圖77條形圖、三維條形圖條形圖、三維條形圖78餅圖、三維餅圖餅圖、三維餅圖79三維圓柱圖三維圓柱圖80三維圓錐圖三維圓錐圖81面積圖面積圖82三維面積圖三維面積圖83三維曲面圖三維曲面圖84折線圖折線圖85本章小結(jié)分布集中趨勢的測度分布離散程度的測度分布偏態(tài)與峰度的側(cè)度莖葉圖與箱線圖統(tǒng)計表與統(tǒng)計圖本章小結(jié)分布集中趨勢的測度86第4章統(tǒng)計數(shù)據(jù)特征的描述4.1分布集中趨勢的測度4.2分布離散程度的測度4.3分布偏態(tài)與峰度的側(cè)度4.4莖葉圖與箱線圖4.5統(tǒng)計表與統(tǒng)計圖本章小結(jié)第4章統(tǒng)計數(shù)據(jù)特征的描述4.1分布集中趨勢的測87學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)集中趨勢和離散程度的測度方法掌握莖葉圖和箱線圖的制作方法掌握分布偏態(tài)與峰度的測度方法掌握統(tǒng)計表和統(tǒng)計圖的使用學(xué)習(xí)目標(biāo)掌握數(shù)據(jù)集中趨勢和離散程度的測度方法88學(xué)習(xí)重點側(cè)度數(shù)據(jù)集中趨勢指標(biāo)的計算方法及應(yīng)用側(cè)度數(shù)據(jù)離散程度指標(biāo)的計算方法及應(yīng)用統(tǒng)計表與統(tǒng)計圖學(xué)習(xí)重點89學(xué)習(xí)難點方差、標(biāo)準(zhǔn)差、變異系數(shù)的實質(zhì)學(xué)習(xí)難點方差、標(biāo)準(zhǔn)差、變異系數(shù)的實質(zhì)90授課學(xué)時4學(xué)時授課學(xué)時4學(xué)時914.1分布集中趨勢的測度分布集中趨勢的測度值是反映數(shù)據(jù)一般水平的代表值或者數(shù)據(jù)分布的中心值。一、眾數(shù)二、中位數(shù)三、四分位數(shù)四、均值五、幾何均值六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較4.1分布集中趨勢的測度分布集中趨勢的測度值是反映數(shù)據(jù)一般水92
眾數(shù)眾數(shù)93眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)計算公式見書頁。眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值94眾數(shù)
(不惟一性)無眾數(shù)
一個眾數(shù)
多于一個眾數(shù)
眾數(shù)
(不惟一性)無眾數(shù)
一個眾數(shù)
多于一個眾數(shù)
95
中位數(shù)中位數(shù)96中位數(shù)
(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即中位數(shù)
(median)排序后處于中間位置上的值Me50%597中位數(shù)計算(1)為分組資料中位數(shù)位置=(n+1)/2(奇數(shù)項與偶數(shù)項)(2)分組資料中位數(shù)位置=n/2中位數(shù)在累計頻數(shù)剛剛大于中位數(shù)位置的組眾數(shù)計算公式見書頁。中位數(shù)計算(1)為分組資料98
四分位數(shù)四分位數(shù)99四分位數(shù)
(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)
(quartile)排序后處于25%和75%位置上100四分位數(shù)
(位置的確定)未分組數(shù)據(jù):分組數(shù)據(jù):四分位數(shù)
(位置的確定)未分組數(shù)據(jù):分組數(shù)據(jù):101
均值均值102均值(算數(shù)平均數(shù))
(mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)注意均值的平均性均值(算數(shù)平均數(shù))
(mean)集中趨勢的最常用測度值103簡單算數(shù)平均數(shù)
(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體均值樣本均值簡單算數(shù)平均數(shù)
(simplemean)設(shè)一組數(shù)據(jù)為:104加權(quán)算數(shù)平均數(shù)
(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn相應(yīng)的頻數(shù)為:f1,f2,…,fk總體均值樣本均值加權(quán)算數(shù)平均數(shù)
(weightedmean)設(shè)一組數(shù)據(jù)為:105加權(quán)算數(shù)平均數(shù)
(例題分析)
加權(quán)算數(shù)平均數(shù)
(例題分析)106均值
(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零2.各變量值與均值的離差平方和最小均值
(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零2.107幾何平均數(shù)幾何平均數(shù)108幾何平均數(shù)
(geometricmean)
n個變量值乘積的n次方根主要用于計算平均比率或平均速度計算公式為5.可看作是均值的一種變形幾何平均數(shù)
(geometricmean)n個變量值乘109幾何平均數(shù)
(例題分析)
【例】一位投資者購持有一種股票,在2000年、2001年、2002年和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:
幾何平均:幾何平均數(shù)
(例題分析)【例】一位投資者購持有一種110幾何平均數(shù)
(例題分析)【例】胡錦濤在十七大報告中提出,實現(xiàn)人均國內(nèi)生產(chǎn)總值(GDP)到2020年比2000年翻兩番。幾何平均數(shù)
(例題分析)111
切尾均值切尾均值112切尾均值
(trimmedMean)去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值在電視大獎賽、體育比賽及需要人們進行綜合評價的比賽項目中已得到廣泛應(yīng)用計算公式為n表示觀察值的個數(shù);α表示切尾系數(shù),
切尾均值
(trimmedMean)去掉大小兩端的若干數(shù)113切尾均值
(例題分析)【例】謀次比賽共有11名評委,對某位歌手的給分分別是:經(jīng)整理得到順序統(tǒng)計量值為去掉一個最高分和一個最低分,α取1/11
切尾均值
(例題分析)【例】謀次比賽共有11名評委,114眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的比較115眾數(shù)、中位數(shù)和均值的關(guān)系左偏(負(fù)偏)分布均值
中位數(shù)
眾數(shù)對稱(正態(tài))分布
均值=中位數(shù)=
眾數(shù)右偏(正偏)分布眾數(shù)
中位數(shù)均值眾數(shù)、中位數(shù)和均值的關(guān)系左偏(負(fù)偏)分布均值中位數(shù)眾116眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)1174.2分布離散程度的測度分布離散程度的測度值反映數(shù)據(jù)分布離散和差異程度。主要包括:一、極差二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)4.2分布離散程度的測度分布離散程度的測度值反映數(shù)據(jù)分布118極差
(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布R
=max(xi)-min(xi)計算公式為極差
(range)一組數(shù)據(jù)的最大值與最小值之差119內(nèi)距
(Inter-QuartileRange,IQR)
也稱四分位差上四分位數(shù)與下四分位數(shù)之差
內(nèi)距=Q3
–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性內(nèi)距
(Inter-QuartileRange,IQR)120
方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差121方差和標(biāo)準(zhǔn)差
(VarianceandStandarddeviation)1. 反映了數(shù)據(jù)的分布離散程度和差異程度的最常用的測度值。2.反映了各變量值與均值的平均差異。3.根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差
(VarianceandStandard122總體方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式總體方差和標(biāo)準(zhǔn)差
(simplevarianceand123樣本方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式注意:樣本方差用自由度n-1去除!樣本方差和標(biāo)準(zhǔn)差
(simplevarianceand124樣本方差
自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為n
時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x
=5
確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差
自由度(degreeoffreedom)一組數(shù)125樣本標(biāo)準(zhǔn)差
(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—55400樣本標(biāo)準(zhǔn)差
(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表126樣本標(biāo)準(zhǔn)差
(例題分析)
含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺樣本標(biāo)準(zhǔn)差
(例題分析)127
離散系數(shù)離散系數(shù)128離散系數(shù)
(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為離散系數(shù)
(coefficientofvariation129在什么情況下使用離散系數(shù)呢?當(dāng)兩個數(shù)列的性質(zhì)相同且均值相等的情況下用標(biāo)準(zhǔn)差說明平均數(shù)代表性的高低。當(dāng)兩個數(shù)列的性質(zhì)不同或均值不同的情況下需要用離散系數(shù)說明平均數(shù)代表性的高低。在什么情況下使用離散系數(shù)呢?當(dāng)兩個數(shù)列的性質(zhì)相同且均值相等的130離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企131離散系數(shù)
(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710離散系數(shù)
(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說132例題:有甲、乙兩個品種的糧食作物,經(jīng)播種實驗后得知乙品種的平均畝產(chǎn)量為998公斤,標(biāo)準(zhǔn)差為162.7公斤,甲品種實驗資料如下,試研究兩個品種的平均畝產(chǎn)量,確定哪一品種具有較大穩(wěn)定性,更有推廣價值。
畝產(chǎn)量(公斤/畝)100095011009001050播種面積(畝)12111098例題:有甲、乙兩個品種的糧食作物,經(jīng)播種實驗后得知乙品種的1334.3分布偏態(tài)與峰度的測度4.3分布偏態(tài)與峰度的測度134偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布135偏態(tài)及其測度(skewness)1.統(tǒng)計學(xué)家Pearson于1895年首次提出2.數(shù)據(jù)分布偏斜程度的測度3. 偏態(tài)系數(shù)=0為對稱分布4. 偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布計算公式:偏態(tài)及其測度(skewness)1.統(tǒng)計學(xué)家Pearso136偏態(tài)系數(shù)
(例題分析)
某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235
491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000
70100000
偏態(tài)系數(shù)
(例題分析)某電腦公司銷售量偏態(tài)及峰度計算表137偏態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)偏態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不138峰態(tài)及其測度(kurtosis)統(tǒng)計學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=3扁平峰度適中峰態(tài)系數(shù)<3為扁平分布峰態(tài)系數(shù)>3為尖峰分布計算公式峰態(tài)及其測度(kurtosis)統(tǒng)計學(xué)家Pearson于19139峰態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)小于3,但與3的差異不大,說明電腦銷售量為輕微扁平分布峰態(tài)系數(shù)
(例題分析)結(jié)論:偏態(tài)系數(shù)小于3,但與3的差異不1404.4莖葉圖與箱線圖一、莖葉圖二、箱線圖4.4莖葉圖與箱線圖一、莖葉圖141莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布。由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字(個位數(shù))。莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值。莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息。莖葉圖
(stem-and-leafdisplay)用于顯142莖葉圖
(例題分析P22表2.7)莖葉圖
(例題分析P22表2.7)143莖葉圖
(擴展的莖葉圖0~4,5~9)莖葉圖
(擴展的莖葉圖0~4,5~9)144箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布。箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成。箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)。連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接。箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布。145箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值146箱線圖
(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)10980859095100105110150120125130周加工零件數(shù)的箱線圖箱線圖
(例題分析)最小值最大值中位數(shù)下四分位數(shù)上四分位數(shù)8147分布的形狀與箱線圖
對稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖分布的形狀與箱線圖對稱分布QL中位數(shù)QU左偏分布QL148未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟數(shù)學(xué)西方經(jīng)濟學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】從某大學(xué)經(jīng)149未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績的箱15011名學(xué)生8門課程考試成績的箱線圖min-max25%-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 機械行業(yè)促銷計劃總結(jié)
- 健康行業(yè)采購工作總結(jié)
- 重要工程安保工作的系統(tǒng)總結(jié)計劃
- 科技產(chǎn)品設(shè)計師的智能體驗與科技感
- 水務(wù)文化建設(shè)的探索計劃
- 中小學(xué)了解學(xué)習(xí)歷史英雄人物故事主題班會:紅色人物1
- 2023年云南省臨滄市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2022年浙江省舟山市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2024年山西省忻州市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2022年浙江省麗水市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 川藏鐵路勘察報告范文
- 新零售智慧零售門店解決方案
- 小學(xué)一年級數(shù)學(xué)20以內(nèi)的口算題(可直接打印A4)
- 上海黃浦區(qū)2025屆物理高一第一學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 肺結(jié)核課件教學(xué)課件
- 新生兒心臟病護理查房
- 規(guī)劃設(shè)計行業(yè)數(shù)字化轉(zhuǎn)型趨勢
- 2024年廣告代理合同的廣告投放范圍與分成比例
- 物業(yè)年終總結(jié)匯報工作
- 2024-2025學(xué)年上學(xué)期期中教育學(xué)業(yè)質(zhì)量監(jiān)測八年級生物學(xué)試卷
- 醫(yī)院住院病歷質(zhì)量檢查評分表(評分標(biāo)準(zhǔn))
評論
0/150
提交評論