版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第2章統(tǒng)計(jì)數(shù)據(jù)的描述2.1統(tǒng)計(jì)數(shù)據(jù)的整理2.2分布集中趨勢的測度2.3分布離散程度的測度2.4分布偏態(tài)與峰態(tài)的測度2.5統(tǒng)計(jì)表與統(tǒng)計(jì)圖學(xué)習(xí)目標(biāo)了解數(shù)據(jù)的計(jì)量尺度了解統(tǒng)計(jì)數(shù)據(jù)的來源和數(shù)據(jù)的質(zhì)量要求掌握數(shù)值型數(shù)據(jù)的整理與顯示方法掌握數(shù)據(jù)集中趨勢和離散程度的測度方法掌握莖葉圖和箱線圖的制作方法掌握分布集中趨勢的測度方法掌握分布離散程度的測度方法2.1統(tǒng)計(jì)數(shù)據(jù)的整理一、統(tǒng)計(jì)數(shù)據(jù)的分組
二、次數(shù)分配三、次數(shù)分配直方圖四、洛倫茨曲線統(tǒng)計(jì)數(shù)據(jù)的分組組距分組
(要點(diǎn))將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組
(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即
組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表組距分組
(幾個概念)1.下限(lowlimit)
:一個組的最小值2.上限(upperlimit)
:一個組的最大值3.組距(classwidth)
:上限與下限之差4.組中值(classmidpoint)
:下限與上限之間的中點(diǎn)值下限值+上限值2組中值=次數(shù)分配表的編制
(例題分析)【例】某車間30名工人每周加工某種零件件數(shù)如下表試對數(shù)據(jù)進(jìn)行分組。
次數(shù)分配表次數(shù)分配直方圖直方圖
(histogram)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖直方圖下的總面積等于1分組數(shù)據(jù)的圖示
(直方圖的繪制)某車間工人周加工零件直方圖
折線圖
(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點(diǎn)要與橫軸相交,具體的做法是第一個矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示
(折線圖的繪制)折線圖與直方圖下的面積相等!某車間工人周加工零件折線圖
洛倫茨曲線洛倫茨曲線本世紀(jì)初美國經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨(M.E.Lorentz)根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特(V.Pareto)提出的收入分配公式繪制成描述收入和財(cái)富分配性質(zhì)的曲線分析該國家或地區(qū)分配的平均程度
AB累積的人口百分比累積的收入百分比絕對公平線基尼系數(shù)20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G.Gini)根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標(biāo)
A表示實(shí)際收入曲線與絕對平均線之間的面積B表示實(shí)際收入曲線與絕對不平均線之間的面積如果A=0,則基尼系數(shù)=0,表示收入絕對平均如果B=0,則基尼系數(shù)=1,表示收入絕對不平均基尼系數(shù)在0和1之間取值一般認(rèn)為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當(dāng)?shù)?,即一個社會既有效率又沒有造成極大的分配不公;基尼系數(shù)在0.4被認(rèn)為是收入分配不公平的警戒線,超過了0.4應(yīng)該采取措施縮小這一差距。AB2.2分布集中趨勢的測度一、眾數(shù)二、中位數(shù)三、分位數(shù)四、均值五、幾何平均數(shù)六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較眾數(shù)眾數(shù)
(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)中位數(shù)中位數(shù)
(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即中位數(shù)
(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):數(shù)值型數(shù)據(jù)的中位數(shù)
(9個數(shù)據(jù)的算例)【例】9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排
序:7507808509601080
1250150016302000位置:123456789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排
序:
660
75078085096010801250150016302000位置:1234
5678910四分位數(shù)四分位數(shù)
(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)
(位置的確定)原始數(shù)據(jù):分組數(shù)據(jù):數(shù)值型數(shù)據(jù)的四分位數(shù)
(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排
序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排
序:
660
75078085096010801250150016302000位置:1234
5678910均值均值
(mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)簡單平均數(shù)
(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體平均數(shù)樣本平均數(shù)加權(quán)平均數(shù)
(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn相應(yīng)的頻數(shù)為:f1,f2,…,fk總體平均數(shù)樣本平均數(shù)加權(quán)平均數(shù)
(例題分析)
平均數(shù)
(數(shù)學(xué)性質(zhì))1. 各變量值與平均數(shù)的離差之和等于零
2.各變量值與平均數(shù)的離差平方和最小幾何平均數(shù)幾何平均數(shù)
(geometricmean)
n個變量值乘積的
n次方根適用于對比率數(shù)據(jù)的平均主要用于計(jì)算平均增長率計(jì)算公式為5.可看作是平均數(shù)的一種變形幾何平均數(shù)
(例題分析)
【例】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:
幾何平均:切尾均值切尾均值
(trimmedMean)
去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值在電視大獎賽、體育比賽及需要人們進(jìn)行綜合評價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為n
表示觀察值的個數(shù);α表示切尾系數(shù),
切尾均值
(例題分析)
【例】謀次比賽共有11名評委,對某位歌手的給分分別是:經(jīng)整理得到順序統(tǒng)計(jì)量值為去掉一個最高分和一個最低分,取1/11
眾數(shù)、中位數(shù)和平均數(shù)的比較眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時(shí)應(yīng)用2.3分布離散程度的測度一、極差二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)極差
(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布
R
=max(xi)-min(xi)計(jì)算公式為內(nèi)距
(Inter-QuartileRange,IQR)
也稱四分位差上四分位數(shù)與下四分位數(shù)之差
內(nèi)距=Q3
–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差
(VarianceandStandarddeviation)1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4681012x=8.3總體方差和標(biāo)準(zhǔn)差
(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差
自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為
n
時(shí),若樣本均值x
確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則
x
=5。當(dāng)
x
=5
確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差σ2時(shí),它是σ2的無偏估計(jì)量離散系數(shù)離散系數(shù)
(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)
(例題分析)結(jié)論:計(jì)算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.7102.4分布偏態(tài)與峰態(tài)的測度一、偏態(tài)及其測度二、峰態(tài)及其測度偏態(tài)
(skewness)統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出數(shù)據(jù)分布偏斜程度的測度2. 偏態(tài)系數(shù)=0為對稱分布3. 偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)大于1或小于-1,被稱為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-0.5~-1之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低偏態(tài)系數(shù)
(coefficientofskewness)根據(jù)分組數(shù)據(jù)計(jì)算峰態(tài)峰態(tài)
(kurtosis)統(tǒng)計(jì)學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布峰態(tài)系數(shù)
(coefficientofkurtosis)根據(jù)分組數(shù)據(jù)計(jì)算2.5統(tǒng)計(jì)表與統(tǒng)計(jì)圖一、統(tǒng)計(jì)表二、統(tǒng)計(jì)圖要合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W要求數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個指標(biāo)后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對于沒有數(shù)字的表格單元,一般用“—”表示必要時(shí)可在表的下方加上注釋統(tǒng)計(jì)表的設(shè)計(jì)莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息莖葉圖
(例題分析)莖葉圖
(擴(kuò)展的莖葉圖)統(tǒng)計(jì)圖箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點(diǎn)與箱子相連接
箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖箱線圖
(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)10980859095100105110150120125130周加工零件數(shù)的箱
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國麻醉機(jī)行業(yè)發(fā)展?fàn)顩r及投資前景規(guī)劃研究報(bào)告
- 2025-2030年中國隱形紗窗行業(yè)競爭格局及未來發(fā)展趨勢分析報(bào)告
- 2025-2030年中國防爆電機(jī)產(chǎn)業(yè)競爭格局及發(fā)展?jié)摿Ψ治鰣?bào)告
- 2025-2030年中國鋅空電池行業(yè)市場現(xiàn)狀規(guī)模及發(fā)展?jié)摿Ψ治鰣?bào)告
- 2025-2030年中國鑄造扣件市場發(fā)展現(xiàn)狀及營銷策略分析報(bào)告
- 2025-2030年中國金屬銦行業(yè)發(fā)展?fàn)顩r及投資前景研究報(bào)告
- 2025年度項(xiàng)目經(jīng)理部勞動合同范本(含員工離職手續(xù)及注意事項(xiàng))3篇
- 2024物業(yè)房屋裝修材料供應(yīng)及安裝合同
- 云母汽車內(nèi)飾材料的研究考核試卷
- 刺繡圖案寓意解讀考核試卷
- 2024年08月云南省農(nóng)村信用社秋季校園招考750名工作人員筆試歷年參考題庫附帶答案詳解
- 防詐騙安全知識培訓(xùn)課件
- 心肺復(fù)蘇課件2024
- 2024年股東股權(quán)繼承轉(zhuǎn)讓協(xié)議3篇
- 2024-2025學(xué)年江蘇省南京市高二上冊期末數(shù)學(xué)檢測試卷(含解析)
- 四川省名校2025屆高三第二次模擬考試英語試卷含解析
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識
- 江蘇省建筑與裝飾工程計(jì)價(jià)定額(2014)電子表格版
- 分紅保險(xiǎn)精算規(guī)定
- Proud-of-you中英文歌詞
- 基因的表達(dá)與調(diào)控.ppt
評論
0/150
提交評論