




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章統(tǒng)計數(shù)據(jù)的描述第一節(jié)分布集中趨勢的描述一、眾數(shù)(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)眾數(shù)
(不惟一性)無眾數(shù)
原始數(shù)據(jù):10591268一個眾數(shù)
原始數(shù)據(jù):
65
9855多于一個眾數(shù)
原始數(shù)據(jù):252828364242排序后處于中間位置上的值Me50%50%不受極端值的影響3.各變量值與中位數(shù)的離差絕對值之和最小,即二、中位數(shù)(median)(一)中位數(shù)的概念原始數(shù)據(jù):分組數(shù)據(jù):(二)中位數(shù)的位置中位數(shù)的求法
(9個數(shù)據(jù)的算例)【例】9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):
15007507801080850960200012501630排序:7507808509601080
1250150016302000位置:
1234
56789中位數(shù)
1080
中位數(shù)的求法
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:
1234
5678910
三、四分位數(shù)(quartile)(一)四分位數(shù)的概念1.將一組數(shù)據(jù)(排序后)四等分的數(shù)據(jù)QLQMQU25%25%25%25%2.不受極端值的影響原始數(shù)據(jù):分組數(shù)據(jù):(二)四分位數(shù)的位置四分位數(shù)的求法
(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789
四分位數(shù)的求法
(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:
1234
5678910
統(tǒng)計函數(shù)—QUARTILE四、均值(mean)(一)均值的概念集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在(重心)易受極端值的影響(二)均值的算法1、簡單均值(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體均值樣本均值2、加權(quán)均值(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…
,xn相應(yīng)的頻數(shù)為:f1,f2,…
,fk總體均值樣本均值單變量分組組距式分組加權(quán)均值計算表零件數(shù)
工人數(shù)
組中值Mifi80-9038525590-100795665100-110131051365110-1205115575120-1302125250合計30
—3110加權(quán)均值
(例題分析)(三)均值的數(shù)學(xué)性質(zhì)1. 各變量值與均值的離差之和等于零2.各變量值與均值的離差平方和最小五、幾何平均數(shù)(geometricmean)1.n個變量值乘積的
n次方根2.適用于對比率數(shù)據(jù)的平均3.主要用于計算平均增長率4.計算公式為5.可看作是均值的一種變形幾何平均數(shù)的求法
(例題分析)
【例】一位投資者購持有一種股票,在2000年、2001年、2002年和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率
幾何平均:六、切尾均值(trimedmean)
1.去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值2.在電視大獎賽、體育比賽及需要人們進行綜合評價的比賽項目中已得到廣泛應(yīng)用3.計算公式為n
表示觀察值的個數(shù);α表示切尾系數(shù),
切尾均值
(例題分析)
【例】某次比賽共有11名評委,對某位歌手的給分分別是:
經(jīng)整理得到順序統(tǒng)計量值為去掉一個最高分和一個最低分,取1/11眾數(shù)、中位數(shù)和均值的關(guān)系左偏分布均值
中位數(shù)
眾數(shù)對稱分布
均值=中位數(shù)=
眾數(shù)右偏分布眾數(shù)
中位數(shù)均值眾數(shù)、中位數(shù)、均值的特點和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用一、極差二、內(nèi)距三、方差和標準差四、離散系數(shù)第二節(jié)分布離散程度的測度一、極差(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值極差越大,說明離散程度越大易受極端值影響未考慮數(shù)據(jù)的分布7891078910R
=max(xi)-min(xi)計算公式為二、內(nèi)距(Inter-QuartileRange,IQR)
1.也稱四分位差2.上四分位數(shù)與下四分位數(shù)之差內(nèi)距=QU
–
QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性三、方差與標準差(VarianceandStandarddeviation)(一)方差與標準差的概念1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布4.反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差可用于衡量均值的代表性大小4681012
x=8.3(二)總體方差和標準差的計算公式未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):1.總體方差的計算公式2.總體標準差的計算公式(三)樣本方差和標準差的計算公式未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):1、樣本方差的計算公式2、樣本標準差的計算公式注意:樣本方差用自由度n-1去除!單變量分組的樣本方差和標準差注:在分組數(shù)據(jù)里n=∑fi注解:樣本方差自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)
當(dāng)樣本數(shù)據(jù)的個數(shù)為
n
時,若樣本均值
x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值(舉例)2.樣本方差用自由度去除,其原因可從多方面解釋,從實際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量S=262.85四、離散系數(shù)(coefficientofvariation)1. 標準差與其相應(yīng)的均值之比2.對數(shù)據(jù)相對離散程度的測度3.消除了數(shù)據(jù)水平高低和計量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為離散系數(shù)
(例題分析)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù)
(例題分析)結(jié)論:計算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710第三節(jié)偏態(tài)與峰度的度量一、偏態(tài)及其測度二、峰度及其測度一、偏態(tài)及其測度(一)偏態(tài)的概念1.統(tǒng)計學(xué)家Pearson于1895年首次提出2.數(shù)據(jù)分布偏斜程度的測度,數(shù)據(jù)分布的不對稱性稱為偏態(tài)。3.偏態(tài)系數(shù)=0為對稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布二、偏態(tài)系數(shù)
(skewnesscoefficient)1.根據(jù)原始數(shù)據(jù)計算2.根據(jù)分組數(shù)據(jù)計算二、峰度及其測度(一)峰度的概念1.統(tǒng)計學(xué)家Pearson于1905年首次提出2.數(shù)據(jù)分布的平峰或尖峰程度的測度(與標準正態(tài)分布比較)。3.峰度系數(shù)=0為峰度適中(標準正態(tài)分布)峰度系數(shù)<0為平峰分布峰度系數(shù)>0為尖峰分布(二)峰度系數(shù)(kurtosiscoefficient)1.根據(jù)原始數(shù)據(jù)計算2.根據(jù)分組數(shù)據(jù)計算偏態(tài)系數(shù)和峰度系數(shù)
(例題分析)
某電腦公司銷售量偏態(tài)及峰度計算表
按銷售量份組(臺)組中值(Mi)頻數(shù)
fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000
70100000
結(jié)論:偏態(tài)系數(shù)為正值,右偏分布。結(jié)論:峰度系數(shù)為負值,說明電腦銷售量為平峰分布STAT《統(tǒng)計學(xué)》非對稱的,右偏斜的分布對稱的、高度適中的分布既左偏斜又低平的分布第四節(jié)莖葉圖與箱線圖一、莖葉圖二、箱線圖用于顯示未分組的原始數(shù)值型數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息一、莖葉圖(stem-and-leafdisplay)莖葉圖
(例題分析)莖葉圖
(擴展的莖葉圖)二、箱線圖(boxplot)用于顯示未分組的原始數(shù)值型數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖箱線圖
(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)10980859095100105110150120125130周加工零件數(shù)的箱線圖分布的形狀與箱線圖
對稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟數(shù)學(xué)西方經(jīng)濟學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機應(yīng)用基礎(chǔ)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度股東致行動協(xié)議:董事會席位調(diào)整與決策權(quán)分配
- 二零二五年度汽車充電樁場地租賃及維護服務(wù)合同
- 旅游景區(qū)服務(wù)質(zhì)量提升策略手冊
- 汽車配件銷售及售后支持協(xié)議
- 企業(yè)級軟件系統(tǒng)開發(fā)合作協(xié)議
- 水滸傳經(jīng)典人物宋江征文
- 租賃房屋補充協(xié)議
- 關(guān)于提高工作效率的研討會紀要
- 文化創(chuàng)意產(chǎn)業(yè)發(fā)展規(guī)劃策略
- 融資租賃資產(chǎn)轉(zhuǎn)讓協(xié)議
- DWI高信號常見疾病的鑒別診斷課件-2
- 2024年內(nèi)蒙古中考地理生物試卷(含答案)
- 酸堿滴定分析與討論實驗報告
- 2024年邵陽職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫完美版
- 2024年湖南理工職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫必考題
- 中國風(fēng)川劇戲曲京劇文化傳統(tǒng)文化國粹世界戲劇日活動策劃完整課件兩篇
- (正式版)JTT 1495-2024 公路水運危險性較大工程安全專項施工方案審查規(guī)程
- 醫(yī)院dip付費績效考核制度
- 20G520-1-2鋼吊車梁(6m-9m)2020年合訂本
- 電梯維護保養(yǎng)規(guī)則(TSG T5002-2017)
- 義務(wù)教育數(shù)學(xué)課程標準(2022年版)解讀與案例分析
評論
0/150
提交評論