第3章數(shù)據(jù)特征描述_第1頁
第3章數(shù)據(jù)特征描述_第2頁
第3章數(shù)據(jù)特征描述_第3頁
第3章數(shù)據(jù)特征描述_第4頁
第3章數(shù)據(jù)特征描述_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、140 150210某電腦公司銷售量分布的折線圖某電腦公司銷售量分布的折線圖190200180160 170220 230240頻頻數(shù)數(shù)(天天)25201510530第 4章 數(shù)據(jù)的概括性度量數(shù)據(jù)特征的測度數(shù)據(jù)特征的測度分布的形狀分布的形狀集中趨勢集中趨勢離散程度離散程度眾眾 數(shù)數(shù)眾數(shù)不同品牌飲料的頻數(shù)分布不同品牌飲料的頻數(shù)分布 飲料品牌飲料品牌頻數(shù)頻數(shù)比例比例百分比百分比(%) 可口可樂可口可樂 旭日升冰茶旭日升冰茶 百事可樂百事可樂 匯源果汁匯源果汁 露露露露15119690.300.220.180.120.183022181218合計合計501100眾數(shù)(Mo)特點不唯一性無眾數(shù)一個眾數(shù)

2、數(shù)個眾數(shù)不受極端值的影響適用于所有數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值數(shù)據(jù)中位數(shù)n【例】:【例】:9個家庭的人均月收入數(shù)據(jù)n原始數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 1630 2000n位 置: 1 2 3 4 5 6 7 8 9n【例】:10個家庭的人均月收入數(shù)據(jù)n排排 序序: 660 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9 10中位數(shù)(Me)特點n不受極端值的影響n不能用于

3、分類數(shù)據(jù)同樣道理:四分位數(shù)n【例】:【例】:9個家庭的人均月收入數(shù)據(jù)n原始數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630n排排 序序: 750 780 850 960 1080 1250 1500 1630 2000n位位 置置: 1 2 3 4 5 6 7 8 9n【例】【例】: 10個家庭的人均月收入數(shù)據(jù)n排 序: 660 750 780 850 960 1080 1250 1500 1630 2000n位 置: 1 2 3 4 5 6 7 8 9 1025%25%25%25%均值nxnxxxxniin121已改至此!已改至此!某電腦公司銷

4、售量數(shù)據(jù)分組表某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組按銷售量分組組中值組中值(Mi)頻數(shù)頻數(shù)(fi)Mi fi 14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計合計12022200185120222001nfMxkiii2.加權均值加權均值3.幾何平均數(shù)幾何平均數(shù)n 【例】【例】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別

5、為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內(nèi)的平均收益率 %0787. 81%9 .101%5 .125%1 .102%5 .1044G%5 . 84%9 . 1%5 .25%1 . 2%5 . 4G眾數(shù)、中位數(shù)和均值的關系左偏分布對稱分布右偏分布數(shù)據(jù)箱線圖某電腦公司銷售量數(shù)據(jù)的箱線圖某電腦公司銷售量數(shù)據(jù)的箱線圖數(shù)據(jù)特征的測度數(shù)據(jù)特征的測度分布的形狀分布的形狀集中趨勢集中趨勢離散程度離散程度眾眾 數(shù)數(shù)離散程度(離中趨勢)1.異眾比率n非眾數(shù)組的頻數(shù)占總頻數(shù)的比率imimirfffffv1異眾比率不同品牌飲料的頻數(shù)分布 飲料品牌頻數(shù)比例百分比(%) 可口可樂 旭日升冰茶 百

6、事可樂 匯源果汁 露露15119690.300.220.180.120.183022181218合計5011002.四分位差極差一組數(shù)據(jù)的最大值與最小值之差四分位差上四分位數(shù)與下四分位數(shù)之差 QD = QU QL離散度:中間50%數(shù)據(jù)四分位差解:設非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2 QU = 一般 = 3四分位差: QD = QU = QL = 3 2 = 1順序數(shù)據(jù)問題甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300

7、合計3003.方差未分組數(shù)據(jù)組距分組數(shù)據(jù)nxxMniid1nfxMMkiiid1平均差全面準確反映離散狀況數(shù)學性質(zhì)較差平均差某電腦公司銷售量數(shù)據(jù)平均差計算表 按銷售量分組組中值(Mi)頻數(shù)(fi)14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計1202040 xMiiifxM 平均差)(1712020401臺nfxMMkiiid改進:方差

8、和標準差數(shù)據(jù)離散程度的最常用測度值總體方差或標準差;樣本方差或標準差總體方差和標準差未分組數(shù)據(jù)組距分組數(shù)據(jù)NxNii122)(NfMkiii122)(樣本方差和標準差n未分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù)1)(122nxxsnii1)(122nfxMskiii1)(12nxxsnii1)(12nfxMskiii樣本標準差某電腦公司銷售量數(shù)據(jù)平均差計算表 按銷售量分組組中值(Mi)頻數(shù)(fi)1401501501601601701701801801901902002002102102202202302302401451551651751851952052152252354916272017108

9、4540302010010203040501602703202700170200240160250合計120554002xMiiifxM2樣本標準差)(58.211120554001)(12臺nfxMskiii相對位置的度量:標準分數(shù)n 計算公式為n n也稱標準化值q均值0q標準差1n用于對變量的標準化處理sxxzii標準分數(shù)的性質(zhì)n只是線性變換,并沒有改變:q一個數(shù)據(jù)在改組數(shù)據(jù)中的位置q也沒有改變該組數(shù)分布的形狀n只將數(shù)據(jù)變?yōu)椋ɡ?,一組數(shù)據(jù)標準差6,均值34)q均值為0,q標準差為1。 經(jīng)驗法則n經(jīng)驗法則表明:當一組數(shù)據(jù)對稱分布時n約有68%的數(shù)據(jù)在平均數(shù)加減1個標準差的范圍之內(nèi)n約有95%

10、的數(shù)據(jù)在平均數(shù)加減2個標準差的范圍之內(nèi)n約有99%的數(shù)據(jù)在平均數(shù)加減3個標準差的范圍之內(nèi) 切比雪夫不等式n一對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有(1-1/k2)個數(shù)據(jù)落在k個標準差之內(nèi)。n對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個標準差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個標準差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個標準差的范圍之內(nèi)4.離散系數(shù):相對離散程度n標準差與其相應的均值之比 q消除了數(shù)據(jù)水平高低和計量單位的影響q用于對不同組別數(shù)據(jù)離散程度的比較n計算公式為xsvs離散系數(shù)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(

11、萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【 例例 】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度離散系數(shù))(19.309)(25.53611萬元萬元sx)(09.23)(5215.3222萬元萬元sx數(shù)據(jù)特征的測度數(shù)據(jù)特征的測度分布的形狀分布的形狀集中趨勢集中趨勢離散程度離散程度眾眾 數(shù)數(shù)偏態(tài)與峰態(tài)分布的形狀偏態(tài)系數(shù) (skewness coefficient)根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算33)2)(1(snnxxnSKi313)(

12、nsfxMSKkiii偏態(tài)n數(shù)據(jù)分布偏斜程度的測度q偏態(tài)系數(shù)=0為對稱分布q偏態(tài)系數(shù) 0為右偏分布q偏態(tài)系數(shù) 0為左偏分布偏態(tài)系數(shù) 某電腦公司銷售量偏態(tài)及峰度計算表某電腦公司銷售量偏態(tài)及峰度計算表 按銷售量份組按銷售量份組(臺臺) 組中值組中值(Mi)頻數(shù)頻數(shù) fi140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235491627201710845-256000-243000-128000-2700001700080000216000256000625000102400

13、00729000025600002700000170000160000064800001024000031250000合計合計120540000 70100000 iifxM3iifxM4偏態(tài)系數(shù)448. 0)58.21(120540000)58.21(120)185()(331013313iiikiiifMnsfxMSK峰態(tài)系數(shù) (kurtosis coefficient)根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算4224) 3)(2)(1() 1()(3)() 1(snnnnxxxxnnKii3)(414nsfxMKkiii峰態(tài)數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)0為尖峰分布峰態(tài)系數(shù)306. 03694. 23)58.21(120701000003)(4414nsfxMKkiii偏態(tài)與峰態(tài)(從直方圖上觀察)結結 束束本章回顧數(shù)據(jù)特征的測度數(shù)據(jù)特征的測度分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論