第3章數(shù)據(jù)特征描述_第1頁(yè)
第3章數(shù)據(jù)特征描述_第2頁(yè)
第3章數(shù)據(jù)特征描述_第3頁(yè)
第3章數(shù)據(jù)特征描述_第4頁(yè)
第3章數(shù)據(jù)特征描述_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530第4章數(shù)據(jù)的概括性度量數(shù)據(jù)特征的測(cè)度分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)眾數(shù)不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計(jì)501100眾數(shù)(Mo)特點(diǎn)不唯一性無眾數(shù)一個(gè)眾數(shù)數(shù)個(gè)眾數(shù)不受極端值的影響適用于所有數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值數(shù)據(jù)中位數(shù)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:66075078085096010801250150016302000位置:12345678910中位數(shù)(Me)特點(diǎn)不受極端值的影響不能用于分類數(shù)據(jù)同樣道理:四分位數(shù)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:66075078085096010801250150016302000位置:12345678910QLQMQU25%25%25%25%均值設(shè)一組數(shù)據(jù)為:x1,x2,…,xn各組的組中值為:M1,M2,…,Mk相應(yīng)的頻數(shù)為:f1,f2,…,fk1.簡(jiǎn)單均值缺點(diǎn):容易受極端值影響已改至此!!某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(Mi)頻數(shù)(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計(jì)—120222002.加權(quán)均值3.幾何平均數(shù)【例】一位投資者購(gòu)持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計(jì)算該投資者在這四年內(nèi)的平均收益率算術(shù)平均:

幾何平均(增長(zhǎng)率計(jì)算):眾數(shù)、中位數(shù)和均值的關(guān)系左偏分布均值

中位數(shù)

眾數(shù)對(duì)稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值數(shù)據(jù)箱線圖最小值141最大值237中位數(shù)182下四分位數(shù)170.5上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的箱線圖數(shù)據(jù)特征的測(cè)度分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)離散程度(離中趨勢(shì))離散程度反映各變量值遠(yuǎn)離其中心值的程度反映集中趨勢(shì)的代表程度1.異眾比率非眾數(shù)組的頻數(shù)占總頻數(shù)的比率用于衡量眾數(shù)的代表性異眾比率不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計(jì)5011002.四分位差極差一組數(shù)據(jù)的最大值與最小值之差四分位差上四分位數(shù)與下四分位數(shù)之差

QD

=QU–QL離散度:中間50%數(shù)據(jù)四分位差解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知

QL=不滿意=2

QU=

一般=

3四分位差:

QD=QU=

QL

=3–2

=1順序數(shù)據(jù)問題甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計(jì)300—3.方差未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差全面準(zhǔn)確反映離散狀況數(shù)學(xué)性質(zhì)較差平均差某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—2040平均差含義:每一天的銷售量平均數(shù)相比,平均相差17臺(tái)改進(jìn):方差和標(biāo)準(zhǔn)差數(shù)據(jù)離散程度的最常用測(cè)度值總體方差或標(biāo)準(zhǔn)差;樣本方差或標(biāo)準(zhǔn)差總體方差和標(biāo)準(zhǔn)差未分組數(shù)據(jù)組距分組數(shù)據(jù)樣本方差和標(biāo)準(zhǔn)差未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本標(biāo)準(zhǔn)差某電腦公司銷售量數(shù)據(jù)平均差計(jì)算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計(jì)—120—55400樣本標(biāo)準(zhǔn)差

相對(duì)位置的度量:標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算公式為

也稱標(biāo)準(zhǔn)化值均值0標(biāo)準(zhǔn)差1用于對(duì)變量的標(biāo)準(zhǔn)化處理標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)只是線性變換,并沒有改變:一個(gè)數(shù)據(jù)在改組數(shù)據(jù)中的位置也沒有改變?cè)摻M數(shù)分布的形狀只將數(shù)據(jù)變?yōu)椋ɡ?,一組數(shù)據(jù)標(biāo)準(zhǔn)差6,均值34)均值為0,標(biāo)準(zhǔn)差為1。

經(jīng)驗(yàn)法則經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)切比雪夫不等式一對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有(1-1/k2)個(gè)數(shù)據(jù)落在k個(gè)標(biāo)準(zhǔn)差之內(nèi)。對(duì)于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)4.離散系數(shù):相對(duì)離散程度標(biāo)準(zhǔn)差與其相應(yīng)的均值之比消除了數(shù)據(jù)水平高低和計(jì)量單位的影響用于對(duì)不同組別數(shù)據(jù)離散程度的比較計(jì)算公式為離散系數(shù)某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號(hào)產(chǎn)品銷售額(萬元)x1銷售利潤(rùn)(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度離散系數(shù)結(jié)論:計(jì)算結(jié)果表明,v1<v2,說明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710數(shù)據(jù)特征的測(cè)度分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!偏態(tài)系數(shù)

(skewnesscoefficient)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算偏態(tài)數(shù)據(jù)分布偏斜程度的測(cè)度偏態(tài)系數(shù)=0為對(duì)稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)

某電腦公司銷售量偏態(tài)及峰度計(jì)算表按銷售量份組(臺(tái))組中值(Mi)頻數(shù)

fi140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計(jì)—120540000

70100000

偏態(tài)系數(shù)結(jié)論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)峰態(tài)系數(shù)

(kurtosiscoefficient)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算峰態(tài)數(shù)據(jù)分布扁平程度的測(cè)度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布峰態(tài)系數(shù)結(jié)論:偏態(tài)系數(shù)為負(fù)值,但與0的差異不大,說明電腦銷售量為輕微扁平分布偏態(tài)與峰態(tài)

(從直方圖上觀察)結(jié)論:1.為右偏分布2.峰態(tài)適中140150210某電腦公司銷售量分布的直方圖190200180160170頻數(shù)(天)25201510530220230240結(jié)束本章回顧數(shù)據(jù)特征的測(cè)度分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰態(tài)四分位差異眾比率偏態(tài)樣本方差和標(biāo)準(zhǔn)差未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式眾數(shù)、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論