第3章-數(shù)據(jù)的概括性度量_第1頁
第3章-數(shù)據(jù)的概括性度量_第2頁
第3章-數(shù)據(jù)的概括性度量_第3頁
第3章-數(shù)據(jù)的概括性度量_第4頁
第3章-數(shù)據(jù)的概括性度量_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析

(方法與案例)

作者賈俊平版權(quán)所有違者必究統(tǒng)計(jì)學(xué)基礎(chǔ)(第6版)FundamentalStatistics第3章數(shù)據(jù)的概括性度量3.1

集中趨勢的度量3.2離散程度的度量3.3偏度與峰度的度量3.4Excel【數(shù)據(jù)分析】工具的應(yīng)用Statistic學(xué)習(xí)目標(biāo)度量集中趨勢的統(tǒng)計(jì)量度量離散程度的統(tǒng)計(jì)量度量偏度與峰度的統(tǒng)計(jì)量各統(tǒng)計(jì)量的的特點(diǎn)及應(yīng)用場合用Excel計(jì)算描述統(tǒng)計(jì)量3.1集中趨勢的度量

3.1.1平均數(shù)

3.1.2分位數(shù)3.1.3眾數(shù)

3.1.4各度量值的比較第3章數(shù)據(jù)的概括性度量集中趨勢

(centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)3.1.1平均數(shù)3.1集中趨勢的度量

x

x平均數(shù)

(mean)也稱為均值,常用的統(tǒng)計(jì)量之一消除了觀測值的隨機(jī)波動(dòng)易受極端值的影響根據(jù)總體數(shù)據(jù)計(jì)算的,稱為平均數(shù),記為

;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本平均數(shù),記為

x簡單算數(shù)平均

(Simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn(總體數(shù)據(jù)xN)樣本平均數(shù)總體平均數(shù)簡單平均數(shù)

(例題分析)【例3—1】在某年級中隨機(jī)抽取30名學(xué)生,得到每名學(xué)生的統(tǒng)計(jì)學(xué)考試分?jǐn)?shù)如表3—1所示(單位:分)。計(jì)算30名學(xué)生考試分?jǐn)?shù)的平均數(shù)567065859674669266687560997180877886897777886999918673657280簡單平均數(shù)

(例題分析)【例3—1】用Excel的【AVERAGE】函數(shù)計(jì)算樣本平均數(shù)

加權(quán)平均數(shù)

(Weightedmean)設(shè)各組的組中值為:M1,M2,…,Mk

相應(yīng)的頻數(shù)為:

f1,f2,…,fk樣本加權(quán)平均:總體加權(quán)平均:加權(quán)平均數(shù)

(例題分析)【例3—2】沿用例3—1。假定將30名學(xué)生的統(tǒng)計(jì)學(xué)考試分?jǐn)?shù)分組后如表3—2所示。計(jì)算考試分?jǐn)?shù)的平均數(shù)考試分?jǐn)?shù)分組人數(shù)60以下160—70770—80980—90890—1005合計(jì)30加權(quán)平均數(shù)

(例題分析)【例3—2】加權(quán)平均數(shù)計(jì)算表考試分?jǐn)?shù)分組60以下5515560—7065745570—8076968480—9085868090—100955475合計(jì)—302349

3.1.2分位數(shù)3.1集中趨勢的度量中位數(shù)

(median)排序后處于中間位置上的值。不受極端值影響Me50%50%2.

位置確定3.

數(shù)值確定中位數(shù)的計(jì)算

(數(shù)據(jù)個(gè)數(shù)為奇數(shù))【例3—3】沿用例3—1。計(jì)算30個(gè)學(xué)生統(tǒng)計(jì)學(xué)考試分?jǐn)?shù)的中位數(shù)566065656666686970717273747577777880808586868788899192969999

中位數(shù)

(例題分析)【例3—3】用Excel的【MEDIAN】函數(shù)計(jì)算中位數(shù)

四分位數(shù)—用3個(gè)點(diǎn)等分?jǐn)?shù)據(jù)

(quartile)排序后處于25%和75%位置上的值不受極端值的影響QLQMQU25%25%25%25%四分位數(shù)的計(jì)算

(位置的確定)Excel給出的四分位數(shù)位置的確定方法

如果位置不是整數(shù),則按比例分?jǐn)偽恢脙蓚?cè)數(shù)值的差值四分位數(shù)的計(jì)算

(例題分析)

四分位數(shù)的計(jì)算

(例題分析)

2020-8-20百分位數(shù)

(percentile)

百分位數(shù)的計(jì)算

(例題分析)

2020-8-20用【PERCENTILE.INC】函數(shù)計(jì)算百分位數(shù)

(例題分析)

眾數(shù)

(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)mo2020-8-20用【MODE.SNGL】函數(shù)計(jì)算眾數(shù)

(例題分析)

3.1.4各度量值的比較3.1集中趨勢的度量眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用平均數(shù)易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良,實(shí)際中最常用數(shù)據(jù)對稱分布或接近對稱分布時(shí)代表性較好中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)代表性接好眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)代表性較好3.2離散程度的度量

3.2.1極差和四分位差

3.2.2平均差

3.2.3方差和標(biāo)準(zhǔn)差

3.2.4離散系數(shù)3.2.5標(biāo)準(zhǔn)分?jǐn)?shù)第3章數(shù)據(jù)的概括性度量3.2.1極差和四分位差3.2離散程度的度量極差

(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布計(jì)算公式為:R=max(xi)-min(xi)四分位差

(quartiledeviation)

25%75%3.2.2平均差3.2離散程度的度量平均差

(meandeviation)各變量值與其平均數(shù)離差絕對值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學(xué)性質(zhì)較差,實(shí)際中應(yīng)用較少計(jì)算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差

(例題分析)

平均差

(例題分析)【例3—8】沿用例3—2。根據(jù)表3—2的數(shù)據(jù),計(jì)算將30名學(xué)生的考試分?jǐn)?shù)的平均差考試分?jǐn)?shù)分組60以下55123.323.360—7065713.393.170—807692.320.780—908586.753.690—10095516.783.5合計(jì)—30—274.2

3.2.3方差和標(biāo)準(zhǔn)差3.2離散程度的度量方差和標(biāo)準(zhǔn)差

(varianceandstandarddeviation)數(shù)據(jù)離散程度的最常用測度值反映各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差(標(biāo)準(zhǔn)差),記為

2();根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差(標(biāo)準(zhǔn)差),記為s2(s)樣本方差和標(biāo)準(zhǔn)差

(samplevarianceandstandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式總體方差和標(biāo)準(zhǔn)差

(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本標(biāo)準(zhǔn)差

(例題分析)【例3—9】沿用例3—1。計(jì)算30個(gè)學(xué)生考試分?jǐn)?shù)的方差和標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差

樣本標(biāo)準(zhǔn)差

(Excel應(yīng)用)

樣本標(biāo)準(zhǔn)差

(例題分析)【例3—10】沿用例3—2。根據(jù)表3—2的數(shù)據(jù),計(jì)算將30名學(xué)生的考試分?jǐn)?shù)的方差和標(biāo)準(zhǔn)差考試分?jǐn)?shù)分組60以下551542.89542.8960—70657176.891238.2370—807695.2947.6180—9085844.89359.1290—100955278.891394.45合計(jì)—30—3582.3樣本標(biāo)準(zhǔn)差

(例題分析)【例3—10】沿用例3—2。根據(jù)表3—2的數(shù)據(jù),計(jì)算將30名學(xué)生的考試分?jǐn)?shù)的方差和標(biāo)準(zhǔn)差

3.2.4離散系數(shù)3.2離散程度的度量離散系數(shù)

(coefficientofvariation)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為離散系數(shù)

(例題分析)【例3—11】在奧運(yùn)會女子10米氣手槍比賽數(shù)據(jù)。評價(jià)哪名運(yùn)動(dòng)員的發(fā)揮更穩(wěn)定

納塔利婭·帕杰林娜郭文珺卓格巴德拉赫·蒙赫珠勒妮諾·薩盧克瓦澤維多利亞·柴卡萊萬多夫斯卡·薩貢亞斯娜·舍卡里奇米拉·內(nèi)萬蘇10.010.09.39.89.38.110.28.78.510.510.010.39.410.39.69.310.010.48.710.010.49.29.99.210.210.48.39.510.19.99.910.310.610.19.210.210.29.89.39.810.510.39.510.710.510.49.110.09.89.48.510.49.29.99.79.79.710.710.710.610.59.410.09.99.510.89.29.19.810.79.39.99.39.79.210.88.69.69.99.7離散系數(shù)

(例題分析)【例3—11】在奧運(yùn)會女子10米氣手槍比賽數(shù)據(jù)。評價(jià)哪名運(yùn)動(dòng)員的發(fā)揮更穩(wěn)定

運(yùn)動(dòng)員納塔利婭·帕杰林娜郭文珺卓格巴德拉赫·蒙赫珠勒妮諾·薩盧克瓦澤維多利亞·柴卡萊萬多夫斯卡·薩貢亞斯娜·舍卡里奇米拉·內(nèi)萬蘇平均數(shù)9.8110.239.2610.149.809.739.699.65標(biāo)準(zhǔn)差0.61540.43730.70740.54610.64980.73340.35730.4625離散系數(shù)0.06270.04270.07640.05390.06630.07540.03690.04793.2.5標(biāo)準(zhǔn)分?jǐn)?shù)3.2離散程度的度量標(biāo)準(zhǔn)分?jǐn)?shù)

(standardscore)1.也稱標(biāo)準(zhǔn)化值2. 對某一個(gè)值在一組數(shù)據(jù)中相對位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)(outlier)用于對變量的標(biāo)準(zhǔn)化處理均值等于0,方差等于1計(jì)算公式為標(biāo)準(zhǔn)分?jǐn)?shù)

(用于數(shù)據(jù)變換)z分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線性變換,它并沒有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒有改變該組數(shù)分布的形狀,而只是使該組數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1

標(biāo)準(zhǔn)分?jǐn)?shù)

(例題分析)【例3—12】沿用例3—1。計(jì)算30個(gè)學(xué)生考試分?jǐn)?shù)的標(biāo)準(zhǔn)分?jǐn)?shù)

標(biāo)準(zhǔn)分?jǐn)?shù)

(例題分析)【例3—12】沿用例3—1。計(jì)算30個(gè)學(xué)生考試分?jǐn)?shù)的標(biāo)準(zhǔn)分?jǐn)?shù)學(xué)生編號考試分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)學(xué)生編號考試分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)學(xué)生編號考試分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)156-1.90311165-1.124621961.5571266-1.03811266-1.03812275-0.25953991.816613800.173023780.00004890.95161477-0.08652469-0.77855911.12461573-0.43252572-0.5190670-0.692016850.60552674-0.34607921.21111768-0.86512760-1.5571871-0.605518870.778528860.6920977-0.086519880.865129991.816610860.69202065-1.124630800.1730經(jīng)驗(yàn)法則

經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對稱分布時(shí)約有68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)經(jīng)驗(yàn)法則

(例題分析)切比雪夫不等式

(Chebyshev’sinequality)如果一組數(shù)據(jù)不是對稱分布,經(jīng)驗(yàn)法則就不再適用,這時(shí)可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有1-1/k2的數(shù)據(jù)落在平均數(shù)加減k個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中k是大于1的任意值,但不一定是整數(shù)切比雪夫不等式

(Chebyshev’sinequality)

對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有89%的數(shù)據(jù)落在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)至少有94%的數(shù)據(jù)落在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)3.3偏度與峰度的度量

3.3.1偏度系數(shù)

3.3.2峰度系數(shù)第3章數(shù)據(jù)的概括性度量3.3.1偏度系數(shù)3.3偏度與峰度的度量偏度

(skewness)統(tǒng)計(jì)學(xué)家K.Pearson于1895年首次提出。是指數(shù)據(jù)分布的不對稱性測度統(tǒng)計(jì)量是偏度系數(shù)(coefficientofskewness)2. 偏度系數(shù)=0為對稱分布;>0為右偏分布;<0為左偏分布偏度系數(shù)大于1或小于-1,為高度偏度分布;偏度系數(shù)在0.5~1或-1~-0.5之間,為是中等偏度分布;偏度系數(shù)越接近0,偏斜程度就越低偏度系數(shù)

(coefficientofskewness)根據(jù)原始數(shù)據(jù)計(jì)算根據(jù)分組數(shù)據(jù)計(jì)算3.3.2峰度系數(shù)3.3偏度與峰度的度量峰度

(kurt

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論