統(tǒng)計學(xué)課件-第2章-集中趨勢與離散趨勢_第1頁
統(tǒng)計學(xué)課件-第2章-集中趨勢與離散趨勢_第2頁
統(tǒng)計學(xué)課件-第2章-集中趨勢與離散趨勢_第3頁
統(tǒng)計學(xué)課件-第2章-集中趨勢與離散趨勢_第4頁
統(tǒng)計學(xué)課件-第2章-集中趨勢與離散趨勢_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二節(jié)集中趨勢測量法

集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值。

一、平均值(Mean)

平均值就是一組數(shù)據(jù)的平均值(averagevalue),用來測度中心位置(centrallocation)。

1.簡單算術(shù)平均數(shù)對樣本:其中n為樣本數(shù)對總體:其中N為總體單位數(shù)

例1.(美國)一個關(guān)于大學(xué)生畢業(yè)后工作起薪的問卷調(diào)查數(shù)據(jù)Table1,MonthlyStartingSalariesforaSampleof12CollegeGraduates

GraduatesMonthlyGraduatesMonthlyGraduatesMonthlySalary($)Salary($)Salary($)123505225592440224506221010285232550723901124284238082630122380

加權(quán)算術(shù)平均往往適用于對分組后的數(shù)據(jù)求均值,這時Xi為各組變量代表值(往往取組中值),F(xiàn)i

為各組變量值出現(xiàn)的頻數(shù)。組中值=(上限+下限)/22.加權(quán)算術(shù)平均數(shù)其中Fi為權(quán)數(shù)

例2.某班級英語考試成績分組情況見下表:成績分組人數(shù)累計人數(shù)成績分組人數(shù)累計人數(shù)(分)(分)

50以下2270~80183550~605780~9094460~70101790以上650

▲注意:

均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,從而使均值代表某組統(tǒng)計數(shù)據(jù)的“平均水平”時失去意義,這時往往用“剔除極端值”的方法加以修正。

如例1中,如果將月薪2825的最高值用10000代替,則均值為3038

算術(shù)平均數(shù)具有如下性質(zhì):(1)各變量值與其算術(shù)平均數(shù)的離差和為零:(2)各變量值與其算術(shù)平均數(shù)的離差平方和最?。憾?、中位數(shù)(Median)

中位數(shù)是一組數(shù)據(jù)按大小排序后,處于中間位置上的變量值。

1.對于未分組數(shù)據(jù):(1)如果數(shù)據(jù)個數(shù)為奇數(shù),則中位數(shù)恰為處于中間位置的數(shù):(2)如果數(shù)據(jù)個數(shù)為偶數(shù),則為中間位置兩個數(shù)的平均數(shù)

美國大學(xué)畢業(yè)生起薪例中:按升序排出的12個統(tǒng)計數(shù)為:

221022552350238023802390

242024402450255026302825則中位數(shù)為

由于均值容易受到統(tǒng)計數(shù)據(jù)中個別極端數(shù)據(jù)的影響,從而使均值代表某組統(tǒng)計數(shù)據(jù)的“平均水平”時失去意義,這時用中位數(shù)代替均值則更有意義。如,在大學(xué)生畢業(yè)工作起薪的例中,如果原統(tǒng)計數(shù)中最高薪金由2825換為10000,則得到平均薪金為3038的結(jié)論,顯然與其他11位均在2000多的薪水水平不符,但這時若用中位數(shù)2405,顯然更具代表意義。▲注意:

首先需確定中位數(shù)所在的組,然后可根據(jù)下列公式計算中位數(shù):

下限公式:

2.對于分組后的數(shù)據(jù):式中:m為中位數(shù)所在的組,d為該組組距,

L、U分別為該組的下限值與上限值,

fm為該組的頻數(shù),

Sm-1

為該組以下各組的頻數(shù)總和,

Sm+1為該組以上各組的頻數(shù)總和,顯然上限公式:

例4.某班級英語考試成績分組情況見下表:成績分組人數(shù)累計人數(shù)成績分組人數(shù)累計人數(shù)(分)(分)

50以下2270~80183550~605780~9094460~70101790以上650

從成績由低往高排,中位數(shù)所在組應(yīng)在第4組,即70~80的組,由于L=70,U=80,d=10,而

Sm-1=2+5+10=17,

Sm+1=9+6=15,fm=18,故或

眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。在大學(xué)畢業(yè)生工作起薪的例中,眾數(shù)為2380。

在分組數(shù)據(jù)中,眾數(shù)可按下式計算:

下限公式:

三、眾數(shù)(Mode)式中:fm為某數(shù)值出現(xiàn)次數(shù)(頻數(shù))最多的組(第m組)的頻數(shù),

fm-1與fm+1分別為第m-1組與m+1組的頻數(shù),

L、U分別為第m組的下限與上限值,

d為該組組距。上限公式:在學(xué)生英語考試成績例中,次數(shù)最多的組也在70~80組中,則有

fm=18,fm-1=10,fm+1=9,或

例如在前面購買五類不同品牌計算機(jī)的統(tǒng)計中,曾得到如右表所示的頻數(shù)分布表。▲注意:

1.如果某組統(tǒng)計數(shù)據(jù)中沒有哪個數(shù)值出現(xiàn)較多的頻率(次數(shù)),則可認(rèn)為該組數(shù)無眾數(shù);如果有多個數(shù)據(jù)出現(xiàn)的次數(shù)(頻率)較多,則認(rèn)為有多個眾數(shù)。在有多個眾數(shù)的情況下,則對眾數(shù)的關(guān)注度下降,因為多眾數(shù)對描述數(shù)據(jù)位置無多大幫助。

2.對描述品質(zhì)數(shù)據(jù)的分布特征的“位置”測度只能用眾數(shù)。CompanyFrequencyApple13Compaq12Gateway20005IBM9PackardBell11顯然,眾數(shù),即個人購買最多的機(jī)算機(jī)品牌是Apple。在這類數(shù)據(jù)中,“均值”與“中位數(shù)”是沒有任何意義的?!氨姅?shù)”提供了頻數(shù)最高的個人電腦購買品牌。

1.如果數(shù)據(jù)具有單一眾數(shù),且分布是對稱的,則眾數(shù)Mo、中位數(shù)Me

與均值相等,即;四、中位數(shù)、眾數(shù)與算術(shù)平均數(shù)的關(guān)系

3.在偏斜度適度的情況下,不論是左偏還是右偏,中位數(shù)與算術(shù)平均數(shù)之差約等于眾數(shù)與算術(shù)平均數(shù)之差的1/3,即有如下經(jīng)驗公式:當(dāng)分布右偏時(說明存在極端大的值)

2.對于非對稱分布,當(dāng)分布左偏時(說明存在極端小的值)

眾數(shù)、中位數(shù)和均值都是對數(shù)據(jù)集中趨勢的測度,

1.均值由全部數(shù)據(jù)計算,包含了全部數(shù)據(jù)的信息,具有良好的數(shù)學(xué)性質(zhì),當(dāng)數(shù)據(jù)接近對稱分布時,具有較好的代表性;但對于偏態(tài)分布,其代表性較差。

2.中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響,對于偏態(tài)分布的數(shù)據(jù),其代表性要比均值好。

3.眾數(shù)是一組數(shù)據(jù)分布的峰值,是一種位置的代表,當(dāng)數(shù)據(jù)的分布具有明顯的集中趨勢時,尤其對于偏態(tài)分布,眾數(shù)的代表性比均值好。

4.對接近正態(tài)的分布數(shù)據(jù),常用均值描述數(shù)據(jù)的集中趨勢;對偏態(tài)分布,常用眾數(shù)或中位數(shù)描述數(shù)據(jù)的集中趨勢。

5.均值只適用于定距或定比尺度的數(shù)據(jù);定序尺度數(shù)據(jù)可用中位數(shù)或眾數(shù)進(jìn)行描述,而對定類尺度數(shù)據(jù),只能用眾數(shù)進(jìn)行描述。

眾數(shù)、中位數(shù)和均值的應(yīng)用場合變量類型與集中趨勢測度值變量類型和所適用的集中趨勢測度值變量類型定類變量定序變量定距變量定比變量適用的測度值眾數(shù)中位數(shù)均值均值—眾數(shù)眾數(shù)眾數(shù)——中位數(shù)中位數(shù)分布的形狀與

眾數(shù)、中位數(shù)和均值的關(guān)系對稱分布

均值=中位數(shù)=眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值高層次變量可以用低層次變量的測量方法但統(tǒng)計分析中,更多的是用均值。對于偏態(tài)的分布,應(yīng)使用中位值作為集中趨勢。只有單峰和基本對稱的圖形,用均值作為集中趨勢才是合理的。第三節(jié)離散趨勢測量法

對數(shù)據(jù)分布特征的另一個測度指標(biāo)是數(shù)據(jù)分布離散程度。它反映各數(shù)據(jù)遠(yuǎn)離其中心值的程度,因此,也稱離中趨勢。

集中趨勢反映的是各變量值向其中心值聚集的程度,

離中趨勢反映各變量值之間的差異狀況。

注意:

集中趨勢的測度值概括地反映了數(shù)據(jù)的一般水平,它對該組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水平。數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差。例:如果你是一家制造業(yè)公司的供應(yīng)部門經(jīng)理,與兩家原材料供應(yīng)商聯(lián)系供貨,兩家供應(yīng)商均表示能在大約10個工作日內(nèi)供齊所需原材料。幾個月的運轉(zhuǎn)之后,你發(fā)現(xiàn)盡管兩家供貨商供貨的平均時間都是大約10天,但他們供貨所需天數(shù)的分布情況卻是不同的(圖)。問:兩家供貨商按時供貨的可信度相同嗎?考慮它們直方圖的差異,你更愿意選擇哪家供貨商供貨呢?A商店16001800175019001850平均工資1780B商店14501500150016502800平均工資1780

極差是最簡單的測度離中趨勢(分散程度)的指標(biāo),也稱全距,是一組數(shù)據(jù)最大值與最小值之差:

R=最大值–最小值

對于組距分組數(shù)據(jù),極差可近似地表示為:

R=最高組上限-最低組下限

▲注意:

1.極差易受極端值的影響;

2.由于極差只利用了數(shù)據(jù)兩端的信息,沒有反映中間數(shù)據(jù)的分散狀況,因而不能準(zhǔn)確描述數(shù)據(jù)的分散程度。一、極差(Range)

方差是各變量值與其均值離差(deviationaboutthemean)平方的平均數(shù)。

(一)總體方差(PopulationVariance)

總體方差用

2表示

二、方差(Variance)其中:Fi為第i組數(shù)據(jù)的頻數(shù)

Xi為第i個數(shù)(未分組)或第i

組組中值(分組)

(二)樣本方差(SampleVariance)

樣本方差用S2表示其中:fi為第i組數(shù)據(jù)的頻數(shù)

xi為第i個數(shù)(未分組)或第i

組組中值(分組)A商店平均工資1780極差300方差10600標(biāo)準(zhǔn)差102.96B商店平均工資1780極差1350方差264600標(biāo)準(zhǔn)差514.39例:在上述5個班級平均人數(shù)的例中,若視5個班為樣本,則若視5個班為總體,則對于分組后的數(shù)據(jù)若視為總體:若視為樣本:

標(biāo)準(zhǔn)差:方差的平方根(正)

在五個班級規(guī)模的例中:若視5個班為總體,則標(biāo)準(zhǔn)差為7.15,若視5個班為樣本,則標(biāo)準(zhǔn)差為8。

總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差:三、標(biāo)準(zhǔn)差(StandardDeviation)均值▲注意:

1.由于方差計算中使用了平方運算,因此方差的單位也是平方,如上述班級規(guī)模例中方差為64(學(xué)生)2,其具體意義不明確。因此方差只有在比較不同組數(shù)據(jù)的離散程度時才有數(shù)量大小上的意義。

2.標(biāo)準(zhǔn)差是對方差的開方運算,因此,其單位與原始數(shù)據(jù)的單位一致,它與均值及其他用同一單位測度的數(shù)據(jù)相比較也容易一些。(標(biāo)準(zhǔn)差就是指數(shù)據(jù)“離散程度的測度值”距“均值”的距離)。重復(fù)3次測量一種物體的長度,得到數(shù)據(jù)如下:單位:m1.1,1.2,1.3;

平均長度1.2,標(biāo)準(zhǔn)差0.08165單位:cm110,120,130;

平均長度120,標(biāo)準(zhǔn)差8.165

離散系數(shù):一組數(shù)據(jù)標(biāo)準(zhǔn)差與其均值的比,也稱為標(biāo)準(zhǔn)差系數(shù),是測度數(shù)據(jù)離散程度的相對指標(biāo):

例:前例中,以m為單位,離散系數(shù)為:0.08165/1.2=0.068,以cm為單位,離散系數(shù)為:8.165/120=0.068

四、離散系數(shù)(CoefficientofVariation)▲注意:

1.對不同組數(shù)據(jù),其離散程度既受其數(shù)據(jù)本身的水平的影響,也受數(shù)據(jù)計量單位的影響,因此對不同(性質(zhì))組別的數(shù)據(jù),不好用離差或標(biāo)準(zhǔn)差來比較它們的離散程度;

2.由于離散系數(shù)消除了來自這兩方面的影響,因此可以用它進(jìn)行不同數(shù)據(jù)組的比較。例5:某管理局抽查了其所屬的8家企業(yè),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論