第4章 統(tǒng)計數(shù)據(jù)分布特征的測定_第1頁
第4章 統(tǒng)計數(shù)據(jù)分布特征的測定_第2頁
第4章 統(tǒng)計數(shù)據(jù)分布特征的測定_第3頁
第4章 統(tǒng)計數(shù)據(jù)分布特征的測定_第4頁
第4章 統(tǒng)計數(shù)據(jù)分布特征的測定_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四章統(tǒng)計數(shù)據(jù)分布特征的測定統(tǒng)計數(shù)據(jù)總體分布特征測定包括:1、數(shù)據(jù)分布集中趨勢的測定2、數(shù)據(jù)分布離散程度的測定3、數(shù)據(jù)分布偏度與峰度的測定§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定集中趨勢(centraltendency)是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點的位置所在。數(shù)據(jù)分布集中趨勢的測定就是尋找數(shù)據(jù)水平的代表值或中心值,在統(tǒng)計學(xué)中,這種有代表性的數(shù)值又通俗的被稱為平均數(shù)?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定本節(jié)將針對不同類型的變量,介紹兩種類型的平均數(shù),分別是數(shù)值平均數(shù)和位置平均數(shù),包括算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)及眾數(shù)、中位數(shù)、四分位數(shù)等六個指標(biāo)。這兩類平均數(shù)的涵義不同、計算方法不同、應(yīng)用場合也不同?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.1算術(shù)平均數(shù)

§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.1算術(shù)平均數(shù)1、簡單算術(shù)平均數(shù)

----根據(jù)未經(jīng)分組整理的數(shù)據(jù)計算的平均數(shù)§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.1算術(shù)平均數(shù)2、加權(quán)算術(shù)平均數(shù)

----根據(jù)經(jīng)過分組整理后的數(shù)據(jù)計算的平均數(shù),要以各組變量值的次數(shù)(頻數(shù)或頻率)為權(quán)數(shù),進(jìn)行加權(quán)計算

§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定上述公式更清晰地表達(dá)了加權(quán)算術(shù)平均數(shù)受各組變量值與各組權(quán)數(shù)比重大小的影響§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.1算術(shù)平均數(shù)3、算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)(1)總體單位數(shù)與其算術(shù)平均數(shù)的乘積等于總體標(biāo)志總量(2)各變量值與其算術(shù)平均數(shù)的離差之和等于零(3)各變量值與其算術(shù)平均數(shù)的離差平方和為最小§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.1算術(shù)平均數(shù)4、算術(shù)平均數(shù)的特點及應(yīng)用算術(shù)平均數(shù)是根據(jù)所有變量值綜合計算出來的,屬于數(shù)值平均數(shù)有時為了提高算術(shù)平均數(shù)的代表性,通常先從數(shù)據(jù)中刪除極大值和極小值,根據(jù)剩余的數(shù)據(jù)計算算術(shù)平均數(shù),這樣得到的平均數(shù)叫切尾平均數(shù),又稱為截尾平均數(shù)§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.2調(diào)和平均數(shù)調(diào)和平均數(shù)(harmonicamean)是算術(shù)平均數(shù)的另一種形式,是一組數(shù)據(jù)中各個變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),因而又稱為倒數(shù)平均數(shù)?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.2調(diào)和平均數(shù)1、簡單調(diào)和平均數(shù)2、加權(quán)調(diào)和平均數(shù)

§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.2調(diào)和平均數(shù)3、由相對數(shù)或平均數(shù)求平均數(shù)對相對數(shù)或平均數(shù)求平均數(shù)時,應(yīng)注意以下幾點:第一,明確相對數(shù)或平均數(shù)的分子,分母指標(biāo)是什么,即相對數(shù)或平均數(shù)由哪兩個指標(biāo)對比形成的;第二,已知相對數(shù)或平均數(shù)的分子、分母指標(biāo)時,用分子指標(biāo)總數(shù)除以分母指標(biāo)的總即為相對數(shù)或平均數(shù)的平均數(shù);第三,已知相對數(shù)或平均數(shù)的分子指標(biāo)時,以分子指標(biāo)為權(quán)數(shù),采用加權(quán)調(diào)和平均法計算其平均數(shù);已知相對數(shù)或平均數(shù)的分母指標(biāo)時,以分母指標(biāo)為權(quán)數(shù),采用加權(quán)算術(shù)平均法計算其平均數(shù);第四,加權(quán)平均所采用的權(quán)數(shù)必須是相對數(shù)或平均數(shù)本身的分子或分母指標(biāo)?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.3幾何平均數(shù)幾何平均數(shù)(Geometricalmean)是一組數(shù)據(jù)中個變量值連乘積的次方根。幾何平均數(shù)是一種具有特殊用途的平均指標(biāo)。1、簡單幾何平均數(shù)§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.3幾何平均數(shù)2、加權(quán)幾何平均數(shù)§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.4.眾數(shù)眾數(shù)(mode)是數(shù)列中次數(shù)最多的那個變量值,用Mo表示。眾數(shù)不僅用于反映數(shù)值型變量的集中趨勢,還可用于反映定性變量的集中趨勢。(1)單項式數(shù)列或品質(zhì)數(shù)列確定眾數(shù)時,只需找出次數(shù)最多的變量值即為眾數(shù)值?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.4.眾數(shù)(2)組距式數(shù)列確定眾數(shù)時,眾數(shù)的數(shù)值與其相鄰組的次數(shù)分布有一定的關(guān)系,這種關(guān)系如下圖(a)fmfm+1Moxffm-1fmfm+1Moxf(b)fm-1fmfm+1Moxf(c)fm-1§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.4.眾數(shù)上限公式:

上限公式:§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.4.眾數(shù)2、眾數(shù)的特點從眾數(shù)的計算公式可以看出,眾數(shù)是根據(jù)眾數(shù)組及相鄰組的次數(shù)分布來確定數(shù)據(jù)中心點仿置的,因此,眾數(shù)是一個位置代表值,它不受數(shù)據(jù)中極端值的影響。從變量值次數(shù)分布的角度看,眾數(shù)是具有明顯集中趨勢點的數(shù)值,它是一組數(shù)據(jù)分布的最高峰點所對應(yīng)的數(shù)值。如果數(shù)據(jù)分布沒有明顯集中趨勢,則眾數(shù)不存在;如果數(shù)據(jù)較多,數(shù)據(jù)分布呈現(xiàn)出兩個高峰點,則就有兩個眾數(shù)。§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.5中位數(shù)中位數(shù)(Median)是把一組數(shù)據(jù)排序后,處于中間位置上的那個變量值,用Me表示。中位數(shù)適合于數(shù)值型變量和順序變量集中趨勢的確定,但不適用于分類變量?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.5中位數(shù)1、中位數(shù)的確定(1)未分組資料未分組的數(shù)據(jù)確定中位數(shù)時,先要對數(shù)據(jù)按大小順序加以排列;再確定中位數(shù)所處位置;然后再根據(jù)中位數(shù)位置確定中位數(shù)數(shù)值。§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.5中位數(shù)(2)已分組資料分組數(shù)據(jù)確定中位數(shù)時,分以下幾個步驟進(jìn)行:第一,確定中位數(shù)位置;第二,根據(jù)向上累計次數(shù)判斷中位數(shù)所在組;向上累計次數(shù)是將變量值從小到大排序后,各組次數(shù)依次遞加的累計第三,由公式確定中位數(shù)的數(shù)值;§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.5中位數(shù)下限公式為:

上限公式為:§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.5中位數(shù)2、中位數(shù)的應(yīng)用中位數(shù)是將一組數(shù)據(jù)排序后一分為二,中間位置上的變量值即為中位數(shù)??梢姡形粩?shù)是以中間位置上的變量值為集中趨勢的代表,其不受極端值的影響。當(dāng)數(shù)據(jù)較多而有極端出現(xiàn)時,此時中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。在實際經(jīng)濟(jì)統(tǒng)計中,人口年齡特征值通常以年齡中位數(shù)為代表值來加以描述?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.6四分位數(shù)四分位數(shù)是指一組數(shù)據(jù)排序后,處于第一個分割點即25%位置和第三個分割點即75%位置上的變量值。通常第一個分割點上的數(shù)值叫下四分位數(shù),用Q1表示,第三個分割點上的數(shù)值叫上四分位數(shù),用Q3表示。四分位數(shù)的確定類似中位數(shù),先確定位置,再確定分位數(shù)值?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.6四分位數(shù)1、對于未分組的資料,四分位數(shù)的位置分別為:下四分位數(shù)的位置為:上四分位數(shù)的位置為:兩個分割點位置上的數(shù)值即為四分位數(shù)的數(shù)值§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.6四分位數(shù)若(n+1)恰好為4的倍數(shù),則Q1、Q3直接為其位置上的變量值若(n+1)不是4的倍數(shù),則Q1、Q3可加權(quán)平均算出,也可簡單平均計算。§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.6四分位數(shù)2、對于已分組資料,四分位數(shù)的位置分別為:與,通過累計次數(shù)可以判斷四分位數(shù)所在組,四分位數(shù)的數(shù)值按公式計算為:§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.6四分位數(shù)下限公式為:§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.6四分位數(shù)上限公式為:

§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.7各種平均數(shù)的比較1、數(shù)值平均數(shù)與位置平均數(shù)的比較第一,數(shù)值平均數(shù)是根據(jù)一組數(shù)據(jù)的全部數(shù)值綜合計算而得出,概括了反映了所有變量值的平均水平,位量平均數(shù)則是以一組數(shù)據(jù)中全部數(shù)值的某些特殊位置上的個別數(shù)值為總體的代表性數(shù)值。第二,數(shù)值平均數(shù)受一組數(shù)據(jù)中某些極端值的影響明顯,位置平均數(shù)則幾乎不受極端值變量值的影響。第三,數(shù)值平均數(shù)適合于數(shù)值型變量,對變量值的量化尺度要求高;位置平均數(shù)不僅適合于量化程度高的數(shù)值型變量,也適合于量化程度較低的定性變量,其中眾數(shù)適合于各種類型的變量,包括順序型變量和分類型變量,分位數(shù)更適合于順序型變量。這表明位置平均數(shù)的用途更為廣泛?!?.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.7各種平均數(shù)的比較2、眾數(shù)、中位數(shù)與算術(shù)平均數(shù)的比較如果次數(shù)分布是對稱的,眾數(shù)、中位數(shù)、算術(shù)平均數(shù)三者必然相等

如果次數(shù)分布向左偏時,說明數(shù)據(jù)中存在最小值,必然會拉動算術(shù)平均數(shù)向極小值一方靠,此時如果次數(shù)分布是右偏時,說明數(shù)據(jù)中存在最大值,必然會拉動算術(shù)平均數(shù)向極大值一方靠,此時§4.1統(tǒng)計數(shù)據(jù)分布集中趨勢的測定§4.1.7各種平均數(shù)的比較§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.1異眾比率異眾比率(VariationRatio)是指非眾數(shù)組的頻數(shù)占總頻率的比率,用vr表示。異眾比率的計算公式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.2四分位差四分位差(quartiledeviation)是上四分位數(shù)與下四分位數(shù)之差,也稱為內(nèi)距或四分位間距(inter-quartilerange),用表示四分位差的計算公式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.3極差極差(range)是一組數(shù)據(jù)的最大值與最小值之差,也稱為全距,用R表示。極差的計算公式為:

§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.4平均差平均差(meandeviation)是一組數(shù)據(jù)中各變量值與其算術(shù)平均數(shù)離差絕對值的平均數(shù),也稱為平均絕對離差(meanabsolutedeviation)用表示平均差的計算公式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.5方差與均方差方差(Variance)是一組數(shù)據(jù)中各變量值與其算術(shù)平均數(shù)離差平方的平均數(shù)。方差的平方根是均方差,又稱為標(biāo)準(zhǔn)差。1、總體方差與均方差設(shè)為總體方差,為總體均方差對于未分組資料,方差與均方差按簡單平均法計算,公式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.5方差與均方差對于已分組數(shù)據(jù),方差與均方差則采用加權(quán)平均法計算,公式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定2、樣本方差與均方差設(shè)為樣本方差,S為樣本均方差,對于未分組資料,方差與均方差按簡單平均法計算,方式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定2、樣本方差與均方差對于分組資料,方差,均方差采用加權(quán)平均法計算,公式為:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定經(jīng)驗表明,當(dāng)一組數(shù)據(jù)呈現(xiàn)對稱分布時,將有68%的變量值位于之內(nèi);95%的變量值位于之內(nèi),99%的變量值位于之內(nèi)而對于任意分布的一組數(shù)據(jù),至少有75%的變量值位于之內(nèi);89%的變量值位于之內(nèi);94%的變量值位于之內(nèi)§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.6離散系數(shù)離散系數(shù)(coefficientofvariation)是反映一組數(shù)據(jù)相對變動程度或離散程度的指標(biāo),是平均差或均方差與其算術(shù)平均數(shù)的比值離散系數(shù)用V表示,則:§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.6離散系數(shù)平均差系數(shù)

均方差系數(shù)§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.2.6離散系數(shù)離散系數(shù)的應(yīng)用條件:對于平均水平不同的同類數(shù)據(jù),對于計量單位不同的不同類別的數(shù)據(jù),平均差和均方差都難于比較它們的離散程度。為了消除變量值平均水平高低和計量單位不同對離散程度的影響,需要計算離散系數(shù)?!?.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.3統(tǒng)計數(shù)據(jù)分布偏度與峰度的測定相對于集中趨勢和離散程度而言,偏度和峰度主要不是從各單位變量值水平的角度考察分布的代表值或變異度,而是從整個分布圖形的形狀來考慮問題的,因而,它們所刻畫的是數(shù)據(jù)分布的形態(tài)特征。§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.3統(tǒng)計數(shù)據(jù)分布偏度與峰度的測定§4.3.1偏度偏度(skewness)是指一組數(shù)據(jù)分布的不對稱程度,從不對稱的方向看,包括左偏和右偏。在算術(shù)平均數(shù)與中位數(shù)、眾數(shù)的比較中,我們可以大致地判斷出數(shù)據(jù)分布是對稱的,還是左偏或右偏,但是要判斷數(shù)據(jù)分布的不對稱程度,就要計算偏度系數(shù)(coefficientofskewness)指標(biāo)了§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.3統(tǒng)計數(shù)據(jù)分布偏度與峰度的測定§4.3.1偏度1、皮爾遜偏度系數(shù)算術(shù)平均數(shù)與眾數(shù)的離差除以均方差的比值,稱為皮爾遜偏度系數(shù),用公式表示為§4.2統(tǒng)計數(shù)據(jù)分布離散程度的測定§4.3統(tǒng)計數(shù)據(jù)分布偏度與峰度的測定§4.3.1偏度1、皮爾遜偏度系數(shù)皮爾遜偏度系數(shù)的數(shù)值在-3~3的范圍內(nèi)。若算術(shù)平均數(shù)大于眾數(shù),為正,表示右偏或正偏分布;若算術(shù)平均數(shù)小于眾數(shù),為負(fù),表示左偏或負(fù)偏分布。的絕對值越接近于3,表示數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論