統(tǒng)計數(shù)據(jù)分布特征的描述_第1頁
統(tǒng)計數(shù)據(jù)分布特征的描述_第2頁
統(tǒng)計數(shù)據(jù)分布特征的描述_第3頁
統(tǒng)計數(shù)據(jù)分布特征的描述_第4頁
統(tǒng)計數(shù)據(jù)分布特征的描述_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計數(shù)據(jù)分布特征的描述第1頁,共65頁,2023年,2月20日,星期二第三章統(tǒng)計數(shù)據(jù)分布特征的描述3.1統(tǒng)計變量集中趨勢的測定3.2統(tǒng)計變量離散程度的測定3.3變量分布偏度與峰度的描述第2頁,共65頁,2023年,2月20日,星期二3.1統(tǒng)計變量集中趨勢的測定3.1.1測定集中趨勢的主要指標(biāo)及其作用3.1.2位置平均數(shù)3.1.3數(shù)值平均數(shù)第3頁,共65頁,2023年,2月20日,星期二

3.1.1

測定集中趨勢的主要指標(biāo)及其作用

測定集中趨勢的指標(biāo)有兩類:位置平均數(shù)和數(shù)值平均數(shù)。

位置平均數(shù)是根據(jù)變量值位置來確定的代表值,即在總體中將變量值按順序排列得到的數(shù)列中某個特殊位置的值就稱為位置平均數(shù)。常用的位置平均數(shù)有眾數(shù)、中位數(shù)和分位數(shù)等,前兩種常用。位置平均數(shù)可以用于對品質(zhì)數(shù)據(jù)和數(shù)量數(shù)據(jù)的測度。

數(shù)值平均數(shù)就是均值,它是對總體中的所有數(shù)據(jù)計算平均值,用以反映所有數(shù)據(jù)的一般水平。根據(jù)計算方法不同,數(shù)值平均數(shù)可以分為算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)和冪平均數(shù)。這類平均數(shù)的特點(diǎn)是,統(tǒng)計總體中任何一項數(shù)據(jù)的變動都會在一定程度上影響到數(shù)值平均數(shù)的計算結(jié)果。數(shù)值平均數(shù)只能用于對數(shù)量數(shù)據(jù)的測度。

第4頁,共65頁,2023年,2月20日,星期二3.1.1

測定集中趨勢的主要指標(biāo)及其作用

測定集中趨勢是為了表示社會經(jīng)濟(jì)現(xiàn)象總體各單位某一標(biāo)志在一定時間、地點(diǎn)條件下所達(dá)到的一般水平。亦即將總體各單位標(biāo)志值的數(shù)量差異抽象化,反映總體在具體條件下各單位標(biāo)志值達(dá)到的一般水平。

集中趨勢的指標(biāo)經(jīng)常被作為評價事物和決策的數(shù)量標(biāo)準(zhǔn)或參考。具體地說,測定集中趨勢的作用如下:

1.反映總體各單位變量分布的集中趨勢和一般水平;2.比較同類現(xiàn)象在不同單位的發(fā)展水平;3.比較同類現(xiàn)象在不同時期的發(fā)展變化趨勢或規(guī)律;4.分析現(xiàn)象之間的依存關(guān)系。第5頁,共65頁,2023年,2月20日,星期二3.1.2位置平均數(shù)

位置平均數(shù)是根據(jù)數(shù)據(jù)排列位置所確定的代表值,其與數(shù)值平均數(shù)的基本區(qū)別在于不需要依據(jù)每一個數(shù)據(jù)值來計算。

常用的位置平均數(shù)有:

1、眾數(shù)

2、中位數(shù)

3、其它分位數(shù)。第6頁,共65頁,2023年,2月20日,星期二3.1.2.1眾數(shù)(mode)

眾數(shù)是總體中出現(xiàn)次數(shù)最多的那個數(shù)據(jù)值。在頻數(shù)分布中,眾數(shù)指頻數(shù)或頻率最大的標(biāo)志值,用Mo表示。

從數(shù)據(jù)的分布層面看,分布數(shù)列中最常出現(xiàn)的標(biāo)志值說明該標(biāo)志值最具有代表性,因此可以反映數(shù)列的一般水平。在分配曲線圖上,眾數(shù)就是曲線的最高峰所對應(yīng)的標(biāo)志值。但是,眾數(shù)具有不確定性。如果數(shù)據(jù)的分布沒有明顯的集中趨勢或最高峰點(diǎn),眾數(shù)就不存在;如果有多個高峰點(diǎn),就有多眾數(shù)。

在不等距分組的條件下,眾數(shù)必須根據(jù)頻數(shù)密度或頻率密度來計算。眾數(shù)是按照數(shù)據(jù)的位置計算的,它的長處是易于理解,不受極端數(shù)值的影響。當(dāng)數(shù)據(jù)分布存在明顯的集中趨勢,且有顯著的極端值時,適合使用眾數(shù)。但是其靈敏度、計算功能和穩(wěn)定性差,具有不唯一性,所以當(dāng)數(shù)據(jù)分布的集中趨勢不明顯或存在兩個以上分布中心時,便不適合使用眾數(shù)(前者無眾數(shù),后者為雙眾數(shù)或多眾數(shù),也等于沒有眾數(shù))。第7頁,共65頁,2023年,2月20日,星期二3.1.2.1.1由品質(zhì)數(shù)列和單項式數(shù)量數(shù)列確定眾數(shù)

由品質(zhì)數(shù)列和單項式數(shù)量分配數(shù)列確定眾數(shù),方法比較簡單。即出現(xiàn)次數(shù)最多的標(biāo)志值就是眾數(shù)。

[例3-1]

2000年福建省城鎮(zhèn)居民家庭居住條件構(gòu)成如下表,求居住條件的眾數(shù)。

表3-1城鎮(zhèn)居民家庭居住條件構(gòu)成(單位:%)

資料來源:《福建統(tǒng)計年鑒—2002》。

按房屋產(chǎn)權(quán)分組數(shù)據(jù)就是一個品質(zhì)數(shù)列,有71.7%的城鎮(zhèn)居民的住房是自有房,因為71.7%是該品質(zhì)數(shù)列中的最高頻率,因此,其眾數(shù)就是“自有房”,Mo=自有房。項目2000年按房屋產(chǎn)權(quán)分公房租賃私房自有房其他100.012.61.971.713.8第8頁,共65頁,2023年,2月20日,星期二3.1.2.1.1由品質(zhì)數(shù)列和單項式數(shù)量數(shù)列確定眾數(shù)[例3-2]某學(xué)院某學(xué)年教師開課門數(shù)如表3-2,求開課門數(shù)的眾數(shù)。

表3-2教師開課門數(shù)(單位:門)

在上表的單項式數(shù)量數(shù)列中,教師開課門數(shù)最集中的是2門課,所以2就是眾數(shù),Mo=2。開課門數(shù)x1234合計教師數(shù)f1530281285第9頁,共65頁,2023年,2月20日,星期二3.1.2.1.2由組距數(shù)量數(shù)列確定眾數(shù)按年人均純收入分組(元)農(nóng)民家庭數(shù)(戶)1000-12001200-14001400-16001600-18001800-20002000-22002200-24002400-2600240480105060027021012030合計3000

[例3-3]某地區(qū)農(nóng)民收入情況如表3-3,計算其人均純收入的眾數(shù)。

表3-3農(nóng)民家庭年人均純收入情況表第10頁,共65頁,2023年,2月20日,星期二3.1.2.2中位數(shù)(Median)

中位數(shù)和眾數(shù)一樣,也是一種位置代表值。中位數(shù)是將總體中的數(shù)據(jù)按順序排列后,處于數(shù)列中點(diǎn)位置上的那個數(shù)據(jù)值或變量值,或者說中位數(shù)是累計頻率數(shù)列中,累計頻率為0.50所對應(yīng)的變量值。用Me表示。在總體中,小于中位數(shù)的數(shù)據(jù)個數(shù)占一半,大于中位數(shù)的數(shù)據(jù)個數(shù)也占一半,即中位數(shù)是將數(shù)據(jù)按大小順序排列后,位于二等分點(diǎn)上的那個數(shù)據(jù)值。用中位數(shù)來代表總體中所有標(biāo)志值的一般水平,可以避免極端值的影響,在有些情況下更具有代表性。中位數(shù)的確定方法,根據(jù)所掌握的數(shù)據(jù)不同而有所不同。第11頁,共65頁,2023年,2月20日,星期二[例3-4]某高校一次對食堂伙食滿意度的調(diào)查

數(shù)據(jù)如表3-4所示。求滿意度的中位數(shù)。

回答類別學(xué)生人數(shù)(人)學(xué)生人數(shù)累計(向上累計)非常不滿意240240不滿意10801320一般9302250滿意4502700非常滿意3003000合計3000——表3-4調(diào)查數(shù)據(jù)次數(shù)分布中位數(shù)位置=3000/2=1500

從學(xué)生數(shù)累計看,中位數(shù)在第三組,所以,Me=一般。

第12頁,共65頁,2023年,2月20日,星期二3.1.2.2.2由單項式分組數(shù)量數(shù)據(jù)確定中位數(shù)

單項式數(shù)量數(shù)據(jù)分組已經(jīng)將數(shù)據(jù)順序化,這時數(shù)據(jù)個數(shù)即總體單位數(shù)n=∑f,確定中位數(shù)位置的方法要通過累計次數(shù)計算。[例3-6]由表3-5數(shù)據(jù)計算中位數(shù)。

中位數(shù)的位置是85/2=42.5,因此,Me=2。表3-5教師開課門數(shù)累計頻數(shù)表開課門數(shù)(門)教師數(shù)(人)向上累計教師數(shù)(人)向下累計教師數(shù)(人)1151585230457032873404128512合計85————第13頁,共65頁,2023年,2月20日,星期二3.1.2.2.3由組距式分組的數(shù)量數(shù)據(jù)確定中位數(shù)

[例3-7]根據(jù)表3-6數(shù)據(jù),計算農(nóng)民家庭年人均純收入中位數(shù)。表3-6農(nóng)民家庭年人均純收入累計次數(shù)表年人均純收入(元)農(nóng)民家庭數(shù)(戶)向上累計戶數(shù)向下累計戶數(shù)1000-120024024030001200-140048072027601400-16001050177022801600-1800600237012301800-200027026406302000-220021028503602200-240012029701502400-260030300030合計3000————第14頁,共65頁,2023年,2月20日,星期二3.1.2.3.1四分位數(shù)(Quartile)

四分位數(shù)又稱為四分位點(diǎn),它利用三個等分點(diǎn)將數(shù)據(jù)四等分:第一個等分點(diǎn)稱為下四分位數(shù),第二個等分點(diǎn)就是中位數(shù),第三個等分點(diǎn)稱為上四分位數(shù)。四分位數(shù)的計算方法與中位數(shù)相似,即先確定其位置,再確定其數(shù)值。(1)順序數(shù)據(jù)四分位數(shù)位置的確定Qi=in/4(i=1,2,3)式中,Qi

是第i個四分位數(shù),n是數(shù)據(jù)個數(shù)即總體單位數(shù)。

(2)未分組和單項式分組的數(shù)量數(shù)據(jù)四分位數(shù)位置的確定Qi=i(n+1)/4(i=1,2,3)(3)組距式分組數(shù)量數(shù)據(jù)中四分位數(shù)位置的確定第15頁,共65頁,2023年,2月20日,星期二3.1.2.3.1四分位數(shù)(Quartile)

[例3-8]利用例3-4的數(shù)據(jù)確定四分位數(shù)。

解:依題意得:Q1位置=n/4=3000/4=750(人)Q1=不滿意Q2位置=2n/4=2*3000/4=1500(人)Q2=一般Q3位置=3n/4=3*3000/4=2250(人)Q3=滿意第16頁,共65頁,2023年,2月20日,星期二3.1.2.3.1四分位數(shù)(Quartile)

[例3-9]

計算例3-5中數(shù)據(jù)的四分位數(shù)。

解:依題意得:Q1位置=(n+1)/4=9/4=2.25Q1=x2+0.25(x3-x2)=19+0.25*(20-19)=19.25(元)Q2位置=2(n+1)/4=2*9/4=4.5Q2=(x4+x5)/2=(22+23)/2=22.5(元)Q3位置=3(n+1)/4=6.75Q3=x6+0.75(x7-x6)=23+0.75*(23-23)=23(元)第17頁,共65頁,2023年,2月20日,星期二3.1.2.3.2百分位數(shù)(Percentile)

百分位數(shù)是數(shù)據(jù)順序排列后,將數(shù)據(jù)100等分,位于i(i=1,2,…,99)個等分點(diǎn)位置的數(shù)據(jù)值。可見,第25百分位數(shù)就是第一個四分位數(shù);第50百分位數(shù)即第二個四分位數(shù),也就是中位數(shù);第75百分位數(shù)則是第三個四分位數(shù)。百分位數(shù)的計算思路與四分位數(shù)一樣。

對第i百分位數(shù),嚴(yán)格的定義如下:第i百分位數(shù)是這樣一個值,它使得至少有i%的數(shù)據(jù)項小于或等于這個值,且至少有(100-i)%的數(shù)據(jù)項大于或等于這個值。第18頁,共65頁,2023年,2月20日,星期二3.1.3數(shù)值平均數(shù)

數(shù)值平均數(shù)又稱為均值,是用于測定數(shù)量數(shù)據(jù)的集中趨勢的指標(biāo),算術(shù)平均數(shù)是最常用的數(shù)值平均數(shù),由算術(shù)平均數(shù)又引申出了調(diào)和平均數(shù)和幾何平均數(shù)。第19頁,共65頁,2023年,2月20日,星期二3.1.3.1算術(shù)平均數(shù)(均值)arithmeticmean

算術(shù)平均數(shù)又稱均值,是統(tǒng)計數(shù)據(jù)高低相互抵消后的結(jié)果,表現(xiàn)了數(shù)據(jù)的集中趨勢和代表性水平。從統(tǒng)計思想看,均值削弱了數(shù)據(jù)中偶然性,揭示了蘊(yùn)含在偶然性當(dāng)中的必然性,是統(tǒng)計數(shù)據(jù)集中趨勢的一個最重要特征值。而且本身具有良好的數(shù)學(xué)性質(zhì)?;拘问剑核阈g(shù)平均數(shù)=總體標(biāo)志總量/總體單位總量

算術(shù)平均數(shù)的計算條件:算術(shù)平均數(shù)是同質(zhì)總體的標(biāo)志總量和單位總量的比率關(guān)系,要求分子與分母必須是同一總體,而且兩者在數(shù)量上存在著直接的對應(yīng)關(guān)系,即分子數(shù)值隨著分母數(shù)值的變動而變動。實際工作中,由于數(shù)據(jù)的不同,算術(shù)平均數(shù)有簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)兩種計算形式。第20頁,共65頁,2023年,2月20日,星期二3.1.3.1.1簡單算術(shù)平均數(shù)[例3-11]例3-5的中,日產(chǎn)零件數(shù)分別為17、19、20、22、23、23、24、25(件/人)8名工人的日產(chǎn)零件的平均數(shù)為:第21頁,共65頁,2023年,2月20日,星期二3.1.3.1.2加權(quán)算術(shù)平均數(shù)(weightedarithmeticmean)

加權(quán)算術(shù)平均數(shù)主要用于數(shù)據(jù)已經(jīng)分組,并編制出次數(shù)分布的條件下。這時必須先將各組標(biāo)志值乘以相應(yīng)的次數(shù),得到各組的標(biāo)志總量,然后再相加得到總體標(biāo)志總量,最后用總體標(biāo)志總量除以總體單位總量。加權(quán)算術(shù)平均數(shù)的計算公式為:如果是組距式分組,在假定各組內(nèi)的變量值均勻分布的條件下,用各組的組中值代表各組的平均值,以各組組中值乘以各組次數(shù)作為各組的標(biāo)志總量,再計算總平均數(shù)。第22頁,共65頁,2023年,2月20日,星期二

[例3-12]

利用表3-2數(shù)據(jù)計算算術(shù)平均數(shù)。第23頁,共65頁,2023年,2月20日,星期二表3-7教師平均開課門數(shù)計算表開課門數(shù)x教師數(shù)fxff/∑f(%)X*f/∑f1151517.650290.70583288432.940.98824124814.120.5648合計852071002.4353第24頁,共65頁,2023年,2月20日,星期二3.1.3.1.2加權(quán)算術(shù)平均數(shù)

[例3-13]利用表3-3的數(shù)據(jù)計算算術(shù)平均數(shù)。

解:依題意得:所以,這3000戶農(nóng)民家庭平均年人均純收入是1596元。第25頁,共65頁,2023年,2月20日,星期二表3-8農(nóng)民家庭平均年人均純收入計算表年人均純收入(元)組中值x農(nóng)民家庭數(shù)(戶)fxf1000-120011002402640001200-140013004806240001400-16001500105015750001600-1800170060010200001800-200019002705130002000-220021002104410002200-240023001202760002400-260025003075000合計__30004788000第26頁,共65頁,2023年,2月20日,星期二計算加權(quán)算術(shù)平均數(shù)需要注意的問題

加權(quán)算術(shù)平均數(shù)的大小受兩個因素的影響:一是變量值大小;二是各組次數(shù)占總次數(shù)比重即頻率的影響。

加權(quán)算術(shù)平均數(shù)中的權(quán)數(shù),指的就是標(biāo)志值出現(xiàn)的次數(shù)或各組次數(shù)占總次數(shù)的比重。在計算平均數(shù)時,各組次數(shù)具有權(quán)衡各組變量值輕重的作用,出現(xiàn)次數(shù)多的標(biāo)志值對平均數(shù)的形成影響大些,出現(xiàn)次數(shù)少的標(biāo)志值對平均數(shù)的形成影響小些。即,在一個數(shù)列中,當(dāng)標(biāo)志值較大的單位數(shù)居多時,平均數(shù)就會趨近標(biāo)志值大的一方;當(dāng)標(biāo)志值較小的單位數(shù)居多時,平均數(shù)就趨近標(biāo)志值小的一方;當(dāng)標(biāo)志值較大的單位數(shù)與標(biāo)志值較小的單位數(shù)基本平分時,平均數(shù)居中。

可見,各組標(biāo)志值的單位數(shù)(頻數(shù))的多少對平均數(shù)的大小有權(quán)衡輕重的作用,所以稱各組單位數(shù)為權(quán)數(shù),用權(quán)數(shù)乘以各組標(biāo)志值叫加權(quán),由此計算的平均數(shù)叫加權(quán)算術(shù)平均數(shù)。注意:權(quán)數(shù)對算術(shù)平均數(shù)大小的影響程度,并不取決于權(quán)數(shù)本身數(shù)值的大小,而是取決于作為權(quán)數(shù)的各組單位數(shù)占總體單位數(shù)比重的大小,即頻率的大小。

在分組數(shù)列的條件下,當(dāng)各組標(biāo)志值出現(xiàn)的次數(shù)或各組次數(shù)所占比重均相等時,權(quán)數(shù)就失去了權(quán)衡輕重的作用,這時用加權(quán)算術(shù)平均數(shù)計算的結(jié)果與用簡單算術(shù)平均數(shù)計算的結(jié)果相同,因此可以把簡單算術(shù)平均數(shù)理解為加權(quán)算術(shù)平均數(shù)當(dāng)f1=f2=…=fn時的特例。第27頁,共65頁,2023年,2月20日,星期二關(guān)于加權(quán)算術(shù)平均數(shù)的權(quán)數(shù)選擇原則

1、權(quán)數(shù)選擇的原則:

各組標(biāo)志值×各組單位數(shù)=各組標(biāo)志總量2、該等式必須有實際經(jīng)濟(jì)意義。即,權(quán)數(shù)必須是標(biāo)志值的直接承擔(dān)者,權(quán)數(shù)與標(biāo)志值的乘積要具有標(biāo)志總量的意義。

只有當(dāng)三個量之間存在著客觀的數(shù)量對等關(guān)系時,各組單位數(shù)才是加權(quán)算術(shù)平均數(shù)的合適權(quán)數(shù)。實例。第28頁,共65頁,2023年,2月20日,星期二算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)

算術(shù)平均數(shù)是最重要的平均數(shù)形式,有一些非常重要的數(shù)學(xué)性質(zhì),其中最重要的數(shù)學(xué)性質(zhì)是:

1、算術(shù)平均數(shù)與標(biāo)志值個數(shù)的乘積等于各標(biāo)志值的總和。2、各個標(biāo)志值與算術(shù)平均數(shù)離差之和等于零。3、各標(biāo)志值與算術(shù)平均數(shù)離差的平方和為最小。第29頁,共65頁,2023年,2月20日,星期二3.1.3.2調(diào)和平均數(shù)(Harmonicmean)

調(diào)和平均數(shù)是集中趨勢的另一種測定指標(biāo),它是總體中各單位標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),又稱“倒數(shù)平均數(shù)”。

在統(tǒng)計實踐中,調(diào)和平均數(shù)常常被作為算術(shù)平均數(shù)的變形來使用:當(dāng)因為數(shù)據(jù)的原因不能采用算術(shù)平均數(shù)的方法計算均值時,可以考慮采用調(diào)和平均數(shù)的形式。

調(diào)和平均數(shù)也有簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)兩種形式。第30頁,共65頁,2023年,2月20日,星期二3.1.3.2.1簡單調(diào)和平均數(shù)

簡單調(diào)和平均數(shù)是各個標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。計算公式如下:第31頁,共65頁,2023年,2月20日,星期二[例3-16]某種蔬菜早市、午市和晚市的價格

分別為0.7、0.68和0.74元,各買一元,求其平均

價格。第32頁,共65頁,2023年,2月20日,星期二3.1.3.2.2加權(quán)調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)的計算公式為:式中,m表示各單位或各組的標(biāo)志值對應(yīng)的標(biāo)志總量。第33頁,共65頁,2023年,2月20日,星期二[例3-17]某種蔬菜價格和成交量資料如表3-10,求該種蔬菜一天的平均價格。

第34頁,共65頁,2023年,2月20日,星期二3.1.3.3幾何平均數(shù)(geomatricmean)

幾何平均數(shù)也稱幾何均值或?qū)?shù)平均數(shù),是一種有特定作用的平均數(shù)。幾何平均數(shù)是N個變量值(比率)連乘積的N次方根,通常用于時間上有聯(lián)系或有先后順序關(guān)系的比率求平均,凡是度量值的連乘積等于總比率或總速度的現(xiàn)象都必須使用幾何平均法計算均值。幾何平均數(shù)根據(jù)所掌握數(shù)據(jù)資料不同,有簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種方法。

幾何平均數(shù)也是算術(shù)平均數(shù)的變形,也受極端變量值的影響,適合于反映特定現(xiàn)象的平均水------現(xiàn)象的總標(biāo)志值是各單位標(biāo)志值的連乘積。但是,如果數(shù)列中有一個標(biāo)志值等于0,或者數(shù)列中有一個標(biāo)志值是負(fù)值,又要開偶次方根,就都無法計算幾何平均數(shù)。第35頁,共65頁,2023年,2月20日,星期二3.1.3.3.1簡單幾何平均數(shù)式中G表示幾何平均數(shù),

表示各項標(biāo)志值。簡單幾何平均數(shù)適用于計算未分組數(shù)列的平均比率或平均速度。若將變量值取對數(shù),幾何平均數(shù)就變成均值形式。第36頁,共65頁,2023年,2月20日,星期二[例3-18]某產(chǎn)品需經(jīng)四個工序的加工,已知第一工

序加工合格率為97%,第二個工序加工合格率為95%,第

三個工序加工合格率為96%,第四個工序加工合格率為94%,求四個工序平均加工合格率。

解:依題意得:第37頁,共65頁,2023年,2月20日,星期二3.1.3.3.2加權(quán)幾何平均數(shù)當(dāng)計算幾何平均數(shù)的各個標(biāo)志值的次數(shù)不相同時,應(yīng)采用加權(quán)幾何平均數(shù)。加權(quán)幾何平均數(shù)是各標(biāo)志值fi次方的連乘積的次方根,計算公式為:第38頁,共65頁,2023年,2月20日,星期二[例3-19]某2企業(yè)2000~2002年增加值發(fā)展速度如表3-11,試計算其2000~2002年增加值平均發(fā)展速度。環(huán)比發(fā)展速度(%)x時期次數(shù)f1021990-199331041993-19985981998-199911031999-20012

第39頁,共65頁,2023年,2月20日,星期二集中趨勢測定指標(biāo)的關(guān)系

1、眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系在對稱的正態(tài)分布條件下,算術(shù)平均數(shù)=眾數(shù)=中位數(shù)。

在非對稱正態(tài)分布的情況下,眾數(shù)、中位數(shù)和平均數(shù)三者的差別取于偏斜的程度。偏斜的程度越大(小),它們之間的差別越大(?。.?dāng)次數(shù)分配呈右偏時,算術(shù)平均數(shù)>中位數(shù)>眾數(shù);當(dāng)次數(shù)分配呈左偏時,眾數(shù)>中位數(shù)>算術(shù)平均數(shù);一般地,中位數(shù)介于眾數(shù)和平均數(shù)之間。英國統(tǒng)計學(xué)家皮爾生(Pearson.E.S)的研究提出,在存在輕微偏斜的情況下,眾數(shù)、中位數(shù)和算術(shù)平均數(shù)數(shù)量關(guān)系的經(jīng)驗公式:算術(shù)平均數(shù)和眾數(shù)的距離約等于算術(shù)平均數(shù)與中位數(shù)距離的三倍。2、算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)的關(guān)系在相同的數(shù)據(jù)中,算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)在數(shù)值是的關(guān)系如下:調(diào)和平均數(shù)≤幾何平均數(shù)≤算術(shù)平均數(shù)。第40頁,共65頁,2023年,2月20日,星期二計算和應(yīng)用集中趨勢測定指標(biāo)應(yīng)注意的問題

1、集中趨勢的測定指標(biāo)只能應(yīng)用于同質(zhì)總體。集中趨勢是總體中的所有數(shù)據(jù)向中心靠攏的程度,位置平均數(shù)和數(shù)值平均數(shù)作為總體的特征值,反映的是總體各單位的一般水平和集中趨勢,只有在同質(zhì)總體中應(yīng)用才有意義,否則就會失真。

2、用組平均數(shù)和分配數(shù)列補(bǔ)充說明總平均數(shù)。平均數(shù)是一個高度概括性的數(shù)值,它抽象了總體中各數(shù)據(jù)的差異。為使總體信息即有綜合又保真,可以用分配數(shù)列和各組的平均數(shù)來總體具體情況,以顯示被平均數(shù)抽象掉的各單位差異及其分布。3、集中趨勢指標(biāo)與離中趨勢指標(biāo)及具體分析相結(jié)合??傮w除了集中趨勢特征外,還具有與集中趨勢相反的特征——離中趨勢,研究中對總體的不同層面、不同方向的特征值都進(jìn)行剖析,相互補(bǔ)充,會使分析更透徹、全面。此外,集中趨勢指標(biāo)與典型事例相結(jié)合,具體問題具體分析。第41頁,共65頁,2023年,2月20日,星期二3.2.1測定離散趨勢的主要指標(biāo)及其作用

離散程度的主要指標(biāo)有極差、平均差、四分位差、方差和標(biāo)準(zhǔn)差以及離散系數(shù)等,在實踐中有重大作用。

1、反映現(xiàn)象總體中變量分布的離中趨勢總體各單位的標(biāo)志值存在差異,標(biāo)志變動度表明總體各單位標(biāo)志值的分散程度。變量值的差異越大,離中趨勢也越大;反之,變量值越小,離中趨勢也就越小。

2、衡量均值的代表性均值作為總體數(shù)量標(biāo)志的代表值,其代表性取決于總體各數(shù)據(jù)的差異程度。當(dāng)總體中各數(shù)據(jù)的變異程度越大,均值的代表性就越??;反之,總體中各數(shù)據(jù)的變異程度越小,均值的代表性就越大。

3、測定現(xiàn)象變動的均勻性或穩(wěn)定性程度離散程度能夠表明生產(chǎn)過程的節(jié)奏性和其他活動的均衡性,可作為企業(yè)產(chǎn)品質(zhì)量控制和評價經(jīng)濟(jì)管理工作的依據(jù)。第42頁,共65頁,2023年,2月20日,星期二3.2.2.1極差極差又稱全距,離散程度的最簡單測度值,是最大和最小觀測值之間的距離。

式中,Umax代表最高組的上限;Lmin代表最低組的下限。用極差描述資料的離散程度簡單明了,但它僅僅測度了兩個端點(diǎn)數(shù)值,沒有考察中間位置上的數(shù)值,沒有考慮數(shù)據(jù)的分布特征,不能反映觀察值的整個離散程度。特別當(dāng)總體存在極端數(shù)值時,極差就完全受極端數(shù)值的影響,缺乏全面性。第43頁,共65頁,2023年,2月20日,星期二3.2.2.2異眾比率異眾比率又稱離異比率或變差比,是指非眾數(shù)的次數(shù)與全部變量值總次數(shù)的比率。異眾比率是描述數(shù)據(jù)離散程度的測定值之一,在對數(shù)據(jù)數(shù)量變動規(guī)律進(jìn)行研究時,與眾數(shù)結(jié)合使用。其計算公式為:

式中:Vr是異眾比率,是變量值的總次數(shù),是眾數(shù)組的次數(shù)。事實上異眾比率是一個相對數(shù),更具體講是一個比例相對數(shù)。它所描述的是非眾數(shù)的數(shù)據(jù)次數(shù)占數(shù)據(jù)總次數(shù)的比重,它與眾數(shù)的數(shù)據(jù)次數(shù)占總體總次數(shù)的比重之和為1。異眾比率可以用于定類數(shù)據(jù)。第44頁,共65頁,2023年,2月20日,星期二3.2.2.3四分位差(quartiledeviation

)分位差是極差的一種改進(jìn),它是從分配數(shù)列中剔除了一部分極端數(shù)值后確定的、反映數(shù)據(jù)之間差異情況的指標(biāo)。經(jīng)常使用的分位差有四分位差、八分位差、16分位差、32分位差以及百分位差等,以四分位差最為多見。

四分位差是在數(shù)列中剔除最大和最小各四分之一的數(shù)據(jù),是第一和第三個四分位數(shù)之間距離的二分之一,表明中位數(shù)到這兩個四分位數(shù)的平均距離,是說明中位數(shù)代表性高低的測量值。四分位差計算公式為:

式中:QD表示四分位差,Q3、Q1分別為第三個、第一個四位數(shù)。第45頁,共65頁,2023年,2月20日,星期二3.2.2.4平均差(MeanAbsoluteDeviation)

平均差是分配數(shù)列中各單位標(biāo)志值與其算術(shù)平均數(shù)之間離差絕對值的平均數(shù),反映總體各單位標(biāo)志值的平均差異(離散)程度。一般用MD表示。由于掌握的數(shù)據(jù)不同,平均差的計算可分為簡單平均差和加權(quán)平均差兩種形式。即:1、未分組數(shù)列:

2、分組數(shù)列:

平均差考慮到了數(shù)列中各個標(biāo)志值的變異程度對整個數(shù)列變異程度的影響,因此,比較全面、客觀地反映了數(shù)列的變異程度。但是平均差在計算中,為了保證正、負(fù)總體中的各變量值與算術(shù)平均數(shù)的離差和不至于在計算中相互抵消為零,對離差取了絕對值,這在數(shù)學(xué)處理上有困難,不符合代數(shù)方法演算,具有局限性。第46頁,共65頁,2023年,2月20日,星期二3.2.3方差(variance)與標(biāo)準(zhǔn)差(StandardDeviation

方差與標(biāo)準(zhǔn)差是測定離散程度最常用的指標(biāo)。標(biāo)準(zhǔn)差是方差的平方根,也稱均方差。方差與標(biāo)準(zhǔn)差利用了算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì),因此是離散程度最靈敏的指標(biāo),實踐中應(yīng)用十分廣泛。

方差和標(biāo)準(zhǔn)差的思路與平均差基本相同,只是在數(shù)學(xué)處理方法上與平均差不同:對于總體中各變量值與算術(shù)平均數(shù)的正負(fù)離差相互抵消為零的問題,平均差采用取絕對值的方法來避免。而方差則是采用平方的方法來避免。然后再對離差的平方計算算術(shù)平均數(shù),并開方取其正根,求出標(biāo)準(zhǔn)差。第47頁,共65頁,2023年,2月20日,星期二3.2.3.1數(shù)量標(biāo)志的方差與標(biāo)準(zhǔn)差1、未分組數(shù)列的計算公式:

2、分組數(shù)列的計算公式:

式中,表示方差;表示標(biāo)準(zhǔn)差。

方差和標(biāo)準(zhǔn)差一般用于定序數(shù)據(jù)和定比數(shù)據(jù)。第48頁,共65頁,2023年,2月20日,星期二

[例3-23]兩種不同水稻品種在不同的田塊上試種,產(chǎn)量資料如表3-12所示。要求:⑴分別計算兩種品種的單位面積產(chǎn)量。⑵計算兩種品種畝產(chǎn)量的方差和標(biāo)準(zhǔn)差。

表3-12兩種水稻品種產(chǎn)量資料表甲品種乙品種田塊面積(畝)產(chǎn)量(公斤)田塊面積(畝)產(chǎn)量(公斤)1.2661.58401.14951.47701.04451.25400.95401.05200.84200.9450第49頁,共65頁,2023年,2月20日,星期二表3-13計算表

xfxfxfxf5001.2600005601.58404024004501.1495-5027005501.47703012604451.0445-5530255201.0520006000.954010090004501.2540-7058805250.8420255005000.9450-20360合計5.02500—15275合計6.03120—9900第50頁,共65頁,2023年,2月20日,星期二解:依題意得:計算結(jié)果說明,甲品種水稻的平均畝產(chǎn)量為500公斤,平均誤差55.3公斤;乙品種水稻的平均畝產(chǎn)量為520公斤,平均誤差40.6公斤。第51頁,共65頁,2023年,2月20日,星期二3.2.3.2是非標(biāo)志的方差與標(biāo)準(zhǔn)差

用“1”表示“是”的變量值,用“0”表示“非”的變量值,則:是非標(biāo)志的方差、標(biāo)準(zhǔn)差,當(dāng)p=q=0.5時取得最大值,方差最大值為0.25,標(biāo)準(zhǔn)差最大值為0.5,也就是說,此時是非標(biāo)志的變異程度最大。第52頁,共65頁,2023年,2月20日,星期二方差與標(biāo)準(zhǔn)差的數(shù)學(xué)性質(zhì)1、變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方。2、變量對算術(shù)平均數(shù)的方差小于對任意常數(shù)的方差

3、n個同性質(zhì)獨(dú)立變量和的方差等于各個變量方差的和。4、n個同性質(zhì)獨(dú)立變量平均數(shù)的方差等于各變量方差平均數(shù)的1/n。

5、變量線性變換的方差等于變量的方差乘以變量系數(shù)的平方。第53頁,共65頁,2023年,2月20日,星期二3.2.4離散系數(shù)

前述的變異指標(biāo)都是有量綱的量,它們的大小不僅取決于總體數(shù)據(jù)的差異程度,而且還與標(biāo)志值的大小有關(guān)。當(dāng)分析比較兩類不同現(xiàn)象或具有不同平均水平數(shù)據(jù)的變異程度時,就必須采用離散程度的相對數(shù)——離散系數(shù)來反映。離散系數(shù)又稱為變異系數(shù)是一個無量綱的量。它是數(shù)量數(shù)據(jù)的各離散程度指標(biāo)與其算術(shù)平均數(shù)的比值。如,將標(biāo)準(zhǔn)差與其平均數(shù)對比,得到標(biāo)準(zhǔn)差系數(shù),等等。其計算公式為:

變異系數(shù)=變異指標(biāo)/算術(shù)平均數(shù)最常用的變異系數(shù)是標(biāo)準(zhǔn)差系數(shù):第54頁,共65頁,2023年,2月20日,星期二3.3變量分布偏度與峰度的描述3.3.1矩3.3.2偏度3.3.3峰度第55頁,共65頁,2023年,2月20日,星期二3.3.1矩

矩也稱為動差。它是總體中所有變量值與任意常數(shù)離差K次方的算術(shù)平均數(shù)。1.基本形式1)未分組數(shù)據(jù):2)分組數(shù)據(jù):

式中,k為任意正整數(shù),a為常數(shù)。第56頁,共65頁,2023年,2月20日,星期二2.原點(diǎn)矩若a=0,即變量x關(guān)于原點(diǎn)的k階矩——k階原點(diǎn)矩。

1)未分組數(shù)據(jù):

2)分組數(shù)據(jù):

顯然,一階原點(diǎn)矩就是變量的算術(shù)平均數(shù),二階原點(diǎn)矩就是變量平方的算術(shù)平均數(shù)。第57頁,共65頁,2023年,2月20日,星期二3.中心矩

若a=,就得到變量x關(guān)于分布中心的k階矩——k階中心矩。1)未分組數(shù)據(jù):

2)分組數(shù)據(jù):

可見,一階中心矩為0,二階中心矩就是方差。

第58頁,共65頁,2023年,2月20日,星期二3.3.2偏度偏度指分布不對稱的方向和程度。偏度指標(biāo)是三階中心動差除以標(biāo)準(zhǔn)差三次方。其計算公式:當(dāng)α=0時,數(shù)列分布為正態(tài)分布。當(dāng)α≠0時,數(shù)列分布有便斜,且便斜程度隨著α絕對值的增大而增大。當(dāng)α>0時,表示大于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論