版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院主講:岳志春yuezhichun@163.com統(tǒng)計學(xué)2/4/20231河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第三章數(shù)據(jù)分布特征的描述本章內(nèi)容:進(jìn)一步分析數(shù)據(jù)分布特征和變化規(guī)律,用代表值從集中、離散趨勢描述數(shù)據(jù)的分布特征,重點掌握這些代表值的計算、特點和應(yīng)用場合。2/4/20232河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第三章數(shù)據(jù)分布特征的描述本章分四節(jié):第一節(jié)分布集中趨勢的測度;第二節(jié)分布離散程度的測度;第三節(jié)分布偏態(tài)與峰度的測度;第四節(jié)統(tǒng)計表與統(tǒng)計圖。
2/4/20233河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第一節(jié)分布集中趨勢的測度集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,對其測度就是找到其代表值。本節(jié)需要把握五個問題:一、眾數(shù);二、中位數(shù);三、均值;四、幾何平均數(shù);五、眾數(shù)、中位數(shù)、均值的比較。2/4/20234河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、眾數(shù)把握三個問題:1、眾數(shù)的概念;2、眾數(shù)的確定與計算;3、眾數(shù)的統(tǒng)計思想。2/4/20235河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
1、眾數(shù)的概念(1)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。在統(tǒng)計實踐中有時用眾數(shù)說明現(xiàn)象的一般水平,如了解市場需求量多的服裝款式。(2)從分布看,它是數(shù)據(jù)分布的最高峰點,若沒有最高峰點,眾數(shù)可以不存在,也可以有多個高峰點,對應(yīng)多個眾數(shù)??磮D3-1:2/4/20236河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
圖3-1眾數(shù)示意圖2/4/20237河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
(1)未分組數(shù)據(jù)或單變量值分組數(shù)據(jù):找出出現(xiàn)次數(shù)最多的變量值。(2)組距分組數(shù)據(jù):眾數(shù)數(shù)值與其相鄰兩組的頻數(shù)分布有關(guān)。設(shè)眾數(shù)組的頻數(shù)為f,前一組頻數(shù)為f-1,后一組頻數(shù)為f+1。A、圖形確定:從眾數(shù)組直方圖的兩頂角向相鄰兩組直方圖的兩頂角引直線,其交點向橫軸引垂線,交點為眾數(shù)??磮D3-2:2、眾數(shù)的確定與計算2/4/20238河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院圖3-2眾數(shù)與相鄰兩組的關(guān)系示意圖當(dāng)f-1=f+1時如圖(a),當(dāng)f-1>f+1時如圖(b),當(dāng)f-1<f+1時如圖(c)。(a)(b)(c)2/4/20239河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、眾數(shù)的確定與計算(2)組距分組數(shù)據(jù):B、公式計算:上限公式下限公式M0表示眾數(shù),L表示眾數(shù)組的下限值,U表示眾數(shù)組的上限值,i表示眾數(shù)組的組距。看下例:2/4/202310河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例3-1:根據(jù)第二章表2-3的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)。解:眾數(shù)組為120~125,其頻數(shù)為14,根據(jù)公式計算眾數(shù)為:2/4/202311河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院(3)公式計算的假定:數(shù)據(jù)分布具有明顯的集中趨勢,同時假定眾數(shù)組的頻數(shù)在該組內(nèi)是均勻分布的。若假定不存在,眾數(shù)的代表性會很差。2、眾數(shù)的確定與計算2/4/202312河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
3、眾數(shù)的統(tǒng)計思想在一組數(shù)據(jù)的中心點附近,變量值出現(xiàn)的頻數(shù)較高,根據(jù)眾數(shù)組及相鄰兩組的頻數(shù)分布,確定中心點的位置。因此,眾數(shù)是一個位置代表值,它不受數(shù)據(jù)中極端值的影響。2/4/202313河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
二、中位數(shù)把握以下三個問題:1、中位數(shù)的概念;2、中位數(shù)的計算;3、中位數(shù)的特點與性質(zhì)。2/4/202314河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、中位數(shù)的概念它是一組數(shù)據(jù)按大小排序后,處于中間位置上的變量值。中位數(shù)將全部數(shù)據(jù)等分成兩部分,一部分?jǐn)?shù)據(jù)比中位數(shù)大,另一部分比中位數(shù)小,它也是一個位置代表值。2/4/202315河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、中位數(shù)的計算(1)根據(jù)未分組數(shù)據(jù)計算:A、先對數(shù)據(jù)排序;B、確定中位數(shù)的位置,公式為(N+1)/2,N為數(shù)據(jù)的個數(shù);C、確定具體數(shù)值。設(shè)一組數(shù)據(jù)為X1,X2,…,XN,從小到達(dá)排序后為X(1),X(2),…,X(N),若N為奇數(shù),則中位數(shù)為;若N為偶數(shù),則中位數(shù)是與的平均數(shù).設(shè)中位數(shù)為M0,公式為:2/4/202316河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、中位數(shù)的計算當(dāng)N為奇數(shù)時:當(dāng)N為偶數(shù)時:
例如,根據(jù)第二章例2-1的數(shù)據(jù),計算50名工人日加工零件數(shù)的中位數(shù)。其位置在(50+1)/2=25.5,中位數(shù)在第25、26個數(shù)值之間,即Me=(123+123)/2=123(件)。2/4/202317河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、中位數(shù)的計算(2)根據(jù)分組數(shù)據(jù)計算:A、先根據(jù)公式確定中位數(shù)的位置,并確定其所在組,然后公式計算:2/4/202318河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院公式下限公式:上限公式:式中:為數(shù)據(jù)的個數(shù),L、U為中位數(shù)所在組下限、上限,Sm-1為中位數(shù)所在組以前各組的向上累積頻數(shù),Sm+1為中位數(shù)所在組之后各組的向下累積頻數(shù),fm為中位數(shù)所在組的頻數(shù),i為中位數(shù)所在組的組距。2/4/202319河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、中位數(shù)的計算
(2)根據(jù)分組數(shù)據(jù)計算;B、例3-2根據(jù)第二章表2-6的數(shù)據(jù),計算50名工人日加工零件數(shù)的中位數(shù)。解:中位數(shù)的位置=50/2=25,即它在120~125一組,L=120,U=125,Sm-1=16,Sm+1=20,fm=14,i=5,代入公式得:
2/4/202320河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
例3-2:
這樣計算假定中位數(shù)所在組頻數(shù)分布是均勻的。2/4/202321河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
3、中位數(shù)的特點與性質(zhì)(1)特點:穩(wěn)健性,其數(shù)值不受極值的影響。(2)性質(zhì):各變量值與中位數(shù)的離差絕對值之和最小,即2/4/202322河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
三、均值把握五個問題:1、均值的概念;2、根據(jù)未分組數(shù)據(jù)計算均值;3、根據(jù)分組數(shù)據(jù)計算均值;4、均值的重要性;5、調(diào)和平均數(shù)—均值的另一形式。2/4/202323河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、均值的概念又稱算術(shù)平均數(shù),它是全部數(shù)據(jù)的算術(shù)平均,是集中趨勢的最主要測度值。根據(jù)數(shù)據(jù)表現(xiàn)形式不同,均值的計算不同。2/4/202324河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、根據(jù)未分組數(shù)據(jù)計算均值(1)公式:設(shè)總體數(shù)據(jù)為X1,X2,…,XN,樣本數(shù)據(jù)x1,x2,…xn,總體均值和樣本均值的計算公式分別為:2/4/202325河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、根據(jù)未分組數(shù)據(jù)計算均值(2)例子:根據(jù)第二章例2-1的數(shù)據(jù),計算50名工人日加工零件數(shù)的均值為:這種方法計算又稱簡單算術(shù)平均,均值受變量值大小影響。2/4/202326河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、根據(jù)分組數(shù)據(jù)計算均值(1)公式:設(shè)原始數(shù)據(jù)被分成K或k組,各組變量值為X1,X2,…,XK,或x1,x2,…,xk,各組變量值出現(xiàn)的頻數(shù)分別為F1,F2,…,FK,或f1,f2,…,fk,則總體均值和樣本均值的計算公式為:2/4/202327河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院公式2/4/202328河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、根據(jù)分組數(shù)據(jù)計算均值(2)例3-3:根據(jù)第二章表2-3的數(shù)據(jù),計算50名工人日加工零件數(shù)均值。解:計算見表3-1。
表3-1某車間50名工人日加工零件數(shù)均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)
XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計-506160.02/4/202329河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
例3-3:根據(jù)(3.6)式得:這樣計算用各組組中值代表各組實際數(shù)據(jù),假定各組數(shù)據(jù)在組內(nèi)均勻分布,與簡單算術(shù)平均結(jié)果122.98比,差0.22件,是犧牲精度換來計算方便。2/4/202330河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、根據(jù)分組數(shù)據(jù)計算均值(3)這種算法又稱加權(quán)算術(shù)平均或加權(quán)均值,均值大小受各組變量值Xi大小影響,又受各組變量值出現(xiàn)頻數(shù)多少(權(quán)數(shù)Fi大小)的影響。如果某一組的權(quán)數(shù)較大,說明該組數(shù)據(jù)較多,它對均值的影響就越大;反之,則越小。我們再看(3.6)式的變形公式。2/4/202331河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院(3.6)式的變形
由上式知道,加權(quán)均值受各組變量值(Xi)大小和各組權(quán)數(shù)Fi/
大小的影響。當(dāng)掌握數(shù)據(jù)不是頻數(shù),而是頻率時,可用上式計算均值。2/4/202332河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4、均值的重要性(1)從統(tǒng)計思想看,均值是一組數(shù)據(jù)的重心,是數(shù)據(jù)誤差相互抵消的結(jié)果。(2)均值的重要數(shù)學(xué)性質(zhì):A、各變量值與其均值的離差之和為零,即:B、各變量值與其均值的離差平方和最小,即:2/4/202333河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院5、調(diào)和平均數(shù)—均值的另一形式(1)又稱調(diào)和均值,實際工作中由于所獲數(shù)據(jù)不同,有時不能直接采用均值公式計算這時需用調(diào)和平均數(shù)形式計算。(2)例子:某蔬菜批發(fā)市場三種蔬菜的日成交額數(shù)據(jù)見下表,計算三種蔬菜該日的平均批發(fā)價格。2/4/202334河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院表:某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價(元)
X
I成交量(㎏)
Fi成交額(元)
XiFi甲乙丙1.200.500.80
1500025000800018000125006400合計-48000369002/4/202335河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
例子的解法從實際意義,計算方法是:平均價=成交額/成交量A.若已知批發(fā)價、成交量,加權(quán)算術(shù)平均計算:2/4/202336河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
例子的解法B.若已知批發(fā)價、成交額,需先求成交量,調(diào)和平均計算:這與算術(shù)平均計算結(jié)果一致,實際它是加權(quán)算術(shù)平均的變形,即:2/4/202337河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
四、幾何平均數(shù)把握以下問題:1、適用條件;2、計算及公式;3、與均值的關(guān)系。2/4/202338河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
1、幾何平均數(shù)的適用條件它是適用于特殊數(shù)據(jù)的一種平均數(shù),主要計算比率或速度的平均。當(dāng)變量值是比率形式,而且各比率的乘積等于總的比率,用幾何平均法計算平均比率。實際應(yīng)用中,它主要計算現(xiàn)象的年平均發(fā)展速度。2/4/202339河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、幾何平均數(shù)的計算
(1)公式:2/4/202340河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、幾何平均數(shù)的計算(2)例3-4:某水泥生產(chǎn)企業(yè)1995年的水泥產(chǎn)量為100萬噸,1996年與1995年相比增長率為9%,1997年與1996年相比增長率為16%,1998年與1997年相比增長率為20%。求各年的年平均增長率。2/4/202341河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例3-4的解法
解:由題知各年的發(fā)展速度分別為109%、116%、120%,則平均發(fā)展速度等于:
年平均增長率為114.91%-100%=14.91%此題不能用算術(shù)平均計算,因為總速度等于各年發(fā)展速度連乘積。
2/4/202342河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、與均值的關(guān)系它可以看作均值的一種變形。具體,對(3.9)式兩端取對數(shù)得:看出幾何平均數(shù)的對數(shù)是各變量值對數(shù)的算術(shù)平均。2/4/202343河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院五、眾數(shù)、中位數(shù)和均值的比較把握兩個問題:1、眾數(shù)、中位數(shù)和均值的關(guān)系;2、眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合。2/4/202344河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
1、眾數(shù)、中位數(shù)和均值的關(guān)系
(1)從分布的角度:眾數(shù)是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,均值是全部數(shù)據(jù)的算術(shù)平均。對同一組數(shù)據(jù)計算三者,三者關(guān)系:2/4/202345河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
1、眾數(shù)、中位數(shù)和均值的關(guān)系(2)從分布看:如果數(shù)據(jù)有單一眾數(shù)且對稱分布,則三者相等,即:如果數(shù)據(jù)是左偏分布,數(shù)據(jù)有極小值,拉動均值向極小值靠,中位數(shù)和眾數(shù)不受影響,三者關(guān)系為:如果數(shù)據(jù)右偏分布,數(shù)據(jù)有極大值,拉動均值向極大值靠,則2/4/202346河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
圖3-3眾數(shù)、中位數(shù)和均值的關(guān)系
(a)對稱分布(b)左偏分布(c)右偏分布2/4/202347河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、眾數(shù)、中位數(shù)和均值的關(guān)系(2)從數(shù)值關(guān)系看,當(dāng)數(shù)據(jù)分布偏度不大時,三者在數(shù)軸上的三點構(gòu)成一定的數(shù)量關(guān)系,即眾數(shù)距離均值最遠(yuǎn),中位數(shù)在二者之間,若把眾數(shù)與均值之間的距離作為1,則中位數(shù)與均值的距離約為1/3,中位數(shù)與眾數(shù)間距離約為2/3。2/4/202348河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院如圖所示根據(jù)上述關(guān)系,得出:
2/4/202349河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例子對于一組數(shù)據(jù),在已知其中兩個代表值下,可根據(jù)(3.10)式推算。例如,根據(jù)例3-2和例3-3計算結(jié)果,推算眾數(shù)為:Mo=3×123.21-2×123.2=123.23(件),與實際計算的眾數(shù)123件相差不大。2/4/202350河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合(1)特點:A、眾數(shù)是一組數(shù)據(jù)分布的峰值,是位置代表值。優(yōu)點是易理解,不受極值的影響。當(dāng)數(shù)據(jù)分布集中趨勢明顯時,其代表性比均值好。缺點是不唯一。2/4/202351河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合(1)特點:B、中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,類似的有四分位數(shù)、十分位數(shù)、百分位數(shù)等。它不受極值的影響,當(dāng)數(shù)據(jù)偏態(tài)分布時,代表性好于均值。2/4/202352河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合(1)特點:C、均值是根據(jù)全部數(shù)據(jù)計算,具有優(yōu)良的數(shù)學(xué)性質(zhì),應(yīng)用最廣泛。缺點受極值影響,數(shù)據(jù)偏態(tài)分布時,其代表性差。均值的變形幾何平均數(shù)、調(diào)和平均數(shù)適合特殊代表值,前者用于計算比率的平均數(shù),后者用于不能直接計算均值的數(shù)據(jù)。2/4/202353河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合(2)應(yīng)用場合:A、從分布看,數(shù)據(jù)接近對稱分布時,選擇均值作為代表值;對于偏態(tài)分布選擇眾數(shù)、中位數(shù)等位置代表值,代表性好于均值。B、從數(shù)據(jù)類型,定類、定序數(shù)據(jù)可以計算眾數(shù)、中位數(shù),無法計算均值;定距、定比數(shù)據(jù)可以計算均值、也可以計算眾數(shù)、中位數(shù);調(diào)和、幾何平均數(shù)不適合定距數(shù)據(jù),定比數(shù)據(jù)可以計算。2/4/202354河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院附加:四分位數(shù)它又稱四分位點,是用三點將全部數(shù)據(jù)等分為四部分,其中每部分包括25%的數(shù)據(jù),處在分位點上的數(shù)值就是四分位數(shù)。顯然,中間的四分位數(shù)就是中位數(shù)。通常所說的四分位數(shù)第一(下四分位數(shù))和第三個四分位數(shù)(上四分位數(shù))。2/4/202355河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第二節(jié)分布離散程度的測度本節(jié)內(nèi)容:考察變量值間的差異程度,研究數(shù)據(jù)的離散程度,就是變量值遠(yuǎn)離中心值的程度,又稱離中趨勢。數(shù)據(jù)的離散程度反映了集中趨勢測度值的代表性,離散程度越大,說明集中趨勢測度值的代表性越差,反之,越好。2/4/202356河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第二節(jié)分布離散程度的測度把握以下問題:一、極差的含義及特點;二、方差和標(biāo)準(zhǔn)差;三、離散系數(shù)的意義、計算和適用場合。2/4/202357河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、極差的含義及特點把握以下問題:1、極差的含義;2、極差的特點。2/4/202358河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、極差的含義又稱全距,它是一組數(shù)據(jù)的最大值與最小值之差,即R=max(Xi)—min(Xi)(3.11)式中:R表示極差,max(Xi)和min(Xi)分別表示一組數(shù)據(jù)的最大、最小值。組距分組數(shù)據(jù)的極差可表示為:R≈最高組上限-最低組下限(3.12)2/4/202359河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例子根據(jù)第二章例2-1中的數(shù)據(jù)計算極差:R=139-107=32(件)根據(jù)表2-3分組后的數(shù)據(jù)計算:R
≈140-105=35(件)2/4/202360河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、極值的特點計算簡單,易于理解,實際中如股票的最高價與最低價。但它受極值的影響,原因在它只是用到兩端數(shù)據(jù),不能反映中間數(shù)據(jù)的分布,實際中如比賽中要去掉一個最高分、一個最低分。2/4/202361河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院附加1:異眾比率又稱離異比率或變差比,主要測度定類數(shù)據(jù),它是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比率,用于衡量眾數(shù)的代表程度,它越大,說明眾數(shù)的代表性越差,反之,越好。2/4/202362河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院附加2:四分位差又稱四分位距,即上下四分位數(shù)之差,反映50%數(shù)據(jù)的離散程度,數(shù)值越小說明中間的數(shù)據(jù)越集中,反之則越分散。與極差比不受極值的影響,又由于中位數(shù)處于中間位置,其大小一定程度上反映中位數(shù)的代表程度。2/4/202363河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院附加3:平均差
又稱平均離差,它是各變量值與其均值離差絕對值的平均數(shù)。它以均值為中心,反映每個數(shù)據(jù)與均值的離差程度,能全面反映一組數(shù)據(jù)的離散狀況,數(shù)值大則離散程度大,反之則小。但由于采取絕對值避免計算不便,其數(shù)學(xué)性質(zhì)不是最優(yōu),用的少。2/4/202364河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院二、方差和標(biāo)準(zhǔn)差把握以下問題:1、方差的概念;2、總體方差和標(biāo)準(zhǔn)差;3、樣本方差和標(biāo)準(zhǔn)差;4、總體方差公式的變形5、標(biāo)準(zhǔn)化值;6、是非標(biāo)志的標(biāo)準(zhǔn)差。2/4/202365河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、方差的概念它是各變量值與其均值離差平方的平均數(shù),是測度定距、定比數(shù)據(jù)離散程度的最主要方法。根據(jù)總體數(shù)據(jù)和樣本數(shù)據(jù)計算方差在數(shù)學(xué)處理上略有不同。2/4/202366河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、總體方差和標(biāo)準(zhǔn)差(1)設(shè)總體方差為σ2,對于未分組數(shù)據(jù),方差計算公式為:對于分組數(shù)據(jù),公式為:2/4/202367河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、總體方差和標(biāo)準(zhǔn)差(2)方差的平方根即為標(biāo)準(zhǔn)差,其公式:未分組數(shù)據(jù):分組數(shù)據(jù):2/4/202368河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、總體方差和標(biāo)準(zhǔn)差(3)標(biāo)準(zhǔn)差與方差相比:標(biāo)準(zhǔn)差有量綱,與變量值的計量單位相同,其實際意義比方差清楚,在實際應(yīng)用中更多使用標(biāo)準(zhǔn)差??蠢?-5:根據(jù)表2-3中的數(shù)據(jù),計算工人日加工零件數(shù)的標(biāo)準(zhǔn)差。解:計算過程見表3-2。2/4/202369河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院表3-2某車間50名工人日加工零件
標(biāo)準(zhǔn)差計算表
按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)105-110110-115115-120120-125125-130130-135135-140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計-50-3100.52/4/202370河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例3-5:根據(jù)(3.16)式得:結(jié)果表明,每個工人的日加工零件數(shù)與平均數(shù)比,平均相差7.87件。2/4/202371河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、樣本方差和標(biāo)準(zhǔn)差(1)與總體方差的區(qū)別:后者用數(shù)據(jù)個數(shù)或總頻數(shù)去除離差平方和,樣本方差用樣本數(shù)據(jù)個數(shù)或總頻數(shù)減1去除離差平方和,即n-1,稱為自由度。設(shè)樣本方差為S2n-1。2/4/202372河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院自由度自由度指一組數(shù)據(jù)中可自由取值的個數(shù)。當(dāng)樣本數(shù)據(jù)為n,均值確定后只有n-1個數(shù)據(jù)可以自由取值。例如,有2、4、9三個數(shù)值,均值為5,此后只有兩個值可以自由取,比如前兩個值為6、7,則第三個值只能是2。樣本方差用自由度去除原因是抽樣估計中用S2n-1估計σ2,是σ2的無偏估計量。
2/4/202373河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
3、樣本方差和標(biāo)準(zhǔn)差
(2)樣本方差公式:未分組數(shù)據(jù)分組數(shù)據(jù)2/4/202374河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、樣本方差和標(biāo)準(zhǔn)差(3)樣本標(biāo)準(zhǔn)差公式:未分組數(shù)據(jù)分組數(shù)據(jù)2/4/202375河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例如用表2-3的數(shù)據(jù)計算樣本標(biāo)準(zhǔn)差:這與總體標(biāo)準(zhǔn)差的結(jié)果7.87件相差不大。當(dāng)n很大時,樣本方差與總體方差計算結(jié)果相差很小,可以用樣本方差公式計算。2/4/202376河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
3、樣本方差和標(biāo)準(zhǔn)差(4)與平均差的區(qū)別:在數(shù)學(xué)處理上通過平方消去離差的正負(fù)號。便于數(shù)學(xué)處理。它根據(jù)全部數(shù)據(jù)計算,準(zhǔn)確地反映數(shù)據(jù)的離散程度,在實際中廣泛應(yīng)用方差或標(biāo)準(zhǔn)差測度離散程度。2/4/202377河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4、總體方差公式的變形
(3.13)公式的變形:2/4/202378河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院(3.13)公式的變形2/4/202379河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院(3.14)式的變形根據(jù)(3.21)、(3.22)式可以化簡方差和標(biāo)準(zhǔn)差的計算。在實際計算時,可以用計算器求得。2/4/202380河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院5、標(biāo)準(zhǔn)化值(1)根據(jù)均值和標(biāo)準(zhǔn)差可以計算一組數(shù)據(jù)中各個數(shù)值的標(biāo)準(zhǔn)化值,設(shè)標(biāo)準(zhǔn)化值為Z,則有:2/4/202381河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院5、標(biāo)準(zhǔn)化值(2)在對多個不同量綱的指標(biāo)進(jìn)行處理時,需要對各指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理。它又給出了一組數(shù)據(jù)中各數(shù)值的相對位置。如,標(biāo)準(zhǔn)化值為1.5,則該數(shù)據(jù)是在高于均值1.5倍標(biāo)準(zhǔn)差的位置,即對一組數(shù)據(jù)大約有68%的數(shù)據(jù)在范圍內(nèi),95%在范圍內(nèi),99%在范圍內(nèi),在此范圍內(nèi)幾乎包括了全部數(shù)據(jù),而之外的數(shù)據(jù),統(tǒng)計上稱為離群點。2/4/202382河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院6、是非標(biāo)志的標(biāo)準(zhǔn)差(1)是非標(biāo)志的概念:在統(tǒng)計中,有時把現(xiàn)象的總體單位分成具有某一標(biāo)志的單位和不具有某一標(biāo)志的單位兩組,這個標(biāo)志是品質(zhì)標(biāo)志。如將全部產(chǎn)品分為合格品和不合格品兩組。這種用是、否或有、無表示的標(biāo)志被稱為是非標(biāo)志。2/4/202383河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院6、是非標(biāo)志的標(biāo)準(zhǔn)差(2)是非標(biāo)志的成數(shù):是非標(biāo)志不能用數(shù)量表示,可以計算結(jié)構(gòu)比例,即總體中具有某一標(biāo)志的單位數(shù)占總體單位數(shù)的比重或成數(shù),設(shè)為P,如產(chǎn)品合格率;不具有某一標(biāo)志的單位數(shù)占總體單位數(shù)的比重或成數(shù),設(shè)為Q。設(shè)總體單位數(shù)為N,具有某一標(biāo)志的單位數(shù)為N1,不具有某一標(biāo)志的單位數(shù)為N0,N0+N1=N,P=N1/N,Q=N0/N,P+Q=12/4/202384河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院6、是非標(biāo)志的標(biāo)準(zhǔn)差(3)是非標(biāo)志的平均數(shù):將是非標(biāo)志量化,是表示為1,非表示為0,則其平均數(shù)按加權(quán)公式計算
2/4/202385河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院6、是非標(biāo)志的標(biāo)準(zhǔn)差(4)是非標(biāo)志的標(biāo)準(zhǔn)差:2/4/202386河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例子已知某產(chǎn)品的合格率為95%,求其合格率的標(biāo)準(zhǔn)差。解:2/4/202387河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院三、離散系數(shù)的意義、計算和適用場合
把握以下問題:1、離散系數(shù)的意義;2、離散系數(shù)的計算;3、離散系數(shù)的適用場合。2/4/202388河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、離散系數(shù)的意義(1)又稱標(biāo)準(zhǔn)差系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其均值之比,是測度數(shù)據(jù)離散程度的相對指標(biāo)。(2)意義:A、方差和標(biāo)準(zhǔn)差是反映數(shù)據(jù)分散程度的絕對數(shù),它受變量值大小和其均值大小的影響;B、對均值不同或計量單位不同的變量值,不能直接比較,因此引入離散系數(shù)。2/4/202389河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、離散系數(shù)的計算(1)其計算公式為:Vσ和VS分別表示總體離散系數(shù)和樣本離散系數(shù)。(2)例3-6:某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表3-3所示。試比較產(chǎn)品銷售額與銷售利潤的離散程度。2/4/202390河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院表3-3某管理局所屬8家企業(yè)的
產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)X1銷售利潤(萬元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.02/4/202391河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例3-6的解由于銷售額與利潤額數(shù)據(jù)水平不同,不能直接用標(biāo)準(zhǔn)差比較,需要計算離散系數(shù)。由表中數(shù)據(jù)得:=536.25(萬元)S1=309.19(萬元)V1=0.577=32.5215(萬元)S2=23.09(萬元)V2=0.710計算結(jié)果表明V1<V2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度。2/4/202392河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
第三節(jié)分布偏態(tài)與峰度的測度偏態(tài)和峰度是對數(shù)據(jù)分布偏斜和扁平程度的描述。把握如下問題:一、偏態(tài)及其測度;二、峰度及其測度。2/4/202393河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、偏態(tài)及其測度把握以下問題:1、偏態(tài)的意義;2、偏態(tài)系數(shù)的計算公式;3、例3-7。2/4/202394河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、偏態(tài)的意義它是對分布偏斜方向及程度的測度。前面學(xué)過用眾數(shù)、中位數(shù)和均值間的關(guān)系判斷分布是左偏還是右偏,但不能測度偏斜程度,這需要計算偏態(tài)系數(shù),它是對分布偏斜程度的測度。2/4/202395河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、偏態(tài)系數(shù)的計算公式公式為:2/4/202396河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、偏態(tài)系數(shù)的計算公式公式的理解:上式是根據(jù)離差三次方的平均數(shù)再除以標(biāo)準(zhǔn)差的三次方,當(dāng)分布對稱時,離差三次方后正負(fù)離差可以相互抵消,公式分子為0,則3=0;當(dāng)分布不對稱時,正負(fù)離差不能抵消,3有正負(fù)。3為正值表示正偏離差值較大,可以判斷正偏或右偏;反之,3為負(fù)值表示負(fù)離差數(shù)值較大,可以判斷為負(fù)偏或左偏。在計算3時,將離差三次方的平均數(shù)除以標(biāo)準(zhǔn)差的三次方是把偏態(tài)系數(shù)轉(zhuǎn)化為相對數(shù),3的絕對值越大,表示偏斜程度越大。2/4/202397河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、例子例3-7:已知1997年我國農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表3-4。計算偏態(tài)系數(shù)。表3-4農(nóng)村居民家庭按純收入分組的數(shù)據(jù)按純收入分(百元)5以下5~1010~1515~2020~25戶數(shù)比重(%)2.2812.4520.3519.5214.93按純收入分(百元)25~3030~3535~4040~4545~5050以上戶數(shù)比重(%)10.356.564.132.681.814.942/4/202398河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、例子解:計算過程見表3-5(略),根據(jù)表3-5數(shù)據(jù)計算得:2/4/202399河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、例子將計算結(jié)果代入(3.25)式得:由結(jié)果知,偏態(tài)系數(shù)為正,且數(shù)值較大,說明農(nóng)村家庭純收入的分布為右偏分布,即收入較少的家庭占多數(shù),收入較高的家庭占少數(shù),且偏斜的程度較大。2/4/2023100河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院二、峰度及其測度把握以下問題:1、峰度的意義;2、峰度的計算公式;3、例子。2/4/2023101河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、峰度的意義
峰度是分布集中趨勢高峰的形狀。它通常是與正態(tài)分布相比而言,在同一方差時,若分布比正態(tài)分布更高更瘦,則為尖峰分布,反之,則為平峰分布,如圖3-5所示2/4/2023102河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院如圖
2/4/2023103河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、峰度系數(shù)的計算公式峰度系數(shù)是離差四次方的平均數(shù),再除以標(biāo)準(zhǔn)差的四次方,公式為:式中:表示峰度系數(shù),表示標(biāo)準(zhǔn)差的四次方2/4/2023104河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、峰度系數(shù)計算公式公式的理解:將離差的四次方除以標(biāo)準(zhǔn)差的四次方是為了將峰度系數(shù)轉(zhuǎn)化成相對數(shù)。用峰度系數(shù)說明分布的尖峰和扁平程度,是與正態(tài)分布的峰度系數(shù)比較而言。由于正態(tài)分布的峰度系數(shù)為3,當(dāng)4>3時為尖峰分布,當(dāng)4<3時為平峰分布。2/4/2023105河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、例子
例3-8:根據(jù)例3-7中的數(shù)據(jù),計算農(nóng)村居民家庭純收入分布的峰度系數(shù)。解:根據(jù)表3-5的計算結(jié)果,代入(3.26)式得:2/4/2023106河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、例子
由于4=3.4>3,說明我國農(nóng)村居民家庭純收入的分布為尖峰分布,說明低收入家庭占有較大比重。2/4/2023107河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第四節(jié)統(tǒng)計表與統(tǒng)計圖
統(tǒng)計表和統(tǒng)計圖是顯示數(shù)據(jù)的兩種基本方式。本節(jié)把握以下問題:一、統(tǒng)計表;二、統(tǒng)計圖。
2/4/2023108河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、統(tǒng)計表把握以下問題:1、統(tǒng)計表的特點;2、統(tǒng)計表的形式及構(gòu)成;3、統(tǒng)計表編制的原則。2/4/2023109河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
1、統(tǒng)計表的特點它是用語顯示統(tǒng)計數(shù)據(jù)的基本工具。使用統(tǒng)計表可以使數(shù)據(jù)一目了然,清晰易懂,便于理解和分析。2/4/2023110河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
2、統(tǒng)計表的形式及構(gòu)成(1)形式多樣看下表表3-61997年城鄉(xiāng)居民家庭平均每人生活消費(fèi)支出單位:元資料來源:《中國統(tǒng)計年鑒1998》,中國統(tǒng)計出版社,1998年,第326、348頁。注:本表城鎮(zhèn)居民家庭收支為抽樣調(diào)查資料項目城鎮(zhèn)居民農(nóng)村居民食品衣著家庭設(shè)備用品及服務(wù)醫(yī)療保健交通通訊娛樂教育文化服務(wù)居住雜項商品與服務(wù)1942.59520.91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.4553.92148.18233.2334.27合計4185.641617.15表頭列標(biāo)題行標(biāo)題數(shù)字資料附加2/4/20231112、統(tǒng)計表的形式及構(gòu)成(2)表的構(gòu)成:包括表頭、行標(biāo)題、列標(biāo)題、和數(shù)字資料。必要時加上附加。表頭在表的上方,說明表的主要內(nèi)容;行、列標(biāo)題在表的第一列和第一行,表示研究問題的類別名稱和指標(biāo)名稱。若是時間序列數(shù)據(jù),行、列標(biāo)題可以是時間,數(shù)據(jù)多時,時間放在橫行標(biāo)題的位置,如表3-7。表的其余部分是具體的數(shù)字資料;附加放在表的下方,包括資料來源、指標(biāo)的注釋等。2/4/2023112河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
表3-71991-1997年城鄉(xiāng)居民家庭
人均收入單位:元
資料來源:《中國統(tǒng)計年鑒1998》,中國統(tǒng)計出版社,1998年,第325頁年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971700.62026.62577.43496.24283.04838.95160.3708.6784.0921.61221.01577.71926.12091.12/4/2023113河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、統(tǒng)計表編制的原則總體原則:科學(xué)、實用、簡練、美觀。具體注意以下幾點:(1)合理安排表的結(jié)構(gòu),使表的橫豎長度比例適當(dāng)。(2)表頭包括表號、總標(biāo)題和表中數(shù)據(jù)的單位等??倶?biāo)題應(yīng)明確表的內(nèi)容,要有時間、地點、以及數(shù)據(jù)。若是同一計量單位,放在表的右上角,若計量單位不同,放在指標(biāo)后或單列一列標(biāo)明。
2/4/2023114河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、統(tǒng)計表編制原則(3)表中上下兩條線用粗線,中間其他線用細(xì)線。表左右兩邊不封口,列標(biāo)題間用豎線分開,行標(biāo)題間不用橫線隔開。表中數(shù)據(jù)一般右對齊,有小數(shù)點以小數(shù)點對齊且小數(shù)點位置統(tǒng)一。沒有數(shù)字的表格單元,用“-”表示,填好的表不應(yīng)有空白單元格。2/4/2023115河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、統(tǒng)計表編制原則(4)在使用統(tǒng)計表時,必要時在表的下方加上注釋,特別注明資料來源,對別人成果的尊重和被讀者查閱。2/4/2023116河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院二、統(tǒng)計圖
把握以下問題:1、線圖;2、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級學(xué)有余力學(xué)生的教學(xué)方法研究
- 《土壤地理學(xué)》筆記
- 2025年湖北省高考數(shù)學(xué)模擬試卷(附答案解析)
- 數(shù)據(jù)遷移與轉(zhuǎn)換
- 閱讀理解記敘文(練習(xí))(學(xué)生版)-2025年高考英語一輪復(fù)習(xí)(新教材新高考)
- 湖北省襄陽市襄州區(qū)2024-2025學(xué)年九年級上學(xué)期9月月考英語試題(含答案)
- 2024年18-萘二甲酰亞胺項目投資申請報告代可行性研究報告
- 有理數(shù)的乘方(六大題型)-2024-2025學(xué)年滬教版六年級數(shù)學(xué)上冊同步練習(xí)
- 3.2 二次函數(shù) 同步練習(xí)
- 讀書交流會主持詞
- 當(dāng)代社會政策分析 課件 第八章 兒童社會政策
- 2023年徽商銀行市區(qū)支行招聘綜合柜員信息筆試上岸歷年典型考題與考點剖析附帶答案詳解
- 2024年湖南化工職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫帶答案解析
- JGT 472-2015 鋼纖維混凝土
- TD/T 1061-2021 自然資源價格評估通則(正式版)
- 24春國家開放大學(xué)《建筑力學(xué)#》形考任務(wù)1-4參考答案
- 推拿手法完整版本
- 五育并舉-同心筑夢家長會課件
- 物業(yè)工程能耗管控方案
- 2024年北京京能清潔能源電力股份有限公司招聘筆試參考題庫含答案解析
- 帕金森病機(jī)制
評論
0/150
提交評論