統(tǒng)計學ch3-統(tǒng)計指標(學生修改后)_第1頁
統(tǒng)計學ch3-統(tǒng)計指標(學生修改后)_第2頁
統(tǒng)計學ch3-統(tǒng)計指標(學生修改后)_第3頁
統(tǒng)計學ch3-統(tǒng)計指標(學生修改后)_第4頁
統(tǒng)計學ch3-統(tǒng)計指標(學生修改后)_第5頁
已閱讀5頁,還剩97頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第3章統(tǒng)計指標§3.1總量指標和相對指標§3.2平均指標—統(tǒng)計數(shù)據(jù)集中趨勢的描述§3.3變異指標-統(tǒng)計數(shù)據(jù)離中趨勢的描述2011-091統(tǒng)計學-suyl2011-09tjx-su2§3.1總量指標和相對指標

§3.1.1

總量指標總量指標是反映社會經(jīng)濟現(xiàn)象總規(guī)模、總水平的指標。絕對數(shù)的形式表示是統(tǒng)計資料匯總的直接結果作用是認識社會經(jīng)濟現(xiàn)象的起點;是進行管理的重要依據(jù);是計算相對指標、平均指標的基礎。2011-09tjx-su3總量指標的計量單位按計量單位不同分為:實物(量)指標計量單位為實物單位——指以事物的自然屬性和特點進行計量的單位,包括:自然單位:如人、只、臺、件…,是長期習慣使用形成,用于離散型數(shù)據(jù)。

度量衡單位:

kg、cm、…,用于連續(xù)型數(shù)據(jù)。標準實物單位:按某一標準(含量、規(guī)格等)折算后的實物單位,用于將用途相同、但規(guī)格或含量不同的物品數(shù)量匯總。如糧食、能源(標準噸)等;復合單位:噸公里、人公里、人次數(shù)、工日…

特點——使用價值明確;綜合性能差,不同使用價值的實物量不能直接匯總。用途——反映主要物資的生產(chǎn)和消耗、主要產(chǎn)品的供需平衡、特別是無法估價的土地面積和自然資源數(shù)量等。2011-09tjx-su4總量指標的分類(續(xù))價值量指標

是用貨幣單位(如人民幣元,對外貿易中使用英鎊、美元、歐元等)計量。特點:具有較強的綜合性和概括能力,內容抽象,而且要受價格波動的影響。用途:表明經(jīng)濟活動的總成果、總規(guī)模,廣泛用于經(jīng)濟效益的考核和評價等。

勞動量指標是用勞動時間單位來計量的,如工時、工日、人年等。勞動量指標可作為確定勞動定額、評價勞動時間利用程度、計算勞動生產(chǎn)率的依據(jù)。但一般限于同一企業(yè)內部使用。2011-09tjx-su51、按反映總體的特征(內容)分為:總體總量即總體單位總數(shù)表示總體本身的規(guī)模大小

標志總量即總體各單位某一數(shù)量標志值總和。表示所研究現(xiàn)象的總水平??傮w單位總量與標志總量的區(qū)分,不是固定不變的,而是隨著研究目的和研究對象的不同而變化的。如:某地區(qū)工業(yè)企業(yè)職工總數(shù)是:總體總量——以該地區(qū)每個工業(yè)企業(yè)職工為總體單位時標志總量——以該地區(qū)每個工業(yè)企業(yè)為總體單位時總量指標的分類2011-09tjx-su62、按反映的時間狀況分時期指標——也稱為流量反映總體在一段時期內活動過程的總量,指標數(shù)值可以累計相加,數(shù)值大小和時間的長短有直接關系;時點指標——也稱為存量是反映總體在某一時刻(瞬間)狀況的總量數(shù)值不能累計相加,數(shù)值的大小和時間間隔的長短沒有直接關系。試判斷下列指標中哪些是時期指標?在校學生人數(shù)、招生人數(shù)、畢業(yè)生人數(shù)、出生人數(shù)、死亡人數(shù)、遷移人數(shù)、從業(yè)人數(shù)、失業(yè)人數(shù)總量指標的分類(續(xù))2011-09tjx-su7

§3.1.2相對指標

(一)相對指標的意義兩個有聯(lián)系的指標對比的比率其指標數(shù)值的表現(xiàn)形式為相對數(shù)有兩種表現(xiàn)形式無名數(shù)——百分比、千分比、倍數(shù)、系數(shù)、成數(shù)等名數(shù)——分子與分母的計量單位構成的復名數(shù)2011-09tjx-su8意義:揭示了現(xiàn)象之間的數(shù)量聯(lián)系和對比關系,使一些不能直接對比的現(xiàn)象找到共同的比較基礎。例如:有兩個企業(yè)的利潤總額為:甲:50萬元乙:5000萬元與資金投入對比——資金利潤率與上期數(shù)對比——發(fā)展速度與計劃數(shù)對比——計劃完成程度2011-09tjx-su9(二)相對指標的種類對比標準不同,相對指標所說明問題也就不同。

1.結構相對數(shù)(又稱比重)反映社會經(jīng)濟現(xiàn)象的內部結構以及分布狀況如:恩格爾系數(shù)絕對貧困勉強度日小康富裕最富裕

59%

50%

40%

30%城市化程度=城市人口數(shù)/總人口數(shù)貨幣化程度=用貨幣支付的商品和勞務總量/全部商品和勞務總量2011-09tjx-su10

國內生產(chǎn)總值構成與從業(yè)人員構成年份國內生產(chǎn)總值構成從業(yè)人員構成第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)199027.141.631.360.121.418.5199520.548.830.752.223.024.8200016.450.233.450.022.527.5200115.850.134.150.022.327.7200215.350.434.350.021.428.6200314.452.233.449.121.629.3200415.252.931.946.922.530.62011-09tjx-su112.比例相對數(shù)——比例(結構性的比例)反映總體內部的比例關系,揭示總體不同部分之間的發(fā)展變化的協(xié)調平衡狀況。如:我國第五次人口普查結果總人口129533萬人,其中男性65355萬人,女性61228萬人,男、女性別比例為106.74∶100,

某地區(qū)農(nóng)輕重比例:20%:50%:30%

消費與積累的比例兩種商品價格之比——比價分子分母可互換2011-09tjx-su123、比較相對數(shù)相同時間不同空間同類現(xiàn)象數(shù)值的對比,說明不同空間的經(jīng)濟勢力強弱和工作優(yōu)劣等。2004年農(nóng)村居民家庭平均每人純收入四川省是2518.93元,陜西省是1866.52元,四川省農(nóng)村居民家庭平均每人純收入是陜西省的1.35倍,或者說陜西省農(nóng)村居民家庭平均每人純收入是四川省的74.1%。分子分母可互換2010-03tjx-su134、動態(tài)相對數(shù)反映現(xiàn)象發(fā)展變化的相對程度(即發(fā)展速度)。年份國內生產(chǎn)總值人均國內生產(chǎn)總值第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)1995110.5105.0113.9108.4109.31996109.6105.1112.1107.9108.41997108.8103.5110.5109.1107.71998107.8103.5108.9108.3106.81999107.1102.8108.1107.7106.22000108.0102.4109.4108.1107.12001107.3102.8108.7107.4106.7………………………………2009108.7104.2109.5112.4112.675國內生產(chǎn)總值指數(shù)(上年=100)2011-09tjx-su14

5、強度相對數(shù)反映現(xiàn)象的強度,如:人均GDP、人均糧食產(chǎn)量…反映現(xiàn)象的密度和普遍程度。如:人口密度、每萬人擁有醫(yī)院病床數(shù)(醫(yī)生數(shù))、人均綠地面積等反映經(jīng)濟效益,如資金利潤率。其它如:外貿依存度=對外貿易總額/GDP

保險密度=保費/人口數(shù)金融相關度(率)=金融資產(chǎn)總量/GNP2011-09tjx-su15強度相對數(shù)的特點強度相對數(shù)是惟一有單位(且為復名數(shù))的相對數(shù)(有的也用無名數(shù)形式);分子分母一般可以互換,故有正指標與逆指標之分。強度相對數(shù)常帶有“平均”字樣,但不是平均數(shù)(含義不同)。2011-09tjx-su16

6、計劃完成相對數(shù)(計劃完成百分比)反映計劃任務的完成程度。2011-09tjx-su17

例1、

某地上年國內生產(chǎn)總值為500億元,計劃為550億元,實際為560億元。該地計劃完成程度如何?

101.8%的經(jīng)濟意義,超額完成計劃1.8%計劃完成百分比=560/550*100%=101.8%

2011-09tjx-su18

例2、某地今年計劃國內生產(chǎn)總值比上年增長10%,實際增長12%。注意:百分比與百分點的區(qū)別。這里的超額完成1.8%,也可以說超額完成2個百分點。計劃完成百分比=

同理,若表示為:計劃當年比上年增加50億元,實際增加了60億元。

計劃完成%=(500+60)/(500+50)*100%=101.8%2011-09tjx-su19

例3、某企業(yè)計劃把單位成本降低3%,實際降低2%。該企業(yè)是否完成了單位成本降低計劃?

計劃完成百分比2011-09tjx-su20

超額完成計劃百分比?在分析計劃完成情況時,要注意計劃任務數(shù)的性質差異。若計劃數(shù)是以下限規(guī)定的(越大越好的指標——正指標),其計劃完成相對數(shù)大于100%為超額完成計劃,如產(chǎn)值、利潤等;若計劃數(shù)是以上限規(guī)定的(越小越好的指標——逆指標),其計劃完成相對數(shù)小于100%為超額完成計劃,如產(chǎn)品成本、原材料消耗量等。

2011-09tjx-su21計算和應用相對指標應注意的問題

1.正確選擇基礎

2.確??杀刃?/p>

3.相對數(shù)與絕對數(shù)結合運用,多種相對數(shù)綜合運用4.多種相對指標結合應用

2011-09tjx-su22§3.2統(tǒng)計數(shù)據(jù)集中趨勢的描述-平均指標

統(tǒng)計數(shù)據(jù)的集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向。集中趨勢的描述歸納起來有兩大類:一類是數(shù)值平均數(shù),它是根據(jù)全部數(shù)值計算得到的代表值;另一類是位置平均數(shù),是根據(jù)數(shù)據(jù)所處位置直接觀察或根據(jù)與所處位置有關的部分數(shù)據(jù)計算確定的代表值。2011-09tjx-su23一、數(shù)值平均數(shù)1.算術平均數(shù)基本公式

例:平均工資=工資總額/職工人數(shù)平均成本=總成本/產(chǎn)量2011-09tjx-su24(1)簡單算術平均數(shù)——未分組時

5名學生的考試成績分別為(分):

70、80、80、85、85,他們的平均成績是多少?(70+80+80+85+85)/5=80(分)2011-09tjx-su25(2)加權算術平均數(shù)——當數(shù)據(jù)已分組,形成了變量數(shù)列:成績

x人數(shù)f708085122合計5平均成績=(70+80+85)/3?平均成績=所有人的成績總和/總人數(shù)

=(70+80*2+85*2)/5=802011-09tjx-su26

工人日產(chǎn)量(件)工人人數(shù)(人)工人人數(shù)比重(%)1011121314701503801501008.7512.5047.5018.72512.50合計800100.002011-09tjx-su27不符合基本公式,不是5個工人,而是800個工人;工人人總產(chǎn)量不是60件,而是9710件

所以,應該這樣計算:

錯誤的計算:2011-09tjx-su28加權平均數(shù)(件)2011-09tjx-su29

權數(shù)(權重)

——權衡輕重(影響)作用的數(shù)(變量)。權數(shù)的兩種形式——絕對數(shù)(次數(shù))f;

——相對數(shù)(比重)2011-09tjx-su30比重權數(shù)更能夠直接體現(xiàn)權數(shù)的實質:權數(shù)的確定方法——主觀賦權,客觀賦權成績

x人數(shù)f1f2F3708085122102020104050合計5501002011-09tjx-su31按成績分組(分)學生人數(shù)(人)60以下60—7070—8080—9090—10021519153合計542011-09tjx-su32根據(jù)組距數(shù)列計算總平均數(shù)的方法

——加權算術平均(分)X——各組的組中值(代表組平均水平)假定條件:組內均勻分布或對稱分布一般地,計算結果是近似值。2011-09tjx-su33月工資組中值職工人數(shù)

500以下45020893600500-600550314172700600-700650382248300700-800750456342000800-900850305259250900-10009502372251501000-1100105078819001100以上11502023000合計------20001445900某企業(yè)職工按月工資分組

元2011-09tjx-su34調和平均數(shù)(倒數(shù)平均數(shù))計算算術平均數(shù),有時只掌握了各組變量值和各組變量值之和的資料,為了符合基本公式,應該首先經(jīng)過除法運算求得分母數(shù)據(jù),再計算平均數(shù)。這樣計算平均數(shù)的方法稱為“調和平均法”,得到的平均數(shù)稱為“調和平均數(shù)”。

當缺乏分子數(shù)據(jù)時,采用算術平均數(shù);

當缺乏分母數(shù)據(jù)時,采用調和平均數(shù)。2011-09tjx-su35工人日產(chǎn)量(件)x工人日總產(chǎn)量(件)xf10111213147001100456019501400合計97102011-09tjx-su36(件)2011-09tjx-su37

某供銷社分三批收購某種農(nóng)副產(chǎn)品,其收購單價及各批收購額如下批次單價(元)收購額12.40600022.251200032.152150合計——201502011-09tjx-su382011-09tjx-su39切尾均值由于算術平均數(shù)易受極端變量值的影響,所以實際工作中也常常計算切尾平均數(shù)。切尾平均數(shù)是去掉數(shù)據(jù)大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的平均數(shù)。它在電視大獎賽、體育比賽等競賽項目的評分中已得到廣泛應用。切尾均值是結合了算術平均數(shù)利用數(shù)據(jù)信息充分和中位數(shù)不受極值影響的兩個優(yōu)點而形成的新型統(tǒng)計量。對于存在極值的現(xiàn)象計算均值有重要意義。2011-09tjx-su40(3)算術平均數(shù)的特點和數(shù)學性質特點:算術平均數(shù)受變量值和變量值出現(xiàn)次數(shù)的共同影響;算術平均數(shù)靠近出現(xiàn)次數(shù)最多的變量值;算術平均數(shù)受極端變量值的影響;2011-09tjx-su41

數(shù)學性質:

變量值與算術平均數(shù)的離差和為零。

2011-09tjx-su42變量值與算術平均數(shù)的離差平方和最小證明:設2011-09tjx-su43某公司下屬18個企業(yè),計劃完成相對數(shù)如下產(chǎn)值計劃完成程度(%)組中值(%)x企業(yè)數(shù)(個)計劃產(chǎn)值

(萬元)f實際產(chǎn)值(萬元)xf80—9085280068090—10095325002375100—110105101720018060110—120115344005060合計——1824900261752011-09tjx-su442011-09tjx-su45

某公司下屬18個企業(yè),計劃完成相對數(shù)如下:產(chǎn)值計劃完成程度(%)組中值(%)企業(yè)數(shù)(個)實際產(chǎn)值計劃產(chǎn)值80-9085268080090-10095323752500100-110105101806017200110-120115350604400合計——1826175249002011-09tjx-su462、幾何平均數(shù)

例某企業(yè)生產(chǎn)某種產(chǎn)品要經(jīng)過三道工序,各工序的合格品率分別為95%、96%和98%。該產(chǎn)品三道工序的平均合格品率為多少?三道工序的平均合格品率為96.32%.思考:三道工序的平均廢品率為多少?平均廢品率=1-平均合格率2011-09tjx-su47幾何平均數(shù)通常用在總量等于各分量乘積的情形。比如,求某些平均比率,平均發(fā)展速度等。2011-09tjx-su48

某金融機夠以復利方式計息。近12年來的年利率有4年為3%、2年為5%、2年為8%、3年為10%、1年為15%。則12年的平均年利率?

平均年利率=106.82%-100%=6.82%2011-09tjx-su49平均發(fā)展速度的計算方法n=環(huán)比發(fā)展速度的個數(shù)=數(shù)列發(fā)展水平項數(shù)-12011-09tjx-su50二、位置平均數(shù)位置平均數(shù)是根據(jù)變量值在分布數(shù)列中所處的位置來確定的平均數(shù)。1、眾數(shù)(Mode)

眾數(shù)是指總體中出現(xiàn)次數(shù)最多或頻率最大的變量值(數(shù)據(jù)),用Mo表示。眾數(shù)也是一種位置平均數(shù),且不受極端值的影響。2011-09tjx-su51眾數(shù)(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242條件——總體單位多;分布有明顯的集中趨勢2011-09tjx-su52品質數(shù)列(定類數(shù)據(jù))的眾數(shù)

某城市居民關注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)

商品廣告服務廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100

這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調查的200人當中,關注商品廣告的人數(shù)最多,為112人,占總被調查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告2011-09tjx-su53品質數(shù)列(定序數(shù)據(jù))的眾數(shù)

解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意

甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意不滿意一般滿意非常滿意24108934530836311510合計300100.02010-03tjx-su54

——眾數(shù)的值與相鄰兩組頻數(shù)的分布有關

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內均勻分布Mo相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算:MoMo等距數(shù)列近似計算眾數(shù)——先確定眾數(shù)所在組2011-09tjx-su55

是眾數(shù)所在組的下限;是眾數(shù)所在組前一組的次數(shù);是眾數(shù)所在組后一組的次數(shù);是眾數(shù)所在組的次數(shù);

是眾數(shù)組的組距。2010-03tjx-su56按成績分組(分)學生人數(shù)(人)60以下60—7070—8080—9090—10021519153合計54

(分)2010-03tjx-su57

公司職工按月工資分組月工資(元)職工人數(shù)人)500以下208500-600314600-700382700-800456800-900305900-10002371000-1100781100以上20合計2000

眾數(shù)最不受極端變量值的影響。(元)2010-03tjx-su582、中位數(shù)(Median)

中位數(shù)是根據(jù)變量值的位置來確定的平均數(shù)。將變量值按大小順序排序,處于中間位置的變量值(或數(shù)據(jù))即中位數(shù),用表示。由于中位數(shù)是位置代表值,所以不會受極端值的影響,具有較高的穩(wěn)健性。

Me50%50%2010-03tjx-su59中位數(shù)位置的確定未分組數(shù)據(jù):組距數(shù)列數(shù)據(jù):中位數(shù)位置N2中位數(shù)位置=2010-03tjx-su60未分組數(shù)據(jù)的中位數(shù)2010-03tjx-su61原始數(shù)據(jù):

2422212620排序: 2021222426位置: 123 45位置n+125+123中位數(shù)222010-03tjx-su62原始數(shù)據(jù):

105 91268排序: 56891012位置: 123

4

56位置n+126+123.5中位數(shù)8+928.52010-03tjx-su63品質數(shù)列(定序數(shù)據(jù))的中位數(shù)中位數(shù)的位置為:

(300+1)/2=150.5從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此

Me=一般某城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般滿意非常滿意2410893453024132225270300合計300—2010-03tjx-su64對于單項式數(shù)列,可以用Σf/2代替(n+1)/2,確定Σf/2所在的組,然后根據(jù)下列公式計算;Me為中位數(shù);L為中位數(shù)組的下限值;Sm-1為向上累計至中位數(shù)所在組以前的次數(shù);

fm為中位數(shù)所在組的次數(shù);i為中位數(shù)所在組的組距。2010-03tjx-su65成績(分)組中值x學生人數(shù)f向上累計人數(shù)60以下552260-7065151770-8075193680-9085155190-10095455合計—55—2010-03tjx-su66(3)中位數(shù)、眾數(shù)和算術平均數(shù)的關系:

中位數(shù)、眾數(shù)和平均數(shù)之間的數(shù)量關系決定于總體內次數(shù)分配的狀況。對稱鐘形分布情形下:非對稱左偏分布情形下:非對稱右偏分布情形下:2010-03tjx-su67眾數(shù)、中位數(shù)和均值的關系對稱種型分布

均值=中位數(shù)=

眾數(shù)左偏分布均值

中位數(shù)

眾數(shù)右偏分布眾數(shù)

中位數(shù)

均值2010-03tjx-su68

在偏斜適度(微偏)的情況下,不論左偏還是右偏,則有如下的經(jīng)驗公式:3(平均數(shù)-中位數(shù))=(平均數(shù)-眾數(shù))2010-03tjx-su693.分位數(shù)四分位數(shù)是通過3個點將全部數(shù)據(jù)等分為4部分,其中每部分包括25%的數(shù)據(jù)。很顯然,第二個四分位數(shù)就是中位數(shù),因此通常所說的四分位數(shù)是指處在25%位置上的數(shù)值(下四分位數(shù)QL)和處在75%位置上的數(shù)值(上四分位數(shù)QU)。與中位數(shù)的計算方法類似,根據(jù)未分組數(shù)據(jù)計算四分位數(shù)時,首先對數(shù)據(jù)進行排序,然后確定四分位數(shù)所在的位置。與中位數(shù)類似的還有四分位數(shù)、十分位數(shù)和百分位數(shù)與中位數(shù)類似的還有四分位數(shù)、十分位數(shù)和百分位數(shù)等。等。分位數(shù)Qp可以由下式確定:P是想要得到的那個分位數(shù),n是數(shù)據(jù)的項數(shù),M是多少分位數(shù)。2010-03tjx-su709名學生的英語考試成績分別為:65、72、73、75、78、80、84、88、90,試計算成績的四分位數(shù)所在的位置和四分位數(shù)。QL和QU之間包括了50%的數(shù)據(jù),因此,我們可以說有一半的學生英語成績在72.5分至86分之間。2010-03tjx-su71三、計算和應用平均指標應注意的問題

同質性與分組結合與變異指標結合2010-03tjx-su72一、變異指標某車間有兩個生產(chǎn)小組,某周5天的產(chǎn)量如下:甲:171,172,172,172,173(件)乙:220,190,170,150,130(件)兩組的平均日產(chǎn)量均為172件。平均日產(chǎn)量172件的代表性甲組比乙組好?!?.3統(tǒng)計數(shù)據(jù)的離中趨勢2010-03tjx-su73

變異指標反映總體單位變量值的離中趨勢(或差異程度,均衡性、穩(wěn)定性)衡量平均數(shù)的代表性。

變異指標越大,平均數(shù)代表性越?。蛔儺愔笜嗽叫?,平均數(shù)代表性越大。2010-03tjx-su74二、極差與四分位差1.極差(全距Range):

R=最大值—最小值

2.四分位差上四分位數(shù)與下四分位數(shù)之差,稱為四分位差,也稱為內距或四分間距,四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中,數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極值的影響。此外,由于中位數(shù)處于數(shù)據(jù)的中間位置,因此四分位差的大小在一定程度上也說明了

2010-03tjx-su75

三、平均差(AverageDeviation)變量值與平均數(shù)的離差絕對值的平均數(shù)2010-03tjx-su76四、方差Variance和標準差S.D

測度標志變異最重要,最常用的指標。標準差=方差的平方根。方差——變量值與平均數(shù)的離差平方的平均數(shù)。2010-03tjx-su77成績分)學生人數(shù)552-20.37829.87386515-10.371613.05357519-0.372.601185159.631391.053585319.631156.0107合計54——4992.5926(分)(分)2010-03tjx-su78方差和標準差具有以下數(shù)學性質

(1)若每一個變量值加上一個常數(shù),方差和標準差不變。設a為任意常數(shù),

則有:

,

(2)若每一個變量值均擴大一個常數(shù)倍,方差是常數(shù)項的平方倍,標準差同比例變化。設a為任意常數(shù),

2010-03tjx-su79

(3)分組條件下,總方差可以分解成組內方差的平均數(shù)和組間方差兩部分,即:

其中2010-03tjx-su80例:一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數(shù)是100分,標準差是15分;在B項測試中,其平均分數(shù)是400分,標準差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分。與平均分數(shù)相比,該位應試者哪一項測試更為理想?2010-03tjx-su81標準化值在對多個具有不同量綱的指標進行處理時,常常需要對各指標數(shù)值進行標準化處理。標準化值也給出了一組數(shù)據(jù)中各數(shù)值的相對位置。如某一數(shù)據(jù)的標準化值為-1.5,則表明該值低于均值1.5倍的標準差。對于一組數(shù)據(jù),大約有68%的數(shù)據(jù)在1個標準差內,有95%的數(shù)據(jù)在兩個標準差內,有99%的數(shù)據(jù)在3個標準差內。上例:ZA=1,ZB=0.5,A項測試標準化值高于B項,故A項測試比較理想2010-03tjx-su82五、離散系數(shù)(變異系數(shù))與異眾比率

一群牛的平均體重是180公斤,標準差是18公斤;一群羊的平均體重是15公斤,標準差是3公斤,能不能說羊的平均體重的代表性高些?為什么?2010-03tjx-su83有兩組學生成績?yōu)椋?/p>

6065707580X=706668707274X=70

二組學生的平均成績的代表性是否一致?2010-03tjx-su84

全距、平均差、方差和標準差有計量單位,是標志變異的絕對指標。而且指標的大小不僅取決于變量值的差異程度,還取決于變量值水平的高低。因而,對于具有不同水平的數(shù)列,或不同量綱的數(shù)列,都不能直接用全距、平均差、方差和標準差來比較平均數(shù)代表性的大小。只能用相對形式——變異系數(shù)——進行比較。2010-03tjx-su85

平均差系數(shù)變異系數(shù)包括:2010-03tjx-su86變異系數(shù)適合于:比較不同標志的變異程度當同一個標志在多個總體具有不同的平均水平時,要評價和比較哪個總體的平均水平具有較好的代表性時。2010-03tjx-su87異眾比率1. 離散程度的測度值之一非眾數(shù)組的頻數(shù)占總頻數(shù)的比重計算公式為:

4.用于衡量眾數(shù)的代表程度2010-03tjx-su88某城市居民關注廣告類型的頻數(shù)分布廣告類型人數(shù)(人)頻率(%)

商品廣告服務廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0合計200100

這說明在所調查的200人當中,關注非商品廣告的人數(shù)占44%,異眾比率還是比較大。因此,用“商品廣告”來反映城市居民對廣告關注的一般趨勢,其代表性還不是很好

Vr=200-112200

=1-112200

=0.44=44%2010-03tjx-su89不同計量層次數(shù)據(jù)的適合測度值定類數(shù)據(jù)定序數(shù)據(jù)定量數(shù)據(jù)集中趨勢眾數(shù)眾數(shù)中位數(shù)四分位數(shù)眾數(shù)中位數(shù)四分位數(shù)算術平均數(shù)幾何平均數(shù)離中趨勢異眾比率異眾比率四分位差四分位差異眾比率極差平均差標準差和方差2010-03tjx-su90§3.4數(shù)據(jù)分布形態(tài)的測定

偏態(tài)和峰態(tài)是數(shù)據(jù)分布的重要特征。偏態(tài)也稱為偏度,指變量圍繞其均值的非對稱方向和程度。峰態(tài)也稱為峰度,指數(shù)據(jù)分布曲線的凸起或平坦程度。偏度和峰度主要用于判斷總體的分布是否接近于正態(tài)分布。測量偏度和峰度最常用的方法是計算偏度系數(shù)和峰度系數(shù),而這兩個系數(shù)的計算需要理解“矩”概念。2010-03tjx-su91§3.4.1k階矩

矩又叫做動差,是物理學上用以表示力與力臂對重心關系的術語。統(tǒng)計學上常常用矩來測度數(shù)據(jù)分布的形態(tài)。若以a值為變量x的中點,所有變量值與a之離差的k次方的平均數(shù)為變量關于a的k階矩:對分組資料,各階矩公式為2010-03tjx-su92當a=0時,即變量以原點為中心,稱上式為k階原點矩。不難看出,一階原點矩為算術平均數(shù),二階原點矩為平方平均數(shù)。當a=時,即變量以均值為中心,稱上式為k階中心矩,用mk表示。根據(jù)算術平均數(shù)的性質和方差的定義可知,一階中心矩為0,二階中心矩為方差,即:2010-03tjx-su93§3.4.2偏態(tài)的測定

測定偏態(tài)的方法很多,主要有以下三種:1.由中心矩測定偏態(tài)奇數(shù)階中心矩才能用于分布的形態(tài)的測度,顯然,三階中心矩最為簡單,故常用三階中心矩來測度偏態(tài)。由于中心矩是有計量單位的數(shù),所以利用m3測定偏態(tài)的方法,是將三階中心矩除以標準差的三次方σ3,所得的系數(shù)通常稱為偏度或偏度系數(shù),用Skew表示,其計算公式為:2010-03tjx-su94當分布對稱時,SKew=0;當SKew為正值時,表示正離差值較大,可以判斷為右偏分布或正偏分布;當SKew為負值時,表示負離差數(shù)值較大,可以判斷為左偏分布或負偏分布。SKew的絕對值越大,表示偏斜的程度越大。2010-03tjx-su952.由均值與眾數(shù)(中位數(shù))之間的關系來測定當分布是對稱的,均值、中位數(shù)、眾數(shù)是相等的,如果是偏態(tài)分布,三者分離。分布越偏,三個數(shù)值差距就越大。顯然,比較三個集中趨勢代表值就成為一種最簡單的偏態(tài)測度方法。均值與眾數(shù)或中位數(shù)之差是測度偏態(tài)的絕對數(shù),有計量單位,其數(shù)值的大小受該組數(shù)據(jù)變量值水平高低的影響,一般測度偏態(tài)時將其與標準差對比:偏態(tài)系數(shù)SKew實際上是以標準差為單位來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論