版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章統(tǒng)計整理§1統(tǒng)計整理的一般問題§2統(tǒng)計分組§3次數(shù)分布§4數(shù)據(jù)顯示1
§1統(tǒng)計整理的一般問題
統(tǒng)計整理的概念統(tǒng)計整理的內(nèi)容2統(tǒng)計整理的含義
統(tǒng)計整理通常是指對調(diào)查所得到的原始資料進行分類、匯總,使之系統(tǒng)化、條理化的工作過程。但廣義的統(tǒng)計整理也包括對原來已經(jīng)加工的綜合資料的再整理。如歷史資料的整理、統(tǒng)計年鑒的編輯、次級資料(如各出版物公布的)的加工整理等。統(tǒng)計整理是統(tǒng)計工作的第三階段。這個階段是統(tǒng)計調(diào)查的繼續(xù),統(tǒng)計分析的前提。承上啟下的作用3統(tǒng)計整理的意義統(tǒng)計調(diào)查所搜集的反映個體量的原始資料是分散的,不是集中的;是零碎的,不是系統(tǒng)的。根據(jù)這些資料。人們難以從總體上分析和認識社會經(jīng)濟現(xiàn)象的數(shù)量表現(xiàn)。至于某些已經(jīng)加工的綜合資料,則往往由于資料在分組方法、總體范圍或指標(biāo)涵義、口徑、計算方法等方面不同,而不能滿足統(tǒng)計分析的要求,也必須先通過統(tǒng)計整理,才能據(jù)以從總體上分析社會經(jīng)濟現(xiàn)象的數(shù)量表現(xiàn),4統(tǒng)計資料整理的內(nèi)容審核統(tǒng)計資料。包括:完整性、準(zhǔn)確性、及時性進行統(tǒng)計分組。這是統(tǒng)計整理的關(guān)鍵問題。進行資料的匯總。這是統(tǒng)計整理的中心內(nèi)容。編制統(tǒng)計表或統(tǒng)計圖。統(tǒng)計整理的結(jié)果。匯總技術(shù)手工匯總、電子計算機匯總5第三章統(tǒng)計資料整理§1統(tǒng)計整理的一般問題§2統(tǒng)計分組§3次數(shù)分布§4數(shù)據(jù)顯示6
§2統(tǒng)計分組
統(tǒng)計分組的概念和種類
統(tǒng)計分組的方法1、選擇分組標(biāo)志——統(tǒng)計分組的核心問題2、選擇分組種類3、劃分分組界限7統(tǒng)計分組概念
根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點,按某個標(biāo)志(或幾個標(biāo)志)把被研究對象的總體劃分為若干個不同性質(zhì)的組。原則窮盡原則、互斥原則例1:從業(yè)人員按文化程度分組小學(xué)畢業(yè)中學(xué)畢業(yè)(含中專)大學(xué)畢業(yè)文盲或識字不多小學(xué)畢業(yè)中學(xué)畢業(yè)(含中專)大專畢業(yè)大學(xué)及大學(xué)以上
(√)(×)8種類例2:某商場把服裝分為①男裝、女裝、童裝。(×)②成年裝(男女裝)兒童裝(男女裝)統(tǒng)計分組(√)按分組標(biāo)志的多少不同簡單分組復(fù)合分組按分組標(biāo)志的性質(zhì)不同品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組9例1為了了解某地區(qū)銀行存款的構(gòu)成,可以選用存款性質(zhì)、期限兩個標(biāo)志分別進行分組:按存款性質(zhì)分組企業(yè)存款儲蓄存款財政性存款按存款期限分組活期存款定期存款簡單分組復(fù)合分組存款同時按其性質(zhì)及期限分組企業(yè)存款活期定期儲蓄存款活期定期財政性存款活期定期例2企業(yè)職工按工齡分組:5年以下5~10年10~15年15~20年20年以上品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組10統(tǒng)計分組作用1、統(tǒng)計分組的根本作用是將復(fù)雜的社會經(jīng)濟現(xiàn)象按照統(tǒng)計認識的要求區(qū)分為各個性質(zhì)不同的組成部分。在區(qū)分事物性質(zhì)的分組中,劃分經(jīng)濟類型具有重要意義。經(jīng)濟類型是指直接反映社會生產(chǎn)關(guān)系的各種類型。我國根據(jù)不同時期經(jīng)濟發(fā)展情況來劃分不同的經(jīng)濟類型。1112統(tǒng)計分組作用2.研究總體現(xiàn)象的內(nèi)部結(jié)構(gòu)?,F(xiàn)象的內(nèi)部結(jié)構(gòu)是表明現(xiàn)象本質(zhì)特點的一個重要方面,將同一總體不同時期的結(jié)構(gòu)聯(lián)系起來,還可以看到現(xiàn)象的發(fā)展趨勢和規(guī)律。例如,1988年全國獨立核算工業(yè)企業(yè)凈產(chǎn)值如下:13統(tǒng)計分組作用3、將總體的分組資料按時間的移動聯(lián)系起來進行分析,可以反映總體及各組在數(shù)量上的變動情況和變動規(guī)律,認識由于各組變動速度不同,而形成總體中性質(zhì)不同的各組地位改變的狀況,從而獲得對總體由量變逐漸轉(zhuǎn)化為質(zhì)變的過程的認識。例如,我國農(nóng)業(yè)總產(chǎn)值個農(nóng)林牧副漁各業(yè)所占比重的變化情況如下表:14統(tǒng)計分組作用4、分析總體現(xiàn)象之間的依存關(guān)系。通過分組將有相互影響的現(xiàn)象聯(lián)系起來進行研究,反映它們在數(shù)量上的變動規(guī)律。例如:商品銷售額與流通費用率的關(guān)系;居民收入與儲蓄額的關(guān)系。15統(tǒng)計分組的方法
統(tǒng)計分組的關(guān)鍵在于選擇分組標(biāo)志和劃分各組界限。
1、選擇分組標(biāo)志——統(tǒng)計分組的核心問題分組標(biāo)志是將總體區(qū)分為各個性質(zhì)不同的組的標(biāo)準(zhǔn)或依據(jù)。選擇分組標(biāo)志的原則是:結(jié)合一定的歷史條件或經(jīng)濟條件,根據(jù)統(tǒng)計研究的目的和任務(wù),選用那些最能反映現(xiàn)象本質(zhì)特征的標(biāo)志作為分組標(biāo)志。如:工業(yè)企業(yè)的分類——規(guī)模分類、部門分類16例:經(jīng)調(diào)查,某地年末貨幣流通量為15.3億元,比上年增加4.5億元。為了宏觀調(diào)控,有必要對本地區(qū)貨幣流通量分布狀況進行調(diào)查。有兩種資料整理結(jié)果:按地區(qū)分組上期本期增減%甲縣乙縣丙縣丁縣360002400028000200005200034000410002600044.441.746.730.0合計10800015300041.7(1)(2)按行業(yè)結(jié)構(gòu)分組上期本期增減%集團單位庫存現(xiàn)金農(nóng)民手持現(xiàn)金城鎮(zhèn)居民手持現(xiàn)金其他流動人口手持現(xiàn)金27000430003100070003500071000370001000029.665.019.042.6合計10800015300041.717統(tǒng)計分組的方法2、選擇分組種類簡單分組分組體系主要根據(jù)研究任務(wù)及對象特點來選擇,前者簡單。后者更全面、深入,但復(fù)雜。品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組單項式分組組距式分組主要根據(jù)研究任務(wù)來選擇。(根據(jù)數(shù)量變動的特征不同來選擇)18
對總體只按一個標(biāo)志進行分組,稱為簡單分組。如:以產(chǎn)值作為劃分企業(yè)規(guī)模的標(biāo)志;按文化程度對人口總體進行分組。統(tǒng)計對總體往往要從多方面進行研究,僅僅依賴一個分組標(biāo)志進行分組是難以滿足需要的,必須運用多個分組標(biāo)志進行多種分組,形成一個分組體系,才能滿足需要。
統(tǒng)計分組的方法2、選擇分組種類19統(tǒng)計分組體系就是根據(jù)統(tǒng)計分析的要求,通過對同一總體進行多種不同分組而形成的一種相互聯(lián)系、相互補充,能從總體在各種特殊性質(zhì)意義上的量來加深對社會經(jīng)濟現(xiàn)象總體數(shù)量表現(xiàn)的認識的體系。例如,對于國民經(jīng)濟總體進行統(tǒng)計研究,必須通過按部門、按所有制、按地區(qū)、按主管系統(tǒng)等多種分組,才能得到比較深刻的認識。這就是國民經(jīng)分組體系。統(tǒng)計分組體系可分為平行分組體系與復(fù)合分組體系。統(tǒng)計分組的方法2、選擇分組種類20對同一總體選擇兩個或兩個以上的標(biāo)志分別進行簡單分組然后并列在一起就形成平行分組體系。例如,為了認識人口總體的自然構(gòu)成,可以分別選擇性別、民族、文化程度、年齡等四個分組標(biāo)志進行分組,得到如下分組體系。平行分組體系的特點是,每一分組只能固定一個因素對差異的影響,不能固定其他因素對差異的影響。例如,男子組.女子組中性別的差異已被固定;各民族組中民族的差異已被固定;但這些組中其他因素的差異都依然存在。
統(tǒng)計分組的方法平行分組體系
21
22對同一總體選擇兩個或兩個以上的標(biāo)志層疊進行分組,就形成復(fù)合分組體系。例如,為了認識我國高等院校在校學(xué)生的基本狀況,可以同時選擇學(xué)科、學(xué)制、性別等三個標(biāo)志進行復(fù)合分組,得到如下分組體系。統(tǒng)計分組的方法復(fù)合分組體系
23
24建立復(fù)合分組體系,應(yīng)根據(jù)統(tǒng)計分析的要求,在選擇分組標(biāo)志的同時,確定它們的主次順序。首先按主要的標(biāo)志對總體進行第一次分組;然后按次要的標(biāo)志對第一次所分的組再進行第二次分組;依次按所有標(biāo)志分至最后一層為止。復(fù)合分組體系的持點是,第一次分組只固定一個因素對差異的影響、第二次分組則同時固定兩個因素對差異的影響,當(dāng)最后一次分組時,則所有被選擇標(biāo)志對差異的影響已全部被固定。例如,理科、文科組中只固定了學(xué)科一個因素的差異,但仍存在著學(xué)制及性別的差異。在兩組下再分的本科、??平M中,則已固定了學(xué)科、學(xué)制兩個因素的差異,但仍存在著性別的差別。而最后分的男、女組中,則所有被選擇標(biāo)志各因素的差異部已被固定。即這些組中的學(xué)生,他們的學(xué)科、學(xué)制、性別全部是相同的。統(tǒng)計分組的方法復(fù)合分組體系
25分組標(biāo)志確定之后,必須解決分組組數(shù)和各組界限的劃分,即分組的具體方法問題。根據(jù)分組標(biāo)志的特征不同,統(tǒng)計總體可以按品質(zhì)標(biāo)志分組,也可以按數(shù)量標(biāo)志分組。
統(tǒng)計分組的方法2、選擇分組種類26按品質(zhì)標(biāo)志分組,就是選擇反映事物屬性差異的品質(zhì)標(biāo)志作為分組標(biāo)志,并在品質(zhì)標(biāo)志的變異范圍內(nèi)劃定各組界限,將總體劃分成為若干個性質(zhì)不同的組成部分。例如,人口總體按性別,分為男、女兩組;再如,企業(yè)總體按所有制,分為全民、集體、合營、個體等組。
統(tǒng)計分組的方法按品質(zhì)標(biāo)志分組27按數(shù)量標(biāo)志分組,就是選擇反映事物數(shù)量差異的數(shù)量標(biāo)志為分組標(biāo)志,并在數(shù)量標(biāo)志的變異范圍內(nèi)劃定各組界限,將總體劃分為性質(zhì)不同的若干組成部分。例如,居民家庭按子女?dāng)?shù)分組,可分為0人(無子女)、1人、2人、3人;等等。
統(tǒng)計分組的方法按數(shù)量標(biāo)志分組28就具體的分組形式而言,如果變量的變異較小,我們可以將每個變量值單列一組,這種分組稱為單項式分組。如果變量的變異較大,則可以把變量的整個的取值范圍依次劃分為若干個區(qū)間,一個區(qū)間內(nèi)的所有變量值歸為一組。區(qū)間的最大值稱為上限,最小值稱為下限,上限與下限之差為組距,即組距=區(qū)間的最大值(上限)-區(qū)間的最小值(下限)……(1)這樣的分組稱為組距式分組。統(tǒng)計分組的方法按數(shù)量標(biāo)志分組29按總體內(nèi)各組組距是否完全相等,數(shù)量標(biāo)志分組又可以分為等距式分組與異距式分組。等距式分組適用于總體各單位的變量值由小到大呈現(xiàn)均勻變化的情況。異距式分組則適用于總體各單位的變量值由小到大呈現(xiàn)不均勻變化的情況。各種分組舉例如表4-3。
統(tǒng)計分組的方法按數(shù)量標(biāo)志分組30
31變量按其變量值能否無限分割可以分為離散型變量和連續(xù)型變量。例如表4-3中,例1、例2、例4中的變量均為離散型變量,例3和例5中的變量為連續(xù)型變量。一般來說,離散型變量既可以來用單項式分組,也能夠采用組距式分組;而連續(xù)型變量只能采用組距式分組,不能采用單項式分組。因為連續(xù)型變量的取值能夠無限分割,變量值有無窮多個。
統(tǒng)計分組的方法按數(shù)量標(biāo)志分組32在采用組距式分組中,兩種變量類型在組限的表示方法上也有不同。離散型變量下各相鄰組的組限可以間斷,如例2中第一組的上限為999人,第二組的下限為1000人,兩者不相重疊。連續(xù)型變量的各相鄰組的組限必須重疊,如例3中第—組的上限為80元,第二組的下限為80元,兩者重疊。為保證重疊后不致發(fā)生“80元”究竟歸屬第幾組的混亂,習(xí)慣上規(guī)定各組一般均只包括本組下限變量值而不包括本組上限變量值。上例80元應(yīng)歸入第二組。
統(tǒng)計分組的方法按數(shù)量標(biāo)志分組33單項式分組:一個變量值列為一組。如:對居民家庭按家庭人口數(shù)進行分組:
1人2人3人4人5人及以上2、選擇分組種類組距式分組:若干個變量值列為一組。如:A、企業(yè)的工人按日B、工人按工資水平分組(連)產(chǎn)零件數(shù)分組(離)50-60300-40060-70400-50070-80500-60080-90600-70090以上700-800適用于離散型變量,且變量值不多時。適用于連續(xù)型變量,且變量值變化范圍大時。34①全距與組距②等距與異距③組限與組中值④開口組與閉口組⑤連續(xù)組距分組和不連續(xù)組距分組重疊組限“上限不在內(nèi)”原則關(guān)于組距式分組的幾個問題例:學(xué)生按成績分組(分)
(1)50—6060—70
70—8080—9090—100(2)60以下60—6970—7980—89
90以上組距=80-70=10上限:80下限:70開口組閉口組組中值組中值組中值重疊組限值70歸于70—80組不連續(xù)組距式分組連續(xù)組距式分組35統(tǒng)計分組的方法3、劃分分組界限
按品質(zhì)標(biāo)志分組,只要根據(jù)事物的性質(zhì)劃分界限。目前我國實踐中有制定和實施的幾種最重要的、基礎(chǔ)性國家分類標(biāo)準(zhǔn)。按數(shù)量標(biāo)志分組,要根據(jù)事物的數(shù)量變動來判斷事物性質(zhì)上的差異。注意客觀界限。例:1、人口按年齡分組(歲):0——6嬰幼兒7——17少年兒童18——59中青年60以上老年362、學(xué)生按成績分組(分):
60以下60——7070——8080——9090以上3、企業(yè)按產(chǎn)值計劃完成程度分組(%):
100以下100——110110以上例:55-6060-6565-70……95-10055-6565-7575-8585-9595以上(×)(×)95-105105-115115以上(×)37第三章統(tǒng)計資料整理§1統(tǒng)計整理的一般問題§2統(tǒng)計分組§3次數(shù)分布§4數(shù)據(jù)顯示38
§3次數(shù)分布
次數(shù)分布的概念和種類
變量數(shù)列的編制
次數(shù)分布類型39次數(shù)分布概念在統(tǒng)計分組的基礎(chǔ)上,將總體中的所有單位按組歸類整理,形成總體中各個單位數(shù)在各組間的分布,就叫做次數(shù)分布。分布在各組的個體單位數(shù)叫次數(shù),又稱額數(shù)。各組次數(shù)與總次數(shù)之比稱比率,又稱頻率。將各組組別與次數(shù)依次編排而成的數(shù)列就叫做次數(shù)分布數(shù)列,簡稱分布數(shù)列。有時也可把比率列入分布數(shù)列中。分布數(shù)列又稱分配數(shù)列或次數(shù)分配,它可以反映總體中所有單位在各組間的分布狀態(tài)和分布特征,研究這種分布特征是統(tǒng)計分析的—項重要內(nèi)容。40次數(shù)分布概念
各組名稱(常用x表示)兩個構(gòu)成要素
各組次數(shù)(有兩種表現(xiàn)形式:絕對數(shù)也稱頻數(shù),用f表示相對數(shù)稱為頻率,用f/∑f表示。)41次數(shù)分布種類由于分組是次數(shù)分布的基礎(chǔ),因此有怎樣的分組就形成怎樣的次數(shù)分布。綜合上述各種的分組,次數(shù)分布的類型,可歸納為:次數(shù)分布品質(zhì)數(shù)列變量數(shù)列單項數(shù)列組距數(shù)列等距數(shù)列異距數(shù)列不連續(xù)組距數(shù)列連續(xù)組距數(shù)列42根據(jù)分組標(biāo)志特征的不同.分布數(shù)列可以分為屬性分布數(shù)列與變量分布數(shù)列兩種。按品質(zhì)標(biāo)志分組形成的分布數(shù)列稱為屬性分布數(shù)列,簡稱品質(zhì)數(shù)列。按數(shù)量標(biāo)志分組形成的分布數(shù)列稱為變量分布數(shù)列,簡稱變量數(shù)列。次數(shù)分布種類43種類例:1、某地人口的性別分布按性別分組次數(shù)人數(shù)(人)比重(%)男女154349271461329751.3748.63合計30048224100.002、學(xué)生的成績分布學(xué)生按成績分組x次數(shù)學(xué)生數(shù)(人)f比重(%)f/∑f60以下60-7070-8080-9090以上2820155416403010合計50100變量數(shù)列品質(zhì)數(shù)列44對于品質(zhì)數(shù)列來說,如果分組標(biāo)志選擇得好,分組標(biāo)準(zhǔn)定得恰當(dāng),則事物性質(zhì)的差異表現(xiàn)得比較明確,總體中各組如何劃分較易解決。因而屬性分布數(shù)列一般也較穩(wěn)定,通常均能準(zhǔn)確地反映總體的分布特征。對于變量數(shù)列來講,因為事物性質(zhì)的差異表現(xiàn)得不甚明確,決定事物性質(zhì)的數(shù)量界限往往因人的主觀認識而異,因此按同一數(shù)量標(biāo)志分組有出現(xiàn)多種分布數(shù)列的可能。為了使變量數(shù)列能比較準(zhǔn)確地反映總體的分布特征.除了按照前面講到的按數(shù)量標(biāo)志分組的原理進行分組外,還需要從次數(shù)分布特征的角度,對變量數(shù)列中幾個特有的問題加以討論。種類45變量數(shù)列由各組變量值x和次數(shù)f(f/∑f)構(gòu)成。變量數(shù)列的編制
1、確定變量數(shù)列的形式——根據(jù)變量的性質(zhì)及特點選擇不同的變量數(shù)列。2、確定組距和組數(shù)——組距=全距/組數(shù)。組數(shù)過多,組距太小,要避免將相同性質(zhì)的單位分到不同組中去;反之,如果組數(shù)過少,組距太大,要避免將不同性質(zhì)的單位分到同一組中去。3、確定組限——(1)客觀數(shù)量界限。(2)第一組的下限和最后一組的上限。有極端值時,第一組和最后一組可采用開口組。(3)盡可能采用5或10的倍數(shù)。4、分配次數(shù)——可利用EXCEL表進行匯總。46單項數(shù)列不存在組距的問題,如表4-8所示。此時,組數(shù)等于數(shù)量標(biāo)志所包含的變量值的數(shù)目。
確定組距和組數(shù)47然而當(dāng)所包括的變量值較多時,單項數(shù)列顯得十分繁瑣,如表4-9,難以反映總體內(nèi)不同性質(zhì)組成部分的分布特征。這就有必要編制組距數(shù)列。確定組距和組數(shù)48若將上例根據(jù)考試成績的不同,分為不及格與及格兩組,可編成如下組距數(shù)列(如友4-10):這個數(shù)列也能說明該班統(tǒng)計學(xué)考試成績的基本情況。但是,由于組數(shù)過少組距過大,第二組學(xué)生成績相差的幅度太大,看不出學(xué)生成績的分布特征。為了將考試成績分布情況說明得細致些,按4分為組距分組,編成如下的組距數(shù)列(如表4-11)確定組距和組數(shù)49確定組距和組數(shù)50表4-11則顯然又由于組距過小,組數(shù)過多,也難以看清學(xué)生成績的分布特征。如果先根據(jù)考試成績性質(zhì)的不同,在60分的數(shù)量界限的基礎(chǔ)上,再細致地分為不及格、及格、中等、良好、優(yōu)秀等五個類型。并將每組組距擴大為10分,編成如下組距數(shù)列(表4-12),則基本上能準(zhǔn)確地反映學(xué)生成績的分布特征。確定組距和組數(shù)51由此可見,編制組距數(shù)列時,不僅要考慮各組的劃分是否能區(qū)分總體內(nèi)各組成部分的性質(zhì)差別,還需要確定適當(dāng)?shù)慕M距和組數(shù),才能準(zhǔn)確而清晰地反映總體的分布特征。在實際進行分組時,采用等距數(shù)列或異距數(shù)列,應(yīng)決定于現(xiàn)象的性質(zhì)和研究的目的。
等距數(shù)列由于組距相同,各組次數(shù)的分布不受組距大小的影響,它和消除了組距因素影響的次數(shù)密度(即單位組距內(nèi)分布的次數(shù),也稱為頻數(shù)密度)的分布相一致。
確定組距和組數(shù)52表4-13中組距都是10分。因此,次數(shù)分布和次數(shù)密度的分布是一樣的。確定組距和組數(shù)53如果畫成直方圖,圖形是相同的(圖4-1,①②)。確定組距和組數(shù)54
如果是異距數(shù)列,則各組次數(shù)的數(shù)值受組距不同的影響。在研究各組次數(shù)的實際分布時,要消除組距不同的影響。就是說,要按次數(shù)密度來看實際的次數(shù)分布情況。若上例按異距分組,編制組距數(shù)列如表4-14。
確定組距和組數(shù)55在這種情況下,次數(shù)密度才能準(zhǔn)確地反映實際的次數(shù)分布情況,如果畫成直方圖,應(yīng)該按照次數(shù)密度來畫,如圖4-2。
確定組距和組數(shù)56因此,從明確反映總體的分布特征考慮,編制組距數(shù)列時應(yīng)盡量采用等距分組的方法。等距數(shù)列一般在社會經(jīng)濟現(xiàn)象性質(zhì)差異的變動比較均衡的條件下使用。分組時,一般應(yīng)依據(jù)對總體內(nèi)部情況的定性分析,先確定組數(shù),然后用變量的變動范圍(即全距)除以組數(shù),確定組距,并據(jù)以計分各組界限。設(shè)R為全距,即總體內(nèi)變量最大值與最小值之差。K為組數(shù),i為等組距。則:
(2)確定組距和組數(shù)57如上例,R=99-56=43設(shè)K=5則:i=R/K=43/5=8.6為計算方便,i宜取5或10的整倍數(shù).故可令:i=10確定組距和組數(shù)58確定組距和組數(shù)當(dāng)偏度系數(shù)不大時,用斯特吉斯(美國H.A.Sturges)經(jīng)驗公式確定組數(shù):n為組數(shù),N為總體單位數(shù),d為組距,R為全距,即最大值(xmax)與最小值(xmin)的差。根據(jù)這個公式,可得出如下的組數(shù)參考標(biāo)準(zhǔn):N15~2425~4445~8990~179180~359n56789當(dāng)偏度系數(shù)大時,分布明顯偏態(tài)時,以平均數(shù)為中心,以K倍標(biāo)準(zhǔn)差為組距。59異距數(shù)列能比較準(zhǔn)確地反映總體內(nèi)部各組成部分的性質(zhì)差異。在社會經(jīng)濟統(tǒng)計總體中,有一部分現(xiàn)象性質(zhì)差異的變動并不均衡,很難用等組距的辦法近似地區(qū)分性質(zhì)不同的組。再如,為研究人口總體在人生各發(fā)展階段上的分布,就需要按照人在一生中自然的和社會的發(fā)展規(guī)律采用異距分組。例如,整理我國1982年第三次人口普查資料時采用了如下的異距分組:確定組距和組數(shù)60
確定組距和組數(shù)61異距數(shù)列的組距與組數(shù)應(yīng)根據(jù)對現(xiàn)象本身質(zhì)量關(guān)系的分析研究來確定。由于異距數(shù)列的各組往往均表明某一種性質(zhì)的現(xiàn)象,因此可將其分布視同品質(zhì)數(shù)列的分布。除非統(tǒng)計分析的需要,可不再考慮與次數(shù)密度分布不相一致的問題。確定組距和組數(shù)62當(dāng)組距、組數(shù)確定后,只需劃定各組數(shù)量界限便可編制組距數(shù)列。一般講來,按數(shù)量分組標(biāo)志分組的組限應(yīng)是決定事物性質(zhì)的數(shù)量界限。然而在具體劃分時,尚需在遵循這一原則的前提下,從次數(shù)分布特征的角度考慮編成的組距數(shù)列是否真實地反映了總體內(nèi)各個單位的實際分布特征。例如:某小組10名工人的基本工資變量資料如下(單位:元):45495456586062646970組限63設(shè)已確定分為低、中、高三個工資組,各組組距為10元(已確定組數(shù)和組距)。于是可以有如下兩種劃分組限的方法,形成兩個分布特征不同的組距數(shù)列(表4-15、表4-16)。表4-15的分布持征反映著高工資的工人占全小組工人數(shù)的一半,中等工資的工人數(shù)持中,低工資的工人數(shù)最少。表4-16的分布特征反映著中等工資的工人占全小組工人數(shù)的一半,低工資的工人數(shù)持中,高工資的工人數(shù)最少。究竟哪一種分布特征準(zhǔn)確?需要依據(jù)該小組工人工資變量的實際分布來檢驗。組限64
65可以看出,這一數(shù)軸可以分為三個區(qū)段:其中以55—65元一段變量值分布最為密集;數(shù)軸的首段,則是另外一種形態(tài),變量值分布較為稀疏;而在數(shù)軸末段,直至70元附近才有兩個變量值出現(xiàn)。因而可以判斷,表4-15的組距數(shù)列正是由于組限劃分不當(dāng)將最密集的55-65段變量值拆散在兩個組內(nèi),造成了高工資組分布最多的假象。組限66組距數(shù)列掩蓋了分布在組內(nèi)各單位的實際變量值。為了反映各組中個體單位變量值的一般水平,統(tǒng)計工作中往往用組中值來代表它。組中值是組內(nèi)變量范圍的中間數(shù)值,通??筛鶕?jù)備組的上限、下限進行簡單平均,即:例如:組中值67
組中值68用組中值來代表組內(nèi)變量值的一般水平有一個必要的前提:各單位的變量值在本組范圍內(nèi)呈均勻分布或在組中值兩側(cè)呈對稱分布。完全具備這一條件實際上是不可能的。我們在劃分各組組限時,必須考慮使各組內(nèi)變量值的分布盡可能滿足這一要求,以減少用組中值代表各組變量值一般水平時所造成的誤差。此外,為了統(tǒng)計分析計算的方便,還應(yīng)力求使組中值能取整齊的數(shù)值。組中值69在編制組距數(shù)列時,為了避免出現(xiàn)空白組,同時又能使個別變量離差較大的單位不致于無組可歸,往往在首末兩組使用“××以下”及“××以上”的不確定組限的形式。這種形式叫做“開口組”。為進行統(tǒng)計分橋,有時也要假定開口組的組限,并計算其組中值。一般可按相鄰組的組距來計算“開口組”的假定的組限.然后再計算組中值。計算式為,首組假定下限=首組上限-鄰組組距………………(4)末組假定上限=末組下限+鄰組組距………………(5)組中值70次數(shù)是分布在各組中的個體單位數(shù)。如用相對數(shù)形式表示便是比率。比率是一種結(jié)構(gòu)相對數(shù),各組比率之和應(yīng)等于1或100%。各組次數(shù)或比率的大小意味著相應(yīng)的變量值在決定總體數(shù)量表現(xiàn)中所起的作用不同。次數(shù)或比率大的組,其變量值在決定總體數(shù)量表現(xiàn)中的作用就大,反之就小。
一、次數(shù)分布的特征71由于社會經(jīng)濟現(xiàn)象性質(zhì)的不同,各種統(tǒng)計總體都有不同的次數(shù)分布,形成各種不同類型的分布特征。研究各種類型的次數(shù)分布特征對于準(zhǔn)確認識不同社會經(jīng)濟性質(zhì)的變量在形成總體數(shù)量表現(xiàn)中的作用有著重要的意義。
一、次數(shù)分布的概念72表示法——即用統(tǒng)計表來表示次數(shù)分布,并可列入累計次數(shù)。例如,前舉某班學(xué)生統(tǒng)計學(xué)考分的次數(shù)分布可以列成如下的統(tǒng)計表4—19:次數(shù)分布的表示法1.表示法73表中:70一80分組的次數(shù)為11人,比率為27.5%,表示考分在70一80分范圍內(nèi)的學(xué)生共11人,占全班學(xué)生的27.5%。向上累計次數(shù)及比率是將各組次數(shù)和比率由變量值低的組向變量值高的組累計,各累計數(shù)的意義是備組上限以下的累計次或累計比率。向下累計次數(shù)及比率是將各組次數(shù)和比率由變量值高的組向變量值低的組累計,各累計數(shù)的意義是各組下限以上的累計次數(shù)或累計比率。次數(shù)分布的表示法1.表示法74圖示法:即用統(tǒng)計圖形來表示次數(shù)分布的方法。常用的有三種:直方圖折線圖曲線圖次數(shù)分布的表示法2.圖示法75直方圖,即用直方形的寬度和高度來表示次數(shù)分布的圖形。如鋸表4-19資料可繪制直方圖如圖4-3。次數(shù)分布的表示法(1)直方圖2.圖示法76繪制直方圖時,橫軸表示各組組限,縱軸表示次數(shù)(一般標(biāo)在左方)和比率(一般標(biāo)在右方),沒有比率的直方圖只保留左側(cè)次數(shù)。然后按分布在各組的次數(shù)及比率確定各組在縱軸上的坐標(biāo),并依據(jù)備組組距的寬度與次數(shù)的高度繪成直方形。次數(shù)分布的表示法2.圖示法(1)直方圖77遇到異距數(shù)列時,則通常按次數(shù)密度繪制直方聞以表示共分布,如圖4-2所示。
直方圖一般不用來表示累計次數(shù)的分布。次數(shù)分布的表示法2.圖示法(1)直方圖78折線圖可以在直方圖的基礎(chǔ)上,用組中值與次數(shù)求坐標(biāo)點連接而成,它表示次數(shù)分布的圖形。如據(jù)表4-19資料可繪制折線圖如圖4-4。次數(shù)分布的表示法2.圖示法(2)折線圖79折線圖還可以用來表示累計次數(shù)的分布。根據(jù)表4-19的資料可以繪制兩種累計次數(shù)分布折線圖,如圖4-5。
次數(shù)分布的表示法2.圖示法(2)折線圖80累計次數(shù)分布折線圖的畫法和次數(shù)分布折線圖有些不同。畫遞增累計分布折線圖時,從首組下限開始,將各累計次數(shù)組的上限的縱坐標(biāo)連接起來。畫遞減累計分布折線圖時,從末組的上限開始,將各累計次數(shù)組的下限的縱坐標(biāo)連接起來。次數(shù)分布的表示法2.圖示法(2)折線圖81當(dāng)變量值非常多,變量數(shù)列的組數(shù)無限增多時,折線便近似地表現(xiàn)為一條平滑的曲線。曲線圖是組數(shù)趨向于無限多時折線圖的極限描繪,是一種理論曲線。它實質(zhì)上是對應(yīng)于連續(xù)變量的次數(shù)或比率分布的函數(shù)關(guān)系圖。曲線圖的繪制方法與折線圖基本相同,只是連接各組次數(shù)坐標(biāo)點的線段應(yīng)當(dāng)用平滑曲線而不用折線。
根據(jù)表4-19的資料,可以近似地畫成如下的次數(shù)分布曲線圖。如圖4-6。
次數(shù)分布的表示法2.圖示法(3)曲線圖82
次數(shù)分布的表示法2.圖示法(3)曲線圖83根據(jù)表4-19的資料,也可以繪制如下兩種近似的累計次數(shù)分布曲線圖。如圖4-7。
次數(shù)分布的表示法2.圖示法(3)曲線圖84洛倫茨曲線累計頻數(shù)(頻率)分布曲線,可用于分析社會財富、土地和工資收入等的分配是否公平的問題。該曲線圖是由美國洛倫茨博士提出,故稱為洛倫茨曲線。洛倫茨曲線某國家收入所得的分配情況按收入所得水平分組人口收入累計收入的(%)人口數(shù)(萬人)結(jié)構(gòu)%累計%月收入額(億美元)結(jié)構(gòu)%實際累計%絕對平等絕對不平等最低中下等中等較高最高128.5348.0466.945.611.012.8534.8046.694.561.112.8547.6594.3498.91001.574.0816.337.541.8851352246518709410012.8547.6594.3498.91000000100合計1000.0100.0__31.40100______8520406080100806040200100絕對平等線實際收入分配線絕對不平等線絕對不平等線人口(%)收入(%)洛倫茨曲線AB86洛倫茨曲線與基尼系數(shù)
20世紀(jì)初意大利經(jīng)濟學(xué)家基尼,根據(jù)洛倫茨曲線找出了判斷分配平等程度的指標(biāo)。實際收入分配曲線和收入分配絕對平等曲線之間的面積為A,實際收入分配曲線右下方的面積為B。以A除以A+B的商表示不平等程度。這個數(shù)值被稱為基尼系數(shù)或稱洛倫茨系數(shù)。87洛倫茨曲線與基尼系數(shù)當(dāng)A=0時,A/(A+B)=0,則基尼系數(shù)為0,收入分配完全平等;當(dāng)B=0時,A/(A+B)=1,則基尼系數(shù)為1,收入分配絕對不平等;所以,基尼系數(shù)可在0和1之間取任何值。
聯(lián)合國有關(guān)組織規(guī)定:若低于0.2表示收入絕對平均;0.2-0.3表示比較平均;0.3-0.4表示相對合理;0.4-0.5表示收入差距較大;0.6以上表示收入差距懸殊?;嵯禂?shù)還可用于財產(chǎn)、資本、資源、產(chǎn)品、市場等資源分配均衡程度的分析。88各種不同性質(zhì)的社會經(jīng)濟現(xiàn)象都有著特殊的次數(shù)分布。概括起來,主要有下列四種類型:鐘形分布水平分布U形分布J形分布
次數(shù)分布的主要類型891.鐘形分布鐘形分布的符征是“兩頭小、中間大”,即靠近中間的變量值分布的次數(shù)多,靠近兩端的變量值分布的次數(shù)少。繪成曲線圖,宛如一口古鐘。次數(shù)分布的主要類型90鐘形分布具體可分為對稱分布和非對稱分布。對稱分布的特征是中間變量值分布的次數(shù)最多,兩側(cè)變量值分布的次數(shù)則隨著與中間變量值距離的增大而漸次減少,并且圍繞中心變量值兩側(cè)呈對稱分布,如圖4—8①。
次數(shù)分布的主要類型91對稱分布中的正態(tài)分布最為重要,許多社會經(jīng)濟現(xiàn)象統(tǒng)計總體的分布都趨近于正態(tài)分布。例如,農(nóng)業(yè)平均畝產(chǎn)量的分布、零件公差的分布、商品市場價格的分布等。正態(tài)分布在社會經(jīng)濟統(tǒng)計學(xué)中具有重要意義。在非對稱的分布中,有不同方向的偏態(tài),如圖4—8②、②所示。關(guān)于偏態(tài)分布及其偏斜度的測定問題,將在本書第七章中論述。次數(shù)分布的主要類型92
次數(shù)分布的主要類型932.水平分布水平分布的特征是總體內(nèi)各個變量值分布的次數(shù)大體相等,繪成圖形,表現(xiàn)為一條平行于橫鈾的水平線,如圖4-9。次數(shù)分布的主要類型94例如,某些必需而用途又比較狹窄的商品(如喪葬用品)的價格,需求彈性小,不論價格如何變化,而需求量變動不大。需求量按價格水平分組便呈現(xiàn)水平分布?,F(xiàn)實生活中嚴(yán)格的水平分布是比較少見的,但對這種分布的研究,在統(tǒng)計理論上有著特殊的意義。次數(shù)分布的主要類型953.U形分布U形分布的待征與鐘形分布恰恰相反,靠近兩端的變量值分布的次數(shù)多,靠近中間的變量值分布的次數(shù)少,形成“兩頭高、中間低”的分布持征。繪成曲線圖,象英文字母“U”字。圖形如圖4—30。次數(shù)分布的主要類型96有些社會經(jīng)濟現(xiàn)象的分布表現(xiàn)為U形分布,例如人口死亡率分布。由于人口總體中幼兒死亡人數(shù)和老年死亡人數(shù)均較高,而中年死亡人數(shù)最低,因而按年齡分組的人口死亡率便表現(xiàn)為U形分布。次數(shù)分布的主要類型974.J形分布J形分布有兩種類型。正J形分布是次數(shù)隨著變量值的增大而增多,繪成曲線圖,猶如英文字母“J”字。反J形分布是次數(shù)隨著變量值的增大而減少,繪成曲線圖,猶如反寫的英文字母“J”字,圖形如下:次數(shù)分布的主要類型98在社會經(jīng)濟現(xiàn)象中,有一些統(tǒng)計總體呈J形分布。例如,資本主義社會中,投資額按利潤率大小分布,一般均呈正J形分布;而人口總體按年齡大小分布,則一般均呈反J分布。次數(shù)分布的主要類型99第三章統(tǒng)計資料整理§1統(tǒng)計整理的一般問題§2統(tǒng)計分組§3次數(shù)分布§4數(shù)據(jù)顯示100
§4數(shù)據(jù)顯示
統(tǒng)計表統(tǒng)計圖101統(tǒng)計表
將統(tǒng)計數(shù)據(jù)按一定的順序排列在表格上,就形成了統(tǒng)計表。從廣義講,統(tǒng)計表包括統(tǒng)計工作各階段
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度藥店藥品零售行業(yè)環(huán)保責(zé)任合同
- 二零二五年度藝術(shù)品抵押貸款風(fēng)險評估合同
- 2025年度藝人經(jīng)紀(jì)合同違約金賠償責(zé)任認定標(biāo)準(zhǔn)
- 二零二五年度貴金屬質(zhì)押貸款交易合同
- 2025年度電子產(chǎn)品銷售團隊提成分配合同
- 二零二五年度商業(yè)地產(chǎn)面積調(diào)整補充合同4篇
- 二零二五年度木材貿(mào)易風(fēng)險管理與保險合同4篇
- 2025年度藝術(shù)品拍賣合同范本(含拍賣規(guī)則)3篇
- 二零二五年度農(nóng)業(yè)科技項目成果轉(zhuǎn)化收益分配合同4篇
- 2025年度體育賽事賽事贊助商權(quán)益糾紛解決合同
- 五年級上冊計算題大全1000題帶答案
- 工程建設(shè)行業(yè)標(biāo)準(zhǔn)內(nèi)置保溫現(xiàn)澆混凝土復(fù)合剪力墻技術(shù)規(guī)程
- 北師大版物理九年級全一冊課件
- 2024年第三師圖木舒克市市場監(jiān)督管理局招錄2人《行政職業(yè)能力測驗》高頻考點、難點(含詳細答案)
- RFJ 006-2021 RFP型人防過濾吸收器制造與驗收規(guī)范(暫行)
- 盆腔炎教學(xué)查房課件
- 新概念英語課件NCE3-lesson15(共34張)
- GB/T 3683-2023橡膠軟管及軟管組合件油基或水基流體適用的鋼絲編織增強液壓型規(guī)范
- 電視劇《瑯琊榜》特色分析
- 5A+Chapter+1+Changes+at+home+課件(新思維小學(xué)英語)
- 安徽省2023年中考數(shù)學(xué)試卷(附答案)
評論
0/150
提交評論