第三章 統(tǒng)計整理_第1頁
第三章 統(tǒng)計整理_第2頁
第三章 統(tǒng)計整理_第3頁
第三章 統(tǒng)計整理_第4頁
第三章 統(tǒng)計整理_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章第三章 統(tǒng)計整理統(tǒng)計整理 本章主要內(nèi)容本章主要內(nèi)容一、統(tǒng)計整理概述一、統(tǒng)計整理概述二、統(tǒng)計數(shù)據(jù)的預處理二、統(tǒng)計數(shù)據(jù)的預處理三、統(tǒng)計分組三、統(tǒng)計分組四、統(tǒng)計表和統(tǒng)計圖四、統(tǒng)計表和統(tǒng)計圖這是本這是本章的基章的基本內(nèi)容本內(nèi)容一、統(tǒng)計整理的概念和意義一、統(tǒng)計整理的概念和意義二、統(tǒng)計整理的過程二、統(tǒng)計整理的過程三、統(tǒng)計整理的技術(shù)選擇三、統(tǒng)計整理的技術(shù)選擇統(tǒng)計整理是承上啟下的過程,是統(tǒng)計調(diào)查的繼續(xù)也是統(tǒng)計分析的基礎。根據(jù)統(tǒng)計研究的目的和要求,根據(jù)統(tǒng)計研究的目的和要求,對調(diào)查所得的各項原始材料進行科學的分對調(diào)查所得的各項原始材料進行科學的分類、加工和匯總,使之系統(tǒng)化、條理化的類、加工和匯總,使之系統(tǒng)化

2、、條理化的工作過程。工作過程。統(tǒng)計整理最后的統(tǒng)計整理最后的結(jié)果就是形成各結(jié)果就是形成各種統(tǒng)計表格和統(tǒng)種統(tǒng)計表格和統(tǒng)計圖。計圖。是統(tǒng)計調(diào)查的繼續(xù),是統(tǒng)計調(diào)查的繼續(xù),是統(tǒng)計分析的基礎。是統(tǒng)計分析的基礎。u統(tǒng)計整理方案設計統(tǒng)計整理方案設計l確定統(tǒng)計資料的處理方法,包括審核方法、分組方法、匯總方法等確定統(tǒng)計資料的處理方法,包括審核方法、分組方法、匯總方法等l確定用哪些具體的統(tǒng)計指標來說明總體確定用哪些具體的統(tǒng)計指標來說明總體u 統(tǒng)計資料的審核統(tǒng)計資料的審核l匯總前的審核匯總前的審核l匯總后的審核匯總后的審核u 統(tǒng)計資料的預處理統(tǒng)計資料的預處理l數(shù)據(jù)篩選數(shù)據(jù)篩選l梳理排序梳理排序u 統(tǒng)計分組統(tǒng)計分組u

3、匯總匯總u 編制統(tǒng)計表和統(tǒng)計圖編制統(tǒng)計表和統(tǒng)計圖 (一)組織形式(一)組織形式l 逐級匯總:自下而上逐級匯總:自下而上l 超級匯總:超級匯總:將全部資料集中到最高一級機關(guān)一次匯總將全部資料集中到最高一級機關(guān)一次匯總(二)匯總技術(shù)(二)匯總技術(shù) 1 1、手工匯總:劃記法、過錄法、折疊法、卡片法、手工匯總:劃記法、過錄法、折疊法、卡片法2 2、計算機匯總、計算機匯總?cè)?、統(tǒng)計整理的技術(shù)選擇三、統(tǒng)計整理的技術(shù)選擇第二節(jié) 統(tǒng)計數(shù)據(jù)的預處理 數(shù)據(jù)審核數(shù)據(jù)審核 數(shù)據(jù)篩選數(shù)據(jù)篩選 數(shù)據(jù)排序數(shù)據(jù)排序一、統(tǒng)計資料的審核一、統(tǒng)計資料的審核完整性:完整性: 檢查應調(diào)查的單位或檢查應調(diào)查的單位或個體是否有遺漏個體是否有

4、遺漏, , 所有的調(diào)查項所有的調(diào)查項目或指標是否填寫齊全目或指標是否填寫齊全及時性:檢查填報單位是否按及時性:檢查填報單位是否按時報送了有關(guān)資料時報送了有關(guān)資料準確性:主要審核登記性誤差準確性:主要審核登記性誤差(邏輯檢查和計算檢查)(邏輯檢查和計算檢查)歷史資料的審核歷史資料的審核復計審核復計審核表表審核表表審核表實審核表實審核對照審核對照審核數(shù)據(jù)篩選包括兩方面內(nèi)容:數(shù)據(jù)篩選包括兩方面內(nèi)容: 將某些不符合要求的數(shù)據(jù)或有明顯錯誤的將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除;數(shù)據(jù)予以剔除; 將某些符合特定條件的數(shù)據(jù)篩選出來,對將某些符合特定條件的數(shù)據(jù)篩選出來,對不符合特定要求的數(shù)據(jù)予以剔除

5、。不符合特定要求的數(shù)據(jù)予以剔除。二、數(shù)據(jù)篩選二、數(shù)據(jù)篩選 升序排列:各行數(shù)據(jù)按照某一個標志值升序排列:各行數(shù)據(jù)按照某一個標志值或指標值從小到大順序排列或指標值從小到大順序排列 降序排列:各行數(shù)據(jù)按照變量值從大到降序排列:各行數(shù)據(jù)按照變量值從大到小順序排列。小順序排列。三、數(shù)據(jù)排序三、數(shù)據(jù)排序(二)統(tǒng)計分組的作用(二)統(tǒng)計分組的作用劃分社會不同類型劃分社會不同類型例例單位:億元單位:億元類型類型1999年年2000年年2001年年2002年年農(nóng)業(yè)農(nóng)業(yè)14 106.213 873.6 14 462.814 931.5林業(yè)林業(yè)886.3936.5938.81 033.5牧業(yè)牧業(yè)6 997.6 7 3

6、93.17 963.18 454.6漁業(yè)漁業(yè)2 539.0 2 712.62 815.02 971.1合計合計24 519.124 915.826 179.627 390.8揭示社會經(jīng)濟現(xiàn)象的內(nèi)部結(jié)構(gòu)揭示社會經(jīng)濟現(xiàn)象的內(nèi)部結(jié)構(gòu)年份年份農(nóng)副產(chǎn)品農(nóng)副產(chǎn)品農(nóng)副產(chǎn)品加工品農(nóng)副產(chǎn)品加工品工礦產(chǎn)品工礦產(chǎn)品合計合計1950196019701980198519901995199957.531.036.718.717.513.07.35.233.242.337.729.526.929.226.225.19.326.725.651.855.657.866.569.7100100100100100100100100

7、我國出口商品構(gòu)成我國出口商品構(gòu)成(%)(%)劃分社會現(xiàn)象的依存關(guān)系劃分社會現(xiàn)象的依存關(guān)系按商品銷售額分組按商品銷售額分組(萬元萬元)商店數(shù)商店數(shù)(個個)流通費用率流通費用率(%)100以下以下100 500500 10001000 30003000 50005000 1000010000以上以上25701307540181011.210.69.98.77.87.06.3(一)按標志的性質(zhì)分組(一)按標志的性質(zhì)分組l按品質(zhì)標志分組按品質(zhì)標志分組l按數(shù)量標志分組按數(shù)量標志分組n單項式分組:離散型變量在變量值變動范圍不單項式分組:離散型變量在變量值變動范圍不大時,可以將一個變量值作為一組大時,可以將

8、一個變量值作為一組n組距式分組組距式分組u離散型變量取值范圍大、項數(shù)又多時離散型變量取值范圍大、項數(shù)又多時u連續(xù)型變量連續(xù)型變量(二)按標志的多少分組(二)按標志的多少分組l簡單分組:選擇一個標志分組簡單分組:選擇一個標志分組l復合分組:選擇兩個或兩個以上的標志結(jié)合起復合分組:選擇兩個或兩個以上的標志結(jié)合起來進行層疊分組來進行層疊分組 (三)分組體系(三)分組體系l 平行分組體系:選擇兩個或兩個以上的標志分別平行分組體系:選擇兩個或兩個以上的標志分別進行簡單分組進行簡單分組l 復合分組體系:選擇兩個或兩個以上的標志結(jié)合復合分組體系:選擇兩個或兩個以上的標志結(jié)合起來進行層疊分組起來進行層疊分組

9、全距全距組數(shù)和組距同時確定組數(shù)和組距同時確定全距全距R = R = 最大標志值最小標志值最大標志值最小標志值組距組距 = = 各組最大標志值(上限)各組最各組最大標志值(上限)各組最 小標志值(下限)小標志值(下限)在等距分組的條件下在等距分組的條件下, ,組數(shù)等于全距除以組距組數(shù)等于全距除以組距指每組兩端數(shù)值。分為上限和下限指每組兩端數(shù)值。分為上限和下限每組的終點數(shù)值(最大值)每組的終點數(shù)值(最大值)每組的起點數(shù)值(最小值)每組的起點數(shù)值(最小值)與變量的特點有關(guān),重合式和不重合式與變量的特點有關(guān),重合式和不重合式n指相鄰兩組中,前一組的上限和后一組的下限數(shù)值指相鄰兩組中,前一組的上限和后一

10、組的下限數(shù)值重合。重合。n一般用于連續(xù)型變量。一般用于連續(xù)型變量。n組距組距= =上限下限上限下限n例如:身高例如:身高1.60m1.60m1.70m1.70m、1.701.701.80m1.80m、 1.801.801.90m1.90mn所謂重合只是形式上相重所謂重合只是形式上相重, ,實際上兩組沒重合實際上兩組沒重合, ,在統(tǒng)在統(tǒng)計時一般采用計時一般采用原則處理原則處理也稱分布數(shù)列、次數(shù)分布或頻數(shù)分布,指反映總體也稱分布數(shù)列、次數(shù)分布或頻數(shù)分布,指反映總體單位在各組分布狀況的一系列數(shù)字。單位在各組分布狀況的一系列數(shù)字。組的名稱組的名稱各組次數(shù)(也稱頻數(shù))或單位數(shù)各組次數(shù)(也稱頻數(shù))或單位數(shù)

11、 按分組標志按分組標志 品質(zhì)數(shù)列品質(zhì)數(shù)列 變量數(shù)列變量數(shù)列分分布布 鐘形分布數(shù)列鐘形分布數(shù)列 正態(tài)分布正態(tài)分布數(shù)數(shù) 偏態(tài)分布偏態(tài)分布 左偏分布左偏分布列列 按次數(shù)分布特征按次數(shù)分布特征 右偏分布右偏分布 U U形分布數(shù)列形分布數(shù)列 J J形分布數(shù)列形分布數(shù)列 J J形形 倒倒J J形形 按變量值的表現(xiàn)形式按變量值的表現(xiàn)形式 單項式數(shù)列單項式數(shù)列 組距式數(shù)列組距式數(shù)列 等距數(shù)列等距數(shù)列 異距數(shù)列異距數(shù)列 按分組標志不同分為品質(zhì)數(shù)列和變量數(shù)列按分組標志不同分為品質(zhì)數(shù)列和變量數(shù)列 1 1)品質(zhì)分布數(shù)列)品質(zhì)分布數(shù)列各組名稱各組名稱次數(shù)(頻數(shù))次數(shù)(頻數(shù)) 頻率頻率1001000合計合計6040600

12、400男性男性女性女性所占所占人數(shù)人數(shù)按性別分組按性別分組2 2)變量數(shù)列)變量數(shù)列各組名稱各組名稱次數(shù)(頻數(shù))次數(shù)(頻數(shù))頻率頻率1001000合計合計815233415580150230340150501000元以下元以下1000-15001500-20002000-25002500-30003000元以上元以上所占()所占()人數(shù)(人)人數(shù)(人)按月工資收入分組按月工資收入分組1 1)單項式數(shù)列:各組由一個具體的變量值)單項式數(shù)列:各組由一個具體的變量值(單項)來表示的數(shù)列。(單項)來表示的數(shù)列。 單項式分組一般適用于離散型變量且變量單項式分組一般適用于離散型變量且變量變動范圍不大的場合

13、。變動范圍不大的場合。己知某車間有己知某車間有24名工人,他們的日產(chǎn)量(件)名工人,他們的日產(chǎn)量(件)分別是:分別是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根據(jù)以上資料編制變量數(shù)列。要求根據(jù)以上資料編制變量數(shù)列。單項分組舉例單項分組舉例日產(chǎn)量(件)日產(chǎn)量(件)X工人數(shù)(人工人數(shù)(人) f202122232425263564321合計合計24編制結(jié)果如下:編制結(jié)果如下:l組距式分組是以變量值變動的一定范圍(區(qū)間)作組距式分組是以變量值變動的一定范圍(區(qū)間)作為一組,區(qū)間的距離就是組距。這

14、樣的分組所形成的為一組,區(qū)間的距離就是組距。這樣的分組所形成的變量分配數(shù)列叫組距式變量數(shù)列,簡稱組距數(shù)列。變量分配數(shù)列叫組距式變量數(shù)列,簡稱組距數(shù)列。l每一組變量值中,其最小值稱為下限,最大值稱為每一組變量值中,其最小值稱為下限,最大值稱為上限。上限。對于連續(xù)型變量或者變動范圍較大的離散型變對于連續(xù)型變量或者變動范圍較大的離散型變量,適宜采用組距式分組。量,適宜采用組距式分組。2 2)組距式變量數(shù)列)組距式變量數(shù)列(二)頻數(shù)和頻率(二)頻數(shù)和頻率 累計次數(shù)分布表的編制累計次數(shù)分布表的編制 1 1、以下累計:即從低組到高組累計,表示該組上限、以下累計:即從低組到高組累計,表示該組上限以下的次數(shù)(

15、頻率)有多少。(向上累計)以下的次數(shù)(頻率)有多少。(向上累計) 2 2、以上累計:即從高組到低組累計,表示該組下限、以上累計:即從高組到低組累計,表示該組下限以上的次數(shù)(頻率)有多少。(向下累計)以上的次數(shù)(頻率)有多少。(向下累計) 累計次數(shù)分布圖的編制累計次數(shù)分布圖的編制 編制方法:以變量為橫軸,累計次數(shù)和累計頻率為縱編制方法:以變量為橫軸,累計次數(shù)和累計頻率為縱軸,繪制累計次數(shù)分布表。軸,繪制累計次數(shù)分布表。序序 計劃完成計劃完成 工人數(shù)工人數(shù) 比重比重 向上累計向上累計 向下累計向下累計 號號 程度(程度(%) (人)(人) (%) 累計人數(shù)累計人數(shù) 累計比重累計比重 人累計數(shù)人累計

16、數(shù) 累計比重累計比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7 120130 23 11.5 8 130140 8 4.0 合合 計計 200 100 2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100特征是特征是“兩頭小,中間大兩頭小,中間大”,即靠近中間的,即靠近中間的變量值分布的次數(shù)多,靠近兩端的變

17、量值分變量值分布的次數(shù)多,靠近兩端的變量值分布的次數(shù)少,其形狀宛如一口古鐘。布的次數(shù)少,其形狀宛如一口古鐘。 特征是靠近中間的變量值分布的次數(shù)少,特征是靠近中間的變量值分布的次數(shù)少, 靠近兩端的變量值分布的次數(shù)多,其形狀靠近兩端的變量值分布的次數(shù)多,其形狀 宛如英文字母宛如英文字母U U。如:人口死亡率。如:人口死亡率。特征是次數(shù)隨著變量值的增大而增多或隨變特征是次數(shù)隨著變量值的增大而增多或隨變量值的增大而減少,其形狀宛如英文大寫字量值的增大而減少,其形狀宛如英文大寫字母母J J鐘型分布鐘型分布對稱分布對稱分布右偏分布右偏分布左偏分布左偏分布U U型分布型分布J J型分布型分布正正J型分布型分

18、布反反J型分布型分布第一步第一步:將原始資料按數(shù)值大小依次排列,確定變量值的變動:將原始資料按數(shù)值大小依次排列,確定變量值的變動范圍。范圍。第二步第二步:確定變量的類型和分組方法(單變量分組或組距分組)。:確定變量的類型和分組方法(單變量分組或組距分組)。第三步第三步:確定組數(shù)和組距。當組數(shù)確定后,組距可計算得到:確定組數(shù)和組距。當組數(shù)確定后,組距可計算得到: 組距組距= =全距全距/ /組數(shù)組數(shù) 全距全距= =最大變量值最大變量值最小變量值。最小變量值。第四步第四步:確定組限和組限的表示方法。(第一組的下限要小于:確定組限和組限的表示方法。(第一組的下限要小于或等于最小變量值,最后一組的上限

19、要大于最大變量值。)或等于最小變量值,最后一組的上限要大于最大變量值。)第五步第五步:匯總出各組的單位數(shù)(注意:離散型變量各組單位:匯總出各組的單位數(shù)(注意:離散型變量各組單位 數(shù)的匯總方法),計算頻率,并編制統(tǒng)計表。數(shù)的匯總方法),計算頻率,并編制統(tǒng)計表。第四節(jié)第四節(jié) 統(tǒng)計表和統(tǒng)計圖統(tǒng)計表和統(tǒng)計圖 統(tǒng)計表統(tǒng)計表是集中而有序地是集中而有序地表現(xiàn)統(tǒng)計資料的表格。表現(xiàn)統(tǒng)計資料的表格。 統(tǒng)計表的結(jié)構(gòu)統(tǒng)計表的結(jié)構(gòu) 總標題、橫行標題、縱總標題、橫行標題、縱欄標題、數(shù)字資料欄標題、數(shù)字資料 統(tǒng)計表的種類統(tǒng)計表的種類 按主詞的分組情況分按主詞的分組情況分 簡單表簡單表 分組表分組表 復合表復合表 制表規(guī)則制

20、表規(guī)則 1.1.標題醒目準確標題醒目準確 2.2.主詞主詞 賓詞排列要有合理順序賓詞排列要有合理順序 3.3.欄目較多時欄目較多時, ,各欄應加編號各欄應加編號 4.4.規(guī)格合乎要求(上下粗線,規(guī)格合乎要求(上下粗線,左右開口,欄間劃線,行間空左右開口,欄間劃線,行間空白)白) 5.5.字跡清楚規(guī)范(數(shù)字按個位字跡清楚規(guī)范(數(shù)字按個位數(shù)上下對齊,無數(shù)填數(shù)上下對齊,無數(shù)填號,缺報號,缺報填填號)號) 6.6.要標明計量單位要標明計量單位 7 7單位負責人和填表人簽字蓋章單位負責人和填表人簽字蓋章例例分組分組總產(chǎn)值總產(chǎn)值(萬元萬元)職工人職工人數(shù)數(shù)(人人)勞動生產(chǎn)率勞動生產(chǎn)率(元元/人人)P123大型大型中型中型小型小型合計合計 2003年某月某公司各企業(yè)勞動生產(chǎn)率統(tǒng)計表 單位_橫橫行行標標題題 主詞主詞賓詞賓詞總標題總標題縱欄標題縱欄標題數(shù)據(jù)資料數(shù)據(jù)資料( (指標數(shù)值指標數(shù)值) )統(tǒng)計表統(tǒng)計表統(tǒng)計圖統(tǒng)計圖統(tǒng)計圖統(tǒng)計圖:以圖形形象地表現(xiàn)統(tǒng)計資料的一種形式。以圖形形象地表現(xiàn)統(tǒng)計資料的一種形式。1 1、直方圖、直方圖(粉紅色是累計曲線圖)(粉紅色是累計曲線圖)( (分組后次數(shù)的分布情況)分組后次數(shù)的分布情況) 直方圖02468100012001400160018002000220024002600

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論