統(tǒng)計數(shù)據(jù)的整理及其顯示課件_第1頁
統(tǒng)計數(shù)據(jù)的整理及其顯示課件_第2頁
統(tǒng)計數(shù)據(jù)的整理及其顯示課件_第3頁
統(tǒng)計數(shù)據(jù)的整理及其顯示課件_第4頁
統(tǒng)計數(shù)據(jù)的整理及其顯示課件_第5頁
已閱讀5頁,還剩207頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第3章統(tǒng)計數(shù)據(jù)的整理與顯示第3章統(tǒng)計數(shù)據(jù)的整理與顯示1統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的,將統(tǒng)計調(diào)查所得到的原始資料(也稱初級資料)進(jìn)行科學(xué)的分類和匯總,或?qū)σ呀?jīng)經(jīng)過加工的綜合資料(也稱次級資料)進(jìn)行再加工,為統(tǒng)計分析準(zhǔn)備系統(tǒng)化的、條理化的、能夠反映總體特征的綜合資料的工作過程。例如,某班50名學(xué)生,調(diào)查其考分資料如下:7765835668709965737288667463718462528078847981645882766273758979616554928673685169647863766872778176上述這些考分(原始資料)的特點是零星分散、不系統(tǒng)、無規(guī)律,不能反映學(xué)生總體的學(xué)習(xí)情況。統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的,將統(tǒng)計調(diào)查所得到的原始資料(也2按考分分組(分)學(xué)生人數(shù)(人)60以下60~7070~8080~9090~10051518102合計50由表3-1可見,整理后的學(xué)生考分資料,較整理前的考分資料明顯要條理、系統(tǒng)。由上表可見,在學(xué)生總體中,60分以下和90分以上的學(xué)生人數(shù)都較少,絕大多數(shù)學(xué)生的考分分布在60—89分之間。表3-1

所以,統(tǒng)計整理是統(tǒng)計調(diào)查的繼續(xù),是統(tǒng)計分析的前提,它實現(xiàn)了從個別單位的標(biāo)志表現(xiàn)(標(biāo)志值)向總體綜合指標(biāo)的過渡,在統(tǒng)計研究中起著承前啟后重要的作用。按考分分組(分)學(xué)生人數(shù)(人)60以下5合3統(tǒng)計數(shù)據(jù)的整理與顯示3.1統(tǒng)計數(shù)據(jù)的整理程序

3.2品質(zhì)數(shù)據(jù)的整理與顯示

3.3數(shù)值型數(shù)據(jù)的整理與顯示3.4次數(shù)分布及其類型3.5統(tǒng)計表與統(tǒng)計圖統(tǒng)計數(shù)據(jù)的整理與顯示3.1統(tǒng)計數(shù)據(jù)的整理程序4學(xué)習(xí)目標(biāo)充分認(rèn)識統(tǒng)計整理在統(tǒng)計研究中的承前啟后的地位;掌握統(tǒng)計數(shù)據(jù)的整理和顯示方法,特別是分組與變量數(shù)列的編制;了解統(tǒng)計表和統(tǒng)計圖的構(gòu)成和展示,能實際設(shè)計統(tǒng)計表和統(tǒng)計圖。學(xué)習(xí)目標(biāo)充分認(rèn)識統(tǒng)計整理在統(tǒng)計研究中的承前啟后的地位;5統(tǒng)計數(shù)據(jù)整理的程序1.制定整理方案(匯總方案);2.對調(diào)查資料進(jìn)行審核和糾正等(預(yù)處理);3.進(jìn)行統(tǒng)計分組(關(guān)鍵);4.進(jìn)行統(tǒng)計匯總;5.匯總后審核;6.編制統(tǒng)計表,繪制統(tǒng)計圖,顯示整理結(jié)果。統(tǒng)計數(shù)據(jù)整理的程序1.制定整理方案(匯總方案);6

根據(jù)統(tǒng)計調(diào)查目的,獲得統(tǒng)計資料的整理流程計劃:一是對總體資料的處理方法,如如何分組;二是確定用哪些具體的統(tǒng)計指標(biāo)來說明總體。一、制定統(tǒng)計整理方案一、制定統(tǒng)計整理方案7數(shù)據(jù)的審核發(fā)現(xiàn)數(shù)據(jù)中的錯誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序發(fā)現(xiàn)數(shù)據(jù)的基本特征升序和降序二、數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核二、數(shù)據(jù)的預(yù)處理8(1)統(tǒng)計資料的審核資料的審核

原始資料完整性準(zhǔn)確性邏輯檢查計算檢查二手資料適用

時效(1)統(tǒng)計資料的審核資料的審核原始資料完整性準(zhǔn)確性邏輯檢查9審核對第一手?jǐn)?shù)據(jù):(1)完整性審核:檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標(biāo)是否填寫齊全(2)準(zhǔn)確性審核:

真實性:檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際——邏輯檢查正確性:檢查數(shù)據(jù)是否有錯誤,計算是否正確等——計算檢查(定量數(shù)據(jù))

審核對第一手?jǐn)?shù)據(jù):10審核對第二手?jǐn)?shù)據(jù):完整性:準(zhǔn)確性:適用性:數(shù)據(jù)的來源、口徑以及有關(guān)背景資料;時效性:盡可能使用最新的數(shù)據(jù)。審核對第二手?jǐn)?shù)據(jù):11(2)數(shù)據(jù)篩選當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時,需要對數(shù)據(jù)進(jìn)行篩選。數(shù)據(jù)篩選的內(nèi)容:將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除;將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除。(2)數(shù)據(jù)篩選當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合12(3)數(shù)據(jù)的排序(3)數(shù)據(jù)的排序13數(shù)據(jù)的排序按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機(jī)完成。數(shù)據(jù)的排序按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,14定類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分定距和定比數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為X1,X2,…,XN,遞增排序后可表示為:X(1)<X(2)<…<X(N)遞減排序可表示為:X(1)>X(2)>…>X(N)定類數(shù)據(jù)的排序15

(五).匯總后審核:審核匯總工作質(zhì)量,匯總過程有無差錯。主要四種方法:一是復(fù)計審核;二是表表審核;三是表實審核;四是對照審核。(五).匯總后審核:16三.統(tǒng)計分組分組前分組后統(tǒng)計分組就是根據(jù)統(tǒng)計研究的目的和被研究現(xiàn)象的本質(zhì)特征,將統(tǒng)計總體按照一定的標(biāo)志劃分為若干性質(zhì)不同的部分或組。三.統(tǒng)計分組分組前分組后統(tǒng)計分組就是根據(jù)統(tǒng)計研究的目的和被研17.

.

統(tǒng)計分組是在總體內(nèi)部進(jìn)行的一種定性分類,它客觀上把總體劃分為一個個性質(zhì)不同,范圍更小的總體。統(tǒng)計分組有兩個方面的含義,即:統(tǒng)計分組對總體而言即將總體區(qū)分為性質(zhì)不同的若干組成部分是“合”即將性質(zhì)相同的總體單位合為一組是“分”對單位而言..統(tǒng)計分組是在總體內(nèi)部進(jìn)行的一種定性分類,它18.

1、統(tǒng)計分組的作用劃分現(xiàn)象的類型(區(qū)分事物的類型);研究總體的結(jié)構(gòu)(構(gòu)成)或比例關(guān)系;分析(探討)現(xiàn)象之間的依存關(guān)系。

注意:統(tǒng)計分組是對總體認(rèn)識深化的手段,它是一切統(tǒng)計研究的基礎(chǔ),應(yīng)用于統(tǒng)計工作的全過程,是統(tǒng)計研究的基本方法。

2、統(tǒng)計分組的原則窮盡原則互斥原則.1、統(tǒng)計分組的作用劃分現(xiàn)象的類型(區(qū)分事物的類型);19揭露社會經(jīng)濟(jì)現(xiàn)象的類型,反映各類型的特點。

⑴類型分組類型1999年2000年2001年2002年農(nóng)業(yè)14106.213873.614462.814931.5林業(yè)886.3936.5938.81033.5牧業(yè)6997.67393.17963.18454.6漁業(yè)2539.02712.62815.02971.1合計24519.124915.826179.627390.8例單位:億元揭露社會經(jīng)濟(jì)現(xiàn)象的類型,反映各類型的特點。⑴類型分組類20說明社會經(jīng)濟(jì)現(xiàn)象的內(nèi)部結(jié)構(gòu)。⑵結(jié)構(gòu)分組說明社會經(jīng)濟(jì)現(xiàn)象的內(nèi)部結(jié)構(gòu)。⑵結(jié)構(gòu)分組21例年份19961997199819992000第一產(chǎn)業(yè)20.419.118.617.615.9第二產(chǎn)業(yè)49.550.049.349.450.9第三產(chǎn)業(yè)30.130.932.133.033.2合計100.0100.0100.0100.0100.0“九五”期間我國國內(nèi)生產(chǎn)總值構(gòu)成(%)例年份19961997199819992000第一產(chǎn)業(yè)22研究經(jīng)濟(jì)現(xiàn)象之間的依存關(guān)系。⑶分析分組研究經(jīng)濟(jì)現(xiàn)象之間的依存關(guān)系。⑶分析分組23例耕作深度分組(cm)地塊數(shù)平均收獲率(斤/畝)10-12740012-141046014-161654016-1818-20125620680某鄉(xiāng)某種農(nóng)作物的耕作深度與收獲率的關(guān)系例耕作深度分組(cm)地塊數(shù)平均收獲率(斤/畝)10-1224.

.

3、統(tǒng)計分組的種類

(一)按分組標(biāo)志的多少不同

(二)按分組標(biāo)志的性質(zhì)不同簡單分組品質(zhì)分組數(shù)量(變量)分組復(fù)合分組..3、統(tǒng)計分組的種類25.

4、統(tǒng)計分組的方法

分組標(biāo)志的選擇:選擇分組標(biāo)志是統(tǒng)計分組的核心問題,必須根據(jù)統(tǒng)計研究的目的選擇分組標(biāo)志。品質(zhì)分組:是按品質(zhì)標(biāo)志進(jìn)行的分組。國民經(jīng)濟(jì)按產(chǎn)業(yè)分組:第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)人口按性別分組:男性女性用文字來表示各組性質(zhì)上的差別.4、統(tǒng)計分組的方法26.

.

數(shù)量分組數(shù)量分組的概念單項式分組與組距式分組

進(jìn)行組距式分組時應(yīng)注意的問題..數(shù)量分組27.

.

數(shù)量分組是按數(shù)量標(biāo)志進(jìn)行的分組。數(shù)量分組的概念例如,學(xué)生按考分分組(分)用數(shù)量來表示各組性質(zhì)上的差別60以下60~7070~8080~9090以上..數(shù)量分組是按數(shù)量標(biāo)志進(jìn)行的分組。數(shù)量分組的概28.

.

(1)單項式分組:即在變量分組中,一個組只有一個變量值。單項式分組與組距式分組

適用條件:

它適用于當(dāng)變量值變化范圍不大、不同變量值個數(shù)較少的離散型變量的場合。例如:居民家庭按子女?dāng)?shù)分組:0123(離散型變量)..(1)單項式分組:即在變量分組中,一個組只有29(2)組距式分組:就是將變量依次劃分為幾段區(qū)間,一段區(qū)間表現(xiàn)為從“……到……”距離,把一段區(qū)間內(nèi)的所有變量值歸為一組。區(qū)間的距離就是組距。例如:企業(yè)按人數(shù)分組499及以下500~9991000~29993000及以上工人按工資分組600~700700~800800~12001200~1500適用條件:

它適用于變量值變化范圍較大、不同變量值個數(shù)較多的離散型變量及連續(xù)型變量的場合。(離散型變量)(連續(xù)型變量)注意:連續(xù)型變量的數(shù)值不能一一列舉,故其只能采用組距式分組。(2)組距式分組:就是將變量依次劃分為幾段區(qū)間,一段區(qū)間表現(xiàn)30進(jìn)行組距式分組時應(yīng)注意的問題(1)組限及劃分方法

(2)等距分組與不等距分組(3)組中值進(jìn)行組距式分組時應(yīng)注意的問題(1)組限及劃分方法31499及以下500~9991000~29993000及以上600~700700~800800~12001200~1500(1)組限及劃分方法

組限:確立每組界限的兩個數(shù)字。其中,每組最大變量值稱為上限,每組最小變量值稱為下限。工人按工資分組:(連續(xù)變量)企業(yè)按人數(shù)分組:(離散變量)(重疊組限)(不重疊組限)499及以下600~700(1)組限及劃分方32組限的劃分方法:組限的劃分方法不重疊組限重疊組限(只適用于離散型變量)(適用于連續(xù)型變量和離散型變量.)重疊組限:不重疊組限:即相鄰兩組的上下限為同一個數(shù)值。即相鄰兩組的上下限為兩個不同的確定數(shù)值。故當(dāng)某單位的變量值剛好等于相鄰兩組的上下限時,一般把此值歸到作為下限的那一組中,即遵循“上限不在其內(nèi)”的原則。組限的劃分方法:組限的劃分方法不重疊組限重疊組限(只33.

.

企業(yè)按人數(shù)分組:499及以下500~9991000~29993000及以上(不重疊組限)企業(yè)按人數(shù)分組:500以下500~10001000~30003000及以上(重疊組限)..企業(yè)按人數(shù)分組:499及以下34.

.

(2)等距分組與不等距分組

組距分組等距分組不等距分組例如:按身高、考分分組等,應(yīng)采用等距分組。它便于各組間單位數(shù)與變量值的直接對比和各項指標(biāo)計算。適用場合:等距分組:即各組組距相同的分組。凡是在變量值分布比較均勻時采用。組距:每組變量值的變動范圍,即組距=上限–下限

..(2)等距分組與不等距分組35不等距分組:即各組組距不都相等的分組。適用場合:當(dāng)變量值分布很不均勻時采用。不等距分組多數(shù)是根據(jù)事物性質(zhì)變化的數(shù)量界限來確定組距,如人口按年齡分組。要注意不同年齡生理變化的特點,可分為:1歲以下;1~6歲;7~12歲;13~18歲;19~59歲;60歲以上。年齡段工人按工資分組(元)

600~700700~800800~12001200~1500不等距分組:即各組組距不都相等的分組。適用場合:當(dāng)變量值分布36.

(3)組中值

組中值是指組距數(shù)列中各組上限和下限之間的中點數(shù)值。注意:組中值經(jīng)常用來代表各組標(biāo)志值的平均水平,但要假定各組內(nèi)標(biāo)志值呈均勻分布。按考分分組50~6060~7070~8080~9090~100

55

75

658595組中值人數(shù)51518102.(3)組中值37.

.

若第一組出現(xiàn)“×××以下”或最末組出現(xiàn)“×××以上”字樣的組叫做開口組。首組組中值=首組上限–相鄰組組距的一半=末組下限+相鄰組組距的一半末組組中值50–10/2100+10/2例如:.首組:末組:按考分分組組中值50~605560~706570~807580~908590~1009550以下100以上45105..若第一組出現(xiàn)“×××以下”或最末組出現(xiàn)“×38年均收入(元)頻數(shù)(村)600—4000114000—5000355000—6000146000—100001610000—2500012合計88年均收入(元)頻數(shù)(村)<4000114000—5000355000—6000146000—1000016>1000012合計88或例:某地區(qū)農(nóng)戶收入分布年均收入(元)頻數(shù)(村)600—4000114000—50039編制:1、單變量數(shù)列還是組距式數(shù)列:變量的性質(zhì)及變異程度離散型變量且變異?。簡巫兞繑?shù)列離散型變量但變異大或連續(xù)型變量:組距式數(shù)列例如:按以五分制計分的成績對全班100名學(xué)生進(jìn)行分組,宜單變量數(shù)列;按以百分制計分的成績對全班100名學(xué)生進(jìn)行分組,宜組距式數(shù)列;例如:按身高對全班100名學(xué)生分組,只能組距式數(shù)列。編制:402、等距數(shù)列還是異距數(shù)列:變量分布的特征當(dāng)分布值很不均勻時,一般采用異距數(shù)列。如學(xué)生成績一般密集于某一區(qū)間,低于這一區(qū)間的學(xué)生為少數(shù),高于這一區(qū)間的學(xué)生也為少數(shù)。合理的做法是在密集區(qū)間內(nèi)使用較短的組距,在稀少區(qū)間內(nèi)使用較長的組距。當(dāng)?shù)攘康臉?biāo)志值不具有相同的意義時,一般采用異距數(shù)列。如:對新生兒和成人的年齡,同樣的一年或一月,其意義是不同的。進(jìn)行人口疾病研究的年齡分組時,一般1歲以下按月分組,1-10歲按年分組,11-20歲按5年分組……當(dāng)標(biāo)志值按一定比例發(fā)展變化:某些時候采用公比為10的不等距分組。如商場按營業(yè)額分組為:5萬元以下、5—50萬元、50—500萬元、500—5000萬元……2、等距數(shù)列還是異距數(shù)列:變量分布的特征413、開口數(shù)列還是閉口數(shù)列:極端變量值偏離分布中心的程度。極端變量值(極大值或極小值)遠(yuǎn)離分布中心:開口數(shù)列極端變量值(極大值或極小值)接近分布中心:閉口數(shù)列例如:成績:20分1人、55分1人、58分3人、60—70分10人……80—90分30人、91分3人、92分2人、95分1人最小組:“<60分”優(yōu)于“20—60分”(實際平均分49.8分)最大組:“90—95分”優(yōu)于“>90分”(實際平均分92分)同時兼顧習(xí)慣。統(tǒng)計數(shù)據(jù)的整理及其顯示42四、統(tǒng)計匯總頻數(shù):各組內(nèi)的總體單位數(shù)頻率:各組內(nèi)總體單位數(shù)占總體全部單位數(shù)的比率累計頻數(shù)(率):各組的頻數(shù)(率)累計加和向上累計制:由標(biāo)志值較小組向較大組累計。每一組的累計次數(shù)表示小于該組下限(變量)值的次數(shù)共有多少。向下累計制:由標(biāo)志值較大組向較小組累計。每一組的累計次數(shù)表示大于該組下限(變量)值的次數(shù)共有多少。四、統(tǒng)計匯總頻數(shù):各組內(nèi)的總體單位數(shù)43例考分次數(shù)向上累計向下累計

人數(shù)(人)比率(%)人數(shù)(人)比率(%)人數(shù)(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合計40100.04010040100某班統(tǒng)計學(xué)考試成績次數(shù)分配例次數(shù)向上累計向下累計

人數(shù)(人)比率(%)人數(shù)(人44

審核匯總工作質(zhì)量,匯總過程有無差錯。主要四種方法:一是復(fù)計審核;二是表表審核;三是表實審核;四是對照審核。五、匯總后審核五、匯總后審核453.2品質(zhì)數(shù)據(jù)的整理與顯示3.2品質(zhì)數(shù)據(jù)的整理與顯示46數(shù)據(jù)的整理與顯示的基本問題要弄清所面對的數(shù)據(jù)類型;不同類型的數(shù)據(jù),處理方式和方法不同。適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)。數(shù)據(jù)的整理與顯示的基本問題要弄清所面對的數(shù)據(jù)類型;47品質(zhì)數(shù)據(jù)的整理與顯示3.2.1定類數(shù)據(jù)的整理與顯示3.2.2定序數(shù)據(jù)的整理與顯示品質(zhì)數(shù)據(jù)的整理與顯示3.2.1定類數(shù)據(jù)的整理與顯示48定類數(shù)據(jù)的整理的基本過程2.計算各類別的頻數(shù);3.制作頻數(shù)分布表;分類頻數(shù)比例百分比比率ABCDE列出各類別;4.用圖形顯示數(shù)據(jù);定類數(shù)據(jù)的整理的基本過程2.計算各類別的頻數(shù);49定類數(shù)據(jù)的整理(可計算的統(tǒng)計量)頻數(shù)(frequency):落在各類別中的數(shù)據(jù)個數(shù)。比例(proportion):某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值。百分比(percentage):將對比的基數(shù)作為100而計算的比值。比率(ratio):不同類別數(shù)值的比值。頻數(shù)分布:也叫次數(shù)分布,就是把各個類別及落在其中的相應(yīng)頻數(shù)全部列出,并用表格的形式表現(xiàn)出來。

定類數(shù)據(jù)的整理(可計算的統(tǒng)計量)頻數(shù)(frequency)50按品質(zhì)標(biāo)志分組形成的頻數(shù)分布某廠職工人數(shù)統(tǒng)計表按性別分組男職工女職工合計人數(shù)(人)(頻數(shù))比例(%)(頻率)25311536868.7531.25100.00按品質(zhì)標(biāo)志分組形成的頻數(shù)分布某廠職工人數(shù)統(tǒng)計表按性別分組男51定類數(shù)據(jù)整理—頻數(shù)分布表【例1】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)。綠色健康飲品定類數(shù)據(jù)整理—頻數(shù)分布表【例1】一家市場調(diào)查公司為研究不同品52一、定類數(shù)據(jù)整理—頻數(shù)分布表

【例3.1】為研究廣告市場的狀況,一家廣告公司在某城市隨機(jī)抽取200人就廣告問題做了郵寄問卷調(diào)查,其中的一個問題是“您比較關(guān)心下列哪一類廣告?”1.商品廣告;2.服務(wù)廣告;3.金融廣告;4.房地產(chǎn)廣告;5.招生招聘廣告;6.其他廣告。表3-1某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100一、定類數(shù)據(jù)整理—頻數(shù)分布表

【例3.1】為研究廣告市場的狀53定類數(shù)據(jù)的圖形顯示1、條形圖(barchart)通過寬度相同的條形的高度或長短來比較各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)或頻率繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(columnchart)定類數(shù)據(jù)的圖形顯示1、條形圖(barchart)54定類數(shù)據(jù)的圖示—條形圖人數(shù)(人)5191610211204080120

商品廣告

服務(wù)廣告

金融廣告

房地產(chǎn)廣告

招生招聘廣告

其他廣告廣告類型

圖3-1某城市居民關(guān)注不同類型廣告的人數(shù)分布定類數(shù)據(jù)的圖示—條形圖人數(shù)(人)5191610211204055定類數(shù)據(jù)的圖示2、餅圖(piechart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形;主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題;繪制圓形圖時,樣本或總體中各部分所占的百分比用圓內(nèi)的各個扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定。定類數(shù)據(jù)的圖示2、餅圖(piechart)56定類數(shù)據(jù)的圖示—圓形圖

其他廣告1.0%

房地產(chǎn)廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務(wù)廣告25.5%

招生招聘廣告5.8%圖3-2某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成定類數(shù)據(jù)的圖示—圓形圖其他廣告1.0%房地產(chǎn)廣告8.573.2.2定序數(shù)據(jù)的整理可計算的統(tǒng)計量:

對于定序數(shù)據(jù),除了可用定類數(shù)據(jù)整理和顯示的方法之外,還可以計算:1.累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加。2.累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加。3.2.2定序數(shù)據(jù)的整理可計算的統(tǒng)計量:58.

.

在研究次數(shù)和頻率的分布時,常需要編制次數(shù)或頻率的累計分布數(shù)列。1.向上累計:是指將各組次數(shù)或頻率由變量值低的組向變量高的組累計。2.向下累計:是指將各組次數(shù)或頻率,由變量值高的組向變量值低的組逐組累計。如:表3-2

.累計分布有向上累計和向下累計兩種:如:表3-2

...在研究次數(shù)和頻率的分布時,常需要編制次數(shù)或59二、定序數(shù)據(jù)頻數(shù)分布表【例3.2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)非常不滿意不滿意一般滿意非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————二、定序數(shù)據(jù)頻數(shù)分布表【例3.2】在一項城市住房問題的研究中60表3-3乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)非常不滿意不滿意一般滿意非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————表3-3乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙61順序數(shù)據(jù)的圖示—累計頻數(shù)分布圖243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對住房狀況評價的累積頻數(shù)分布順序數(shù)據(jù)的圖示—累計頻數(shù)分布圖24300132225270062環(huán)形圖環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示;與餅圖類似,但又有區(qū)別:餅圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個樣本或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán)用于結(jié)構(gòu)比較研究;用于展示分類和順序數(shù)據(jù)。環(huán)形圖環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用638%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對住房狀況的評價環(huán)形圖8%36%31%15%7%33%26%21%13%10%非643.3數(shù)值型數(shù)據(jù)的整理與展示3.3數(shù)值型數(shù)據(jù)的整理與展示653.3.1數(shù)據(jù)分組與頻數(shù)分析3.3.2數(shù)值型數(shù)據(jù)的圖示3.3.1數(shù)據(jù)分組與頻數(shù)分析663.3.1數(shù)據(jù)分組與頻數(shù)分布1、排序,求全距(全距=最大值-最小值);2、確定變量的數(shù)據(jù)形式(單變量分組、組距分組);3、確定組數(shù):斯特格斯(Sturges)經(jīng)驗公式:4、確定各組組距:組距=全距/組數(shù)=(最大值-最小值)/組數(shù)5、根據(jù)分組整理成頻數(shù)分布表(確定各組組限,計算頻數(shù))數(shù)據(jù)分組的步驟3.3.1數(shù)據(jù)分組與頻數(shù)分布1、排序,求全距(全距=最大67頻數(shù)分布表的編制實例117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例2】某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個)。對數(shù)據(jù)進(jìn)行分組。

頻數(shù)分布表的編制實例117122124129681、排序,求全距:107108108110112112112114115117117117118118118119120120121122122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139全距=最大值-最小值=139-107=321、排序,求全距:692、確定變量的數(shù)據(jù)形式表3-3某車間50名工人日加工零件數(shù)分組表(**單變量值分組)零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221122、確定變量的數(shù)據(jù)形式表3-3某車間50名工人日加工703、確定組數(shù)K=1+log10N/log102=1+3.322lgN=1+3.322×lg50

≈73、確定組數(shù)K=1+log10N/log102714、確定各組組距組距=全距/組數(shù)=(最大值-最小值)/組數(shù)=32/7=4.6≈54、確定各組組距組距=全距/組數(shù)725、根據(jù)分組整理成頻數(shù)分布表表3-4某車間50名工人日加工零件數(shù)分組表(**組距分組:等距分組)按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計501005、根據(jù)分組整理成頻數(shù)分布表表3-4某車間50名工人73等距分組表(使用開口組)表2-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)110以下110~115115~120120~125125~130130~135135以上358141064610162820128合計50100等距分組表(使用開口組)表2-5某車間50名工人日加工74頻數(shù)分布表的編制【例3】表中是某電腦公司2005年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進(jìn)行分組頻數(shù)分布表的編制【例3】表中是某電腦公司2005年前四個月各753.3.2數(shù)據(jù)值型數(shù)據(jù)的圖形顯示Excel1、分組數(shù)據(jù)—直方圖和折線圖2、未分組數(shù)據(jù)—莖葉圖和箱線圖3.3.2數(shù)據(jù)值型數(shù)據(jù)的圖形顯示Excel1、分組數(shù)據(jù)—直76分組數(shù)據(jù)—直方圖(histogram)用于展示分組數(shù)據(jù)分布的一種圖形。用矩形的寬度和高度來表示頻數(shù)分布。本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標(biāo)系中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖。直方圖下的總面積等于1。分組數(shù)據(jù)—直方圖(histogram)用于展示分組數(shù)據(jù)分布的77直方圖的繪制140150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240銷售量(臺)直方圖的繪制140150210直方圖下的面積之和等于1某電腦78直方圖與條形圖的區(qū)別條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義;直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列;條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)。直方圖與條形圖的區(qū)別條形圖是用條形的長度(橫置時)表示各類別79分組數(shù)據(jù)—折線圖折線圖也稱頻數(shù)多邊形圖;是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉;折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸;折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布一致。分組數(shù)據(jù)—折線圖折線圖也稱頻數(shù)多邊形圖;80折線圖的繪制折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530銷售量(臺)折線圖的繪制折線圖與直方圖140150210某電腦公司銷售量81未分組數(shù)據(jù)—莖葉圖(stem-and-leaf)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉,樹葉上只保留最后一位數(shù)字對于n(20n300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過

L=[10×lgn]莖葉圖類似于橫置的直方圖,但又有區(qū)別:直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖(stem-and-leaf)用于顯示未分82樹莖樹葉7880223477788890012222333344466777889013344579910111213數(shù)據(jù)個數(shù)3132410莖葉圖類似橫置的直方圖莖葉圖的制作某車間工人日加工零件數(shù)的莖葉圖樹莖樹葉7880223477788890012222333383未分組數(shù)據(jù)—箱線圖(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布;由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成;繪制方法:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU);連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接;該箱線圖也稱為Median/Quart./Range箱線圖。未分組數(shù)據(jù)—箱線圖(boxplot)用于顯示未分組的原始數(shù)84箱線圖的構(gòu)成中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖箱線圖的構(gòu)成:箱線圖的構(gòu)成中位數(shù)4681012QUQLX最大值X最小值Me85單批數(shù)據(jù)箱線圖最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Range箱線圖單批數(shù)據(jù)箱線圖最小值最大值中位數(shù)下四分位數(shù)上四分位數(shù)14086分布的形狀與箱線圖

對稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線圖分布的形狀與箱線圖對稱分布QL中位數(shù)QU左偏分布QL873.4次數(shù)分布及其類型

3.4次數(shù)分布及其類型88次數(shù)分布及其類型3.4.1分配數(shù)列的概念和構(gòu)成要素3.4.2分配數(shù)列的種類及編制方法3.4.3次數(shù)分布的主要類型次數(shù)分布及其類型3.4.1分配數(shù)列的概念和構(gòu)成要素89.

.

3.4.1分配數(shù)列的概念和構(gòu)成要素

分配數(shù)列是指在統(tǒng)計分組的基礎(chǔ)上,將總體所有單位按組歸類排隊,形成總體中各單位在各組間的分布,又稱分布數(shù)列或統(tǒng)計分布。

分配數(shù)列的概念。按性別分組男生女生合計表3-6表3-7按考分分組

50~6060~7070~8080~9090~100合計

人數(shù)(人)

頻率(%)20306040501005人數(shù)(人)

頻率(%)103010151850236420100..3.4.1分配數(shù)列的概念和構(gòu)成要素90.

.

分配數(shù)列的構(gòu)成要素分配數(shù)列的構(gòu)成要素總體按某標(biāo)志所分的各個組各組次數(shù)或頻率次數(shù)(頻數(shù)):頻率:所以,次數(shù)或頻率分布形成的數(shù)列叫分配數(shù)列。即分布在各組的單位數(shù)。即各組次數(shù)與總次數(shù)之比。..分配數(shù)列的構(gòu)成要素分配數(shù)列的構(gòu)成要素總體按91.

.

3.4.2分配數(shù)列的種類及編制方法

(一)品質(zhì)數(shù)列

分配數(shù)列的種類1.單項式變

量數(shù)列

2.組距式變

量數(shù)列

(二)變量數(shù)列

..3.4.2分配數(shù)列的種類及編制方法92.

.

(一)品質(zhì)分配數(shù)列

按品質(zhì)標(biāo)志分組所形成的分配數(shù)列稱為品質(zhì)分配數(shù)列(品質(zhì)數(shù)列)。按性別分組人數(shù)(人)

頻率(%)男生女生30206040合計50100一般來說品質(zhì)數(shù)列較容易編制,它通常能準(zhǔn)確地反映總體的分配特征,一旦分組標(biāo)志確定以后,其分布數(shù)列的形式是唯一的。例如:表3-8..(一)品質(zhì)分配數(shù)列93.

.

(二)變量數(shù)列

按數(shù)量標(biāo)志分組所形成的分布數(shù)列稱為變量分配數(shù)列(變量數(shù)列)。按順序列出的各組變量值及相應(yīng)的頻率,即成為變量的頻率分布。按考分分組人數(shù)(人)頻率(%)50~6060~7070~8080~9090~10051518102103036204合計50100例如:表3-9

注意:任何一個頻率分布都必須滿足兩個條件:一是各組頻率≥0;二是各組頻率之和等于100%。..(二)變量數(shù)列941.單項式變量數(shù)列2.組距式變量數(shù)列(由單項式分組形成)居民家庭按子女?dāng)?shù)分組(個)戶數(shù)(戶)0123420601509040合計360按考分分組人數(shù)(人)頻率(%)50~6060~7070~8080~9090~10051518102103036204合計50100表3-10(單項式變量數(shù)列)(組距式變量數(shù)列)表3-11變量數(shù)列(由組距式分組形成)1.單項式變量數(shù)列2.組距式變量數(shù)列(由單項式分組形成)居民95.

.

3.4.3次數(shù)分布的主要類型

次數(shù)分布類型主要有三種:鐘型分布、U型分布和J型分布。

其分布特征是“兩頭小,中間大”,即靠近中間的變量值分布分布的次數(shù)多,靠近兩端的變量值分布分布的次數(shù)少。1.鐘型分布:fx正態(tài)分布即其分布曲線形如一口古鐘,故稱鐘型分布例如,如人的身高、體重、職工工資、農(nóng)作物畝產(chǎn)量、市場價格、學(xué)生的考分等現(xiàn)象都屬于鐘型分布。其分布又可分為以下兩種:正態(tài)分布和偏態(tài)分布。

圖3-1...3.4.3次數(shù)分布的主要類型96.

.

正態(tài)分布:

中間變量值分布的次數(shù)最多,兩側(cè)變量值分布的次數(shù)隨著與中間變量值距離的增大而漸次減少,并且圍繞中心變量值兩側(cè)呈對稱分布。見圖3-1

。.偏態(tài)分布:當(dāng)變量值存在極大值時,次數(shù)分布曲線會較正態(tài)分布向右延伸,這種分布稱為右偏分布,見圖3-2。右偏分布當(dāng)變量值存在極小值時,次數(shù)分布曲線就會較正態(tài)分布向左延伸,這種分布稱為左偏分布。圖3-2圖3-3左偏分布見圖3-3。

xffx..正態(tài)分布:中間變量值分97其分布的特征是一邊小一邊大的單調(diào)分布,即形如字母J字。它是與鐘型分布圖形相反的分布,其特點是:越靠近中間變量值分布次數(shù)較少;越靠近兩端變量值分布的次數(shù)較多,形成“兩頭大、中間小”的分布特征。.

.

2.U型分布:見圖3-4。3.J型分布:U型分布xf圖3-4J型分布有兩種類型,即:正J型分布與反J分布。見圖3-5和圖3-6。圖3-5xf正J型分布反J型分布圖3-6xf其分布的特征是一邊小一98頻數(shù)分布的類型對稱分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見的頻數(shù)分布頻數(shù)分布的類型對稱分布右偏分布左偏分布正J型分布反J型分布U993.5統(tǒng)計圖和統(tǒng)計表的使用3.5統(tǒng)計圖和統(tǒng)計表的使用100統(tǒng)計圖和統(tǒng)計表3.5.1統(tǒng)計圖3.5.2統(tǒng)計表統(tǒng)計圖和統(tǒng)計表3.5.1統(tǒng)計圖1013.5.1統(tǒng)計表2002~2003年我國城鎮(zhèn)居民家庭抽樣調(diào)查資料項目單位2002年2003年

調(diào)查戶數(shù)平均每戶家庭人口平均每戶就業(yè)人口平均每戶就業(yè)面平均一名就業(yè)者負(fù)擔(dān)人數(shù)平均每人全部年收入??芍涫杖肫骄咳讼M性支出戶人人%元元元元453173.041.5851.971.928177.407702.806029.88480283.011.5852.491.919061.228472.206510.94資料來源:《中國統(tǒng)計年鑒2004》,中國統(tǒng)計出版社,2004,第359頁。注:本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查資料。

行標(biāo)題列標(biāo)題數(shù)字資料表頭附加主詞欄賓詞欄統(tǒng)計表的結(jié)構(gòu)(分別從形式和內(nèi)容來看)3.5.1統(tǒng)計表2002~2003年我國城鎮(zhèn)居民家庭抽樣調(diào)102總標(biāo)題要簡明確切地概括統(tǒng)計表內(nèi)容,一般需滿足3W(統(tǒng)計數(shù)據(jù)的時間、地點及何種數(shù)據(jù))要求;數(shù)據(jù)計量單位相同時,可放在表的右上角標(biāo)明,不同時應(yīng)放在每個變量后或單列出一列標(biāo)明;表中的上下兩條橫線一般用粗線,其他用細(xì)線;通常情況下,統(tǒng)計表的左右兩邊不封口;表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應(yīng)以小數(shù)點對齊,而且小數(shù)點的位數(shù)應(yīng)統(tǒng)一;對于沒有數(shù)字的表格單元,一般用“—”表示;必要時可在表的下方加上注釋。統(tǒng)計表的設(shè)計總標(biāo)題要簡明確切地概括統(tǒng)計表內(nèi)容,一般需滿足3W(統(tǒng)計數(shù)據(jù)103統(tǒng)計圖是用點、線、面或立體圖形等形式直觀地表達(dá)統(tǒng)計資料的數(shù)值大小、分布情況、發(fā)展變化趨勢或相互關(guān)系等。統(tǒng)計圖所表示的數(shù)量關(guān)系,比統(tǒng)計表更加明白具體,使人一目了然,印象深刻。5.5.2統(tǒng)計圖統(tǒng)計圖是用點、線、面或立體圖形等形式直觀地表104標(biāo)題:圖的標(biāo)題應(yīng)簡明扼要,切合圖的內(nèi)容,必要時可注明時間、地點。圖號:文章中若有幾幅畫,則需按其出現(xiàn)的先后次序編上序號,寫在圖題的左前方。標(biāo)目:對于有縱橫軸的統(tǒng)計圖,應(yīng)在縱橫軸上分別標(biāo)明統(tǒng)計項目及其尺度。圖形:圖形線在圖中為最粗,而且要清晰。統(tǒng)計圖的結(jié)構(gòu)標(biāo)題:圖的標(biāo)題應(yīng)簡明扼要,切合圖的內(nèi)容,必要時可注明時間、地105條形圖與柱狀圖(大小的比較)餅圖(總體的結(jié)構(gòu))直方圖、莖葉圖和箱式圖(數(shù)據(jù)分布)時序圖(發(fā)展變化趨勢)散點圖(兩變量之間的關(guān)系)常用統(tǒng)計圖條形圖與柱狀圖(大小的比較)常用統(tǒng)計圖106第3章統(tǒng)計數(shù)據(jù)的整理與顯示第3章統(tǒng)計數(shù)據(jù)的整理與顯示107統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的,將統(tǒng)計調(diào)查所得到的原始資料(也稱初級資料)進(jìn)行科學(xué)的分類和匯總,或?qū)σ呀?jīng)經(jīng)過加工的綜合資料(也稱次級資料)進(jìn)行再加工,為統(tǒng)計分析準(zhǔn)備系統(tǒng)化的、條理化的、能夠反映總體特征的綜合資料的工作過程。例如,某班50名學(xué)生,調(diào)查其考分資料如下:7765835668709965737288667463718462528078847981645882766273758979616554928673685169647863766872778176上述這些考分(原始資料)的特點是零星分散、不系統(tǒng)、無規(guī)律,不能反映學(xué)生總體的學(xué)習(xí)情況。統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的,將統(tǒng)計調(diào)查所得到的原始資料(也108按考分分組(分)學(xué)生人數(shù)(人)60以下60~7070~8080~9090~10051518102合計50由表3-1可見,整理后的學(xué)生考分資料,較整理前的考分資料明顯要條理、系統(tǒng)。由上表可見,在學(xué)生總體中,60分以下和90分以上的學(xué)生人數(shù)都較少,絕大多數(shù)學(xué)生的考分分布在60—89分之間。表3-1

所以,統(tǒng)計整理是統(tǒng)計調(diào)查的繼續(xù),是統(tǒng)計分析的前提,它實現(xiàn)了從個別單位的標(biāo)志表現(xiàn)(標(biāo)志值)向總體綜合指標(biāo)的過渡,在統(tǒng)計研究中起著承前啟后重要的作用。按考分分組(分)學(xué)生人數(shù)(人)60以下5合109統(tǒng)計數(shù)據(jù)的整理與顯示3.1統(tǒng)計數(shù)據(jù)的整理程序

3.2品質(zhì)數(shù)據(jù)的整理與顯示

3.3數(shù)值型數(shù)據(jù)的整理與顯示3.4次數(shù)分布及其類型3.5統(tǒng)計表與統(tǒng)計圖統(tǒng)計數(shù)據(jù)的整理與顯示3.1統(tǒng)計數(shù)據(jù)的整理程序110學(xué)習(xí)目標(biāo)充分認(rèn)識統(tǒng)計整理在統(tǒng)計研究中的承前啟后的地位;掌握統(tǒng)計數(shù)據(jù)的整理和顯示方法,特別是分組與變量數(shù)列的編制;了解統(tǒng)計表和統(tǒng)計圖的構(gòu)成和展示,能實際設(shè)計統(tǒng)計表和統(tǒng)計圖。學(xué)習(xí)目標(biāo)充分認(rèn)識統(tǒng)計整理在統(tǒng)計研究中的承前啟后的地位;111統(tǒng)計數(shù)據(jù)整理的程序1.制定整理方案(匯總方案);2.對調(diào)查資料進(jìn)行審核和糾正等(預(yù)處理);3.進(jìn)行統(tǒng)計分組(關(guān)鍵);4.進(jìn)行統(tǒng)計匯總;5.匯總后審核;6.編制統(tǒng)計表,繪制統(tǒng)計圖,顯示整理結(jié)果。統(tǒng)計數(shù)據(jù)整理的程序1.制定整理方案(匯總方案);112

根據(jù)統(tǒng)計調(diào)查目的,獲得統(tǒng)計資料的整理流程計劃:一是對總體資料的處理方法,如如何分組;二是確定用哪些具體的統(tǒng)計指標(biāo)來說明總體。一、制定統(tǒng)計整理方案一、制定統(tǒng)計整理方案113數(shù)據(jù)的審核發(fā)現(xiàn)數(shù)據(jù)中的錯誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序發(fā)現(xiàn)數(shù)據(jù)的基本特征升序和降序二、數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核二、數(shù)據(jù)的預(yù)處理114(1)統(tǒng)計資料的審核資料的審核

原始資料完整性準(zhǔn)確性邏輯檢查計算檢查二手資料適用

時效(1)統(tǒng)計資料的審核資料的審核原始資料完整性準(zhǔn)確性邏輯檢查115審核對第一手?jǐn)?shù)據(jù):(1)完整性審核:檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標(biāo)是否填寫齊全(2)準(zhǔn)確性審核:

真實性:檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際——邏輯檢查正確性:檢查數(shù)據(jù)是否有錯誤,計算是否正確等——計算檢查(定量數(shù)據(jù))

審核對第一手?jǐn)?shù)據(jù):116審核對第二手?jǐn)?shù)據(jù):完整性:準(zhǔn)確性:適用性:數(shù)據(jù)的來源、口徑以及有關(guān)背景資料;時效性:盡可能使用最新的數(shù)據(jù)。審核對第二手?jǐn)?shù)據(jù):117(2)數(shù)據(jù)篩選當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時,需要對數(shù)據(jù)進(jìn)行篩選。數(shù)據(jù)篩選的內(nèi)容:將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除;將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除。(2)數(shù)據(jù)篩選當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合118(3)數(shù)據(jù)的排序(3)數(shù)據(jù)的排序119數(shù)據(jù)的排序按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機(jī)完成。數(shù)據(jù)的排序按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,120定類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分定距和定比數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為X1,X2,…,XN,遞增排序后可表示為:X(1)<X(2)<…<X(N)遞減排序可表示為:X(1)>X(2)>…>X(N)定類數(shù)據(jù)的排序121

(五).匯總后審核:審核匯總工作質(zhì)量,匯總過程有無差錯。主要四種方法:一是復(fù)計審核;二是表表審核;三是表實審核;四是對照審核。(五).匯總后審核:122三.統(tǒng)計分組分組前分組后統(tǒng)計分組就是根據(jù)統(tǒng)計研究的目的和被研究現(xiàn)象的本質(zhì)特征,將統(tǒng)計總體按照一定的標(biāo)志劃分為若干性質(zhì)不同的部分或組。三.統(tǒng)計分組分組前分組后統(tǒng)計分組就是根據(jù)統(tǒng)計研究的目的和被研123.

.

統(tǒng)計分組是在總體內(nèi)部進(jìn)行的一種定性分類,它客觀上把總體劃分為一個個性質(zhì)不同,范圍更小的總體。統(tǒng)計分組有兩個方面的含義,即:統(tǒng)計分組對總體而言即將總體區(qū)分為性質(zhì)不同的若干組成部分是“合”即將性質(zhì)相同的總體單位合為一組是“分”對單位而言..統(tǒng)計分組是在總體內(nèi)部進(jìn)行的一種定性分類,它124.

1、統(tǒng)計分組的作用劃分現(xiàn)象的類型(區(qū)分事物的類型);研究總體的結(jié)構(gòu)(構(gòu)成)或比例關(guān)系;分析(探討)現(xiàn)象之間的依存關(guān)系。

注意:統(tǒng)計分組是對總體認(rèn)識深化的手段,它是一切統(tǒng)計研究的基礎(chǔ),應(yīng)用于統(tǒng)計工作的全過程,是統(tǒng)計研究的基本方法。

2、統(tǒng)計分組的原則窮盡原則互斥原則.1、統(tǒng)計分組的作用劃分現(xiàn)象的類型(區(qū)分事物的類型);125揭露社會經(jīng)濟(jì)現(xiàn)象的類型,反映各類型的特點。

⑴類型分組類型1999年2000年2001年2002年農(nóng)業(yè)14106.213873.614462.814931.5林業(yè)886.3936.5938.81033.5牧業(yè)6997.67393.17963.18454.6漁業(yè)2539.02712.62815.02971.1合計24519.124915.826179.627390.8例單位:億元揭露社會經(jīng)濟(jì)現(xiàn)象的類型,反映各類型的特點。⑴類型分組類126說明社會經(jīng)濟(jì)現(xiàn)象的內(nèi)部結(jié)構(gòu)。⑵結(jié)構(gòu)分組說明社會經(jīng)濟(jì)現(xiàn)象的內(nèi)部結(jié)構(gòu)。⑵結(jié)構(gòu)分組127例年份19961997199819992000第一產(chǎn)業(yè)20.419.118.617.615.9第二產(chǎn)業(yè)49.550.049.349.450.9第三產(chǎn)業(yè)30.130.932.133.033.2合計100.0100.0100.0100.0100.0“九五”期間我國國內(nèi)生產(chǎn)總值構(gòu)成(%)例年份19961997199819992000第一產(chǎn)業(yè)128研究經(jīng)濟(jì)現(xiàn)象之間的依存關(guān)系。⑶分析分組研究經(jīng)濟(jì)現(xiàn)象之間的依存關(guān)系。⑶分析分組129例耕作深度分組(cm)地塊數(shù)平均收獲率(斤/畝)10-12740012-141046014-161654016-1818-20125620680某鄉(xiāng)某種農(nóng)作物的耕作深度與收獲率的關(guān)系例耕作深度分組(cm)地塊數(shù)平均收獲率(斤/畝)10-12130.

.

3、統(tǒng)計分組的種類

(一)按分組標(biāo)志的多少不同

(二)按分組標(biāo)志的性質(zhì)不同簡單分組品質(zhì)分組數(shù)量(變量)分組復(fù)合分組..3、統(tǒng)計分組的種類131.

4、統(tǒng)計分組的方法

分組標(biāo)志的選擇:選擇分組標(biāo)志是統(tǒng)計分組的核心問題,必須根據(jù)統(tǒng)計研究的目的選擇分組標(biāo)志。品質(zhì)分組:是按品質(zhì)標(biāo)志進(jìn)行的分組。國民經(jīng)濟(jì)按產(chǎn)業(yè)分組:第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)人口按性別分組:男性女性用文字來表示各組性質(zhì)上的差別.4、統(tǒng)計分組的方法132.

.

數(shù)量分組數(shù)量分組的概念單項式分組與組距式分組

進(jìn)行組距式分組時應(yīng)注意的問題..數(shù)量分組133.

.

數(shù)量分組是按數(shù)量標(biāo)志進(jìn)行的分組。數(shù)量分組的概念例如,學(xué)生按考分分組(分)用數(shù)量來表示各組性質(zhì)上的差別60以下60~7070~8080~9090以上..數(shù)量分組是按數(shù)量標(biāo)志進(jìn)行的分組。數(shù)量分組的概134.

.

(1)單項式分組:即在變量分組中,一個組只有一個變量值。單項式分組與組距式分組

適用條件:

它適用于當(dāng)變量值變化范圍不大、不同變量值個數(shù)較少的離散型變量的場合。例如:居民家庭按子女?dāng)?shù)分組:0123(離散型變量)..(1)單項式分組:即在變量分組中,一個組只有135(2)組距式分組:就是將變量依次劃分為幾段區(qū)間,一段區(qū)間表現(xiàn)為從“……到……”距離,把一段區(qū)間內(nèi)的所有變量值歸為一組。區(qū)間的距離就是組距。例如:企業(yè)按人數(shù)分組499及以下500~9991000~29993000及以上工人按工資分組600~700700~800800~12001200~1500適用條件:

它適用于變量值變化范圍較大、不同變量值個數(shù)較多的離散型變量及連續(xù)型變量的場合。(離散型變量)(連續(xù)型變量)注意:連續(xù)型變量的數(shù)值不能一一列舉,故其只能采用組距式分組。(2)組距式分組:就是將變量依次劃分為幾段區(qū)間,一段區(qū)間表現(xiàn)136進(jìn)行組距式分組時應(yīng)注意的問題(1)組限及劃分方法

(2)等距分組與不等距分組(3)組中值進(jìn)行組距式分組時應(yīng)注意的問題(1)組限及劃分方法137499及以下500~9991000~29993000及以上600~700700~800800~12001200~1500(1)組限及劃分方法

組限:確立每組界限的兩個數(shù)字。其中,每組最大變量值稱為上限,每組最小變量值稱為下限。工人按工資分組:(連續(xù)變量)企業(yè)按人數(shù)分組:(離散變量)(重疊組限)(不重疊組限)499及以下600~700(1)組限及劃分方138組限的劃分方法:組限的劃分方法不重疊組限重疊組限(只適用于離散型變量)(適用于連續(xù)型變量和離散型變量.)重疊組限:不重疊組限:即相鄰兩組的上下限為同一個數(shù)值。即相鄰兩組的上下限為兩個不同的確定數(shù)值。故當(dāng)某單位的變量值剛好等于相鄰兩組的上下限時,一般把此值歸到作為下限的那一組中,即遵循“上限不在其內(nèi)”的原則。組限的劃分方法:組限的劃分方法不重疊組限重疊組限(只139.

.

企業(yè)按人數(shù)分組:499及以下500~9991000~29993000及以上(不重疊組限)企業(yè)按人數(shù)分組:500以下500~10001000~30003000及以上(重疊組限)..企業(yè)按人數(shù)分組:499及以下140.

.

(2)等距分組與不等距分組

組距分組等距分組不等距分組例如:按身高、考分分組等,應(yīng)采用等距分組。它便于各組間單位數(shù)與變量值的直接對比和各項指標(biāo)計算。適用場合:等距分組:即各組組距相同的分組。凡是在變量值分布比較均勻時采用。組距:每組變量值的變動范圍,即組距=上限–下限

..(2)等距分組與不等距分組141不等距分組:即各組組距不都相等的分組。適用場合:當(dāng)變量值分布很不均勻時采用。不等距分組多數(shù)是根據(jù)事物性質(zhì)變化的數(shù)量界限來確定組距,如人口按年齡分組。要注意不同年齡生理變化的特點,可分為:1歲以下;1~6歲;7~12歲;13~18歲;19~59歲;60歲以上。年齡段工人按工資分組(元)

600~700700~800800~12001200~1500不等距分組:即各組組距不都相等的分組。適用場合:當(dāng)變量值分布142.

(3)組中值

組中值是指組距數(shù)列中各組上限和下限之間的中點數(shù)值。注意:組中值經(jīng)常用來代表各組標(biāo)志值的平均水平,但要假定各組內(nèi)標(biāo)志值呈均勻分布。按考分分組50~60

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論