統(tǒng)計數(shù)據(jù)的整理及其顯示_第1頁
統(tǒng)計數(shù)據(jù)的整理及其顯示_第2頁
統(tǒng)計數(shù)據(jù)的整理及其顯示_第3頁
統(tǒng)計數(shù)據(jù)的整理及其顯示_第4頁
統(tǒng)計數(shù)據(jù)的整理及其顯示_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第3章統(tǒng)計數(shù)據(jù)的整理與顯示統(tǒng)計整理是根據(jù)統(tǒng)計研究的目的,將統(tǒng)計調(diào)查所得到的原始資料(也稱初級資料)進行科學的分類和匯總,或?qū)σ呀?jīng)經(jīng)過加工的綜合資料(也稱次級資料)進行再加工,為統(tǒng)計分析準備系統(tǒng)化的、條理化的、能夠反映總體特征的綜合資料的工作過程。例如,某班50名學生,調(diào)查其考分資料如下:7765835668709965737288667463718462528078847981645882766273758979616554928673685169647863766872778176上述這些考分(原始資料)的特點是零星分散、不系統(tǒng)、無規(guī)律,不能反映學生總體的學習情況。按考分分組(分)學生人數(shù)(人)60以下60~7070~8080~9090~10051518102合計50由表3-1可見,整理后的學生考分資料,較整理前的考分資料明顯要條理、系統(tǒng)。由上表可見,在學生總體中,60分以下和90分以上的學生人數(shù)都較少,絕大多數(shù)學生的考分分布在60—89分之間。表3-1

所以,統(tǒng)計整理是統(tǒng)計調(diào)查的繼續(xù),是統(tǒng)計分析的前提,它實現(xiàn)了從個別單位的標志表現(xiàn)(標志值)向總體綜合指標的過渡,在統(tǒng)計研究中起著承前啟后重要的作用。統(tǒng)計數(shù)據(jù)的整理與顯示3.1統(tǒng)計數(shù)據(jù)的整理程序

3.2品質(zhì)數(shù)據(jù)的整理與顯示

3.3數(shù)值型數(shù)據(jù)的整理與顯示3.4次數(shù)分布及其類型3.5統(tǒng)計表與統(tǒng)計圖學習目標充分認識統(tǒng)計整理在統(tǒng)計研究中的承前啟后的地位;掌握統(tǒng)計數(shù)據(jù)的整理和顯示方法,特別是分組與變量數(shù)列的編制;了解統(tǒng)計表和統(tǒng)計圖的構成和展示,能實際設計統(tǒng)計表和統(tǒng)計圖。統(tǒng)計數(shù)據(jù)整理的程序1.制定整理方案(匯總方案);2.對調(diào)查資料進行審核和糾正等(預處理);3.進行統(tǒng)計分組(關鍵);4.進行統(tǒng)計匯總;5.匯總后審核;6.編制統(tǒng)計表,繪制統(tǒng)計圖,顯示整理結果。

根據(jù)統(tǒng)計調(diào)查目的,獲得統(tǒng)計資料的整理流程計劃:一是對總體資料的處理方法,如如何分組;二是確定用哪些具體的統(tǒng)計指標來說明總體。一、制定統(tǒng)計整理方案數(shù)據(jù)的審核發(fā)現(xiàn)數(shù)據(jù)中的錯誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序發(fā)現(xiàn)數(shù)據(jù)的基本特征升序和降序二、數(shù)據(jù)的預處理(1)統(tǒng)計資料的審核資料的審核

原始資料完整性準確性邏輯檢查計算檢查二手資料適用

時效審核對第一手數(shù)據(jù):(1)完整性審核:檢查應調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標是否填寫齊全(2)準確性審核:

真實性:檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際——邏輯檢查正確性:檢查數(shù)據(jù)是否有錯誤,計算是否正確等——計算檢查(定量數(shù)據(jù))

審核核對第第二二手手數(shù)數(shù)據(jù)據(jù)::完整整性性::準確確性性::適用用性性::數(shù)據(jù)據(jù)的的來來源源、、口口徑徑以以及及有關背景資料料;時效性:盡可能使用最最新的數(shù)據(jù)。。(2)數(shù)據(jù)篩篩選當數(shù)據(jù)中的錯錯誤不能予以以糾正,或者者有些數(shù)據(jù)不不符合調(diào)查的的要求而又無無法彌補時,,需要對數(shù)據(jù)據(jù)進行篩選。。數(shù)據(jù)篩選的內(nèi)內(nèi)容:將某些不符合合要求的數(shù)據(jù)據(jù)或有明顯錯錯誤的數(shù)據(jù)予予以剔除;將符合某種特特定條件的數(shù)數(shù)據(jù)篩選出來來,而不符合合特定條件的的數(shù)據(jù)予以剔剔除。(3)數(shù)據(jù)的的排序數(shù)據(jù)的排序按一定順序?qū)?shù)據(jù)排列,,以發(fā)現(xiàn)一些些明顯的特征征或趨勢,找找到解決問題題的線索排序有助于對對數(shù)據(jù)檢查糾糾錯,以及為為重新歸類或或分組等提供供依據(jù)在某些場合,,排序本身就就是分析的目目的之一排序可借助于于計算機完成成。定類數(shù)據(jù)的排排序字母型數(shù)據(jù),,排序有升序序降序之分,,但習慣上用用升序漢字型數(shù)據(jù),,可按漢字的的首位拼音字字母排列,也也可按筆畫排排序,其中也也有筆畫多少少的升序降序序之分定距和定比數(shù)數(shù)據(jù)的排序遞增排序:設設一組數(shù)據(jù)為為X1,X2,…,XN,遞增排序后后可表示為::X(1)<X(2)<…<X(N)遞減排序可表表示為:X(1)>X(2)>…>X(N)(五).匯總總后審核:審核匯總工作作質(zhì)量,匯總總過程有無差差錯。主要四四種方法:一是復計審核核;二是表表審核核;三是表實審核核;四是對照審核核。三.統(tǒng)計分組組分組前分組后統(tǒng)計分組就是是根據(jù)統(tǒng)計研究的目的和和被研究現(xiàn)象象的本質(zhì)特征征,將統(tǒng)計總體體按照一定的的標志劃分為為若干性質(zhì)不不同的部分或或組。..統(tǒng)計分組是在總體內(nèi)部部進行的一種定性分類類,它客觀上把把總體劃分為為一個個性質(zhì)不不同,范圍更更小的總體。統(tǒng)計分組有兩個方面的的含義,即::統(tǒng)計分組對總體而言即將總體區(qū)分為性質(zhì)不同的若干組成部分是“合”即將性質(zhì)相同的總體單位合為一組是“分”對單位而言.1、統(tǒng)計分組組的作用劃分現(xiàn)象的類類型(區(qū)分事事物的類型));研究總體的結結構(構成))或比例關系系;分析(探討))現(xiàn)象之間的的依存關系。。注意:統(tǒng)計分分組是對總體認識識深化的手段段,它是一切切統(tǒng)計研究的的基礎,應用用于統(tǒng)計工作作的全過程,,是統(tǒng)計研究究的基本方法法。2、統(tǒng)計分組組的原則窮盡原則互斥原則揭露社會經(jīng)濟濟現(xiàn)象的類型型,反映各類類型的特點。。⑴類型分組類型1999年2000年2001年2002年農(nóng)業(yè)14106.213873.614462.814931.5林業(yè)886.3936.5938.81033.5牧業(yè)6997.67393.17963.18454.6漁業(yè)2539.02712.62815.02971.1合計24519.124915.826179.627390.8例單位:億元說明社會經(jīng)濟濟現(xiàn)象的內(nèi)部部結構。⑵結構分組例年份19961997199819992000第一產(chǎn)業(yè)20.419.118.617.615.9第二產(chǎn)業(yè)49.550.049.349.450.9第三產(chǎn)業(yè)30.130.932.133.033.2合計100.0100.0100.0100.0100.0“九五”期間間我國國內(nèi)生生產(chǎn)總值構成成(%)研究經(jīng)濟現(xiàn)象象之間的依存存關系。⑶分析分組例耕作深度分組(cm)地塊數(shù)平均收獲率(斤/畝)10-12740012-141046014-161654016-1818-20125620680某鄉(xiāng)某種農(nóng)作作物的耕作深深度與收獲率率的關系..3、統(tǒng)計分組組的種類(一)按分組標志的的多少不同(二)按分組組標志的性質(zhì)質(zhì)不同簡單分組品質(zhì)分組數(shù)量(變量))分組復合分組.4、統(tǒng)計分組組的方法分組標志的選選擇:選擇分分組標志是統(tǒng)統(tǒng)計分組的核心問題,必須根據(jù)統(tǒng)統(tǒng)計研究的目的選擇分組標志志。品質(zhì)分組:是是按品質(zhì)標志志進行的分組組。國民經(jīng)濟按產(chǎn)產(chǎn)業(yè)分組:第第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)人口按性別分分組:男男性女性用文字來表示示各組性質(zhì)上上的差別..數(shù)量分組數(shù)量分組的概概念單項式分組與與組距式分組組進行組距式分分組時應注意意的問題..數(shù)量分組是按數(shù)量標志志進行的分組組。數(shù)量分組的概概念例如,學生按考分分分組(分)用數(shù)量來表示示各組性質(zhì)上上的差別60以下60~7070~~8080~9090以以上..(1)單項式式分組:即即在變量分組組中,一個組組只有一個變變量值。單項式式分組組與組組距式式分組組適用條條件::它適用用于當當變量量值變變化范范圍不不大、、不同同變量量值個個數(shù)較較少的的離散型型變量量的場合合。例如::居民家家庭按按子女女數(shù)分分組::0123(離散散型變變量))(2))組距式式分組組:就是將將變量量依次次劃分分為幾幾段區(qū)區(qū)間,,一段段區(qū)間間表現(xiàn)現(xiàn)為從從“………到到………”距距離,,把一一段區(qū)區(qū)間內(nèi)內(nèi)的所所有變變量值值歸為為一組組。。區(qū)間間的距距離就就是組組距。。例如::企業(yè)按按人數(shù)數(shù)分組組499及以以下500~~9991000~~29993000及及以上上工人按按工資資分組組600~~700700~~800800~~12001200~~1500適用條條件::它適用用于變變量值值變化化范圍圍較大大、不不同變變量值值個數(shù)數(shù)較多多的離散型型變量量及連續(xù)型型變量量的場合合。(離散型型變量量)(連續(xù)型型變量量)注意::連續(xù)型型變量量的數(shù)數(shù)值不不能一一一列列舉,,故其其只能能采用用組距距式分分組。。進行組組距式式分組組時應應注意意的問問題(1)組限限及劃劃分方方法(2)等距距分組組與不不等距距分組組(3)組中中值499及以以下500~~9991000~~29993000及及以上上600~~700700~~800800~~12001200~~1500(1))組限限及劃劃分方方法組限::確立每每組界界限的的兩個個數(shù)字字。其中,,每組組最大大變量量值稱稱為上限,每組最小小變量值值稱為下限。工人按工工資分組組:(連續(xù)變變量)企業(yè)按人人數(shù)分組組:(離散變變量)(重疊組組限)(不重疊疊組限))組限的劃劃分方法法:組限的劃劃分方法法不重疊組組限重疊組限限(只適用用于離散型變變量)(適用于于連續(xù)型變變量和離離散型型變量.)重疊組限限:不重疊組組限:即相鄰兩兩組的上上下限為為同一個個數(shù)值。。即相鄰兩兩組的上上下限為為兩個不不同的確確定數(shù)值值。故當某單單位的變變量值剛剛好等于于相鄰兩組組的上下下限時,一般把把此值歸歸到作為為下限的的那一組組中,即即遵循“上限不不在其內(nèi)內(nèi)”的原則。。..企業(yè)按人人數(shù)分組組:499及及以下500~~9991000~~29993000及及以上(不重疊疊組限))企業(yè)按人人數(shù)分組組:500以以下500~10001000~~30003000及及以上(重疊組組限)..(2)等等距分組組與不等等距分組組組距分組組等距分組組不等距分分組例如:按身高、、考分分分組等,,應采用用等距分分組。它它便于各各組間單單位數(shù)與與變量值值的直接接對比和和各項指指標計算算。適用場合合:等距分組組:即各各組組距距相同的的分組。。凡是在變變量值分分布比較較均勻時時采用。。組距:每每組變量量值的變變動范圍圍,即組組距=上限限–下下限不等距分分組:即各組組組距不都都相等的的分組。。適用場合合:當變量值值分布很很不均勻勻時采用用。不等距分分組多數(shù)數(shù)是根據(jù)據(jù)事物性性質(zhì)變化化的數(shù)量量界限來來確定組組距,如如人口按按年齡分分組。要注意不不同年齡齡生理變變化的特特點,可可分為::1歲以下下;1~6歲歲;7~12歲;;13~~18歲歲;19~~59歲歲;60歲歲以上。。年齡段工人按工工資分組組(元)600~~700700~~800800~12001200~~1500.(3)組組中值組中值是指組距距數(shù)列中中各組上上限和下下限之間的中點數(shù)值值。注意:組中值經(jīng)經(jīng)常用來來代表各各組標志志值的平平均水平平,但要要假定各組內(nèi)標標志值呈呈均勻分分布。按考分分分組50~~6060~~7070~~8080~~9090~~1005575658595組中值人數(shù)51518102..若第一組出出現(xiàn)“×××以下”或最末組出出現(xiàn)“×××以上”字樣的組組叫做開口組。首組組中中值=首組上限限–相鄰組組組距的一一半=末組下限限+相鄰組組組距的一一半末組組中中值50–10/2100+10/2例如:.首組:末組:按考分分分組組組中中值50~~605560~~706570~807580~~908590~1009550以下下100以以上45105年均收入(元)頻數(shù)(村)600—4000114000—5000355000—6000146000—100001610000—2500012合計88年均收入(元)頻數(shù)(村)<4000114000—5000355000—6000146000—1000016>1000012合計88或例:某地地區(qū)農(nóng)戶戶收入分分布編制:1、單變變量數(shù)列列還是組組距式數(shù)數(shù)列:變變量的性性質(zhì)及變變異程度度離散型變變量且變變異?。海簡巫兞苛繑?shù)列離散型變變量但變變異大或或連續(xù)型型變量::組距式式數(shù)列例如:按按以五分分制計分分的成績績對全班班100名學生生進行分分組,宜宜單變量量數(shù)列;;按以百百分制計計分的成成績對全全班100名學學生進行行分組,,宜組距距式數(shù)列列;例如:按按身高對對全班100名名學生分分組,只只能組距距式數(shù)列列。2、等距距數(shù)列還還是異距距數(shù)列::變量分分布的特特征當分布值值很不均均勻時,,一般采采用異距距數(shù)列。。如學生生成績一一般密集集于某一一區(qū)間,,低于這這一區(qū)間間的學生生為少數(shù)數(shù),高于于這一區(qū)區(qū)間的學學生也為為少數(shù)。。合理的的做法是是在密集集區(qū)間內(nèi)內(nèi)使用較較短的組組距,在在稀少區(qū)區(qū)間內(nèi)使使用較長長的組距距。當?shù)攘康牡臉酥局抵挡痪哂杏邢嗤牡囊饬x時時,一般般采用異異距數(shù)列列。如::對新生生兒和成成人的年年齡,同同樣的一一年或一一月,其其意義是是不同的的。進行行人口疾疾病研究究的年齡齡分組時時,一般般1歲以以下按月月分組,,1-10歲按按年分組組,11-20歲按5年分組組……當標志值值按一定定比例發(fā)發(fā)展變化化:某些些時候采采用公比比為10的不等等距分組組。如商商場按營營業(yè)額分分組為::5萬元元以下、、5—50萬元元、50—500萬元元、500—5000萬元………3、開口口數(shù)列還還是閉口口數(shù)列::極端變變量值偏偏離分布布中心的的程度。。極端變量量值(極極大值或或極小值值)遠離離分布中中心:開開口數(shù)列列極端變量值值(極大值值或極小值值)接近分分布中心::閉口數(shù)列列例如:成績績:20分分1人、55分1人人、58分分3人、60—70分10人人……80—90分分30人、、91分3人、92分2人、、95分1人最小組:““<60分分”優(yōu)于““20—60分”((實際平均均分49.8分)最大組:““90—95分”優(yōu)優(yōu)于“>90分”((實際平均均分92分分)同時兼顧習習慣。四、統(tǒng)計匯匯總頻數(shù):各組組內(nèi)的總體體單位數(shù)頻率:各組組內(nèi)總體單單位數(shù)占總總體全部單單位數(shù)的比比率累計頻數(shù)((率):各各組的頻數(shù)數(shù)(率)累累計加和向上累計制制:由標志志值較小組組向較大組組累計。每每一組的累累計次數(shù)表表示小于該該組下限((變量)值值的次數(shù)共共有多少。。向下累計制制:由標志志值較大組組向較小組組累計。每每一組的累累計次數(shù)表表示大于該該組下限((變量)值值的次數(shù)共共有多少。。例考分次數(shù)向上累計向下累計

人數(shù)(人)比率(%)人數(shù)(人)比率(%)人數(shù)(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合計40100.04010040100某班統(tǒng)計學學考試成績績次數(shù)分配配審核匯總工工作質(zhì)量,,匯總過程程有無差錯錯。主要四四種方法::一是復計審審核;二是表表審審核;三是表實審審核;四是對照審審核。五、匯總后后審核3.2品品質(zhì)數(shù)據(jù)據(jù)的整理與與顯示數(shù)據(jù)的整理理與顯示的的基本問題題要弄清所面面對的數(shù)據(jù)據(jù)類型;不同類型的的數(shù)據(jù),處處理方式和和方法不同同。適合于低層層次數(shù)據(jù)的的整理和顯顯示方法也也適合于高高層次的數(shù)數(shù)據(jù);但適適合于高層層次數(shù)據(jù)的的整理和顯顯示方法并并不適合于于低層次的的數(shù)據(jù)。品質(zhì)數(shù)據(jù)的的整理與顯顯示3.2.1定類類數(shù)據(jù)的整整理與顯示示3.2.2定序序數(shù)據(jù)的整整理與顯示示定類數(shù)據(jù)的的整理的基基本過程2.計算算各類別的的頻數(shù);3.制作作頻數(shù)分布表表;分類頻數(shù)比例百分比比率ABCDE列出各類別別;4.用圖形顯示數(shù)據(jù);;定類數(shù)據(jù)的的整理(可可計算的統(tǒng)統(tǒng)計量)頻數(shù)(frequency):落在各類類別中的數(shù)數(shù)據(jù)個數(shù)。。比例(proportion):某某一類別數(shù)數(shù)據(jù)占全部部數(shù)據(jù)的比比值。百分比(percentage):將對比的的基數(shù)作為為100而而計算的比比值。比率(ratio):不同同類別數(shù)值值的比值。。頻數(shù)分布:也叫次數(shù)分分布,就是是把各個類類別及落在在其中的相相應頻數(shù)全全部列出,,并用表格格的形式表表現(xiàn)出來。。按品質(zhì)標志志分組形成成的頻數(shù)分分布某廠職工人人數(shù)統(tǒng)計表表按性別分組組男職工工女職工工合計計人數(shù)(人))(頻數(shù))比例(%))(頻率)25311536868.7531.25100.00定類數(shù)據(jù)整整理—頻數(shù)數(shù)分布表【例1】一一家市場調(diào)調(diào)查公司為為研究不同同品牌飲料料的市場占占有率,對對隨機抽取取的一家超超市進行了了調(diào)查。調(diào)調(diào)查員在某某天對50名顧客購購買飲料的的品牌進行行了記錄,,如果一個個顧客購買買某一品牌牌的飲料,,就將這一一飲料的品品牌名字記記錄一次。右邊就是是記錄的原原始數(shù)據(jù)。。綠色健康飲品一、定類數(shù)數(shù)據(jù)整理——頻數(shù)分布布表【例3.1】為研究究廣告市場場的狀況,,一家廣告告公司在某某城市隨機機抽取200人就廣告問問題做了郵郵寄問卷調(diào)調(diào)查,其中中的一個問問題是“您您比較關心心下列哪一一類廣告??”1.商品廣廣告;2..服務廣告告;3.金金融廣告;;4.房地地產(chǎn)廣告;;5.招生生招聘廣告告;6.其其他廣告。。表3-1某城市居民關注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)商品廣告服務廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100定類數(shù)據(jù)的的圖形顯示示1、條形圖(barchart)通過寬度相相同的條形形的高度或或長短來比較各類別數(shù)據(jù)據(jù)的圖形有單式條形形圖、復式式條形圖等等形式主要用于反反映分類數(shù)數(shù)據(jù)的頻數(shù)數(shù)或頻率繪制時,各各類別可以以放在縱軸軸,稱為條條形圖,也也可以放在在橫軸,稱稱為柱形圖圖(columnchart)定類數(shù)據(jù)的的圖示—條條形圖人數(shù)(人)5191610211204080120

商品廣告

服務廣告

金融廣告

房地產(chǎn)廣告

招生招聘廣告

其他廣告廣告類型

圖3-1某城市居民關注不同類型廣告的人數(shù)分布定類數(shù)據(jù)的的圖示2、餅圖((piechart)也稱圓形圖圖,是用圓圓形及圓內(nèi)內(nèi)扇形的角角度來表示示數(shù)值大小小的圖形;;主要用于表表示樣本或或總體中各各組成部分分所占的比比例,用于于研究結構性問題題;繪制圓形圖圖時,樣本本或總體中中各部分所所占的百分分比用圓內(nèi)內(nèi)的各個扇扇形角度表表示,這些些扇形的中中心角度,,按各部分分數(shù)據(jù)百分分比占3600的相應比例例確定。定類數(shù)據(jù)的的圖示—圓圓形圖

其他廣告1.0%

房地產(chǎn)廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務廣告25.5%

招生招聘廣告5.8%圖3-2某城市居民關注不同類型廣告的人數(shù)構成3.2.2定序序數(shù)據(jù)的整整理可計算的統(tǒng)統(tǒng)計量:對于定序數(shù)數(shù)據(jù),除了了可用定類類數(shù)據(jù)整理理和顯示的的方法之外外,還可以以計算:1.累累積頻數(shù)(cumulativefrequencies)::各類別頻數(shù)數(shù)的逐級累累加。2.累累積頻率(cumulativepercentages)::各..在研研究究次次數(shù)數(shù)和和頻頻率率的的分分布布時時,,常常需需要要編編制制次次數(shù)數(shù)或或頻頻率率的的累累計計分分布布數(shù)數(shù)列列。。1.向向上上累累計計::是指指將將各各組組次次數(shù)數(shù)或或頻頻率率由由變量量值值低低的的組組向變量量高高的的組組累計計。2.向向下下累累計計::是指指將將各各組組次次數(shù)數(shù)或或頻頻率率,,由由變量量值值高高的的組組向變量量值值低低的的組組逐組組累計計。如::表3-2.累計計分分布布有有向上上累累計計和向下下累累計計兩種種::如:二、、定定序序數(shù)數(shù)據(jù)據(jù)頻頻數(shù)數(shù)分分布布表表【例例3.2】】在在一一項項城城市市住住房房問問題題的的研研究究中中,,研研究究人人員員在在甲甲乙乙兩兩個個城城市市各各抽抽樣樣調(diào)調(diào)查查300戶,其中的一一個問題是::“您對您家家庭目前的住住房狀況是否否滿意?1.非常不滿滿意;2.不不滿意;3..一般;4..滿意;5..非常滿意。。表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)非常不滿意不滿意一般滿意非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————表3-3乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)非常不滿意不滿意一般滿意非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————順序數(shù)據(jù)的圖圖示—累計頻頻數(shù)分布圖243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對對住房狀況評評價的累積頻頻數(shù)分布環(huán)形圖環(huán)形圖中間有有一個“空洞洞”,樣本或或總體中的每每一部分數(shù)據(jù)據(jù)用環(huán)中的一一段表示;與餅圖類似,,但又有區(qū)別別:餅圖只能顯示示一個總體各各部分所占的的比例用于結構比較研究;用于展示分類和順序數(shù)據(jù)。8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

甲乙兩城市家庭對住房狀況的評價環(huán)形圖3.3數(shù)數(shù)值型數(shù)據(jù)的的整理與展示示數(shù)數(shù)據(jù)分分組與頻數(shù)分分析數(shù)數(shù)值型型數(shù)據(jù)的圖示示數(shù)數(shù)據(jù)分組組與頻數(shù)分布布1、排序,求全距距(全距=最最大值-最小小值);2、確定變量量的數(shù)據(jù)形式式(單變量分分組、組距分分組);3、確定組數(shù)數(shù):斯特格斯(Sturges)經(jīng)驗公公式:4、確定各組組組距:組距=全距/組數(shù)=(最最大值-最小小值)/組組數(shù)5、根據(jù)分組組整理成頻數(shù)數(shù)分布表(確定各組組組限,計算頻頻數(shù))數(shù)據(jù)分組的步步驟頻數(shù)分布表的的編制實例【例2】某生生產(chǎn)車間50名工人日加工工零件數(shù)如下下(單位:個個)。對數(shù)據(jù)據(jù)進行分組。。1、排序,求求全距:全距=最大值值-最小值==139-107=322、確定變量量的數(shù)據(jù)形式式表3-3某車間50名工人日加工零件數(shù)分組表(**單變量值分組)零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)零件數(shù)(個)頻數(shù)(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221123、確定組數(shù)數(shù)K=1+log10N/log102=1+3.322lgN=1+3.322×lg50≈74、確定各組組組距組距=全距/組數(shù)=(最大值--最小值)/組數(shù)=32/7=4.6≈55、根根據(jù)分分組整整理成成頻數(shù)數(shù)分布布表表3-4某車間50名工人日加工零件數(shù)分組表(**組距分組:等距分組)按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100等距分分組表表(使使用開開口組組)表2-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)110以下110~115115~120120~125125~130130~135135以上358141064610162820128合計50100頻數(shù)分分布表表的編編制【例3】表中是是某電電腦公公司2005年年前四四個月月各天天的銷銷售量量數(shù)據(jù)據(jù)(單單位::臺)。試試對數(shù)數(shù)據(jù)進進行分分組數(shù)數(shù)據(jù)值值型數(shù)數(shù)據(jù)的的圖形形顯示示Excel1、分分組數(shù)數(shù)據(jù)——直方方圖和和折線線圖2、未未分組數(shù)數(shù)據(jù)——莖葉葉圖和和箱線線圖分組數(shù)數(shù)據(jù)——直方方圖(histogram)用于展展示分分組數(shù)據(jù)分分布的一種種圖形形。用矩形形的寬寬度和和高度度來表表示頻頻數(shù)分分布。。本質(zhì)上上是用用矩形形的面積來表示示頻數(shù)數(shù)分布布在直角角坐標標系中中,用用橫軸軸表示示數(shù)據(jù)據(jù)分組組,縱縱軸表表示頻頻數(shù)或或頻率率,各各組與與相應應的頻頻數(shù)就就形成成了一一個矩矩形,,即直直方圖圖。直方圖圖下的的總面面積等等于1。直方圖圖的繪繪制140150210直方圖下的面積之和等于1某電腦腦公司司銷售售量分分布的的直方方圖我一眼就看出來了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240銷售量量(臺臺)直方方圖圖與與條條形形圖圖的的區(qū)區(qū)別別條形形圖圖是是用用條條形形的的長長度度(橫橫置置時時)表表示示各各類類別別頻頻數(shù)數(shù)的的多多少少,,其其寬寬度度(表表示示類別別)則則是是固定定的;;直方方圖圖是是用用面積積表示示各各組組頻頻數(shù)數(shù)的的多多少少,,矩矩形形的的高高度度表表示示每每一一組組的的頻頻數(shù)數(shù)或或百百分分比比,,寬寬度度則則表表示示各各組組的的組組距距,,其其高高度度與與寬寬度度均均有有意意義義;;直方方圖圖的的各各矩矩形形通通常常是是連連續(xù)續(xù)排排列列,,條條形形圖圖則則是是分分開開排排列列;;條形形圖圖主主要要用用于于展展示示分分類類數(shù)數(shù)據(jù)據(jù),,直直方方圖圖則則主主要要用用于于展展示示數(shù)數(shù)值值型型數(shù)數(shù)據(jù)據(jù)。。分組組數(shù)數(shù)據(jù)據(jù)——折折線線圖圖折線線圖圖也也稱稱頻頻數(shù)數(shù)多多邊邊形形圖圖;;是在在直直方方圖圖的的基基礎礎上上,,把把直直方方圖圖頂頂部部的的中中點點(組組中中值值)用用直直線線連連接接起起來來,,再再把把原原來來的的直直方方圖圖抹抹掉掉;;折線線圖圖的的兩兩個個終終點點要要與與橫橫軸軸相相交交,,具具體體的的做做法法是是第一一個個矩矩形形的的頂頂部部中中點點通通過過豎豎邊邊中中點點(即即該該組組頻頻數(shù)數(shù)一一半半的的位位置置)連連接接到到橫橫軸軸,,最最后后一一個個矩矩形形頂頂部部中中點點與與其其豎豎邊邊中中點點連連接接到到橫橫軸軸;;折線圖下下所圍成成的面積積與直方方圖的面面積相等等,二者者所表示示的頻數(shù)數(shù)分布一一致。折線圖的的繪制折線圖與與直方圖圖下的面積積相等!!140150210某電腦公公司銷售售量分布布的折線線圖190200180160170220230240頻數(shù)(天)25201510530銷售量((臺)未分組數(shù)數(shù)據(jù)—莖莖葉圖(stem-and-leaf)用于顯示示未分組組的原始始數(shù)據(jù)的的分布由“莖””和“葉葉”兩部部分構成成,其圖圖形是由由數(shù)字組組成的以以該組數(shù)數(shù)據(jù)的高高位數(shù)值值作樹莖莖,低位位數(shù)字作作樹葉,,樹葉上上只保留留最后一一位數(shù)字字對于n(20n300)個數(shù)據(jù)據(jù),莖葉葉圖最大大行數(shù)不不超過L=[10××lgn]莖葉圖類類似于橫橫置的直直方圖,,但又有有區(qū)別::直方圖可可觀察一一組數(shù)據(jù)據(jù)的分布布狀況,,但沒有有給出具具體的數(shù)數(shù)值莖葉圖既既能給出出數(shù)據(jù)的的分布狀狀況,又又能給出出每一個個原始數(shù)數(shù)值,保保留了原原始數(shù)據(jù)據(jù)的信息息直方圖適適用于大大批量數(shù)數(shù)據(jù),莖莖葉圖適適用于小批量數(shù)數(shù)據(jù)樹莖樹葉788022347778889013344579910111213數(shù)據(jù)個數(shù)數(shù)3132410莖葉圖類似橫置的直方圖莖葉圖的的制作某車間工工人日加加工零件件數(shù)的莖莖葉圖未分組數(shù)數(shù)據(jù)—箱箱線圖(boxplot)用于顯示示未分組組的原始始數(shù)據(jù)的的分布;;由一組數(shù)數(shù)據(jù)的5個特征征值繪制制而成,,它由一一個箱子子和兩條條線段組組成;繪制方法法:首先找出出一組數(shù)數(shù)據(jù)的5個特征征值,即即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)數(shù)(下四分分位數(shù)QL和上四分分位數(shù)QU);連接兩個個四分位位數(shù)畫出出箱子,,再將兩兩個極值值點與箱箱子相連連接;該箱線圖圖也稱為為Median/Quart./Range箱線圖。。箱線圖的的構成中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖圖箱線圖的的構成::單批數(shù)據(jù)據(jù)箱線圖圖最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Range箱線圖分布的形形狀與箱箱線圖對稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布布的箱線線圖3.4次數(shù)分布布及其類類型次數(shù)分布布及其類類型分分配數(shù)列列的概念念和構成成要素分分配數(shù)列列的種類類及編制制方法次次數(shù)分布布的主要要類型..分分配數(shù)數(shù)列的概概念和構構成要素素分配數(shù)列列是指在統(tǒng)計分組組的基礎上上,將總總體所有有單位按按組歸類類排隊,,形成總總體中各各單位在在各組間間的分布布,又稱稱分布數(shù)列列或統(tǒng)計分布布。分配數(shù)列列的概念念。按性別分組男生女生合計表3-6表3-7按考分分組

50~6060~7070~8080~9090~100合計人數(shù)(人)頻率(%)20306040501005人數(shù)(人)頻率(%)103010151850236420100..分配數(shù)列列的構成成要素分配數(shù)列列的構成成要素總體按某某標志所所分的各各個組各組次數(shù)數(shù)或頻率次數(shù)(頻頻數(shù))::頻率:所以,次數(shù)或頻頻率分布布形成的的數(shù)列叫叫分配數(shù)數(shù)列。即分布在在各組的的單位數(shù)數(shù)。即各組次次數(shù)與總總次數(shù)之之比。..分分配數(shù)數(shù)列的種種類及編編制方法法(一)品品質(zhì)數(shù)列列分配數(shù)列列的種類類1.單項項式變量數(shù)列2.組距式變變量數(shù)列(二)變量數(shù)數(shù)列..(一)品質(zhì)分分配數(shù)列按品質(zhì)標志分組組所形成的分配配數(shù)列稱為品質(zhì)分配數(shù)列列(品質(zhì)數(shù)列列)。按性別分組人數(shù)(人)

頻率(%)男生女生30206040合計50100一般來說品質(zhì)質(zhì)數(shù)列較容易易編制,它通通常能準確地地反映總體的的分配特征,,一旦分組標標志確定以后后,其分布數(shù)列的的形式是唯一一的。例如:表3-8..(二)變量數(shù)數(shù)列按數(shù)量標志分組組所形成的分布布數(shù)列稱為變量分配數(shù)列列(變量數(shù)列列)。按順序列出的的各組變量值值及相應的頻頻率,即成為為變量的頻率分分布。按考分分組人數(shù)(人)頻率(%)50~6060~7070~8080~9090~10051518102103036204合計50100例如:表3-9注意:任何一個頻率分布都必須滿足兩個條件件:一是各組頻率率≥0;二是是各組頻率之之和等于100%。1.單項式變變量數(shù)列2.組距式變變量數(shù)列(由單項式分分組形成)居民家庭按子女數(shù)分組(個)戶數(shù)(戶)0123420601509040合計360按考分分組人數(shù)(人)頻率(%)50~6060~7070~8080~9090~10051518102103036204合計50100表3-10(單項式變量數(shù)數(shù)列)(組距式變量數(shù)數(shù)列)表3-11變量數(shù)列(由組距式分分組形成)..次次數(shù)分布布的主要類型型次數(shù)分布類型型主要有三種種:鐘型分布、UU型分布和J型分布。其分布特征是“兩頭小,中中間大”,即靠近中間的的變量值分布布分布的次數(shù)數(shù)多,靠近兩兩端的變量值值分布分布的的次數(shù)少。1.鐘型分布布:fx正態(tài)分布即其分布曲線線形如一口古古鐘,故稱鐘鐘型分布例如如,如人的身高、體體重、職工工工資、農(nóng)作物物畝產(chǎn)量、市市場價格、學學生的考分等等現(xiàn)象都屬于于鐘型分布。其分布又可分分為以下兩種種:正態(tài)分布和偏態(tài)分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論