版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章數(shù)據(jù)整理
按照研究的目的,將搜集到的原始數(shù)據(jù)進(jìn)行整理加工,從中提取有用的信息,并搜索其中的數(shù)量規(guī)律性。3.1數(shù)據(jù)分組3.2次數(shù)分配3.3統(tǒng)計(jì)指標(biāo)3.4統(tǒng)計(jì)表和統(tǒng)計(jì)圖第三章數(shù)據(jù)整理按照研究的目的,將搜集到的原13.1數(shù)據(jù)分組一、統(tǒng)計(jì)數(shù)據(jù)分組的目的及原則分組是將總體所有單位按一定的標(biāo)準(zhǔn)區(qū)分為若干部分分組前分組后25%33%42%分組的目的:概括數(shù)據(jù),清晰條理3.1數(shù)據(jù)分組一、統(tǒng)計(jì)數(shù)據(jù)分組的目的及原則分組是將總體所2分組時(shí)注意:
將具有共性的個(gè)體歸入同一組將總體內(nèi)部個(gè)體間的差異通過(guò)組別區(qū)分開(kāi)來(lái)分組的原則:保證總體中的任何一個(gè)個(gè)體或原始數(shù)據(jù)都能歸于某一個(gè)組且僅能歸于某一個(gè)組,即保證不重、不漏。統(tǒng)計(jì)分組的關(guān)鍵是分組標(biāo)志的選擇分組時(shí)注意:分組的原則:保證總體中的任何一31、按分組標(biāo)志的多少不同分:簡(jiǎn)單分組:分組僅按一個(gè)標(biāo)志來(lái)進(jìn)行復(fù)合分組:分組按兩個(gè)或兩個(gè)以上的標(biāo)志進(jìn)行,并且層疊在一起。二、統(tǒng)計(jì)分組的種類(lèi)1、按分組標(biāo)志的多少不同分:二、統(tǒng)計(jì)分組的種類(lèi)4例如:對(duì)全國(guó)的工業(yè)企業(yè)進(jìn)行簡(jiǎn)單分組:按經(jīng)濟(jì)類(lèi)型分:全民所有制企業(yè)、集體所有制企業(yè)、城鄉(xiāng)個(gè)體企業(yè)按輕重工業(yè)分:重工業(yè)、輕工業(yè)按企業(yè)規(guī)模大小分:大型企業(yè)、中型企業(yè)、小型企業(yè)復(fù)合分組:全民所有制集體所有制重工業(yè)輕工業(yè)重工業(yè)輕工業(yè)大型企業(yè)中型企業(yè)小型企業(yè)例如:對(duì)全國(guó)的工業(yè)企業(yè)進(jìn)行全民所有制集體所有制重工業(yè)輕工業(yè)重52、按分組標(biāo)志的性質(zhì)不同分:品質(zhì)分組:按品質(zhì)標(biāo)志進(jìn)行的分組如人口總體按性別分組、高校教師按職稱(chēng)分組。變量分組:按數(shù)量標(biāo)志進(jìn)行的分組如企業(yè)按職工人數(shù)分------1000人以下、1000-5000人、5000人以上2、按分組標(biāo)志的性質(zhì)不同分:6三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計(jì)研究的目的,在對(duì)現(xiàn)象進(jìn)行分析的基礎(chǔ)上,抓住具有本質(zhì)性的區(qū)別及反映現(xiàn)象內(nèi)在聯(lián)系的標(biāo)志來(lái)作為分組標(biāo)志。2、在統(tǒng)計(jì)整理中,為了全面認(rèn)識(shí)被研究現(xiàn)象總體,常常需要運(yùn)用多個(gè)分組標(biāo)志對(duì)總體進(jìn)行分組,形成一系列相互聯(lián)系、相互補(bǔ)充的分組體系。三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計(jì)研究的目的,在對(duì)現(xiàn)象7四、統(tǒng)計(jì)分組方法1、品質(zhì)分組的方法分組標(biāo)志一經(jīng)確定,組名稱(chēng)和組數(shù)也就確定,不存在組與組之間界限區(qū)分的困難。復(fù)雜的情況下,各組界限不易劃分,從這一組到另一組存在各種過(guò)度狀態(tài),邊緣不清。2、變量分組的方法:變量分組的目的并不是單純確定各組在數(shù)量上的差別,而是要通過(guò)數(shù)量上變化來(lái)區(qū)分各組的不同類(lèi)型和性質(zhì)。四、統(tǒng)計(jì)分組方法1、品質(zhì)分組的方法8單項(xiàng)式分組:是依次將每一個(gè)變量值作為一組。(適用于離散型變量且變量取值不多的情況)例如,居民家庭人口數(shù),其取值不可能很多,且每一個(gè)取值都可視為一種類(lèi)型。按家庭人口數(shù)分組
1人
2人
3人
4人
5人
6人單項(xiàng)式分組:是依次將每一個(gè)變量值作為一組。按家庭人口數(shù)分組9組距式分組:把整個(gè)變量值依次劃分為幾個(gè)區(qū)間,各個(gè)變量值按其大小確定所歸并的區(qū)間,區(qū)間的距離稱(chēng)組距。包括等距分組和不等距分組適用于連續(xù)型變量或雖為離散型變量但取值很多,不便一一列舉的情況。1)連續(xù)型變量的組距式分組如對(duì)商店按銷(xiāo)售額進(jìn)行分組:按銷(xiāo)售額分組(萬(wàn)元)50以下;50—200;200—400;400—600600—800;800以上組距式分組:把整個(gè)變量值依次劃分為幾個(gè)區(qū)間,各個(gè)變量102)離散型變量的組距式分組如對(duì)某企業(yè)的生產(chǎn)小組按人數(shù)分組:生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—1011—1617—222)離散型變量的組距式分組生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—111組距式分組中的有關(guān)問(wèn)題:(1)組距和組中值組距兩端的數(shù)值稱(chēng)為組限,其中:每組的起點(diǎn)數(shù)值稱(chēng)下限、每組的終點(diǎn)數(shù)值稱(chēng)上限。離散型變量分組:各組的上下限都可以用確定的數(shù)值(整數(shù))表示。
連續(xù)型變量分組:相鄰組的上限和下限無(wú)法用兩個(gè)確定的數(shù)值分別表示,因此上一組的上限同時(shí)也是下一組的下限。組距式分組中的有關(guān)問(wèn)題:12例如:企業(yè)按工人工資對(duì)工人進(jìn)行分組如下:
500—600元
600---700元
700---800元如果某工人工資為700元,應(yīng)將他歸并到哪一組?“上組限不計(jì)入”原則:遇到某單位的標(biāo)志值剛好等于相鄰兩組上下限時(shí),一般把此值歸并到作為下限的那一組。注意EXCEL!例如:企業(yè)按工人工資對(duì)工人進(jìn)行分組如下:注意EXCEL!13(2)全距:變量值中最大值與最小值的差數(shù)組數(shù)=全距/組距組距=上限—下限(3)組中值=(上限+下限)/2缺下限的開(kāi)口組:組距數(shù)列的首組出現(xiàn)“***以下”缺上限的開(kāi)口組:組距數(shù)列的末組出現(xiàn)“***以上”(2)全距:變量值中最大值與最小值的差數(shù)缺下限的開(kāi)口組:組距14合理確定組中值例如:第一組:50人以下第二組:50—200人按公式應(yīng)定下限為0合理確定組中值例如:應(yīng)定下限為0153.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個(gè)數(shù)稱(chēng)為次數(shù),各組間的次數(shù)稱(chēng)為次數(shù)分配。次數(shù)分配描述了總體的結(jié)構(gòu)和特征。一、品質(zhì)次數(shù)分配的編制按品質(zhì)標(biāo)志進(jìn)行分組,由總體各組的名稱(chēng)及各組的單位數(shù)(次數(shù))組成。
某高校學(xué)生的性別分布
按性別分組人數(shù)比例(%)女生544841.2男生780458.8合計(jì)13262100.0Excel演示3.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個(gè)數(shù)稱(chēng)為次數(shù),各組間的次16二、變量次數(shù)分配的編制1、將原始資料按順序排序2、確定組數(shù)與組距(1)當(dāng)n較大時(shí),k取10~20;當(dāng)n<50時(shí),k取5~6
;(2)如果數(shù)據(jù)分布比較均勻、對(duì)稱(chēng),即中間數(shù)值次數(shù)多,大小極端值次數(shù)少,考慮用以下公式來(lái)確定組數(shù):組數(shù)=1+3.322log
n式中,n
表示總次數(shù),log
表示以10為底的對(duì)數(shù)。組距=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)二、變量次數(shù)分配的編制1、將原始資料按順序排序(2)如果數(shù)173、確定組限每組區(qū)間的界限稱(chēng)為組限。離散型變量,分組時(shí)相鄰組的組限必須間斷。
如某省企業(yè)按職工人數(shù)分組,可分為:0-99,100-199,200-299,300-399,…,900-1000等;連續(xù)型變量,相鄰組的上、下限采用重疊的方法分組界定。
如按職工工資分組,0-500,500-1000,1000-1500,1500-2000,…,等;4、將各個(gè)數(shù)據(jù)按其數(shù)值大小歸入相應(yīng)的組內(nèi)。3、確定組限18某企業(yè)非熟練工人的周工資額(元)單位:元人員編號(hào)周收入人員編號(hào)周收入人員編號(hào)周收入11061199218528412942210631111311923101491148724105510915118259669116972610571111710327107810718103281289121199529111101052010630101返回某企業(yè)非熟練工人的周工資額(元)單位:元人員編號(hào)周收入人員編19分組計(jì)算組數(shù)=1+3.322logn(n=30)=5.9分6組組距:每組區(qū)間的寬度=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)
=(128-84)/6=7.384-91,91-98,98-105,105-112,112-119,119-126;未包含最大值83-91,91-99,99-107,107-115,115-123,123-131;分組計(jì)算組數(shù)=1+3.322logn(n=30)20按5組,10元作為組距,計(jì)算次數(shù)。求次數(shù)分配表和直方圖結(jié)合實(shí)際數(shù)據(jù),組距為10比較好計(jì)算且方便,分組的組數(shù)相應(yīng)從6減少為5。最小值為83,下限從80開(kāi)始,按5組,10元作為組距,計(jì)算次數(shù)。求次數(shù)分配表和直方圖21次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90390-1007100-11013110-1205120-1302合計(jì)30次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90322累計(jì)次數(shù)分布周工資上組限組次數(shù)小于上組限的累計(jì)次數(shù)小于上組限的累計(jì)百分比%80-9090-100100-110110-120120-1309010011012013037135231023283010337793100累計(jì)次數(shù)分布周工資上組限組次數(shù)小于上組限的累計(jì)次數(shù)小于上組限23作圖作圖24如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10513105-13017合計(jì)30反映不出觀察值分布特征Excel作直方圖如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10525分組太細(xì)會(huì)出現(xiàn)什么問(wèn)題?反映不出觀察值的分布特征分組太細(xì)會(huì)出現(xiàn)什么問(wèn)題?反映不出觀察值的分布特征26前面分組都是等距分組也有不等距分組在不等距分組情況下,要比較各組次數(shù)或分析總體結(jié)構(gòu),要消除由組距不等造成的影響。為此需計(jì)算單位組距的次數(shù),即頻數(shù)密度。每組單位組距次數(shù)=某組次數(shù)/該組組距前面分組都是等距分組也有不等距分組27次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的曲線,即次數(shù)曲線。常見(jiàn)的四種次數(shù)曲線:正態(tài)分布曲線,偏態(tài)曲線,J形曲線和U形曲線。次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的28正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實(shí)際中,許多社會(huì)現(xiàn)象的總體分布都趨向于正態(tài)分布,如農(nóng)作物單位面積產(chǎn)量的分布、零件公差的分布等。正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實(shí)際中,許多社會(huì)現(xiàn)象的總體29U
形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼兒和老年人死亡率高,而中青年死亡率低。自然界某一物種在理想條件下種群數(shù)量增長(zhǎng)的形式,如果以時(shí)間做橫坐標(biāo),種群數(shù)量做縱坐標(biāo)畫(huà)出來(lái)的曲線表示,曲線大致成J型曲線。
U形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼30洛倫茨(Lorens)曲線洛倫茨曲線是美國(guó)經(jīng)濟(jì)學(xué)家洛倫茨在二十世紀(jì)初提出的,應(yīng)用累積次數(shù)分配曲線描述一個(gè)國(guó)家或一個(gè)地區(qū)收入分配平均程度的一種圖示方法.收入分配不平均的程度可以通過(guò)基尼系數(shù)來(lái)測(cè)算?;嵯禂?shù)=A/(A+B)洛倫茨(Lorens)曲線洛倫茨曲線是美國(guó)經(jīng)濟(jì)學(xué)家洛倫茨在二31G的值在0~1之間。聯(lián)合國(guó)有關(guān)組織規(guī)定:
G小于0.2可認(rèn)為收入絕對(duì)平等;G在0.2~0.3之間表示比較平等;G在0.3~0.4之間表示相對(duì)合理;G在0.4~0.5之間表示收入差距較大;G大于0.6表示收入差距懸殊?;嵯禂?shù)0.4為國(guó)際警戒線,超過(guò)0.4則應(yīng)采取措施縮小收入差距G的值在0~1之間。323.3統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)指標(biāo)是說(shuō)明社會(huì)經(jīng)濟(jì)現(xiàn)象總體數(shù)量特征的名稱(chēng)和數(shù)值,是統(tǒng)計(jì)活動(dòng)對(duì)客觀存在的種種社會(huì)經(jīng)濟(jì)現(xiàn)象,按其具體名稱(chēng),在一定空間、時(shí)間條件下,進(jìn)行科學(xué)計(jì)量的數(shù)字結(jié)果。兩個(gè)特征:可計(jì)量性(具體性)和總體性(綜合性)形成指標(biāo)的現(xiàn)象特征必須是可以用數(shù)量來(lái)表現(xiàn)的統(tǒng)計(jì)指標(biāo)是由個(gè)體數(shù)量特征匯總或整理加工后得到的數(shù)值3.3統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)指標(biāo)是說(shuō)明社會(huì)經(jīng)濟(jì)現(xiàn)象總體數(shù)量特征的33一、統(tǒng)計(jì)指標(biāo)的種類(lèi)1.總量指標(biāo):反映總體現(xiàn)象的規(guī)模水平,以絕對(duì)數(shù)形式表現(xiàn),故也稱(chēng)為絕對(duì)指標(biāo)。如總?cè)丝?、?guó)民生產(chǎn)總值等;總量指標(biāo)按其所說(shuō)明的總體內(nèi)容的不同,分為總體單位總量和總體標(biāo)志總量總體單位總量反映總體單位的總量指標(biāo),如企業(yè)數(shù)目、職工人數(shù)等;總體標(biāo)志總量反映總體各單位某一數(shù)量標(biāo)志值總和的總量指標(biāo),如商品銷(xiāo)售額、總工資總額等;總量指標(biāo)按其所反映的不同時(shí)間狀況,分為時(shí)點(diǎn)總量和時(shí)期總量。一、統(tǒng)計(jì)指標(biāo)的種類(lèi)1.總量指標(biāo):反映總體現(xiàn)象的規(guī)模水平,以絕342.平均指標(biāo):將總體標(biāo)志總量指標(biāo)除以總體單位總量,得到平均指標(biāo);平均指標(biāo)=總體標(biāo)志總量/總體單位總量3.相對(duì)指標(biāo):兩個(gè)有聯(lián)系的指標(biāo)對(duì)比所得到的指標(biāo)都可以叫做相對(duì)指標(biāo)。(1)結(jié)構(gòu)相對(duì)指標(biāo)將總體的部分標(biāo)志總量與總體的標(biāo)志總量相比較,或?qū)⒖傮w的部分單位總量與總體全部單位數(shù)相比較。2.平均指標(biāo):將總體標(biāo)志總量指標(biāo)除以總體單位總量,得到平均指35
(2)比例相對(duì)指標(biāo)將總體內(nèi)部的部分與部分對(duì)比所得到的指標(biāo)(3)動(dòng)態(tài)相對(duì)指標(biāo)將同一內(nèi)容的指標(biāo)在不同時(shí)間上的數(shù)值進(jìn)行對(duì)比。
說(shuō)明現(xiàn)象在時(shí)間上的變化。
(4)強(qiáng)度相對(duì)指標(biāo)將同一時(shí)期內(nèi)容不同、但有一定聯(lián)系的兩個(gè)總量指標(biāo)對(duì)比。強(qiáng)度相對(duì)指標(biāo)常被用來(lái)說(shuō)明現(xiàn)象的密度、普遍程度。(2)比例相對(duì)指標(biāo)36二、統(tǒng)計(jì)指標(biāo)體系由相互聯(lián)系的若干統(tǒng)計(jì)指標(biāo)組成的一個(gè)指標(biāo)系統(tǒng)稱(chēng)為指標(biāo)體系。按指標(biāo)體系所反映的內(nèi)容分為基本統(tǒng)計(jì)指標(biāo)體系和專(zhuān)題統(tǒng)計(jì)指標(biāo)體系;基本統(tǒng)計(jì)指標(biāo)體系反映社會(huì)經(jīng)濟(jì)發(fā)展的基本情況,如人口統(tǒng)計(jì)指標(biāo)體系、科技統(tǒng)計(jì)指標(biāo)體系。專(zhuān)題統(tǒng)計(jì)指標(biāo)體系是就某一專(zhuān)門(mén)問(wèn)題而設(shè)立的。如企業(yè)經(jīng)濟(jì)效益評(píng)價(jià)指標(biāo)體系。按統(tǒng)計(jì)指標(biāo)體系所實(shí)施的范圍分為國(guó)家統(tǒng)計(jì)指標(biāo)體系、地方統(tǒng)計(jì)指標(biāo)體系、部門(mén)統(tǒng)計(jì)指標(biāo)體系和基層統(tǒng)計(jì)指標(biāo)體系;二、統(tǒng)計(jì)指標(biāo)體系由相互聯(lián)系的若干統(tǒng)計(jì)指標(biāo)組成的一個(gè)指標(biāo)系統(tǒng)稱(chēng)37三、統(tǒng)計(jì)指標(biāo)的應(yīng)用注意:1.統(tǒng)計(jì)指標(biāo)的內(nèi)涵和可比性2.多種指標(biāo)結(jié)合應(yīng)用三、統(tǒng)計(jì)指標(biāo)的應(yīng)用注意:383.4統(tǒng)計(jì)表和統(tǒng)計(jì)圖一個(gè)完整的統(tǒng)計(jì)表要求有:表號(hào)、表名、分組標(biāo)志或說(shuō)明、指標(biāo)名稱(chēng)及數(shù)值;p55統(tǒng)計(jì)圖有條形圖、線形圖、圓形圖、立體圖、枝葉圖等;3.4統(tǒng)計(jì)表和統(tǒng)計(jì)圖一個(gè)完整的統(tǒng)計(jì)表要求有:表號(hào)、表名、39樹(shù)莖樹(shù)葉
次數(shù)84853911947567106975366615571131101981512182
某研究所研究人員月工資收入的莖葉圖樹(shù)莖樹(shù)葉次數(shù)8485391194740第三章數(shù)據(jù)整理
按照研究的目的,將搜集到的原始數(shù)據(jù)進(jìn)行整理加工,從中提取有用的信息,并搜索其中的數(shù)量規(guī)律性。3.1數(shù)據(jù)分組3.2次數(shù)分配3.3統(tǒng)計(jì)指標(biāo)3.4統(tǒng)計(jì)表和統(tǒng)計(jì)圖第三章數(shù)據(jù)整理按照研究的目的,將搜集到的原413.1數(shù)據(jù)分組一、統(tǒng)計(jì)數(shù)據(jù)分組的目的及原則分組是將總體所有單位按一定的標(biāo)準(zhǔn)區(qū)分為若干部分分組前分組后25%33%42%分組的目的:概括數(shù)據(jù),清晰條理3.1數(shù)據(jù)分組一、統(tǒng)計(jì)數(shù)據(jù)分組的目的及原則分組是將總體所42分組時(shí)注意:
將具有共性的個(gè)體歸入同一組將總體內(nèi)部個(gè)體間的差異通過(guò)組別區(qū)分開(kāi)來(lái)分組的原則:保證總體中的任何一個(gè)個(gè)體或原始數(shù)據(jù)都能歸于某一個(gè)組且僅能歸于某一個(gè)組,即保證不重、不漏。統(tǒng)計(jì)分組的關(guān)鍵是分組標(biāo)志的選擇分組時(shí)注意:分組的原則:保證總體中的任何一431、按分組標(biāo)志的多少不同分:簡(jiǎn)單分組:分組僅按一個(gè)標(biāo)志來(lái)進(jìn)行復(fù)合分組:分組按兩個(gè)或兩個(gè)以上的標(biāo)志進(jìn)行,并且層疊在一起。二、統(tǒng)計(jì)分組的種類(lèi)1、按分組標(biāo)志的多少不同分:二、統(tǒng)計(jì)分組的種類(lèi)44例如:對(duì)全國(guó)的工業(yè)企業(yè)進(jìn)行簡(jiǎn)單分組:按經(jīng)濟(jì)類(lèi)型分:全民所有制企業(yè)、集體所有制企業(yè)、城鄉(xiāng)個(gè)體企業(yè)按輕重工業(yè)分:重工業(yè)、輕工業(yè)按企業(yè)規(guī)模大小分:大型企業(yè)、中型企業(yè)、小型企業(yè)復(fù)合分組:全民所有制集體所有制重工業(yè)輕工業(yè)重工業(yè)輕工業(yè)大型企業(yè)中型企業(yè)小型企業(yè)例如:對(duì)全國(guó)的工業(yè)企業(yè)進(jìn)行全民所有制集體所有制重工業(yè)輕工業(yè)重452、按分組標(biāo)志的性質(zhì)不同分:品質(zhì)分組:按品質(zhì)標(biāo)志進(jìn)行的分組如人口總體按性別分組、高校教師按職稱(chēng)分組。變量分組:按數(shù)量標(biāo)志進(jìn)行的分組如企業(yè)按職工人數(shù)分------1000人以下、1000-5000人、5000人以上2、按分組標(biāo)志的性質(zhì)不同分:46三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計(jì)研究的目的,在對(duì)現(xiàn)象進(jìn)行分析的基礎(chǔ)上,抓住具有本質(zhì)性的區(qū)別及反映現(xiàn)象內(nèi)在聯(lián)系的標(biāo)志來(lái)作為分組標(biāo)志。2、在統(tǒng)計(jì)整理中,為了全面認(rèn)識(shí)被研究現(xiàn)象總體,常常需要運(yùn)用多個(gè)分組標(biāo)志對(duì)總體進(jìn)行分組,形成一系列相互聯(lián)系、相互補(bǔ)充的分組體系。三、分組標(biāo)志與分組體系的選擇1、根據(jù)統(tǒng)計(jì)研究的目的,在對(duì)現(xiàn)象47四、統(tǒng)計(jì)分組方法1、品質(zhì)分組的方法分組標(biāo)志一經(jīng)確定,組名稱(chēng)和組數(shù)也就確定,不存在組與組之間界限區(qū)分的困難。復(fù)雜的情況下,各組界限不易劃分,從這一組到另一組存在各種過(guò)度狀態(tài),邊緣不清。2、變量分組的方法:變量分組的目的并不是單純確定各組在數(shù)量上的差別,而是要通過(guò)數(shù)量上變化來(lái)區(qū)分各組的不同類(lèi)型和性質(zhì)。四、統(tǒng)計(jì)分組方法1、品質(zhì)分組的方法48單項(xiàng)式分組:是依次將每一個(gè)變量值作為一組。(適用于離散型變量且變量取值不多的情況)例如,居民家庭人口數(shù),其取值不可能很多,且每一個(gè)取值都可視為一種類(lèi)型。按家庭人口數(shù)分組
1人
2人
3人
4人
5人
6人單項(xiàng)式分組:是依次將每一個(gè)變量值作為一組。按家庭人口數(shù)分組49組距式分組:把整個(gè)變量值依次劃分為幾個(gè)區(qū)間,各個(gè)變量值按其大小確定所歸并的區(qū)間,區(qū)間的距離稱(chēng)組距。包括等距分組和不等距分組適用于連續(xù)型變量或雖為離散型變量但取值很多,不便一一列舉的情況。1)連續(xù)型變量的組距式分組如對(duì)商店按銷(xiāo)售額進(jìn)行分組:按銷(xiāo)售額分組(萬(wàn)元)50以下;50—200;200—400;400—600600—800;800以上組距式分組:把整個(gè)變量值依次劃分為幾個(gè)區(qū)間,各個(gè)變量502)離散型變量的組距式分組如對(duì)某企業(yè)的生產(chǎn)小組按人數(shù)分組:生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—1011—1617—222)離散型變量的組距式分組生產(chǎn)小組按人數(shù)分組(人)組數(shù)5—151組距式分組中的有關(guān)問(wèn)題:(1)組距和組中值組距兩端的數(shù)值稱(chēng)為組限,其中:每組的起點(diǎn)數(shù)值稱(chēng)下限、每組的終點(diǎn)數(shù)值稱(chēng)上限。離散型變量分組:各組的上下限都可以用確定的數(shù)值(整數(shù))表示。
連續(xù)型變量分組:相鄰組的上限和下限無(wú)法用兩個(gè)確定的數(shù)值分別表示,因此上一組的上限同時(shí)也是下一組的下限。組距式分組中的有關(guān)問(wèn)題:52例如:企業(yè)按工人工資對(duì)工人進(jìn)行分組如下:
500—600元
600---700元
700---800元如果某工人工資為700元,應(yīng)將他歸并到哪一組?“上組限不計(jì)入”原則:遇到某單位的標(biāo)志值剛好等于相鄰兩組上下限時(shí),一般把此值歸并到作為下限的那一組。注意EXCEL!例如:企業(yè)按工人工資對(duì)工人進(jìn)行分組如下:注意EXCEL!53(2)全距:變量值中最大值與最小值的差數(shù)組數(shù)=全距/組距組距=上限—下限(3)組中值=(上限+下限)/2缺下限的開(kāi)口組:組距數(shù)列的首組出現(xiàn)“***以下”缺上限的開(kāi)口組:組距數(shù)列的末組出現(xiàn)“***以上”(2)全距:變量值中最大值與最小值的差數(shù)缺下限的開(kāi)口組:組距54合理確定組中值例如:第一組:50人以下第二組:50—200人按公式應(yīng)定下限為0合理確定組中值例如:應(yīng)定下限為0553.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個(gè)數(shù)稱(chēng)為次數(shù),各組間的次數(shù)稱(chēng)為次數(shù)分配。次數(shù)分配描述了總體的結(jié)構(gòu)和特征。一、品質(zhì)次數(shù)分配的編制按品質(zhì)標(biāo)志進(jìn)行分組,由總體各組的名稱(chēng)及各組的單位數(shù)(次數(shù))組成。
某高校學(xué)生的性別分布
按性別分組人數(shù)比例(%)女生544841.2男生780458.8合計(jì)13262100.0Excel演示3.2次數(shù)分配數(shù)據(jù)觀察值在各組中的個(gè)數(shù)稱(chēng)為次數(shù),各組間的次56二、變量次數(shù)分配的編制1、將原始資料按順序排序2、確定組數(shù)與組距(1)當(dāng)n較大時(shí),k取10~20;當(dāng)n<50時(shí),k取5~6
;(2)如果數(shù)據(jù)分布比較均勻、對(duì)稱(chēng),即中間數(shù)值次數(shù)多,大小極端值次數(shù)少,考慮用以下公式來(lái)確定組數(shù):組數(shù)=1+3.322log
n式中,n
表示總次數(shù),log
表示以10為底的對(duì)數(shù)。組距=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)二、變量次數(shù)分配的編制1、將原始資料按順序排序(2)如果數(shù)573、確定組限每組區(qū)間的界限稱(chēng)為組限。離散型變量,分組時(shí)相鄰組的組限必須間斷。
如某省企業(yè)按職工人數(shù)分組,可分為:0-99,100-199,200-299,300-399,…,900-1000等;連續(xù)型變量,相鄰組的上、下限采用重疊的方法分組界定。
如按職工工資分組,0-500,500-1000,1000-1500,1500-2000,…,等;4、將各個(gè)數(shù)據(jù)按其數(shù)值大小歸入相應(yīng)的組內(nèi)。3、確定組限58某企業(yè)非熟練工人的周工資額(元)單位:元人員編號(hào)周收入人員編號(hào)周收入人員編號(hào)周收入11061199218528412942210631111311923101491148724105510915118259669116972610571111710327107810718103281289121199529111101052010630101返回某企業(yè)非熟練工人的周工資額(元)單位:元人員編號(hào)周收入人員編59分組計(jì)算組數(shù)=1+3.322logn(n=30)=5.9分6組組距:每組區(qū)間的寬度=(觀察值中的最大數(shù)值-觀察值中的最小數(shù)值)/組數(shù)
=(128-84)/6=7.384-91,91-98,98-105,105-112,112-119,119-126;未包含最大值83-91,91-99,99-107,107-115,115-123,123-131;分組計(jì)算組數(shù)=1+3.322logn(n=30)60按5組,10元作為組距,計(jì)算次數(shù)。求次數(shù)分配表和直方圖結(jié)合實(shí)際數(shù)據(jù),組距為10比較好計(jì)算且方便,分組的組數(shù)相應(yīng)從6減少為5。最小值為83,下限從80開(kāi)始,按5組,10元作為組距,計(jì)算次數(shù)。求次數(shù)分配表和直方圖61次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90390-1007100-11013110-1205120-1302合計(jì)30次數(shù)分配表工資收入次數(shù)分配表工資收入分組次數(shù)80-90362累計(jì)次數(shù)分布周工資上組限組次數(shù)小于上組限的累計(jì)次數(shù)小于上組限的累計(jì)百分比%80-9090-100100-110110-120120-1309010011012013037135231023283010337793100累計(jì)次數(shù)分布周工資上組限組次數(shù)小于上組限的累計(jì)次數(shù)小于上組限63作圖作圖64如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10513105-13017合計(jì)30反映不出觀察值分布特征Excel作直方圖如果分兩組工資收入次數(shù)分配表工資收入分組次數(shù)80-10565分組太細(xì)會(huì)出現(xiàn)什么問(wèn)題?反映不出觀察值的分布特征分組太細(xì)會(huì)出現(xiàn)什么問(wèn)題?反映不出觀察值的分布特征66前面分組都是等距分組也有不等距分組在不等距分組情況下,要比較各組次數(shù)或分析總體結(jié)構(gòu),要消除由組距不等造成的影響。為此需計(jì)算單位組距的次數(shù),即頻數(shù)密度。每組單位組距次數(shù)=某組次數(shù)/該組組距前面分組都是等距分組也有不等距分組67次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的曲線,即次數(shù)曲線。常見(jiàn)的四種次數(shù)曲線:正態(tài)分布曲線,偏態(tài)曲線,J形曲線和U形曲線。次數(shù)曲線用直線線段連接直方圖各組條形頂端中值,形成一條平滑的68正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實(shí)際中,許多社會(huì)現(xiàn)象的總體分布都趨向于正態(tài)分布,如農(nóng)作物單位面積產(chǎn)量的分布、零件公差的分布等。正態(tài)分布曲線偏態(tài)曲線鐘型分布在客觀實(shí)際中,許多社會(huì)現(xiàn)象的總體69U
形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼兒和老年人死亡率高,而中青年死亡率低。自然界某一物種在理想條件下種群數(shù)量增長(zhǎng)的形式,如果以時(shí)間做橫坐標(biāo),種群數(shù)量做縱坐標(biāo)畫(huà)出來(lái)的曲線表示,曲線大致成J型曲線。
U形曲線J形曲線如人口按年齡死亡率的分布,在人口總體中,幼70洛倫茨(Lorens)曲線洛倫茨曲線是美國(guó)經(jīng)濟(jì)學(xué)家洛倫茨在二十世紀(jì)初提出的,應(yīng)用累積次數(shù)分配曲線描述一個(gè)國(guó)家或一個(gè)地區(qū)收入分配平均程度的一種圖示方法.收入分配不平均的程度可以通過(guò)基尼系數(shù)來(lái)測(cè)算?;嵯禂?shù)=A/(A+B)洛倫茨(Lorens)曲線洛倫茨曲線是美國(guó)經(jīng)濟(jì)學(xué)家洛倫茨在二71G的值在0~1之間。聯(lián)合國(guó)有關(guān)組織規(guī)定:
G小于0.2可認(rèn)為收入絕對(duì)平等;G在0.2~0.3之間表示比較平等;G在0.3~0.4之間表示相對(duì)合理;G在0.4~0.5之間表示收入差距較大;G大于0.6表示收入差距懸殊?;嵯禂?shù)0.4為國(guó)際警戒線,超過(guò)0.4則應(yīng)采取措施縮小收入差距G的值在0~1之間。723.3統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)指標(biāo)是說(shuō)明社會(huì)經(jīng)濟(jì)現(xiàn)象總體數(shù)量特征的名稱(chēng)和數(shù)值,是統(tǒng)計(jì)活動(dòng)對(duì)客觀存在的種種社會(huì)經(jīng)濟(jì)現(xiàn)象,按其具體名稱(chēng),在一定空間、時(shí)間條件下,進(jìn)行科學(xué)計(jì)量的數(shù)字結(jié)果。兩個(gè)特征:可計(jì)量性(具體性)和總體性(綜合性)形
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度冷鏈物流空調(diào)清洗消毒與防凍服務(wù)合同2篇
- 2025年度企業(yè)內(nèi)部員工保密協(xié)議(新修訂)5篇
- 二零二五年度國(guó)際會(huì)議兼職同聲傳譯及外教聘請(qǐng)協(xié)議3篇
- 2025年香港建筑工程合同正規(guī)范本標(biāo)準(zhǔn)版6篇
- 二零二五年度城市污水處理廠承包管理服務(wù)協(xié)議4篇
- 二零二五年度大型活動(dòng)現(xiàn)場(chǎng)解說(shuō)配音合作協(xié)議4篇
- 2025年噴灌系統(tǒng)節(jié)水技術(shù)創(chuàng)新合作合同4篇
- 2025年度農(nóng)產(chǎn)品供應(yīng)鏈金融合作協(xié)議-@-1
- 二零二五年度展覽館場(chǎng)地租賃與展會(huì)組織服務(wù)合同3篇
- 2025年金融科技支付系統(tǒng)開(kāi)發(fā)與運(yùn)營(yíng)合同3篇
- 茉莉花-附指法鋼琴譜五線譜
- 結(jié)婚函調(diào)報(bào)告表
- SYT 6968-2021 油氣輸送管道工程水平定向鉆穿越設(shè)計(jì)規(guī)范-PDF解密
- 冷庫(kù)制冷負(fù)荷計(jì)算表
- 肩袖損傷護(hù)理查房
- 設(shè)備運(yùn)維管理安全規(guī)范標(biāo)準(zhǔn)
- 辦文辦會(huì)辦事實(shí)務(wù)課件
- 大學(xué)宿舍人際關(guān)系
- 2023光明小升初(語(yǔ)文)試卷
- GB/T 14600-2009電子工業(yè)用氣體氧化亞氮
- 申請(qǐng)使用物業(yè)專(zhuān)項(xiàng)維修資金征求業(yè)主意見(jiàn)表
評(píng)論
0/150
提交評(píng)論