第三章統(tǒng)計(jì)學(xué)_第1頁(yè)
第三章統(tǒng)計(jì)學(xué)_第2頁(yè)
第三章統(tǒng)計(jì)學(xué)_第3頁(yè)
第三章統(tǒng)計(jì)學(xué)_第4頁(yè)
第三章統(tǒng)計(jì)學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩122頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章統(tǒng)計(jì)整理PowerPoint統(tǒng)計(jì)學(xué)數(shù)據(jù)的整理與顯示

(基本問(wèn)題)要弄清所面對(duì)的數(shù)據(jù)類型不同類型的數(shù)據(jù),采取不同的處理方式和方法對(duì)分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對(duì)數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)第3章統(tǒng)計(jì)數(shù)據(jù)的整理與顯示3.1數(shù)據(jù)的計(jì)量與類型3.2數(shù)值型數(shù)據(jù)的整理與顯示3.3品質(zhì)數(shù)據(jù)的整理與顯示3.4統(tǒng)計(jì)表第一節(jié)數(shù)據(jù)的計(jì)量與類型一、數(shù)據(jù)的類型二、四個(gè)測(cè)定層次的比較

三、不同類型數(shù)據(jù)的分析方法一、統(tǒng)計(jì)數(shù)據(jù)的類型數(shù)據(jù)的類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)二、四個(gè)測(cè)定層次的比較

測(cè)定層次特征運(yùn)算功能舉例1、定類數(shù)據(jù)分類計(jì)數(shù)產(chǎn)業(yè)分類2、定序數(shù)據(jù)

分類、排序計(jì)數(shù)、排序企業(yè)等級(jí)在班級(jí)排名3、定距數(shù)據(jù)分類、排序有基本測(cè)量單位計(jì)數(shù)、排序、加減溫度鞋碼4、定比數(shù)據(jù)分類、排序有基本測(cè)量單位、有絕對(duì)零點(diǎn)計(jì)數(shù)、排序加減、乘除商品銷售額收入課堂小練習(xí)請(qǐng)指出下列數(shù)據(jù)的類型1、學(xué)生到達(dá)教室的距離2、SAT(5分制)3、按照出生地所在省市所作的學(xué)生分類4、按照大學(xué)新生、大學(xué)二年級(jí)學(xué)生、三年級(jí)學(xué)生和四年級(jí)學(xué)生對(duì)學(xué)生的排序5、學(xué)生每周學(xué)習(xí)的小時(shí)數(shù)三、數(shù)據(jù)類型與統(tǒng)計(jì)方法數(shù)據(jù)類型與統(tǒng)計(jì)方法定類數(shù)據(jù)定序數(shù)據(jù)品質(zhì)數(shù)據(jù)數(shù)量數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)參數(shù)方法非參數(shù)方法3.2數(shù)值型數(shù)據(jù)的整理與顯示

一、引言二、構(gòu)造頻數(shù)分布(分組)的步驟三、數(shù)值型數(shù)據(jù)的圖形表示四、累積頻數(shù)分布五、統(tǒng)計(jì)分組

一、引言

羅布是位于哥倫比亞的龐蒂亞克公司的企業(yè)主。羅布的父親在1964年創(chuàng)建了這家企業(yè),在30多年里他們專門銷售龐蒂亞克產(chǎn)品。20世紀(jì)90年代初期,羅布父親的健康狀況變得不太樂(lè)觀,羅布接管了更多處理企業(yè)日常運(yùn)作問(wèn)題的工作。與此同時(shí),汽車業(yè)開始發(fā)生變革(商人們從一些制造商那里購(gòu)買汽車),羅布面臨著一些重大問(wèn)題的決策。當(dāng)另一個(gè)經(jīng)營(yíng)沃爾沃(Volvos)汽車、Saabs汽車和大眾汽車(Volkswagens)的本地商人與羅布接洽有關(guān)收購(gòu)自己企業(yè)的事情時(shí),第一個(gè)重大的決策來(lái)臨了。經(jīng)過(guò)大量的分析和思考,羅布收購(gòu)了那家企業(yè)。再往后,當(dāng)?shù)氐募怔椘髽I(yè)陷入了困境,羅布也把它收購(gòu)下來(lái)了。所以現(xiàn)在羅布的公司出售龐蒂亞克公司的全部系列產(chǎn)品(昂貴的沃爾沃汽車、Saabs汽車、大眾汽車)、克萊斯勒產(chǎn)品以及流行的吉普系列。該公司雇用了83名員工,其中23名是全職銷售人員。由于產(chǎn)品品種的多樣化,汽車的售價(jià)也有很大變動(dòng)。頂級(jí)的沃爾沃汽車的售價(jià)比龐蒂亞克AM級(jí)別的2倍還多。羅布想要使用一些圖表和圖形,以便每月都能從中找出售價(jià)趨向的焦點(diǎn)、售價(jià)的變動(dòng)程度和每項(xiàng)產(chǎn)品售價(jià)的走勢(shì)。在本章中,我們將對(duì)羅布或像他一樣管理企業(yè)的人士提出具有實(shí)用價(jià)值的技術(shù)方法。某月該公司賣出了80輛車,價(jià)格如下:

龐蒂亞克公司某月車輛售價(jià)(單位:美元)201972037217454205912365124453142661502125683278721658720169328511625117047212852132421609256701254616873222512227725034215332444316889170041435717155166882065723613178951720320765227832366129277176421898121052227991279415263329251439914968173561844218722163311981716766176331796219845232852489626076294921589018740193742157122449253371764220613276551944214891178182323717445185561863921296原始數(shù)據(jù):未經(jīng)整理的數(shù)據(jù)。

根據(jù)數(shù)據(jù)統(tǒng)計(jì)研究的需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)化分成不同的組別,分組后的數(shù)據(jù)稱為分組數(shù)據(jù)。數(shù)據(jù)分組分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點(diǎn))1.將一個(gè)變量值作為一組2.適合于離散變量3.適合于變量值較少的情況

組距分組

(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則以及“上組限不在內(nèi)”原則可采用等距分組,也可采用不等距分組~~~~~二、構(gòu)造頻數(shù)分布(分組)的步驟頻數(shù)分布:把一組數(shù)據(jù)分到互不包含的組里以顯示各組中觀察值的個(gè)數(shù)。第一步:確定全距(R)R=最大值-最小值=32925-12546=20379第二步:確定組數(shù)這一步的目標(biāo)是用恰好足夠的組來(lái)揭示數(shù)據(jù)分布的形狀,太多或太少的組都不能揭示數(shù)據(jù)集的基本形狀。例如:組數(shù)太少的一個(gè)例子:車輛售價(jià)(美元)車輛數(shù)目12000-210004821000-300003030000-390002總計(jì)80確定組數(shù)的例子人口按年齡分組0-8嬰幼兒8-18少年兒童18-60中青年60以上老年學(xué)生按成績(jī)分組60以下60-7070-8080-9090以上確定組數(shù)的一個(gè)法則:2的K次方法則:選擇最小的K,使得K滿足2k>n在本案例中,n=80,則最小K=7,所以可把這組數(shù)據(jù)分為7組。確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),組數(shù)一般為5

K15第三步確定組距

1.組距:上限與下限之差2.組距有等距與不等距之分3.等距式分組組距=全距/組數(shù)4.組距通常取10或100或1000的倍數(shù)5.能用等距分組的盡可能用等距分組在本案例中,組距=20379/7≈2911美元取1000的倍數(shù),則組距為3000美元第四步確定各組的組限下限:一個(gè)組的最小值上限:一個(gè)組的最大值3.最小組的下限要小于或等于最小變量值,最大組的上限要大于或等于最大變量值,并且一般取10或100的倍數(shù)。第四步確定各組的組限在本案例中,Xmin=12546,Xmax=32925,則第一組的下限可取為12000,而最大組的上限則可取為33000。因此可選用的組如下:如把售價(jià)單位由美元變?yōu)榍涝?,則可簡(jiǎn)化為右圖。12000-1500012-1515000-1800015-1818000-2100018-2121000-2400021-2424000-2700024-2727000-3000027-3030000-3300030-33第五步計(jì)算各組次數(shù),編制頻數(shù)分布數(shù)列表3-4某月龐蒂亞克公司汽車售價(jià)的頻數(shù)分布售價(jià)(千美元)頻數(shù)頻率(%)12-1581015-182328.7518-211721.2521-241822.524-2781027-304530-3322.5總計(jì)801001.最小組無(wú)下限或最大組無(wú)上限的分組稱為開口組2.相鄰兩組的組限重合,并遵循“上限不在內(nèi)”原則3.組中值=(上限+下限)/2由前面頻數(shù)分布可得到的信息:1.售價(jià)的變化范圍大約是12000~33000美元。2.售價(jià)集中在15000~24000美元,總共58輛車或者所售車輛數(shù)量的72.5%處于這個(gè)范圍。3.最密集的組是15000~18000美元這一組。這組的組中值是16500美元,因此我們說(shuō)一般售價(jià)為16500美元。4.兩輛車的售價(jià)在30000美元以上,而八輛車的售價(jià)低于150000美元。用EXCEL做頻數(shù)分布1.頻數(shù)分布函數(shù)(FREQUENCY)FREQUENCY(data-array,bins-array)data-array為用來(lái)編制頻數(shù)分布的數(shù)據(jù)bins-array為頻數(shù)的接收區(qū)間CTRL+SHIFT+ENTER就可到結(jié)果表3-4某月龐蒂亞克公司汽車售價(jià)的頻數(shù)分布售價(jià)(千美元)頻數(shù)頻率(%)12-1581015-182328.7518-211721.2521-241822.524-2781027-3041030-3325總計(jì)80100去年第一季度,某公司銷售部的11名成員掙得的傭金是(單位:美元):165014751510167015951760154014951590162515101.像1650美元和1475美元這樣的數(shù)值稱做什么?2.以1400~1500為第一組,1500~1600為第二組,以此類推,把以上數(shù)據(jù)整理成頻數(shù)分布。3.你的頻數(shù)分布表中右邊一列數(shù)字稱作什么?4.在頻數(shù)分布的基礎(chǔ)上,描述季度傭金的分布。三、數(shù)值型數(shù)據(jù)的圖形表示

(直方圖的制作)橫軸表示各組,縱軸表示頻數(shù)的一種圖形。頻數(shù)由直條的高度表示,并且直條之間相互緊鄰。當(dāng)縱軸用頻率表示時(shí),直方圖下的總面積等于1分組數(shù)據(jù)—直方圖

(直方圖的繪制)頻數(shù)(人)1512963105110115120125130135140日加工零件數(shù)(個(gè))圖3-5某車間工人日加工零件數(shù)的直方圖我一眼就看出來(lái)了,大多數(shù)人的日加工零件數(shù)在120~125之間!用EXCEL做直方圖

某月龐蒂亞克公司汽車售價(jià)的頻數(shù)分布

插入-----圖表三、數(shù)值型數(shù)據(jù)的圖形表示

(折線圖的制作)折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交1512963105110115120125130135140日加工零件數(shù)(個(gè))頻數(shù)(人)折線圖下的面積與直方圖的面積相等!折線圖的繪制圖3-6某車間工人日加工零件數(shù)的折線圖用EXCEL做折線圖

某月龐蒂亞克公司汽車售價(jià)的頻數(shù)分布

四、累積頻數(shù)分布(累計(jì)頻數(shù)折線圖)

表3-5某月龐蒂亞克公司汽車售價(jià)的頻數(shù)分布

售價(jià)(千美元)頻數(shù)由小向大累積由大向小累積12~15888015~1823317218~2117484921~2418663224~278741427~30478630~332802合計(jì)80未分組數(shù)據(jù)—莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字對(duì)于n(20

n

300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過(guò)

L=[10×lg

n]

6.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖

(例題分析)某電腦公司銷售量分布的莖葉圖未分組數(shù)據(jù)—莖葉圖

(擴(kuò)展的莖葉圖)未分組數(shù)據(jù)—箱線圖

(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接該箱線圖也稱為Median/Quart./Range箱線圖

未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Range箱線圖分布的形狀與箱線圖

對(duì)稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析)【例】

從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如右表。試?yán)L制各科考試成績(jī)的批比較箱線圖,并分析各科考試成績(jī)的分布特征11名學(xué)生各科的考試成績(jī)數(shù)據(jù)課程名稱學(xué)生編號(hào)1234567891011英語(yǔ)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營(yíng)銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)8門課程考試成績(jī)的Median/Quart./Range箱線圖11名學(xué)生8門課程考試成績(jī)的Median/Quart./Range箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

(例題分析—Median/Quart./Range)時(shí)間序列數(shù)據(jù)—線圖

(lineplot)表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形時(shí)間一般繪在橫軸,數(shù)據(jù)繪在縱軸圖形的長(zhǎng)寬比例大致為10:74.一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷時(shí)間序列數(shù)據(jù)—線圖

(例題分析)【例】我國(guó)1991~2003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如右表。試?yán)L制線圖¥

1991~2003年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2時(shí)間序列數(shù)據(jù)—線圖

(例題分析)兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖

(2DScatterplots)展示兩個(gè)變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi

,yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的個(gè)點(diǎn)稱為散點(diǎn),由坐標(biāo)及其散點(diǎn)形成的二維數(shù)據(jù)圖溫度/0C降雨量/mm產(chǎn)量/(kg/hm2)62522508403450105845001368575014110580016987500211208250兩個(gè)變量間的關(guān)系—二維散點(diǎn)圖

(2Dscatterplots)三個(gè)變量間的關(guān)系—?dú)馀輬D

(bubblechart)顯示三個(gè)變量之間的關(guān)系圖中數(shù)據(jù)點(diǎn)的大小依賴于第三個(gè)變量也稱為蜘蛛圖(spiderchart)顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用4.假定各變量的取值具有相同的正負(fù)號(hào),總的絕對(duì)值與圖形所圍成的區(qū)域成正比5.可用于研究多個(gè)樣本之間的相似程度多變量數(shù)據(jù)—雷達(dá)圖

(radarchart)

設(shè)有n組樣本S1,S2,…,Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2,…,XP,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是多變量數(shù)據(jù)—雷達(dá)圖

(雷達(dá)圖的制作)先做一個(gè)圓,然后將圓P等分,得到P個(gè)點(diǎn),令這P個(gè)點(diǎn)分別對(duì)應(yīng)P個(gè)變量,在將這P個(gè)點(diǎn)與圓心連線,得到P個(gè)輻射狀的半徑,這P個(gè)半徑分別作為P個(gè)變量的坐標(biāo)軸,每個(gè)變量值的大小由半徑上的點(diǎn)到圓心的距離表示將同一樣本的值在P個(gè)坐標(biāo)上的點(diǎn)連線。這樣,n個(gè)樣本形成的n個(gè)多邊形就是一個(gè)雷達(dá)圖多變量數(shù)據(jù)—雷達(dá)圖

(例題分析)【例3.10】2003年我國(guó)城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖今天的主食是面包2003年城鄉(xiāng)居民家庭平均每人生活消費(fèi)支出構(gòu)成(%)項(xiàng)目城鎮(zhèn)居民農(nóng)村居民食品衣著家庭設(shè)備用品及服務(wù)醫(yī)療保健交通通訊娛樂(lè)教育文化服務(wù)居住雜項(xiàng)商品與服務(wù)37.129.796.307.3111.0814.3510.743.3045.595.674.205.968.3612.1315.872.21多變量數(shù)據(jù)—雷達(dá)圖

(例題分析)數(shù)據(jù)類型及圖示

(小結(jié))數(shù)據(jù)類型品質(zhì)數(shù)據(jù)數(shù)值型數(shù)據(jù)匯總表原始數(shù)據(jù)分組數(shù)據(jù)時(shí)序數(shù)據(jù)多元數(shù)據(jù)條形圖餅圖莖葉圖箱線圖直方圖線圖散點(diǎn)圖氣泡圖雷達(dá)圖環(huán)形圖五、統(tǒng)計(jì)分組(一)、統(tǒng)計(jì)分組的概念

統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的目的,將統(tǒng)計(jì)總體按照一定的標(biāo)志區(qū)分為若干個(gè)不同類型或性質(zhì)的組成部分的一種統(tǒng)計(jì)方法。分組前分組后25%33%42%總體“分”,個(gè)體“合”結(jié)果“組內(nèi)性質(zhì)更近,組間差異更大”1.劃分性質(zhì)不同的各種類型,研究其特征和規(guī)律性

表1某地近幾年農(nóng)業(yè)總產(chǎn)值情況

單位:億元(二)統(tǒng)計(jì)分組的作用2.分析總體中各個(gè)組成部分的構(gòu)成情況

表2我國(guó)國(guó)內(nèi)生產(chǎn)總值構(gòu)成情況(%)3.可以揭示現(xiàn)象之間的依存關(guān)系

35018~2032016~1827014~1623012~1420010~12單位面積產(chǎn)量(kg)按耕作深度分組(厘米)表3單位面積產(chǎn)量與耕作程度的關(guān)系(三)分組的原則1.窮盡原則2.互斥原則問(wèn)題:某商場(chǎng)的服裝分為男裝、女裝、童裝三類,是否符合互斥原則?(四)統(tǒng)計(jì)分組的種類標(biāo)志人數(shù)(人)比重(%)按性別分組男性女性按企業(yè)性質(zhì)分組國(guó)有企業(yè)獨(dú)資企業(yè)其他企業(yè)按規(guī)模分組大型企業(yè)中型企業(yè)小型企業(yè)1.簡(jiǎn)單分組與復(fù)合分組簡(jiǎn)單分組對(duì)同一總體選擇兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行重疊分組,就叫復(fù)合分組。多個(gè)復(fù)合分組組成的體系就是復(fù)合分組體系。國(guó)民收入使用額積累生產(chǎn)性積累農(nóng)業(yè)輕工業(yè)重工業(yè)非生產(chǎn)性積累居民住宅文化服務(wù)設(shè)施消費(fèi)居民消費(fèi)社會(huì)集團(tuán)消費(fèi)復(fù)合分組2.品質(zhì)標(biāo)志分組和數(shù)量標(biāo)志分組標(biāo)志人數(shù)(人)比重(%)按性別分組男性女性按產(chǎn)值分組大型企業(yè)中型企業(yè)小型企業(yè)品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組

(五)分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

1.將一個(gè)變量值作為一組2.適合于離散變量3.適合于變量值較少的情況

單變量值分組

表3-1

某高校新生年齡構(gòu)成情況表新生年齡(歲)學(xué)生人數(shù)(人)171001835819420201082185222合計(jì)1083組距分組

將變量值的一個(gè)區(qū)間作為一組適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~等距分組表

表3-2某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計(jì)50100不等距距分組表表3-3某市工業(yè)企業(yè)職工人數(shù)分布表按企業(yè)職工人數(shù)分組工業(yè)企業(yè)單位數(shù)不足10人5761810-50人15523650-10073310100-500107028500-1000151571000-300077173000-50009035000-1000058310000以上302總計(jì)417904

分布數(shù)列

分布數(shù)列的種類上節(jié)小結(jié)單項(xiàng)式變量數(shù)列組距式變量數(shù)列等距分組異距分組品質(zhì)分布數(shù)列變量分布數(shù)列第二節(jié)品質(zhì)數(shù)據(jù)的整理與顯示

(基本問(wèn)題)對(duì)定類數(shù)據(jù)和定序數(shù)據(jù)主要是做分類整理對(duì)定距數(shù)據(jù)和定比數(shù)據(jù)則主要是做分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)定類數(shù)據(jù)的整理

(基本過(guò)程)

1.列出各類別

2.計(jì)算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)定類數(shù)據(jù)整理—頻數(shù)分布表

(實(shí)例)【例3.1】為研究廣告市場(chǎng)的狀況,一家廣告公司在某城市隨機(jī)抽取200人就廣告問(wèn)題做了郵寄問(wèn)卷調(diào)查,其中的一個(gè)問(wèn)題是“您比較關(guān)心下列哪一類廣告?”1.商品廣告;2.服務(wù)廣告;3.金融廣告;4.房地產(chǎn)廣告;5.招生招聘廣告;6.其他廣告。表3-6某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0合計(jì)200100分類數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)【例】一家市場(chǎng)調(diào)查公司為研究不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)

用Excel制作頻數(shù)分布表綠色健康飲品使用Excel計(jì)數(shù)函數(shù)(COUNTIF)

如果只需要計(jì)算某一類別的數(shù)據(jù)個(gè)數(shù),可以使用Excel中的統(tǒng)計(jì)函數(shù)【COUNTIF】。在對(duì)話框【Range】后輸入數(shù)據(jù)區(qū)域,在【Criteria】后輸入數(shù)字、表達(dá)式、字符串等,計(jì)數(shù)單元格必須符合的條件,即可得出結(jié)果例如,我們要計(jì)算出可口可樂(lè)出現(xiàn)的頻數(shù),在【Range】后輸入A1:A50(數(shù)據(jù)所在的區(qū)域),在【Criteria】后輸入“可口可樂(lè)”,結(jié)果為15。如果數(shù)據(jù)區(qū)域是數(shù)值型數(shù)據(jù),計(jì)算符合特定條件的數(shù)據(jù)個(gè)數(shù),則可在【Criteria】后輸入“>某一數(shù)值”、“<某一數(shù)值”、“=某一數(shù)值”,等等統(tǒng)計(jì)函數(shù)—COUNTIF定類數(shù)據(jù)的圖示—條形圖

(條形圖的制作)1.條形圖是用寬度相同的條形的高度或長(zhǎng)短來(lái)表示數(shù)據(jù)變動(dòng)的圖形2.在表示定類數(shù)據(jù)的分布時(shí),是用條形圖的高度來(lái)表示各類別數(shù)據(jù)的頻數(shù)或頻率3.繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖定類數(shù)據(jù)的圖示—條形圖

(由Excel繪制的條形圖)人數(shù)(人)5191610211204080120

商品廣告

服務(wù)廣告

金融廣告

房地產(chǎn)廣告

招生招聘廣告

其他廣告廣告類型

圖3-1某城市居民關(guān)注不同類型廣告的人數(shù)分布直方圖與條形圖的區(qū)別條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的。直方圖矩形的高度表示每一組的頻數(shù)或頻率,寬度則表示各組的組距,其高度與寬度均有意義。直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列分類數(shù)據(jù)的圖示—條形圖

(例題分析)分類數(shù)據(jù)的圖示—帕雷托圖(Paretochart)按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖主要用于展示分類數(shù)據(jù)的分布分類數(shù)據(jù)的圖示—對(duì)比條形圖

(side-by-sidebarchart)分類變量在不同時(shí)間或不同空間上有多個(gè)取值對(duì)比分類變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢(shì)電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688分類數(shù)據(jù)的圖示—對(duì)比條形圖

(例題分析)定類數(shù)據(jù)的圖示—圓形圖

(圓形圖的制作)也稱餅圖,是用圓形及園內(nèi)扇形的面積來(lái)表示數(shù)值大小的圖形主要用于表示總體中各組成部分所占的比重,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用在繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示定類數(shù)據(jù)的圖示—圓形圖

(由Excel繪制的圓形圖)

其他廣告1.0%

房地產(chǎn)廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務(wù)廣告25.5%

招生招聘廣告5.8%圖3-2某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成圖并沒(méi)有說(shuō)謊,是說(shuō)謊者在畫圖。

BenjaminDisraeli定序數(shù)據(jù)的整理與顯示定序數(shù)據(jù)的整理

(可計(jì)算的指標(biāo))1.累計(jì)頻數(shù):將各類別的頻數(shù)逐級(jí)累加2.累計(jì)頻率:將各類別的頻率(百分比)逐級(jí)累加

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論