第三章 數(shù)據(jù)整理與圖表展示.ppt_第1頁
第三章 數(shù)據(jù)整理與圖表展示.ppt_第2頁
第三章 數(shù)據(jù)整理與圖表展示.ppt_第3頁
第三章 數(shù)據(jù)整理與圖表展示.ppt_第4頁
第三章 數(shù)據(jù)整理與圖表展示.ppt_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、案例:如何描述不同原因引起的壽命損失 文字:未結(jié)婚的男性會(huì)使壽命減少3500天,女性則減少1600天;吸煙的男性會(huì)使壽命減少2250天,女性則減少800天;飲酒會(huì)使壽命減少130天;超重會(huì)使壽命減少1300天;濫用藥物會(huì)使壽命減少90天 表格 圖形 Q:哪一種方式更好?,第三章 數(shù)據(jù)整理與圖表展示,表3-1 不同原因引起的壽命損失,圖3-1 不同原因引起的壽命損失,第三章 數(shù)據(jù)整理與圖表展示,學(xué)習(xí)目標(biāo) 了解統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理方法 掌握非數(shù)值型數(shù)據(jù)的分類整理和圖示 掌握數(shù)值型數(shù)據(jù)的分組整理和圖示 重點(diǎn):頻數(shù)分布表繪制;各種統(tǒng)計(jì)圖的繪制,并能解釋其含義,一、數(shù)據(jù)審核(data auditing) 原

2、始數(shù)據(jù) 數(shù)據(jù)審核的內(nèi)容和方式 二、數(shù)據(jù)篩選(data filter) 舉例 表3-2是8名學(xué)生4門課程的成績(jī)數(shù)據(jù)。 請(qǐng)找出統(tǒng)計(jì)學(xué)成績(jī)等于87分的學(xué)生,英文成績(jī)前5名的學(xué)生,四門課成績(jī)均大于70分的學(xué)生。,3.1 數(shù)據(jù)的預(yù)處理,表3-2 8名學(xué)生的成績(jī)數(shù)據(jù),三、數(shù)據(jù)排序 舉例 財(cái)富 2011全球500強(qiáng)企業(yè) 福布斯 2011全球富豪排行榜 2011 中國大學(xué)排行榜 四、數(shù)據(jù)透視表(Pivot Table) 按使用者要求對(duì)數(shù)據(jù)表重要信息進(jìn)行匯總后的結(jié)果 Note:Excel的特色功能(舉例),財(cái)富 2011全球500強(qiáng)企業(yè),單位:百萬美元,一、數(shù)據(jù)分組(Data Grouping)(P31) 根據(jù)

3、研究現(xiàn)象特點(diǎn)和數(shù)據(jù)分析目的,將原始數(shù)據(jù)按照總體單位的某一特征分為不同的組別。 分組數(shù)據(jù) 分組標(biāo)志 非數(shù)值型數(shù)據(jù)分組和數(shù)值型數(shù)據(jù)分組,3.2 非數(shù)值型數(shù)據(jù)的分類整理和展示,二、非數(shù)值型數(shù)據(jù)分組(分類)(P32) 反映事物自然屬性的非數(shù)值型數(shù)據(jù)的分組 反映事物社會(huì)經(jīng)濟(jì)屬性的非數(shù)值型數(shù)據(jù)的分組 城鎮(zhèn)家庭 “可支配收入” 分組,3.2 非數(shù)值型數(shù)據(jù)的分類整理和展示,表3-3 20002009年 江蘇省城鎮(zhèn)家庭可支配收入分組表 (單位:元),圖3-4 20002009年江蘇省城鎮(zhèn)家庭可支配收入水平折線圖,三、定類數(shù)據(jù)的整理和展示 1. 頻數(shù)與頻數(shù)分布(Frequency Distribution)(P3

4、8) 頻數(shù) 頻數(shù)分布表 頻率(比例) 舉例-1(P38) 按性別的人口構(gòu)成(表3-4),3.2 非數(shù)值型數(shù)據(jù)的分類整理和展示,表3-4 2001-2003年我國按性別分人口數(shù)及構(gòu)成 資料來源:2004中國統(tǒng)計(jì)年鑒. 北京. 中國統(tǒng)計(jì)出版社 2004 Q:統(tǒng)計(jì)學(xué)中怎么稱呼分配在各組的單位數(shù)及其相對(duì)形式?,統(tǒng)計(jì)分組,分配在各組的單位數(shù)及其相對(duì)形式,1. 頻數(shù)與頻數(shù)分布(Frequency Distribution) 舉例-2 表3-5是調(diào)查員隨機(jī)觀察的50名顧客購買的飲料類型及購買者性別記錄。 要求:生成頻數(shù)分布表,觀察飲料類型和顧客性別的分布狀況,并進(jìn)行描述性分析。,三、定類數(shù)據(jù)的整理和展示,說

5、明:F女; M男;ts碳酸;lc綠茶;kqs礦泉水;gz果汁;qt其它,表3-5 顧客性別及購買的飲料類型,Excel結(jié)果: 表3-6 不同類型飲料和顧客性別的頻數(shù)分布,2. 定類數(shù)據(jù)的圖示 (1)條形圖(Bar Chart) 用寬度相同的條形的高度或長(zhǎng)短表示數(shù)據(jù)頻數(shù)。,圖3-5 飲料類型的條形圖,圖3-6 飲料類型和顧客性別的復(fù)式條形圖,2. 定類數(shù)據(jù)的圖示 (2)餅圖(Pie Chart) 主要用于說明一個(gè)樣本各部分所占比例,或者總體 內(nèi)部結(jié)構(gòu)分析。,圖3-7 不同類型飲料構(gòu)成的餅圖,2. 定類數(shù)據(jù)的圖示 (3)環(huán)形圖(Doughnut Chart) 主要用于顯示多個(gè)樣本各部分所占的相應(yīng)比

6、例,有助于構(gòu)成的比較研究。 舉例 表3-7是某年北京、上海和天津地區(qū)按收入法計(jì)算的地區(qū)生產(chǎn)總值(按當(dāng)年價(jià)格計(jì)算)數(shù)據(jù)。 請(qǐng)繪制環(huán)形圖比較三個(gè)地區(qū)的生產(chǎn)總值構(gòu)成。,表3-7 某年北京、上海和天津地區(qū)生產(chǎn)總值構(gòu)成 單位:億元,圖3-8 北京、上海和天津地區(qū)生產(chǎn)總值構(gòu)成 的環(huán)形圖,四、定序數(shù)據(jù)的整理和展示 1. 累積頻數(shù)與累積頻率(P38) 累積頻數(shù) 向上/向下累積 累積頻率 舉例 關(guān)于城市住房問題的研究中,研究人員對(duì)兩個(gè)城市各抽樣調(diào)查300戶,其中一個(gè)問題是:“您對(duì)家庭目前的住房狀況是否滿意?” 調(diào)查結(jié)果的頻數(shù)分布表如表3-8、表3-9。,3.2 非數(shù)值型數(shù)據(jù)的分類整理和展示,表3-8 甲城市家庭

7、對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布,表3-9 乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布,2. 定序數(shù)據(jù)的圖示 舉例:根據(jù)表3-7的數(shù)據(jù)繪制累積頻數(shù)分布圖。,圖3-9 甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布圖,一、數(shù)值型數(shù)據(jù)分組與頻數(shù)分布 1. 數(shù)值型數(shù)據(jù)分組 根據(jù)統(tǒng)計(jì)研究需要,將原始數(shù)據(jù)按某種標(biāo)準(zhǔn)分成不同的組別。 關(guān)鍵:選擇分組變量和劃分各組界限 2.數(shù)值型數(shù)據(jù)分組的結(jié)果 形成頻數(shù)分布表 兩個(gè)構(gòu)成要素 各組的分組界限 每組中的頻數(shù)、頻率,3.3 數(shù)值型數(shù)據(jù)的整理和圖示,頻數(shù)分布舉例(表3-10),3. 數(shù)值型數(shù)據(jù)分組方法(P33),一、數(shù)值型數(shù)據(jù)分組與頻數(shù)分布,(1) 單變量值分組 每一個(gè)變量值作為一組的分組

8、方式。 舉例 某學(xué)院某年畢業(yè)研究生發(fā)表論文篇數(shù)的頻數(shù)分布表(表3-11),(2) 組距分組 將全部變量值依次劃分為若干個(gè)區(qū)間,將每一區(qū)間的變量值作為一組。 適合于連續(xù)變量或變量值較多時(shí)。 遵循“不重不漏”的原則。 等距與不等距分組。,基本概念 組限 上限(U ) / 下限(L) 組距(d) 間斷/重合組限 閉口/開口組限 閉口組/開口組 Note:在采用重合組限場(chǎng)合,一般采用“上限不在內(nèi)” 的統(tǒng)計(jì)慣例。(P35),怎樣進(jìn)行等距分組(結(jié)合例子) 確定取值范圍 確定組數(shù): Sturges 經(jīng)驗(yàn)公式 計(jì)算組距: 確定各組祖限(多種形式) Note:三種常用的等距分組表(表1315) 根據(jù)分組整理成頻

9、數(shù)分布表,已知某電腦公司2009年912月每天的銷售量數(shù)據(jù)。 要求進(jìn)行數(shù)據(jù)分組。 確定取值范圍(R=96) 確定組數(shù)(H=10) 計(jì)算組距(d=10) 確定各組祖限 根據(jù)分組整理成頻數(shù)分布表,等距分組 舉例,表3-12 某電腦公司銷售量的頻數(shù)分布,等距分組 舉例,等距分組表(上下組限間斷),等距分組表(上下組限重疊,上組限不在內(nèi)),等距分組表(使用開口組),4. 組中值(Class Midpoint)(P36) 如何計(jì)算及舉例 (P36-37) 對(duì)于重合組限分組:(上限+下限)/2 對(duì)于間斷組限分組:(上組下限+本組下限)/2 對(duì)于重合組限開口組: 缺少下限的組中值=本組上限-鄰組組距/2 缺

10、少上限的組中值=本組下限+鄰組組距/2 對(duì)于間斷組限開口組: 缺少下限的組中值=鄰組下限-鄰組組距/2 缺少上限的組中值=本組下限+鄰組組距/2,一、數(shù)值型數(shù)據(jù)分組與頻數(shù)分布,表3-16 2003年我國按年齡和性別分人口數(shù)及組中值,Note:數(shù)據(jù)分組的要點(diǎn)和基本概念 統(tǒng)計(jì)分組 基本概念:R、K、d、組中值; 祖限、間斷祖限、重合組限、開口組、閉口組; 頻數(shù)、頻數(shù)分布、頻率、累積頻數(shù)、累積頻率。,非數(shù)值型數(shù)據(jù)分組,數(shù)值型數(shù)據(jù)分組,單變量分組,組距分組,等距分組,異距分組,5. 等距分組的應(yīng)用(教材:P46),例3.1 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)如下: 92,87,75,74,

11、65,91,98,78,84,83, 78,96,62,84,76,52,69,84,81,88, 70,91,89,87,75,79,82,86,79,82, 64,90,56,84,89 問題:對(duì)該班學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī),采用重合組限和開口組限設(shè)置進(jìn)行等距分組、計(jì)算組中值和頻數(shù)分布,編制統(tǒng)計(jì)表和統(tǒng)計(jì)圖。,一、數(shù)值型數(shù)據(jù)分組與頻數(shù)分布,Excel 應(yīng)用,例3.1 某學(xué)期某班35名學(xué)生的統(tǒng)計(jì)學(xué)考試成績(jī)的原始數(shù)據(jù)如下: 92,87,75,74,65,91,98,78,84,83,78,96,62,84,76, 52,69,84,81,88,70,91,89,87,75,79,82,86,79,8

12、2, 64,90,56,84,89,1. 計(jì)算取值范圍 排序、確定最大值和最小值為98和52,計(jì)算得R=46(分) 2. 確定組數(shù)和組距 H=5,d=46/5=9.11 (分),取整,d為10分 3. 計(jì)算頻數(shù)分布 4. 計(jì)算組中值 5. 繪制直方圖和折線圖,3. 計(jì)算頻數(shù)分布(上限不在內(nèi)) 98、96、92、91、91、90 (共6人) 89、89、88、87、87、86、84、84、84、84、83、82、82、81 (共14人) 79、79、78、78、76、75、75、74、70(共9人) 69、65、64、62(共4人) 56、52(共2人) 4. 計(jì)算組中值,表3-17 35名學(xué)生

13、統(tǒng)計(jì)學(xué)成績(jī)統(tǒng)計(jì)表,常用統(tǒng)計(jì)圖,二、數(shù)值型數(shù)據(jù)的圖示,二、數(shù)值型數(shù)據(jù)的圖示,分組數(shù)據(jù):直方圖(Histogram) 用來展示數(shù)值型分組數(shù)據(jù)分布的常用圖形。 在統(tǒng)計(jì)分組的基礎(chǔ)上,用矩形的寬度和高度表示頻數(shù)分布。 注意對(duì)不等距分組:縱軸必須表示為頻數(shù)密度 頻數(shù)密度=頻數(shù)/組距 (面積之和=總頻數(shù)) 舉例 等距分組 不等距分組,某會(huì)計(jì)師事務(wù)所對(duì)20家公司進(jìn)行年終審計(jì)所需時(shí)間(天)的頻數(shù)分布表(表3-18),直方圖(等距分組),直方圖(等距分組),我一眼就看出來了,審計(jì)時(shí)間在1520天之間的公司數(shù)最多!,圖3-10 審計(jì)時(shí)間直方圖(等距分組),某會(huì)計(jì)師事務(wù)所對(duì)20家公司進(jìn)行年終審計(jì)所需時(shí)間(天)的頻數(shù)分

14、布表(表3-19),直方圖(不等距分組),圖3-11 審計(jì)時(shí)間直方圖(不等距分組),二、數(shù)值型數(shù)據(jù)的圖示,2. 折線圖(Frequency polygon) 在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再將原來的直方圖抹掉。 折線圖的兩個(gè)終點(diǎn)應(yīng)與橫軸相交。 組數(shù)越多,組據(jù)就越小,折線圖就越光滑,趨近于一條平滑曲線,即頻數(shù)分布曲線。 舉例,折線圖與直方圖 下的面積相等!,圖3-12 審計(jì)時(shí)間折線圖,圖3-13 學(xué)生統(tǒng)計(jì)學(xué)成績(jī)直方圖,圖3-14 在直方圖基礎(chǔ)上繪制的折線圖,圖3-15 學(xué)生統(tǒng)計(jì)學(xué)成績(jī)折線圖,二、數(shù)值型數(shù)據(jù)的圖示,3. 未分組數(shù)據(jù):莖葉圖 (Stem-and-Lea

15、f Display) 用于顯示未分組的原始數(shù)據(jù)的分布。由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。 通常以數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉。 舉例,原始數(shù)據(jù):24, 26, 24, 21, 27, 27, 30, 41, 32, 38 從小到大排序后的數(shù)據(jù): 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 莖葉圖(圖3-16):,3 0 2 8,4 1,2 1 4 4 6 7 7,莖葉圖,30,40名教師的年齡的數(shù)據(jù): 40,41,48,51,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34

16、,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64,SPSS 生成的一個(gè)莖葉圖,4. 時(shí)間序列數(shù)據(jù):線圖(Line Chart),圖3-17 1996年-2003年城鄉(xiāng)居民人民幣儲(chǔ)蓄存款年底余額,二、數(shù)值型數(shù)據(jù)的圖示,Note: 增長(zhǎng)速度 ?,3.4 繪制圖表的要點(diǎn),(不恰當(dāng))統(tǒng)計(jì)圖舉例,不必要的三維效果:三維圖形可能比二維圖形更能吸引讀者的注意,但只能用來反映變化的趨勢(shì),不能用來進(jìn)行精確的比較。,Note: 避免選用不恰當(dāng)圖形類型,1960: $1.00,1970: $1.60,1980: $3.10,1990: $3.80,Minimum Wage,不好的圖形,Quarterly Sales,不好的圖形,0,100,200,Q1,Q2,Q3,Q4,$,Note: 避免壓縮縱軸,Monthly Sales,不好的圖形,36,39,42,45,J,F,M,A,M,J,$,Note: 避免縱軸無零點(diǎn),Monthly Sales,0,39,42,45,J,F,M,A,M,J,$,36,一、統(tǒng)計(jì)圖繪制要點(diǎn) 圖形類型選擇恰當(dāng),刻度、長(zhǎng)寬比例合理,能準(zhǔn)確顯示數(shù)據(jù)中包含的信息。 圖形盡量簡(jiǎn)約。 圖形應(yīng)該有清楚的標(biāo)題和必要的說明。 反復(fù)加工和修改是獲得優(yōu)秀統(tǒng)計(jì)圖形的重要步驟。,3.4 繪制圖表的要點(diǎn),二、統(tǒng)計(jì)表設(shè)計(jì)要求,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論