版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第3章 數(shù)據(jù)的圖表展示3.1 數(shù)據(jù)的預(yù)處理 3.2 品質(zhì)數(shù)據(jù)的整理與顯示3.3 數(shù)值型數(shù)據(jù)的整理與顯示3.4 合理使用圖表數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核數(shù)據(jù)審核原始數(shù)據(jù) (raw data)完整性審核準(zhǔn)確性審核二手?jǐn)?shù)據(jù)(second hand data)適用性審核時(shí)效性審核:盡可能使用最新的數(shù)據(jù)有必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter) 找出符合條件的數(shù)據(jù) 例3-1數(shù)據(jù)排序 升序和降序數(shù)據(jù)透視表(pivot table) 按需要匯總 例3-2品質(zhì)數(shù)據(jù)的整理與顯示分類數(shù)據(jù)頻數(shù)和頻數(shù)分布(frequency distribution)條形圖(bar Chart)、柱形圖(column cha
2、rt)、對(duì)比條形圖帕累托圖(pareto chart)餅圖 (pie Chart)環(huán)形圖 (doughnut Chart)順序數(shù)據(jù)累積頻數(shù)(cumulative frequency)、累積頻率(cumulative percentages)累積頻數(shù)分布或頻率圖分類數(shù)據(jù)的整理 (可計(jì)算的統(tǒng)計(jì)量)頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個(gè)數(shù)比例(proportion) :某一類別數(shù)據(jù)個(gè)數(shù)占全部數(shù)據(jù)個(gè)數(shù)的比值百分比(percentage) :將對(duì)比的基數(shù)作為100而計(jì)算的比值比率(ratio) :不同類別數(shù)值個(gè)數(shù)的比值分類頻數(shù)比例百分比比率ABCDE順序數(shù)據(jù)的整理(可計(jì)算的統(tǒng)計(jì)量)1. 累積
3、頻數(shù)(cumulative frequencies):各類別頻數(shù)的逐級(jí)累加2. 累積頻率(cumulative percentages):各類別頻率(百分比)的逐級(jí)累加向上累積順序數(shù)據(jù):從開始向結(jié)尾累加數(shù)值型數(shù)據(jù):變量值小向變量值大的方向累加向下累積順序數(shù)據(jù):從結(jié)尾向開始累加數(shù)值型數(shù)據(jù):變量值大向變量值小的方向累加數(shù)值型數(shù)據(jù)的整理:分組將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況遵循“不重不漏”原則等距分組或不等距分組組數(shù)應(yīng)以能顯示數(shù)據(jù)分布特征和規(guī)律為目的。實(shí)際中,組數(shù)一般為5K 15組距是一個(gè)組上、下限之差,根據(jù)數(shù)據(jù)的最大值和最小值及組數(shù)確定。即 組距( 最大值最小值) 組
4、數(shù)統(tǒng)計(jì)頻數(shù)可整理出頻數(shù)分布表 1. 下上限(lower 、upper limit) :一個(gè)組的最小最大值2. 組距(class width) :上下限之差3. 組中值(class midpoint) :上下限間的中點(diǎn)值下限值+上限值2組中值 =頻數(shù)分布表的編制 (例題分析)【例】某電腦公司2005年前四個(gè)月各天的銷售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組Max=237Min=141等距分組表 (上下組限重疊)Max=237Min=141(Max-Min)/10=(141-237)/10=9.610上限(一個(gè)組的最大值)不在內(nèi)。160、180這幾個(gè)數(shù)究竟屬于哪一組?149等距分組表 (使用開口組)
5、開口組如何計(jì)算組距、組中值?數(shù)值型數(shù)據(jù)的顯示數(shù)值型數(shù)據(jù)的圖示分組數(shù)據(jù):直方圖 (histogram)未分組數(shù)據(jù)莖葉圖(stem-and-leaf display)箱線圖 (box plot)時(shí)間序列數(shù)據(jù)線圖(line plot)兩個(gè)變量間的關(guān)系二維散點(diǎn)圖(2D Scatterplots)三個(gè)變量間的關(guān)系氣泡圖(bubble chart)多變量數(shù)據(jù)雷達(dá)圖 (radar chart)分組數(shù)據(jù)直方圖 (histogram)用矩形的面積表示頻率分布橫軸表示數(shù)據(jù)分組,縱軸表示頻率/組距,各組與相應(yīng)的頻率就形成了一個(gè)矩形,即直方圖140150210某電腦公司銷售量分布的直方圖190200180160170
6、25201510530220230240我一眼就看出來了,銷售量在170180之間的天數(shù)最多!頻率組距頻數(shù)分組數(shù)據(jù)直方圖(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)未分組數(shù)據(jù)莖葉圖(stem-and-leaf display)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)
7、值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字5. 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)未分組數(shù)據(jù)莖葉圖 (例題分析)某電腦公司銷售量分布的莖葉圖未分組數(shù)據(jù)箱線圖 (box plot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)
8、與箱子相連接未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140 150 160 170 180 190 200 210 220 230 240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Rang箱線圖未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)【例】 從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布
9、特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號(hào)1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖(例題分析Median/Quart./Range)8門課程考試成績的Median
10、/Quart./Range箱線圖11名學(xué)生8門課程考試成績的Median/Quart./Range箱線圖min-max25%-75%median value455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析Median/Quart./Range)股票分析中的K線圖與箱線圖類似線圖最早是日本德川幕府時(shí)代大阪的米商用來記錄當(dāng)時(shí)一天、一周或一月中米價(jià)漲跌行情的圖示法,后被引入股市。線圖有直觀、立體感強(qiáng)、攜帶信息量大的特點(diǎn),是各類傳播媒介、電腦實(shí)時(shí)分析系統(tǒng)應(yīng)用較多的技術(shù)分析手段。以日K線為例:是根據(jù)股價(jià)(指數(shù))一天的
11、走勢(shì)中形成的四個(gè)價(jià)位即:開盤價(jià),收盤價(jià),最高價(jià),最低價(jià)繪制而成的。收盤價(jià)高于開盤價(jià)時(shí),則開盤價(jià)在下收盤價(jià)在上,二者之間的長方柱用紅色或空心繪出,稱之為陽線;其上影線的最高點(diǎn)為最高價(jià),下影線的最低點(diǎn)為最低價(jià)。收盤價(jià)低于開盤價(jià)時(shí),則開盤價(jià)在上收盤價(jià)在下,二者之間的長方柱用綠色或?qū)嵭睦L出,稱之為陰線,其上影線的最高點(diǎn)為最高價(jià),下影線的最低點(diǎn)為最低價(jià)。 08.11.27-09.3.26日K線圖時(shí)間序列數(shù)據(jù)線圖 (line plot)表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形一般時(shí)間為橫軸,數(shù)據(jù)為縱軸圖形的長寬比例大致為10 : 7 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時(shí),可以
12、采取折斷的符號(hào)將縱軸折斷時(shí)間序列數(shù)據(jù)線圖 (例題分析)【例】我國19912003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖¥ 19912003年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民(元)農(nóng)村居民(元)19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2 708.6 784.0 921.61221.01577.71926.12091.12162.02210.32253.42366.42475.
13、62622.2時(shí)間序列數(shù)據(jù)線圖 (例題分析)兩個(gè)變量間的關(guān)系二維散點(diǎn)圖(2D Scatterplots)展示兩個(gè)變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi,yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個(gè)點(diǎn)稱為散點(diǎn),由坐標(biāo)及其散點(diǎn)形成的二維數(shù)據(jù)圖溫度 / 0C降雨量/mm產(chǎn)量/kg/hm262522508403450105845001368575014110580016987500211208250兩個(gè)變量間的關(guān)系二維散點(diǎn)圖(2D Scatterplots)三個(gè)變量間的關(guān)系氣泡圖(bubble chart)顯示三個(gè)變量之間的關(guān)系圖中數(shù)據(jù)點(diǎn)的大小依賴于第三個(gè)變量也稱
14、為蜘蛛圖(spider chart)顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用假定各變量的取值具有相同的正負(fù)號(hào),總的絕對(duì)值與圖形所圍成的區(qū)域成正比可用于研究多個(gè)樣本之間的相似程度多變量數(shù)據(jù)雷達(dá)圖 (radar chart) 設(shè)有n組樣本S1,S2, , Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2 , , XP,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是多變量數(shù)據(jù)雷達(dá)圖 (雷達(dá)圖的制作) 先做一個(gè)圓,然后將圓P等分,得到P個(gè)點(diǎn),令這P個(gè)點(diǎn)分別對(duì)應(yīng)P個(gè)變量,在將這P個(gè)點(diǎn)與圓心連線,得到P個(gè)幅射狀的半徑,這P個(gè)半徑分別作為P個(gè)變量的坐標(biāo)軸,每個(gè)變量值的大小由半徑上的點(diǎn)到圓心的距離表示 將同一
15、樣本的值在P個(gè)坐標(biāo)上的點(diǎn)連線。這樣,n個(gè)樣本形成的n個(gè)多邊形就是一個(gè)雷達(dá)圖多變量數(shù)據(jù)雷達(dá)圖 (例題分析)【例】2003年我國城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖今天的主食是面包2003年城鄉(xiāng)居民家庭平均每人生活消費(fèi)支出構(gòu)成(%)項(xiàng) 目城鎮(zhèn)居民農(nóng)村居民 食品 衣著 家庭設(shè)備用品及服務(wù) 醫(yī)療保健 交通通訊 娛樂教育文化服務(wù) 居住 雜項(xiàng)商品與服務(wù)37.129.796.307.3111.0814.3510.743.30 45.595.674.205.968.3612.1315.872.21多變量數(shù)據(jù)雷達(dá)圖 (例題分析)其他統(tǒng)計(jì)圖舉例:1月20日至1月25日中國及周邊版圖地震情
16、況版圖周邊共計(jì)有901條地震記錄,其中大于ML5級(jí)的一共兩次:2010-01-24 10:36:13.8 35.45 110.70 15 Ms4.8 天然地震 山西河津2010-01-21 10:02:02.8 13.70 125.85 33 Ms5.1 天然地震 菲律賓群島地區(qū)藍(lán)色的背景是地震點(diǎn)的密度紅色的點(diǎn)代表地震的位置,其大小表示震級(jí)的大小。地震的震級(jí)(ML)分布至少可以長舒一口氣,原來大部分都是小震,不具“破壞性”的居多。假如:我是教練組成員,我提議(單從本場(chǎng)比賽結(jié)果看):Brooks、Battier、Ariza、Andersen 在火箭進(jìn)攻體系中位置比較重要,輪轉(zhuǎn)的時(shí)候盡量保證其中的
17、兩人或三人同時(shí)在場(chǎng)。 Budinger 屬于絕好的替補(bǔ)球員,但似乎不適合同 Battier、Hayes 同時(shí)在場(chǎng)。箭頭方向是助攻方向 其他統(tǒng)計(jì)圖舉例:火箭對(duì)熱火比賽(20100116)中,火箭球員的助攻網(wǎng)絡(luò)關(guān)系 社會(huì)網(wǎng)絡(luò)關(guān)系 圖并沒有說謊,是說謊者在畫圖。 Benjamin Disraeli合理使用圖表一張好的圖表應(yīng)包括以下基本特征顯示數(shù)據(jù)讓讀者把注意力集中在圖表的內(nèi)容上,而不是制作圖表的程序上避免歪曲強(qiáng)調(diào)數(shù)據(jù)之間的比較服務(wù)于一個(gè)明確的目的有對(duì)圖表的統(tǒng)計(jì)描述和文字說明5種鑒別圖表優(yōu)劣的準(zhǔn)則:一張好的圖表應(yīng)當(dāng)精心設(shè)計(jì)、有助于洞察問題的實(shí)質(zhì)使復(fù)雜的觀點(diǎn)得到簡(jiǎn)明、確切、高效的闡述能在最短的時(shí)間內(nèi)以最
18、少的筆墨給讀者提供最大量的信息是多維的表述數(shù)據(jù)的真實(shí)情況鑒別圖表優(yōu)劣的準(zhǔn)則增長速度驚人。上圖增長速度緩慢。不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:縱橫比例 不必要的三維效果:三維圖形可能比二維圖形更能吸引讀者的注意,但只能用來反映變化的趨勢(shì),不能用來進(jìn)行精確的比較。不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:三維效果不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:圖形類型1960: $1.001970: $1.601980: $3.101990: $3.80Minimum Wage不好的圖形好的圖形Minimum Wage0241960197019801990$不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:壓縮縱軸Quarterly Sales不好的圖形0100200Q1Q2Q3Q4$好的圖形Quarterly Sales02550Q1Q2Q3Q4$不恰當(dāng)?shù)慕y(tǒng)計(jì)圖形舉例:縱軸無零點(diǎn)好的圖形Monthly Sales不好的圖形36394245JFMAMJ$Monthly Sales 0394245JFMAMJ$36合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W 要求數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)變量后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對(duì)于沒有數(shù)字的表格單元,一般用“”表示必要時(shí)可在表的下方加上注釋統(tǒng)計(jì)表的設(shè)計(jì)統(tǒng)計(jì)表的結(jié)構(gòu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年花卉種子獨(dú)家授權(quán)代理3篇
- 2024年運(yùn)輸服務(wù)補(bǔ)充協(xié)議范本版B版
- 2025年版智能穿戴設(shè)備生產(chǎn)銷售合同3篇
- 二零二五年度2025版父母房產(chǎn)共有權(quán)轉(zhuǎn)讓協(xié)議書3篇
- 2024年青少年羽毛球錦標(biāo)賽場(chǎng)地租賃及賽事組織服務(wù)協(xié)議3篇
- 2024年魚塘使用權(quán)轉(zhuǎn)讓合同6篇
- 2024年版電影制作與發(fā)行合同
- 2025年度物業(yè)管理項(xiàng)目消防安全管理合同3篇
- 2024年綠色節(jié)能照明產(chǎn)品采購協(xié)議3篇
- 二零二五年度變更撫養(yǎng)權(quán)與子女生活費(fèi)用及教育費(fèi)用支付協(xié)議書3篇
- 《XL集團(tuán)破產(chǎn)重整方案設(shè)計(jì)》
- 智慧金融合同施工承諾書
- 術(shù)后甲狀旁腺功能減退癥管理專家共識(shí)
- 【7道期末】安徽省安慶市區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期末道德與法治試題(含解析)
- 2024年01月22094法理學(xué)期末試題答案
- 2024年1月國家開放大學(xué)法律事務(wù)??啤睹穹▽W(xué)(1)》期末紙質(zhì)考試試題及答案
- 學(xué)校2024-2025學(xué)年教研工作計(jì)劃
- 煙草執(zhí)法課件教學(xué)課件
- 2024年安全文化建設(shè)實(shí)施方案
- 漢字文化解密學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 國家開放大學(xué)電大本科《工程經(jīng)濟(jì)與管理》2023-2024期末試題及答案(試卷號(hào):1141)
評(píng)論
0/150
提交評(píng)論