版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第三章 數(shù)據(jù)的圖表展示主講人:龔潔松3.1數(shù)據(jù)的預(yù)處理
3.2品質(zhì)數(shù)據(jù)的整理與顯示
3.3數(shù)值型數(shù)據(jù)的整理與顯示
3.4合理使用圖表學(xué)習(xí)目標了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的掌握分類和順序數(shù)據(jù)的整理與顯示方法掌握數(shù)值型數(shù)據(jù)的整理與顯示方法用Excel、SPSS作頻數(shù)分布表和圖形合理使用圖表3.1數(shù)據(jù)的預(yù)處理3.1.1數(shù)據(jù)審核3.1.2數(shù)據(jù)篩選3.1.3數(shù)據(jù)排序3.1.4數(shù)據(jù)透視表數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核數(shù)據(jù)透視數(shù)據(jù)篩選數(shù)據(jù)排序檢查數(shù)據(jù)中的錯誤找出符合條件的數(shù)據(jù)按需要匯總升序和降序?qū)ふ覕?shù)據(jù)的基本特征數(shù)據(jù)審核原始數(shù)據(jù)的審核完整性審核應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或變量是否填寫齊全準確性審核數(shù)據(jù)是否真實反映實際情況,內(nèi)容是否符合實際數(shù)據(jù)是否有錯誤,計算是否正確等二手數(shù)據(jù)的審核適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時效性審核盡可能使用最新的數(shù)據(jù)確認是否有必要做進一步的加工整理數(shù)據(jù)篩選和排序數(shù)據(jù)篩選
(datafilter)當數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除數(shù)據(jù)排序
(datarank)按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成數(shù)據(jù)透視…稍后介紹數(shù)據(jù)透視表
(pivottable)可以從復(fù)雜的數(shù)據(jù)中提取有用的信息可以對數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進行匯總和作圖形成一個符合需要的交叉表(列聯(lián)表)在利用數(shù)據(jù)透視表時,數(shù)據(jù)源表中的首行必須有列標題數(shù)據(jù)的整理與顯示
(基本問題)要弄清所面對的數(shù)據(jù)類型不同類型的數(shù)據(jù),采取不同的處理方式和方法對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)3.2品質(zhì)數(shù)據(jù)的整理與展示3.2.1分類數(shù)據(jù)的整理與圖示3.2.2順序數(shù)據(jù)的整理與圖示品質(zhì)數(shù)據(jù)的整理與圖示分類數(shù)據(jù)的整理
(基本過程)列出各類別計算各類別的頻數(shù)制作頻數(shù)分布表用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE可計算的統(tǒng)計量假設(shè)某樣本的N個數(shù)據(jù)被分成K個部分,每一部分的數(shù)據(jù)分別為N1,N2,…,NK.頻數(shù)(frequency)
:落在各類別中的數(shù)據(jù)個數(shù),即Ni比例(proportion)
:某一類別數(shù)據(jù)個數(shù)占全部數(shù)據(jù)個數(shù)的比值,即Ni/N百分比(percentage)
:將對比的基數(shù)作為100而計算的比值,即(Ni/N)×100%比率(ratio)
:不同類別數(shù)值個數(shù)的比值,即Ni︰Nj圖示1:條形圖用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條形圖(barchart),也可以放在橫軸,稱為柱形圖(columnchart)圖示2:復(fù)式條形圖分類變量在不同時間或不同空間上有多個取值對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688帕累托圖與條形圖的區(qū)別條形按頻數(shù)從高到低排序右側(cè)縱軸有頻率(百分比)有一條逐漸上升的線段圖示3:帕累托圖按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖主要用于展示分類數(shù)據(jù)的分布同時用線段的逐漸上升趨勢表現(xiàn)累計百分比的過程可用于區(qū)分影響某個現(xiàn)象的主要因素和次要因素圖示4:餅圖也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題繪制圓形圖時,樣本或總體中各部分所占的百分比用圓內(nèi)的各個扇形角度表示,這些扇形的中心角度,按各部分數(shù)據(jù)百分比乘以360°確定圖示5:環(huán)形圖環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個樣本或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán)用于結(jié)構(gòu)比較研究用于展示分類和順序數(shù)據(jù)8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
甲乙兩城市家庭對住房狀況的評價3.3
數(shù)值型數(shù)據(jù)的整理與展示3.3.1數(shù)據(jù)分組3.3.2數(shù)值型數(shù)據(jù)的圖示數(shù)據(jù)分組每一個變量值作為一組只適合于離散變量適合于變量值較少的情況.將全部變量值依次劃分為若干個區(qū)間,每一個區(qū)間的變量值作為一組.單變量分組組距分組組距分組將變量值的一個區(qū)間作為一組適合于連續(xù)變量、離散變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用異距分組等距分組適用于變量值變動比較均勻的情況;異距分組適應(yīng)于變量值分布存在明顯的偏斜、變量值變異范圍較大,按一定比例發(fā)展變化的情況。思考題:等距還是異距?123安徽省人口的年齡學(xué)生的考試成績上海市居民的個人收入數(shù)據(jù)分組組距分布步驟1、確定組數(shù)4、確定組中值和累計頻數(shù)表2、確定組距和組限3、頻數(shù)分布表組數(shù)一般與數(shù)據(jù)分布的特征及數(shù)據(jù)的多少有關(guān)組距=上限-下限根據(jù)情況需要如計算平均值、標準差等使用Excel頻數(shù)函數(shù)(FREQUENCY)【例3.6】某電腦公司2005年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進行分組頻數(shù)分布表編制例題確定組數(shù) 組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的一般情況下,組數(shù)不應(yīng)少于5組,也不應(yīng)多于15組。斯特杰斯經(jīng)驗公式:不能生搬硬套確定組距與組限1.下限(lowlimit):一個組的最小值2.上限(upperlimit):一個組的最大值組距(classwidth):上限與下限之差“XX以上”叫做缺上限開口組 “XX以下”叫做缺下限開口組上限不在內(nèi)該組的最大值不在該組,應(yīng)歸類到下一組中編制頻數(shù)分布表 使用統(tǒng)計函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖的具體步驟是選擇與接受區(qū)域(即分段點區(qū)域)相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計函數(shù)中的【FREQUENCY】函數(shù).在對話框【Date-array】后輸入數(shù)據(jù)區(qū)域,在【Bins-array】后輸入接受區(qū)域(分段點區(qū)域).同時且快速按下“ctrl-shift-Enter”組合鍵,即得到頻數(shù)分布.等距分組表
(上下組限重疊)等距分組表
(上下組限間斷)等距分組表
(使用開口組)整理累計頻數(shù)分配表1、將各組的頻數(shù)逐組累積相加而成累積頻數(shù)分布,它表明總體在某一變量值的某一水平上下總共包含的總體頻數(shù)2、“向上累積”:由變量值低的組向變量值高的組逐組累積 “向下累積”:由變量值高的組向變量值低的組逐組累積確定組中值確定組中值:各組變量值范圍的中間數(shù)值1、組中值=(上限+下限)/22、當各組變量值均勻分布時,組中值就能較強地代表各組變量值的平均水平。因此分組時,應(yīng)盡可能使組內(nèi)各單位變量值分布均勻3、開口組組中值的確定:
缺上限的開口組組中值=下限﹢鄰組組距/2
缺下限的開口組組中值=上限﹣鄰組組距/2已分組數(shù)據(jù)的圖示圖示1:直方圖用于展示數(shù)值數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖縱軸表示頻率,直方圖下的總面積等于1直方圖的繪制140150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240直方圖與條形圖的區(qū)別條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)圖示2:折線圖折線圖也稱次數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法:第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的折線圖的繪制折線圖與直方圖下的面積相等!頻數(shù)分配曲線的類型正態(tài)分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見的頻數(shù)分布未分組數(shù)據(jù)的圖示圖示3:莖葉圖用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)莖葉圖某電腦公司銷售量分布的莖葉圖擴展的莖葉圖某電腦公司銷售量分布的擴展莖葉圖圖示4:箱線圖用于顯示未分組的原始數(shù)據(jù)的分布箱線圖是由一組數(shù)據(jù)的最大值(maximum)、最小值(minimum)、中位數(shù)(median)、兩個四分位數(shù)(quartiles)這5個值繪制而成的中位數(shù)是一組數(shù)據(jù)排序后處于中間位置上的變量值四分位數(shù)是一組數(shù)據(jù)排序后處在數(shù)據(jù)25%位置和75%位置上的兩個分位數(shù)值繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接.箱線圖的構(gòu)成中位數(shù)4681012Q75%Q25%XMaxXMinMedian/Quart./Range箱線圖箱線圖的應(yīng)用最小值141最大值237中位數(shù)18225%四分位數(shù)170.2575%四分位數(shù)197140150160170180190200210220230240某電腦公司銷售額數(shù)據(jù)的Median/Quart./Rang箱線圖分布的形狀與箱線圖不同分布的箱線圖對稱分布左偏分布右偏分布多批數(shù)據(jù)箱線圖【例2.6】
從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟數(shù)學(xué)西方經(jīng)濟學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177多批數(shù)據(jù)箱線圖–
從科目多批數(shù)據(jù)箱線圖–
從學(xué)生箱線圖—K線圖
(上證指數(shù)K線圖)箱線圖—K線圖
(上證指數(shù)K線圖)數(shù)據(jù)類型及圖示
(小結(jié))3.4
合理使用圖表3.4.1鑒別圖形優(yōu)劣的準則3.4.2統(tǒng)計表的設(shè)計鑒別圖表優(yōu)劣的準則一張好的圖表應(yīng)包括以下基本特征顯示數(shù)據(jù)讓讀者把注意力集中在圖表的內(nèi)容上,而不是制作圖表的程序上避免歪曲強調(diào)數(shù)據(jù)之間的比較服務(wù)于一個明確的目的有對圖表的統(tǒng)計描述和文字說明5種鑒別圖表優(yōu)劣的準則:一張好的圖表應(yīng)當精心設(shè)計、有助于洞察問題的實質(zhì)使復(fù)雜的觀點得到簡明、確切、高效的闡述能在最短的時間內(nèi)以最少的筆墨給讀者提供最大量的信息是多維的表述數(shù)據(jù)的真實情況鑒別圖表優(yōu)劣的準則合理安排統(tǒng)計表的結(jié)構(gòu)總標題內(nèi)容滿足3W(When、Where、What)要求數(shù)據(jù)計量單位相同時,可放在表的右上角標明;不同時應(yīng)放在每個變量后或單列出一列標明表中的上下兩條橫線一般用粗線,其他線用細線通常情況下,統(tǒng)計表的左右兩邊不封口表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應(yīng)以小數(shù)點對齊,而且小數(shù)點的位數(shù)應(yīng)統(tǒng)一當數(shù)字為“0”時,應(yīng)填寫“0”當數(shù)字缺乏或者未記錄時,應(yīng)填寫“……”當不應(yīng)有數(shù)字時,應(yīng)填寫“——”表中,數(shù)字部分不應(yīng)留白;且不應(yīng)出現(xiàn)“同上”“同左”等字樣。必要時可在表的下方加上注釋統(tǒng)計表的結(jié)構(gòu)2002~2003年安徽省城鎮(zhèn)居民家庭抽樣調(diào)查資料項目單位2002年
2003年
調(diào)查戶數(shù)平均每戶家庭人口平均每戶就業(yè)人口平均每戶就業(yè)面平均一名就業(yè)者負擔人數(shù)平均每人全部年收入??芍涫杖?/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 純色背景課件教學(xué)課件
- 2024年度金融IT系統(tǒng)集成與維護合同
- 2024年商標許可使用合同 規(guī)定許可范圍與使用期限
- 2024廠區(qū)綠化養(yǎng)護合同
- 2024年度氨水行業(yè)綠色發(fā)展與環(huán)保合作協(xié)議
- 2024年品牌授權(quán)與連鎖加盟合同
- 2024年城市軌道交通安全監(jiān)控系統(tǒng)建設(shè)合同
- 2024年度房地產(chǎn)買賣與租賃合同
- 2024年度委托加工合同標的原料提供與加工質(zhì)量
- 2024胡柚買賣合同范文
- 粉筆決戰(zhàn)行測5000題判斷解析
- 北京市各區(qū)稅務(wù)所地址電話
- 川教版小學(xué)英語三年級上全冊教案.doc
- 溢洪道穩(wěn)定計算
- (完整word版)韓海軍梅花易數(shù)秘籍
- 公路工程施工圖審查管理辦法
- 幼兒園園本教研的途徑與方法
- 《認識水果蔬菜》ppt課件
- 典型草原割草場技術(shù)規(guī)范-編制說明-內(nèi)蒙古
- 中國農(nóng)業(yè)銀行商業(yè)用房抵押貸款合作合同
- 阿壩藏族羌族自治州羌族文化生態(tài)保護實驗區(qū)實施方案 - 阿壩州羌族
評論
0/150
提交評論