版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)的處理、描述與分析
斯日古冷數(shù)據(jù)的處理、描述與分析什么是數(shù)據(jù)處理?
數(shù)據(jù)處理就是對(duì)原始數(shù)據(jù)進(jìn)行加工處理,形成有用的信息,使之符合統(tǒng)計(jì)分析的需求,并用圖標(biāo)的形式將數(shù)據(jù)展示出來(lái)。換句話說(shuō),數(shù)據(jù)處理就是對(duì)數(shù)據(jù)進(jìn)行加工處理與顯示。【例】一家市場(chǎng)調(diào)查公司為研究不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買(mǎi)飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買(mǎi)某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)。綠色健康飲品案例數(shù)據(jù)的處理、描述與分析的步驟:一、數(shù)據(jù)的預(yù)處理二、統(tǒng)計(jì)分組與分類(lèi)三、制作頻數(shù)分布表四、繪制統(tǒng)計(jì)圖五、數(shù)據(jù)的描述與分析一、數(shù)據(jù)的預(yù)處理
預(yù)處理是數(shù)據(jù)處理的第一步。其主要內(nèi)容包括:數(shù)據(jù)的審核、篩選和排序,目的:為統(tǒng)計(jì)匯總提供準(zhǔn)確信息。
數(shù)據(jù)的審核主要從完整性和準(zhǔn)確性?xún)煞矫鎸徍耍和暾詫徍耍孩贁?shù)據(jù)是否有遺漏,②項(xiàng)目是否齊全。準(zhǔn)確性審核:①計(jì)算檢查,②邏輯檢查對(duì)二手資料,還應(yīng)審核數(shù)據(jù)的適用性和時(shí)效性。
數(shù)據(jù)的篩選包括兩方面內(nèi)容:一是對(duì)不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來(lái),對(duì)不符合特定條件的數(shù)據(jù)予以剔除。用Excel進(jìn)行數(shù)據(jù)篩選
8名學(xué)生的考試成績(jī)數(shù)據(jù)
數(shù)據(jù)篩選
【例】8名學(xué)生4門(mén)課程的考試成績(jī)數(shù)據(jù)。找出統(tǒng)計(jì)學(xué)成績(jī)等于75分的學(xué)生,英語(yǔ)成績(jī)最高的前3名學(xué)生,4門(mén)課程成績(jī)都大于70分的學(xué)生。
數(shù)據(jù)的排序?qū)?shù)據(jù)按一定順序排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索;排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類(lèi)或分組等提供依據(jù);在某些場(chǎng)合,排序本身就是分析的目的之一。數(shù)據(jù)排序方法
分類(lèi)數(shù)據(jù)的排序字母型數(shù)據(jù),有升序、降序之分。漢字型數(shù)據(jù),可按首位拼音字母排列,也可按筆畫(huà)多少排序。數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)用Excel進(jìn)行數(shù)據(jù)排序
8名學(xué)生的考試成績(jī)數(shù)據(jù)
數(shù)據(jù)排序方法二、統(tǒng)計(jì)分組與分類(lèi)
統(tǒng)計(jì)分組是在統(tǒng)計(jì)資料預(yù)處理的基礎(chǔ)上,根據(jù)統(tǒng)計(jì)研究的需要,按照某種標(biāo)志將統(tǒng)計(jì)總體劃分為若干組成部分,這些組成部分稱(chēng)為統(tǒng)計(jì)總體的“組”。數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,可進(jìn)一步作分類(lèi)或分組整理。不同類(lèi)型的數(shù)據(jù),所采用的處理方式和所使用的方法不同。數(shù)據(jù)的分類(lèi):品質(zhì)數(shù)據(jù)(分類(lèi)數(shù)據(jù)、順序數(shù)據(jù))
數(shù)值型數(shù)據(jù)品質(zhì)數(shù)據(jù):品質(zhì)數(shù)據(jù)說(shuō)明的是事物的品質(zhì)特征,通常用文字來(lái)表示。例如:人口按性別分為男、女兩類(lèi),人的文化程度可分為小學(xué)、初中、高中、大學(xué)、研究生、博士六類(lèi)。數(shù)值型數(shù)據(jù):數(shù)值型數(shù)據(jù)說(shuō)明的是現(xiàn)象的數(shù)量特征,通常用數(shù)值來(lái)表示。
品質(zhì)數(shù)據(jù)(分類(lèi)數(shù)據(jù)和順序數(shù)據(jù))本身就是對(duì)事物的一種分類(lèi)。因此沒(méi)有別的需要的話無(wú)需作進(jìn)一步的分類(lèi)。數(shù)值型數(shù)據(jù)均表現(xiàn)為數(shù)字,因此,通常進(jìn)行數(shù)據(jù)分組。分組的方法有:?jiǎn)巫兞糠纸M和組距式分組兩種。。分組方法分組方法等距分組不等距分組單變量值分組組距分組單變量值分組(要點(diǎn))1.將一個(gè)變量值作為一組2.適合于離散變量3.適合于變量值較少的情況某車(chē)間工人產(chǎn)量分組表單變量分組示例:?jiǎn)巫兞恐捣纸M(實(shí)例)【例】某生產(chǎn)車(chē)間50名工人日加工零件數(shù)如下(單位:個(gè))。試采用單變量值對(duì)數(shù)據(jù)進(jìn)行分組。117122124129139115117130122125108131125117122133126122118108110118123126133134127123118112112134127123125113120123127130137114120128124115139128124121單變量值分組表(實(shí)例)某車(chē)間50名工人日加工零件數(shù)分組表零件數(shù)(個(gè))頻數(shù)(人)零件數(shù)(個(gè))頻數(shù)(人)零件數(shù)(個(gè))頻數(shù)(人)108110112113114115117118212112331201211221231241251261272144332312812913013113313413713921212212組距分組
(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~某地區(qū)120家企業(yè)按利潤(rùn)分組表組距式分組(示例)組距分組步驟確定組數(shù):可以按Sturges提出的經(jīng)驗(yàn)公式來(lái)確定確定組距:組距是一個(gè)組的上限與下限之差.
組距=(最大值-最小值)÷組數(shù)
統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表
組距分組(幾個(gè)概念)1.下限:一個(gè)組的最小值,3002.上限:一個(gè)組的最大值,4003.組距:上限與下限之差,1004.全距:全部數(shù)據(jù)最大值-最小值,
500-300=2005.組數(shù):分幾組,如,分4組。300以下,300-400,400-500,500以上6.組中值:下限與上限之間的中點(diǎn)值,可代表一組數(shù)據(jù)。下限值+上限值2組中值==350組的形式:開(kāi)口組:上下限缺一個(gè),如,60以下,60-7070-80,80以上閉口組:50-60,60-7070-80,80-90,90-100上下線重疊:60-70,70-80,80-90上組限不在組內(nèi)上下限間斷:50-60,61-7071-80,81-90,91-100等距分組:50-60,60-7070-80,80-90,90-100不等距分組:50-60,60-75,75-90,90-100等距分組表(上下組限重疊)等距分組表(上下組限間斷)等距分組表(使用開(kāi)口組)不等距分組2005年中國(guó)人口按年齡分組本表是2005年全國(guó)1%人口抽樣調(diào)查樣本數(shù)據(jù),抽樣比為1.325%頻數(shù)分布表的編制(例題分析)【例】某電腦公司2009年前四個(gè)月各天的銷(xiāo)售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組。
分組步驟確定組數(shù):確定組距:
組距=(237-141)÷10=9.610組數(shù)一般為5的倍數(shù)。3.統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表。三、制作頻數(shù)分布表頻數(shù)分布表的概念:統(tǒng)計(jì)表之一,在統(tǒng)計(jì)分組的基礎(chǔ)上,將原始數(shù)據(jù)逐個(gè)分配到不同的組內(nèi),計(jì)算出各組的單位數(shù)及各組單位數(shù)占總體單位數(shù)的比重,進(jìn)而研究現(xiàn)象的分布特征。這就是頻數(shù)分布表。頻數(shù)分布表的意義:頻數(shù)分布表可以劃分現(xiàn)象的類(lèi)別,從而對(duì)數(shù)據(jù)及其特征有一個(gè)初步的了解。利用頻數(shù)分布表可計(jì)算出各類(lèi)別的頻率,從而反映現(xiàn)象的內(nèi)部結(jié)構(gòu)特征。頻數(shù)分布表也是制作各種圖表的基礎(chǔ)。
先有表后有圖分類(lèi)數(shù)據(jù)整理—頻數(shù)分布表頻數(shù)頻率
頻數(shù),也稱(chēng)次數(shù),用f表示,是指分配在各組中的數(shù)據(jù)個(gè)數(shù)。
頻率,也稱(chēng)比率或比重,是指各組頻數(shù)與總數(shù)之比,用f/∑f表示。幾個(gè)相關(guān)概念:累計(jì)頻數(shù)累計(jì)頻率累積頻數(shù)就是將各類(lèi)別的頻數(shù)逐級(jí)累加起來(lái),其方法有兩種:一是向上累積,即從變量值小的一方向變量值大的一方累加頻數(shù);二是向下累計(jì),即從變量值大的一方向變量值小的一方累加頻數(shù)。第一種方法:通過(guò)分類(lèi)匯總實(shí)現(xiàn)第二種方法:通過(guò)數(shù)據(jù)透視表實(shí)現(xiàn)
第三種方法:通過(guò)插入頻數(shù)分布函數(shù)(FREQUENCY)實(shí)現(xiàn)頻數(shù)分布表的制作方法第一種方法:通過(guò)分類(lèi)匯總實(shí)現(xiàn)1、對(duì)數(shù)據(jù)進(jìn)行排序
一般來(lái)說(shuō),錄入數(shù)據(jù)清單的數(shù)據(jù)是無(wú)序的,不能反映現(xiàn)象的本質(zhì)與規(guī)律性。為了方便分析,要將其進(jìn)行排序、分組,以使數(shù)據(jù)按要求排列,同時(shí)把性質(zhì)相同的數(shù)據(jù)歸為一組,讓不同組數(shù)據(jù)之間的差異性顯示出來(lái)。*數(shù)據(jù)的排序,基本步驟如下:打開(kāi)Excel文件,選中文件數(shù)據(jù)區(qū)域任一單元格,單擊“數(shù)據(jù)”下拉菜單→點(diǎn)擊“排序”
,然后在“主要關(guān)鍵字”下的列表框中選擇要排序數(shù)據(jù)的字段名,在右側(cè)選擇“升序”或“降序”。如果要把相同的記錄再排序,則可在“次要關(guān)鍵字”下的列表框中選擇要排序數(shù)據(jù)的字段名,在右側(cè)選擇“升序”或“降序”。案例:對(duì)所有員工按學(xué)歷排序(1)打開(kāi)Excel文件,單擊數(shù)據(jù)區(qū)域任意單元格;(2)單擊“數(shù)據(jù)”下拉菜單→點(diǎn)擊“排序”,出現(xiàn)如下對(duì)話框:(3)在“主要關(guān)鍵字”下的列表框中選擇“學(xué)歷”,在右側(cè)選擇“升序”;(4)單擊“確定”,完成排序。
2、對(duì)數(shù)據(jù)進(jìn)行分類(lèi)匯總,基本步驟如下:
(1)在數(shù)據(jù)排序的基礎(chǔ)上,單擊文件數(shù)據(jù)區(qū)域任一單元格;
(2)單擊“數(shù)據(jù)”下拉菜單→點(diǎn)擊“分類(lèi)匯總”
,出現(xiàn)分類(lèi)匯總的對(duì)話框;(3)在“分類(lèi)字段”下的列表框中選擇要分類(lèi)的字段名;(4)在“匯總方式”下的列表框中選擇“計(jì)數(shù)“;(5)在“選定匯總項(xiàng)”下的列表框中選擇要計(jì)數(shù)的字段名。(6)單擊“確定”,完成分類(lèi)匯總。案例:對(duì)所有數(shù)學(xué)建模學(xué)院按班級(jí)進(jìn)行分類(lèi)匯總(1)打開(kāi)Excel文件,單擊數(shù)據(jù)區(qū)域任意單元格;(2)單擊“數(shù)據(jù)”下拉菜單→點(diǎn)擊“分類(lèi)匯總”,出現(xiàn)如下對(duì)話框:(3)在“分類(lèi)字段”下的列表框中選擇“班級(jí)”;(4)在“匯總方式”下的列表框中選擇“計(jì)數(shù)”;(5)在“選定匯總項(xiàng)”下的列表框中選擇“班級(jí)”;(6)單擊“確定”,完成分類(lèi)匯總。3、通過(guò)查找功能統(tǒng)計(jì)各類(lèi)別數(shù)據(jù)的合計(jì)數(shù)
4、利用各類(lèi)別合計(jì)數(shù)制作頻數(shù)分布表【例】一家市場(chǎng)調(diào)查公司為研究不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買(mǎi)飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買(mǎi)某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)。
制作頻數(shù)分布表綠色健康飲品Excel第二種方法:通過(guò)數(shù)據(jù)透視表實(shí)現(xiàn)分類(lèi)數(shù)據(jù)的頻數(shù)分布表(1)列出各類(lèi)別(2)計(jì)算各類(lèi)別的頻數(shù)(3)生成頻數(shù)分布表分類(lèi)頻數(shù)比例百分比比率ABCDE分類(lèi)數(shù)據(jù)整理—頻數(shù)分布表
1、單擊數(shù)據(jù)區(qū)域任一單元格
2、單擊“數(shù)據(jù)”下拉菜單
→單擊“數(shù)據(jù)透視表和數(shù)據(jù)透視圖”
3、單擊“下一步”,出現(xiàn)如下的復(fù)選框:一般會(huì)自動(dòng)選定區(qū)域
4、單擊“下一步”,出現(xiàn)如下的對(duì)話框:
通過(guò)數(shù)據(jù)透視表編制頻數(shù)分布表步驟5、選擇數(shù)據(jù)透視表顯示位置。如果選擇“新建工作表”,則單擊“完成”。如果選擇“現(xiàn)有工作表”,則需要在其下面的空白框中輸入透視表顯示的位置。然后出現(xiàn)如下對(duì)話框:
單擊“完成”,創(chuàng)建數(shù)據(jù)透視表,出現(xiàn)如下界面:6、在“數(shù)據(jù)透視表字段列表”下面的列表框中點(diǎn)擊要作為行字段的字段名如“飲料品牌”,拖至報(bào)表的行字段處;點(diǎn)擊列字段如“銷(xiāo)售日期”拖動(dòng)到報(bào)表的列字段處;點(diǎn)擊要進(jìn)行匯總的數(shù)據(jù)項(xiàng)如“飲料品牌”拖至報(bào)表的數(shù)據(jù)項(xiàng)處。此時(shí)即完成了數(shù)據(jù)透視表樣式的頻數(shù)分布表。進(jìn)一步編輯頻數(shù)分布表,包括計(jì)算頻率等,最后制作出一張漂亮的頻數(shù)分布表。
第三種方法:通過(guò)插入頻數(shù)分布函數(shù)實(shí)現(xiàn)
頻數(shù)分布函數(shù)(FREQUENCY)是Excel工作表函數(shù)的一個(gè),它可以對(duì)一列垂直數(shù)組返回某個(gè)區(qū)域中數(shù)據(jù)的頻數(shù)分布。其語(yǔ)法形式為:FREQUENCY(Data_array,Bins_array)其中,Data_array為用來(lái)編制頻數(shù)分布的數(shù)據(jù),Bins_array為頻數(shù)的接收區(qū)間。具體操作步驟如下:1、給不同類(lèi)別的定性數(shù)據(jù)設(shè)定代碼,用1、2、3……代替原有的定性數(shù)據(jù)類(lèi)別;并在源數(shù)據(jù)區(qū)域外的空白單元格中輸入源數(shù)據(jù)中的字段名,在字段名下面的單元格中輸入數(shù)據(jù)類(lèi)別名稱(chēng);在字段名右面相鄰單元格中輸入“代碼(組限)”,在“代碼(組限)”下面的單元格中輸入數(shù)據(jù)1、2、3……,作為Bins_array中頻數(shù)的接收區(qū)間;2、按照上步設(shè)定的代碼,給源數(shù)據(jù)編碼;3、在“代碼(組限)”右面的單元格中輸入“頻數(shù)”;4、單擊“頻數(shù)”下面的單元格;5、單擊“插入”子菜單→單擊“函數(shù)”,出現(xiàn)如下對(duì)話框:6、在“或選擇類(lèi)別”的列表框中選擇“統(tǒng)計(jì)”,在“選擇函數(shù)”的列表框中選擇“FREQUENCY”
→單擊“確定”,出現(xiàn)如下對(duì)話框:7、在Data_array右面的空白框中輸入用來(lái)編制頻數(shù)分布表的數(shù)據(jù)區(qū)域位置,在Bins_array右面的空白框中輸入頻數(shù)的接收區(qū)間的數(shù)據(jù)位置;
※注意:此處輸入的是相對(duì)位置如C2:C251,E2:E58、單擊“確定”,此時(shí)在Excel表的“頻數(shù)”下面的單元格中出現(xiàn)第一個(gè)頻數(shù)結(jié)果;9、用鼠標(biāo)選中所有應(yīng)該出現(xiàn)頻數(shù)的單元格,同時(shí)按下“F2鍵、Ctrl鍵、Shift鍵、Enter鍵”,則所有頻數(shù)結(jié)果出現(xiàn);10、進(jìn)一步編輯頻數(shù)分布表,包括計(jì)算頻率等,最后制作出一張漂亮的頻數(shù)分布表。案例:對(duì)某超市一周的飲料銷(xiāo)售數(shù)據(jù)通過(guò)頻數(shù)分布函數(shù)制作頻數(shù)分布表。如何分析結(jié)果形成文字(非常重要)通過(guò)對(duì)某超市一周的飲料銷(xiāo)售數(shù)據(jù)進(jìn)行處理,制作頻數(shù)分布表如下:表1
某超市不同品牌飲料銷(xiāo)售頻數(shù)分布表飲料品牌頻數(shù)(件)頻率(%)王老吉涼茶6024露露9538匯源果汁5522可口可樂(lè)4016合計(jì)250100表2
某超市不同日期飲料銷(xiāo)售頻數(shù)分布表銷(xiāo)售日期頻數(shù)(件)頻率(%)星期一135.2星期二2610.4星期三3915.6星期四3112.4星期五2911.6星期六5923.6星期日5321.2合計(jì)250100.0
數(shù)據(jù)結(jié)果顯示,本超市在一周所銷(xiāo)售的四種品牌飲料總數(shù)為250件,其中,“露露”銷(xiāo)售最多,為95件,占全部銷(xiāo)售總量的38%,將近4成;而“可口可樂(lè)”銷(xiāo)量最低,為40件,僅占銷(xiāo)售總量的16%,不及“露露”的一半。從銷(xiāo)售日期看,周六、周日銷(xiāo)量最高,分別為59件和53件,占一周銷(xiāo)售總量的23.6%和21.2%,兩天銷(xiāo)量占到一周銷(xiāo)售總量的將近一半;其他時(shí)間銷(xiāo)量較低,尤其周一銷(xiāo)量最低,只有13件,僅占一周銷(xiāo)售總量的5.2%,不及周六、周日一天銷(xiāo)量的四份之一。(這部分是根據(jù)數(shù)據(jù)分析具體詳細(xì),下一步提供對(duì)策建議)分析結(jié)果:對(duì)策建議:(1)在進(jìn)貨方面,加大“露露”的進(jìn)貨量,并進(jìn)一步改善和生產(chǎn)廠商的關(guān)系,爭(zhēng)取獲得更多的進(jìn)貨優(yōu)惠;適當(dāng)減少“可口可樂(lè)”的進(jìn)貨量,以減少資金占用。(2)從時(shí)間安排上,適當(dāng)延長(zhǎng)周六、周日的工作時(shí)間,并在周六、周日采取更多的促銷(xiāo)措施;適當(dāng)減少周一的工作時(shí)間,而員工的輪休應(yīng)安排在周一、周二。統(tǒng)計(jì)表:把說(shuō)明總體特征的數(shù)字資料按照一定的規(guī)則、以表格的形式表現(xiàn)出來(lái),這種表格叫做統(tǒng)計(jì)表。統(tǒng)計(jì)表示例2008年中國(guó)國(guó)內(nèi)生產(chǎn)總值統(tǒng)計(jì)表產(chǎn)業(yè)分組國(guó)內(nèi)生產(chǎn)總值絕對(duì)值(億元)比重(%)國(guó)內(nèi)生產(chǎn)總值第一產(chǎn)業(yè)增加值第二產(chǎn)業(yè)增加值第三產(chǎn)業(yè)增加值30067034000146183120487100.011.348.640.1總標(biāo)題主詞賓詞縱列標(biāo)題橫行標(biāo)題注:資料來(lái)源于2009年《中國(guó)統(tǒng)計(jì)年鑒》統(tǒng)計(jì)表的構(gòu)成
從內(nèi)容上看:統(tǒng)計(jì)表由說(shuō)明總體及其各個(gè)組成部分的主詞和說(shuō)明總體的各種統(tǒng)計(jì)指標(biāo)的賓詞兩部分構(gòu)成。
從形式上看:統(tǒng)計(jì)表由總標(biāo)題、橫行標(biāo)題、縱列標(biāo)題、線條表格及表中的指標(biāo)數(shù)值等部分組成。編制統(tǒng)計(jì)表應(yīng)注意的問(wèn)題統(tǒng)計(jì)表的總標(biāo)題要能準(zhǔn)確反映表中的內(nèi)容及資料所屬的時(shí)間和空間。統(tǒng)計(jì)表中的數(shù)字要有單位,如表中各指標(biāo)單位不同,可分別寫(xiě)在縱欄標(biāo)題下;如單位相同,應(yīng)將計(jì)量單位寫(xiě)在統(tǒng)計(jì)表右上角。統(tǒng)計(jì)表中的數(shù)字應(yīng)書(shū)寫(xiě)工整,數(shù)位要對(duì)準(zhǔn)。表內(nèi)遇到相同數(shù)字時(shí),要照寫(xiě),不能用“同上”替代;沒(méi)有數(shù)字的空格要用“-”表示;資料未取得,數(shù)字暫缺用“…”表示。統(tǒng)計(jì)表的注釋?zhuān)Y料來(lái)源等,一般簡(jiǎn)單扼要地寫(xiě)在表的最下方。四、制作統(tǒng)計(jì)圖統(tǒng)計(jì)圖在統(tǒng)計(jì)表的基礎(chǔ)上,用幾何圖形或?qū)嵨飯D形把統(tǒng)計(jì)表中的數(shù)字資料形象地再現(xiàn)出來(lái)。常用統(tǒng)計(jì)圖條形圖和柱形圖餅圖直方圖折線圖條形圖和柱形圖
條形圖和柱形圖是最常見(jiàn)的圖表,它們是在頻數(shù)分布表的基礎(chǔ)上,利用圖表向?qū)е谱鞯?,用于顯示現(xiàn)象中不同類(lèi)別的頻數(shù)。制作簡(jiǎn)單,直觀明了,品質(zhì)數(shù)據(jù)的處理經(jīng)常使用這兩種圖表。制作步驟:(1)做好頻數(shù)分布表;(2)選中制作圖表的數(shù)據(jù)區(qū)域;(3)點(diǎn)擊“插入”
→點(diǎn)擊“圖表”,出現(xiàn)下面的復(fù)選框:
(或直接在Excel表上方的工具欄中點(diǎn)擊圖表向?qū)В?(4)在“圖表類(lèi)型”下面的列表框中選擇柱形圖或條形圖;(5)在右面“子圖表類(lèi)型”中選擇合適的子圖表;(6)單擊“下一步”,選擇系列產(chǎn)生在行或列;(7)單擊“下一步”,出現(xiàn)下面對(duì)話框,需根據(jù)內(nèi)容和需要填寫(xiě)圖表標(biāo)題、分類(lèi)(X)軸的標(biāo)題、數(shù)值(Y)軸的標(biāo)題;(8)單擊“下一步”,出現(xiàn)下面復(fù)選框:(9)選擇圖表的位置。若選擇“作為新工作表插入”,則系統(tǒng)會(huì)默認(rèn)插入一張新工作表并自動(dòng)命名如“Chart1”;若選擇“作為其中的對(duì)象插入”,則系統(tǒng)會(huì)默認(rèn)當(dāng)前工作表;(10)單擊“完成”,條形圖或柱形圖即制成。(11)為了使圖表更加美觀,可進(jìn)一步編輯圖表。案例:對(duì)某超市一周的飲料銷(xiāo)售數(shù)據(jù)制作條形圖和柱形圖。二、餅圖
餅圖也是一種常見(jiàn)的圖表,它是在頻率分布表的基礎(chǔ)上,利用圖表向?qū)е谱鞯?,用于顯示現(xiàn)象中不同類(lèi)別在總體中所占的比重,用于反映現(xiàn)象的結(jié)構(gòu)及各類(lèi)別之間的對(duì)比關(guān)系。制作步驟:(1)在頻數(shù)分布表的基礎(chǔ)上計(jì)算頻率;(2)選中制作圖表的數(shù)據(jù)區(qū)域;(3)點(diǎn)擊“插入”
→點(diǎn)擊“圖表”,出現(xiàn)下面的復(fù)選框:或直接在Excel表上方的工具欄中點(diǎn)擊圖表向?qū)В海?)在“圖表類(lèi)型”下面的列表框中選擇餅圖;(5)在右面“子圖表類(lèi)型”中選擇合適的子圖表;(6)單擊“下一步”,出現(xiàn)下面對(duì)話框,需根據(jù)內(nèi)容和需要填寫(xiě)圖表標(biāo)題;(7)單擊“下一步”,出現(xiàn)下面復(fù)選框:(8)選擇圖表的位置。若選擇“作為新工作表插入”,則系統(tǒng)會(huì)默認(rèn)插入一張新工作表并自動(dòng)命名如“Chart1”;若選擇“作為其中的對(duì)象插入”,則系統(tǒng)會(huì)默認(rèn)當(dāng)前工作表;(9)單擊“完成”,餅圖即制成。(10)為了使圖表更加美觀,可進(jìn)一步編輯圖表。
案例:對(duì)某超市一周的飲料銷(xiāo)售數(shù)據(jù)制作餅圖。三、直方圖
直方圖需利用數(shù)據(jù)分析工具制作,主要用于統(tǒng)計(jì)源數(shù)據(jù)中各類(lèi)別數(shù)據(jù)出現(xiàn)的頻數(shù)和累積頻率,顯示現(xiàn)象中不同類(lèi)別的數(shù)量分布形態(tài)。
適用于數(shù)值型數(shù)據(jù)。制作步驟:1、在做好頻數(shù)分布表的基礎(chǔ)上,選擇“工具”下拉菜單的“數(shù)據(jù)分析”子菜單,用鼠標(biāo)雙擊數(shù)據(jù)分析對(duì)話框中的“直方圖”選項(xiàng);2、進(jìn)入“直方圖”對(duì)話框,其主要選項(xiàng)為1)輸入?yún)^(qū)域:選定要處理的數(shù)據(jù)區(qū)域;2)接收區(qū)域:選定作為分組邊界值(主要是各組上限)的數(shù)據(jù)范圍;3)標(biāo)志:因輸入數(shù)據(jù)區(qū)域的第一行是標(biāo)志項(xiàng);4)累積百分比:選定時(shí)頻數(shù)分布表的結(jié)果中將有累積百分比數(shù)值,并在直方圖中出現(xiàn)累積百分比折線圖。5)圖表輸出:選定時(shí)將在輸出頻數(shù)分布表的同時(shí),生成直方圖。3、根據(jù)需要選定“直方圖”對(duì)話框中的選項(xiàng)后,單擊“確定”即得初步結(jié)果;4、在頻數(shù)分布表的結(jié)果中刪除“其他”所在行(第7行),則圖中“其他”及對(duì)應(yīng)部分也就消失。5、在直方圖中雙擊任一直條,即可進(jìn)入“數(shù)據(jù)系列格式”,點(diǎn)擊“選項(xiàng)”標(biāo)簽,將“間距寬度”的值150改為0,還可以點(diǎn)擊“數(shù)據(jù)標(biāo)志”標(biāo)簽選定“顯示值”,再單擊“確定”即可得到直條間無(wú)間隔的直方圖。四、折線圖
折線圖主要用于比較幾類(lèi)數(shù)據(jù)變動(dòng)的方向和趨勢(shì),表現(xiàn)數(shù)據(jù)在不同時(shí)期發(fā)展變化的不同趨勢(shì)。適用于時(shí)間序列數(shù)據(jù)。Excel繪制折線圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開(kāi)始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷折線圖(例題分析)【例】我國(guó)1990~2008年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖¥
$
時(shí)間序列折線圖(例題分析)Excel數(shù)據(jù)分析程序的安裝運(yùn)用Excel進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析時(shí),Excel中必須安裝Excel數(shù)據(jù)分析程序,即在Excel的“工具”菜單中應(yīng)出現(xiàn)“數(shù)據(jù)分析”的命令選項(xiàng),當(dāng)進(jìn)入MicrosoftExcel時(shí),如果在“工具”菜單中沒(méi)有“數(shù)據(jù)分析”命令,必須首先安裝“分析工具庫(kù)”。
其步驟為:安裝步驟(2003)1、點(diǎn)擊“工具”菜單中的“加載宏”;2、在彈出的“加載宏”對(duì)話框中勾選“分析工具庫(kù)”;3、點(diǎn)擊確定。此時(shí)即完成了Excel數(shù)據(jù)分析程序的安裝,在Excel的“工具”菜單中就會(huì)出現(xiàn)“數(shù)據(jù)分析”的命令選項(xiàng)。
安裝步驟(2010)文件===》excel選項(xiàng)===》加載項(xiàng)===》excel加載項(xiàng)===》分析工具五、數(shù)據(jù)的描述與分析
數(shù)據(jù)經(jīng)過(guò)整理與顯示后,我們對(duì)數(shù)據(jù)分布的類(lèi)型和特點(diǎn)有了大致的了解,但還缺少代表性的數(shù)量特征,無(wú)法準(zhǔn)確地描述出數(shù)據(jù)的分布。對(duì)數(shù)據(jù)的分布特征,可以從不同方面測(cè)定和描述:一是分布的集中趨勢(shì):反映數(shù)據(jù)向其中心值靠攏或聚集的程度;二是分布的離散程度:反映數(shù)據(jù)遠(yuǎn)離其中心值的程度。數(shù)據(jù)的描述與分析
測(cè)定集中趨勢(shì)均值眾數(shù)中位數(shù)一二三極差標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差系數(shù)四測(cè)定離中趨勢(shì)知識(shí)點(diǎn)一:對(duì)數(shù)據(jù)資料計(jì)算均值(mean)1.對(duì)未分組數(shù)據(jù)計(jì)算平均數(shù)2.對(duì)分組數(shù)據(jù)計(jì)算平均數(shù)3.解釋計(jì)算數(shù)據(jù)所表達(dá)的含義平均數(shù):總體數(shù)量差異的平均化,總體數(shù)量的代表水平。1.對(duì)未分組資料計(jì)算平均數(shù)將各個(gè)變量值加總,除以變量值的個(gè)數(shù)。例12009年10月某物流公司員工工資統(tǒng)計(jì)表姓名工資王可張?zhí)m李萬(wàn)鵬黎潔趙明亮15652033180626811785單位:元求該物流公司員工工資的平均數(shù)計(jì)算過(guò)程2.對(duì)分組資料計(jì)算平均數(shù)各組觀察值與各組頻數(shù)的乘積總和除以總頻數(shù)例22009年10月某物流公司員工工資統(tǒng)計(jì)表員工工資(元)人數(shù)(人)1500160017001800190081215205求該物流公司員工工資的平均數(shù)A單項(xiàng)數(shù)列計(jì)算過(guò)程例32009年10月某物流公司員工工資統(tǒng)計(jì)表員工工資(元)人數(shù)(人)1000以下1000-12001200-14001400-16001600以上81215205求該物流公司員工工資的平均數(shù)B組距數(shù)列計(jì)算組中值公式計(jì)算過(guò)程3.解釋計(jì)算結(jié)果所表達(dá)的含義算數(shù)平均數(shù)(均值)表明一組數(shù)據(jù)的一般水平。優(yōu)點(diǎn):一組數(shù)據(jù)只有一個(gè)均值,比較不同組數(shù)據(jù)時(shí)非常有用,并且考慮到了每一個(gè)數(shù)值的影響;缺點(diǎn):它會(huì)受到不能真正代表一組數(shù)據(jù)的極端值的影響。例題1中計(jì)算出的均值說(shuō)明:雖然每個(gè)員工工資不同,但是他們的工資集中在1974元左右,也就是說(shuō)1974元是該公司員工工資的代表值。知識(shí)點(diǎn)二:對(duì)數(shù)據(jù)資料測(cè)定眾數(shù)(mode)1.整理排序2.計(jì)算眾數(shù)3.眾數(shù)說(shuō)明的意義和特點(diǎn)眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)量值。1.整理排序數(shù)據(jù):1,1,0,3,3,0,
1,2,3,5,3,
2,0,4,6排序:0,0,0,1,1,1,
2,2,3,3,3,3,
4,5,63為眾數(shù)2.計(jì)算眾數(shù)計(jì)算組距數(shù)列眾數(shù)方法一M0—眾數(shù)L—眾數(shù)所在組的下限f—眾數(shù)所在組的頻數(shù)f-1—眾數(shù)所在組前一組的頻數(shù)f+1—眾數(shù)所在組后一組的頻數(shù)i—組距計(jì)算組距數(shù)列眾數(shù)方法二M0—眾數(shù)U—眾數(shù)所在組的上限f—眾數(shù)所在組的頻數(shù)f-1—眾數(shù)所在組前一組的頻數(shù)f+1—眾數(shù)所在組后一組的頻數(shù)i—組距3.眾數(shù)說(shuō)明的意義和特點(diǎn)此次調(diào)查中,被調(diào)查者的年齡集中在27.8歲,這個(gè)集中趨勢(shì)就是用眾數(shù)來(lái)表示的。優(yōu)點(diǎn):不受極端值的影響,計(jì)算方便。缺點(diǎn):當(dāng)一組數(shù)據(jù)沒(méi)有重復(fù)值出現(xiàn),集中趨勢(shì)不明顯時(shí),眾數(shù)不存在;而當(dāng)有些數(shù)據(jù)重復(fù)出現(xiàn)的次數(shù)相同時(shí),會(huì)有多個(gè)眾數(shù)。知識(shí)點(diǎn)三:對(duì)調(diào)查數(shù)據(jù)資料測(cè)定中位數(shù)(median)1.數(shù)據(jù)排序2.分組資料確定中位數(shù)3.組距數(shù)列確定中位數(shù)4.中位數(shù)說(shuō)明的意義和特點(diǎn)中位數(shù)是指一組數(shù)據(jù)中按照從大到小或從小到大的順序排列后,位于數(shù)列中點(diǎn)位置的數(shù)值。1.數(shù)據(jù)排序,確定中位數(shù)位置數(shù)據(jù):110330123532046排序:000111223333456位置:123456789101112131415如果數(shù)列項(xiàng)數(shù)為奇數(shù),中間位置的那個(gè)變量值為中位數(shù)。中位數(shù)數(shù)據(jù):1103301235320467如果數(shù)列項(xiàng)數(shù)為偶數(shù),中間位置的兩個(gè)變量值的平均數(shù)為中位數(shù)?;蚺判?0001112233334567位置:12345678910111213141516中位數(shù)2.分組資料確定中位數(shù)先確定中位數(shù)所在的位置,然后找出中位數(shù)所在的組,再計(jì)算中位數(shù)的近似值。例題1第一步:確定中位數(shù)位置向上累計(jì)924.5第二步:找出中位數(shù)所在組第三步:計(jì)算中位數(shù)924和925之間
向上累計(jì):從標(biāo)志值小的一方向標(biāo)志值大的一方累計(jì)在數(shù)據(jù)表中的特征:累計(jì)頻數(shù)越來(lái)越大名詞解釋向上累計(jì)924.5例題2924和925之間3.組距數(shù)列確定中位數(shù)Me—中位數(shù)L—中位數(shù)所在組的下限fm—中位數(shù)所在組的頻數(shù)Sn-1—中位數(shù)所在組前一組的累積頻數(shù)(向上累計(jì))i—中位數(shù)所在組的組距方法一924.5向上累計(jì)例題3SfMe—中位數(shù)U—中位數(shù)所在組的上限fm—中位數(shù)所在組的頻數(shù)Sn+1—中位數(shù)所在組前一組的累積頻數(shù)(向下累計(jì))i—中位數(shù)所在組的組距方法二924.5向下累計(jì)例題4名詞解釋
向下累計(jì):從標(biāo)志值大的一方向標(biāo)志值小的一方累計(jì)在數(shù)據(jù)表中的特征:累計(jì)頻數(shù)越來(lái)越小4.中位數(shù)說(shuō)明的意義和特點(diǎn)
此次調(diào)查中,被調(diào)查者的年齡集中在30.58歲,這個(gè)集中趨勢(shì)就是用中位數(shù)來(lái)表示的。優(yōu)點(diǎn):不受極端值的影響,對(duì)于一些不能用數(shù)量表示,只能用等級(jí)、名次表示的現(xiàn)象,可采用中位數(shù)來(lái)代表一般水平。缺點(diǎn):沒(méi)有考慮到所有的數(shù)據(jù)價(jià)值,僅是一種大致的集中趨勢(shì)指標(biāo),不夠精確。知識(shí)點(diǎn)四:對(duì)調(diào)查數(shù)據(jù)測(cè)定離中趨勢(shì)值1.計(jì)算極差2.計(jì)算標(biāo)準(zhǔn)差3.計(jì)算標(biāo)準(zhǔn)差系數(shù)測(cè)定離中趨勢(shì)1.計(jì)算極差(Range)極差=最大數(shù)據(jù)值-最小數(shù)據(jù)值極差是數(shù)據(jù)分布中兩個(gè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 樂(lè)隊(duì)訓(xùn)練第二學(xué)期計(jì)劃2篇
- 主診醫(yī)師述職報(bào)告范文(6篇)
- 中學(xué)生繁星春水讀后感
- 高職傷逝課件教學(xué)課件
- 探究性閱讀課教案
- 美術(shù)大綱課件教學(xué)課件
- 輪椅車(chē)座椅 第14部分:與外力控制以維持組織完整性有關(guān)的概念 征求意見(jiàn)稿
- 農(nóng)小蜂-中國(guó)香蕉市場(chǎng)動(dòng)態(tài)監(jiān)測(cè)(2024年10月)
- 八年級(jí)上學(xué)期語(yǔ)文1月月考試卷
- 初中化學(xué)基礎(chǔ)知識(shí)與題目(含答案)
- 諾如病毒的護(hù)理查房
- 信息科技大單元教學(xué)設(shè)計(jì)之八年級(jí)第三單元簡(jiǎn)單物聯(lián)功能實(shí)踐
- 【團(tuán)體標(biāo)準(zhǔn)】TDZJN 77-2022 鋰離子電池產(chǎn)品碳足跡評(píng)價(jià)導(dǎo)則
- 期中模擬卷(含答案)2024-2025學(xué)年浙教版七年級(jí)數(shù)學(xué)上冊(cè)
- 2024年江蘇蘇州市(12345)便民服務(wù)中心招聘座席代表人員高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 小班-數(shù)學(xué)-愛(ài)跳的棉花糖(上下、前后、里外方位)-課件(互動(dòng)版)
- 基于UbD理論小說(shuō)敘事視角的群文閱讀設(shè)計(jì)
- 內(nèi)分泌系統(tǒng)和營(yíng)養(yǎng)代謝性疾病總論P(yáng)PT課件
- 抓斗式挖泥船疏浚施工方案(共7頁(yè))
- 抹灰整改通知單
- 半導(dǎo)體簡(jiǎn)答題
評(píng)論
0/150
提交評(píng)論