版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3章數(shù)據(jù)的整理與展示統(tǒng)計(jì)學(xué)第3章數(shù)據(jù)的整理與展示§3.1
數(shù)據(jù)的預(yù)處理§3.2分類和順序數(shù)據(jù)的整理與展示§3.3數(shù)值型數(shù)據(jù)的整理與展示§3.4合理使用統(tǒng)計(jì)圖表§3.1數(shù)據(jù)的預(yù)處理3.1.1數(shù)據(jù)審核3.1.2數(shù)據(jù)篩選3.1.3數(shù)據(jù)排序3.1.4數(shù)據(jù)透視表數(shù)據(jù)的預(yù)處理1.數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯(cuò)誤2.數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)3.數(shù)據(jù)排序(1)升序和降序(2)尋找數(shù)據(jù)的基本特征數(shù)據(jù)的預(yù)處理是在對(duì)數(shù)據(jù)分類或分組之前所做的必要處理,包括以下內(nèi)容:數(shù)據(jù)審核—原始數(shù)據(jù)(rawdata)數(shù)據(jù)審核就是檢查數(shù)據(jù)中是否有錯(cuò)誤。對(duì)通過(guò)調(diào)查取得的原始數(shù)據(jù)從以下兩方面來(lái)審核:
1.完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目是否填寫齊全
2.準(zhǔn)確性審核檢查數(shù)據(jù)是否有錯(cuò)誤,是否存在異常值。對(duì)異常值的鑒別:若是記錄錯(cuò)誤,需要糾正;若是正確值,則保留。數(shù)據(jù)的審核—二手?jǐn)?shù)據(jù)二手?jǐn)?shù)據(jù)的審核,主要審核數(shù)據(jù)的適用性和時(shí)效性1.適用性弄清數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景確定數(shù)據(jù)是否符合自己分析的需要。2.時(shí)效性對(duì)數(shù)據(jù)的時(shí)效性進(jìn)行審核,對(duì)于一些時(shí)效性較強(qiáng)的問(wèn)題,若數(shù)據(jù)過(guò)于滯后,就失去了研究的意義,所以盡可能使用最新的數(shù)據(jù)。用Excel進(jìn)行數(shù)據(jù)篩選
8名學(xué)生的考試成績(jī)數(shù)據(jù)
數(shù)據(jù)篩選(datafilter)數(shù)據(jù)篩選是根據(jù)需要找出符合特定條件的某類數(shù)據(jù)。例3.1找出統(tǒng)計(jì)學(xué)成績(jī)等于75分的學(xué)生,英語(yǔ)成績(jī)最高的前三名學(xué)生,四門課程成績(jī)都大于70分的學(xué)生。數(shù)據(jù)排序(datarank)1.按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索2.排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)3.在某些場(chǎng)合,排序本身就是分析的目的之一例如,美國(guó)的《財(cái)富》雜志每年都要在世界范圍內(nèi)排出500強(qiáng)企業(yè),通過(guò)這一信息,不僅可以了解自己企業(yè)所處的位置,清楚自己的差距,還可以從側(cè)面了解對(duì)手的狀況,從而有效制定企業(yè)的發(fā)展規(guī)劃和戰(zhàn)略目標(biāo)。4.排序可借助于計(jì)算機(jī)完成數(shù)據(jù)排序的方法分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)排序后的數(shù)據(jù)稱為順序統(tǒng)計(jì)量數(shù)據(jù)透視表1.作用:利用數(shù)據(jù)透視表,我們可以對(duì)數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進(jìn)行匯總和作圖,以形成一個(gè)符合需要的交叉表(列聯(lián)表)。2.利用數(shù)據(jù)透視表可以十分靈活地分析數(shù)據(jù)。3.要求:在利用數(shù)據(jù)透視表時(shí),數(shù)據(jù)源表中的首行必須有列標(biāo)題。數(shù)據(jù)透視表的編制:如下面的例3.2數(shù)據(jù)透視表例3.2在某大學(xué)隨機(jī)抽取30名學(xué)生,調(diào)查他們的性別、家庭所在地、平均每月購(gòu)買衣物支出和購(gòu)買衣物時(shí)所考慮的首要因素等,得到的數(shù)據(jù)如表所示。試建立一個(gè)數(shù)據(jù)透視表,在表的行變量中給出性別和購(gòu)買衣物首選因素,在列變量中給出學(xué)生的家庭所在地,對(duì)平均月生活支出和購(gòu)買衣物支出進(jìn)行交叉匯總。用Excel做數(shù)據(jù)透視圖
上節(jié)內(nèi)容總結(jié)1.統(tǒng)計(jì)學(xué)2.數(shù)據(jù)的分類:計(jì)量尺度,數(shù)據(jù)來(lái)源,時(shí)間與空間3.總體、樣本,參數(shù)、統(tǒng)計(jì)量4.數(shù)據(jù)的生成過(guò)程
1)概率抽樣:簡(jiǎn)單隨機(jī)抽樣、分層、整群、系統(tǒng)、多階段抽樣
2)非概率抽樣:方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣
3)數(shù)據(jù)搜集方法:自填式、面訪式、電話式
4)試驗(yàn)數(shù)據(jù):對(duì)照組和試驗(yàn)組、匹配原則
5)抽樣誤差和非抽樣誤差上節(jié)內(nèi)容總結(jié)1.數(shù)據(jù)的審核:檢查數(shù)據(jù)中的錯(cuò)誤原始數(shù)據(jù):完整性和準(zhǔn)確性二手?jǐn)?shù)據(jù):適用性和時(shí)效性2.數(shù)據(jù)的篩選:找出符合條件的數(shù)據(jù)3.數(shù)據(jù)排序:升序和降序數(shù)據(jù)的預(yù)處理3.2.1分類數(shù)據(jù)的整理與展示3.2.2順序數(shù)據(jù)的整理與展示要弄清所面對(duì)的數(shù)據(jù)類型,因?yàn)椴煌愋偷臄?shù)據(jù),所采取的處理方式和方法是不同的對(duì)品質(zhì)數(shù)據(jù)主要是做分類整理對(duì)數(shù)值型數(shù)據(jù)則主要是做分組整理§3.2品質(zhì)數(shù)據(jù)的整理與展示分類數(shù)據(jù)的整理(基本過(guò)程)1. 列出各類別2.計(jì)算各類別的頻數(shù)、頻率3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE分類數(shù)據(jù)的整理(可計(jì)算的統(tǒng)計(jì)量)1.頻數(shù)(frequency)
:落在某一特定類別或組中的數(shù)據(jù)個(gè)數(shù)。把各個(gè)類別及落在其中的相應(yīng)頻數(shù)全部列出,并用表格表現(xiàn)出來(lái),稱為頻數(shù)分布。頻率是指頻數(shù)/總數(shù)據(jù)個(gè)數(shù)。下面舉例來(lái)說(shuō)明。分類數(shù)據(jù)整理—頻數(shù)分布表
(例題分析)【例3.3】為研究不同類型軟飲料的市場(chǎng)銷售情況,一家市場(chǎng)調(diào)查公司隨機(jī)抽取的一家超市進(jìn)行調(diào)查。調(diào)查員隨機(jī)觀察的50名顧客購(gòu)買的飲料類型及購(gòu)買者性別的記錄。生成頻數(shù)分布表,觀察飲料類型和顧客性別的分布情況,進(jìn)行描述性分析。綠色健康飲品用Excel制作頻數(shù)分布表
顧客性別飲料類型顧客性別飲料類型顧客性別飲料類型女碳酸飲料女碳酸飲料女其他男綠茶男綠茶女碳酸飲料男礦泉水男其他女其他女礦泉水女碳酸飲料女果汁男碳酸飲料男綠茶男綠茶男礦泉水男綠茶女果汁女碳酸飲料女碳酸飲料女碳酸飲料女綠茶男碳酸飲料女果汁男果汁女綠茶男礦泉水男碳酸飲料男礦泉水女碳酸飲料女礦泉水女綠茶女綠茶女其他女碳酸飲料女其他男碳酸飲料女礦泉水女果汁男綠茶男其他男綠茶男碳酸飲料男碳酸飲料女其他女其他女果汁女礦泉水男礦泉水男礦泉水分類數(shù)據(jù)的整理(可計(jì)算的統(tǒng)計(jì)量)2.比例(proportion)(或頻率)
:一個(gè)樣本(或總體)中各個(gè)部分與全部數(shù)據(jù)之比,通常用于反映樣本(或總體)的構(gòu)成或結(jié)構(gòu)。3.百分比(percentage)
:將比例乘以100得到的結(jié)果,用%表示。當(dāng)分子的數(shù)值很小而分母的數(shù)值很大時(shí),也可用千分?jǐn)?shù)‰來(lái)表示比例。4.比率(ratio)
:樣本(或總體)中各個(gè)不同類別數(shù)值之間的比值。比率可以是一個(gè)樣本(或總體)中各個(gè)不同部分的數(shù)量對(duì)比,一般將分母化為1或100。分類數(shù)據(jù)的圖示—條形圖(barChart)1.條形圖是用寬度相同的條形的高度或長(zhǎng)短來(lái)表示數(shù)據(jù)多少的圖形2.條形圖可以橫置或縱置,縱置時(shí)也可稱為柱形圖。3.條形圖有簡(jiǎn)單條形圖、對(duì)比條形圖等形式。4.條形圖是用矩形的高度或長(zhǎng)度來(lái)表示各類別數(shù)據(jù)的頻數(shù)或頻數(shù)分布的圖形。繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖。分類數(shù)據(jù)的圖示—條形圖
(例題分析)對(duì)比條形圖對(duì)比(復(fù)式)條形圖(side-by-sidebarchart):當(dāng)分類變量在不同時(shí)間或不同空間上有多個(gè)取值時(shí),為對(duì)比分類變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢(shì),我們可以繪制對(duì)比條形圖。用Excel制作頻數(shù)分布表
帕累托圖帕累托圖(Paretochart):是以意大利經(jīng)濟(jì)學(xué)家V.Pareto的名字而命名的,它是按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖。通過(guò)對(duì)柱形圖的排序,容易看出哪類數(shù)據(jù)出現(xiàn)得多,哪類數(shù)據(jù)出現(xiàn)得少。它多用于質(zhì)量控制中。如不同品牌飲料的頻數(shù)分布繪制成帕累托圖。分類數(shù)據(jù)的圖示—餅圖(pieChart)1.餅圖是用圓形及圓內(nèi)扇形的角度來(lái)表示數(shù)值大小的圖形2.主要用于表示一個(gè)樣本(或總體)中各組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用3.繪制餅圖時(shí),樣本中各部分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,是按各部分百分比占3600的相應(yīng)比例確定的。分類數(shù)據(jù)的圖示—餅圖(例題分析)分類數(shù)據(jù)的圖示—復(fù)式餅圖(例題分析)分類數(shù)據(jù)的圖示--環(huán)形圖1.環(huán)形圖中間有一個(gè)“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示。2.環(huán)形圖與餅圖類似,但又有區(qū)別:餅圖只能顯示一個(gè)樣本或總體各部分所占的比例;環(huán)形圖則可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,每一個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)。3.環(huán)形圖可用于結(jié)構(gòu)比較研究4.環(huán)形圖主要用于展示分類和順序數(shù)據(jù)分類數(shù)據(jù)整理—頻數(shù)分布表
(例題分析)【例3.4】2006年北京、上海和天津地區(qū)按收入法計(jì)算的地區(qū)生成總之(按當(dāng)年價(jià)格計(jì)算)數(shù)據(jù)如右表所示,繪制環(huán)形圖比較桑格地區(qū)的生成總之構(gòu)成。用Excel制作頻數(shù)分布表
地區(qū)勞動(dòng)者報(bào)酬生成稅凈額固定資產(chǎn)折舊營(yíng)業(yè)盈余北京3496.571161.551251.091961.07天津1383.36775.09595.091605.61上海3756.561623.361730.513255.94環(huán)形圖(例題分析)
順序數(shù)據(jù)的整理(可計(jì)算的指標(biāo))1.累積頻數(shù)(cumulativefrequencies):將各有序類別或組的頻數(shù)逐級(jí)累加起來(lái)得到的頻數(shù)。2.累積頻率(cumulativepercentages):將各有序類別或組的百分比逐級(jí)累加起來(lái)。頻數(shù)的累積方法有兩種:①?gòu)念悇e順序的開(kāi)始一方向類別順序的最后一方累加頻數(shù)(數(shù)值型分組數(shù)據(jù)則是從變量值小的一方向變量值大的一方累加頻數(shù)),稱為向上累積;②從類別順序的最后一方向類別順序的開(kāi)始一方累加頻數(shù)(數(shù)值型分組數(shù)據(jù)則是從變量值大的一方向變量值小的一方累加頻數(shù)),稱為向下累積。通過(guò)累積頻數(shù),我們可以很容易看出某一類別(或數(shù)值)以下或某一類別(或數(shù)值)以上的頻數(shù)之和。累積頻率也有向上累積和向下累積兩種方法。順序數(shù)據(jù)的整理(可計(jì)算的指標(biāo))順序數(shù)據(jù)的頻數(shù)分布表
(例題分析)【例3.5】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?
1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0————順序數(shù)據(jù)的頻數(shù)分布表
(例題分析)乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計(jì)300100.0————順序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖(例題分析)243001322252700100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布根據(jù)累積頻數(shù)或累積頻率,可以繪制頻數(shù)分布或頻率圖?!?.3數(shù)值型數(shù)據(jù)的整理與展示3.3.1數(shù)據(jù)分組3.3.2數(shù)值型數(shù)據(jù)的圖示注:品質(zhì)數(shù)據(jù)的整理與圖示方法,也適用于數(shù)值型數(shù)據(jù)的整理與顯示,但數(shù)值型數(shù)據(jù)還有一些特定的整理和圖示方法,它們并不適用于品質(zhì)數(shù)據(jù)。數(shù)據(jù)分組1.分組數(shù)據(jù):是根據(jù)研究的需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)化分成不同的組別,則分組后的數(shù)據(jù)就稱為分組數(shù)據(jù)。2.目的:觀察數(shù)據(jù)的分布特征。3.方法:?jiǎn)巫兞恐捣纸M和組距分組。單變量值分組是把每一個(gè)變量值作為一組,這種分組通常只適合離散變量,且變量值較少的情況下使用。組距分組是將全部變量值依次劃分為若干個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組,通常用于連續(xù)變量或變量值較多的情況。組距分組(步驟)1.確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按斯特奇斯(Sturges)提出的經(jīng)驗(yàn)公式來(lái)確定組數(shù)K2.確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即
組距=(最大值-最小值)÷組數(shù)
統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表組距分組1.組距分組應(yīng)遵循“不重不漏”的原則
(1)“不重”是指一項(xiàng)數(shù)據(jù)只能分在其中的某一組,不能在其他組中重復(fù)出現(xiàn);
(2)“不漏”是指組別能夠窮盡,即在說(shuō)分的全部組別中每項(xiàng)數(shù)據(jù)都能分在其中的某一組,不能遺漏。2.解決不重的方法:統(tǒng)計(jì)分組習(xí)慣上規(guī)定“上組限不在內(nèi)”;也可根據(jù)數(shù)據(jù)的精度確定上限。3.在組距分組中,如果全部數(shù)據(jù)中的最大值與最小值與其他數(shù)據(jù)相差懸殊,為避免出現(xiàn)空白組或個(gè)別極端值被漏掉,常設(shè)置“以下”或“以上”形式的開(kāi)口組。開(kāi)口組通常以相鄰組的組距作為其組距。組距分組(幾個(gè)概念)1.下限(lowlimit)
:一個(gè)組的最小值2.上限(upperlimit)
:一個(gè)組的最大值3.組距(classwidth)
:上限與下限之差4.組中值(classmidpoint)
:下限與上限之間的中點(diǎn)值等距分組與不等距分組
(在表現(xiàn)頻數(shù)分布上的差異)1.等距分組(1)各組頻數(shù)的分布不受組距大小的影響(2)可直接根據(jù)絕對(duì)頻數(shù)來(lái)觀察頻數(shù)分布的特征2.不等距分組(1)各組頻數(shù)的分布受組距大小不同的影響(2)各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況(3)需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況頻數(shù)分布表的編制
(例題分析)【例3.6】某電腦公司2005年前四個(gè)月各天的銷售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組。
頻數(shù)分布表的編制
(步驟)1.確定組數(shù):根據(jù)斯特奇斯(Sturges)提出的經(jīng)驗(yàn)公式得組數(shù)K為:一般5≤K≤152.確定各組的組距:
組距=(237-141)÷10=9.610用Excel制作頻數(shù)分布表例3.6等距分組表
(上下組限重疊)等距分組表
(上下組限間斷)等距分組表
(使用開(kāi)口組)數(shù)值型數(shù)據(jù)的圖示Excel分組數(shù)據(jù)—直方圖和折線圖分組數(shù)據(jù)—直方圖(histogram)用圖象來(lái)展示數(shù)據(jù)的分布會(huì)更形象、直觀。顯示分組數(shù)據(jù)頻數(shù)分布特征的圖形有直方圖、折線圖和曲線圖等。1.直方圖是用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布。2.在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖。分組數(shù)據(jù)的圖示
(直方圖的繪制)140150210某電腦公司銷售量分布的直方圖我一眼就看出來(lái)了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240等距分組時(shí),組距為1,高度為頻率。非等距分組時(shí),高度為密度除以總頻數(shù)。直方圖與條形圖的區(qū)別1.條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的2.直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義3.直方圖的各矩形通常是連續(xù)排列,條形圖則是分開(kāi)排列4.條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)未分組數(shù)據(jù)—莖葉圖
(stem-and-leafdisplay)1.莖葉圖是反映原始數(shù)據(jù)分布的圖形。它由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的。2.通過(guò)莖葉圖,可以看出數(shù)據(jù)的分布形狀及數(shù)據(jù)的離散狀況,如分布是否對(duì)稱,數(shù)據(jù)是否集中,是否有離群點(diǎn)等。3.制作莖葉圖方法:以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉,且樹(shù)葉上只保留一位數(shù)字4.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)—莖葉圖(例題分析)未分組數(shù)據(jù)—箱線圖(boxplot)箱線圖是由一組數(shù)據(jù)的最大值、最小值、中位數(shù)、兩個(gè)四分位數(shù)這五個(gè)特征值繪制而成的,它主要反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較,它由一個(gè)箱子和兩條線段組成。繪制方法:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me
和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接,中位數(shù)在箱子中間。未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖
(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的箱線圖分布的形狀與箱線圖
對(duì)稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖U形分布QL
中位數(shù)
QU未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例3.7】
從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績(jī)的比較箱線圖,并分析各科考試成績(jī)的分布特征11名學(xué)生各科的考試成績(jī)數(shù)據(jù)課程名稱學(xué)生編號(hào)1234567891011英語(yǔ)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營(yíng)銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)8門課程考試成績(jī)的箱線圖11名學(xué)生8門課程考試成績(jī)的箱線圖Min-Max25%-75%Medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)時(shí)間序列數(shù)據(jù)—線圖(lineplot)對(duì)于時(shí)間序列數(shù)據(jù),可以繪制線圖,主要用于反映現(xiàn)象隨時(shí)間變化的特征。繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,觀測(cè)值繪在縱軸圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開(kāi)始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷時(shí)間序列數(shù)據(jù)—線圖
(例題分析)【例3.8】已知1991~2003年我國(guó)城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖¥
$
年份城鎮(zhèn)居民農(nóng)村居民19911700.6708.619922026.6784.019932577.4921.619943496.21221.019954283.01577.719964838.91926.119975160.32091.119985425.12162.019995854.02210.320006280.02254.420016859.62366.420027702.82475.620038472.22622.2時(shí)間序列數(shù)據(jù)—線圖
(例題分析)用Excel制作線圖
散點(diǎn)圖是用二維坐標(biāo)展示兩個(gè)變量之間關(guān)系的一種圖形。它是用坐標(biāo)橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi,yi)在坐標(biāo)系中用一個(gè)點(diǎn)來(lái)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個(gè)點(diǎn)稱為散點(diǎn),由坐標(biāo)及散點(diǎn)形成的二維數(shù)據(jù)圖稱為散點(diǎn)圖。如下面的例子。多變量數(shù)據(jù)的圖示—散點(diǎn)圖【例3.9】小麥的單位面積產(chǎn)量與降雨量和溫度等有一定關(guān)系。為了解它們之間的關(guān)系形態(tài),收集到如下數(shù)據(jù)。繪制小麥產(chǎn)量與降雨量的散點(diǎn)圖,并分析它們之間的關(guān)系。多變量數(shù)據(jù)的圖示—散點(diǎn)圖小麥產(chǎn)量與降雨量和溫度的數(shù)據(jù)溫度(℃)降雨量(mm)產(chǎn)量(kg/hm2)62522508403450105845001368575014110580016987500211208250多變量數(shù)據(jù)的圖示—散點(diǎn)圖用Excel制作散點(diǎn)圖
氣泡圖是用于展示三個(gè)變量之間的關(guān)系。它與散點(diǎn)圖類似,繪制時(shí)將一個(gè)變量放在橫軸,另一個(gè)變量放在縱軸,而第三個(gè)變量則用氣泡的大小來(lái)表示。多變量數(shù)據(jù)的圖示—?dú)馀輬D用Excel制作氣泡圖
雷達(dá)圖是顯示多個(gè)變量的常用圖示方法,也稱為蜘蛛圖。設(shè)有n組樣本S1,S2,…,Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2,…,Xp,要繪制這P個(gè)變量的雷達(dá)圖。繪制方法:1.先做一個(gè)圓,然后將圓P等分,得到P個(gè)點(diǎn),令這P個(gè)點(diǎn)分別對(duì)應(yīng)P個(gè)變量,在將這P個(gè)點(diǎn)與圓心連線,得到P個(gè)幅射狀的半徑,這P個(gè)半徑分別作為P個(gè)變量的坐標(biāo)軸,每個(gè)變量值的大小由半徑上的點(diǎn)到圓心的距離表示
2.再將同一樣本的值在P個(gè)坐標(biāo)上的點(diǎn)連線。這樣,n個(gè)樣本形成的n個(gè)多邊形就是一個(gè)雷達(dá)圖。多變量數(shù)據(jù)—雷達(dá)圖(radarchart)多變量數(shù)據(jù)—雷達(dá)圖
(例題分析)【例3.10】2003年我國(guó)城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖。今天的主食是面包2003年城鄉(xiāng)居民家庭平均每人生活消費(fèi)支出構(gòu)成(%)項(xiàng)目城鎮(zhèn)居民農(nóng)村居民食品37.1245.59衣著9.795.67家庭設(shè)備用品及服務(wù)6.304.20醫(yī)療保健7.315.96交通通訊11.088.36娛樂(lè)教育文化服務(wù)14.3512.13居住10.7415.87雜項(xiàng)商品與服務(wù)3.302.21多變量數(shù)據(jù)—雷達(dá)圖
(例題分析)用Excel制作雷達(dá)圖
數(shù)據(jù)類型及圖示
(小結(jié))數(shù)據(jù)類型品質(zhì)數(shù)據(jù)數(shù)值型數(shù)據(jù)匯總表原始數(shù)據(jù)分組數(shù)據(jù)時(shí)序數(shù)據(jù)多變量數(shù)據(jù)條形圖餅圖環(huán)形圖莖葉圖箱線圖直方圖線圖散點(diǎn)圖氣泡圖雷達(dá)圖§2.4合理使用圖表3.4.1鑒別圖形優(yōu)劣的準(zhǔn)則3.4.2統(tǒng)計(jì)表的設(shè)計(jì)鑒別圖形優(yōu)劣的準(zhǔn)則一張精心設(shè)計(jì)的圖形是展示數(shù)據(jù)的最有效工具,精心設(shè)計(jì)的圖形可以準(zhǔn)確表達(dá)數(shù)據(jù)所要傳遞的信息。在設(shè)計(jì)圖形時(shí),應(yīng)繪制得盡可能簡(jiǎn)潔,以能夠清晰地顯示數(shù)據(jù)、合理地表達(dá)統(tǒng)計(jì)目的為依據(jù)在繪制圖形時(shí),應(yīng)避免一切不必要的修飾,過(guò)于花哨的修飾往往會(huì)使人注重圖形本身,而掩蓋了圖形所要表達(dá)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年黑龍江c1客運(yùn)資格證模擬考試題下載什么軟件
- 2024年徐州辦理客運(yùn)從業(yè)資格證考試題和答案
- 吉首大學(xué)《律師法學(xué)》2021-2022學(xué)年期末試卷
- 吉首大學(xué)《電子商務(wù)物流管理》2021-2022學(xué)年第一學(xué)期期末試卷
- 《機(jī)加工藝方案設(shè)計(jì)與實(shí)施》考試卷及答案
- 吉林藝術(shù)學(xué)院《影視特效合成》2021-2022學(xué)年第一學(xué)期期末試卷
- 吉林藝術(shù)學(xué)院《視覺(jué)藝術(shù)機(jī)構(gòu)管理》2021-2022學(xué)年第一學(xué)期期末試卷
- 酒吧裝修保密協(xié)議書范本模板
- 2024年供暖系統(tǒng)承攬合同范本
- 吉林師范大學(xué)《中國(guó)傳統(tǒng)文化概論》2021-2022學(xué)年第一學(xué)期期末試卷
- 塑料制品的品質(zhì)管控與問(wèn)題解決
- 屋頂分布式光伏發(fā)電施工組織設(shè)計(jì)
- 建設(shè)施工企業(yè)法律知識(shí)講座
- 家政服務(wù)標(biāo)準(zhǔn)化建設(shè)
- 創(chuàng)意椅子資料
- xxx小學(xué)四年級(jí)語(yǔ)文上期中質(zhì)量分析總結(jié)
- 2023-2024學(xué)年北京中學(xué)七年級(jí)(上)期中數(shù)學(xué)試卷
- 【數(shù)學(xué)】廣東省深圳市龍崗區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期中試題(解析版)
- 2024屆高考語(yǔ)文復(fù)習(xí)- 高考作文必備素材(人物篇)
- 少數(shù)民族阿昌族民俗文化科普介紹教學(xué)課件
- JGJT178-2009 補(bǔ)償收縮混凝土應(yīng)用技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論