統(tǒng)計學(xué)數(shù)據(jù)圖表展示_第1頁
統(tǒng)計學(xué)數(shù)據(jù)圖表展示_第2頁
統(tǒng)計學(xué)數(shù)據(jù)圖表展示_第3頁
統(tǒng)計學(xué)數(shù)據(jù)圖表展示_第4頁
統(tǒng)計學(xué)數(shù)據(jù)圖表展示_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于統(tǒng)計學(xué)數(shù)據(jù)的圖表展示第一張,PPT共一百零三頁,創(chuàng)作于2022年6月學(xué)習(xí)目標(biāo)了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的掌握分類和順序數(shù)據(jù)的整理與顯示方法掌握數(shù)值型數(shù)據(jù)的整理與顯示方法用Excel作頻數(shù)分布表和圖形合理使用圖表第二張,PPT共一百零三頁,創(chuàng)作于2022年6月 重點(diǎn) 1.分類、順序、數(shù)值型數(shù)據(jù)的整理 2.分類、順序、數(shù)值型數(shù)據(jù)的展示方法 難點(diǎn)利用Excel做頻數(shù)分布表和形圖和合理使用統(tǒng)計表 本章教學(xué)重點(diǎn)與難點(diǎn)第三張,PPT共一百零三頁,創(chuàng)作于2022年6月3.1 數(shù)據(jù)的預(yù)處理3.1.1 數(shù)據(jù)審核3.1.2 數(shù)據(jù)篩選3.1.3 數(shù)據(jù)排序3.1.4 數(shù)據(jù)透視表第四張,PPT共一百零三頁,創(chuàng)作于20

2、22年6月數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核檢查數(shù)據(jù)中的錯誤數(shù)據(jù)篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征數(shù)據(jù)透視按需要匯總第五張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)審核第六張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)審核原始數(shù)據(jù)(raw data)完整性審核應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或變量是否填寫齊全準(zhǔn)確性審核數(shù)據(jù)是否真實反映實際情況,內(nèi)容是否符合實際數(shù)據(jù)是否有錯誤,計算是否正確等第七張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)的審核二手?jǐn)?shù)據(jù)(second hand data)適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析

3、研究的需要時效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)是否有必要做進(jìn)一步的加工整理第八張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)篩選與排序第九張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)篩選(data filter)當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時,需要對數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除第十張,PPT共一百零三頁,創(chuàng)作于2022年6月用Excel進(jìn)行數(shù)據(jù)篩選 8名學(xué)生的考試成績數(shù)據(jù) 數(shù)據(jù)篩選(data filter)第十一張,PPT共一百零三頁,創(chuàng)作于

4、2022年6月數(shù)據(jù)排序 (data rank)按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機(jī)完成第十二張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)排序 (方法)分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分2. 數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,xn,遞增排序后可表示為:x(1)x(2)x(2)x(n)第十三張,PPT共一百零三頁,創(chuàng)作于202

5、2年6月數(shù)據(jù)透視表第十四張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)透視表(pivot table )可以從復(fù)雜的數(shù)據(jù)中提取有用的信息可以對數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進(jìn)行匯總和作圖形成一個符合需要的交叉表(列聯(lián)表)在利用數(shù)據(jù)透視表時,數(shù)據(jù)源表中的首行必須有列標(biāo)題第十五張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)透視表(用Excel創(chuàng)建數(shù)據(jù)透視表)第1步:在Excel工作表中建立數(shù)據(jù)清單第2步:選中數(shù)據(jù)清單中的任意單元格,并選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第3步:確定數(shù)據(jù)源區(qū)域第4步:在【向?qū)?步驟之3】中選擇數(shù)據(jù)透視表的輸出位置。然后選擇【布局】第5步:在【

6、向?qū)Р季帧繉υ捒蛑?,依次將”分類變量“拖至左邊的“行”區(qū)域,上邊的“列”區(qū)域,將需要匯總的“變量” 拖至“數(shù)據(jù)區(qū)域”第6步:然后單擊【確定】,自動返回【向?qū)?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表 第十六張,PPT共一百零三頁,創(chuàng)作于2022年6月3.2 品質(zhì)數(shù)據(jù)的整理與展示3.2.1 分類數(shù)據(jù)的整理與圖示3.2.2 順序數(shù)據(jù)的整理與圖示第十七張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)的整理與顯示(基本問題)要弄清所面對的數(shù)據(jù)類型不同類型的數(shù)據(jù),采取不同的處理方式和方法對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合

7、于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)第十八張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的整理與圖示第十九張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的整理(基本過程)1.列出各類別2.計算各類別的頻數(shù)3. 制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE第二十張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的整理(可計算的統(tǒng)計量)頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個數(shù)比例(proportion) :某一類別數(shù)據(jù)個數(shù)占全部數(shù)據(jù)個數(shù)的比值百分比(percentage) :將對比的基數(shù)作為100而計算的比值比率(r

8、atio) :不同類別數(shù)值個數(shù)的比值第二十一張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)整理頻數(shù)分布表 (例題分析)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次 。右邊就是記錄的原始數(shù)據(jù)用Excel制作頻數(shù)分布表綠色健康飲品第二十二張,PPT共一百零三頁,創(chuàng)作于2022年6月使用Excel數(shù)據(jù)透視表數(shù)計數(shù) (pivot table)第1步:選擇【數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第2步:確定數(shù)據(jù)源區(qū)域第3步:在【向?qū)?步驟之3】

9、中選擇數(shù)據(jù)透視表的輸出位置。然后選擇【布局】第4步:在【向?qū)Р季帧繉υ捒蛑校来螌ⅰ胺诸愖兞俊?這里是飲料類型)連續(xù)拖放兩次:一次拖至左邊的“行”區(qū)域 ,一次拖至 “數(shù)據(jù)”區(qū)域,將“顧客性別”拖至 “列”區(qū)域第5步:然后單擊【確定】,自動返回【向?qū)?步驟之3】對話框。然后單擊【完成】,即可輸出數(shù)據(jù)透視表第二十三張,PPT共一百零三頁,創(chuàng)作于2022年6月生成頻數(shù)分布表(定性數(shù)據(jù))不同類型飲料的頻數(shù)分布 第二十四張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示條形圖(bar Chart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)

10、的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(column chart) 第二十五張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示條形圖(例題分析)第二十六張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示對比條形圖(side-by-side bar chart )分類變量在不同時間或不同空間上有多個取值對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688第二十七張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示對比條形圖 (例題分析)第二十八張,

11、PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示帕累托圖(pareto chart)按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖 主要用于展示分類數(shù)據(jù)的分布第二十九張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示餅圖(pie Chart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題繪制圓形圖時,樣本或總體中各部分所占的百分比用圓內(nèi)的各個扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比乘以3600確定第三十張,PPT共一百零三頁,創(chuàng)作于2022年6月分類數(shù)據(jù)的圖示餅圖 (例題分析)第三十一張,PPT共

12、一百零三頁,創(chuàng)作于2022年6月環(huán)形圖(doughnut chart)環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個樣本或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán)用于結(jié)構(gòu)比較研究 第三十二張,PPT共一百零三頁,創(chuàng)作于2022年6月環(huán)形圖(doughnut chart)【例】2006年北京、上海和天津地區(qū)按收入法計算的地區(qū)生產(chǎn)總值(按當(dāng)年價格計算)數(shù)據(jù)。繪制環(huán)形圖比較三個地區(qū)的生產(chǎn)總值構(gòu)成 第三十三張,PPT共一百零三頁,創(chuàng)作于2022年6月環(huán)形圖 (doughnut chart

13、)北京、上海和天津地區(qū)按收入法計算的地區(qū)生產(chǎn)總值第三十四張,PPT共一百零三頁,創(chuàng)作于2022年6月順序數(shù)據(jù)的整理與圖示第三十五張,PPT共一百零三頁,創(chuàng)作于2022年6月順序數(shù)據(jù)的整理(可計算的統(tǒng)計量)1. 累積頻數(shù)(cumulative frequencies):各類別頻數(shù)的逐級累加2. 累積頻率(cumulative percentages):各類別頻率(百分比)的逐級累加 第三十六張,PPT共一百零三頁,創(chuàng)作于2022年6月順序數(shù)據(jù)的頻數(shù)分布表(例題分析)【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?”

14、1非常不滿意;2不滿意;3一般;4滿意;5非常滿意。 甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積 向下累積 戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%) 非常不滿意 不滿意 一般 滿意 非常滿意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合計300100.0第三十七張,PPT共一百零三頁,創(chuàng)作于2022年6月順序數(shù)據(jù)的頻數(shù)分布表 (例題分析)乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積

15、向下累積 戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%) 非常不滿意 不滿意 一般 滿意 非常滿意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合計300100.0第三十八張,PPT共一百零三頁,創(chuàng)作于2022年6月順序數(shù)據(jù)的圖示累計頻數(shù)分布圖 (例題分析)243001322252700100200300400 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(shù)(戶)(a)向上累積276168303007501002003004

16、00 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對住房狀況評價的累積頻數(shù)分布第三十九張,PPT共一百零三頁,創(chuàng)作于2022年6月環(huán)形圖 (例題分析)8%36%31%15%7%33%26%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 甲乙兩城市家庭對住房狀況的評價第四十張,PPT共一百零三頁,創(chuàng)作于2022年6月3.3 數(shù)值型數(shù)據(jù)的整理與展示3.3.1 數(shù)據(jù)分組3.3.2 數(shù)值型數(shù)據(jù)的圖示第四十一張,PPT共一百零三頁,創(chuàng)作于2022年6月一、數(shù)據(jù)分組第四十二張,PPT共一百零三頁,創(chuàng)作于2022年6月分組方法分組方法等距分組異距分組單變量值分

17、組組距分組第四十三張,PPT共一百零三頁,創(chuàng)作于2022年6月單變量值分組(要點(diǎn))1. 將一個變量值作為一組2. 適合于離散變量3. 適合于變量值較少的情況第四十四張,PPT共一百零三頁,創(chuàng)作于2022年6月組距分組 (要點(diǎn))將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組 第四十五張,PPT共一百零三頁,創(chuàng)作于2022年6月組距分組的步驟1.將原始數(shù)據(jù)進(jìn)行排序2.確定組數(shù)3.確定各組的組距4.確定各組的組限5.統(tǒng)計出各組的頻數(shù)下面舉例說明。第四十六張,PPT共一百零三頁,創(chuàng)作于2022年6月確定組數(shù)1、分組的目的之一是

18、為了觀察數(shù)據(jù)的特征和規(guī)律。2、組數(shù)的多少應(yīng)適中。不宜過多也不宜過少,一般 515 組3、組數(shù)的確定,應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。第四十七張,PPT共一百零三頁,創(chuàng)作于2022年6月第四十八張,PPT共一百零三頁,創(chuàng)作于2022年6月確定各組組距組限:一個組的最小值稱為“下限”;一個組的最大值稱為“上限”。組距:是一個組的上限與下限之差。=(全部數(shù)據(jù)的最大值-全部數(shù)據(jù)的最小值)組數(shù)通常,組距宜取5或10的倍數(shù),且第一組的下限應(yīng)小于最小變量值,最后一組的上限要大于最大的變量值。第四十九張,PPT共一百零三頁,創(chuàng)作于2022年6月組距分組應(yīng)注意的問題一定要遵循“不重不漏”的原則。解決“不

19、重”的問題,連續(xù)型變量的各相鄰組的組限必須重疊,習(xí)慣上規(guī)定“上組限不在內(nèi)”。當(dāng)一組數(shù)據(jù)懸殊較大時,為避免出現(xiàn)空白組或極個別極端值被遺漏,一般應(yīng)采用“以下”及“以上”,稱謂開口組。第五十張,PPT共一百零三頁,創(chuàng)作于2022年6月組距分組(幾個概念)1. 下限(lower limit) :一個組的最小值2. 上限(upper limit) :一個組的最大值3. 組距(class width) :上限與下限之差4. 組中值(class midpoint) :下限與上限之間的中點(diǎn)值下限值+上限值2組中值 =第五十一張,PPT共一百零三頁,創(chuàng)作于2022年6月頻數(shù)分布表的編制(例題分析)【例】某電腦公

20、司2005年前四個月各天的銷售量數(shù)據(jù)(單位:臺)。試對數(shù)據(jù)進(jìn)行分組第五十二張,PPT共一百零三頁,創(chuàng)作于2022年6月頻數(shù)分布表的編制(步驟)1.確定組數(shù):根據(jù) Sturges 提出的經(jīng)驗公式得組數(shù)K為:確定各組的組距: 組距( 237 - 141) 10=9.6 10統(tǒng)計出各組的頻數(shù)。每個組的數(shù)據(jù)滿足a xb(上限值不在內(nèi))第五十三張,PPT共一百零三頁,創(chuàng)作于2022年6月等距分組表(上下組限重疊)第五十四張,PPT共一百零三頁,創(chuàng)作于2022年6月等距分組表(上下組限間斷)第五十五張,PPT共一百零三頁,創(chuàng)作于2022年6月等距分組表(使用開口組)第五十六張,PPT共一百零三頁,創(chuàng)作于2

21、022年6月統(tǒng)計函數(shù)創(chuàng)建頻數(shù)分布表(FREQUENCY)使用統(tǒng)計函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖可解決這一問題。具體步驟是1、選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域2、選擇統(tǒng)計函數(shù)中的【FREQUENCY】函數(shù)3、在對話框【Date-array】后輸入數(shù)據(jù)區(qū)域,在【Bins-array】后輸入接受區(qū)域4、同時按下“ctrl-shift-Enter”組合鍵,即得到頻數(shù)分布第五十七張,PPT共一百零三頁,創(chuàng)作于2022年6月利用工具菜單中的【直方圖】創(chuàng)建頻數(shù)分布表利用工具菜單中的【直方圖】來創(chuàng)建頻數(shù)分布表的步驟:第 1步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】

22、項第 2步:在【數(shù)據(jù)分析】項對話框中選擇【直方圖】命令第3步:當(dāng)出現(xiàn)對話框時: 在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)區(qū)域 在【接收區(qū)域】方框內(nèi)鍵入創(chuàng)建分組的上限值區(qū)域 在【輸出區(qū)域】方框內(nèi)鍵入結(jié)果輸出的區(qū)域第五十八張,PPT共一百零三頁,創(chuàng)作于2022年6月二、數(shù)值型數(shù)據(jù)的圖示Excel分組數(shù)據(jù)直方圖和折線圖未分組數(shù)據(jù)莖葉圖和箱線圖時間序列數(shù)據(jù)線圖多變量數(shù)據(jù)的圖示第五十九張,PPT共一百零三頁,創(chuàng)作于2022年6月分組數(shù)據(jù)直方圖(histogram)用于展示分組數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組

23、與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖第六十張,PPT共一百零三頁,創(chuàng)作于2022年6月分組數(shù)據(jù)的圖示(直方圖的繪制)140150210某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240第六十一張,PPT共一百零三頁,創(chuàng)作于2022年6月分組數(shù)據(jù)直方圖(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是

24、連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)第六十二張,PPT共一百零三頁,創(chuàng)作于2022年6月分組數(shù)據(jù)折線圖(frequency polygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點(diǎn)要與橫軸相交,具體的做法是第一個矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的第六十三張,PPT共一百零三頁,創(chuàng)作于2022年6月分組數(shù)據(jù)的圖示(折線圖的繪制)折

25、線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530第六十四張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)值型數(shù)據(jù)的圖示STATISTICA未分組數(shù)據(jù)莖葉圖和箱線圖第六十五張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)莖葉圖(stem-and-leaf display)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出

26、具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)第六十六張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)莖葉圖(例題分析)某電腦公司銷售量分布的莖葉圖第六十七張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)箱線圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分位數(shù)畫出箱子,再將兩個極值點(diǎn)與箱子相連接該箱線圖也稱為Med

27、ian/Quart./Range箱線圖 第六十八張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖第六十九張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140 150 160 170 180 190 200 210 220 230 240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Rang箱線圖第七十張,PPT共一百零三頁,創(chuàng)作于2022年6月分布的形狀與箱線圖

28、 不同分布的箱線圖左偏分布Q L中位數(shù) QULeft-skewed distribution右偏分布QL 中位數(shù) QURight-skewed distribution對稱分布QL中位數(shù) QUBell-shaped distribution第七十一張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)【例】 從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財

29、務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177第七十二張,PPT共一百零三頁,創(chuàng)作于2022年6月未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖(例題分析Median/Quart./Range)8門課程考試成績的Median/Quart./Range箱線圖第七十三張,PPT共一百

30、零三頁,創(chuàng)作于2022年6月11名學(xué)生8門課程考試成績的Median/Quart./Range箱線圖min-max25%-75%median value455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析Median/Quart./Range)第七十四張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)值型數(shù)據(jù)的圖示時間序列數(shù)據(jù)線圖Excel第七十五張,PPT共一百零三頁,創(chuàng)作于2022年6月時間序列數(shù)據(jù)線圖(line plot)表示時間序列數(shù)據(jù)趨勢的圖形時間一般繪在橫軸,數(shù)據(jù)繪在縱軸圖形的長寬比例大致為10 : 7

31、一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷第七十六張,PPT共一百零三頁,創(chuàng)作于2022年6月時間序列數(shù)據(jù)線圖 (例題分析)【例】我國19912003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖¥ 19912003年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民(元)農(nóng)村居民(元)19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2 7

32、08.6 784.0 921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2第七十七張,PPT共一百零三頁,創(chuàng)作于2022年6月時間序列數(shù)據(jù)線圖 (例題分析)第七十八張,PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)值型數(shù)據(jù)的圖示多變量數(shù)據(jù)的圖示Excel第七十九張,PPT共一百零三頁,創(chuàng)作于2022年6月兩個變量間的關(guān)系二維散點(diǎn)圖(2D Scatterplots)展示兩個變量之間的關(guān)系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi , yi)在坐標(biāo)系中用一個點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個點(diǎn)稱為散點(diǎn),由坐標(biāo)及其散點(diǎn)

33、形成的二維數(shù)據(jù)圖溫度 / 0C降雨量/mm產(chǎn)量/kg/hm262522508403450105845001368575014110580016987500211208250第八十張,PPT共一百零三頁,創(chuàng)作于2022年6月兩個變量間的關(guān)系二維散點(diǎn)圖(2D Scatterplots)第八十一張,PPT共一百零三頁,創(chuàng)作于2022年6月三個變量間的關(guān)系氣泡圖(bubble chart)顯示三個變量之間的關(guān)系圖中數(shù)據(jù)點(diǎn)的大小依賴于第三個變量第八十二張,PPT共一百零三頁,創(chuàng)作于2022年6月也稱為蜘蛛圖(spider chart)顯示多個變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量

34、的取值具有相同的正負(fù)號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度多變量數(shù)據(jù)雷達(dá)圖(radar chart)第八十三張,PPT共一百零三頁,創(chuàng)作于2022年6月 設(shè)有n組樣本S1,S2, , Sn,每個樣本測得P個變量X1,X2 , , XP,要繪制這P個變量的雷達(dá)圖,其具體做法是多變量數(shù)據(jù)雷達(dá)圖(雷達(dá)圖的制作) 先做一個圓,然后將圓P等分,得到P個點(diǎn),令這P個點(diǎn)分別對應(yīng)P個變量,在將這P個點(diǎn)與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標(biāo)軸,每個變量值的大小由半徑上的點(diǎn)到圓心的距離表示 將同一樣本的值在P個坐標(biāo)上的點(diǎn)連線。這樣,n個樣本形成的n個多邊

35、形就是一個雷達(dá)圖第八十四張,PPT共一百零三頁,創(chuàng)作于2022年6月多變量數(shù)據(jù)雷達(dá)圖 (例題分析)【例】2003年我國城鄉(xiāng)居民家庭平均每人各項生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖今天的主食是面包2003年城鄉(xiāng)居民家庭平均每人生活消費(fèi)支出構(gòu)成(%)項 目城鎮(zhèn)居民農(nóng)村居民 食品 衣著 家庭設(shè)備用品及服務(wù) 醫(yī)療保健 交通通訊 娛樂教育文化服務(wù) 居住 雜項商品與服務(wù)37.129.796.307.3111.0814.3510.743.30 45.595.674.205.968.3612.1315.872.21第八十五張,PPT共一百零三頁,創(chuàng)作于2022年6月多變量數(shù)據(jù)雷達(dá)圖 (例題分析)第八十六張,

36、PPT共一百零三頁,創(chuàng)作于2022年6月數(shù)據(jù)類型及圖示 (小結(jié))數(shù)據(jù)類型品質(zhì)數(shù)據(jù)數(shù)值型數(shù)據(jù)匯總表原始數(shù)據(jù)分組數(shù)據(jù)時序數(shù)據(jù)多元數(shù)據(jù)條形圖餅圖莖葉圖箱線圖直方圖折線圖線圖散點(diǎn)圖氣泡圖雷達(dá)圖環(huán)形圖第八十七張,PPT共一百零三頁,創(chuàng)作于2022年6月三、頻數(shù)分布的類型第八十八張,PPT共一百零三頁,創(chuàng)作于2022年6月次數(shù)分布的類型次數(shù)分布的類型:正態(tài)分布、偏態(tài)分布、J型分布、U型分布。第八十九張,PPT共一百零三頁,創(chuàng)作于2022年6月正態(tài)分布正態(tài)分布:是一種對稱的鐘型分布。它成“兩頭小,中間大”的形狀。有許多現(xiàn)象均服從正態(tài)分布。如農(nóng)作物的單位面積產(chǎn)量、學(xué)生的考試成績、零件的公差、纖維的強(qiáng)度等均服從正態(tài)分布。正態(tài)分布第九十張,PPT共一百零三頁,創(chuàng)作于2022年6月正偏(右偏)分布正偏分布:是相對于“正態(tài)分布”而言的,表現(xiàn)為一組數(shù)據(jù)中多數(shù)數(shù)據(jù)偏低,少數(shù)數(shù)據(jù)偏高,有極大值出現(xiàn)。此時,全部數(shù)據(jù)的均值會高于中位數(shù)。右偏分布第九十一張,PPT共一百零三頁,創(chuàng)作于2022年6月負(fù)偏(左偏)分布負(fù)偏分布:也是相對于“正態(tài)分布”而言的,表現(xiàn)為一組數(shù)據(jù)中,多數(shù)數(shù)據(jù)偏高,少數(shù)數(shù)據(jù)偏低,有極小值出現(xiàn)。此時,全部數(shù)據(jù)的均值會低于中位數(shù)左偏分布第九十二張,PPT共一百零三頁,創(chuàng)作于2022年6月正J型分布正J分布:即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論