統(tǒng)計數(shù)據(jù)的整理和顯示_第1頁
統(tǒng)計數(shù)據(jù)的整理和顯示_第2頁
統(tǒng)計數(shù)據(jù)的整理和顯示_第3頁
統(tǒng)計數(shù)據(jù)的整理和顯示_第4頁
統(tǒng)計數(shù)據(jù)的整理和顯示_第5頁
已閱讀5頁,還剩86頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)Statistics

第三章統(tǒng)計數(shù)據(jù)的整理與顯示第一節(jié)數(shù)據(jù)資料整理的意義與程序

第二節(jié)品質(zhì)數(shù)據(jù)的整理與顯示

第三節(jié)數(shù)值數(shù)據(jù)的整理與顯示

第四節(jié)統(tǒng)計表★統(tǒng)計整理統(tǒng)計調(diào)查客觀現(xiàn)象數(shù)量表現(xiàn)統(tǒng)計總體數(shù)量特征統(tǒng)計研究的程序統(tǒng)計研究目的統(tǒng)計設(shè)計推斷分析描述分析學(xué)習(xí)目標(biāo)了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的掌握分類和順序數(shù)據(jù)的整理與顯示方法掌握數(shù)值型數(shù)據(jù)的整理與顯示方法合理使用統(tǒng)計表一、數(shù)據(jù)資料整理的意義

★統(tǒng)計整理將統(tǒng)計調(diào)查得到的原始資料進行科學(xué)的分組和匯總形成綜合統(tǒng)計資料的工作過程統(tǒng)計調(diào)查的繼續(xù),統(tǒng)計分析的前提和根底意義和地位統(tǒng)計整理是積累歷史資料的必要手段數(shù)據(jù)整理是對調(diào)查資料進行科學(xué)加工,使之系統(tǒng)化,成為說明總體特征的綜合資料分類數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調(diào)查。調(diào)查員在某天對50名顧客購置飲料的品牌進行了記錄,如果一個顧客購置某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)

用Excel制作頻數(shù)分布表綠色健康飲品編制等距數(shù)列適用于總體單位的標(biāo)志值變動比較均勻的情況實例己知某地區(qū)某年50個商店商品銷售額的資料如下〔單位:百萬元〕:7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求編制組距數(shù)列。二、數(shù)據(jù)資料整理的內(nèi)容和程序統(tǒng)計數(shù)據(jù)的處理:

統(tǒng)計資料的分組、匯總及制表統(tǒng)計數(shù)據(jù)的管理:

數(shù)據(jù)的傳輸、貯存、更新及輸出整理的內(nèi)容設(shè)計制定數(shù)據(jù)整理方案對原始資料進行審核數(shù)據(jù)處理(篩選、排序〕制作統(tǒng)計表或統(tǒng)計圖

統(tǒng)計整理的步驟數(shù)據(jù)資料審核

第一,統(tǒng)計資料的完備性檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查工程或指標(biāo)是否填寫齊全數(shù)據(jù)審核內(nèi)容原始數(shù)據(jù)(rawdata)審核第二,統(tǒng)計資料的及時性第三,統(tǒng)計資料的準(zhǔn)確性從理論上或常識上檢查資料是否有悖常理、有無不切實際或不符合邏輯的地方。工程之間有無相互矛盾檢查各項指標(biāo)的計算口徑、計量單位是否符合實際符合規(guī)定,檢查各指標(biāo)間的數(shù)字是否相互銜接計算是否正確。數(shù)據(jù)審核內(nèi)容邏輯檢查計算檢查

二手?jǐn)?shù)據(jù)(secondhanddata)審核適用性審核

弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料

確定數(shù)據(jù)是否符合自己分析研究的需要

時效性審核*

盡可能使用最新的數(shù)據(jù)

確認(rèn)是否有必要做進一步的加工整理

數(shù)據(jù)的篩選對審核過程中發(fā)現(xiàn)的錯誤應(yīng)盡可能予以糾正當(dāng)發(fā)現(xiàn)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內(nèi)容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔出數(shù)據(jù)排序

按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成數(shù)據(jù)排序方法

分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)

三、數(shù)據(jù)分組與頻數(shù)分布

將總體中所有單位按一定的標(biāo)志分為性質(zhì)不同但又有聯(lián)系的若干部分的過程統(tǒng)計分組統(tǒng)計分組的作用:總體經(jīng)過分組,能夠突出組與組之間的差異而抽象掉組內(nèi)各單位之間的差異,使數(shù)據(jù)變得條理化,便于進一步分析研究。劃分社會經(jīng)濟現(xiàn)象的類型反映社會經(jīng)濟現(xiàn)象的內(nèi)部結(jié)構(gòu)和比例關(guān)系揭示社會經(jīng)濟現(xiàn)象之間的相互依存關(guān)系選擇分組標(biāo)志確定分組體系總體單位歸類科學(xué)性:組間差異大,組內(nèi)差異小。完備性和互斥性:每個單位均能且只能歸到某個組中。統(tǒng)計分組的程序與原那么對大學(xué)生月生活費支出情況進行分組研究:按家庭收入水平分組;按城鄉(xiāng)分組;按性別分組;按年齡分組。?統(tǒng)計分組的程序與原那么對父母親下崗情況進行分組研究:單親下崗;雙親下崗;雙親在崗。不符合科學(xué)性不符合完備性和互斥性城鄉(xiāng)區(qū)別離退休是否健在?統(tǒng)計分組的程序與原那么分組體系指同時使用兩個以上標(biāo)志分組時,分組標(biāo)志的組合形式。各分組標(biāo)志并列使用各分組標(biāo)志交叉結(jié)合使用平行分組體系交叉分組體系平行分組體系對教師的分類按性別分類男性女性按職稱分類按年齡分類高級中級初級青年中年共計7組2+3+2復(fù)合分組體系按性別分類按職稱分類按年齡分類男女高級中級初級青年中年共計12組2×3×2對教師的分類

第三章統(tǒng)計數(shù)據(jù)的整理與顯示★第一節(jié)數(shù)據(jù)資料整理的意義與程序第二節(jié)

品質(zhì)數(shù)據(jù)的整理與顯示第三節(jié)數(shù)值數(shù)據(jù)的整理與顯示

第四節(jié)統(tǒng)計表★分類數(shù)據(jù)的整理與圖示分類數(shù)據(jù)的整理〔根本過程〕1. 列出各類別

2.計算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE分類數(shù)據(jù)的整理〔可計算的統(tǒng)計量〕頻數(shù)(frequency):落在各類別中的數(shù)據(jù)個數(shù)比例(proportion):某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比(percentage):將比照的基數(shù)作為100而計算的比值比率(ratio):不同類別數(shù)值的比值分類數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調(diào)查。調(diào)查員在某天對50名顧客購置飲料的品牌進行了記錄,如果一個顧客購置某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)

用Excel制作頻數(shù)分布表綠色健康飲品分類數(shù)據(jù)的圖示—條形圖用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(barChart)分類數(shù)據(jù)的圖示—條形圖

(例題分析)分類數(shù)據(jù)的圖示—餅圖

也稱圓形圖,是用圓形及圓內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成局部所占的比例,對于研究結(jié)構(gòu)性問題十分有用繪制圓形圖時,總體中各局部所占的百分比用圓內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各局部數(shù)據(jù)百分比占3600的相應(yīng)比例確定的(pieChart)分類數(shù)據(jù)的圖示—餅圖

(例題分析)定序數(shù)據(jù)的整理與圖示定序數(shù)據(jù)的整理

(可計算的統(tǒng)計量)1.累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加2.累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加

順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調(diào)查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意2.不滿意3.一般4.滿意5.非常滿意。甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530

836311510

24132225270300

8.044.075.090.0100.03002761687530100.092562510合計300100.0————順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)乙城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計300100.0————順序數(shù)據(jù)的圖示—累計頻數(shù)分布圖

(例題分析)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對住房狀況評價的累積頻數(shù)分布環(huán)形圖

(annularchart)環(huán)形圖中間有一個“空洞〞,總體中的每一局部數(shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各局部所占的比例環(huán)形圖那么可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究環(huán)形圖主要用于展示分類和順序數(shù)據(jù)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

圖3-4甲乙兩城市家庭對住房狀況的評價數(shù)值型數(shù)據(jù)的整理與圖示

〔定距數(shù)據(jù)與定比數(shù)據(jù)〕變量數(shù)列品質(zhì)數(shù)列將總體各單位按某個標(biāo)志分成若干組,列出各組的總體單位數(shù)或各組在總體中所占的比重而形成的數(shù)列分布數(shù)列分類分組標(biāo)志的具體表現(xiàn)各組的次數(shù)或頻率構(gòu)成要素異距數(shù)列等距數(shù)列組距數(shù)列單值數(shù)列單值數(shù)列指每個組值只用一個具體的變量值表現(xiàn)的數(shù)列同時具備變量數(shù)列的編制變量是離散變量變量的不同取值個數(shù)較少編制條件:【例】己知某車間有24名工人,他們的日產(chǎn)量〔件〕分別是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根據(jù)以上資料編制變量數(shù)列。日產(chǎn)量(件)X工人數(shù)(人)f202122232425263564321合計24編制結(jié)果如下:組距數(shù)列指每個組的變量值用一個區(qū)間來表現(xiàn)的變量數(shù)列變量數(shù)列的編制變量是連續(xù)變量;或:總體單位數(shù)較多變量不同取值個數(shù)也較多的離散變量。

編制條件:變量值變動區(qū)間的長度相等變量值變動區(qū)間的長度不完全相等等距數(shù)列異距數(shù)列相關(guān)概念指每組兩端表示各組界限的變量值,各組的最小值為下限(lowlimit)

,最大值為上限(upperlimit)

組限每組變量值變動區(qū)間的長度,為上下限之差組距每組變量取值范圍的中點數(shù)值組中值組中值=(ClassWidth)(classmidpoint)某地區(qū)100個百貨商店月銷售額與流通費用情況銷售額(萬元)商店數(shù)(個)每百元商品銷售額中支付的流通費(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上組限U下組限L如:組距d=U-L=100-50=50〔萬元〕如:組中值x=(U+L)/2=(100+200)/2=150〔萬元〕開口組距數(shù)列組中值的計算:

首組假定下限=首組上限-相鄰組組距末組假定上限=末組下限+相鄰組組距先計算開口組的假定上、下限:

因此有:首組組中值末組組中值編制等距數(shù)列適用于總體單位的標(biāo)志值變動比較均勻的情況實例己知某地區(qū)某年50個商店商品銷售額的資料如下〔單位:百萬元〕:7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求編制組距數(shù)列。編制步驟:⒈求變異全距⒉確定組距及組數(shù)確定組距的原則:要能區(qū)分各組的性質(zhì)差異要能反映總體資料的分布特征為方便計算,盡可能為5或10的整數(shù)倍R≤組距(d)×組數(shù)〔m)編制等距數(shù)列計算組數(shù)〔組數(shù)不宜過多,也不宜太少〕上例中,取d=5,那么有編制等距數(shù)列(當(dāng)?shù)慕Y(jié)果為整數(shù)時)(當(dāng)?shù)慕Y(jié)果為小數(shù)時)組數(shù)確實定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按Sturges提出的經(jīng)驗公式來確定組數(shù)K組距分組

〔要點〕將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏〞的原那么可采用等距分組,也可采用不等距分組~~~~~⒊確定組限對于離散變量,相鄰組組限可以間斷,也可重疊;對于連續(xù)變量,相鄰組組限必須重疊;符合“上組限不計入”原則;首末兩組可使用“××以下”及“××以上”的開口組。組限的表示方法編制等距數(shù)列等距分組表

〔上下組限重疊〕表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100等距分組表

〔上下組限間斷離散變量〕表3-6某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計50100等距分組表

〔使用開口組〕表3-7某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合計50100統(tǒng)計圖以點、線條、面積等方法描述、顯示統(tǒng)計數(shù)據(jù)的形式具有直觀、醒目、易于理解等特點組成:坐標(biāo)系圖形圖例單式圖復(fù)合圖疊加圖一個圖只用來顯示一種現(xiàn)象的數(shù)量特征用一個圖同時顯示幾種數(shù)量的分布或變化情況幾種常用的統(tǒng)計圖條形圖(Bar)用于顯示離散型變量的次數(shù)分布幾種常用的統(tǒng)計圖條形圖〔Bar〕用于顯示離散型變量的次數(shù)分布幾種常用的統(tǒng)計圖條形圖〔Bar〕用于顯示離散型變量的次數(shù)分布條形圖〔Bar〕用于顯示離散型變量的次數(shù)分布直方圖(

Histogram

)用于顯示連續(xù)型變量的次數(shù)分布直方圖條形圖圓形圖(餅圖

Pie

)用于顯示定類變量的次數(shù)分布線圖(Line)主要用于顯示連續(xù)型變量的次數(shù)分布和現(xiàn)象的動態(tài)變化散點圖(Scatter)主要用來觀察變量間的相關(guān)關(guān)系,也可顯示數(shù)量隨時間的變化情況數(shù)值型數(shù)據(jù)的圖示

用Excel作圖以下圖形均由計算機繪制!ExcelSTATISTICA分組數(shù)據(jù)—直方圖

〔直方圖的繪制〕頻數(shù)(人)1512963日加工零件數(shù)(個)圖3-5某車間工人日加工零件數(shù)的直方圖我一眼就看出來了,大多數(shù)人的日加工零件數(shù)在120~125之間!分組數(shù)據(jù)—直方圖

〔直方圖與條形圖的區(qū)別〕條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)那么是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度那么表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖那么是分開排列分組數(shù)據(jù)—折線圖

〔折線圖的制作〕折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)是在直方圖的根底上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點〔即該組頻數(shù)一半的位置〕連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的1512963105110115120125130135140日加工零件數(shù)(個)頻數(shù)(人)折線圖下的面積與直方圖的面積相等!分組數(shù)據(jù)—折線圖

〔折線圖的繪制〕圖3-6某車間工人日加工零件數(shù)的折線圖未分組數(shù)據(jù)—箱線圖

〔箱線圖的制作〕用于顯示未分組的原始數(shù)據(jù)或分組數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU〕連接兩個四分〔位〕數(shù)畫出箱子,再將兩個極值點與箱子相連接未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖

〔箱線圖的構(gòu)成〕中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖分布的形狀與箱線圖

對稱分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖

〔實例〕【例】從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征表11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟數(shù)學(xué)西方經(jīng)濟學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算機應(yīng)用基礎(chǔ)7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608781678691837776907082838292848170697278757

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論