版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章數(shù)據(jù)的表述一、數(shù)據(jù)的分類二、數(shù)據(jù)的整理三、數(shù)據(jù)的概括性度量指標(biāo)主要內(nèi)容目錄一、數(shù)據(jù)的分類(一)數(shù)據(jù)分類的原則互斥原則:每一個(gè)數(shù)據(jù)只能劃歸到某一類型中,而不能既是這一類,又是那一類。窮盡原則:所有被觀察的數(shù)據(jù)都可被歸屬到適當(dāng)?shù)念愋椭?,沒有一個(gè)數(shù)據(jù)無從歸屬。(二)數(shù)據(jù)的類型1.定性數(shù)據(jù)和定量數(shù)據(jù)定性數(shù)據(jù):用文字描述的。如消費(fèi)者對國美所提供服務(wù)的總體評價(jià)等都屬于文字描述的定性數(shù)據(jù)。定量數(shù)據(jù):用數(shù)字描述的。如企業(yè)的凈資產(chǎn)額、凈利潤額等。2.離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)類型離散型變量:數(shù)據(jù)只能取整數(shù)。如一家公司的職工人數(shù)。連續(xù)型變量的數(shù)據(jù)可以取介于兩個(gè)數(shù)值之間的任意數(shù)值。如銷售額、經(jīng)濟(jì)增長率等。
3.數(shù)據(jù)的四個(gè)等級定類數(shù)據(jù)例如,對人口按性別劃分為男性和女性兩類。也稱列名數(shù)據(jù)(分類數(shù)據(jù)),這種數(shù)據(jù)只對事物的某種屬性和類別進(jìn)行具體的定性描述。能夠進(jìn)行的唯一運(yùn)算是計(jì)數(shù),即計(jì)算每一個(gè)類型的頻數(shù)或頻率(即比重)。定序數(shù)據(jù)例如,對企業(yè)按經(jīng)營管理的水平和取得的效益劃分為一級企業(yè)、二級企業(yè)等。定序數(shù)據(jù),也稱順序數(shù)據(jù),是對事物所具有的屬性順序進(jìn)行描述。定距數(shù)據(jù)如10℃、20℃等。它不僅有明確的高低之分,而且可以計(jì)算差距,如20℃比10℃高10℃,比5℃高15℃等。也稱間距數(shù)據(jù),是比定序數(shù)據(jù)的描述功能更好一些的定量數(shù)據(jù)。定距測定的量可以進(jìn)行加或減的運(yùn)算,但卻不能進(jìn)行乘或除的運(yùn)算。定比數(shù)據(jù)如產(chǎn)量、產(chǎn)值、固定資產(chǎn)投資額、居民貨幣收入和支出、銀行存款余額等。也稱比率數(shù)據(jù),是比定距數(shù)據(jù)更高一級的定量數(shù)據(jù)。它不僅可以進(jìn)行加減運(yùn)算,而且還可以作乘除運(yùn)算。測定層次特征運(yùn)算功能舉例1.定類測定2.定序測定3.定距測定4.定比測定分類分類;排序分類;排序;有基本測量單位分類;排序;有基本測量單位;有絕對零點(diǎn)計(jì)數(shù)計(jì)數(shù);排序計(jì)數(shù);排序;加減計(jì)數(shù);排序;加減乘除產(chǎn)業(yè)分類企業(yè)等級溫度商品銷售額統(tǒng)計(jì)數(shù)據(jù)四個(gè)層次的概括
《知音漫客》問卷大調(diào)查Q1.看完《知音漫客》第五集的感覺是什么?1.非常有趣2.有點(diǎn)有趣3.一般4.有點(diǎn)無趣5.非常無趣Q2.你的性別是?1.女2.男Q3.你的年齡是?___歲Q4.平均每月購買幾本雜志?___本氣溫是什么數(shù)據(jù)?出生地呢?柔道的段位?體重?二、統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)搜集到的大量資料是分散的,不系統(tǒng)的,只能說明各個(gè)單位的特征和屬性,必須按照科學(xué)的原則加以整理,使之條理化和系統(tǒng)化,成為便于儲(chǔ)存和傳遞的、反映總體特征的數(shù)據(jù)?;締栴}要弄清所面對的數(shù)據(jù)類型不同類型的數(shù)據(jù),采取不同的處理方式和方法對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)分類數(shù)據(jù)的整理與圖示定類數(shù)據(jù)的整理
(基本過程)1. 列出各類別2.計(jì)算各類別的頻數(shù)3.制作頻數(shù)分布表4.用圖形顯示數(shù)據(jù)分類頻數(shù)比例百分比比率ABCDE定類數(shù)據(jù)的整理
(可計(jì)算的統(tǒng)計(jì)量)
SPSS中的頻數(shù)分布表頻數(shù)(Frequency):變量值落在某個(gè)區(qū)間(或某個(gè)類別)中的次數(shù)。百分比(Percent):各頻數(shù)占總樣本數(shù)的百分比。有效百分比(ValidPercent):各頻數(shù)占有效樣本數(shù)的百分比。定類數(shù)據(jù)整理—頻數(shù)分布表
(例題分析)【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)綠色健康飲品使用Excel計(jì)數(shù)函數(shù)(COUNTIF)如果只需要計(jì)算某一類別的數(shù)據(jù)個(gè)數(shù),可以使用Excel中的統(tǒng)計(jì)函數(shù)【COUNTIF】。在對話框【Range】后輸入數(shù)據(jù)區(qū)域,在【Criteria】后輸入數(shù)字、表達(dá)式、字符串等,計(jì)數(shù)單元格必須符合的條件,即可得出結(jié)果例如,我們要計(jì)算出可口可樂出現(xiàn)的頻數(shù),在【Range】后輸入A1:A50(數(shù)據(jù)所在的區(qū)域),在【Criteria】后輸入“可口可樂”,結(jié)果為15。如果數(shù)據(jù)區(qū)域是數(shù)值型數(shù)據(jù),計(jì)算符合特定條件的數(shù)據(jù)個(gè)數(shù),則可在【Criteria】后輸入“>某一數(shù)值”、“<某一數(shù)值”、“=某一數(shù)值”,等等統(tǒng)計(jì)函數(shù)—COUNTIF分類數(shù)據(jù)的圖示—條形圖
(barchart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖(columnchart)分類數(shù)據(jù)的圖示—條形圖
(例題分析)分類數(shù)據(jù)的圖示—帕雷托圖(Paretochart)按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖主要用于展示分類數(shù)據(jù)的分布分類數(shù)據(jù)的圖示—對比條形圖
(side-by-sidebarchart)分類變量在不同時(shí)間或不同空間上有多個(gè)取值對比分類變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢電腦品牌一季度二季度聯(lián)想256468IBM285397康柏247328戴爾563688分類數(shù)據(jù)的圖示—對比條形圖
(例題分析)分類數(shù)據(jù)的圖示—餅圖
(piechart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示樣本或總體中各組成部分所占的比例,用于研究結(jié)構(gòu)性問題繪制圓形圖時(shí),樣本或總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定分類數(shù)據(jù)的圖示—餅圖
(例題分析)順序數(shù)據(jù)的整理
(可計(jì)算的統(tǒng)計(jì)量)1.
累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級累加2.累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加順序數(shù)據(jù)的頻數(shù)分布表
(例題分析)【例】在一項(xiàng)城市住房問題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問題是:“您對您家庭目前的住房狀況是否滿意?”1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向下累積向上累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0————順序數(shù)據(jù)的頻數(shù)分布表
(例題分析)乙城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累積向下累積戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合計(jì)300100.0————順序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖
(例題分析)243001322252700100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(shù)(戶)(a)向上累積27616830300750100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(shù)(戶)(b)向下累積甲城市家庭對住房狀況評價(jià)的累積頻數(shù)分布環(huán)形圖
(doughnutchart)環(huán)形圖中間有一個(gè)“空洞”,樣本或總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,每一個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)用于結(jié)構(gòu)比較研究用于展示分類和順序數(shù)據(jù)環(huán)形圖
(例題分析)8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
甲乙兩城市家庭對住房狀況的評價(jià)數(shù)值型數(shù)據(jù)的整理與展示數(shù)據(jù)分組分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組
(要點(diǎn))1.
將一個(gè)變量值作為一組2.適合于離散變量3.適合于變量值較少的情況組距分組
(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~組距分組
(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),組數(shù)一般為5K15,可以按Sturges
提出的經(jīng)驗(yàn)公式確定組數(shù)K確定組距:組距(classwidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表組距分組
(幾個(gè)概念)1.下限(lowlimit):一個(gè)組的最小值2.上限(upperlimit):一個(gè)組的最大值3.組距(classwidth):上限與下限之差4.組中值(classmidpoint):下限與上限之間的中點(diǎn)值下限值+上限值2組中值=頻數(shù)分布表的編制
(例題分析)【例】表中是某電腦公司2005年前四個(gè)月各天的銷售量數(shù)據(jù)(單位:臺(tái))。試對數(shù)據(jù)進(jìn)行分組頻數(shù)分布表的編制
(步驟)確定組數(shù):根據(jù)
Sturges
提出的經(jīng)驗(yàn)公式得組數(shù)K為確定各組的組距
組距=(237-141)÷10=9.610
用Excel制作頻數(shù)分布表
等距分組表
(上下組限重疊)等距分組表
(上下組限間斷)等距分組表
(使用開口組)使用Excel頻數(shù)函數(shù)(FREQUENCY)Excel的【直方圖】工具的缺陷是:頻數(shù)分布及直方圖沒有與數(shù)據(jù)鏈接,當(dāng)改變?nèi)魏我粋€(gè)數(shù)據(jù)時(shí),頻數(shù)分布表和直方圖不會(huì)跟著改變使用統(tǒng)計(jì)函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖可解決這一問題。具體步驟是選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計(jì)函數(shù)中的【FREQUENCY】函數(shù)在對話框【Date-array】后輸入數(shù)據(jù)區(qū)域,在【Bins-array】后輸入接受區(qū)域同時(shí)按下“Ctrl-Shift-Enter”組合鍵,即得到頻數(shù)分布統(tǒng)計(jì)函數(shù)—FREQUENCY數(shù)值型數(shù)據(jù)的圖示Excel分組數(shù)據(jù)—直方圖和折線圖分組數(shù)據(jù)—直方圖
(histogram)用于展示分組數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標(biāo)系中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1分組數(shù)據(jù)的圖示
(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170~180之間的天數(shù)最多!190200180160170頻數(shù)(天)25201510530220230240銷售量(臺(tái))分組數(shù)據(jù)—直方圖
(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)分組數(shù)據(jù)—折線圖
(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布一致分組數(shù)據(jù)的圖示
(折線圖的繪制)折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(shù)(天)25201510530銷售量(臺(tái))未分組數(shù)據(jù)—莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字對于n(20n300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過
L=[10×lg
n]未分組數(shù)據(jù)—莖葉圖
(例題分析)某電腦公司銷售量分布的莖葉圖莖葉圖與直方圖的區(qū)別莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)隨時(shí)間起舞的圖—線圖
(lineplot)表示時(shí)間序列數(shù)據(jù)趨勢的圖形時(shí)間一般繪在橫軸,數(shù)據(jù)繪在縱軸圖形的長寬比例大致為10:74.一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時(shí),可以采取折斷的符號將縱軸折斷
(例題分析)【例】我國1991~2003年城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如右表。試?yán)L制線圖¥
$
1991~2003年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2
708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2
(例題分析)留意象形圖右圖是象形圖,象形圖其實(shí)就是柱狀圖,以圖形取代柱體。這個(gè)圖的目標(biāo)是廣告商,他們正在考慮預(yù)算要花在什么地方。這個(gè)圖顯示,《時(shí)代雜志》吸引了大量的廣告支出。真是這樣的嗎?筆頂端的數(shù)字顯示在《時(shí)代雜志》的廣告費(fèi)是《新聞周刊》的1.64倍。注意刻度改變線圖的刻度所產(chǎn)生的效果:兩個(gè)圖所展示的是同一組數(shù)據(jù),但是右邊的圖使得增加的速度看起來快得多。怎樣把圖畫好一定要在表示與說明里表示清楚,圖里面變量是什么,單位是什么,以及資料來源。要讓數(shù)據(jù)很醒目。要確實(shí)注意到,抓住看圖者注意力的是數(shù)據(jù)本身,而不是標(biāo)示,格子,或者背景。你是在畫一個(gè)呈現(xiàn)數(shù)據(jù)的圖,而不是在搞藝術(shù)創(chuàng)作。要注意實(shí)際上眼睛會(huì)捕捉到什么。避免用象形圖,而且要注意刻度。也不要用很炫目的“三維空間”效果,因?yàn)槟侵粫?huì)讓人看得迷迷糊糊,不會(huì)增加看的人對數(shù)據(jù)的了解。蹩腳的圖右圖顯示,25歲以上女性擁有高學(xué)位的比率增加了。一共只有五個(gè)數(shù)據(jù)點(diǎn)。所以線圖應(yīng)該很簡單,但右圖可不簡單,畫圖的人大概忍不住在背景中加畫些東西。三、變量的概括性度量4-60
第四章綜合指標(biāo)4-62
數(shù)值平均數(shù)位置平均數(shù)算術(shù)平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)集中趨勢的測度四分位數(shù)4-63
眾數(shù)分布數(shù)列中出現(xiàn)頻數(shù)(率)最多的變量值。
存在條件位置平均數(shù)
總體單位數(shù)較多;變量值的次數(shù)分布有明顯的集中趨勢特點(diǎn)不受極端值和開口組的影響,增強(qiáng)對數(shù)列一般水平的代表性;是一個(gè)不易確定的平均指標(biāo)例:7名工人日產(chǎn)量(件)為4、5、6、6、6、7、8。則眾數(shù)是6。由未分組資料確定眾數(shù)4-65
【例】:已知某企業(yè)某日工人的日產(chǎn)量資料如下:
計(jì)算工人日產(chǎn)量的眾數(shù)。日產(chǎn)量(件)工人人數(shù)(人)101112131470100380150100合計(jì)800單項(xiàng)數(shù)列4-66
【例】以下是教師按年齡分組的資料,計(jì)算教師年齡的眾數(shù)。教師按年齡分組(歲)人數(shù)(人)20—30830—402840—501650—6010合計(jì)62組距數(shù)列4-67
中位數(shù)
各單位變量值按順序排列,位于中點(diǎn)位置的變量值。1、未分組資料:4562747879818587903645487881848588變量值的個(gè)數(shù)是奇數(shù):變量值的個(gè)數(shù)是偶數(shù):
排序:
中位數(shù)位次:
計(jì)算中位數(shù)的位次:中位數(shù)為:(78+81)/2=79.5中位數(shù)為:79
確定中位數(shù)組
根據(jù)公式計(jì)算中位數(shù)(組距式分組)2、分組資料:4-69
【例】某企業(yè)某日工人的日產(chǎn)量資料如下:計(jì)算該企業(yè)該日全部工人日產(chǎn)量的中位數(shù)。
日產(chǎn)量(件)工人人數(shù)(人)向下累計(jì)次數(shù)(人)10111213147010038015010070170550700800合計(jì)800—
單項(xiàng)數(shù)列中位數(shù)的位次:4-70
【例】以下是教師按年齡分組的資料,計(jì)算教師年齡的中位數(shù)。教師按年齡分組(歲)人數(shù)(人)向下累計(jì)人數(shù)20—30830—402840—501650—6010合計(jì)628365262----組距數(shù)列四分位數(shù)
(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)
(位置的確定)原始數(shù)據(jù):分組數(shù)據(jù):數(shù)值型數(shù)據(jù)的四分位數(shù)
(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)
(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:
660
75078085096010801250150016302000位置:12345678910順序數(shù)據(jù)的四分位數(shù)
(例題分析)解:QL位置=(300)/4=75QU位置=(3×300)/4
=225
從累計(jì)頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中
四分位數(shù)為
QL
=不滿意
QU
=一般甲城市家庭對住房狀況評價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計(jì)頻數(shù)
非常不滿意
不滿意
一般
滿意
非常滿意
2410893
4530
24132225270300合計(jì)300—箱線圖
(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接該箱線圖也稱為Median/Quart./Range箱線圖
未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖
(箱線圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值Median/Quart./Range箱線圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖
(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷售量數(shù)據(jù)的Median/Quart./Range箱線圖分布的形狀與箱線圖
對稱分布QL中位數(shù)
QU左偏分布QL中位數(shù)
QU右偏分布QL
中位數(shù)
QU不同分布的箱線圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析)【例】
從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如右表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學(xué)生各科的考試成績數(shù)據(jù)課程名稱學(xué)生編號1234567891011英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析—Median/Quart./Range)8門課程考試成績的Median/Quart./Range箱線圖11名學(xué)生8門課程考試成績的Median/Quart./Range箱線圖min-max25%-75%medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖
(例題分析—Median/Quart./Range)
集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)均值(算數(shù)平均數(shù))mean4-84
(二)計(jì)算與應(yīng)用未分組資料:
簡單算術(shù)平均數(shù)例:兩組推銷人員某日的銷售量分別是(箱):一組:10、16、15、8、14、11二組:8、11、13、12、17、14、9比較哪個(gè)組的銷售成績好?
一組平均銷售量:12.33二組平均銷售量:124-85
例:以下是50個(gè)工人每人每天加工的某種零件數(shù)分組(件):
分組資料:
工人按日產(chǎn)量分組(X)人數(shù)(f)
總產(chǎn)量(X?f)
20120214842261322381842412288251025026718227254合計(jì)501194
工人的平均日產(chǎn)量:4-86
——加權(quán)算術(shù)平均
權(quán)數(shù)
2)如果該班有20名學(xué)生,平均分是多少?3)如果不知道該班的學(xué)生數(shù),能否算出平均分?1)如果該班有10名學(xué)生,平均分是多少?反映了各組的變量值對平均數(shù)的影響程度例:一次智力測試中,班級學(xué)生有30%得5分,50%得4分,10%得3分,10%得1分。4-87
成績(分)人數(shù)(人)甲班乙班丙班603915010013950平均成績(分)619980影響總體平均數(shù)的因素?各組頻數(shù)(頻率)各組變量值4-88
【例】某投資項(xiàng)目評估,將項(xiàng)目投產(chǎn)時(shí),市場可能發(fā)生景氣、一般、不景氣三種情況,分別估計(jì)項(xiàng)目年利潤和可能的頻率如下
:計(jì)算該項(xiàng)目平均年利潤。市場情況年利潤(萬元)X頻率(%)(fi/∑fi)景氣一般不景氣
200120505030201004-89
數(shù)學(xué)性質(zhì)各變量值與其算術(shù)平均數(shù)的離差之和等于零
在分析和計(jì)算上非常簡捷、便利。各個(gè)變量值與其平均數(shù)離差平方之和為最小值不足:易受極端變量值的影響;開口式的組距數(shù)列,組中值不易確定,影響其代表性。4-90
幾何平均數(shù)Geometricmean用于計(jì)算現(xiàn)象的平均比率或平均速度應(yīng)用:各個(gè)比率或速度的連乘積等于總比率或總速度;相乘的各個(gè)比率或速度不為零或負(fù)值。應(yīng)用的前提條件:n個(gè)變量值乘積的n次方根
4-91
【例】某流水生產(chǎn)線有前后銜接的五道工序。某日各工序產(chǎn)品的合格率分別為95﹪、92﹪、90﹪、85﹪、80﹪,求整個(gè)流水生產(chǎn)線產(chǎn)品的平均合格率。簡單公式及應(yīng)用應(yīng)用條件:資料未分組(各變量值次數(shù)都是1)。4-92
分
析設(shè)最初投產(chǎn)A個(gè)單位
,則
第一道工序的合格品為A×0.95;第二道工序的合格品為(A×0.95)×0.92;
……
第五道工序的合格品為
(A×0.95×0.92×0.90×0.85)×0.80;因該流水線的最終合格品即為第五道工序的合格品,
故該流水線總的合格品應(yīng)為
A×0.95×0.92×0.90×0.85×0.80;則該流水線產(chǎn)品總的合格率為:結(jié)論:即該流水線總的合格率等于各工序合格率的連乘積,符合幾何平均數(shù)的適用條件,故需采用幾何平均法計(jì)算。4-93
【例】某金融機(jī)構(gòu)以復(fù)利計(jì)息。近12年來的年利率有4年為3﹪,2年為5﹪,2年為8﹪,3年為10﹪,1年為15﹪。求平均年利率。加權(quán)公式及應(yīng)用
應(yīng)用條件:資料經(jīng)過分組,各組次數(shù)不同。4-94
分析:設(shè)本金為V,則至各年末的本利和應(yīng)為:第1年末的本利和為:第2年末的本利和為:第12年末的本利和為:第2年的計(jì)息基礎(chǔ)第12年的計(jì)息基礎(chǔ)………………
結(jié)論:即12年總本利率等于各年本利率的連乘積,符合幾何平均數(shù)的適用條件,故計(jì)算平均年本利率應(yīng)采用幾何平均法。4-95
幾何平均數(shù)的適用范圍當(dāng)變量值是相對數(shù),而且變量值之間存在連乘關(guān)系,反映現(xiàn)象的一般水平用幾何平均數(shù)。切尾均值
(trimmedMean)
去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為n表示觀察值的個(gè)數(shù);α表示切尾系數(shù),
切尾均值
(例題分析)
【例】某次比賽共有11名評委,對某位歌手的給分分別是:
經(jīng)整理得到順序統(tǒng)計(jì)量值為去掉一個(gè)最高分和一個(gè)最低分,取1/11
4-99
各種平均數(shù)的比較(一)各種平均數(shù)的特點(diǎn)及應(yīng)用場合
是就全部數(shù)據(jù)計(jì)算的,具有優(yōu)良的數(shù)學(xué)性質(zhì),實(shí)際中應(yīng)用最為廣泛。其主要缺點(diǎn)是易受極端值的影響,對偏態(tài)分布其代表性較差。G主要用于計(jì)算比率數(shù)據(jù)的平均數(shù),易受極端值的影響。不受極端值大小的影響,對偏態(tài)分布其代表性較好。但不是根據(jù)所有的變量值計(jì)算的.不受極端值的影響,對偏態(tài)分布其代表性較好.但不是根據(jù)所有的變量值計(jì)算的.
4-100
(二)平均數(shù)、中位數(shù)、眾數(shù)的關(guān)系對稱分布左偏分布右偏分布皮爾生經(jīng)驗(yàn)公式:4-101
例:某地居民去年醫(yī)療費(fèi)支出的眾數(shù)是300元,算術(shù)平均數(shù)為250元,(1)計(jì)算中位數(shù)近似值;(2)說明該地居民醫(yī)療費(fèi)支出額分布的態(tài)勢(3)若該地居民醫(yī)療費(fèi)支出額小于400元的人數(shù)占一半,眾數(shù)仍為300元,估計(jì)算術(shù)平均數(shù),并說明其分布態(tài)勢。解:1.
3、4-102
平均數(shù)計(jì)算只宜用于同質(zhì)總體應(yīng)結(jié)合分配數(shù)列和組平均數(shù)補(bǔ)充說明總平均數(shù)按地勢分組甲
地乙
地播種面積(畝)平均畝產(chǎn)(千克/畝)播種面積(畝)平均畝產(chǎn)(千克/畝)旱田190380200320水田70640300620合計(jì)260450500500應(yīng)用平均指標(biāo)須注意的問題
4-103
一組:8576758281747279二組:7080829093546095平均值變量值頻率變量變動(dòng)度----數(shù)據(jù)分布離散程度4-104
測定離散程度的意義1.反映各單位變量值分布的離中趨勢2.說明平均指標(biāo)對總體的代表性程度3.說明現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度指總體中各單位變量值背離分布中心的規(guī)?;虺潭?,用離散程度
來反映。離散程度反映統(tǒng)計(jì)數(shù)據(jù)差異程度的綜合指標(biāo),也稱為變量變動(dòng)度4-105
1、極差(range)分布離散程度的測度
優(yōu)點(diǎn):計(jì)算方法簡單、易懂;
缺點(diǎn):易受極端數(shù)值的影響,不能全面反映所有變量值差異大小及分布狀況,準(zhǔn)確程度差R=max(xi)-min(xi)2.內(nèi)距(Inter-QuartileRange,IQR)
也稱四分位差上四分位數(shù)與下四分位數(shù)之差
內(nèi)距=Q3
–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性3.方差和標(biāo)準(zhǔn)差
(VarianceandStandarddeviation)1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差4681012x=8.3總體方差和標(biāo)準(zhǔn)差
(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差
(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí),若樣本均值x確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x
=5確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 腎性高血壓的治療
- 做課件軟件教學(xué)課件
- 活動(dòng)安全應(yīng)急預(yù)案
- 1.1.1反應(yīng)熱 焓變 課件 高二上學(xué)期化學(xué)人教版(2019)選擇性必修1
- 吉林省2024七年級數(shù)學(xué)上冊第1章有理數(shù)1.12有理數(shù)的混合運(yùn)算課件新版華東師大版
- 犬皮膚癬菌病開題報(bào)告
- 踩高蹺大班教案反思
- 肝門部膽管癌輔助治療
- 讓友誼之樹常青說課稿
- 花點(diǎn)心說課稿
- 2024美團(tuán)外賣服務(wù)合同范本
- 2023~2024學(xué)年第一學(xué)期高一期中考試數(shù)學(xué)試題含答案
- 2023年全國中學(xué)生英語能力競賽初三年級組試題及答案
- 一種基于STM32的智能門鎖系統(tǒng)的設(shè)計(jì)-畢業(yè)論文
- 部編版道德與法治九年級上冊 8.2 共圓中國夢 教學(xué)設(shè)計(jì)
- 醫(yī)療器械質(zhì)量保證及售后服務(wù)承諾書模板
- 英語四級單詞表4500.xls
- (最新整理)紫外可見分光光度計(jì)期間核查規(guī)程
- 《海子詩人簡介》PPT課件.ppt
- 阿莫的生病日ppt課件
- 汽車材料概述課件(ppt 119頁).ppt
評論
0/150
提交評論