![第二章統(tǒng)計數(shù)據(jù)的描述課件_第1頁](http://file4.renrendoc.com/view/4fcd845ef6cce1ee61a9423a94d5a206/4fcd845ef6cce1ee61a9423a94d5a2061.gif)
![第二章統(tǒng)計數(shù)據(jù)的描述課件_第2頁](http://file4.renrendoc.com/view/4fcd845ef6cce1ee61a9423a94d5a206/4fcd845ef6cce1ee61a9423a94d5a2062.gif)
![第二章統(tǒng)計數(shù)據(jù)的描述課件_第3頁](http://file4.renrendoc.com/view/4fcd845ef6cce1ee61a9423a94d5a206/4fcd845ef6cce1ee61a9423a94d5a2063.gif)
![第二章統(tǒng)計數(shù)據(jù)的描述課件_第4頁](http://file4.renrendoc.com/view/4fcd845ef6cce1ee61a9423a94d5a206/4fcd845ef6cce1ee61a9423a94d5a2064.gif)
![第二章統(tǒng)計數(shù)據(jù)的描述課件_第5頁](http://file4.renrendoc.com/view/4fcd845ef6cce1ee61a9423a94d5a206/4fcd845ef6cce1ee61a9423a94d5a2065.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、華南理工大學精品課程統(tǒng)計學統(tǒng)計數(shù)據(jù)的描述第二章華南理工大學精品課程第二章 統(tǒng)計數(shù)據(jù)的描述錄取中有無歧視?某高校只有兩個系,財經(jīng)系和工程系。該校報考及錄取的總體情況如下:男生女生錄取350200未錄取450400報考人數(shù)800600引例:華南理工大學精品課程第二章 統(tǒng)計數(shù)據(jù)的描述 如果我們只看該校男女生錄取的比率,即男生350/800=44%, 女生200/600=33%。這時我們不免會問,是男同學的成績比女同學好,還是在錄取中存在著性別的歧視?學過統(tǒng)計學的同學不會簡單地做出結論,而是繼續(xù)搜集數(shù)據(jù)并得到兩個系各自錄取的男女生數(shù)據(jù):引例:華南理工大學精品課程第二章 統(tǒng)計數(shù)據(jù)的描述工程系財經(jīng)系男生女
2、生男生女生錄取30010050100未錄取300100150300報考人數(shù)600200200400引例:華南理工大學精品課程第二章 統(tǒng)計數(shù)據(jù)的描述 有了分系的錄取數(shù)據(jù),不難看到工程系錄取的人數(shù)比較多,男女生錄取的比率都是50%。 而財經(jīng)系招生名額較少,男女生錄取的比率都是25%。由于女生報財經(jīng)系的人多,男生報工科的人多,因而導致男生整個錄取率偏高,而女生偏低。這個例子告訴我們對數(shù)據(jù)一是要從不同角度進行分析,二是要注意權數(shù)的影響,這就是本章要討論的問題。引例:華南理工大學精品課程6引例提問錄取中有無歧視?Q1Q2Q3統(tǒng)計學怎樣對數(shù)據(jù)進行有效分析?怎樣理解權數(shù)對均值的影響?華南理工大學精品課程7本
3、章學習內(nèi)容1.學習如何用數(shù)據(jù)對客觀事物進行計量, 如何獲取數(shù)據(jù)以及對數(shù)據(jù)質(zhì)量的評價2.如何對獲取的數(shù)據(jù)進行整理3.數(shù)據(jù)分布的集中趨勢和離散程度4.非正態(tài)總體的分布偏態(tài)和峰度5.莖葉圖和箱線圖的特點和優(yōu)勢6.統(tǒng)計表及統(tǒng)計圖華南理工大學精品課程8本章學習目標 了解數(shù)據(jù)的計量尺度 了解統(tǒng)計數(shù)據(jù)的來源和數(shù)據(jù)的質(zhì)量要求 掌握數(shù)值型數(shù)據(jù)的整理方法 掌握數(shù)據(jù)集中趨勢和離散程度的測度方法 掌握莖葉圖和箱線圖的制作方法 掌握分布偏態(tài)與峰度的測度方法 掌握統(tǒng)計表和統(tǒng)計圖的使用華南理工大學精品課程9第一節(jié) 數(shù)據(jù)的計量尺度2.42.5第二章具體章節(jié)結構 第二節(jié) 統(tǒng)計數(shù)據(jù)的來源第三節(jié) 統(tǒng)計數(shù)據(jù)的質(zhì)量第
4、四節(jié) 統(tǒng)計數(shù)據(jù)的整理第五節(jié) 分布集中趨勢的測度華南理工大學精品課程10第六節(jié) 分布離散程度的測度2.9第七節(jié) 分布偏態(tài)與峰度的測度第八節(jié) 莖葉圖與箱線圖第九節(jié) 統(tǒng)計表與統(tǒng)計圖第二章具體章節(jié)結構 華南理工大學精品課程第一節(jié) 數(shù)據(jù)的計量尺度 按照計量學的一般分類方法,對數(shù)據(jù)分為四種計量尺度,即: 一、列名尺度二、順序尺度三、間隔尺度四、比率尺度華南理工大學精品課程12列名尺度 (Nominal scale)也稱名義尺度或分類尺度計量層次最低對事物進行平行的分類各類別可以指定數(shù)字代碼表示使用時必須符合類別窮盡和互斥的要求數(shù)據(jù)表現(xiàn)為“類別”具有=或的數(shù)學特性華南理工大學精品課程13順
5、序尺度 (Ordinal scale)也稱定序尺度對事物分類的同時給出各類別的順序比定類尺度精確未測量出類別之間的準確差值數(shù)據(jù)表現(xiàn)為“類別”,但有序具有或的數(shù)學特性華南理工大學精品課程14間隔尺度 (Interval scale)也稱間隔尺度對事物的準確測度比定序尺度精確數(shù)據(jù)表現(xiàn)為“數(shù)值”沒有絕對零點具有 + 或 - 的數(shù)學特性華南理工大學精品課程15比率尺度 (Ratio scale)也稱比率尺度對事物的準確測度與定距尺度處于同一層次數(shù)據(jù)表現(xiàn)為“數(shù)值”有絕對零點具有 或 的數(shù)學特性華南理工大學精品課程16四種計量尺度的比較定類尺度定序尺度定距尺度定比尺度 分類( = , ) 排序( ) 間距
6、( + ,- ) 比值( , ) “”表示該尺度所具有的特性表2-1 四種計量尺度的比較華南理工大學精品課程17本節(jié)提問數(shù)據(jù)的計量尺度分為哪幾種?Q1Q2Q3不同計量尺度各有什么特點?間隔尺度和比例尺度有何區(qū)別?華南理工大學精品課程第二節(jié) 統(tǒng)計數(shù)據(jù)的來源 統(tǒng)計數(shù)據(jù)來源于直接組織的調(diào)查、觀察和科學試驗,我們稱之為第一手數(shù)據(jù)或直接的數(shù)據(jù);或者來源于已有的數(shù)據(jù),我們稱之為第二手數(shù)據(jù)或間接的數(shù)據(jù)。一、間接獲取的數(shù)據(jù) 二、直接獲取的數(shù)據(jù)華南理工大學精品課程19間接取得的數(shù)據(jù)統(tǒng)計部門和政府部門公布的有關資料,如各類統(tǒng)計年鑒各類經(jīng)濟信息中心、信息咨詢機構、專業(yè)調(diào)查機構等提供的數(shù)據(jù)各類專業(yè)期刊、報紙、書籍所提
7、供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學術性研討會上交流的有關資料從互聯(lián)網(wǎng)或圖書館查閱到的相關資料中國統(tǒng)計年鑒2001中國人口統(tǒng)計年鑒中國市場統(tǒng)計年鑒世界發(fā)展報告世界經(jīng)濟年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計出版社華南理工大學精品課程20提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站中國政府及相關機構 網(wǎng)址數(shù)據(jù)內(nèi)容國家統(tǒng)計局http:/統(tǒng)計年鑒、統(tǒng)計月報等國務院發(fā)展研究中心信息網(wǎng)http:/宏觀經(jīng)濟、財經(jīng)、貨幣金融等 中國經(jīng)濟信息網(wǎng)http:/經(jīng)濟信息及各類網(wǎng)站華通數(shù)據(jù)中心http:/國家統(tǒng)計局授權的數(shù)據(jù)中心中國決策信息網(wǎng)http:/決策知識及案例三農(nóng)數(shù)據(jù)網(wǎng)http:/三農(nóng)信息、論壇及相關網(wǎng)站表2-2 提供統(tǒng)計數(shù)
8、據(jù)的部分政府網(wǎng)站華南理工大學精品課程21提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站美國政府機構 網(wǎng)址數(shù)據(jù)內(nèi)容人口普查局http:/人口和家庭等聯(lián)邦儲備局http:/www.bog.frb.fed.us貨幣供應、信譽、匯率等預算編制辦公室http:/omb財政收入、支出、債券等商務部http:/商業(yè)、工業(yè)等表2-2 提供統(tǒng)計數(shù)據(jù)的部分政府網(wǎng)站(續(xù)表)華南理工大學精品課程22普查 (census)為特定目的專門組織的非經(jīng)常性全面調(diào)查通常是一次性或周期性的一般需要規(guī)定統(tǒng)一的標準調(diào)查時間數(shù)據(jù)的規(guī)范化程度較高應用范圍比較狹窄總體華南理工大學精品課程23抽樣調(diào)查 (sampling survey)1.從總體中隨機抽取一部
9、分單位作為樣本進行調(diào)查,并根據(jù)樣本調(diào)查結果來推斷總體特征的數(shù)據(jù)收集方法 2.具有經(jīng)濟性、時效性強、 適應面廣、準確性 高等特點總體隨機樣本華南理工大學精品課程24本節(jié)提問簡要說明統(tǒng)計數(shù)據(jù)的來源?Q1Q2獲取直接統(tǒng)計數(shù)據(jù)的渠道主要有哪些?華南理工大學精品課程第三節(jié) 統(tǒng)計數(shù)據(jù)的質(zhì)量 統(tǒng)計數(shù)據(jù)的誤差: 一、抽樣誤差二、非抽樣誤差華南理工大學精品課程26統(tǒng)計數(shù)據(jù)的誤差華南理工大學精品課程27抽樣誤差 (sampling error)由于抽樣的隨機性所帶來的誤差 所有樣本可能的結果與總體真值之間的平均性差異 影響抽樣誤差大小的因素樣本量的大小總體的變異性華南理工大學精品課程28非抽樣誤差 (non-sa
10、mpling error)相對于抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測量誤差華南理工大學精品課程29誤差的控制抽樣誤差可計算和控制非抽樣誤差的控制 調(diào)查員的挑選 調(diào)查員的培訓 督導員的調(diào)查專業(yè)水平 調(diào)查過程控制 調(diào)查結果進行檢驗、評估 現(xiàn)場調(diào)查人員進行獎懲的制度華南理工大學精品課程30本節(jié)提問簡要說明抽樣誤差和非抽樣誤差?Q1Q2非抽樣誤差的控制有哪些途徑?華南理工大學精品課程第四節(jié) 統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計數(shù)據(jù)的分組 二、次數(shù)分配三、次數(shù)分配直方圖四、
11、洛倫茨曲線華南理工大學精品課程32統(tǒng)計數(shù)據(jù)的分組 統(tǒng)計分組是統(tǒng)計整理的第一步,它是按照統(tǒng)計研究的目的,將數(shù)據(jù)分別分入不同的組內(nèi)。在本章第一節(jié)中,我們將數(shù)據(jù)分成四種計量尺度,即列名尺度、順序尺度、間隔尺度和比例尺度。其中列名尺度和順序尺度的數(shù)據(jù)是按照事物的性質(zhì)和屬性劃分的,因而又稱為按品質(zhì)標志分組;間隔尺度和比例尺度是按照事物的數(shù)量標準劃分的,又稱為數(shù)量標志分組。 華南理工大學精品課程33組距分組(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用 不等距分組華南理工大學精品課程34組距分組 (步驟)確定組數(shù):組數(shù)的確定應以能夠
12、顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距:組距(class width)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù)統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表華南理工大學精品課程35組距分組 (幾個概念)1. 下限(low limit) :一個組的最小值2. 上限(upper limit) :一個組的最大值3. 組距(class width) :上限與下限之差4. 組中值(class midpoint) :下限與上限之間的中點值下限值+上限值2組中值 =華南理工大學精品課程36案例分析 次數(shù)分配表的編制【例】 某車間30名工人每周加工
13、某種零件件數(shù)如右表試對數(shù)據(jù)進行分組。 工人編號周加工零件數(shù)工人編號周加工零件數(shù)工人編號周加工零件數(shù)12345678910106841109110991111107121105111213141516171819209994119881189720310695106212223242526272829308510610110596105107128111101表2-3 某車間30名工人周加工零件數(shù) (單位:件)華南理工大學精品課程37案例分析 次數(shù)分配表表2-4 某車間30名工人周加工零件數(shù)的頻數(shù)分布按周加工零件數(shù)分組次 數(shù)80 9090 100100 110110 120120 1303713
14、52合計30華南理工大學精品課程38使用Excel頻數(shù)函數(shù) (FREQUENCY) Excel的“直方圖”工具的缺陷是:頻數(shù)分布和直方圖沒有與數(shù)據(jù)聯(lián)系起來,這樣,如果你改變?nèi)魏我粋€數(shù)據(jù),頻數(shù)分布表和直方圖不會跟著改變 使用Excel中的統(tǒng)計函數(shù)“FREQUENCY”來創(chuàng)建 頻數(shù)分布表和直方圖,可解決這一問題。華南理工大學精品課程39使用Excel頻數(shù)函數(shù) (FREQUENCY)創(chuàng)建頻數(shù)分布表的步驟是:選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計函數(shù)中的“FREQUENCY”函數(shù)在對話框 Date-array 后輸入數(shù)據(jù)區(qū)域,在Bins-array后輸入接受區(qū)域同時按下ct
15、rl-shift-Enter組合鍵,即得到頻數(shù)分布統(tǒng)計函數(shù)FREQUENCY華南理工大學精品課程40分組數(shù)據(jù)的圖示 (直方圖的繪制)我一眼就看出來了,周加工零件在100110之間的人數(shù)最多!圖2-1 某車間工人周加工零件直方圖華南理工大學精品課程41分組數(shù)據(jù)的圖示 (折線圖的繪制)折線圖與直方圖下的面積相等!圖2-2 某車間工人周加工零件折線圖 華南理工大學精品課程42次數(shù)分配的類型對稱分布右偏分布左偏分布正J型分布反J型分布U型分布圖2-3 幾種常見的頻數(shù)分布華南理工大學精品課程43洛倫茨曲線20世紀初美國經(jīng)濟學家、統(tǒng)計學家洛倫茨(M.E. Lorentz)根據(jù)意大利經(jīng)濟學家巴雷特(V. P
16、areto)提出的收入分配公式繪制而成描述收入和財富分配性質(zhì)的曲線分析該國家或地區(qū)分配的平均程度AB累積的人口百分比 絕對公平線 累積的收入百分比 華南理工大學精品課程44基尼系數(shù)20世紀初意大利經(jīng)濟學家基尼(G. Gini)根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標A表示實際收入曲線與絕對平均線之間的面積B表示實際收入曲線與絕對不平均線之間的面積如果A=0,則基尼系數(shù)=0,表示收入絕對平均華南理工大學精品課程45基尼系數(shù)5.如果B=0,則基尼系數(shù)=1,表示收入絕對不平均6.基尼系數(shù)在0 和1之間取值7.一般認為:基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當?shù)模?/p>
17、即一個社會既有效率又沒有造成極大的分配不公;基尼系數(shù)在0.4被認為是收入分配不公平的警戒線,超過了0.4應該采取措施縮小這一差距。AB華南理工大學精品課程46本節(jié)提問描述次數(shù)分配表的編制過程。Q1Q2Q3解釋洛倫茨曲線及其用途。說明基尼系數(shù)的含義和用途。華南理工大學精品課程第五節(jié) 分布集中趨勢的測度一、眾數(shù)二、中位數(shù)三、四分位數(shù)四、均值五、幾何均值六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較華南理工大學精品課程48眾數(shù) (mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)華南理工大學精品課程4
18、9眾數(shù) (不惟一性)無眾數(shù)原始數(shù)據(jù): 11 3 7 12 9 8一個眾數(shù)原始數(shù)據(jù): 7 4 6 13 4 4多于一個眾數(shù)原始數(shù)據(jù): 17 15 25 33 24 24華南理工大學精品課程50中位數(shù) (median)1.排序后處于中間位置上的值2.不受極端值的影響3.主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)4.各變量值與中位數(shù)的離差絕對值之和最小,即Me50%50%華南理工大學精品課程51中位數(shù) (位置的確定)華南理工大學精品課程52案例分析 (9個數(shù)據(jù)的算例)【例】 9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1400 750 760 1050 870 950 2100 1450 154
19、0 排 序: 750 760 870 950 1050 1400 1450 1540 2100位 置: 1 2 3 4 5 6 7 8 9中位數(shù) = 1050華南理工大學精品課程53案例分析 (10個數(shù)據(jù)的算例)【例】 10個家庭的人均月收入數(shù)據(jù) 排 序: 635 690 770 820 930 1078 1230 1450 1690 2150 位 置: 1 2 3 4 5 6 7 8 9 10 華南理工大學精品課程54四分位數(shù) (quartile)1.排序后處于25%和75%位置上的值2.不受極端值的影響3.主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25
20、%25%華南理工大學精品課程55四分位數(shù) (位置的確定)華南理工大學精品課程56案例分析 (四分位數(shù)7個數(shù)據(jù)的算例)原始數(shù)據(jù): 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 77+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QL= 23QU = 30N+1華南理工大學精品課程57案例分析(四分位數(shù)10個數(shù)據(jù)的算例)【例】 10個家庭的人均月收入數(shù)據(jù)排 序: 500 650 760 780 940 1060 1350 1680 1790 1900位 置: 1 2 3 4 5 6 7 8 9
21、 10統(tǒng)計函數(shù)QUARTILE華南理工大學精品課程58均值 (mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)華南理工大學精品課程59簡單均值 (simple mean)設一組數(shù)據(jù)為: x1 ,x2 , ,xn總體均值樣本均值華南理工大學精品課程60加權均值 (weighted mean)設一組數(shù)據(jù)為: x1 ,x2 , ,xn相應的頻數(shù)為: f1 ,f2 , ,fk總體均值樣本均值華南理工大學精品課程61案例分析 加權均值按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105110110115115120120
22、125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計506160.0【例】根據(jù)表中的數(shù)據(jù),計算50 名工人日加工零件數(shù)的均值 表2-5 某車間50名工人日加工零件均值計算表華南理工大學精品課程62均值 (數(shù)學性質(zhì))1. 各變量值與均值的離差之和等于零2. 各變量值與均值的離差平方和最小華南理工大學精品課程63幾何均值 (geometric mean)n 個變量值乘積的 n 次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為:可看作
23、是均值的一種變形華南理工大學精品課程64案例分析 幾何均值 【例】 一位投資者購持有一種股票,在1997年、1998年、1999年和2000年收益率分別為 4.5%、2.0%、3.5%、5.4%。計算該投資者在這四年內(nèi)的平均收益率 平均收益率103.84%-1=3.84%華南理工大學精品課程65切尾均值 (trimmed Mean)去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值在電視大獎賽、體育比賽及需要人們進行綜合評價的比賽項目中已得到廣泛應用計算公式為:n 表示觀察值的個數(shù);表示切尾系數(shù),華南理工大學精品課程66案例分析 切尾均值【例】某次求職面試中共有11名評委,對某位求職者的給分分別是:
24、經(jīng)整理得到順序統(tǒng)計量值為去掉一個最高分和一個最低分,取1/11 華南理工大學精品課程67眾數(shù)、中位數(shù)和均值的關系左偏分布均值 中位數(shù) 眾數(shù)對稱分布 均值= 中位數(shù)= 眾數(shù)右偏分布眾數(shù) 中位數(shù)均值圖2-4 眾數(shù)、中位數(shù)和均值的關系華南理工大學精品課程68眾數(shù)、中位數(shù)、均值的特點和應用眾數(shù) -不受極端值影響 -具有不惟一性 -數(shù)據(jù)分布偏斜程度較大時應用中位數(shù) -不受極端值影響 -數(shù)據(jù)分布偏斜程度較大時應用均值 -易受極端值影響 -數(shù)學性質(zhì)優(yōu)良 -數(shù)據(jù)對稱分布或接近對稱分布時應用小結數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型定類數(shù)據(jù) 定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的測度值眾數(shù)中位數(shù)算術平均數(shù)算術平均數(shù)四
25、分位數(shù)眾數(shù)調(diào)和平均數(shù)眾數(shù)中位數(shù)幾何平均數(shù)四分位數(shù) 中位數(shù)四分位數(shù)眾數(shù)紅色為該數(shù)據(jù)類型最適合用的測度值華南理工大學精品課程70本節(jié)提問一組數(shù)據(jù)的分布特征可以從哪幾個方面進行測度?Q1Q2Q3怎樣理解均值在統(tǒng)計學中的地位?對于比率數(shù)據(jù)的平均,為什么采用幾何平均?簡述眾數(shù)、中位數(shù)和均值的特點和應用場合。Q4華南理工大學精品課程第六節(jié) 分布離散程度的測度一、極差二、內(nèi)距三、方差和標準差四、離散系數(shù)華南理工大學精品課程72極差 (range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910計算公式為: R = max(xi) - min(xi)華南理工
26、大學精品課程73內(nèi)距 (Inter-Quartile Range,IQR)也稱四分位差上四分位數(shù)與下四分位數(shù)之差 內(nèi) 距 = Q3 Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性華南理工大學精品課程74案例分析 四分位差【例】 根據(jù)表中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差回答類別甲城市戶數(shù) (戶)累計頻數(shù) 非常不滿意 不滿意 一般 滿意 非常滿意2410893453024132225270300合計300解:設非常不滿意為1,不滿意為2, 一般為3, 滿意為 4, 非常滿意為5 已知 QL = 不滿意 = 2 QU = 一般 = 3四分位差: QD =
27、 QU = QL = 32 = 1表2-6 甲城市家庭對住房狀況評價的頻數(shù)分布華南理工大學精品課程75方差和標準差(Variance and Standard deviation)1.離散程度的測度值之一2.最常用的測度值3.反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4 6 8 10 12 x = 8.3華南理工大學精品課程76總體方差和標準差 (Population variance and Standard deviation)未分組數(shù)據(jù):方差的計算公式標準差的計算公式未分組數(shù)據(jù):組距分組數(shù):組距分組數(shù):
28、華南理工大學精品課程77案例分析 總體標準差計算過程及結果【例】根據(jù)表中的數(shù)據(jù),計算工人日加工零件數(shù)的標準差表2-7 某車間50名工人日加工零件標準差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計503100.5華南理工大學精品課程
29、78樣本方差和標準差 (simple variance and standard deviation)方差的計算公式注意:樣本方差用自由度n-1去除!標準差的計算公式未分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):組距分組數(shù)據(jù):華南理工大學精品課程79樣本方差 自由度(degree of freedom)1.一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)2.當樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值x 確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值3.例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當 x = 5 確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自
30、由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值4.樣本方差用自由度去除,其原因可從多方面解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差2時,它是2的無偏估計量華南理工大學精品課程80案例分析 樣本方差 樣本方差與標準差原始數(shù)據(jù): 10 5 9 13 6 8華南理工大學精品課程81離散系數(shù)(coefficient of variation)1.標準差與其相應的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為:華南理工大學精品課程82案例分析 離散系數(shù)【例】某公司抽查了所屬的8家超市,其產(chǎn)品銷
31、售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度超市編號產(chǎn)品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0表2-8 某公司所屬8家超市的產(chǎn)品銷售數(shù)據(jù)華南理工大學精品課程83案例分析 離散系數(shù)v1=536.25309.19=0.577v2=32.521523.09=0.710結論: 計算結果表明,v10時為正偏斜;當 0)(0時,表示頻數(shù)分布比正態(tài)分布更集中,分布呈尖峰狀態(tài),0)(=0) (0)圖2-8 峰度示意圖華南理工大學精品課程第八節(jié) 莖葉圖與箱線圖一、莖葉圖二、箱線圖華
32、南理工大學精品課程97莖葉圖 (stem-and-leaf display)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構成,其圖形由數(shù)字組成以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別:-直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值-莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息華南理工大學精品課程98案例分析 莖葉圖樹莖樹葉78022347778889001222233334446677789013344579910111213數(shù)據(jù)個數(shù)31324 10莖葉圖類似橫置的直方圖圖2-9 某車間30
33、名工人周加工零件數(shù)據(jù)的莖葉圖表華南理工大學精品課程99案例分析 擴展的莖葉圖圖2-10 擴展的莖葉圖表7 8 80 2 2 3 45 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 90 1 3 3 4 4 5 7 9 9樹莖樹葉10*10.11*11.12*12.13*13.樹莖樹葉10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.78 802 2 34 57 7 78 8 8 90 0 12 2 2 2 3 3 3 34 4 4 5 56 6 7 7 78 8 90 13
34、 34 4 579 9華南理工大學精品課程100箱線圖 (box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接華南理工大學精品課程101箱線圖 (箱線圖的構成)中位數(shù)4681012QUQLX最大值X最小值圖2-11 簡單箱線圖華南理工大學精品課程102案例分析 箱線圖最小值107最大值139中位數(shù)123下四分位數(shù)117.75上四分位數(shù)128105 110 11
35、5 120 125 130 135 140圖2-12 50名工人日加工零件數(shù)的箱線圖華南理工大學精品課程103分布的形狀與箱線圖對稱分布QL中位數(shù) QU左偏分布QL中位數(shù) QU右偏分布QL 中位數(shù) QU圖2-13 不同分布的箱線圖華南理工大學精品課程104案例分析 多批數(shù)據(jù)箱線圖 課程名稱學生編號1234567891011英語經(jīng)濟數(shù)學西方經(jīng)濟學市場營銷學財務管理基礎會計學統(tǒng)計學計算機應用基礎7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608781678691837
36、7769070828382928481706972787578918866948085718674687962818155787075687177【例】 從某大學工商管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征表2-11 11名學生各科的考試成績數(shù)據(jù)華南理工大學精品課程105圖2-14 8門課程考試成績的箱線圖案例分析 多批數(shù)據(jù)箱線圖 華南理工大學精品課程106圖2-15 11名學生8門課程考試成績的箱線圖min-max25%-75%median value455565758595105學生1
37、學生2學生3學生4學生5學生6學生7學生8學生9學生10學生11案例分析 多批數(shù)據(jù)箱線圖 華南理工大學精品課程107本節(jié)提問描述莖葉圖和箱線圖的畫法?Q1Q2說明莖葉圖和箱線圖的用途。Q2Q2華南理工大學精品課程第九節(jié) 統(tǒng)計表與統(tǒng)計圖統(tǒng)計表和統(tǒng)計圖是顯示統(tǒng)計數(shù)據(jù)的兩種方式統(tǒng)計表把雜亂的數(shù)據(jù)有條理地組織在一張簡明的表格內(nèi);統(tǒng)計圖把數(shù)據(jù)形象地顯示出來 。華南理工大學精品課程109統(tǒng)計表數(shù)字資料行標題附加列標題 表2-12 19992000年城鎮(zhèn)居民家庭抽樣調(diào)查資料 項 目單位1999年2000年 調(diào)查戶數(shù)戶4004442220 平均每戶家庭人口人3.143.13 平均每戶就業(yè)人口人1.771.68
38、 平均每戶就業(yè)面%56.4353.67 平均每一就業(yè)者負擔人數(shù)人1.771.86 平均每人全部年收入元5888.776316.81 可支配收入元5854.026279.98 平均每人消費性支出元4615.914998.00表頭 資料來源:中國統(tǒng)計年鑒2001,中國統(tǒng)計出版社,2001,第305頁。 注:本表為城鎮(zhèn)居民家庭收支抽樣調(diào)查材料。 華南理工大學精品課程110統(tǒng)計表設計的一般要求1.要合理安排統(tǒng)計表的結構2.總標題內(nèi)容應滿足3W要求3.數(shù)據(jù)計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出一列標明4.表中的上下兩條橫線一般用粗線,其他線用細線5.通常情況下,統(tǒng)計表的左右
39、兩邊不封口華南理工大學精品課程1116.表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應以小數(shù)點對齊,而且小數(shù)點的為數(shù)應統(tǒng)一7.對于沒有小數(shù)點的單元,一般用“-”表示8.必要時可在表的下方加上注釋統(tǒng)計表設計的一般要求華南理工大學精品課程112統(tǒng)計圖常見的統(tǒng)計圖:直方圖、莖葉圖和箱線圖 折線圖、條形圖和圓形圖、環(huán)行圖、雷達圖等等華南理工大學精品課程113定類數(shù)據(jù)的圖示條形圖(條形圖的制作)條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動的圖形。條形圖有單式、復式等形式。在表示定類數(shù)據(jù)的分布時,是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率。繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖。
40、華南理工大學精品課程114定類數(shù)據(jù)的圖示-條形圖人數(shù)(人)5191610211204080120 商品廣告 服務廣告 金融廣告 房地產(chǎn)廣告 招生招聘廣告 其他廣告廣告類型 圖2-16 某城市居民關注不同類型廣告的人數(shù)分布由 Excel 繪制的條形圖定類數(shù)據(jù)的圖示圓形圖(圓形圖的制作)華南理工大學精品課程1151.也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形。2.主要用于表示總體中各組成部分所占的比例,對于研究結構性問題十分有用。3.在繪制圓形圖時,總體中各部分所占的百分比用圓內(nèi)的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的。4.例如,關注服務廣告的人數(shù)占總人數(shù)的百分比為25.5%,那么其扇形的中心角度就應為360025.5%91.80,其余類推。定類數(shù)據(jù)的圖示圓形圖華南理工大學精品課程116 其他廣告1.0% 房地產(chǎn)廣告8.0% 商品廣告56.0% 金融廣告4.5% 服務廣告25.5% 招生招聘廣告5.8%圖2-17 某城市居民關注不同類型廣告的人數(shù)構成由 Excel 繪制的圓形圖定序數(shù)據(jù)的圖示環(huán)形圖(環(huán)形圖的制作)華南理工大學精品課程1171.環(huán)形圖中間有一個“空洞”,總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示2.環(huán)形圖與圓形圖類似,但又有區(qū)別圓形
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北師大版道德與法治七年級下冊9.1《我們身邊的法律》聽課評課記錄
- 湘教版數(shù)學九年級下冊聽評課記錄:2.3 垂徑定理
- 小學二年級上冊數(shù)學口算練習題人教版新課標
- 小學二年級人教版口算及豎式計算寒假練習A4排版
- 小學二年級加減乘法口算練習題
- 蘇教版小學二年級數(shù)學上冊口算題卡
- 超市連鎖加盟合同范本
- 儲藏室租賃合同范本
- 汽車二級經(jīng)銷商合作協(xié)議書范本
- 二零二五年度美容學員美容行業(yè)技能提升培訓協(xié)議
- 高標準農(nóng)田施工組織設計(全)
- 宿舍、辦公樓消防應急預案
- 細胞全能性的課件資料
- 職業(yè)安全健康工作總結(2篇)
- 14S501-1 球墨鑄鐵單層井蓋及踏步施工
- YB 4022-1991耐火泥漿荷重軟化溫度試驗方法(示差-升溫法)
- 水土保持方案中沉沙池的布設技術
- 安全生產(chǎn)技術規(guī)范 第25部分:城鎮(zhèn)天然氣經(jīng)營企業(yè)DB50-T 867.25-2021
- 現(xiàn)代企業(yè)管理 (全套完整課件)
- 走進本土項目化設計-讀《PBL項目化學習設計》有感
- 高中語文日積月累23
評論
0/150
提交評論