統(tǒng)計(jì)數(shù)據(jù)的描述1.ppt_第1頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的描述1.ppt_第2頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的描述1.ppt_第3頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的描述1.ppt_第4頁(yè)
統(tǒng)計(jì)數(shù)據(jù)的描述1.ppt_第5頁(yè)
已閱讀5頁(yè),還剩121頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

華南理工大學(xué)精品課程 統(tǒng)計(jì)學(xué) 統(tǒng)計(jì)數(shù)據(jù)的描述 第二章 華南理工大學(xué)精品課程 第二章統(tǒng)計(jì)數(shù)據(jù)的描述 錄取中有無(wú)歧視 某高校只有兩個(gè)系 財(cái)經(jīng)系和工程系 該校報(bào)考及錄取的總體情況如下 引例 華南理工大學(xué)精品課程 第二章統(tǒng)計(jì)數(shù)據(jù)的描述 如果我們只看該校男女生錄取的比率 即男生350 800 44 女生200 600 33 這時(shí)我們不免會(huì)問(wèn) 是男同學(xué)的成績(jī)比女同學(xué)好 還是在錄取中存在著性別的歧視 學(xué)過(guò)統(tǒng)計(jì)學(xué)的同學(xué)不會(huì)簡(jiǎn)單地做出結(jié)論 而是繼續(xù)搜集數(shù)據(jù)并得到兩個(gè)系各自錄取的男女生數(shù)據(jù) 引例 華南理工大學(xué)精品課程 第二章統(tǒng)計(jì)數(shù)據(jù)的描述 引例 華南理工大學(xué)精品課程 第二章統(tǒng)計(jì)數(shù)據(jù)的描述 有了分系的錄取數(shù)據(jù) 不難看到工程系錄取的人數(shù)比較多 男女生錄取的比率都是50 而財(cái)經(jīng)系招生名額較少 男女生錄取的比率都是25 由于女生報(bào)財(cái)經(jīng)系的人多 男生報(bào)工科的人多 因而導(dǎo)致男生整個(gè)錄取率偏高 而女生偏低 這個(gè)例子告訴我們對(duì)數(shù)據(jù)一是要從不同角度進(jìn)行分析 二是要注意權(quán)數(shù)的影響 這就是本章要討論的問(wèn)題 引例 華南理工大學(xué)精品課程 6 引例提問(wèn) 錄取中有無(wú)歧視 Q1 Q2 Q3 統(tǒng)計(jì)學(xué)怎樣對(duì)數(shù)據(jù)進(jìn)行有效分析 怎樣理解權(quán)數(shù)對(duì)均值的影響 華南理工大學(xué)精品課程 7 本章學(xué)習(xí)內(nèi)容 1 學(xué)習(xí)如何用數(shù)據(jù)對(duì)客觀事物進(jìn)行計(jì)量 如何獲取數(shù)據(jù)以及對(duì)數(shù)據(jù)質(zhì)量的評(píng)價(jià)2 如何對(duì)獲取的數(shù)據(jù)進(jìn)行整理3 數(shù)據(jù)分布的集中趨勢(shì)和離散程度4 非正態(tài)總體的分布偏態(tài)和峰度5 莖葉圖和箱線圖的特點(diǎn)和優(yōu)勢(shì)6 統(tǒng)計(jì)表及統(tǒng)計(jì)圖 華南理工大學(xué)精品課程 8 本章學(xué)習(xí)目標(biāo) 了解數(shù)據(jù)的計(jì)量尺度了解統(tǒng)計(jì)數(shù)據(jù)的來(lái)源和數(shù)據(jù)的質(zhì)量要求掌握數(shù)值型數(shù)據(jù)的整理方法掌握數(shù)據(jù)集中趨勢(shì)和離散程度的測(cè)度方法掌握莖葉圖和箱線圖的制作方法掌握分布偏態(tài)與峰度的測(cè)度方法掌握統(tǒng)計(jì)表和統(tǒng)計(jì)圖的使用 華南理工大學(xué)精品課程 9 第一節(jié)數(shù)據(jù)的計(jì)量尺度 2 1 2 2 2 3 2 4 2 5 第二章具體章節(jié)結(jié)構(gòu) 第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的來(lái)源 第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量 第四節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理 第五節(jié)分布集中趨勢(shì)的測(cè)度 華南理工大學(xué)精品課程 10 第六節(jié)分布離散程度的測(cè)度 2 6 2 7 2 8 2 9 第七節(jié)分布偏態(tài)與峰度的測(cè)度 第八節(jié)莖葉圖與箱線圖 第九節(jié)統(tǒng)計(jì)表與統(tǒng)計(jì)圖 第二章具體章節(jié)結(jié)構(gòu) 華南理工大學(xué)精品課程 第一節(jié)數(shù)據(jù)的計(jì)量尺度 按照計(jì)量學(xué)的一般分類(lèi)方法 對(duì)數(shù)據(jù)分為四種計(jì)量尺度 即 一 列名尺度二 順序尺度三 間隔尺度四 比率尺度 華南理工大學(xué)精品課程 12 列名尺度 Nominalscale 也稱(chēng)名義尺度或分類(lèi)尺度計(jì)量層次最低對(duì)事物進(jìn)行平行的分類(lèi)各類(lèi)別可以指定數(shù)字代碼表示使用時(shí)必須符合類(lèi)別窮盡和互斥的要求數(shù)據(jù)表現(xiàn)為 類(lèi)別 具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 13 順序尺度 Ordinalscale 也稱(chēng)定序尺度對(duì)事物分類(lèi)的同時(shí)給出各類(lèi)別的順序比定類(lèi)尺度精確未測(cè)量出類(lèi)別之間的準(zhǔn)確差值數(shù)據(jù)表現(xiàn)為 類(lèi)別 但有序具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 14 間隔尺度 Intervalscale 也稱(chēng)間隔尺度對(duì)事物的準(zhǔn)確測(cè)度比定序尺度精確數(shù)據(jù)表現(xiàn)為 數(shù)值 沒(méi)有絕對(duì)零點(diǎn)具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 15 比率尺度 Ratioscale 也稱(chēng)比率尺度對(duì)事物的準(zhǔn)確測(cè)度與定距尺度處于同一層次數(shù)據(jù)表現(xiàn)為 數(shù)值 有絕對(duì)零點(diǎn)具有 或 的數(shù)學(xué)特性 華南理工大學(xué)精品課程 16 四種計(jì)量尺度的比較 表示該尺度所具有的特性 表2 1四種計(jì)量尺度的比較 華南理工大學(xué)精品課程 17 本節(jié)提問(wèn) 數(shù)據(jù)的計(jì)量尺度分為哪幾種 Q1 Q2 Q3 不同計(jì)量尺度各有什么特點(diǎn) 間隔尺度和比例尺度有何區(qū)別 華南理工大學(xué)精品課程 第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的來(lái)源 統(tǒng)計(jì)數(shù)據(jù)來(lái)源于直接組織的調(diào)查 觀察和科學(xué)試驗(yàn) 我們稱(chēng)之為第一手?jǐn)?shù)據(jù)或直接的數(shù)據(jù) 或者來(lái)源于已有的數(shù)據(jù) 我們稱(chēng)之為第二手?jǐn)?shù)據(jù)或間接的數(shù)據(jù) 一 間接獲取的數(shù)據(jù)二 直接獲取的數(shù)據(jù) 華南理工大學(xué)精品課程 19 間接取得的數(shù)據(jù) 統(tǒng)計(jì)部門(mén)和政府部門(mén)公布的有關(guān)資料 如各類(lèi)統(tǒng)計(jì)年鑒各類(lèi)經(jīng)濟(jì)信息中心 信息咨詢(xún)機(jī)構(gòu) 專(zhuān)業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類(lèi)專(zhuān)業(yè)期刊 報(bào)紙 書(shū)籍所提供的資料各種會(huì)議 如博覽會(huì) 展銷(xiāo)會(huì) 交易會(huì)及專(zhuān)業(yè)性 學(xué)術(shù)性研討會(huì)上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書(shū)館查閱到的相關(guān)資料 華南理工大學(xué)精品課程 20 提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站 表2 2提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站 華南理工大學(xué)精品課程 21 提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站 表2 2提供統(tǒng)計(jì)數(shù)據(jù)的部分政府網(wǎng)站 續(xù)表 華南理工大學(xué)精品課程 22 普查 census 為特定目的專(zhuān)門(mén)組織的非經(jīng)常性全面調(diào)查通常是一次性或周期性的一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間數(shù)據(jù)的規(guī)范化程度較高應(yīng)用范圍比較狹窄 華南理工大學(xué)精品課程 23 抽樣調(diào)查 samplingsurvey 1 從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查 并根據(jù)樣本調(diào)查結(jié)果來(lái)推斷總體特征的數(shù)據(jù)收集方法2 具有經(jīng)濟(jì)性 時(shí)效性強(qiáng) 適應(yīng)面廣 準(zhǔn)確性高等特點(diǎn) 華南理工大學(xué)精品課程 24 本節(jié)提問(wèn) 簡(jiǎn)要說(shuō)明統(tǒng)計(jì)數(shù)據(jù)的來(lái)源 Q1 Q2 獲取直接統(tǒng)計(jì)數(shù)據(jù)的渠道主要有哪些 華南理工大學(xué)精品課程 第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量 統(tǒng)計(jì)數(shù)據(jù)的誤差 一 抽樣誤差二 非抽樣誤差 華南理工大學(xué)精品課程 26 統(tǒng)計(jì)數(shù)據(jù)的誤差 華南理工大學(xué)精品課程 27 抽樣誤差 samplingerror 由于抽樣的隨機(jī)性所帶來(lái)的誤差所有樣本可能的結(jié)果與總體真值之間的平均性差異影響抽樣誤差大小的因素樣本量的大小總體的變異性 華南理工大學(xué)精品課程 28 非抽樣誤差 non samplingerror 相對(duì)于抽樣誤差而言除抽樣誤差之外的 由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣 非概率抽樣 全面性調(diào)查有抽樣框誤差 回答誤差 無(wú)回答誤差 調(diào)查員誤差 測(cè)量誤差 華南理工大學(xué)精品課程 29 誤差的控制 抽樣誤差可計(jì)算和控制非抽樣誤差的控制 調(diào)查員的挑選 調(diào)查員的培訓(xùn) 督導(dǎo)員的調(diào)查專(zhuān)業(yè)水平 調(diào)查過(guò)程控制 調(diào)查結(jié)果進(jìn)行檢驗(yàn) 評(píng)估 現(xiàn)場(chǎng)調(diào)查人員進(jìn)行獎(jiǎng)懲的制度 華南理工大學(xué)精品課程 30 本節(jié)提問(wèn) 簡(jiǎn)要說(shuō)明抽樣誤差和非抽樣誤差 Q1 Q2 非抽樣誤差的控制有哪些途徑 華南理工大學(xué)精品課程 第四節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理 一 統(tǒng)計(jì)數(shù)據(jù)的分組二 次數(shù)分配三 次數(shù)分配直方圖四 洛倫茨曲線 華南理工大學(xué)精品課程 32 統(tǒng)計(jì)數(shù)據(jù)的分組 統(tǒng)計(jì)分組是統(tǒng)計(jì)整理的第一步 它是按照統(tǒng)計(jì)研究的目的 將數(shù)據(jù)分別分入不同的組內(nèi) 在本章第一節(jié)中 我們將數(shù)據(jù)分成四種計(jì)量尺度 即列名尺度 順序尺度 間隔尺度和比例尺度 其中列名尺度和順序尺度的數(shù)據(jù)是按照事物的性質(zhì)和屬性劃分的 因而又稱(chēng)為按品質(zhì)標(biāo)志分組 間隔尺度和比例尺度是按照事物的數(shù)量標(biāo)準(zhǔn)劃分的 又稱(chēng)為數(shù)量標(biāo)志分組 華南理工大學(xué)精品課程 33 組距分組 要點(diǎn) 將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循 不重不漏 的原則可采用等距分組 也可采用不等距分組 華南理工大學(xué)精品課程 34 組距分組 步驟 確定組數(shù) 組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距 組距 classwidth 是一個(gè)組的上限與下限之差 可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定 即組距 最大值 最小值 組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表 華南理工大學(xué)精品課程 35 組距分組 幾個(gè)概念 1 下限 lowlimit 一個(gè)組的最小值2 上限 upperlimit 一個(gè)組的最大值3 組距 classwidth 上限與下限之差4 組中值 classmidpoint 下限與上限之間的中點(diǎn)值 華南理工大學(xué)精品課程 36 案例分析次數(shù)分配表的編制 例 某車(chē)間30名工人每周加工某種零件件數(shù)如右表試對(duì)數(shù)據(jù)進(jìn)行分組 表2 3某車(chē)間30名工人周加工零件數(shù) 單位 件 華南理工大學(xué)精品課程 37 案例分析次數(shù)分配表 表2 4某車(chē)間30名工人周加工零件數(shù)的頻數(shù)分布 華南理工大學(xué)精品課程 38 使用Excel頻數(shù)函數(shù) FREQUENCY Excel的 直方圖 工具的缺陷是 頻數(shù)分布和直方圖沒(méi)有與數(shù)據(jù)聯(lián)系起來(lái) 這樣 如果你改變?nèi)魏我粋€(gè)數(shù)據(jù) 頻數(shù)分布表和直方圖不會(huì)跟著改變 使用Excel中的統(tǒng)計(jì)函數(shù) FREQUENCY 來(lái)創(chuàng)建頻數(shù)分布表和直方圖 可解決這一問(wèn)題 華南理工大學(xué)精品課程 39 使用Excel頻數(shù)函數(shù) FREQUENCY 創(chuàng)建頻數(shù)分布表的步驟是 選擇與接受區(qū)域相臨近的單元格區(qū)域 作為頻數(shù)分布表輸出的區(qū)域 選擇統(tǒng)計(jì)函數(shù)中的 FREQUENCY 函數(shù)在對(duì)話框Date array后輸入數(shù)據(jù)區(qū)域 在Bins array后輸入接受區(qū)域 同時(shí)按下ctrl shift Enter組合鍵 即得到頻數(shù)分布 統(tǒng)計(jì)函數(shù) FREQUENCY 華南理工大學(xué)精品課程 40 分組數(shù)據(jù)的圖示 直方圖的繪制 我一眼就看出來(lái)了 周加工零件在100 110之間的人數(shù)最多 圖2 1某車(chē)間工人周加工零件直方圖 華南理工大學(xué)精品課程 41 分組數(shù)據(jù)的圖示 折線圖的繪制 折線圖與直方圖下的面積相等 圖2 2某車(chē)間工人周加工零件折線圖 華南理工大學(xué)精品課程 42 次數(shù)分配的類(lèi)型 圖2 3幾種常見(jiàn)的頻數(shù)分布 華南理工大學(xué)精品課程 43 洛倫茨曲線 20世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家 統(tǒng)計(jì)學(xué)家洛倫茨 M E Lorentz 根據(jù)意大利經(jīng)濟(jì)學(xué)家巴雷特 V Pareto 提出的收入分配公式繪制而成描述收入和財(cái)富分配性質(zhì)的曲線分析該國(guó)家或地區(qū)分配的平均程度 累積的人口百分比 絕對(duì)公平線 累積的收入百分比 華南理工大學(xué)精品課程 44 基尼系數(shù) 20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼 G Gini 根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標(biāo)A表示實(shí)際收入曲線與絕對(duì)平均線之間的面積B表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積如果A 0 則基尼系數(shù) 0 表示收入絕對(duì)平均 華南理工大學(xué)精品課程 45 基尼系數(shù) 5 如果B 0 則基尼系數(shù) 1 表示收入絕對(duì)不平均6 基尼系數(shù)在0和1之間取值7 一般認(rèn)為 基尼系數(shù)若小于0 2 表明分配平均 基尼系數(shù)在0 2至0 4之間是比較適當(dāng)?shù)?即一個(gè)社會(huì)既有效率又沒(méi)有造成極大的分配不公 基尼系數(shù)在0 4被認(rèn)為是收入分配不公平的警戒線 超過(guò)了0 4應(yīng)該采取措施縮小這一差距 華南理工大學(xué)精品課程 46 本節(jié)提問(wèn) 描述次數(shù)分配表的編制過(guò)程 Q1 Q2 Q3 解釋洛倫茨曲線及其用途 說(shuō)明基尼系數(shù)的含義和用途 華南理工大學(xué)精品課程 第五節(jié)分布集中趨勢(shì)的測(cè)度 一 眾數(shù)二 中位數(shù)三 四分位數(shù)四 均值五 幾何均值六 切尾均值七 眾數(shù) 中位數(shù)和均值的比較 華南理工大學(xué)精品課程 48 眾數(shù) mode 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類(lèi)數(shù)據(jù) 也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù) 華南理工大學(xué)精品課程 49 眾數(shù) 不惟一性 無(wú)眾數(shù)原始數(shù)據(jù) 11371298 一個(gè)眾數(shù)原始數(shù)據(jù) 7461344 多于一個(gè)眾數(shù)原始數(shù)據(jù) 171525332424 華南理工大學(xué)精品課程 50 中位數(shù) median 1 排序后處于中間位置上的值2 不受極端值的影響3 主要用于順序數(shù)據(jù) 也可用數(shù)值型數(shù)據(jù) 但不能用于分類(lèi)數(shù)據(jù)4 各變量值與中位數(shù)的離差絕對(duì)值之和最小 即 華南理工大學(xué)精品課程 51 中位數(shù) 位置的確定 華南理工大學(xué)精品課程 52 案例分析 9個(gè)數(shù)據(jù)的算例 例 9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù) 14007507601050870950210014501540排序 75076087095010501400145015402100位置 123456789 中位數(shù) 1050 華南理工大學(xué)精品課程 53 案例分析 10個(gè)數(shù)據(jù)的算例 例 10個(gè)家庭的人均月收入數(shù)據(jù)排序 63569077082093010781230145016902150位置 12345678910 華南理工大學(xué)精品課程 54 四分位數(shù) quartile 1 排序后處于25 和75 位置上的值2 不受極端值的影響3 主要用于順序數(shù)據(jù) 也可用于數(shù)值型數(shù)據(jù) 但不能用于分類(lèi)數(shù)據(jù) 華南理工大學(xué)精品課程 55 四分位數(shù) 位置的確定 華南理工大學(xué)精品課程 56 案例分析 四分位數(shù)7個(gè)數(shù)據(jù)的算例 原始數(shù)據(jù) 23213032282526排序 21232526283032位置 1234567 QL 23 QU 30 N 1 華南理工大學(xué)精品課程 57 案例分析 四分位數(shù)10個(gè)數(shù)據(jù)的算例 例 10個(gè)家庭的人均月收入數(shù)據(jù)排序 50065076078094010601350168017901900位置 12345678910 統(tǒng)計(jì)函數(shù) QUARTILE 華南理工大學(xué)精品課程 58 均值 mean 集中趨勢(shì)的最常用測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù) 不能用于分類(lèi)數(shù)據(jù)和順序數(shù)據(jù) 華南理工大學(xué)精品課程 59 簡(jiǎn)單均值 simplemean 設(shè)一組數(shù)據(jù)為 x1 x2 xn 總體均值 樣本均值 華南理工大學(xué)精品課程 60 加權(quán)均值 weightedmean 設(shè)一組數(shù)據(jù)為 x1 x2 xn相應(yīng)的頻數(shù)為 f1 f2 fk 總體均值 樣本均值 華南理工大學(xué)精品課程 61 案例分析加權(quán)均值 例 根據(jù)表中的數(shù)據(jù) 計(jì)算50名工人日加工零件數(shù)的均值表2 5某車(chē)間50名工人日加工零件均值計(jì)算表 華南理工大學(xué)精品課程 62 均值 數(shù)學(xué)性質(zhì) 1 各變量值與均值的離差之和等于零2 各變量值與均值的離差平方和最小 華南理工大學(xué)精品課程 63 幾何均值 geometricmean n個(gè)變量值乘積的n次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率計(jì)算公式為 可看作是均值的一種變形 華南理工大學(xué)精品課程 64 案例分析幾何均值 例 一位投資者購(gòu)持有一種股票 在1997年 1998年 1999年和2000年收益率分別為4 5 2 0 3 5 5 4 計(jì)算該投資者在這四年內(nèi)的平均收益率 平均收益率 103 84 1 3 84 華南理工大學(xué)精品課程 65 切尾均值 trimmedMean 去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值在電視大獎(jiǎng)賽 體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為 n表示觀察值的個(gè)數(shù) 表示切尾系數(shù) 華南理工大學(xué)精品課程 66 案例分析切尾均值 例 某次求職面試中共有11名評(píng)委 對(duì)某位求職者的給分分別是 經(jīng)整理得到順序統(tǒng)計(jì)量值為 去掉一個(gè)最高分和一個(gè)最低分 取1 11 華南理工大學(xué)精品課程 67 眾數(shù) 中位數(shù)和均值的關(guān)系 圖2 4眾數(shù) 中位數(shù)和均值的關(guān)系 華南理工大學(xué)精品課程 68 眾數(shù) 中位數(shù) 均值的特點(diǎn)和應(yīng)用 眾數(shù) 不受極端值影響 具有不惟一性 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù) 不受極端值影響 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用均值 易受極端值影響 數(shù)學(xué)性質(zhì)優(yōu)良 數(shù)據(jù)對(duì)稱(chēng)分布或接近對(duì)稱(chēng)分布時(shí)應(yīng)用 小結(jié) 紅色為該數(shù)據(jù)類(lèi)型最適合用的測(cè)度值 華南理工大學(xué)精品課程 70 本節(jié)提問(wèn) 一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測(cè)度 Q1 Q2 Q3 怎樣理解均值在統(tǒng)計(jì)學(xué)中的地位 對(duì)于比率數(shù)據(jù)的平均 為什么采用幾何平均 簡(jiǎn)述眾數(shù) 中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合 Q4 華南理工大學(xué)精品課程 第六節(jié)分布離散程度的測(cè)度 一 極差二 內(nèi)距三 方差和標(biāo)準(zhǔn)差四 離散系數(shù) 華南理工大學(xué)精品課程 72 極差 range 一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布 計(jì)算公式為 R max xi min xi 華南理工大學(xué)精品課程 73 內(nèi)距 Inter QuartileRange IQR 也稱(chēng)四分位差上四分位數(shù)與下四分位數(shù)之差內(nèi)距 Q3 Q1反映了中間50 數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性 華南理工大學(xué)精品課程 74 案例分析四分位差 例 根據(jù)表中的數(shù)據(jù) 計(jì)算甲城市家庭對(duì)住房滿意狀況評(píng)價(jià)的四分位差 解 設(shè)非常不滿意為1 不滿意為2 一般為3 滿意為4 非常滿意為5已知QL 不滿意 2QU 一般 3四分位差 QD QU QL 3 2 1 表2 6甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布 華南理工大學(xué)精品課程 75 方差和標(biāo)準(zhǔn)差 VarianceandStandarddeviation 1 離散程度的測(cè)度值之一2 最常用的測(cè)度值3 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計(jì)算的 稱(chēng)為總體方差或標(biāo)準(zhǔn)差 根據(jù)樣本數(shù)據(jù)計(jì)算的 稱(chēng)為樣本方差或標(biāo)準(zhǔn)差 華南理工大學(xué)精品課程 76 總體方差和標(biāo)準(zhǔn)差 PopulationvarianceandStandarddeviation 未分組數(shù)據(jù) 方差的計(jì)算公式 標(biāo)準(zhǔn)差的計(jì)算公式 未分組數(shù)據(jù) 組距分組數(shù) 組距分組數(shù) 華南理工大學(xué)精品課程 77 案例分析總體標(biāo)準(zhǔn)差計(jì)算過(guò)程及結(jié)果 例 根據(jù)表中的數(shù)據(jù) 計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差 表2 7某車(chē)間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表 華南理工大學(xué)精品課程 78 樣本方差和標(biāo)準(zhǔn)差 simplevarianceandstandarddeviation 方差的計(jì)算公式 標(biāo)準(zhǔn)差的計(jì)算公式 未分組數(shù)據(jù) 未分組數(shù)據(jù) 組距分組數(shù)據(jù) 組距分組數(shù)據(jù) 華南理工大學(xué)精品課程 79 樣本方差自由度 degreeoffreedom 1 一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)2 當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為n時(shí) 若樣本均值 x確定后 只有n 1個(gè)數(shù)據(jù)可以自由取值 其中必有一個(gè)數(shù)據(jù)則不能自由取值3 例如 樣本有3個(gè)數(shù)值 即x1 2 x2 4 x3 9 則 x 5 當(dāng) x 5確定后 x1 x2和x3有兩個(gè)數(shù)據(jù)可以自由取值 另一個(gè)則不能自由取值 比如x1 6 x2 7 那么x3則必然取2 而不能取其他值4 樣本方差用自由度去除 其原因可從多方面解釋 從實(shí)際應(yīng)用角度看 在抽樣估計(jì)中 當(dāng)用樣本方差去估計(jì)總體方差 2時(shí) 它是 2的無(wú)偏估計(jì)量 華南理工大學(xué)精品課程 80 案例分析樣本方差 樣本方差與標(biāo)準(zhǔn)差 原始數(shù)據(jù) 10591368 華南理工大學(xué)精品課程 81 離散系數(shù) coefficientofvariation 1 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4 用于對(duì)不同組別數(shù)據(jù)離散程度的比較5 計(jì)算公式為 華南理工大學(xué)精品課程 82 案例分析離散系數(shù) 例 某公司抽查了所屬的8家超市 其產(chǎn)品銷(xiāo)售數(shù)據(jù)如表 試比較產(chǎn)品銷(xiāo)售額與銷(xiāo)售利潤(rùn)的離散程度 表2 8某公司所屬8家超市的產(chǎn)品銷(xiāo)售數(shù)據(jù) 華南理工大學(xué)精品課程 83 案例分析離散系數(shù) 結(jié)論 計(jì)算結(jié)果表明 v1 v2 說(shuō)明產(chǎn)品銷(xiāo)售額的離散程度小于銷(xiāo)售利潤(rùn)的離散程度 小結(jié) 為該數(shù)據(jù)類(lèi)型最適合的用的測(cè)度值 華南理工大學(xué)精品課程 85 本節(jié)提問(wèn) 為什么要計(jì)算離散系數(shù) Q1 Q2 華南理工大學(xué)精品課程 第七節(jié)分布偏態(tài)與峰度的測(cè)度 一 偏態(tài)及其測(cè)度二 峰度及其測(cè)度 華南理工大學(xué)精品課程 87 偏態(tài)與峰度分布的形狀 偏態(tài) 峰度 圖2 5偏態(tài)與峰度分布的形狀 華南理工大學(xué)精品課程 88 偏態(tài) 1 偏態(tài) 衡量頻數(shù)分配不對(duì)稱(chēng)程度 或偏斜程度的指標(biāo) 2 計(jì)算公式 用距法測(cè)定 華南理工大學(xué)精品課程 89 當(dāng) 0時(shí) 左右完全對(duì)稱(chēng) 為正態(tài)分布 當(dāng) 0時(shí)為正偏斜 當(dāng) 0時(shí)為負(fù)偏斜 圖2 6偏態(tài)示意圖 偏態(tài) 華南理工大學(xué)精品課程 90 案例分析偏態(tài) 例 已知1997年我國(guó)農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表 試計(jì)算偏態(tài)系數(shù) 表2 91997年農(nóng)村居民家庭純收入數(shù)據(jù) 華南理工大學(xué)精品課程 91 案例分析偏態(tài)與峰度從直方圖上觀察 按純收入分組 元 結(jié)論 1 為右偏分布2 峰度適中 圖2 7農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖 華南理工大學(xué)精品課程 92 案例分析偏態(tài)系數(shù) 計(jì)算過(guò)程 表2 10農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計(jì)算表 華南理工大學(xué)精品課程 93 案例分析偏態(tài)系數(shù) 計(jì)算結(jié)果 根據(jù)上表數(shù)據(jù)計(jì)算得 將計(jì)算結(jié)果代入公式得 結(jié)論 偏態(tài)系數(shù)為正值 而且數(shù)值較大 說(shuō)明農(nóng)村居民家庭純收入的分布為右偏分布 即收入較少的家庭占據(jù)多數(shù) 而收入較高的家庭則占少數(shù) 而且偏斜的程度較大 華南理工大學(xué)精品課程 94 峰度 1 峰度 用以衡量頻數(shù)分配的集中程度 即分布曲線的尖峭程度的指標(biāo) 2 計(jì)算公式 用距法測(cè)定 華南理工大學(xué)精品課程 95 峰度 峰度指標(biāo) 0 分布為正態(tài)峰度 當(dāng)峰度指標(biāo) 0時(shí) 表示頻數(shù)分布比正態(tài)分布更集中 分布呈尖峰狀態(tài) 0時(shí)表示頻數(shù)分布比正態(tài)分布更分散 分布呈平坦峰 如圖所示 圖2 8峰度示意圖 華南理工大學(xué)精品課程 第八節(jié)莖葉圖與箱線圖 一 莖葉圖二 箱線圖 華南理工大學(xué)精品課程 97 莖葉圖 stem and leafdisplay 用于顯示未分組的原始數(shù)據(jù)的分布由 莖 和 葉 兩部分構(gòu)成 其圖形由數(shù)字組成以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖 低位數(shù)字作樹(shù)葉樹(shù)葉上只保留一位數(shù)字莖葉圖類(lèi)似于橫置的直方圖 但又有區(qū)別 直方圖可觀察一組數(shù)據(jù)的分布狀況 但沒(méi)有給出具體的數(shù)值 莖葉圖既能給出數(shù)據(jù)的分布狀況 又能給出每一個(gè)原始數(shù)值 保留了原始數(shù)據(jù)的信息 華南理工大學(xué)精品課程 98 案例分析莖葉圖 樹(shù)莖 樹(shù)葉 78 022347778889 001222233334446677789 0133445799 數(shù)據(jù)個(gè)數(shù) 圖2 9某車(chē)間30名工人周加工零件數(shù)據(jù)的莖葉圖表 華南理工大學(xué)精品課程 99 案例分析擴(kuò)展的莖葉圖 圖2 10擴(kuò)展的莖葉圖表 78802234577788890012222333344455667778890133445799 樹(shù)莖 樹(shù)葉 10 10 11 11 12 12 13 13 華南理工大學(xué)精品課程 100 箱線圖 boxplot 用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成 它由一個(gè)箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值 即最大值 最小值 中位數(shù)Me和兩個(gè)四分位數(shù) 下四分位數(shù)QL和上四分位數(shù)QU 連接兩個(gè)四分 位 數(shù)畫(huà)出箱子 再將兩個(gè)極值點(diǎn)與箱子相連接 華南理工大學(xué)精品課程 101 箱線圖 箱線圖的構(gòu)成 華南理工大學(xué)精品課程 102 案例分析箱線圖 華南理工大學(xué)精品課程 103 分布的形狀與箱線圖 圖2 13不同分布的箱線圖 華南理工大學(xué)精品課程 104 案例分析多批數(shù)據(jù)箱線圖 例 從某大學(xué)工商管理專(zhuān)業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人 對(duì)8門(mén)主要課程的考試成績(jī)進(jìn)行調(diào)查 所得結(jié)果如表 試?yán)L制各科考試成績(jī)的批比較箱線圖 并分析各科考試成績(jī)的分布特征 表2 1111名學(xué)生各科的考試成績(jī)數(shù)據(jù) 華南理工大學(xué)精品課程 105 圖2 148門(mén)課程考試成績(jī)的箱線圖 案例分析多批數(shù)據(jù)箱線圖 華南理工大學(xué)精品課程 106 圖2 1511名學(xué)生8門(mén)課程考試成績(jī)的箱線圖 min max 25 75 medianvalue 45 55 65 75 85 95 105 學(xué)生1 學(xué)生2 學(xué)生3 學(xué)生4 學(xué)生5 學(xué)生6 學(xué)生7 學(xué)生8 學(xué)生9 學(xué)生10 學(xué)生11 案例分析多批數(shù)據(jù)箱線圖 華南理工大學(xué)精品課程 107 本節(jié)提問(wèn) 描述莖葉圖和箱線圖的畫(huà)法 Q1 Q2 說(shuō)明莖葉圖和箱線圖的用途 Q2 Q2 華南理工大學(xué)精品課程 第九節(jié)統(tǒng)計(jì)表與統(tǒng)計(jì)圖 統(tǒng)計(jì)表和統(tǒng)計(jì)圖是顯示統(tǒng)計(jì)數(shù)據(jù)的兩種方式 統(tǒng)計(jì)表把雜亂的數(shù)據(jù)有條理地組織在一張簡(jiǎn)明的表格內(nèi) 統(tǒng)計(jì)圖把數(shù)據(jù)形象地顯示出來(lái) 華南理工大學(xué)精品課程 109 統(tǒng)計(jì)表 數(shù)字資料 行標(biāo)題 附加 列標(biāo)題 表2 121999 2000年城鎮(zhèn)居民家庭抽樣調(diào)查資料 表頭 資料來(lái)源 中國(guó)統(tǒng)計(jì)年鑒2001 中國(guó)統(tǒng)計(jì)出版社 2001 第305頁(yè) 注 本表為城鎮(zhèn)居民家庭收支抽樣調(diào)查材料 華南理工大學(xué)精品課程 110 統(tǒng)計(jì)表設(shè)計(jì)的一般要求 1 要合理安排統(tǒng)計(jì)表的結(jié)構(gòu)2 總標(biāo)題內(nèi)容應(yīng)滿足3W要求3 數(shù)據(jù)計(jì)量單位相同時(shí) 可放在表的右上角標(biāo)明 不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明4 表中的上下兩條橫線一般用粗線 其他線用細(xì)線5 通常情況下 統(tǒng)計(jì)表的左右兩邊不封口 華南理工大學(xué)精品課程 111 6 表中的數(shù)據(jù)一般是右對(duì)齊 有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊 而且小數(shù)點(diǎn)的為數(shù)應(yīng)統(tǒng)一7 對(duì)于沒(méi)有小數(shù)點(diǎn)的單元 一般用 表示8 必要時(shí)可在表的下方加上注釋 統(tǒng)計(jì)表設(shè)計(jì)的一般要求 華南理工大學(xué)精品課程 112 統(tǒng)計(jì)圖 常見(jiàn)的統(tǒng)計(jì)圖 直方圖 莖葉圖和箱線圖折線圖 條形圖和圓形圖 環(huán)行圖 雷達(dá)圖等等 華南理工大學(xué)精品課程 113 定類(lèi)數(shù)據(jù)的圖示 條形圖 條形圖的制作 條形圖是用寬度相同的條形的高度或長(zhǎng)短來(lái)表示數(shù)據(jù)變動(dòng)的圖形 條形圖有單式 復(fù)式等形式 在表示定類(lèi)數(shù)據(jù)的分布時(shí) 是用條形圖的高度來(lái)表示各類(lèi)別數(shù)據(jù)的頻數(shù)或頻率 繪制時(shí) 各類(lèi)別可以放在縱軸 稱(chēng)為條形圖 也可以放在橫軸 稱(chēng)為柱形圖 華南理工大學(xué)精品課程 114 定類(lèi)數(shù)據(jù)的圖示 條形圖 由Excel繪制的條形圖 定類(lèi)數(shù)據(jù)的圖示 圓形圖 圓形圖的制作 華南理工大學(xué)精品課程 115 1 也稱(chēng)餅圖 是用圓形及園內(nèi)扇形的面積來(lái)表示數(shù)值大小的圖形 2 主要用于表示總體中各組成部分所占的比例 對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用 3 在繪制圓形圖時(shí) 總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形面積表示 這些扇形的中心角度 是按各部分百分比占3600的相應(yīng)比例確定的 4 例如 關(guān)注服務(wù)廣告的人數(shù)占總?cè)藬?shù)的百分比為25 5 那么其扇形的中心角度就應(yīng)為3600 25 5 91 80 其余類(lèi)推 定類(lèi)數(shù)據(jù)的圖示 圓形圖 華南理工大學(xué)精品課程 116 由Excel繪制的圓形圖 定序數(shù)據(jù)的圖示 環(huán)形圖 環(huán)形圖的制作 華南理工大學(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論