![2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第1頁](http://file4.renrendoc.com/view14/M03/28/1A/wKhkGWbOoSqAfJcHAAJsLdFqRUE320.jpg)
![2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第2頁](http://file4.renrendoc.com/view14/M03/28/1A/wKhkGWbOoSqAfJcHAAJsLdFqRUE3202.jpg)
![2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第3頁](http://file4.renrendoc.com/view14/M03/28/1A/wKhkGWbOoSqAfJcHAAJsLdFqRUE3203.jpg)
![2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第4頁](http://file4.renrendoc.com/view14/M03/28/1A/wKhkGWbOoSqAfJcHAAJsLdFqRUE3204.jpg)
![2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第5頁](http://file4.renrendoc.com/view14/M03/28/1A/wKhkGWbOoSqAfJcHAAJsLdFqRUE3205.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
本章考情
年份單選題多選題合計(jì)
2020年4題4分3題6分10分
2019年3題3分1題2分5分
2018年3題3分1題2分5分
本章重點(diǎn):
1.統(tǒng)計(jì)學(xué)、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的含義。
2.變量、數(shù)據(jù),定性變量和定量變量,分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。
3.觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù),一手?jǐn)?shù)據(jù)和二手?jǐn)?shù)據(jù)。
4.統(tǒng)計(jì)調(diào)查的含義及其分類(全面調(diào)查和非全面調(diào)查、連續(xù)調(diào)查和不連續(xù)調(diào)查),常用統(tǒng)計(jì)調(diào)查方
式〔統(tǒng)計(jì)報(bào)表、普查、抽樣調(diào)查、重點(diǎn)調(diào)查和典型調(diào)查)的含義、特點(diǎn)和應(yīng)用場合。
5.數(shù)據(jù)科學(xué)與大數(shù)據(jù)。
知識(shí)點(diǎn)一:統(tǒng)計(jì)學(xué)
(一)統(tǒng)計(jì)學(xué):一門關(guān)于數(shù)據(jù)的學(xué)科,它提供了一系列用于收集、處理、分析和解釋數(shù)據(jù)的方法。
(二)統(tǒng)計(jì)學(xué)兩個(gè)分支:
1.描述統(tǒng)計(jì):研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法。主要內(nèi)容:如何取得所需要的數(shù)據(jù),如何
用圖表或數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理和展示,如何描述數(shù)據(jù)的一般性特征。
【示例】利用統(tǒng)計(jì)圖表展示GDP的變化、利用增長率描述人均可支配收入的基本走勢、利用統(tǒng)計(jì)表
描述公司員工年齡分布等。
2.?斷統(tǒng)計(jì):研究如何利用樣本數(shù)據(jù)來推斷總體特征的方法。_________________________
某國家男青年的身高構(gòu)成一個(gè)總體,想知道這個(gè)總體的均值,
利用樣本信息推斷總
隨機(jī)抽取部分人,測得身高的均值,再用這些數(shù)據(jù)來估計(jì)這群
讓體特征
人的平均身高
假設(shè)檢利用樣本信息判斷對(duì)若假設(shè)“該國男青年平均身高超過1.7米”,需要通過樣本檢
1總體的假設(shè)是否成立驗(yàn)此命題是否成立
【例題?單選題】(2020年)下列統(tǒng)計(jì)處理中,屬于描述統(tǒng)計(jì)的是()。
A.利用均值測度一組數(shù)據(jù)的集中趨勢
B.利用抽樣調(diào)查數(shù)據(jù)推斷城鎮(zhèn)居民平均收入
C.利用樣本信息推斷消費(fèi)者對(duì)某品牌的知曉度
D.利用最小二乘法擬合線性回歸模型
『正確答案」A
r答案解析J描述統(tǒng)計(jì)是研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法。其內(nèi)容包括如何取得所需要的
數(shù)據(jù),如何用圖表或數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理和展示,如何描述數(shù)據(jù)的一般性特征。選項(xiàng)BCD屬于
推斷統(tǒng)計(jì)。
【例題?單選題】利用概率樣本數(shù)據(jù)推斷全國居民人均消費(fèi)支出,適用的統(tǒng)計(jì)學(xué)方法是()。
A.參數(shù)估計(jì)
B.相關(guān)分析
C.假設(shè)檢驗(yàn)
D.描述統(tǒng)計(jì)
『正確答案』A
f答案解析』本題考查統(tǒng)計(jì)學(xué)。參數(shù)估計(jì)是利用樣本信息推斷總體特征。
知識(shí)點(diǎn)二,變量和數(shù)據(jù)
(一)變量
1.變量:研究對(duì)象的屬性或特征,它是相對(duì)于常數(shù)而言的。常數(shù)只有一個(gè)固定取值,而變量可以有
兩個(gè)或更多個(gè)可能的取值。
【示例】性別、受教育水平、年收入等。
2.分類:
定量變重(數(shù)量變量)變量的取便是數(shù)量職工人數(shù)、年銷售額等
分類變量變量的取值為類別性別、出行方式、工作行業(yè)等
定性變量變量的取值表現(xiàn)為類別且具有一定順
順序變量客戶滿意度、經(jīng)濟(jì)師職稱等
序
(二)數(shù)據(jù)
1.含義:對(duì)變量進(jìn)行測量、觀測的結(jié)果。數(shù)據(jù)根據(jù)需要可以是數(shù)值、文字或者圖像等形式。
2.分類
分類變量的觀測結(jié)果,,性別,,
分類數(shù)據(jù)表現(xiàn)為類別,i般用文字來表述,也可用數(shù)值="男”,“女”
代碼表示=“0”,“1”
“客戶滿意度”
順序變量的觀測結(jié)果
="非常滿意”,“滿意”,”不
順序數(shù)據(jù)也表現(xiàn)為類別,一般用文字來表述,也可用數(shù)
滿意”
值代碼表示
=“1”,“2”,“3”
數(shù)值型數(shù)定量變量的觀測結(jié)果“年齡”
1表現(xiàn)為具體表示大小或多少的數(shù)值=“20”,“30”,“40”
3.對(duì)不同類型的數(shù)據(jù),可采用不同的統(tǒng)計(jì)方法來處理和分析。
(1)分類數(shù)據(jù):計(jì)算出各類別的頻率,但對(duì)其進(jìn)行加、減、乘或除等數(shù)學(xué)運(yùn)算是沒有意義的。
(2)數(shù)值型數(shù)據(jù):可以進(jìn)行數(shù)學(xué)運(yùn)算,計(jì)算均值和方差等統(tǒng)計(jì)量。
【例題?單選題】(2020年)對(duì)順序變量觀測的結(jié)果稱為()。
A.順序數(shù)據(jù)
B.定量數(shù)據(jù)
C.分類數(shù)據(jù)
D.數(shù)值型數(shù)據(jù)
『正確答案」A
r答案解析J數(shù)據(jù)是對(duì)變量進(jìn)行測量、觀測的結(jié)果。順序數(shù)據(jù)是對(duì)順序變量的觀測結(jié)果。
【例題?單選題】下列變量中,屬于分類變量的是()。
A.運(yùn)輸方式
B.公共預(yù)算收入
C.商品零售額
D.新增就業(yè)人數(shù)
r正確答案JA
「答案解析」本題考查變量和數(shù)據(jù)。當(dāng)變量的取值表現(xiàn)為類別時(shí)則被稱為分類變量,比如企業(yè)所屬
行業(yè)。
【例題?多選題】分類數(shù)據(jù)和順序數(shù)據(jù)的共同點(diǎn)是()。
A.可用數(shù)值代碼表示
R.表現(xiàn)為類別
C.通常用文字表述
D.有順序
E.不區(qū)分順序
f正確答案』ABC
『答案解析」本題考查分類數(shù)據(jù)和順序數(shù)據(jù)。二者都表現(xiàn)為類別,都可以用文字表述,也都可以用
數(shù)值代碼表示。
知識(shí)點(diǎn)三:數(shù)據(jù)的來源
<-)按收集方法分類:觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)
1.觀測數(shù)據(jù):通過直接調(diào)查或測量而收集到的數(shù)據(jù),是在沒有對(duì)事物施加任何人為控制因素的條件
下得到的,幾乎所有與社會(huì)經(jīng)濟(jì)現(xiàn)象會(huì)關(guān)的統(tǒng)計(jì)數(shù)據(jù)都是觀測數(shù)據(jù)。
【示例】GDP、CPI、房價(jià)等。
2.實(shí)驗(yàn)數(shù)據(jù):通過在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象以及其所處的實(shí)驗(yàn)環(huán)境收集到的數(shù)據(jù)。自然科學(xué)領(lǐng)域的數(shù)
據(jù)大多都是實(shí)驗(yàn)數(shù)據(jù)。
【示例】一種新產(chǎn)品使用壽命的數(shù)據(jù)等。
(二)統(tǒng)計(jì)數(shù)據(jù)按來源分為:
L一手?jǐn)?shù)據(jù):來源于直接的調(diào)查和科學(xué)實(shí)驗(yàn)的數(shù)據(jù),對(duì)使用者來說這是數(shù)據(jù)的直接來源。來源主要
有:調(diào)查或觀察、實(shí)驗(yàn)。
2.二手?jǐn)?shù)據(jù):來源于別人的調(diào)杳或?qū)嶒?yàn)的數(shù)據(jù),對(duì)使用者來說這是數(shù)據(jù)的間接來源。來源主要有:
統(tǒng)計(jì)年鑒、內(nèi)部財(cái)務(wù)報(bào)表等。
【例題?單選題】(2020年)下列統(tǒng)計(jì)數(shù)據(jù)中,屬于觀測數(shù)據(jù)的是()。
A.居民收入數(shù)據(jù)
B.新藥療效數(shù)據(jù)
C.電池使用壽命數(shù)據(jù)
D.輪胎使用壽命數(shù)據(jù)
I1正確答案』A
【答案解析」通過直接調(diào)查或測量而收集到的數(shù)據(jù),稱為觀測數(shù)據(jù)。觀測數(shù)據(jù)是在沒有對(duì)事物施加
任何人為控制因素的條件下得到的,幾乎所有與社會(huì)經(jīng)濟(jì)現(xiàn)象有關(guān)的統(tǒng)計(jì)數(shù)據(jù)都是觀測數(shù)據(jù)。選項(xiàng)
BCD屬于實(shí)驗(yàn)數(shù)據(jù)。
【例題?單選題】通過直接統(tǒng)計(jì)調(diào)查獲得的數(shù)據(jù)屬于()。
A.二手?jǐn)?shù)據(jù)
B.實(shí)驗(yàn)數(shù)據(jù)
C.間接數(shù)據(jù)
D.一手?jǐn)?shù)據(jù)
『正確答案」D
『答案解析」本題考查數(shù)據(jù)的來源。統(tǒng)計(jì)數(shù)據(jù),就其本身的來源來看,最初都來源于調(diào)查或?qū)嶒?yàn)。
但從使用者的角度看,數(shù)據(jù)的來源主要有兩種:一是直接的調(diào)查和科學(xué)實(shí)驗(yàn),對(duì)使用者來說,這是
數(shù)據(jù)的直接來源,稱為直接數(shù)據(jù)或一手?jǐn)?shù)據(jù);二是別人的調(diào)查或?qū)嶒?yàn)的數(shù)據(jù),對(duì)使用者來說,這是
數(shù)據(jù)的間接來源,稱為間接數(shù)據(jù)或二手?jǐn)?shù)據(jù)。一手?jǐn)?shù)據(jù)的來源主要有兩個(gè):一是調(diào)查或觀察,二是
實(shí)驗(yàn)。在社會(huì)經(jīng)濟(jì)領(lǐng)域,統(tǒng)計(jì)調(diào)查是獲得數(shù)據(jù)的主要方法,也是獲得一手?jǐn)?shù)據(jù)的重要方式。
知識(shí)點(diǎn)四:統(tǒng)計(jì)調(diào)查
(一)統(tǒng)計(jì)調(diào)查的概念與分類
1.統(tǒng)計(jì)調(diào)查:按照預(yù)定的目的和任務(wù),運(yùn)用科學(xué)的統(tǒng)計(jì)調(diào)查方法,有計(jì)劃有組織地收集數(shù)據(jù)信息資
料的過程。
調(diào)查過程有兩個(gè)重要特征:
(1)調(diào)查是一種有計(jì)劃、有方法、有程序的活動(dòng);
(2)調(diào)查的結(jié)果表現(xiàn)為搜集到的數(shù)據(jù)。
2.分類
(1)按調(diào)查對(duì)象的范圍不同
全面調(diào)查:對(duì)構(gòu)成調(diào)查對(duì)象的所有單位進(jìn)行逐一的、無一遺漏的調(diào)查,包括全面統(tǒng)計(jì)報(bào)表和普查。
例如,人口普查、經(jīng)濟(jì)普查等。
非仝面調(diào)查:對(duì)調(diào)查對(duì)象中的一部分單位進(jìn)行調(diào)查,包括非仝面統(tǒng)計(jì)報(bào)表、抽樣調(diào)查、重點(diǎn)調(diào)查和
典型調(diào)查等。例如,城市居民家庭的生活水平等。
(2)按登記的時(shí)間是否連續(xù)
J為觀察總體現(xiàn)象在一定時(shí)期內(nèi)(通常是一年內(nèi))的數(shù)量變化
J要求隨著調(diào)查對(duì)象的發(fā)展變化,連續(xù)地進(jìn)行調(diào)查登記,說明現(xiàn)象產(chǎn)品產(chǎn)量
連續(xù)調(diào)查
的發(fā)展過程能源的消耗等
J目的是了解現(xiàn)象在一段時(shí)期的總量
V間隔一個(gè)相當(dāng)長的時(shí)間(通常是一年以上)所作的調(diào)查生產(chǎn)設(shè)備擁有
不連續(xù)調(diào)
J數(shù)值在短期內(nèi)變化不大,不需要連續(xù)登記量
查
/為了對(duì)總體現(xiàn)象在一定時(shí)點(diǎn)上的狀態(tài)進(jìn)行研究耕地面積等
(-)統(tǒng)計(jì)調(diào)查的方式
統(tǒng)計(jì)報(bào)表、普查、抽樣調(diào)查、重點(diǎn)調(diào)查、典型調(diào)查
調(diào)查方
含義分類/特征
式
按照國家有關(guān)法規(guī)的
1.按調(diào)查對(duì)象范圍的不同分為:全面統(tǒng)計(jì)報(bào)表和非全面統(tǒng)計(jì)
規(guī)定,以一定的原始數(shù)
報(bào)表。目前的大多數(shù)統(tǒng)計(jì)報(bào)表都是全面統(tǒng)計(jì)報(bào)表
統(tǒng)計(jì)報(bào)據(jù)為基礎(chǔ),自上而下地
2.按報(bào)送周期長短的不同分為:日?qǐng)?bào)、月報(bào)、季報(bào)、年報(bào)等
表統(tǒng)一布置,自下而上地
3.按報(bào)表內(nèi)容和實(shí)施范圍的不同分為:國家的、部門的、地
逐級(jí)提供基本統(tǒng)計(jì)數(shù)
方的統(tǒng)計(jì)報(bào)表
據(jù)的一種調(diào)查方式
1普.查通常是二次性的或者周期性的
2.一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間,以避免調(diào)查數(shù)據(jù)的重
為某一特定目的而專復(fù)或遺漏,保證普查結(jié)果的準(zhǔn)確性
門組織的一次性全面3數(shù).據(jù)一般比較準(zhǔn)確,規(guī)范化程度較高,可以為抽樣調(diào)查或
調(diào)查,主要用于了解處其他調(diào)查提供基本依據(jù)
普查
于某一時(shí)點(diǎn)狀態(tài)上的4.使用范圍比較窄,只能調(diào)查一些最基本及特定的現(xiàn)象
社會(huì)經(jīng)濟(jì)現(xiàn)象的基本】.經(jīng)濟(jì)普查每10年進(jìn)行兩次,分別在福逢年份的末尾數(shù)字為
全貌3、8的年份實(shí)施
2.人口普查逢“0”的年份進(jìn)行
3.農(nóng)業(yè)普查逢“6”的年份進(jìn)行,均為每10年一次
從調(diào)查對(duì)象的總體中1經(jīng).濟(jì)性(最顯著優(yōu)點(diǎn))
抽樣調(diào)隨機(jī)抽取一部分單位2.時(shí)效性強(qiáng):可以迅速、及時(shí)地獲得所需要的信息,彌補(bǔ)全
查作為樣本進(jìn)行調(diào)查,并面調(diào)查的不足
根據(jù)樣本調(diào)查結(jié)果來3.適應(yīng)面廣:適用于各個(gè)領(lǐng)域
推斷總體數(shù)量特征的4.準(zhǔn)確性高:誤差往往很小
一種非全面調(diào)查
1.重點(diǎn)單位雖然只是全部單位中的一部分,但就調(diào)查的標(biāo)志
從調(diào)查對(duì)象的全部單值來說在總體中占絕大比重
重點(diǎn)調(diào)
位中選擇少數(shù)重點(diǎn)單2.調(diào)查單位不是隨機(jī)抽取的,結(jié)果不能推斷總體
查
位進(jìn)行調(diào)查3.適用范圍很廣
4.調(diào)查目的只要求了解基本狀況和發(fā)展趨勢
【示例】調(diào)查全國工業(yè)企業(yè)的資產(chǎn)總額情況,只需對(duì)全國大中型工業(yè)企業(yè)進(jìn)行重點(diǎn)調(diào)查即可。因?yàn)?/p>
雖然大中型工業(yè)企業(yè)數(shù)占全國工業(yè)企業(yè)數(shù)不到5%,但這些大中型企業(yè)的資產(chǎn)總額卻占全國工業(yè)的60%
以上。
作用:
根據(jù)調(diào)查的目的與要求,在對(duì)被調(diào)查對(duì)象進(jìn)行全面分
典型調(diào)1.彌補(bǔ)全面調(diào)查的不足
析的基礎(chǔ)上,有意識(shí)地選擇若干具有典型意義的或有
查2.在一定條件下可以驗(yàn)證全面
代表性的單位進(jìn)行的調(diào)查
調(diào)查數(shù)據(jù)的真實(shí)性
【例題?單選題】(2020年)第七次全國人口普查與第六次全國人口普查相同,普查標(biāo)準(zhǔn)時(shí)間定
為普查年份的()。
A.1月1日0時(shí)
B.11月1日0時(shí)
C.7月1口0時(shí)
D.12月31日。時(shí)
[正確答案JB
[答案解析』第六次人口普查的標(biāo)準(zhǔn)時(shí)間為普查年份的11月1日0時(shí)。
【例題?多選題】(2020年)關(guān)于抽樣調(diào)查的說法,正確的有()。
A.抽樣調(diào)查只抽取部分樣本進(jìn)行調(diào)查
B.抽樣調(diào)查的時(shí)效性強(qiáng)
C.抽樣調(diào)查耗費(fèi)大量人力、物力、財(cái)力
D.抽樣調(diào)查根據(jù)樣本調(diào)查結(jié)果推斷總體數(shù)量特征
E.抽樣調(diào)查工作量小
f正確答案JABDE
I1答案解析」抽樣調(diào)查是從調(diào)查對(duì)象的總體中抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查
結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查。所以AD正確。抽樣調(diào)查具有經(jīng)濟(jì)性、時(shí)效性強(qiáng)、適
應(yīng)面廣的特點(diǎn)。由于調(diào)查的樣本單位通常是總體單位中的很小一部分,調(diào)查的工作量小,因而可以
節(jié)省大量的人力、物力、財(cái)力和時(shí)間。所以BE正確,C錯(cuò)誤。
【例題?單選題】為及時(shí)了解全國城市商品零售價(jià)格的變動(dòng)趨勢,按照商品零售額排序?qū)η?5個(gè)
大中型城市的商品零售價(jià)格變化情況進(jìn)行調(diào)查,這種調(diào)查方法屬于()。
A.全面調(diào)查
B.典型調(diào)查
C.重點(diǎn)調(diào)查
D.隨機(jī)調(diào)查
F正確答案JC
「答案解析」本題考杳重點(diǎn)調(diào)查。重點(diǎn)調(diào)查是一種非全面調(diào)查,它是在所要調(diào)查的總體中選擇一部
分重點(diǎn)單位進(jìn)行的調(diào)查。所選擇的重點(diǎn)單位雖然只是全部單位中的一部分,但就調(diào)查的標(biāo)志值來說
在總體中占絕大比重,調(diào)查這一部分單位的情況.能夠大致反映被調(diào)查對(duì)象的基本情況C
【例題?多選題】普查的特點(diǎn)有()。
A.使用范圍廣,適用于各個(gè)領(lǐng)域
B.需要耗費(fèi)大量的人力、物力和財(cái)力
C.周期性的普查通常需要間隔較長時(shí)間
D.規(guī)范化程度較高
E.一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間
『正確答案』BCDE
『答案解析」本題考查統(tǒng)計(jì)調(diào)查的方式“普查的特點(diǎn):(1)普查通常是一次性的或周期性的,由
于普查涉及面廣、調(diào)查單位多,需要耗費(fèi)大量的人力、物力和財(cái)力,通常需要間隔較長的時(shí)間;(2)
普查一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間,以避免調(diào)查數(shù)據(jù)的重復(fù)或遺漏,保證普查結(jié)果的準(zhǔn)確性;
(3)普查的數(shù)據(jù)一般比較準(zhǔn)確,規(guī)范化程度也比較高,因此它可以為抽樣調(diào)查或其他調(diào)查提供基
本依據(jù);(4)普查的使用范圍比較窄,只能調(diào)查一些最基本及特定的現(xiàn)象。
知識(shí)點(diǎn)五:數(shù)據(jù)科學(xué)與大數(shù)據(jù)
(一)數(shù)據(jù)科學(xué):一門通過系統(tǒng)性研究獲取與數(shù)據(jù)相關(guān)的知識(shí)體系的學(xué)科。數(shù)據(jù)科學(xué)一方面研究數(shù)
據(jù)本身的特性和變化規(guī)律,另一方面通過對(duì)數(shù)據(jù)的研究為自然科學(xué)和社會(huì)科學(xué)提供一種新的方法,從而
揭示自然界和人類行為的現(xiàn)象和規(guī)律。
包含:對(duì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、處理、分析、表現(xiàn)等一系列活動(dòng)。
研究對(duì)象數(shù)據(jù)
研究目標(biāo)通過對(duì)數(shù)據(jù)的分析,來解釋、預(yù)測、洞見和決策,為現(xiàn)實(shí)世界服務(wù)
(二)大數(shù)據(jù):指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理利處理的數(shù)據(jù)集合,是需
要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的迤量、高增長率和多樣化的信息資
產(chǎn)。
大數(shù)據(jù)特征(多選)
數(shù)據(jù)量大大數(shù)據(jù)的起始計(jì)量單位是PB(1024TB)、EB或ZB
包括網(wǎng)絡(luò)R志、音頻、視頻、圖片、地理位置等各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)
化的數(shù)據(jù)
L結(jié)構(gòu)化數(shù)據(jù):指存偌在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù)
數(shù)據(jù)多樣性2.非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù),包括所有格式
(多選)的辦公文檔、文本、圖片、報(bào)表、圖像、音頻信息、視頻信息等
3.半結(jié)構(gòu)化數(shù)據(jù):介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一
定的結(jié)構(gòu)性;例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、婚姻、
戶籍、出入境等很多信息
價(jià)值密度低大數(shù)據(jù)價(jià)值密度的高低與數(shù)據(jù)總量的大小成叵比_
數(shù)據(jù)的產(chǎn)生
一般要在秒級(jí)時(shí)間范圍內(nèi)給出分析結(jié)果,超出這個(gè)時(shí)間數(shù)據(jù)就可能失去價(jià)值,即
和處理速度
大數(shù)據(jù)的處理要符合“1秒定律”
快
(三)數(shù)據(jù)挖掘:從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱藏在
其中但又有潛在價(jià)值的信息和知識(shí)的過程。
L數(shù)據(jù)挖掘內(nèi)涵:(多選上
數(shù)據(jù)源必須是真實(shí)的、大量的、有噪聲的
發(fā)現(xiàn)的是用戶感興趣的知識(shí)
發(fā)現(xiàn)的知識(shí)是可接受.可理解.可運(yùn)用的一
并不要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問題
數(shù)據(jù)挖掘以解決實(shí)際問題為出發(fā)點(diǎn),核心任務(wù)是對(duì)數(shù)據(jù)關(guān)系和特征進(jìn)行探索。
2.數(shù)據(jù)挖掘分為:
有指導(dǎo)學(xué)習(xí)對(duì)目標(biāo)需求的概念進(jìn)行學(xué)習(xí)和建模,通過探索數(shù)據(jù)和建立模型來實(shí)現(xiàn)從觀察變
(監(jiān)督學(xué)習(xí))量到目標(biāo)需求的有效解程
無指導(dǎo)學(xué)習(xí)
沒有明確的標(biāo)識(shí)變量來表達(dá)目標(biāo)概念,主要任務(wù)是探索數(shù)據(jù)之間的內(nèi)在聯(lián)系和
(非監(jiān)督學(xué)
結(jié)構(gòu)
習(xí))
3.數(shù)據(jù)挖掘算法:常用的算法有分類、聚類分析、關(guān)聯(lián)分析、趨勢與演化分析、特征分析、異常分
析等。(多選)
分類確定目標(biāo)對(duì)象屬于哪個(gè)預(yù)定的類別,以實(shí)現(xiàn)對(duì)未來潛在的預(yù)測需求
把?組數(shù)據(jù)按照差異性和相似性分為幾個(gè)類別,使得同類的數(shù)據(jù)相似性盡量大,
聚類分析
不同類的數(shù)據(jù)相似性盡可能小,跨類的數(shù)據(jù)關(guān)聯(lián)性盡可能低
對(duì)數(shù)據(jù)集中反復(fù)出現(xiàn)的相關(guān)關(guān)系和關(guān)聯(lián)性進(jìn)行挖掘提取,從而可以根據(jù)一個(gè)數(shù)
關(guān)聯(lián)分析
據(jù)項(xiàng)的出現(xiàn)預(yù)測其他數(shù)據(jù)項(xiàng)的出現(xiàn)
趨勢與演化包括數(shù)據(jù)變化趨勢、序列模式分析、周期性分析以及相似程度分析等內(nèi)容,纏
分析計(jì)學(xué)的回歸分析方法經(jīng)常用于這類問題的分析
(四)數(shù)據(jù)可視化:借助圖形化手段清晰有效地傳達(dá)與溝通信息。(多選)
簡單,表現(xiàn)清晰,利用人對(duì)形狀、顏色、運(yùn)動(dòng)的敏感,有效傳遞信息,幫
可視化優(yōu)勢
助用戶從數(shù)據(jù)中發(fā)現(xiàn)關(guān)系、規(guī)律和趨勢
面向科學(xué)與工程領(lǐng)域的數(shù)據(jù),如包含空間坐標(biāo)和幾何信息的三維空間測量
科學(xué)可視
數(shù)據(jù)、計(jì)算機(jī)模擬數(shù)據(jù)和醫(yī)學(xué)影像數(shù)據(jù),重點(diǎn)探索以幾何、拓?fù)浜托螤钐?/p>
兩大分化
征來呈現(xiàn)數(shù)據(jù)中蘊(yùn)含的規(guī)律
支
信息可視處理對(duì)象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù),如金融交易、社交網(wǎng)絡(luò)和文本
化數(shù)據(jù)
【例題?多選題】(2020年)關(guān)于大數(shù)據(jù)多樣性的說法,正確的有()。
A.大數(shù)據(jù)只包括結(jié)構(gòu)化數(shù)據(jù)
B.結(jié)構(gòu)化數(shù)據(jù)是指存儲(chǔ)在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù)
C.半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù)
D.半結(jié)構(gòu)化數(shù)據(jù)具有一定的結(jié)構(gòu)性
E.非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整、沒有預(yù)定義的數(shù)據(jù)
[正確答案」BCDE
『答案解析」大數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置等各種結(jié)構(gòu)化、半結(jié)
構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指存儲(chǔ)在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù);非
結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù),包括所有格式的辦公文檔、文本、
圖片、報(bào)表、圖像、音頻信息、視頻信息等;半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化
數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性,例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、
婚姻、戶籍、出入境等很多信息。
【例題?多選題】(2020年)關(guān)于數(shù)據(jù)可視化的說法,正確的有()。
A.數(shù)據(jù)可視化借助圖形化手段清晰有效地傳達(dá)與溝通信息
B.數(shù)據(jù)可視化包含科學(xué)可視化和信息可視化兩個(gè)重點(diǎn)分支
C.數(shù)據(jù)可視化傳達(dá)的信息比較復(fù)雜,需要專力解讀
D.科學(xué)可視化面向科學(xué)與工程領(lǐng)域數(shù)據(jù)
E.信息可視化的處理對(duì)象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù)
『正確答案』ABDE
f答案解析』數(shù)據(jù)可視化,即借助圖形化手段清晰有效地傳達(dá)與溝通信息。可視化的優(yōu)勢在于簡單,
表現(xiàn)清晰,利用人對(duì)形狀、顏色、運(yùn)動(dòng)的敏感,有效傳遞信息,幫助用戶從數(shù)據(jù)中發(fā)現(xiàn)關(guān)系、規(guī)律
和趨勢。所以C錯(cuò)誤。數(shù)據(jù)可視化包含兩個(gè)重點(diǎn)分支:科學(xué)可視化和信息可視化??茖W(xué)可視化面向
科學(xué)與工程領(lǐng)域的數(shù)據(jù);信息可視化的處理對(duì)象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù)。
【例題?多選題】以下屬于大數(shù)據(jù)特征的有()。
A.數(shù)據(jù)量大
B.數(shù)據(jù)多樣性
C.數(shù)據(jù)的產(chǎn)生和處理速度快
D.價(jià)值密度高
E.價(jià)值高
『正確答案』ABC
r答案解析」本題考查大數(shù)據(jù)特征。大數(shù)據(jù)的特征有:數(shù)據(jù)量大、數(shù)據(jù)多樣性、價(jià)值密度低、數(shù)據(jù)
的產(chǎn)生和處理速度快。
廣|統(tǒng)計(jì)學(xué)兩大分支H觸潮計(jì)
T變量
T統(tǒng)計(jì)潮查分皿E圖r
統(tǒng)計(jì)與統(tǒng)計(jì)科學(xué)
全1微怫原
血
一統(tǒng)計(jì)調(diào)查方式卜_____
膽Wt
而
q統(tǒng)計(jì)科學(xué)與大數(shù)據(jù)卜gm咐語鼠分類,集法
本章考情
年份單選題多選題合計(jì)
2020年4題4分0題。分4分
2019年2題2分1題2分4分
2018年3題3分1題2分5分
本章重點(diǎn):
1.測度數(shù)據(jù)集中趨勢的統(tǒng)計(jì)量:均值、中位數(shù)和眾數(shù)。
2.測度數(shù)據(jù)離散程度的統(tǒng)計(jì)量:方差、標(biāo)準(zhǔn)差和離散系數(shù)。
3.測度數(shù)據(jù)分布偏態(tài)的統(tǒng)計(jì)量:偏態(tài)系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)。
4.測度變量相關(guān)關(guān)系的統(tǒng)計(jì)量:散點(diǎn)圖、相關(guān)系數(shù)。
知識(shí)點(diǎn)一:集中趨勢的測度
1.均值。平均數(shù),數(shù)據(jù)組中所有數(shù)值的總和除以該組數(shù)值的個(gè)數(shù)。
均值是集中趨勢最主要的測度值,它是一組數(shù)據(jù)的重心所在,解釋了一組數(shù)據(jù)的平均水平。
a
f員+……+Z_
nn
【示例】某售貨小組5名營業(yè)員,元旦一天的銷售額分別為520元、600元、480元、750元和500
元,求該日平均銷售額。
平均銷售額=(520+600+480+750+500)4-5=570(元)
【注意1】均值主要適用于數(shù)值型數(shù)據(jù),但不適用于分類和順序數(shù)據(jù)。
【注意2】均值容易受到極端值的影響,極端值會(huì)使得均值向極大值或極小值方向傾斜,使得均值
對(duì)數(shù)據(jù)組的代表性減弱。
需要全部信息避不開極端值!
2.中位數(shù)。把一組數(shù)據(jù)按從小到大或從大到小的順序進(jìn)行排列,位置居中的數(shù)值叫作中位數(shù),用
Mr表不:
rx-
苧當(dāng)n為奇數(shù)時(shí)
-(X+X)當(dāng)n為偶數(shù)時(shí)
129'(-+1)
【注意1】中位數(shù)是一個(gè)位置代表值,主要用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù)。
【注意2】中位數(shù)的優(yōu)點(diǎn):不受極端值的影響,抗干擾性強(qiáng),尤其適用于偏斜分布的數(shù)值型數(shù)據(jù)。
不需要全部信息能避開極端值!
3.眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)(頻數(shù))最多的變量值°不適用于描述定量數(shù)據(jù)的集中位置。
【注意】適用于描述分類數(shù)據(jù)和順序數(shù)據(jù)的集中趨勢。在定量數(shù)據(jù)中,可能出現(xiàn)多眾數(shù)和無眾數(shù)的
情況,因此眾數(shù)不適于描述定量數(shù)據(jù)的集中位置。
不需要全部信息能避開極端值!
總結(jié):
指標(biāo)適用特點(diǎn)
?利用全部信息,受極端值影響
均值定量變量
?如有明顯極端值,則代表性差
順序變量?不受極端值影響
中位數(shù)
定量變量?適用于分布不對(duì)稱的數(shù)據(jù)
?沒有充分利用全部信息,穩(wěn)定性優(yōu)于眾數(shù),差于均值
?沒有充分利用全部信息.,不受極端值影響
分類變量
眾數(shù)?適用于分布明顯呈偏態(tài)的數(shù)據(jù)
順序變量
,可能不唯一
【例題?單選題】(2020年)在測度數(shù)據(jù)集中趨勢時(shí),中位數(shù)與眾數(shù)的共同優(yōu)點(diǎn)是()。
A.能夠充分利用數(shù)據(jù)的全部信息
B.適用于分類變量
C.適用于定量變量
D.不受極端值影響
「正確答案」D
[答案解析]中位數(shù)與眾數(shù)的共同優(yōu)點(diǎn)是都不受極端值的影響。
【例題?單選題】2019年某企業(yè)集團(tuán)下轄8個(gè)分公司的銷售額分別為10000萬元、3600萬元、800
萬元、1000萬元、600萬元、3000萬元、2800萬元、2200萬元,這組數(shù)據(jù)中的中位數(shù)是()萬元。
A.2200
B.2800
C.2500
D.3000
『正確答案」C
[答案解析」本題考查中位數(shù)的計(jì)算。(2800+2200)/2=2500o
知識(shí)點(diǎn)二:離散程度的測度
(一)方差和標(biāo)準(zhǔn)差
離散程度:反映數(shù)據(jù)之間的差異程度。集中趨勢的測度值對(duì)一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)
的離散水平。
數(shù)據(jù)的離散程度越大,集中趨勢的測度值對(duì)該組數(shù)據(jù)的代表性就越差;離散程度解小,其代表性就
越好。
L方差
(1)方差:數(shù)據(jù)組中各數(shù)值與其均值離差平方的平均數(shù)。
(2)方差越小,說明數(shù)據(jù)值與均值的平均距離越小,均值的代表性越好。
》總體方差公式:
N_
2
Z(\-x)N_
a2=-----------s2=—-Y)2
NN-1外
》樣本方差公式:
1區(qū)-劉
一(n-1)
【示例】某售貨小組5名營業(yè)員,元旦一天的銷售額分別為520元、600元、480元、750元和500
元,平均銷售額為570元,計(jì)算日銷售額的樣本方差。
Z(x「劉
e2_j-1____________
"(n-1)
=[(520-570)2+(600-570)2+(480-570)2+(750-570)2+(500-570)2]4-(5-1)
=12200(元2)
2.標(biāo)準(zhǔn)差
方差是反映數(shù)據(jù)離散程度的重要測度指標(biāo),但是其單位是原數(shù)據(jù)單位的平方,沒有解釋意義。因此,
我們經(jīng)常使用標(biāo)準(zhǔn)差來測度數(shù)據(jù)的離散程度,標(biāo)準(zhǔn)差即方差的平方根。標(biāo)準(zhǔn)差與方差只適用于數(shù)值型
數(shù)據(jù),它們對(duì)極端值很敏感。
Z(x.-x)2
【示例】5名營業(yè)員元旦當(dāng)天的銷售額的標(biāo)準(zhǔn)差
=^^2200=110.45(7L)
(二)離散系數(shù)
L離散系數(shù):變異系數(shù)或標(biāo)準(zhǔn)差系數(shù)。
2.標(biāo)準(zhǔn)差與均值的比值:
s
cv=2
X
3.適用:不同類別數(shù)據(jù)離散程度的比較。
【注意】標(biāo)準(zhǔn)差的大小不僅與數(shù)據(jù)的測度單位有關(guān),也與觀測值的均值大小有關(guān),不能直接用標(biāo)準(zhǔn)
差比較不同變量的離散程度。離散系數(shù)消除了測度單位和觀測值水平不同的影響,因而可以直接用來
比較變量的離散程度。
【示例】某學(xué)校學(xué)生的平均年齡為20歲,標(biāo)準(zhǔn)差為3歲;該校教師的平均年齡為38歲,標(biāo)準(zhǔn)差為
3歲。比較該校學(xué)生年齡和教師年齡的離散程度。
「止確答案」學(xué)生年齡的離散程發(fā)更大。
I■答案解析」學(xué)生年齡的離散系數(shù)=3/20=0.15
教師年齡的離散系數(shù)=3/38=0.0789
【例題?單選題】(2020年)與標(biāo)準(zhǔn)差相比,方差在測度數(shù)據(jù)離散程度時(shí)的缺點(diǎn)是()。
A.計(jì)算方法復(fù)雜
B.不適用于數(shù)值型數(shù)據(jù)
C.其單位是原數(shù)據(jù)單位的平方,沒有解釋意義
D.數(shù)學(xué)性質(zhì)較差
r正確答案」C
[答案解析」方差是反映數(shù)據(jù)離散程度的重要測度指標(biāo),但是其單位是原數(shù)據(jù)單位的平方,沒有解
釋意義。
【例題?多選題】下列統(tǒng)計(jì)量中,容易受極端值影響的有()。
A.均值
B.方差
C.眾數(shù)
D.中位數(shù)
E.標(biāo)準(zhǔn)差
『正確答案1ARE
『答案解析」本題考查集中趨勢和離散程度的測度指標(biāo)。均值、方差、標(biāo)準(zhǔn)差容易受極端值的影響。
【例題?單選題】根據(jù)2014年某城市金融業(yè)和制造業(yè)各1000人的年薪樣本數(shù)據(jù)來比較這兩個(gè)行業(yè)
從業(yè)人員年薪的離散程度,應(yīng)采用的統(tǒng)計(jì)量是()。
A.標(biāo)準(zhǔn)分?jǐn)?shù)
B.相關(guān)系數(shù)
C.變異系數(shù)
D.偏態(tài)系數(shù)
f正確答案」C
『答案解析』本題考查離散系數(shù)。離散系數(shù)也稱為變異系數(shù)或標(biāo)準(zhǔn)差系數(shù),即標(biāo)準(zhǔn)差與均值的比值,
主要用于不同類別數(shù)據(jù)離散程度的比較。
知識(shí)點(diǎn)三:分布形態(tài)的測度
(一)偏態(tài)系數(shù)(SK):
1.偏度:指數(shù)據(jù)分布的偏斜方向和程度,描述數(shù)據(jù)分布對(duì)稱程度。(.匿選)
2.偏態(tài)系數(shù):測度數(shù)據(jù)分布偏度的指標(biāo)。偏態(tài)系數(shù)取決?于離差三次方的平均數(shù)與標(biāo)準(zhǔn)差三次方的
比值。
SK=
(〃-1)〃(力-2)yElIfsJ
3.應(yīng)用:偏態(tài)系數(shù)的絕對(duì)值越大,說明數(shù)據(jù)分布的偏斜程度越大。
SK=0說明數(shù)據(jù)分布是對(duì)隨
SK>01.說明數(shù)據(jù)分布為右偏
偏態(tài)系數(shù)為正2.取值。?0.5(說明輕度右偏)0.5-1(說明中度右偏)大于1(說明嚴(yán)重右
值偏)
SK<01.說明數(shù)據(jù)分布為左偏
偏態(tài)系數(shù)為負(fù)2.0^0.5(說明輕度左偏)一0.5^^-1(說明中度左偏)小于一1(說明嚴(yán)
值重左偏)
【例題?單選題】(2020年)下列統(tǒng)計(jì)量中,用于測度數(shù)據(jù)分布偏度的是()。
A.方差
B.標(biāo)準(zhǔn)差
C.偏態(tài)系數(shù)
D.均值
I1正確答案』C
『答案解析」測度數(shù)據(jù)分布偏度的統(tǒng)計(jì)量稱為偏態(tài)系數(shù)。
【例題?單選題】(2020年)如果一組數(shù)據(jù)的偏態(tài)系數(shù)為-0.4,則該組數(shù)據(jù)的分布為()。
A.輕度左偏
B.中度左偏
C.中度右偏
D.輕度右偏
『正確答案」A
[答案解析』偏態(tài)系數(shù)為0,說明數(shù)據(jù)的分布是對(duì)稱的。偏態(tài)系數(shù)為正,說明分布是右偏的,取值
在。?0.5之間說明輕度右偏,取值在0.5?1之間,說明中度右偏,取值大于1說明嚴(yán)重右偏;偏
態(tài)系數(shù)為負(fù),說明分布為左偏.取值在0-----0.5之間,說明輕度左偏.取值在-0.5-----1之間.
說明中度左偏,取值小于一1,說明嚴(yán)重左偏。本題中,偏態(tài)系數(shù)為-0.4,說明輕度左偏。
【例題?單選題】關(guān)于偏態(tài)系數(shù)的說法,正確的是()。
A.偏態(tài)系數(shù)為正值,說明數(shù)據(jù)對(duì)稱
B.偏態(tài)系數(shù)的絕對(duì)值越大,說明數(shù)據(jù)越對(duì)稱
C.偏態(tài)系數(shù)等于0,說明數(shù)據(jù)對(duì)稱
D.偏態(tài)系數(shù)等于1,說明數(shù)據(jù)對(duì)稱
『正確答案』C
『答案解析」本題考查偏態(tài)系數(shù)。如果偏態(tài)系數(shù)為正值,說明分布為右偏的"A選項(xiàng)錯(cuò)誤。偏態(tài)系
數(shù)的絕對(duì)值越大,說明數(shù)據(jù)分布的偏斜程度越大。B選項(xiàng)錯(cuò)誤。偏態(tài)系數(shù)等于0,說明數(shù)據(jù)對(duì)稱。C
選項(xiàng)正確。偏態(tài)系數(shù)等于1,說明系數(shù)中度右偏。D選項(xiàng)錯(cuò)誤。
【例題?多選題】在某電商網(wǎng)站上,商品甲得到6個(gè)評(píng)價(jià)得分,分別是1、4、4、5、5、5;商品
乙得到5個(gè)評(píng)分,分別是3、3、3、4、4。關(guān)于這兩組數(shù)據(jù)的說法,正確的有()。
A.商品中的評(píng)分中位數(shù)高于商品乙
B.商品甲的評(píng)分均值低于商品乙
C商品甲的評(píng)分眾數(shù)高于商品乙
D.商品甲的評(píng)分分布離散程度大于商品乙
E.商品甲的評(píng)分分布是左偏的
『正確答案』ACDE
I1答案解析」本題考查集中趨勢、離散程度的測度。
商品甲:評(píng)分中位數(shù)=(4+5)/2=4.5,眾數(shù)=5,均值=(1+4+4+5+5+5)/6=4,方
差=[(1-4)24-(4-4)2+(4-4)2+(5-4)2+(5-4)24-(5-4)2]/5=2.4,標(biāo)準(zhǔn)差
=1.55,離散系數(shù)=1.55/4=0.3875。
商品乙:評(píng)分中位數(shù)=3,眾數(shù)=3,均值=3.4,標(biāo)準(zhǔn)差=0.55,離散系數(shù)=0.55/3.4=0.16。
由于商品甲離差三次方,即(1-4)3+(4-4)3+(4-4)3+(5-4)3+(5-4)3+(5
-4)3=-24,根據(jù)公式可知偏態(tài)系數(shù)為負(fù),說明數(shù)據(jù)分布左偏。
(-)標(biāo)準(zhǔn)分?jǐn)?shù)
1.標(biāo)準(zhǔn)分?jǐn)?shù)(Z分?jǐn)?shù)):統(tǒng)計(jì)學(xué)上常用的一種標(biāo)準(zhǔn)化方法。標(biāo)準(zhǔn)分?jǐn)?shù)可以給出數(shù)值距離均值的相對(duì)
位置,用于比較不同分布的變量值。
2.公式:標(biāo)準(zhǔn)分?jǐn)?shù)2=(數(shù)值一均值)+標(biāo)準(zhǔn)差
3.結(jié)果:標(biāo)準(zhǔn)分?jǐn)?shù)Z越大越好。
【注意】轉(zhuǎn)變后的標(biāo)準(zhǔn)分?jǐn)?shù)并沒有改變數(shù)值在原分布中的位置,也沒有改變數(shù)據(jù)原分布的偏度,但
是標(biāo)準(zhǔn)分?jǐn)?shù)的平均數(shù)為0,標(biāo)準(zhǔn)差為1。
【示例1】考核A中員工得分80分,均值80分,標(biāo)準(zhǔn)差為20分,在考核B中員工得分70分,均
值60分,標(biāo)準(zhǔn)差為5分。
80分的Z分?jǐn)?shù)=(80-80)4-20=0
70分的Z分?jǐn)?shù)=(70-60)小5=2
【說明】70分在考核B中的相對(duì)排名高于80分在考核A中的相對(duì)排名。
【示例2】某班期末考試。語文考試全班平均成績73分,標(biāo)準(zhǔn)差7分,甲得了78分;數(shù)學(xué)考試全
班平均成績80分,標(biāo)準(zhǔn)差6.5分,甲得了83分。甲哪一門成績更優(yōu)秀?
因?yàn)閮煽品植?均值、標(biāo)準(zhǔn)差)不同,不能用原始數(shù)據(jù)直接比較,需要轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后比較。
Z(語文)=(78-73)4-7=0.71
z(數(shù)學(xué))=(83-80)+6.5=0.46
【說明】甲的語文成績更優(yōu)秀,
4.實(shí)際應(yīng)用:當(dāng)數(shù)據(jù)服從對(duì)稱的鐘形分布時(shí),可以運(yùn)用經(jīng)驗(yàn)法則來判斷與均值的距離在特定倍數(shù)標(biāo)
準(zhǔn)差之內(nèi)的數(shù)據(jù)項(xiàng)所占比例。
-68.00%-
—95.00%~
1--------------99.00%-------------1
約有68%的數(shù)據(jù)與平均數(shù)的距離在1個(gè)標(biāo)準(zhǔn)差之內(nèi),標(biāo)準(zhǔn)分?jǐn)?shù)在[-1,1]_范圍內(nèi):
約有嬴的數(shù)據(jù)與平均數(shù)的距離在2個(gè)標(biāo)準(zhǔn)差之內(nèi),標(biāo)準(zhǔn)分?jǐn)?shù)在[-2,2]范圍內(nèi):
約有繆的數(shù)據(jù)與平均數(shù)的距離在3個(gè)標(biāo)準(zhǔn)差之內(nèi),標(biāo)準(zhǔn)分?jǐn)?shù)在[-3,3]范圍內(nèi)。
【示例】語文考試全班平均成績73分,標(biāo)準(zhǔn)差7分:
則68%的同學(xué)得分在66和80之間;
則95%的同學(xué)得分在59和87之間;
則99國的同學(xué)得分在52和94之間,
【例題?單選題】某公司員工年度業(yè)績考核中,全體員工考核成績的均值為80,方差為25。某員
工在這次業(yè)績考核中成績?yōu)?5,則該員工考核成績的標(biāo)準(zhǔn)分?jǐn)?shù)為(
A.3.4
B.0.2
C.1.0
D.17.0
「正確答案」C
f答案解析』本題考查分布形態(tài)的測度。標(biāo)準(zhǔn)分?jǐn)?shù)可以給出數(shù)值距離均值的相對(duì)位置,計(jì)算方法是
用數(shù)值減去均值所得的差除以標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)分?jǐn)?shù)=(85—80)/5=1。
【例題?多選題】某企業(yè)客戶滿意度數(shù)據(jù)服從對(duì)稱的鐘形分布,均值為75,標(biāo)準(zhǔn)差為5。根據(jù)經(jīng)驗(yàn)
法則,關(guān)于該企業(yè)客戶滿意度的說法,正確的有()。
A.約有68%的客戶滿意度在[70,80]范圍內(nèi)
B.約有68%的客戶滿意度在[75,85]范圍內(nèi)
C.約有95%的客戶滿意度在[75,95]范圍內(nèi)
D.約有95%的客戶滿意度在[65,85]范圍內(nèi)
E.約有99%的客戶滿意度在[60,90]范圍內(nèi)
I1正確答案』ADE
『答案解析』本題考查標(biāo)準(zhǔn)分?jǐn)?shù)。經(jīng)驗(yàn)法則表明:約有68%的數(shù)據(jù)與平均數(shù)的距離在1個(gè)標(biāo)準(zhǔn)差之
內(nèi),約有95%的數(shù)據(jù)與平均數(shù)的距離在2個(gè)標(biāo)準(zhǔn)差之內(nèi),約有99%的數(shù)據(jù)與平均數(shù)的距離在3個(gè)標(biāo)
準(zhǔn)差之內(nèi)。
知識(shí)點(diǎn)四:變量間的相關(guān)分析
(一)相關(guān)關(guān)系分類
1.按相關(guān)的程度:完全相關(guān)、不完全相關(guān)和不相關(guān)C
2.按相關(guān)的方向:正相關(guān)和負(fù)相關(guān)。
3.按相關(guān)的形式:線性相關(guān)和非線性相關(guān)。
【注意]相關(guān)關(guān)系并不等同于因果關(guān)系。
(二)兩變量的散點(diǎn)圖:兩個(gè)變顯間的關(guān)系可以用散點(diǎn)圖來展示。
1.觀測點(diǎn)分布無規(guī)律:不相關(guān)。
2.觀測點(diǎn)分布密集在一條線周圍:線性相關(guān)。
(1)正相關(guān):直線向右上傾斜;
(2)負(fù)相關(guān):直線向右下傾斜。
3.觀測點(diǎn)呈現(xiàn)曲線模式:兩個(gè)變量非線性相關(guān).
(三)相關(guān)系數(shù)的定義和計(jì)算
1.Pearson相關(guān)系數(shù):度量的是兩個(gè)變量之間的線性相關(guān)關(guān)系。
2.Pearson相關(guān)系數(shù)的取值范圍:—
(1)0<r^l:變量X和Y之間存在正線性相關(guān)關(guān)系;
(2)-l^r<0:變量X和Y之間存在負(fù)線性相關(guān)關(guān)系;
(3)r=l:變量X和Y之間為完全正線性相關(guān),即變量Y的取值完全依賴于變量X;
(4)r=-l:變量X和Y之間為完全負(fù)線性相關(guān),即變量Y的取值完全依賴于變量X。
【注意】Pearson相關(guān)系數(shù)只適用于線性相關(guān)關(guān)系的判斷。因此三=0只表示兩個(gè)變量之間不存在
線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如它們之間可能存在非線性相關(guān)關(guān)系。
3.相關(guān)程度:
(1)|r>0.8:高度相關(guān);
<2)0.5<|r|<0,8:中度相關(guān);
<3)0.3<|r|<0.5:低度相關(guān);
<4)|r|<0.3:說明兩個(gè)變量之間的相關(guān)程度極弱,可視為無線性相關(guān)關(guān)系。
【例題-多選題】關(guān)于相關(guān)關(guān)系的說法,正確的有()。
A.完全相關(guān)是指一個(gè)變量的取值變化完全由另一個(gè)變量的取值變化所確定
B.相關(guān)關(guān)系等同于因果關(guān)系
C.正相關(guān)是指一個(gè)變量的取值隨著另一個(gè)變量的取值增大而增大
D.不相關(guān)是指兩個(gè)變量的取值變化彼此互不影響
E.相關(guān)關(guān)系等同于函數(shù)關(guān)系
『正確答案』ACD
f答案解析」本題考查變量間的相關(guān)關(guān)系。相關(guān)關(guān)系并不等同于因果關(guān)系和函數(shù)關(guān)系。
【例題?單選題】根據(jù)下面的變量X和變量Y的散點(diǎn)圖,可以看出這兩個(gè)變量的Pearson相關(guān)系數(shù)
r的取值范圍是()。
15(T
100-
50-
0-
?50-
?100-
-15G
A.r<—1
B.OWrVl
C.r21
D.-l^r<0
『正確答案』D
f答案解析」本題考查散點(diǎn)圖與相關(guān)關(guān)系。若一lWrVO,表明變量X和Y之間存在負(fù)線性相關(guān)關(guān)
系O
【例題?單選題】2014年某企業(yè)員工的工齡和月平均工資的散點(diǎn)圖如下:
.一
Q5000個(gè)????????「?
4500?**
)???
胃4000…
篦3500:f*
叮3000.:*
2500
2000
15005101520253035
1000工齡(年)
500
0
根據(jù)以上散點(diǎn)圖,工齡和月平均工資兩個(gè)變量的相關(guān)關(guān)系是().
A.正相關(guān)、線性相關(guān)
B.負(fù)相關(guān)、線性相關(guān)
C.正相關(guān)、非線性相關(guān)
D.負(fù)相關(guān)、非線性相關(guān)
I1正確答案』C
『答案解析』本題考查散點(diǎn)圖。首先,觀測點(diǎn)的走勢很容易判斷出是正相關(guān)關(guān)系;其次,觀測點(diǎn)呈
現(xiàn)出曲線模式,并不是直線的模式,所以兩個(gè)變量為非線性相關(guān)關(guān)系。
均值、中位數(shù)、眾數(shù)
本章考情
年份單選題多選題合計(jì)
2020年1題1分1題2分3分
2019年1題1分2題4分5分
2018年4題4分1題2分6分
本章重點(diǎn):
1.抽樣調(diào)查基本概念:總體、樣本、樣本量、總體參數(shù)、樣本統(tǒng)計(jì)量與抽樣框。
2.概率抽樣和非概率抽樣,抽樣誤差和非抽樣誤差(抽樣框誤差、無回答誤差、計(jì)量誤差)。
3.幾種基本概率抽樣方法:簡單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣和多階段抽樣。
4.估計(jì)量的性質(zhì),抽樣誤差影響因素,樣本量的影響因素。
知識(shí)點(diǎn)一:抽樣調(diào)查基本概念
(一)抽樣調(diào)查基本概念
1.總體:調(diào)杳對(duì)象的全體,調(diào)查總體必須是明確的而不能是模糊的。
【示例】研究全國鋼鐵企業(yè)盈利狀況,所有鋼鐵企業(yè)是總體。
2.樣本:總體的一部分,它由從總體中按一定原則或程序抽出的部分個(gè)體所組成。
樣本量:樣本中包含的入樣單位的個(gè)數(shù)。
【示例】選取了20家鋼鐵企業(yè)是樣本。
3.抽樣框:供抽樣所用的所有抽樣單元的名單,是抽樣總體的具體表現(xiàn)。
【示例】工商局注冊(cè)的200家企業(yè);公司200名注冊(cè)在職人員名冊(cè)。
4.總體參數(shù):變量的數(shù)字特征,根據(jù)總體中所有單位的數(shù)值計(jì)算的。
【示例】所有鋼鐵企業(yè)盈利總額,所有鋼鐵企業(yè)盈利均值。
5.樣本統(tǒng)計(jì)量:根據(jù)樣本中各單位的數(shù)值計(jì)算的,是對(duì)總體參數(shù)的估計(jì),因此也稱為估計(jì)量。
常用的樣本統(tǒng)計(jì)量:樣本均值,樣本比例、樣本方差等。
【示例】20家企業(yè)盈利總額,20家企業(yè)盈利均值。
【例題?單選題】供抽樣所用的所有抽樣單元的名單稱為()。
A.抽樣框
B.總體
C.總體參數(shù)
D.樣本
『正確答案」A
f答案解析」本題考查抽樣框。抽樣框是供抽樣所用的所有抽樣單元的名單,是抽樣總體的具體表
現(xiàn)。
【例題?單選題】從某單位所有在職員工中隨機(jī)抽取300人進(jìn)行抽樣調(diào)查,來研究該單位在職職工
中亞健康人員占比狀況,該項(xiàng)調(diào)查的總體是()。
A.隨機(jī)抽取的300名在職員工
B.該單位所有亞健康在職員工
C.該單位所有在職員工
D.被調(diào)查的300名在職員工中的亞健康員工
『正確答案」C
f答案解析」本題考查抽樣調(diào)查的基本概念??傮w即調(diào)查對(duì)象的全體,乜就是該單位所有在職員工。
(二)概率抽樣與非概率抽樣
根據(jù)抽取樣本方法的不同,抽樣分為:
1.概率抽樣(隨機(jī)抽樣):指依據(jù)隨機(jī)原則,按照某種事先設(shè)計(jì)的程序,從總體中抽取部分單元的
方法。
(1)隨機(jī)原則:在抽取樣本時(shí)排除主觀」?有意識(shí)地抽取調(diào)查單元的情況.使每個(gè)單元都有一定的
機(jī)會(huì)被抽中。
(2)特點(diǎn):
J按一定的概率以隨機(jī)原則抽取樣本;
J總體中每個(gè)單元被抽中的概率是已知的,或者是可以計(jì)算出來的;
J當(dāng)采用樣本對(duì)總體參數(shù)進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單元被抽中的概率。
(3)分類:
等概率抽樣每個(gè)單位被抽入樣本的概率相等
不等概率抽樣每個(gè)單位被抽入樣本的概率不同
2.非概率抽樣(非隨機(jī)抽樣):調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本的方法。
(1)最主要的特征:抽取樣本時(shí)并不是依據(jù)隨機(jī)原則。
(2)非概率抽樣方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 湘教版九年級(jí)數(shù)學(xué)下冊(cè)2.5直線與圓的位置關(guān)系2.5.3切線長定理聽評(píng)課記錄
- 小學(xué)數(shù)學(xué)五年級(jí)數(shù)學(xué)《植樹問題》聽評(píng)課記錄
- 生態(tài)物流服務(wù)合同(2篇)
- 教科版道德與法治九年級(jí)下冊(cè)第十四課《第一次選擇》聽課評(píng)課記錄
- 湘教版數(shù)學(xué)八年級(jí)上冊(cè)4.3《一元一次不等式的解法》聽評(píng)課記錄1
- 華師大版數(shù)學(xué)七年級(jí)上冊(cè)《角》聽評(píng)課記錄2
- 新版蘇教版小學(xué)數(shù)學(xué)(二年級(jí)上冊(cè))聽評(píng)課記錄【含教學(xué)計(jì)劃】
- 蘇州蘇教版三年級(jí)下冊(cè)數(shù)學(xué)第七單元《37、認(rèn)識(shí)幾分之一》聽評(píng)課記錄
- 蘇科版數(shù)學(xué)九年級(jí)下冊(cè)5.4《二次函數(shù)與一元二次方程》(第2課時(shí))講聽評(píng)課記錄
- 北師大版歷史七年級(jí)下冊(cè)第22課《明清皇權(quán)膨脹與文化專制》聽課評(píng)課記錄
- 2024年度醫(yī)院內(nèi)科消化科述職報(bào)告課件
- 大動(dòng)脈炎患者的血清代謝組學(xué)及口腔微生物群特征的初步研究
- 經(jīng)濟(jì)學(xué)基礎(chǔ)期末試卷和答案
- 柯頓電臺(tái)操作使用講座
- 小學(xué)科學(xué)項(xiàng)目化學(xué)習(xí)活動(dòng)作業(yè)方案案例設(shè)計(jì)《設(shè)計(jì)制作動(dòng)力小車項(xiàng)目化學(xué)習(xí)》
- 茶與健康 第二講 茶成分課件
- 復(fù)工條件驗(yàn)收?qǐng)?bào)告
- 小學(xué)生作文稿紙A4打印稿
- 2023理論學(xué)習(xí)、理論武裝方面存在問題及原因剖析18條
- GB/T 10095.2-2023圓柱齒輪ISO齒面公差分級(jí)制第2部分:徑向綜合偏差的定義和允許值
- 運(yùn)動(dòng)技能學(xué)習(xí)與控制課件第三章運(yùn)動(dòng)能力與個(gè)體差異
評(píng)論
0/150
提交評(píng)論