2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第1頁
2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第2頁
2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第3頁
2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第4頁
2021中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》考點(diǎn)解析-第四部分 統(tǒng) 計(jì)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

本章考情

年份單選題多選題合計(jì)

2020年4題4分3題6分10分

2019年3題3分1題2分5分

2018年3題3分1題2分5分

本章重點(diǎn):

1.統(tǒng)計(jì)學(xué)、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的含義。

2.變量、數(shù)據(jù),定性變量和定量變量,分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。

3.觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù),一手?jǐn)?shù)據(jù)和二手?jǐn)?shù)據(jù)。

4.統(tǒng)計(jì)調(diào)查的含義及其分類(全面調(diào)查和非全面調(diào)查、連續(xù)調(diào)查和不連續(xù)調(diào)查),常用統(tǒng)計(jì)調(diào)查方

式〔統(tǒng)計(jì)報(bào)表、普查、抽樣調(diào)查、重點(diǎn)調(diào)查和典型調(diào)查)的含義、特點(diǎn)和應(yīng)用場合。

5.數(shù)據(jù)科學(xué)與大數(shù)據(jù)。

知識(shí)點(diǎn)一:統(tǒng)計(jì)學(xué)

(一)統(tǒng)計(jì)學(xué):一門關(guān)于數(shù)據(jù)的學(xué)科,它提供了一系列用于收集、處理、分析和解釋數(shù)據(jù)的方法。

(二)統(tǒng)計(jì)學(xué)兩個(gè)分支:

1.描述統(tǒng)計(jì):研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法。主要內(nèi)容:如何取得所需要的數(shù)據(jù),如何

用圖表或數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理和展示,如何描述數(shù)據(jù)的一般性特征。

【示例】利用統(tǒng)計(jì)圖表展示GDP的變化、利用增長率描述人均可支配收入的基本走勢、利用統(tǒng)計(jì)表

描述公司員工年齡分布等。

2.?斷統(tǒng)計(jì):研究如何利用樣本數(shù)據(jù)來推斷總體特征的方法。_________________________

某國家男青年的身高構(gòu)成一個(gè)總體,想知道這個(gè)總體的均值,

利用樣本信息推斷總

隨機(jī)抽取部分人,測得身高的均值,再用這些數(shù)據(jù)來估計(jì)這群

讓體特征

人的平均身高

假設(shè)檢利用樣本信息判斷對(duì)若假設(shè)“該國男青年平均身高超過1.7米”,需要通過樣本檢

1總體的假設(shè)是否成立驗(yàn)此命題是否成立

【例題?單選題】(2020年)下列統(tǒng)計(jì)處理中,屬于描述統(tǒng)計(jì)的是()。

A.利用均值測度一組數(shù)據(jù)的集中趨勢

B.利用抽樣調(diào)查數(shù)據(jù)推斷城鎮(zhèn)居民平均收入

C.利用樣本信息推斷消費(fèi)者對(duì)某品牌的知曉度

D.利用最小二乘法擬合線性回歸模型

『正確答案」A

r答案解析J描述統(tǒng)計(jì)是研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法。其內(nèi)容包括如何取得所需要的

數(shù)據(jù),如何用圖表或數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行整理和展示,如何描述數(shù)據(jù)的一般性特征。選項(xiàng)BCD屬于

推斷統(tǒng)計(jì)。

【例題?單選題】利用概率樣本數(shù)據(jù)推斷全國居民人均消費(fèi)支出,適用的統(tǒng)計(jì)學(xué)方法是()。

A.參數(shù)估計(jì)

B.相關(guān)分析

C.假設(shè)檢驗(yàn)

D.描述統(tǒng)計(jì)

『正確答案』A

f答案解析』本題考查統(tǒng)計(jì)學(xué)。參數(shù)估計(jì)是利用樣本信息推斷總體特征。

知識(shí)點(diǎn)二,變量和數(shù)據(jù)

(一)變量

1.變量:研究對(duì)象的屬性或特征,它是相對(duì)于常數(shù)而言的。常數(shù)只有一個(gè)固定取值,而變量可以有

兩個(gè)或更多個(gè)可能的取值。

【示例】性別、受教育水平、年收入等。

2.分類:

定量變重(數(shù)量變量)變量的取便是數(shù)量職工人數(shù)、年銷售額等

分類變量變量的取值為類別性別、出行方式、工作行業(yè)等

定性變量變量的取值表現(xiàn)為類別且具有一定順

順序變量客戶滿意度、經(jīng)濟(jì)師職稱等

(二)數(shù)據(jù)

1.含義:對(duì)變量進(jìn)行測量、觀測的結(jié)果。數(shù)據(jù)根據(jù)需要可以是數(shù)值、文字或者圖像等形式。

2.分類

分類變量的觀測結(jié)果,,性別,,

分類數(shù)據(jù)表現(xiàn)為類別,i般用文字來表述,也可用數(shù)值="男”,“女”

代碼表示=“0”,“1”

“客戶滿意度”

順序變量的觀測結(jié)果

="非常滿意”,“滿意”,”不

順序數(shù)據(jù)也表現(xiàn)為類別,一般用文字來表述,也可用數(shù)

滿意”

值代碼表示

=“1”,“2”,“3”

數(shù)值型數(shù)定量變量的觀測結(jié)果“年齡”

1表現(xiàn)為具體表示大小或多少的數(shù)值=“20”,“30”,“40”

3.對(duì)不同類型的數(shù)據(jù),可采用不同的統(tǒng)計(jì)方法來處理和分析。

(1)分類數(shù)據(jù):計(jì)算出各類別的頻率,但對(duì)其進(jìn)行加、減、乘或除等數(shù)學(xué)運(yùn)算是沒有意義的。

(2)數(shù)值型數(shù)據(jù):可以進(jìn)行數(shù)學(xué)運(yùn)算,計(jì)算均值和方差等統(tǒng)計(jì)量。

【例題?單選題】(2020年)對(duì)順序變量觀測的結(jié)果稱為()。

A.順序數(shù)據(jù)

B.定量數(shù)據(jù)

C.分類數(shù)據(jù)

D.數(shù)值型數(shù)據(jù)

『正確答案」A

r答案解析J數(shù)據(jù)是對(duì)變量進(jìn)行測量、觀測的結(jié)果。順序數(shù)據(jù)是對(duì)順序變量的觀測結(jié)果。

【例題?單選題】下列變量中,屬于分類變量的是()。

A.運(yùn)輸方式

B.公共預(yù)算收入

C.商品零售額

D.新增就業(yè)人數(shù)

r正確答案JA

「答案解析」本題考查變量和數(shù)據(jù)。當(dāng)變量的取值表現(xiàn)為類別時(shí)則被稱為分類變量,比如企業(yè)所屬

行業(yè)。

【例題?多選題】分類數(shù)據(jù)和順序數(shù)據(jù)的共同點(diǎn)是()。

A.可用數(shù)值代碼表示

R.表現(xiàn)為類別

C.通常用文字表述

D.有順序

E.不區(qū)分順序

f正確答案』ABC

『答案解析」本題考查分類數(shù)據(jù)和順序數(shù)據(jù)。二者都表現(xiàn)為類別,都可以用文字表述,也都可以用

數(shù)值代碼表示。

知識(shí)點(diǎn)三:數(shù)據(jù)的來源

<-)按收集方法分類:觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)

1.觀測數(shù)據(jù):通過直接調(diào)查或測量而收集到的數(shù)據(jù),是在沒有對(duì)事物施加任何人為控制因素的條件

下得到的,幾乎所有與社會(huì)經(jīng)濟(jì)現(xiàn)象會(huì)關(guān)的統(tǒng)計(jì)數(shù)據(jù)都是觀測數(shù)據(jù)。

【示例】GDP、CPI、房價(jià)等。

2.實(shí)驗(yàn)數(shù)據(jù):通過在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象以及其所處的實(shí)驗(yàn)環(huán)境收集到的數(shù)據(jù)。自然科學(xué)領(lǐng)域的數(shù)

據(jù)大多都是實(shí)驗(yàn)數(shù)據(jù)。

【示例】一種新產(chǎn)品使用壽命的數(shù)據(jù)等。

(二)統(tǒng)計(jì)數(shù)據(jù)按來源分為:

L一手?jǐn)?shù)據(jù):來源于直接的調(diào)查和科學(xué)實(shí)驗(yàn)的數(shù)據(jù),對(duì)使用者來說這是數(shù)據(jù)的直接來源。來源主要

有:調(diào)查或觀察、實(shí)驗(yàn)。

2.二手?jǐn)?shù)據(jù):來源于別人的調(diào)杳或?qū)嶒?yàn)的數(shù)據(jù),對(duì)使用者來說這是數(shù)據(jù)的間接來源。來源主要有:

統(tǒng)計(jì)年鑒、內(nèi)部財(cái)務(wù)報(bào)表等。

【例題?單選題】(2020年)下列統(tǒng)計(jì)數(shù)據(jù)中,屬于觀測數(shù)據(jù)的是()。

A.居民收入數(shù)據(jù)

B.新藥療效數(shù)據(jù)

C.電池使用壽命數(shù)據(jù)

D.輪胎使用壽命數(shù)據(jù)

I1正確答案』A

【答案解析」通過直接調(diào)查或測量而收集到的數(shù)據(jù),稱為觀測數(shù)據(jù)。觀測數(shù)據(jù)是在沒有對(duì)事物施加

任何人為控制因素的條件下得到的,幾乎所有與社會(huì)經(jīng)濟(jì)現(xiàn)象有關(guān)的統(tǒng)計(jì)數(shù)據(jù)都是觀測數(shù)據(jù)。選項(xiàng)

BCD屬于實(shí)驗(yàn)數(shù)據(jù)。

【例題?單選題】通過直接統(tǒng)計(jì)調(diào)查獲得的數(shù)據(jù)屬于()。

A.二手?jǐn)?shù)據(jù)

B.實(shí)驗(yàn)數(shù)據(jù)

C.間接數(shù)據(jù)

D.一手?jǐn)?shù)據(jù)

『正確答案」D

『答案解析」本題考查數(shù)據(jù)的來源。統(tǒng)計(jì)數(shù)據(jù),就其本身的來源來看,最初都來源于調(diào)查或?qū)嶒?yàn)。

但從使用者的角度看,數(shù)據(jù)的來源主要有兩種:一是直接的調(diào)查和科學(xué)實(shí)驗(yàn),對(duì)使用者來說,這是

數(shù)據(jù)的直接來源,稱為直接數(shù)據(jù)或一手?jǐn)?shù)據(jù);二是別人的調(diào)查或?qū)嶒?yàn)的數(shù)據(jù),對(duì)使用者來說,這是

數(shù)據(jù)的間接來源,稱為間接數(shù)據(jù)或二手?jǐn)?shù)據(jù)。一手?jǐn)?shù)據(jù)的來源主要有兩個(gè):一是調(diào)查或觀察,二是

實(shí)驗(yàn)。在社會(huì)經(jīng)濟(jì)領(lǐng)域,統(tǒng)計(jì)調(diào)查是獲得數(shù)據(jù)的主要方法,也是獲得一手?jǐn)?shù)據(jù)的重要方式。

知識(shí)點(diǎn)四:統(tǒng)計(jì)調(diào)查

(一)統(tǒng)計(jì)調(diào)查的概念與分類

1.統(tǒng)計(jì)調(diào)查:按照預(yù)定的目的和任務(wù),運(yùn)用科學(xué)的統(tǒng)計(jì)調(diào)查方法,有計(jì)劃有組織地收集數(shù)據(jù)信息資

料的過程。

調(diào)查過程有兩個(gè)重要特征:

(1)調(diào)查是一種有計(jì)劃、有方法、有程序的活動(dòng);

(2)調(diào)查的結(jié)果表現(xiàn)為搜集到的數(shù)據(jù)。

2.分類

(1)按調(diào)查對(duì)象的范圍不同

全面調(diào)查:對(duì)構(gòu)成調(diào)查對(duì)象的所有單位進(jìn)行逐一的、無一遺漏的調(diào)查,包括全面統(tǒng)計(jì)報(bào)表和普查。

例如,人口普查、經(jīng)濟(jì)普查等。

非仝面調(diào)查:對(duì)調(diào)查對(duì)象中的一部分單位進(jìn)行調(diào)查,包括非仝面統(tǒng)計(jì)報(bào)表、抽樣調(diào)查、重點(diǎn)調(diào)查和

典型調(diào)查等。例如,城市居民家庭的生活水平等。

(2)按登記的時(shí)間是否連續(xù)

J為觀察總體現(xiàn)象在一定時(shí)期內(nèi)(通常是一年內(nèi))的數(shù)量變化

J要求隨著調(diào)查對(duì)象的發(fā)展變化,連續(xù)地進(jìn)行調(diào)查登記,說明現(xiàn)象產(chǎn)品產(chǎn)量

連續(xù)調(diào)查

的發(fā)展過程能源的消耗等

J目的是了解現(xiàn)象在一段時(shí)期的總量

V間隔一個(gè)相當(dāng)長的時(shí)間(通常是一年以上)所作的調(diào)查生產(chǎn)設(shè)備擁有

不連續(xù)調(diào)

J數(shù)值在短期內(nèi)變化不大,不需要連續(xù)登記量

/為了對(duì)總體現(xiàn)象在一定時(shí)點(diǎn)上的狀態(tài)進(jìn)行研究耕地面積等

(-)統(tǒng)計(jì)調(diào)查的方式

統(tǒng)計(jì)報(bào)表、普查、抽樣調(diào)查、重點(diǎn)調(diào)查、典型調(diào)查

調(diào)查方

含義分類/特征

按照國家有關(guān)法規(guī)的

1.按調(diào)查對(duì)象范圍的不同分為:全面統(tǒng)計(jì)報(bào)表和非全面統(tǒng)計(jì)

規(guī)定,以一定的原始數(shù)

報(bào)表。目前的大多數(shù)統(tǒng)計(jì)報(bào)表都是全面統(tǒng)計(jì)報(bào)表

統(tǒng)計(jì)報(bào)據(jù)為基礎(chǔ),自上而下地

2.按報(bào)送周期長短的不同分為:日?qǐng)?bào)、月報(bào)、季報(bào)、年報(bào)等

表統(tǒng)一布置,自下而上地

3.按報(bào)表內(nèi)容和實(shí)施范圍的不同分為:國家的、部門的、地

逐級(jí)提供基本統(tǒng)計(jì)數(shù)

方的統(tǒng)計(jì)報(bào)表

據(jù)的一種調(diào)查方式

1普.查通常是二次性的或者周期性的

2.一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間,以避免調(diào)查數(shù)據(jù)的重

為某一特定目的而專復(fù)或遺漏,保證普查結(jié)果的準(zhǔn)確性

門組織的一次性全面3數(shù).據(jù)一般比較準(zhǔn)確,規(guī)范化程度較高,可以為抽樣調(diào)查或

調(diào)查,主要用于了解處其他調(diào)查提供基本依據(jù)

普查

于某一時(shí)點(diǎn)狀態(tài)上的4.使用范圍比較窄,只能調(diào)查一些最基本及特定的現(xiàn)象

社會(huì)經(jīng)濟(jì)現(xiàn)象的基本】.經(jīng)濟(jì)普查每10年進(jìn)行兩次,分別在福逢年份的末尾數(shù)字為

全貌3、8的年份實(shí)施

2.人口普查逢“0”的年份進(jìn)行

3.農(nóng)業(yè)普查逢“6”的年份進(jìn)行,均為每10年一次

從調(diào)查對(duì)象的總體中1經(jīng).濟(jì)性(最顯著優(yōu)點(diǎn))

抽樣調(diào)隨機(jī)抽取一部分單位2.時(shí)效性強(qiáng):可以迅速、及時(shí)地獲得所需要的信息,彌補(bǔ)全

查作為樣本進(jìn)行調(diào)查,并面調(diào)查的不足

根據(jù)樣本調(diào)查結(jié)果來3.適應(yīng)面廣:適用于各個(gè)領(lǐng)域

推斷總體數(shù)量特征的4.準(zhǔn)確性高:誤差往往很小

一種非全面調(diào)查

1.重點(diǎn)單位雖然只是全部單位中的一部分,但就調(diào)查的標(biāo)志

從調(diào)查對(duì)象的全部單值來說在總體中占絕大比重

重點(diǎn)調(diào)

位中選擇少數(shù)重點(diǎn)單2.調(diào)查單位不是隨機(jī)抽取的,結(jié)果不能推斷總體

位進(jìn)行調(diào)查3.適用范圍很廣

4.調(diào)查目的只要求了解基本狀況和發(fā)展趨勢

【示例】調(diào)查全國工業(yè)企業(yè)的資產(chǎn)總額情況,只需對(duì)全國大中型工業(yè)企業(yè)進(jìn)行重點(diǎn)調(diào)查即可。因?yàn)?/p>

雖然大中型工業(yè)企業(yè)數(shù)占全國工業(yè)企業(yè)數(shù)不到5%,但這些大中型企業(yè)的資產(chǎn)總額卻占全國工業(yè)的60%

以上。

作用:

根據(jù)調(diào)查的目的與要求,在對(duì)被調(diào)查對(duì)象進(jìn)行全面分

典型調(diào)1.彌補(bǔ)全面調(diào)查的不足

析的基礎(chǔ)上,有意識(shí)地選擇若干具有典型意義的或有

查2.在一定條件下可以驗(yàn)證全面

代表性的單位進(jìn)行的調(diào)查

調(diào)查數(shù)據(jù)的真實(shí)性

【例題?單選題】(2020年)第七次全國人口普查與第六次全國人口普查相同,普查標(biāo)準(zhǔn)時(shí)間定

為普查年份的()。

A.1月1日0時(shí)

B.11月1日0時(shí)

C.7月1口0時(shí)

D.12月31日。時(shí)

[正確答案JB

[答案解析』第六次人口普查的標(biāo)準(zhǔn)時(shí)間為普查年份的11月1日0時(shí)。

【例題?多選題】(2020年)關(guān)于抽樣調(diào)查的說法,正確的有()。

A.抽樣調(diào)查只抽取部分樣本進(jìn)行調(diào)查

B.抽樣調(diào)查的時(shí)效性強(qiáng)

C.抽樣調(diào)查耗費(fèi)大量人力、物力、財(cái)力

D.抽樣調(diào)查根據(jù)樣本調(diào)查結(jié)果推斷總體數(shù)量特征

E.抽樣調(diào)查工作量小

f正確答案JABDE

I1答案解析」抽樣調(diào)查是從調(diào)查對(duì)象的總體中抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查

結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查。所以AD正確。抽樣調(diào)查具有經(jīng)濟(jì)性、時(shí)效性強(qiáng)、適

應(yīng)面廣的特點(diǎn)。由于調(diào)查的樣本單位通常是總體單位中的很小一部分,調(diào)查的工作量小,因而可以

節(jié)省大量的人力、物力、財(cái)力和時(shí)間。所以BE正確,C錯(cuò)誤。

【例題?單選題】為及時(shí)了解全國城市商品零售價(jià)格的變動(dòng)趨勢,按照商品零售額排序?qū)η?5個(gè)

大中型城市的商品零售價(jià)格變化情況進(jìn)行調(diào)查,這種調(diào)查方法屬于()。

A.全面調(diào)查

B.典型調(diào)查

C.重點(diǎn)調(diào)查

D.隨機(jī)調(diào)查

F正確答案JC

「答案解析」本題考杳重點(diǎn)調(diào)查。重點(diǎn)調(diào)查是一種非全面調(diào)查,它是在所要調(diào)查的總體中選擇一部

分重點(diǎn)單位進(jìn)行的調(diào)查。所選擇的重點(diǎn)單位雖然只是全部單位中的一部分,但就調(diào)查的標(biāo)志值來說

在總體中占絕大比重,調(diào)查這一部分單位的情況.能夠大致反映被調(diào)查對(duì)象的基本情況C

【例題?多選題】普查的特點(diǎn)有()。

A.使用范圍廣,適用于各個(gè)領(lǐng)域

B.需要耗費(fèi)大量的人力、物力和財(cái)力

C.周期性的普查通常需要間隔較長時(shí)間

D.規(guī)范化程度較高

E.一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間

『正確答案』BCDE

『答案解析」本題考查統(tǒng)計(jì)調(diào)查的方式“普查的特點(diǎn):(1)普查通常是一次性的或周期性的,由

于普查涉及面廣、調(diào)查單位多,需要耗費(fèi)大量的人力、物力和財(cái)力,通常需要間隔較長的時(shí)間;(2)

普查一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間,以避免調(diào)查數(shù)據(jù)的重復(fù)或遺漏,保證普查結(jié)果的準(zhǔn)確性;

(3)普查的數(shù)據(jù)一般比較準(zhǔn)確,規(guī)范化程度也比較高,因此它可以為抽樣調(diào)查或其他調(diào)查提供基

本依據(jù);(4)普查的使用范圍比較窄,只能調(diào)查一些最基本及特定的現(xiàn)象。

知識(shí)點(diǎn)五:數(shù)據(jù)科學(xué)與大數(shù)據(jù)

(一)數(shù)據(jù)科學(xué):一門通過系統(tǒng)性研究獲取與數(shù)據(jù)相關(guān)的知識(shí)體系的學(xué)科。數(shù)據(jù)科學(xué)一方面研究數(shù)

據(jù)本身的特性和變化規(guī)律,另一方面通過對(duì)數(shù)據(jù)的研究為自然科學(xué)和社會(huì)科學(xué)提供一種新的方法,從而

揭示自然界和人類行為的現(xiàn)象和規(guī)律。

包含:對(duì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、處理、分析、表現(xiàn)等一系列活動(dòng)。

研究對(duì)象數(shù)據(jù)

研究目標(biāo)通過對(duì)數(shù)據(jù)的分析,來解釋、預(yù)測、洞見和決策,為現(xiàn)實(shí)世界服務(wù)

(二)大數(shù)據(jù):指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理利處理的數(shù)據(jù)集合,是需

要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的迤量、高增長率和多樣化的信息資

產(chǎn)。

大數(shù)據(jù)特征(多選)

數(shù)據(jù)量大大數(shù)據(jù)的起始計(jì)量單位是PB(1024TB)、EB或ZB

包括網(wǎng)絡(luò)R志、音頻、視頻、圖片、地理位置等各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)

化的數(shù)據(jù)

L結(jié)構(gòu)化數(shù)據(jù):指存偌在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù)

數(shù)據(jù)多樣性2.非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù),包括所有格式

(多選)的辦公文檔、文本、圖片、報(bào)表、圖像、音頻信息、視頻信息等

3.半結(jié)構(gòu)化數(shù)據(jù):介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一

定的結(jié)構(gòu)性;例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、婚姻、

戶籍、出入境等很多信息

價(jià)值密度低大數(shù)據(jù)價(jià)值密度的高低與數(shù)據(jù)總量的大小成叵比_

數(shù)據(jù)的產(chǎn)生

一般要在秒級(jí)時(shí)間范圍內(nèi)給出分析結(jié)果,超出這個(gè)時(shí)間數(shù)據(jù)就可能失去價(jià)值,即

和處理速度

大數(shù)據(jù)的處理要符合“1秒定律”

(三)數(shù)據(jù)挖掘:從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱藏在

其中但又有潛在價(jià)值的信息和知識(shí)的過程。

L數(shù)據(jù)挖掘內(nèi)涵:(多選上

數(shù)據(jù)源必須是真實(shí)的、大量的、有噪聲的

發(fā)現(xiàn)的是用戶感興趣的知識(shí)

發(fā)現(xiàn)的知識(shí)是可接受.可理解.可運(yùn)用的一

并不要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問題

數(shù)據(jù)挖掘以解決實(shí)際問題為出發(fā)點(diǎn),核心任務(wù)是對(duì)數(shù)據(jù)關(guān)系和特征進(jìn)行探索。

2.數(shù)據(jù)挖掘分為:

有指導(dǎo)學(xué)習(xí)對(duì)目標(biāo)需求的概念進(jìn)行學(xué)習(xí)和建模,通過探索數(shù)據(jù)和建立模型來實(shí)現(xiàn)從觀察變

(監(jiān)督學(xué)習(xí))量到目標(biāo)需求的有效解程

無指導(dǎo)學(xué)習(xí)

沒有明確的標(biāo)識(shí)變量來表達(dá)目標(biāo)概念,主要任務(wù)是探索數(shù)據(jù)之間的內(nèi)在聯(lián)系和

(非監(jiān)督學(xué)

結(jié)構(gòu)

習(xí))

3.數(shù)據(jù)挖掘算法:常用的算法有分類、聚類分析、關(guān)聯(lián)分析、趨勢與演化分析、特征分析、異常分

析等。(多選)

分類確定目標(biāo)對(duì)象屬于哪個(gè)預(yù)定的類別,以實(shí)現(xiàn)對(duì)未來潛在的預(yù)測需求

把?組數(shù)據(jù)按照差異性和相似性分為幾個(gè)類別,使得同類的數(shù)據(jù)相似性盡量大,

聚類分析

不同類的數(shù)據(jù)相似性盡可能小,跨類的數(shù)據(jù)關(guān)聯(lián)性盡可能低

對(duì)數(shù)據(jù)集中反復(fù)出現(xiàn)的相關(guān)關(guān)系和關(guān)聯(lián)性進(jìn)行挖掘提取,從而可以根據(jù)一個(gè)數(shù)

關(guān)聯(lián)分析

據(jù)項(xiàng)的出現(xiàn)預(yù)測其他數(shù)據(jù)項(xiàng)的出現(xiàn)

趨勢與演化包括數(shù)據(jù)變化趨勢、序列模式分析、周期性分析以及相似程度分析等內(nèi)容,纏

分析計(jì)學(xué)的回歸分析方法經(jīng)常用于這類問題的分析

(四)數(shù)據(jù)可視化:借助圖形化手段清晰有效地傳達(dá)與溝通信息。(多選)

簡單,表現(xiàn)清晰,利用人對(duì)形狀、顏色、運(yùn)動(dòng)的敏感,有效傳遞信息,幫

可視化優(yōu)勢

助用戶從數(shù)據(jù)中發(fā)現(xiàn)關(guān)系、規(guī)律和趨勢

面向科學(xué)與工程領(lǐng)域的數(shù)據(jù),如包含空間坐標(biāo)和幾何信息的三維空間測量

科學(xué)可視

數(shù)據(jù)、計(jì)算機(jī)模擬數(shù)據(jù)和醫(yī)學(xué)影像數(shù)據(jù),重點(diǎn)探索以幾何、拓?fù)浜托螤钐?/p>

兩大分化

征來呈現(xiàn)數(shù)據(jù)中蘊(yùn)含的規(guī)律

信息可視處理對(duì)象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù),如金融交易、社交網(wǎng)絡(luò)和文本

化數(shù)據(jù)

【例題?多選題】(2020年)關(guān)于大數(shù)據(jù)多樣性的說法,正確的有()。

A.大數(shù)據(jù)只包括結(jié)構(gòu)化數(shù)據(jù)

B.結(jié)構(gòu)化數(shù)據(jù)是指存儲(chǔ)在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù)

C.半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù)

D.半結(jié)構(gòu)化數(shù)據(jù)具有一定的結(jié)構(gòu)性

E.非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整、沒有預(yù)定義的數(shù)據(jù)

[正確答案」BCDE

『答案解析」大數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置等各種結(jié)構(gòu)化、半結(jié)

構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指存儲(chǔ)在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)實(shí)現(xiàn)表達(dá)的數(shù)據(jù);非

結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù),包括所有格式的辦公文檔、文本、

圖片、報(bào)表、圖像、音頻信息、視頻信息等;半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化

數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性,例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、

婚姻、戶籍、出入境等很多信息。

【例題?多選題】(2020年)關(guān)于數(shù)據(jù)可視化的說法,正確的有()。

A.數(shù)據(jù)可視化借助圖形化手段清晰有效地傳達(dá)與溝通信息

B.數(shù)據(jù)可視化包含科學(xué)可視化和信息可視化兩個(gè)重點(diǎn)分支

C.數(shù)據(jù)可視化傳達(dá)的信息比較復(fù)雜,需要專力解讀

D.科學(xué)可視化面向科學(xué)與工程領(lǐng)域數(shù)據(jù)

E.信息可視化的處理對(duì)象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù)

『正確答案』ABDE

f答案解析』數(shù)據(jù)可視化,即借助圖形化手段清晰有效地傳達(dá)與溝通信息。可視化的優(yōu)勢在于簡單,

表現(xiàn)清晰,利用人對(duì)形狀、顏色、運(yùn)動(dòng)的敏感,有效傳遞信息,幫助用戶從數(shù)據(jù)中發(fā)現(xiàn)關(guān)系、規(guī)律

和趨勢。所以C錯(cuò)誤。數(shù)據(jù)可視化包含兩個(gè)重點(diǎn)分支:科學(xué)可視化和信息可視化??茖W(xué)可視化面向

科學(xué)與工程領(lǐng)域的數(shù)據(jù);信息可視化的處理對(duì)象是非結(jié)構(gòu)化、非幾何的抽象數(shù)據(jù)。

【例題?多選題】以下屬于大數(shù)據(jù)特征的有()。

A.數(shù)據(jù)量大

B.數(shù)據(jù)多樣性

C.數(shù)據(jù)的產(chǎn)生和處理速度快

D.價(jià)值密度高

E.價(jià)值高

『正確答案』ABC

r答案解析」本題考查大數(shù)據(jù)特征。大數(shù)據(jù)的特征有:數(shù)據(jù)量大、數(shù)據(jù)多樣性、價(jià)值密度低、數(shù)據(jù)

的產(chǎn)生和處理速度快。

廣|統(tǒng)計(jì)學(xué)兩大分支H觸潮計(jì)

T變量

T統(tǒng)計(jì)潮查分皿E圖r

統(tǒng)計(jì)與統(tǒng)計(jì)科學(xué)

全1微怫原

一統(tǒng)計(jì)調(diào)查方式卜_____

膽Wt

q統(tǒng)計(jì)科學(xué)與大數(shù)據(jù)卜gm咐語鼠分類,集法

本章考情

年份單選題多選題合計(jì)

2020年4題4分0題。分4分

2019年2題2分1題2分4分

2018年3題3分1題2分5分

本章重點(diǎn):

1.測度數(shù)據(jù)集中趨勢的統(tǒng)計(jì)量:均值、中位數(shù)和眾數(shù)。

2.測度數(shù)據(jù)離散程度的統(tǒng)計(jì)量:方差、標(biāo)準(zhǔn)差和離散系數(shù)。

3.測度數(shù)據(jù)分布偏態(tài)的統(tǒng)計(jì)量:偏態(tài)系數(shù)、標(biāo)準(zhǔn)分?jǐn)?shù)。

4.測度變量相關(guān)關(guān)系的統(tǒng)計(jì)量:散點(diǎn)圖、相關(guān)系數(shù)。

知識(shí)點(diǎn)一:集中趨勢的測度

1.均值。平均數(shù),數(shù)據(jù)組中所有數(shù)值的總和除以該組數(shù)值的個(gè)數(shù)。

均值是集中趨勢最主要的測度值,它是一組數(shù)據(jù)的重心所在,解釋了一組數(shù)據(jù)的平均水平。

a

f員+……+Z_

nn

【示例】某售貨小組5名營業(yè)員,元旦一天的銷售額分別為520元、600元、480元、750元和500

元,求該日平均銷售額。

平均銷售額=(520+600+480+750+500)4-5=570(元)

【注意1】均值主要適用于數(shù)值型數(shù)據(jù),但不適用于分類和順序數(shù)據(jù)。

【注意2】均值容易受到極端值的影響,極端值會(huì)使得均值向極大值或極小值方向傾斜,使得均值

對(duì)數(shù)據(jù)組的代表性減弱。

需要全部信息避不開極端值!

2.中位數(shù)。把一組數(shù)據(jù)按從小到大或從大到小的順序進(jìn)行排列,位置居中的數(shù)值叫作中位數(shù),用

Mr表不:

rx-

苧當(dāng)n為奇數(shù)時(shí)

-(X+X)當(dāng)n為偶數(shù)時(shí)

129'(-+1)

【注意1】中位數(shù)是一個(gè)位置代表值,主要用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù),但不適用于分類數(shù)據(jù)。

【注意2】中位數(shù)的優(yōu)點(diǎn):不受極端值的影響,抗干擾性強(qiáng),尤其適用于偏斜分布的數(shù)值型數(shù)據(jù)。

不需要全部信息能避開極端值!

3.眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)(頻數(shù))最多的變量值°不適用于描述定量數(shù)據(jù)的集中位置。

【注意】適用于描述分類數(shù)據(jù)和順序數(shù)據(jù)的集中趨勢。在定量數(shù)據(jù)中,可能出現(xiàn)多眾數(shù)和無眾數(shù)的

情況,因此眾數(shù)不適于描述定量數(shù)據(jù)的集中位置。

不需要全部信息能避開極端值!

總結(jié):

指標(biāo)適用特點(diǎn)

?利用全部信息,受極端值影響

均值定量變量

?如有明顯極端值,則代表性差

順序變量?不受極端值影響

中位數(shù)

定量變量?適用于分布不對(duì)稱的數(shù)據(jù)

?沒有充分利用全部信息,穩(wěn)定性優(yōu)于眾數(shù),差于均值

?沒有充分利用全部信息.,不受極端值影響

分類變量

眾數(shù)?適用于分布明顯呈偏態(tài)的數(shù)據(jù)

順序變量

,可能不唯一

【例題?單選題】(2020年)在測度數(shù)據(jù)集中趨勢時(shí),中位數(shù)與眾數(shù)的共同優(yōu)點(diǎn)是()。

A.能夠充分利用數(shù)據(jù)的全部信息

B.適用于分類變量

C.適用于定量變量

D.不受極端值影響

「正確答案」D

[答案解析]中位數(shù)與眾數(shù)的共同優(yōu)點(diǎn)是都不受極端值的影響。

【例題?單選題】2019年某企業(yè)集團(tuán)下轄8個(gè)分公司的銷售額分別為10000萬元、3600萬元、800

萬元、1000萬元、600萬元、3000萬元、2800萬元、2200萬元,這組數(shù)據(jù)中的中位數(shù)是()萬元。

A.2200

B.2800

C.2500

D.3000

『正確答案」C

[答案解析」本題考查中位數(shù)的計(jì)算。(2800+2200)/2=2500o

知識(shí)點(diǎn)二:離散程度的測度

(一)方差和標(biāo)準(zhǔn)差

離散程度:反映數(shù)據(jù)之間的差異程度。集中趨勢的測度值對(duì)一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)

的離散水平。

數(shù)據(jù)的離散程度越大,集中趨勢的測度值對(duì)該組數(shù)據(jù)的代表性就越差;離散程度解小,其代表性就

越好。

L方差

(1)方差:數(shù)據(jù)組中各數(shù)值與其均值離差平方的平均數(shù)。

(2)方差越小,說明數(shù)據(jù)值與均值的平均距離越小,均值的代表性越好。

》總體方差公式:

N_

2

Z(\-x)N_

a2=-----------s2=—-Y)2

NN-1外

》樣本方差公式:

1區(qū)-劉

一(n-1)

【示例】某售貨小組5名營業(yè)員,元旦一天的銷售額分別為520元、600元、480元、750元和500

元,平均銷售額為570元,計(jì)算日銷售額的樣本方差。

Z(x「劉

e2_j-1____________

"(n-1)

=[(520-570)2+(600-570)2+(480-570)2+(750-570)2+(500-570)2]4-(5-1)

=12200(元2)

2.標(biāo)準(zhǔn)差

方差是反映數(shù)據(jù)離散程度的重要測度指標(biāo),但是其單位是原數(shù)據(jù)單位的平方,沒有解釋意義。因此,

我們經(jīng)常使用標(biāo)準(zhǔn)差來測度數(shù)據(jù)的離散程度,標(biāo)準(zhǔn)差即方差的平方根。標(biāo)準(zhǔn)差與方差只適用于數(shù)值型

數(shù)據(jù),它們對(duì)極端值很敏感。

Z(x.-x)2

【示例】5名營業(yè)員元旦當(dāng)天的銷售額的標(biāo)準(zhǔn)差

=^^2200=110.45(7L)

(二)離散系數(shù)

L離散系數(shù):變異系數(shù)或標(biāo)準(zhǔn)差系數(shù)。

2.標(biāo)準(zhǔn)差與均值的比值:

s

cv=2

X

3.適用:不同類別數(shù)據(jù)離散程度的比較。

【注意】標(biāo)準(zhǔn)差的大小不僅與數(shù)據(jù)的測度單位有關(guān),也與觀測值的均值大小有關(guān),不能直接用標(biāo)準(zhǔn)

差比較不同變量的離散程度。離散系數(shù)消除了測度單位和觀測值水平不同的影響,因而可以直接用來

比較變量的離散程度。

【示例】某學(xué)校學(xué)生的平均年齡為20歲,標(biāo)準(zhǔn)差為3歲;該校教師的平均年齡為38歲,標(biāo)準(zhǔn)差為

3歲。比較該校學(xué)生年齡和教師年齡的離散程度。

「止確答案」學(xué)生年齡的離散程發(fā)更大。

I■答案解析」學(xué)生年齡的離散系數(shù)=3/20=0.15

教師年齡的離散系數(shù)=3/38=0.0789

【例題?單選題】(2020年)與標(biāo)準(zhǔn)差相比,方差在測度數(shù)據(jù)離散程度時(shí)的缺點(diǎn)是()。

A.計(jì)算方法復(fù)雜

B.不適用于數(shù)值型數(shù)據(jù)

C.其單位是原數(shù)據(jù)單位的平方,沒有解釋意義

D.數(shù)學(xué)性質(zhì)較差

r正確答案」C

[答案解析」方差是反映數(shù)據(jù)離散程度的重要測度指標(biāo),但是其單位是原數(shù)據(jù)單位的平方,沒有解

釋意義。

【例題?多選題】下列統(tǒng)計(jì)量中,容易受極端值影響的有()。

A.均值

B.方差

C.眾數(shù)

D.中位數(shù)

E.標(biāo)準(zhǔn)差

『正確答案1ARE

『答案解析」本題考查集中趨勢和離散程度的測度指標(biāo)。均值、方差、標(biāo)準(zhǔn)差容易受極端值的影響。

【例題?單選題】根據(jù)2014年某城市金融業(yè)和制造業(yè)各1000人的年薪樣本數(shù)據(jù)來比較這兩個(gè)行業(yè)

從業(yè)人員年薪的離散程度,應(yīng)采用的統(tǒng)計(jì)量是()。

A.標(biāo)準(zhǔn)分?jǐn)?shù)

B.相關(guān)系數(shù)

C.變異系數(shù)

D.偏態(tài)系數(shù)

f正確答案」C

『答案解析』本題考查離散系數(shù)。離散系數(shù)也稱為變異系數(shù)或標(biāo)準(zhǔn)差系數(shù),即標(biāo)準(zhǔn)差與均值的比值,

主要用于不同類別數(shù)據(jù)離散程度的比較。

知識(shí)點(diǎn)三:分布形態(tài)的測度

(一)偏態(tài)系數(shù)(SK):

1.偏度:指數(shù)據(jù)分布的偏斜方向和程度,描述數(shù)據(jù)分布對(duì)稱程度。(.匿選)

2.偏態(tài)系數(shù):測度數(shù)據(jù)分布偏度的指標(biāo)。偏態(tài)系數(shù)取決?于離差三次方的平均數(shù)與標(biāo)準(zhǔn)差三次方的

比值。

SK=

(〃-1)〃(力-2)yElIfsJ

3.應(yīng)用:偏態(tài)系數(shù)的絕對(duì)值越大,說明數(shù)據(jù)分布的偏斜程度越大。

SK=0說明數(shù)據(jù)分布是對(duì)隨

SK>01.說明數(shù)據(jù)分布為右偏

偏態(tài)系數(shù)為正2.取值。?0.5(說明輕度右偏)0.5-1(說明中度右偏)大于1(說明嚴(yán)重右

值偏)

SK<01.說明數(shù)據(jù)分布為左偏

偏態(tài)系數(shù)為負(fù)2.0^0.5(說明輕度左偏)一0.5^^-1(說明中度左偏)小于一1(說明嚴(yán)

值重左偏)

【例題?單選題】(2020年)下列統(tǒng)計(jì)量中,用于測度數(shù)據(jù)分布偏度的是()。

A.方差

B.標(biāo)準(zhǔn)差

C.偏態(tài)系數(shù)

D.均值

I1正確答案』C

『答案解析」測度數(shù)據(jù)分布偏度的統(tǒng)計(jì)量稱為偏態(tài)系數(shù)。

【例題?單選題】(2020年)如果一組數(shù)據(jù)的偏態(tài)系數(shù)為-0.4,則該組數(shù)據(jù)的分布為()。

A.輕度左偏

B.中度左偏

C.中度右偏

D.輕度右偏

『正確答案」A

[答案解析』偏態(tài)系數(shù)為0,說明數(shù)據(jù)的分布是對(duì)稱的。偏態(tài)系數(shù)為正,說明分布是右偏的,取值

在。?0.5之間說明輕度右偏,取值在0.5?1之間,說明中度右偏,取值大于1說明嚴(yán)重右偏;偏

態(tài)系數(shù)為負(fù),說明分布為左偏.取值在0-----0.5之間,說明輕度左偏.取值在-0.5-----1之間.

說明中度左偏,取值小于一1,說明嚴(yán)重左偏。本題中,偏態(tài)系數(shù)為-0.4,說明輕度左偏。

【例題?單選題】關(guān)于偏態(tài)系數(shù)的說法,正確的是()。

A.偏態(tài)系數(shù)為正值,說明數(shù)據(jù)對(duì)稱

B.偏態(tài)系數(shù)的絕對(duì)值越大,說明數(shù)據(jù)越對(duì)稱

C.偏態(tài)系數(shù)等于0,說明數(shù)據(jù)對(duì)稱

D.偏態(tài)系數(shù)等于1,說明數(shù)據(jù)對(duì)稱

『正確答案』C

『答案解析」本題考查偏態(tài)系數(shù)。如果偏態(tài)系數(shù)為正值,說明分布為右偏的"A選項(xiàng)錯(cuò)誤。偏態(tài)系

數(shù)的絕對(duì)值越大,說明數(shù)據(jù)分布的偏斜程度越大。B選項(xiàng)錯(cuò)誤。偏態(tài)系數(shù)等于0,說明數(shù)據(jù)對(duì)稱。C

選項(xiàng)正確。偏態(tài)系數(shù)等于1,說明系數(shù)中度右偏。D選項(xiàng)錯(cuò)誤。

【例題?多選題】在某電商網(wǎng)站上,商品甲得到6個(gè)評(píng)價(jià)得分,分別是1、4、4、5、5、5;商品

乙得到5個(gè)評(píng)分,分別是3、3、3、4、4。關(guān)于這兩組數(shù)據(jù)的說法,正確的有()。

A.商品中的評(píng)分中位數(shù)高于商品乙

B.商品甲的評(píng)分均值低于商品乙

C商品甲的評(píng)分眾數(shù)高于商品乙

D.商品甲的評(píng)分分布離散程度大于商品乙

E.商品甲的評(píng)分分布是左偏的

『正確答案』ACDE

I1答案解析」本題考查集中趨勢、離散程度的測度。

商品甲:評(píng)分中位數(shù)=(4+5)/2=4.5,眾數(shù)=5,均值=(1+4+4+5+5+5)/6=4,方

差=[(1-4)24-(4-4)2+(4-4)2+(5-4)2+(5-4)24-(5-4)2]/5=2.4,標(biāo)準(zhǔn)差

=1.55,離散系數(shù)=1.55/4=0.3875。

商品乙:評(píng)分中位數(shù)=3,眾數(shù)=3,均值=3.4,標(biāo)準(zhǔn)差=0.55,離散系數(shù)=0.55/3.4=0.16。

由于商品甲離差三次方,即(1-4)3+(4-4)3+(4-4)3+(5-4)3+(5-4)3+(5

-4)3=-24,根據(jù)公式可知偏態(tài)系數(shù)為負(fù),說明數(shù)據(jù)分布左偏。

(-)標(biāo)準(zhǔn)分?jǐn)?shù)

1.標(biāo)準(zhǔn)分?jǐn)?shù)(Z分?jǐn)?shù)):統(tǒng)計(jì)學(xué)上常用的一種標(biāo)準(zhǔn)化方法。標(biāo)準(zhǔn)分?jǐn)?shù)可以給出數(shù)值距離均值的相對(duì)

位置,用于比較不同分布的變量值。

2.公式:標(biāo)準(zhǔn)分?jǐn)?shù)2=(數(shù)值一均值)+標(biāo)準(zhǔn)差

3.結(jié)果:標(biāo)準(zhǔn)分?jǐn)?shù)Z越大越好。

【注意】轉(zhuǎn)變后的標(biāo)準(zhǔn)分?jǐn)?shù)并沒有改變數(shù)值在原分布中的位置,也沒有改變數(shù)據(jù)原分布的偏度,但

是標(biāo)準(zhǔn)分?jǐn)?shù)的平均數(shù)為0,標(biāo)準(zhǔn)差為1。

【示例1】考核A中員工得分80分,均值80分,標(biāo)準(zhǔn)差為20分,在考核B中員工得分70分,均

值60分,標(biāo)準(zhǔn)差為5分。

80分的Z分?jǐn)?shù)=(80-80)4-20=0

70分的Z分?jǐn)?shù)=(70-60)小5=2

【說明】70分在考核B中的相對(duì)排名高于80分在考核A中的相對(duì)排名。

【示例2】某班期末考試。語文考試全班平均成績73分,標(biāo)準(zhǔn)差7分,甲得了78分;數(shù)學(xué)考試全

班平均成績80分,標(biāo)準(zhǔn)差6.5分,甲得了83分。甲哪一門成績更優(yōu)秀?

因?yàn)閮煽品植?均值、標(biāo)準(zhǔn)差)不同,不能用原始數(shù)據(jù)直接比較,需要轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后比較。

Z(語文)=(78-73)4-7=0.71

z(數(shù)學(xué))=(83-80)+6.5=0.46

【說明】甲的語文成績更優(yōu)秀,

4.實(shí)際應(yīng)用:當(dāng)數(shù)據(jù)服從對(duì)稱的鐘形分布時(shí),可以運(yùn)用經(jīng)驗(yàn)法則來判斷與均值的距離在特定倍數(shù)標(biāo)

準(zhǔn)差之內(nèi)的數(shù)據(jù)項(xiàng)所占比例。

-68.00%-

—95.00%~

1--------------99.00%-------------1

約有68%的數(shù)據(jù)與平均數(shù)的距離在1個(gè)標(biāo)準(zhǔn)差之內(nèi),標(biāo)準(zhǔn)分?jǐn)?shù)在[-1,1]_范圍內(nèi):

約有嬴的數(shù)據(jù)與平均數(shù)的距離在2個(gè)標(biāo)準(zhǔn)差之內(nèi),標(biāo)準(zhǔn)分?jǐn)?shù)在[-2,2]范圍內(nèi):

約有繆的數(shù)據(jù)與平均數(shù)的距離在3個(gè)標(biāo)準(zhǔn)差之內(nèi),標(biāo)準(zhǔn)分?jǐn)?shù)在[-3,3]范圍內(nèi)。

【示例】語文考試全班平均成績73分,標(biāo)準(zhǔn)差7分:

則68%的同學(xué)得分在66和80之間;

則95%的同學(xué)得分在59和87之間;

則99國的同學(xué)得分在52和94之間,

【例題?單選題】某公司員工年度業(yè)績考核中,全體員工考核成績的均值為80,方差為25。某員

工在這次業(yè)績考核中成績?yōu)?5,則該員工考核成績的標(biāo)準(zhǔn)分?jǐn)?shù)為(

A.3.4

B.0.2

C.1.0

D.17.0

「正確答案」C

f答案解析』本題考查分布形態(tài)的測度。標(biāo)準(zhǔn)分?jǐn)?shù)可以給出數(shù)值距離均值的相對(duì)位置,計(jì)算方法是

用數(shù)值減去均值所得的差除以標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)分?jǐn)?shù)=(85—80)/5=1。

【例題?多選題】某企業(yè)客戶滿意度數(shù)據(jù)服從對(duì)稱的鐘形分布,均值為75,標(biāo)準(zhǔn)差為5。根據(jù)經(jīng)驗(yàn)

法則,關(guān)于該企業(yè)客戶滿意度的說法,正確的有()。

A.約有68%的客戶滿意度在[70,80]范圍內(nèi)

B.約有68%的客戶滿意度在[75,85]范圍內(nèi)

C.約有95%的客戶滿意度在[75,95]范圍內(nèi)

D.約有95%的客戶滿意度在[65,85]范圍內(nèi)

E.約有99%的客戶滿意度在[60,90]范圍內(nèi)

I1正確答案』ADE

『答案解析』本題考查標(biāo)準(zhǔn)分?jǐn)?shù)。經(jīng)驗(yàn)法則表明:約有68%的數(shù)據(jù)與平均數(shù)的距離在1個(gè)標(biāo)準(zhǔn)差之

內(nèi),約有95%的數(shù)據(jù)與平均數(shù)的距離在2個(gè)標(biāo)準(zhǔn)差之內(nèi),約有99%的數(shù)據(jù)與平均數(shù)的距離在3個(gè)標(biāo)

準(zhǔn)差之內(nèi)。

知識(shí)點(diǎn)四:變量間的相關(guān)分析

(一)相關(guān)關(guān)系分類

1.按相關(guān)的程度:完全相關(guān)、不完全相關(guān)和不相關(guān)C

2.按相關(guān)的方向:正相關(guān)和負(fù)相關(guān)。

3.按相關(guān)的形式:線性相關(guān)和非線性相關(guān)。

【注意]相關(guān)關(guān)系并不等同于因果關(guān)系。

(二)兩變量的散點(diǎn)圖:兩個(gè)變顯間的關(guān)系可以用散點(diǎn)圖來展示。

1.觀測點(diǎn)分布無規(guī)律:不相關(guān)。

2.觀測點(diǎn)分布密集在一條線周圍:線性相關(guān)。

(1)正相關(guān):直線向右上傾斜;

(2)負(fù)相關(guān):直線向右下傾斜。

3.觀測點(diǎn)呈現(xiàn)曲線模式:兩個(gè)變量非線性相關(guān).

(三)相關(guān)系數(shù)的定義和計(jì)算

1.Pearson相關(guān)系數(shù):度量的是兩個(gè)變量之間的線性相關(guān)關(guān)系。

2.Pearson相關(guān)系數(shù)的取值范圍:—

(1)0<r^l:變量X和Y之間存在正線性相關(guān)關(guān)系;

(2)-l^r<0:變量X和Y之間存在負(fù)線性相關(guān)關(guān)系;

(3)r=l:變量X和Y之間為完全正線性相關(guān),即變量Y的取值完全依賴于變量X;

(4)r=-l:變量X和Y之間為完全負(fù)線性相關(guān),即變量Y的取值完全依賴于變量X。

【注意】Pearson相關(guān)系數(shù)只適用于線性相關(guān)關(guān)系的判斷。因此三=0只表示兩個(gè)變量之間不存在

線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如它們之間可能存在非線性相關(guān)關(guān)系。

3.相關(guān)程度:

(1)|r>0.8:高度相關(guān);

<2)0.5<|r|<0,8:中度相關(guān);

<3)0.3<|r|<0.5:低度相關(guān);

<4)|r|<0.3:說明兩個(gè)變量之間的相關(guān)程度極弱,可視為無線性相關(guān)關(guān)系。

【例題-多選題】關(guān)于相關(guān)關(guān)系的說法,正確的有()。

A.完全相關(guān)是指一個(gè)變量的取值變化完全由另一個(gè)變量的取值變化所確定

B.相關(guān)關(guān)系等同于因果關(guān)系

C.正相關(guān)是指一個(gè)變量的取值隨著另一個(gè)變量的取值增大而增大

D.不相關(guān)是指兩個(gè)變量的取值變化彼此互不影響

E.相關(guān)關(guān)系等同于函數(shù)關(guān)系

『正確答案』ACD

f答案解析」本題考查變量間的相關(guān)關(guān)系。相關(guān)關(guān)系并不等同于因果關(guān)系和函數(shù)關(guān)系。

【例題?單選題】根據(jù)下面的變量X和變量Y的散點(diǎn)圖,可以看出這兩個(gè)變量的Pearson相關(guān)系數(shù)

r的取值范圍是()。

15(T

100-

50-

0-

?50-

?100-

-15G

A.r<—1

B.OWrVl

C.r21

D.-l^r<0

『正確答案』D

f答案解析」本題考查散點(diǎn)圖與相關(guān)關(guān)系。若一lWrVO,表明變量X和Y之間存在負(fù)線性相關(guān)關(guān)

系O

【例題?單選題】2014年某企業(yè)員工的工齡和月平均工資的散點(diǎn)圖如下:

.一

Q5000個(gè)????????「?

4500?**

)???

胃4000…

篦3500:f*

叮3000.:*

2500

2000

15005101520253035

1000工齡(年)

500

0

根據(jù)以上散點(diǎn)圖,工齡和月平均工資兩個(gè)變量的相關(guān)關(guān)系是().

A.正相關(guān)、線性相關(guān)

B.負(fù)相關(guān)、線性相關(guān)

C.正相關(guān)、非線性相關(guān)

D.負(fù)相關(guān)、非線性相關(guān)

I1正確答案』C

『答案解析』本題考查散點(diǎn)圖。首先,觀測點(diǎn)的走勢很容易判斷出是正相關(guān)關(guān)系;其次,觀測點(diǎn)呈

現(xiàn)出曲線模式,并不是直線的模式,所以兩個(gè)變量為非線性相關(guān)關(guān)系。

均值、中位數(shù)、眾數(shù)

本章考情

年份單選題多選題合計(jì)

2020年1題1分1題2分3分

2019年1題1分2題4分5分

2018年4題4分1題2分6分

本章重點(diǎn):

1.抽樣調(diào)查基本概念:總體、樣本、樣本量、總體參數(shù)、樣本統(tǒng)計(jì)量與抽樣框。

2.概率抽樣和非概率抽樣,抽樣誤差和非抽樣誤差(抽樣框誤差、無回答誤差、計(jì)量誤差)。

3.幾種基本概率抽樣方法:簡單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣和多階段抽樣。

4.估計(jì)量的性質(zhì),抽樣誤差影響因素,樣本量的影響因素。

知識(shí)點(diǎn)一:抽樣調(diào)查基本概念

(一)抽樣調(diào)查基本概念

1.總體:調(diào)杳對(duì)象的全體,調(diào)查總體必須是明確的而不能是模糊的。

【示例】研究全國鋼鐵企業(yè)盈利狀況,所有鋼鐵企業(yè)是總體。

2.樣本:總體的一部分,它由從總體中按一定原則或程序抽出的部分個(gè)體所組成。

樣本量:樣本中包含的入樣單位的個(gè)數(shù)。

【示例】選取了20家鋼鐵企業(yè)是樣本。

3.抽樣框:供抽樣所用的所有抽樣單元的名單,是抽樣總體的具體表現(xiàn)。

【示例】工商局注冊(cè)的200家企業(yè);公司200名注冊(cè)在職人員名冊(cè)。

4.總體參數(shù):變量的數(shù)字特征,根據(jù)總體中所有單位的數(shù)值計(jì)算的。

【示例】所有鋼鐵企業(yè)盈利總額,所有鋼鐵企業(yè)盈利均值。

5.樣本統(tǒng)計(jì)量:根據(jù)樣本中各單位的數(shù)值計(jì)算的,是對(duì)總體參數(shù)的估計(jì),因此也稱為估計(jì)量。

常用的樣本統(tǒng)計(jì)量:樣本均值,樣本比例、樣本方差等。

【示例】20家企業(yè)盈利總額,20家企業(yè)盈利均值。

【例題?單選題】供抽樣所用的所有抽樣單元的名單稱為()。

A.抽樣框

B.總體

C.總體參數(shù)

D.樣本

『正確答案」A

f答案解析」本題考查抽樣框。抽樣框是供抽樣所用的所有抽樣單元的名單,是抽樣總體的具體表

現(xiàn)。

【例題?單選題】從某單位所有在職員工中隨機(jī)抽取300人進(jìn)行抽樣調(diào)查,來研究該單位在職職工

中亞健康人員占比狀況,該項(xiàng)調(diào)查的總體是()。

A.隨機(jī)抽取的300名在職員工

B.該單位所有亞健康在職員工

C.該單位所有在職員工

D.被調(diào)查的300名在職員工中的亞健康員工

『正確答案」C

f答案解析」本題考查抽樣調(diào)查的基本概念??傮w即調(diào)查對(duì)象的全體,乜就是該單位所有在職員工。

(二)概率抽樣與非概率抽樣

根據(jù)抽取樣本方法的不同,抽樣分為:

1.概率抽樣(隨機(jī)抽樣):指依據(jù)隨機(jī)原則,按照某種事先設(shè)計(jì)的程序,從總體中抽取部分單元的

方法。

(1)隨機(jī)原則:在抽取樣本時(shí)排除主觀」?有意識(shí)地抽取調(diào)查單元的情況.使每個(gè)單元都有一定的

機(jī)會(huì)被抽中。

(2)特點(diǎn):

J按一定的概率以隨機(jī)原則抽取樣本;

J總體中每個(gè)單元被抽中的概率是已知的,或者是可以計(jì)算出來的;

J當(dāng)采用樣本對(duì)總體參數(shù)進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單元被抽中的概率。

(3)分類:

等概率抽樣每個(gè)單位被抽入樣本的概率相等

不等概率抽樣每個(gè)單位被抽入樣本的概率不同

2.非概率抽樣(非隨機(jī)抽樣):調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本的方法。

(1)最主要的特征:抽取樣本時(shí)并不是依據(jù)隨機(jī)原則。

(2)非概率抽樣方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論