大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）

上傳人：文*** IP屬地：河北上傳時間：2024-10-27 格式：PDF 頁數(shù)：100 大?。?2.56MB 積分：12 舉報 版權(quán)申訴

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第2頁

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第3頁

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第4頁

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第5頁

已閱讀5頁，還剩95頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)

一、單選題

1.以下哪些分類方法可以較好地避免樣本的不平衡問題？

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

答案：A

2.0算法是最廣泛使用的聚類算法,算法簡單,易于理解和操作。

Axgglomerative

B、C.URE

C、K-means

D、k-中心點算法

答案：C

3.貝葉斯決策是根據(jù)()進行決策的一種方法。

A、極大似然概率

B、先驗概率

C、邊際概率

D、后驗概率

答案：D

4.回歸分析的第一步是()

A、確定解釋量和被解釋變量

B、確定回歸模型

C、建立回歸方程

D、進行檢驗

答案：A

5.當所有觀測值都落在回歸直線上，則這兩個變量之間的相關(guān)系數(shù)為0

A、1

B、-1

C、+1或7

D、0

答案：C

6.()是進行項目投資效益評價的最終依據(jù)。

A、現(xiàn)金流量

B、盈虧平衡點

C、凈現(xiàn)金流量

D、現(xiàn)金流入量

答案：C

7.被廣泛用于購物籃分析的是()。

A、關(guān)聯(lián)分析；

B、分類和預(yù)測

C、聚類分析

D、演變分析

答案：A

8.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法？()

A、變量代換

B、離散化

C、聚集

D、估計遺漏值

答案：D

9.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()

A、支持度

B、置信度

C、滿意度

D、提升度

答案：C

10.NoSQL含義是指0

A、NO!SQL;

B、NomberSQL;

C、NotOnIySQL

D、NOLLSQL

答案：C

11.個人信息的收集、處理和利用應(yīng)當遵循()的原則，不得違反法律、法規(guī)的規(guī)定

和雙方的約定收集、處理和利用個人信息。()

A、正規(guī)、合法、必要

B、合法、正當、必要

C、合法、合規(guī)、正當

D、合法、合理、合規(guī)

答案：B

12.Tableau能夠?qū)?shù)據(jù)進行處理包括()。

A、將多個數(shù)據(jù)源數(shù)據(jù)拼接為一個寬表；

B、修改、刪除、新增數(shù)據(jù)行；

C、對數(shù)據(jù)進行行列轉(zhuǎn)換、重命名、格式修改；

D、對數(shù)據(jù)進行計算、合并生成新的數(shù)據(jù)列

答案：A

13.()是數(shù)據(jù)倉庫體系架構(gòu)的重要組成部分,具備數(shù)據(jù)倉庫的部分特征和OLTP系

統(tǒng)的部分特征。

A、E.SB;

B、D.M

C、ODS

D、E.TL

答案：C

14.RFM方法中的F說明客戶的0

A、興趣度

B、粘性

C、當前價值

D、未來價值

答案：A

15.關(guān)于主成分數(shù)目的選取,正確的是()

A、保留多少個主成分取決于累計方差在方差總和中所占百分比

B、一般選擇50%以上

C、選擇前兩個就可以

D、選擇的數(shù)目和變量的個數(shù)一致

答案:A

16.下列關(guān)于數(shù)據(jù)重組的說法中，錯誤的是0

A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集

B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒

C、數(shù)據(jù)重組實現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成

D、數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新

答案：A

17.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是()

A、CREATESCHEMA

B、CREATETABLE

C、CREATEVIEW

D、CREATEDATABASE

答案：D

18.當時間序列數(shù)據(jù)點的一階差分近似為一常數(shù),可配合以下哪種預(yù)測模型()

A、直線

B、二次拋物線

C、三次拋物線

D、指數(shù)曲線

答案：A

19.對于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()

A、數(shù)據(jù)收集

B、數(shù)據(jù)存儲

C、數(shù)據(jù)分析

D、數(shù)據(jù)再利用

答案：D

20.線性回歸算法尋找()與預(yù)測目標之間的線性關(guān)系。

A、屬性

B、根因

C、表象

答案：A

21.下面不屬于明細數(shù)據(jù)質(zhì)量評價指標的是()。

A、接入率；

B、自動采集率

C、及時率

D、完整率

答案：B

22.資金的時間價值是()

A、同一資金在同一時點上價值量的差額

B、同一資金在不同時點上價值量的差額

C、不同資金在同一時點上價值量的差額

D、不同資金在不同時點上價值量的差額

答案：B

23.以下哪種方法不屬于于監(jiān)督學(xué)習(xí)模型()

A、決策樹

B、線性回歸

C、關(guān)聯(lián)分析

D、判別分析

答案：C

24.在多元回歸模型的檢驗中，目的是檢驗每一個自變量與因變量在指定顯著性

水平上是否存在線性相關(guān)關(guān)系的檢驗是()

A\r檢驗

B、t檢驗

C\f檢驗

D、DW檢驗

答案：B

25.關(guān)于混合模型聚類算法的優(yōu)缺點,下面說法正確的是()

A、當簇只包含少量數(shù)據(jù)點，或者數(shù)據(jù)點近似協(xié)線性時，混

合模型也能很好地處理。

B、混合模型比K均值或模糊C均值更一般,因為它可以使用各種類型的分布。

C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。

D、混合模型在有噪聲和離群點時不會存在問題。

答案：B

26.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()

A、建立數(shù)據(jù)科學(xué)

B、完成數(shù)據(jù)應(yīng)用

C、配備數(shù)據(jù)硬件

D、吸納數(shù)據(jù)人才

答案：B

27.下面關(guān)于因子分析的說法正確的是()

A、因子分析就是主成分分析

B、因子之間可相關(guān)也可不相關(guān)

C、因子受量綱的影響

D、可以對因子進行旋轉(zhuǎn)，使其意義更明顯

答案：D

28.快速實現(xiàn)簡單的MapReduce統(tǒng)計,不必開發(fā)專門的MapReduce應(yīng)用，十分適合

數(shù)據(jù)倉庫的統(tǒng)計分析的是0。

AxMap;

B、Reduce

C、H.ive

D、SQL語句

答案：D

29.企業(yè)要建立預(yù)測模型,需準備建模數(shù)據(jù)集，以下四條描述建模數(shù)據(jù)集正確的是

A、數(shù)據(jù)越多越好

B、盡可能多的適合的數(shù)據(jù)

C、數(shù)據(jù)越少越好

D、以上三條都不正確

答案：B

30.以下哪個類型的變量在作預(yù)測客戶流失的模型中最有解釋力度？

A、人口基本數(shù)據(jù)，比如年齡和性別

B、基本社會狀態(tài)數(shù)據(jù)，比如收入和職業(yè)

C、業(yè)務(wù)數(shù)據(jù),比如消費頻次

D、業(yè)務(wù)數(shù)據(jù)的衍生變量，比如最近3個月消費頻次的變化情況

答案：D

31.將復(fù)雜的地址簡化成北、中、南、東四區(qū)，是在進行？

A、數(shù)據(jù)正規(guī)化

B、數(shù)據(jù)一般化

C、數(shù)據(jù)離散化

D、數(shù)據(jù)整合

答案：B

32.Hadoop是一個開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺，是Appach的一個用（）

語言實現(xiàn)開源軟件框架。

A、java

B\C.++

C、R語言

答案：A

33.大數(shù)據(jù)特征錯誤的是()。

A、容量大；

B、類型多

C、價值高

D、系統(tǒng)多

答案：D

34.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法,它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻

繁項集的算法,利用()搜索的方法挖掘頻繁項集。

A、逐層

B\逐級

C、自底向上

D、自上而下

答案：A

35.分類算法以()定理為基礎(chǔ),采用概率方法對數(shù)據(jù)進行建模

A、決策樹

B、K-最鄰近

C、SVM

D、貝葉斯

答案：D

36.自然界中某種事物發(fā)生時其他事物也會發(fā)生,則這種聯(lián)系稱之為()o

A、連接

B、聯(lián)絡(luò)

C、關(guān)聯(lián)

D、聯(lián)系

答案：C

37.源業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中心的方式主要有:JDBCESB和()。

A、D.XP;

B、E.SP

C、OGG

D、E.TL

答案：C

38.下列哪個不屬于個人信息影響評估原則()

A、個人信息的處理目的、處理方式等是否合法、正當、必要

B、對個人的影響及風(fēng)險程度

C、誰主管誰負責(zé)

D、所采取的安全保護措施是否合法、有效并與風(fēng)險程度相適應(yīng)。

答案：C

39.以下哪項關(guān)于決策樹的說法是錯誤的0

A、冗余屬性不會對決策樹的準確率造成不利的影響

B、子樹可能在決策樹中重復(fù)多次

C、決策樹算法對于噪聲的干擾非常敏感

D、尋找最佳決策樹是NP完全問題

答案：C

40.Hadoop框架中兩大核心是：（）和MapReducE

A、H.CFS;

B、H.DFS

C、H.EFS

D、H.FFS

答案：B

41.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式,便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律,的數(shù)據(jù)探索方法是

A、匯總統(tǒng)計法

B、概率統(tǒng)計法

C、可視化法

答案：C

42.矩估計的基本原理是0

A、用樣本矩估計總體矩

B、使得似然函數(shù)達到最大

C、使得似然函數(shù)達到最小

D、小概率事件在一次試驗中是不可能發(fā)生的

答案：A

43.數(shù)據(jù)預(yù)處理目前常用的異常數(shù)據(jù)識別方法包括業(yè)務(wù)判別法、（）、箱線圖判別

法、統(tǒng)計判別法

A、聚類判別法；

B、回歸判別法

C、抽樣判別法

答案：A

44.算法的核心思想是()逐層構(gòu)造一個樹。

A、自上而下

B、自下而上

C、自左向右

D、自右向左

答案：A

45.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯誤的是()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對精確

D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)

答案：D

46.什么是KDD?()

A、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)

B、領(lǐng)域知識發(fā)現(xiàn)

C、文檔知識發(fā)現(xiàn)

D、動態(tài)知識發(fā)現(xiàn)

答案：A

47.某家長為了使孩子在第3-6年上大學(xué)的4年中，每年

年初得到10000元助學(xué)基金,他應(yīng)在2年前在銀行存入多少錢？（年利率按5%計算）

A、33771

B、30291

C、32163

D、45256

答案：A

48.關(guān)于K均值和DBSCAN的比較，以下說法不正確的是0。

A、K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類

所有對象

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同

形狀的簇

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN會

合并有重疊的簇

答案：A

49.SQL查詢語句中HAVING子句的作用是0

A、指出分組查詢的范圍

B、指出分組查詢的值

C、指出分組查詢的條件

D、指出分組查詢的內(nèi)容

答案：C

50.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱為()。

A、分位數(shù)

B、中位數(shù)

C、眾數(shù)

答案：C

51.JS0N中的中括號一般來表示()。

A、數(shù)組；

B、標點符號

C、對象

D、注釋

答案：C

52.模型構(gòu)建指基于()數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型。

A、線上

B、線下

C、實時

D、歷史

答案：D

53.Tableau在處理離線地圖時,需要將標記設(shè)置為()。

A、路徑；

B、區(qū)域

C、邊形

D、已填充地圖

答案：A

54.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯誤的有()

A、神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒

B、可以處理冗余特征

C、訓(xùn)練ANN是一個很耗時的過程

D、至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)

答案：A

55.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明

了大風(fēng)與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對精確

D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)

答案：B

56.當時間序列的環(huán)比增長速度大體相同時,適宜擬合()

A、指數(shù)曲線

B、拋物線

C、直線

D、對數(shù)曲線

答案：A

57.將多個指標轉(zhuǎn)化為少數(shù)幾個指標的一種統(tǒng)計分析方法是()o

A、數(shù)據(jù)預(yù)處理；

B、數(shù)據(jù)降維

C、主成分分析

D、假設(shè)檢驗

答案：C

58.設(shè)X={1,213)是頻繁項集,則可由X可產(chǎn)生()個關(guān)聯(lián)規(guī)則。

A、3

B、4

C、5

D、6

答案：D

59.當一個連續(xù)變量的缺失值占比在85%左右時,以下哪種方式最合理()

A、直接使用該變量

B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量

C、使用多重插補的方法進行缺失值填補

D、直接刪除該變量

答案：B

60.大數(shù)據(jù)分析挖掘流程正確的是()。

A、業(yè)務(wù)理解一數(shù)據(jù)理解T數(shù)據(jù)準備T建立模型一模型評估；

B、業(yè)務(wù)理解T數(shù)據(jù)準備T數(shù)據(jù)理解T建立模型T模型評估；

C、業(yè)務(wù)理解T數(shù)據(jù)準備T數(shù)據(jù)理解T模型評估T建立模型；

D、業(yè)務(wù)理解-?數(shù)據(jù)準備-?模型評估T數(shù)據(jù)理解T建立模型

答案：A

61.()是統(tǒng)計學(xué)的基礎(chǔ),是統(tǒng)計學(xué)里面最重要的概率分布

A、正態(tài)分布；

B、靜態(tài)分布

C、動態(tài)分布

D、穩(wěn)態(tài)分布

答案：A

62.因子分析的主要作用有()

A、對變量進行降維

B、對變量進行判別

C、對變量進行聚類

D、以上都不對

答案：A

63.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為()

A、D.XP;

B、E.SP

C、OGG

D、E.TL

答案：D

64.給定歷史時間數(shù)據(jù),通過擬合時序模型,分析研究時序數(shù)據(jù)的發(fā)展變化規(guī)律,

得出觀測數(shù)據(jù)的歷史統(tǒng)計特征再據(jù)此進行外推預(yù)測目標的分析方法是()。

A、聚類;

B、回歸

C、時間序列

D、匯總統(tǒng)計

答案：C

65.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)。

A、統(tǒng)計報表

B、網(wǎng)絡(luò)爬蟲

C、API接口

D、傳感器

答案：D

66.假設(shè)檢驗中顯著性水平是：)

A、推斷時犯取偽錯誤的概率

B、推斷時取偽棄真的概率

C、正確推斷的概率

D、是推斷的可信度

答案：B

67.以下哪些算法是分類算法。

A、DBSCAN

B、C4.5

C、K-Mean

D、EM

答案：B

68.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯誤的是0。

A、大數(shù)據(jù)起源互聯(lián)網(wǎng)，目前處于成熟期；

B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù)；

C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地；

D、互聯(lián)網(wǎng)上形成了多種相對成熟的應(yīng)用模式。

答案：A

69.下列關(guān)于計算機存儲容量單位的說法中,錯誤的是()

A、1I<B<1MB<1GB

B、基本單位是字節(jié)(Byte)

C、一個漢字需要一個字節(jié)的存儲空間

D、一個字節(jié)能夠容納一個英文字符

答案：C

70.當置信水平一定時,置信區(qū)間的寬度()

A、隨著樣本量的增大而減小

B、隨著樣本量的增大而增大

C、與樣本量的大小無關(guān)

D、先隨著樣本量的增大而減小，到一定程度后會隨著樣本

量的增大而增大。

答案：A

71.倒傳遞神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))的訓(xùn)練順序為何？(A:調(diào)整權(quán)重;B:計算誤差值;

C:利用隨機的權(quán)重產(chǎn)生輸出的結(jié)果)

AvBCA

B、CAB

C、BAC

D、CBA

答案：D

72.個人信息保護影響評估報告和處理情況記錄應(yīng)當至少保存()年。

A、—

B、+

C、五

D、三

答案：D

73.資金的時間價值是()

A、同一資金在同一時點上價值量的差額

B、同一資金在不同時點上價值量的差額

C、不同資金在同一時點上價值量的差額

D、不同資金在不同時點上價值量的差額

答案：B

74.有一條關(guān)聯(lián)規(guī)則為AT

B,此規(guī)則的信心水平(confidence)為60%,則代表()

A、買B商品的顧客中，有60%的顧客會同時購買A

B、同時購買

A,B兩商品的顧客，占所有顧客的60%

C、買A商品的顧客中，有60%的顧客會同時購買B

D、兩商品

A.B在交易數(shù)據(jù)庫中同時被購買的機率為60%

答案：C

75.有一組數(shù)據(jù)其均值是20,對其中的每一個數(shù)據(jù)都加上

10.那么得到的這組新數(shù)據(jù)的均值是0。

A、20

B、10

C、15

D、30

答案：D

76.與大數(shù)據(jù)密切相關(guān)的技術(shù)是0。

A、藍牙；

B、云計算

C、Wi-Fi

D、博弈論

答案：B

77.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展強、數(shù)據(jù)挖掘能力

強等特點的分析工具是()。

A、Weka

B、SPSS

C、SAS

D、R

答案：D

78.用于分類與回歸應(yīng)用的主要算法有：（）

AxApriori算法、HotSpot算法

B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹

C、K均值法、S0M神經(jīng)網(wǎng)絡(luò)

D、決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯

答案：D

79.（）提供的支撐技術(shù)，有效解決了大數(shù)據(jù)分析、研發(fā)的問題，比如虛擬化技術(shù)、

并行計算、海量存儲和海量管理等。

A、點計算

B、線計算

C、云計算

D、面計算

答案：C

80.描述一組對稱（或正態(tài)）分布數(shù)據(jù)的離散程度時,最適宜選擇的指標是0

A、極差

B、標準差

C、均值

D、變異系數(shù)

答案：B

81.考慮下面的頻繁3-項集的集合:（1.213},{1,2,

4},[1,3,4},{1,3,5},{2,3.4},[2,3,5},

{3.4,5}假定數(shù)據(jù)集中只有5個項,若采用合并策略,則由候選產(chǎn)生過程得到4-項

集不包含()

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,45

答案：C

82.相關(guān)分析與回歸分析的一個重要區(qū)別是()

A、前者研究變量之間關(guān)系的密切程度,后者研究變量間的變動關(guān)系,并用方程式

表示

B、前者研究變量之間的變動關(guān)系,后者研究變量間關(guān)系的密切程度

C、兩者都研究變量間的變動關(guān)系

D、兩者都不研究變量間的變動關(guān)系

答案：A

83.SQL語句中刪除表的命令是()

A、DROPTABLE

B、DELETETABLE

C、ERASETABLE

D、DELETEDBF

答案：A

84.已知事件A的概率P(A)=0.6,U為必然事件，則P(A+U)=1,P(AU)二

A、0.4

B、0.6

C、0

D、1

答案：B

85.邁克爾?波特的“五力模型”中，五種競爭力量中不包括0

A、新進入者

B、供應(yīng)商議價能力

C、其他利益相關(guān)者力量

D、行業(yè)中現(xiàn)有競爭者

答案：C

86.假設(shè)12個銷售價格記錄組已經(jīng)排序如下：5,10,11,13.

15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)

方法將它們劃分成四個箱,求15在哪個箱子？()

A、第1個

B、第2個

C、第3個

D、第4個

答案：A

87.()是研究一種或者多種因素的變化對試驗結(jié)果的觀測值是否有顯著影響的統(tǒng)

計方法。

A、因子分析；

B、數(shù)據(jù)降維

C、方差分析

D、假設(shè)檢驗

答案：C

88.某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬

于數(shù)據(jù)挖掘的哪類問題？()

A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

B、聚類

C、分類

D、自然語言處理

答案：A

89.以下哪個指標不能用于線性回歸中的模型比較()

A、R方

B、調(diào)整R方

C、AIC

D、BIG

答案：A

90.下面關(guān)于聚類分析說法錯誤的是0

A、一定存在一個最優(yōu)的分類

B、聚類分析是無監(jiān)督學(xué)習(xí)

C、聚類分析可以用于判斷異常值

D、聚類分析即:物以類聚，人以群分

答案：A

91.分類變量使用以下哪個統(tǒng)計量進行缺失值填補較合適

A、均值

B、最大值

C、眾數(shù)

D、中位數(shù)

答案：C

92.若數(shù)據(jù)量較大,下面哪種方式比較適合()

A、系統(tǒng)聚類

B、快速聚類(k-means)

C、A和B都可以

D\A和B都不可以

答案：B

93.在對歷史數(shù)據(jù)集進行分區(qū)之前進行數(shù)據(jù)清洗(缺失值填補等)的缺點是什么

A、違反了建模的假設(shè)條件

B、加大了處理的難度

C、無法針對分區(qū)后各個數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗

D、無法對不同數(shù)據(jù)清理的方法進行比較,以選擇最優(yōu)方法

答案：D

94.數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的是()

A、數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容

B、捕捉到的新數(shù)據(jù)會覆蓋原來的快照

C、數(shù)據(jù)倉庫隨時間變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行

重新綜合

答案：C

95.SQL語言中,刪除一個表中所有數(shù)據(jù)，但保留表結(jié)構(gòu)的命令是()

A、DELETE

B、DROP

GCLEAR

D、REMORE

答案：A

96.依照《中華人民共和國數(shù)據(jù)安全法》和有關(guān)法律、行政法規(guī)的規(guī)定，()負責(zé)統(tǒng)

籌協(xié)調(diào)網(wǎng)絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。

A、工業(yè)和信息化部

B、國家安全部門

C、國家網(wǎng)信部門

D、通信主管部門

答案：C

97.假設(shè)屬性ine的最大最小值分別是12000

元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到。至1的范圍內(nèi)。

對屬性ine的73600元將被轉(zhuǎn)化為()

A、0.751

B、0.163

C、0.457

D、0.716

答案：D

98.建立一個模型,通過這個模型根據(jù)已知的變量值來預(yù)測其他某個變量值屬于

數(shù)據(jù)挖掘的哪一類任務(wù)？()

A、根據(jù)內(nèi)容檢索

B、建模描述

C、預(yù)測建模

D、尋找模式和規(guī)則

答案：C

99.自動化高級分析實驗室,實現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián),實現(xiàn)數(shù)據(jù)的自助組表、

自助分析功能，滿足不同層級,不同水平的用戶需求的是0

A、初級分析；

B、綜合分析

C、典型分析

D、高級分析

答案：D

100.下列選項中屬于現(xiàn)金流入的項目是0

A、所得稅

B、建設(shè)投資

C、經(jīng)營成本

D、營業(yè)收入

答案：D

101.一組N個觀測值按數(shù)值大小排列,分成100份,處于X%位置的值稱第X個百

分位數(shù)稱為()。

A、分位數(shù)

B、中位數(shù)

C、眾數(shù)

答案：A

102.開始將N個樣品各自作為一類,將規(guī)定樣品之間的距離和類與類之間的距離,

然后將距離最近的兩類合并成一個新類,計算新類與其他類的距離,重復(fù)進行兩

個最近類的合并,每次減少一類,直至所有的樣品合并為一類，此種聚類方法是()

A、K-means

B、SOM聚類

C、系統(tǒng)聚類

D、有序聚類

答案：C

103.指數(shù)平滑法可以用以下哪種指標來反映對時間序列資料的修正程度()

A、平滑常數(shù)

B、指數(shù)平滑數(shù)初始值

C、跨越期

D、季節(jié)指數(shù)

答案：A

104.變量的量綱比如以厘米或者米為單位對下面哪種方法會有影響0

A、方差分析

B、回歸分析

C、聚類分析

D、主成分分析

答案：C

105.關(guān)于Tableau的特點，以下說法錯誤的是()

A、學(xué)習(xí)成本低，簡單易用；

B、圖表精美；

C、開發(fā)快速，分享便捷；

D、需要IT大量人員參與

答案：D

106.在ID3算法中信息增益是指()

A、信息的溢出程度

B、信息的增加效益

C、烯增加的程度最大

D、炳減少的程度最大

答案：D

107.一組數(shù)據(jù)中最大值與最小值的差值稱為0,也稱全距。

A、極差

B、極距

C、距離

D、方差

答案：A

108.()是一種開源軟件編程語言,主要用于統(tǒng)計分析,繪圖和數(shù)據(jù)挖掘,內(nèi)置多種

統(tǒng)計及分析功能。

A、H.IVE;

B、H.ADOOP

C、R;

D、H.FDS

答案：C

109.決策樹中的InformationGain的計算是用來?

A、剪枝

B、使樹成長

C、處理缺失值和異常值

D、砍樹

答案：B

110.泊松回歸是一種廣泛應(yīng)用的()回歸模型。

A、線性

B、非線性

C、預(yù)測

D、估算

答案：B

111.數(shù)據(jù)庫系統(tǒng)是由0組成的

A、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和用戶

B、數(shù)據(jù)文件、命令文件和報表

C、數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)

D、常量、變量和函數(shù)

答案：A

112.下列四項中，不屬于數(shù)據(jù)庫特點的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨立性高

答案：C

113.某小區(qū)60%居民訂晚報,45%訂青年報,30%兩報均訂,隨機抽一戶。則至少訂

一種報的概率為()

A、0.82

B、0.85

C、0.80

D、0.75

答案：D

114.關(guān)于統(tǒng)計學(xué)和大數(shù)據(jù)之間的關(guān)系,一下說法錯誤的是0。

A、面臨大數(shù)據(jù)，統(tǒng)計學(xué)的研究對象有所改變；

B、在大數(shù)據(jù)環(huán)境中,需要首先將未知的問題轉(zhuǎn)化為可用的統(tǒng)計方法；

C、在大數(shù)據(jù)分析過程中，傳統(tǒng)的統(tǒng)計分析過程“定量一定位一再定性”轉(zhuǎn)變?yōu)椤岸?/p>

量一定性”；

D、在大數(shù)據(jù)環(huán)境中,需要將統(tǒng)計研究的對象范圍擴展到一切數(shù)據(jù)。

答案：A

115.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展差、數(shù)據(jù)挖掘能力

強等特點的分析工具是()。

A、Weka

B、SPSS

C、SAS

D、R

答案:B

116.下列說明錯誤的是()

A、性別二“男”二)職業(yè)二“司機”，是布爾型關(guān)聯(lián)規(guī)則

B、性別二“女"二》avg(收入)二2300,是一個數(shù)值型

關(guān)聯(lián)規(guī)則

C、肝炎券ALT(丙氨酸轉(zhuǎn)氨酶)升高,是一個單層關(guān)聯(lián)規(guī)則

D、性別二“女”二〉職業(yè)二“秘書”，是多維關(guān)聯(lián)規(guī)則

答案：C

117.Hive是基于Hadoop的一個數(shù)據(jù)()工具

A、分析；

B、倉庫

C、制圖

D、可視化

答案：B

118.數(shù)據(jù)記錄內(nèi)容完整比例,包括指標單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整,

指標字段值完整稱為()

A、指標數(shù)據(jù)自動采集率；

B、指標數(shù)據(jù)接入率

C、指標數(shù)據(jù)接入及時率；

D、指標數(shù)據(jù)完整率

答案：D

119.EXCEL中，求標準差的函數(shù)是0

A、AVERAGE

B、MEDIAN

C、MODE

D、STDEV

答案：D

120.對于下列實驗數(shù)據(jù):1,108,11,8,5,6,8,

8,7,11,描述其集中趨勢用()最為適宜,其值是()。

A、平均數(shù)，14.4

B、中位數(shù),8.5

C、眾數(shù),8

D、以上都可以

答案：C

121.《個人信息保護法》發(fā)布執(zhí)行時間()。

A、2021年9月1日;

B、2021年10月1日；

C、2021年11月1日

D、2021年12月1日

答案：C

122.檢測一元正態(tài)分布中的離群點,屬于異常檢測中的基于

()的離群點檢測

A、統(tǒng)計方法

B、鄰近度

C、密度

D、聚類技術(shù)

答案：A

123.下列關(guān)于聚類挖掘技術(shù)的說法中，錯誤的是()

A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目，完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別

B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能

C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能

D、與分類挖掘技術(shù)相似的是,都是要對數(shù)據(jù)進行分類處理

答案：B

124.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分分為0

A、結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)

B、強結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)

C、截面數(shù)據(jù)、面板數(shù)據(jù)

D、一級數(shù)據(jù)、二級數(shù)據(jù)、三級數(shù)據(jù)

答案：A

125.當前國內(nèi)社會中，最為突出的大數(shù)據(jù)環(huán)境是()

A、互聯(lián)網(wǎng)

B、物聯(lián)網(wǎng)

C、綜合國力

D、自然資源

答案：A

126.()是一種松散耦合的服務(wù)和應(yīng)用之間標準的集成方式。

A、E.SB;

B、D.M

C、ODS

D、E.TL

答案：A

127.在建立線性回歸(LinearRegression)之前我們可以利用何種方法挑選重要

屬性,以降低模型的復(fù)雜度？

A、皮爾森相關(guān)系數(shù)

B、卡方檢定

C、T-檢定

D、Z-Score

答案：A

128.給定一個置信概率和置信區(qū)域,若誤差超過置信區(qū)域，則認為誤差不是隨機

誤差引起,視為異常值的判別方法Oo

A、聚類判別法；

B、回歸判別法

C、抽樣判別法

D、統(tǒng)計判別法

答案：D

129.ROC曲線凸向哪個角，代表模型越理想？

A、左上角

B、右上角

C、左下角

D、右下角

答案：A

130..給出下列結(jié)論:

1)在回歸分析中,可用指數(shù)系數(shù)R方的值判斷模型的擬合效果,R方越大,模型的

擬合效果越好；

2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的

擬合效果越好；

⑶在回歸分析中,可用相關(guān)系數(shù)r的值判斷模型的擬合效果,r越小,模型的擬合

效果越好；

(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平

的帶狀區(qū)域中,說明這樣的模型比較

合適.帶狀區(qū)域的寬度越寬,說明模型的擬合精度越高.以上結(jié)論中,正確的有()

個.

A、1

B、2

C、3

D、4

答案：A

131.回歸是一種預(yù)測建模技術(shù)研究()和()的依存關(guān)系。

A、預(yù)測值、實際值

B、自變量、因變量

C、絕對誤差、平方誤差

D、測試樣本、集合

答案：B

132.ODS是指()

A、企業(yè)數(shù)據(jù)中心；

B、數(shù)據(jù)倉庫

C、操作型存儲

D、總線

答案：B

133.用簡單隨機重復(fù)抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,

則樣本容量需要擴大到原來的()

A、2倍

B、3倍

C、4倍

D、5倍

答案：C

133假設(shè)｛BCE)為一頻繁項目集(FrequentItemset)，則根據(jù)AprioriPrinciple

以下何者不是子頻繁項目？

A、BC

B、CE

C、C

D、CD

答案：D

135.假如學(xué)生考試成績以“優(yōu)”.“良”.“及格”和“不及格”來記錄，為了說

明全班同學(xué)考試成績的水平高低,其集中趨勢的測度0

A、可以采用算術(shù)平均數(shù)

B、可以采用眾數(shù)或中位數(shù)

C、只能采用眾數(shù)

D、只能采用四分位數(shù)

答案：C

136.將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?

A、數(shù)據(jù)獲取

B、分類和預(yù)測

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)可視化

答案：C

137.在有指導(dǎo)的數(shù)據(jù)挖掘中，有關(guān)測試集的說法錯誤的是0

A、測試集和訓(xùn)練集是相互聯(lián)系的

B、測試集是用以測試模型的數(shù)據(jù)集

C、通常測試集大約占總樣本的三分之一

D、K-次交叉驗證中,測試集只有1個,訓(xùn)練集有K-1個

答案：A

138.以下那一項不是大數(shù)據(jù)提供的用戶交互方式是0。

A、企業(yè)報表;

B、查詢

C、大數(shù)據(jù)分析挖掘

D、可視化

答案：A

139.表示職稱為副教授、性別為男的表達式為0

A、職稱二‘副教授'0R性別=‘男’

B、職稱二'副教授'AND性別='男'

C、BETWEEN'副教授'AND'男，

D、IN(‘副教授‘，‘男‘)

答案：B

140.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測模型,常用于()分類變量

預(yù)測和概率預(yù)測。

A、四值

B、三值

C、二值

D、一值

答案：C

141.檢查異常值常用的統(tǒng)計圖形是()

A、柱狀圖

B、箱線圖

C、帕累托圖

D、氣泡圖

答案：B

142.以下哪條屬于個人信息影響的評估場景：()

A、處理敏感個人信息，利用個人信息進行自動化決策

B、委托處理個人信息、向第三方提供個人信息、公開個人信息

C、向境外提供個人信息

D、以上皆是

答案：D

143.《個人信息保護法》對于企業(yè)的影響不包括()

A、需要強化個人信息處理這主體責(zé)任

B、明確了可以量化的中國版執(zhí)行罰則

C、需要設(shè)立負責(zé)處理個人信息保護相關(guān)事務(wù)的專門機構(gòu)和指定代表

D、收集和處理數(shù)據(jù)時可以不遵循“最小化”原則

答案：D

144.實際由源業(yè)務(wù)系統(tǒng)自動接入的指標數(shù)據(jù)占指標體系中應(yīng)接指標總數(shù)的比例

稱為()

A、指標數(shù)據(jù)自動采集率；

B、指標數(shù)據(jù)接入率

C、指標數(shù)據(jù)接入及時率；

D、指標數(shù)據(jù)完整率

答案：A

145.假設(shè)檢驗中，拒絕域的邊界稱為()

A、臨界值

B、臨界點

C、置信水平

D、邊際值

答案：A

146.以下關(guān)于大數(shù)據(jù)的概念和理解不正確的是0

A、大數(shù)據(jù)是指無法再容許的時間內(nèi)用常規(guī)的軟件工具對其內(nèi)容進行抓取、管理

和處理的數(shù)據(jù)集合,大數(shù)據(jù)規(guī)模的標準是持續(xù)變化的，當前泛指單一的數(shù)據(jù)集的

大小在幾十TB和PB之間；

B、大數(shù)據(jù)是一項技術(shù)，能夠?qū)?fù)雜海量數(shù)據(jù)進行實時獲取、

傳輸、存儲、加工和利用的高薪技術(shù)；

C、大數(shù)據(jù)是一種挑戰(zhàn)，現(xiàn)有的數(shù)據(jù)采集、傳輸、存儲、處理和分析技術(shù)已無法適

用于現(xiàn)有的需要;

D、大數(shù)據(jù)是一個時代,擁有大數(shù)據(jù)是時代的特征、解讀大數(shù)據(jù)是時代的任務(wù)、應(yīng)

用大數(shù)據(jù)是時代的機遇。

答案：A

147,數(shù)據(jù)收集的標準為()而非動用企業(yè)全部數(shù)據(jù)。

A、一致性、可靠性、時效性

B、相同性、可靠性、時效性

C、C相關(guān)性、可靠性、時效性

D、一致性、可靠性、實際性

答案：C

148.MySQL是()

A、操作系統(tǒng)；

B、數(shù)據(jù)庫

C、聊天軟件

D、瀏覽器

答案：B

149.當不知道數(shù)據(jù)所帶標簽時,可以使用哪種技術(shù)促使帶同類標簽的數(shù)據(jù)與帶其

他標簽的數(shù)據(jù)相分離？()

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、主成分分析

答案：B

150.某超市研究銷售記錄發(fā)現(xiàn)購買奶的很概率會購買包,這種屬于數(shù)據(jù)挖掘的

哪類問題？()

A、聚類分析

B、關(guān)聯(lián)規(guī)則

C、分類分析

D、自然語言處理

答案：B

151.蘋果公司對IPHONE的降價行為屬于0

A、地域性差別定價

B、時間性差別定價

C、非線性定價或數(shù)量折扣定價

D、其他形式的定價

答案：B

152.當不知道數(shù)據(jù)所帶標簽時,可以使用哪種技術(shù)促使帶同類標簽的數(shù)據(jù)與帶其

他標簽的數(shù)據(jù)相分離？

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、隱馬爾可夫鏈

答案：B

153.NaiveBayes是屬于數(shù)據(jù)挖掘中的什么方法？

A、聚類

B、分類

C、時間序列

D、關(guān)聯(lián)規(guī)則

答案：B

154.《中華人民共和國數(shù)據(jù)安全法》中的數(shù)據(jù),是指任何以電子或者其他方式對()

的記錄。

Av數(shù)據(jù)

B、信息

C、文件

D、知識

答案：B

155.下列不屬于原始數(shù)據(jù)來源的是()

A、行政記錄

B、統(tǒng)計調(diào)查

C、統(tǒng)計年鑒

D、實驗

答案：C

156.數(shù)據(jù)挖掘技術(shù)包括三個主要的部分()

A、數(shù)據(jù)、模型、技術(shù)

B、算法、技術(shù)、領(lǐng)域知識

C、數(shù)據(jù)、建模能力、算法與技術(shù)

D、建模能力、算法與技術(shù)、領(lǐng)域知識

答案：C

157.(),用于顯示樹狀結(jié)構(gòu)數(shù)據(jù)。

A、矩形式樹狀結(jié)構(gòu)圖；

B、平行結(jié)構(gòu)樹

C、垂直結(jié)構(gòu)樹

答案：A

158.在Excel工作表中，在某單元格內(nèi)輸入數(shù)值123,不正確的輸入形式是0

A、123

B、=123

C、+123

D、*123

答案：D

159.分析顧客消費行業(yè),以便有針對性的向其推薦感興趣的服務(wù),屬于()問題。

A、關(guān)聯(lián)規(guī)則挖掘

B、分類與回歸

C、聚類分析

D、時序預(yù)測

答案：A

160.在有關(guān)數(shù)據(jù)倉庫測試,下列說法不正確的是()

A、在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要

包括單元測試和系統(tǒng)測試

B、當數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試

C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的

功能測試和回歸測試

D、在測試之前沒必要制定詳細的測試計劃

答案：D

161.Byte代表一個字節(jié),及()的數(shù)值范圍。

A、0~100

B、0~155

C、0~200

D、0~255

答案：D

162.目前常用的識別異常數(shù)據(jù)的方法有物理判別法和0。

A、化學(xué)判別法

B、統(tǒng)計判別法

C、靜態(tài)判別法

D、動態(tài)判別法

答案：B

163,下列有關(guān)Apriori算法的說法中不正確的是()

A、Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。

B、應(yīng)用Apriori算法時，需要先設(shè)定模型的最小支持度、最小置信度等閾值。

C、應(yīng)用Apriori算法時，輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是離散型數(shù)據(jù)。

DxApriori算法掃描數(shù)據(jù)庫的次數(shù)依賴于最大頻繁項集中項的數(shù)量。

答案：C

164.VBA語言中，聲明變量的關(guān)鍵字是()。

A、SET;

B、C.ONST

C、PRIVATE

D、IM

答案：D

165.下列四項中，不屬于數(shù)據(jù)庫特點的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨立性高

答案：C

166.維度規(guī)約是在以下哪個步驟的任務(wù)？()

A、頻繁模式挖掘

B、降維

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)流挖掘

答案：C

167.屬于財務(wù)專業(yè)明細數(shù)據(jù)表的是()

A、客戶收費流水表；

B、應(yīng)收票據(jù)信息表；

C、公司分壓線損統(tǒng)計表;

D、供應(yīng)計劃表

答案：B

168.以下哪個變量可以反映客戶的忠誠度？()

A、購買頻次

B、購買金額

C、最后一次購買時間

D、購買金額波動率

答案:A

169.某項目預(yù)計運行5年后的凈現(xiàn)值為4500萬元,如折現(xiàn)率為16%,其終值應(yīng)為()

萬元(說明:結(jié)果保留兩位小數(shù))

A、8045.86

B、6996.21

C、9451.54

D、7000.02

答案：C

170.數(shù)據(jù)在規(guī)定的時間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為0

A、指標數(shù)據(jù)自動采集率；

B、指標數(shù)據(jù)接入率

C、指標數(shù)據(jù)接入及時率；

D、指標數(shù)據(jù)完整率

答案：C

171.數(shù)據(jù)正規(guī)化(DataNormaIization)是在知識發(fā)掘處理

(KnowIedgeDiscoveryProcess)中的哪一個階段進行？

A、數(shù)據(jù)清洗

B、數(shù)據(jù)選擇

C、數(shù)據(jù)編碼

D、數(shù)據(jù)擴充

答案：C

172.東北人養(yǎng)了一只雞和一頭豬。一天雞問豬:”主人呢？“豬說:“出去買蘑菇了。

“雞聽了撒丫子就跑。豬說:“你跑什么？"雞叫道：“有本事主人買粉條的時候你小

子別跑！”

以上對話體現(xiàn)了數(shù)據(jù)分析方法中的()

A、關(guān)聯(lián)

B、聚類

C、分類

D、自然語言處理

答案：A

173.以下敘述正確的是0

A、極差較少受異常值的影響

B、四分位差較少受異常值的影響

C、方差較少受異常值的影響

D、標準差較少受異常值的影響

答案：B

174.大數(shù)據(jù)應(yīng)用需求分為年度需求和()兩類。

A、季度需求

B、月度需求

C、周需求

D、即時需求

答案：D

175.關(guān)聯(lián)規(guī)則是反映事物之間的依賴關(guān)系,典型例子是購物籃分析,常見算法有

Apriori關(guān)聯(lián)算法和()算法。

A、貝葉斯算法

B、線性回歸

C、F.P-growth關(guān)聯(lián)算法

D、聚類算法

答案：C

176.無監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法

A、聚類算法；

B、降維算法；

C、關(guān)聯(lián)規(guī)則算法；

D、文本挖掘

答案：A

177.以下哪些分類方法可以較好地避免樣本的不平衡問題？

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

答案：A

178.數(shù)據(jù)倉庫的最終目的是0

A、收集業(yè)務(wù)需求

B、建立數(shù)據(jù)倉庫邏輯模型

C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析

D、為用戶和業(yè)務(wù)部門提供決策支持

答案：D

179.下列不屬于分類算法的是()

A、C4.5算法

B、邏輯回歸

C、KNN算法

D、TF-TDF算法

答案：D

180.如下哪個不是最近鄰分類器的特點0

A、它使用具體的訓(xùn)練實例進行預(yù)測,不必維護源自數(shù)據(jù)的模型

B、分類一個測試樣例開銷很大

C、最近鄰分類器基于全局信息進行預(yù)測

D、可以生產(chǎn)任意形狀的決策邊界

答案：C

181.通過()，計算頻數(shù)、眾數(shù)、中位數(shù)等一個或多個數(shù)據(jù)指標，探索數(shù)據(jù)的分布結(jié)

構(gòu)。

A、概率統(tǒng)計法

B、匯總統(tǒng)計法

C、可視化法

D、分類統(tǒng)計法

答案：B

182.MapReduce是一種()計算模型

A、集中式；

B、分布式

C、離散式

D、放射式

答案：B

183.一種商品價格變動與由此引起另外一種商品需求量相對變動的比率稱為()

A、需求價格彈性

B、供給價格彈性

C、需求交叉彈性

D、供給交叉彈性

答案：C

184.請問以下何者屬于時間序列的問題？

A、信用卡發(fā)卡銀行偵測潛在的卡奴

B、基金經(jīng)理人針對個股做出未來價格預(yù)測

C、電信公司將人戶區(qū)分為數(shù)個群體

D、以上均不是

答案：B

185.非參數(shù)檢驗是針對()分布情況做的假設(shè)。

A、總體

B、局部

C、個體

答案:A

186.分類器效果檢驗中的準確率是指()

A、預(yù)測正確的數(shù)據(jù)在總數(shù)據(jù)中的比例

B、預(yù)測為正的數(shù)據(jù)在總數(shù)據(jù)中的比例

C、預(yù)測為正的數(shù)據(jù)中實際為正的數(shù)據(jù)所占比例

D、實際為正的數(shù)據(jù)中被預(yù)測為正的數(shù)據(jù)所占比例

答案：C

187.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時間0。

A、2021年9月1日；

B、2021年10月1日；

C、2021年11月1日

D、2021年12月1日

答案：A

188.實際接入的指標數(shù)占應(yīng)接指標總數(shù)的比例,統(tǒng)計時又分線上和線下接入率稱

為()

A、指標數(shù)據(jù)自動采集率；

B、指標數(shù)據(jù)接入率

C、指標數(shù)據(jù)接入及時率；

D、指標數(shù)據(jù)完整率

答案：B

189.關(guān)于回歸分析,下列說法中錯誤的是0

A、作回歸分析的變量之間要有實際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象隨意進行回

歸分析,要結(jié)合專業(yè)知識對兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。

B、在進行線性回歸分析進行的數(shù)據(jù)準備的時候,要求因變量y和自變量x都是符

合總體正態(tài)的隨機變量。

C、回歸直線不要隨意外延

D、所有非線性回歸都可以轉(zhuǎn)化為線性回歸

答案：D

190.凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標之間的數(shù)量關(guān)系()NPV>0

Av當PK1,IRR>iNPV>0

B、當Pl>1,IRR>iNPV<0

C、當Pl<1時，IRR>i,NPV<0、當DPI>1IRR>i,時，

答案：B

191.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是

A、K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類所有對象。

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同

形狀的簇。

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN會

合并有重疊的簇。

答案：A

192..人們購買制冷用空調(diào)主要是為了在夏天獲得涼爽空氣,這屬于空調(diào)產(chǎn)品整

體概念中的()

A、有形產(chǎn)品

B、直接產(chǎn)品

C、核心產(chǎn)品

D、主要產(chǎn)品

答案：C

193.某牙膏廠原來生產(chǎn)兩面針藥物牙膏,現(xiàn)在又增加牙刷生產(chǎn),這屬于()

A、同心多元化

B、水平多元化

C、集團多元化

D、相關(guān)多元化

答案：B

194.在發(fā)生或者可能發(fā)生個人信息泄露、毀損、丟失的情況時，應(yīng)當立即采取()

措施,按照規(guī)定及時告知用戶并向有關(guān)主管部門報告。()

A\彌補

B、補救

C、救援

D、相關(guān)

答案：B

多選題

1.以下算法中對缺失值敏感的有()

A、Logistic回歸

B、SVM算法

C、CART決策樹

D、樸素貝葉斯

答案：AB

2.以下關(guān)于皮爾森相關(guān)分析敘述正確的是()

A、兩變量獨立，兩者的皮爾森相關(guān)系數(shù)必然等于0

B、兩變量皮爾森相關(guān)系數(shù)不等于0,兩者必然不獨立

C、皮爾森相關(guān)系數(shù)是否等于零,不能指明兩變量是否獨立

D、兩變量不獨立，兩者的皮爾森相關(guān)系數(shù)必然不等于0

答案：AB

3.配合一元線性回歸方程須具備下列前提條件0

A、現(xiàn)象間確實存在數(shù)量上的相互依存關(guān)系

B、現(xiàn)象間的關(guān)系是直線關(guān)系，這種直線關(guān)系可用散點圖來表示

C、具備一組自變量與因變量的對應(yīng)資料,且能明確哪個是自變量,哪個是因變量

D、兩個變量之間不是對等關(guān)系

答案：ABCD

4.下面關(guān)于季度模型的敘述,不正確的是0

A、季度模型以季度數(shù)據(jù)為樣本

B、季度模型主要用于季度預(yù)測

C、季度模型注重長期行為的描述

D、季度模型一般規(guī)模較大

答案：AB

5.如果自變量有連續(xù)型變量,則適用的分類預(yù)測方法有0

A、邏輯回歸

B、神經(jīng)網(wǎng)絡(luò)

GSVM算法

D、C4.5算法

答案：ABC

6.在比較不同預(yù)測方法的精確度時,通常采用()等誤差指標來衡量預(yù)測誤差的大

小。

A、絕對誤差

B、相對誤差

C、平均誤差

D、隨機誤差

答案：ABC

7.以下說法正確的有()

A、評價預(yù)測精度是通過測量與分析預(yù)測誤差進行的

B、絕對誤差是實際觀測值與預(yù)測值的離差

C、相對誤差反映實際觀測值與預(yù)測值之間差異的相對程度

D、平均誤差反映實際觀測值與預(yù)測值之間的平均差異

答案：ABCD

8.產(chǎn)品成本費用按其與產(chǎn)量變化的關(guān)系分為()

A、可變成本

B、固定成本

C、付現(xiàn)成本

D、沉沒成本

答案：AB

9.下面給出的t檢驗的結(jié)果，0表明接受原假設(shè),顯著性水平為0.05o

A、0.000

B、0.039

C、0.092

D、0.124

答案：CD

10.回歸變差(或回歸平方和)是指()

A、被解釋變量的實際值與平均值的離差平方和

B、被解釋變量的回歸值與平均值的離差平方和

C、被解釋變量的總變差與剩余變差之差

D、解釋變量變動所引起的被解釋變量的變差

答案：BCD

11.在ExceI中,要選定A到E列單元格,操作正確的是

A、用鼠標左鍵單擊列號

A,然后向右拖動鼠標至列號

E,再釋放鼠標左鍵

B、左鍵單擊列號

A,再按下shift鍵不放并用鼠標左鍵單擊列號

E,最后釋放shift鍵

C、單擊列號

A,然后先按下Ctrl鍵不放,再用鼠標單擊B.C,D,E列號,最后釋放CtrI鍵

D、按shift鍵不放，用鼠標左鍵單擊

A,B,C,D,E的每個列號

答案：ABC

12.^ijApriori算法計算頻繁項集可以有效降低計算頻繁集的時間復(fù)雜度。在以

下的購物籃中產(chǎn)生支持度不小于3的候選3-項集，在候選2-項集中需要剪枝的是

0ID項集。

1面包.牛奶

2面包.尿布.啤酒.雞蛋

3牛奶.尿布.啤酒.可樂

4面包.牛奶.尿布.啤酒

5面包.牛奶.尿布.可樂

A、啤酒.尿布

B、啤酒.面包

C、面包.尿布

D、啤酒.牛奶

答案：BD

13.大數(shù)據(jù)技術(shù)的兩大核心：

A、分布式存儲GFS'HDFS

B、分布式傳輸Transmission

C、分布式采集Collection

Dx分布式處理MapReduce

答案：AD

14.概率分析中，應(yīng)計算出()表明該風(fēng)險因素的風(fēng)險程度。

A、變異系數(shù)

B、期望值

C、方差

D、標準差

答案：ABCD

15.數(shù)據(jù)科學(xué)家的3c精神

A、創(chuàng)造性地工作

B、批判性地思考

C、系統(tǒng)性地處理

D、好奇性地提問

答案：ABD

16.相關(guān)分析的任務(wù)有()

A、判定現(xiàn)象之間有無關(guān)系

B、判定現(xiàn)象之間關(guān)系的方向

C、判定相關(guān)關(guān)系的緊密程度

D、說明現(xiàn)象之間聯(lián)系的具體形式

答案：ABCD

17.元組在某些屬性上缺少值是常有的。在實際數(shù)據(jù)中,描述處理該問題的各種方

法有()

A、直接刪除

B、.使用屬性的平均值填充空缺值

C、使用一個全局常量填充空缺

D、使用與給定元組屬同一類的所有樣本的平均值

答案：ABC

18.如下表student中，如何篩選type為包含數(shù)學(xué)或語文的記錄？

IDtypescore

A01數(shù)學(xué)78

A02語文76

A03英語90

A04數(shù)學(xué)68

A05英語84

A、seIect*fromstudentwheretype=,>數(shù)學(xué)"andtype=M語文”

B、seIect*fromstudentwheretype二“數(shù)學(xué)"ortype=,J語文”

C\seIect*fromstudentwheretypein（M數(shù)學(xué)"，“語文"）

D、seIect*fromstudentwheretypein(M數(shù)學(xué)"？“語文")

答案：BC

19.以下哪些變量使用RFM方法構(gòu)造出來的？()

A、最近3期境外消費金額

B、最近6期網(wǎng)銀消費交易筆數(shù)

C、信用額度

D、距最近一次逾期的月數(shù)

答案：ABD

20.以下關(guān)于邏輯回歸的說法正確的是()

A、應(yīng)用邏輯回歸時,異常值會對模型造成很大的干擾。

B、邏輯回歸的自變量必須是分類變量,因此要對連續(xù)型變量進行離散化處理。

C、邏輯回歸對模型中自變量的多重共線性較為敏感。

D、邏輯回歸屬于分類算法。

答案：ACD

21.主成分分析計算選擇相關(guān)系數(shù)計算法時,確定主成分個數(shù)的致原則包括()

A、特征根值大于1

B、特征根值大于3

C、累積特征根值加總占總特征根值的80%以上

D、累積特征根值加總占總特征根值的90%以上

答案：AC

22.大數(shù)據(jù)應(yīng)用建設(shè)及運營過程中如發(fā)生數(shù)據(jù)安全問題,應(yīng)立即暫停大數(shù)據(jù)應(yīng)用

建設(shè)或運營工作，向0部門匯援。

A、互聯(lián)網(wǎng)部

B、安監(jiān)部

C、法規(guī)部

D、相關(guān)專業(yè)管理部門

答案：ABCD

23.下列關(guān)于統(tǒng)計量的表述中,正確的有()

A、估計同一個總體參數(shù)可以用多個不同的統(tǒng)計量

B、統(tǒng)計量是樣本的函數(shù)

C、.統(tǒng)計量不含有總體的參數(shù)

D、統(tǒng)計量是隨機變量

答案：ABD

24.下列對ID3算法的描述,正確的是0

A、每個節(jié)點的分支度都不相同

B、使用InformationGain作為節(jié)點分割的依據(jù)

C、可以處理數(shù)值型態(tài)的字段

D、方法處理空值的字段

答案：ABD

25.數(shù)據(jù)科學(xué)中的主流語音工具0

A、R

B、C++

C\Java

D、Python

答案：AD

26.定基發(fā)展速度與環(huán)比發(fā)展速度的關(guān)系有()。

A、各環(huán)比發(fā)展速度之和等于相應(yīng)的定基發(fā)展速度

B、各環(huán)比發(fā)展速度之積等于相應(yīng)的定基發(fā)展速度

C、兩個環(huán)比發(fā)展速度之商等于相應(yīng)的定基發(fā)展速度

D、兩個定基發(fā)展速度之商等于相應(yīng)的環(huán)比發(fā)展速度

答案：BD

27.處理噪聲數(shù)據(jù)的常用方法。

A、分箱

B、聚類

C、回歸

D、對比

答案：ABC

28.行業(yè)分析數(shù)據(jù)采集方法有I)o

A、一手資料

B、實地考察法

C、專家訪談法

D、收集媒體信息

答案：ABCD

29.貨幣時間價值用相對值來表示時,在數(shù)量上應(yīng)當理解為扣除0后的社會平均

利潤率。

A、時間因素

B、通貨膨脹因素

C、純粹利率

D、風(fēng)險因素

答案：BD

30.商業(yè)模式描述正確的是：

A、B2B--商家對商家

B、B2C一商家對人

C、020一線上對線下

D、C2C一人對人

答案：ABCD

31.以下屬于聚類算法的是0

A、K均值

B、DBSCAN

C\Apriori

D、knn

答案：AB

32.KANO模型定義的顧客需求層次有()

A、興奮型需求

B、喜愛型需求

C、基本型需求

D、期望型需求

答案：ACD

33.根據(jù)分析內(nèi)容和側(cè)重面不同,風(fēng)險分析的方法有()

A、敏感性分析

B、概率分析

C、經(jīng)濟效益分析

D、盈虧平衡分析

答案：ABD

34.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是0

A、系統(tǒng)誤差

B、登記性誤差

C、責(zé)任心誤差

D、技術(shù)性誤差

答案：BCD

35.敏感個人信息劃定依據(jù)()

A、與人格尊嚴相關(guān)

B、與人身.財產(chǎn)安全相關(guān)

C、不滿十四周歲未成年人的個人信息

D、與公司管理要求相關(guān)

答案：ABC

36.在客戶關(guān)系管理中,客戶的生命周期都包括()階段。

A、潛在客戶

B、響應(yīng)客戶

C、即得客戶

D、流失客戶

答案：ABCD

37.以下屬于數(shù)據(jù)預(yù)處理的是：）

A、缺失值填充

B、噪聲數(shù)據(jù)剔除

C、異常值識別

D、數(shù)據(jù)可視化

答案：ABC

38.我們可以用哪種方式來避免決策樹過度擬合的問題？0

A、利用修剪法來限制樹的深度

B、利用盆栽法規(guī)定每個節(jié)點下的最小的記錄數(shù)

C、利用逐步回歸法來刪除部分數(shù)據(jù)

D、目前并無適合的方法來處理這問題

答案：AB

39.在有關(guān)數(shù)據(jù)倉庫測試,下列說法中正確的是0

A、在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要

包括單元測試和系統(tǒng)測試

B、當數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試

C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試

D、在測試之前可以不制定詳細的測試計劃，測試過程中實時調(diào)整。

答案：ABC

40.關(guān)于基準收益率的表述,正確的是()

A、基準收益率越高越好

B、基準收益率越低越好，但不能低于銀行貸款利率

C、可以采用項目加權(quán)平均資金成本為基礎(chǔ)確定基準收益率

D、可以采用國家有關(guān)部門或行業(yè)統(tǒng)一發(fā)布的行業(yè)基準收益

率

答案：CD

41.分箱方法有哪些？()

A、等深分箱

B、等寬分箱

C、數(shù)據(jù)標準化

D、自定義區(qū)間法

答案：ABD

42.數(shù)據(jù)類型：

A、離散Q型

B、連續(xù)性

C、符號型

D、文本型

答案：ABCD

43.營銷觀念是營銷過程中如何處理0利益關(guān)系。

Av企業(yè)

Bx員工

C、顧客

D、社會

答案：ACD

44.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲基礎(chǔ),其特點為()

A、支持超大文件

B、基于商用硬件

C、流式數(shù)據(jù)訪問

D、高吞吐量

答案：ABCD

45.隨機抽樣方法有0

A、等距隨機抽樣

B、綜合隨機抽樣

C、簡單隨機抽樣

D、分群隨機抽樣

答案：ACD

46.能消除時間序列中的不規(guī)則變動和季節(jié)變動的方法是

A、移動平均法

B、指數(shù)平滑法

C、時間序列乘法模型

D、季節(jié)指數(shù)

答案：AD

47.關(guān)于數(shù)據(jù)范式描述準確的是：

A、經(jīng)驗科學(xué)是第一范式，主要研究模型是科學(xué)實驗；

B、理論科學(xué)是第二范式，主要研究模型是數(shù)學(xué)模型；

C、計算科學(xué)是第三范式,主要研究模型是計算機仿真和模擬，第三范式是“人腦+

電腦”，人腦是主角；

D、數(shù)據(jù)密集型科學(xué)是第四范式,的主要研究模型是數(shù)據(jù)挖掘卻機器學(xué)習(xí)，特別是

機器學(xué)習(xí)，第四范式是“電腦+人腦”，電腦是主角。

答案：ABCD

48.如下表student中，如何篩選type為包含數(shù)學(xué)或語文的記錄？0

AvseIect*fromstudentwheretype="數(shù)學(xué)”andtype="語文”

B、seIect*fromstudentwheretype="數(shù)學(xué)"ortype="語文”

Cvselect*fromstudentwheretypein（"數(shù)學(xué)”,“語文”）

D、seiect*fromstudentwheretypein（"數(shù)學(xué)"?”語文"）

答案：BC

49.下列項目中，其變動可以改變盈虧平衡點位置的因素有

A、單價

B、單位變動成本

C、銷量

D、固定成本

答案：ABCD

50.某種產(chǎn)品的生產(chǎn)總費用2003年為50萬元，比2002

年多2萬元,而單位產(chǎn)品成本2003年比2002年降低5%,則()

A、生產(chǎn)費用總指數(shù)為104.17%

B、生產(chǎn)費用指數(shù)為108.56%

C、單位成本指數(shù)為95%

D、產(chǎn)量指數(shù)為109.65%

E、由于成本降低而節(jié)約的生產(chǎn)費用為2.63萬元

答案：ACDE

51.按照性質(zhì),預(yù)測方法大致可分為()。

A、定性預(yù)測

B、情景預(yù)測

C、時間序列預(yù)測

D、回歸預(yù)測

答案：ACD

52.以下屬于分類器評價或比較尺度的有0

A、預(yù)測準確度

B、召回率

C、模型描述的簡潔度

D、F1-Score

答案：ABD

53.如下哪些不是基于規(guī)則的分類器的特點()

A、規(guī)則集的表達能力遠不如決策樹好

B、基于規(guī)則的分類器都對屬性空間進行直線劃分,并將類指派到每個劃分

C、無法被用來產(chǎn)生更易于解釋的描述性模型

D、非常適合處理類分布不平衡的數(shù)據(jù)集

答案：AC

54.數(shù)據(jù)離散化是指為了數(shù)據(jù)分析的需要，將連續(xù)數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù)的過程。

數(shù)據(jù)離散化的方法有()

A、隨機取值

B、等距離散法

C、數(shù)值規(guī)約

D、等頻離散法

答案：BD

55.缺失值的處理方法有哪些？()

A、用平均值填充

B、忽略缺失記錄

C、以任意數(shù)據(jù)填充

D、用默認值填充

答案:ABD

56.()這些數(shù)據(jù)特性都是對聚類分析具有很強影響的。

A、高維性

B、規(guī)模

C、稀疏性

D、噪聲和離群點

答案：ABCD

57.以下屬于數(shù)據(jù)規(guī)約方法的是0

A、數(shù)據(jù)離散化

B、數(shù)據(jù)標準化

C、噪聲數(shù)據(jù)識別

D、數(shù)據(jù)壓縮

答案：AD

58.在假設(shè)檢驗中，當我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時,表示()

A、有充足的理由否定原假設(shè)

B、原假設(shè)必定是錯誤的

C、犯錯誤的概率不大于a

D、犯錯誤的概率不大于b

E、在H。成立的情況下發(fā)生了小概率事件

答案：ACE

59.電子元器件：

A、電子管

B、晶體管

C、小規(guī)模中規(guī)模集成電路

D、大規(guī)模或超大規(guī)模集成電路

答案：ABCD

60.若檢驗統(tǒng)計量F近似等于1.說明()

A、組間方差中不包含系統(tǒng)因素的影響

B、組內(nèi)方差中不包含系統(tǒng)因素的影響

C、組間方差中包含系統(tǒng)因素的影響

D、方差分析中不應(yīng)拒絕原假設(shè)

答案：AD

61.統(tǒng)計決策的基本原則是()

Av可行性

B、發(fā)展性

C、合理性

D、經(jīng)濟性

答案：ACD

62.促銷預(yù)算的方法主要有()。

A、量入為出法

B、競爭對等法

C、銷售比例法

D、目標任務(wù)法

答案：ABCD

63.以下哪個分布是右偏分布？0

A、均勻分布

B、卡方分布

C、F分布

D、對數(shù)正態(tài)分布

答案：BCD

64.大數(shù)據(jù)在今天這個時間點上爆發(fā)的原因有哪些？()

A、各種傳感器無時無刻不在為我們提供大量的數(shù)據(jù)

B、各種監(jiān)控設(shè)備無時無刻不在為我們提供大量的數(shù)據(jù)

C、各種智能設(shè)備無時無刻不在為我們提供大量的數(shù)據(jù)

D、互聯(lián)網(wǎng)的收集和積累

答案:ABCD

65.數(shù)據(jù)挖掘的預(yù)測建模任務(wù)主要包括哪幾大類問題？0

A、分類

B、回歸

C、模式發(fā)現(xiàn)

D、模式匹配

答案：AB

66.從復(fù)雜度及價值高低兩個維度,可以將數(shù)據(jù)分析分為()

Av描述性分析(DescriptiveAnalytics)

B、診斷性分析(DiagnosticAnalytics)

C\預(yù)測性分析(PredictiveAnaIytics)

D、規(guī)范性分析(PrescriptiveAnalytics)

答案：ABCD

67.下面有關(guān)HAVING子句的說法中正確的是()

A、HAVING子句必須與GROUPBY子句同時使用，不能單獨使用

B、使用HAVING子句的同時不能使用WHERE子句

C、使用HAVING子句的同時可以使用WHERE子句

D、使用HAVING子句的作用是限定分組的條件

答案：ACD

68.在作邏輯回歸時,如果區(qū)域這個變量,當Region二A時Y取值均為1,無法確定

是否出現(xiàn)的是哪個問題？

A、共線性

B、異常值

C、擬完全分離(Quasi-pleteseparation)

D、缺失值

答案：ABD

69.以下哪個聚類分析的方法是利用統(tǒng)計學(xué)定義的距離進行度量()

A、層次聚類法

B、快速聚類法(K-Means)

C、基于密度的聚類法

D、基于網(wǎng)格的聚類法

答案：AB

70.方差分析的基本假設(shè)前提包括()

A、各處理條件下的樣本均來自正態(tài)總體

B、各處理條件下的樣本相互獨立

C、各處理條件下樣本的方差都相等

D、各處理條件下樣本均值相等，方差可以不等

答案：ABC

71.季節(jié)變動主要是由()引起的。

A、自然災(zāi)害

B、政治事件

C、制度.法津習(xí)俗

D、自然界的季節(jié)變化

答案：CD

72.以下說法正確的有哪些？()

A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大

B、大數(shù)據(jù)對傳統(tǒng)行業(yè)有幫助

C、大數(shù)據(jù)會帶來機器智能

D、大數(shù)據(jù)是一種思維方式

答案：BCD

73.下列公式正確的是()

A、流動資金二流動資產(chǎn)-流動負債

B、流動資產(chǎn)二應(yīng)收賬款+存貨

C、流動負債=應(yīng)付賬款+預(yù)收賬款

D、流動資金本年增加額二本年流動資金-上年流動資金

答案：ACD

74.決策樹法分析問題的主要步驟包括()。

A、結(jié)構(gòu)化問題

B、設(shè)計可能結(jié)果發(fā)生的概率

C、設(shè)計結(jié)果的得益

D、分析問題

答案：ABCD

75.下列說法中不正確的是()

A、任何兩個變量都具有相關(guān)關(guān)系

B、人的知識與其年齡具有相關(guān)關(guān)系

C、散點圖中的各點是分散的沒有規(guī)律

D、根據(jù)散點圖求得的回歸直線方程都是有意義的

答案：ACD

76.投資項目的現(xiàn)金流量中經(jīng)營成本與會計中的“總成本費用”概念有根本的不

同,不包括

A、利息支出

B、攤銷費

C、折舊費

D、維修費

答案：ABC

77.符合下列情形之一的,個人信息處理者方可處理個人信

息

A、取得個人的同意；

B、為訂立.履行個人作為一方當事人的合同所必需，或者

按照依法制定的勞動規(guī)章制度和依法簽訂的集體合同實施人力

資源管理所必需；

C、為履行法定職責(zé)或者法定義務(wù)所必需;

D、為應(yīng)對突發(fā)公共衛(wèi)生事件,或者緊急情況下為保護自然人的生命健康和財產(chǎn)安

全所必需；

E、為公共利益實施新聞報道.輿論監(jiān)督等行為,在合理的范圍內(nèi)處理個人信息；

F、依照本法規(guī)定在合理的范圍內(nèi)處理個人自行公開或者其他已經(jīng)合法公開的個

人信息；

G、法律.行政法規(guī)規(guī)定的其他情形。

答案：ABCDEFG

78.大數(shù)據(jù)四大特征：

A、速度快

B、數(shù)據(jù)量大

C、價值密度低

D、類型多

答案：ABCD

79.確定一個投資方案可行的必要條件是0。

A、凈現(xiàn)值大于零

B、現(xiàn)值指數(shù)大于1

C、投資回收期小于1年

D、內(nèi)部報酬率較高

答案：AB

80.以下屬于聚類算法的是()

A、K均值

B、DBSCAN

C\Apriori

Dxk-medoids

答案：ABD

81.下列何種算法可以幫助我們做數(shù)值的預(yù)測(Prediction)?

A、Apriori

B、DecisionTree

CvNaiveBayes

D、LinearRegression

答案：BD

82.層次聚類的聚類方式有0

A、凝聚方式聚類

B、分解方式聚類

C、Q型聚類

D、R型聚類

答案：AB

83.有下列情形之一的,個人信息處理者應(yīng)當事前進行個人信息保護影響評估,并

對處理情況進行記錄：

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）

文檔簡介

溫馨提示

最新文檔

評論

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔