大數(shù)據(jù)開發(fā)基礎練習題及答案17-2023-背題版_第1頁
大數(shù)據(jù)開發(fā)基礎練習題及答案17-2023-背題版_第2頁
大數(shù)據(jù)開發(fā)基礎練習題及答案17-2023-背題版_第3頁
大數(shù)據(jù)開發(fā)基礎練習題及答案17-2023-背題版_第4頁
大數(shù)據(jù)開發(fā)基礎練習題及答案17-2023-背題版_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

試題說明

本套試題共包括1套試卷

每題均顯示答案和解析

大數(shù)據(jù)開發(fā)基礎練習題及答案17(500題)

大數(shù)據(jù)開發(fā)基礎練習題及答案17

L[單選題]關于GES技術原理,下列錯誤的是哪一項?

A)基于ElasticSearch的索引機制,能根據(jù)素快速查問數(shù)據(jù)

B)基于Yarn的資源調(diào)度,可以并行執(zhí)行多任務

C)基于Spak的分布式內(nèi)存計算技術,支持數(shù)據(jù)快速導入D、基于HBase的分布式存儲機制,能夠處理

海量數(shù)據(jù)

答案:B

解析:

2.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,在企業(yè)信用智能分析報告(含征信)查詢記錄

列表中,有O字段,用戶可在該列查看到每期報告所含征信數(shù)據(jù)的時間。

A)人行征信報告數(shù)據(jù)狀態(tài)

B)B.最新人行征信報告查詢時間

C)C.最新人行征信報告編號

答案:B

解析:

3.[單選題]在MapReduce計算架構(gòu)中,()組件運行在DataNode上,具體管理本節(jié)點計算任務的執(zhí)行

O

A)Client

B)JobTracker

C)TaskTracker

D)Task

答案:C

解析:

4.[單選題]在Oracle數(shù)據(jù)庫中一個表的唯一標識稱為(—兀

A)主鍵

B)ID

C)索引

D)key

答案:A

解析:

5.[單選題]寫入數(shù)據(jù)到HDFS的Sink組件是()。

A)Hive

B)HBase

OHDFS

D)Hadoop

答案:C

解析:

6.[單選題]下列處理方法能獲得像素級標注的是()。

A)圖像分類

B)物體檢測

C)圖像去噪

D)語義分割

答案:D

解析:語義分割通過對每個像素進行密集的預測、推斷標簽來實現(xiàn)細粒度的推理,從而使每個像素都

被標記為其封閉對象礦石區(qū)域的類別,因此能夠獲得像素級標注。

7.[單選題]關于推進數(shù)據(jù)共享開放的描述,錯誤的是:()

A)要改變政府職能部門“數(shù)據(jù)孤島”現(xiàn)象,立足于數(shù)據(jù)資源的共享互換.設定相對明確的數(shù)據(jù)標準

,實現(xiàn)部門之間的數(shù)據(jù)對接與共享

B)要使不同省區(qū)市之間的數(shù)據(jù)實現(xiàn)對接與共享,解決數(shù)據(jù)“畫地為牢”的問題,實現(xiàn)數(shù)據(jù)共享共用

C)在企業(yè)內(nèi)部,破除“數(shù)據(jù)孤島”,推進數(shù)據(jù)融合

D)不同企業(yè)之間,為了保護各自商業(yè)利益,不宜實現(xiàn)數(shù)據(jù)共享

答案:D

解析:

8.[單選題]如果線性回歸模型中的隨機誤差存在異方差性,那么參數(shù)的0LS估討量是()

A)無偏的,有效的

B)無偏的,非有效的

C)有偏的,有效的

D)有偏的,非有效的

答案:B

解析:

9.[單選題]想要求出字符串元素個數(shù),應使用()

A)count

B)len

C)length

D)total

答案:B

解析:

10.[單選題]數(shù)據(jù)科學是一門以()為主要研究任務的獨立學科。

A)"數(shù)據(jù)驅(qū)動"{(數(shù)據(jù)業(yè)務化""數(shù)據(jù)洞見""數(shù)據(jù)產(chǎn)品研友"和(或)"數(shù)據(jù)生態(tài)系統(tǒng)的建設"

B)數(shù)據(jù)研發(fā)

C)數(shù)據(jù)處理

D)數(shù)據(jù)洞見

答案:A

解析:

11.[單選題]查看一張表中數(shù)據(jù)的最后修改時間,正確的方法是:()。

A)找管理員從后臺查

B)DESC命令

OSH0WTABLES命令

D)SELECTLAST_MODIFY_TIMEFROMTABLE

答案:B

解析:

12.[單選題]在SELECT語句中,使用關鍵字()可以把重復行屏蔽

A)TOP

B)ALL

C)UNION

D)DISTINCT

答案:D

解析:

13.[單選題]Spark集群的默認web管理頁面端口(一)。

A)8090

B)1020

08010

D)8080

答案:D

解析:

14.[單選題]數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的是()。

A)數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容

B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照

C)數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行重新綜合

答案:C

解析:

15.[單選題]()反映數(shù)據(jù)的精細化程度,越細化的數(shù)據(jù),價值越高。

A)規(guī)模

B)活性

C)關聯(lián)度

D)顆粒度

答案:D

解析:

16.[單選題]下列對大數(shù)據(jù)4V特征理解錯誤的是(一)。

A)數(shù)量大,隨著信息技術的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長,存儲單位從過去的GB到TB,直至PB

B)廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性

C)大數(shù)據(jù)的交換和傳播是通過互聯(lián)網(wǎng)、云計算等方式實現(xiàn)的,遠比傳統(tǒng)媒介的信息交換和傳播速度

快捷

D)現(xiàn)實世界所產(chǎn)生的數(shù)據(jù)中,有價值的數(shù)據(jù)所占比例很高,體現(xiàn)了大數(shù)據(jù)的價值性

答案:D

解析:

17.[單選題]OLTP是什么意思()

A)面向過程的實時處理系統(tǒng)

B)面向?qū)ο蟮膶崟r處理系統(tǒng)

C)面向事務的實時處理系統(tǒng)

D)面向系統(tǒng)的實時處理系統(tǒng)

答案:C

解析:

18.[單選題]定義類如下:classA():defa():print(uan)classB():defb():

print("b")classC():defc():print(c)classD(A,C):defd():print("d")d=

D()d.a()d.b()d.d()以下程序能執(zhí)行的結(jié)果是

A)a,b,d

B)a,d

Od.a

D)執(zhí)行會報錯

答案:D

解析:

19.[單選題]Hive中的解釋器(compiler)優(yōu)化器(optimizer),執(zhí)行器(executor)組件用于H0L語句從

詞法分析、語法分析、編譯、優(yōu)化以及查詢計劃生成。生成的查詢計劃將存儲在在()中,并在隨后由

()調(diào)用執(zhí)行

A)HDFS、MapReduce

B)內(nèi)存、MapReduce

C)HBase>Yarn

D)HDFS、Yarn

答案:A

解析:

20.[單選題]聚合函數(shù)COUNT用于()

A)計算元組個數(shù)

B)計算屬性的個數(shù)

C)對一列中的非空值計算個數(shù)

D)對一列中非空值和空值計算個數(shù)

答案:C

解析:

21.[單選題]DIKW金字塔模型中,頂層與底層的名稱分別為()。

A)智慧與數(shù)據(jù)

B)知識與數(shù)據(jù)

C)智慧與數(shù)值

D)知識與數(shù)值

答案:A

解析:DIKW金字塔(DIKWPyramid)模型揭示了數(shù)據(jù)(Data)與信息(Information)、知識

(Knowledge),智慧(Wisdom)之間的區(qū)別與聯(lián)系,自底向上分別為數(shù)據(jù)、信息、知識、智慧。

22.[單選題]在抽樣估計中,隨著樣本容量的增大,樣本統(tǒng)計量接近總體參數(shù)的概率就越大,這一性質(zhì)

稱為()。

A)無偏性

B)有效性

C)及時性

D)一致性

答案:D

解析:一致性是指隨著樣本容量的增大,樣本統(tǒng)計量接近總體參數(shù)的概率就越大。對于給定的偏差控

制水平,兩者間偏差高于此控制水平的可能性越小。

23.[單選題]數(shù)據(jù)洞見強調(diào)的是如何將數(shù)據(jù)轉(zhuǎn)換為()的過程

A)增值數(shù)據(jù)

B)實際行動

C)智慧

D)數(shù)據(jù)產(chǎn)品

答案:B

解析:

24.[單選題]馬爾可夫隨機場是典型的馬爾可夫網(wǎng),這是一種著名的(_)模型。

A)無向圖

B)有向圖

C)樹形圖

D)環(huán)形圖

答案:A

解析:

25.[單選題]關于Python的全局變量和局部變量,以下選項中描述錯誤的是

A)局部變量指在函數(shù)內(nèi)部使用的變量,當函數(shù)退出時,變量依然存在,下次函數(shù)調(diào)用可以繼續(xù)使用

B)使用global保留字聲明簡單數(shù)據(jù)類型變量后,該變量作為全局變量使用

C)簡單數(shù)據(jù)類型變量無論是否與全局變量重名,僅在函數(shù)內(nèi)部創(chuàng)建和使用,函數(shù)退出后變量被釋放

D)全局變量指在函數(shù)之外定義的變量,一般沒有縮進,在程序執(zhí)行全過程有效

答案:A

解析:

26.[單選題]下列關于文本圖的說法中,錯誤的是()

A)文本圖不適合展示數(shù)據(jù)太少的數(shù)據(jù)集

B)文本圖不適用于展示無明顯差異的數(shù)據(jù)集,因為無明顯差異的數(shù)據(jù)集會使得出的文本圖缺少關鍵詞

,無法帶來突出感

C)可以在文本圖中添加標簽以使可視化結(jié)果更為直觀

D)文本圖又可稱為詞云圖

答案:C

解析:

27.[單選題]以下選項中,不屬于MySQL特點的是()。一

A)界面良好

B)跨平臺

0體積小

D)速度快

答案:A

解析:

28.[單選題]matpltlib中繪制圖形,通過更改繪圖框的尺寸來設置相等的縮放比例的參數(shù)是()。

A)scaled

B)equal

C)auto

D)normal

答案:A

解析:

29.[單選題]支持向量機的優(yōu)化問題是最小化的平方,這實現(xiàn)了(_)。

A)幾何間隔為1/的最大間隔超平面

B)幾何間隔為的最大間隔超平面

0幾何間隔為"的最小間隔超平面

D)幾何間隔為的最小間隔超平面

答案:A

解析:

30.[單選題]在視圖上不能完成的操作是()

A)更新視圖數(shù)據(jù)

B)在視圖上定義新的基本表

C)在視圖上定義新的視圖

D)查詢

答案:B

解析:

31.[單選題]下列不是SVM核函數(shù)的是

A)多項式核函數(shù)

B)logistic核函數(shù)

C)徑向基核函數(shù)

D)Sigmoid核函數(shù)

答案:B

解析:

32.[單選題]HBase使用一個()節(jié)點協(xié)調(diào)管理一個或多個RegionServer從屬機。

A)NameNode

B)DataNode

C)lobTracker

D)Master

答案:D

解析:

33.[單選題]()不是Spark服務層的功能。

A)SQL查詢

B)實時處理

C)機器學習

D)內(nèi)存計算

答案:D

解析:

34.[單選題]下列對MapReduceVersion1的描述不正確的是(__)0

A)JobTracker負載過重,存在單點故障

B)資源管理和計算調(diào)度強耦合,其他計算框架難以復用其資源管理

C)不同框架對濟源不能全局管理

D)MapReduce1.0與MapReduce2.0在客戶端的應用有很大的差別

答案:D

解析:

35.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNode實現(xiàn)的功能是()。

A)管理文件系統(tǒng)的命名空間

B)管理存儲空間

C)分配算力

D)調(diào)控算法

答案:A

解析:NameNode負責管理文件系統(tǒng)的命名空間。

36.[單選題]下面不屬于數(shù)據(jù)科學中常用的開源技術統(tǒng)計工具的有(_)。

A)scipy

B)numpy

C)scalalab

D)sentry

答案:D

解析:

37.[單選題]例如數(shù)據(jù)庫中有A表,包括學生,學科,成績?nèi)齻€字段,數(shù)據(jù)庫結(jié)構(gòu)為學生學科成

績張三語文80張三數(shù)學100李四語文70李四數(shù)學80李四英語80如何統(tǒng)計每個學科的最

高分()

A)select學生,max(成績)fromAgroupby學生;

B)select學生,max(成績)fromAgroupby學科;

C)select學生,max(成績)fromAorderby學生;

D)select學生,max(成績)fromAgroupby成績;

答案:B

解析:

38.[單選題]下列對MapReduce中的公平調(diào)度器描述正確的是(__)。

A)公平調(diào)度器的目標是讓每個用戶公平獨享集群能力

B)如果只有一個作業(yè)在運行,就會得到集群的所有資源

C)提交作業(yè)數(shù)較多的用戶,會獲得更多的集群資源

D)公平調(diào)度器不支持搶占機制

答案:B

解析:

39.[單選題]樸素貝葉斯是一種簡單但是非常強大的()

A)線性分類器

B)分析器

C)邏輯分析器

D)以上說法都不對

答案:A

解析:

40.[單選題]現(xiàn)在有一億條數(shù)據(jù)要插入Hbase,使用下列哪種方式最好?

A)shell端put命令

B)put方法

C)bulkload方法

D)insert方法

答案:C

解析:

41.[單選題]在很多小文件場景下,Spark會起很多Task,當SQL邏輯中存在Shuffle操作時,會大

大增加hash分桶數(shù),嚴重影響性能。Fusioninsight中,針對小文件的場景通常采用答案:算子,來

對Table中的小文件生成的partition進行合并,減少partition數(shù),從而避免在shuffle的時候

,生成過多的hash分桶,提升性能?

A)groupby

B)coalesce

C)connect

D)join

答案:D

解析:

42.[單選題]Dave于2012年發(fā)布(_)首次全面地刻畫了當時快速發(fā)展的大數(shù)據(jù)技術體系。

A)大數(shù)據(jù)產(chǎn)業(yè)網(wǎng)絡

B)大數(shù)據(jù)產(chǎn)業(yè)全景圖

C)大數(shù)據(jù)產(chǎn)業(yè)

D)大數(shù)據(jù)網(wǎng)絡

答案:B

解析:

43.[單選題]在留出法、交叉驗證法和自助法三種評估方法中,()更適用于數(shù)據(jù)集較小、難以劃

分訓練集和測試集的情況。

A)留出法

B)交叉驗證法

0自助法

D)留一法

答案:C

解析:

44.[單選題]大數(shù)據(jù)的4V特性不包括

A)Volume(大量)

B)Velocity(高速)

C)Visual(可視)

D)Variety(多樣)

答案:C

解析:

45.[單選題]SELECTINSERT('welcome',3,4,'HA')的執(zhí)行結(jié)果為()。~

A)weHAe

B)welHAme

C)weHAome

D)welHAcome

答案:A

解析:

46.[單選題]for循環(huán)中,foriin,中不可以填寫以下哪個?()

A)列表

B)一個整型變量

0range生成的數(shù)字序列

D)字符串

答案:B

解析:

47.[單選題]Flume的輸出叫做()0

A)接收器

B)源

C)數(shù)據(jù)流

D)通道

答案:A

解析:

48.[單選題]絕對多數(shù)投票法的基本思想是()

A)對于若干和弱學習器的輸出進行平均得到最終的預測輸出咱少數(shù)服從多數(shù),數(shù)量最多的類別為最

終的分類類別

B)不光要求獲得最高票,還要求票過半數(shù)

C)將訓練集弱學習器的學習結(jié)果作為輸入,

D)將訓練集的輸出作為輸出,重新訓練一個學習器來得到最終結(jié)果

答案:C

解析:

49.[單選題]所有預測模型在廣義上都可稱為一個或一組(_)。

A)公式

B)邏輯

C)命題

D)規(guī)則

答案:D

解析:

50.[單選題]MaxComputeGraph中的邊(Edge)的表示方式為:()。

AXID,Value,Halted>

BXID,Value,Halted,Edges>

C)<DestVertexID,Value>

D)<ID,,Values>

答案:C

解析:

51.[單選題]下列關于HBase系統(tǒng)分層架構(gòu)敘述不正確的一項為()。

A)HDFS提供了HBase的頂層物理存儲結(jié)構(gòu)

B)Hadoop平臺提供了存儲基礎結(jié)構(gòu):Hadoop集群及系統(tǒng)軟件

C)客戶端:提供了數(shù)據(jù)庫訪問接口

D)RegionServer:管理多個regions并提供數(shù)據(jù)訪問服務

答案:A

解析:

52.[單選題]請閱讀下面一段程序:arr_2d=np.array([[11,20,13],[14,25,⑹,[27,18,

9]])print(arr2d[1,:1])執(zhí)行上述程序后,最終輸出的結(jié)果為()

A)[14]

B)[25]

0:14,25]

D)[20,25]

答案:A

解析:

53.[單選題]YARN的基于標準調(diào)度,是對下列選項中的()進行標簽化。

A)AppMaster

B)ResourceManager

C)NodeManager

D)Container

答案:C

解析:

54.[單選題]LSTM中特有的三個門,下列哪一個不再其中?()

A)輸入門

B)輸出門

C)循環(huán)門

D)遺忘門

答案:C

解析:

55.[單選題]Scikit-Learn中,()可以實現(xiàn)整數(shù)分類值轉(zhuǎn)化為獨熱向量。

A)OridinalEncoder

B)OneHotEncoder

C)LableEncoder

D)AutoEncoder

答案:B

解析:0neHot編碼是將整數(shù)分類值轉(zhuǎn)化為獨熱向量。

56.[單選題]我們建立一個5000個特征,100萬數(shù)據(jù)的機器學習模型。我們怎么有效地應對這樣的大數(shù)

據(jù)訓練()。

A)我們隨機抽取一些樣本,在這些少量樣本之上訓練

B)我們可以試用在線機器學習算法

C)我們應用PCA算法降維,減少特征數(shù)

D)以上答案都正確

答案:D

解析:樣本數(shù)過多或者特征數(shù)過多,而不能單機完成訓練,可以用小批量樣本訓練,或者在線累計式訓

練,或者主成分PCA降維方式減少特征數(shù)量再進行訓練。

57.[單選題]現(xiàn)階段的大數(shù)據(jù)技術體系主要類型不包括0。

A)數(shù)據(jù)源與App

B)基礎設施

C)Hadoop

D)數(shù)據(jù)資源

答案:C

解析:Speechpad的聯(lián)合創(chuàng)始人DaveFeinleib于2012年發(fā)布大數(shù)據(jù)產(chǎn)業(yè)全景圖(BigData

Landscape),首次較為全面地刻畫了當時快速發(fā)展中的大數(shù)據(jù)技術體系。后來,該圖及其畫法成為大

數(shù)據(jù)和數(shù)據(jù)科學的重要分析工具,得到廣泛地應用和不斷地更新。MattTurck等組織繪制了2017大數(shù)

據(jù)產(chǎn)業(yè)全景圖(BigDataLandscape2017)?從2017大數(shù)據(jù)產(chǎn)業(yè)全景圖看,現(xiàn)階段的大數(shù)據(jù)技術體系

主要類型包括數(shù)據(jù)資源、數(shù)據(jù)源與App、開源工具、跨平臺基礎設施和分析工具、行業(yè)應用、企業(yè)應

用、基礎設施和分析工具。

58.[單選題]下列哪一項不是大數(shù)據(jù)架構(gòu)中需要考慮的要點?

A)業(yè)務分解

B)業(yè)務聯(lián)動

C)持續(xù)發(fā)展

D)獨立開發(fā)

答案:D

解析:

59.[單選題]以下可用于隱變量估計的方法是:

A)梯度下降法

B)EM法

C)牛頓法

D)支持向量機

答案:B

解析:

60.[單選題]下面哪項不屬于循環(huán)神經(jīng)網(wǎng)絡的輸出模式。()

A)、單輸出

B)、多輸出

C)、同步多輸出

D)、異步多輸出

答案:C

解析:

61.[單選題]pynlpir是一種常用的自然語言理解工具包,其中進行分詞處理的函數(shù)是(—兀

A)open()

B)segment()

C)AddUserWord()

D)generate()

答案:B

解析:

62.[單選題]一個關系只有一個()

A)外碼

B)候選碼

C)超碼

D)主碼

答案:D

解析:

63.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,在【大數(shù)據(jù)貸后預警處置】菜單中,用戶選中

一個客戶,點擊()按鈕,可以查看該客戶的預警信號。

A)預警信號詳情

B)B.查看客戶信息

C)C.填寫處置措施

D)D.影像操作

答案:A

解析:

64.[單選題]以下關于字符串類型的操作的描述,錯誤的是:

A)str.replace(x,y)方法把字符串str中所有的x子串都替換成y

B)想把一個字符串str所有的字符都大寫,用str.upper()

C)想獲取字符串str的長度,用字符串處理函數(shù)str.len()

D)設x='aa',則執(zhí)行x*3的結(jié)果是'aaaaaa'

答案:c

解析:

65.[單選題](_)是在不影響數(shù)據(jù)分析結(jié)果準確性的前提下,對原始數(shù)據(jù)進行一定的變換操作,對其

中的個人(組織)敏感數(shù)據(jù)進行替換或刪除操作。

A)數(shù)據(jù)加工

B)數(shù)據(jù)保護

C)數(shù)據(jù)脫敏

D)數(shù)據(jù)清洗

答案:C

解析:

66.[單選題]下面關于"priceBETWEEN0AND、59”描述錯誤的是()?!?/p>

A)判斷的范圍包括0

B)BETWEEN...AND用于設置比較區(qū)間

0判斷的范圍包括59

D)以上說法都不正確

答案:D

解析:

67.[單選題]下列哪個程序通常與NameNode在一個節(jié)點啟動?

A)SecondaryNameNode

B)DataNode

C)TaskTracker

D)JobTracker

答案:D

解析:

68.[單選題]在HBase的專用過濾器中,TimestampsFilter是()

A)時間戳過濾器

B)包含結(jié)束的過濾器

C)列計數(shù)過濾器

D)首次行鍵過濾器

答案:A

解析:

69.[單選題]關于臟數(shù)據(jù)和亂數(shù)據(jù)的區(qū)分,以下哪種不屬于臟數(shù)據(jù)0。

A)含有缺失數(shù)據(jù)

B)冗余數(shù)據(jù)

C)噪聲數(shù)據(jù)

D)不規(guī)則形態(tài)數(shù)據(jù)

答案:D

解析:在數(shù)據(jù)庫技術中,臟數(shù)據(jù)在臨時更新(臟讀)中產(chǎn)生。事務A更新了某個數(shù)據(jù)項X,但是由于某種

原因,事務A出現(xiàn)了問題,于是要把A回滾。但是在回滾之前,另一個事務B讀取了數(shù)據(jù)項X的值(A更新

后),A回滾了事務,數(shù)據(jù)項恢復了原值。事務B讀取的是臟數(shù)據(jù)。

70.[單選題]根據(jù)《泛在電力物聯(lián)網(wǎng)2019年建設方案》,在統(tǒng)籌組織、基層創(chuàng)新該項建設原則中指出

,公司研究確定的三類任務不包括()

A)統(tǒng)一組織

B)專項試點

C)開放合作

D)創(chuàng)新探索

答案:C

解析:

71.[單選題]按粒度大小的順序,Hive數(shù)據(jù)被分為:數(shù)據(jù)庫、數(shù)據(jù)表、()、桶?

A)元祖

B)欄

C)分區(qū)

D)行

答案:C

解析:

72.[單選題]下面對字典型數(shù)據(jù)的正確表示為()

A)dic=[l:2,3:4,5:5]

B)dic={l,3,4,5,6}

C)dict={(l,2),(4,5),(2,4)}

D)dict={'a':1,'b':3,'c':5}

答案:D

解析:

73.[單選題]如果線性回歸模型中的隨機誤差存在異方差性,那么參數(shù)的OLS估計量是(一)。

A)無偏的,有效的

B)無偏的,非有效的

C)有偏的,有效的

D)有偏的,非有效的

答案:B

解析:

74.[單選題]下面描述錯誤的是:()

A)數(shù)據(jù)挖掘的目標明確,先做假設,然后通過數(shù)據(jù)分析來驗證假設是否正確,從而得到相應的結(jié)論

B)數(shù)據(jù)挖掘的重點在尋找未知的模式與規(guī)律

C)數(shù)據(jù)分析一般都是得到一個指標統(tǒng)計量結(jié)果,如總和、平均值等

D)數(shù)據(jù)挖掘則是輸出模型或規(guī)則,并且可相應得到模型得分或標簽

答案:A

解析:

75.[單選題]下列關于網(wǎng)絡用戶行為的說法中,錯的是()。

A)網(wǎng)絡公司能夠捕捉到用戶在其網(wǎng)站上的所有行為

B)用戶離散的交互痕跡能夠為企業(yè)提升服務質(zhì)量提供參考

C)數(shù)字軌跡用完即自動刪除

D)用戶的隱私安全很難得以規(guī)范保護

答案:C

解析:

76.[單選題]貝葉斯決策的最優(yōu)分類面是(_)。

A)線性的

B)非線性的

C)不可構(gòu)造的

D)不存在的

答案:A

解析:

77.[單選題]下列關于python面向?qū)ο缶幊?,正確的是()

A)Python在類中定義函數(shù)的第一個參數(shù)為this

B)_init_方法可以使定義的實例擁有類模板的屬性

C)如果子類定義了父類中的同名方法,通過子類調(diào)用該方法時使用父類的方法

D)如果一個變量前帶有可以直接從外部訪問

答案:B

解析:

78.[單選題]已知x與y的關系如下表所示:表1x與y的關系xyx<0xlx=0xx>0x+1以下選項中,可

以正確地表達x與y之間關系的是()

A)y=x+lifx>=0:ifx=0:y=xelse:y=x-1

B)y=x-lifx!=0:ifx>0:y=x+1else:y=x

C)ifx<=0:ifx<0:y=x-1else:y=xelse:y=x+1

D)y=xifx<=0:ifx<0:y=x-1else:y=x+1

答案:C

解析:

79.[單選題](_)不是描述統(tǒng)計的基本類型。

A)集中趨勢分析

B)無關分析

C)相關分析

D)離中趨勢分析

答案:B

解析:

80.[單選題]以下哪個不是聚類方法:()

A)GMM

B)LDA

ODBSCAN

D)TPLINK

答案:D

解析:

81.[單選題]業(yè)務部門梳理本專業(yè)(),制定數(shù)據(jù)轉(zhuǎn)換需求,提高數(shù)據(jù)可讀性,豐富完善一手數(shù)據(jù)資

源。

A)原始數(shù)據(jù)

B)結(jié)構(gòu)化數(shù)據(jù)

0非結(jié)構(gòu)化數(shù)據(jù)

D)所有數(shù)據(jù)

答案:C

解析:

82.[單選題]下列關于可視化方法體系說法不正確的是()。

A)通常采用視覺圖形元素和視覺通道兩個維度進行視覺編碼

B)常用的共性方法有統(tǒng)計圖表、圖論方法、視覺隱喻和圖形符號學等

C)領域方法在所屬領域內(nèi)其可視化的信度和效果往往低干基礎方法的直接應用

D)視覺編碼為其他數(shù)據(jù)可視化方法提供了方法學基礎

答案:C

解析:領域方法在所屬領域內(nèi)其可視化的信度和效果高于基礎方法的直接應用。

83.[單選題]下列關于RBM的說法,錯誤的是()

A)學習過程很快

B)RBM訓練可以看作對一個深層BP網(wǎng)絡的網(wǎng)絡權佳參數(shù)的初始化

C)RBM不用人工選擇特征

D)RBM有標簽樣本集

答案:A

解析:

84.[單選題]如果想獲取一個序列內(nèi)的數(shù)據(jù)可以通過()獲取

A)索弓I

B)最大值

C)最小值

D)求和

答案:A

解析:

85.[單選題]以下關于公共安全行業(yè)專題分析與查詢業(yè)務場景描述錯誤的選項是()o

A)適用標準SQL語句進行查詢,根據(jù)查詢結(jié)果篩選目標人群,偵辦案件。

B)原始數(shù)據(jù)經(jīng)過批處理后結(jié)果寫入到指定的文件目錄,供交互時查詢。

C)臨時交互式查詢?nèi)蝿諏?shù)據(jù)進行精確或者模糊查詢。

D)數(shù)據(jù)湖內(nèi)多個數(shù)據(jù)源只能單獨訪問再呈現(xiàn)結(jié)果。

答案:D

解析:

86.[單選題]np.eye()的作用是(_)0

A)創(chuàng)建全零矩陣

B)創(chuàng)建全1矩陣

0創(chuàng)建對角全1的矩陣

D)顯示矩陣

答案:C

解析:

87.[單選題]下面這條GaussDB200語句"calldbms_job.interval(1,'sysdate+1.0/24');"的意

思是

A)修改Jobl的Interva為每隔24小時執(zhí)行一次。

B)修改Jobl的Interval為每隔1小時執(zhí)行一次。

C)修改Jobl的Interval為每隔1/24小時執(zhí)行一次。

D)修改Jobl的Interval為每隔24分鐘執(zhí)行一次。

答案:B

解析:

88.[單選題]關于列表的說法,描述錯誤的是()

A)list是一個有序集合,沒有固定大小

B)list可以存放任意類型的元素

C)使用list時,其下標可以是負數(shù)

D)list是不可變的數(shù)據(jù)類型

答案:D

解析:

89.[單選題]根據(jù)《承德銀行大數(shù)據(jù)貸后風險預警信號管理辦法(試行)》,承德轄區(qū)支行的黃色級

信號,支行管戶客戶經(jīng)理應在接收到系統(tǒng)所推送信號2個工作日內(nèi)聯(lián)系客戶完成貸后預警信號核實工

作,限期()個工作日內(nèi)制定出針對性的處置措施。

A)1

B)B.3

C)C.5

D)D.10

答案:C

解析:

90.[單選題]當前傳統(tǒng)關系型數(shù)據(jù)庫主要面臨的挑戰(zhàn)是(

A)數(shù)據(jù)量爆炸式增長,要求數(shù)據(jù)處理平臺具備彈性擴展能力。

B)數(shù)據(jù)處理時效性需求提高,要求數(shù)據(jù)處理平臺速度夠快。

C)多類型數(shù)據(jù)融合,要求數(shù)據(jù)處理平臺功能更加強大。

D)以上全都正確。

答案:D

解析:

91.[單選題]按照“()”的思路,以打造智慧能源綜合服務體系為抓手,統(tǒng)一對外業(yè)務門戶和人口

,實現(xiàn)“引流+賦能”,創(chuàng)新推動源網(wǎng)荷儲協(xié)同服務,積極構(gòu)建能源互聯(lián)網(wǎng)生態(tài)圈,推動新興業(yè)務

“百花齊放”,帶動產(chǎn)業(yè)鏈上下游共同發(fā)展。

A)數(shù)據(jù)+應用

B)平臺+生態(tài)

C)能源+業(yè)務

D)數(shù)據(jù)+業(yè)務

答案:B

解析:

92.[單選題]Elasticfearch是怎么實現(xiàn)Master選舉的?

A)內(nèi)部自行選舉

B)借助ZooKeeper選舉

C)隨機生成

D)自行指定

答案:B

解析:

93.[單選題]各單位應對各域間邊界、尤其是互聯(lián)網(wǎng)邊界的數(shù)據(jù)流量,建立健全數(shù)據(jù)監(jiān)測、審計機制

及相關技防措施,審計日志應留存不少于()個月

A)一

B)三

C)六

D)十二

答案:C

解析:

94.[單選題]下面關于matplotlib的介紹不正確的是。

A)matplotlib是一個python的2d和3d繪圖庫

B)matplotlib可以實現(xiàn)跨平臺

Omatplotlib的操作是通過API實現(xiàn)的

D)matplotlib中函數(shù)接口實現(xiàn)的API易用性更好

答案:A

解析:

95.[單選題]應用人工智能和()等新技術,實現(xiàn)區(qū)域自治、云邊協(xié)同和能力開放。

A)云計算

B)能源生態(tài)

C)邊緣計算

D)數(shù)據(jù)共享

答案:C

解析:

96.[單選題]在模型評估與度量的方法中,(_)直接將數(shù)據(jù)集劃分為兩個互斥的集合,一個作為訓

練集,另一個作為測試集。

A)自助法

B)留出法

C)交叉驗證法

D)錯誤率分析

答案:B

解析:

97.[單選題]()是一個組織機構(gòu)的數(shù)據(jù)管理的愿景、目標以及功能藍圖的統(tǒng)一管理。

A)數(shù)據(jù)治理

B)數(shù)據(jù)戰(zhàn)略

C)數(shù)據(jù)加工

D)數(shù)據(jù)能力

答案:B

解析:數(shù)據(jù)戰(zhàn)略(DataStrategy)是一個機構(gòu)的數(shù)據(jù)管理的愿景、目標以及功能藍圖的統(tǒng)一管理。從

DMM模型可看出,數(shù)據(jù)戰(zhàn)略是組織機構(gòu)的數(shù)據(jù)管理工作的重要前提。

98.[單選題]Spark的集群管理模式不包含()。

A)Standalone模式

B)Message模式

OYARN模式

D)Mesos模式

答案:B

解析:

99.[單選題]交叉表的橫縱軸區(qū)域中,除了行維度、列維度外,另外一個是0

A)形狀

B)風格

C)背景

D)指標

答案:D

解析:

100.[單選題]結(jié)構(gòu)化程序設計中,下面對goto語句使用描述正確的是o

A)禁止使用goto語句

B)應避免濫用goto語句

C)goto語句最好用,不容易造成結(jié)構(gòu)體程序混亂

D)使用goto語句程序效率高

答案:B

解析:

101.[單選題]以下關于選用Kafka等消息系統(tǒng)的原因描述錯誤的是()。

A)解耦:消息系統(tǒng)在處理過程中插入一個隱含、基于數(shù)據(jù)的接口層。

B)同步通信:消息隊列允許消息加入隊列,等需要時再處理。

C)擴展性:消息隊列解耦處理過程,容易擴展處理過程。

D)冗余:消息隊列持久化,防止數(shù)據(jù)丟失

答案:D

解析:

102.[單選題]掌握智慧物聯(lián)的發(fā)展重點,應用人工智能和()等新技術,實現(xiàn)區(qū)域自治、云邊協(xié)同和能

力開放。

A)云計算

B)能源生態(tài)

C)邊緣計算

D)數(shù)據(jù)共享

答案:C

解析:

103.[單選題]獲取指定字符串長度的函數(shù)是()

A)Lefttrim

B)Length

C)Lower

D)NumberToString

答案:B

解析:

104.[單選題]Maxcompute表tl、t2都是分區(qū)表,分區(qū)鍵是pt,對于sql語句selecttl.idfromtl

leftouterjoint2ontl.id=t2.idwheretl.pt='20140101Tandt2.pt=,20140101),(

)說法是正確的。

A)兩張表都會進行分區(qū)裁剪

B)t2表會進行分區(qū)裁剪

C)tl表會進行分區(qū)裁剪

D)兩張表都不會進行分區(qū)裁剪

答案:C

解析:

105.[單選題]在Hadoop中,下面哪個是默認的InputFormat類型,它將每行內(nèi)容作為新值,而將字節(jié)

偏移量作為key()

A)FilelnputFormat

B)TextlnputFormat

C)KeyValueTextlnputFormat

D)CombineTextlnputFormat

答案:B

解析:

106.[單選題]Numpy包中meshgrid()函數(shù)實現(xiàn)的功能是()。

A)數(shù)組拆分

B)數(shù)組乘法

C)數(shù)組除法

D)數(shù)組融合

答案:D

解析:np.meshgrid()用于數(shù)組融合,在畫等高線圖時常用。

107.[單選題]下列關于存儲過程中的變量說法正確的是()?

A)聲明變量時需要指定變量的初始值。

B)變量的作用域是全局。

C)變量必須先聲明后使用.

D)聲明變量時需要指定變量的數(shù)據(jù)類型。

答案:C

解析:

108.[單選題]對數(shù)據(jù)可視化的作用說法不正確的一項是()

A)數(shù)據(jù)分析

B)數(shù)據(jù)過濾

C)信息記錄

D)橫縱對比

答案:B

解析:

109.[單選題]創(chuàng)建Loader作業(yè)時,可以在以下()步驟中設置Map數(shù)。

A)輸出

B)輸入設置

C)轉(zhuǎn)換

D)基本信息

答案:A

解析:

110.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,在企業(yè)信用智能分析報告頁面,點擊左上角

【打印/下載】按鈕,彈出打印機選擇頁面。用戶在彈出的打印機選擇頁面,選擇()項,點擊【打

印】按鈕,選擇保存路徑,即可保存PDF版本企業(yè)信用智能分析報告文件到指定路徑。

A)Fax

B)B.MicrosoftprinttoPDF

C)C.MicrosoftXPSDocumentWriter

D)D.OneNote

答案:B

解析:

111.[單選題]線性回歸的基本假設不包括哪個?

A)隨機誤差項是一個期望值為0的隨機變量

B)對于解釋變量的所有觀測值,隨機誤差項有相同的方差

C)隨機誤差項彼此相關

D)解釋變量是確定性變量不是隨機變量,與隨機誤差項之間相互獨立

答案:C

解析:

112.[單選題]以下不屬于數(shù)據(jù)科學家主要職責的是(—)。

A)制定“數(shù)據(jù)戰(zhàn)略”

B)研發(fā)“數(shù)據(jù)產(chǎn)品”

C)構(gòu)建“數(shù)據(jù)生態(tài)系統(tǒng)”

D)運用“數(shù)據(jù)領域知識”

答案:D

解析:

113.[單選題]下列不屬于數(shù)據(jù)科學與統(tǒng)計學區(qū)別的是()。

A)數(shù)據(jù)科學中的數(shù)據(jù)不僅僅是數(shù)值

B)數(shù)據(jù)科學關注的不僅僅是“單一學科”問題,超出了數(shù)學、統(tǒng)計學、計算機科學等單一學科的范

C)數(shù)據(jù)科學不僅僅是理論研究,也不是純領域?qū)崉罩R,它關注和強調(diào)的是二者的結(jié)合

D)數(shù)據(jù)科學和統(tǒng)計學中的計算一樣,僅僅是加減乘除

答案:D

解析:數(shù)據(jù)科學中的計算并不僅僅是加/減/乘/除等數(shù)學計算,而是包括數(shù)據(jù)的查詢、挖掘、洞見

、分析、可視化等更多類型的計算。

114.[單選題]HBase的物理存儲單元是什么?

A)Region

B)Columnfami1

C)Column

D)Row

答案:B

解析:

115.[單選題]在HBase的表的每個區(qū)域是由表中的(—)的子集構(gòu)成。

A)行

B)列

C)單元

D)塊

答案:A

解析:

116.[單選題]以下哪項不是深度學習最近火熱的原因()

A)神經(jīng)網(wǎng)絡是一個全新的領域

B)需要處理的數(shù)據(jù)量急劇加大

C)計算能力的不斷提升

D)深度學習在很多重要領域,例如語音識別和圖像識別等方面取得了重大成就

答案:A

解析:

117.[單選題]如果在大型數(shù)據(jù)集上訓練決策樹。為了花費更少的時間來訓練這個模型,下列哪種做法

是正確的()

A)增加樹的深度

B)增加學習率

C)減小樹的深度

D)減少樹的數(shù)量

答案:C

解析:決策樹深度越深,在訓練集上誤差會越小,準確率越高。但是容易造成過擬合,而且增加模型的

訓練時問間。對決策樹進行修剪,減小樹的深度,能夠提高模型的訓練速度,有效避免過擬合。

118.[單選題]若要修改HBase表,下列API哪個最先被調(diào)用?

A)createConnection()

B)getTable()

C)getConnect()

D)getAdmin()

答案:D

解析:

119.[單選題]在線性回歸中,(.)試圖找到一條直線,使所有樣本到直線上的歐氏距離之和最小。

A)最小二乘法

B)拉格朗日乘子法

C)歐氏距離

D)均方誤差

答案:A

解析:

120.[單選題]關于Maxcompute中的運算符的說法,正確的是:()。

A)String類型可以和其他任意類型進行隱式轉(zhuǎn)換:Boo1ean不行

B)除boolean外,其他類型不允許參與邏輯運算,也不允許其他類型的隱式類型轉(zhuǎn)換

C)只有bigint、double才能參與算數(shù)運算:只有string、bigint、double和Decimal才能參與算術運

D)特殊的關系運算符rlike表示右側(cè)開始匹配

答案:B

解析:

121.[單選題]對HDFS通信協(xié)議的理解錯誤的是().

A)客戶端與數(shù)據(jù)節(jié)點的交互是通過RPC(RemoteProcedureCall)來實現(xiàn)的

B)客戶端通過一個可配置的端口向名稱節(jié)點主動發(fā)起TCP連接,并使用客戶端協(xié)議與名稱節(jié)點進行交

C)名稱節(jié)點和數(shù)據(jù)節(jié)點之間則使用數(shù)據(jù)節(jié)點協(xié)議進行交互

D)HDFS通信協(xié)議都是構(gòu)建在IoT協(xié)議基礎之上的

答案:D

解析:

122.[單選題]Python對not、or、and求值的優(yōu)先順序是()。

A)andornot

B)notandor

C)orandnot

D)ornotand

答案:B

解析:詳見對比符優(yōu)先級。

123.[單選題]關于Sqoop的說法,不正確的是()。

A)主要設計目的是在Hadoop與傳統(tǒng)數(shù)據(jù)庫之間進行數(shù)據(jù)的ETL操作

B)數(shù)據(jù)導入導出通過MapReduce完成

C)Sqoop具備MapReduce的并行化和容錯性

D)Sqoop的Reduce操作速度更快

答案:D

解析:Sqoop是一個強大的工具,主要用來處理大量的數(shù)據(jù)傳輸,并不會影響Reduce的操作速度。

124.[單選題]將python中的.py文件轉(zhuǎn)換為.pyc文件的組件為()。

A)編輯器

B)編譯器

C)虛擬機

D)解釋器

答案:B

解析:

125.[單選題]查看HDFS的報告命令是()

A)bin/hdfs

B)bin/hdfs

C)bin/hdfs

D)bin/hdfs

答案:A

解析:

126.[單選題]數(shù)據(jù)庫設計中用關系模型表示實體和實體之間的聯(lián)系。關系模型的結(jié)構(gòu)是(一)。

A)層次結(jié)構(gòu)

B)網(wǎng)狀結(jié)構(gòu)

C)封裝結(jié)構(gòu)

D)二維表結(jié)構(gòu)

答案:D

解析:

127.[單選題]圖靈獎獲得者JimGray提出的科學研究的第四范式--數(shù)據(jù)密集型科學發(fā)現(xiàn)(Data-

intensiveScientificDiscovery)描述了數(shù)據(jù)科學的()

A)三要素原則

B)數(shù)據(jù)復雜性原則

C)三世界原則

D)從簡原則

答案:C

解析:

128.[單選題]關于貝葉斯網(wǎng)絡,說法錯誤的是0

A)、是由有向有環(huán)圖構(gòu)成

B)、每個節(jié)點代表一個“事件”或者”隨機變量”

C)、貝葉斯網(wǎng)絡是基于概率推理的模型

D)、表示起因的假設和表示結(jié)果的數(shù)據(jù)均用結(jié)點表示

答案:A

解析:

129.[單選題]假如table中有一條記錄,字段列coll值為空,下面()條件會將此條記錄查詢出來

A)coll="

B)coll!="

C)collisnull

D)collisnotnull

答案:C

解析:

130.[單選題]()不僅可用于多層前饋神經(jīng)網(wǎng)絡,還可用于其他類型的神經(jīng)網(wǎng)絡

A)感知機

B)神經(jīng)元

C)神經(jīng)系統(tǒng)

D)誤差逆?zhèn)鞑?/p>

答案:D

解析:

131.[單選題]正確導入日期模塊的語句是()。

A)importdate

B)importdatetime

C)importtime

D)importdatetime

答案:B

解析:導入日期模塊的語句是importdatetime

132.[單選題]考慮某個具體問題時,你可能只有少量數(shù)據(jù)來解決這個問題不過幸運的是你有一個類

似問題已經(jīng)預先訓練好的神經(jīng)網(wǎng)絡可以利用這個預先訓練好的網(wǎng)絡的方法是()

A)把除了最后一層外所有的層都凍住,重新訓練最后一層

B)對新數(shù)據(jù)重新制1鯨整個模型

C)只對最后幾層進行訓練調(diào)參(直netune)

D)對每一層模型進行評估,選擇其中的少數(shù)來用

答案:C

解析:

133.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,擔保圈鏈模塊,連通路徑指連接擔保圈鏈中

各節(jié)點所產(chǎn)生的路徑,一個節(jié)點只能在當前連通路徑中出現(xiàn)()次。

A)1

B)B.3

C)C.5

D)D.10

答案:A

解析:

134.[單選題]LasVegasWrapper是一種典型的(_)算法。

A)過濾式選擇

B)嵌入式選擇

C)包裹式選擇

D)正則化

答案:C

解析:

135.[單選題]使用Pig語句實現(xiàn)條件查詢,下列語句正確的是(__)o

A)SELECT*FROMtmp_tableWHEREage>18;

B)tmp_table_where=FILTERtmp_tableBYage>18;DUMPtmp_tab1e_where;

C)DUMPtmp_tableFILTERBYage>18:

D)FILTERtmp_tableBYage>18;

答案:B

解析:

136.[單選題]下面這條GaussDB200語句rtcalldbms_job.interval(1,'sysdate—1.0/24):”的意思

是()

A)修改Jobl的Interval為每24分鐘執(zhí)行一次

B)修改Jobl的Interval為每24小時執(zhí)行一次

C)修改Jobl的Interval為每1/24小時執(zhí)行一次

D)修改Jobl的Interval為每1小時執(zhí)行次

答案:D

解析:

137.[單選題]下面關于詞袋模型說法錯誤的是?

A)詞袋模型即bagofwords(BOW)

B)詞袋模型是常用的文本表示方式

C)詞袋模型的詞匯表采用字典順序排列

D)詞袋模型可以得到文本的二進制編碼表示

答案:C

解析:

138.[單選題]Python變量作為實參時,它和對應的形參之間數(shù)據(jù)傳遞方式是()。

A)由形參傳給實參

B)由實參傳給形參

C)由實參傳給形參,再由形參傳給實參

D)在用戶干預情況下,實參形參能相互傳遞

答案:D

解析:

139.[單選題]scipy.stats模塊中對隨機變量進行隨機取值的函數(shù)是什么?

A)rvs

B)pdf

Ocdf

D)sf

答案:A

解析:

140.[單選題]大數(shù)據(jù)計算服務(MaxCompute,原ODPS)中的客戶表customer是一張非分區(qū)表,現(xiàn)在

想要清空表的內(nèi)容然后重新上傳數(shù)據(jù),可以通過()將數(shù)據(jù)清空。

A)deletefromcustomer;

B)insertoverwritetablecustomerselect*fromcustomer;

C)truncatetablecustomer;

D)droptablecustomer;

答案:C

解析:

141.[單選題]關于云主機登錄方式描述對的是()

A)Windows通過遠程桌面(MSTSC)方式登錄

B)Linux通過SSH方式登錄

C)通過控制臺方式(VNC)登錄

D)以上描述均對

答案:D

解析:

142.[單選題]以下描述不正確的是(__)o

A)文本是半結(jié)構(gòu)化數(shù)據(jù)

B)非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)科學與傳統(tǒng)數(shù)據(jù)管理的主要區(qū)別

C)視頻是非結(jié)構(gòu)化數(shù)據(jù)

D)目前,非結(jié)構(gòu)化數(shù)據(jù)占比最大

答案:A

解析:

143.[單選題]下列哪一個屬于浮點型數(shù)據(jù)?

A)a=l

B)a=3.14

C)a='3.14'

D)a=True

答案:B

解析:

144.[單選題]有關Hive支持的數(shù)據(jù)類型,“Helloworld”可以使用下列那一個數(shù)據(jù)類型()

A)Int

B)Float

C)Double

D)String

答案:D

解析:

145.[單選題]以下程序的輸出結(jié)果是:LI=['abc',[,123,,,4561]]L2=['1','2','3']print(Ll

>L2)

A)False

B)TypeError:'>'notsupportedbetweeninstancesof'list'and'str'

01

D)True

答案:D

解析:

146.[單選題]MapReduce計算框架的輸入數(shù)據(jù)結(jié)構(gòu)是()。

A)key-value

B)input-output

C)map-reduce

D)key-column

答案:A

解析:MapReduce計算框架的輸入是鍵值對,即key-value。

147.[單選題]構(gòu)成狀態(tài)空間的4個要素是:()o

A)開始狀態(tài)、目標狀態(tài)、規(guī)則與操作

B)初始狀態(tài)、中間狀態(tài)、目標狀態(tài)與操作

C)空間、狀態(tài)、規(guī)則與操作

D)開始狀態(tài)、中間狀態(tài)、結(jié)束狀態(tài)與其他狀態(tài)

答案:B

解析:

148.[單選題]np.sqrt(10)的結(jié)果是?

A)3.1622776601684

B)3

C)10

D)1

答案:A

解析:

149.[單選題]在統(tǒng)計抽樣過程中,我們計算抽樣誤差的原因是()

A)追求精確。

B)追求效率。

C)尋求因果。

D)以誤差為中心。

答案:A

解析:

150.[單選題]下列選項中,描述正確是()。

A)Series是一維數(shù)據(jù)結(jié)構(gòu),其索引在右,數(shù)據(jù)在左

B)DataFrame是二維數(shù)據(jù)結(jié)構(gòu),并且該結(jié)構(gòu)具有行索引和列索引

OSeries結(jié)構(gòu)中的數(shù)據(jù)不可以進行算術運算

D)sort_values()方法可以將Series或DataFrame中的數(shù)據(jù)按照索引排序

答案:B

解析:

151.[單選題]Saprk中默認的存儲級別是()

A)MEMORY_ONLY

B)MEMORY_ONLY_SER

C)MEMORY_AND__DISK

D)MEMORY_AND_DISK_SER

答案:A

解析:

152.[單選題]FusioninsightHD系統(tǒng)中如果修改了服務的配置項,不進行服務重啟,該服務的配置

狀態(tài)是什么狀態(tài)?

A)SYNCHRONIZED

B)EXPIRED

C)CONFIGURING

D)UNKNOWN

答案:B

解析:

153.[單選題]Hadoop中,Reducer的三個階段是()。

A)Shuffle-Sort-Reduce

B)Shuffle-Reduce-Sort

C)Reduce-Shuff1e-Sort

D)Sort-Shuffile-Reduce

答案:A

解析:Reducer主要分為Shuffle洗牌、Sort排序和Reduce三個步驟。

154.[單選題]關于OTS中數(shù)據(jù)查詢的說法正確的是:()。

A)查詢時僅需要提供分片鍵即可

B)可以創(chuàng)建索引,然后基于索引列進行查詢

C)查詢時可以僅提供主鍵的一部分,但是和組成主鍵的列的順序有關

D)單行查詢必須提供主鍵

答案:D

解析:

155.[單選題]迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式()

A)我為人人,人人為我

B)全樣而非抽樣

C)效率而非精確

D)相關而非因果

答案:A

解析:

156.[單選題]下列哪個不屬于CRF模型對于HMM和MEMM模型的優(yōu)勢

A)特征靈活

B)速度快

C)可容納較多上下文信息

D)全局最優(yōu)

答案:B

解析:

157.[單選題]從網(wǎng)絡的原理上來看,結(jié)構(gòu)最復雜的神經(jīng)網(wǎng)絡是()

A)卷積神經(jīng)網(wǎng)絡

B)長短時記憶神經(jīng)網(wǎng)絡

OGRU

D)BP神經(jīng)網(wǎng)絡

答案:C

解析:

158.[單選題]txt=open(filename)返回的是()0

A)變量

B)常數(shù)

C)文件內(nèi)容

D)文件對象

答案:D

解析:

159.[單選題]讓學習器不依賴外界交互、自動地利用未標記樣本來提升學習性能,就是。

A)有監(jiān)督學習

B)全監(jiān)督學習

C)無監(jiān)督學習

D)半監(jiān)督學習

答案:D

解析:

160.[單選題]()算法可以用于特征選擇。

A)樸素貝葉斯

B)感知器

C)支持向量機

D)決策樹

答案:D

解析:使用決策樹也可以計算每個特征的相對重要性。這些重要性能夠輔助進行特征選擇。

161.[單選題]Hadoop生態(tài)系統(tǒng)中,(—_)的主要設計目的是在Hadoop與傳統(tǒng)數(shù)據(jù)庫之間進行數(shù)據(jù)的

ETL操作。

A)HDFS

B)Flume

OHive

D)Sqoop

答案:D

解析:

162.[單選題]下列算法中屬于圖像銳化處理的是

A)低通濾波

B)加權平均法

C)高通濾波

D)中值濾波

答案:C

解析:

163.[單選題]()不是神經(jīng)網(wǎng)絡的代表。

A)卷積神經(jīng)網(wǎng)絡

B)遞歸神經(jīng)網(wǎng)絡

C)殘差網(wǎng)絡

D)xgboost算法

答案:D

解析:xgboost是boosting算法的代表。

164.[單選題](_)實現(xiàn)了采用留一法進行交叉驗證。

A)kf=KFold(n_splits=2)

B)kf=RepeatedKFold(n_splits=2,n_repeats=2,random_state=0)

C)Ipo=LeavePOut(p=2)

D)loo=LeaveOneOut()

答案:D

解析:

165.[單選題]MapReduce適用于()

A)任意應用程序

B)任意可以在Windows

C)可以串行處理的應用程序

D)可以并行處理的應用程序

答案:D

解析:

166.[單選題]圖像灰度方差說明了圖像哪一個屬性

A)平均灰埋

B)圖像對比度

C)圖像整體亮度

D)圖像細節(jié)

答案:B

解析:

167.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,財務智能分析中的財務指標趨勢分析模塊

,點擊()可切換變化率的兩種計算方式(選擇該期財務指標的去年同比值或與今年年初的比較值

)O

A)合并/本部

B)B.按報告期/按年度切換

OC.同比變化率/比年初變化率

D)D.以上都不對

答案:C

解析:

168.[單選題]選項()可以令下面的代碼輸出結(jié)果為Truea=foo(2)b=foo(3)print(a<b)

A)classfoo:def_init_(self,x):self,x=xdef_It_(self,other):ifself,x<

other,x:returnFalseelse:returnTrue

B)classfoo:def_init(self,x):self,x=xdef_less_(self,other):ifself,x>

other,x:returnFalseelse:returnTrue

C)classfoo:def_init_(self,x):self,x=xdef_It_(self,other):ifself,x<

other,x:returnTrueelse:returnFalse

D)classfoo:def_init_(self,x):self,x=xdef_less_(self,other):ifself,x<

other,x:returnFalseelse:returnTrue

答案:C

解析:

169.[單選題]著名的C4.5決策樹算法使用()來選擇最優(yōu)劃分屬性。

A)信息增益

B)增益率

C)基尼指數(shù)

D)均值

答案:B

解析:

170.[單選題]以下說法中正確的是()o

A)Python3.x完全兼容Python2.x0

B)在Windows平臺上編寫的Python程序無法在Unix平臺運行。

C)不可以在同一臺計算機上安裝多個Python版本。

D)Python是跨平臺的

答案:D

解析:

171.[單選題]對組織機構(gòu)的數(shù)據(jù)管理成熟度等級劃分中的已執(zhí)行級的描述錯誤的是()。

A)在具體項目中,DMM關鍵過程域(KPA)中給出的關鍵過程已被執(zhí)行,但隨意性和臨時性較大

B)DMM關鍵過程的執(zhí)行不僅僅局限于特定業(yè)務范疇,存在跨越不同業(yè)務領域的關鍵過程

C)缺少針對DMM關鍵過程的反饋與優(yōu)化

D)雖然有可能在特定業(yè)務過程中進行了基礎性改進,但沒有進行持續(xù)跟進,也未拓展到整個組織機構(gòu)

答案:B

解析:DMM的執(zhí)行級(PerformedLevel):組織機構(gòu)只在個別項目的范圍之內(nèi)"執(zhí)行"了DMM給出的關鍵過

程,但缺乏機構(gòu)層次的統(tǒng)籌與管理。主要特點如下:①在具體項目中,DMM關鍵過程域(KPA)中給出的關

鍵過程(KeyProcess)已被執(zhí)行,但隨意性和臨時性較大。②DMM關鍵過程(KeyProcess)的執(zhí)行往往

僅限于特定業(yè)務范疇,很少存在跨越不同業(yè)務領域的關鍵過程。③缺少針對DMM關鍵過程(Key

Process)的反饋與優(yōu)化。以DMM關鍵過程(KeyProcess)中的"數(shù)據(jù)質(zhì)量"為例,其數(shù)據(jù)管理工作可能過

于集中在一個特定業(yè)務,如"數(shù)據(jù)修復活動",并沒有擴散到整個的業(yè)務范圍或并沒有開展對數(shù)據(jù)修復

活動本身的反饋與優(yōu)化工作;④雖然有可能在特定業(yè)務過程中已進行了基礎性改進,但沒有進行持續(xù)

跟進,也未拓展到整個組織機構(gòu);⑤)組織機構(gòu)沒有統(tǒng)籌其數(shù)據(jù)管理工作,而數(shù)據(jù)管理活動局限在具體

項目中,主要按照其具體項目的實施需求進行,如果一個具體項目中需要進行數(shù)據(jù)管理,可能會執(zhí)行

DMM中給出的相關過程,反之亦然。

172.[單選題]MapReduce自定義排序規(guī)則需要重寫下列那項方法()

A)readFields()

B)compareTo()

C)map()

D)reduce()

答案:B

解析:

173.[單選題]()負責組織制定電力監(jiān)控系統(tǒng)數(shù)據(jù)安全保護方案,并對安全保護措施技術落實情況

進行檢查。

A)國調(diào)中心

B)國網(wǎng)安質(zhì)部

C)國網(wǎng)信通部

D)網(wǎng)絡安全和信息化領導小組

答案:A

解析:

174.[單選題]Hbase中的Region是由:()服務進程來管理的。

A)HRegionServer

B)Zookeeper

OHmaster

D)DataNode

答案:A

解析:

175.[單選題]()不是RDD的緩存方法。

A)persist

B)cache

C)memory

D)以上答案都正確

答案:C

解析:

176.[單選題]Reduce階段不包括以下哪一步?()

A)排序

B)分區(qū)

C)分組

D)規(guī)約

答案:B

解析:

177.[單選題]Sklearn庫中對數(shù)據(jù)進行預處理和規(guī)范化主要依靠()模塊。

A)neighbors模塊

B)preprocessing模塊

Opipeline模塊

D)datasets模塊

315

答案:B

解析:sklearn.preprocessing模塊包括縮放、居中、歸一化、二值化和插補方法,主要是對數(shù)據(jù)進

行預處理和規(guī)范化。

178.[單選題]業(yè)務中臺是將具有()特征的業(yè)務沉淀形成企業(yè)級共享服務中心,各業(yè)務系統(tǒng)不再單

獨建設共性應用服務,直接調(diào)用業(yè)務中臺服務。

A)共性

B)個性

C)統(tǒng)一

D)分散

答案:A

解析:

179.[單選題]Hive是基于Hadoop的數(shù)據(jù)倉庫軟件,最大可以查詢和管理()級別的分布式數(shù)據(jù)。

A)TB

B)GB

C)PB

D)MB

答案:C

解析:

180.[單選題]如何禁用reduce階段()

A)設置conf.setNumreduceTasks(0)

B)設置job.setNumreduceTasks(0)

C)設置job.setNumreduceTasks()=0

D)修改配置文件中NumreduceTasks=O

答案:B

解析:

181.[單選題]大數(shù)據(jù)計算服務(MaxCompute,原0DPS)中的用戶表dim_user是一張非分區(qū)表,另外

有一部分新增用戶的數(shù)據(jù)存在usejdelta表中,兩張表的結(jié)構(gòu)相同,為了在dim_user表中得到全量

的用戶數(shù)據(jù),可以采用()方式。

A)select*fromuser_deltaintodim_user;

B)insertintodim_userselect*fromuser_deltaunionallselect*fromdim_user

C)insertoverwritetabledim_userselect*fromuser_delta

D)insertintotabledimuserselect*fromuserdelta

答案:D

解析:

182.[單選題]FusioninsightHD的Loader在創(chuàng)建作業(yè)時,連接器(Connector)有什么作用

A)確定有哪些轉(zhuǎn)換步驟

B)提供優(yōu)化參數(shù),提高數(shù)據(jù)導入導出性能

C)配置作業(yè)如何對外部數(shù)據(jù)源進行連接

D)配置作業(yè)如何與內(nèi)部數(shù)據(jù)源進行連接

答案:C

解析:

183.[單選題]以下()組件負責接收來自應用的訪問請求,并向客戶端返回執(zhí)行結(jié)果。

A)GTM

B)WLM

C)CN

D)DN

答案:c

解析:

184.[單選題]在著名管理學家Thomas.H.Davernport在《哈佛商業(yè)論壇》上發(fā)表的題為《第蘭代分析

學(Analytics3.0)}的經(jīng)典論文中,Analytics3.0時代是指()。

A)商務智能時代

B)唱大數(shù)據(jù)時代

C)數(shù)據(jù)富足供給時代

D)數(shù)據(jù)智能時代

答案:C

解析:

185.[單選題]邏輯回歸是輸出結(jié)果落在[0,1]區(qū)間內(nèi),下列哪個函數(shù)用于轉(zhuǎn)換概率,使其落入

[0,1]?

A)Sigmoid

B)Mode

C)Square

D)Probit

答案:A

解析:

186.[單選題]一切以數(shù)據(jù)作為驅(qū)動或者核心的產(chǎn)品叫做()

A)創(chuàng)新性產(chǎn)品

B)數(shù)據(jù)產(chǎn)品

C)風控產(chǎn)品

D)核心產(chǎn)品

答案:B

解析:

187.[單選題]數(shù)據(jù)庫設計中,反映用戶對數(shù)據(jù)要求的模式是

A)內(nèi)模式

B)外模式

C)設計模式

D)概念模式

答案:B

解析:

188.[單選題]日前,多數(shù)NoSQL數(shù)據(jù)庫是針對特定應用場景研發(fā)出來的,其設計遵循(原則,更強調(diào)

讀寫效率、數(shù)據(jù)容量以及系統(tǒng)可擴展性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論