大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3-2023練習(xí)版_第5頁(yè)
已閱讀5頁(yè),還剩104頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試題說(shuō)明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3(500題)

大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案3

L[單選題]下列關(guān)于機(jī)器學(xué)習(xí)模型的說(shuō)法正確的是()。

A)一個(gè)機(jī)器學(xué)習(xí)模型如果有較高準(zhǔn)確率,總是說(shuō)明這個(gè)分類(lèi)器是好的

B)如果增加模型復(fù)雜度,那么模型的測(cè)試錯(cuò)誤率不一定會(huì)降低

C)如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯(cuò)誤率總是會(huì)降低

2.[單選題]大數(shù)據(jù)環(huán)境下,為了從大量電子數(shù)據(jù)中挖掘有用的信息,一些數(shù)據(jù)分析工具被開(kāi)發(fā)出來(lái)

,主要有三類(lèi)工具:批處理工具、流處理工具、交互式分析工具

A)交互式分析工具

B)嵌入式分析工具

C)模擬仿真工具

3.[單選題]MapReduce任務(wù)最終是在下列()中被執(zhí)行的。

A)NodeManager

B)container

C)ResourceManager

D)AppMaster

4.[單選題]什么是詞向量?

A)句子分詞得到的向量

B)多個(gè)詞組成的向量

C)對(duì)每個(gè)詞進(jìn)行編碼得到的向量

D)文檔的向量表示

5.[單選題]下列關(guān)于誤差的說(shuō)法,正確的是O

A)訓(xùn)練樣本容量增加,泛化誤差也會(huì)增加

B)過(guò)擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過(guò)大

C)過(guò)擬合可以通過(guò)減少模型參數(shù)數(shù)量解決

D)交叉驗(yàn)證不重復(fù)使用數(shù)據(jù)

6.[單選題]在其它條件不變的前提下,以下哪種做法容易引起機(jī)器學(xué)習(xí)中的過(guò)擬合問(wèn)題

A)增加訓(xùn)練集數(shù)量

B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)

C)刪除稀疏的特征

D)SVM算法中使用高斯核/RBF核代替

7.[單選題]()是用來(lái)解決海量大數(shù)據(jù)文件存儲(chǔ)問(wèn)題的,是目前應(yīng)用最廣泛的分布式文件系統(tǒng)。

A)HDFS

B)HBase

OHIve

D)Kafka

8.[單選題]以下關(guān)于turtle庫(kù)的描述,正確的是:

A)在importturtle之后就可以用CirCle()語(yǔ)句,來(lái)畫(huà)一個(gè)圓圈

B)要用fromturtleimportturtle來(lái)導(dǎo)入所有的庫(kù)函數(shù)

OhomeO函數(shù)設(shè)置當(dāng)前畫(huà)筆位置到原點(diǎn),朝向東

D)seth(x)是Setheading(X)函數(shù)的別名,讓畫(huà)筆向前移動(dòng)X

9.[單選題]IDC的定義除了揭示大數(shù)據(jù)傳統(tǒng)3V基本特征,即VOlUme、Variety和VeIOCity,還增添了

一個(gè)新特征是

A)量大

B)速度快

C)應(yīng)用廣

D)價(jià)值

10.[單選題]下列關(guān)于可視化工具中高級(jí)分析工具的說(shuō)法,錯(cuò)誤的是?()

A)R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件

B)Weka主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非??犰诺目梢暬瘓D形

C)GePhi主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非??犰诺目梢暬瘓D形

D)R通常用于大數(shù)據(jù)集的統(tǒng)計(jì)與分析

11.[單選題]執(zhí)行以下代碼段Print(bool('FaISe'))Print(bool())時(shí),輸出為(.)。

A)TrueTrue

B)TrueFalse

C)FalseTrue

D)FalseFalse

12.[單選題]關(guān)系云的一個(gè)重要功能是提供()。

A)數(shù)據(jù)庫(kù)即服務(wù)

B)虛擬服務(wù)

C)彈性計(jì)算

D)按需服務(wù)

13.[單選題]python語(yǔ)句Print(type({}))的結(jié)果是。()

A)class'dict'

B)class'tuple'

C)class'set'

D)class'list'

14.[單選題]第3次信息化浪潮的標(biāo)志是:O

A)個(gè)人計(jì)算機(jī)的普及

B)互聯(lián)網(wǎng)的普及

C)云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的普及

D)人工智能化

15.[單選題]針對(duì)MaXCOnIPUteSQL做邏輯分析的時(shí)候,會(huì)進(jìn)行一些優(yōu)化,不包括:()優(yōu)化。

A)常量表達(dá)式(ConStantExpression)

B)列映射(ColumnProjection)

C)謂語(yǔ)動(dòng)詞下沉(PredictPushDown)

D)掃描方式(ScanMethod)

16.[單選題]在早期版本低的HadooP中使用的是()方法來(lái)調(diào)度用戶的作業(yè)。

A)短作業(yè)優(yōu)先

B)高響應(yīng)比優(yōu)選

C)基于時(shí)間片輪轉(zhuǎn)

D)先進(jìn)先出

17.[單選題]以下風(fēng)險(xiǎn)管理工作,哪些可運(yùn)用大數(shù)據(jù)實(shí)現(xiàn)?

A)貸款催收

B)憑證審閱

C)風(fēng)險(xiǎn)模型預(yù)警

D)以上都是

18.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用以安全可控為前提,按照()的原則,落實(shí)安全與保密責(zé)任。

A)誰(shuí)經(jīng)手,誰(shuí)使用,誰(shuí)負(fù)責(zé)

B)誰(shuí)主管,誰(shuí)負(fù)責(zé)

C)誰(shuí)使用,誰(shuí)主管,誰(shuí)負(fù)責(zé)

D)誰(shuí)錄入,誰(shuí)使用,誰(shuí)負(fù)責(zé)

19.[單選題]哪個(gè)軟件架構(gòu)是GOogIe提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的

A)GFS

B)MapReduce

C)Chubby

D)Bigtable

20.[單選題]關(guān)于數(shù)據(jù)相關(guān)性,以下說(shuō)法錯(cuò)誤的是(一)。

A)相關(guān)性體現(xiàn)了大數(shù)據(jù)的靈魂

B)相關(guān)性思維實(shí)現(xiàn)了從“為什么”到“是什么”的思維轉(zhuǎn)變

C)相關(guān)性關(guān)注事物的因果關(guān)系

D)相關(guān)性關(guān)注事物的相關(guān)關(guān)系

21.[單選題]HDFS中當(dāng)前block大小為128M,如果當(dāng)前要上傳到HDFS中的文件大小為300M,那么在存

儲(chǔ)時(shí)會(huì)分配()個(gè)block進(jìn)行存儲(chǔ)。

A)l

B)2

03

D)4

22.[單選題]第一數(shù)字定律中使用概率最大的數(shù)字是()。

A)0

B)l

02

D)3

23.[單選題]下列關(guān)于HiVe中連接查詢(xún)描述正確的是()

A)HiVe中連接查詢(xún)只支持相等連接而不支持不等連接

B)HiVe中連接查詢(xún)支持相等連接和不等連接

C)HiVe中連接查詢(xún)只支持不等連接而不支持相等連接

D)以上都不對(duì)

24.[單選題]在TF-IDF算法中,在計(jì)算完詞頻與逆文檔頻率后,將兩者()后得到最終的結(jié)果。

A)相加

B)相減

C)相乘

D)相除

25.[單選題]下列選項(xiàng)中,關(guān)于HBaSe特性描述不正確的一項(xiàng)是()。

A)高可靠性

B)高性能

C)面向行

D)可伸縮

26.[單選題]對(duì)于二分類(lèi)問(wèn)題,線性分類(lèi)器用一個(gè)超平面將兩類(lèi)樣本分開(kāi),對(duì)于二維平面,這個(gè)超平面

是一條()

A)折線

B)曲線

C)直線

D)以上說(shuō)法都不對(duì)

27.[單選題]由于不同類(lèi)別的關(guān)鍵詞對(duì)排序的貢獻(xiàn)不同,檢索算法一般把查詢(xún)關(guān)鍵詞分為幾類(lèi),

以下哪一類(lèi)不屬于此關(guān)鍵詞類(lèi)型的是()。

A)、引用詞

B)、普通關(guān)鍵詞

C)、高頻詞匯

D)、擴(kuò)展關(guān)鍵詞

28.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,系統(tǒng)在【客戶信息管理】一級(jí)菜單下增加【征

信報(bào)告查詢(xún)管理】二級(jí)菜單,用戶可在此菜單下的O節(jié)點(diǎn)查看否決意見(jiàn)。

A)待處理的征信報(bào)告

B)B.審批中的征信報(bào)告

C)C.審批批準(zhǔn)

D)D.審批否決

29.[單選題]如果問(wèn)題存在最優(yōu)解,則下面幾種搜索算法中,()必然可以得到該最優(yōu)解。

A)廣度優(yōu)先搜索

B)深度優(yōu)先搜索

C)有界深度優(yōu)先搜索

D)啟發(fā)式搜索

30.[單選題]組合多條SQL查詢(xún)語(yǔ)句形成組合查詢(xún)的操作符是()

A)SELECT

B)ALL

C)LINK

D)UNION

31.[單選題]下列不屬于TranSfOrmation操作的是0

A)map

B)fIter

C)sample

D)count

32.[單選題]某單位運(yùn)用隨機(jī)森林算法思想建立搶修熱點(diǎn)模型。該模型主要預(yù)測(cè)下期臺(tái)區(qū)工單數(shù)量

,構(gòu)建搶修熱點(diǎn)。模型構(gòu)建步驟如下:①將歷史數(shù)據(jù)進(jìn)行隨機(jī)自助法重抽樣,生成N個(gè)訓(xùn)練樣本集;②將

N個(gè)訓(xùn)練樣本集分別做決策樹(shù),生成N棵決策樹(shù);③將N棵決策樹(shù)隨機(jī)構(gòu)成隨機(jī)森林;④未來(lái)根據(jù)預(yù)測(cè)樣

本氣候環(huán)境、設(shè)備屬性、設(shè)備工況進(jìn)行隨機(jī)森林決策投票,得出針對(duì)該預(yù)測(cè)樣本最優(yōu)的決策樹(shù)進(jìn)行運(yùn)

算,并計(jì)算出最終結(jié)果。模型算法構(gòu)建步驟合理的順序是()。

A)①②③④

B)①③②④

C)④①②③

D)④②①③

33.[單選題]執(zhí)行以下代碼段ClaSSA:def_init_(self,x=1):self,x=xclassder(A):def

—init一(self,y=2):super().—init—()self,y=ydefmain():obj=der()print(obj.x,

Obj.y)main()時(shí),輸出為(一)0

A)l1

B)l2

C)22

D)21

34.[單選題]在Matplotlib中設(shè)置X軸、y軸的刻度位置可用函數(shù)()。

A)xlabel()、ylabel()

B)xlimO、ylimO

C)Xscale()、yscale()

D)xticks()、yticks()

35.[單選題]以下哪個(gè)選項(xiàng)對(duì)Redis數(shù)據(jù)讀寫(xiě)流程描述是正確的?(

A)ServerA節(jié)點(diǎn)返回集群拓?fù)?客戶端選擇集群任意一個(gè)serverA節(jié)點(diǎn)連接客戶端計(jì)算Key歸屬的槽

位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連接-Servere節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果

B)客戶端選擇集群任意一個(gè)SerVerA節(jié)點(diǎn)連接-Servera節(jié)點(diǎn)返回集群拓?fù)淇蛻舳擞?jì)算Key歸屬的槽

位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連接一ServerB節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果

C)ServerA節(jié)點(diǎn)返回集群拓?fù)?喜戶端計(jì)算Key歸屬的槽位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連接戶端選擇集

群任意一個(gè)SerVerA節(jié)點(diǎn)連接-eerB節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果

D)客戶端選擇集群任意一個(gè)SerVera節(jié)點(diǎn)連接客戶端計(jì)算Key歸屬的槽位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連

接-ServerA節(jié)點(diǎn)返回集群拓?fù)?ServerB節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果

36.[單選題]以下描述中不屬于"規(guī)整數(shù)據(jù)(TidyData)"三個(gè)基本原則的是()。

A)每一類(lèi)觀察單元構(gòu)成一個(gè)關(guān)系(表)

B)每個(gè)觀察占且僅占一行

C)每個(gè)變量占且僅占一列

D)每個(gè)觀察占且僅占一個(gè)關(guān)系(表)

37.[單選題]關(guān)于MaXCOmPUte用戶和權(quán)限,說(shuō)法正確的是:()。

A)每一個(gè)項(xiàng)目空間在創(chuàng)建后,需要手工創(chuàng)建一個(gè)admin的角色,并且為該角色授予了確定的權(quán)限

B)admin角色可以將admin權(quán)限指派給用戶

C)Admin可以設(shè)定項(xiàng)目空間的安全配置,但是不能修改項(xiàng)目空間的鑒權(quán)模型

D)MaXComPUte目前不支持在項(xiàng)目空間中徹底移除一個(gè)用戶及其所有權(quán)限數(shù)據(jù)。

38.[單選題]考察一個(gè)由三個(gè)卷積層組成的CNN:kernel=3×3,stride=2,padding=SAME0最低層

輸出100個(gè)特征映射(featuremap),中間層200個(gè)特征映射,最高層400個(gè)特征映射。輸入是

200X300的RGB圖片,則總參數(shù)的數(shù)量是()。

A)903400

B)2800

C)180200

D)720400

39.[單選題]F1參數(shù)(一),說(shuō)明模型越穩(wěn)定。

A)越小

B)越大

C)越趨近于某一特定值

D)Fl參數(shù)和模型穩(wěn)定性沒(méi)有關(guān)系

40.[單選題]數(shù)據(jù)使用環(huán)節(jié)的安全技術(shù)措施除防火墻、()、防病毒、防DDOS、漏洞檢測(cè)等網(wǎng)絡(luò)安全

防護(hù)技術(shù)措施外,還需實(shí)現(xiàn)以下安全技術(shù)能力:賬號(hào)權(quán)限管理、數(shù)據(jù)安全域、數(shù)據(jù)脫敏、日志管理和

審計(jì)、異常行為實(shí)時(shí)監(jiān)控和終端數(shù)據(jù)防泄漏。

A)入侵檢測(cè)

B)病毒檢測(cè)

C)程序檢測(cè)

D)進(jìn)程檢測(cè)

41.[單選題]下列哪個(gè)程序通常與NameNode在同一個(gè)節(jié)點(diǎn)啟動(dòng)

A)TaskTracker

B)DataNode

C)SecondaryNameNode

D)Jobtracker

42.[單選題]大數(shù)據(jù)計(jì)算服務(wù)項(xiàng)目空間Prjl中存在表tl,其中包含一列名字為id,OWner打開(kāi)

LabelSeCUrity設(shè)置后,執(zhí)行如下命令:SETLABEL1TOTABLEtl;SETLABEL2TOTABLE

tl(id);SETLABEL3TOTABLEtl;此時(shí),tl表中的id列的敏感等級(jí)標(biāo)簽()。

A)I級(jí)

B)3級(jí)

C)2級(jí)

D)O級(jí)

43.[單選題](一)是一種建立在HadooP之上的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)。

A)HDFS

B)Flume

C)Sqoop

D)Hive

44.[單選題]長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計(jì)用來(lái)解決什么問(wèn)題?()

A)、傳統(tǒng)RNN存在的梯度消失/爆炸問(wèn)題

B)、傳統(tǒng)RNN計(jì)算量大的問(wèn)題

C)、傳統(tǒng)RNN速度較慢的問(wèn)題

D)、傳統(tǒng)RNN容易過(guò)過(guò)擬合的問(wèn)題

45.[單選題]下面哪一個(gè)不屬于大數(shù)據(jù)倫理問(wèn)題:()

A)隱私泄露問(wèn)題

B)數(shù)據(jù)安全問(wèn)題

C)數(shù)字鴻溝問(wèn)題

D)數(shù)據(jù)冗余問(wèn)題

46.[單選題]執(zhí)行以下代碼段CiaSSFather():def_init_(self,a,b):self,b=bifa<b:

self,a=aelse:self,a=bdefaction(self):self,a+=4classSon(Father):def

init_(self,a,b):self,a=8self,b=4defaction(self):self,a+=7self,b*=

2classGrandSon(Son):def—init—(self,a,b):Father.—init—(self,a,b)grandson=

GrandSon(9,6)grandson,action()print(grandson,a)?,輸出為()0

A)10

B)13

C)15

D)16

47.[單選題]以等可能性為基礎(chǔ)的概率是O。

A)古典概率

B)經(jīng)驗(yàn)概率

C)試驗(yàn)概率

D)主觀概率

48.[單選題]在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,感知機(jī)輸出層中的M-P神經(jīng)元通常被稱(chēng)為()。

A)閾值邏輯單元

B)激活函數(shù)

C)擠壓函數(shù)

D)連接函數(shù)

49.[單選題]以下對(duì)于離線批處理的概念理解錯(cuò)誤的是哪-項(xiàng)?

A)離線批處理對(duì)數(shù)據(jù)處理的時(shí)延要求不高。

B)離線批處理占用的內(nèi)存資源較多。

C)離線批處理通常通過(guò)眠作業(yè)、SPark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。

D)離線批處理針對(duì)的數(shù)據(jù)量較大。

50.[單選題]MapReduce默認(rèn)的分區(qū)函數(shù)是()。

A)hash

B)disk

C)reduce

D)map

51.[單選題]查找表結(jié)構(gòu)用以下哪一項(xiàng)()

A)FIND

B)SELETE

C)ALTER

D)DESC

52.[單選題]Flink的數(shù)據(jù)轉(zhuǎn)換操作在:()環(huán)節(jié)中完成。

A)channel

B)Transformation

C)sink

D)source

53.[單選題]下列哪項(xiàng)通常是集群的最主要瓶頸_

A)CPU

B)網(wǎng)絡(luò)

C)磁盤(pán)IO

D)內(nèi)存

54.[單選題]在比較模型的擬合效果時(shí),甲、乙、丙蘭個(gè)模型的相關(guān)指數(shù)R2的值分別約為0.71、

0.85.0.90,則擬合效果較好的模型是()。

A)甲

B)乙

C)丙

D)效果一樣

55.[單選題]下列代碼中最適合接受系統(tǒng)輸入是一個(gè)整數(shù)的是()。

A)num=input()

B)num=input("6")

C)num=int(input)

D)num=oat(input)

56.[單選題]使用Pig語(yǔ)句查詢(xún)一張名為tmp_table的表的前50行,下列語(yǔ)句正確的是()。

A)SELECT*FROMtmp_tableLIMIT50;

B)tmp_table_limit=LIMITtmp_table50;DUMPtmp_table_limit;

ODUMPtmp_tableLIMIT50

D)DUMPtmp_tableLIMIT=50;

57.[單選題]推薦系統(tǒng)為客戶推薦商品,自動(dòng)完成個(gè)性化選擇商品的過(guò)程,滿足客戶的個(gè)性化需求,推

薦基于網(wǎng)站最熱賣(mài)商品、客戶所處城市、(),推測(cè)客戶將來(lái)可能的購(gòu)買(mǎi)行為。

A)客戶的朋友

B)客戶的個(gè)人信息

C)客戶的興趣愛(ài)好

D)客戶過(guò)去的購(gòu)買(mǎi)行為和購(gòu)買(mǎi)記錄

58.[單選題]下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:

A)粒度是指數(shù)據(jù)倉(cāng)庫(kù)小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別

B)數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高

C)數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高

D)粒度的具體劃分將直接影響數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量以及查詢(xún)質(zhì)量

59.[單選題]留出法直接將數(shù)據(jù)集劃分為()個(gè)互斥的集合

A)一

B)二

C)三

D)四

60.[單選題]決策樹(shù)的基本流程遵循()的策略。

A)貪心

B)最優(yōu)化

C)分而治之

D)順序

61.[單選題]關(guān)于數(shù)據(jù)整合和分組的說(shuō)法,不E確的是

A)數(shù)據(jù)連接可以用concat或merge函數(shù)

B)axis=l表示軸向連接

C)數(shù)據(jù)分組可以使用mean函數(shù)

D)使用agg可以自定義多個(gè)聚合函數(shù)

62.[單選題]遺忘門(mén)的作用是()。

A)保留重要信息

B)去除不重要信息

C)信息增加

D)輸出

63.[單選題]創(chuàng)建數(shù)據(jù)庫(kù)使用以下哪項(xiàng)()

A)createmytest

B)createtablemytest

C)databasemytest

D)createdatabasemytest

64.[單選題]下列關(guān)于MaPRedUCe計(jì)算原理敘述不正確的一項(xiàng)是()0

A)將大數(shù)據(jù)集劃分為小數(shù)據(jù)集,小數(shù)據(jù)集劃分為更小數(shù)據(jù)集

B)將最終劃分的小數(shù)據(jù)分發(fā)布到集群節(jié)點(diǎn)上

C)以串行的方式完成計(jì)算處理

D)將計(jì)算結(jié)果遞歸融匯,得到最后的結(jié)果

65.[單選題]在SeleCt語(yǔ)句中,實(shí)現(xiàn)選擇操作的子句是()

A)select

B)groupby

C)where

D)from

66.[單選題]Python源程序文件的擴(kuò)展名為()

A)pdb

B)db

Opy

D)exe

67.[單選題]決策樹(shù)中,同一路徑上的所有屬性之間是()關(guān)系

A)因果

B)相關(guān)

C)邏輯或

D)邏輯與

68.[單選題]()是SPark中用于結(jié)構(gòu)化數(shù)據(jù)處理的軟件包。

A)SPARKCORE

B)SparkSQL

C)SparkStreaming

D)Mllib

69.[單選題]下面關(guān)于MaPRedUCe模型中MaP函數(shù)與RedUCe函數(shù)的描述正確的是()

A)一個(gè)MaP函數(shù)就是對(duì)一部分原始數(shù)據(jù)進(jìn)行指定的操作。

B)一個(gè)MaP操作就是對(duì)每個(gè)RedUCe所產(chǎn)生的一部分中間結(jié)果進(jìn)行合并操作。

C)MaP與MaP之間不是相互獨(dú)立的。

D)RedUCee與RedUCe之間不是相互獨(dú)立的。

70.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用O以為前提,按照“誰(shuí)經(jīng)手,誰(shuí)使用,誰(shuí)負(fù)責(zé)”的原則,落實(shí)安全與保

密責(zé)任。

A)來(lái)源明確

B)冗余率低

C)分類(lèi)清晰

D)安全可控

71.[單選題]下面不屬于NoSQL的有(_)。

A)ORACLE

B)Redislabs

C)couchbase

D)paradigm4

72.[單選題]數(shù)據(jù)抽取是從數(shù)據(jù)源中抽取數(shù)據(jù)的過(guò)程,數(shù)據(jù)抽取的方式有全量抽取和()。

A)重點(diǎn)抽取

B)個(gè)別抽取

C)抽樣抽取

D)增量抽取

73.[單選題]一般情況下,若要提高EIaStiCSearCh檢索效率,可以采取什么操作?

A)調(diào)整索引分片數(shù)

B)使用HiVe做底層存儲(chǔ)

C)壓縮素引

D)正價(jià)ESMaSter節(jié)點(diǎn)

74.[單選題]下面屬于批處理技術(shù)的是:()

A)MapReduce

B)Storm

C)Spark

D)GraphX

75.[單選題]下列關(guān)于數(shù)據(jù)交易市場(chǎng)的說(shuō)法中,錯(cuò)誤的是()。

A)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物

B)商業(yè)化的數(shù)據(jù)交易活動(dòng)催生了多方參與的第三方數(shù)據(jù)交易市場(chǎng)

C)數(shù)據(jù)交易市場(chǎng)通過(guò)生產(chǎn)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助

D)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)資源化的必然產(chǎn)物

76.[單選題]下面幾種梯度下降方法中,哪種是速度最慢的:()

A)SGD

B)Adagrad

ORMSProp

D)Adam

77.[單選題]在我們神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,每次dropout想去掉20%的參數(shù),下面有關(guān)激活函數(shù)說(shuō)法錯(cuò)

誤的是:()

A)SigmOid容易飽和,出現(xiàn)梯度消失。

B)LeakyRelU是ReiU的一個(gè)變種,他在X

C)Tanh存在梯度消失問(wèn)題,但是是0均值,而且收斂速度比Sigmoid慢。

D)ReIU收斂速度比Sigmoid和tanh快很多,可以緩解梯度消失現(xiàn)象。

78.[單選題]()反映數(shù)據(jù)的精細(xì)化程度,越細(xì)化的數(shù)據(jù),價(jià)值越高。

A)規(guī)模

B)活性

0關(guān)聯(lián)度

D)顆粒度

79.[單選題]HBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?

A)Deletedelete=newDelete(rowkey)

B)scan.SetCaching(1000)

C)bytellrowkey=Bytes.toBytesC"012005000201")

D)List<Put>]putS=newArraylist<Put>0

80.[單選題]與以下代碼段foriinranged,101):ifint(i*0.5)==i*0.5:Print(i)等效

的列表描述(一)o

A)[iforiinrange(1,100)ifint(i*0.5)==(i*0.5)]

B)[iforiinrange(1,101)ifint(i*0.5)==(i*0.5)]

C)[iforiinrange(1,101)ifint(i*0.5)=(i*0.5)]

D)[iforiinrange(1,100)ifint(i*0.5)=(i*0.5)]

81.[單選題]在支持向量機(jī)中,軟間隔支持向量機(jī)的目標(biāo)函數(shù)比硬間隔支持向量機(jī)多了一個(gè)(_)。

A)偏置項(xiàng)b

B)系數(shù)

C)松弛變量

D)兩種情況的目標(biāo)函數(shù)相同

82.[單選題]Hive創(chuàng)建。時(shí),會(huì)將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指向的路徑;創(chuàng)建O,僅記錄數(shù)據(jù)所在的

路徑,不對(duì)數(shù)據(jù)的位置做任何改變

A)內(nèi)部表.外部表

B)內(nèi)部表.元數(shù)據(jù)

C)原元數(shù)據(jù).外部表

D)外部表.托管表

83.[單選題]若不針對(duì)MapReduce編程模型中的key和VaIUe值進(jìn)行特別設(shè)置,下列哪一項(xiàng)是

MapReduce不適宜的運(yùn)算。()

A)Max

B)Min

C)Count

D)Average

84.[單選題]()可用來(lái)展示持續(xù)性數(shù)據(jù),可很好地表示趨勢(shì)、累積、減少以及變化。

A)柱形圖

B)地圖

C)面積圖

D)雷達(dá)圖

85.[單選題]Spark的核心概念不包括?

A)RDD

B)Hoq

C)寬套依賴(lài)

D)Shuffle

86.[單選題]以下哪個(gè)不是大數(shù)據(jù)的“4V”特性:()

A)數(shù)據(jù)量大

B)數(shù)據(jù)類(lèi)型繁多

C)處理速度快

D)價(jià)值密度高

87.[單選題]關(guān)于FusionlnsightHD中Loader作業(yè)描述正確的是

A)Load可將作業(yè)提交到Y(jié)arn執(zhí)行后,如果此時(shí)Loader服務(wù)出現(xiàn)異常,則此作業(yè)執(zhí)行失敗。

B)LOader將作業(yè)提交至Yarn執(zhí)行后,如果某個(gè)MaPPer任務(wù)執(zhí)行失敗,能夠自動(dòng)進(jìn)行重試。

C)Loader作業(yè)執(zhí)行共敗后將會(huì)產(chǎn)生垃圾數(shù)據(jù),需要用戶手動(dòng)清除

D)LOader將一個(gè)作業(yè)提交至Yarn執(zhí)行后,該作讓執(zhí)行完成前,不能再提交其他作業(yè)

88.[單選題]落實(shí)國(guó)家大數(shù)據(jù)安全保護(hù)要求時(shí),需進(jìn)一步明確大數(shù)據(jù)采集、傳輸、存儲(chǔ)、使用、開(kāi)放

等各環(huán)節(jié)的O和具體措施。

A)責(zé)任主體

B)生產(chǎn)成本

C)關(guān)鍵技術(shù)

D)標(biāo)準(zhǔn)規(guī)范

89.[單選題]評(píng)估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbi踴),應(yīng)采取的解決方法是0

A)減少模型的特征數(shù)量

B)增加模型的特征數(shù)量

C)增加樣本數(shù)量

D)以上答案都正確

90.[單選題]相對(duì)于HadoopMapReducel.0,Spark的特點(diǎn)不包括()。

A)速度快

B)并發(fā)多

C)通用性

D)易用性

91.[單選題]Flink的窗口,按窗口行為劃分不包含以下哪種?

A)容量窗口

B)滑動(dòng)窗

C)滾動(dòng)窗口

D)會(huì)話窗口

92.[單選題]一張表的主鍵個(gè)數(shù)為()

A)至多3個(gè)

B)沒(méi)有限制

C)至多1個(gè)

D)至多2個(gè)

93.[單選題]下面的循環(huán)會(huì)打印多少次"ILovePythonw?foriinrange(0,10,2):print('ILove

Python')

A)2

B)5

C)6

D)10

94.[單選題]下列關(guān)于類(lèi)屬性和實(shí)例屬性的說(shuō)法中,描述正確的是。。

A)類(lèi)屬性既可以顯式定義,又能在方法中定義

B)公有類(lèi)屬性可以通過(guò)類(lèi)和類(lèi)的實(shí)例訪問(wèn)

C)通過(guò)類(lèi)可以獲取實(shí)例屬性的值

D)類(lèi)的實(shí)例只能獲取實(shí)例屬性的值

95.[單選題]Maxcompute拓展MR的主要特點(diǎn)是:()。

A)支持計(jì)算在內(nèi)存中進(jìn)行,中間結(jié)果不落地

B)支持MaP后連續(xù)任意多個(gè)RedUCe操作

C)可以在上一次的reduce結(jié)束之后,直接增加一次map

D)從MaP直接到RedUCe,省去ShUffle階段

96.[單選題]有關(guān)HiVe支持的基本數(shù)據(jù)類(lèi)型,TimeStamP表示()

A)時(shí)間戳

B)字符序列,可以指定字符集

C)字節(jié)數(shù)組

D)集合數(shù)據(jù)類(lèi)型

97.[單選題]Flume中最小的獨(dú)立運(yùn)行單位是()。

A)Source

B)Agent

C)Channel

D)Sink

98.[單選題IStructuredStreaming中通過(guò)什么機(jī)制解決數(shù)據(jù)的無(wú)序和滯后問(wèn)題?

A)事件時(shí)間

B)流連接

C)Watermark機(jī)制

D)持續(xù)查詢(xún)

99.[單選題]輸入圖像為32x32,經(jīng)過(guò)步長(zhǎng)為1,不進(jìn)行Padding,卷積核為5x5的卷積層后,得到的特

征圖尺寸是多少?O

A)28x28

B)27x27

C)29x29

D)32x32

100.[單選題]下列關(guān)于SkIearn說(shuō)法錯(cuò)誤的是Oo

A)sklearn全稱(chēng)為SCikitTearn

B)sklearn在官網(wǎng)被分為7個(gè)大塊

C)sklearn的聚類(lèi)算法幾乎都已經(jīng)放在CIUSter模塊中了

D)sklearn需要NUmPy和SCiPy庫(kù)的支持

IOL[單選題]執(zhí)行"abedef''[::-l]語(yǔ)句時(shí)輸出是(Jo

A)fedcba

B)f

C)abcdef

D)abcde

102.[單選題]業(yè)務(wù)中臺(tái)方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺(tái),后期逐步視

情況拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)

A)電網(wǎng)服務(wù)業(yè)務(wù)中臺(tái)

B)電網(wǎng)資源業(yè)務(wù)中臺(tái)

C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺(tái)

D)電網(wǎng)環(huán)境業(yè)務(wù)中臺(tái)

103.[單選題]()屬于SVM應(yīng)用。

A)文本和超文本分類(lèi)

B)圖像分類(lèi)

C)新文章聚類(lèi)

D)以上均是

104.[單選題]Relief的時(shí)間開(kāi)銷(xiāo)隨采樣次數(shù)以及原始特征數(shù)(_)。

A)線性增長(zhǎng)

B)指數(shù)型增長(zhǎng)

C)快速增長(zhǎng)

D)負(fù)增長(zhǎng)

105.[單選題]Reduce階段不包括以下哪一步?。

A)排序

B)分區(qū)

C分組

D)規(guī)約

106.[單選題]YARN分層結(jié)構(gòu)的本質(zhì)是(一),負(fù)責(zé)整個(gè)系統(tǒng)的資源管理和分配。

A)ResourceManger

B)NodeManger

C)ApplicationMaster

D)Container

107.[單選題]下列哪個(gè)命令是刪除文件的?

A)dfs-clear

B)dfs-Is

C)dfs-rm

D)dfs-del

108.[單選題]下面程序段執(zhí)行后的輸出結(jié)果是()。

N=Is=l

Whilen<5:

S=s*nn=n+lprint(s)

A)24

B)10

C)120

D)15

109.[單選題]Hadoopl.0默認(rèn)的調(diào)度器策略是哪個(gè)。()

A)先進(jìn)先出調(diào)度器

B)計(jì)算能力調(diào)度器

C)公平調(diào)度器

D)優(yōu)先級(jí)調(diào)度器

110.[單選題]一幅大小為512X512的8比特圖像,則該圖像大小為(一)。

A)32KB

B)128KB

C)16KB

D)256KB

Ill.[單選題]一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思維維度中的

()O

A)定量思維

B)相關(guān)思維

C)因果思維

D)檢驗(yàn)思維

112.[單選題]O以上地方人民政府有關(guān)部門(mén)的網(wǎng)絡(luò)安全保護(hù)和監(jiān)督管理職責(zé),按照國(guó)家有關(guān)規(guī)定

確定

A)鄉(xiāng)級(jí)

B)縣級(jí)

C)市級(jí)

D)省級(jí)

113.[單選題]數(shù)據(jù)管理成熟度模型將機(jī)構(gòu)數(shù)據(jù)管理能力定義為(_)個(gè)不同成熟度等級(jí),并給出了

(_)類(lèi)關(guān)鍵過(guò)程域,共(_)個(gè)關(guān)鍵活動(dòng)。

A)3,7,21

B)4,6,24

05,6,25

D)6,7,28

114.[單選題IMapReduce編程模型,鍵值對(duì)<key,value>的key必須實(shí)現(xiàn)哪個(gè)接口?()

A)WritableComparab1e

B)ComparabIe

OWritable

D)LongWritable

115.[單選題]CNN神經(jīng)網(wǎng)絡(luò)對(duì)圖像特征提取帶來(lái)了變革性的變化,使之前的人工特征提取升級(jí)到數(shù)據(jù)

驅(qū)動(dòng)的自動(dòng)特征提取,在αN中,起到特征提取作用的網(wǎng)絡(luò)層是()

A)ConVoIUtion層

B)fullConneet層

C)maxpooling層

D)norm層

116.[單選題]Maxcompute中,當(dāng)一個(gè)用戶被移除后,與該用戶有關(guān)的()授權(quán)會(huì)保留。

?)PaCkage授權(quán)

B)POIiCy授權(quán)

C)ACL授權(quán)

D)項(xiàng)目空間授權(quán)

117.[單選題]關(guān)于缺失值填補(bǔ),不正確的說(shuō)法是()。

A)填補(bǔ)數(shù)據(jù)可以用中位數(shù)或者眾數(shù)等

B)Pandas,dropna可以用來(lái)填補(bǔ)缺失值

C)用平均值填補(bǔ)會(huì)引入相關(guān)性

D)啞變量填補(bǔ)是將缺失值當(dāng)做一類(lèi)新特征處理

118.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNOde實(shí)現(xiàn)的功能是()。

A)管理文件系統(tǒng)的命名空間

B)管理存儲(chǔ)空間

C)分配算力

D)調(diào)控算法

119.[單選題]下列關(guān)于GaUSSDB200的TOAST機(jī)制說(shuō)法正確的是O?

A)存儲(chǔ)超過(guò)2KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制.

B)支持變長(zhǎng)(Varlena)表現(xiàn)形式的數(shù)據(jù)類(lèi)型.

C)存儲(chǔ)超過(guò)1/2KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制。

D)存儲(chǔ)超過(guò)IKB的字段時(shí),會(huì)觸發(fā)ToAST機(jī)制。

120.[單選題]執(zhí)行以下代碼段IiStl=[1,5,9]Print(SUnI(IiStI))時(shí),輸出為(_)。

A)l

B)5

09

D)15

121.[單選題]假如使用LaSSO回歸來(lái)擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(gè)(XI,X2,…,

XlOO)O現(xiàn)在,把其中一個(gè)特征的值擴(kuò)大10倍(如特征XD,然后用相同的正則化參數(shù)對(duì)LaSSO

回歸進(jìn)行修正。那么下列說(shuō)法正確的是()。

A)特征Xl很可能被排除在模型之外

B)特征Xl很可能還包含在模型之中

C)無(wú)法確定特征Xl是否被舍

D)以上答案都不正確

122.[單選題]防火墻、漏洞掃描、病毒防范和系統(tǒng)加固等服務(wù)屬于O

A)安全增值服務(wù)

B)代理代維服務(wù)

C)優(yōu)化類(lèi)服務(wù)

D)容災(zāi)服務(wù)

123.[單選題]K折交叉驗(yàn)證器是()函數(shù)。

A)model_selection.GroupKFold()

B)model_SeleCtion.GroupShufeSplit()

C)model_selection.KFold()

D)model_seIection.RepeatedKFold()

124.[單選題]閱讀以下代碼,回答問(wèn)題,當(dāng)n是11的時(shí)候,S為多少1deftotal(n):2s=03i=14

while(i

A)55

B)66

C)44

D)50

125.[單選題]已知初始問(wèn)題的描述,通過(guò)一系列變換把此問(wèn)題最終變?yōu)橐粋€(gè)子問(wèn)題集合;這些子問(wèn)題

的解可以直接得到,從而解決了初始問(wèn)題。這是知識(shí)表示法叫OO

A)狀態(tài)空間法

B)問(wèn)題歸約法

C)謂詞邏輯法

D)語(yǔ)義網(wǎng)絡(luò)法

126.[單選題]下面哪個(gè)是分布式數(shù)據(jù)庫(kù)O

?)HDFS

B)HBase

C)Oracle

D)Mysql

127.[單選題]HBase的物理存儲(chǔ)單元是什么?

A)Region

B)ColumnFamily

C)Column

D)ROW

128.[單選題]numPy中實(shí)現(xiàn)豎直軸分割數(shù)組的函數(shù)是什么?

A)np.vsplit

B)np.hsplit

C)np.dsplit

D)np.split

129.[單選題]假設(shè)現(xiàn)在要做一個(gè)可以根據(jù)線索指導(dǎo)運(yùn)維人員進(jìn)行排障的功能,你建議選擇下列哪個(gè)

工具實(shí)現(xiàn)該功能?

A)Lucene

B)HBase

C)ElasticSearch

D)GraphBase

130.[單選題]關(guān)于HiVe在FUSiOnlnSightHD中的架構(gòu)描述錯(cuò)誤的是?

A)只要有一個(gè)HiVeSerVer不可用,整個(gè)HiVe集群便不可用

B)MOtaStOre用于提供元數(shù)據(jù)服務(wù),依賴(lài)于DBSerViCe

C)在同一時(shí)間點(diǎn),HiVeSerVer只要一個(gè)處于ACtiVe狀態(tài),另一個(gè)則處于Standby狀態(tài)

D)HiVeSerVer負(fù)責(zé)接收客戶端請(qǐng)求.解析.執(zhí)行HQL命令并返回查詢(xún)結(jié)果

131.[單選題]哪一項(xiàng)不屬于FUSiOnInSightHD中HiVe的流控特性的描述?

A)支持對(duì)已經(jīng)建立的總連接數(shù)做閥值控制

B)支持對(duì)每個(gè)用戶已經(jīng)建立的連接數(shù)做閥值控制

C)支持對(duì)某個(gè)特定用戶已經(jīng)建立的連接數(shù)做閥值控制

D)支持對(duì)單位時(shí)間所建立的連接數(shù)做閥值控制

132.[單選題]()是GOOgle提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運(yùn)算的

軟件架構(gòu)。

Λ)GFS

B)MapReduce

C)Chubby

D)BitTable

133.[單選題]下列關(guān)于數(shù)據(jù)交易市場(chǎng)的說(shuō)法中,錯(cuò)誤的是()。

A)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物

B)咱商業(yè)化的數(shù)據(jù)交易活動(dòng)催生了多方參與的第三方數(shù)據(jù)交易市場(chǎng)

C)數(shù)據(jù)交易市場(chǎng)通過(guò)生產(chǎn)、研友和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助

D)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)資源化的必然產(chǎn)物

134.[單選題]下列對(duì)于ADS中表和表組的描述正確的是()。

A)維度表在創(chuàng)建時(shí)不需要指定表組,但是需要配置分區(qū)信息

B)維度表可以和除維度表組外的任意表組中的表關(guān)聯(lián)

C)批量插入的表如果只有一級(jí)分區(qū),每次導(dǎo)入數(shù)據(jù)是會(huì)覆蓋掉已有數(shù)據(jù)

D)維度表組有且只有一個(gè),用戶可以修改表組屬性,但是不能刪除

135.[單選題]np.arraySPIit()函數(shù)的作用是(_)o

A)沿著它的水平軸分割

B)沿著縱向的軸分割

C)允許指定沿哪個(gè)軸分割

D)按深度方向分割

136.[單選題]sciPy中模塊Signal.的作用是什么?

A)信號(hào)處理

B)程序輸入輸出

C)程序輸入輸出

D)計(jì)算積分

137.[單選題]大數(shù)據(jù)產(chǎn)業(yè)指什么?

A)一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合

B)提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)

C)提供數(shù)據(jù)分享平臺(tái)、數(shù)據(jù)分析平臺(tái)、數(shù)據(jù)租售平臺(tái)等服務(wù)的企業(yè)

D)提供分布式計(jì)算、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析等服務(wù)的各類(lèi)企業(yè)

138.[單選題]為保證流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在:()。

A)本地文件系統(tǒng)中

B)JObManager的內(nèi)存中

C)HDFS中

D)可靠性高的單擊數(shù)據(jù)庫(kù)中

139.[單選題]下列選項(xiàng)中,用于標(biāo)識(shí)為靜態(tài)方法的是OO

A)@classmethod

B)PythOn標(biāo)示注釋使用符號(hào)是以下哪個(gè)?

C)?staticmethod

D)'?privatemethod

140.[單選題]HBase為什么適用于海量數(shù)據(jù)存儲(chǔ)?

A)集群規(guī)模小

B)支持列存表

C)多列簇特性

D)HDFS做底層存儲(chǔ)

141.[單選題]下列關(guān)于RDD說(shuō)法,描述有誤的是?

A)一個(gè)RDD就是一個(gè)分布式對(duì)象集合,本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合

B)每個(gè)RDD可分成多個(gè)分區(qū),每個(gè)分區(qū)就是一個(gè)數(shù)據(jù)集片段

C)RDD是可以直接修改的

D)RDD提供了一種高度受限的共享內(nèi)存模型

142.[單選題]以下不屬于生成式模型的是:

A)樸素貝葉斯

B)K近鄰

C)高斯混合模型

D)馬爾科夫隨機(jī)場(chǎng)

143.[單選題]在其他條件不變的前提下,()容易引起機(jī)器學(xué)習(xí)中的過(guò)擬合問(wèn)題

A)增加訓(xùn)練集量

B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)

C)刪除稀疏的特征

D)SVM算法中使用高斯拉底BF桂代替線性

144.[單選題]信息安全管理最關(guān)注的是?()

A)外部惡意攻擊

B)病毒對(duì)PC的影響

C)內(nèi)部惡意攻擊

D)病毒對(duì)網(wǎng)絡(luò)的影響

145.[單選題]數(shù)據(jù)、信息與知識(shí)三者之間的變化趨勢(shì)是O

A)宏課程

B)大課程

C)小課程

D)微課程

146.[單選題]在留出法、交叉驗(yàn)證法和自助法三種評(píng)估方法中,()更適用于數(shù)據(jù)集較小、難以劃分訓(xùn)

練集和測(cè)試集的情況。

A)留出法

B)交叉驗(yàn)證法

C)自助法

D)留一法

147.[單選題]下列關(guān)于鍵值數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的:()

A)擴(kuò)展性好,靈活性好

B)大量寫(xiě)操作時(shí)性能高

C)無(wú)法存儲(chǔ)結(jié)構(gòu)化信息

D)條件查詢(xún)效率高

148.[單選題]下列操作是創(chuàng)建目錄的是(__)。

A)mkdir

B)chdir

C)rmdir

D)move

149.[單選題IFusionInsightHD集群組網(wǎng)設(shè)計(jì)中,有一種機(jī)架可以按照業(yè)務(wù)需求線性擴(kuò)展,這種機(jī)

架被稱(chēng)為()

A)基本框

B)擴(kuò)展框

C)管理框

D)數(shù)據(jù)框

150.[單選題]下面說(shuō)法錯(cuò)誤的是()。

A)可以利用統(tǒng)計(jì)量對(duì)缺失值進(jìn)行填補(bǔ)

B)可以利用K近鄰值對(duì)缺失值進(jìn)行填補(bǔ)

C)只要有缺失值就必須把對(duì)應(yīng)記錄刪除

D)對(duì)于缺失值較多的屬性可以考慮刪除

151.[單選題]下列選項(xiàng)中,不屬于PythOn特點(diǎn)的是。()

A)面向?qū)ο?/p>

B)運(yùn)行效率高

C)可移植性

D)免費(fèi)和開(kāi)源

152.[單選題]MySQL數(shù)據(jù)庫(kù)驅(qū)動(dòng)文件放置于hive哪個(gè)目錄下O

A)jar

B)lib

Obin

D)sbin

153.[單選題]在HadoOP的分區(qū)階段,默認(rèn)的PartitiOner是()。

A)RangePartitioner

B)Partitioner

C)HashPartitioner

D)用戶自定義的Partitioner

154.[單選題]大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的運(yùn)維人員想要知道一張日志表IOg已經(jīng)占

用了多少存儲(chǔ)空間,可以在命令行工具OdPSemd中使用()命令查看。

A)Islog;

B)desclog;

C)select*fromlog;

D)sizelog;

155.[單選題]下列選項(xiàng)中,哪個(gè)配置文件可以配置HDFS地址、端口號(hào)以及臨時(shí)文件目錄()

A)core-site,xml

B)hdfs-site.xml

C)mapred-site.xml

D)yarn-site,xml

156.[單選題]有N個(gè)樣本,一般用于訓(xùn)練,一般用于測(cè)試若N增大,則訓(xùn)練誤差和測(cè)試誤差之間的差

距會(huì)()

A)增大

B)減小

C)無(wú)法確定

D)無(wú)明顯變化

157.[單選題]下面哪個(gè)RDD操作肯定是寬依賴(lài)()

A)map

B)fIatMap

OreduceByKey

D)sample

158.[單選題]下面哪個(gè)不屬于matplotlib基本圖表包含的元素

A)坐標(biāo)軸

B)刻度

C)刻度標(biāo)簽

D)參考區(qū)域

159.[單選題]表A為ADS中的普通表,列a為其中一個(gè)普通列,類(lèi)型為int,以下SQL()是正確的。

A)SELECTa+COUNT(*)FROMA

B)SELECTUDF_SYS_COUNT_COLUMN(a)FROMA

C)SELECTSUM(COUNT(*))FROMA

D)以上都正確

160.[單選題]下列關(guān)于Python文件處理的描述錯(cuò)誤的是()。

A)Python能處理jpg圖像文件

B)Python不可以處理PDF文件

OPython能處理CSV文件

D)Python能處理Excel文件

161.[單選題]在空間維度上刻畫(huà)數(shù)據(jù)連續(xù)性是數(shù)據(jù)的()特點(diǎn)。

A)可關(guān)聯(lián)性

B)可溯源性

C)可理解性

D)可復(fù)制性

162.[單選題]()是指為最小化總體風(fēng)險(xiǎn),只需在每個(gè)樣本上選擇能使特定條件風(fēng)險(xiǎn)最小的類(lèi)別標(biāo)記。

A)支持向量機(jī)

B)間隔最大化

C)線性分類(lèi)器

D)貝葉斯判定準(zhǔn)則

163.[單選題]Flume中基于WAL(預(yù)寫(xiě)式日志W(wǎng)rite-AheadLog)實(shí)現(xiàn)ChanneI持久化的是?

A)JDBCChannel

B)KafkaChannel

C)MemoryChannel

D)FiIeChannel

164.[單選題]情感信息抽取不包括以下哪些方法?()

A)、基于命名實(shí)體識(shí)別的抽取方法

B)、基于重復(fù)段落的識(shí)別方法

0、基于語(yǔ)義角色標(biāo)注的抽取方法

D)、基于監(jiān)督學(xué)習(xí)抽取的學(xué)習(xí)方法

165.[單選題]下列的處理過(guò)程與RedUCe處理過(guò)程相似的是(一)0

A)Shuffle

B)Combiner

C)Partition

D)Map

166.[單選題]假設(shè)每個(gè)用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,

QueueA.minimum-userTimit-PerCent=24。則以下說(shuō)法錯(cuò)誤的是?

A)第3個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得33.33%的資源

B)第2個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得50%的資源

C)C第4個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得25%的資源

D)D第5個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得20%的資源

167.[單選題]CSV是一種通用的、相對(duì)簡(jiǎn)單的文件格式,被用戶、商業(yè)和科學(xué)廣泛應(yīng)用?,F(xiàn)在需要在

DEEP平臺(tái)中將多個(gè)字符串拼接成CSV格式的字符串。請(qǐng)選擇適用的數(shù)值轉(zhuǎn)換器:

A)Ceiling

B)CsvAssemble

C)CsnToString

D)TermExtract

168.[單選題]下面插入數(shù)據(jù)操作錯(cuò)誤的是()。-

A)INSERT數(shù)據(jù)表名VALUE(值列表)

B)INSERTINTO數(shù)據(jù)表名VALUES(值列表)

C)INSERT數(shù)據(jù)表名VALUES(值列表)

D)INSERT數(shù)據(jù)表名(值列表)

169.[單選題]執(zhí)行以下代碼段deffl(a,b=[]):b.append(a)returnbprint(fl(1,[2,3]))時(shí)

,輸出為()o

A)[1,2,3]

B)[1,3,2]

C)[3,2,1]

D)[2,3,1]

170.[單選題]在hadoop配置中yarn-site,xml作用是()

A)用于定義系統(tǒng)級(jí)別的參數(shù)

B)用于名稱(chēng)節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置

C)用于配置

D)配置

171.[單選題]當(dāng)(_)過(guò)高,會(huì)出現(xiàn)欠擬合現(xiàn)象

A)偏差

B)方差

C)噪聲

D)泛化誤差

172.[單選題]YARN調(diào)度器分配資源的順序是:()o

A)任意機(jī)器一本地資源一同機(jī)架

B)任意機(jī)器一同機(jī)架一本地資源

C)本地資源一同機(jī)架一任意機(jī)器

D)同機(jī)架一任意機(jī)器一本地資源

173.[單選題]假設(shè)PreCiSiOn=TP/(TP+FP),recall=TP/(TP+FN),則在二分類(lèi)問(wèn)題中,當(dāng)測(cè)試集的正例

和負(fù)例數(shù)量不均衡時(shí),以下評(píng)價(jià)方案中()是相對(duì)不合理的。

A)Accuracy:(TP+TN)/all

B)F-value:2recallprecision/(recal!+precision)

C)G-mean:sqrt(precision*recall)

D)AUC:曲線下面積

174.[單選題]國(guó)網(wǎng)數(shù)據(jù)中臺(tái),是在下面()數(shù)據(jù)中心階段的基礎(chǔ)上發(fā)展過(guò)來(lái)的。

A)營(yíng)銷(xiāo)服務(wù)中心

B)全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心

C)海量歷史/實(shí)時(shí)數(shù)據(jù)中心

D)電網(wǎng)GlS數(shù)據(jù)中心

175.[單選題]執(zhí)行下列語(yǔ)句后的顯示結(jié)果是什么?>>>World="world"?>print"hello"+

world

A)helloworld

B)“hello"world

C)helloworld

D)語(yǔ)法錯(cuò)誤

176.[單選題]在MaPRedUCe中,以下描述錯(cuò)誤的有()。

A)WOrker缸故障和MaSter故障的處理方法不相同

B)Map和Reduce的處理結(jié)果都存儲(chǔ)在本地文件件統(tǒng)

C)一個(gè)WOrker發(fā)生故障時(shí),該節(jié)點(diǎn)上執(zhí)行完成的Map任務(wù)需要再次執(zhí)行

D)MapReduce具有很強(qiáng)的容錯(cuò)機(jī)制

177.[單選題]離線批處理方案的應(yīng)用場(chǎng)景不包括?

A)占用計(jì)算存儲(chǔ)資源多

B)快速高效,實(shí)時(shí)的數(shù)據(jù)處理

C)數(shù)據(jù)處理格式多樣

D)處理大規(guī)模數(shù)據(jù)

178.[單選題]Hive中distributeby和Sortby的功能結(jié)合的是()

A)orderby

B)sortby

C)distributeby

D)clusterby

179.[單選題]大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用不包括以下哪項(xiàng)?O

A)大數(shù)據(jù)驅(qū)動(dòng)的團(tuán)購(gòu)模式

B)利用大數(shù)據(jù)為用戶推薦消費(fèi)內(nèi)容

C)利用大數(shù)據(jù)調(diào)整線下門(mén)店布局

D)利用大數(shù)據(jù)控制消費(fèi)人群的口味喜好

180.[單選題]如果x=5.5,則表達(dá)式x>0andx==int(x)的運(yùn)算結(jié)果為;表達(dá)式x>0or

x==int(x)的運(yùn)算結(jié)果為?

A)TrUe、False

B)False,True

C)TrUe、True

D)False,False

181.[單選題]以下語(yǔ)句錯(cuò)誤的是()

A)selectsal+1fromemp;

B)selectsal*10,sal*deptnofromemp;

C)不能使用運(yùn)算符號(hào)

D)selectsal*10,deptno*10fromemp;

182.[單選題]在一個(gè)簡(jiǎn)單的線性回歸模型中(只有一個(gè)變量),如果將輸入變量改變一個(gè)單位

(增加或減少),那么輸出將改變()。

A)一個(gè)單位

B)不變

C)截距

D)回歸模型的尺度因子

183.[單選題]MaxCompute中負(fù)責(zé)對(duì)等待提交的task進(jìn)行排序的模塊是:()。

A)Worker

B)Executor

C)Scheduler

D)controller

184.[單選題]把圖像分割問(wèn)題與圖的最小割(mincut)問(wèn)題相關(guān)聯(lián)的方法是()。

A)基于圖論的分割方法

B)分水嶺算法

OSLIC算法

D)基于閾值的方法

185.[單選題]對(duì)于缺失值的處理中,不屬于數(shù)據(jù)補(bǔ)齊的是()

A)熱卡填充

B)期望值最大化方法

C)人工填寫(xiě)

D)隨機(jī)補(bǔ)充

186.[單選題]從數(shù)據(jù)庫(kù)架構(gòu)設(shè)計(jì)來(lái)看,主要有以下哪些設(shè)計(jì)思路?

A)Shared-Disk

B)Shared-Everying

C)Shared-Nothing

D)以上全都正確

187.[單選題]下列選項(xiàng)中,若是哪個(gè)節(jié)點(diǎn)關(guān)閉了,就無(wú)法訪問(wèn)HadooP集群()。

A)namenode

B)datanode

C)secondarynamenode

D)yarn

188.[單選題]現(xiàn)階段的大數(shù)據(jù)技術(shù)體系主要類(lèi)型不包括()。

A)數(shù)據(jù)源與App

B)基礎(chǔ)設(shè)施

OHadoop

D)D.數(shù)據(jù)資源

189.[單選題]下面()表示日期和時(shí)間的數(shù)據(jù)類(lèi)型。--

A)DECIMAL(6,2)

B)DATE

OYEAR

D)TIMESTAMP

190.[單選題]在DlKW金字塔中屬于未來(lái)的是(一)。

A)信息

B)數(shù)據(jù)

C)知識(shí)

D)智慧

191.[單選題]下列選項(xiàng)中適合MapReduce的場(chǎng)景有?

A)實(shí)時(shí)交互計(jì)算

B)迭代計(jì)算

C)流式計(jì)算

D)離線計(jì)算

192.[單選題]綜合類(lèi)大數(shù)據(jù)應(yīng)用管理主要包括應(yīng)用需求、分析應(yīng)用和O,由互聯(lián)網(wǎng)部統(tǒng)一組織開(kāi)

展。

A)數(shù)據(jù)安全

B)成果管理

C)商務(wù)拓展

D)推廣應(yīng)用

193.[單選題]大數(shù)據(jù)的起源是()。

A)金融

B)電信

C)互聯(lián)網(wǎng)

D)公共管理

194.[單選題]()表達(dá)了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達(dá)到的期望泛化誤差的下界,即刻畫(huà)了學(xué)習(xí)問(wèn)

題本身的難度。

A)偏差

B)方差

C)噪聲

D)泛化誤差

195.[單選題]在多元線性回歸模型中,若某個(gè)解釋變量對(duì)其余解釋變量的判定系數(shù)接近于1,則表明

模型中存在()

A)異方差

B)嘈序列相關(guān)

C)多重共線性

D)高擬合優(yōu)皮

196.[單選題]下列哪一種不屬于Bl工具數(shù)據(jù)集的數(shù)據(jù)字段類(lèi)型?()

A)文本

B)數(shù)值

C)日期

D)整型

197.[單選題]數(shù)據(jù)科學(xué)是一門(mén)以“數(shù)據(jù)”,尤其是“大數(shù)據(jù)”為研究對(duì)象,并以數(shù)據(jù)統(tǒng)計(jì)、機(jī)器學(xué)

習(xí)、數(shù)據(jù)可視化等為理論基礎(chǔ),主要研究數(shù)據(jù)加工、數(shù)據(jù)管理、數(shù)據(jù)計(jì)算等活動(dòng)的(一)o

A)新興科學(xué)

B)交叉性學(xué)科

C)獨(dú)立學(xué)科

D)一整套知識(shí)體系

198.[單選題]在計(jì)算擬合曲線時(shí),如果擬合曲線始終沒(méi)有收斂,應(yīng)調(diào)整哪個(gè)參數(shù)?

A)增加迭代步數(shù)

B)減少迭代步數(shù)

C)增大收斂系數(shù)

D)減小收斂系數(shù)

199.[單選題]SQL語(yǔ)言的數(shù)據(jù)操縱語(yǔ)句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也

是使用最頻繁的語(yǔ)句是()。

A)UPDATE

B)SELECT

C)DELETE

D)INSERT

200.[單選題]下列算法中,()更適合做時(shí)間序列建模。

A)CNN

B)決策樹(shù)

C)LSTM

D)貝葉斯算法

201.[單選題]s=On=int(input())foriinrange(1,n+1):al=0forjinrange(1,i+

1):al+=ja=1.0/als+=aprint("s=%.If"%S)當(dāng)輸入的n為4時(shí),輸出S=()。

A)l.5

B)1.4

01.6

D)l.7

202.[單選題]以下可以在字符串中表示單引號(hào)的是()。-

A)?"

B)??'

C)?'

D)'

203.[單選題]Spark的技術(shù)架構(gòu)中,SPark核心層的作用是什么?

A)資源管理

B)提供內(nèi)存計(jì)算框架

C)提供面向特定類(lèi)型的計(jì)算服務(wù)

D)分布式數(shù)據(jù)存取

204.[單選題]神經(jīng)網(wǎng)絡(luò)研究屬于下列O學(xué)派

A)符號(hào)主義

B)連接主義

C)行為主義

D)都不是

205.[單選題]使用似然函數(shù)的目的是()。

A)求解目標(biāo)函數(shù)

B)得到最優(yōu)數(shù)據(jù)樣本

C)找到最適合數(shù)據(jù)的參數(shù)

D)改變目標(biāo)函數(shù)分布

206.[單選題]如果要將讀寫(xiě)位置移動(dòng)到文件開(kāi)頭,需要使用的命令是()。

A)close

B)seek(0)

C)truncate

D)write(1stuff')

207.[單選題]FusionInsightHD中LOader從SFTP服務(wù)器導(dǎo)入文件,如果不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)

換且速度最快,選擇下面哪個(gè)文件類(lèi)型?

A)test_file

B)sequence_file

C)binary_file

D)graph_file

208.[單選題](_)在劃分屬性時(shí)是在當(dāng)前結(jié)點(diǎn)的屬性集合中選擇一個(gè)最優(yōu)屬性。

A)AdaBoost

B)RF

C)Bagging

D)傳統(tǒng)決策樹(shù)

209.[單選題]以下哪些情景可以使用機(jī)器學(xué)習(xí)技術(shù)?O

A)記錄過(guò)去一段時(shí)間內(nèi)某移動(dòng)運(yùn)營(yíng)商客戶轉(zhuǎn)移到競(jìng)爭(zhēng)對(duì)手的案例

B)統(tǒng)計(jì)電商網(wǎng)站某類(lèi)別商品在一定時(shí)間內(nèi)的銷(xiāo)量均值

C)統(tǒng)計(jì)某零售超市一個(gè)月內(nèi)哪類(lèi)牛奶的銷(xiāo)量最大

D)為攜程在線旅游公司的客戶推薦度假產(chǎn)品

210.[單選題]下列不是數(shù)據(jù)科學(xué)項(xiàng)目的主要角色()。

A)項(xiàng)目發(fā)起人

B)項(xiàng)目經(jīng)理

C)操作員

D)驗(yàn)收人員

211.[單選題]Python運(yùn)算符中用來(lái)計(jì)算集合并集的是()。

A)l

B)&

Oll

D)+

212.[單選題]以下選項(xiàng)哪個(gè)是MapReduce正確的運(yùn)行模型()

?)Reduce-Map-Shuffie

B)Shuffle-Map-Reduce

C)Map-Shuff1e-Reduce

D)Map-Reduce-Shuffie

213.[單選題]下列哪一種命令格式是不正確的()

?)get表行健列族

B)scan表時(shí)間戳起始行健結(jié)束行健

C)alter表列族

D)put表行鍵列族:列值

214.[單選題]關(guān)于計(jì)算機(jī)技術(shù)的描述以下正確的是,:

A)計(jì)算機(jī)是革命性技術(shù)

B)計(jì)算機(jī)早于工業(yè)革命時(shí)代誕生

C)計(jì)算機(jī)運(yùn)行算法的時(shí)候跟CPU速度沒(méi)關(guān)系

D)計(jì)算機(jī)不能用來(lái)收集數(shù)據(jù)

215.[單選題]下列不屬于無(wú)監(jiān)督學(xué)習(xí)方法的是O

A)K-means

B)線性降維

C)DBSCAN

D)支持向量機(jī)

216.[單選題]以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過(guò)程域"數(shù)據(jù)戰(zhàn)略"。

A)數(shù)據(jù)戰(zhàn)略制定

B)嘈業(yè)務(wù)術(shù)語(yǔ)表

C)數(shù)據(jù)質(zhì)量評(píng)估

D)過(guò)程質(zhì)量保障

217.[單選題]優(yōu)化管理體系,實(shí)現(xiàn)管理模式從(_)向(_)轉(zhuǎn)變,向各級(jí)組織和業(yè)務(wù)賦能。

A)數(shù)據(jù)化,業(yè)務(wù)化

B)平臺(tái)化,集約化

C)條塊化,共享化

D)縱向貫通,橫向貫通

218.[單選題]namenode默認(rèn)的WebUl訪問(wèn)端口號(hào)是()

A)50070

B)50060

C)50050

D)50040

219.[單選題]()選擇成為支持向量機(jī)的最大變數(shù)

A)核函數(shù)

B)樣本空間

C)模型

D)算法

220.[單選題]下列描述說(shuō)法錯(cuò)誤的是?O

A)SeCUreCRT是一款支持SSH的終端仿真程序,它能夠在WindoWS操作系統(tǒng)上遠(yuǎn)程連接LinUX服務(wù)器執(zhí)

行操作。

B)HadOoP是一個(gè)用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及WindOWS系統(tǒng)上進(jìn)行

安裝使用。

C)VMware

D)SSH是一個(gè)軟件,專(zhuān)為遠(yuǎn)程登錄會(huì)話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。

221.[單選題]以下哪項(xiàng)用來(lái)分組()

A)ORDERBY

B)ORDEREDBY

C)GROUPBY

D)GROUPEDBY

222.[單選題]假設(shè)我們使用原始的非線性可分版本的SOft-SVM優(yōu)化目標(biāo)函數(shù)。我們可通過(guò)0來(lái)保證

得到的模型是線性可分離的。

A)C=O

B)C=1

C)C正無(wú)窮大

D)C負(fù)無(wú)窮大

223.[單選題]創(chuàng)建分支語(yǔ)句如下,CREATEORREPLACEPROCEDUREproccase,branch(pi_result

ininteger,pi_returnoutinteger)ASBEGINCASEpi_resultWHEN!THENpi_return;=

1:WHEN2THENpi_return:=3:WHEN3THENpireturn:5:WHEN6THENPi_return:-7:WHEN

7THENpi_return

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論