大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5-2023背題版_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5-2023背題版_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5-2023背題版_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5-2023背題版_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5-2023背題版_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

試題說明

本套試題共包括1套試卷

每題均顯示答案和解析

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5(500題)

大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案5

L[單選題]HDFS有一個gzip文件大小75MB,客戶端設(shè)置BloCk大小為64MB。當(dāng)運行Hiapreduce任務(wù)讀

取該文件時inputSPIit大小為?

A)64MB

B)75MB

C)一個map讀取64MB,另夕I—個map讀取IIMB

答案:B

解析:問inputSPIit輸入拆分的話:gzip算法不支持SPIit,Izo壓縮/解壓支持SPIit(需要建索引

,文件修改后需要重新建索引)

2.[單選題]從已知事實出發(fā),通過規(guī)則庫求得結(jié)論的產(chǎn)生式系統(tǒng)的推理方式是O

A)正向推理

B)反向推理

C)雙向推理

答案:A

解析:

3.[單選題IMapReduce框架提供了一種序列化機制,支持這種序列化的類能夠在MaP和RedUCe過程中

充當(dāng)鍵或值,以下說法錯誤的是?

A)實現(xiàn)Writable接口的類是值

B)實現(xiàn)WritabIeCOmParable接口的類可以是值或鍵

C)HadooP的基本類型TeXt并不實現(xiàn)WritableCOmParabIe接口

D)鍵和值的數(shù)據(jù)類型可以超出HadOoP自身支持的基本類型

答案:A

解析:

4.[單選題]以下哪一項屬于非結(jié)構(gòu)化數(shù)據(jù)。

A)企業(yè)ERP數(shù)據(jù)

B)財務(wù)系統(tǒng)數(shù)據(jù)

C)視頻監(jiān)控數(shù)據(jù)

D)日志數(shù)據(jù)

答案:C

解析:

5.[單選題]下列哪個HDFS命令可用于檢測數(shù)據(jù)塊的完整性

A)hdfsfsck/

B)hdfsfsck/-delete

C)hdfsdfsadmin-report

D)hdfsbalancer-thresheld1

答案:A

解析:

6.[單選題]以下代碼的執(zhí)行結(jié)果a,b,c分別是Oa=[[]]*5a[0].append(l)b=[[]foriin

range(5)]b[0].append(1)c=[□*5]c[0].append(1)

A)a:[[U,L],L],n,[]]b:[[1],LlL[1],[1L[l]]c[[1]J

B)a:[[1],Ll],[1],[1],[l]]b:[[1],□,□,□,[]]c[[ιu

C)a:LEU,[],L],E],L]]b:[[1],[1L[1],[1],[ι]]c[⑴,□,□,□,□]

D)a:[[1],[],[],□,[]]b:[[1].[1],[1],[1],[l]]c[[1],[1],[1],[1],[1]]

答案:B

解析:

7.[單選題]假設(shè)我們有由三次多項式回歸產(chǎn)生的數(shù)據(jù)(三次多項式完美契合數(shù)據(jù)),下列說法哪些

是對的?L簡單線性回歸有高偏差和低方差2.簡單線性回歸有低偏差和高方差3.三次多項式有低偏

差和高方差4.三次多項式有低偏差和低方差

A)I和4

B)I和3

C)2和3

D)2和4

答案:A

解析:

8.[單選題]在MySQL中,建立數(shù)據(jù)庫用()

A)CREATETABLE命令

B)CREATETRlGGER命令

OCREATEINDEX命令

D)CREATEDATABASE命令

答案:D

解析:

9.[單選題]()是指給目標(biāo)用戶產(chǎn)生的錯誤或不準(zhǔn)確的視覺感知,而這種感知與數(shù)據(jù)可視化者的意圖或

數(shù)據(jù)本身的真實情況不一致。

A)視覺假象

B)視覺認(rèn)知

C)視覺感知

D)數(shù)據(jù)可視

答案:A

解析:視覺假象(ViSUalIlUSiOn)是數(shù)據(jù)可視化工作中不可忽略的特殊問題。視覺假象是指給目標(biāo)用

戶產(chǎn)生的錯誤或不準(zhǔn)確的視覺感知,而這種感知與數(shù)據(jù)可視化者的意圖或數(shù)據(jù)本身的真實情況不一致

10.[單選題]下列對于錯誤率的公式,解釋正確的是(_)。

A)統(tǒng)計分類器預(yù)測出來的結(jié)果與真實結(jié)果不相同的個數(shù),然后除以總的樣例集D的個數(shù)。

B)先統(tǒng)計分類正確的樣本數(shù),然后除以總的樣例集D的個數(shù)。

C)預(yù)測為正的樣例中有多少是真正的正樣例

D)樣本中的正例有多少被預(yù)測正確

答案:A

解析:

IL[單選題]Redis中哪個命令是查看鍵的剩余生存時間?

A)ttl

B)expireat

C)persist

D)expire

答案:A

解析:

12.[單選題]SQL語法中內(nèi)部關(guān)聯(lián)的關(guān)鍵字是()

A)INNERJOIN

B)LEFTJOIN

OFULLJOIN

D)CROSSJOIN

答案:A

解析:

13.[單選題]下面描述錯誤是:()

A)“探針盒子”就是一款自動收集用戶隱私的產(chǎn)品

B)許多顧客在使用WiFi之后會收到大量的廣告信息,甚至自己的手機號碼也會被當(dāng)做信息進行多次

買賣

C)在免費上網(wǎng)的背后,其實也存在著不小的信息安全風(fēng)險,或許8一不小心,就落入了電腦黑客們

設(shè)計的WiFi陷阱之中

D)免費WlFl都是安全的,可以放心使用

答案:D

解析:

14.[單選題]HDFS默認(rèn)的當(dāng)前工作目錄是/user/$(JSER,fs.default,name的值需要在()配置文件內(nèi)

說明。

A)mapred-site.xml

B)core-site,xml

C)hdfs-site.xml

D)以上均不是

答案:B

解析:

15.[單選題]大數(shù)據(jù)不是要教機器像人一樣思考,相反,它是

A)把數(shù)學(xué)算法運用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性

B)被視為人工智能的一部分

C)被視為一種機器學(xué)習(xí)

D)預(yù)測與懲罰

答案:A

解析:

16.[單選題]scipy.stats()函數(shù)不能求()o

A)均值

B)方差

C)峰度

D)眾數(shù)

答案:D

解析:stats作為一個函數(shù)可以返回均值、方差、(費舍爾)偏態(tài)、(費舍爾)峰度等值,不包括

眾數(shù)等值。

17.[單選題]DataX是阿里集團發(fā)起的開源項目,是一種離線數(shù)據(jù)同步的工具,支持多種異構(gòu)數(shù)據(jù)源

之間的高效數(shù)據(jù)同步,DataX任務(wù)配置文件使用()。

A)xml

B)java

C)bson

D)json

答案:D

解析:

18.[單選題]大數(shù)據(jù)平臺Hadoop的組件中,提供分布式協(xié)作服務(wù)的組件是()

A)HBase

B)ZooKeeper

C)Sqoop

D)Hive

答案:B

解析:

19.[單選題]()是交叉驗證法的一種特例

A)自助法

B)留一法

C)交叉驗證法

D)錯誤率分析

答案:B

解析:

20.[單選題[StructuredStreaming不支持以下哪種計算時間?

A)處理時間

B)事件時間

C)結(jié)束時間

D)注入時間

答案:C

解析:

21.[單選題]hadoop中什么類提供了連接到HDFS系統(tǒng)并執(zhí)行文件操作的基本功能()

A)FSDirectory

B)DFSClient

C)ClientProtocol

D)FSInputStream

答案:B

解析:A、FSDirectory【HDFS文件系統(tǒng)的整個命名空間是通過FSDireCtory類來管理的】

B、DFSCIientIDFSClient會連接到HDFS,對外提供管理文件/目錄、讀寫文件以及管理與配置

HDFS系統(tǒng)等功能?!?/p>

C、ClientProtocol【這個接口中有兩類方法,一是操縱命名空間的方法,二是操縱文件流的方法】

D、FSInPUtStreanl【在FSlnPUtStream類中,通過Seekable接口的seek()方法實現(xiàn)了

PoSitiOnedReadabIe接口中的read。方法】

22.[單選題]對數(shù)組中的某個元素進行修改時,計算機對其的操作是(_)。

A)復(fù)制該數(shù)組后再修改

B)直接在原數(shù)組中修改

C)修改該數(shù)組后再復(fù)制

D)刪除該數(shù)組后,重新創(chuàng)建

答案:B

解析:

23.[單選題]下列關(guān)于數(shù)據(jù)整合和分組的說法不正確的是()。

A)數(shù)據(jù)連接可以用concat或merge函數(shù)

B)axis=l表示軸向連接

C)數(shù)據(jù)分組可以使用mean函數(shù)

D)使用agg可以自定義多個聚合函數(shù)

答案:C

解析:數(shù)據(jù)分組不可以使用mean函數(shù),mean函數(shù)為求平均數(shù)函數(shù)。

24.[單選題]以下選項不包含在DlKW金字塔中的是()。

A)信息

B)數(shù)值

C)知識

D)智慧

答案:B

解析:

25.[單選題]()不是長短時記憶神經(jīng)網(wǎng)絡(luò)蘭個門中的一個門

A)輸入門

B)輸出門

C)遺忘門

D)進化門

答案:D

解析:

26.[單選題]規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指

的是()。

A)大數(shù)據(jù)

B)貧數(shù)據(jù)

C)富數(shù)據(jù)

D)繁數(shù)據(jù)

答案:A

解析:

27.[單選題]大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)中的角色(Role)是一組訪問權(quán)限的集合。

當(dāng)需要讀一組用戶賦予相同的權(quán)限時,可以使用角色來授權(quán)?;诮巧氖跈?quán)可以大大簡化授權(quán)流

程,降低授權(quán)管理成本,當(dāng)需要對用戶授權(quán)時,應(yīng)當(dāng)優(yōu)先考慮是否應(yīng)該使用角色來完成。關(guān)于角色

的說法中正確的是:()。

A)可以將OWner視為一個角色,賦給其他用戶

B)Admin是項目空間自動創(chuàng)建的角色,可以為該角色添加權(quán)限

C)刪除一個角色時,會先檢查該角色內(nèi)是否還存在其他用戶。若存在,則刪除該角色失敗

D)創(chuàng)建完角色后,需要給角色添加權(quán)限,僅支持以AeL授權(quán)的方式添加

答案:C

解析:

28.[單選題]將內(nèi)存引用賦值給另一個變量的操作叫(_)。

A)深拷貝

B)指針

C)參數(shù)實例化

D)淺拷貝

答案:D

解析:

29.[單選題]安裝FusionInsightHD的Streaming組件是,Nimbus角色要求安裝幾個節(jié)點?

A)4

B)3

02

D)l

答案:C

解析:

30.[單選題]以下對VOIUme相關(guān)描述不正確的是()。

A)VoIUme是指數(shù)據(jù)量大

B)就目前而言,當(dāng)數(shù)據(jù)量達到拍字節(jié)以上時,一般稱為大數(shù)據(jù)

C)大數(shù)據(jù)時間分布是均勻的

D)數(shù)據(jù)量大是相對計算與存儲能力而定的

答案:C

解析:

31.[單選題]關(guān)于OLAP和01:凹的區(qū)別描述,不正確的是()。

A)0LP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù),它與OTP應(yīng)用程序不同

B)咱與OLP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對簡單的事務(wù)

OOLP的特點在于事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高

D)OLP是以數(shù)據(jù)倉庫為基礎(chǔ)的,但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面

對的用戶是相同的

答案:C

解析:

32.[單選題]在Python中,下面哪些對列表的描述是錯誤的?。

A)列表中的一項叫做元素。

B)列表被創(chuàng)建后,還可以修改其中的元素。

C)索引被用于標(biāo)識某個元素在列表中的位置,列表的索引從0開始

D)列表是一系列元素組成的序列,在一個列表中,元素的類型必須相同。

答案:D

解析:

33.[單選題]大數(shù)據(jù)時代()

A)不允許不精確的數(shù)據(jù)

B)允許不精確的數(shù)據(jù)

C)為精確可以犧牲效率

D)只要因果數(shù)據(jù)

答案:B

解析:

34.[單選題]下列關(guān)于在回歸分析中解釋變量與非解釋變量的說法正確的是()。

A)解釋變量和被解釋變量都是隨機變量

B)解釋變量為非隨機變量,被解釋變量為隨機變量

C)解釋變量和被解釋變量都為非隨機變量

D)解釋變量為隨機變量,被解釋變量為非隨機變量

答案:B

解析:在回歸分析中,解釋變量可以理解為自變量,具有確定性,因此為非隨機變量;被解釋變量

可以理解為因變量,具有隨機性,因此為隨機變量。

35.[單選題]關(guān)系型數(shù)據(jù)庫最多可以創(chuàng)建。個只讀實例

A)5

B)4

03

D)2

答案:A

解析:

36.[單選題]下列敘述正確的是()。

A)continue語句的作用是結(jié)束整個循環(huán)的執(zhí)行

B)只能在循環(huán)體內(nèi)使用break語句

C)在循環(huán)體內(nèi)使用break語句或continue語句的作用相同

D)從多層循環(huán)嵌套中退出時,只能使用goto語句

252

答案:B

解析:eontinue語句可以跳過循環(huán)的當(dāng)前一步,故AC錯;Python沒有g(shù)oto語句。

37.[單選題]未來二十年就是()為王的時代。

A)文化

B)工業(yè)

C)數(shù)據(jù)

D)農(nóng)業(yè)

答案:C

解析:

38.[單選題]執(zhí)行以下代碼段defdescribe_pet(animal_type,pet_name):print("Ihavea"+

animal_type+".")print("My"+animal_type+"'snameis"+pet_name.title()+

1

".")describepet(petname='harry,animaltype='hamster')時,輸出為()o

A)Ihaveaharry.Myharry1snameisHarry.

B)Ihaveaharry.Myharry'snameisHamster.

C)Ihaveahamster.Myhamster'snameisHamster.

D)Ihaveahamster.Myhamster'snameisHarry.

答案:D

解析:

39.[單選題]S市A,B共有兩個區(qū),人口比例為3:5,據(jù)歷史統(tǒng)計A的犯罪率為0.01%,B區(qū)為

0.015%,現(xiàn)有一起新案件發(fā)生在S市,那么案件發(fā)生在A區(qū)的可能性有多大?(—)

A)0.375

B)0.268

O0.286

D)0.261

答案:C

解析:

40.[單選題]大數(shù)據(jù)計算服務(wù)中,臨時數(shù)據(jù)表tmp_item是一張非分區(qū)表,開發(fā)人員在建表時指定了

IifeCyCle屬性為30,且使用一次后未再進行任何操作和訪問。30天后這張表會()。

A)tmp_item會被自動重命名為deleted

B)tmpitem表會被自動刪除掉

C)不會任何變更

D)tmpitem中的數(shù)據(jù)會被清空,表結(jié)構(gòu)仍存在

答案:B

解析:

41.[單選題]數(shù)據(jù)中臺定位于為各專業(yè)提供數(shù)據(jù)共享和分析應(yīng)用服務(wù),以。為基礎(chǔ),根據(jù)數(shù)據(jù)共享

和分析應(yīng)用的需求,沉淀共性數(shù)據(jù)服務(wù)能力,通過數(shù)據(jù)服務(wù)滿足各類需求,支撐前端應(yīng)用和業(yè)務(wù)中

臺服務(wù)構(gòu)建。

A)業(yè)務(wù)中臺

B)企業(yè)中臺

C)全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心

D)物聯(lián)管理平臺

答案:C

解析:

42.[單選題]MapReduce對map()函數(shù)的返回值進行處理后再返回給自reduce()函數(shù)的目的是(

)。

A)減少map()函數(shù)和reduce()函數(shù)之間的數(shù)據(jù)傳輸

B)優(yōu)化map()函數(shù)

C)優(yōu)化reduce()函數(shù)

D)這一步驟并無必要

答案:A

解析:

43.[單選題]使用下面哪個命令來檢查HDFS所有進程的狀態(tài)()

A)jps

B)fsck

C)distcp

D)hadoop

答案:A

解析:

44.[單選題]()在訓(xùn)練的每一輪都要檢查當(dāng)前生成的基學(xué)習(xí)器是否滿足基本條件。

A)支持向量機

B)Boosting算法

C)貝葉斯分類器

D)Bagging算法

答案:B

解析:

45.[單選題]下列關(guān)于聚類挖掘技術(shù)的說法中,錯誤的是()

A)不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別

B)嘈要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小

C)要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小

D)與分類挖掘技術(shù)相似的是,都是要對數(shù)據(jù)進行分類處理

答案:B

解析:

46.[單選題]()提供的支撐技術(shù),有效的解決了大數(shù)據(jù)分析、研發(fā)的問題,比如:虛擬化技術(shù)、

并行計算、海量存儲及管理等。

A)點計算

B)云計算

C)面計算

D)線計算

答案:B

解析:

47.[單選題]下列哪一項是大數(shù)據(jù)技術(shù)領(lǐng)域的實施標(biāo)準(zhǔn)?

A)GoogleAPP

B)MapReduce

C)Hadoop

D)HDFS

答案:C

解析:

48.[單選題]如果想獲取一個序列內(nèi)最大數(shù)字會使用內(nèi)置函數(shù)

A)min

B)max

C)Ien

D)for

答案:B

解析:

49.[單選題]表達式int('101',2)的值為()。

A)5

B)6

C)"10"

D)3

答案:A

解析:二進制101等于十進制5o

50.[單選題]根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險預(yù)警信號管理辦法(試行)》,域外分行的黃色級信號

,轄內(nèi)支行管戶客戶經(jīng)理應(yīng)在接收到系統(tǒng)所推送信號2個工作日內(nèi)聯(lián)系客戶完成貸后預(yù)警信號核實工

作,限期O個工作日內(nèi)制定出針對性的處置措施。

A)l

B)B.3

C)C.5

D)D.10

答案:C

解析:

51.[單選題]下面if語句統(tǒng)計“成績(SCore)優(yōu)秀的男生以及不及格的男生”的人數(shù),正確的語句為。

O

A)If(gender=="男andscore=90):n+=l

B)If(gender=="男andscore=90):n+=l

C)If(gender=="男and(score=90)):n+=l

D)If(gender=="男orscore=90):n+=l

答案:C

解析:

52.[單選題]()不是神經(jīng)網(wǎng)絡(luò)的代表

A)卷積神經(jīng)網(wǎng)絡(luò)

B)遞歸神經(jīng)網(wǎng)絡(luò)

C)殘差網(wǎng)絡(luò)

D)XgbOoSt算法

答案:D

解析:

53.[單選題]在FUiSOnlnSightHD中,創(chuàng)建LOader作業(yè)的進行數(shù)據(jù)轉(zhuǎn)換的正確步驟是?

A)輸入設(shè)置,轉(zhuǎn)換,輸出

B)抽取,轉(zhuǎn)換,輸出

C)加載,轉(zhuǎn)換,輸出

D)加載,轉(zhuǎn)換,抽取

答案:A

解析:

54.[單選題]()是指數(shù)據(jù)減去一個總括統(tǒng)計量或模型擬合值時的殘余部分

A)極值

B)標(biāo)準(zhǔn)值

C)平均值

D)殘值

答案:D

解析:殘值在數(shù)理統(tǒng)計中是指實際觀察值與估計值(擬合值)之間的差。

55.[單選題]()用于說明在父RDD上執(zhí)行何種計算。

A)分區(qū)

B)算子

C)日志

D)數(shù)據(jù)塊

答案:B

解析:

56.[單選題]在PythOn3中有六個標(biāo)準(zhǔn)的數(shù)據(jù)類型,下面哪個不屬于?O

A)String(字符串)

B)Dictionary(字典)

C)Sets(集合)

D)Link(鏈表)

答案:D

解析:

57.[單選題]HBase的主HMaster是如何選舉的?

A)由RegionServer進行裁決

B)HMaster為雙主模式,不需要進行裁決

C)通過ZooKeeper進行裁決

D)隨機選舉

答案:C

解析:

58.[單選題]np.full_like()的作用是(一)。

A)創(chuàng)建形狀一樣但指定數(shù)值的矩陣

B)創(chuàng)建全1矩陣

C)創(chuàng)建對角矩陣

D)復(fù)制矩陣

答案:A

解析:

59.[單選題]以下哪些算法是基于規(guī)則的分類器(一)o

A)C4.5

B)KNN

OBayes

D)ANN

答案:A

解析:

60.[單選題]數(shù)據(jù)倉庫的最終目的是()。

A)收集業(yè)務(wù)需求

B)建立數(shù)據(jù)倉庫邏輯模型

C)開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析

D)為用戶和業(yè)務(wù)部門提供決策支持

答案:D

解析:

61.[單選題]下列關(guān)于數(shù)據(jù)科學(xué)流程與方法的描述中,錯誤的是()。

A)數(shù)據(jù)科學(xué)的基本流程包括數(shù)據(jù)化、數(shù)據(jù)加工(DataWrangling或DataMUnging)、數(shù)據(jù)規(guī),整化、

探索性分析、數(shù)據(jù)分析與洞見、結(jié)果展現(xiàn)以及數(shù)據(jù)產(chǎn)品的提供

B)對于數(shù)據(jù)形態(tài)不符合要求的亂數(shù)據(jù),要通過清洗成為規(guī)整數(shù)據(jù)

C)數(shù)據(jù)分析包括描述性分析、診斷性分析、預(yù)測性分析和規(guī)范性分析

D)數(shù)據(jù)可視,化會遇到視,覺假象問題,人眼對亮度和顏色的相對判斷容易造成視覺假象

答案:B

解析:

62.[單選題IFusionInsightHD系統(tǒng)中,哪個方法不能查看Loader作業(yè)執(zhí)行結(jié)果?

A)通過Ym任務(wù)管理查看

B)B通過LOaderUl界面查看

C)C通過manager的告警查看

D)D通過Nodemanager查看

答案:D

解析:

63.[單選題]AUC是衡量()模型優(yōu)劣的一種評價指標(biāo)

A)回歸

B)分類

C)二分類

D)聚類

答案:c

解析:

64.[單選題]執(zhí)行以下代碼段defdescribe_pet(animal_type,pet_name):print("Ihavea"+

animal_type+".")print("My"+animal_type+"'snameis"+pet_name.title()+

".")describepet('harry','hamster')時,輸出為()o

A)Ihaveaharry.Myharry1snameisHarry.

B)Ihaveaharry.Myharry'snameisHamster.

C)Ihaveahamster.Myhamster'snameisHamster.

D)Ihaveahamster.Myhamster'snameisHarry.

答案:B

解析:

65.[單選題]關(guān)于隨機森林和AdaBOoSt說法不正確的是

A)和AdaBOOSt相比,隨機森林對錯誤和離群點更魯棒

B)隨機森林準(zhǔn)確率不依賴于個體分類器的實例和他們之間的依賴性

C)隨機森林對每次劃分所考慮的屬性數(shù)很敏感

D)AdaBoOSt初始時每個訓(xùn)練元組被賦予相等的權(quán)重

答案:B

解析:

66.[單選題]Spark可以處理的數(shù)據(jù)任務(wù)包括()

A)數(shù)據(jù)批處理任務(wù)

B)準(zhǔn)實時處理任務(wù)

C)圖數(shù)據(jù)處理任務(wù)

D)A,B和C

答案:D

解析:

67.[單選題]()算法可以較好地避免樣本的不平衡問題。

A)KNN

B)SVM

C)Bayes

D)神經(jīng)網(wǎng)絡(luò)

答案:A

解析:KNN只是取了最近的幾個樣本點做平均,離預(yù)測數(shù)據(jù)較遠的訓(xùn)練數(shù)據(jù)對預(yù)測結(jié)

果不會造成影響,但是SVM,Bayes和KNN的每一個訓(xùn)練樣本結(jié)果都會對預(yù)測結(jié)果產(chǎn)生影響。

68.[單選題]ADS創(chuàng)建普通表時,關(guān)于UPdateTyPe屬性()說法是錯誤的。

A)合法的取值為realtime或者batch,該值不顯式指定時,默認(rèn)取batch

B)該值為realtime時,對應(yīng)的表必須指定合法的主鍵并且必須指定二級分區(qū)

C)通過該屬性指定數(shù)據(jù)的更新方式

D)該值為batch時,如果要支持增量導(dǎo)入,必須指定二級分區(qū)

答案:B

解析:

69.[單選題]對EIaStiCSearCh檢索流程描述正確的是()。

A)分片節(jié)點匯總結(jié)果發(fā)送給客戶端

B)檢索節(jié)點匯總結(jié)果發(fā)送給客戶端

C)檢索節(jié)點不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端

D)分片節(jié)點不需要匯總結(jié)果直接把結(jié)果發(fā)送給客戶端

答案:B

解析:

70.[單選題]關(guān)于“回歸(Regression)”和"相關(guān)(COrrelatiOn)”,下列說法正確的是()。

A)回歸和相關(guān)在自變量X和因變量y之間都是互為對稱的

B)回歸和相關(guān)在自變量X和因變量y之間都是非對稱的

C)回歸在自變量X和因變量y之間是非對稱的,相關(guān)在自變量X和因變量y之間是互為對稱的

D)回歸在自變量X和因變量y之間是對稱的,相關(guān)在自變量X和因變量y之間是非對稱的

答案:C

解析:

71.[單選題]下列關(guān)于數(shù)據(jù)交易市場的說法錯誤的是()。

A)數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物

B)商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場

C)數(shù)據(jù)交易市場通過生產(chǎn)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助

D)數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物

答案:C

解析:數(shù)據(jù)交易市場不生產(chǎn)數(shù)據(jù)。

72.[單選題]傳統(tǒng)數(shù)據(jù)處理的數(shù)據(jù)規(guī)模的單位是?

A)TB

B)EB

OPB

D)GB

答案:D

解析:

73.[單選題]下列描述中不屬于HDFS集群中的NameNode職責(zé)的是()。

A)維護HDFS集群的目錄樹結(jié)構(gòu)

B)維護HDFS集群的所有數(shù)據(jù)塊的分布、副本數(shù)和負載均衡

C)負責(zé)保存客戶端上傳的數(shù)據(jù)

D)響應(yīng)客戶端的所有讀寫數(shù)據(jù)請求

答案:C

解析:NameNode是HDFS的管理節(jié)點,DataNOde是HDFS集群的工作節(jié)點。所以用

戶上傳的數(shù)據(jù)是由DataNode進行保存的;NameNode負責(zé)保存用戶上傳的數(shù)據(jù)的元數(shù)據(jù)和維護

HDFS的抽象目錄樹結(jié)構(gòu),也會響應(yīng)客戶端的所有讀寫請求。

74.[單選題]對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,下列說法正確的是()。

A)需要將這些樣本全部強制轉(zhuǎn)換為支持向量

B)需要將這些樣本中可以轉(zhuǎn)化的樣本轉(zhuǎn)換為支持向量.不能轉(zhuǎn)換的直接刪除

C)移去或者減少這些樣本對分類結(jié)果沒有影響

D)以上都不對

答案:C

解析:支持向量機的一個重要性質(zhì):訓(xùn)練完成后,大部分的訓(xùn)練樣本都不需保留,最終模型僅與支持向

量有關(guān)。

75.[單選題]Spark通過什么來劃分不同的Stages?

A)Scheduler

B)Storage

C)RDD

D)Shuffle

答案:D

解析:

76.[單選題]Hive的查詢語言HQL(HiveSQL)支持()標(biāo)準(zhǔn),使得HQL非常類似SQL

A)SQL-90

B)SQL-91

C)SQL-92

D)SQL-93

答案:C

解析:

77.[單選題]大數(shù)據(jù)是指不用隨機分析法這樣的捷徑,而采用()的方法。

A)所有數(shù)據(jù)

B)部分?jǐn)?shù)據(jù)

C)少量數(shù)據(jù)

D)抽樣數(shù)據(jù)

答案:A

解析:大數(shù)據(jù)的一種表現(xiàn)形式為接近其總體的"所有數(shù)據(jù)

78.[單選題]以下不屬于馬爾可夫隨機場模型與條件隨機場模型的差別的是(一)。

A)馬爾可夫隨機場與條件隨機場都是無向圖模型

B)馬爾可夫隨機場是生成式模型,條件隨機場是判別式模型

C)馬爾可夫隨機場處理條件概率,條件隨機場處理聯(lián)合概率

D)馬爾可夫隨機場處理聯(lián)合概率,條件隨機場處理條件概率

答案:c

解析:

79.[單選題]下列哪個語句在PythOn中是非法的?

Λ)x=y=z=1

B)x=(y=z+1)

C)x,y=y,X

D)x+=y

答案:B

解析:

80.[單選題]以下圖像分割方法中,屬于基于圖像灰度分布的閾值方法的是

A)區(qū)域合并、分裂法

B)最大類間、內(nèi)方差比法

O已知形狀的曲線檢測

D)區(qū)域生長法

答案:B

解析:

81.[單選題]在HiVe的查詢語句中,表示A按位取反正確的是()

A)#A

B)^A

C)#REF!

D)~A

答案:D

解析:

82.[單選題](__)在訓(xùn)練的每一輪都要檢查當(dāng)前生成的基學(xué)習(xí)器是否滿足基本條件。

A)支持向量機

B)BOoSting算法

C)貝葉斯分類器

D)神經(jīng)網(wǎng)絡(luò)

答案:B

解析:

83.[單選題]查看kafka某TOPiC的partition詳細信息時,使用如下那個命令?

A)bin/kakfa-topics.sh-create

B)bin/kakfa-topics,sh-delete

C)bin/kakfa-topics.sh-list

D)bin/kakfa-topics.sh-describe

答案:D

解析:

84.[單選題]線性模型中的權(quán)重W值可以看做各個屬性X的(_)。

A)正則化系數(shù)

B)對最終決策結(jié)果的“貢獻度”

C)高維映射

D)取值

答案:B

解析:

85.[單選題]HDFS默認(rèn)BlockSiZe的大小是O。

A)32MB

B)64MB

C)128MB

D)256M

答案:B

解析:

86.[單選題]scipy.stats中,()表示泊松分布。

A)gamma

B)poisson

C)binom

D)uniform

答案:B

解析:poission表示泊松分布。

304

87.[單選題]下面哪個色彩空間最接近人的視覺系統(tǒng)的特點()。

A)RGB空間

B)CMY空間

C)CMYK空間

D)HSl空間

答案:D

解析:

88.[單選題]人工智能研究的一項基本內(nèi)容是機器感知。以下列舉中的。不屬于機器感知的領(lǐng)域。

A)使機器具有視覺、聽覺、觸覺、味覺、嗅覺等感知能力。

B)讓機器具有理解文字的能力。

C)使機器具有能夠獲取新知識、學(xué)習(xí)新技巧的能力。

D)使機器具有聽懂人類語言的能力

答案:C

解析:

89.[單選題](_)是具有適應(yīng)性的簡單單元組成的廣泛并行互聯(lián)的網(wǎng)絡(luò)。

A)神經(jīng)系統(tǒng)

B)神經(jīng)網(wǎng)絡(luò)

C)神經(jīng)元

D)感知機

答案:B

解析:

90.[單選題]數(shù)據(jù)清洗的方法不包括()

A)缺失值處理

B)噪聲數(shù)據(jù)清除

C)一致性檢查

D)重復(fù)數(shù)據(jù)記錄處理

答案:D

解析:

91.[單選題]將一副圖像進行分割后,分割出的區(qū)域彼此之間()重疊

A)可以

B)不可以

C)根據(jù)任務(wù)需要確定是否可以

D)根據(jù)分割方法確定是否可以

答案:B

解析:

92.[單選題]我們常見的二維碼標(biāo)簽屬于物聯(lián)網(wǎng)架構(gòu)中的哪一層?

A)感知層

B)網(wǎng)絡(luò)層

C)處理層

D)應(yīng)用層

答案:A

解析:

93.[單選題IKafkaClusterMirroring工具可以實現(xiàn)以下哪些功能?

A)Kafka跨集群數(shù)據(jù)同步方案

B)Kafka單集群內(nèi)數(shù)據(jù)備份

OKafka但集群內(nèi)數(shù)據(jù)恢復(fù)

D)以上全不正確

答案:A

解析:

94.[單選題]下列關(guān)于LSTM的說法錯誤的是()。

A)LSTM中存在sigmoid函數(shù)

B)LSTM中存在tanh函數(shù)

OLSTM又稱長短時記憶網(wǎng)絡(luò)

D)RNN是LSTM的變種

答案:D

解析:LSTM在RNN基礎(chǔ)上進行了改進,能夠?qū)W習(xí)到長期依賴關(guān)系,是RNN的一個變種。

95.[單選題]下面關(guān)于大數(shù)據(jù)安全問題,描述錯誤的是:。

A)大數(shù)據(jù)的價值并不單純地來源于它的用途,而更多地源自其二次利用

B)對大數(shù)據(jù)的收集、處理、保存不當(dāng),會加劇數(shù)據(jù)信息泄露的風(fēng)險

C)大數(shù)據(jù)成為國家之向博弈的新戰(zhàn)場

D)大數(shù)據(jù)對于國家安全沒有產(chǎn)生影響

答案:D

解析:

96.[單選題]處理文本數(shù)據(jù),循環(huán)神經(jīng)網(wǎng)絡(luò)與前饋神經(jīng)網(wǎng)絡(luò)相比有()的優(yōu)點。

A)不會梯度消失

B)訓(xùn)練結(jié)果不會發(fā)散

C)不需要激活函數(shù)

D)可以接受有序的輸入序列

答案:D

解析:

97.[單選題]閱讀下面程序:list_demo=[1,2,l,3]nums=set(list_demo)foriinnums:

Print(i,end="")執(zhí)行的結(jié)果為()

A)1213

B)213

C)321

D)123

答案:D

解析:

98.[單選題]對分類任務(wù)來說,學(xué)習(xí)器從類別標(biāo)記集合中預(yù)測出一個標(biāo)記,最常見的結(jié)合策略是()

A)投票法

B)乎均法

C)學(xué)習(xí)法

D)排序法

答案:A

解析:

99.[單選題]以下語句不正確的是()

A)select*fromemp;

B)selectename,hiredate,salfromemp;

C)select*fromemporderdeptno;

D)select*fromwheredeptno=landsal<300;

答案:C

解析:

100.[單選題]將屬性縮放到一個指定的最大和最小值之間,這種預(yù)處理方法的好處是(__)。

A)對于方差非常小的屬性可以增強其穩(wěn)定性

B)維持稀疏矩陣中為0的條目

C)便于理解

D)以上都是

答案:D

解析:

101.[單選題]如果要清空文件,需要使用的命令是(—)。

A)close()

B)seek(0)

C)truncate()

D)write('stuff')

答案:C

解析:

102.[單選題]HBase交互模式中,顯示所有命名空間

A)show_namespace

B)showsnamespace

C)lists_namespace

D)listnamespace

答案:D

解析:

103.[單選題]下面關(guān)于數(shù)據(jù)產(chǎn)品開發(fā)相關(guān)描述正確的有(_)。

A)數(shù)據(jù)科學(xué)家的主要職責(zé)是“數(shù)據(jù)的管理”

B)數(shù)據(jù)科學(xué)家一定是科學(xué)家

C)“數(shù)據(jù)碼農(nóng)”可以勝任數(shù)據(jù)科學(xué)家

D)數(shù)據(jù)科學(xué)家是為解決現(xiàn)實世界中問題提供直接指導(dǎo)、依據(jù)或參考的高級專家

答案:D

解析:

104.[單選題]在SPark中,(—)是指RDD的每個分區(qū)都只被子RDD的一個分區(qū)所依賴。

A)子分區(qū)

B)父分區(qū)

C)寬依賴

D)窄依賴

答案:D

解析:

105.[單選題]下列哪個不屬于k-means算法的終止條件()

A)沒有(或最小數(shù)目)對象被重新分配給不同的聚類

B)沒有聚類中心再發(fā)生變化

C)誤差平方和局部最小

D)聚類中心聚集在一點

答案:D

解析:

106.[單選題]下面關(guān)于增強學(xué)習(xí)描述不正確的是(_)。

A)增強學(xué)習(xí)主要研究如何協(xié)助自治Agent的學(xué)習(xí)活動

B)增強學(xué)習(xí)基本思路是當(dāng)Agent在環(huán)境中做出每個動作時,施教者會提供獎賞或者懲罰信息,以表示

結(jié)果狀態(tài)的正確與否

C)增強學(xué)習(xí)中的Agent需要具備環(huán)境交互能力和自治能力

D)基于馬爾可夫決策不屬于增強學(xué)習(xí)

答案:D

解析:

107.[單選題]關(guān)于SeCOndaryNameNOde下面哪項是正確的()。

A)它是NameNOde的熱備

B)它對內(nèi)存沒有要求

C)它的目的是幫助NameNode合并編輯日志,減少NanIeNOde啟動時間

D)SecondaryNameNode應(yīng)與NameNOde部署到一個節(jié)點

答案:C

解析:

108.[單選題]有如下程序:y=6z=lambdax:x*yprint(z(8))程序的輸出結(jié)果是()。

A)14

B)24

048

D)64

答案:C

解析:

109.[單選題]長短時記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計用來解決的問題是()

A)傳統(tǒng)RNN存在的梯皮消失/爆炸問題

B)傳統(tǒng)RNN計算量大的問題

C)傳統(tǒng)RNN速度較慢的問題

D)傳統(tǒng)RNN容易過過擬合的問題

答案:A

解析:

110?[單選題]()在訓(xùn)練的每一輪都要檢查當(dāng)前生成的基學(xué)習(xí)器是否滿足基本條件

A)支持向量機

B)BOoSting算法

C)貝葉斯分類器

D)Bagging算法

答案:B

解析:

IlL[單選題]YARN中默認(rèn)的資源調(diào)度器是:()。

A)FlFO調(diào)度器

B)容量調(diào)度器

C)Fair調(diào)度器

D)以上全部是

答案:B

解析:

112.[單選題]以下哪個不是Storm的特點:()

A)可擴展性

B)可靠的消息處理

C)支持各種編程語言

D)復(fù)雜的APl

答案:D

解析:

113.[單選題]以下屬于PythonWeb開發(fā)框架第三方庫的是:

A)Django

B)Wheel

C)Pygame

D)WeRoBot

答案:A

解析:

114.[單選題]為數(shù)據(jù)表創(chuàng)建索引的目的是()

A)提高查詢的檢索性能

B)歸類

C)創(chuàng)建唯一索引

D)創(chuàng)建主鍵

答案:A

解析:

115.[單選題]假負率是指()

A)正樣本預(yù)劇結(jié)果數(shù)/正樣本實際數(shù)

B)被預(yù)測為負的正樣本結(jié)果數(shù)/正樣本實際數(shù)

C)被預(yù)測為正的負樣本結(jié)果數(shù)/負樣本實際數(shù)

D)負樣本預(yù)測結(jié)果數(shù)/負樣本實際數(shù)

答案:B

解析:

116.[單選題]下列關(guān)于云數(shù)據(jù)庫的描述,哪個是錯誤的?()

A)云數(shù)據(jù)庫是部署和虛擬化在云計算環(huán)境中的數(shù)據(jù)庫

B)云數(shù)據(jù)庫是在云計算的大背景下發(fā)展起來的一種新興的共享基礎(chǔ)架構(gòu)的方法

C)云數(shù)據(jù)庫價格不菲,維護費用極其昂貴

D)云數(shù)據(jù)庫具有高可擴展性、高可用性、采用多租形式和支持資源有發(fā)等特點

答案:C

解析:

117.[單選題]線性模型中的權(quán)重W值可以看做各個屬性X的O。

A)正則化系數(shù)

B)對最終決策結(jié)果的貢獻度

C)高維映射

D)取值

答案:B

解析:

118.[單選題]數(shù)據(jù)被稱為信息時代的“石油”,正在成為企業(yè)的核心資產(chǎn)。下列說法不正確的是

OO

A)企業(yè)應(yīng)更加重視大數(shù)據(jù)技術(shù)應(yīng)用推廣

B)企業(yè)需要培養(yǎng)和引進數(shù)據(jù)應(yīng)用人才

C)可以未經(jīng)許可任意使用其它企業(yè)的數(shù)據(jù)

D)核心數(shù)據(jù)必須通過加密備份等嚴(yán)密保護

答案:C

解析:

119.[單選題]下列哪一項關(guān)于極大似然估計(MLE)的說法是正確的?LMLE并不總是存在2.MLE一直

存在3.如果MLE存在,它可能不特異4.如果MLE存在,它一定是特異的

A)1和4

B)2和3

C)I和3

D)2和4

答案:C

解析:

120.[單選題]用機器代碼表示的數(shù)據(jù)庫模式稱為()

A)物理模式

B)邏輯模式

C)源模式

D)目標(biāo)模式

答案:D

解析:

121.[單選題]任何一個核函數(shù)都隱式地定義了一個()空間

A)希爾伯特空間

B)再生希爾伯特空間

C)再生按希爾伯特空間

D)歐式空間

答案:C

解析:

122.[單選題]ndarry對象的SiZe屬性表示(—)。

A)數(shù)組占用空間大小

B)數(shù)組每一維度的數(shù)量

C)數(shù)組中包含的元素個數(shù)

D)數(shù)組中的最大元素值

答案:C

解析:

123.[單選題]構(gòu)造了一個詞表:{1.“小明”2.“喜歡”3.“踢"4.“看"5.“足球”6.“籃

球”7.“電影”},利用上述詞表的索引號,文檔{小明喜歡踢足球}可以用一個7維向量表示

[(—)]?

A)l101001

B)l111111

OIIIIIOO

D)l110100

答案:D

解析:

124.[單選題]以下描述錯誤的是:

A)在終極的分析中,一切知識都是歷史

B)在抽象的意義下,一切科學(xué)都是數(shù)學(xué)

C)在理性的基礎(chǔ)上,所有的判斷都是統(tǒng)計學(xué)

D)在數(shù)據(jù)角度上,一切決策都是隨機的

答案:D

解析:

125.[單選題]不屬于判別式模型的是(

A)決策樹

B)BP神經(jīng)網(wǎng)絡(luò)

C)支持向量機

D)貝葉斯

答案:D

解析:

126.[單選題]Numpy是由誰開發(fā)的?

A)中國

B)美國

C)開源組織

D)日本

答案:C

解析:

127.[單選題]大數(shù)據(jù)參考架構(gòu)的水平軸和垂直軸分別為()。

A)信息(活動)價值鏈和信息技術(shù)價值鏈

B)信息技術(shù)價值鏈和信息(活動)價值鏈

C)信息交互價值鏈和信息技術(shù)價值鏈

D)信息(活動)價值鏈和信息交互價值鏈

答案:A

解析:

128.[單選題]執(zhí)行np.concatenated[[123][234]],[[345]]],axis=。)得到的結(jié)果是?

A)[[123][234][345]]

B)[[123345][234]]

C)[[123][234345]]

D)[[l23]L234]]

答案:A

解析:

129.[單選題]在有關(guān)數(shù)據(jù)倉庫測試,下列說法不正確的是:

A)在完成數(shù)據(jù)倉庫的實施過程中,需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)

測試

B)當(dāng)數(shù)據(jù)倉庫的每個單獨組件完成后,就需要對他們進行單元測試

C)系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試

D)在測試之前沒必要制定詳細的測試計劃

答案:D

解析:

130.[單選題IHashShuffleMagnage是(_)之前版本的默認(rèn)模式

A)Sparkl.1

B)Sparkl.2

C)Sparkl.3

D)Sparkl.4

答案:B

解析:

131.[單選題]銀行進行客戶購買力分析.首先獲取客戶歷史賬單,確定其中各項商品的計算權(quán)重,得

出每位客戶的購買力評分并存儲記錄。最后將結(jié)果以圖表顯示。請問該過程對應(yīng)于以下哪個項目數(shù)

據(jù)流程設(shè)計。

A)數(shù)據(jù)可視化->數(shù)據(jù)源->數(shù)據(jù)落地->數(shù)據(jù)處理

B)數(shù)據(jù)源->數(shù)據(jù)落地->數(shù)據(jù)處理->數(shù)據(jù)可視化

C)數(shù)據(jù)源->數(shù)據(jù)處理->數(shù)據(jù)落地->數(shù)據(jù)可視化

D)數(shù)據(jù)可視化->數(shù)據(jù)源->數(shù)據(jù)處理>數(shù)據(jù)荷地

答案:C

解析:

132.[單選題]下列哪個選項對批量數(shù)據(jù)處理組件的描述是不正確的?

A)HiVe:傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理

速度較慢。

B)MaPRedUCe:傳統(tǒng)批處理引擎,用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學(xué)習(xí)類批處理作業(yè),使用

廣泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。

OSparkSQL:新型SQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù).處理速度高效。

D)Spark:新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學(xué)習(xí)類批處理作業(yè),適

合海量數(shù)據(jù),處理速度高效。

答案:B

解析:

133.[單選題]下列關(guān)于計算機存儲容量單位的說法中,錯誤的是

A)1KB<1MB<1GB

B)基本單位是字節(jié)(Byte)

C)一個漢字需要一個字節(jié)的存儲空間

D)一個字節(jié)能夠容納一個英文字符

答案:C

解析:

134.[單選題]機械思維強調(diào)的是()

A)世界是確定的

B)世界是不確定的

C)世界是機械的

D)世界是智能的

答案:A

解析:

135.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,財務(wù)智能分析中的國資委行業(yè)標(biāo)準(zhǔn)值比對模

塊,通過選擇O期次,用戶可對企業(yè)財務(wù)報表進行切換,選擇需要與國資委績效標(biāo)準(zhǔn)值對比的財

務(wù)報表期次。

A)報表

B)B.對比企業(yè)規(guī)模

C)C.財務(wù)科目

D)D.財務(wù)指標(biāo)

答案:A

解析:

136.[單選題]下列關(guān)于數(shù)據(jù)倉庫隨時間變化的描述不正確的是()。

A)數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容

B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照

C)數(shù)據(jù)倉庫隨時間變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行重新綜合

答案:C

解析:一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的

查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。

137.[單選題]關(guān)于Hive建表基本操作,描述正確的是

A)一旦表建好,不可再修改表名

B)一旦表建好,不可再增加新列

C)創(chuàng)建外部表時需要制定external關(guān)鍵字

D)一旦表創(chuàng)建好,不可再修改列名

答案:C

解析:

138.[單選題]Python標(biāo)示注釋使用符號是以下哪個?

A)@

B)&

C)#

D)0

答案:C

解析:

139.[單選題](_)是將數(shù)據(jù)轉(zhuǎn)換為產(chǎn)品的藝術(shù)。

A)數(shù)據(jù)柔術(shù)

B)數(shù)據(jù)處理

C)數(shù)據(jù)加工

D)數(shù)據(jù)設(shè)計

答案:A

解析:

140.[單選題]()操作屬于預(yù)剪枝

A)信息增益

B)計算最好的特征切分點

C)巳限制樹模型的深度

D)可視,化樹模型

答案:C

解析:

141.[單選題]下列關(guān)于MaP/Reduce并行計算模型敘述正確的一項為O0

A)MaP/Reduce把待處理的數(shù)據(jù)集分割成許多大的數(shù)據(jù)塊

B)大數(shù)據(jù)塊經(jīng)MaP()函數(shù)并行處理后輸出新的中間結(jié)果

C)reduce()函數(shù)把多任務(wù)處理后的中間結(jié)果進行匯總

D)reduce階段的作用接受來自輸出列表的迭代器

答案:C

解析:

142.[單選題]在HadOoP生態(tài)系統(tǒng)中,()可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張數(shù)據(jù)庫表,并提供簡單的

查詢語言。

A)Pig

B)HBase

OHive

D)MapReduce

答案:C

解析:在HadoOP生態(tài)系統(tǒng)中,Hive可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張數(shù)據(jù)庫表,并提供簡單的查詢語

143.[單選題](?)是交叉驗證法的一種特例。

A)自助法

B)留一法

C)交叉驗證法

D)錯誤率分析

答案:B

解析:

144.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【

征信報告查詢管理】二級菜單,用戶可在此菜單下的O節(jié)點查看征信報告。

A)待處理的征信報告

B)B.審批中的征信報告

OC.審批批準(zhǔn)

D)D.審批否決

答案:C

解析:

145.[單選題]()認(rèn)為,大數(shù)據(jù)時代的數(shù)據(jù)管理目標(biāo)不一定理想和完美,一致性、可用性和分區(qū)容

錯性中的任何兩個特征的保證(爭取)可能導(dǎo)致另一個特征的損失(放棄)。

A)CAP理論

B)BASE原則

C)數(shù)據(jù)一致性理論

D)大數(shù)據(jù)法則

答案:A

解析:

146.[單選題]假如使用一個較復(fù)雜的回歸模型來擬合樣本數(shù)據(jù),使用Ridge回歸,調(diào)試正則化參數(shù)

入,來降低模型復(fù)雜度若入較大時,關(guān)于偏差(bias)和方差(VarianCe),下列說法正確的是()

A)若λ較大時,偏差減小,方差減小

B)若λ較大時,偏差減小,方差增大

C)若λ較太時,偏差增大,方差減小

D)若人較大時,偏差增大,方差增大

答案:C

解析:

147.[單選題]下列關(guān)于關(guān)鍵詞提取的說法錯誤的是()。

A)關(guān)鍵詞提取是指借用自然語言處理方法提取文章關(guān)鍵詞

B)TF-IDF模型是關(guān)鍵詞提取的經(jīng)典方法

C)文本中出現(xiàn)次數(shù)最多的詞最能代表文本的主題

D)這個問題涉及數(shù)據(jù)挖掘、文本處理、信息檢索等領(lǐng)域

答案:C

解析:只依靠文本中出現(xiàn)次數(shù)即詞頻所得到的關(guān)鍵詞有很大的不確定性,對于長度比較長的文本,這

個方法會有很大的噪聲,雖然它在文本中出現(xiàn)的次數(shù)最多,但它很可能在語料庫中出現(xiàn)的次數(shù)也很

高,所以單憑文本中出現(xiàn)次數(shù)最多這一個特性并不能準(zhǔn)確的代表文本的主題,所以C錯誤,選Co

148.[單選題]HDFS采用了什么模型?

A)分層模型

B)主從結(jié)構(gòu)模型

C)管道-過濾器模型

D)點對點模型

答案:B

解析:

149.[單選題]大數(shù)據(jù)的本質(zhì)是()。

A)洞察

B)采集

C)統(tǒng)計

D)聯(lián)系

答案:A

解析:

150.[單選題]我行《大數(shù)據(jù)應(yīng)用推動考核辦法》從O開始實施。

A)20170101

B)20170801

020180101

D)20180801

答案:D

解析:

151.[單選題]HBase來源于哪一項?O

A)TheGoogleFileSystem

B)MapReduce

OBigTable

D)Chubby

答案:C

解析:

152.[單選題]()指從“數(shù)據(jù)視角”提出問題、在“數(shù)據(jù)層次”上分析問題、”以數(shù)據(jù)為中心”解

決問題,以及將“數(shù)據(jù)”當(dāng)作決策制定的決定因素,提高決策制定的信度與效度。

A)、模型驅(qū)動型決策支持

B)、數(shù)據(jù)驅(qū)動型決策支持

C)、任務(wù)驅(qū)動型決策支持

D)、算法驅(qū)動型決策支持

答案:B

解析:

153.[單選題]()模式的變化意味著數(shù)據(jù)科學(xué)中所關(guān)注的數(shù)據(jù)計算的常見瓶頸、關(guān)注焦點、主要

矛盾和思維模式發(fā)生了根本性變化。

A)數(shù)據(jù)計算

B)、數(shù)據(jù)管理

C)、數(shù)據(jù)分析

D)、數(shù)據(jù)獲取

答案:A

解析:

154.[單選題]Hive查看數(shù)據(jù)庫命令是()

A)looktable;

B)showtable;

C)lookdatabases;

D)showdatabases;

答案:D

解析:

155.[單選題]以下不屬于數(shù)據(jù)治理工作的主要內(nèi)容的有(_)。

A)理解自己的數(shù)據(jù)

B)數(shù)據(jù)部門的建立

C)有效監(jiān)督與動態(tài)優(yōu)化

D)崗位工資的定義

答案:D

解析:

156.[單選題]對于HBaSeKeyVaIUe存儲模型描述不正確的是?

A)同一個Key值只能關(guān)聯(lián)個value

B)擁有時間戳類型等關(guān)鍵信息

C)KeyValUe具有特定的格式

D)時間戳來區(qū)分多個記錄版本

答案:A

解析:

157.[單選題IMaxCompute表中的列,不支持()數(shù)據(jù)類型。

A)Bigint

B)Double

OBoolean

D)Varchar

答案:D

解析:

158.[單選題]下列基本活動中不屬于數(shù)據(jù)產(chǎn)品開發(fā)工作之中需要特別注意的是()。

A)創(chuàng)造性設(shè)計

B)數(shù)據(jù)洞見

C)虛擬化

D)個性化描述

答案:D

解析:數(shù)據(jù)產(chǎn)品開發(fā)工作之中需要注意有創(chuàng)造性設(shè)計、數(shù)據(jù)洞見、虛擬化等基本活動。

159.[單選題]商品的()用于在搜索和瀏覽列表時更準(zhǔn)確的找到該商品。-

A)關(guān)鍵詞

B)描述

C)提示

D)詳情

答案:A

解析:

160.[單選題]對arr=np.arange(9).reshape(3,3),反轉(zhuǎn)二維數(shù)組arr的行進行的操作是

()O

A)arrL::-1]

B)arr[::-2]

C)arr[::1]

D)arr[::0]

答案:A

解析:使用arr[::-1]進行反轉(zhuǎn),當(dāng)只有一個參數(shù)代表索引行,若反轉(zhuǎn)列應(yīng)使用

ArrL:,::-11o

161.[單選題]int('12',16)的結(jié)果是(—)。

A)10

B)12

016

D)18

答案:D

解析:

162.[單選題]關(guān)于虛擬私有云(VPe)描述不對的是()

A)VPC支持專線接入

B)VPC的多個子網(wǎng)可以創(chuàng)建在同一Region內(nèi)的不同AZ中

C)可以通過安全組實現(xiàn)不同VPC之間的云主機互通

D)每個用戶可以創(chuàng)建多個VPC及子網(wǎng)

答案:C

解析:

163.[單選題]在下列算法中,對于缺失值敏感的模型為(—)。

A)隨機森林

B)邏輯回歸

C)C5.0

D)樸素貝葉斯

答案:B

解析:

164.[單選題]ZooKeePer的特點描述錯誤的是()。

A)復(fù)雜性

B)自我復(fù)制

C)順序訪問

D)高速讀取

答案:A

解析:ZooKeePer的設(shè)計目標(biāo)和特點包括簡單性、自我復(fù)制、順序訪問和高速讀取。

165.[單選題]()采用概率模型來表達聚類原型。

A)K均值算法

B)學(xué)習(xí)向量量化

C)高斯混合聚類

D)密度聚類

答案:C

解析:

166.[單選題]下面組件哪個是數(shù)據(jù)挖掘庫:O

A)Zookeeper

B)Mahout

OMySQL

D)HBase

答案:B

解析:

167.[單選題]以下哪項屬于FIUme的基本數(shù)據(jù)單位?

A)Object

B)Subject

C)Topic

D)Event

答案:D

解析:

168.[單選題]數(shù)據(jù)庫利用()進行死鎖檢測。

A)DAG

B)RPC

OWFG

D)DLC

答案:C

解析:

169.[單選題]在實驗集群的master節(jié)點使用jps命令查看進程時,終端出現(xiàn)以下哪項能說明

Hadoop主節(jié)點啟動成功?()

A)Namenode,Datanode,TaskTracker

B)Namenode,Datanode,SecondaryNameNode

C)Namenode,Datanode,HMaster

D)Namenode,JobTracker,SecondaryNameNode

答案:D

解析:

170.[單選題]matplotIib中的Iegend函數(shù)作用是什么()

A)設(shè)置標(biāo)簽文本

B)繪制網(wǎng)格線

C)標(biāo)示不同圖形的文本標(biāo)簽圖例

D)設(shè)置X軸的數(shù)值顯示范圍

答案:C

解析:

171.[單選題]下列關(guān)于氣泡圖的說法中,錯誤的是()

A)氣泡圖中氣泡的顏色是系統(tǒng)統(tǒng)一設(shè)置的,無法人為調(diào)整

B)氣泡大小的不同意味著所代表的的數(shù)值的不同

C)氣泡圖中的圖形形狀不一定是圓形

D)可以為每個氣泡打上標(biāo)簽使其展示的數(shù)值更加直觀化

答案:A

解析:

172.[單選題]在MaPRedUCe中,下面哪個數(shù)據(jù)流的順序是正確的O

A)InputFormat

B)Mapper

C)Combiner

D)Reducer

答案:A

解析:

173.[單選題]一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思維維度中的(

)。

A)定量思維

B)相關(guān)思維

C)因果思維

D)檢驗思維

答案:B

解析:《我們的大數(shù)據(jù)時代》一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思

維維度中的相關(guān)思維。

174.[單選題]下列論據(jù)中,體現(xiàn)“冷眼”看大數(shù)據(jù)的觀點是()

A)互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為

B)大數(shù)據(jù)醫(yī)療正在走進平民百姓

C)數(shù)據(jù)資產(chǎn)型企業(yè)前景光明

D)個人隱私泄露與信息安全擔(dān)憂

答案:D

解析:

175.[單選題]下列關(guān)于Numpy的簡單介紹不正確的是()。

A)Numpy(NumericalPython)是Python語言的一個擴展程序庫

B)支持大量的維度數(shù)組與矩陣運算

C)針對數(shù)組運算提供大量的數(shù)學(xué)函數(shù)庫

D)Numpy不開放源代碼

答案:D

解析:NUmPy是開源代碼庫。

278

176.[單選題]下面算法中屬于圖像銳化處理的是:Oo

A)低通濾波

B)加權(quán)平均法

C)高通濾波

D)中值濾波

答案:C

解析:

177.[單選題]當(dāng)需要將一個數(shù)組改變形狀時,應(yīng)使用numPy的哪個屬性?

A)shape()

B)reshape()

C)arrange()

D)array()

答案:B

解析:

178.[單選題]哪個產(chǎn)品適應(yīng)于OLAP場景?

A)PostgressQL

B)SQLServero

OMysQL

D)GaussDB200

答案:D

解析:

179.[單選題]從網(wǎng)絡(luò)的原理上來看,結(jié)構(gòu)最復(fù)雜的神經(jīng)網(wǎng)絡(luò)是()。

A)卷積神經(jīng)網(wǎng)絡(luò)

B)長短時記憶神經(jīng)網(wǎng)絡(luò)

OGRU

D)BP神經(jīng)網(wǎng)絡(luò)

答案:B

解析:

180.[單選題]以下關(guān)于HDFS適合做什么描述正確的是

A)低延遲讀取

B)大文件存儲

C)大量小文件存儲

D)隨機寫入

答案:B

解析:

181.[單選題]下列不屬于HiVe記錄中默認(rèn)分隔符()

A)?n

B)^A

C)^B

D)?r?n

答案:D

解析:

182.[單選題]()是Spark中的抽象數(shù)據(jù)模型。

A)RDD

B)Scheduler

C)Storage

D)Shuffle

答案:A

解析:RDD(ReSilientDiStribUtedDataSet)是Spark的抽象數(shù)據(jù)模型。Scheduler,Storage和

Shufle是Spark的關(guān)鍵技術(shù)。

183.[單選題]下面與HDFS類似的框架是O?

Λ)NTFS

B)FAT32

OGFS

D)EXT3

答案:C

解析:

184.[單選題]Hadoop的作者是下面哪一位()。

A)MartinFowler

B)Dougcutting

C)KentBeck

D)GraceHopper

答案:B

解析:

185.[單選題]最早被提出的循環(huán)神經(jīng)網(wǎng)絡(luò)門控算法是什么

A)長短期記憶網(wǎng)絡(luò)

B)門控循環(huán)單元網(wǎng)絡(luò)

C)堆疊循環(huán)神經(jīng)網(wǎng)絡(luò)

D)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)

答案:A

解析:

186.[單選題]多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()。

A)一對一

B)一對其余

C)一對多

D)多對多

答案:A

解析:多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略包括一對多、多對多、一對其余。

187.[單選題]在MaXCOmPUteSQL中,用于執(zhí)行顯示類型轉(zhuǎn)換的函數(shù)是:()。

A)CAST

B)CONCAT

c)τo

D)LIKE

答案:A

解析:

188.[單選題]以下關(guān)于HDFS適合做什么描述不正確的是?

A)流式數(shù)據(jù)讀取

B)大文件存儲與訪問

C)大數(shù)據(jù)量吞吐

D)低延遲讀取

答案:D

解析:

189.[單選題]求以下程序結(jié)果正確的是()L=CGoogle','Python','Taobao')print(L[-2])

print(L[l:])

A)Python',('Python','Taobao')

B)Google',CPython','Taobao')

C)Google''Python,

D),Taobao''Python,

答案:A

解析:

190?[單選題]SELECT語句的完整語法較復(fù)雜,但至少包括的部分是()

A)僅SELECT

B)SELECT,FROM

C)SELECT,GROUP

D)SELECT,INTO

答案:B

解析:

191.[單選題]python中,while的中止的關(guān)鍵字是O

A)continue

B)broken

C)break

D)plug

答案:C

解析:

192.[單選題]基于大數(shù)據(jù)的谷歌廣告體現(xiàn)的大數(shù)據(jù)思維方式是()

A)全樣而非抽樣

B)效率而非精確

C)相關(guān)而非因果

D)以數(shù)據(jù)為中心

答案:D

解析:

193.[單選題]下列關(guān)于數(shù)據(jù)重組的說法中,錯誤的是()。

A)數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集

B)數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒

C)數(shù)據(jù)重紐實現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成

D)數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新

答案:A

解析:

194.[單選題]如果PythOn程序中包括零運算,解釋器將在運行時拋出()錯誤信息。O

A)NameError

B)FiIeNotFoundError

C)SyntaxError

D)ZeroDivisionError

答案:D

解析:

195.[單選題]在Hadoo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論