大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10-2023練習(xí)版_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10-2023練習(xí)版_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10-2023練習(xí)版_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10-2023練習(xí)版_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10-2023練習(xí)版_第5頁(yè)
已閱讀5頁(yè),還剩103頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試題說(shuō)明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10(500題)

大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案10

L[單選題]Hadoop作者

A)MartinFowler

B)KentBeck

C)Dougcutting

2.[單選題]假設(shè)有n組數(shù)據(jù)集,每組數(shù)據(jù)集中,x的平均值都是9,x的方差都是11,y的平均值都是

7.50,X與y的相關(guān)系數(shù)都是0.816,擬合的線性回歸方程都是y=3.00+0.500xo那么這n組數(shù)據(jù)集()o

A)一樣

B)不一樣

C)無(wú)法確定是否一樣

3.[單選題]關(guān)于MaXComPUte類(lèi)型之間的類(lèi)型轉(zhuǎn)化,說(shuō)法不正確的是:()。

A)隱式類(lèi)型轉(zhuǎn)換是MaXCOmPUte依據(jù)上下文使用環(huán)境自動(dòng)進(jìn)行的類(lèi)型轉(zhuǎn)換

B)部分類(lèi)型之間不可以通過(guò)顯式的類(lèi)型轉(zhuǎn)換,但可以通過(guò)SQL的隱式轉(zhuǎn)換完成

C)不支持的隱式類(lèi)型轉(zhuǎn)換會(huì)導(dǎo)致異常

D)MaXCOmPUte支持的隱式類(lèi)型轉(zhuǎn)換規(guī)則與顯式轉(zhuǎn)換相同

4.[單選題]下列關(guān)于分布式數(shù)據(jù)庫(kù)的說(shuō)法中,錯(cuò)誤的是

A)分布式數(shù)據(jù)庫(kù)系統(tǒng)通常使用較小的計(jì)算機(jī)系統(tǒng)

B)分布式數(shù)據(jù)庫(kù)是物理上分散的數(shù)據(jù)庫(kù)

C)分布式數(shù)據(jù)庫(kù)是邏輯上統(tǒng)一的數(shù)據(jù)庫(kù)

D)每臺(tái)計(jì)算機(jī)中都一定有DBMS的一份完整拷貝副本

5.[單選題]通常會(huì)單獨(dú)購(gòu)買(mǎi)獨(dú)立設(shè)備組為其服務(wù)的行業(yè)是?O

A)電商行業(yè)

B)金融行業(yè)

C)視頻行業(yè)

D)新聞網(wǎng)站

6.[單選題]運(yùn)行下面代碼的輸出結(jié)果為()。

Importnumpyasnp

A=np.array([[3,7,5],[8,4,3],[2,4,9]])print(np.ptp(a))

A)[E3,7,5],[8,4,3],[2,4,9]]

B)7

C)[4,5,7]

D)[6,3,6]

7.[單選題]分類(lèi)模型評(píng)估指標(biāo)不包括O

A)Fl-score

B)平均絕對(duì)誤差

C)準(zhǔn)確率

D)ΛUC

8.[單選題]下列語(yǔ)句的輸出結(jié)果為()a=5b=4c=a+bprint("a+b=",c)

A)a=5

B)b=4

C)5+4=9

D)a+b=9

9.[單選題]當(dāng)上傳本地文件到QUiCkBl中做展現(xiàn)時(shí),數(shù)據(jù)被保存到了()。

A)QuickB自帶的探索空間

B)QuickBI自帶的MaXComPUte

OAnalyticDB

D)客戶端本地緩存

10.[單選題]HDFS配置數(shù)據(jù)文件存儲(chǔ)路徑(dfs.datanode.data,dir)的文件是哪一個(gè)?

A)hadoop-env.sh

B)core-site,xml

C)hdfs-site.xml

D)yarn-site,xml

IL[單選題]下列關(guān)于數(shù)據(jù)標(biāo)準(zhǔn)化的說(shuō)法中,不正確的是()

A)Z-SCore標(biāo)準(zhǔn)化適用于特征最大值和最小值未知,數(shù)據(jù)較分散的情況

B)聚類(lèi)算法要求數(shù)據(jù)集無(wú)量綱化

C)LogiStiC標(biāo)準(zhǔn)化函數(shù)。(x)滿足。(0)=1

D)Min-Max標(biāo)準(zhǔn)化易受離群值影響

12.[單選題]推動(dòng)多元化新興產(chǎn)業(yè)發(fā)展,重點(diǎn)發(fā)揮公司()企業(yè)優(yōu)勢(shì),聚集產(chǎn)業(yè)各方,構(gòu)建多方參與、

共商共建共贏的多元產(chǎn)業(yè)生態(tài)。

A)聚集型

B)共享型

C)樞紐型

D)計(jì)劃型

13.[單選題]下列函數(shù)中,用于沿著軸方向堆疊PandaS對(duì)象的是()。

A)concat()

B)join()

C)merge()

D)combinefirst()

14.[單選題]平均值很容易受()影響

A)平均值

B)定變值

C)極值

D)以上說(shuō)法都不對(duì)

15.[單選題]在Python中,變量的取名要遵循一定的規(guī)則,下列規(guī)則不正確的是()。

A)變量名要以字母、數(shù)字、下劃線命名,且不能以數(shù)字開(kāi)頭;

B)變量名不區(qū)分大小寫(xiě)

C)變量名不能有空格;

D)變量名能與Python中的內(nèi)置命令重復(fù),如if、while、for等不可以作為變量名;

16.[單選題]數(shù)據(jù)轉(zhuǎn)換器中日期類(lèi)型的使用用途正確的是()

A)DateDiff對(duì)應(yīng)用途是將時(shí)間類(lèi)型轉(zhuǎn)換為字符類(lèi)型

B)DateFOmat對(duì)應(yīng)用途是把一個(gè)日期值格式化為DateShire系統(tǒng)內(nèi)部統(tǒng)一格式

OStringToDateTime對(duì)應(yīng)用途是將字符串轉(zhuǎn)換為日期時(shí)間

D)FormatDate對(duì)應(yīng)用途為計(jì)算兩個(gè)日期之間的差

17.[單選題]以下關(guān)于知識(shí)圖譜,描述錯(cuò)誤的是:。

A)又稱(chēng)為科學(xué)知識(shí)圖譜

B)在圖書(shū)情報(bào)界稱(chēng)為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖

C)知識(shí)圖譜屬于密碼學(xué)研究范疇

D)知識(shí)圖譜可用于反欺詐、不一致性驗(yàn)證、組團(tuán)欺詐等公共安全保障領(lǐng)域

18.[單選題]大數(shù)據(jù)計(jì)算服務(wù)的開(kāi)發(fā)人員創(chuàng)建了日志表,并且導(dǎo)入了歷史數(shù)據(jù)后發(fā)現(xiàn)表的一個(gè)字段命

名拼寫(xiě)有錯(cuò)誤,可以采用()更正此問(wèn)題成本最低。

A)將原表重命名,然后建張正確的表,再導(dǎo)入歷史數(shù)據(jù)

B)在表的末尾新添加一個(gè)字段

C)刪除表后重建,然后重新導(dǎo)入歷史數(shù)據(jù)

D)通過(guò)alter命令重新命令該字段

19.[單選題]在MaPRedUCe的應(yīng)用程序開(kāi)發(fā)中,下列()JAVA類(lèi)負(fù)責(zé)管理和運(yùn)行一個(gè)計(jì)算任務(wù)。

A)lob

B)Context

OFileSystem

D)Configuration

20.[單選題]下列關(guān)于聚類(lèi)挖掘技術(shù)的說(shuō)法中,錯(cuò)誤的是()。

A)不預(yù)先設(shè)定數(shù)據(jù)歸類(lèi)類(lèi)目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類(lèi)別

B)要求同類(lèi)數(shù)據(jù)的內(nèi)容相似度盡可能小

C)要求不同類(lèi)數(shù)據(jù)的內(nèi)容相儀度盡可能小

D)與分類(lèi)挖據(jù)技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類(lèi)處理

21.[單選題]下列關(guān)于Logistic回歸和SVM的描述不正確的是()。

A)Logistic回歸本質(zhì)上是一種根據(jù)樣本對(duì)權(quán)值進(jìn)行極大似然估計(jì)的方法,用先驗(yàn)概率的乘積代替后

驗(yàn)概率

B)Logistic回歸的輸出就是樣本屬于正類(lèi)別的概率

OSVM的目標(biāo)是找到使得訓(xùn)練數(shù)據(jù)盡可能分開(kāi)且分類(lèi)間隔最大的超平面,屬于結(jié)構(gòu)風(fēng)險(xiǎn)最小化

D)SVM可以通過(guò)正則化系數(shù)控制模型的復(fù)雜度,避免過(guò)擬合

22.[單選題]以下哪項(xiàng)是SParkQ2x程序統(tǒng)一入口?0

A)StreamingContext

B)SaContext

C)HiveContext

D)SparkSession

23.[單選題]下面哪種不屬于池化操作()。

A)、連接池化

B)、一般池化

C)、重疊池化

D)、金字塔池化

24.[單選題]下列關(guān)于不確定性知識(shí)描述錯(cuò)誤的是()。

A)不確定性知識(shí)是不可以精確表示的

B)專(zhuān)家知識(shí)通常屬于不確定性知識(shí)

C)不確定性知識(shí)是經(jīng)過(guò)處理過(guò)的知識(shí)

D)不確定性知識(shí)的事實(shí)與結(jié)論的關(guān)系不是簡(jiǎn)單的“是”或“不是”。

25.[單選題]數(shù)據(jù)科學(xué)基本原則中,"基于數(shù)據(jù)的智能"的主要特點(diǎn)是()。

A)數(shù)據(jù)簡(jiǎn)單、但算法簡(jiǎn)單

B)數(shù)據(jù)復(fù)雜、但算法簡(jiǎn)單

C)數(shù)據(jù)簡(jiǎn)單、但算法復(fù)雜

D)數(shù)據(jù)復(fù)奈、但算法復(fù)雜

26.[單選題]下列說(shuō)法錯(cuò)誤的是()。

A)大數(shù)據(jù)是一種思維

B)大數(shù)據(jù)不僅僅是數(shù)的體量大

C)大數(shù)據(jù)的英文Iargedata

D)大數(shù)據(jù)會(huì)帶來(lái)機(jī)器智能

27.[單選題]作為技術(shù)人員,小王被MaXConIPUte強(qiáng)大的數(shù)據(jù)處理能力吸引,想去體驗(yàn)一下。他快速注

冊(cè)了一個(gè)阿里云帳號(hào),進(jìn)入官網(wǎng)后試圖創(chuàng)建一個(gè)名字為test_project的MaXConIPUteProjeCt,結(jié)果

沒(méi)有成功。分析,小王出錯(cuò)的最有可能的原因是:()。

A)帳號(hào)未充值,余額不足導(dǎo)致出錯(cuò)

B)帳號(hào)未開(kāi)通MaXCOnlPUte的使用權(quán)限

C)未創(chuàng)建合適的accesSlD和accesSKey

D)項(xiàng)目名字和現(xiàn)有的其他帳戶的名字重復(fù)

28.[單選題]在MaPRedUCe中,哪個(gè)組件是用戶不指定也不會(huì)有默認(rèn)的()。

A)Combiner

B)OutputFormat

C)Partitioner

D)InputFormat

29.[單選題]關(guān)系數(shù)據(jù)庫(kù)所謂的關(guān)系是指()

A)各記錄中的數(shù)據(jù)彼此有一定關(guān)聯(lián)

B)數(shù)據(jù)模型符合滿足一定條件的二維表格式

C)某兩個(gè)數(shù)據(jù)庫(kù)之間有一定的關(guān)系

D)表中兩個(gè)字段有一定的關(guān)系

30.[單選題]下面()子句專(zhuān)用于GroUPBy操作中的條件過(guò)濾功能。

A)WHERE子句

B)HAVING子句

C)LlMlT子句

D)ORDERBY子句

31.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,系統(tǒng)在【客戶信息管理】一級(jí)菜單下增加【征

信報(bào)告查詢管理】二級(jí)菜單,用戶可在此菜單下的【審批中的征信報(bào)告】節(jié)點(diǎn)中點(diǎn)擊O按鈕,完

成查看/下載征信查詢授權(quán)書(shū)動(dòng)作。

A)新增查詢

B)B.查看/下載授權(quán)書(shū)

C)C.取消申請(qǐng)

D)D.提交

32.[單選題]下列符號(hào)中,表示Python中單行注釋的是()。

A)#

B)//

C)D)”

33.[單選題]己知一組數(shù)據(jù)的協(xié)方差矩陣P,下面關(guān)于主分量說(shuō)法錯(cuò)誤的是()

A)主分量分析的最佳準(zhǔn)則是對(duì)一組數(shù)據(jù)進(jìn)行接一紐正交基分解,在只取相同數(shù)量分量的條件下,以

均方誤差計(jì)算截尾誤差最小

B)在經(jīng)主分量分解后,協(xié)方差矩陣成為對(duì)角矩陣

C)主分量分析就是K-L變換

D)主分量是通過(guò)求協(xié)方差矩陣的特征值得到

34.[單選題]哪個(gè)不是StrUetUredStreaming中OUtPUt可以定義的存儲(chǔ)方式?

A)UpdateMode

B)JDBCMode

C)CompleteMode

D)AppendMode

35.[單選題]GaussDB200在創(chuàng)建表時(shí),需要注意以下哪些事項(xiàng)O?

A)創(chuàng)建列存表之后,后續(xù)可以修改為行存表。

B)創(chuàng)建列存表時(shí)壓縮級(jí)別默認(rèn)為HlGH.

C)如果指定表空間為普通表空間,創(chuàng)建表時(shí)默認(rèn)是行式存儲(chǔ)。

D)創(chuàng)建行存表之后,后續(xù)可以修改為列存表。

36.[單選題]在HiVe的查詢語(yǔ)句中,表示A和B按位取或的是()

A)A∣B

B)A&B

OA-B

D)A~B

37.[單選題](一)是SPark中用來(lái)進(jìn)行圖計(jì)算的庫(kù)函數(shù)。

A)GraphX

B)SparkSQL

C)SparkStreaming

D)MlIib

38.[單選題]若用如下的SQL語(yǔ)句創(chuàng)建了一個(gè)表SC:()CREATETABLESC(S#CHAR(6)NOT

NULL,CttCHAR(3)NOTNULL,SCOREINTEGER,NOTECHAR(20));向SC表插入如下行時(shí),(

)行可以被插入。

A)(NULL,,103',80,'選修')

B)('200823,,'101',NULL,NULL)

C)('201132,,NULL,86,'')

D)(,201009,,'111,,60,必修)

39.[單選題]依據(jù)國(guó)網(wǎng)公司數(shù)據(jù)管理辦法,()是用來(lái)描述公司核心業(yè)務(wù)實(shí)體的數(shù)據(jù),是各業(yè)務(wù)應(yīng)用

和各系統(tǒng)之間進(jìn)行信息交互的基礎(chǔ)。

A)基礎(chǔ)數(shù)據(jù)

B)數(shù)據(jù)標(biāo)準(zhǔn)

C)參考數(shù)據(jù)

D)主數(shù)據(jù)

40.[單選題]大數(shù)據(jù)最顯著的特征是:

A)數(shù)據(jù)規(guī)模大

B)數(shù)據(jù)類(lèi)型多

C)數(shù)據(jù)分布廣

D)數(shù)據(jù)處理快

41.[單選題]有一個(gè)關(guān)系,課程目錄(課程號(hào),授課教師,所述專(zhuān)業(yè)),規(guī)定授課教師不能取空值,這一規(guī)

則屬于()

A)實(shí)體完整性約束

B)參照完整性約束

C)用戶自定義完整性約束

D)關(guān)鍵字完整性約束

42.[單選題]解決多重共線性的方法包括O

A)嶺回歸

B)主成分回歸

C)偏最小二乘回歸

D)以上都是

43.[單選題]下列哪項(xiàng)方法不屬于圖像分割方法Oo

A)邊緣檢測(cè)法

B)閾值分割法

C)區(qū)域分割法

D)特征提取法

44.[單選題]圖像的形態(tài)學(xué)處理方法包括()。

A)圖像增強(qiáng)

B)圖像銳化

C)圖像分割

D)腐蝕

45.[單選題]HDFS數(shù)據(jù)寫(xiě)入流程描述錯(cuò)誤的是?

A)業(yè)務(wù)應(yīng)用調(diào)用HDFSClient提供的API,請(qǐng)求寫(xiě)入文件。

B)業(yè)務(wù)調(diào)用ClOSe,flush后HDFSClient聯(lián)系NameNode,確認(rèn)數(shù)據(jù)寫(xiě)完成,DataNode持久化元數(shù)據(jù)。

OHDFSCIient收到業(yè)務(wù)數(shù)據(jù)后,從NameNode獲取到數(shù)據(jù)塊編號(hào).位置信息后,聯(lián)系DataNode,并將需

要寫(xiě)入數(shù)據(jù)的DataNode建立起流水線。完成后,客戶端再通過(guò)自有協(xié)議寫(xiě)入數(shù)據(jù)到DataNodeL再由

DataNode1復(fù)制到DataNodeQ2DataNOde3。

D)HDFSCIient聯(lián)系NameNOde,NameNode在元數(shù)據(jù)中創(chuàng)建文件節(jié)點(diǎn)。

46.[單選題]條件uIN(20,30,40),,表示()

A)年齡在20到40之間

B)年齡在20到30之間

C)年齡是20或30或40

D)年齡在30到40之間

47.[單選題]下列關(guān)于SCaIa特性的描述,錯(cuò)誤的是哪一項(xiàng)?

A)SCala語(yǔ)法復(fù)雜,但是能提供優(yōu)雅的APl計(jì)算

B)SCaIa具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程,可以更好地支持分布式系統(tǒng)

C)SCaIa兼容Java,運(yùn)行速度快,且能融合到HadooP生態(tài)圈中

D)SCala是SPark的主要編程語(yǔ)言

48.[單選題]hadoop能可靠地存儲(chǔ)和處理()字節(jié)數(shù)據(jù)。

A)TB

B)PB

OYB

D)ZB

49.[單選題]數(shù)據(jù)產(chǎn)品開(kāi)發(fā)的關(guān)鍵環(huán)節(jié)是()

A)數(shù)據(jù)收集

B)數(shù)據(jù)預(yù)處理

C)數(shù)據(jù)學(xué)習(xí)

D)數(shù)據(jù)加工

50.[單選題]以下關(guān)于降維的表述,錯(cuò)誤的是()

A)降維過(guò)程中可以保留原始數(shù)據(jù)的所有信息

B)多維縮放的目標(biāo)是要保證降維后樣本之間的距離不變

C)線性降維方法目標(biāo)是要保證降維到的起平面能更好地表示原始數(shù)據(jù)

D)核線性降維方法目標(biāo)是通過(guò)按函數(shù)和核方法來(lái)避免采樣空間投影到高維空間再降維之后的低維結(jié)

構(gòu)丟失

51.[單選題]關(guān)于bagging下列說(shuō)法錯(cuò)誤的是()

A)各基分類(lèi)器之間有較強(qiáng)依賴(lài),不可以進(jìn)行并行訓(xùn)練

B)嘈最著名的算法之一是基于決策樹(shù)基分類(lèi)器的隨機(jī)森林

C)當(dāng)訓(xùn)練樣本數(shù)量較少時(shí),子集之間可能有重疊

D)為了讓基分類(lèi)器之間互相獨(dú)立,需要將訓(xùn)練集分為若干子集

52.[單選題]下列PythOn文件模式中,(—)表示創(chuàng)建一個(gè)新文件。如果文件已經(jīng)存在,則操作失

敗。

A)“r”

B)“W”

C)“x”

D)“+”

53.[單選題]語(yǔ)句np.random,randn(5,4)的運(yùn)算結(jié)果是()。

A)生成一個(gè)5行4列的隨機(jī)矩陣

B)將矩陣的第5行第4列改成一個(gè)隨機(jī)值

C)將矩陣的第4行第3列改成一個(gè)隨機(jī)值

D)將矩陣的第5列和第4列都用隨機(jī)值代替

54.[單選題]如果LA、SSO模型中的懲罰項(xiàng)變大,下列說(shuō)法正確的是0

A)、部分回歸系數(shù)會(huì)變?yōu)?

B)、部分回歸系數(shù)會(huì)趨近于0,但不會(huì)取值為0

C)、A和B的表述都正確

D)、以上說(shuō)法都不正確

55.[單選題]()不是最近鄰分類(lèi)器的特點(diǎn)。

A)它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),不必維護(hù)源自數(shù)據(jù)的模型

B)分類(lèi)一個(gè)測(cè)試樣例開(kāi)銷(xiāo)很大

C)最近鄰分類(lèi)器基于全局信息進(jìn)行預(yù)測(cè)

D)可以生產(chǎn)任意形狀的決策邊界

56.[單選題]下列關(guān)于線性回歸分析中的殘差說(shuō)法正確的是()。

A)殘差均值總是為零

B)殘差均值總是約等于零

C)殘差均值總是大于零

D)以上答案都不正確

57.[單選題]x=Idefchange(a):x+=1printXChange(X)代碼執(zhí)行結(jié)果是(_)。

A)l

B)2

03

D)報(bào)錯(cuò)

58.[單選題]下面關(guān)于TimetOaSt的描述,哪個(gè)是錯(cuò)誤的?()

A)TimetoaSt是在線創(chuàng)作基于時(shí)間軸事件記載服務(wù)的網(wǎng)站

B)提供個(gè)性化的時(shí)間線服務(wù)

C)TimetOaSt基于flash平臺(tái),并基于flash時(shí)間軸上任意加入事件

D)TimetOaSt是一個(gè)提供復(fù)雜統(tǒng)計(jì)圖表的工具

59.[單選題]下列方法中,能夠讓所有單詞的首字母變成大寫(xiě)的方法是()。

A)capitalize

B)title

C)upper

D)Ijust

60.[單選題]核矩陣是()的。

A)沒(méi)有規(guī)律

B)半正定

C)正定

D)樣本矩陣

61.[單選題]下列不屬于scikit-learn中用于標(biāo)準(zhǔn)化的函數(shù)是()。

A)StandardScaler

B)MinMaxScaler

C)MeanScaler

D)以上都對(duì)

62.[單選題]MaxComputeSQL中,使用關(guān)系運(yùn)算符對(duì)兩個(gè)操作數(shù)進(jìn)行比較,如果進(jìn)行比較的兩個(gè)類(lèi)型

間不能進(jìn)行隱式類(lèi)型轉(zhuǎn)換,貝1I:()O

A)則該關(guān)系運(yùn)算不能完成,但并不會(huì)報(bào)錯(cuò)

B)則該關(guān)系運(yùn)算可以完成,健艮錯(cuò)退出

C)則該關(guān)系運(yùn)算不能完成,報(bào)錯(cuò)退出

D)提示用戶需要使用CaSt進(jìn)行顯示的類(lèi)型轉(zhuǎn)換

63.[單選題]表達(dá)式Print("{:.2f}".format(20-2**3+10∕3**2*5))的結(jié)果是:

A)55

B)56

022

D)56

64.[單選題]數(shù)據(jù)科學(xué)是一門(mén)以()為主要研究任務(wù)的獨(dú)立學(xué)科。

A)數(shù)據(jù)驅(qū)動(dòng)、數(shù)據(jù)業(yè)務(wù)化、數(shù)據(jù)洞見(jiàn)、數(shù)據(jù)產(chǎn)品研發(fā)和(或)數(shù)據(jù)生態(tài)系統(tǒng)的建設(shè)

B)數(shù)據(jù)研發(fā)

C)數(shù)據(jù)處理

D)數(shù)據(jù)洞見(jiàn)

65.[單選題]Insert事務(wù)使用的鎖模式是:()。

A)AccessShareLock

B)ROWEXCIUSiveLock

C)ShareupdateExclusiveLock

D)ExclusiveLock

66.[單選題]假設(shè)一個(gè)線性回歸模型完美適合訓(xùn)練數(shù)據(jù)(訓(xùn)練誤差為時(shí),下面那個(gè)說(shuō)法是正確的()

A)測(cè)試集誤差一直為0

B)測(cè)試集誤差可能為0

C)測(cè)試集誤差不會(huì)為。

D)以上都不對(duì)

67.[單選題]Flume數(shù)據(jù)采集過(guò)程中,下列選項(xiàng)中能對(duì)數(shù)據(jù)進(jìn)行過(guò)濾和修飾的是:()。

A)Sink

B)Channel

C)ChannelSelector

D)Interceptor

68.[單選題]下面哪個(gè)不是SPark的組件()

A)SparkStreaming

B)SparkMlib

OSparkSQL

D)SparkR

69.[單選題]建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的()。

A)基礎(chǔ)

B)前提

C)核心

D)條件

70」單選題]()不是HDFS的守護(hù)進(jìn)程。

A)SecondaryNameNode

B)DataNode

C)MRAppMaster/YarnChi1d

D)NameNode

71.[單選題]DataFrame和RDD最大的區(qū)別()

A)科學(xué)統(tǒng)計(jì)支持

B)多了schema

C)存儲(chǔ)方式不一樣

D)外部數(shù)據(jù)源支持

72.[單選題]Spark生態(tài)系統(tǒng)組件SParkStreaming的應(yīng)用場(chǎng)景是?

A)基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘

B)圖結(jié)構(gòu)數(shù)據(jù)的處理

C)基于歷史數(shù)據(jù)的交互式查詢

D)基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理

73.[單選題]長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計(jì)用來(lái)解決的問(wèn)題是()。

A)傳統(tǒng)RNN存在的梯度消失/爆炸問(wèn)題

B)傳統(tǒng)RNN計(jì)算量大的問(wèn)題

C)傳統(tǒng)RNN速度較慢的問(wèn)題

D)傳統(tǒng)RNN容易過(guò)過(guò)擬合的問(wèn)題

74.[單選題]以下說(shuō)法錯(cuò)的是哪項(xiàng)

A)大數(shù)據(jù)是一種思維方式

B)大數(shù)據(jù)不僅僅是講數(shù)據(jù)的體量大

C)大數(shù)據(jù)會(huì)帶來(lái)機(jī)器智能

D)大數(shù)據(jù)的英文名稱(chēng)是Iargedata

75.[單選題]啟用日志聚集功能,需要配置哪個(gè)參數(shù)?

A)Ayarn,nodemanager,local-dirs

B)Byarn,nodemanager,log-dirs

C)Cyarn.acl.enable

D)Dyarn,log-aggregation-enable

76.[單選題]HadoopStreaming支持腳本語(yǔ)言編寫(xiě)簡(jiǎn)單MaPRedUCe程序,以下是一個(gè)例子:

bin/hadoopjarcontrib/streaming/hadoop-O.20-streaming.jar

-inputinput/fiIename

-outputoutput

-mapperMosth.py5,

-filedosth.py

-Dmapred.reduce,tasks=l

以下說(shuō)法不正確的是:

A)HadoopStreaming使用UniX中的流與程序交互

B)HadoopStreaming允許我們使用任何可執(zhí)行腳本語(yǔ)言處理數(shù)據(jù)流

C)采用腳本語(yǔ)言時(shí)必須遵從UNlX的標(biāo)準(zhǔn)輸入STDlN,并輸出到STDoUT

D)RedUCe沒(méi)有設(shè)定,上述命令運(yùn)行會(huì)出現(xiàn)問(wèn)題

77.[單選題]在數(shù)據(jù)生命周期管理實(shí)踐中,()是執(zhí)行方法。

A)數(shù)據(jù)存儲(chǔ)和備份規(guī)范

B)數(shù)據(jù)管理和維護(hù)

C)數(shù)據(jù)價(jià)值發(fā)覺(jué)和利用

D)數(shù)據(jù)應(yīng)用開(kāi)發(fā)和管理

78.[單選題]更新列表時(shí)可以使用以下哪幾種方法來(lái)添加列表項(xiàng)(__)o

A)append(),next(),pop()

B)index(),clear(),extend()

C)append(),extend(),insert()

D)remove(),super0,pop()

79.[單選題]以下可表示變長(zhǎng)度字符串的數(shù)據(jù)類(lèi)型是()

A)TEXT

B)CHAR

C)VΛRCHΛR

D)EMUM

80.[單選題]下列哪些操作可以設(shè)置一個(gè)監(jiān)聽(tīng)器WatCher()

A)getData

B)getChiIdren

C)exists

D)setData

81.[單選題]以下SQL語(yǔ)句編寫(xiě)正確的是()?!?/p>

A)SELECT*FROMsh_goodsWHERE0;

B)SELECT*FROMsh_goodsGROUPBYCategOry_iD、WHEREprice>5;

C)SELECT*FROMsh_goodsLIMIT3ORDERBYprice;

D)以上選項(xiàng)都不正確

82.[單選題]以下可以創(chuàng)建外鍵約束的表是()。-

A)MylSAM表

B)InnoDB表

C)MEMORY表

D)以上答案全部正確

83.[單選題]Storage模塊負(fù)責(zé)了SPark計(jì)算過(guò)程中所有的(_)。

A)運(yùn)算

B)存儲(chǔ)

C)編程

D)編譯

84.[單選題]以下選項(xiàng)中,不是PythOn對(duì)文件的打開(kāi)模式的是

A)w'

B)+'

Oc'

D)r'

85.[單選題]函數(shù)使用哪個(gè)關(guān)鍵字()o

A)fun

B)define

Odef

D)function

86.[單選題]下列哪一個(gè)不屬于云數(shù)據(jù)庫(kù)產(chǎn)品?()

A)本地安裝MySQL

B)阿里云RDS

C)Oracle

D)百度云數(shù)據(jù)庫(kù)

87.[單選題]以下C類(lèi)繼承A類(lèi)和B類(lèi)的格式中,正確的是OO

A)classCA,B:

B)classC(A:B):

C)classC(A,B):

D)classCAandB:

88.[單選題]在HDFS中,默認(rèn)一個(gè)塊多大?

A)64MB

B)32KB

C)128KB

D)16KB

89.[單選題]當(dāng)前社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是

A)互聯(lián)網(wǎng)

B)物聯(lián)網(wǎng)

C)綜合國(guó)力

D)自然資源

90.[單選題]在進(jìn)行回歸模型運(yùn)行操作前,需要進(jìn)行哪一步轉(zhuǎn)換操作?()

A)數(shù)值組裝

B)數(shù)值預(yù)測(cè)

C)模型訓(xùn)練

D)求絕對(duì)值

91.[單選題]np.SWaPaXeS()函數(shù),需要傳入的參數(shù)是(_)。

A)數(shù)組維度

B)數(shù)組大小

C)一對(duì)軸編號(hào)

D)一個(gè)軸編號(hào)

92.[單選題]將從源數(shù)據(jù)源獲取的數(shù)據(jù)按照業(yè)務(wù)需求,轉(zhuǎn)換成目的數(shù)據(jù)源要求的形式,并對(duì)錯(cuò)誤、不

一致的數(shù)據(jù)進(jìn)行清洗和加工這一過(guò)程稱(chēng)為(一)O

A)數(shù)據(jù)抽取

B)數(shù)據(jù)轉(zhuǎn)換

C)數(shù)據(jù)加載

D)數(shù)據(jù)存儲(chǔ)

93.[單選題]HBase依靠()存儲(chǔ)底層數(shù)據(jù)。

A)HDFS

B)Hadoop

C)Memory

D)MapReduce

94.[單選題]閱讀下面PythOn代碼,選擇正確輸出結(jié)果:()deffun(x,y,z=10):

print("{}:{}:{}".format(x,y,z))fun(y=20,x=30)

A)20:30:10

B)O.43090277777778

C)30:20:10

D)報(bào)錯(cuò),缺少參數(shù)

95.[單選題]聚類(lèi)算法的性能度量可稱(chēng)為()。

A)密度估計(jì)

B)異常檢測(cè)

C)有效性指標(biāo)

D)分布結(jié)構(gòu)

96.[單選題]面向用戶提供大數(shù)據(jù)一站式部署方案,包括數(shù)據(jù)中心和服務(wù)器等硬件.數(shù)據(jù)分析應(yīng)用軟

件及技術(shù)運(yùn)維支持等多方面內(nèi)容的大數(shù)據(jù)商業(yè)模式是()

A)大數(shù)據(jù)解決方案模式

B)大數(shù)據(jù)信息分類(lèi)模式

C)大數(shù)據(jù)處理服務(wù)模式

D)大數(shù)據(jù)資源提供模式

97.[單選題]下面關(guān)于深度學(xué)習(xí)相關(guān)描述不正確的有(_)。

A)深度學(xué)習(xí)是一種特征學(xué)習(xí)方法

B)深度學(xué)習(xí)通過(guò)足夠多的簡(jiǎn)單轉(zhuǎn)換函數(shù)及其組合方式來(lái)學(xué)習(xí)一個(gè)復(fù)雜的目標(biāo)函數(shù)

C)深度學(xué)習(xí)的關(guān)鍵在于計(jì)算觀測(cè)書(shū)記的分層特征及其表示

D)ANN不是深度學(xué)習(xí)

98.[單選題]使用numpy.arange(0,11,2)表示的結(jié)果為?

A)[0,2,4,6,8]

B)[2,4,6,8,10]

O[0,2,4,6,8,10]

D)[0,2,4,6,8,10,12]

99.[單選題]執(zhí)行以下代碼段X=5x-=2x+=3**XPrint(X)時(shí),輸出為()。

A)12

B)20

C)30

D)86

IOO.[單選題]在一些算法中,為了進(jìn)行屬性之間的比較或運(yùn)算,需要把不同屬性的不同變量取值范圍

變換成同一范圍,以免使得結(jié)果發(fā)生扭曲,偏向取值范圍大的變量。這一過(guò)程稱(chēng)為()。

A)合并

B)數(shù)據(jù)聚合

C)歸一化

D)數(shù)據(jù)處理

101.[單選題]客戶端首次查詢HBaSe數(shù)據(jù)庫(kù)時(shí),首先需要從哪個(gè)表開(kāi)始查找()

A)METΛ

B)R00T

C)用戶表

D)信息表

102.[單選題]敏感信息核驗(yàn)中不包含以下哪類(lèi)信息的核驗(yàn):()

A)用戶實(shí)名制驗(yàn)證

B)聯(lián)系人驗(yàn)證

C)用戶上網(wǎng)行為驗(yàn)證

D)通話交叉驗(yàn)證

103.[單選題](一)是將HadoOP生態(tài)系統(tǒng)云化的一個(gè)組件。

A)Avro

B)HttPFSB

C)Mahout

D)Whirr

104.[單選題]專(zhuān)家系統(tǒng)的正向推理是以O(shè)作為出發(fā)點(diǎn),按照一定的策略,應(yīng)用知識(shí)庫(kù)中的知識(shí)

,推斷出結(jié)論的過(guò)程。

A)需要解決的問(wèn)題

B)已知事實(shí)

C)證明結(jié)論

D)表示目標(biāo)的謂詞或命題

105.[單選題]下面組件哪個(gè)是負(fù)布式資源調(diào)度與管理的:O

A)YARN

B)FIume

C)Zookeeper

D)Kafka

106.[單選題]下列哪個(gè)不屬于常用的文本分類(lèi)的特征選擇算法?

A)卡方檢驗(yàn)值

B)互信息

C)信息增益

D)主成分分析

107.[單選題]在多元線性回歸模型中,若某個(gè)解釋變量對(duì)其余解釋變量的判定系數(shù)接近于1,則表

明模型中存在()。

A)異方差

B)序列相關(guān)

C)多重共線性

D)高擬合優(yōu)度

108.[單選題]以下哪個(gè)不屬于數(shù)據(jù)治理內(nèi)容的是()。

A)理解自己的數(shù)據(jù)

B)行為規(guī)范的制定

C)崗位職責(zé)的定義

D)獲得更多的數(shù)據(jù)

109.[單選題]數(shù)據(jù)變換的策略包括()。

A)乎滑處理、特征構(gòu)造、聚集、標(biāo)準(zhǔn)化、離散化中

B)平滑處理、特征構(gòu)造、聚集、審計(jì)、離散化

C)乎滑處理、聚集、標(biāo)準(zhǔn)化、審計(jì)、離散化

D)特征構(gòu)造、聚集、標(biāo)準(zhǔn)化、審計(jì)、離散化

110.[單選題]以下哪個(gè)不是HDFS的進(jìn)程()

A)SecondaryNode

B)NameNode

C)ResourceManager

D)DataNode

IlL[單選題]關(guān)于SeCOndaryNameNode哪項(xiàng)是正確?()

A)它是

B)它對(duì)內(nèi)存沒(méi)有要求

C)它的目的是幫助

D)SecondaryNameNode

112.[單選題]基于Bagging的集成學(xué)習(xí)代表算法有()。

A)Adaboost

B)GBDT

C)XGB00ST

D)隨機(jī)森林

113.[單選題]下面哪項(xiàng)是HadOOP的作者?O

A)Martin

B)Doug

C)Mark

D)Kent

114.[單選題]數(shù)據(jù)銷(xiāo)毀環(huán)節(jié)的安全技術(shù)措施有通過(guò)軟件或物理方式保障磁盤(pán)中存儲(chǔ)數(shù)據(jù)的(},不可

恢復(fù),如數(shù)據(jù)銷(xiāo)毀軟件、硬盤(pán)消磁機(jī)、硬盤(pán)粉碎機(jī)等。

A)暫時(shí)隔離

B)暫時(shí)刪除

C)永久刪除

D)不做處理

115.[單選題]表示數(shù)據(jù)分布是否為對(duì)稱(chēng)性的統(tǒng)計(jì)量是()。

A)方差

B)中位數(shù)

C)偏態(tài)

D)峰態(tài)

116.[單選題]執(zhí)行以下代碼段X=12deffl(a,b=x):print(a,b)x=15fl(4)時(shí),輸出為

(一)o

A)154

B)415

0412

D)124

117.[單選題]大數(shù)據(jù)時(shí)代的一大特征是萬(wàn)物互聯(lián)與融合,下列說(shuō)法錯(cuò)誤的是O0

A)人均入網(wǎng)設(shè)備增加

B)融入各個(gè)領(lǐng)域行業(yè)

C)個(gè)人信息安全問(wèn)題凸顯

D)信息安全領(lǐng)域影響不大

118.[單選題]以下關(guān)于人機(jī)交互,描述錯(cuò)誤的是:()

A)人機(jī)交互是一門(mén)研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)科

B)人機(jī)交互界面通常是指用戶不可見(jiàn)的部分

C)系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件

D)用戶通過(guò)人機(jī)交互界面與系統(tǒng)交流,并進(jìn)行操作

119.[單選題]下列關(guān)于智能物流的描述錯(cuò)誤的是Oo

A)是利用智能化技術(shù),使物流技術(shù)能模仿人的智能,具有思維、感知、學(xué)習(xí)、推理判斷和自行解決

物流中某些問(wèn)題的能力

B)實(shí)現(xiàn)物流資源優(yōu)化配置和有效調(diào)度,并且提示物流系統(tǒng)效率

C)智能物流概念源于2010年IBM發(fā)布的研究報(bào)告《智慧的未來(lái)供應(yīng)鏈》

D)提高了物流活動(dòng)的一體化,增加了物流的復(fù)雜性

120.[單選題]在訓(xùn)練集上每學(xué)到一條規(guī)則,就將該規(guī)則覆蓋的訓(xùn)練樣例去除,然后以剩下的訓(xùn)練樣

例組成訓(xùn)練集重復(fù)上述步驟。這個(gè)過(guò)程稱(chēng)為(_)。

A)規(guī)則學(xué)習(xí)

B)直推學(xué)習(xí)

C)強(qiáng)化學(xué)習(xí)

D)序貫覆蓋

121.[單選題]()不是專(zhuān)門(mén)用于可視化時(shí)間空間數(shù)據(jù)的技術(shù)

A)等高線圖

B)餅圈

C)曲面圖

D)矢量場(chǎng)圈

122.[單選題]下列不是hadoop核心組件的是OO

A)JobTracker

B)TaskTracker

C)HDFS

D)Hbase

123.[單選題]如果使用RediS統(tǒng)計(jì)topN元素,可以使用哪些數(shù)據(jù)類(lèi)型?

A)Set

B)List

C)Storedset

D)Hash

124.[單選題]HDFS中的block默認(rèn)保存幾個(gè)備份。()

A)3份

B)2份

C)I份

D)不確定

125.[單選題]以下關(guān)于同步賦值語(yǔ)句描述錯(cuò)誤的選項(xiàng)是:

A)同步賦值能夠使得賦值過(guò)程變得更簡(jiǎn)潔

B)判斷多個(gè)單一賦值語(yǔ)句是否相關(guān)的方法是看其功能上是否相關(guān)或相同

C)設(shè)X,y表示一個(gè)點(diǎn)的坐標(biāo),則x=a;y=b兩條語(yǔ)句可以用x,y=a,b一條語(yǔ)句來(lái)賦值

D)多個(gè)無(wú)關(guān)的單一賦值語(yǔ)句組合成同步賦值語(yǔ)句,會(huì)提高程序可讀性

126.[單選題]下列關(guān)于HadoOPAPl的說(shuō)法錯(cuò)誤的是O

A)HadoOP的文件APl不是通用的,只用于HDFS文件系統(tǒng)

B)Configuration類(lèi)的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的

C)FiIeStatUS對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)

D)FSDatalnPUtStreanI是java.io.DatalnPUtStream的子類(lèi)

127.[單選題]2015年,美國(guó)2150萬(wàn)個(gè)社保賬號(hào)被黑客盜取。該事件反映出的問(wèn)題是O0

A)大數(shù)據(jù)時(shí)代個(gè)人信息安全成為關(guān)注熱點(diǎn)

B)美國(guó)政府的信息安全技術(shù)水平低

C)黑客只對(duì)個(gè)人社保賬號(hào)感興趣

D)美國(guó)公民的信息安全意識(shí)普遍不高

128.[單選題]下面關(guān)于自定義視圖列的說(shuō)法錯(cuò)誤的是()。-

A)自定義列名稱(chēng)的順序與AS后SELECT字段列表的順序一致

B)自定義列名稱(chēng)的數(shù)量必須與SELECT字段列表的數(shù)量一致

C)自定義列名稱(chēng)的視圖在操作數(shù)據(jù)時(shí)只能使用自定義的列名稱(chēng)

D)以上說(shuō)法都不正確

129.[單選題]BASE原則的含義不包括()

A)基本可用

B)柔性狀態(tài)

C)最終一致

D)基礎(chǔ)條件

130.[單選題]在深度學(xué)習(xí)中,我們經(jīng)常會(huì)遇到收斂到localminimum,下列不屬于解決

localminimum

問(wèn)題的方法是()。

A)隨機(jī)梯度下降

B)設(shè)置Momentum

C)設(shè)置不同初始值

D)增大batchsize

131.[單選題]有N個(gè)樣本,一半用于訓(xùn)練,一半用于測(cè)試。若增大N值,則訓(xùn)練誤差和測(cè)試誤差之間

的差距會(huì)()

A)增大

B)減小

C)不確定

D)無(wú)變化

132.[單選題]下列哪個(gè)不是情感分析的應(yīng)用場(chǎng)景?

A)數(shù)據(jù)挖掘

B)信息檢索

C)文本分詞

D)市場(chǎng)營(yíng)銷(xiāo)

133.[單選題]下列關(guān)于鍵值數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的:(D)

A)擴(kuò)展性好,靈活性好

B)大量寫(xiě)操作時(shí)性能高

C)無(wú)法存儲(chǔ)結(jié)構(gòu)化信息

D)條件查詢效率高

134.[單選題]下列能體現(xiàn)大數(shù)據(jù)思維的是()

A)大數(shù)據(jù)思維是要追求數(shù)據(jù)的精確性

B)大數(shù)據(jù)思維是要抓住樣本數(shù)據(jù)

C)大數(shù)據(jù)思維是要通過(guò)少量數(shù)據(jù)觀察數(shù)據(jù)間關(guān)系

D)大數(shù)據(jù)思維是要從自然思維轉(zhuǎn)變?yōu)橹悄芩季S

135.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,貸后預(yù)警處置,是基于O維度對(duì)目標(biāo)客戶

的同一批次貸后預(yù)警信號(hào)一并處置,并非是基于信號(hào)維度,逐一對(duì)信號(hào)進(jìn)行處置。

A)客戶

B)B.信號(hào)

Oc.支行

D)D.分行

136.[單選題]執(zhí)行以下代碼段defgreetuser(username):print("Hello,+username,title()

+"!")greet_user(jesse')時(shí),輸出為(.)□

A)Hello!

B)jesse!

C)Hello,jesse!

D)Hello,Jesse!

137.[單選題]下列選項(xiàng)中優(yōu)先級(jí)級(jí)別最高的是()。-

A)~(按位取反)

B)^

C)&&

D)&

138.[單選題]下列選項(xiàng)中無(wú)法通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是?

A)商業(yè)模式發(fā)現(xiàn)

B)信用評(píng)估

C)商品推薦

D)運(yùn)營(yíng)分析

139.[單選題]以下關(guān)于HiVeSQL基本操作描述正確的是?

A)創(chuàng)建外部表必須要指定IOCatiOn信息

B)創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字

C)加載數(shù)據(jù)到HiVe時(shí)源數(shù)據(jù)必須是HDFS的一個(gè)路徑

D)創(chuàng)建表時(shí)可以指定列分割符

140.[單選題]留出法直接將數(shù)據(jù)集劃分為()個(gè)互斥的集合。

A)-

B)二

OS

D)四

141.[單選題]()是表示數(shù)據(jù)分布是否為對(duì)稱(chēng)性的統(tǒng)計(jì)量。

A)方差

B)中位數(shù)

C)偏態(tài)

D)峰態(tài)

142.[單選題]數(shù)據(jù)可視化的方法論基礎(chǔ)是()。

A)統(tǒng)計(jì)圖表

B)視覺(jué)編碼

C)圖論

D)圖形符號(hào)學(xué)

143.[單選題]RDD中的數(shù)據(jù)被()在集群中,使得任務(wù)可以并行執(zhí)行。

A)順序存儲(chǔ)

B)連續(xù)存儲(chǔ)

C)分塊存儲(chǔ)

D)分區(qū)存儲(chǔ)

144.[單選題]硬件故障被認(rèn)為是常態(tài),為了解決這個(gè)問(wèn)題,HDFS設(shè)計(jì)了副本機(jī)制,默認(rèn)情況下,一

份文件,HDFS會(huì)存放()份。

A)3

B)5

02

D)l

145.[單選題]泛在電力物聯(lián)網(wǎng)系統(tǒng)建設(shè)必須嚴(yán)格遵循公司統(tǒng)一的O數(shù)據(jù)模型和數(shù)據(jù)、采集、定義

、編碼、應(yīng)用等標(biāo)準(zhǔn),確保數(shù)據(jù)共享。

A)E-R模型

B)SG-ClM模型

C)IMS模型

D)DBTG模型

146.[單選題]下面描述錯(cuò)誤的是:()

A)“探針盒子”就是一款自動(dòng)收集用戶隱私的產(chǎn)品

B)許多顧客在使用WiFi之后會(huì)收到大量的廣告信息,甚至自己的手機(jī)號(hào)碼也會(huì)被當(dāng)做信息進(jìn)行多次

買(mǎi)賣(mài)

C)在免費(fèi)上網(wǎng)的背后,其實(shí)也存在著不小的信息安全風(fēng)險(xiǎn),或許一不小心,就落入了電腦黑客們?cè)O(shè)

計(jì)的WiFi陷阱之中

D)免費(fèi)WlFl都是安全的,可以放心使用

147.[單選題]配置HadooP時(shí),JAVAJ40ME包含在()配置文件中

A)hadoop-default.xml

B)hadoop-env.sh

C)hadoop-site.xml

D)configuration,xs

148.[單選題]下述O不是人工智能中常用的知識(shí)格式化表示方法。

A)框架表示法

B)狀態(tài)空間表示法

C)語(yǔ)義網(wǎng)絡(luò)表示法

D)形象描寫(xiě)表示法

149.[單選題]當(dāng)用戶選擇的列是集合數(shù)據(jù)類(lèi)型時(shí),HiVe會(huì)使用()格式應(yīng)用于輸出

A)string

B)map

C)json

D)list

150.[單選題]部署HiVe時(shí)元數(shù)據(jù)信息通常存在哪個(gè)數(shù)據(jù)庫(kù)中

A)SqlServer

B)HBase

OMySql

D)OracleRAC

151.[單選題]()是從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本的抽樣方法。每個(gè)單位被抽中的概

率是相等的,屬于“等概率抽樣”。

A)方便抽樣

B)分層抽樣

C)整群抽樣

D)簡(jiǎn)單隨機(jī)抽樣

152.[單選題]下列哪些不是HBase的特點(diǎn)()

A)高可靠性

B)高性能

C)面向列

D)緊密性

153.[單選題]以下哪個(gè)選項(xiàng)不能做為Kafka的ConSUmer?

A)Hadoop

B)Real-timeMonitoring

C)FrontEnd

D)DataWarehouse

154.[單選題]下面回歸模型中的哪個(gè)步驟/假設(shè)最能影響過(guò)擬合和欠擬合之間的平衡因素()

A)多項(xiàng)式的階數(shù)

B)是否通過(guò)矩陣求逆或梯度下降學(xué)習(xí)權(quán)重

C)使用常數(shù)項(xiàng)

D)使用正則化

155.[單選題]根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險(xiǎn)預(yù)警信號(hào)管理辦法(試行)》,承德轄區(qū)支行的紅色

級(jí)信號(hào),支行管戶客戶經(jīng)理應(yīng)在接收到系統(tǒng)所推送信號(hào)當(dāng)日立即聯(lián)系客戶開(kāi)展預(yù)警信號(hào)風(fēng)險(xiǎn)核實(shí)工

作,限期O個(gè)工作日內(nèi)制定出針對(duì)性的處置措施

A)l

B)B.3

C)C.5

D)D.10

156.[單選題]下面不屬于數(shù)據(jù)科學(xué)家的主要職責(zé)有(_)。

A)制定“數(shù)據(jù)戰(zhàn)略”

B)研發(fā)“數(shù)據(jù)產(chǎn)品”

C)模擬“數(shù)據(jù)學(xué)習(xí)”

D)構(gòu)建“數(shù)據(jù)生態(tài)系統(tǒng)”

157.[單選題]一切以數(shù)據(jù)作為驅(qū)動(dòng)或者核心的產(chǎn)品叫做O

A)創(chuàng)新性產(chǎn)品

B)數(shù)據(jù)產(chǎn)品

C)風(fēng)控產(chǎn)品

D)核心產(chǎn)品

158.[單選題]查找條件為:姓名為NULL的記錄()

A)WHERENAMENULL

B)?WHERENAMEISNULL

OWHERENAME=NULL

D)?WHERENAME==NULL

159.[單選題]大數(shù)據(jù)的O體現(xiàn)在大數(shù)據(jù)是基于互聯(lián)網(wǎng)的實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),而不是歷史的或嚴(yán)格控制

環(huán)境下產(chǎn)生的內(nèi)容

A)社會(huì)性

B)廣泛性

C)公開(kāi)性

D)動(dòng)態(tài)性

160.[單選題]感知機(jī)只有(_)神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能神經(jīng)元。

A)輸入層

B)輸出層

C)第一層

D)第二層

161.[單選題]大數(shù)據(jù)元年是指Oo

A)2012年

B)2011年

C)2013年

D)2010年

162.[單選題]關(guān)于批量數(shù)據(jù)處理組件的描述不正確的是?

A)HiVe:傳統(tǒng)SQL批處理引擎,用于處理SQL類(lèi)批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理

速度較慢。

B)SParkSQL:新型SSQL批處理引擎,用于處理SQL類(lèi)批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。

OSpark:新型批處理引擎,可以用于處理非SQL類(lèi),尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類(lèi)批處理作業(yè),適

合海量數(shù)據(jù),處理速度高效。

D)MaPRedUCer傳統(tǒng)批處理引整用于處理非SoL類(lèi),尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類(lèi)批處理作業(yè),使用廣

泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。

163.[單選題]以下對(duì)于離線批處理的概念理解錯(cuò)誤的是哪一項(xiàng)?

A)離線批處理針對(duì)的數(shù)據(jù)量較大

B)離線批處理占用的內(nèi)存資源較多。

C)齋線批收處理對(duì)數(shù)據(jù)處理的時(shí)延要求不高。

D)離線批處理通常MR作業(yè),SPark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。

164.[單選題]多分類(lèi)圖像識(shí)別任務(wù)一般采用什么編碼方式作為輸出。O

A)二進(jìn)制編碼

B)One-hot編碼

C)霍夫曼編碼

D)曼切斯特編碼

165.[單選題]Flume傳輸數(shù)據(jù)過(guò)程中,為了防止數(shù)據(jù)不丟失,使用的ChanneI類(lèi)型是?

A)MemoryChannel

B)FileChanne

C)JDBCChanne

D)HDESChannel

166.[單選題]以下描述中不正確的是(—)。

A)若欲預(yù)測(cè)的是離散值,則此學(xué)習(xí)任務(wù)稱(chēng)為分類(lèi)

B)若預(yù)測(cè)的是連續(xù)值,則此類(lèi)學(xué)習(xí)任務(wù)稱(chēng)為回歸

C)學(xué)得的模型適用于新樣本的能力,稱(chēng)訓(xùn)練能力

D)從數(shù)據(jù)中學(xué)得模型的過(guò)程稱(chēng)為學(xué)習(xí)

167.[單選題]對(duì)于ElaStiCSearch描述不正確的是?

A)對(duì)LUCene進(jìn)行了擴(kuò)展

B)不支持結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)

C)能夠水平擴(kuò)展

D)基于LUCene的全文檢素服務(wù)

168.[單選題]下面不屬于詞袋模型的缺點(diǎn)的是?

A)詞匯表的詞匯需要經(jīng)過(guò)精心設(shè)計(jì)

B)表示具有稀疏性

C)丟失詞序忽略了上下文

D)模型復(fù)雜,不利于實(shí)施

169.[單選題]大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)圖計(jì)算框架再計(jì)算過(guò)程中通過(guò)對(duì)圖進(jìn)行編輯

、演化最終求解出結(jié)果,在計(jì)算過(guò)程中用戶可以對(duì)圖進(jìn)行()編輯操作。

A)增加邊

B)刪除點(diǎn)

C)修改邊的權(quán)值

D)增加點(diǎn)

170.[單選題]sciPy中模塊StatS的作用是什么?

A)統(tǒng)計(jì)

B)差值計(jì)算

C)程序輸入輸出

D)稀疏矩陣

171.[單選題]數(shù)據(jù)倉(cāng)庫(kù)的最終目的是()

A)收集業(yè)務(wù)需求

B)建立數(shù)據(jù)倉(cāng)庫(kù)邏輯模型

C)開(kāi)發(fā)數(shù)據(jù)的應(yīng)用分析

D)為用戶和業(yè)務(wù)部門(mén)提供決策支持

172.[單選題]運(yùn)營(yíng)人員為了搞促銷(xiāo),需要找出目標(biāo)客戶名單,這批客戶的信息存儲(chǔ)在大數(shù)據(jù)計(jì)算服

務(wù)(MaxCompute,原ODPS)的USer表中,并且用戶名字段USername中包含"vip"字樣,通過(guò)執(zhí)行

SQL語(yǔ)句()可以找出這批客戶。

A)select*fromuserwhereusernamecontains('vip')

B)select*fromuserwhereusername=,vip,

C)select*fromuserwhereusernamelike'*vip*'

D)select*fromuserwhereusernamelike,%vip%,

173.[單選題]Apriori算法的核心思想是()

A)通過(guò)頻繁項(xiàng)集生成和情節(jié)的向下封閉檢測(cè)兩個(gè)階段來(lái)挖掘候選集

B)通過(guò)候選集生成和情節(jié)的向下封閉檢測(cè)兩個(gè)階段來(lái)挖掘頻繁項(xiàng)集

C)數(shù)據(jù)集中包含該項(xiàng)集的數(shù)據(jù)所占數(shù)據(jù)集的比例,度量一個(gè)集合在原始數(shù)據(jù)中出現(xiàn)的頻率

D)若某條規(guī)則不滿足最小置信度要求,則該規(guī)則的所有子集也不滿足最小置信皮要求

174.[單選題]下列選項(xiàng)中,用于刪除缺失值的方法是()

A)isnull()

B)delete()

C)dropna()

D)fiIlnaO

175.[單選題]以下Python代碼運(yùn)行結(jié)果為()。$;$defSUm(a,b=3,c=5):$;$returnsum(La,

b,c])$;Sprint(Sum(a=8,c=2))$;$print(Sum(8))$;$print(Sum(8,2))

A)13,16,15

B)10,8,10

C)13,8,10

D)10,16,10

176.[單選題]F1參數(shù)的大小反映了模型的(_)。

A)準(zhǔn)確度

B)誤差

C)穩(wěn)定性

D)偏差

177.[單選題]下列說(shuō)法錯(cuò)誤的是()

A)大數(shù)據(jù),不僅是以此技術(shù)革命,同時(shí)也是以此思想革命。

B)舍恩伯格指出大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是思維方式的轉(zhuǎn)變。

C)并非所有的規(guī)律都可以用簡(jiǎn)單的原理來(lái)描述。

D)世界的一切都是可知的,都可以用簡(jiǎn)單的原理、公式描述出來(lái)。

178.[單選題]將基礎(chǔ)設(shè)施作為服務(wù)的云計(jì)算服務(wù)類(lèi)型是()

A)IaaS

B)SaaS

OPaaS

D)三個(gè)選項(xiàng)都是

179.[單選題]()是二維隨機(jī)變量的分布。

A)正態(tài)分布

B)二項(xiàng)分布

C)邊緣分布

D)指數(shù)分布

180.[單選題]大數(shù)據(jù)的基本特征不包括()。

A)數(shù)據(jù)量大

B)據(jù)類(lèi)型繁多

C)處理速度快

D)價(jià)值密度高

181.[單選題]以下不屬于大數(shù)據(jù)重要意義的是()。

A)大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力

B)大數(shù)據(jù)成為重塑?chē)?guó)家競(jìng)爭(zhēng)優(yōu)勢(shì)的新機(jī)遇

C)大數(shù)據(jù)成為提升政府治理能力的新途徑

D)大數(shù)據(jù)會(huì)增加經(jīng)濟(jì)發(fā)展的成本

182.[單選題]根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)戰(zhàn)略安排,第一個(gè)階段是到O年,初步建成泛在電力物聯(lián)

網(wǎng)。

A)2020

B)2021

02024

D)2025

183.[單選題]長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)通過(guò)什么來(lái)緩解梯度消失問(wèn)題?

A)增加網(wǎng)絡(luò)深度

B)減少網(wǎng)絡(luò)神經(jīng)元

C)使用雙向的網(wǎng)絡(luò)結(jié)構(gòu)

D)增加一個(gè)用來(lái)保存長(zhǎng)期狀態(tài)的單元

184.[單選題]下列關(guān)于常見(jiàn)的動(dòng)作(ACtion)和轉(zhuǎn)換(TranSformation)操作的APl解釋錯(cuò)誤的是(

A)filter(func):篩選出滿足函數(shù)func的元素,并返回一個(gè)新的數(shù)據(jù)集

B)map(func):將每個(gè)元素傳遞到函數(shù)func中,并將結(jié)果返回為一個(gè)新的數(shù)據(jù)集

OcountO:返回?cái)?shù)據(jù)集中的元素個(gè)數(shù)

D)take(n):返回?cái)?shù)據(jù)集中的第n個(gè)元素

185.[單選題]假設(shè)在龐大的數(shù)據(jù)集上使用LogiStiC回歸模型,可能遇到一個(gè)問(wèn)題,Logistic回歸需

要很長(zhǎng)時(shí)間才能訓(xùn)練,如果對(duì)相同的數(shù)據(jù)進(jìn)行邏輯回歸,則花費(fèi)更少的時(shí)間,并給出比較相似的精度的

方法是()。

A)降低學(xué)習(xí)率,減少選代次數(shù)

B)降低學(xué)習(xí)率,增加迭代次數(shù)

C)提高學(xué)習(xí)率,增加迭代次數(shù)

D)增加學(xué)習(xí)率,減少迭代次數(shù)

186.[單選題]Spark的默認(rèn)存儲(chǔ)級(jí)別()

A)MEMORYj)NLY

B)MEMORYJ)NLYSER

C)MEMoRY_AND_DlSK

D)MEMORY_AND_DISK_SER

187.[單選題]下列選項(xiàng)中那些是HadooP2.x版本獨(dú)有的進(jìn)程()

A)JobTracker

B)TaskTracker

C)NodeManager

D)NameNode

188.[單選題.]HadoopL0中,HadOOP內(nèi)核的主要組成是()

A)HDFS和MaPRedUCe

B)HDFS和Yarn

C)Yarn

D)MaPRedUCe和Yarn

189.[單選題]下列關(guān)于文本分類(lèi)的說(shuō)法不正確的是()o

A)文本分類(lèi)是指按照預(yù)先定義的主題類(lèi)別,由計(jì)算機(jī)自動(dòng)地為文檔集合中的每個(gè)文檔確定一個(gè)類(lèi)別

B)文本分類(lèi)系統(tǒng)大致可分為基于知識(shí)工程的分類(lèi)系統(tǒng)和基于機(jī)器學(xué)習(xí)的分類(lèi)革統(tǒng)

C)文本的向量形式一般基于祠袋模型構(gòu)建,該模型考慮了文本詞語(yǔ)的行文順序

D)構(gòu)建立本的向量形式可以歸結(jié)為文本的特征選擇與特征權(quán)重計(jì)算兩個(gè)步驟

190.[單選題]下列關(guān)于網(wǎng)絡(luò)用戶行為的說(shuō)法中,錯(cuò)誤的是()

A)網(wǎng)絡(luò)公司能夠捕捉到用戶在其網(wǎng)站上的所有行為

B)用戶離散的交互痕跡能夠?yàn)槠髽I(yè)提升服務(wù)質(zhì)量提供參考

C)數(shù)字軌跡用完即自動(dòng)刪除

D)用戶的隱私安全很難得以規(guī)范保護(hù)

191.[單選題]Hadoop生態(tài)系統(tǒng)中,(—_)主要解決的是日志類(lèi)數(shù)據(jù)的收集和處理問(wèn)題。

A)Mahout

B)Flume

C)Sqoop

D)HBase

192.[單選題]專(zhuān)家系統(tǒng)的推理機(jī)的最基本的方式是O0

A)直接推理與間接推理

B)正向推理與反向推理

C)邏輯推理與非邏輯推理

D)準(zhǔn)確推理與模糊推理

193.[單選題]O是大數(shù)據(jù)審計(jì)技術(shù)發(fā)展的最強(qiáng)大動(dòng)力

A)人才培養(yǎng)

B)科技發(fā)展

C)制度建設(shè)

D)審計(jì)方式轉(zhuǎn)變

194.[單選題]數(shù)據(jù)管理成熟度模型--DMM將一個(gè)機(jī)構(gòu)的數(shù)據(jù)管理工作抽象成6個(gè)關(guān)鍵過(guò)程域,即

數(shù)據(jù)戰(zhàn)略、()、數(shù)據(jù)質(zhì)量、平臺(tái)與架構(gòu)、數(shù)據(jù)操作以及輔助性過(guò)程。

A)數(shù)據(jù)管理

B)數(shù)據(jù)治理

C)數(shù)據(jù)策略

D)數(shù)據(jù)安全

195.[單選題]()先對(duì)數(shù)據(jù)集進(jìn)行特征選擇,然后再訓(xùn)練學(xué)習(xí)器

A)過(guò)濾式選擇

B)包裹式選擇

C)稀疏表示

D)嵌入式選擇

196.[單選題]美國(guó)海軍軍官莫里通過(guò)對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)

與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()

A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B)在分析方法上更注重相關(guān)分析而不是因果分析

C)在分析效果上更追究效率而不是絕對(duì)精確

D)在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

197.[單選題]創(chuàng)建Loader作業(yè)中,可以在以下哪個(gè)步驟中設(shè)置過(guò)濾器類(lèi)型?

A)輸入設(shè)置

B)轉(zhuǎn)換

C)基本信息

D)輸出

198.[單選題]HDFS默認(rèn)的一個(gè)塊大小是()。

A)64MB

B)8KB

C)32KB

D)16KB

199.[單選題]下列關(guān)于MaPRedUCe工作流程,哪個(gè)描述是正確的?

A)所有的數(shù)據(jù)交換都是通過(guò)MaPRedUCe框架自身去實(shí)現(xiàn)的

B)不同的MaP任務(wù)之間會(huì)進(jìn)行通信

C)不同的RedUCe任務(wù)之間可以發(fā)生信息交換

D)用戶可以顯式地從一臺(tái)機(jī)器向另一臺(tái)機(jī)器發(fā)送消息

200.[單選題]()是指通過(guò)訓(xùn)練而得到一種識(shí)別規(guī)則,通過(guò)此識(shí)別規(guī)則可以得到一種特征分類(lèi),使

圖像識(shí)別技術(shù)能夠得到高識(shí)別率。

A)預(yù)處理

B)特征抽取和選擇

C)分類(lèi)器設(shè)計(jì)

D)分類(lèi)決策

201.[單選題]以下哪個(gè)組件可以指定對(duì)key進(jìn)行RedUCe分發(fā)的策略?

A)RecordReader

B)Combiner

C)Partitioner

D)FiIeInputFormat

202.[單選題]人工智能的目的是讓機(jī)器能夠O,以實(shí)現(xiàn)某些腦力勞動(dòng)的機(jī)械化。

A)具有智能

B)與人一樣工作

C)完全代替人的大腦

D)模擬、延伸與擴(kuò)展人的智能

203.[單選題]下面關(guān)于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的描述錯(cuò)誤的是:()

A)機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多

門(mén)學(xué)科

B)數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中信息的過(guò)程。

C)數(shù)據(jù)挖掘可以視為機(jī)器學(xué)習(xí)與數(shù)據(jù)庫(kù)的交叉

D)數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)的底層技術(shù)

204.[單選題]在用戶驗(yàn)證權(quán)限時(shí),應(yīng)當(dāng)在“服務(wù)列表”中選擇數(shù)據(jù)復(fù)制服務(wù),進(jìn)入DRS主界面,單擊

右上角(),嘗試購(gòu)創(chuàng)建遷移任務(wù)。

A)修改遷移任務(wù)

B)創(chuàng)建遷移任務(wù)

C)查閱權(quán)限

D)刪除遷移任務(wù)

205.[單選題]商業(yè)秘密數(shù)據(jù)脫離本單位(含網(wǎng)絡(luò)、信息系統(tǒng)及各種介質(zhì))環(huán)境須經(jīng)O業(yè)務(wù)主管部

門(mén)和保密部門(mén)審批。

A)公司部門(mén)級(jí)及以上單位

B)市級(jí)及以上單位

C)省級(jí)及以上單位

D)國(guó)家級(jí)單位

206.[單選題]智慧城市的構(gòu)建,不包含()。

A)數(shù)字城市

B)物聯(lián)網(wǎng)

C)聯(lián)網(wǎng)監(jiān)控

D)云計(jì)算

207.[單選題]現(xiàn)有如下兩個(gè)HiVe表,使用如下哪條語(yǔ)句可以得到以下結(jié)果:O

?)selectfromstudentjoinscoreonstudent,id=score,id;

B)selectfromstudentleftjoinscoreonstudent,id=score,id;

C)selectfromstudentrightjoinscoreonstudent,id=score,id;

D)selectfromstudentfulljoinscoreonstudent,id=score,id;

208.[單選題]已知初始問(wèn)題的描述,通過(guò)一系列變換把此問(wèn)題最終變?yōu)橐粋€(gè)子問(wèn)題集合;這些子問(wèn)題

的解可以直接得到,從而解決了初始問(wèn)題。這是知識(shí)表示法叫O

A)狀態(tài)空間法

B)問(wèn)題歸約法

C)謂詞邏輯法

D)語(yǔ)義網(wǎng)絡(luò)法

209.[單選題]下面不屬于數(shù)據(jù)科學(xué)主要研究?jī)?nèi)容的有(_)。

A)基礎(chǔ)理論

B)數(shù)據(jù)管理

C)數(shù)據(jù)分析

D)數(shù)據(jù)商務(wù)

210.[單選題]關(guān)于數(shù)據(jù)分析,下列說(shuō)法正確的是()。

A)描述性分析和預(yù)測(cè)性分析是診斷性分析的基礎(chǔ)

B)診斷性分析是對(duì)規(guī)范性分析的進(jìn)一步理解

C)預(yù)測(cè)性分析是規(guī)范性分析的基礎(chǔ)

D)規(guī)范性分析是數(shù)據(jù)分析的最高階段,可以直接產(chǎn)生產(chǎn)業(yè)價(jià)值

211.[單選題]SciPy通常與()同時(shí)使用。

A)Pandas

B)Scikit-learn

C)Numpy

D)Jieba

212.[單選題]Hadoop框架是用下面()語(yǔ)言寫(xiě)的。

A)Pytyon

B)Java

OC++

D)Scala

213.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,系統(tǒng)在【大數(shù)據(jù)貸后預(yù)警處置】菜單下設(shè)置

【待處置】、【處置中】等4個(gè)節(jié)點(diǎn)。其中,用戶在()節(jié)點(diǎn)可查看已提交審批且流程尚未走完的客

戶預(yù)警信號(hào)詳情、關(guān)注其貸后預(yù)警審批狀態(tài)等。

A)待處置

B)B.處置中

C)C.退回

D)D.處置完成

214.[單選題]HBase依靠。存儲(chǔ)底層數(shù)據(jù)

A)HDFS

B)Hadoop

C)Memory

D)MapReduce

215.[單選題](_)度量了同樣大小的訓(xùn)練集的變動(dòng)所導(dǎo)致的學(xué)習(xí)性能的變化。

A)偏差

B)方差

C)均方差

D)泛化誤差

216.[單選題]DataX是阿里集團(tuán)發(fā)起的開(kāi)源項(xiàng)目,是一種離線數(shù)據(jù)同步的工具,支持多種異構(gòu)數(shù)據(jù)源

之間的高效數(shù)據(jù)同步。DataX任務(wù)配置文件使用()文件格式。

A)java

B)bson

C)xml

D)json

217.[單選題]下列可以作為文本分類(lèi)準(zhǔn)則的是()。

A)預(yù)測(cè)準(zhǔn)確率

B)魯棒性

C)可擴(kuò)展性

D)以上都對(duì)

218.[單選題]在頁(yè)面中看不見(jiàn)的表單元素是()。

A)<inputtype="password"><∕input>

B)<inputtype="radio"></input>

C)<inputtype="hidden"><∕input>

D)<inputtype="reset"></input>

219.[單選題]如果需要從MaXCOmPUte同步一張表到ADS,則該表的訪問(wèn)權(quán)限需要授予MaXComPUte中的

()用戶。

A)aliyun$guradabuild@aliyun.com

B)aliyun$gurada_data@aliyun.com

OaliyunSguradaads@aliyun.com

D)aliyun$ads_data@aliyun.com

220.[單選題]關(guān)于數(shù)據(jù)服務(wù)中,app說(shuō)法正確的是:()。

A)一個(gè)用戶只能創(chuàng)建一個(gè)APP

B)一個(gè)APP只能申請(qǐng)一個(gè)API的權(quán)限

C)一個(gè)用戶可以創(chuàng)建多個(gè)APP,一個(gè)APP可以申請(qǐng)多個(gè)APl的權(quán)限

D)一個(gè)APl只能被一個(gè)APP使用

221.[單選題]下列選項(xiàng)哪一個(gè)不屬于HlVE的工作內(nèi)容?

A)表結(jié)構(gòu)元數(shù)據(jù)管理

B)HQL語(yǔ)句命令解析

C)分布式文件底層數(shù)據(jù)管理

D)數(shù)據(jù)結(jié)構(gòu)以及函數(shù)的定義

222.[單選題]更新數(shù)據(jù)表中的記錄用以下哪一項(xiàng)()

A)DELETE

B)ALTRE

C)UPDATE

D)SELECT

223.[單選題]以下不屬于推斷統(tǒng)計(jì)的是(一)。

A)參數(shù)估計(jì)

B)關(guān)聯(lián)預(yù)測(cè)

C)假設(shè)檢驗(yàn)

D)采樣分布

224.[單選題]Numpy是(_)的簡(jiǎn)寫(xiě)。

A)NumericalPython

B)Numericpython

ONumericalforPython

D)Numericofpython

225.[單選題]Sigmoid函數(shù)作為神經(jīng)元激活函數(shù)的特點(diǎn)是()

A)連續(xù)但不光滑

B)不連續(xù)但尤滑

C)連續(xù)且光滑

D)不連續(xù)且不光滑

226.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,財(cái)務(wù)智能分析中的財(cái)務(wù)指標(biāo)趨勢(shì)分析模塊

,O部分描述頁(yè)面右側(cè)表格中有所異動(dòng)、大幅異動(dòng)的重點(diǎn)財(cái)務(wù)指標(biāo)數(shù)值、增額、增幅情況,描述

的文字內(nèi)容隨表格內(nèi)容變動(dòng)而變動(dòng)。

A)表格

B)B.圖表

OC.文字

D)D.以上都不對(duì)

227.[單選題]谷歌采用搜索引擎大數(shù)據(jù)進(jìn)行流感趨勢(shì)預(yù)測(cè),體現(xiàn)了哪種大數(shù)據(jù)思維方式()

A)我為人人,人人為我

B)全樣而非抽樣

C)效率而非精確

D)相關(guān)而非因果

228.[單選題]LSM含義是?

A)日志結(jié)構(gòu)合并樹(shù)

B)二叉樹(shù)

C)平衡二叉樹(shù)

D)基于日志結(jié)構(gòu)的合并樹(shù)

229.[單選題IFusionInsightHD系統(tǒng)中執(zhí)行HBaSe些數(shù)據(jù)是,數(shù)據(jù)被寫(xiě)入內(nèi)存MemStore,日志HLOg和

HDP中,請(qǐng)問(wèn)那一步寫(xiě)入成功后才會(huì)最終返回客戶端寫(xiě)數(shù)據(jù)成功?

A)Memstore

B)HLog

OHDFS

D)Memory

230.[單選題]k近鄰學(xué)習(xí)是一種(_)方法。

A)監(jiān)督學(xué)習(xí)方法

B)半監(jiān)督學(xué)習(xí)方法

C)無(wú)監(jiān)督學(xué)習(xí)方法

D)測(cè)試方法

231.[單選題]下面哪個(gè)程序負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)O

A)NameNode

B)Jobtracker

C)Datanode

D)SecondaryNameNode

232.[單選題]()不屬于特征選擇的標(biāo)準(zhǔn)方法。

A)散入

B)過(guò)濾

C)包裹

D)抽樣

233.[單選

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論