




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
試題說明
本套試題共包括1套試卷
每題均顯示答案和解析
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案8(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案8
1.[單選題]大數(shù)據(jù)應(yīng)用開發(fā)流程不包含以下哪項?
A)需求分析
B)可行性分析
C)應(yīng)用推廣D、技術(shù)選型
答案:C
解析:
2.[單選題]Client端上傳文件的時候下列哪項正確?
A)數(shù)據(jù)經(jīng)過NameNode傳遞給DataNode
B)Client端將文件切分為Block,依次上傳
OClient只上傳數(shù)據(jù)到一臺DataNOde,然后由NameNode負(fù)責(zé)Block復(fù)制工作
答案:B
解析:a.數(shù)據(jù)經(jīng)過NameNOde傳遞給DataNode【數(shù)據(jù)不用經(jīng)過NameNode傳遞給DataNode,直接客戶端
按順序?qū)⑽募饌€block傳遞給相應(yīng)DataNode】
C.Client只上傳數(shù)據(jù)到一臺DataNode,然后由NameNOde負(fù)責(zé)BIoCk復(fù)制工作
【由接收到block的DataNode負(fù)責(zé)復(fù)制b1ock的副本而不是NameNode]
3.[單選題]Hadoop的MapReduce組件擅長處理哪些場景的計算任務(wù)?
A)迭代計算
B)離線計算
C)實時交互計算
D)流式計算
答案:B
解析:
4.[單選題]大數(shù)據(jù)的最顯著特征是()。
A)數(shù)據(jù)規(guī)模大
B)數(shù)據(jù)類型多樣
C)數(shù)據(jù)處理速度快
D)數(shù)據(jù)價值密度高
答案:A
解析:
5.[單選題IFusionInsightHD集群規(guī)劃中,管理節(jié)點&控制節(jié)點&數(shù)據(jù)節(jié)點合一部署方案合適什么樣
的場景?
A)30節(jié)點以下
B)IOO節(jié)點以下
C)IO(T200節(jié)點
D)200節(jié)點以上
答案:A
解析:
6.[單選題]對于HBaSe表設(shè)計描述錯誤的是?
A)-張表可以創(chuàng)建多個ColumnFamily
B)TTL默認(rèn)為一天
C)RegiOn建議預(yù)先創(chuàng)建
D)MaxVerSiOn無法人為修改
答案:D
解析:
7.[單選題]下列選項中,能夠提高數(shù)據(jù)安全性的是OO
A)計算機病毒
B)蠕蟲
C)殺毒軟件
D)黑客
答案:C
解析:
8.[單選題]使用MaXConlPUtetunnel命令上傳數(shù)據(jù)時,下列()參數(shù)可以設(shè)定是否忽略臟數(shù)據(jù)。
A)-dbr
B)-fd
C)-dfp
D)-rd
答案:A
解析:
9.[單選題]規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指
的是()。
A)富數(shù)據(jù)
B)貧數(shù)據(jù)
C)繁數(shù)據(jù)
D)大數(shù)據(jù)
答案:D
解析:
10.[單選題]下列關(guān)于Python的全局變量和局部變量的描述錯誤的是()。
A)局部變量指在函數(shù)內(nèi)部使用的變量,當(dāng)函數(shù)退出時,變量依然存在,下次函數(shù)調(diào)用可以繼續(xù)使用
B)使用global保留字聲明簡單數(shù)據(jù)類型變量后,該變量作為全局變量使用
C)簡單數(shù)據(jù)類型變量無論是否與全局變量重名,僅在函數(shù)內(nèi)部創(chuàng)建和使用,函數(shù)退出后變量被釋放
D)全局變量指在函數(shù)之外定義的變量,一般沒有縮進,在程序執(zhí)行全過程有效
答案:A
解析:局部變量指在函數(shù)內(nèi)部使用的變量,當(dāng)函數(shù)退出時,變量即不存在。
IL[單選題]按照姓名降序排列()
A)ORDERBYDESCNAME
B)ORDERBYNAMEDESC
OORDERBYNAMEASC
D)ORDERBYASCNAME
答案:B
解析:
12.[單選題]我們建立一個5000個特征,100萬數(shù)據(jù)的機器學(xué)習(xí)模型我們怎么有效地應(yīng)對這樣的大數(shù)
據(jù)訓(xùn)練()
A)我們隨權(quán)晶取一些樣本,在這些少量樣本之上訓(xùn)練
B)我們可以試用在線機器學(xué)習(xí)算法
C)我們應(yīng)用PCA算法降雄,減少特征數(shù)
D)以上答案都正確
答案:D
解析:
13.[單選題]在過去,數(shù)據(jù)分析的目的之一是對未來進行預(yù)測。比如通過實時分析微博數(shù)據(jù),當(dāng)發(fā)現(xiàn)
人們對霧霾的討論明顯增加時,就可以建議銷售部門增加口罩的進貨量。這個案例體現(xiàn)了過去數(shù)據(jù)
分析的()
A)重視因果關(guān)系
B)抽樣的特性
C)精確的特性
D)全樣的特性
答案:A
解析:
14.[單選題](一)會周期性地通過Heartbet將本節(jié)點上資源的使用情況和任務(wù)的運行進度匯報給
JobTrackero
A)TaskTrack
B)Task
C)Client
D)JobTracker
答案:A
解析:
15.[單選題]啟動HBaSe需先在hbase∕conf∕目錄下修改的配置文件是()
A)hbase-env.sh
B)hbase-conf.sh
C)hbase-cmd.sh
D)hbase-file.sh
答案:A
解析:
16」單選題]DougCUtting所創(chuàng)立的項目的名稱都受到其家人的啟發(fā),以下項目不是由他創(chuàng)立的項目
是
Λ)Hadoop
B)Nutch
C)Lucene
D)Solr
答案:D
解析:A.Hadoop[DougCutting看到他兒子在牙牙學(xué)語時,抱著黃色小象,親昵的叫hadoop,他靈
光一閃,就把這技術(shù)命名為Hadoop]
B.Nutch【他的兒子在咿呀學(xué)語時,總把所有用于吃飯的詞叫成NUtCh納奇】
C.LUCene【Lucene露西是他妻子的中間名,也是她外祖母的名字】
D.Solr【YonikSeely約尼克?西利于2004年創(chuàng)建了SOlr饃了】
17.[單選題]有關(guān)數(shù)據(jù)倉庫的開發(fā)特點,不正確的描述是()。
A)數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)
B)數(shù)據(jù)倉庫使用的需求在開發(fā)初期就要明確
C)數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程,是啟發(fā)式的開發(fā)
D)在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)分析和處
理更靈活,且沒有固定的模式
答案:A
解析:數(shù)據(jù)倉庫開發(fā)要從需求出發(fā)。
18.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,在草稿狀態(tài)的集團家譜頁面,點擊【修訂模式
】后,選擇集團成員列表中的某一節(jié)點,點擊【新增】按鈕,在彈出的新增詳情頁面,點擊【引入
】按鈕,彈出該集團的待引入成員列表。集團成員引入列表中的企業(yè)為我行客戶,且為未納入當(dāng)前
集團統(tǒng)一管理的集團客戶,即集團圖譜中顯示為紫色的集團成員,狀態(tài)為O的集團客戶。
A)行內(nèi)客戶未認(rèn)定
B)B.核心企業(yè)
C)C.行內(nèi)客戶已認(rèn)定
D)D.行內(nèi)客戶認(rèn)定中
答案:A
解析:
19.[單選題]Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)
庫表,并提供()查詢功能,HiVe底層是將SQL語句轉(zhuǎn)換為()任務(wù)運行。
A)SQL、HQL
B)SQL、MapReduce
C)類SQL、SQL
D)類SQL、MapReduce
答案:D
解析:
20.[單選題]關(guān)于HDase的Region分裂流程Split的描述不正確的是
A)Split過程中并沒有真正的將文件分開,僅僅是創(chuàng)建了引用文件
B)SPlit為了咸少Region中數(shù)據(jù)大小,從而將一個Region分裂成兩個Region
Osplit過程中該表會暫停服務(wù)
D)split過程中被分裂的Region會暫停服務(wù)
答案:C
解析:
21.[單選題]圖像灰度方差說明了圖像的哪一個屬性O(shè)o
A)平均灰度
B)圖像對比度
C)圖像整體亮度
D)圖像細(xì)節(jié)
答案:B
解析:
22.[單選題]MapReduce的Shuffle過程中哪個操作是最后做的()。
A)溢寫
B)分區(qū)
C)排序
D)合并
答案:D
解析:
23.[單選題]以下哪個不是海量大數(shù)據(jù)的常用處理工具()
A)Hadoop
B)Excel
C)Spark
D)Hive
答案:B
解析:
24.[單選題]執(zhí)行以下代碼段my_tuple=(1,2,3,4)my_tuple.append((5,6,
7))Print(Ien(DIy_tuple))時,輸出為(____.)o
A)4
B)5
C)7
D)Error
答案:D
解析:
25.[單選題]以下()選項用于為視圖數(shù)據(jù)操作設(shè)置檢查條件。一
A)WITHCHECKOPTION
B)AS
OSQLSECURITY
D)ALGORITHM
答案:A
解析:
26.[單選題]在HBaSe的專用過濾器中,ColumnPaginationFilter?()
A)時間戳過濾器
B)包含結(jié)束的過濾器
C)列分頁過濾器
D)列計數(shù)過濾器
答案:C
解析:
27.[單選題]以下哪項不屬于圖像分割的內(nèi)容O
A)把不同類標(biāo)分開。
B)提取不同區(qū)域的特征。
C)識別圖像內(nèi)容,或?qū)D像進行分類。
D)對未處理圖像進行平滑。
答案:D
解析:
28.[單選題]假設(shè)您已在數(shù)據(jù)集上擬合了一個復(fù)雜的回歸模型現(xiàn)在,您正在使用Ridge回歸,并調(diào)整
參數(shù)人以減少其復(fù)雜性下面的描述哪個表達(dá)了偏差和方差與人的關(guān)系O
A)在λ非常小的情況下,偏差低,方差低
B)在λ非常小的情況下,偏差低,方差低高
C)在λ非常小的情況下,偏差高,方差低
D)在λ非常小的情況下,偏差低,方差低
答案:B
解析:
29.[單選題]機器學(xué)習(xí)算法在學(xué)習(xí)過程中對某種類型假設(shè)的偏好稱為()。
A)訓(xùn)練偏好
B)歸納偏好
C)分析偏好
D)假設(shè)偏好
答案:B
解析:
30.[單選題]概率密度函數(shù)服從正態(tài)分布的噪聲,叫做(_)。
A)泊松噪聲
B)高斯噪聲
C)乘性噪聲
D)椒鹽噪聲
答案:B
解析:
31.[單選題]大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)中的日志表Iog是一張分區(qū)表,分區(qū)鍵是
dt,每天產(chǎn)生一個分區(qū)用于存儲當(dāng)天新增的數(shù)據(jù),現(xiàn)在共有dt='2016010Γ至dt='2016013Γ共
31個分區(qū)的數(shù)據(jù),為了刪除20160101當(dāng)天新增的數(shù)據(jù),可以通過()方式實現(xiàn)。
A)deletefromlogwheredt='20160101,
B)truncatetablewheredt='20160101,
C)droppartitionlog(dt=*20160101,)
D)altertablelogdroppartition(dt='20160101,)
答案:D
解析:
32.[單選題]以下哪一種方法最適合在n(n>l)維空間中做異常點檢測
A)馬氏距離
B)正態(tài)分布圖
C)散點圖
D)盒圖
答案:A
解析:
33.[單選題]Hadoop的特性不包括()。
A)高可靠性
B)高效性
C)高可擴展性
D)低容錯性
答案:D
解析:
34.[單選題]國家電網(wǎng)有限公司數(shù)據(jù)管理辦法規(guī)定,公司()是數(shù)據(jù)管理工作的領(lǐng)導(dǎo)決策機構(gòu),
A)規(guī)章制度管理委員會
B)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組
C)互聯(lián)網(wǎng)部
D)大數(shù)據(jù)中心
答案:B
解析:
35.[單選題]下面哪個功能不是大數(shù)據(jù)平臺安全管理組件提供的功能()。
A)接口代理
B)接口認(rèn)證
C)接口授權(quán)
D)路由代理
答案:D
解析:
36.[單選題]MapReduce中.Shuffle操作的作用是()。
A)合并
B)排序
C)降雄
D)分區(qū)
答案:B
解析:
37.[單選題]下列哪種去噪方法能較好的保持圖像邊緣。()
A)、中值濾波
B)、雙邊濾波
C)、均值濾波
D)、高斯濾波
答案:A
解析:
38.[單選題]創(chuàng)建存儲過程,CREATEORREPLACEPROCEDUREproc_while_loop(maxvalin
integer)ASDECLARE1int:=maxval∕2;BEGINWHILEi<maxvalLOOPraiseinfo'%',i;i:
=i+l;ENDLOOP:END:下面循環(huán)語句在Messages內(nèi)的輸出是OCALLproc_while_loop(9);
A)5678
B)456789
C)56789
D)45678
答案:D
解析:
39.[單選題]以下屬于數(shù)據(jù)統(tǒng)計分析工具的是
A)NoSQL
B)SQL
OSPSS
D)MapReduce
答案:C
解析:
40.[單選題]Spark的特點不包括()。
A)速度快
B)通用性
C)易用性
D)單一操作性
答案:D
解析:
41.[單選題]第三次信息化浪潮標(biāo)志不包含以下哪項?
A)互聯(lián)網(wǎng)
B)云計算
C)物聯(lián)網(wǎng)
D)大數(shù)據(jù)
答案:A
解析:
42.[單選題]下列關(guān)于數(shù)據(jù)轉(zhuǎn)換,正確的是()。
A)Json內(nèi)的取值只能有統(tǒng)一格式
B)PDF文件在不同平臺上打開顯示不同
C)可以通過Python將CSV文件轉(zhuǎn)換成Excel格式
D)EXCeI存儲數(shù)據(jù)的量無限制
答案:C
解析:Json內(nèi)的取值可以有多種格式,PDF文件在不同平臺上打開顯示相同,Excel存儲數(shù)據(jù)的量在
EXCel2007及以后版本,一個工作表最多可有1048576行、16384列。
43.[單選題]云計算包括3種類型。面向所有用戶提供服務(wù),只要是注冊付費的用戶都可以使用,這
種云計算屬于:
A)公有云
B)私有云
C)混合云
D)獨立云
答案:A
解析:
44.[單選題]以下()不屬于MaXCOmPUte計算層的模塊。
A)0TS
B)Pangu
OFuxi
D)Nuwa
答案:A
解析:
45.[單選題]假設(shè)每個用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,Queue
A.minimum-user-1imit-percent=24o則以下說法錯誤的是:()。
A)第3個用戶提交任務(wù)時,每個用戶最多獲得33.33%的資源
B)第2個用戶提交任務(wù)時每個用戶最多獲得50%的資源
C)第4個用戶提交任務(wù)時,每個用戶最多獲得25%的資源
D)第5個用戶提交任務(wù)時,每個用戶最多獲得20%的資源
答案:D
解析:
46.[單選題]輸人圖片大小為37x37,經(jīng)過第一層卷積t(henumberoffiIterS=25,kernelsize=5川
,padding=valid,Stride=I)與池化層maxpooling(keIneISiZe=3x3,padding=valid),輸出特征圖
大小為()
A)IOxlO
B)llxll
C)12x12
D)13x13
答案:B
解析:
47.[單選題]下面O屬于風(fēng)險管理中的強數(shù)據(jù)。
A)征信數(shù)據(jù)
B)社保公積金數(shù)據(jù)
C)稅務(wù)工商數(shù)據(jù)
D)以上都是
答案:D
解析:
48.[單選題]有關(guān)MaPRedUce,下面哪個說法是正確的O
A)它提供了資源管理能力
B)它是開源數(shù)據(jù)倉庫系統(tǒng),用于查詢和分析存儲在HadooP中的大型數(shù)據(jù)集
C)它是HadoOP數(shù)據(jù)處理層
D)它是一個理想的數(shù)據(jù)處理框架,難以實現(xiàn)
答案:C
解析:
49.[單選題]采用主成分分析法映射到低維空間,將最小的d-d'個特征向量舍棄,產(chǎn)生的影響是()
A)使樣本采樣密度增大
B)丟失最優(yōu)解
C)增大噪聲
D)使樣本采樣密度減小
答案:A
解析:
50」單選題]2='ZedShaw'print(2)上述代碼的執(zhí)行結(jié)果為(一)。
A)2
B)ZedShaw
C)can'tassigntoliteral
D)invalidsyntax
答案:C
解析:
51.[單選題]HBase中數(shù)據(jù)存儲的文件格式是下面哪-項?
?)SequenceFiIe
B)Hfile
C)TextFile
D)HLog
答案:B
解析:
52.[單選題]下列方法中,可以將元組轉(zhuǎn)換為MUltiIndeX對象的是()。
A)from_tupl.es()
B)fromarrays()
C)from_product()
D)from_list()
答案:A
解析:
53.[單選題]RDD的特點不包括()。
A)RDD之間有依賴關(guān)系,可溯源
B)RDD由很多partition構(gòu)成
C)對RDD的每個split或partition做計算
D)RDD可以增量更新
答案:D
解析:
54.[單選題]以下關(guān)于分布式文件系統(tǒng),描述錯誤的是:()
A)是一種通過網(wǎng)絡(luò)實現(xiàn)文件在多臺主機上進行分布式存儲的文件系統(tǒng)
B)所有的分布式文件系統(tǒng)的設(shè)計都是采用“客戶機/服務(wù)器”(Client/Server)模式
C)谷歌開發(fā)了分布式文件系統(tǒng)GFSHadoop
D)分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)是針對GFS的開源實現(xiàn)
答案:B
解析:
55.[單選題]在HadOOP的解壓目錄下,通過執(zhí)行哪一項指令可以查看HadoOP的目錄結(jié)構(gòu)
A)jps
B)11
C)tar
D)find
答案:B
解析:通過“11”指令查看HadooP的目錄結(jié)構(gòu)
56.[單選題]在FlUme中,(__)指的是位于源與接收器之間的組件。
A)數(shù)據(jù)流
B)FlUme通道
C)FIUme攔截器
D)FIUme代理
答案:B
解析:
57.[單選題]HBase依靠()存儲底層數(shù)據(jù)。
A)HDFS
B)Hadoop
C)Memory
D)MapReduce
答案:A
解析:
58.[單選題]格式化日期的函數(shù)是()
A)DATEDIFFO
B)DATEFORMAT()
ODAY()
D)CURDATE()
答案:B
解析:
59.[單選題]泛在電力物聯(lián)網(wǎng)的總體架構(gòu)中,內(nèi)部用戶有作業(yè)層、管理層、()
A)執(zhí)行層
B)決策層
C)建議層
D)推送層
答案:B
解析:
60.[單選題]Kafka集群中,Kafka服務(wù)端的角色是:()。
A)Broker
B)Consumer
C)Zookeeper
D)Producer
答案:A
解析:
61.[單選題]下面不屬于網(wǎng)絡(luò)釣魚行為的是:()
A)黑客利用各種手段,可以將用戶的訪問引導(dǎo)到假冒的網(wǎng)站上
B)以銀行升級為誘餌,欺騙客戶點擊金融之家進行系統(tǒng)升級
C)網(wǎng)購信息泄露,財產(chǎn)損失
D)用戶在假冒的網(wǎng)站上輸入的信用卡號都進入了黑客的銀行
答案:C
解析:
62.[單選題](_)是事先將訓(xùn)練樣本存儲下來,然后每當(dāng)遇到一個新增樣本,學(xué)習(xí)系統(tǒng)分析此樣本與
以前存儲樣本之間的關(guān)系,并據(jù)此把一個目標(biāo)函數(shù)值賦給新增樣本。
A)基于實例學(xué)習(xí)
B)遺傳算法
C)人工神經(jīng)網(wǎng)絡(luò)
D)歸納學(xué)習(xí)
答案:A
解析:
63.[單選題]下面關(guān)于數(shù)據(jù)科學(xué)中機器學(xué)習(xí)思路相關(guān)描述不正確的有(_)。
A)測試集為輸入
B)機器學(xué)習(xí)算法來學(xué)習(xí)
C)用函數(shù)比較算法估計目標(biāo)函數(shù)
D)現(xiàn)有或部分?jǐn)?shù)據(jù)為訓(xùn)練集
答案:A
解析:
64.[單選題]Choice函數(shù)屬于()函數(shù)
A)文本函數(shù)
B)數(shù)值函數(shù)
C)邏輯函數(shù)
D)集合函數(shù)
答案:C
解析:
65.[單選題]通常使用以下哪一種方式度量文本之間的相似度()
A)歐氏距離
B)余弦相似度
C)漢明距離
D)杰卡德相似度
答案:B
解析:
66.[單選題](_)是指為最小化總體風(fēng)險,只需在每個樣本上選擇能使特定條件風(fēng)險最小的類別標(biāo)
記。
A)支持向量機
B)間隔最大化
C)線性分類器
D)貝葉斯判定準(zhǔn)則
答案:D
解析:
67.[單選題]對參數(shù)進行L2正則,是機器學(xué)習(xí)常用的防止過擬合的方法。請問對參數(shù)做L2正則,是對
參數(shù)本身做了哪些先驗分布假設(shè)?
A)高斯分布
B)拉普拉斯分布
C)泊松分布
D)均勻分布
答案:A
解析:
68.[單選題]Hive適合()環(huán)境
A)Hive
B)提供實時查詢功能
C)適合應(yīng)用在大量不可變數(shù)據(jù)的批處理作業(yè)
D)Hive
答案:C
解析:
69.[單選題]type(LO)的結(jié)果為(—)。
A)class'int'
B)class'float'
C)class'complex'
D)class'bool'
答案:B
解析:
70.[單選題]()是指理解挖掘項目的目標(biāo)業(yè)務(wù)需求。
A)業(yè)務(wù)理解
B)數(shù)據(jù)理解
C)數(shù)據(jù)準(zhǔn)備
D)數(shù)據(jù)建模
答案:A
解析:根據(jù)跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程(CroSS-industrystandardprocessfordatamining,
CRISP-DM)模型,業(yè)務(wù)理解是指從業(yè)務(wù)的角度了解項目的要求和最終目的,并將這些目的與數(shù)據(jù)挖
掘的定義以及結(jié)果結(jié)合起來。
71.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,系統(tǒng)在【大數(shù)據(jù)貸后預(yù)警處置】菜單下設(shè)置【
待處置】、【處置中】等4個節(jié)點。其中,用戶在()節(jié)點可對審批通過的客戶查看其預(yù)警信號詳情
、客戶信息、審批通過意見、影像資料等。
A)待處置
B)B.處置中
C)C.退回
D)D.處置完成
答案:D
解析:
72.[單選題]Spark核心層主要關(guān)注()問題。
A)存儲
B)計算
C)傳輸
D)連接
答案:B
解析:SPark核心層定義,Spark核心層主要關(guān)注計算問題。
73.[單選題]留出法直接將數(shù)據(jù)集劃分為()個互斥的集合。
A)-
B)二
OS
D)四
答案:B
解析:留出法(hold-out)直接將數(shù)據(jù)集D劃分為兩個互斥的集合,其中一個集合作為訓(xùn)練集,另一個作
為測試集T。
74.[單選題]下面算法屬于局部處理的是。。
A)灰度線性變換
B)二值化
C)傅里葉變換
D)中值濾波
答案:D
解析:
75.[單選題]后剪枝過程(—)地對樹中的所有非葉節(jié)點進行逐一考察,其訓(xùn)練時間開銷比未剪枝
決策樹和預(yù)剪枝決策樹要(—)得多。
A)自頂向下,小
B)自頂向下,大
C)自底向上,大
D)自底向上,小
答案:C
解析:
76.[單選題Ifusioninsightmanager對于管理操作,下列錯誤的是?
A)可對服務(wù)進行啟停重啟
B)可以添加和卸載服務(wù)
C)可設(shè)置不常用服務(wù)隱藏或顯示
D)可查看服務(wù)的當(dāng)前狀態(tài)
答案:C
解析:
77.[單選題]在PythOn3中代碼為my_input=input('enteranumber:'),則type(my_input)為
(一)o
A)class'int'
B)class'float'
C)class'str'
D)class'bool'
答案:C
解析:
78.[單選題]在SPark技術(shù)中,(_)操作需要將數(shù)據(jù)進行重新聚合和劃分,然后分配到集群的各個
節(jié)點上進行下一個Stage操作,這里會涉及集群不同節(jié)點間的大量數(shù)據(jù)交換。
A)Scheduler
B)Shuffle
C)Storage
D)RDD
答案:B
解析:
79.[單選題](_)中基學(xué)習(xí)器的多樣性不僅來自樣本擾動,還來自屬性擾動。
A)AdaBoost
B)RF
OBagging
D)傳統(tǒng)決策樹
答案:B
解析:
80.[-^?i?^]python3≠round(15.5)與round(16.5)的結(jié)果分別為()。
A)16,16
B)16,17
017,16
D)17,17
答案:A
解析:
81.[單選題]下面代碼的輸出結(jié)果是:X=12.34print(type(x))
A)<class'int'>
B)<class'float1>
C)<class'bool'>
D)<class'complex'>
答案:B
解析:
82.[單選題](一)是在云計算環(huán)境中部署和虛擬化的關(guān)系數(shù)據(jù)庫,進而使傳統(tǒng)關(guān)系數(shù)據(jù)庫具備云計
算的主要優(yōu)勢。
A)NoSQL
B)NewSQL
C)關(guān)系云
D)SQL數(shù)據(jù)庫
答案:C
解析:
83.[單選題]下列說法錯誤的是()
A)PartitiOner負(fù)責(zé)控制map輸出結(jié)果key的分割
B)RePOrter用于MaPRedUCe應(yīng)用程序報告進度
C)OUtPUtColIeCtor收集MaPPer或RedUCer輸出數(shù)據(jù)
D)RedUCe的數(shù)目不可以是0
答案:D
解析:reduee的數(shù)目可以是0。有些作業(yè)不需要進行歸約進行處理,那么就可以設(shè)置reduce的數(shù)量為
0來進行處理,這種情況下用戶的作業(yè)運行速度相對較高,map的輸出會直接寫入到
SetOUtPUtPath(Path)設(shè)置的輸出目錄,而不是作為中間結(jié)果寫到本地。同時HadoOP框架在寫入文件
系統(tǒng)前并不對之進行排序。
84.[單選題]Redis中String數(shù)據(jù)類型不含以下哪種操作?
A)Mget
B)size
C)Strlen
D)append
答案:B
解析:
85.[單選題]利用到每個聚類中心和的遠(yuǎn)近判斷離群值的方法,可以基于的算法為。
A)KMeans
B)KNN
OSVM
D)LinearRegression
答案:A
解析:
86.[單選題]HBase提供的比較過濾器中,不屬于比較運算符的有()
A)LESS_OR_EQUAL
B)EQUALS
ONOTEQUAL
D)GREATERj)R_EQUAL
答案:B
解析:
87.[單選題]數(shù)據(jù)的原始內(nèi)容及其備份數(shù)據(jù)是數(shù)據(jù)產(chǎn)品研發(fā)的()。
A)零次數(shù)據(jù)
B)一次數(shù)據(jù)
C)二次數(shù)據(jù)
D)采集數(shù)據(jù)
答案:A
解析:零次數(shù)據(jù)是數(shù)據(jù)的原始內(nèi)容及其備份數(shù)據(jù),如各種感知儀器設(shè)備中直接生成的數(shù)據(jù)。零次數(shù)據(jù)
中往往存在缺失值、噪聲、錯誤或虛假數(shù)據(jù)等質(zhì)量問題。
88.[單選題]下面程序中最后X_trainJninmaX值為多少()>?X_train=np.array([[1.,-1.,
2.],...[2.,0.,0.],...[0.,1.,-L]])...>?min_max_scaler=
preprocessing.MinMaxScalerOXtrain_minmax=minmax_scaler.fittransform(Xtrain)
A)array([E0.,0.,1.1,L1,,0.5,0.33333333],L0.5,1,,0.]])
B)array([[0.5,0.,0.],[1.,0.5,0.33333333],[0.,1.,1.1])
C)array([[0,5,0,,1.L[1.,0.5,0.33333333],[0.,1.,0.]])
D)array([[0.5,0.,1.],[1.,0.5,0.],[0.,1.,0.1])
答案:c
解析:
89.[單選題]下列哪一個不屬于HadooP的大數(shù)據(jù)層的功能?
A)數(shù)據(jù)挖掘
B)離線分析
C)實時計算
D)Bl分析
答案:C
解析:
90.[單選題]采用主成分分析法映射到低維空間,將最小的d-d'個特征向量舍棄,產(chǎn)生的影響是
()。
A)使樣本采樣密度增大
B)丟失最優(yōu)解
C)增大噪聲
D)使樣本采樣密度減小
答案:A
解析:低維空間與原始高維空間必有不同,因為對應(yīng)于最小的d-d'個特征值的特征向量被舍棄了
,這是降維導(dǎo)致的結(jié)果,但舍棄這部分信息往往是必要的。一方面舍棄這部分信息之后能使樣本的
采樣密度增大,這正是降維的重要動機;另一方面,當(dāng)數(shù)據(jù)受到噪聲影響時,最小的特征值所對應(yīng)
的特征向量往往與噪聲有關(guān)。將它們舍棄能在一定程度上起到去噪的效果。
91.[單選題]云計算平臺層(PaaS)指的是什么?
A)操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù)
B)將基礎(chǔ)設(shè)施(計算資源和存儲)作為服務(wù)出租
C)從一個集中的系統(tǒng)部署軟件,使之在一臺本地計算機上(或從云中遠(yuǎn)程地)運行的一個模型
D)提供硬件、軟件、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施以及提供咨詢、規(guī)劃和系統(tǒng)集成服務(wù)
答案:A
解析:
92.[單選題]Mapper排序后的輸出將作為下面哪個的輸入()
A)Reducer
B)Mapper
OShuffle
D)Sort
答案:A
解析:
93.[單選題]pipinstallDjango==L7與PiPinstallDjango兩者的區(qū)別是(__)0
A)兩者作用一樣
B)前者安裝指定版本的包后者安裝最新版本的包
C)前者安裝指定版本的包后者安裝隨機版本的包
D)以上都不對
答案:B
解析:
94.[單選題]下列關(guān)于Ll正則化與L2正則化的描述,錯誤的是()
A)L1范數(shù)正則化有助于降低過擬合風(fēng)險
B)L2范數(shù)正則化有助于降低過擬合風(fēng)險
C)Ll范數(shù)正則化比L2范數(shù)正則化更有易于獲得稀疏解
D)L2范數(shù)正則化比Ll范數(shù)正則化更有易于獲得稀疏解
答案:C
解析:
95.[單選題]對于一個圖像識別問題(在一張照片里找出一只貓),下面哪種神經(jīng)網(wǎng)絡(luò)可以更好地解決
這個問題?。
A)循環(huán)神經(jīng)網(wǎng)絡(luò)
B)感知機
C)多層感知機
D)卷積神經(jīng)網(wǎng)絡(luò)
答案:D
解析:
96.[單選題]聚類算法屬于(_)。
A)半監(jiān)督學(xué)習(xí)
B)有監(jiān)督學(xué)習(xí)
C)無監(jiān)督學(xué)習(xí)
D)一種分類方法
答案:C
解析:
97.[單選題]HBASE中使用的壓縮算法是O
A)gzip
B)LZO
C)Snappy
D)ZAPPY
答案:C
解析:
98.[單選題]如果字符串中有*需要匹配,需要輸入的正則表達(dá)式為()。
A)?*
B)??*
0*
D)(*)
答案:A
解析:*用在匹配前面的子表達(dá)式零次或多次;要匹配*字符,請使用\*進行轉(zhuǎn)義。
99.[單選題]從連續(xù)圖像到數(shù)字圖像需要采取的措施是()。
A)圖像灰度級設(shè)定
B)圖像分辨率設(shè)定
C)確定圖像的存儲空間
D)采樣和量化
答案:D
解析:數(shù)字圖像又稱離散圖像,連續(xù)圖像到數(shù)字圖像需要離散化,離散化是通過采樣和量化實現(xiàn)的。
IOo.[單選題]np.Setdiffld(Ndarrayl,Ndarray2)函數(shù)的作用是()□
A)返回二者的交集并排序
B)返回二者的并集并排序
C)返回二者的差集
D)返回二者的對稱差
答案:C
解析:intersectld()返回二者的交集并排序,Unionld()返回二者的并集并排序,
Np.Setdiffld()返回二者的差集,np.Setxorld()返回二者的對稱差。
297
IOL[單選題]SQL語句中聚合函數(shù)求數(shù)據(jù)總和的是
A)MAX
B)SUM
OCOUNT
D)AVG
答案:B
解析:
■2.[單選題]DataFrame和RDD最大的區(qū)別是()。
A)科學(xué)統(tǒng)計支持
B)多了schema
C)存儲方式不一樣
D)外部數(shù)據(jù)源支持
答案:B
解析:相比于RDD,DataFrame多了數(shù)據(jù)的結(jié)構(gòu)信息,即schemao
103.[單選題]數(shù)據(jù)整合和分組的說法,不正確的是()
A)數(shù)據(jù)連接可以用COnCat或merge函數(shù)
B)axiS=I表示軸向連接
C)數(shù)據(jù)分組可以使用mean函數(shù)
D)使用agg可以自定義多個聚合函數(shù)
答案:C
解析:
104.[單選題]為了允許支持向量機在一些樣本上出錯,引人()的概念
A)軟間隔
B)硬間隔
C)間隔
D)誤差
答案:A
解析:
105.[單選題]()主要提供內(nèi)存計算框架。
A)Spark核心層
B)資源計算層
C)服務(wù)核心層
D)Spark層
答案:A
解析:
106.[單選題]下列關(guān)于Matplotlib中繪圖標(biāo)準(zhǔn)流程的說法錯誤的是()。
A)繪制最簡單的圖形可以不用創(chuàng)建畫布
B)添加圖例可以在繪制圖形之前
C)添加X軸、y軸的標(biāo)簽可以在繪制圖形之前
D)修改X軸標(biāo)簽、y軸標(biāo)簽和繪制圖形沒有先后
答案:B
解析:繪制圖例需要在繪制圖形之后。
107.[單選題]下列語句在Python中非法的是()。
A)x=y=z=l
B)X=(y=z+l)
C)x,y=y,X
D)x+=y
答案:B
解析:賦值語句不能用于賦值。
108.[單選題]根據(jù)數(shù)據(jù)管理計劃,設(shè)計或選擇具體方法實行計劃中的工作內(nèi)容,屬于數(shù)據(jù)治理的哪一
步()
A)計劃
B)執(zhí)行
C)檢查
D)改進
答案:B
解析:
109.[單選題]下列關(guān)于模型能力(modelcapaCity指神經(jīng)網(wǎng)絡(luò)模型能擬合復(fù)雜函數(shù)的能力)的描述,正
確的是()
A)隱藏層層數(shù)增加,模型能力增加
B)DroPoUt的比例增加,模型能力增加
C)學(xué)習(xí)率增加,模型能力增加
D)都不正確
答案:A
解析:
110.[單選題]關(guān)于FUSionlnSightHDStreaming客戶端的SUPerViSor描述正確的是?
A)SUPerViSOr負(fù)責(zé)資源分配和資源調(diào)度
B)SUPerViSor負(fù)責(zé)接管Nimbus分配的任務(wù),啟動和停止屬于自己管理的WOrker進程
OSupervisor是運行具體處理邏輯的進程
D)SUPerViSOr是一個ToPOIogy中接收數(shù)據(jù)然后執(zhí)行處理的組件
答案:B
解析:
IlL[單選題]執(zhí)行以下代碼段classA:defone(self):returnself,two()deftwo(self):
return'A'classB(A):deftwo(self):return'B'objl=A()obj2=B()print(objl.two(),
Obj2.two())時,輸出為()o
A)AA
B)AB
OBB
D)BA
答案:B
解析:
112.[單選題]國網(wǎng)信通產(chǎn)業(yè)集團、南瑞集團、國網(wǎng)能源院、中國電科院、聯(lián)研院等單位是公司數(shù)據(jù)
資產(chǎn)管理的O,按照公司數(shù)據(jù)資產(chǎn)管理的要求開展工作。
A)上層機構(gòu)
B)并行機構(gòu)
C)支撐機構(gòu)
D)連接機構(gòu)
答案:C
解析:
113.[單選題]在HBaSe系統(tǒng)架構(gòu)中,()使用的一種主選舉方式,使用集群中最少的節(jié)點數(shù)用來選
舉
A)Client
B)ZooKeeper
OHMaster
D)HRegionServer
答案:B
解析:
114.[單選題]下列關(guān)于數(shù)據(jù)的說法,正確的是()
A)數(shù)據(jù)科學(xué)中樣本和特征是同一個概念
B)布爾型特征有兩個取值
C)名義型特征可以比大小
D)離散型特征可以在空間中任意取值
答案:B
解析:
115.[單選題]np.InUItiPIy([[1,2,3],[1,2,3],[1,2,3]],[[2,1,1],[2,1,1],[2,
1,1]])的結(jié)果是多少?
A)[[1266][1266]L1266]]
B)[:211][211][211]]
C)[[223][223][223]]
D)[[123][123][123]]
答案:C
解析:
116.[單選題]泛在電力物聯(lián)網(wǎng)建設(shè)堅持頂層設(shè)計和O相結(jié)合,鼓勵基層單位因地制宜,先行先試
A)基層創(chuàng)新
B)集約建設(shè)
C)共建共享
D)繼承發(fā)展
答案:A
解析:
117.[單選題]關(guān)于批量處理數(shù)據(jù)組件的描述不正確的時?
A)SparkSql,新型SQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。
B)SPark新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學(xué)習(xí)批處理作業(yè),適合海
量數(shù)據(jù),樹立速度高效。
OMapReduce,傳統(tǒng)批處理引擎,用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學(xué)習(xí)批處理作業(yè),使用
廣泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。
D)Hive,傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處
理速度較慢。
答案:C
解析:
118.[單選題]假設(shè)每個用戶最低資源保障設(shè)置為yarn,scheduler,capacity,
root,QUeUeA.minimum-userTimit-PerCent=24。則以下說法錯誤的是?
A)第3個用戶提交任務(wù)時,每個用戶最多獲得33.33%的資源
B)第2個用戶提交任務(wù)時,每個用戶最多獲得50%的資源
C)第4個用戶提交任務(wù)時,每個用戶最多獲得25%的資源
D)第5個用戶提交任務(wù)時,每個用戶最多獲得20%的資源
答案:D
解析:
119.[單選題]現(xiàn)有一張score表,我想要實現(xiàn)先按照班級class_name進行分桶,再按照學(xué)生學(xué)號
stu_id進行升序排序,下列語句書寫正確的是()
A)SELECTFROMscoreCLUSTERBYclass_name,stu_id;
B)SELECTFROMscoreCLUSTERBYclass_namesortbystu_idasc;
C)SELECTFROMscoreDISTRIBUTEBYclass_nameSORTBYstu_id;
D)SELECTFROMscoreDISTRIBUTEDBYclass_nameSORTBYstu_idasc;
答案:C
解析:
120.[單選題]以下哪種文件以二進制格式寫入和讀取的模式(.J0
A)wb+
B)w
Owb
D)w+
答案:A
解析:
121.[單選題]MaxCompute的使用限制包括:()。
A)字符串格式的列內(nèi)容不能超過2M
B)單個任務(wù)引用的資源總計字節(jié)數(shù)不能超過64M
C)單個任務(wù)中自定義的COUnter不能超過64個
D)單個任務(wù)引用的資源個數(shù)不能超過512個
答案:B
解析:
122.[單選題]當(dāng)J一)過高,會出現(xiàn)過擬合現(xiàn)象
A)偏差
B)方差
C)噪聲
D)泛化誤差
答案:B
解析:
123.[單選題]對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,下列說法正確的是()
A)需要將這些樣本全部強制轉(zhuǎn)換為支持向量
B)需要將這些樣本中可以轉(zhuǎn)化的樣本轉(zhuǎn)換為支持向量,不能轉(zhuǎn)換的直接劇除
C)移去或者減少這些樣本對分類結(jié)果沒有影響
D)以上都不對
答案:C
解析:
124.[單選題]一個輸入為(32,32,3)的數(shù)據(jù)集,通過一個卷積核個數(shù)為8,大小為5*5,步長為
1的卷積層,輸出()。
A)(28,28,8)
B)(27,27,8)
C)(28,28,3)
D)(27,27,3)
答案:A
解析:
125.[單選題]在FUSionInSightManager界面中,對LOader的操作不包括下列哪個選項?
A)切換LOader主備節(jié)點
B)啟動Loader實例
C)配置LOader參數(shù)
D)查看Loader服務(wù)狀態(tài)
答案:A
解析:
126.[單選題]Hbase的某張表的ROWKey劃分SPlitkey為9.E.a.z.請問表里面有()個Region。
A)6
B)5
04
D)3
答案:B
解析:
127.[單選題]Zookeeper的基本操作是一組豐富的“構(gòu)件”,可用于實現(xiàn)多種協(xié)調(diào)數(shù)據(jù)結(jié)構(gòu)和
(—)0
A)協(xié)議
B)算法
C)查詢操作
D)讀寫操作
答案:A
解析:
128.[單選題]下列PythOn語句正確的是()
A)min=xifx<yelsey
B)max=x>y?x:y
C)if(x>y)printX
D)whileTrue:pass
答案:D
解析:
129.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,財務(wù)智能分析模塊,【財務(wù)科目異動分析】
頁面的左上角圖表部分,最多支持O種財務(wù)科目的圖表分析,超過3種后,再次選擇則予以提示。
A)l
B)B.3
0C.30
D)D.50
答案:B
解析:
130.[單選題]一個gzip文件大小75MB,客戶端設(shè)置BIoCk大小為64MB,請我其占用幾個BIOCk?
A)l
B)2
03
D)4
答案:B
解析:常識題?
131.[單選題]假設(shè)一行數(shù)據(jù)內(nèi)容有1列字段內(nèi)容是不定長字符串STR:"...I張山:23歲I李四:27歲
I王五:29歲I.....I劉N:T歲I......請使用hive的函數(shù)解析出"李四"的年齡。
A)str_to_map(STR,李四']
B)str_to_map(STR,李四']
C)finCLin_set(STR,'李四
D)find_in_set(STR,'李四','','I')
答案:B
解析:
132.[單選題]執(zhí)行以下代碼段a=3b=4print(a∕b)時,輸出為(____)0
A)0
B)0.75
Ol
D)3
答案:B
解析:
133.[單選題]Zookeeper能夠確保()
A)所有namenode都是活動的,為客戶端請求提供服務(wù)
B)當(dāng)任何一個datanode失效時,觸發(fā)故障轉(zhuǎn)移
C)僅有一個namenode是活動的,為客戶端請求提供服務(wù)
D)HadOoP超級管理員不能啟動故障轉(zhuǎn)移
答案:B
解析:
134.[單選題]下列哪種去噪方法能較好的保持圖像邊緣。O
A)中值濾波
B)雙邊濾波
C)均值濾波
D)高斯濾波
答案:A
解析:
135.[單選題]RDD的()算子會會觸發(fā)執(zhí)行,向SPark引擎提交,生成一個job,并返回相應(yīng)的結(jié)果。
A)創(chuàng)建
B)轉(zhuǎn)換
C)控制
D)執(zhí)行
答案:D
解析:
136.[單選題]np.VSPIit()函數(shù)的作用是(一)。
A)沿著它的水平軸分割
B)沿著縱向的軸分割
C)允許指定沿哪個軸分割
D)按深度方向分割
答案:B
解析:
137.[單選題]LSTM中門的輸出是()之間的實數(shù)向量。
A)O到1
B)I到T
C)O到T
D)I到2
答案:A
解析:
138.[單選題]在很長一段時間內(nèi),下列關(guān)于人工智能研究領(lǐng)域的說法中錯誤的是()
A)一部分研究人員堅持采用傳統(tǒng)的人工智能方法解決問題,簡單來說就是模仿人。
B)一部分研究人員倡導(dǎo)數(shù)據(jù)驅(qū)動。
C)“模仿人”的原因之一是可獲取的數(shù)據(jù)太多,無法處理
D)大數(shù)據(jù)時代,強調(diào)以數(shù)據(jù)為中心
答案:C
解析:
139.[單選題]在支持向量機中,核函數(shù)的主要作用是(一)o
A)將低維空間中線性不可分的數(shù)據(jù)映射到高維空間,使其線性可分
B)將高維空間中線性不可分的數(shù)據(jù)映射到低維空間,使其線性可分
C)將高維空間中線性可分的數(shù)據(jù)映射到低維空間,使其線性不可分
D)將低維空間中線性可分的數(shù)據(jù)映射到高維空間,使其線性不可分
答案:A
解析:
140.[單選題]在SPark中()是工作節(jié)點上運行的一組計算進程。
A)DAGScheduler
B)TaskScheduler
C)Executor
D)ClusterManager
答案:C
解析:
141.[單選題]數(shù)據(jù)故事話的‘情景'不包括0。
A)還原情景
B)統(tǒng)計情景
C)移植情景
D)虛構(gòu)情景
答案:B
解析:數(shù)據(jù)的故事化描述(Storytening)是指為了提升數(shù)據(jù)的可理解性、可記憶性及可體驗性,將“數(shù)
據(jù)"還原成關(guān)聯(lián)至特定的"情景"的過程。由此可見,數(shù)據(jù)故事化也是數(shù)據(jù)轉(zhuǎn)換的表現(xiàn)形式之一,其本質(zhì)
是以"故事講述"的方式展現(xiàn)"數(shù)據(jù)的內(nèi)容數(shù)據(jù)故事化中的"情景",可以是:①還原情景;還原數(shù)據(jù)所
計量和記錄信息時的"原始情景②移植情景;并非對應(yīng)信息的原始情景,而是將數(shù)據(jù)移植到另一個真
實發(fā)生的情景(如目標(biāo)用戶比較熟悉的情景)之中;③虛構(gòu)情景:數(shù)據(jù)的故事化描述中所選擇的情景并
非為真實存在的情景,而是根據(jù)講述人的想象力設(shè)計出來的"虛構(gòu)情景"。
142.[單選題]為提高計算性能,Spark中TranSfOrmation操作采用的是()計算模式。
A)活性
B)惰性
C)實時
D)非實時
答案:C
解析:
143.[單選題]以下哪個不屬于數(shù)據(jù)治理的內(nèi)容
A)理解自己的數(shù)據(jù)
B)行為規(guī)范的制定
C)崗位職責(zé)的定義
D)獲得更多的數(shù)據(jù)
答案:D
解析:
144.[單選題]下列哪個項目屬于機器算法中的有無監(jiān)督學(xué)習(xí)
A)圖像的貓狗分類任務(wù)
B)圖結(jié)點的聚類算法
C)良性或惡性腫瘤預(yù)測
D)社交網(wǎng)絡(luò)中用戶的情感分析
答案:B
解析:
145.[單選題]Kafka中數(shù)據(jù)從ProdUCer到Broker和Broker到Consumer分別是那種傳遞方式
A)pullpush
B)pullpull
C)pushpush
D)pushpull
答案:D
解析:
146.[單選題]用二維表結(jié)構(gòu)表達(dá)實體集的模型是(一)。
A)層次模型
B)網(wǎng)狀模型
C)關(guān)系模型
D)概念模型
答案:C
解析:
147.[單選題]關(guān)于字符串下列說法錯誤的是
A)字符應(yīng)該視為長度為1的字符串
B)字符串以?n標(biāo)志字符串的結(jié)束
C)既可以用單引號,也可以用雙引號創(chuàng)建字符串
D)在三引號字符串中可以包含換行回車等特殊字符
答案:B
解析:
148.[單選題]下列關(guān)于存儲過程的特點說法正確的是()
A)編寫的SQL存儲在數(shù)據(jù)庫中,因此執(zhí)行速度快。
B)創(chuàng)建時編譯,執(zhí)行時調(diào)用,因此開發(fā)效率高。
C)用戶創(chuàng)建的存儲過程或自定義函數(shù)可以重復(fù)調(diào)用,因此數(shù)據(jù)傳輸量少。
D)通過指定存儲過程的訪問權(quán)限,因此安全系數(shù)高。
答案:D
解析:
149.[單選題]下列關(guān)于半監(jiān)督支持向量機說法錯誤的是(_)。
A)半監(jiān)督支持向量機是針對二分類問題的學(xué)習(xí)算法
B)半監(jiān)督支持向量機尋求一個在所有樣本上間隔最小化的劃分超平面
C)半監(jiān)督支持向量機采用局部搜索來迭代地尋找其優(yōu)化問題的近似解
D)半監(jiān)督支持向量機試圖考慮對未標(biāo)記樣本進行各種可能的標(biāo)記指派
答案:B
解析:
150.[單選題]相關(guān)關(guān)系是一種與函數(shù)關(guān)系區(qū)別的非確定性關(guān)系,而相關(guān)分析就是研究事物或現(xiàn)象之
間是否存在這種非確定性關(guān)系的統(tǒng)計方法,以下不屬于相關(guān)性分析方法的是()。
A)Pearson相關(guān)系數(shù)
B)SPearman秩相關(guān)系數(shù)
C)KendaII相關(guān)系數(shù)
D)傅里葉系數(shù)
答案:D
解析:傅里葉系數(shù)由FOUriercoefficient翻譯而來,有多個中文譯名。它是數(shù)學(xué)分析中的一個概念
,常常被應(yīng)用在信號處理領(lǐng)域中。對于任意的周期信號,如果滿足一定條件,都可以展開三角函數(shù)的線
性組合,每個展開項的系數(shù)稱為傅里葉系數(shù),不能用于解釋相關(guān)性。
151.[單選題]大數(shù)據(jù)時代,數(shù)據(jù)使用的關(guān)鍵是O0
A)數(shù)據(jù)收集
B)數(shù)據(jù)存儲
C)數(shù)據(jù)分析
D)數(shù)據(jù)再利用
答案:D
解析:
152.[單選題]O向用戶提供辦公軟件、工作流等服務(wù),使軟件提供商從軟件產(chǎn)品的生產(chǎn)者轉(zhuǎn)變成
服務(wù)的運營者
A)Iaas
B)Paas
C)Saas
D)Daas
答案:C
解析:
153.[單選題]對于一組數(shù)據(jù)(1,2,2,NAN,4),若采用眾數(shù)法補全缺省值,貝IINAN該補為()。
A)l
B)1.8
04
D)2
答案:D
解析:
154.[單選題]以下哪一項不是SPark框架可用的數(shù)據(jù)源?
A)IndexFS
B)HDFS
0S3
D)Cassandra
答案:A
解析:
155.[單選題]如果想刪除整個字符串使用
A)list
B)count
Odel
D)Ien
答案:C
解析:
156.[單選題]圖像挖掘中常用卷積神經(jīng)網(wǎng)絡(luò)(DNN)作為基礎(chǔ)結(jié)構(gòu),以下關(guān)于卷積操作(ConV)和
池化(pooling)的說法正確的是?
A)ConV基于平移不變性,POoling基于局部相關(guān)性
B)ConV和POoling都基于平移不變性
C)ConV基于局部相關(guān)性,PoOling基于平移不變性
D)COnV和PooIing都基于局部相關(guān)性
答案:A
解析:
157.[單選題]在MaPRedUCe計算架構(gòu)中,()組件運行在NameNode節(jié)點上,提供集群資源的分配和工
作調(diào)度管理。
A)Client
B)JobTracker
C)TaskTracker
D)Task
答案:B
解析:
158.[單選題]在HBaSe中,檢查表是否啟用的命令是()
A)is_enabled'my_ns:my_table'
B)is_abled'my_ns:my_table'
C)isenabled'my_ns:my_table'
D)isabled'my_ns:my_table'
答案:A
解析:
159.[單選題]下列關(guān)于神經(jīng)網(wǎng)絡(luò)的說法中:①增加神經(jīng)網(wǎng)絡(luò)層數(shù),可能會增加測試數(shù)據(jù)集的分類錯誤
率;②減少神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小測試數(shù)據(jù)集的分類錯誤率;③增加神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小
訓(xùn)練數(shù)據(jù)集的分類錯誤率,正確的是()
A)①
B)①③
C)①②
D)②
答案:A
解析:
160.[單選題]下列關(guān)于TF-IDF的說法正確的是()。
A)該值與特征項在文檔中出現(xiàn)的頻率成反比
B)該值與特征項在文檔中出現(xiàn)的頻率成正比
C)該值與在整個語料庫中出現(xiàn)該特征項的文檔庫成正比
D)該值與特征項在文檔中出現(xiàn)的頻率無關(guān)
答案:B
解析:TFTDF是一種用于信息檢索與數(shù)據(jù)挖掘的常用加權(quán)技術(shù),TF是詞頻(Term
Frequency),IDF是逆文本頻率指數(shù)(InverseDocumentFrequency)oTF-IDF是一種統(tǒng)計方法
,用以評估一字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著
它在文件中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。A中應(yīng)是
成正比,C中應(yīng)是成反比,B正確。
161.[單選題]在FUSiOnlnSight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的ToPiC,以下哪些描述是正確的?
A)在創(chuàng)建Kafka的TOPiC時,必須設(shè)置Partition個數(shù)
B)在創(chuàng)建Kafka的ToPiC時,必須設(shè)置Partition副本個數(shù)
C)設(shè)置多副本可以增強Kafka服務(wù)的容災(zāi)能力
D)以上全都正確
答案:C
解析:
162.[單選題]請選擇計算231T的PythOn表達(dá)式:
A)power(2,31)-1
B)2^31-l
C)231-l
D)2(31)-l
答案:C
解析:
163.[單選題]下列關(guān)于數(shù)據(jù)的說法,不正確的是()
A)數(shù)據(jù)的類別有多種多樣
B)數(shù)據(jù)庫中的一列代表一個特征
C)一組數(shù)據(jù)平均值不會受異常值影響
D)數(shù)據(jù)點之間的距離滿足d_ij+d_jk>d_ik
答案:C
解析:
164.[單選題]卷積神經(jīng)網(wǎng)絡(luò)中池化層的作用是()。
A)尋找圖像中的細(xì)節(jié)特征
B)輸入圖片
C)減少下一層的計算,防止過擬合
D)輸出圖片
答案:C
解析:
165.[單選題]某工程師正在開發(fā)EaStiCSearCh應(yīng)用,請問下列代碼可以幫助他實現(xiàn)什么功能?
A)刪除素引
B)創(chuàng)建素引
C)維護索引
D)更新素引
答案:A
解析:
166.[單選題]CART決策樹使用“基尼指數(shù)”來選擇劃分屬性時,使劃分后基尼指數(shù)O的屬性為最
優(yōu)劃分屬性。
A)最大
B)最小
C)隨機選擇
D)按序選擇
答案:B
解析:
167.[單選題]下面代碼的輸出結(jié)果是:forsin"HelloWorld":ifs=="W":continue
print(s,end="")
A)HelIoorld
B)Hello
OWorld
D)HeIloWorId
答案:A
解析:
168.[單選題]哪個是實時檢索解決方案的數(shù)據(jù)源?
A)流數(shù)據(jù)
B)以上都是
C)文件數(shù)據(jù)
D)圖數(shù)據(jù)
答案:B
解析:
169.[單選題]成N個訓(xùn)練樣本集;②將N個訓(xùn)練樣本集分別做決策樹,生成N棵決策樹:③將N棵決策樹
隨機構(gòu)成隨機森林;④未來根據(jù)預(yù)測樣本氣候環(huán)境、設(shè)備屬性、設(shè)備工況進行隨機森林決策投票,得
出針對該預(yù)測樣本最優(yōu)的決策樹進行運算并計算出最終結(jié)果模型算法構(gòu)建步驟合理的順序是()
A)①②⑤④
B)①③②④
C)④①②③
D)④②①③
答案:A
解析:
170.[單選題](_)是根據(jù)數(shù)據(jù)采樣來估計概率分布參數(shù)的經(jīng)典方法。
A)貝葉斯判定準(zhǔn)則
B)貝葉斯決策論
C)貝葉斯分類器
D)極大似然估計
答案:D
解析:
171.[單選題](一)是SPark中用來進行機器學(xué)習(xí)和數(shù)學(xué)建模的軟件包。
A)SPARKCORE
B)SparkSQL
C)SparkStreaming
D)Mllib
答案:D
解析:
172.[單選題]()選擇是直接把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評價準(zhǔn)則。
A)嵌入式
B)過濾式
C)包裹式
D)一體式
答案:C
解析:包裹式特征選擇直接把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評價準(zhǔn)則。
173.[單選題]關(guān)于大數(shù)據(jù)交易在發(fā)展過程中遇到的問題.下面描述錯誤的是:()
A)互聯(lián)網(wǎng)數(shù)據(jù)馬太效應(yīng)顯現(xiàn)
B)市場信用體系缺失、監(jiān)管有待加強
C)大數(shù)據(jù)交易規(guī)則和標(biāo)準(zhǔn)缺乏
D)數(shù)據(jù)質(zhì)量評價與估值定價已經(jīng)很完善
答案:D
解析:
174.[單選題]異常檢測過程查找基于()組標(biāo)準(zhǔn)值偏差的異常個案。
A)單體
B)分類
C)聚類
D)回歸
答案:C
解析:異常檢測過程查找基于聚類組標(biāo)準(zhǔn)值偏差的異常個案。該過程設(shè)計為在探索性數(shù)據(jù)分析步驟中
,快速檢測到用于數(shù)據(jù)審核的異常個案,并優(yōu)先于任何推論性數(shù)據(jù)分析。
175.[單選題[Combiner不適合哪一種操作?()
A)最大值
B)求和
C)平均值
D)計數(shù)
答案:C
解析:
176.[單選題]大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)的開發(fā)人員需要創(chuàng)建一張用戶消費習(xí)慣表
,其中一個字段想要命名為like,則以下說法正確的是:()。
A)可以將字段命名為like,無需特殊處理
B)可以將字段名命名為like,在創(chuàng)建表及引用該字段時,需要用括起來,即表示為‘like'
C)在創(chuàng)建表時無需特殊處理,但是在引用該字段時需要表示為‘like'(注:沒有測試成功)
D)無法將字段命名為like,因為這是關(guān)鍵字
答案:D
解析:
177.[單選題]下列哪個不屬于HadOOP的特性?
A)成本高
B)高可靠性
C)高容錯性
D)運行在LinUX平臺上
答案:A
解析:
178.[單選題]有關(guān)HadooP的陳述哪個是錯誤的O
A)它運行在通用硬件上
B)它是APaehe軟件基金會(ASF)下的項目
C)它是最好的實時流式數(shù)據(jù)處理框架
D)HadooP對數(shù)據(jù)的處理是有延遲的
答案:C
解析:
179.[單選題]HBase作為數(shù)據(jù)存儲組件封裝于大數(shù)據(jù)平臺,用于()存儲。
A)關(guān)系型數(shù)據(jù)庫
B)分布式文件
C)非關(guān)系型數(shù)據(jù)庫
D)列式存儲
答案:C
解析:HBaSe是列式存儲,以流的方式在列中存儲所有的數(shù)據(jù)。對于任何記錄,索引都可以快速地獲取
列上的數(shù)據(jù)。列式存儲主要用于非關(guān)系型數(shù)據(jù)庫存儲。
180.[單選題]關(guān)于SOM神經(jīng)網(wǎng)絡(luò)的描述,錯誤的是()
A)一種競爭學(xué)習(xí)型的無監(jiān)督神經(jīng)網(wǎng)絡(luò)
B)將高雄輸入數(shù)據(jù)映射到低維空間,保持輸入數(shù)據(jù)在高維空間的拓?fù)浣Y(jié)構(gòu)
C)SOM尋優(yōu)目標(biāo)為每個輸出神經(jīng)元找到合適的權(quán)重
D)輸出層神經(jīng)元以矩陣方式排列在二維空間
答案:C
解析:
181.[單選題]MVCC用于解決()事務(wù)沖突。
A)讀讀
B)寫寫
C)讀寫
D)上述都包括
答案:C
解析:
182.[單選題]調(diào)用以下函數(shù)返回的值()defπIyfUn():PaSS
A)0
B)出錯不能運行
C)空字符串
D)None
答案:D
解析:
183.[單選題](_)算法是一種挖掘關(guān)聯(lián)規(guī)則的頻繁項集算法,其核心思想是通過候選集生成和情
節(jié)的向下封閉檢測兩個階段來挖掘頻繁項集。
A)Apriori
B)EM
OPCA
D)PAC
答案:A
解析:
184.[單選題]下列說法中,關(guān)于客戶端從HDFS中讀取數(shù)據(jù)的說法錯誤的是O
A)客戶端會選取排序靠前的DataNode來依次讀取BlOCk塊
B)客戶端會把最終讀取出來所有的BlOCk塊合并成一個完整的最終文件
C)客戶端會選取排序靠后的DataNOde來依讀取BlOCk塊
D)如果客戶端本身就是DataNode,那么將從本地直接獲取數(shù)據(jù)
答案:C
解析:
185.[單選題]一個分布式應(yīng)用程序協(xié)調(diào)服務(wù),分布式應(yīng)用程序可以基于它實現(xiàn)同步服務(wù),配置維護
和命名服務(wù)等的工具是()。
A)Flume
B)Zookeeper
C)Storm
D)SparkStreaming
答案:B
解析:
186.[單選題]運行下面代碼,則下列描述錯誤的是()。
Importtimeprint(time,time)
A)time庫是Python的標(biāo)準(zhǔn)庫
B)可使用time.Ctime。,顯示為更可讀的形式
C)time.sleep(5)推遲調(diào)用線程的運行,單位為毫秒
D)輸出自1970年1月1日00:00:00AM以來的秒數(shù)
答案:C
解析:time模塊的sleepO函數(shù)推遲調(diào)用線程的運行,單位為秒。
187.[單選題]GaussDB200在創(chuàng)建表時,需要注意以下哪些事項
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年浙江省建筑安全員《B證》考試題庫
- 《公共政策學(xué)》題庫及答案 2
- 西安信息職業(yè)大學(xué)《商業(yè)倫理》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024-2025學(xué)年山東省聊城市高唐縣第二中學(xué)高三上學(xué)期12月月考?xì)v史試卷
- 武漢船舶職業(yè)技術(shù)學(xué)院《R語言與數(shù)據(jù)可視化》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南財經(jīng)工業(yè)職業(yè)技術(shù)學(xué)院《斜視弱視學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025青海省安全員《C證》考試題庫
- 濰坊理工學(xué)院《經(jīng)濟統(tǒng)計學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 臨夏現(xiàn)代職業(yè)學(xué)院《數(shù)字信號處理A》2023-2024學(xué)年第二學(xué)期期末試卷
- 平頂山學(xué)院《安全類專業(yè)寫作》2023-2024學(xué)年第二學(xué)期期末試卷
- 中醫(yī)藥膳專題講座培訓(xùn)課件
- 物業(yè)消防安全管理培訓(xùn)【共54張課件】
- 空心杯電機基礎(chǔ)知識
- DL-T+5839-2021土石壩安全監(jiān)測系統(tǒng)施工技術(shù)規(guī)范
- 歷年交管12123駕照學(xué)法減分復(fù)習(xí)題庫帶答案下載
- 人教鄂教版-科學(xué)-三年級下冊-知識點
- 2024-2034年中國注射用賴氨匹林行業(yè)市場競爭格局及投資前景展望報告
- 供應(yīng)鏈可持續(xù)采購實踐
- 菌菇智慧方艙栽培及食用菌菌包中心生產(chǎn)基地項目可行性研究報告
- 生物工程畢業(yè)設(shè)計開題報告
- 園林垃圾處理政策解讀
評論
0/150
提交評論