大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷6)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷6)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷6)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷6)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷6)_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷6)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共145題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.要級聯(lián)刪除用戶創(chuàng)建的表等數(shù)據(jù)庫對象,使用關(guān)鍵字()。A)STRICTB)CASCADEC)USAGE答案:B解析:[單選題]2.圖靈獎獲得者JimGray提出的"科學(xué)研究第四范式"的全稱為()。A)數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)B)以數(shù)據(jù)為中心的科學(xué)發(fā)現(xiàn),C)數(shù)據(jù)驅(qū)動型的科學(xué)發(fā)現(xiàn)D)大數(shù)據(jù)科學(xué)研究答案:A解析:2007年,圖靈獎獲得者JimGray提出了科學(xué)研究的第四范式--數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)(Data-intensiveScientificDiscovery)。在他看來,人類科學(xué)研究活動已經(jīng)歷過三種不同范式的演變過程(原始社會的"實(shí)驗(yàn)科學(xué)范式"、以模型和歸納為特征的"理論科學(xué)范式"和以模擬仿真為特征的"計(jì)算科學(xué)范式"),目前正在從"計(jì)算科學(xué)范式"轉(zhuǎn)向"數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式"。[單選題]3.互聯(lián)網(wǎng)思維核心()A)用戶思維B)迭代思維C)流量思維D)平臺思維答案:A解析:[單選題]4.對數(shù)據(jù)可視化的作用說法不正確的一項(xiàng)是()A)數(shù)據(jù)分析B)數(shù)據(jù)過濾C)信息記錄D)橫縱對比答案:B解析:[單選題]5.OLTP是什么意思()A)面向過程的實(shí)時(shí)處理系統(tǒng)B)面向?qū)ο蟮膶?shí)時(shí)處理系統(tǒng)C)面向事務(wù)的實(shí)時(shí)處理系統(tǒng)D)面向系統(tǒng)的實(shí)時(shí)處理系統(tǒng)答案:C解析:[單選題]6.當(dāng)用戶輸入abc時(shí),下面代碼的輸出結(jié)果是:try:n=0n=input("請輸入一個(gè)整數(shù):")defpow10(n):returnn**10except:print("程序執(zhí)行錯誤")A)輸出:abcB)程序沒有任何輸出C)輸出:0D)輸出:程序執(zhí)行錯誤答案:B解析:[單選題]7.下面代碼的輸出結(jié)果是:forsin"HelloWorld":ifs=="W":continueprint(s,end="")A)HelloorldB)HelloC)WorldD)HelloWorld答案:A解析:[單選題]8.在條件允許的前提下,()對數(shù)據(jù)安全進(jìn)行審計(jì),()進(jìn)行一次全面審計(jì)。A)1年/3年B)1季度/1年C)1年/2年D)半年/1年答案:A解析:[單選題]9.以下()不是NoSQL數(shù)據(jù)庫。A)MongoDBB)BigTableC)HBaseD)Access答案:D解析:NoSQL是指那些非關(guān)系型的、分布式的、不保證遵循ACID原則的數(shù)據(jù)存儲系統(tǒng)。典型的NoSOL產(chǎn)品有DangaInteractive的Memcached、10gen的MongoDB、Facebook的Cassandra、Google的BigTable及其開源系統(tǒng)HBase、Amazon的Dynamo、Apache的TokyoCabinet、CouchDB和Redis等。[單選題]10.如果LASSO模型中的懲罰項(xiàng)變大,下列說法正確的是()A)部分回歸系數(shù)會變?yōu)?B)部分回歸系數(shù)會趨近于0,但不會取值為0C)A和B的表述都正確D)以上說法都不正確答案:A解析:[單選題]11.下列有關(guān)Hive和Impala的對比錯誤的是()。A)Hive與Impala中對SQL的解釋處理比較相似,都是通過詞法分析生成執(zhí)行計(jì)劃B)Hive與Impala使用相同的元數(shù)據(jù)C)Hive適合于長時(shí)間的批處理查詢分析,而Impala適合于實(shí)時(shí)交互式SQL查詢D)Hive在內(nèi)存不足以存儲所有數(shù)據(jù)時(shí),會使用外存,而Impala也是如此答案:D解析:[單選題]12.以下關(guān)于KafkaPartition偏移量的描述不正確的是?A)每條消息在文件中的位置稱為offset答案:偏移量B)消費(fèi)者通過答案:offset.partition.topic跟蹤記錄C)唯一標(biāo)記一條消息D)Offset是一個(gè)String型字符串答案:D解析:[單選題]13.可以實(shí)現(xiàn)數(shù)組的除法是哪個(gè)函數(shù)?A)np.subB)np.addC)np.mulD)np.div答案:D解析:[單選題]14.下列關(guān)鍵字中,用來引入模塊的是()A)includeB)fromC)importD)continue答案:C解析:[單選題]15.執(zhí)行以下代碼段classGraph():def__init__(self):self.a=10defaction(self):self.a//=4classMyGraph(Graph):def__init__(self):self.a=8self.b=4defaction(self):self.a+=7*2self.b//=2classLastGraph(MyGraph):passg2=LastGraph()g2.action()print(g2.a)時(shí),輸出為()。A)22B)84C)16D)34答案:A解析:[單選題]16.a和b為兩個(gè)整數(shù),以下關(guān)系表達(dá)式語法錯誤的是?A)a==bB)abC)a>=bD)a!=b答案:B解析:[單選題]17.如果要將讀寫位置移動到文件開頭,需要使用的命令是()。A)closeB)seek(0)C)truncateD)write('stuff')答案:B解析:seek(0)指移動指針到0位置即開頭。[單選題]18.Python中statsmodel庫和()庫關(guān)系密切。A)NumpyB)ScipyC)JiebaD)Pandas答案:D解析:statsmodels建立在Pandas之上。[單選題]19.可以對大數(shù)據(jù)進(jìn)行深度分析的工具是()。A)淺層神經(jīng)網(wǎng)絡(luò)B)ScalaC)深度學(xué)習(xí)D)MapReduce答案:C解析:[單選題]20.plt.axvspan()函數(shù)中的參數(shù)alpha的作用是(__)。A)指定圖表網(wǎng)格線的透明度B)指定圖表參考區(qū)域透明度C)指定圖表網(wǎng)格線顏色D)指定圖表參考區(qū)域顏色答案:B解析:[單選題]21.Hbase元數(shù)據(jù)MetaRegion路由器信息存放在()。A)ZookeeperB)Meta表C)HMasterD)Root表答案:B解析:[單選題]22.若arr=np.array([1,2,3,4,5,6,7,8]),則arr[5:8]=12的意義為(__)。A)將第5個(gè)和第8個(gè)元素改成12B)將第6、7、8個(gè)元素修改成12C)將第8個(gè)元素賦值給第5個(gè)元素D)創(chuàng)建一個(gè)全為12的數(shù)組答案:B解析:[單選題]23.hadoop中什么類提供了連接到HDFS系統(tǒng)并執(zhí)行文件操作的基本功能()A)FSDirectoryB)DFSClientC)ClientProtocolD)FSInputStream答案:B解析:A、FSDirectory【HDFS文件系統(tǒng)的整個(gè)命名空間是通過FSDirectory類來管理的】B、DFSClient【DFSClient會連接到HDFS,對外提供管理文件/目錄、讀寫文件以及管理與配置HDFS系統(tǒng)等功能?!緾、ClientProtocol【這個(gè)接口中有兩類方法,一是操縱命名空間的方法,二是操縱文件流的方法】D、FSInputStream【在FSInputStream類中,通過Seekable接口的seek()方法實(shí)現(xiàn)了PositionedReadable接口中的read()方法】[單選題]24.一元線性回歸方程y=0.7+0.82x,判定系數(shù)等于0.64,則x與y的相關(guān)系數(shù)為()。A)0.82B)0.64C)0.8D)0.7答案:C解析:一元回歸分析中,自變量和因變量的相關(guān)系數(shù)的平方等于回歸模型的判定系數(shù)。所以,相關(guān)系數(shù)=sqrt(0.64)=0.8。[單選題]25.偽彩色處理和假彩色處理是兩種不同的色彩增強(qiáng)處理方法,說出下面屬于偽彩色增強(qiáng)的處理?A)將景象中的藍(lán)天邊為紅色,綠草變?yōu)樗{(lán)色B)用自然色復(fù)制多光譜的景象C)將灰度圖經(jīng)頻域高通/低通后的信號分別送入紅/藍(lán)顏色顯示控制通道D)將紅、綠、藍(lán)彩色信號分別送入藍(lán)、紅、綠顏色顯示控制通道答案:C解析:[單選題]26.假設(shè)已經(jīng)配置好PATH環(huán)境變量,啟動Hadoop的命令是()。A)start-hdfs.shB)start-fs.shC)start-dfs.shD)start-hadoop.sh答案:C解析:[單選題]27.Flink中的DataStream數(shù)據(jù)流轉(zhuǎn)不包含以下哪項(xiàng)?A)DatasourceB)TransformationsC)DatasinkD)Actions答案:D解析:[單選題]28.HBase中需要根據(jù)某些因素來確定一個(gè)單元格,這些因素可以視為一個(gè)?四維坐標(biāo)?,下面哪個(gè)不屬于?四維坐標(biāo)??A)行鍵B)關(guān)鍵字C)列族D)時(shí)間戳答案:B解析:[單選題]29.KafkaClusterMirroring工具可以實(shí)現(xiàn)以下哪些功能?A)Kafka跨集群數(shù)據(jù)同步方案B)Kafka單集群內(nèi)數(shù)據(jù)備份C)Kafka但集群內(nèi)數(shù)據(jù)恢復(fù)D)以上全不正確答案:A解析:[單選題]30.阿里云MaxCompute中,用于在關(guān)系表達(dá)式中匹配任意一個(gè)字符的是:()。A)'%'B)'#'C)*D)'\'答案:D解析:[單選題]31.HAVING子句的位置放在GROUPBY子句之()A)前后都可以B)前C)后D)以上都不對答案:C解析:[單選題]32.HDFS的設(shè)計(jì)者采用了()的概念,實(shí)現(xiàn)了一個(gè)高度容錯性的系統(tǒng)。A)機(jī)器學(xué)習(xí)B)數(shù)據(jù)挖掘C)集群計(jì)算D)塊復(fù)制答案:D解析:[單選題]33.下列選項(xiàng)中,執(zhí)行哪一個(gè)命令查看Linux系統(tǒng)的IP配置A)ipconfigB)findC)ifconfigD)arp-a答案:C解析:[單選題]34.執(zhí)行以下代碼段x=[i**2foriinrange(3)]print(x)時(shí),輸出為()。A)[0,1,2]B)[0,1,4]C)[1,2,3]D)[1,2,9]答案:B解析:[單選題]35.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),推薦使用以下哪種channel類型?A)MemoryChannelB)FileChannelC)JDBCChannelD)HDFSChannel答案:B解析:[單選題]36.關(guān)于Hadoop中MapReduce說法正確的是()。A)可以沒有Reduce任務(wù)B)Reducer輸入為隨機(jī)輸入C)Shuffie主要實(shí)現(xiàn)數(shù)據(jù)可視化功能D)一個(gè)Reducer只能從一個(gè)Map復(fù)制所需要的partition答案:A解析:[單選題]37.下列選項(xiàng)中,用于刪除缺失值的方法是()A)isnull()B)delete()C)dropna()D)fillna()答案:C解析:[單選題]38.np.sqrt(10)的結(jié)果是?A)3.1622776601684B)3C)10D)1答案:A解析:[單選題]39.4A賬號生命周期管理包括:()A)賬號開通B)賬號變更C)用戶維護(hù)、用戶離職D)以上全部答案:D解析:[單選題]40.以下關(guān)于機(jī)器學(xué)習(xí),描述錯誤的是:()A)是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、.腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科B)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能C)機(jī)器學(xué)習(xí)強(qiáng)調(diào)三個(gè)關(guān)鍵詞:算法、模型、訓(xùn)練D)基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一答案:C解析:[單選題]41.運(yùn)行下面程序,輸出的結(jié)果是()。DefchanageInt(number2):number2=number2+1print("changeInt:number2=",number2)#調(diào)用Number1=2;ChanageInt(number1)print("number:",number1)A)changeInt:number2=3number:3B)changeInt:number2=3number:2C)number:2changeInt:number2=2D)number:2changeInt:number2=3答案:B解析:按照程序執(zhí)行,先運(yùn)行changeInt(),然后再運(yùn)行print。[單選題]42.在一些算法中,為了進(jìn)行屬性之間的比較或運(yùn)算,需要把不同屬性的不同變量取值范圍變換成同一范圍,以免使得結(jié)果發(fā)生扭曲,偏向取值范圍大的變量這一過程稱為()。A)合并B)嘈數(shù)據(jù)聚合C)歸一化D)數(shù)據(jù)處理答案:C解析:[單選題]43.TF-IDF與一個(gè)詞在文檔中的出現(xiàn)次數(shù)成(__)。A)正比B)反比C)無關(guān)D)冪次答案:A解析:[單選題]44.(__)是在不影響數(shù)據(jù)完整性和數(shù)據(jù)分析結(jié)果準(zhǔn)確性的前提下,通過減少數(shù)據(jù)規(guī)模的方式減少數(shù)據(jù)量,進(jìn)而提升數(shù)據(jù)分析的效果與效率。A)數(shù)據(jù)縮減B)數(shù)據(jù)加工C)數(shù)據(jù)清洗D)數(shù)據(jù)歸約答案:D解析:[單選題]45.主鍵的建立有()種方法A)一B)四C)二D)三答案:D解析:[單選題]46.()承擔(dān)公司網(wǎng)絡(luò)安全監(jiān)督職能,負(fù)責(zé)公司網(wǎng)絡(luò)安全工作監(jiān)督、檢查與評價(jià),負(fù)責(zé)組織公司網(wǎng)絡(luò)安全事件調(diào)查。A)國調(diào)中心B)國網(wǎng)安質(zhì)部C)國網(wǎng)信通部D)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組答案:B解析:[單選題]47.下面對?ORDERBYpno,level?描述正確的是()。--A)先按level全部升序后,再按pno升序B)先按level升序后,相同的level再按pno升序C)先按pno全部升序后,再按level升序D)先按pno升序后,相同的pno再按level升序答案:D解析:[單選題]48.()是數(shù)據(jù)庫管理系統(tǒng)運(yùn)行的基本工作單位。A)事務(wù)B)數(shù)據(jù)倉庫C)數(shù)據(jù)單元D)數(shù)據(jù)分析答案:A解析:[單選題]49.物聯(lián)網(wǎng)的核心和基礎(chǔ)是()A)RFIDB)計(jì)算機(jī)技術(shù)C)人工智能D)互聯(lián)網(wǎng)答案:D解析:[單選題]50.以下關(guān)于Saoop數(shù)據(jù)導(dǎo)入原理的描述中,錯誤的是哪-項(xiàng)?A)Sqoop會根據(jù)傳入的num-mappers來確定劃分幾個(gè)區(qū)域。B)Saoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中。C)num-mappers越大效率越高。D)Saoop在import時(shí),需要指定split-by參數(shù)。答案:C解析:[單選題]51.執(zhí)行以下代碼段classGraph():def__init__(self):self.a=10defaction(self):self.a//=4classMyGraph(Graph):def__init__(self):self.a=8self.b=4defaction(self):self.a+=7self.b**=2classLastGraph(MyGraph):passg1=MyGraph()g2=LastGraph()g1.action()g2.action()print(g1.a)print(g2.b)時(shí),輸出為()。A)158B)1516C)1716D)916答案:B解析:[單選題]52.下列哪種說法是錯誤的A)除字典類型外,所有標(biāo)準(zhǔn)對象均可以用于布爾測試。B)空字符串的布爾值是False。C)空列表對象的布爾值是False。D)值為0的任何數(shù)字對象的布爾值是False。答案:A解析:[單選題]53.以下對Velocity相關(guān)描述不正確的是()。A)Velocity是指速度快B)實(shí)時(shí)分析數(shù)據(jù)處理要求速度快C)大數(shù)據(jù)中所說的?速度?包括兩種:增長速度和處理速度D)通常而言,處理速度比增長速度快答案:D解析:[單選題]54.在HBase數(shù)據(jù)模型中,不可以作為行鍵的是()。A)字符串B)整數(shù)C)二進(jìn)制串D)并行化的結(jié)構(gòu)答案:D解析:[單選題]55.以下關(guān)于字典類型的描述,正確的是:A)字典類型可迭代,即字典的值還可以是字典類型的對象B)表達(dá)式forxind:中,假設(shè)d是字典,則x是字典中的鍵值對C)字典類型的值可以是任意數(shù)據(jù)類型的對象D)字典類型的鍵可以是列表和其他數(shù)據(jù)類型答案:C解析:[單選題]56.Flume數(shù)據(jù)采集的過程中,下列選項(xiàng)中能對數(shù)據(jù)進(jìn)行過濾和修飾的是?A)SinkB)ChannelC)ChannelselectorD)Interceptor答案:D解析:[單選題]57.使用()關(guān)鍵字聲明匿名函數(shù)。A)functionB)funcC)defD)lambda答案:D解析:[單選題]58.()選擇成為支持向量機(jī)的最大變數(shù)。A)核函數(shù)B)樣本空間C)模型D)算法答案:A解析:在不知道特征映射的形式時(shí),我們并不知道什么樣的核函數(shù)是合適的,而核函數(shù)也僅是隱式地定義了這個(gè)特征空間。于是,核函數(shù)選擇成為支持向量機(jī)的最大變數(shù)。[單選題]59.將python中的.py文件轉(zhuǎn)換為.pyc文件的組件為()。A)編輯器B)編譯器C)虛擬機(jī)D)解釋器答案:B解析:[單選題]60.下列關(guān)于Hadoop中Shell類說法錯誤的是()A)Shell類是一個(gè)繼承類B)Shell類定義了如何在當(dāng)前文件系統(tǒng)環(huán)境中,通過命令進(jìn)行交互C)Shell類定義了靜態(tài)的字符串命令D)Shell類定義了與實(shí)現(xiàn)命令的執(zhí)行相關(guān)的屬性答案:A解析:shell類是一個(gè)提供執(zhí)行操作系統(tǒng)命令的類,只是提供一個(gè)shell命令執(zhí)行的總體框架[單選題]61.下列哪一個(gè)不屬于大數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)業(yè)鏈環(huán)節(jié)?A)數(shù)據(jù)循環(huán)層B)數(shù)據(jù)源層C)數(shù)據(jù)分析層D)數(shù)據(jù)應(yīng)用層答案:A解析:[單選題]62.下面哪個(gè)選項(xiàng)不是我們需要Hadoop的主要原因()A)我們需要處理PB級別的數(shù)據(jù)B)為每個(gè)應(yīng)用建立一個(gè)可靠的系統(tǒng)是很昂貴的C)幾乎每天都有結(jié)點(diǎn)壞掉D)把一個(gè)任務(wù)分割成多個(gè)子任務(wù)的方式是不好的答案:D解析:在一定情況下把一個(gè)任務(wù)分割成多個(gè)子任務(wù)的方式是有好處的[單選題]63.DRDS的讀策略中不包含:()A)主庫讀B)均衡C)自定義D)主庫寫答案:D解析:[單選題]64.假設(shè)已從標(biāo)準(zhǔn)庫functools導(dǎo)入reduce()函數(shù),那么表達(dá)式reduce(lambdax,y∶x+y,[1,2,3])的值為()。A)NoneB)6C)3D)9答案:B解析:reduce()是聚合函數(shù),該操作完成數(shù)組求和功能。[單選題]65.下面()函數(shù)不是字符串處理函數(shù)。A)TRUNCB)TO_CHARC)SUBSTRD)丨NSTR答案:A解析:[單選題]66.以下()不屬于?加強(qiáng)人才隊(duì)伍建設(shè)?的范疇。A)加強(qiáng)數(shù)據(jù)管理崗位培訓(xùn),重點(diǎn)開展數(shù)據(jù)管理體系、數(shù)據(jù)管理理論、數(shù)據(jù)管理實(shí)踐等知識培訓(xùn)。B)搭建數(shù)據(jù)管理交流平臺,根據(jù)工作推進(jìn)情況定期舉辦數(shù)據(jù)管理工作交流座談。C)充分發(fā)揮大數(shù)據(jù)中心、科研產(chǎn)業(yè)單位作用,構(gòu)建數(shù)據(jù)專業(yè)支撐團(tuán)隊(duì)。D)組織各種形式的數(shù)據(jù)知識競賽等活動。答案:D解析:[單選題]67.在HBase中,Scan類的()方法設(shè)置時(shí)間戳范圍A)setTimeRange()B)setTimeStamp()C)setMaxVersions()D)setRange()答案:A解析:[單選題]68.啟動HDFS上的垃圾回收機(jī)制只需要配置兩個(gè)參數(shù):一個(gè)是erval,另外一個(gè)是erval,若是erval的值設(shè)置為0,則表示()A)表示垃圾檢查點(diǎn)之間的分鐘數(shù)為0分鐘B)表示和erval的值相等C)表示自動開啟垃圾回收功能D)表示禁用垃圾回收功能答案:D解析:[單選題]69.在Flink技術(shù)架構(gòu)中,以下哪項(xiàng)是流處理和批處理的計(jì)算引擎?A)StandaloneB)RuntimeC)FlinkCoreD)DataSteam答案:B解析:[單選題]70.MacOS系統(tǒng)的開發(fā)者是()A)微軟公司B)惠普公司C)蘋果公司D)IBM公司答案:C解析:[單選題]71.文本向量的每個(gè)元素表示該詞的()。A)順序B)頻率C)含義D)語義關(guān)系答案:B解析:[單選題]72.緩解過擬合的一個(gè)辦法是允許支持向量機(jī)在一些樣本上出錯,()形式適合這種方法。A)硬間隔支持向量機(jī)B)軟間隔支持向量機(jī)C)線性核函數(shù)支持向量機(jī)D)多項(xiàng)式核函數(shù)支持向量機(jī)答案:B解析:軟間隔允許某些樣本不滿足約束,可緩解過擬合。[單選題]73.一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思維維度中的()。A)定量思維B)相關(guān)思維C)因果思維D)檢驗(yàn)思維答案:B解析:[單選題]74.下面哪個(gè)Flume功能可以給Event添加Header信息。A)數(shù)倉與大數(shù)據(jù)的并行架構(gòu)B)低成本高擴(kuò)震性的傳統(tǒng)數(shù)倉架構(gòu)C)以數(shù)倉為核心,大數(shù)據(jù)平臺為延伸的融合架構(gòu)D)大數(shù)據(jù)平臺為核心的架構(gòu)答案:C解析:[單選題]75.在Spark技術(shù)中,RDD實(shí)現(xiàn)了用戶的邏輯,而(__)是Storage模塊與其他模塊交互最主要的類,它提供了讀和寫B(tài)lock的接口。A)org.apache.spark.storage.BlockB)org.spark.storage.BlockManagerC)org.apache.spark.BlockManagerD)org.apache.spark.storage.BlockManager答案:D解析:[單選題]76.實(shí)時(shí)處理的步驟中,實(shí)時(shí)計(jì)算的前一步是以下哪一項(xiàng)?.A)實(shí)時(shí)展示B)實(shí)時(shí)緩存存儲C)實(shí)時(shí)采集D)實(shí)時(shí)落地答案:B解析:[單選題]77.程序如下:i=0j=0while(iA)1B)0C)2D)4.5答案:B解析:[單選題]78.以下哪項(xiàng)不是深度學(xué)習(xí)最近火熱的原因()A)神經(jīng)網(wǎng)絡(luò)是一個(gè)全新的領(lǐng)域B)需要處理的數(shù)據(jù)量急劇加大C)計(jì)算能力的不斷提升D)深度學(xué)習(xí)在很多重要領(lǐng)域,例如語音識別和圖像識別等方面取得了重大成就答案:A解析:[單選題]79.對于隨機(jī)森林和GBDT,下面說法正確的是()。A)在隨機(jī)森林的單個(gè)樹中,樹和樹之間是有依賴的,而GBDT中的單個(gè)樹之間是沒有依賴的B)這兩個(gè)模型都使用隨機(jī)特征子集,來生成許多單個(gè)的樹C)我們可以并行地生成GBDT單個(gè)樹,因?yàn)樗鼈冎g是沒有依賴的D)GBDT訓(xùn)練模型的表現(xiàn)總是比隨機(jī)森林好答案:B解析:組成隨機(jī)森林的樹可以并行生成;而GBDT只能是串行生成。[單選題]80.F1參數(shù)的大小反映了模型的(__)。A)準(zhǔn)確度B)誤差C)穩(wěn)定性D)偏差答案:C解析:[單選題]81.下列關(guān)于模型能力(modelcapacity指神經(jīng)網(wǎng)絡(luò)模型能擬合復(fù)雜函數(shù)的能力)的描述,正確的是()A)隱藏層層數(shù)增加,模型能力增加B)Dropout的比例增加,模型能力增加C)學(xué)習(xí)率增加,模型能力增加D)都不正確答案:A解析:[單選題]82.一幅灰度均勻分布的圖像,其灰度范圍在[0,255],則該圖像的信息量為()。A)0B)6C)8D)255答案:C解析:[單選題]83.給定詞匯表如下:{"B、oB、","ok","like","footB、A、ll","C、A、r"}。則下面句子?B、otlikesfootB、A、ll"的詞袋模型表示為:A)、[11100]B)、[10110]C)、[10010]D)、[01101]答案:B解析:[單選題]84.BI工具采用哪種分析方式?()A)自助式探索B)圖表展示C)查詢搜索D)人工互助答案:A解析:[單選題]85.設(shè)計(jì)坐出租車收費(fèi)程序,3公里內(nèi)按10元收取,超3公里不超10公里按每公里1.5元收取,超過10公里按每公里1.3元收取,請問根據(jù)以上情況用什么語句合適A)ifB)if…elif…elseC)whileD)以上都不對答案:B解析:[單選題]86.函數(shù)如下:defshowNnumber(numbers):forninnumbers:print(n)下面那些在調(diào)用函數(shù)時(shí)會報(bào)錯()A)showNumer([2,4,5])B)showNnumber(?abcesf?)C)showNnumber(3.4)D)showNumber((12,4,5))答案:C解析:[單選題]87.假設(shè)你正在訓(xùn)練一個(gè)LSτM網(wǎng)絡(luò),你有一個(gè)10000詞的詞匯表,并且使用一個(gè)激活值維度為100的LSTM塊,在每一個(gè)時(shí)間步中,幾的維度是()A)lB)100C)300D)10000答案:B解析:[單選題]88.數(shù)據(jù)科學(xué)是一門以()為主要研究任務(wù)的獨(dú)立學(xué)科。A)數(shù)據(jù)驅(qū)動、數(shù)據(jù)業(yè)務(wù)化、數(shù)據(jù)洞見、數(shù)據(jù)產(chǎn)品研發(fā)和(或)數(shù)據(jù)生態(tài)系統(tǒng)的建設(shè)B)數(shù)據(jù)研發(fā)C)數(shù)據(jù)處理D)數(shù)據(jù)洞見答案:A解析:數(shù)據(jù)科學(xué)是一門以實(shí)現(xiàn)從數(shù)據(jù)到信息、從數(shù)據(jù)到知識和(或)從數(shù)據(jù)到智慧的轉(zhuǎn)化為主要研究目的,以數(shù)據(jù)驅(qū)動、數(shù)據(jù)業(yè)務(wù)化、數(shù)據(jù)洞見、數(shù)據(jù)產(chǎn)品研發(fā)和(或)數(shù)據(jù)生態(tài)系統(tǒng)的建設(shè)為主要研究任務(wù)的獨(dú)立學(xué)科。[單選題]89.下面程序的運(yùn)行結(jié)果是()deffunc(a,b):a=a+breturnab=func(10,30)print(b)A)10B)20C)30D)40答案:D解析:[單選題]90.解決多重共線性的方法包括()A)嶺回歸B)主成分回歸C)偏最小二乘回歸D)以上都是答案:D解析:[單選題]91.智能數(shù)據(jù)湖運(yùn)營平臺指的是以下哪個(gè)選項(xiàng)?A)VAS(videoAnalysisService)B)ModelArtsC)cSSD)DAYU答案:D解析:[單選題]92.以下哪些方法不可以直接來對文本分類()A)KmeansB)決策樹C)支持向量機(jī)D)KNN答案:A解析:[單選題]93.調(diào)用自定義函數(shù)使用()。--A)CALLB)LOADC)CREATED)SELECT答案:D解析:[單選題]94.(__)不是常用的噪聲處理方法。A)聚類B)回歸C)分類D)分箱答案:C解析:[單選題]95.函數(shù)使用哪個(gè)關(guān)鍵字()。A)funB)defineC)defD)function答案:C解析:[單選題]96.假設(shè)給定一個(gè)長度為n的不完整單詞序列,希望預(yù)測下一個(gè)字母是什么,如輸入是Predictio(9個(gè)字母組成),希望預(yù)測第十個(gè)字母是什么。適用于解決這個(gè)工作的是()。A)循環(huán)神經(jīng)網(wǎng)絡(luò)B)全連接神經(jīng)網(wǎng)絡(luò)C)受限波爾茲曼機(jī)D)卷積神經(jīng)網(wǎng)絡(luò)答案:A解析:循環(huán)神經(jīng)網(wǎng)絡(luò)具有記憶性、參數(shù)共享并且圖靈完備,因此在對序列的非線性特征進(jìn)行學(xué)習(xí)時(shí)具有一定優(yōu)勢。循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語言處理(naturallanguageprocessing,NLP),例如語音識別、語言建模、機(jī)器翻譯等領(lǐng)域有應(yīng)用,也被用于各類時(shí)間序列預(yù)報(bào)。[單選題]97.下列選項(xiàng)中,若是哪個(gè)節(jié)點(diǎn)關(guān)閉了,就無法訪問Hadoop集群()A)namenodeB)datanodeC)secondarynamenodeD)yarn答案:A解析:[單選題]98.下面關(guān)于Region的說法,哪個(gè)是錯誤的?A)同一個(gè)Region不會被分拆到多個(gè)Region服務(wù)器B)為了加快訪問速度,.META.表的全部Region都會被保存在內(nèi)存中C)一個(gè)-ROOT-表可以有多個(gè)RegionD)為了加速尋址,客戶端會緩存位置信息,同時(shí),需要解決緩存失效問題答案:C解析:[單選題]99.以下關(guān)于隱馬爾科夫模型中,敘述錯誤的是()。A)是一種有向圖模型B)是一種無向圖模型C)是一種結(jié)構(gòu)簡單的動態(tài)貝葉斯網(wǎng)絡(luò)D)常被應(yīng)用于時(shí)序數(shù)據(jù)建模答案:B解析:[單選題]100.某工程師正在開發(fā)EasticSearch應(yīng)用,請問下列代碼可以幫助他實(shí)現(xiàn)什么功能?A)刪除素引B)創(chuàng)建素引C)維護(hù)索引D)更新素引答案:A解析:[單選題]101.過濾式特征選擇、包裹式特征選擇與學(xué)習(xí)器的關(guān)系分別是()。A)相關(guān),相關(guān)B)相關(guān),不相關(guān)C)不相關(guān),相關(guān)D)不相關(guān),不相關(guān)答案:C解析:過濾式特征選擇先對數(shù)據(jù)集進(jìn)行特征選擇,然后再訓(xùn)練學(xué)習(xí)器,特征選擇過程與后續(xù)學(xué)習(xí)器無關(guān)。包裹式特征選擇把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評價(jià)準(zhǔn)則。[單選題]102.引用集合數(shù)據(jù)類型中的元素選擇sub數(shù)組中第一個(gè)元素進(jìn)行查詢,正確的是()A)selectname,subordinates[0]fromemplyees;B)selectname,subordinates[1]fromemplyees;C)selectname,subordinatesfromemplyees;D)以上都不正確答案:A解析:[單選題]103.HDFS每個(gè)文件被劃分成()大小的多個(gè)block,屬于同一個(gè)文件的blocks分散存儲在不同DataNode上。A)32MBB)64MBC)128MBD)無法確定答案:B解析:[單選題]104.()是指給目標(biāo)用戶產(chǎn)生的錯誤或不準(zhǔn)確的視覺感知,而這種感知與數(shù)據(jù)可視化者的意圖或數(shù)據(jù)本身的真實(shí)情況不一致。A)視覺假象B)視覺認(rèn)知C)視覺感知D)數(shù)據(jù)可視答案:A解析:視覺假象(VisualIlusion)是數(shù)據(jù)可視化工作中不可忽略的特殊問題。視覺假象是指給目標(biāo)用戶產(chǎn)生的錯誤或不準(zhǔn)確的視覺感知,而這種感知與數(shù)據(jù)可視化者的意圖或數(shù)據(jù)本身的真實(shí)情況不一致。[單選題]105.關(guān)于抽象類,下列說法錯誤的是()。A)抽象類中只能有抽象方法B)抽象類能被實(shí)例化C)抽象類既包括函數(shù)屬性又包括數(shù)據(jù)屬性D)抽象類同時(shí)具備普通類和接口類的部分特性答案:B解析:[單選題]106.()情況下,LDA會失敗。A)如果有辨識性的信息不是平均值,而是數(shù)據(jù)的方差B)如果有辨識性的信息是平均值,而不是數(shù)據(jù)方差C)如果有辨識性的信息是數(shù)據(jù)的均值和方差D)以上答案都不正確答案:A解析:LDA的思想是投影后類內(nèi)方差最小、類間方差最大。[單選題]107.基于Boosting的集成學(xué)習(xí)代表算法不包含()A)AdaboostB)GBDTC)XGBOOSTD)隨機(jī)森林答案:D解析:[單選題]108.下列哪個(gè)選項(xiàng)可以來判斷Hbase表是否存在?A)table.containskey(tableName)B)admin.getTable(TableName)C)adminTableExists(TableNamevalueOf(tableName))D)adminTableExists(tableName)答案:D解析:[單選題]109.下列哪個(gè)組件可以實(shí)現(xiàn)數(shù)據(jù)庫的導(dǎo)入導(dǎo)出()。A)MahoutB)ZookeeperC)FlumeD)Sqoop答案:D解析:[單選題]110.一切事物及事物運(yùn)動的狀態(tài),不僅包括銷售數(shù)據(jù)、價(jià)格數(shù)據(jù)可以形成大數(shù)據(jù),甚至連顧客情緒(如色彩.空間的感知等)都可以測得,這體現(xiàn)了大數(shù)據(jù)思維維度中的()A)定量思維B)相關(guān)思維C)因果思維D)實(shí)驗(yàn)思維答案:A解析:[單選題]111.若X=np.array([[1.,-1.,2.],[2.,0.,0.],[0.,1.,-1.]]),X_scaled=preprocessing.scale(X),則print(X_scaled.mean(axis=0))的輸出結(jié)果是(__)。A)[1.0.0.33333333]B)[0.,0.,0.]C)0.444444444D)0答案:B解析:[單選題]112.D剛常用的激活函數(shù)有()A)sigmoidB)tanhC)ReLUD)以上答案都正確答案:D解析:[單選題]113.以下匹配'1ton'和'2ton'及'3ton'的正則表達(dá)式是()A)'123ton'B)'1,2,3ton'C)'[123]ton'D)'1|2|3ton'答案:C解析:[單選題]114.請閱讀下面一段程序:arr=np.arange(6).reshape(1,2,3)print(arr.transpose(2,0,1))執(zhí)行上述程序后,最終輸出的結(jié)果為()。A)[[[25]][[03]][[14]]]B)[[[14]][[03]][[25]]]C)[[[03]][[14]][[25]]]D)[[[0][3]][[1][4]][[2][5]]]答案:C解析:[單選題]115.給定訓(xùn)練樣例集,設(shè)法將樣例投影到一條直線上,使得同類樣例的投影點(diǎn)盡可能接近、異類樣例的投影點(diǎn)盡可能遠(yuǎn)離,這說的是()算法A)PCAB)SVMC)K-meansD)LDA答案:D解析:[單選題]116.下列數(shù)據(jù)中,不屬于字符串的是()。A)'ab'B)"perfect"'C)"52wo"D)abc答案:D解析:[單選題]117.Python不支持的數(shù)據(jù)類型有A)charB)intC)floatD)list答案:A解析:[單選題]118.在情感分析中,下面哪個(gè)詞不屬于影響詞?A)識別B)開心C)難過D)無聊答案:A解析:[單選題]119.下列有關(guān)HBase的跳轉(zhuǎn)過濾器SkipFilter描述錯誤的是()A)跳轉(zhuǎn)過濾器可以對用戶提供的過濾器進(jìn)行包裝B)當(dāng)被包裝的過濾器遇到某一行中某一列需要過濾時(shí),那么整行數(shù)據(jù)都將被過濾掉C)被包裝的過濾器必須實(shí)現(xiàn)filterKeyValue()方法,否則SkipFilter無法正常工作D)跳轉(zhuǎn)過濾器不可以對用戶提供的過濾器進(jìn)行包裝答案:D解析:[單選題]120.優(yōu)化內(nèi)部管理,促進(jìn)質(zhì)效提升,重點(diǎn)圍繞營配貫通和()體系變革兩條主線,打破專業(yè)壁壘,打造業(yè)務(wù)中臺。A)優(yōu)化客戶服務(wù)B)多維精益管理C)營銷服務(wù)D)計(jì)量計(jì)費(fèi)答案:B解析:[單選題]121.下列關(guān)于線性模型的描述錯誤的是()。A)支持向量機(jī)的判別函數(shù)一定屬于線性函數(shù)B)在樣本為某些分布情況時(shí),線性判別函數(shù)可以成為最小錯誤率或最小風(fēng)險(xiǎn)意義下的最優(yōu)分類器C)在一般情況下,線性分類器只能是次優(yōu)分類器D)線性分類器簡單而且在很多期情況下效果接近最優(yōu),所以應(yīng)用比較廣泛答案:A解析:支持向量機(jī)的判別函數(shù)不一定是線性函數(shù)。[單選題]122.Kafka集群中,Kafka服務(wù)端的角色是:()。A)BrokerB)ConsumerC)ZookeeperD)Producer答案:A解析:[單選題]123.ApacheHadoop可以在(___)平臺上運(yùn)行。A)UbuntuB)DebianC)WindowsD)跨平臺答案:D解析:[單選題]124.下面關(guān)于NewSQL數(shù)據(jù)庫的描述,錯誤的是:()A)NewSQL數(shù)據(jù)庫保持了傳統(tǒng)數(shù)據(jù)庫支持ACID和SQL等特性B)不同的NewSQL數(shù)據(jù)庫的內(nèi)部結(jié)構(gòu)基本相同C)都支持關(guān)系數(shù)據(jù)模型D)都使用SQL作為其主要的接口答案:B解析:[單選題]125.Hive常被用來處理()場景。A)事務(wù)性處理B)批量計(jì)算C)實(shí)時(shí)性計(jì)算D)流計(jì)算答案:B解析:[單選題]126.指出下面正確的說法A)基于像素的圖像增強(qiáng)方法是一種非線性灰度變換B)基于像素的圖像增強(qiáng)方法是基于頻域的圖像增強(qiáng)方法的一種C)基于頻域的圖像增強(qiáng)方法由于常用到傅里葉變換和傅里葉反變換,所以總比基于圖像域的方法計(jì)算復(fù)雜較高D)基于頻域的圖像增強(qiáng)方法可以獲得和基于空域的圖像增強(qiáng)方法同樣的圖像增強(qiáng)效果答案:D解析:[單選題]127.以下哪個(gè)框架可以同時(shí)滿足實(shí)時(shí)分析、離線分析、實(shí)時(shí)檢索的功能A)ApacheHadoopB)FusionInsightHDC)ApacheHBaseD)以上全都正確答案:B解析:[單選題]128.以下關(guān)于HDPS適合做什么描述不正確的是?A)低延遲讀取B)大文件存儲與訪問C)流式數(shù)據(jù)讀取D)大數(shù)據(jù)量吞吐答案:A解析:[單選題]129.Python使用()關(guān)鍵字定義一個(gè)匿名函數(shù)A)functionB)funcC)defD)lambda答案:D解析:[單選題]130.requests庫的get()函數(shù)執(zhí)行后會返回一個(gè)Response類型的對象,其text屬性以()形式存儲響應(yīng)內(nèi)容A)網(wǎng)頁B)字符串C)整數(shù)D)文本答案:B解析:[單選題]131.下列哪一個(gè)選項(xiàng)不是StructuredStreaming支持的sink輸出源?A)HBaseB)ConsoleC)KafkaD)HDFS答案:A解析:[單選題]132.以下()是對DMM(數(shù)據(jù)管理成熟度模型)中"已管理級"基本特點(diǎn)的正確表述。A)組織機(jī)構(gòu)的數(shù)據(jù)管理關(guān)鍵活動能夠根據(jù)結(jié)構(gòu)自身的反饋以及外部環(huán)境的變革進(jìn)行不斷優(yōu)化B)組織機(jī)構(gòu)已用定量化的方式管理其關(guān)鍵過程的執(zhí)行過程C)組織機(jī)構(gòu)只有在項(xiàng)目管理過程中執(zhí)行了D.M給出的關(guān)鍵過程,而缺乏機(jī)構(gòu)層次的統(tǒng)籌與管理D)組織機(jī)構(gòu)的數(shù)據(jù)管理工作超出了項(xiàng)目管理的范疇,由組織機(jī)構(gòu)統(tǒng)一管理其數(shù)據(jù)管理關(guān)鍵過程答案:D解析:[單選題]133.Spark是用以下哪種編程語言實(shí)現(xiàn)的?A)CB)C++C)JAVAD)Scala答案:D解析:[單選題]134.下列關(guān)于支持向量機(jī)的說法錯誤的是(__)。A)硬間隔支持向量機(jī)易出現(xiàn)過擬合的情況B)軟間隔支持向量機(jī)的目標(biāo)函數(shù)不是一個(gè)二次規(guī)劃問題C)松弛變量可用來解決線性不可分問題D)支持向量機(jī)可用來進(jìn)行數(shù)據(jù)的分類答案:B解析:[單選題]135.以下關(guān)于異常處理try語句塊的說法,不正確的是。()A)finally語句中的代碼段始終要被執(zhí)行B)一個(gè)try塊后接一個(gè)或多個(gè)except塊C)一個(gè)try語句塊后接一個(gè)或多個(gè)finally塊D)try塊必須與except或finally塊一起用答案:C解析:[單選題]136.下?哪個(gè)不是RDD的特點(diǎn)()A)可分區(qū)B)可序列化C)可修改D)可持久化答案:C解析:[單選題]137.使用sklearn庫進(jìn)行預(yù)測結(jié)果的交叉驗(yàn)證,需要導(dǎo)入一下哪個(gè)包()。A)sklearn.linear_modelB)sklearn.model_selectionC)sklearn.naive_bayesD)sklearn.ensemble答案:B解析:[單選題]138.下列關(guān)于數(shù)據(jù)整合和分組的說法不正確的是()。A)數(shù)據(jù)連接可以用concat或merge函數(shù)B)axis=1表示軸向連接C)數(shù)據(jù)分組可以使用mean函數(shù)D)使用agg可以自定義多個(gè)聚合函數(shù)答案:C解析:數(shù)據(jù)分組不可以使用mean函數(shù),mean函數(shù)為求平均數(shù)函數(shù)。[單選題]139.在實(shí)驗(yàn)集群的master節(jié)點(diǎn)使用jps命令查看進(jìn)程時(shí),終端出現(xiàn)以下哪項(xiàng)能說明Hadoop主節(jié)點(diǎn)啟動成功?()A)Namenode,Datanode,TaskTrackerB)Namenode,Datanode,secondaryNameNodeC)Namenode,Datanode,HMasterD)Namenode,JobTracker,secondaryNameNode答案:D解析:[單選題]140.下列哪個(gè)表達(dá)式在Python中是非法的()。A)x=y=z=1B)x=(y=z+1)C)x,y=y,xD)x+=y答案:B解析:[單選題]141.()不是HDFS的守護(hù)進(jìn)程。A)SecondaryNameNodeB)DataNodeC)MRAppMaster/YarnChildD)NameNode答案:C解析:NameNode是HDFS集群的主節(jié)點(diǎn),DataNode是HDFS集群的從節(jié)點(diǎn),SecondaryNameNode是HDFS集群啟動的用來給NameNode節(jié)點(diǎn)分擔(dān)壓力的角色,這個(gè)三個(gè)服務(wù)進(jìn)程會一直啟動著。MRAppMaster/YarnChild進(jìn)程是只有在YARN集群運(yùn)行了MapReduce程序之后才會啟動的程序。[單選題]142.對銀行業(yè)而言,做好大數(shù)據(jù)分析應(yīng)用的前提是()A)增加統(tǒng)計(jì)種類B)增加營業(yè)網(wǎng)點(diǎn)C)增加數(shù)據(jù)來源D)開展專項(xiàng)活動答案:C解析:[單選題]143.以下關(guān)于數(shù)據(jù)科學(xué)相關(guān)描述不正確的是()。A)數(shù)據(jù)科學(xué)是數(shù)據(jù),尤其是大數(shù)據(jù)背后的科學(xué)B)?數(shù)據(jù)?是一門科學(xué),答案就在?大數(shù)據(jù)?手中C)在數(shù)據(jù)科學(xué)出現(xiàn)之前,我們關(guān)注的是數(shù)據(jù)主動的一面,而在數(shù)據(jù)科學(xué)中我們更加重視的是被動作用。D)數(shù)據(jù)科學(xué)的最終研究目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)、物質(zhì)和能量之間的轉(zhuǎn)換。答案:C解析:[單選題]144.下列關(guān)于分布式數(shù)據(jù)庫的說法中,錯誤的是A)分布式數(shù)據(jù)庫系統(tǒng)通常使用較小的計(jì)算機(jī)系統(tǒng)B)分布式數(shù)據(jù)庫是物理上分散的數(shù)據(jù)庫C)分布式數(shù)據(jù)庫是邏輯上統(tǒng)一的數(shù)據(jù)庫D)每臺計(jì)算機(jī)中都一定有DBMS的一份完整拷貝副本答案:D解析:第2部分:多項(xiàng)選擇題,共62題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.Flink中的計(jì)算時(shí)間包含以下哪幾種?(A)DelayTimeB)ProcessingTimeC)EventTimeD)IngestionTime答案:BC解析:[多選題]146.(__)可以幫助解決訓(xùn)練集在特征空間中線性不可分的問題。A)硬間隔B)軟間隔C)核函數(shù)D)拉格朗日乘子法答案:BC解析:[多選題]147.下表是一個(gè)購物籃,假定支持度閾值為40%,其中()是頻繁閉項(xiàng)集。ID項(xiàng)集1面包、牛奶、尿布2面包、牛奶、尿布、啤酒3牛奶、尿布、雞蛋4面包、尿布、啤酒、雞蛋5啤酒、雞蛋A)面包、牛奶、尿布B)面包、啤酒C)尿布、啤酒D)啤酒、雞蛋答案:AD解析:[多選題]148.在FusionInsight集群規(guī)劃時(shí),以下哪些集群命名是系統(tǒng)允許的?A)FusionInsight-123B)FusionInsight_123C)FusionInsight123D)123FusionInsight答案:BCD解析:[多選題]149.以下哪些算子是窄依賴?A)unionB)mapC)filterD)groupBy答案:ABCD解析:[多選題]150.下列中屬于MapReduce特征的有()。A)以主從結(jié)構(gòu)的形式運(yùn)行B)容錯機(jī)制的復(fù)雜性C)任務(wù)備份機(jī)制的必要性D)數(shù)據(jù)存儲位置固定答案:ABC解析:數(shù)據(jù)存儲位置具有多樣性,并非固定,所以D錯。[多選題]151.以下關(guān)于性能度量,說法正確的是(__)A)聚類結(jié)果的?簇內(nèi)相似度?低且?簇間相似度?高。B)性能度量內(nèi)部指標(biāo)包含JC、FM指數(shù)、Rand指數(shù)等C)外部指標(biāo)度量結(jié)果均在0-1之間,且值越大越好。D)內(nèi)部指數(shù)DBI值越小越好,而DI則相反,值越大越好。答案:CD解析:[多選題]152.公司組織制定《國家電網(wǎng)公司數(shù)據(jù)資產(chǎn)管理辦法》是為了()A)貫徹落實(shí)公司黨組決策部署B(yǎng))規(guī)范公司數(shù)據(jù)資產(chǎn)管理C)充分挖掘數(shù)據(jù)資產(chǎn)價(jià)值D)推動公司精益管理和創(chuàng)新發(fā)展答案:ABCD解析:[多選題]153.以下哪兩個(gè)場景最適合使用Spark來代替MR?A)海量數(shù)據(jù)處理B)逐條實(shí)時(shí)計(jì)算C)迭代計(jì)算D)交互查詢答案:CD解析:[多選題]154.卷積神經(jīng)網(wǎng)絡(luò)可以用于()。A)圖像分類B)目標(biāo)提取C)圖像分割D)中文分詞答案:ABC解析:[多選題]155.下列說法正確的是()。A)在Map階段對輸入文件的每個(gè)內(nèi)容都解析成一個(gè)鍵值對B)在生成每個(gè)鍵值對時(shí)僅調(diào)用一次map函數(shù)C)在map函數(shù)中,接受一個(gè)鍵值對,并陳勝一組中間鍵值對D)在shuffle階段將所有具有相同鍵的鍵值對發(fā)送給同一個(gè)reduce函數(shù)答案:ABCD解析:[多選題]156.大數(shù)據(jù)平臺的業(yè)務(wù)目標(biāo)為()A)全面、客觀、真實(shí)、及時(shí)反映業(yè)務(wù)運(yùn)營情況,為各級領(lǐng)導(dǎo)提供企業(yè)經(jīng)營的決策依據(jù)B)快速支撐精確管理、精準(zhǔn)營銷、精細(xì)服務(wù)等各類需求C)實(shí)現(xiàn)企業(yè)數(shù)據(jù)和應(yīng)用的有效共享,降本增效D)建立數(shù)據(jù)全生命周期的安全保障體系,降低數(shù)據(jù)泄露的風(fēng)險(xiǎn)答案:ABCD解析:[多選題]157.下列哪種方法可以用來減小過擬合?()A)更多的訓(xùn)練數(shù)據(jù)B)L1正則化C)L2正則化D)減小模型的復(fù)雜度答案:ABCD解析:[多選題]158.影響基本K-均值算法的主要因素有()A)樣本輸入順序B)模式相似性測度C)聚類準(zhǔn)則D)初始類中心的選取答案:ABD解析:[多選題]159.決策樹剪枝的基本策略有(___)。A)預(yù)剪枝B)前剪枝C)后剪枝D)下剪枝答案:AC解析:[多選題]160.關(guān)于FusionInsightManager功能說法錯問題有哪些?A)通過FusionInsightManager的Audit設(shè)計(jì)界面可以查詢每個(gè)重要操作B)通過FusionInsightManager不能下載單個(gè)組件的客戶端C)集群部署完成后,通過FusionInsightManager不能進(jìn)行集群擴(kuò)容,只能通過卸載集群重新搭建來擴(kuò)容集群D)通過FusionInsightManager的admin告警界面可以查詢每個(gè)告警的具體信息答案:BC解析:[多選題]161.在Spark技術(shù)中,下面對Storage模塊中各個(gè)類的的主要功能表述正確的是(__)。A)org.apache.spark.storage.BlockManagerMasterActor:在Driver節(jié)點(diǎn)上的Actor,負(fù)責(zé)track所有Slave節(jié)點(diǎn)的Block的信息B)org.apache.spark.storage.BlockManagerMaster:Block管理的接口類C)org.apache.spark.storage.BlockObjectWriter:一個(gè)抽象類,可以將任何的JVMobject寫入外部存儲系統(tǒng)。注意,它可以支持并發(fā)的寫操作。D)org.apache.spark.storage.BlockStore:存儲Block的抽象類。答案:ABD解析:[多選題]162.項(xiàng)目空間(project)是大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的基本組織單元,它類似于傳統(tǒng)數(shù)據(jù)庫的Database。以下關(guān)于項(xiàng)目空間的說法中正確的有:()。A)所有的對象都會屬于某個(gè)項(xiàng)目空間B)一個(gè)帳號可以擁有多個(gè)項(xiàng)目空間的權(quán)限C)一個(gè)帳號可以創(chuàng)建多個(gè)項(xiàng)目空間,最多不能超過10個(gè)D)通過安全授權(quán),可以在一個(gè)項(xiàng)目空間中訪問另一個(gè)項(xiàng)目空間中的數(shù)據(jù)答案:ABD解析:[多選題]163.數(shù)據(jù)預(yù)處理的方法主要有()。A)分類B)聚類C)回歸D)清除答案:ABC解析:[多選題]164.以下哪些選項(xiàng)屬于集群資源規(guī)劃設(shè)計(jì)?A)數(shù)據(jù)質(zhì)量B)數(shù)據(jù)總規(guī)模C)容量預(yù)留D)單條數(shù)據(jù)大小答案:BC解析:[多選題]165.以下哪些不是ElasticSearch的特點(diǎn)?A)邊寫邊讀B)低性能C)倒排素引D)不可擴(kuò)展伸縮答案:BD解析:[多選題]166.根據(jù)《泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案》,2019年開展基于?國網(wǎng)芯?的新型智能終端研發(fā)應(yīng)用工作主要包括():A)實(shí)現(xiàn)泛在電力物聯(lián)網(wǎng)邊端及終端設(shè)備的硬件平臺統(tǒng)一B)實(shí)現(xiàn)核心器件?國網(wǎng)芯?化C)推進(jìn)自主化芯片規(guī)?;瘧?yīng)用和產(chǎn)業(yè)化發(fā)展D)研制多形態(tài)邊緣物聯(lián)代理、能源路由器等智能終端并試點(diǎn)應(yīng)用答案:ABCD解析:[多選題]167.Hive底層所依賴的計(jì)算引擎可以是:()A)FlinkB)MapReduceC)TezD)Spark答案:BCD解析:[多選題]168.以下正確的語句是()。A)_a=1B)__a=1C)__str__=1D)__True_=1答案:ABCD解析:[多選題]169.下列選項(xiàng)是關(guān)系型數(shù)據(jù)庫基本特征的是()A)與列的次序無關(guān)B)與行的次序無關(guān)C)不同的列應(yīng)有不同的列名D)不同的列應(yīng)有不同的數(shù)據(jù)類型答案:ABC解析:[多選題]170.序列的分片[x:y:z]x,y,z分別表示A)起始索引B)終止索引(包含)C)終止索引(不包含)D)步長答案:ACD解析:[多選題]171.下列屬于無監(jiān)督學(xué)習(xí)任務(wù)的還有(__)。A)密度估計(jì)B)異常檢測C)聚類D)分類答案:ABC解析:[多選題]172.下列屬于位運(yùn)算符的是()。--A)&&B)&C)>>D)<<答案:BCD解析:[多選題]173.Redis使用場景包含以下哪些特點(diǎn)?A)支持持久化B)豐富數(shù)據(jù)結(jié)構(gòu)在取C)低時(shí)延D)高性能答案:ABCD解析:[多選題]174.關(guān)干大數(shù)據(jù)的主要特征理解和描述正確的有A)來源多,格式多B)增長速度快,處理速度快C)存儲量大計(jì)算量大D)數(shù)據(jù)的價(jià)值密度較低答案:ABCD解析:[多選題]175.需要維護(hù)的數(shù)據(jù)資產(chǎn)主要包括:()A)業(yè)務(wù)人員未按照規(guī)定的數(shù)據(jù)格式和內(nèi)容質(zhì)量要求填寫或錄入,造成的不完整和不準(zhǔn)確數(shù)據(jù)B)因系統(tǒng)更新、調(diào)整等原因,造成數(shù)據(jù)格式或者數(shù)據(jù)含義發(fā)生變化而導(dǎo)致無法應(yīng)用的數(shù)據(jù)C)因業(yè)務(wù)變化或數(shù)據(jù)標(biāo)準(zhǔn)變更等原因,造成的原有數(shù)據(jù)與現(xiàn)有數(shù)據(jù)不一致而導(dǎo)致無法應(yīng)用的數(shù)據(jù)D)其他因素造成的有問題數(shù)據(jù)答案:ABCD解析:[多選題]176.在Hive架構(gòu)中支持對數(shù)據(jù)的操作有()。A)插入B)查詢C)刪除D)分析答案:BD解析:[多選題]177.執(zhí)行HBase讀數(shù)據(jù)業(yè)務(wù),需要讀取那幾部分?jǐn)?shù)據(jù)?A)HFileB)HLogC)MemStoreD)HDFS答案:AC解析:[多選題]178.Katka每個(gè)Partition在物理上對應(yīng)的文件夾下存儲哪些文件?A)素引文件B)用戶文件C)消息文件D)配置文件答案:AC解析:[多選題]179.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內(nèi)容?A)目錄B)文件C)塊D)以上全不正確答案:ABC解析:[多選題]180.Hadoop的MapReduce的缺點(diǎn)包括:()A)表達(dá)能力有限B)磁盤IO開銷大C)延遲高D)中間結(jié)果多答案:ABC解析:[多選題]181.下列哪些情況下SQL自診斷可以識別,并上報(bào)告警信息?A)大表BroadcastB)SQL語句不下推。C)數(shù)據(jù)傾斜。D)HashJoin中大表做內(nèi)表答案:ABCD解析:[多選題]182.回歸分析有很多種類,常見的有()。A)線性回歸B)系數(shù)回歸C)邏輯回歸D)曲線回歸答案:ACD解析:[多選題]183.下列關(guān)于Region服務(wù)器工作原理的描述,哪些是正確的?A)每個(gè)Region服務(wù)器都有一個(gè)自己的HLog文件B)每次刷寫都生成一個(gè)新的StoreFile,數(shù)量太多,影響查找速度C)合并操作比較耗費(fèi)資源,只有數(shù)量達(dá)到一個(gè)閾值才啟動合并D)Store是Region服務(wù)器的核心答案:ABCD解析:[多選題]184.下面關(guān)于可視化圖表的描述正確的是:()A)漏斗圖適用于業(yè)務(wù)流程比較規(guī)范、周期長、環(huán)節(jié)多的流程分析B)樹圖是一種流行的、利用包含關(guān)系表達(dá)層次化數(shù)據(jù)的可視化方法C)?;鶊D是以特殊高亮的形式顯示訪客熱衷的頁面區(qū)域和訪客所在的地理區(qū)域的圖示D)詞云對網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的?關(guān)鍵詞?給予視覺上的突出答案:ABD解析:[多選題]185.關(guān)于MapReduce程序執(zhí)行時(shí)的故障檢測與容錯處理,下面說法正確的是()A)HadoopMapReduce采用心跳機(jī)制實(shí)現(xiàn)故障檢測B)HadoopMApReduce會自動處理容錯,主要方法是將失敗的任務(wù)進(jìn)行再次執(zhí)行C)失效節(jié)點(diǎn)手動重啟D)投機(jī)執(zhí)行機(jī)制答案:ABD解析:[多選題]186.可以在()定義函數(shù)。A)模塊B)類C)函數(shù)D)以上都不對答案:ABC解析:[多選題]187.下列選項(xiàng)中,關(guān)于Hadoop集群說法正確的是()。A)Hadoop集群包含Worker節(jié)點(diǎn)B)Hadoop集群包含Master節(jié)點(diǎn)C)Hadoop集群包含Slave節(jié)點(diǎn)D)Hadoop集群包含HMaster節(jié)點(diǎn)答案:BC解析:Hadoop集群包含一臺Master節(jié)點(diǎn)和兩臺Slave節(jié)點(diǎn)。[多選題]188.對RDD執(zhí)行的操作有一下幾種:A)創(chuàng)建B)轉(zhuǎn)換C)控制D)執(zhí)行答案:ABCD解析:[多選題]189.SortShuffleManage是Spark1.2及以上版本默認(rèn)的ShuffleManage模式,具體包含(__)和(__)。A)簡單模式B)普通模式C)bypass模式D)pass模式答案:BC解析:[多選題]190.一個(gè)FlumeAgent內(nèi)部通常包含有哪三個(gè)模塊?A)SourceB)DestinationC)ChannelD)Sink答案:ACD解析:[多選題]191.以下關(guān)于MapReduce1.0版本說法正確的是()。A)擴(kuò)展性差B)可靠性差C)資源利用率低D)無法支持多種計(jì)算框架答案:ABCD解析:[多選題]192.在Windows系統(tǒng)中通過Geany編寫Python程序,運(yùn)行Python程序的常用步驟有()。A)菜單Build>ExecuteB)菜單Execute>BuildC)按F5D)按F10答案:AC解析:在Windows系統(tǒng)中通過Geany編寫Python程序,運(yùn)行Python程序的常用步驟有菜單Build>Execute或按F5。[多選題]193.MySQL可以運(yùn)行在以下哪些平臺上A)MacOSB)UbuntuC)RedHatD)Windows答案:ABCD解析:[多選題]194.主成分解析(PCA)是一種重要的降維技術(shù),以下對于PCA的描述正確的是:A)主成分解析是一種無監(jiān)督方法B)主成分?jǐn)?shù)量一定小于等于特征的數(shù)量C)各個(gè)主成分之間相互正交D)原始數(shù)據(jù)在第一主成分上的投影方差最小答案:ABC解析:[多選題]195.根據(jù)《大數(shù)據(jù)風(fēng)控平臺項(xiàng)目操作手冊》,貸后風(fēng)險(xiǎn)預(yù)警提示共3種級別,其中,()。A)紅色為高風(fēng)險(xiǎn)B)紫色為中風(fēng)險(xiǎn)C)黃色為中風(fēng)險(xiǎn)D)提示為低風(fēng)險(xiǎn)答案:ACD解析:[多選題]196.下列選項(xiàng)對ElasticSearchreplicas的描述,正確的是A)代表素引副本B)提高系統(tǒng)容傳性C)壓縮素引大小D)提高檢素效率答案:ABD解析:[多選題]197.大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)中的MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算,它極大地方便了編程人員在不會分布式并行編程的情況下,將自己的程序運(yùn)行在分布式系統(tǒng)上。其中,兩個(gè)主要階段Map和Reduce相互配合,可以完成對海量數(shù)據(jù)的處理。關(guān)于這兩個(gè)階段的關(guān)系,說法正確的有:()。A)一個(gè)reduce的輸入數(shù)據(jù)可能來自于多個(gè)map的輸出B)一個(gè)MR處理可以不包括任何mapC)一個(gè)MR處理可以不包括任何reduceD)一個(gè)map的輸出結(jié)果可能會被分配到多個(gè)reduce上去答案:ACD解析:[多選題]198.消除數(shù)據(jù)孤島對于政府具有哪些重要的意義:()A)有助于提升資源利用率B)有助于推動政府轉(zhuǎn)型C)有助于提高行政效率D)有助于促進(jìn)跨部門合作答案:ABCD解析:[多選題]199.可視化高維展示技術(shù)在展示數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)分析結(jié)果方面()。A)能夠直觀反映成對數(shù)據(jù)之間的空間關(guān)系B)能夠直觀反映多維數(shù)據(jù)之間的空間關(guān)系C)能夠靜態(tài)演化事物的變化及變化的規(guī)律D)能夠動態(tài)演化事物的變化及變化的規(guī)律E.提供高性能并行計(jì)算技術(shù)的強(qiáng)力支撐答案:BD解析:可視化高維展示技術(shù)在展示數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)分析結(jié)果方面能夠直觀反映多維數(shù)據(jù)之間的空間關(guān)系,以及能夠動態(tài)演化事物的變化及變化的規(guī)律。[多選題]200.Flink運(yùn)行模式有以下哪幾項(xiàng)?A)Standalone模式B)Local模式C)YARN模式D)Spark模式答案:ABCD解析:[多選題]201.tunnelupload命令可以上傳數(shù)據(jù)到大數(shù)據(jù)計(jì)算服務(wù)中去,請判斷以下()數(shù)據(jù)對象可以作為上傳的目標(biāo)。A)資源B)非分區(qū)表C)視圖D)分區(qū)表答案:BD解析:[多選題]202.下列關(guān)于Worker答案:工作進(jìn)程、Executor答案:線程、Task答案:任務(wù)說法正確的是?A)每個(gè)Executor答案:線程可以運(yùn)行多個(gè)Task(任務(wù))B)每個(gè)Worker可以運(yùn)行多個(gè)Executor(線程)C)每個(gè)Worker只能為一個(gè)拓?fù)溥\(yùn)行Executor(線程)D)每個(gè)Executor答案:線程可以運(yùn)行不同組件答案:Spout或Bolt的Task(任務(wù))答案:ABD解析:[多選題]203.數(shù)據(jù)中臺以需求為導(dǎo)向,基于統(tǒng)一數(shù)據(jù)模型,有針對性的按需開展數(shù)據(jù)接入與整合,逐步實(shí)現(xiàn)()等各版塊數(shù)據(jù)融通A)電網(wǎng)B)產(chǎn)業(yè)C)金融D)國際化答案:ABCD解析:[多選題]204.典型的數(shù)據(jù)采集方法包括:()A)系統(tǒng)日志采集B)分布式消息訂閱分發(fā)C)ETLD)網(wǎng)絡(luò)數(shù)據(jù)采集答案:ABCD解析:[多選題]205.Spark的技術(shù)架構(gòu)可以分為哪幾層?A)資源管理層B)Spark核心層C)應(yīng)用層D)服務(wù)層答案:ABD解析:[多選題]206.針對維數(shù)災(zāi)難,我們主要采用的降維方法有()A)多維縮放B)主成分分析C)核化線性降維D)流形學(xué)習(xí)E)度量學(xué)習(xí)答案:ABCDE解析:第3部分:判斷題,共42題,請判斷題目是否正確。[判斷題]207.SQLonAnywhere的意思是GaussDB200的SQL可以運(yùn)行在任何地方的數(shù)據(jù)庫。A)正確B)錯誤答案:錯解析:[判斷題]208.使用describe()方法會輸出多個(gè)統(tǒng)計(jì)指標(biāo)。()A)正確B)錯誤答案:對解析:[判斷題]209.已知x為非空字符串,那么表達(dá)式''A)正確B)錯誤答案:錯解析:[判斷題]210.Python內(nèi)置的字典dict中元素是按添加的順序依次進(jìn)行存儲的。A)正確B)錯誤答案:錯解析:[判斷題]211.數(shù)據(jù)處理方式,可分為實(shí)時(shí)處理和離線處理。A)正確B)錯誤答案:對解析:[判斷題]212.啟動Hadoop集群服務(wù)之前需要格式化文件系統(tǒng)。()A)正確B)錯誤答案:錯解析:[判斷題]213.表達(dá)式3>5andmath.sin(0)的值為0。()A)正確B)錯誤答案:錯解析:[判斷題]214.一維數(shù)組的切片操作與Python列表的切片操作很相似。例如,我們可以用下標(biāo)3~7來選取元素3~6。A)正確B)錯誤答案:對解析:[判斷題]215.()邏輯值的?真?和?假?可以用邏輯常量TRUE和FALSE表示。A)正確B)錯誤答案:對解析:[判斷題]216.在函數(shù)內(nèi)部沒有任何聲明的情況下直接為某個(gè)變量賦值,這個(gè)變量一定是函數(shù)內(nèi)部的局部變量。A)正確B)錯誤答案:對解析:[判斷題]217.企業(yè)級的數(shù)據(jù)中心,基于?集中、開放、云化?原則,按照平臺與應(yīng)用分離的設(shè)計(jì)思路,打造企業(yè)級的大數(shù)據(jù)平臺,有序推進(jìn)企業(yè)的大數(shù)據(jù)戰(zhàn)略。A)正確B)錯誤答案:對解析:[判斷題]218.變量名可以以數(shù)字開頭。()A)正確B)錯誤答案:錯解析:[判斷題]219.鏈?zhǔn)組apReduce計(jì)算中,對任意一個(gè)MapReduce作業(yè),Map和Reduce階段可以有個(gè)Mapper,但Reducer只能有一個(gè)。A)正確B)錯誤答案:對解析:[判斷題]220.Sqoop主要用來做實(shí)時(shí)流處理。A)正確B)錯誤答案:錯解析:[判斷題]221.如果在函數(shù)中有語句return3,那么該函數(shù)一定會返回整數(shù)3。A)正確B)錯誤答案:錯解析:[判斷題]222.配置Hadoop集群只需要修改core-site、xml配置文件就可以。()A)正確B)錯誤答案:錯解析:[判斷題]223.函數(shù)和對象方法是一樣的,內(nèi)部實(shí)現(xiàn)和外部調(diào)用都沒有任何區(qū)別。A)正確B)錯誤答案:錯解析:[判斷題]224.核函數(shù)的主要作用是將樣本從原始空間歸納為一個(gè)特征空間,使得樣本在這個(gè)特征空間內(nèi)線性不可分。()A)正確B)錯誤答案:對解析:[判斷題]225.一條SPU可以包含多個(gè)SKU的信息。--A)正確B)錯誤答案:對解析:[判斷題]226.BI工具中的數(shù)據(jù)集,被其他應(yīng)用引用后可以強(qiáng)行刪除()

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論