大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷10)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用不包括以下哪項(xiàng)?()A)大數(shù)據(jù)驅(qū)動(dòng)的團(tuán)購(gòu)模式B)利用大數(shù)據(jù)為用戶推薦消費(fèi)內(nèi)容C)利用大數(shù)據(jù)調(diào)整線下門(mén)店布局D)利用大數(shù)據(jù)控制消費(fèi)人群的口味喜好答案:D解析:[單選題]2.數(shù)據(jù)質(zhì)量支持從完整性、()、及時(shí)性、一致性、準(zhǔn)確性、唯一性六個(gè)維度進(jìn)行單列、跨列、跨行和跨表的分析。自定義質(zhì)量規(guī)則時(shí),請(qǐng)對(duì)此規(guī)則進(jìn)行維度匹配。A)交叉性B)共享性C)時(shí)效性D)有效性答案:D解析:[單選題]3.()是整個(gè)文件系統(tǒng)的管理節(jié)點(diǎn)。A)AvroB)HttPFSBC)NameNodeD)Whirr答案:C解析:[單選題]4.以下關(guān)于Hive的的描述錯(cuò)誤的是()A)Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具B)Hive提供了一系列的工具,可以用來(lái)進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL)C)可以存儲(chǔ)、分析存儲(chǔ)在Hadoop中的大規(guī)模數(shù)據(jù),但不能進(jìn)行查詢D)使用HQL作為查詢接口答案:C解析:[單選題]5.基本元數(shù)據(jù)是指()。A)基本元數(shù)據(jù)是與數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C)基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息D)基本元數(shù)據(jù)包括關(guān)于裴載和更新處理、分析處理以及管理方面的信息答案:D解析:[單選題]6.以下()不是由MaxCompute接入層提供的服務(wù)。A)HTTP服務(wù)B)LoadBalanceC)括用戶空間管理操作D)用戶認(rèn)證答案:C解析:[單選題]7.以下哪個(gè)不是大數(shù)據(jù)的數(shù)據(jù)計(jì)算引擎?A)SparkB)MapReduceC)FlumeD)Flink答案:C解析:[單選題]8.()是指為最小化總體風(fēng)險(xiǎn),只需在每個(gè)樣本上選擇能使特定條件風(fēng)險(xiǎn)最小的類別標(biāo)記A)支持向量機(jī)B)間隔最大化C)線性分類器D)貝葉斯判定準(zhǔn)則答案:D解析:[單選題]9.Flink不包含以下哪些數(shù)據(jù)處理場(chǎng)景?()A)高可靠性B)圖形分析C)毫秒級(jí)低時(shí)延D)高并發(fā)答案:B解析:[單選題]10.以下關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的敘述中,不正確的是()A)數(shù)據(jù)倉(cāng)庫(kù)是相對(duì)穩(wěn)定的B)數(shù)據(jù)倉(cāng)庫(kù)是反映歷史變化的數(shù)據(jù)集合C)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源可能是異構(gòu)的D)數(shù)據(jù)倉(cāng)庫(kù)是動(dòng)態(tài)的、實(shí)時(shí)的數(shù)據(jù)集合答案:D解析:[單選題]11.Spark應(yīng)用程序在集群上以()進(jìn)程集合的形式運(yùn)行。A)獨(dú)立B)并發(fā)C)分布式D)多答案:A解析:[單選題]12.閱讀以下代碼,回答問(wèn)題,當(dāng)n是11的時(shí)候,s為多少1deftotal(n):2s=03i=14while(iA)55B)66C)44D)50答案:B解析:[單選題]13.Hive希望employees表中具有相同?FederalTaxes?值的數(shù)據(jù)在一起處理,可以使用()來(lái)保證具有相同?FederalTaxes?值的記錄會(huì)分發(fā)到同一個(gè)reducer中進(jìn)行處理,然后使用sortby來(lái)按照期望的方式對(duì)數(shù)據(jù)進(jìn)行排序A)orderbyB)sortbyC)distributebyD)countby答案:C解析:[單選題]14.HDFS的設(shè)計(jì)者采用了()的概念,實(shí)現(xiàn)了一個(gè)高度容錯(cuò)性的系統(tǒng)。A)機(jī)器學(xué)習(xí)B)數(shù)據(jù)挖掘C)集群計(jì)算D)塊復(fù)制答案:D解析:[單選題]15.執(zhí)行a=np.array([[1,1,3],[4,3,6]]);print(np.append(a,[[1,1,1]],axis=0))結(jié)果為?A)[113436111]B)[[141][251][361]]C)[[113][436][111]]D)[[1,1,3,4,3,6,1,1,1]]答案:C解析:[單選題]16.使用()關(guān)鍵字創(chuàng)建自定義函數(shù)。A)functionB)funcC)defD)lambda答案:C解析:[單選題]17.假設(shè)擁有一個(gè)已完成訓(xùn)練的、用來(lái)解決車輛檢測(cè)問(wèn)題的深度神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練所用的數(shù)據(jù)集由汽車和卡車的照片構(gòu)成,而訓(xùn)練目標(biāo)是檢測(cè)出每種車輛的名稱(車輛共有10種類型)?,F(xiàn)在想要使用這個(gè)模型來(lái)解決另外一個(gè)問(wèn)題,問(wèn)題數(shù)據(jù)集中僅包含一種車(福特野馬)而目標(biāo)變?yōu)槎ㄎ卉囕v在照片中的位置,則應(yīng)采取的方法是()。A)除去神經(jīng)網(wǎng)絡(luò)中的最后一層,凍結(jié)所有層然后重新訓(xùn)練B)對(duì)神經(jīng)網(wǎng)絡(luò)中的最后幾層進(jìn)行微調(diào),同時(shí)將最后一層(分類層)更改為回歸層C)使用新的數(shù)據(jù)集重新訓(xùn)練模型D)所有答案均不對(duì)答案:B解析:由于神經(jīng)網(wǎng)絡(luò)淺層網(wǎng)絡(luò)主要提取圖像的低維特征,對(duì)于相近領(lǐng)域進(jìn)行遷移學(xué)習(xí)時(shí),這些低維特征相同,因此只需要對(duì)最后幾層進(jìn)行微調(diào),而檢測(cè)位置相當(dāng)于回歸任務(wù)。[單選題]18.在計(jì)算擬合曲線時(shí),如果擬合曲線始終沒(méi)有收斂,應(yīng)調(diào)整哪個(gè)參數(shù)?A)增加迭代步數(shù)B)減少迭代步數(shù)C)增大收斂系數(shù)D)減小收斂系數(shù)答案:D解析:[單選題]19.ApacheHadoop是使用哪個(gè)協(xié)議發(fā)布的()A)ApacheLicense2.0B)SharewareC)MozillaPublicLicenseD)Commercial答案:A解析:[單選題]20.(__)在完成某一類任務(wù)的性能能隨經(jīng)驗(yàn)而改進(jìn)。A)學(xué)習(xí)系統(tǒng)B)學(xué)習(xí)任務(wù)C)機(jī)器學(xué)習(xí)D)數(shù)據(jù)科學(xué)系統(tǒng)答案:A解析:[單選題]21.在HBase系統(tǒng)架構(gòu)中,HMaster主要負(fù)責(zé)()A)Database和Region的管理工作B)Database和Master的管理工作C)Table和Region的管理工作D)Table和Master的管理工作答案:C解析:[單選題]22.HDFS集群中的NameNode職責(zé)不包括()。A)維護(hù)HDFS集群的目錄樹(shù)結(jié)構(gòu)B)維護(hù)HDFS集群的所有數(shù)據(jù)塊的分布、副本數(shù)和負(fù)載均衡C)負(fù)責(zé)保存客戶端上傳的數(shù)據(jù)D)響應(yīng)客戶端的所有讀寫(xiě)數(shù)據(jù)請(qǐng)求答案:C解析:NameNode是HDFS的管理節(jié)點(diǎn),DataNode是HDFS集群的工作節(jié)點(diǎn)。所以用戶上傳的數(shù)據(jù)是由DataNode進(jìn)行保存的;NameNode負(fù)責(zé)保存用戶上傳的數(shù)據(jù)的元數(shù)據(jù)和維護(hù)HDFS的抽象目錄樹(shù)結(jié)構(gòu),也會(huì)響應(yīng)客戶端的所有讀寫(xiě)請(qǐng)求。[單選題]23.按照姓名升序序排列()A)ORDERBYNAMEASCB)ORDERBYASCNAMEC)ORDERBYNAMEDESCD)ORDERBYDESCNAME答案:A解析:[單選題]24.以下關(guān)于組合數(shù)據(jù)類型的描述,錯(cuò)誤的是:A)集合類型是一種具體的數(shù)據(jù)類型B)序列類似和映射類型都是一類數(shù)據(jù)類型的總稱C)字典類型的鍵可以用的數(shù)據(jù)類型包括字符串,元組,以及列表D)python的集合類型跟數(shù)學(xué)中的集合概念一致,都是多個(gè)數(shù)據(jù)項(xiàng)的無(wú)序組合答案:C解析:[單選題]25.MaxCompute的授權(quán)操作一般涉及三個(gè)要素,不包括:()。A)主體(subject)B)客體(Object)C)操作(Action)D)限制條件(contidiotn)答案:D解析:[單選題]26.RNN不同于其他神經(jīng)網(wǎng)絡(luò)的地方在于()A)實(shí)現(xiàn)了記憶功能B)速度快C)精度高D)易于搭建答案:A解析:[單選題]27.決策樹(shù)是基于(__)結(jié)構(gòu)來(lái)進(jìn)行決策的。A)樹(shù)B)鏈C)隊(duì)列D)棧答案:A解析:[單選題]28.在過(guò)去,數(shù)據(jù)分析的目的之一是對(duì)未來(lái)進(jìn)行預(yù)測(cè)。比如通過(guò)實(shí)時(shí)分析微博數(shù)據(jù),當(dāng)發(fā)現(xiàn)人們對(duì)霧霾的討論明顯增加時(shí),就可以建議銷售部門(mén)增加口罩的進(jìn)貨量。這個(gè)案例體現(xiàn)了過(guò)去數(shù)據(jù)分析的()A)重視因果關(guān)系B)抽樣的特性C)精確的特性D)全樣的特性答案:A解析:[單選題]29.以下關(guān)于ZooKeeper關(guān)鍵特性中的原子性說(shuō)法正確的是?A)客戶端發(fā)送的更新會(huì)按照他們被發(fā)送的順序進(jìn)行應(yīng)用B)更新只能全部完成或失敗,不會(huì)部分完成C)一條消息被一個(gè)server接收,將被所有server接收D)集群中無(wú)論哪臺(tái)服務(wù)器,對(duì)外展示的均是同一視圖答案:B解析:[單選題]30.采用主成分分析法映射到低維空間,將最小的d-d′個(gè)特征向量舍棄,產(chǎn)生的影響是()。A)使樣本采樣密度增大B)丟失最優(yōu)解C)增大噪聲D)使樣本采樣密度減小答案:A解析:低維空間與原始高維空間必有不同,因?yàn)閷?duì)應(yīng)于最小的d-d'個(gè)特征值的特征向量被舍棄了,這是降維導(dǎo)致的結(jié)果。但舍棄這部分信息往往是必要的:一方面舍棄這部分信息之后能使樣本的采樣密度增大,這正是降維的重要?jiǎng)訖C(jī);另一方面,當(dāng)數(shù)據(jù)受到噪聲影響時(shí),最小的特征值所對(duì)應(yīng)的特征向量往往與噪聲有關(guān)。將它們舍棄能在一定程度上起到去噪的效果。[單選題]31.多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()。A)一對(duì)一B)一對(duì)其余C)一對(duì)多D)多對(duì)多答案:A解析:多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略包括一對(duì)多、多對(duì)多、一對(duì)其余。[單選題]32.()包含Spark的主要基本功能。A)SPARKCOREB)SparkSQLC)SparkStreamingD)Mllib答案:A解析:[單選題]33.在python3中執(zhí)行以下代碼段a=21b=10print(ab)時(shí),輸出為()。A)TrueB)FalseC)NoneD)Error答案:D解析:[單選題]34.下列選項(xiàng)中,符合類的命名規(guī)范的是()。A)HolidayResortB)HolidayResortC)holidayResortD)holidayresort答案:A解析:[單選題]35.在Hive中查詢語(yǔ)句命令使用的關(guān)鍵字為()A)showB)lookC)selectD)looks答案:C解析:[單選題]36.把基于使用DMSquid作為模型的Predict輸出進(jìn)行反向轉(zhuǎn)換得到原始的標(biāo)簽值,會(huì)采用哪個(gè)數(shù)值轉(zhuǎn)換器?A)JobldB)InverseQuantifyC)DMSquidD)InverseNormalizer答案:B解析:[單選題]37.Numpy包中meshgrid()函數(shù)實(shí)現(xiàn)的功能是()。A)數(shù)組拆分B)數(shù)組乘法C)數(shù)組除法D)數(shù)組融合答案:D解析:np.meshgrid()用于數(shù)組融合,在畫(huà)等高線圖時(shí)常用。[單選題]38.TF-IDF模型中IDF是指(__)。A)詞頻數(shù)B)逆文檔頻率C)詞頻率D)逆文檔頻數(shù)答案:B解析:[單選題]39.Flume中一個(gè)ChannelSelector的作用是什么?A)設(shè)置多個(gè)channel發(fā)往多個(gè)sink的策略B)設(shè)置一個(gè)source發(fā)往多個(gè)channel的策略C)設(shè)置多個(gè)source發(fā)往多個(gè)channel的策略D)設(shè)置一個(gè)channel發(fā)往多個(gè)sink的策略角答案:B解析:[單選題]40.下列關(guān)于漏斗圖的說(shuō)法中,錯(cuò)誤的是()A)漏斗圖往往適用于業(yè)務(wù)流程上的順序關(guān)系B)漏斗圖可以通過(guò)漏斗中梯形的大小,清晰地展示出不同數(shù)值的大小C)漏斗圖與餅圖同樣適用于表示占比的情況D)漏斗圖不適用于表示無(wú)邏輯順序的分類對(duì)比情況答案:C解析:漏斗圖不適合表示無(wú)邏輯順序的分類對(duì)比,如果要表示無(wú)邏輯順序的分類對(duì)比情況,請(qǐng)使用柱狀圖。漏斗圖也不適合表示占比情況,如果要表示占比情況,請(qǐng)使用餅圖。[單選題]41.在Spark技術(shù)中,RDD實(shí)現(xiàn)了用戶的邏輯,而(__)則管理了用戶的數(shù)據(jù)。A)SchedulerB)ShuffleC)StorageD)RDD答案:C解析:[單選題]42.大數(shù)據(jù)的基本特征不包括()。A)數(shù)據(jù)量大B)據(jù)類型繁多C)處理速度快D)價(jià)值密度高答案:D解析:[單選題]43.關(guān)于MapReduce中的鍵值對(duì),下面陳述正確的是()A)Key類必須實(shí)現(xiàn)WritableB)Key類必須實(shí)現(xiàn)WritableComparableC)Value類必須實(shí)現(xiàn)WritableComparableD)Value類必須繼承WritableComparable答案:B解析:[單選題]44.以下運(yùn)算符的運(yùn)算順序?yàn)閺挠业阶蟮氖?)。--A)=(賦值運(yùn)算符)B)=(比較運(yùn)算符C)-(負(fù)號(hào))D)-(減法)答案:A解析:[單選題]45.以下關(guān)于機(jī)器學(xué)習(xí),描述錯(cuò)誤的是:()A)是一門(mén)涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、.腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科B)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能C)機(jī)器學(xué)習(xí)強(qiáng)調(diào)三個(gè)關(guān)鍵詞:算法、模型、訓(xùn)練D)基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一答案:C解析:[單選題]46.通過(guò)HBase提創(chuàng)建表的關(guān)鍵字是()A)insertB)createC)addD)以上都不正確答案:B解析:[單選題]47.以下不屬于數(shù)據(jù)庫(kù)的是A)MongoDBB)SparkC)MySQLD)HBase答案:B解析:[單選題]48.在有關(guān)數(shù)據(jù)倉(cāng)庫(kù)測(cè)試,下列說(shuō)法不正確的是:A)在完成數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行各種測(cè)試.測(cè)試工作中要包括單元測(cè)試和系統(tǒng)測(cè)試B)當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試C)系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試D)在測(cè)試之前沒(méi)必要制定詳細(xì)的測(cè)試計(jì)劃答案:D解析:[單選題]49.python中,while的中止的關(guān)鍵字是()A)continueB)brokenC)breakD)plug答案:C解析:[單選題]50.以下不屬于數(shù)據(jù)倉(cāng)庫(kù)的特性是()A)面向主題B)集成的C)跨平臺(tái)性D)非易失答案:C解析:[單選題]51.下列()值,在MaxCompute中被視為合法的datetime類型。A)2014-02-2923:59:59B)41305.063020833C)25569.000011574D)42019.430908056答案:C解析:[單選題]52.TF-IDF與該詞在整個(gè)語(yǔ)言中的出現(xiàn)次數(shù)成(__)。A)正比B)反比C)無(wú)關(guān)D)冪次答案:B解析:[單選題]53.哪個(gè)不是Hbase的操作語(yǔ)法?A)create'my_tb',infoB)listC)createtabletb1(idint,namestring)D)scanmy答案:C解析:[單選題]54.中心極限定理是噪聲抑制的中的統(tǒng)計(jì)原理,其內(nèi)容是:均值分布總會(huì)收斂于一個(gè)()。A)正態(tài)分布B)泊松分布C)多項(xiàng)式分布D)均值分布答案:A解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.大數(shù)據(jù)的參考架構(gòu)分為哪三個(gè)層次()A)角色B)活動(dòng)C)邏輯構(gòu)件D)功能組件答案:ABD解析:[多選題]56.對(duì)于安全模式下列說(shuō)法正確的是()A)SafeMode是NameNode的一種特殊狀態(tài),在這種狀態(tài)下,文件系統(tǒng)只接受讀數(shù)據(jù)請(qǐng)求(ls、cat),而不接受上傳、刪除、修改等變更請(qǐng)求。B)HDFS處于安全模式下,block不能進(jìn)行任何的副本復(fù)制操作。C)在HDFS集群正常冷啟動(dòng)時(shí),NameNode會(huì)在SafeMode狀態(tài)下維持相當(dāng)長(zhǎng)的一段時(shí)間,此時(shí)你不需要去理會(huì),等待它自動(dòng)退出安全模式即可。D)在HDFS集群正常冷啟動(dòng)時(shí),NameNode會(huì)進(jìn)入SafeMode狀態(tài),這是因?yàn)閒simage鏡像文件中缺少文件的路徑信息和相關(guān)副本數(shù)答案:ABC解析:[多選題]57.已定義級(jí)(DefinedLevel)的主要特點(diǎn)包括()。A)組織機(jī)構(gòu)已明確給出了關(guān)鍵過(guò)程的"標(biāo)準(zhǔn)定義",并定期對(duì)其進(jìn)行改進(jìn)B)已提供了關(guān)鍵過(guò)程的測(cè)量與預(yù)測(cè)方法C)關(guān)鍵過(guò)程的執(zhí)行過(guò)程并不是簡(jiǎn)單或死板地執(zhí)行組織機(jī)構(gòu)給出的"標(biāo)準(zhǔn)定義",而是根據(jù)具體業(yè)務(wù)進(jìn)行了一定的"裁剪"工作D)數(shù)據(jù)的重要性已成為組織機(jī)構(gòu)層次的共識(shí),將數(shù)據(jù)當(dāng)作成功實(shí)現(xiàn)組織機(jī)構(gòu)使命的關(guān)鍵因素之一答案:ABCD解析:DMM的已定義級(jí)(DefinedLevel):組織機(jī)構(gòu)已經(jīng)定義了自己的"標(biāo)準(zhǔn)關(guān)鍵過(guò)程"。其主要特點(diǎn)如下:①組織機(jī)構(gòu)已明確給出了關(guān)鍵過(guò)程的"標(biāo)準(zhǔn)定義",并定期對(duì)其進(jìn)行改進(jìn);②已提供了關(guān)鍵過(guò)程的測(cè)量與預(yù)測(cè)方法;③關(guān)鍵過(guò)程的執(zhí)行過(guò)程并不是簡(jiǎn)單或死板地執(zhí)行組織機(jī)構(gòu)給出的"標(biāo)準(zhǔn)定義",而是根據(jù)具體業(yè)務(wù)進(jìn)行了一定的"裁剪"工作;④數(shù)據(jù)的重要性已成為組織機(jī)構(gòu)層次的共識(shí),將數(shù)據(jù)當(dāng)作成功實(shí)現(xiàn)組織機(jī)構(gòu)使命的關(guān)鍵因素之一。[多選題]58.下列關(guān)于自助法描述錯(cuò)誤的是(__)。A)自助法在數(shù)據(jù)集較大、難以有效劃分訓(xùn)練集或測(cè)試集是很有用B)自助法能從初始數(shù)據(jù)集中產(chǎn)生多個(gè)不同的訓(xùn)練集C)自助法產(chǎn)生的數(shù)據(jù)集沒(méi)有改變初始數(shù)據(jù)集的分布D)在初始數(shù)據(jù)量足夠時(shí),留出法和交叉驗(yàn)證法較自助法更為常用答案:AC解析:[多選題]59.關(guān)于空值和缺失值,下列說(shuō)法中正確的是()。A)NaN和None是完全一樣的B)使用isnull()可以檢測(cè)數(shù)據(jù)中是否存在空值或缺失值C)notnull()與isnull()方法都可以判斷數(shù)據(jù)中是否存在空值或缺失值D)dropna()方法可以刪除空值和缺失值答案:BCD解析:[多選題]60.StructuredStreaming中通過(guò)什么機(jī)制,解決數(shù)據(jù)的無(wú)序和滯后問(wèn)題?A)留連接B)持續(xù)查詢C)Wartermark機(jī)制D)事件時(shí)間答案:CD解析:[多選題]61.下列有關(guān)k-mean算法說(shuō)法正確的是A)不能自動(dòng)識(shí)別類的個(gè)數(shù),隨機(jī)挑選初始點(diǎn)為中心點(diǎn)計(jì)算B)數(shù)據(jù)數(shù)量不多時(shí),輸入的數(shù)據(jù)的順序不同會(huì)導(dǎo)致結(jié)果不同C)不能自動(dòng)識(shí)別類的個(gè)數(shù),不是隨機(jī)挑選初始點(diǎn)為中心點(diǎn)計(jì)算D)初始聚類中心的選擇對(duì)聚類結(jié)果的影響很大答案:AD解析:[多選題]62.HDFS具有較高的容錯(cuò)性,設(shè)計(jì)了哪些相應(yīng)的機(jī)制檢測(cè)數(shù)據(jù)錯(cuò)誤和進(jìn)行自動(dòng)恢復(fù)?A)數(shù)據(jù)源太大B)數(shù)據(jù)節(jié)點(diǎn)出錯(cuò)C)數(shù)據(jù)出錯(cuò)D)名稱節(jié)點(diǎn)出錯(cuò)答案:BCD解析:[多選題]63.華為大數(shù)據(jù)產(chǎn)品FusionInsightHD中的Streaming具有哪些關(guān)鍵特性?A)容災(zāi)能力B)靈活性C)消息可靠性D)可伸縮性答案:ABC解析:[多選題]64.為落實(shí)數(shù)據(jù)安全全過(guò)程管控,在發(fā)布環(huán)節(jié),嚴(yán)格對(duì)外發(fā)和傳播數(shù)據(jù)安全審查,落實(shí)信息內(nèi)容合規(guī)性審核,發(fā)現(xiàn)違法違規(guī)信息應(yīng)()。A)立即停止傳輸和發(fā)布B)采取消除等處置措施,防止信息擴(kuò)散C)對(duì)信息進(jìn)行保密D)保存有關(guān)記錄答案:ABD解析:[多選題]65.比特幣要解決的兩個(gè)核心問(wèn)題是:()A)防篡改B)防丟失C)防貶值D)去中心化記賬答案:AD解析:[多選題]66.典型的數(shù)據(jù)采集方法包括:()A)系統(tǒng)日志采集B)分布式消息訂閱分發(fā)C)ETLD)網(wǎng)絡(luò)數(shù)據(jù)采集答案:ABCD解析:[多選題]67.以下哪幾項(xiàng)屬于漢語(yǔ)未登錄詞的類型?()A)存在于詞典但出現(xiàn)頻率較少的詞B)新出現(xiàn)的普通詞匯C)專有名詞D)專業(yè)名詞和研究領(lǐng)域名稱答案:BCD解析:[多選題]68.x=np.linspace(0.05,10,1000)y=np.sin(x)plt.plot(x,y,ls="-.",l=2,c="c",label="plotfigure"plt.legend()plt.grid(linestyle=":",color="r")plt.show()對(duì)這段代碼說(shuō)法正確的是(__)。A)該圖表是一個(gè)藍(lán)綠色的散點(diǎn)圖B)圖表中有紅色實(shí)線的網(wǎng)格線C)圖表中有圖例D)該圖畫(huà)的是sin曲線答案:CD解析:[多選題]69.分析工具包括(__)和商務(wù)智能可視化、垂直分析、統(tǒng)計(jì)計(jì)算、數(shù)據(jù)服務(wù)、語(yǔ)音與自然語(yǔ)言理解、搜索等。A)數(shù)據(jù)分析平臺(tái)B)數(shù)據(jù)科學(xué)平臺(tái)C)機(jī)器學(xué)習(xí)D)人工智能答案:ABCD解析:[多選題]70.安全模式下安裝FusionInsightHD集群時(shí),哪些組件是必須安裝的?A)ZookeeperB)LdapServerC)KrbServerD)HDFS答案:BC解析:[多選題]71.關(guān)于Python面向?qū)ο缶幊讨?,下列說(shuō)法中,錯(cuò)誤的是()。A)Python中一切都是對(duì)象B)Python支持私有繼承C)Python支持接口編程D)Python支持保護(hù)類型答案:BCD解析:[多選題]72.根據(jù)數(shù)據(jù)分析深度,可將數(shù)據(jù)分析分為以下哪幾個(gè)層次()?A)描述性分析B)預(yù)測(cè)性分析C)規(guī)則性分析D)專業(yè)性分析答案:ABC解析:[多選題]73.以下關(guān)于Hive的Metastore描述正確的是()【選兩項(xiàng)】A)Metastore保存了Hive的元數(shù)據(jù)信息B)Metastore的安裝模式不能用內(nèi)嵌模式C)Metastore的安裝模式有本地模式D)Metastore的安裝模式默認(rèn)是遠(yuǎn)程模式答案:AC解析:[多選題]74.NumPy提供的兩種基本對(duì)象是()。A)arrayB)ndarrayC)ufuncD)matrix答案:BC解析:[多選題]75.下列屬于位運(yùn)算符的是()。--A)&&B)&C)>>D)<<答案:BCD解析:[多選題]76.數(shù)據(jù)冗余可能會(huì)引起的問(wèn)題有()。--A)讀取異常B)更新異常C)插入異常D)刪除異常答案:BCD解析:[多選題]77.HDFS要實(shí)現(xiàn)以下哪幾個(gè)目標(biāo)?A)兼容廉價(jià)的硬件設(shè)備B)流數(shù)據(jù)讀寫(xiě)C)大數(shù)據(jù)集D)復(fù)雜的文件模型答案:ABC解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.云計(jì)算的基本原理為:利用非本地或遠(yuǎn)程服務(wù)器(集群)的分布式計(jì)算機(jī)為互聯(lián)網(wǎng)用戶提供服務(wù)(計(jì)算、存儲(chǔ)、軟硬件等服務(wù))。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.在Python3.5中運(yùn)算符+不僅可以實(shí)現(xiàn)數(shù)值的相加、字符串連接,還可以實(shí)現(xiàn)列表、元組的合并和集合的并集運(yùn)算A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.運(yùn)營(yíng)商在智慧交通涉及到的數(shù)據(jù)源主要有信令數(shù)據(jù)、基站工參等。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.當(dāng)前,企業(yè)提供的大數(shù)據(jù)解決方案大多基于Hadoop開(kāi)源項(xiàng)目。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.服務(wù)可用性以月為服務(wù)周期,可用性為月服務(wù)可用時(shí)間與月服務(wù)總時(shí)間的比值A(chǔ))正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.使用DELETE刪除記錄時(shí),自動(dòng)增長(zhǎng)值不會(huì)減小或填補(bǔ)空缺。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.在函數(shù)內(nèi)部可以通過(guò)關(guān)鍵字global來(lái)定義全局變量。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.Series與DataFrame還支持eq、ne、lt、gt、le、ge等二進(jìn)制比較操作的方法,其中大于等于是gt。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]86.成立中央網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組,體現(xiàn)了我們黨對(duì)網(wǎng)絡(luò)安全強(qiáng)有力的領(lǐng)導(dǎo)和更加高度的關(guān)注。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]87.Flink處理數(shù)據(jù)是無(wú)狀態(tài)的,處理一個(gè)事件與之前的事件無(wú)關(guān)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]88.BlockSize是不可以修改的。A)正確B)錯(cuò)誤答案:錯(cuò)解析:可以修改修改方法有兩種,1.修改hdfs塊大小的方法在hdfs-site.xml文件中修改配置塊大小的地方,dfs.block.size節(jié)點(diǎn)。重啟集群后,重新上傳文件到hadoop集群上,新增的文件會(huì)按照新的塊大小存儲(chǔ),舊的不會(huì)改變。2.hadoop指定某個(gè)文件的blocksize,而不改變整個(gè)集群的blocksize文件上傳的時(shí)候,使用下面的命令即可hadoopfs-Dfs.local.block.size=134217728-putlocal_nameremote_location鏈接:/questio

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論