大數(shù)據(jù)HCIA復(fù)習(xí)測試附答案_第1頁
大數(shù)據(jù)HCIA復(fù)習(xí)測試附答案_第2頁
大數(shù)據(jù)HCIA復(fù)習(xí)測試附答案_第3頁
大數(shù)據(jù)HCIA復(fù)習(xí)測試附答案_第4頁
大數(shù)據(jù)HCIA復(fù)習(xí)測試附答案_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第頁大數(shù)據(jù)HCIA復(fù)習(xí)測試附答案1.某銀行規(guī)劃的FusionlnsightHD集群有90個節(jié)點(diǎn),如果控制節(jié)點(diǎn)規(guī)劃了3個,那集群中數(shù)據(jù)節(jié)點(diǎn)推薦規(guī)劃()個。A、87B、85C、90D、86【正確答案】:B2.HDFS的Client寫入文件時,數(shù)據(jù)的第一副本寫入位置由NameNode確定,其他副本的寫入位置由DataNode確定。A、對B、錯【正確答案】:A3.下圖展示了文件A、B、C、D的存放位置,其中文件A和B具有關(guān)聯(lián)性,它們的存儲位置符合Colocation同分布策略。A、TRUEB、FALSE【正確答案】:B4.在Flink的運(yùn)行流程中,負(fù)責(zé)申請資源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正確答案】:B5.FusionlnsightHD中,如果需要查看當(dāng)前登錄HBase的用戶和權(quán)限組,可以在HBaseshell中執(zhí)行什么命令?A、use_permissionB、whoamiC、whoD、get_user【正確答案】:B6.SparkOnYarn模式下的driver只能運(yùn)行在客戶端。A、對B、錯【正確答案】:B7.hbase的底層數(shù)據(jù)以()的形式存在的?A、keyvalueB、列存儲C、行存儲D、實(shí)時存儲【正確答案】:A8.FusionInsightManager對服務(wù)的配置功能說法不正確的是?A、服務(wù)級別的配置可對所有實(shí)例生效B、實(shí)例級別的配置只針對本實(shí)例生效C、實(shí)例級別的配置對其他實(shí)例也生效D、配置保存好需要重啟服務(wù)才能生效【正確答案】:C9.FusionInsightHD系統(tǒng)中,flume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過哪個組件?()A、sinkB、topicC、SourceD、Channel【正確答案】:B10.在Flink中,checkpoint機(jī)制能夠保證應(yīng)用在運(yùn)行過程中出現(xiàn)失效時,從某一個檢查點(diǎn)恢復(fù),在此過程中,流快照是根據(jù)數(shù)據(jù)流入建立的A、TRUEB、FALSE【正確答案】:A11.Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI【正確答案】:A12.FuskmlnsightHD集群規(guī)劃中,管理節(jié)點(diǎn)&控制節(jié)點(diǎn)&數(shù)據(jù)節(jié)點(diǎn)合一部署方案適合什么樣的場景?A、30節(jié)點(diǎn)以下B、100節(jié)點(diǎn)以上C、100-200節(jié)點(diǎn)D、200節(jié)點(diǎn)以上【正確答案】:A13.YRAN的基于標(biāo)簽調(diào)度,是對下列選項(xiàng)中的哪個進(jìn)行標(biāo)簽化?APPMasterB、ResourceManagerContainerD、NodeManager【正確答案】:D14.大數(shù)據(jù)需要傳統(tǒng)行業(yè)思維的轉(zhuǎn)變,要把數(shù)據(jù)收集,分析中作為業(yè)務(wù)流程的重要組成,數(shù)據(jù)端驅(qū)動業(yè)務(wù)流程優(yōu)化,實(shí)現(xiàn)智能化和自動化,并依托數(shù)據(jù)資產(chǎn)實(shí)現(xiàn)跨界拓展A、正確B、錯誤【正確答案】:A15.關(guān)于Hive與Hadoop其他組件的關(guān)系。以下描述錯誤的是?A、Hive最終將數(shù)據(jù)存儲在HDFS中B、Hive是Hadoop平臺的數(shù)據(jù)倉庫工具C、HQL可以通過MapReduce執(zhí)行任務(wù)D、Hive對HBase有強(qiáng)依賴【正確答案】:D16.Flume的perties配置文件可以配置多個channel來傳輸數(shù)據(jù)。A、對B、錯【正確答案】:A17.關(guān)于Kafka磁盤容量不足的告警,對于可能的原因以下分析不正確的是?A、用于存儲Kafka數(shù)據(jù)的磁盤配置(如磁盤數(shù)目、大小等),無法滿足當(dāng)前業(yè)務(wù)數(shù)據(jù)流量,導(dǎo)致磁盤使用率達(dá)到上限B、數(shù)據(jù)保存時間配置過長,數(shù)據(jù)累積達(dá)到磁盤使用率上限C、業(yè)務(wù)規(guī)劃不合理,導(dǎo)致數(shù)據(jù)分配不均勻,使部分磁盤達(dá)到使用率上限D(zhuǎn)、Broker節(jié)點(diǎn)故障導(dǎo)致【正確答案】:D18.Zookeeper的scheme認(rèn)證方式不包含以下哪項(xiàng)?()A、saslB、authC、digestD、world【正確答案】:A19.在fusionlnsight產(chǎn)品中,關(guān)于kafka的topic.以下描述不正確的是?A、topic的partition數(shù)量可以創(chuàng)建時配置B、每個topic只能被分成一個partition區(qū)C、每條發(fā)布到kafka的消息都有一個類別,這個類別被稱為topic.也可以理解為一個存儲消息的隊(duì)列D、每個partition在存儲層面對應(yīng)一個log文件,log文件中記錄了所有的消息數(shù)據(jù)【正確答案】:B20.華為在金融、公安、鐵路、政務(wù)等多行業(yè)擁有豐富的大數(shù)據(jù)解決方案經(jīng)驗(yàn)A、對B、錯【正確答案】:A21.HBase不適合哪些應(yīng)用場景?()A、高吞吐率應(yīng)用場景B、要求具有完全ACID特性的應(yīng)用場景C、半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場景D、海量數(shù)據(jù)(TB、PB)應(yīng)用場景【正確答案】:B22.二級索引為hbase提供了按照某些列的值進(jìn)行索引的能力,二級索引先查索引表,再定位到數(shù)據(jù)表中的位置,不用全表掃描A、trueB、false【正確答案】:A23.下圖為flume數(shù)據(jù)傳輸架構(gòu),圖中“?”號處的組件是?()A、IntercepterB、ChannelprocessorChannelselectorD、以上全不正確【正確答案】:C24.在YARN的任務(wù)調(diào)度中,一旦ApplicationMaster申請到資源后,便與對應(yīng)的ResourceManager通信,要求它啟動任務(wù)A、TRUEB、FALSE【正確答案】:B25.FusionInsightSparkSQL同社區(qū)SparkJDBCServer一樣,只支持單租戶綁定到一個YARN資源隊(duì)列多租戶,并不支持多租戶并行執(zhí)行。A、TRUEB、FALSE【正確答案】:B26.下圖為HDFS分級存儲的配置,如果block的副本數(shù)為4,則以下說法錯誤的是?()A、4個block都將寫入RAM_DISKB、如果是第1個副本之外的其它副本寫入失敗,則嘗試寫入“副本的備選存儲策略”指定的存儲類型C、第1個block副本將寫入RAM_DISK,其余副本寫入DISKD、如果第1個block副本寫入RAM_DISK失敗,則嘗試寫入“備選存儲策略”指定的存儲類型【正確答案】:A27.關(guān)于Hive建表的基本操作,描述正確的是?A、創(chuàng)建外部表的時需要指定external關(guān)鍵字B、一旦表創(chuàng)建好,不可再修改表名C、一旦表創(chuàng)建好,不可再修改列名D、一旦表創(chuàng)建好,不可再增加新列【正確答案】:A28.在規(guī)劃FuskmlnsightHD集群時候,如果客戶用于功能測試,對性能沒有要求,節(jié)約成本的情況下,可以采用管理節(jié)點(diǎn)、控制節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)合一部署,最少需要多少節(jié)點(diǎn)?A、2B、3C、4D、5【正確答案】:B29.Flume的perties配置文件中可以配置多個Channel來傳輸數(shù)據(jù)?A、TRUEB、FALSE【正確答案】:A30.Spark是以下哪種編程語言實(shí)現(xiàn)的?A、CB、C++C、JAVAD、Scala【正確答案】:D31.Hadoop系統(tǒng)中YARN分配給Container的內(nèi)存大小,可以通過參數(shù)yarn.app.mapreduce.am.resource.mb來設(shè)置A、對B、錯【正確答案】:B32.在FusionInsight產(chǎn)品中,關(guān)于KafkaTopic,以下描述不正確的有?A、每個Topic只能被分成一個partition(區(qū))B、Topic的partition數(shù)量可以在創(chuàng)建時配置C、每個Partition的存儲層面對應(yīng)一個log文件,log文件中記錄了所有的信息數(shù)據(jù)D、每條發(fā)布到Kafka的消息都有一個類別,這個類別被稱為Topic,也可以理解為一個存儲消息的隊(duì)列【正確答案】:A33.FusionInsightManger對外支持REST接口、SNMP接口、SYSLOG接口A、正確B、錯誤【正確答案】:A34.Hive是一種數(shù)據(jù)倉庫處理工具,使用類SQL的HiveQL語言實(shí)現(xiàn)數(shù)據(jù)查詢功能,所有Hive的數(shù)據(jù)都存儲在HDFS中()A、TRUEB、FALSE【正確答案】:A35.FusionInsightHD產(chǎn)品中,關(guān)于Kafka的說法不正確的是?A、Kafka強(qiáng)依賴于ZookeeperB、Kafka部署的實(shí)例個數(shù)不得小于2C、Kafka的服務(wù)端可以產(chǎn)生消息D、Consumer作為Kafka的客戶端角色進(jìn)行消息的消費(fèi)【正確答案】:B36.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪個環(huán)節(jié)中完成?()A、soureB、TransformationC、SinkD、Channel【正確答案】:B37.Kafka集群中,Kafka服務(wù)端的角色是?A、ProducerB、ConsumerC、ZookeeperD、Broker【正確答案】:A38.關(guān)于HBase的RegionSplit分裂流程的描述不正確的是()A、Split過程中該表會暫停服務(wù)B、Split為了減少Region中數(shù)據(jù)大小,從而將一個Region分裂成兩個RegionC、Split過程中被分裂的Region會暫停服務(wù)D、Split過程中并沒有真正的將文件分裂,僅僅是創(chuàng)建了引用文件【正確答案】:A39.FusionInsightHD的Loader中,一個連接器只可以分配給一個作業(yè)使用A、對B、錯【正確答案】:A40.下列哪個不是HBase讀取數(shù)據(jù)流程中涉及的角色或服務(wù)?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer【正確答案】:C41.RDD有Transformation和Action算子,下列屬于Action算子的是?()A、reduceByKeyB、filterC、mapD、saveAsTextFile【正確答案】:D42.FusionInsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作()A、刪除服務(wù)實(shí)例B、啟停服務(wù)實(shí)例C、手動清除告警D、查詢歷史監(jiān)控【正確答案】:D43.在FusionInsightManager界面中,對loader的操作不包括下列哪個選項(xiàng)?()A、切換Loader主備節(jié)點(diǎn)B、啟動loader實(shí)例C、配置loader參數(shù)D、查看loader服務(wù)狀態(tài)【正確答案】:A44.Hive在load時是不檢查數(shù)據(jù)是否符合schema的,hive遵循的是schemaonread(讀時模式),只有在讀的時候hive才檢查、解析具體的數(shù)據(jù)字段、schema。

()A、TRUEB、FALSE【正確答案】:A45.查看Kafka的某Topic的partition詳細(xì)信息時,使用如下哪個命令?A、bin/kafka-topic.sh–createB、bin/kafka-topic.sh--listC、bin/kafka-topic.sh--describeD、bin/kafka-topic.sh--delete【正確答案】:C46.kafka集群在運(yùn)行期間,直接依賴于下面那些組件?()A、ZookeeperB、HDFSC、SparkD、HBase【正確答案】:A47.HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是?()A、1B、3C、2D、4【正確答案】:C48.在Streaming中,消息可靠性級別中精確一次是通過ACK機(jī)制來實(shí)現(xiàn)的。A、TRUEB、FALSE【正確答案】:B49.FusionInsight中Hive包含2個角色,HiveServer和MetaStore.A、TRUEB、FALSE【正確答案】:A50.圖形化的健康巡檢工具FusionInsightTool由FusionCare和SysChecker兩部分組成。A、trueB、false【正確答案】:A51.FusionInsightManager用戶權(quán)限管理不支持哪個配置?A、給用戶配置角色B、給角色配置權(quán)限C、給用戶組配置角色D、給用戶組配置權(quán)限【正確答案】:D52.Hadoop系統(tǒng)中關(guān)于客戶端向HDFS文件系統(tǒng)上傳文件說法正確的是?A、客戶端的文件數(shù)據(jù)經(jīng)過NameNode傳遞給DataNodeB、客戶端將文件劃分為多個Block,根據(jù)datanode的地址信息,按順序?qū)懭氲矫恳粋€datanode中C、客戶端根據(jù)datanode的地址信息,按順序?qū)⒄麄€文件寫入每一個datanode中,然后由datanode將文件劃分為多個blockD、客戶端只上傳數(shù)據(jù)到一個datanode,然后由namenode負(fù)責(zé)block復(fù)制【正確答案】:B53.某用戶需要搭建一個350節(jié)點(diǎn)的FusionlnsightHD集群,哪種規(guī)劃方案最佳?A、管理節(jié)點(diǎn)、控制節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)合一部署,二層組網(wǎng)B、管理節(jié)點(diǎn)、控制節(jié)點(diǎn)合一部署、數(shù)據(jù)節(jié)點(diǎn)獨(dú)立部署,二層組網(wǎng)C、管理節(jié)點(diǎn)、控制節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)都獨(dú)立部署,三層組網(wǎng)D、管理節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)合一部署,控制節(jié)點(diǎn)獨(dú)立部署,二層組網(wǎng)【正確答案】:C54.下列關(guān)于HBase的BloomFilter特性理解不正確的是?A、用來過濾數(shù)據(jù)B、用來優(yōu)化隨機(jī)讀取的性能C、會增加存儲的消耗D、可以準(zhǔn)確判斷某條數(shù)據(jù)不存在S【正確答案】:C55.FusionInsightManager用戶權(quán)限管理不支持哪個配置?A、給用戶配置角色B、給用戶組配置權(quán)限C、給用戶組配置角色D、給用戶配置權(quán)限【正確答案】:B56.topology的處理邏輯都在bolt中。A、TRUEB、FALSE【正確答案】:A57.Yarn-client和Yarn-cluster主要區(qū)別是ApplicationMaster進(jìn)程的區(qū)別()A、TRUEB、FALSE【正確答案】:A58.Hive不適用于以下哪個場景A、非實(shí)時分析,例如日志分析,統(tǒng)計(jì)分析B、數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示C、數(shù)據(jù)匯總,例如每天,每用戶點(diǎn)擊數(shù),點(diǎn)擊排行D、實(shí)時在線數(shù)據(jù)分析【正確答案】:D59.Hadoop的NameNode用于存儲文件系統(tǒng)的元數(shù)據(jù)。A、正確B、錯誤【正確答案】:A60.驅(qū)動型Source是flume周期性主動去獲取數(shù)據(jù)。()A、TRUEB、FALSE【正確答案】:B61.下列選項(xiàng)中適合MapReduce的場景有?()A、離線計(jì)算B、實(shí)時交互計(jì)算C、迭代計(jì)算D、流式計(jì)算【正確答案】:A62.HBase的最小處理單元是Region,UserRegion和RegionServer之間的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正確答案】:A63.以下關(guān)于Kafka的描述錯誤的有()A、用作活動流和運(yùn)營數(shù)據(jù)處理管道的基礎(chǔ)B、由ApacheHadoop開發(fā),并于2011年開源C、具有信息持久化、高吞吐、實(shí)時等特性D、使用Scala、Java語言實(shí)現(xiàn)【正確答案】:B64.關(guān)于RDD,下列說法錯誤的是?A、RDD具有血統(tǒng)機(jī)制(Lineage)B、RDD默認(rèn)存儲在磁盤C、RDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集D、RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象【正確答案】:B65.Channel支持事務(wù),提供較弱的順序保證,可以連接任何數(shù)量的Source和Sink

()A、TRUEB、FALSE【正確答案】:A66.FusionInsightHD部署Solr時,如果選擇索引存放在本地磁盤,建議給每個

SolrServer實(shí)例(題目不全)A、正確B、錯誤【正確答案】:A67.Hadoop中哪個模塊負(fù)責(zé)HDFS的數(shù)據(jù)存儲?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker【正確答案】:B68.以下關(guān)于HiveSQL基本操作描述正確的是()A、加載數(shù)據(jù)到Hive時源數(shù)據(jù)必須是HDFS的一個路徑B、創(chuàng)建外部表必須要指定location信息C、創(chuàng)建表時可以指定列分隔符D、創(chuàng)建外部表使用external關(guān)鍵字。創(chuàng)建普通表需要指定internal關(guān)鍵字【正確答案】:C69.FusionInsightHD管理節(jié)點(diǎn)提供雙機(jī)HA機(jī)制,主節(jié)點(diǎn)故障后,主備節(jié)點(diǎn)需要手動實(shí)現(xiàn)Failover。A、正確B、錯誤【正確答案】:B70.Flink是一個批處理和流處理結(jié)合的計(jì)算框架,其核心是一個數(shù)據(jù)分類以及并行化計(jì)算的流數(shù)據(jù)處理引擎。()A、TRUEB、FALSE【正確答案】:A71.在FusionInsightHD系統(tǒng),Loader作業(yè)運(yùn)行過程中,如果產(chǎn)生臟數(shù)據(jù),Loader作業(yè)執(zhí)行結(jié)果的狀態(tài)一定是失敗。A、對B、錯【正確答案】:B72.Flume的tertises配置文件中可以配置多個channel來傳輸數(shù)據(jù)A、TrueB、False【正確答案】:A73.FusionInsighttool是為技術(shù)支持工程師和維護(hù)工程師提供的一套健康檢測工具,能夠檢查集群相關(guān)節(jié)點(diǎn)、服務(wù)的健康狀態(tài),提前發(fā)現(xiàn)集群中潛在的問題,并生成健康檢查報(bào)告。方便技術(shù)支持工程師各維護(hù)工程師快速了解系統(tǒng)的健康狀況。()A、TRUEB、FALSE【正確答案】:A74.Spark任務(wù)的每個stage可劃分為job,劃分的標(biāo)記是shuffle。A、正確B、錯誤【正確答案】:B75.以下關(guān)于Hbase中HregionServer的功能描述哪些是不正確的A、RegionServer一般與HDFS集群的NameNode部署在一起,實(shí)現(xiàn)數(shù)據(jù)的存儲功能B、Hbase的數(shù)據(jù)處理和計(jì)算單元C、RegionServer是Hbase的數(shù)據(jù)服務(wù)進(jìn)程,負(fù)責(zé)處理用戶數(shù)據(jù)的讀寫請求D、管理所有的Region,Region可以在RegionServer之間遷移【正確答案】:B76.在Hive中,以下關(guān)于分區(qū)的描述不正確的是()A、分區(qū)下可再有分區(qū)或者桶B、數(shù)據(jù)表可以按照某個字段的值劃分分區(qū)C、每個分區(qū)是一個目錄D、分區(qū)數(shù)量是固定的【正確答案】:D77.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次運(yùn)行Task都要從3個有副本的機(jī)器上傳輸需要處理的文件段。A、對B、錯【正確答案】:B78.以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是?A、同時寫入磁盤和內(nèi)存B、先寫磁盤再寫內(nèi)存C、僅寫入內(nèi)存D、先寫內(nèi)存再寫磁盤【正確答案】:B79.Hbase中OpenScanner的過程,會創(chuàng)建兩種不同的Scanner來讀取HFile和MemStore的數(shù)據(jù),HFile對應(yīng)的Scanner為StoreFileScanner,MemStore對應(yīng)的Scanner為MemStoreScanner。A、TRUEB、FALSE【正確答案】:A80.FusionInsight集群組網(wǎng)設(shè)計(jì)中,二層組網(wǎng)指集群內(nèi)二層交換,集群節(jié)點(diǎn)在一個子網(wǎng)里,適用節(jié)點(diǎn)小于200的集群場景。A、正確B、錯誤【正確答案】:A81.華為FusionInsightHD是國內(nèi)首家符合國家金融等級保護(hù)的大數(shù)據(jù)平臺,其安全性現(xiàn)在以下哪些方面?A、系統(tǒng)安全B、權(quán)限認(rèn)證C、數(shù)據(jù)安全D、以上全都正確【正確答案】:D82.以下關(guān)于FusionInsightManager界面Hive日志收集的描述,哪個選項(xiàng)不正確?()A、可指定特定用戶進(jìn)行日志收集,例如僅下載UserA用戶產(chǎn)生的日志。B、可指定時間段進(jìn)行日志收集,比如只收集2016-1-1到2016-1-10的日志。C、可指定實(shí)例進(jìn)行日志收集,比如指定收集metstore的日志。D、可指定節(jié)點(diǎn)IP進(jìn)行日志收集,例如僅下載某個IP的日志?!菊_答案】:A83.關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉庫的對比,以下描述錯誤的是?A、Hive元數(shù)據(jù)存儲獨(dú)立于數(shù)據(jù)存儲之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,而傳統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)應(yīng)用單一,靈活性低B、Hive基于HDFS存儲,理論上存儲量可無限擴(kuò)展,而傳統(tǒng)數(shù)據(jù)倉庫存儲量會有上限C、由于Hive的數(shù)據(jù)存儲在HDFS中,所以可以保證數(shù)據(jù)的高容錯,高可靠D、由于Hive基于大數(shù)據(jù)平臺,所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快【正確答案】:D84.在MapReduce編程中,代碼不僅要描述做什么,還要描述具體怎么做。()A、TRUEB、FALSE【正確答案】:B85.HDFS聯(lián)邦機(jī)制下,各NameNode間元數(shù)據(jù)是不共享的。A、TRUEB、FALSE【正確答案】:A86.導(dǎo)入數(shù)據(jù)到Hive表時,不會檢查數(shù)據(jù)合法性,只會要讀取數(shù)據(jù)時候檢查。A、TRUEB、FALSE【正確答案】:A87.kafkaConsumer寫數(shù)據(jù)總體流程是,Consumer連接指定TopicPartition所在的LeaderBroker,用于主動獲取方式從kafka中獲取消息。()A、TRUEB、FALSE【正確答案】:A88.Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI【正確答案】:B89.Kafka作為一個分布式消息系統(tǒng),支持在線和離線消息處理,并提供了javaAPI以便其他組件對接使用,在FusionInsight解決方案中,Kafka屬于FusionInsightHD模塊。A、TrueB、False【正確答案】:A90.YARN中設(shè)置隊(duì)列QueueA的最大使用資源量,需要配置哪個參數(shù)?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.stateD、yarn.scheduler.capacity.root.QueueA.maximum-capacity【正確答案】:D91.HDFS支持大文件存儲,同時支持多個用戶對同一個文件的寫操作,以及在文件任意位置進(jìn)行修改。A、正確B、錯誤【正確答案】:B92.加載數(shù)據(jù)到Hive表,哪種方式不正確?A、直接將本地路徑的文件load到Hive表中B、將HDFS上的額文件load到Hive表中C、Hive支持insertinto單條記錄的方法,所以可以直接在命令行插入單條記錄D、將其他表的結(jié)果集insertinto到Hive表中【正確答案】:C93.FusionInsightHD系統(tǒng)中,HBase支持動態(tài)擴(kuò)展列。()A、TRUEB、FALSE【正確答案】:A94.Flink中的checkpoint機(jī)制不斷繪制流應(yīng)用的快照,流應(yīng)用的狀態(tài)快照只能保存在HDFS文件系統(tǒng)中。A、對B、錯【正確答案】:B95.Flume支持監(jiān)控并傳輸目錄下新增的文件,可實(shí)現(xiàn)數(shù)據(jù)傳輸,以上描述的是哪一類source?A、spoolingdirectorysourceB、httpsourceC、execsourceD、syslogsource【正確答案】:A96.關(guān)于HIVE的描述不正確的是?A、Hive最佳使用場景是大數(shù)據(jù)集的批處理作業(yè)B、Hive可以實(shí)現(xiàn)在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢C、Hive構(gòu)建在基于靜態(tài)批量處理的Hadoop之上,Hadoop通常有較高的延遲并且在作提交和調(diào)度的時候需要大量的開銷D、Hive查詢操作過程嚴(yán)格遵循HadoopMapReduce的作用執(zhí)行模型,Hive將用戶的HiveQL語句通過解釋器轉(zhuǎn)

換為MapReduceHadoop集群上【正確答案】:B97.HFS的出現(xiàn)解決了需要在HDFS中存儲大量的小文件(10MB以下)。同時也要存儲一些大文件(10MB以上)的混合的場景A、TRUEB、FALSE【正確答案】:B98.SparkonYarn-client適合用于生產(chǎn)環(huán)境是因?yàn)榭梢愿斓目吹紸PP的輸出。A、TRUEB、FALSE【正確答案】:B99.

FusionInsightHD的Streaming對于Zookeeper弱依賴,即使Zookeeper故障,Streaming可以正常提供服務(wù)。A、對B、錯【正確答案】:B100.安裝FusionInsightHD的Streaming組件時,Nimbus角色要求安裝幾個節(jié)點(diǎn)A、3B、2C、4D、1【正確答案】:B101.下列選項(xiàng)中無法通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是?A、商業(yè)模式發(fā)現(xiàn)B、信用評估C、商品推薦D、運(yùn)營分析【正確答案】:A102.FusionInsightHD系統(tǒng)審計(jì)日志不可用記錄下面哪些操作?A、手動清除警告B、啟停服務(wù)實(shí)例C、刪除服務(wù)實(shí)例D、查詢歷史監(jiān)控【正確答案】:D103.為了提高kafka的容錯性,kafka支持partition的復(fù)制策略,以下關(guān)于leaderpartition和Followerpartition的描述錯誤的是?()A、一個kafka集群各個節(jié)點(diǎn)間不可能互為leader和flowerB、如果leader失效,那么將會有其他Follower來接管(成為新的leader)C、由于leaderServer承載了全部的請求壓力,因此從集群的整體考慮,kafka會將

Leader均橫的分散在每個實(shí)例上,來確保整體的性能穩(wěn)定D、Kafka針對partition的復(fù)制需要選出一個leader,由該leader負(fù)責(zé)partition的讀寫操作,其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)的同步【正確答案】:A104.假設(shè)每個用戶最低資源保障設(shè)置為yarn.scheduler.capacity.root.QueueA,minimum-user-limit-percent=24,則以上說法錯誤的是()A、第4個用戶提交任務(wù)時,每個用戶最多獲得25%的資源B、第2個用戶提交任務(wù)時,每個用戶最多獲得50%的資源C、第3個用戶提交任務(wù)時,每個用戶最多獲得33.33%的資源D、第5個用戶提交任務(wù)時,每個用戶最多獲得20%的資源【正確答案】:D105.Hive不支持超時重試機(jī)制。A、TRUEB、FALSE【正確答案】:B106.在很多小文件場景下,Spark會起很多Task,當(dāng)SQL邏輯中存在Shuffle操作時,會大大增加hash分桶數(shù),嚴(yán)重影響性能。FusionInsight中,針對小文件的場景通常采用()算子,來對Table中的小文件生成的partition進(jìn)行合并,減少partition數(shù),從而避免在shuffle的時候,生成過多的hash分桶,提升性能?A、groupbyB、coalosceC、connectD、join【正確答案】:D107.FusionInsightManager界面上,當(dāng)收到Kafka磁盤容量不足告警,且該告警的原因已經(jīng)排除硬盤硬件故障時,系統(tǒng)管理員需要考慮擴(kuò)容解決此問題A、對B、錯【正確答案】:A108.下列選項(xiàng)中,關(guān)于Zookeeper可靠性含義說法正確的是?()A、可靠性通過主備部署莫屬實(shí)現(xiàn)B、可靠性是指更新只能成功或者失敗,沒有中間狀態(tài)C、可靠性是指無論哪個Server。對外展示的均是同一個視圖D、可靠性是指一條消息被一個Server接收,它將被所有Server接受【正確答案】:D109.FusionInsightHD系統(tǒng)中,下面哪個方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果?A、通過Yarn任務(wù)管理查看B、通過LoaderUI界面查看C、通過Mangaer的告警查看D、通過NodeManager查看【正確答案】:D110.sparkStreaming容錯機(jī)制是指RDD中任意的partition出錯,都可以根據(jù)其父

RDD重新計(jì)算生成,如果父RDD丟失,則需要去磁盤中查找原始數(shù)據(jù)。()A、TRUEB、FALSE【正確答案】:B111.FusionInsightHD中使用HBase進(jìn)行數(shù)據(jù)讀取服務(wù)時需要連接HMasterA、對B、錯【正確答案】:B112.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Bolt的某一個確定的Task,應(yīng)選擇以下哪種消息發(fā)布策略A、局部字段分組B、廣播分組C、直接分組D、全局分組【正確答案】:C113.FusionlnsightHadoop集群中,在某節(jié)點(diǎn)上通過df-hT查詢,看到的分區(qū)包含以下幾個:

/var/log

/srv/BigData

/srv/BigData/hadoop/data5

/srv/BigData/solr/solrserver3

/srv/BigData/dbdataom

這些分區(qū)所對應(yīng)磁盤最佳Raid級別的規(guī)劃組合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1【正確答案】:B114.創(chuàng)建loader作業(yè)中,可以在以下哪個步驟中設(shè)置過濾器類型?()A、輸入設(shè)置B、轉(zhuǎn)換C、輸出D、基本信息【正確答案】:A115.HDFS中的主備仲裁,是由哪個組件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正確答案】:A116.如圖,以下關(guān)于kafka消息消費(fèi)者Consumer讀取消息的描述,錯誤的有?()A、圖片中的藍(lán)色為kafka的一個topic,即可以理解為隊(duì)列,每個格子代表一條消息。B、生產(chǎn)者產(chǎn)生的消息逐條放到topic的末尾。C、消費(fèi)者從右至左順序讀取消息。D、Consumer使用offset來記錄讀取的位置?!菊_答案】:C117.HDFS機(jī)制中NameNode負(fù)責(zé)管理元數(shù)據(jù),Client端每次讀請求都需要從NameNode的元數(shù)據(jù)磁盤中讀取元數(shù)據(jù)信息,以此獲取所讀文件在DataNode中的位置。A、對B、錯【正確答案】:A118.HBase的某張表的RowKey劃分SplitKey為9,E,a,z,請問該表有幾個Region?A、3B、4C、5D、6【正確答案】:C119.如果YARN集群中只有Default、QueueA和QueueB子隊(duì)列,那么允許將他們的容量分別設(shè)置為60%、25%、22%。A、對B、錯【正確答案】:B120.Mapreduce過程中,默認(rèn)情況下,一個分片就是一個塊,也是一個mapTask.A、trueB、false【正確答案】:A121.使用配置規(guī)劃工具對FusionInsightHDV100R002C50集群進(jìn)行規(guī)劃時,可以用V100R2002C60版本的配置規(guī)劃工具來規(guī)劃。A、正確B、錯誤【正確答案】:B122.FusionInsightHD部署過程中,執(zhí)行precheck檢查每個節(jié)點(diǎn)時必須調(diào)用

CheckNode.Config配置文件。A、正確B、錯誤【正確答案】:A123.SparkStreaming相比Storm具備更高的實(shí)時性。A、對B、錯【正確答案】:B124.在有N個節(jié)點(diǎn)FusionInsightHD集群中部署HBase時,推薦部署()個HMaster進(jìn)程,()個

RegionServer進(jìn)程A、3,NB、N,NC、2,ND、2,2【正確答案】:C125.為了保障流應(yīng)用的快照存儲的可靠性,快照主要存儲在哪里?A、jobManager的內(nèi)存中B、可靠性高的單機(jī)數(shù)據(jù)庫中C、本地文件系統(tǒng)中D、hdfs中【正確答案】:D126.Spark根據(jù)RDD的依賴關(guān)系來劃分Stage,調(diào)度器從DAG圖末端出發(fā),逆向遍歷整個依賴關(guān)系鏈,遇到窄依賴就斷開,遇到寬依賴就將其加入當(dāng)前Stage。A、TRUEB、FALSE【正確答案】:B127.Hive是基于hadoop的數(shù)據(jù)倉庫軟件,可以查詢和管理PB級別的分布式數(shù)據(jù)。以下關(guān)于Hive特性的描述不正確的是?()A、僅支持MapReduce計(jì)算引擎B、易用易編程C、可直接訪問HDFS文件以及HBaseD、靈活方便的ETL(extract/transform/load)【正確答案】:A128.以下哪個不屬于Hadoop中MapReduce組件的特點(diǎn)?A、易于編程B、良好的拓展性C、實(shí)時計(jì)算D、高容錯性【正確答案】:C129.以下關(guān)于ZooKeeper關(guān)鍵特性中的原子性說法正確的是A、客戶端發(fā)送的更新會按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個server接收,將被所有server接收D、集群中無論哪臺服務(wù)器,對外展示的均是同一視圖【正確答案】:B130.HDFS的Client寫入文件時,數(shù)據(jù)的第一副本寫入位置是由NameNode確定,其他副本的寫入位置由DataNode確定。A、正確B、錯誤【正確答案】:A131.HBase中MOB數(shù)據(jù)直接HFile的格式存儲在HDFS上,然后把這個文件的地址信息及大小信息作為value存儲在管理HBase的store上,通過工具集中管理這些文件。這樣就可以大大降低HBase的compation和split頻率,提升性能。A、TRUEB、FALSE【正確答案】:A132.現(xiàn)有3個機(jī)架,有一個文件需要存3份,其中副本1和副本2存放在與client相同的機(jī)架且不同的服務(wù)器上。根據(jù)HDFS的副本放置策略一定要存放在其他機(jī)架。A、TRUEB、FALSE【正確答案】:B133.HBase中數(shù)據(jù)存儲的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile【正確答案】:A134.SoIrCloud模式是集群模式,在此模式下Solr服務(wù)器強(qiáng)依賴于以下哪個服務(wù)?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正確答案】:C135.FusionInsightHD的Streaming是基于開源ApacheStorm開發(fā)的,Storm是一個分布式的離線計(jì)算框架。A、對B、錯【正確答案】:B136.在FusionInsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Topic時,必須設(shè)置Partition個數(shù)B、創(chuàng)建Kafka的Topic時,必須設(shè)置Partition副本個數(shù)C、設(shè)置多副本可以增強(qiáng)Kafka服務(wù)的容災(zāi)能力D、以上全都正確【正確答案】:C137.HDFS的NameNode節(jié)點(diǎn)主備狀態(tài)管理及元數(shù)據(jù)文件合并分別由哪兩個角色負(fù)責(zé)?A、ZKFC和備NameNodeB、主NameNode和備NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode【正確答案】:A138.容量調(diào)度器在盡行資源分配,現(xiàn)有同級的2個隊(duì)列Q1和Q2,他們的容量均為30,其中Q1已使用8,Q2已使用14,則會優(yōu)先將資源分配Q1。A、TrueB、False【正確答案】:A139.YARN調(diào)度器分配資源的順序,下面哪一個描述是正確的?A、任意機(jī)器->同機(jī)架->本地資源B、任意機(jī)器->本地資源->同機(jī)架C、本地資源->同機(jī)架->任意機(jī)器D、同機(jī)架->任意機(jī)器->本地資源【正確答案】:C140.spark的核心模塊是?A、sparkstreamingB、sparkcoreC、mapreduceD、sparksql【正確答案】:B141.FusionlnsightHD中Loader實(shí)例必須與哪個實(shí)例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager【正確答案】:D142.FusionInsightHD平臺中,HBase暫不支持二級索引A、對B、錯【正確答案】:B143.Hadoop平臺中,要查看YARN服務(wù)中一個application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正確答案】:D144.關(guān)于FusionlnsightManager中的Controller和NodeAgent,說法正確的是?A、Controller每陪3秒向NodeAgent發(fā)送心跳B、NodeAgent接受Contcolleir下發(fā)的命令,執(zhí)行具體的動作C、每個節(jié)點(diǎn)都必須部署ControllerD、NodeAgent是幵源增強(qiáng)的【正確答案】:B145.在Flink中,checkpoint機(jī)制能夠保證應(yīng)用在運(yùn)行過程中出現(xiàn)失敗時,從某一個檢查點(diǎn)恢復(fù),在此過程中,流快照是根據(jù)數(shù)據(jù)流入順序依次創(chuàng)建的。A、TrueB、False【正確答案】:A146.Flink是一個批處理和流處理結(jié)合的統(tǒng)一計(jì)算框架,其核心是一個數(shù)據(jù)分發(fā)以及并行化計(jì)算的流數(shù)據(jù)處理引擎。A、對B、錯【正確答案】:A147.Kerberos只能對集群內(nèi)的服務(wù)提供安全認(rèn)證。A、正確B、錯誤【正確答案】:B148.Flink采用checkpoint機(jī)制保障應(yīng)用程序運(yùn)行中的容錯性。A、TRUEB、FALSE【正確答案】:A149.關(guān)于Hive在FusionlnsightHD中的架構(gòu)描述錯誤的是?A、只要有一個HiveServer不可用,整個Hive集群便不可用B、HiveServer負(fù)責(zé)接受客戶端請求、解析、執(zhí)行HQL命令并返回查詢結(jié)果C、MetaStore用于提供原數(shù)據(jù)服務(wù),依賴于DBServerD、在同一時間點(diǎn)HiveServeir只有一個處于Active狀態(tài),另一個則處于Standby狀態(tài)【正確答案】:A150.下圖展示了StructuredStreaming的計(jì)算模型。通過觀察可以得出最終T3的計(jì)算結(jié)果是

A、Dog1,owl1B、Cat2,dog4,owl2Cat2,dog3,owl1D、Cat1,cat1,dog2,dog2,owl2【正確答案】:B1.Nimbus在Streaming架構(gòu)中的功能包括?A、監(jiān)控任務(wù)執(zhí)行狀態(tài)B、任務(wù)調(diào)度C、啟動/關(guān)閉工作進(jìn)程D、資源分配【正確答案】:ABD2.Flink的兼容性體現(xiàn)在以下哪些方面?()A、能夠與hadoop原有的mappers和reducers混合使用B、YARN能夠作為Flink集群的資源調(diào)度管理器C、能夠使用hadoop的格式化輸入和輸出D、能夠從本地獲取數(shù)據(jù)【正確答案】:ABCD3.FusionInsightManager與外部管理平臺對接時,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正確答案】:AB4.HBase中包含的一些典型的Filter有哪些?A、ingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter【正確答案】:ABCD5.與開源sqoop相比,loader具有哪些增強(qiáng)特性?A、高可靠性B、高性能C、安全性D、圖形化【正確答案】:ABCD6.在loader歷史作業(yè)記錄中,可以查看以下哪些內(nèi)容?()A、作業(yè)狀態(tài)B、作業(yè)開始/運(yùn)行時間C、臟數(shù)據(jù)鏈接D、錯誤行/文件數(shù)量【正確答案】:ABCD7.YARN中,“從”節(jié)點(diǎn)負(fù)責(zé)以下哪些工作?()A、集群中所有資源的統(tǒng)一管理和分配B、監(jiān)督Container的生命周期管理C、管理日志和不同應(yīng)用程序用到的附屬服務(wù)D、監(jiān)控每個Container的資源使用(內(nèi)存,CPU等)情況【正確答案】:BD8.Flume適用于以下哪些場景的數(shù)據(jù)收集?A、Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B、本地文件數(shù)據(jù)采集C、應(yīng)用系統(tǒng)產(chǎn)生的日志采集D、大量數(shù)據(jù)的實(shí)時數(shù)據(jù)采集【正確答案】:ABC9.HBase集群定時執(zhí)行Compaction的目的是什么?A、減少同一Region,同一ColumnFamily下的文件數(shù)目B、提升數(shù)據(jù)讀取性能C、減少同一ColumnFamily的文件數(shù)據(jù)D、減少同一Region的文件數(shù)目【正確答案】:ABD10.FusionInsightHD系統(tǒng)中Hive支持的存儲格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正確答案】:BCD11.fusininsightHD平臺中,那些組件支持對列表加密?A、HDFSB、FlinkC、hbaseD、hive【正確答案】:CD12.FusionlnsightHDLoader可以將HDFS數(shù)據(jù)導(dǎo)出到以下哪些目標(biāo)端?A、SFTP服務(wù)器B、FTP服務(wù)器C、Oracle數(shù)據(jù)庫DB2數(shù)據(jù)庫【正確答案】:ABCD13.HDFS系統(tǒng)中對備用NameNode的作用的描述正確的有?A、主NameNode的熱備B、備NameNode對內(nèi)存沒有要求C、幫助主NameNode合并編輯日志,減少主NameNode的啟動時間D、備NameNode應(yīng)與主NameNode部署到一個節(jié)點(diǎn)【正確答案】:AC14.kafka消息傳輸保障通常有以下哪幾種?()A、最多三次(AtMostThreeTimes)B、僅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正確答案】:BCD15.以下關(guān)于華為大數(shù)據(jù)解決方案說法正確的是()A、Farmer是數(shù)據(jù)服務(wù)框架B、GaussDB是一款開源數(shù)據(jù)庫產(chǎn)品C、FusionInsightManager是一個分布式系統(tǒng)管理框架,管理員可以通過多接入點(diǎn)操控分布式集群D、FusionInsightHD是基于開源大數(shù)據(jù)軟件Hadoop的增強(qiáng)版本【正確答案】:ABCD16.下列關(guān)于Flink中Transformation的說法正確的是?A、可以通過window設(shè)定時間窗口B、Filtor操作是對每個元素執(zhí)行boolean函數(shù)C、flatMap可以對文本進(jìn)行切分D、eyBy是將源頭數(shù)據(jù)按照key進(jìn)行分組,以保證同一個key的元數(shù)據(jù)分到同樣的組中【正確答案】:ABD17.HBase的數(shù)據(jù)文件HFile中一個KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType【正確答案】:ABCD18.Fusionlnsight系統(tǒng)中Hive支持的存儲格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正確答案】:BCD19.FusionlnsightHadop集群中,就去哪規(guī)模有70個節(jié)點(diǎn),如果采用推薦部署方案,在管理節(jié)點(diǎn)可能存在哪些分區(qū)?A、/srv/BigData/zookeeperB、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/BigData/jumalnodeE、/srv/BigData/hadoop/data5【正確答案】:ABCD20.下列選項(xiàng)中,哪些是MapReduce一定會有的過程?A、CombineB、MapC、ReduceD、Partition【正確答案】:BCD21.下列哪些組件必須依賴于Zookeeper才能運(yùn)行?A、HDFSB、HBaseC、SparkD、YARN【正確答案】:ABD22.FusionInsightManager會定時備份哪些數(shù)據(jù)?A、NameNodeB、LDAPC、OMSDBService【正確答案】:BC23.Zookeeper中的數(shù)據(jù)節(jié)點(diǎn)znode分為哪幾種類型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正確答案】:BD24.下列哪些措施是為了保障數(shù)據(jù)的完整性A、元數(shù)據(jù)可靠性保證B、重建失效數(shù)據(jù)盤的副本數(shù)據(jù)C、安全模式D、集群數(shù)據(jù)均衡【正確答案】:ABCD25.以下屬于Streaming的特點(diǎn)的是?A、數(shù)據(jù)先存儲在計(jì)算B、屬于事件驅(qū)動C、延遲低D、可做連續(xù)查詢【正確答案】:BCD26.以下關(guān)于Flink與其他組件交互說法正確的是?()A、Flink的checkpoint的實(shí)現(xiàn)依賴于ZookeeperB、Flink可以將接收的組件發(fā)生給kafkaC、Flink任務(wù)的運(yùn)行依賴Yarn來進(jìn)行資源的調(diào)度管理D、Flink在HDFS文件系統(tǒng)中讀寫數(shù)據(jù)【正確答案】:ABCD27.Loader可以實(shí)現(xiàn)以下哪些轉(zhuǎn)換規(guī)則()A、空值轉(zhuǎn)換B、拼接轉(zhuǎn)換C、長整型時間轉(zhuǎn)換D、增量轉(zhuǎn)換【正確答案】:ABCD28.以下屬于hiveSQL中DDL(數(shù)據(jù)定義語言)的是?()A、修改表B、刪除表C、建表D、數(shù)據(jù)導(dǎo)入【正確答案】:ABC29.Flink支持的時間操作類型包括以下哪些選項(xiàng)?A、結(jié)束時間B、處理時間C、采集時間D、事件時間【正確答案】:BD30.安全模式下安裝FusionlnsightHD集群時,哪些組件是必須安裝的?、A、ZooKeeperB、LDAPServerC、KrbServerD、HDFS【正確答案】:BC31.以下關(guān)于KafkaLogs中segmentfile的說法正確的有?A、index元數(shù)據(jù)全部映射到menory,可以避免sementfile的index數(shù)據(jù)IO磁盤操作B、索引文件稀疏存儲,可以大幅減低index文件元數(shù)據(jù)占用空間大小C、稀疏存儲,即將原來的完整數(shù)據(jù),只間隔的選擇多條進(jìn)行存儲D、通過索引信息可以快速定位message【正確答案】:ABCD32.Spark適用于以下哪些場景?()A、圖計(jì)算B、互式查詢C、批處理D、實(shí)時流處理【正確答案】:ABCD33.關(guān)于Flume,下列說法錯誤的是?、A、Flume級聯(lián)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸支持加密B、Flume支持多級聯(lián)和多路復(fù)用C、Source到Channel到Sink等進(jìn)程內(nèi)部有加密的必要D、Flume級聯(lián)節(jié)點(diǎn)之間的數(shù)據(jù)傳輸不支持壓縮【正確答案】:CD34.在FusionInsight產(chǎn)品中,關(guān)于Kafka組件說法正確的是?A、在創(chuàng)建Topic時,副本數(shù)不得大于當(dāng)前存活的Broker實(shí)例個數(shù),否則創(chuàng)建Topic將會失敗B、Kafka的Producer發(fā)送消息時,可以指定該消息被哪個Consumer消費(fèi)C、Kafka會將元數(shù)據(jù)信息存放到Zookeeper上D、Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄【正確答案】:ABCD35.在FusionInsight集群中,Spark主要與以下哪些組件進(jìn)行交互?()A、HiveB、YARNC、HDFSD、Zookeeper【正確答案】:BCD36.執(zhí)行Hbase數(shù)據(jù)業(yè)務(wù)(題干可能為讀數(shù)據(jù)業(yè)務(wù)),需要讀取哪幾部分?jǐn)?shù)據(jù)()A、HLogB、MenStoreC、HFileD、HMaster【正確答案】:BC37.下圖展示了HDFS的標(biāo)簽存儲策略,觀察下圖,HBase的數(shù)據(jù)會被存儲到哪些數(shù)據(jù)節(jié)點(diǎn)上A、ataNodeAB、ataNodeBC、ataNodeED、ataNodeF【正確答案】:AB38.下列選項(xiàng)中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正確答案】:BCD39.FusionInsightHD數(shù)據(jù)高可靠性體現(xiàn)在以下哪些方面?()A、跨數(shù)據(jù)中心容災(zāi)B、關(guān)鍵數(shù)據(jù)掉電保護(hù)C、硬盤熱插拔D、第三方備份系統(tǒng)集成【正確答案】:ABCD40.ZKFC進(jìn)程部署在hdfs中的以下那個節(jié)點(diǎn)上?A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不對【正確答案】:AB41.大數(shù)據(jù)分析相關(guān)技術(shù)主要特征有哪些?A、機(jī)器學(xué)習(xí),全量特征B、數(shù)據(jù)背后事件關(guān)聯(lián)性分析C、以海量數(shù)據(jù)為基礎(chǔ)D、以精確樣本為基礎(chǔ)【正確答案】:ABC42.Zookeeper的關(guān)鍵特性包括以下哪些選項(xiàng)?()A、原子性B、最終一致性C、等待無關(guān)性D、可靠性【正確答案】:ABCD43.FusionInsightHD的Loader在創(chuàng)建作業(yè)時,連接器有什么作用?A、確定有哪些轉(zhuǎn)換步驟B、提供優(yōu)化參數(shù),提供數(shù)據(jù)導(dǎo)入導(dǎo)出性能C、配置作業(yè)如何與外部數(shù)據(jù)源進(jìn)行連接D、配置作業(yè)如何與內(nèi)部數(shù)據(jù)源進(jìn)行連接【正確答案】:ABCD44.FuskmlnsightHD集群中,集群規(guī)模現(xiàn)有300個節(jié)點(diǎn),如果采用推薦部署方案,控制節(jié)點(diǎn)上一定不會存在哪些分區(qū)?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正確答案】:BE45.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正確答案】:BC46.HDFS不適用于以下哪些場景?A、流式數(shù)據(jù)訪問B、大量小文件存儲C、大文件存儲與訪問D、隨機(jī)寫入【正確答案】:BD47.HBase集群定時執(zhí)行Compaction的目的是什么?(ACD)[]A、減少同一個Region同一個ColumnFamily下的文件數(shù)目B、減少同一個Region的文件數(shù)目C、提升數(shù)據(jù)讀取性能D、提升數(shù)據(jù)寫入能力【正確答案】:ACD48.Zookeeper可以為FusionInsightHD中哪些組件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正確答案】:ABCD49.FusionlnsightHDLLD配置規(guī)劃工具可以生成哪些配置文件?A、監(jiān)控告警閾值配置文件B、集群的安裝模板文件C、HDFS和YARN的配置文件D、執(zhí)行Precheck所需要的配晉文件CheckNodes.Config【正確答案】:BD50.FusionInsight家族包含下列哪些子產(chǎn)品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正確答案】:ABCDE51.YARN通過ResourceManager對集群資源進(jìn)行管理,它的主要功能有?A、集群資源調(diào)度B、應(yīng)用程序管理C、日志管理D、以上說法都不對【正確答案】:AB52.以下哪些是Kafka實(shí)際的應(yīng)用場景A、日志收集B、網(wǎng)站活性跟蹤C(jī)、資源管理D、聚合統(tǒng)計(jì)系統(tǒng)運(yùn)營數(shù)據(jù)【正確答案】:BD53.在Kafka中,如下關(guān)于Producer發(fā)送數(shù)據(jù)的說法錯誤的是()A、Proucer負(fù)責(zé)生產(chǎn)數(shù)據(jù)。Consumer負(fù)責(zé)消費(fèi)數(shù)據(jù)。Producer和Consumer之間需要建立連接B、Proucer既可以發(fā)送數(shù)據(jù)到Broker上。又可以發(fā)送數(shù)據(jù)到ConsumerC、Proucer作為消息生產(chǎn)者??梢灾苯訉?shù)據(jù)寫入ZookeeperD、Proucer連接任意一個正常的Broker實(shí)例就可以產(chǎn)生數(shù)據(jù)【正確答案】:ABC54.FusionlnsightHD產(chǎn)品在部署Kerberos和LDAP服務(wù)是,以下描述正確的是?(多選)A、部署Kerberos服務(wù)之前,必須先部署LDAP服務(wù)B、LDAP服務(wù)必須和Kerberos服務(wù)部署在同一個節(jié)點(diǎn)C、Kerberos服務(wù)和LDAP服務(wù)部署同一個節(jié)點(diǎn)利于數(shù)據(jù)訪問,有助于性能提升D、LDAP服務(wù)可以多個集群共享【正確答案】:AC55.華為大數(shù)據(jù)產(chǎn)品FusionInsightHD中的Streaming具有哪些關(guān)鍵特性?()A、靈活性B、可伸縮性C、容災(zāi)能力D、消息可靠性【正確答案】:ABCD56.FusionInsightHD平臺中,哪些組件支持對表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正確答案】:BC57.傳統(tǒng)數(shù)據(jù)處理的性能瓶頸有?A、數(shù)據(jù)存儲成本高B、流式數(shù)據(jù)處理性能不足C、擴(kuò)展能力有限D(zhuǎn)、批量數(shù)據(jù)處理缺失【正確答案】:AC58.在華為大數(shù)據(jù)解決方案中,hadoop底層包含以下那些組件?A、finkB、hiveC、minerD、spark【正確答案】:ABD59.FusionInsight家族包含下列哪些子產(chǎn)品()?A、FusionInsightMinerB、FusionInsightFarmerC、FusionInsightHDD、GaussDB200【正確答案】:ABCD60.從生命周期來看,數(shù)據(jù)主要經(jīng)歷哪幾個階段?A、數(shù)據(jù)采集B、數(shù)據(jù)存儲C、數(shù)據(jù)管理D、數(shù)據(jù)分析E、數(shù)據(jù)呈現(xiàn)【正確答案】:ABCD61.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、數(shù)據(jù)集成C、系統(tǒng)管理D、服務(wù)治理【正確答案】:AC62.Flume進(jìn)程級聯(lián)時,以下哪些sink類型用于接收上一跳Flume發(fā)送過來的消息?AvrosinkB、ThriftsinkC、HivesinkD、Nullsink【正確答案】:AB63.NodeManager的內(nèi)存和CPU的數(shù)量,是通過下列哪些選項(xiàng)進(jìn)行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正確答案】:BCD64.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令提交了拓?fù)渲?使用StromUI查看發(fā)現(xiàn)該拓?fù)溟L時間沒有處理數(shù)據(jù),可能原因有?()A、Supervisor是在topology中接收數(shù)據(jù)然后執(zhí)行處理的組件B、拓?fù)錁I(yè)務(wù)存在邏輯錯誤,提交之后無法正常運(yùn)行C、拓?fù)溥^于復(fù)雜或者并發(fā)太大,導(dǎo)致worker啟動時間太長,超過Supervisor的等待時間D、Supervisor的slots資源被耗盡,拓?fù)涮峤簧先ブ蠓植坏絪lot去啟東worker進(jìn)程【正確答案】:BCD65.以下哪些選項(xiàng)屬于FusionInsight數(shù)據(jù)安全性?A、操作系統(tǒng)安全加固B、組件數(shù)據(jù)加密C、數(shù)據(jù)完整性校驗(yàn)D、用戶權(quán)限認(rèn)證管理【正確答案】:BC66.以下關(guān)于HBase的文件存儲模塊(HBaseFileStream,簡稱HFS)描述正確的有?A、應(yīng)用在FusionInsightHD的上層應(yīng)用B、HFS封裝了HBase與HDFS的接口C、為上層應(yīng)用提供文件的存儲.讀取.刪除等功能D、HFS是HBase的獨(dú)立模塊【正確答案】:ABCD67.FusionInsightHD安裝前準(zhǔn)備,包括哪些步驟?(多選)A、完成硬件安裝B、完成節(jié)點(diǎn)主機(jī)操作系統(tǒng)安裝C、準(zhǔn)備工具和軟件。例如Putty、LLD、FusionInsightHD軟件安裝包等D、準(zhǔn)備規(guī)劃數(shù)據(jù),例如網(wǎng)絡(luò)參數(shù)和角色部署位置【正確答案】:ABCD68.MapReduce過程中,以下屬于shuffle機(jī)制的是?()A、partitionB、sort/mergeC、copyD、combine【正確答案】:BC69.下面關(guān)于flink窗口的描述錯誤的是A、滾動窗口在時間上是重疊的B、滾動窗口在時間上是不重疊的C、滑動動窗口之間時間點(diǎn)不存在重疊D、滑動窗口之間時間點(diǎn)存在重疊【正確答案】:AC70.在大數(shù)據(jù)時代,企業(yè)所面臨的挑戰(zhàn)有以下哪些?A、企業(yè)各部門間數(shù)據(jù)分散,相同數(shù)據(jù)在各部門內(nèi)部存儲格式不一致。B、數(shù)據(jù)結(jié)構(gòu)多樣化。C、競爭對手的技術(shù)進(jìn)步。D、數(shù)據(jù)存在噪音、缺失、存儲類型不規(guī)范等問題,需要進(jìn)行大量的數(shù)據(jù)預(yù)處理工作。【正確答案】:ABCD71.Loader提供了哪些方式或接口實(shí)現(xiàn)作業(yè)管理?A、WEBUIB、Linux命令行C、REST接口D、JavaAPI【正確答案】:ABCD72.FusionlnsightManager會定時備份哪些數(shù)據(jù)?A、NameNodeB、LDAPServerC、OMSDBService【正確答案】:BC73.FusionInsightHD集群中包含多種服務(wù),每種服務(wù)又由若干角色組成,下面哪些是服務(wù)的角色?A、HDFSB、NameNodeC、DataNodeD、HBase【正確答案】:BC74.HBase的主要特點(diǎn)有哪些?A、高可靠性B、高性能C、面向列D、可伸縮【正確答案】:ABCD75.下列屬于flume數(shù)據(jù)監(jiān)控的指標(biāo)是?()A、Source接收數(shù)據(jù)量B、Sink寫入數(shù)據(jù)量C、DataNode數(shù)量D、Channel緩存數(shù)據(jù)量【正確答案】:ABD76.Flink流式處理的數(shù)據(jù)源類型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正確答案】:ABCD77.以下關(guān)于FusionInsight多租戶管理的描述正確的有()A、一站式管理租戶資源,計(jì)算資源(CPU/內(nèi)存/IO)、存儲資源(HDFS)、服務(wù)資源,(HBase…)B、可視化的多級租戶管理,與企業(yè)組織結(jié)構(gòu)相匹配,簡化系統(tǒng)資源分配與管理C、基于容器機(jī)制的租戶資源隔離,為租戶SLA保駕護(hù)航D、與企業(yè)組織結(jié)構(gòu)相匹配的多級的租戶模型,不同部門對應(yīng)不同的租戶、按需動態(tài)增刪租戶【正確答案】:ABCD78.以下關(guān)于HBase中HMaster的功能描述哪些是正確的?A、Region負(fù)載均衡,Region分裂以及分裂后的Region分配B、負(fù)責(zé)建表/修改表/刪除表C、負(fù)責(zé)RegionServer的負(fù)載均衡D、RegionServer失效后的Region遷移【正確答案】:ABCD79.在華為FusionInsightHD中,下面哪些組件是Flink強(qiáng)依賴的?()A、kafkaB、HDFSC、YARND、Zookeeper【正確答案】:BC80.FusionlnsightManager與外部管理平臺對接時,支持哪些接口?(多選)A、NMPB、VPNC、FTPD、Syslog【正確答案】:ACD81.StructuredStreamming在OutPut階段可以定義不同的數(shù)據(jù)寫入方式,包括下列哪些方式?AppendModeB、UpdateModeC、neralModeD、pleteMode【正確答案】:ABD82.以下哪些數(shù)據(jù)源可以通過loader實(shí)現(xiàn)與FusionInsightHD的數(shù)據(jù)交換?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正確答案】:ABCD83.Hadoop集群規(guī)模很大時,數(shù)據(jù)的分布情況會非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴(kuò)容,數(shù)據(jù)是否需要做均衡等。以下關(guān)于FusionInsight資源分布監(jiān)控說法正確的有()A、幫助用戶迅速找到資源消耗最高的節(jié)點(diǎn),采用適當(dāng)?shù)拇胧〣、通過每個服務(wù)主頁的資源分布查看界面,查看到關(guān)鍵的資源分布情況C、可以幫助用戶快速聚集在最關(guān)鍵的資源消耗上D、通過DashBoard界面,可以查看到主機(jī)資源分布情況。例如內(nèi)存占有率在50-75%的主機(jī)列表,并提供鏈接跳轉(zhuǎn)【正確答案】:ABCD84.在FusionInsightHD中,以下哪一項(xiàng)不屬于Hive的流控特性A、支持對已建立的總連接數(shù)做閾值控制B、支持對每個用戶已經(jīng)建立的連接數(shù)做閾值控制C、支持對某個特定用戶已建立的連接數(shù)做閾值控制D、支持對單位時間內(nèi)所建立的連接數(shù)做閾值控制【正確答案】:ABD85.某高校的FusionlnsightHD集群中有230個節(jié)點(diǎn),在進(jìn)行集群規(guī)劃時,下列哪些進(jìn)程應(yīng)該部署在數(shù)據(jù)節(jié)點(diǎn)上?A、DataNodeB、NameNodeC、NodeManagerD、RegionServerE、DBServerF、SoIrServer【正確答案】:ACDF86.在FusionInsightHD中,Flink主要與以下哪些組件進(jìn)行交互A、zookeeperB、HDFSC、KafkaD、Yarn【正確答案】:ABCD87.如圖所示,下列哪些選項(xiàng)屬于寬依賴A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正確答案】:AD88.FusionlnsightHD產(chǎn)品中,關(guān)于Kafka組件說法正確的有?A、刪除Topic時,必須踴保Kafka的服務(wù)配置delete.topic.enable配置為trueB、Kafka安裝及運(yùn)行曰志保存路徑為/srv/Bigdata/kafkaC、ZooKeeper服務(wù)不可用會導(dǎo)致Kafka服務(wù)不可用D、必須使用admin用戶或者Kafkaadmin組用戶進(jìn)行創(chuàng)建Topic【正確答案】:ACD89.以下關(guān)于Zookeeper的Leader選舉說法正確的是?A、當(dāng)實(shí)例n為奇數(shù)時,假定n=2x+1,則成為leader節(jié)點(diǎn)需要x+1票B、Zookeeper選舉leader時,需要半數(shù)以上的票數(shù)C、當(dāng)實(shí)例數(shù)為8時,則成為leader節(jié)點(diǎn)需要5票,容災(zāi)能力為4D、當(dāng)實(shí)例數(shù)n為奇數(shù)時,假定n=2x+1,則成為leader節(jié)點(diǎn)需要x票【正確答案】:AB90.若在消息處理過程中允許部分信息丟失,關(guān)閉消息可靠性處理機(jī)制的方式有以下哪些?A、將參數(shù)Config.Topology_ACKKRS設(shè)置為0B、將參數(shù)Config.Topology_ACKKRS設(shè)置為FalseC、Spout發(fā)送消息時,使用不指定消息messageID的接口進(jìn)行發(fā)送D、Bolt發(fā)送消息時使用Unanchor方式發(fā)送【正確答案】:ACD91.FusionInsightHD集群中包含了很多種服務(wù),每種服務(wù)又由若干角色組成,下面哪些是服務(wù)的角色?()【正確答案】:AA、HDFSB、NameNodeC、DataNodeD、Hbase【正確答案】:BC92.Hadoop的HDFS是一種分布式文件系統(tǒng),適合以下哪種應(yīng)用場景的數(shù)據(jù)存儲和管理?A、大量小文件存儲B、高容錯、高吞吐量C、低延遲讀取D、流式數(shù)據(jù)訪問【正確答案】:BD93.FusionInsightManager界面顯示Hive服務(wù)狀態(tài)為Bad時,可能原因有哪些?A、DBService不可用B、HDFS服務(wù)不可用C、MetaStore實(shí)例不可用D、HBase服務(wù)不可用【正確答案】:ABC94.華為FusionInsightHD行業(yè)成功案例都有哪些?A、數(shù)字政府B、智慧園區(qū)C、智慧交通D、金融【正確答案】:ABCD95.下列關(guān)于worker(工作進(jìn)程)、Executor(線程)、task(任務(wù))說法正確的是?()A、每個Executor(線程)可以運(yùn)行多個task(任務(wù))B、每個Executor(線程)可以運(yùn)行不同組件(spout或bolt)的task(任務(wù))C、每個worker可以運(yùn)行多個Executor(線程)D、每個worker只能為一個拓?fù)溥\(yùn)行Executor(線程)【正確答案】:ABCD96.FusionlnsightHD集群升級,以下描述正確的有?(多選)A、升級過程中不可以手工操作主備OMS倒換B、集群內(nèi)所有主機(jī)的root賬戶密碼保持一致C、保持網(wǎng)絡(luò)暢通,避免因網(wǎng)絡(luò)問題導(dǎo)致升級異常D、觀察期不能做壙容【正確答案】:ABCD97.如圖所示,Flink流式數(shù)據(jù)處理接口DataStreamAPI支持的語言包括?()A、pythonB、javaC、c語言D、scala【正確答案】:BD98.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內(nèi)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論