




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第頁HCIP大數(shù)據(jù)復(fù)習(xí)測試有答案1.HDFS基本系統(tǒng)架構(gòu)中,副本配置通常存儲()份。A、1B、2C、3D、4【正確答案】:C2.以下哪個選項屬于大數(shù)據(jù)消息系統(tǒng)?A、HDFSB、MapReduceC、YarnD、Kafka【正確答案】:D3.以下哪一個選項不屬于實時檢索項目構(gòu)建的基本流程?A、環(huán)境準(zhǔn)備B、應(yīng)用調(diào)試、部署C、代碼工程D、市場營銷【正確答案】:D4.關(guān)于HBase的說法中,以下哪一個選項是錯誤的?A、HBase是一個NoSQL數(shù)據(jù)庫B、HBase對于大表的讀寫訪問需要分鐘級的時延,C、HBase需要依賴HDFS作為底層的文件存儲系統(tǒng)D、HBase需要依賴Zookeeper進(jìn)行協(xié)同服務(wù)【正確答案】:B5.以下關(guān)于RDD的描述中,錯誤的是哪一項?A、RDD默認(rèn)是存儲于內(nèi)存。B、RDD是分布式彈性數(shù)據(jù)集。C、RDD的創(chuàng)建只能依賴HDFS。D、用戶可以選擇不同的存儲級別緩存RDD以便重用?!菊_答案】:C6.以下哪種資源不是大數(shù)據(jù)集群在進(jìn)行數(shù)據(jù)傳輸過程中遇到的瓶頸?A、網(wǎng)絡(luò)B、CPUC、磁盤/OD、內(nèi)存【正確答案】:B7.以下有關(guān)Hive多表關(guān)聯(lián)的描述,正確的是哪一個選項?A、Hive最右邊的表是大表,且無法通過命令指定哪張表是大表B、Hive在進(jìn)行多表關(guān)聯(lián)時,從右往左進(jìn)行關(guān)聯(lián)操作C、在HiveSQL中,建議把小表寫在右邊,這樣可以提高執(zhí)行效率D、一般情況下有多少張表進(jìn)行join連接操作,就會啟動多少個MapReduce任務(wù)【正確答案】:B8.以下哪一項不是SparkSQL的適用場景?A、實時數(shù)據(jù)查詢B、需要處理PB級的大容量數(shù)據(jù)C、結(jié)構(gòu)化數(shù)據(jù)處理D、對數(shù)據(jù)處理的實時性要求不高的場景【正確答案】:A9.Hive表與MySQL類似存在分區(qū)的概念,那么對于Hive的分區(qū),以下描述中,正確的是哪一項?A、Hive的分區(qū)針對的是文件,分桶針對的是文件夾。B、Hive的分區(qū)數(shù)量可以通過參數(shù)動態(tài)生成。C、Hive的分區(qū)和分桶是以一個概念。D、Hive的分區(qū)字段與MySQL一樣必須存在?!菊_答案】:B10.Hive中hive>DESCRIBEinvites這一命令可以實現(xiàn)以下哪一功能?A、修改表B、瀏覽表C、描述表D、創(chuàng)建表【正確答案】:C11.下列關(guān)于ElasticSearch的說法錯誤的是哪一項?A、可以擴展到上百臺服務(wù)器,處理PB級別的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)B、分布式文件存儲,并將每一個字段都編入索引,使其可以被搜索C、實時分析的分布式搜索引擎D、ElasticSearch可以存儲和檢索PB的數(shù)據(jù),只適用于離線批處理場景?!菊_答案】:D12.Hive中trim()函數(shù)的功能是以下哪一選項?A、字符串截取B、返回近似值。C、計算絕對值D、去除空字符串【正確答案】:D13.以下關(guān)于KeyBy算子的描述,錯誤的是哪一項?A、數(shù)據(jù)類型轉(zhuǎn)換是KeyedStream->DataStreamB、每個分區(qū)包含具有相同key的元素C、邏輯地將一個流拆分成不相交的分區(qū)D、在內(nèi)部以hash的形式實現(xiàn)的【正確答案】:A14.關(guān)于HBase,以下描述正確的是哪一項?A、對于絕大部分企業(yè)級大數(shù)據(jù)平臺而言,HBase底層需依賴HDFS存儲海量數(shù)據(jù)B、HBase可輕易實現(xiàn)海量數(shù)據(jù)的全局A,CID特性C、HBase和Zookeeper不是強綁定的D、HBase無法存儲結(jié)構(gòu)稀疏的表格【正確答案】:A15.以下關(guān)于SinkProcessor的描述,錯誤的是哪一項?A、DefaultSinkProcessor是默認(rèn)類型,需要配置SinkgroupsB、FalloverSinkProcessor是故障轉(zhuǎn)移機制C、主要作用是針對Sinkgroups的處理策略設(shè)置D、L0A,DbalanceSinkProcessor是負(fù)載均衡機制【正確答案】:A16.大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為以下哪個選項?A、用戶畫像的生成B、病毒入侵C、個人信息的被識別與暴露D、內(nèi)存溢出【正確答案】:C17.以下哪一個組件可以將SQL語句轉(zhuǎn)化為HBase的Scan操作?ApacheStormB、ApachePhoenixC、ApacheMapReduceD、ApacheHDFS【正確答案】:B18.以下哪一選項不屬于分布式架構(gòu)應(yīng)對故障的策略?()A、單集群跨AZ高可用B、異地容災(zāi)集群C、數(shù)據(jù)多副本,支持磁盤熱拔插D、滾動升級/補丁【正確答案】:D19.以下關(guān)于Sqoop數(shù)據(jù)導(dǎo)入原理的描述中,錯誤的是哪一項?A、Sqoop在import時,需要指定split-by參數(shù)。B、Sqoop會根據(jù)傳入的num-mappers來確定劃分幾個區(qū)域。C、Sqoop根據(jù)不同的split-by參數(shù)值來進(jìn)行切分,然后將切分出來的區(qū)域分配到不同map中。D、num-nappers越大效率越高?!菊_答案】:D20.Spark中A,Ction算子返回的是以下哪一選項?A、依賴關(guān)系B、DAG圖C、RDDD、計算結(jié)果或者是寫入存儲操作【正確答案】:D21.以下關(guān)于HliveStreaming的描述,錯誤的是哪一頂?A、通過FlinkSQL可以更簡單的對Hive表中的數(shù)據(jù)進(jìn)行讀寫等操作B、Flink1.11的HiveStreaming功能大大提高了Hive數(shù)倉的實時性C、HiveStreaming對ETL作業(yè)非常有利D、HiveStreaming不支持流式持續(xù)查詢的需求【正確答案】:D22.以下關(guān)于GES四大特點的描述,哪一個選項是錯誤的?A、查詢分析一體:提供豐富的圖分析算法,實現(xiàn)了查詢分析一體化,可以為關(guān)系分析、路徑規(guī)劃、營銷推薦等業(yè)務(wù)提供多樣的分析能力B、高性能:對分布式圖形計算引擎進(jìn)行了深度優(yōu)化,能達(dá)到小時級響應(yīng)速度的查詢能力C、簡單易用:支持Gremlin查詢語言,兼容不同用戶的使用習(xí)慣D、大規(guī)模:具有高效的數(shù)據(jù)組織能力,可以更有效地對百億節(jié)點千億邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析【正確答案】:B23.以下HBase讀取數(shù)據(jù)的命令中,錯誤的是哪一項?A、scan'my_table',(STARTROW=>'123001',Limit=>2)B、get'my_table','123001'C、scan'my_table'D、scan'my_table','123001'【正確答案】:D24.以下哪一個概念是ElasticSearch中的邏輯命名空間?A、TypeB、SchemaC、IndexD、NameSpace【正確答案】:C25.以下哪個場景是HDFS適合做的?A、大量小文件存儲B、流式數(shù)據(jù)訪問C、隨機寫入D、低延遲讀取【正確答案】:B26.關(guān)于GES特點,以下描述中正確的是哪一項?A、簡單易用:支持SQL查詢語言,兼容不同用戶的使用習(xí)慣B、高性能:對分布式圖形計算引警進(jìn)行了深度優(yōu)化,具有高井發(fā)、最快可達(dá)分鐘級時延的實時查詢能力C、大規(guī)模:最大可支持百萬節(jié)點千萬邊規(guī)模的數(shù)據(jù)進(jìn)行查詢與分析D、查詢分析一體:提供豐富的圖分析算法,實現(xiàn)了查詢分析一體化【正確答案】:D27.Spark處理數(shù)據(jù)時產(chǎn)生的中間產(chǎn)物會存放到以下哪一選項中?A、磁盤B、網(wǎng)絡(luò)C、內(nèi)存D、云上【正確答案】:C28.Redis中哪個命令是查看鍵的剩余生存時間?A、ttlB、expireatC、persistD、expire【正確答案】:A29.以下哪一項不屬于Flink組件的滾動聚合算子?A、KeyBy()B、minBy()C、min()D、sum()【正確答案】:A30.消息系統(tǒng)Kafka如何保證高吞吐能力?A、Partition機制B、持久性機制C、多訂閱者機制D、冗余備份機制【正確答案】:A31.df.select($"id",$"name").orderBy($"id",desc).show關(guān)于以上代碼,哪一個選項是錯誤的?A、該行代碼會按照從小到大進(jìn)行排序B、使用該代碼之前,需要先創(chuàng)建或?qū)?shù)據(jù)注冊成為DataFrame,并起名為dfC、該代碼是SparkSQL的查詢語句D、如果不加。show函數(shù),該命令不會返回查詢的結(jié)果【正確答案】:A32.關(guān)于ElasticSearch生態(tài)圈,以下描述中錯誤的是哪一項?A、elasticsearch-head:深度集成Hadoop和ElasticSearch的項目,是官方維護的一個子項目Beats:專門用于發(fā)送數(shù)據(jù)的平臺,可以將數(shù)據(jù)無縫傳輸給Logstash或是ElasticSearchC、Logstash:具備實時數(shù)據(jù)傳輸能力的管道,著重日志相關(guān)處理D、Kibana:開源的分析和可視化平臺,基于ElasticSearch的搜索與分析能力,拿到用于上層分析和可視化需要的結(jié)果【正確答案】:A33.在Flume架構(gòu)中,以下哪一種類型的Sink支持將數(shù)據(jù)寫入到Solr中?A、thiftsinkB、filerollsinkC、MorphlineSolrsinkD、hdfssink【正確答案】:C34.關(guān)于ElasticSearch的說法,下列錯誤的是哪一項?A、ElasticSearch可以把一個完整的索引分成多個分片B、ElasticSearch可以不需要Zookeeper的支特、C、EsMaster可以臨時管理集群級別刷的一些變更D、ElasticSearch可以設(shè)置多個索引的副本【正確答案】:B35.在華為云GES中,想要給圖g中id為"Katherine"的用戶添加朋友為"zhangsan"。以下哪一個選項能正確實現(xiàn)上述目的?A、g.addV('friends').from(g.V("Katherine")).to(g.V("zhangsan"))B、g.addV('friends').from(g.V("zhangsan")).to(g.V("Katherine"))C、g.addE('friends').from(g.V("zhangsan")).to(g.V("Katherine"))D、g.addE('friends').from(g.V("Katherine").to(g.V("zhangsan"))【正確答案】:D36.以下關(guān)于Redis中String類型的描述,錯誤的是哪一項?A、一個字符串類型的值存儲的最大容量是1MBB、字符串類型是Redis中最基本的數(shù)據(jù)類型C、可以存儲圖片D、可以存儲文本數(shù)據(jù)【正確答案】:A37.Hive與傳統(tǒng)數(shù)據(jù)倉庫的區(qū)別不包括以下哪一選項?A、索引B、易用性C、面向?qū)ο驞、執(zhí)行引擎【正確答案】:C38.關(guān)于HBase中HRegionServer的故障處理機制,以下說法中哪一項是錯誤的?A、共用日志優(yōu)點:恢復(fù)時需要分拆日志;缺點:提高對表的寫操作性能B、根據(jù)日志記錄所屬的Region對象對HLog數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Region對象的目錄下C、Zookeeper會實時監(jiān)測每個HRegionServer的狀態(tài),當(dāng)某個HRegionServer發(fā)生故障時,Zookeeper會通知HMasterD、HMaster首先會處理發(fā)生故障的HRegionServer上面遺留的HLog文件,這個遺留的HLog文件中包含了來自多個Region對象的日志記錄【正確答案】:A39.某大數(shù)據(jù)業(yè)務(wù)人員在查詢某張表的業(yè)務(wù)數(shù)據(jù)時,希望查詢出來的數(shù)值結(jié)果保留兩位小數(shù)他應(yīng)該使用哪個函數(shù)來實現(xiàn)?A、randB、absC、trimD、round【正確答案】:D40.不同的Channel提供的持久化水平也是不一樣的,其中()不會持久化;A、MemoryChannel、JDBCChannel、FileChannelB、FileChannel、JDBCChannel、MemoryChannelC、JDBCChannel、MemoryChannel、FileChanelD、MemoryChannel、FileChannel、JDBCChannel【正確答案】:D41.假設(shè)現(xiàn)在要做一個可以根據(jù)線索指導(dǎo)運維人員進(jìn)行排障的功能,你建議選擇下列哪個工具實現(xiàn)該功能?A、LuceneB、HBaseC、GESD、ElasticSearch【正確答案】:D42.Spark讀取任務(wù)參數(shù)優(yōu)先級最高的是以下哪一選項?A、動態(tài)參數(shù)B、代碼配置C、配置文件D、客戶端配置【正確答案】:B43.以下哪個選項不屬于智慧城市所需要的技術(shù)?AI計算B、大數(shù)據(jù)C、手工制作D、智慧交通【正確答案】:C44.某大數(shù)據(jù)運維人員想通過shell命令上傳某個文件至HDFS文件系統(tǒng)中。以下哪個命令能幫助他完成這個操作?A、-putB、-getC、-uploadD、-cat【正確答案】:A45.關(guān)于HBase中的BloomFilter,以下描述中錯誤的是哪一項?A、BloomFilter用來優(yōu)化一些隨機讀取的場景,即Get場景BloomFilter可以被用來快速的判斷一條數(shù)據(jù)在一個大的數(shù)據(jù)集合中是否存在C、如果BloomFilter判斷結(jié)果為“該條數(shù)據(jù)不存在”,這一結(jié)果擁有一定的誤判率D、HBase的BloomFilter的相關(guān)數(shù)據(jù),被保存在HFile中【正確答案】:C46.以下描述中,哪一個選項屬于HDFS的使用場景?A、海量氣象數(shù)據(jù)存儲B、集群資源調(diào)配管理C、社交媒體數(shù)據(jù)流式分析D、數(shù)據(jù)采集與分發(fā)【正確答案】:A47.HBase默以使用什么組件作為其底層文件存儲系統(tǒng)()A、FileB、KafkaC、MemoryD、HDFS【正確答案】:D48.Hive架構(gòu)中有一個Driver模塊用于對SQL語句進(jìn)行轉(zhuǎn)化,那么對于Driver的描述中,正確的是哪一項?A、Driver中的Compiler負(fù)責(zé)對HiveQL生成的執(zhí)行計劃和MapReduce任務(wù)進(jìn)行優(yōu)化B、Driver中的Optimizer負(fù)責(zé)編譯HiveQL并將其轉(zhuǎn)化為一系列相互依賴的Map/Reduce任務(wù)。C、Driver中的Executor負(fù)責(zé)按照任務(wù)的依賴關(guān)系分別執(zhí)行Map/Reduce任務(wù)Driver指Java的JDBC連接所用的Driver類。【正確答案】:C49.企業(yè)級數(shù)據(jù)分析平臺的演進(jìn)趨勢不包括以下哪一階段A、無組織架構(gòu)階段B、單一架構(gòu)階段C、存算分離架構(gòu)階段D、存算融合架構(gòu)階段【正確答案】:A50.以下哪一選項不屬于華為云MRS中Manager的特點?A、一鍵式部署、升級B、運維難度高C、管理員可全面掌握集群運行狀態(tài)D、故障快速定位【正確答案】:B51.在MRSHDFS中,將HDFS根目錄下的a.txt重命名為b.txt,以下哪一個選項可以實現(xiàn)上述目的?A、hdfsdfs-rm/a.txt/b.txtB、hdfsdfs-mv/a.txt/b.txtC、hdfsdfs-put/a.txt/b.txtD、hdfsdfs-1s/a.txt/b.txt【正確答案】:B52.GES基于ElasticSearch于的索引機制,能根據(jù)索引快速查詢數(shù)據(jù)。A、對(參考答案)B、錯【正確答案】:A53.在HDFS中"認(rèn)為硬件,總是不可靠的"體現(xiàn)了以下哪一個特性?A、高吞吐量B、大文件存儲C、高容錯性D、彈性伸縮【正確答案】:C54.在HDFS的架構(gòu)中NameNode主要存儲元數(shù)據(jù)。以下哪個不是元數(shù)據(jù)?A、文件位置B、文件大小C、文件權(quán)限D(zhuǎn)、文件數(shù)據(jù)【正確答案】:D55.關(guān)于Spark中的DataSet,以下哪一個選項是錯誤的?A、DataSet與RDD高度類似,但在利用SparkSQL進(jìn)行處理時性能比RDD好B、DataSet不需要反序列化就可執(zhí)行大部分操作C、DataSet是一個由特定域的對象組成的強類型集合DataSet執(zhí)行sot、filter、shuffle等操作需要進(jìn)行反序列化【正確答案】:A56.關(guān)于HBase集群架構(gòu)組成各部分描述錯誤的是哪一選項?A、正常HBase表只有一個Region,不支持分裂B、Client可用于緩存維護已經(jīng)訪問過的Region的位置信息C、HRegionServer負(fù)責(zé)處理數(shù)據(jù)讀寫請求D、HMaster主要負(fù)責(zé)Region的管理工作【正確答案】:A57.SparkRDD常用算子包含Transformation算子和A,Ction算子,下列哪一個選項屬于ACtion算子?A、MapB、saveAsTextFileC、reduceByKeyD、filter【正確答案】:B58.以下關(guān)于數(shù)據(jù)倉庫分層優(yōu)點的描述中,哪一個選項是錯誤的?A、分層可將復(fù)雜問題簡單化B、分層之后真實數(shù)據(jù)與統(tǒng)計數(shù)據(jù)耦合在一起,減少了存儲空間消耗C、分層可以隔離原始數(shù)據(jù)D、分層可減少重復(fù)開發(fā)【正確答案】:B59.如果想把Redis的Key中存儲的數(shù)字值減1,該使用下列哪一個命令?A、incrbyB、decrC、decrbyD、incr【正確答案】:B60.以下關(guān)于SparkSQL中DataSet的描述中,錯誤的是哪一項?A、DataSet是一個由特定域的對象組成的強類型集合。B、DataSet是"懶惰"的,只在執(zhí)行A,Ction操作時觸發(fā)計算C、DataSet需要反序列化才可以執(zhí)行大部分操作。DataSet與RDD高度類似【正確答案】:C61.以下描述中,哪一項不是實時檢索技術(shù)在金融行業(yè)的應(yīng)用特點?A、高并發(fā)B、查詢條件復(fù)雜C、時延要求高D、存在海量圖片小文件【正確答案】:B62.HiveSQL中DDL指定是哪一種語言?A、數(shù)據(jù)刪除語言B、數(shù)據(jù)查詢語言C、數(shù)據(jù)管理語言D、數(shù)據(jù)定義語言【正確答案】:D63.下列哪一個命令可以清空Redis實例下所有數(shù)據(jù)庫的數(shù)據(jù)A、dropallB、flushallC、dropdbD、flushdb【正確答案】:B64.Kafka的shell命令中,哪一個參數(shù)是設(shè)置副本個數(shù)?A、broker-listB、partitionsC、bootstrap-serverD、replication-fA,Ctor【正確答案】:D65.Irange是Redis中哪種數(shù)據(jù)類型的命令?A、SetB、ListC、HashD、String【正確答案】:B66.實時處理的步驟中,實時計算的前一步是以下哪一項?A、實時展示B、實時落地C、實時緩存存儲D、實時采集【正確答案】:C67.關(guān)于HBase的RowKey,以下描述中錯誤的是哪一項?A、RowKey默認(rèn)最大長度64KB,實際應(yīng)用中一般為10~100字節(jié)B、在HBase中,每一個RowKey都是一串字節(jié)數(shù)組C、RowKey是一個長整型對象D、RowKey默認(rèn)按照字典序存儲【正確答案】:C68.以下大數(shù)據(jù)精準(zhǔn)廣告發(fā)展方向不包括哪一項?A、平臺化B、自動化C、精準(zhǔn)化D、價值化【正確答案】:A69.基于WAL(預(yù)寫式日志W(wǎng)rite-AheadLog)實現(xiàn)持久化的Channel類型,是以下的哪一項?A、FileChannelB、ODBCChannelC、JDBCChannelD、MemoryChannel【正確答案】:A70.下面哪一項不是Kafka的組件?A、BrokersB、ConsumerC、TopicD、Zookeeper【正確答案】:D71.關(guān)于ElasticSearch核心概念,以下哪一項說法是錯誤的?A、Document文檔,是可以被素引的基本單位,特指最頂層結(jié)構(gòu)或根對象序列化成的JSoN數(shù)據(jù)B、Mapping:映射,用來約束字段的類型,可以根據(jù)數(shù)據(jù)自動創(chuàng)建,相當(dāng)于數(shù)據(jù)庫中的ShemaC、Type:文檔類型,文檔類型使得同一個素引中在存儲結(jié)構(gòu)不同的文檔時,只需要依據(jù)文檔類型就可以找到對應(yīng)的參數(shù)映射信息,方便文檔的存儲D、Index:是ElasticSearch中一個邏輯命名空間,與關(guān)系數(shù)據(jù)庫實例DatA,Base相當(dāng),只能存放結(jié)構(gòu)化數(shù)據(jù)【正確答案】:D72.RedisMaster-Slave采用Master-Slave架構(gòu),由Masterslave節(jié)點管理工作。A、對B、錯(參考答案)【正確答案】:B73.有關(guān)實時檢索技術(shù)在金融行業(yè)的應(yīng)用,以下哪一項說法是錯誤的?()A、實時檢索技術(shù)可完成查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等B、底層可以整合多方數(shù)據(jù),形城關(guān)系網(wǎng)絡(luò),查詢關(guān)聯(lián)關(guān)系,可用于反洗錢、風(fēng)控等場景C、對于簡單查詢的場景,要求響應(yīng)時間在10分鐘左右D、可以根據(jù)ID(日志類型、卡號等)和時間段進(jìn)行查詢【正確答案】:C74.在HBase中,實現(xiàn)不同HRegionServer之間的負(fù)載均衡是由以下哪一個組件負(fù)責(zé)管理的?A、HfileB、HlogC、HMasterD、MemStore【正確答案】:C75.以下哪一選項不是批流融合的實時決策系統(tǒng)的優(yōu)勢?A、維護難度大B、吞吐量高C、可靠性高D、批-流融合計算【正確答案】:A76.在大數(shù)據(jù)業(yè)務(wù)處理的場景中,常常說不適合存儲大量的小文件。這主要是受以下哪個組件的影響?A、YarnB、HDFSC、HiveD、MapReduce【正確答案】:B77.Spark2.0中引入了()的概念,它為用戶提供了一個統(tǒng)的切入點來使用Spark的各項功能。A、SparkSessionB、SparkTextC、SparkConfD、SparkContext【正確答案】:A78.關(guān)于HBase的RegionSplit,以下描述中錯誤的是哪一項?A、RegionSplit過程不需要HMaster進(jìn)行管理B、將大表分裂出多個Region有助于提高數(shù)據(jù)的讀寫效率C、RegionSplit速度很快,因為并沒有真正拆分?jǐn)?shù)據(jù)D、在建表時可以預(yù)先創(chuàng)建多個Region【正確答案】:C79.Kafka運行時直接依賴于以下哪一個組件?A、HBaseB、HDFSC、SparkD、Zookeeper【正確答案】:D80.關(guān)于HBase的概念視圖,以下描述中正確的是哪一項?A、HBase是一個面向列的非關(guān)系型數(shù)據(jù)庫B、HBase的每一行數(shù)據(jù)可以有不同的行鍵C、HBase表格數(shù)據(jù)以文件塊的形式存放在內(nèi)存中D、HBase的每一個Region都是固定大小,每個Region都是64MB【正確答案】:A81.以下哪一選項不是統(tǒng)一元數(shù)據(jù)管理的優(yōu)勢?A、元數(shù)據(jù)統(tǒng)一管理、統(tǒng)一訪問和使用B、提供可視化元數(shù)據(jù)管理工具C、使用事實標(biāo)準(zhǔn)Hivemetastore接口,業(yè)務(wù)易對接D、數(shù)據(jù)訪問分散授權(quán),數(shù)據(jù)安全無保障【正確答案】:D82.在大數(shù)據(jù)分析場景中,以下說法哪一項是不正確的?A、SparkSQL:新型SQL處理引擎,速度比Hive快,處理SQL類的批處理任務(wù)B、HDFS:基于大數(shù)據(jù)的數(shù)據(jù)倉庫平臺C、FLink:流批一體式計算引擎D、Hive:類SQL查詢,傳統(tǒng)批處理引擎,速度較慢【正確答案】:B83.Redis中Hash數(shù)字類型不含以下哪種操作?A、hgetallB、hsetC、hmgetD、size【正確答案】:D84.HBase的Region的是由哪個服務(wù)進(jìn)程來管理的?A、HRegionServerB、ZooKeeperC、DataNodeD、HMaster【正確答案】:A85.StructuredStreaming中持續(xù)地查詢最新計算結(jié)果至寫出。這個過程叫做什么?()A、ContinuousstringB、continousqueryC、mapqueryD、continousphrase【正確答案】:B86.altertabletableNamesettblproperties('EXTERNAL'='FALSE'):執(zhí)行該Hive命令能實現(xiàn)以下哪一個目標(biāo)?A、修改內(nèi)部表tableName為外部表B、移動tableName數(shù)據(jù)到外部存儲系統(tǒng)C、刪除tableName表的元數(shù)據(jù)信息D、修改外部表tableName為內(nèi)部表【正確答案】:D87.以下關(guān)于Redis持久化的描述,錯誤的是哪一項?A、RDB方式的持久化是通過快照完成的B、AOF方式的持久化是通過日志文件的方式C、可以手動執(zhí)行save或者bgsave命令讓redis執(zhí)行快照D、Redis默認(rèn)的持久化方式是AOF【正確答案】:D88.關(guān)于RDD,下列說法錯誤的是哪一項?A、RDD默認(rèn)存儲在磁盤B、RDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集C、RDD具有血(Lineage).D、RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象【正確答案】:A89.HBase客戶端提供了很多命令,關(guān)于list命令,下列正確是哪一項?A、查看所有的表B、查詢命名空間C、查看幫助命令D、查詢表數(shù)據(jù)【正確答案】:A90.關(guān)于HDFS單名稱節(jié)點體系結(jié)構(gòu)的局限性,以下哪一個選項是錯誤的?A、HDFS只設(shè)置唯一一個名稱節(jié)點,一旦這個唯一的名稱節(jié)點發(fā)生故障,會導(dǎo)致整個集群變得不可用B、HDFS只設(shè)置唯一個名稱節(jié)點,資源和數(shù)據(jù)可以方便的完成隔離C、HDFS只設(shè)置唯-一個名稱節(jié)點,會帶來命名空間的限制D、HDFS只設(shè)置唯一個名稱節(jié)點,會帶來性能的瓶頸和吞吐量的瓶頸【正確答案】:B91.關(guān)于分布式圖數(shù)據(jù)庫,以下描述正確的是哪一項?A、圖數(shù)據(jù)庫將數(shù)據(jù)切分為多個數(shù)據(jù)塊進(jìn)行存儲,數(shù)據(jù)塊大小固定128MBB、圖數(shù)據(jù)庫以"圖"這種數(shù)據(jù)結(jié)構(gòu)來存儲和查詢數(shù)據(jù)C、圖數(shù)據(jù)庫采用ER實體關(guān)系進(jìn)行存儲D、圖數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫可以靈活轉(zhuǎn)化【正確答案】:B92.編寫Scala代碼時,通過以下哪個算子可以實現(xiàn)數(shù)據(jù)過?A、filterB、collectC、mapD、flatmap【正確答案】:A93.下列哪一項不是ElasticSearch的擴展插件?A、es-HadoopB、ElasticSearch-headC、HadoopD、Logstash【正確答案】:C94.Kafka集群必須依賴于下列哪一個組件?A、FlumeB、ZookeeperC、YarnD、HDFS【正確答案】:B95.StructuredStreaming的底層源碼是以下哪一項?A、JavaB、PythonCD、Scala【正確答案】:D96.ElasticSearch數(shù)據(jù)寫入階段有很多調(diào)優(yōu)方式,下列錯誤的是哪一項?A、盡量使用自動生成的idB、禁用wildcardC、寫入前副本數(shù)設(shè)置為0D、寫入過程中:采取bulk批量寫入【正確答案】:B97.以下哪一選項不屬于MRS日常運維不影響業(yè)務(wù)這一特性?A、修改配置滾動重啟B、擴縮容業(yè)務(wù)無感知C、滾動升級/補丁D、單集群跨AZ高可用【正確答案】:D98.以下關(guān)于Redis中Hash類型描述,錯誤的是哪一項?A、Hash類型適合存儲對象B、Hash類型的字段和字段值只能是字符串C、Hash類型的值存儲了字段和字段值的映射D、Hash類型的鍵至多可以存儲2~32個字段【正確答案】:D99.關(guān)于ElasticSearch內(nèi)部架構(gòu),以下描述中錯誤的是哪一項?()A、Plugins:插件可以通過自定義的方式擴展加強Elasticsearch的基本功能,比如可以自定義類型映射,分詞器,本地腳本等B、transport:代表Elasticsearch內(nèi)部節(jié)點或集群與客戶端的交互方式,默認(rèn)內(nèi)部是使用tcp協(xié)議進(jìn)行交互C、Discovery:該模塊主要負(fù)責(zé)集群中節(jié)點的自動發(fā)現(xiàn)和Master節(jié)點的選舉D、Gateway:代表ElasticSearch.與客戶端交流的方式【正確答案】:D100.某大數(shù)據(jù)業(yè)務(wù)人員需針對某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個數(shù)據(jù)為時間類型yyyyMMdd.那么可以使用以下哪一項作為字段類型?A、varcahrB、stringC、intD、double【正確答案】:B1.以下哪些選項是Hive數(shù)據(jù)倉庫分層的優(yōu)點?A、隔離原始數(shù)據(jù)B、復(fù)雜問題簡單化C、減少重復(fù)開發(fā)D、清晰數(shù)據(jù)結(jié)構(gòu)【正確答案】:ABCD2.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來越廣,以下場景中有哪些場景可以應(yīng)用大數(shù)據(jù)技術(shù)?A、廣告精準(zhǔn)營銷B、游戲畫面實時刷新C、人物畫像D、道路智能規(guī)劃【正確答案】:ACD3.實時檢索解決方案的項目流程包括以下哪些選項?A、應(yīng)用部署B(yǎng)、代碼工程C、項目環(huán)境準(zhǔn)備D、應(yīng)用開發(fā)【正確答案】:ABCD4.以下哪些選項是網(wǎng)站日志的特點?A、價值密度低B、數(shù)據(jù)的業(yè)務(wù)種類多C、數(shù)據(jù)結(jié)構(gòu)復(fù)雜D、數(shù)據(jù)量大【正確答案】:ABCD5.大數(shù)據(jù)分離架構(gòu)有以下哪些優(yōu)勢?A、異構(gòu)流數(shù)據(jù)實時處理B、交互式實時查間C、結(jié)構(gòu)化數(shù)據(jù)快速查詢D、復(fù)雜計算模型靈活編程接口【正確答案】:ABCD6.華為企業(yè)云數(shù)據(jù)湖具有以下哪些優(yōu)勢?A、開放接口,支持開放實時標(biāo)準(zhǔn),構(gòu)建豐富生態(tài),自助式數(shù)據(jù)開發(fā)與分析B、存儲和計算分離,支持更多用戶并發(fā)和更大數(shù)據(jù)量C、更多數(shù)據(jù)通過實時、虛擬方式入湖,數(shù)據(jù)產(chǎn)生即可見、可用D、數(shù)據(jù)集中,開放共享、統(tǒng)一目錄管理,避免跨系統(tǒng)數(shù)據(jù)搬遷【正確答案】:ABCD7.HBase讀數(shù)據(jù)時需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HfileB、MemStoreC、HDFSD、Hlog【正確答案】:AB8.以下關(guān)于Redis中set數(shù)據(jù)類型srandmemberkey[count]命令的描述正確的是A、如果count為正數(shù),且小于集合基數(shù),那么命令返回一個包含count個元素的數(shù)組,數(shù)組中的元素各不相同B、如果count為負(fù)數(shù),那么命令返回一個數(shù)組,數(shù)組中的元素可能會重復(fù)出現(xiàn)多次,而數(shù)組的長度為count的絕對值C、如果count大于等于集合基數(shù),那么返回整個集合。D、如果count為負(fù)數(shù),那么命令返回一個數(shù)組,數(shù)組中的元素各不相同,且數(shù)組的長度小于count的絕對值?!菊_答案】:ABC9.以下哪些選項是Loader組件的特點?()A、圖形化B、高性能C、高可靠D、安全【正確答案】:ABCD10.以下哪幾項是屬于ElasticSearch的查詢類型?A、基于全文檢索B、基于分值數(shù)檢索C、基于元數(shù)據(jù)檢索D、基于詞條檢索【正確答案】:ABCD11.關(guān)于HBase二級索引的理解,以下哪些選項是正確的?A、Hindex是華為公司開發(fā)的純Java編寫的HBase二級索引B、多表索引也是HBase二級索引的特色之C、二級索引方便了基于列值來查找列值的應(yīng)用場景D、ApacheHBase只有一個針對行健的索引【正確答案】:ABCD12.以下關(guān)于FileChannel的描述中,正確的是哪些項?A、不同的FileChannel均需要配置多個checkpoint目錄B、不同的FileChannel均需要配置一個checkpoint目錄C、支持對數(shù)據(jù)進(jìn)行持久化D、需要配置數(shù)據(jù)目錄和checkpoint目錄【正確答案】:ACD13.關(guān)于HBase的基本架構(gòu),以下描述中正確的有哪些項?A、在HBase中,每一個Store對應(yīng)一個ColumnQualifierB、每一次觸發(fā)Flush都會生成新的HFileC、在HBase中,由HMaster直接管理RegionD、HBase允許多臺HRegionServer同時工作【正確答案】:ABD14.以下關(guān)于處理時間的描述,正確的是哪些項?A、處理時間不需要流和機器之間的協(xié)調(diào)B、處理時間是指每臺機器的系統(tǒng)時間C、處理時間能提供最好的性能和最低延遲D、處理時間不能提供消息事件的時序性保證【正確答案】:ABCD15.關(guān)于MRS的Redis增強特性描述正確的是()。A、支持?jǐn)?shù)據(jù)導(dǎo)入導(dǎo)出工具B、自研Arm架構(gòu)C、集群可靠性保障D、完善的集群管理功能【正確答案】:ABCD16.以下哪些選項是容易造成Hive數(shù)據(jù)傾斜的原因?()A、groupbyB、joinC、distinctcountD、droptable【正確答案】:ABC17.HBaseFilter有以下哪幾項?A、RowFilterB、KeyOnlyFilterC、MFilterListD、SingleColumnValueFilter【正確答案】:ABCD18.數(shù)據(jù)融合分析包括以下哪些場景?A、視頻數(shù)據(jù)處理,需要AI和大數(shù)據(jù)結(jié)合分析B、IOT數(shù)據(jù),業(yè)務(wù)時效性要求,依賴更實時、高效的數(shù)據(jù)處理C、日志類的半結(jié)構(gòu)化數(shù)據(jù),結(jié)合機器學(xué)習(xí)能力的批處理D、實時營銷,流數(shù)據(jù)與歷史數(shù)據(jù)結(jié)合,實現(xiàn)更全面的用戶行為刻畫【正確答案】:ABCD19.下面選項哪些是HBase數(shù)據(jù)查詢過濾器Filter的比較器?A、BinaryComparatorB、SubStringComparatorC、BinaryPrefixComparatorD、RegexStringComparator【正確答案】:ABCD20.關(guān)于SparkRDD的說法中,以下哪些選項是正確的?A、RDD基于Lineage血統(tǒng)機制的高效容錯(第n個節(jié)點出錯,可從第n-1個節(jié)點恢復(fù))B、RDD默認(rèn)存儲于磁盤上,如果磁盤空間不夠,會由磁盤刷寫至內(nèi)存中C、計算流程中會劃分Stage,Stage如果失敗會進(jìn)行特定次數(shù)的重試,重試時只計算失敗的數(shù)據(jù)分片D、RDD是只讀和可分區(qū)的;要想對RDD進(jìn)行操作,只能重新生成一個新的RDD【正確答案】:ACD21.以下關(guān)于Kafka的特點描述,正確的是哪些項?A、高吞吐B、分布式C、多訂閱者D、冗余備份【正確答案】:ABCD22.關(guān)于ApachePhoenix與HBase的搭配,以下哪些選項是正確的?A、PhoenixSQL只有命令行一種使用模式,無法對接JDBC進(jìn)行使用B、ApachePhoenix可以將SQL查詢編譯為一系列HBase掃描C、Phoenix在Hadoop中為低延遲應(yīng)用程序提供OLTP和運營分析能力D、ApachePhoenix可以為小型查詢提供毫秒級的性能,或者為數(shù)千萬行數(shù)據(jù)提供秒級的性能【正確答案】:BCD23.通過Loader的可視化界面,可以實現(xiàn)以下哪些操作?A、數(shù)據(jù)分析任務(wù)B、制定多種不同的數(shù)據(jù)源C、數(shù)據(jù)可視化操作D、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟【正確答案】:BCD24.Event的組成部分,包含以下哪些項?A、BodyB、FootC、HandD、Header【正確答案】:AD25.以下哪些選項是ZooKeeper在Kafka中的作用?A、索引數(shù)據(jù)的生成B、負(fù)載均衡CPU資源調(diào)配管理D、集群管理【正確答案】:ABD26.HBase中包含的典型的Filter有以下哪幾項?A、SingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter【正確答案】:ABCD27.Flink提供的窗口分配器,包含以下哪些項?A、全局窗口B、滾動窗口C、滑動窗口D、會話窗口【正確答案】:ABCD28.數(shù)據(jù)倉庫分層包括以下哪些選項?A、DWD層B、DWS層C、ADS層D、ODS層【正確答案】:ABCD29.關(guān)于Spark的應(yīng)用場景,請將場景與描述正確匹配()A、流處理秒級延遲的處理,可支持多種外部數(shù)B、數(shù)據(jù)挖掘在海量數(shù)據(jù)基礎(chǔ)上進(jìn)行復(fù)雜的挖掘分析C、迭代計算應(yīng)對復(fù)雜的數(shù)據(jù)處理邏輯【正確答案】:ABC30.Hive可以直接訪問以下哪些組件?A、HDFSB、DockerC、TensorFlowD、HBase【正確答案】:AD31.以下哪些選項是常用的數(shù)據(jù)結(jié)構(gòu)類型?A、結(jié)構(gòu)化數(shù)據(jù)B、非結(jié)構(gòu)數(shù)據(jù)C、無結(jié)構(gòu)化數(shù)據(jù)D、超結(jié)構(gòu)化數(shù)據(jù)【正確答案】:AB32.HDFS文件系統(tǒng)能夠支撐的數(shù)據(jù)量級有哪些?A、ZBB、TBC、PBD、EB【正確答案】:BC33.關(guān)于HBase觸發(fā)Flush操作,以下描述中正確的有哪些項?A、HBase定期刷新Memstore,默認(rèn)周期為24個小時B、Region中MemStore的總大小達(dá)到了預(yù)設(shè)的FlushSize閱值時會觸發(fā)Flush操作C、Flush操作和HLog中的文件數(shù)量沒有任何關(guān)系D、MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預(yù)設(shè)的閱值大小時會觸發(fā)Flush操作【正確答案】:BD34.Hive組件的Driver由以下哪些項組成?A、MetaStoreB、CompilerC、ExecutorD、Optimizer【正確答案】:BCD35.以下哪些項屬于離線批處理場景的核心訴求?A、處理數(shù)據(jù)量巨大B、支特SQL類作業(yè)和自定義作業(yè)C、處理數(shù)據(jù)格式多樣D、處理時間要求不高【正確答案】:ABCD36.以下關(guān)于Spark的描述中,正確的有哪幾項?A、寬依賴是指父RDD的每個分區(qū)都可能被多個子RDD分區(qū)所使用。B、窄依賴跟寬依賴的區(qū)別是是否發(fā)生Shuffle.C、當(dāng)一個任務(wù)在spark執(zhí)行時,該任務(wù)會被拆分成多個Stage,然后分配到不同的節(jié)點上進(jìn)行執(zhí)行。D、窄依賴是指父RDD的每個分區(qū)只被子RDD的一個分區(qū)所使用?!菊_答案】:ABD37.有關(guān)華為實時檢索解決方案,以下描述中正確的有哪幾項?A、數(shù)據(jù)采集:文件數(shù)據(jù)通過批量加載寫入數(shù)據(jù);流式數(shù)據(jù)通過實時加載寫入數(shù)據(jù),圖數(shù)據(jù)可以使用華為GES的工具導(dǎo)入數(shù)據(jù)B、數(shù)據(jù)源:數(shù)據(jù)源的種類包括文件數(shù)據(jù)和流式數(shù)據(jù)等C、實時檢索引擎:適合快速檢索,也就是根據(jù)指定條件查詢結(jié)果,不適用于統(tǒng)計和復(fù)雜查詢D、GES:基于Hadoop生態(tài)的圖數(shù)據(jù)庫,即存放圖片的數(shù)據(jù)庫【正確答案】:ABC38.客戶端使用get方式讀取HBase用戶數(shù)據(jù)時,需要查詢meta表的哪些數(shù)據(jù)?A、RegionServert地址B、Region分裂時間C、Region起始rowkeyD、Region大小【正確答案】:AC39.HBase中會觸發(fā)Flush操作的有以下哪幾項?A、RegionMemStore中的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值。B、HBaseMemstore定期刷新,默認(rèn)周期為1小時。C、MemStoreRegionServer占用內(nèi)存的總量和總內(nèi)存比值超出了預(yù)設(shè)的閾值大小。D、當(dāng)WALs中文件數(shù)量達(dá)到閾值時?!菊_答案】:ABCD40.一個典型的KafKa集群中包含以下哪些組件?A、一個ZooKeeper集群B、若干個BrockerC、若干個ProducerD、若干個Consumer【正確答案】:ABCD41.SparkSQL對SQL語句的處理和關(guān)系型數(shù)據(jù)庫采用了類似的方法。關(guān)于SparkSQL的處理邏輯,以下哪些選項是正確的?多選A、執(zhí)行(Execute):執(zhí)行優(yōu)化步驟獲取的最優(yōu)執(zhí)行計劃,返回從數(shù)據(jù)庫查詢的數(shù)據(jù)集B、詞法和語法解析(Parse):對讀入的SQL語句進(jìn)行詞法和語法解析(Parse),分辨出SQL語句中那些詞是關(guān)鍵詞,哪些是表達(dá)式,哪些DataSource等,判斷SQL語句是否規(guī)范,并形成邏輯計劃C、優(yōu)化(Optimize):SparkSQL會提供幾個執(zhí)行計劃,并針對數(shù)據(jù)進(jìn)行優(yōu)化,返回從數(shù)據(jù)庫查詢的數(shù)據(jù)集D、綁定(Bind):將SQL語句和數(shù)據(jù)庫的數(shù)據(jù)字典(列、表和視圖等)進(jìn)行綁定(Bind),如果相關(guān)的Projection和DataSource等都存在的話,則表示這個SQL語句是可以執(zhí)行的【正確答案】:ABCD42.FIink計算時間不包含以下哪幾種時間語義?A、StartTime(開始時)B、EventTime(件)C、ProcessingTime(處理時)DelayTime(延遲時間)【正確答案】:AD43.某大數(shù)據(jù)業(yè)務(wù)人員在不小心刪除了HDFS某個文件后,想通過回收站機制恢復(fù)數(shù)據(jù),但是在對應(yīng)的回收站目錄/user/root/.Trash中為什么找不到要恢復(fù)的數(shù)據(jù)?A、回收站中的數(shù)據(jù)超過了保留的期限,被系統(tǒng)刪除了。B、回收站機制并沒有開啟,導(dǎo)致沒有及時回收C、回收站通過回收間隔,對數(shù)據(jù)進(jìn)行了整理,需要進(jìn)入到指定時間間隔下才能找到D、查找的目錄可能出現(xiàn)了問題,需要核實刪除操作的用戶?!菊_答案】:AB44.關(guān)于HBase的數(shù)據(jù)模型,以下哪些選項是正確的?A、表是由行和列構(gòu)成的,所有的列是從屬于某一個列族的B、所有的表都必須要有主鍵-keyC、應(yīng)用程序是以表的方式在HBase存儲數(shù)據(jù)的參考答案)D、HBase的表是按key排序的,排序方式是針對字節(jié)的【正確答案】:ABCD45.關(guān)于HBase性能優(yōu)化,以下描述中正確的有哪些選項?A、在使用HBaseJavaAPI時,可以通過調(diào)用Table實例的get(List)批量讀取多行記錄,只需一次網(wǎng)絡(luò)1/O開銷,可以明顯的提升讀性能B、一張表里不要定義太多的列簇,因為某個列簇在flush的時候,它鄰近的列簇也會因關(guān)聯(lián)效應(yīng)被觸發(fā)flush,最終導(dǎo)致系統(tǒng)產(chǎn)生更多的I/OC、在建表時可以預(yù)先創(chuàng)建多個Region,當(dāng)數(shù)據(jù)寫入HBase時,會按照RowKey對應(yīng)Region分區(qū)情況,在集群內(nèi)做數(shù)據(jù)的負(fù)載均衡D、在使用HBaseJavaAPI時,可以通過調(diào)用Table實例的put(List)批量寫入多行記錄,只需一次網(wǎng)絡(luò)l/O開銷,可以明顯的提升寫性能【正確答案】:ABCD46.2019年以后,華為云數(shù)據(jù)湖CloudDataLake中數(shù)據(jù)管理包含以下哪些組件。AWSGlueB、DeltaLakeC、AtlasD、HUDI【正確答案】:ABCD47.某個業(yè)務(wù)人員發(fā)現(xiàn)某個查詢的HiveSQL執(zhí)行時間比較長,分析發(fā)現(xiàn)該SQL在被分解成多個階段執(zhí)行,導(dǎo)致執(zhí)行時間過長。那么該業(yè)務(wù)人員可以執(zhí)行如下哪些操作來優(yōu)化該SQL語句?A、增加服務(wù)器內(nèi)存,來增加該SQL的執(zhí)行內(nèi)存。B、將SQL語句逐條執(zhí)行。C、針對業(yè)務(wù)邏輯,提前進(jìn)行數(shù)據(jù)過濾,避免后續(xù)JOIN操作太繁瑣。D、通過參數(shù)hive.exec.parallel開啟并行執(zhí)行,提高查詢效率【正確答案】:BD48.Spark中RDD是彈性數(shù)據(jù)集的原因包括以下哪些選項?A、基于Lineage的高效容錯B、自動進(jìn)行內(nèi)存和磁盤數(shù)據(jù)存儲的切換C、數(shù)據(jù)調(diào)度彈性D、Task失敗自動重試【正確答案】:ABC49.SparkSQL使用場景豐富,可以處理的數(shù)據(jù)源包括()。A、HiveB、文本文件C、RDDD、Json【正確答案】:ABCD50.以下關(guān)于Filnk的窗口描述正確的是()。A、Flink窗口按窗口行為劃分:TumblingWindow-SlidingWindow.SessionWindow.B、窗口可以是時間驅(qū)動的也可以是數(shù)據(jù)驅(qū)動的。C、我們可以每30秒計算一次最近一分鐘用戶購買的商品總數(shù),這個就是時間滑動窗口的應(yīng)用方式。D、會話窗口是將數(shù)據(jù)聚合到會話窗口中,由非活躍的間隙分隔開。【正確答案】:ABCD51.Hive架構(gòu)中Driver包含以下哪些組件?A、ExecutorB、ChannelC、OptimizerD、Compiler【正確答案】:ACD52.Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪幾種Channel類型?A、FileChannelB、MemoryChannelC、HDFSChannelD、JDBCChannel【正確答案】:AD53.華為混合云MRS服務(wù)的優(yōu)勢有哪些?A、存算分離,TCO下降B、易管理,駕駛艙體驗C、多場景融合,高性能D、易部署,所用即所得【正確答案】:ABCD54.以下關(guān)于華為云MRS提供的基于天氣大數(shù)據(jù)進(jìn)行海量數(shù)據(jù)離線分析應(yīng)用場景的描述中,哪些選項是正確的?A、可以利用Hive實現(xiàn)TB/PB級的數(shù)據(jù)分析B、可以通過可視化ETL工具Loader,將數(shù)據(jù)導(dǎo)出到DWS.完成BI分析C、可以使用OBS實現(xiàn)低成本存儲D、離線批處理必須依賴Flink組件完成計算【正確答案】:ABC55.Hive支持以下哪些計算引擎?A、MapReduceB、LoaderC、TezD、Spark【正確答案】:ACD解析:
三.判斷56.ElasticSearch用于日志搜索和分析,離不開其擁有的生態(tài)圈系統(tǒng)和解決方案,這些開源軟件之間互相配合使用,完美銜接,高效地滿足了多場景的應(yīng)用。那么其生態(tài)系統(tǒng)具體包括以下哪些內(nèi)容?A、數(shù)據(jù)持久化與分析層ElasticsearchB、數(shù)據(jù)接入層LogstashC、用戶接入層KibanaD、插件擴展層【正確答案】:ABCD57.HBase中HMaster主要負(fù)責(zé)()A、Regionserverf負(fù)載均衡B、表的增刪改查C、Region分布調(diào)整D、用戶數(shù)據(jù)讀寫【正確答案】:ABC58.ELK指的是哪些組件?A、ElasticsearchB、LogstashC、KickstartD、Kibana【正確答案】:ABD59.下列關(guān)于大數(shù)據(jù)的說法中,錯誤的是哪些選項?A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時效性強的特征B、處理大數(shù)據(jù)需采用新型計算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析D、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析【正確答案】:AC60.以下哪些選項不是Flink資源調(diào)度的方式?A、FlinkStandaloneB、FlinkOnZooKeeperC、FlinkOnDocker(參考答案)D、FlinkOnMesos【正確答案】:ABC61.以下哪些數(shù)據(jù)庫的引擎適合做數(shù)據(jù)倉庫?A、ExadataB、OracleC、RedisD、TeraData【正確答案】:ABD62.某大數(shù)據(jù)運維人員需要將部分?jǐn)?shù)據(jù)導(dǎo)入Hive數(shù)據(jù)表中,以下哪些做法是可取的?A、將數(shù)據(jù)導(dǎo)入到FTP服務(wù)器中,通過創(chuàng)建外表的方式導(dǎo)入到Hive表中。B、將數(shù)據(jù)導(dǎo)入到HDFS文件系統(tǒng)中,通過loaddata命令導(dǎo)入到Hive表中。C、將數(shù)據(jù)導(dǎo)入到本地電腦中,然后使用loaddatalocal命令導(dǎo)入到Hive表中。D、將數(shù)據(jù)導(dǎo)入到集群服務(wù)器上,通過loaddatalocal命令導(dǎo)入到Hive表中。【正確答案】:ABD63.以下關(guān)于Spark流連接的描述中,正確的是哪些項?A、一個輸入流接收的任何行都可以與另一個來自未來的、尚未接收的輸入流中的任何行進(jìn)行匹配B、對于兩個輸入流,StructuredStreaming可以將過去的輸入流緩沖為流狀態(tài)C、支持將每個未來輸入流與過去的輸入流相匹配,從而生成連接結(jié)果D、Spark2.x支持流與流的連接【正確答案】:ABCD64.數(shù)據(jù)分析平臺云化和融合發(fā)展具有以下哪些特點?A、資源彈性分配B、超敏捷應(yīng)用C、交叉融合分析D、多場景分析【正確答案】:ABCD65.實時流的場景中,Kafka的使用主要是為了解決哪些問題?A、防止數(shù)據(jù)丟失B、系統(tǒng)解耦C、僅支持?jǐn)?shù)據(jù)同步分發(fā)D、消息的隨機讀取【正確答案】:ABCD66.Hive組件支持以下哪些運行框架?A、MapReduceB、TezC、SparkD、Kafka【正確答案】:ABC67.以下哪些選項是華為云MRS使用HetuEngine的根本原因?A、企業(yè)傳統(tǒng)數(shù)倉,缺乏高效、統(tǒng)一的融合分析B、企業(yè)傳統(tǒng)數(shù)倉采用分系統(tǒng)構(gòu)建模式,導(dǎo)致數(shù)據(jù)冗余嚴(yán)重,阻礙企業(yè)快速轉(zhuǎn)型C、隨著數(shù)據(jù)量增長,業(yè)務(wù)對數(shù)據(jù)分析靈活性要求越來越高D、HetuEngine對浪涌式的數(shù)據(jù)進(jìn)行整合分析,發(fā)揮最大價值【正確答案】:ABCD68.以下哪些項可能是鍵值的返回值類型?A、StringB、zsetC、listD、set【正確答案】:ABCD69.以下關(guān)于Channel的描述中,錯誤的是哪些項?A、Channel位于Source和Sink之間B、Channels不支持事務(wù)Channel的作用類似隊列D、Channels提供較強的順序保證【正確答案】:BD70.699.Spark運行前需要讀取任務(wù)參數(shù),包含配置文件、動態(tài)參數(shù)、代碼配置等,請連接將他們的優(yōu)先級進(jìn)行匹配。()A、高代碼配置B、中動態(tài)參數(shù)C、低配置文件【正確答案】:ABC71.StructuredStreaming中OutPut的存儲方式包含以下哪幾種?A、UpdateModeB、ModifyModeCompleteModeD、AppendMode【正確答案】:ACD72.以下哪些場景可以使用HBase作為存儲系統(tǒng)?A、Row-Key查詢B、滿足ACID特性C、海量數(shù)據(jù)存儲D、大文件(T【正確答案】:ACD73.關(guān)于Elasticsearch的緩存機制,以下哪些選項是正確的?A、Elasticsearch緩存主要分三種:QueryCACheFielddataCACheRequestCACheB、QueryCAChe:屬于Node級別的緩存,是對一個查詢中包含的過濾器執(zhí)行結(jié)果進(jìn)行緩存C、RequestCAChe:Shard級別的緩存,是為了緩存"分片級"的本地結(jié)果集D、FielddataCAChe:Fielddata是專門針對分詞的字段在查詢期間的數(shù)據(jù)結(jié)構(gòu)的緩存【正確答案】:ABCD74.將Hive數(shù)倉分層后各層的名稱和對應(yīng)的描述進(jìn)行匹配。()A、ODS原始數(shù)據(jù)層B、ADS應(yīng)用層,為各種統(tǒng)計報表提供數(shù)據(jù)C、DWS將上一層數(shù)據(jù)進(jìn)行輕度匯總后得到的結(jié)果DWD結(jié)構(gòu)和粒度與原始表保持一-致簡單清洗得到的結(jié)果【正確答案】:ABCD75.關(guān)于ElasticSearch的基本架構(gòu),以下描述中正確的有哪些項?A、ElasticSearch通過Discovery模塊來實現(xiàn)節(jié)點自動發(fā)現(xiàn),以及Master節(jié)點選取B、ElasticSearch底層基于Lucence,將索引存儲在本地文件系統(tǒng)、共享文件系統(tǒng)或HDFS等文件系統(tǒng)中C、ElasticSearch支多種插件來擴展加強功能D、ElasticSearch通過Java以及Restfulapi提供【正確答案】:ABCD76.針對以下場景描述,可以用于大數(shù)據(jù)實時檢索技術(shù)完成的有?A、主要根據(jù)ID(手機號碼)、時間段進(jìn)行用戶話費清單、流量清單查詢B、可用于事后查詢交易憑證,追溯交易,以及查詢客戶信用記錄,幫助客戶快速借款等C、要求1秒內(nèi)響應(yīng),高并發(fā)(100以上請求)查詢條件簡單(80%查詢是主鍵查詢,其他是簡單條件組合查詢)D、根據(jù)ID(身份證,車牌號等)進(jìn)行查詢,可用于實時布控,車輛軌跡繪制,快速信息匯集【正確答案】:ABCD77.以下哪些選項不是HBase的典型應(yīng)用場景?A、挖掘潛在客戶B、存儲氣象數(shù)據(jù)C、統(tǒng)計訂單總額D、推薦最優(yōu)套餐【正確答案】:ACD78.關(guān)于Kafka組件部署規(guī)劃說法以下哪些選項是錯誤的?A、Kafka會將元數(shù)據(jù)信息存放到ZooKeeper上B、在創(chuàng)建Topic時,副本數(shù)不得大于當(dāng)前存活的Broker實例個數(shù),否則創(chuàng)建Topic將會失敗C、Kafka的Producer發(fā)送消息時可以指定該消息被哪個Consumer消費D、Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄了【正確答案】:CD79.關(guān)于GES服務(wù)的常見基本概念,以下哪些選項是正確的?A、GES不存在無向邊B、在GES中,點的屬性(Property)表示了該頂點的附加信息,采用Keyvalue:結(jié)構(gòu)進(jìn)行保存C、個人的姓名、年齡、身份證、愛好等信息可以用VertexLA,Bel來表示D、"認(rèn)識/朋友關(guān)系"在圖中可以用邊來表示【正確答案】:ABCD80.OutPut可以定義的存儲方式包含以下哪些項?A、CompleteModeB、A,DdModeC、UpdateModeD、AppendMode【正確答案】:ACD81.所謂的大數(shù)據(jù)技術(shù)融合主要指哪些方面?A、計算融合B、數(shù)據(jù)融合C、算力融合D、批-流融合【正確答案】:ABCD82.Flink支持Source的有以下哪些選項?A、從集合中讀取數(shù)據(jù)B、自定義數(shù)據(jù)讀取C、從文件中讀取數(shù)據(jù)D、從消息隊列中讀取數(shù)據(jù)rk【正確答案】:ABCD83.計算十分鐘內(nèi)的單詞,每5分鐘更新一次,若程序在11:00開始運行,在12:07收到一個數(shù)字,這個數(shù)字應(yīng)該對應(yīng)于以下哪些窗口的計算()A、12:05-12:15B、12:10-12:20C、12:00-12:10D、11:55-12:05【正確答案】:AC84.有關(guān)實時檢索引擎中各組件的聯(lián)系與定位,以下描述中正確的有哪些項?()A、ElasticSearch存儲數(shù)據(jù)性價比低,但是其能夠滿足場景中多級索引的實時查詢需求,同時還能夠?qū)ξ臋n分詞建立索引B、圖數(shù)據(jù)庫可以完美的解決復(fù)雜多級關(guān)系查詢分析,選用GES來解決圖數(shù)據(jù)的實時查詢需求C、與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲的基石D、HBase加ElasticSearch的組合滿足了大部分的用戶實時檢索訴求【正確答案】:ABCD85.HDFS文件系統(tǒng)適用于哪些場景?A、大規(guī)模數(shù)據(jù)(TB及以上)B、流式數(shù)據(jù)訪問(寫一次,讀多次)C、頻繁修改文件(基本就是寫一次)D、商用硬件(一般硬件)【正確答案】:ABD86.ElasticSearch在部署時,對Linux的設(shè)置有哪些優(yōu)化方法?A、堆內(nèi)存設(shè)置為:MinB、設(shè)置最大文件句柄數(shù)C、線程池+隊列大小根據(jù)業(yè)務(wù)需要做調(diào)整D、關(guān)閉緩存Swap【正確答案】:BC87.Loader具有對以下哪些數(shù)據(jù)源的讀取能力?A、HBaseB、HDFSC、HiveD、RDB【正確答案】:ABCD88.Redis寫命令同步的時機,可以設(shè)置以下哪些項?A、appendfsynceveryminB、appendfsyncalwaysC、appendfsyncnoD、appendfsynceverysec【正確答案】:BCD89.關(guān)于ElasticSearch常見的API接口,以下描述中正確的有哪些項?A、SpringDataElasticsearch:第三方插件,與Spring生態(tài)集成度較高B、TransportClient:官方原生客戶端、,全部操作功能均支持,但內(nèi)部請求需要做Java序列化操作,導(dǎo)致項目可移值性較低C、JestClient:第三方插件,最早期的Rest第三方插件,社區(qū)和API都相對比較全面D、RestClient:官方新推API,屬于高級API,基于HttpRestful請求,可移值性更高,但功能不夠全面【正確答案】:ABCD90.以下哪些選項是大數(shù)據(jù)云化的優(yōu)勢與價值?A、提升業(yè)務(wù)分析及運維體驗效率B、資源共享C、資源彈性發(fā)放D、提升資源申請效率【正確答案】:ABCD91.關(guān)于Scan命令,下列說法正確的有哪些?A、scan可以通過setFilter方法添加過濾器B、scan可以通過setCA,Ching與setBatch方法提高速度C、scan可以通過setStartRow與setEndRow來限定范圍D、scan讀取數(shù)據(jù)是一次性全部把數(shù)據(jù)從服務(wù)端讀取到【正確答案】:ABC92.實時檢索的公安和金融行業(yè)應(yīng)用場景有哪些特征?A、高并發(fā)B、存在海量小文件C、查詢速度快D、查詢條件簡單【正確答案】:ABCD93.關(guān)于HBase組件的描述,下列哪幾項是正確的?A、存儲數(shù)據(jù)是以K-V的形式B、是面向列的C、是一種NoSQL數(shù)據(jù)D、是分布式的【正確答案】:ABCD94.華為MRS服務(wù)具有以下哪些優(yōu)勢?A、高可用B、多場景融合C、存算分離D、彈性計算【正確答案】:ABCD95.在HBase中利用get命令查找某一個單元格對應(yīng)的數(shù)據(jù),以下哪些信息是必要的?()A、ColumnQualifier(限定符)信息B、Rowkey(行鍵)信息C、DataBlockID(數(shù)據(jù)塊編號)信息D、ColumnFamily(列族)信息【正確答案】:ABD96.關(guān)于使用HBase的JavaAPI讀取數(shù)據(jù),以下描述中正確的是哪些項?A、QualifierFilter用于過HBase表中的列族信息B、HBaseFilter主要在Scan和Get過程中進(jìn)行數(shù)據(jù)過濾,通過設(shè)置一些過濾條件來實現(xiàn)條件查詢C、要從表中讀取數(shù)據(jù),首先需要實例化該表對應(yīng)的Table實例D、為了提高查詢效率,使用Scan命令時最好指定StartRow和StopRow【正確答案】:ABCD97.關(guān)于實施檢索項目的項目流程,以下描述中正確的有哪些項?A、實施檢索項目絕非一蹴而就,需要不斷調(diào)試,通過應(yīng)用運維進(jìn)行項目選代,以便更好地適應(yīng)項目的實際要求B、在應(yīng)用開發(fā)階段可以參考樣例代碼,根據(jù)實際需求和具體應(yīng)用進(jìn)行有針對性的開發(fā)C、環(huán)境準(zhǔn)備階段是整個流程的第一步,常見的工作包括創(chuàng)建Java環(huán)境、搭建HBase和ElasticSearch集群等D、在實際業(yè)務(wù)中,安全認(rèn)證準(zhǔn)備工作目非常重要,通??梢赃x擇Kerberos和LDAP的組合完成這一工作【正確答案】:ABCD98.關(guān)于Hive導(dǎo)入數(shù)據(jù)的命令,以下哪些選項是正確的?A、loA,Ddatainpath可用于將HDFS上的數(shù)據(jù)導(dǎo)入Hive表中B、導(dǎo)入數(shù)據(jù)時必須指定導(dǎo)入哪張表格,也就是需要使用intotable關(guān)鍵詞+表名C、可以使用Local關(guān)鍵詞從本地文件系統(tǒng)導(dǎo)入數(shù)據(jù)至Hive,但是這里的Local指的是hiveserver服務(wù)所在的機器,而不是beeline客戶端所在的機器D、如果原先表中有數(shù)據(jù),想用新數(shù)據(jù)覆蓋舊數(shù)據(jù),可以添加overwrite參數(shù)進(jìn)行覆蓋【正確答案】:ABCD99.以下關(guān)于持續(xù)處理模型的描述,正確的是哪些項?A、對于偏移范圍的記錄異步寫入日志,以達(dá)到連續(xù)處理B、可以啟動一系列的連續(xù)讀取、處理和寫入結(jié)果任務(wù)C、低延遲下,會丟失數(shù)據(jù)D、可以實現(xiàn)毫秒級延遲【正確答案】:ABD100.相較于大數(shù)據(jù)組件,傳統(tǒng)數(shù)據(jù)倉庫存在以下哪些劣勢?A、I/O存在瓶頸B、大規(guī)模數(shù)據(jù)實時性差C、拓展能力差D、架構(gòu)單一【正確答案】:ABCD1.在HBase中,KeyValue作為承載用戶數(shù)據(jù)的基本單元,需要保存一些對自身的描述信息,例如時間截、版本號等等。那么勢必會有一定的結(jié)構(gòu)化空間開銷。A、正確B、錯誤【正確答案】:A2.Spark執(zhí)行效率高的一個關(guān)鍵因素是在處理數(shù)據(jù)時產(chǎn)生的中間產(chǎn)物(計算結(jié)果)存放在內(nèi)存中,減少了對磁盤的I/O操作。A、正確B、錯誤【正確答案】:A3.Flink處理數(shù)據(jù)是無狀態(tài)的,處理一個事件與之前的事件無關(guān)。A、正確B、錯誤【正確答案】:B4.大數(shù)據(jù)上云是萬物互聯(lián)時代的必然趨勢,移動終端構(gòu)成的物聯(lián)網(wǎng)只有通過云,才能快速將全渠道數(shù)據(jù)(新型生產(chǎn)資料)通過大數(shù)據(jù)和AI技術(shù)轉(zhuǎn)化成價值。A、正確B、錯誤【正確答案】:A5.Kettlel中有兩種transformation腳本文件(轉(zhuǎn)換ktr結(jié)尾)和job(任務(wù)kjb結(jié)尾)。A、正確B、錯誤【正確答案】:A6.在Spark中,RDD通過數(shù)據(jù)塊的方式將數(shù)據(jù)存放在內(nèi)存中,并且采用三副本機制提高數(shù)據(jù)的穩(wěn)定性。A、正確B、錯誤【正確答案】:B7.Spark中的JDBCServer不是單點服務(wù),因此非常適合處理海量數(shù)據(jù)和高并發(fā)任務(wù)()A、正確B、錯誤【正確答案】:B8.云上數(shù)據(jù)分析以敏捷無縫的部署和管理體驗從技術(shù)、組織和人員等多維度提速企業(yè)數(shù)字化轉(zhuǎn)型。A、正確B、錯誤【正確答案】:A9.Event是Flume數(shù)據(jù)傳輸?shù)幕締卧狝、正確B、錯誤【正確答案】:A10.Redis中List是一個有序的字符串列表,列表內(nèi)部實現(xiàn)是使用雙向鏈表(linkedlist)實現(xiàn)的。A、正確B、錯誤【正確答案】:A11.由于大數(shù)據(jù)本身的特性,一般大數(shù)據(jù)場景中不合適頻繁的讀取數(shù)據(jù),而適合頻繁的修改數(shù)據(jù)。A、正確B、錯誤【正確答案】:B12.Source必須至少和一個channel關(guān)聯(lián)。A、正確B、錯誤【正確答案】:A13.在海量日志離線分析過程中,數(shù)據(jù)分析師可以將網(wǎng)站日志收集到HDFS上存儲,然后把日志加載到Hive中進(jìn)行統(tǒng)計分析與建模。A、正確B、錯誤【正確答案】:A14.DAYU無縫連接華為云MRS、DWS、DLI等數(shù)據(jù)底座的開發(fā)。A、正確B、錯誤【正確答案】:A15.在HBase的shell客戶端查看'ns'這個命名空間下所有數(shù)據(jù)文件的名稱時,需要用到show_namespA,Ce'ns'命令。A、正確B、錯誤【正確答案】:B16.BloomFilter可以被用來快速的判斷一條數(shù)據(jù)在一個大的數(shù)據(jù)集合中是否存在。A、正確B、錯誤【正確答案】:A17.BloomFilter是一個列族(cf)級別的配置屬性,如果你在表中設(shè)置了BloomFilter,那么HBase會在生成StoreFilel時包含一份具有BloomFilter結(jié)構(gòu)的數(shù)據(jù),稱其為Metablock.A、正確B、錯誤【正確答案】:A18.在使用HBaseJavaAPI時,用戶可以通過org,Apache.Hadoop.hbase.client.A,Dmin實例的createTable快速建表,創(chuàng)建表后整張表只有一個Region,隨著數(shù)據(jù)量的增加會自動分裂成多個Region。A、正確B、錯誤【正確答案】:A19.在Spark2.x版中,SparkSQL適合進(jìn)行離線數(shù)據(jù)查詢,在某些場景下也可以適用于實時工作流任務(wù)。A、正確B、錯誤【正確答案】:A20.實時流的處理場景我們可以選擇Flink框架,也可以使用Spark框架。A、正確B、錯誤【正確答案】:A21.FIume不支持對數(shù)據(jù)進(jìn)行簡單處理,并寫到各種數(shù)據(jù)接受方(可定制)的能力。A、正確B、錯誤【正確答案】:B22.Redis不支持在服務(wù)器端進(jìn)行集合的交井補運算。A、正確B、錯誤【正確答案】:B23.云數(shù)融合指的是大數(shù)據(jù)基礎(chǔ)設(shè)施上云,改變大數(shù)據(jù)服務(wù)的提供方式,各大云廠商均開始提供各類大數(shù)據(jù)服務(wù)產(chǎn)品,以滿足客戶的需求。()A、正確B、錯誤【正確答案】:A24.在進(jìn)行HDFS元數(shù)據(jù)持久化時,NameNode可以周期性觸發(fā)EditLog和Fslmage的合并。A、正確B、錯誤【正確答案】:B25.Kafka中的Broker具有消息接收和消息分發(fā)的能力。A、正確B、錯誤【正確答案】:B26.在華為MRS中的Manager上,管理人員可以一鍵式完成集群的安裝部署、升級、參數(shù)配置、組件啟停等操作。A、正確B、錯誤【正確答案】:A27.實時檢索場景對于數(shù)據(jù)加載的要求比較高,實際業(yè)務(wù)中要求每小時加載TB級的數(shù)據(jù)。A、正確B、錯誤【正確答案】:A28.在HBase表中,通過行、列族和列限定符確定一個單元格(cell),且表中存儲的數(shù)據(jù)需要嚴(yán)格定義好數(shù)據(jù)類型,比如Name列需定義為stringA、正確B、錯誤【正確答案】:B29.某大數(shù)據(jù)業(yè)務(wù)人員希望確保某份關(guān)鍵數(shù)據(jù)在Hive中不會因為drop操作導(dǎo)致數(shù)據(jù)別除。他可以采用內(nèi)部表的方式來實現(xiàn),drop操作時只會刪除元數(shù)據(jù)而不會刪除表數(shù)據(jù)。A、正確B、錯誤【正確答案】:B30.數(shù)據(jù)倉庫僅僅提供存儲功能,以及面向數(shù)據(jù)管理的服務(wù)。A、正確B、錯誤【正確答案】:A31.大數(shù)據(jù)離線批處理支持SQL類作業(yè)和自定義作業(yè)。A、正確B、錯誤【正確答案】:A32.HBase類似于傳統(tǒng)關(guān)系型數(shù)據(jù)庫,可以輕易滿足海量數(shù)據(jù)的全局ACID特性。A、正確B、錯誤【正確答案】:B33.通過SparkSession提交SQL語句時,任務(wù)會像普通Spark應(yīng)用一樣被提交到集群中分布式運行。A、正確B、錯誤【正確答案】:A34.Hive中刪除外部表時,元數(shù)據(jù)和數(shù)據(jù)會一起被刪除。A、正確B、錯誤【正確答案】:B35.在Hive的SQL語句執(zhí)行中,因為groupby等關(guān)鍵字的使用會導(dǎo)致數(shù)據(jù)傾斜。因此為了表面數(shù)據(jù)傾斜,應(yīng)禁止該類操作執(zhí)行。A、正確B、錯誤【正確答案】:B36.Spark是基于內(nèi)存的分布式批處理系統(tǒng),與磁盤沒有關(guān)系,因此在安裝Spark時,不需要安裝HDFS。A、正確B、錯誤【正確答案】:B37.HBase依賴于Zookeeper完成主備選舉,以及管理root表。A、正確B、錯誤【正確答案】:A38.離線批處理對數(shù)據(jù)處理的時延要求高,處理的數(shù)據(jù)量較大,占用的計算存儲資源較多,通常通過MR作業(yè)、Spark作業(yè)或者HQL作業(yè)實現(xiàn)。A、正確B、錯誤【正確答案】:B39.在HBase中,BloomFilter的數(shù)據(jù)被存在RDD的元數(shù)據(jù)中,一旦寫入無法更新,因為RDD是不可變的。開啟BloomFilter會有一定的存儲及內(nèi)存cache開銷。A、正確B、錯誤【正確答案】:B40.對于數(shù)據(jù)集市和數(shù)據(jù)倉庫而言,面向最終用戶或應(yīng)用的是數(shù)據(jù)集市,面向數(shù)據(jù)管理的是數(shù)據(jù)倉庫。A、正確B、錯誤【正確答案】:A41.實時流處理系統(tǒng)中消費后的數(shù)據(jù)可以存儲到關(guān)系型數(shù)據(jù)庫中,便于實時查詢判斷A、正確B、錯誤【正確答案】:A42.Impala使用SQL的方式運行。A、正確B、錯誤【正確答案】:A43.向HBase插入數(shù)據(jù),只可使用put一種方法。A、正確B、錯誤【正確答案】:B44.在ElasticSearch中,用戶可以通過Head請求查詢某個索引是否存在。A、正確B、錯誤【正確答案】:A45.GES技術(shù)架構(gòu)包含了接口層、計算層和存儲層。A、正確B、錯誤【正確答案】:A46.GES既支持分布式部署也支持單機部署。A、正確B、錯誤【正確答案】:A47.開啟BloomFilter會有一定的磁盤存儲空間及內(nèi)存cA,Che的額外開銷A、正確B、錯誤【正確答案】:A48.Flume中輪詢調(diào)度(RoundRobinScheduling)算法簡潔,無需記錄當(dāng)前所有連接的狀態(tài)。A、正確B、錯誤【正確答案】:A49.作為企業(yè)級大數(shù)據(jù)平臺,F(xiàn)usionInsight具備四大能力包括一站式平臺、永遠(yuǎn)在線、易用成本低以及可持續(xù)演進(jìn)。A、正確B、錯誤【正確答案】:A50.行鍵是按照字典序存儲,因此,設(shè)計行鍵時,要充分利用這個排序特點,將經(jīng)常一起讀取的數(shù)據(jù)存儲到一塊,將最近可能會被訪問的數(shù)據(jù)放在一塊。A、正確B、錯誤【正確答案】:A51.ElasticSearch支持QueryCA,Che緩存技術(shù),主要用于緩存Filter中的查詢結(jié)果,即對一個查詢中包含的過濾器執(zhí)行結(jié)果進(jìn)行緩存。A、正確B、錯誤【正確答案】:A52.在HDF
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 11爸爸媽媽在我心中-愛父母在行動(第2課時)(教學(xué)設(shè)計)2023-2024學(xué)年統(tǒng)編版道德與法治三年級上冊
- 滬科版高中信息技術(shù)必修教材《信息技術(shù)基礎(chǔ)》教學(xué)設(shè)計:第3章 信息的加工與獲取 綜合活動 資料網(wǎng)站的制作(保護水資源)
- 全國中圖版高中信息技術(shù)選修2第二單元第一節(jié)1、《素材獲取》教學(xué)設(shè)計
- 新型儲能在電動汽車中的應(yīng)用
- 第五單元《倍的認(rèn)識》(教學(xué)設(shè)計)-2024-2025學(xué)年三年級數(shù)學(xué)上學(xué)期人教版
- 影劇院外立面裝修合同范本
- 2025二手房裝修合同5篇
- 城市休閑公園土地資源及使用情況
- 辦公樓裝修改造項目投資分析
- 2025年度體育產(chǎn)業(yè)合伙人股權(quán)分配與賽事運營協(xié)議
- 年產(chǎn)15噸透明質(zhì)酸生產(chǎn)車間的初步工藝設(shè)計
- 三年級下冊數(shù)學(xué)混合計算100題及答案
- 大模型在航空航天領(lǐng)域的應(yīng)用:智能探索宇宙的無限可能
- 地下礦山安全教育課件
- 國際市場營銷教案
- 全球變暖對工業(yè)企業(yè)的影響
- 《中醫(yī)藥健康知識講座》課件
- 2024年中國陪診服務(wù)行業(yè)市場發(fā)展趨勢預(yù)測報告-智研咨詢重磅發(fā)布
- 藝術(shù)欣賞與實踐(高職)全套教學(xué)課件
- 轉(zhuǎn)基因調(diào)查分析報告
- 英語-時文閱讀-7年級(8篇)
評論
0/150
提交評論