華為大數(shù)據(jù)測(cè)試題及答案_第1頁(yè)
華為大數(shù)據(jù)測(cè)試題及答案_第2頁(yè)
華為大數(shù)據(jù)測(cè)試題及答案_第3頁(yè)
華為大數(shù)據(jù)測(cè)試題及答案_第4頁(yè)
華為大數(shù)據(jù)測(cè)試題及答案_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第第6頁(yè)/共20頁(yè)第第6頁(yè)/共20頁(yè)華為大數(shù)據(jù)測(cè)試題及答案下列關(guān)于GaussDB200的局部聚簇技術(shù)說(shuō)法正確的是()?A、局部聚簇技術(shù)可以應(yīng)用在GaussDB200的所有表中B、局部聚簇在某些場(chǎng)景下可以提交檢索效率,所以在創(chuàng)建表時(shí)根據(jù)業(yè)務(wù)場(chǎng)景應(yīng)創(chuàng)建多個(gè)PCKC、PCK對(duì)應(yīng)的列盡量不要為空值D、PCK通過(guò)min/max稀疏索引實(shí)現(xiàn)事實(shí)表快速過(guò)濾掃描(正確答案)從數(shù)據(jù)庫(kù)架構(gòu)設(shè)計(jì)來(lái)看,主要有以下哪些設(shè)計(jì)思路?A、Shard-DiskB、Shard-EveryingC、Shard-NothingD、以上都是(正確答案)關(guān)于Schema和Database,下面說(shuō)法正確的是()。A、二者都能實(shí)現(xiàn)資源隔離B、schema和用戶強(qiáng)相關(guān)的,通過(guò)權(quán)限控制語(yǔ)法可以實(shí)現(xiàn)不同用戶對(duì)各Schema的權(quán)限(正確答案)C、Database之間無(wú)法直接訪問(wèn),但通過(guò)權(quán)限授予可以訪問(wèn)數(shù)據(jù)D、相比于Database,Schema的隔離更加的徹底下面哪個(gè)數(shù)據(jù)類(lèi)型不是GaussDB200支持的數(shù)據(jù)類(lèi)型()。A、XML類(lèi)型(正確答案)B、數(shù)值類(lèi)型C、JSON類(lèi)型D、貨幣類(lèi)型GaussDB200在創(chuàng)建表時(shí),需要注意以下哪個(gè)事項(xiàng)()?A、創(chuàng)建列存表時(shí)壓縮級(jí)別默認(rèn)為L(zhǎng)OW(正確答案)B、創(chuàng)建列存表時(shí)壓縮級(jí)別默認(rèn)為HIGHC、創(chuàng)建列存表時(shí)壓縮級(jí)別默認(rèn)為NOD、創(chuàng)建列存表之后,后續(xù)可以修改為行存表下列關(guān)于存儲(chǔ)過(guò)程的特點(diǎn)說(shuō)法正確的是()?A、編寫(xiě)的SQL存儲(chǔ)在數(shù)據(jù)庫(kù)中,因此執(zhí)行速度快B、創(chuàng)建時(shí)編譯,執(zhí)行時(shí)調(diào)用,因此開(kāi)發(fā)效率高C、用戶創(chuàng)建的存儲(chǔ)過(guò)程或自定義函數(shù)可以重復(fù)調(diào)用,因此數(shù)據(jù)傳輸量少D、通過(guò)指定存儲(chǔ)過(guò)程的訪問(wèn)權(quán)限,因此安全系數(shù)高(正確答案)語(yǔ)句number=0的意思是()?A、修改變量number的值為0B、判斷number的值是否為0C、比較number和0的大小D、聲明一個(gè)變量number,并初始化值為0(正確答案)GaussDB200支持幾種數(shù)據(jù)并行導(dǎo)入策略?A、4B、3(正確答案)C、2D、1ElasticSearch架構(gòu)中包含哪些?A、A.以上說(shuō)法全都正確(正確答案)B、ClientC、ESMasterD、ESNode.以下哪個(gè)不是RDD的創(chuàng)建方式?A、從子的RDD轉(zhuǎn)換到新的RDD(正確答案)B、從數(shù)據(jù)集合轉(zhuǎn)換而來(lái)C、從HDFS輸入創(chuàng)建D、從父的RDD轉(zhuǎn)換的到新的RDD以下哪個(gè)不是SparkSQL的使用場(chǎng)景?A、A.需要處理PB級(jí)的大容量數(shù)據(jù)B、對(duì)數(shù)據(jù)處理的實(shí)時(shí)性要求不高的場(chǎng)景C、實(shí)時(shí)數(shù)據(jù)查詢(正確答案)D、結(jié)構(gòu)化數(shù)據(jù)處理第第6頁(yè)/共20頁(yè)第第6頁(yè)/共20頁(yè)第第6頁(yè)/共20頁(yè)以下哪個(gè)不是離線批處理的核心訴求?A、處理數(shù)據(jù)量巨大B、處理數(shù)據(jù)格式多樣C、處理時(shí)間要求不高(正確答案)D、支持SQL類(lèi)作業(yè)和自定義作業(yè)HBase架構(gòu)中包含哪些?A、ZookeeperB、以上說(shuō)法全都正確(正確答案)C、HmasterD、HRegionServer某項(xiàng)目小組接到一個(gè)大數(shù)據(jù)實(shí)時(shí)分析項(xiàng)目,且對(duì)實(shí)時(shí)性要求很高。請(qǐng)問(wèn)以下哪種大數(shù)據(jù)計(jì)算框架最合適?A、HbaseB、MapReduceC、SparkD、Flink(正確答案)以下關(guān)于Hive內(nèi)置函數(shù)描述正確的是?A、descfunctionsupper:查看系統(tǒng)自帶的函數(shù)B、trim():去除空字符串(正確答案)C、to_date():獲取當(dāng)前日期D、substr():求字符串長(zhǎng)度Gremlin中查詢單個(gè)點(diǎn)的信息該用什么命令?A、g.V(13464736).valueMap()(正確答案)B、g.V().hasLabel("test").values("age")C、g.V().hasLabel("test")D、g.V().hasLabel("test").valueMap("String_list","age")考慮以下場(chǎng)景,當(dāng)公安人員需要根據(jù)某犯罪人員發(fā)現(xiàn)其犯罪同伙時(shí),最適合使用下列哪個(gè)工具?A、ElasticSearchB、GraphBase(正確答案)C、HbaseD、HDFSHBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?A、Deletedelete=newDelete(rowKey)B、scan.setCaching(1000)C、byte[]rowKey=Bytes.toBytes("012005000201")(正確答案)D、List<Put>puts=newArrayList<Put>()Flink不包含以下哪些數(shù)據(jù)處理場(chǎng)景?A、高并發(fā)B、毫秒級(jí)低時(shí)延C、高可靠性D、圖形分析(正確答案)關(guān)于GaussDB200的邏輯架構(gòu),下列說(shuō)法正確的是()?A、DN是實(shí)際數(shù)據(jù)節(jié)點(diǎn),所以只負(fù)責(zé)存儲(chǔ)數(shù)據(jù)。B、CM是集群的管理模塊,那么負(fù)責(zé)集群的日常管理和運(yùn)維。C、CN是協(xié)調(diào)節(jié)點(diǎn),協(xié)助CM管理整個(gè)集群。D、GTM是全局事務(wù)控制器,負(fù)責(zé)生成和維護(hù)全局事務(wù)ID等全局唯一信息。(正確答案)用戶Region和RegionServer之間的路由信息,保存在哪個(gè)模塊中?A、ZookeeperB、BHDFSC、MasterD、Meta表(正確答案)Hbase的物理存儲(chǔ)單元是什么?A、RegionB、Columnfamily(正確答案)C、ColumnD、RowRedis中適合存儲(chǔ)對(duì)象的數(shù)據(jù)類(lèi)型是?A、Hash(正確答案)B、ListC、StringD、SetGAUSSDB200數(shù)據(jù)并行導(dǎo)入Shared策略支持的數(shù)據(jù)格式是?A、CSVB、Text(正確答案)C、FIXEDD、seqFlume支持第三方過(guò)濾器對(duì)數(shù)據(jù)進(jìn)行過(guò)濾操作。[判斷題]對(duì)(正確答案)錯(cuò)多個(gè)Flume可以連接起來(lái)從部署節(jié)點(diǎn)上采集數(shù)據(jù)。[判斷題]對(duì)(正確答案)錯(cuò)Flume傳輸數(shù)據(jù)時(shí),sink如果出現(xiàn)下一跳故障,可以將數(shù)據(jù)發(fā)給其他的下一跳。[判斷題]對(duì)(正確答案)錯(cuò)Kafka集群中,Kafka服務(wù)端角色是Consumer。[判斷題]對(duì)錯(cuò)(正確答案)Kafka集群中,Kafka部署的實(shí)例個(gè)數(shù)不得小于2。[判斷題]對(duì)(正確答案)錯(cuò)Checkpoint機(jī)制是Flink運(yùn)行過(guò)程中容錯(cuò)的重要手段。[判斷題]對(duì)(正確答案)錯(cuò)Flink程序是由DataSet和DataStream組成。[判斷題]對(duì)錯(cuò)(正確答案)StructuredStreaming的外部存儲(chǔ)系統(tǒng)的AppendMode方式表示只有在ResultTable中被更新的數(shù)據(jù)才會(huì)被寫(xiě)入到外部存儲(chǔ)系統(tǒng)。[判斷題]對(duì)錯(cuò)(正確答案)Redis可以做排行榜的應(yīng)用場(chǎng)景。[判斷題]對(duì)(正確答案)錯(cuò)Redis的flushall命令表示清空Redis實(shí)例下所有數(shù)據(jù)庫(kù)的數(shù)據(jù)。[判斷題]對(duì)(正確答案)錯(cuò)數(shù)據(jù)庫(kù)架構(gòu)設(shè)計(jì)Shard-Everying是指服務(wù)器的所有資源(包括磁盤(pán)、CPU、顯卡、網(wǎng)絡(luò))都共享。[判斷題]對(duì)錯(cuò)(正確答案)CTID的值是增量增加的。[判斷題]對(duì)(正確答案)錯(cuò)物理集群包含邏輯集群。[判斷題]對(duì)(正確答案)錯(cuò)SQLonAnywhere的意思是SQL可以在任何地方使用。[判斷題]對(duì)錯(cuò)(正確答案)GaussDB200的自適應(yīng)調(diào)度和大數(shù)據(jù)的Yarn調(diào)度是類(lèi)似的,都是根據(jù)作業(yè)的所耗資源,按照作業(yè)優(yōu)先級(jí),并優(yōu)先滿足損耗資源少的作業(yè),保證資源的充分利用。[判斷題]對(duì)錯(cuò)(正確答案)創(chuàng)建數(shù)據(jù)庫(kù)時(shí)默認(rèn)支持的字符集是UTF-8。[判斷題]對(duì)錯(cuò)(正確答案)Flink程序是由DataSet和DataStream組成。[判斷題]對(duì)錯(cuò)(正確答案)StructuredStreaming的外部存儲(chǔ)系統(tǒng)的AppendMode方式表示只有在ResultTable中被更新的數(shù)據(jù)才會(huì)被寫(xiě)入到外部存儲(chǔ)系統(tǒng)。[判斷題]對(duì)錯(cuò)(正確答案).Hive從本地加載數(shù)據(jù)需要加關(guān)鍵字:“l(fā)ocal”。[判斷題]對(duì)(正確答案)錯(cuò)大數(shù)據(jù)技術(shù),是指伴隨大數(shù)據(jù)的采集、存儲(chǔ)、處理和分析的相關(guān)技術(shù)[判斷題]對(duì)(正確答案)錯(cuò)針對(duì)不同的數(shù)據(jù)來(lái)源,需要先分析其數(shù)據(jù)特征,例如一般網(wǎng)站產(chǎn)生的日志特點(diǎn)是數(shù)據(jù)量大,價(jià)值密度高,數(shù)據(jù)的業(yè)務(wù)種類(lèi)多且涵蓋之前的數(shù)據(jù)。[判斷題]對(duì)錯(cuò)(正確答案)Kafka中的Broker在收到新消息后會(huì)立即存入磁盤(pán)。[判斷題]對(duì)錯(cuò)(正確答案)GaussDB200的自適應(yīng)調(diào)度和大數(shù)據(jù)的YARN調(diào)度是類(lèi)似的,都是根據(jù)作業(yè)的所耗資源,按照作業(yè)優(yōu)先級(jí),并優(yōu)先滿足損耗資源少的作業(yè),保證資源的充分利用。[判斷題]對(duì)錯(cuò)(正確答案)Hbase是一種分布式數(shù)據(jù)庫(kù),不依賴(lài)HDFS也可以運(yùn)行。[判斷題]對(duì)(正確答案)錯(cuò)GAUSSDB200在內(nèi)部使用行標(biāo)識(shí)符(CTID)記錄數(shù)據(jù)在表中的邏輯位置。[判斷題]對(duì)錯(cuò)(正確答案)Redis默認(rèn)支持14個(gè)數(shù)據(jù)庫(kù)。[判斷題]對(duì)錯(cuò)(正確答案)關(guān)于Kafka組件說(shuō)法正確的是?A、刪除topic時(shí),必須確保kafka的服務(wù)配置delete.topic.enable配置為true(正確答案)B、Kafka安裝及運(yùn)行日志保存路徑為/srv/Bigdata/kafka/C、ZooKeeper服務(wù)不可用會(huì)導(dǎo)致Kafka服務(wù)不可用(正確答案)D、必須使用admin用戶或者kafkaadmin組用戶進(jìn)行創(chuàng)建topic(正確答案)下面哪些是Flume的sink支持的類(lèi)型?A、KafkaSink(正確答案)B、StormSinkC、HbaseSink(正確答案)D、SparkSink(正確答案)Redis的寫(xiě)命令同步的時(shí)機(jī)有哪幾種?A、appendfsyncyesB、appendfsyncalways(正確答案)C、appendfsynceverysec(正確答案)D、appendfsyncno(正確答案)關(guān)于Redis的描述,下列正確的是?A、Redis支持多數(shù)據(jù)庫(kù)(正確答案)B、可以使用existskey判斷鍵是否存在(正確答案)B、B、count(正確答案)第6頁(yè)/共20頁(yè)B、B、count(正確答案)第6頁(yè)/共20頁(yè)D、支持標(biāo)準(zhǔn)D、支持標(biāo)準(zhǔn)SQL和標(biāo)準(zhǔn)JDBC特性第6頁(yè)/共20頁(yè)C、Redis可以為任何鍵增減字段而不影響其他鍵D、Redis的命令區(qū)分大小寫(xiě)(正確答案)下面哪些是屬于Flink的窗口類(lèi)型?A、TumblingWindow(正確答案)B、countWindow(正確答案)C、SlidingWindow(正確答案)D、timeWindow(正確答案)以下哪些情況下采用Replication方式存儲(chǔ)數(shù)據(jù)()?A、存儲(chǔ)的表的數(shù)據(jù)量較?。ㄕ_答案)B、需要較高的并發(fā)分析能力(正確答案)C、對(duì)數(shù)據(jù)的完整性要求較高D、以上都是一般在什么時(shí)候會(huì)采用數(shù)據(jù)分區(qū)()?A、當(dāng)表中數(shù)據(jù)量比較多(千萬(wàn)級(jí)別以上)的時(shí)候(正確答案)B、需要執(zhí)行大量的數(shù)據(jù)刪除操作的時(shí)候(正確答案)C、需要執(zhí)行大量的熱點(diǎn)數(shù)據(jù)查詢操作的時(shí)候(正確答案)D、需要執(zhí)行大量的數(shù)據(jù)更新操作的時(shí)候(正確答案)GaussDB200的高可靠主要體現(xiàn)在()?A、提供集群管理和數(shù)據(jù)節(jié)點(diǎn)HA(正確答案)B、事務(wù)支持ACID特性(正確答案)C、支持故障切換、單節(jié)點(diǎn)故障恢復(fù)(正確答案)下面關(guān)于GaussDB200的邏輯集群說(shuō)法正確的是()?A、邏輯集群的意思就是通過(guò)物理服務(wù)器的隔離來(lái)達(dá)到數(shù)據(jù)的分離處理B、在邏輯集群上實(shí)現(xiàn)多租戶管理,達(dá)到CPU、內(nèi)存等計(jì)算資源的控制隔離(正確答案)C、邏輯集群的最終目的是實(shí)現(xiàn)資源隔離及資源彈性能力(正確答案)D、一個(gè)物理節(jié)點(diǎn)對(duì)應(yīng)一個(gè)邏輯集群(正確答案)對(duì)于Gremlin描述正確的是?A、支持客戶端操作和JavaAPI操作(正確答案)B、每一步操作都在數(shù)據(jù)流(datastream)上執(zhí)行一個(gè)原子操作(正確答案)C、語(yǔ)句比較復(fù)雜D、函數(shù)式數(shù)據(jù)流語(yǔ)言(正確答案)HDFS的系統(tǒng)結(jié)構(gòu)中包含哪些模塊?A、DataNode(正確答案)B、Client(正確答案)C、RegionServerD、NameNode(正確答案)以下哪些是Hive自帶的系統(tǒng)函數(shù)?A、sum(正確答案)第第6頁(yè)/共20頁(yè)B、用于優(yōu)化隨機(jī)寫(xiě)的場(chǎng)景(B、用于優(yōu)化隨機(jī)寫(xiě)的場(chǎng)景(正確答案)第6頁(yè)/共20頁(yè)C、批量文件數(shù)據(jù)(C、批量文件數(shù)據(jù)(正確答案)第6頁(yè)/共20頁(yè)C、like(正確答案)D、Dwg大數(shù)據(jù)場(chǎng)景化解決方案包含以下哪些選項(xiàng)?A、離線檢索B、離線批處理(正確答案)C、實(shí)時(shí)檢索(正確答案)D、實(shí)時(shí)流處理(正確答案)在金融領(lǐng)域的大數(shù)據(jù)批量離線處理平臺(tái)中,以下描述準(zhǔn)確的是?A、在數(shù)據(jù)集成模塊,可以分為數(shù)據(jù)采集、數(shù)據(jù)操控和數(shù)據(jù)加載3個(gè)階段。(正確答案)B、金融領(lǐng)域的外部數(shù)據(jù)來(lái)源可以是征信信息、社交網(wǎng)絡(luò)和電商等。(正確答案)C、金融領(lǐng)域的內(nèi)部數(shù)據(jù)來(lái)源均是結(jié)構(gòu)化數(shù)據(jù),包括信貸數(shù)據(jù)、信用卡數(shù)據(jù)和收單數(shù)據(jù)等。D、金融領(lǐng)域的數(shù)據(jù)應(yīng)用層面均是面向金融機(jī)構(gòu)內(nèi)部的,如監(jiān)管報(bào)表系統(tǒng),精準(zhǔn)營(yíng)銷(xiāo)、BI應(yīng)用等,完全不對(duì)外或?qū)ζ渌聦贆C(jī)構(gòu)開(kāi)放。大數(shù)據(jù)離線批處理場(chǎng)景中常見(jiàn)的數(shù)據(jù)源包括?A、流式數(shù)據(jù)Socket流(正確答案)B、網(wǎng)頁(yè)日志流(正確答案)D、數(shù)據(jù)庫(kù)(正確答案)以下哪些選項(xiàng)是實(shí)時(shí)檢索適用的場(chǎng)景?A、高并發(fā)的場(chǎng)景(正確答案)B、查詢速度要求高的場(chǎng)景(正確答案)C、圖片查詢場(chǎng)景(正確答案)D、查詢條件比較復(fù)雜的場(chǎng)景下列哪些措施,可以顯著提升ElasticSearch的性能?A、減少EsMasterB、禁用swap(正確答案)C、修改副本數(shù)量(正確答案)D、增加EsMasterFlink中的計(jì)算時(shí)間包含以下哪幾種?A、IngestionTime(正確答案)B、EventTime(正確答案)C、DelayTimeD、ProcessingTime(正確答案)StructuredStreaming中通過(guò)什么機(jī)制,解決數(shù)據(jù)的無(wú)序和滯后問(wèn)題?A、持續(xù)查詢B、事件時(shí)間(正確答案)C、watermark機(jī)制(正確答案)D、流連接下列關(guān)于GaussDB200的TOAST機(jī)制說(shuō)法正確的是()?A、支持變長(zhǎng)(varlena)表現(xiàn)形式的數(shù)據(jù)類(lèi)型。(正確答案)B、存儲(chǔ)超過(guò)2KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制。(正確答案)C、存儲(chǔ)超過(guò)1KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制。D、存儲(chǔ)超過(guò)1/2KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制。數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)分層的優(yōu)點(diǎn)包括?A、把復(fù)雜問(wèn)題簡(jiǎn)單化(正確答案)B、減少數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)空間C、隔離原始數(shù)據(jù)(正確答案)D、減少重復(fù)開(kāi)發(fā)(正確答案)GaussDB200的高可靠主要體現(xiàn)在()?A、提供集群管理和數(shù)據(jù)節(jié)點(diǎn)HA。(正確答案)B、GTM采用Active-Standby模式。(正確答案)C、CN支持多CNActive-Active模式HA。(正確答案)D、支持標(biāo)準(zhǔn)SQL和標(biāo)準(zhǔn)JDBC特性。對(duì)HbaseBloomfilter描述不正確的是?A、判斷結(jié)果一定正確(正確答案)C、用于優(yōu)化Scan場(chǎng)景(正確答案)D、誤判率由哈希函數(shù)個(gè)數(shù)k、位數(shù)組大小m、數(shù)據(jù)量n共同確定實(shí)時(shí)場(chǎng)景的典型特點(diǎn)是?A、數(shù)據(jù)格式多(正確答案)B、交互式查詢(正確答案)C、數(shù)據(jù)量大D、時(shí)延要求高(正確答案)實(shí)時(shí)檢索解決方案支持的數(shù)據(jù)采集有哪些?A、Loader(正確答案)B、Spark(正確答案)C、Sparkstreaming(正確答案)D、Graphbase導(dǎo)入工具(正確答案)/r/

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論