版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)平臺技術(shù)智慧樹知到課后章節(jié)答案2023年下山東交通學(xué)院山東交通學(xué)院
第一章測試
數(shù)據(jù),就是所有能輸入到計算機,并被計算機程序處理的符號的總稱為()。
A:對B:錯
答案:對
大數(shù)據(jù)的4V特征包括()。
A:變化頻繁
B:規(guī)模龐大
C:種類繁多
D:價值巨大但價值密度低
答案:變化頻繁
;規(guī)模龐大
;種類繁多
;價值巨大但價值密度低
2TB數(shù)據(jù)等于多少GB()。
A:1000
B:2048
C:1024
D:2000
答案:2048
大數(shù)據(jù)包含下面類型()。
A:半結(jié)構(gòu)化數(shù)據(jù)
B:純文本數(shù)據(jù)
C:非結(jié)構(gòu)化數(shù)據(jù)
D:結(jié)構(gòu)化數(shù)據(jù)
答案:半結(jié)構(gòu)化數(shù)據(jù)
;純文本數(shù)據(jù)
;非結(jié)構(gòu)化數(shù)據(jù)
;結(jié)構(gòu)化數(shù)據(jù)
大數(shù)據(jù)的生命周期一般會經(jīng)歷這么幾個階段()。
A:采集與預(yù)處理
B:存儲與管理
C:分析與挖掘
D:可視化
答案:采集與預(yù)處理
;存儲與管理
;分析與挖掘
;可視化
大數(shù)據(jù)平臺的基本架構(gòu),從技術(shù)架構(gòu)的角度,可劃分為這幾個層次()。
A:服務(wù)封裝層
B:數(shù)據(jù)存儲層
C:數(shù)據(jù)采集層
D:數(shù)據(jù)處理層
答案:服務(wù)封裝層
;數(shù)據(jù)存儲層
;數(shù)據(jù)采集層
;數(shù)據(jù)處理層
linux系統(tǒng)中cd命令的作用是()。
A:進入指定目錄
B:刪除一個目錄中的一個或多個文件
C:將源文件復(fù)制至目標(biāo)文件
D:移動文件或修改文件名
答案:進入指定目錄
vi編輯器的操作模式共分為()。
A:輸入模式
B:底線命令模式
C:命令模式
D:編輯模式
答案:底線命令模式
;命令模式
;編輯模式
第二章測試
Flume的Agent包含這些組成部分()。
A:Sink
B:Channel
C:Source
D:Event
答案:Sink
;Channel
;Source
Event由這兩部分組成()。
A:Array
B:Body
C:Head
D:K-V
答案:Body
;Head
Source是Flume中事件的源頭,負(fù)責(zé)接收數(shù)據(jù)到FlumeAgent,可以處理多種類型、多種格式的數(shù)據(jù)()
A:錯B:對
答案:對
Channel是位于Source和Sink之間的緩沖區(qū),對Source和Sink進行一對一處理()
A:對B:錯
答案:錯
在Flume的配置文件中,對某個目錄下文件進行監(jiān)控的命令是()。
A:flume-ng
B:exec
C:/bin/bash-c
D:tail-f
答案:tail-f
第三章測試
以下說法有誤的是()。
A:分布式存儲系統(tǒng)可以實現(xiàn)數(shù)據(jù)容災(zāi)
B:傳統(tǒng)單機存儲方式擴容成本較低
C:分布式存儲系統(tǒng)需要考慮數(shù)據(jù)的分塊問題
D:“元數(shù)據(jù)”中不包含真正的文件數(shù)據(jù)
答案:傳統(tǒng)單機存儲方式擴容成本較低
Hadoop2.x中HDFS默認(rèn)的block的大小為()。
A:128MB
B:32MB
C:64MB
D:256MB
答案:128MB
關(guān)于SecondaryNameNode哪項是正確的()。
A:SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點
B:它是NameNode的熱備
C:它對內(nèi)存沒有要求
D:它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間
答案:它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間
以下哪一項用于配置HDFS的block大?。ǎ?/p>
A:dfs.replication
B:.dir
C:dfs.blocksize
D:fs.defaultFS
答案:dfs.blocksize
HDFS中的NameNode節(jié)點用于存放元數(shù)據(jù),元數(shù)據(jù)內(nèi)容包含()。
A:客戶端硬件配置數(shù)據(jù)
B:數(shù)據(jù)塊與數(shù)據(jù)節(jié)點的映射表
C:文件與數(shù)據(jù)塊的映射表
D:每個數(shù)據(jù)塊的內(nèi)容
答案:數(shù)據(jù)塊與數(shù)據(jù)節(jié)點的映射表
;文件與數(shù)據(jù)塊的映射表
如果NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。()
A:錯B:對
答案:錯
NameNode負(fù)責(zé)管理元數(shù)據(jù),客戶端每次讀寫請求,它都會從磁盤中讀取或者寫入元數(shù)據(jù)信息并反饋客戶端。()
A:錯B:對
答案:錯
因為HDFS有多個數(shù)據(jù)副本,所以NameNode是不存在單點故障問題的。()
A:錯B:對
答案:錯
讀取HDFS文件可以使用命令hdfsdfs-get。()
A:錯B:對
答案:對
第四章測試
以下說法有誤的是()。
A:Hadoop的MapReduce框架不能容忍任務(wù)出錯
B:MapReduce編程模型可以分為Map和Reduce兩個階段
C:MapReduce編程模型的核心思想是分而治之
D:分布式計算框架的實現(xiàn)需要考慮網(wǎng)絡(luò)通信
答案:Hadoop的MapReduce框架不能容忍任務(wù)出錯
下面說法錯誤的是()。
A:MapTask負(fù)責(zé)匯總整個任務(wù)的執(zhí)行結(jié)果
B:一個集群中某個確定的任務(wù)可以存在多個MapTask進程
C:MapReduce任務(wù)可以不跑在Hadoop集群中
D:MapReduce可以逐行處理文本數(shù)據(jù)
答案:MapTask負(fù)責(zé)匯總整個任務(wù)的執(zhí)行結(jié)果
下面哪項是錯誤的()。
A:Python提交MapReduce作業(yè)時,可以使用-rhadoop指定集群模式運行
B:MapReduce作業(yè)的運行內(nèi)存并非越大越好
C:Python提交MapReduce作業(yè)時,可以使用-o參數(shù)指定輸出路徑
D:MapReduce的輸出目錄如果已經(jīng)存在了,任務(wù)的輸出結(jié)果將會覆蓋該路徑下的原有內(nèi)容
答案:MapReduce的輸出目錄如果已經(jīng)存在了,任務(wù)的輸出結(jié)果將會覆蓋該路徑下的原有內(nèi)容
MapReduce中Map階段的輸出將作為下面哪個階段的輸入()。
A:Reduce
B:Split
C:Join
D:Shuffle
答案:Reduce
下列關(guān)于MapReduce說法正確的是()。
A:MapReduce是一種計算框架
B:MapReduce隱藏了并行計算的細(xì)節(jié),方便使用
C:MapReduce來源于google的學(xué)術(shù)論文
D:MapReduce程序只能用java語言編寫
答案:MapReduce是一種計算框架
;MapReduce隱藏了并行計算的細(xì)節(jié),方便使用
;MapReduce來源于google的學(xué)術(shù)論文
第五章測試
以下說法有誤的是()。
A:Kafka無法持久化數(shù)據(jù)
B:Kafka由Scala語言編寫
C:實時數(shù)據(jù)傳輸問題在高并發(fā)場景下尤為明顯
D:Kafka支持離線數(shù)據(jù)處理
答案:Kafka無法持久化數(shù)據(jù)
以下對Kafka名詞解釋錯誤的是()。
A:Partition指Kafka的數(shù)據(jù)副本
B:Offset是數(shù)據(jù)在分區(qū)中的唯一位置
C:Broker指Kafka服務(wù)器
D:Consumer指消息的消費者
答案:Partition指Kafka的數(shù)據(jù)副本
對市面上的消息隊列產(chǎn)品描述正確的是()。
A:RabbitMQ支持動態(tài)擴展
B:ActiveMQ不支持集群模式
C:Kafka支持事務(wù)
D:Kafka支持動態(tài)擴展
答案:Kafka支持動態(tài)擴展
以下描述正確的是()。
A:數(shù)據(jù)發(fā)送到Kafka需要經(jīng)歷序列化
B:Kafka的默認(rèn)客戶端端口號是50070
C:utf-8編碼方式不支持中文
D:Python語言可以通過kafka-python模塊使用Kafka客戶端
答案:數(shù)據(jù)發(fā)送到Kafka需要經(jīng)歷序列化
;Python語言可以通過kafka-python模塊使用Kafka客戶端
以下對消息模型的說法正確的是()。
A:點對點模型中消息被消費后即刪除
B:發(fā)布訂閱模型以主題區(qū)分消息類別
C:點對點模型中同一消息只有一個消費者可以消費
D:發(fā)布訂閱模型消息可以重復(fù)消費
答案:點對點模型中消息被消費后即刪除
;發(fā)布訂閱模型以主題區(qū)分消息類別
;點對點模型中同一消息只有一個消費者可以消費
;發(fā)布訂閱模型消息可以重復(fù)消費
第六章測試
Spark框架的特色包括()。
A:通用性
B:容易使用
C:運行速度快
D:運行模式多樣
答案:通用性
;容易使用
;運行速度快
;運行模式多樣
Spark支持的集群管理器包括()。
A:HadoopYARN
B:ApacheMesos
C:SparkCore
D:Standalone
答案:HadoopYARN
;ApacheMesos
;Standalone
下面關(guān)于Spark驅(qū)動程序driverprogram的說法,正確的是()。
A:驅(qū)動程序負(fù)責(zé)把并行操作發(fā)布到集群上
B:驅(qū)動程序定義了分布式數(shù)據(jù)集以應(yīng)用在集群中
C:驅(qū)動程序包含Spark應(yīng)用程序中的主函數(shù)
D:每個Spark應(yīng)用程序都包含一個驅(qū)動程序
答案:驅(qū)動程序負(fù)責(zé)把并行操作發(fā)布到集群上
;驅(qū)動程序定義了分布式數(shù)據(jù)集以應(yīng)用在集群中
;驅(qū)動程序包含Spark應(yīng)用程序中的主函數(shù)
;每個Spark應(yīng)用程序都包含一個驅(qū)動程序
彈性分布式數(shù)據(jù)集RDD的特性包括()。
A:彈性
B:依賴
C:分區(qū)
D:只讀
答案:彈性
;依賴
;分區(qū)
;只讀
在Spark操作中,map(func)的作用是()。
A:對元素為鍵值對的RDD中Key相同的元素的value進行reduce
B:返回排序后的數(shù)據(jù)集
C:對RDD中的數(shù)據(jù)按照func進行計算得到新的RDD
D:返回一個新的數(shù)據(jù)集,這個數(shù)據(jù)集中的元素是通過func函數(shù)篩選后返回為true的元素
答案:對RDD中的數(shù)據(jù)按照func進行計算得到新的RDD
在Spark操作中,collect()的作用是()。
A:返回數(shù)據(jù)集中的元素個數(shù)
B:通過函數(shù)func聚合數(shù)據(jù)集中的元素
C:以數(shù)組的形式返回數(shù)據(jù)集中的所有元素
D:將數(shù)據(jù)集中的每個元素傳遞到函數(shù)func中運行
答案:以數(shù)組的形式返回數(shù)據(jù)集中的所有元素
從概念上而言,流數(shù)據(jù)(或數(shù)據(jù)流)是指()。
A:在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據(jù)集合體
B:數(shù)據(jù)分時段批量到達(dá)
C:數(shù)據(jù)采用集中式處理
D:數(shù)據(jù)記錄是流數(shù)據(jù)的最小組成單元
答案:在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據(jù)集合體
;數(shù)據(jù)記錄是流數(shù)據(jù)的最小組成單元
SparkStreaming最主要的抽象是離散化數(shù)據(jù)流,表示連續(xù)不斷的數(shù)據(jù)流。()
A:對B:錯
答案:對
在SparkStreaming中,作為一個長期運行的task跑在一個Executor上,用于接收DStream的組件是()。
A:Streaming
B:Analyzer
C:RDD
D:Receiver
答案:Receiver
在SparkStreaming中,可以通過streamingContext.awaitTermination()方法來手動結(jié)束流計算進程。()
A:對B:錯
答案:錯
第七章測試
以下說法有誤的是()。
A:HBase不需要考慮讀寫性能
B:HBase是一種key-value數(shù)據(jù)庫
C:HBase對事務(wù)的支持較差
D:HBase是非關(guān)系型數(shù)據(jù)庫
答案:HBase不需要考慮讀寫性能
下面說法錯誤的是()。
A:HBase的一個表中可以有多個列族
B:HBase表的一個列族可以包含多個列
C:HBase一個RegionServer服務(wù)器中可以有多個Region
D:一個HBase集群中只能有一個RegionServer
答案:一個HBase集群中只能有一個RegionServer
下面哪項關(guān)于HBase的常用命令的描述是錯誤的()。
A:HBase使用scan命令時可以指定掃描區(qū)間
B:HBase要查看表可以使用list_namespace
C:HBase一張正在使用的表可以直接使用drop命令刪除
D:HBase全表掃描使用get命令
答案:HBase要查看表可以使用list_namespace
;HBase一張正在使用的表可以直接使用dro
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度還建房產(chǎn)權(quán)登記與轉(zhuǎn)移合同范本2篇
- 2025年水泥制品企業(yè)環(huán)保節(jié)能項目投資合作合同3篇
- 二零二五年新推出二手房買賣合同代辦服務(wù)條款3篇
- 2025年體檢服務(wù)費分期付款協(xié)議
- 2025年勞務(wù)派遣用工終止協(xié)議
- 2025年垃圾處理與資源回收協(xié)議
- 二零二五版智能化辦公場地租賃及升級協(xié)議3篇
- 2025年分期付款購車協(xié)議
- 2025年城市污水處理設(shè)施建設(shè)PPP協(xié)議
- 2025年專利轉(zhuǎn)讓合同仲裁協(xié)議
- 全自動化學(xué)發(fā)光分析儀操作規(guī)程
- 北侖區(qū)建筑工程質(zhì)量監(jiān)督站監(jiān)督告知書
- 深藍(lán)的故事(全3冊)
- GB/T 42461-2023信息安全技術(shù)網(wǎng)絡(luò)安全服務(wù)成本度量指南
- 職校開學(xué)第一課班會PPT
- 法考客觀題歷年真題及答案解析卷一(第1套)
- 央國企信創(chuàng)白皮書 -基于信創(chuàng)體系的數(shù)字化轉(zhuǎn)型
- GB/T 36964-2018軟件工程軟件開發(fā)成本度量規(guī)范
- 6第六章 社會契約論.電子教案教學(xué)課件
- 機加車間各崗位績效考核方案
- 小學(xué)數(shù)學(xué)專題講座:小學(xué)數(shù)學(xué)計算能力的培養(yǎng)課件
評論
0/150
提交評論