




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數(shù)據平臺技術智慧樹知到課后章節(jié)答案2023年下山東交通學院山東交通學院
第一章測試
數(shù)據,就是所有能輸入到計算機,并被計算機程序處理的符號的總稱為()。
A:對B:錯
答案:對
大數(shù)據的4V特征包括()。
A:變化頻繁
B:規(guī)模龐大
C:種類繁多
D:價值巨大但價值密度低
答案:變化頻繁
;規(guī)模龐大
;種類繁多
;價值巨大但價值密度低
2TB數(shù)據等于多少GB()。
A:1000
B:2048
C:1024
D:2000
答案:2048
大數(shù)據包含下面類型()。
A:半結構化數(shù)據
B:純文本數(shù)據
C:非結構化數(shù)據
D:結構化數(shù)據
答案:半結構化數(shù)據
;純文本數(shù)據
;非結構化數(shù)據
;結構化數(shù)據
大數(shù)據的生命周期一般會經歷這么幾個階段()。
A:采集與預處理
B:存儲與管理
C:分析與挖掘
D:可視化
答案:采集與預處理
;存儲與管理
;分析與挖掘
;可視化
大數(shù)據平臺的基本架構,從技術架構的角度,可劃分為這幾個層次()。
A:服務封裝層
B:數(shù)據存儲層
C:數(shù)據采集層
D:數(shù)據處理層
答案:服務封裝層
;數(shù)據存儲層
;數(shù)據采集層
;數(shù)據處理層
linux系統(tǒng)中cd命令的作用是()。
A:進入指定目錄
B:刪除一個目錄中的一個或多個文件
C:將源文件復制至目標文件
D:移動文件或修改文件名
答案:進入指定目錄
vi編輯器的操作模式共分為()。
A:輸入模式
B:底線命令模式
C:命令模式
D:編輯模式
答案:底線命令模式
;命令模式
;編輯模式
第二章測試
Flume的Agent包含這些組成部分()。
A:Sink
B:Channel
C:Source
D:Event
答案:Sink
;Channel
;Source
Event由這兩部分組成()。
A:Array
B:Body
C:Head
D:K-V
答案:Body
;Head
Source是Flume中事件的源頭,負責接收數(shù)據到FlumeAgent,可以處理多種類型、多種格式的數(shù)據()
A:錯B:對
答案:對
Channel是位于Source和Sink之間的緩沖區(qū),對Source和Sink進行一對一處理()
A:對B:錯
答案:錯
在Flume的配置文件中,對某個目錄下文件進行監(jiān)控的命令是()。
A:flume-ng
B:exec
C:/bin/bash-c
D:tail-f
答案:tail-f
第三章測試
以下說法有誤的是()。
A:分布式存儲系統(tǒng)可以實現(xiàn)數(shù)據容災
B:傳統(tǒng)單機存儲方式擴容成本較低
C:分布式存儲系統(tǒng)需要考慮數(shù)據的分塊問題
D:“元數(shù)據”中不包含真正的文件數(shù)據
答案:傳統(tǒng)單機存儲方式擴容成本較低
Hadoop2.x中HDFS默認的block的大小為()。
A:128MB
B:32MB
C:64MB
D:256MB
答案:128MB
關于SecondaryNameNode哪項是正確的()。
A:SecondaryNameNode應與NameNode部署到一個節(jié)點
B:它是NameNode的熱備
C:它對內存沒有要求
D:它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間
答案:它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間
以下哪一項用于配置HDFS的block大?。ǎ?。
A:dfs.replication
B:.dir
C:dfs.blocksize
D:fs.defaultFS
答案:dfs.blocksize
HDFS中的NameNode節(jié)點用于存放元數(shù)據,元數(shù)據內容包含()。
A:客戶端硬件配置數(shù)據
B:數(shù)據塊與數(shù)據節(jié)點的映射表
C:文件與數(shù)據塊的映射表
D:每個數(shù)據塊的內容
答案:數(shù)據塊與數(shù)據節(jié)點的映射表
;文件與數(shù)據塊的映射表
如果NameNode意外終止,SecondaryNameNode會接替它使集群繼續(xù)工作。()
A:錯B:對
答案:錯
NameNode負責管理元數(shù)據,客戶端每次讀寫請求,它都會從磁盤中讀取或者寫入元數(shù)據信息并反饋客戶端。()
A:錯B:對
答案:錯
因為HDFS有多個數(shù)據副本,所以NameNode是不存在單點故障問題的。()
A:錯B:對
答案:錯
讀取HDFS文件可以使用命令hdfsdfs-get。()
A:錯B:對
答案:對
第四章測試
以下說法有誤的是()。
A:Hadoop的MapReduce框架不能容忍任務出錯
B:MapReduce編程模型可以分為Map和Reduce兩個階段
C:MapReduce編程模型的核心思想是分而治之
D:分布式計算框架的實現(xiàn)需要考慮網絡通信
答案:Hadoop的MapReduce框架不能容忍任務出錯
下面說法錯誤的是()。
A:MapTask負責匯總整個任務的執(zhí)行結果
B:一個集群中某個確定的任務可以存在多個MapTask進程
C:MapReduce任務可以不跑在Hadoop集群中
D:MapReduce可以逐行處理文本數(shù)據
答案:MapTask負責匯總整個任務的執(zhí)行結果
下面哪項是錯誤的()。
A:Python提交MapReduce作業(yè)時,可以使用-rhadoop指定集群模式運行
B:MapReduce作業(yè)的運行內存并非越大越好
C:Python提交MapReduce作業(yè)時,可以使用-o參數(shù)指定輸出路徑
D:MapReduce的輸出目錄如果已經存在了,任務的輸出結果將會覆蓋該路徑下的原有內容
答案:MapReduce的輸出目錄如果已經存在了,任務的輸出結果將會覆蓋該路徑下的原有內容
MapReduce中Map階段的輸出將作為下面哪個階段的輸入()。
A:Reduce
B:Split
C:Join
D:Shuffle
答案:Reduce
下列關于MapReduce說法正確的是()。
A:MapReduce是一種計算框架
B:MapReduce隱藏了并行計算的細節(jié),方便使用
C:MapReduce來源于google的學術論文
D:MapReduce程序只能用java語言編寫
答案:MapReduce是一種計算框架
;MapReduce隱藏了并行計算的細節(jié),方便使用
;MapReduce來源于google的學術論文
第五章測試
以下說法有誤的是()。
A:Kafka無法持久化數(shù)據
B:Kafka由Scala語言編寫
C:實時數(shù)據傳輸問題在高并發(fā)場景下尤為明顯
D:Kafka支持離線數(shù)據處理
答案:Kafka無法持久化數(shù)據
以下對Kafka名詞解釋錯誤的是()。
A:Partition指Kafka的數(shù)據副本
B:Offset是數(shù)據在分區(qū)中的唯一位置
C:Broker指Kafka服務器
D:Consumer指消息的消費者
答案:Partition指Kafka的數(shù)據副本
對市面上的消息隊列產品描述正確的是()。
A:RabbitMQ支持動態(tài)擴展
B:ActiveMQ不支持集群模式
C:Kafka支持事務
D:Kafka支持動態(tài)擴展
答案:Kafka支持動態(tài)擴展
以下描述正確的是()。
A:數(shù)據發(fā)送到Kafka需要經歷序列化
B:Kafka的默認客戶端端口號是50070
C:utf-8編碼方式不支持中文
D:Python語言可以通過kafka-python模塊使用Kafka客戶端
答案:數(shù)據發(fā)送到Kafka需要經歷序列化
;Python語言可以通過kafka-python模塊使用Kafka客戶端
以下對消息模型的說法正確的是()。
A:點對點模型中消息被消費后即刪除
B:發(fā)布訂閱模型以主題區(qū)分消息類別
C:點對點模型中同一消息只有一個消費者可以消費
D:發(fā)布訂閱模型消息可以重復消費
答案:點對點模型中消息被消費后即刪除
;發(fā)布訂閱模型以主題區(qū)分消息類別
;點對點模型中同一消息只有一個消費者可以消費
;發(fā)布訂閱模型消息可以重復消費
第六章測試
Spark框架的特色包括()。
A:通用性
B:容易使用
C:運行速度快
D:運行模式多樣
答案:通用性
;容易使用
;運行速度快
;運行模式多樣
Spark支持的集群管理器包括()。
A:HadoopYARN
B:ApacheMesos
C:SparkCore
D:Standalone
答案:HadoopYARN
;ApacheMesos
;Standalone
下面關于Spark驅動程序driverprogram的說法,正確的是()。
A:驅動程序負責把并行操作發(fā)布到集群上
B:驅動程序定義了分布式數(shù)據集以應用在集群中
C:驅動程序包含Spark應用程序中的主函數(shù)
D:每個Spark應用程序都包含一個驅動程序
答案:驅動程序負責把并行操作發(fā)布到集群上
;驅動程序定義了分布式數(shù)據集以應用在集群中
;驅動程序包含Spark應用程序中的主函數(shù)
;每個Spark應用程序都包含一個驅動程序
彈性分布式數(shù)據集RDD的特性包括()。
A:彈性
B:依賴
C:分區(qū)
D:只讀
答案:彈性
;依賴
;分區(qū)
;只讀
在Spark操作中,map(func)的作用是()。
A:對元素為鍵值對的RDD中Key相同的元素的value進行reduce
B:返回排序后的數(shù)據集
C:對RDD中的數(shù)據按照func進行計算得到新的RDD
D:返回一個新的數(shù)據集,這個數(shù)據集中的元素是通過func函數(shù)篩選后返回為true的元素
答案:對RDD中的數(shù)據按照func進行計算得到新的RDD
在Spark操作中,collect()的作用是()。
A:返回數(shù)據集中的元素個數(shù)
B:通過函數(shù)func聚合數(shù)據集中的元素
C:以數(shù)組的形式返回數(shù)據集中的所有元素
D:將數(shù)據集中的每個元素傳遞到函數(shù)func中運行
答案:以數(shù)組的形式返回數(shù)據集中的所有元素
從概念上而言,流數(shù)據(或數(shù)據流)是指()。
A:在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據集合體
B:數(shù)據分時段批量到達
C:數(shù)據采用集中式處理
D:數(shù)據記錄是流數(shù)據的最小組成單元
答案:在時間分布和數(shù)量上無限的一系列動態(tài)數(shù)據集合體
;數(shù)據記錄是流數(shù)據的最小組成單元
SparkStreaming最主要的抽象是離散化數(shù)據流,表示連續(xù)不斷的數(shù)據流。()
A:對B:錯
答案:對
在SparkStreaming中,作為一個長期運行的task跑在一個Executor上,用于接收DStream的組件是()。
A:Streaming
B:Analyzer
C:RDD
D:Receiver
答案:Receiver
在SparkStreaming中,可以通過streamingContext.awaitTermination()方法來手動結束流計算進程。()
A:對B:錯
答案:錯
第七章測試
以下說法有誤的是()。
A:HBase不需要考慮讀寫性能
B:HBase是一種key-value數(shù)據庫
C:HBase對事務的支持較差
D:HBase是非關系型數(shù)據庫
答案:HBase不需要考慮讀寫性能
下面說法錯誤的是()。
A:HBase的一個表中可以有多個列族
B:HBase表的一個列族可以包含多個列
C:HBase一個RegionServer服務器中可以有多個Region
D:一個HBase集群中只能有一個RegionServer
答案:一個HBase集群中只能有一個RegionServer
下面哪項關于HBase的常用命令的描述是錯誤的()。
A:HBase使用scan命令時可以指定掃描區(qū)間
B:HBase要查看表可以使用list_namespace
C:HBase一張正在使用的表可以直接使用drop命令刪除
D:HBase全表掃描使用get命令
答案:HBase要查看表可以使用list_namespace
;HBase一張正在使用的表可以直接使用dro
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 名牌轎車買賣合同
- 居間合同咨詢服務合同
- 關于推進數(shù)字化轉型的討論
- 個人雙包裝修合同7篇
- 2025年白城貨運資格證考試口訣
- 兼職合同合作協(xié)議
- 2025年長春貨運從業(yè)資格證考試模擬考試題目答案
- 合伙共同經營賓館合同8篇
- 個人房屋抵押借款服務合同5篇
- 新編信托借款合同5篇
- 古詩文教學方法創(chuàng)新研究
- 商場扶梯安全培訓
- 開封市第一屆職業(yè)技能大賽美容項目技術文件(世賽項目)
- 《全科醫(yī)學概論》課件-以家庭為單位的健康照顧
- 自來水廠安全施工組織設計
- 川教版2024-2025學年六年級下冊信息技術全冊教案
- KTV商務禮儀培訓
- 2024年《論教育》全文課件
- 計算機網絡與信息安全(2024年版)課件 李全龍 第1-4章計算機網絡與信息安全概述-網絡層服務與協(xié)議
- 人工智能教育背景下中小學教師智能教育素養(yǎng)提升路徑研究
- 必考古詩賞析知識點(九年級下冊)-2025年中考語文一輪復習
評論
0/150
提交評論