![大數(shù)據(jù)技術與應用智慧樹知到期末考試答案章節(jié)答案2024年咸陽職業(yè)技術學院_第1頁](http://file4.renrendoc.com/view12/M02/1E/12/wKhkGWakms2AG5YYAAID3SercDs664.jpg)
![大數(shù)據(jù)技術與應用智慧樹知到期末考試答案章節(jié)答案2024年咸陽職業(yè)技術學院_第2頁](http://file4.renrendoc.com/view12/M02/1E/12/wKhkGWakms2AG5YYAAID3SercDs6642.jpg)
![大數(shù)據(jù)技術與應用智慧樹知到期末考試答案章節(jié)答案2024年咸陽職業(yè)技術學院_第3頁](http://file4.renrendoc.com/view12/M02/1E/12/wKhkGWakms2AG5YYAAID3SercDs6643.jpg)
![大數(shù)據(jù)技術與應用智慧樹知到期末考試答案章節(jié)答案2024年咸陽職業(yè)技術學院_第4頁](http://file4.renrendoc.com/view12/M02/1E/12/wKhkGWakms2AG5YYAAID3SercDs6644.jpg)
![大數(shù)據(jù)技術與應用智慧樹知到期末考試答案章節(jié)答案2024年咸陽職業(yè)技術學院_第5頁](http://file4.renrendoc.com/view12/M02/1E/12/wKhkGWakms2AG5YYAAID3SercDs6645.jpg)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
大數(shù)據(jù)技術與應用智慧樹知到期末考試答案+章節(jié)答案2024年咸陽職業(yè)技術學院克服MapReduce在迭代式計算和交互式計算方面的不足。()
答案:對Sqoop常用命令import是將數(shù)據(jù)導出。()
答案:錯Flumeagent承載了三大組件Source、Channel、Sink。()
答案:對生效環(huán)境變量的命令是:source/etc/profile。()
答案:對下載Hadoop的官網(wǎng)是/。()
答案:錯hadoopdfsadmin–report命令用于檢測HDFS損壞塊。()
答案:錯DataNode是文件存儲的基本單元,它將Block存儲在本地文件系統(tǒng)中,保存了Block的Meta-data,同時周期性地將所有存在的Block信息發(fā)送給NameNode。NameNode返回文件存儲的DataNode的信息。()
答案:對Channel不可以連接Source和Sink的組件。()
答案:錯最早提出“大數(shù)據(jù)”時代到來的是全球知名公司谷歌()
答案:錯HiveServer將用戶提交的HL語句進行編譯,解析成對應的Yarn任務、Spak任務或者HDFS操作,從而完成數(shù)據(jù)的提取、轉換、分析。()
答案:對Hadoop環(huán)境變量中的HADOOP_HEAPSIZE用于設置所有Hadoop守護線程的內(nèi)存。它默認是200GB。()
答案:錯Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次運行的task都要從3個有副本的機器上傳輸需要處理的文件段。()
答案:錯傳統(tǒng)的數(shù)據(jù)倉庫無法有效處理不同類型的數(shù)據(jù)。(
)
答案:對Hadoop完全分布模式配置免密登錄是要?()
答案:主節(jié)點和從節(jié)點任意兩個節(jié)點之間免密登錄下面哪個目錄保存了Hadoop集群的命令(比如啟動Hadoop)?()
答案:sbinHBase的訪問方式有很多,如下的訪問方式中,哪一種是支持直接命令行方式訪問()
答案:HbaseShell并行數(shù)據(jù)處理框架MapReduce是()公司在大數(shù)據(jù)領域的重要貢獻。
答案:谷歌下列關于傳統(tǒng)并行計算框架(比如MPI)和MapReduce并行計算框架比較正確的是:()
答案:前者是共享式(共享內(nèi)存/共享存儲),容錯性差,后者是非共享式的,容錯性好()是一個處理、存儲和分析海量的分布式、非結構化數(shù)據(jù)的開源框架。
答案:Hadoop下列對HBase的理解正確的是:()
答案:HBase是針對谷歌BigTable的開源實現(xiàn)下列關于計算機存儲容量單位的說法中,錯誤的是()。
答案:一個漢字需要一個字節(jié)的存儲空間關于Hbase的數(shù)據(jù)模型敘述中,正確的是()
答案:Hbase表中的單元由行Key,列族名,列限定符和時間戳共同唯一確定端口50090默認是Hadoop哪個服務的端口?()
答案:SecondaryNameNodeHive是由哪家公司開源的(
)。
答案:Facebook在ZooKeeper和YARN的協(xié)同工作中,當ActiveResourceManager產(chǎn)生故障時,StandbyResourceManager會從以下哪個目錄中獲取Application相關信息()
答案:Statestore(正確答案)()指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態(tài)以及相互關系等進行記載的物理符號或這些物理符號的組合。
答案:數(shù)據(jù).下面關于Hivemetastore的三種模式的描述錯誤的是(
)。
答案:Derby方式在同一時間只能有多個進程連接使用數(shù)據(jù)庫HDFS為海量的數(shù)據(jù)提供了存儲,而MapReduce為海量的數(shù)據(jù)提供了計算。()
答案:對Sqoop對于數(shù)據(jù)的導入、導出都是通過MapReduce作業(yè)實現(xiàn)的。()
答案:對SecureCRT是一款世界一流的終端仿真程序,終端仿真其實就是用于與遠程主機(計算機)進行通信。()
答案:對HBase是一個構建在HDFS上的分布式列存儲系統(tǒng)。()
答案:對mysql到hdfs通過sqoop進行數(shù)據(jù)傳輸分兩種,一是只支持新增不支持更新、二是可以修改和新增。()
答案:對集群的目的是為了節(jié)省成本,用廉價的pc機,取代小型機及大型機。()
答案:對Source組件只能處理單一類型格式的日志數(shù)據(jù)。()
答案:錯MapReduce的核心理念是數(shù)據(jù)向計算靠攏。()
答案:錯Flume具有高可靠性、高容錯性,并且是可升級的、易管理的、可定制的。()
答案:對Sqoop常用命令exportt是將數(shù)據(jù)導出。()
答案:對大數(shù)據(jù)的核心就是(),大數(shù)據(jù)能夠預測體現(xiàn)在很多方面。
答案:預測Hadoop平臺中啟用YARN組件的日志聚集功能,需要配置哪個參數(shù)()
答案:yarn.log-aggregation-enable(正確答案)在HBase數(shù)據(jù)庫中,每個Region的建議最佳大小是:()
答案:1GB-2GB解壓JDK軟件jdk-linux-x64.tar.gz的正確命令是()
答案:tar-xzvfjdk-linux-x64.tar.gz查看IP地址的命令錯誤的為:()
答案:startnetwork下面關于Hive和傳統(tǒng)數(shù)據(jù)庫的比較描述正確的是(
)。
答案:Hive的針對數(shù)據(jù)倉庫設計,針對的是讀多寫少的場景下列說法錯誤的是:()
答案:Hadoop框架是用Java實現(xiàn)的,MapReduce應用程序則一定要用Java來寫下面關于Hive各個格式使用場景描述錯誤的是(
)。
答案:目前Parquet默認使用gzip壓縮格式Flume是Cloudera提供的一個分布式、高可靠的、高可用的海量日志收集、聚合和傳輸系統(tǒng)。()
答案:對FlumeSource可以監(jiān)聽一個或者多個網(wǎng)絡端口,也可以從本地文件系統(tǒng)讀取數(shù)據(jù)。()
答案:對傳統(tǒng)的數(shù)據(jù)倉庫可以滿足快速增長的海量數(shù)據(jù)存儲需求。(
)
答案:錯Flume不具有高擴展性,而且不容易地被水平擴展。()
答案:錯在hive中下列哪些命令可以實現(xiàn)去重(
)。
答案:groupby;row_number;distinct互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,是一個從信息找人,到人找信息的過程。()
答案:錯下面關于Hive數(shù)據(jù)裝載描述正確的是(
)。
答案:什么場景,裝載數(shù)據(jù)使用LOADDATA效率最低并行數(shù)據(jù)處理技術MapReduce是由哪家公司最先提出的()
答案:谷歌公司下面關于Hive外表table1的數(shù)據(jù)刪除描述正確的是(
)。
答案:ALTERtable1SETTBLPROPERTIES('EXTERNAL'='FALSE');DROPTABLEtable1;Flume采用了三層架構,分別為agent,collector和storage,每一層均可以水平擴展。()
答案:對Sqoop不可以高效的可控的利用資源,比如它可以通過調整任務數(shù),來控制任務的并發(fā)度,另外還可以配置數(shù)據(jù)庫的訪問時間等等。()
答案:錯YARN調度器分配資源的順序,下面哪一個描述是正確的()
答案:本地資源->同機架->任意機器(正確答案)停止Hadoop進程正確的命令是()。
答案:stop-all.shHive是為了解決哪類問題(
)。
答案:海量結構化日志的數(shù)據(jù)統(tǒng)計HDfS中的block默認保存幾份?()
答案:3份下列有關大數(shù)據(jù)的典型應用,說法錯誤的是()
答案:大數(shù)據(jù)的應用只能讓我們了解事物的現(xiàn)狀,不能預測未來測試Sqoop安裝是否成功,輸入sqoopversion命令之后,系統(tǒng)不會提示Sqoop版本相關信息。()
答案:錯今天,大數(shù)據(jù)已經(jīng)廣泛應用于各個行業(yè)中。例如,金融、汽車、餐飲、電信、能源、體育和娛樂等社會各行各業(yè)都已經(jīng)融入了大數(shù)據(jù)的印跡。()
答案:對Sqoop啟動MapReduce作業(yè),MapReduce中主要是對輸入類InputFormat和輸出類OutputFormat進行定制。()
答案:對Flume于2019年被捐贈給apache軟件基金會,成為Hadoop相關組件之一。()
答案:錯Flume的核心是FlumeAgent。()
答案:對大數(shù)據(jù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。()
答案:對Sqoop常用命令help是打印Sqoop幫助信息。()
答案:對Sqoop底層用MapReduce程序實現(xiàn)數(shù)據(jù)的抽取、轉換、加載。()
答案:對MapReduce是基于內(nèi)存計算機。()
答案:錯HBase的分布式存儲的最基本單元是Region。()
答案:對虛擬機是一個相對獨立的環(huán)境,在這個環(huán)境里,可以安裝各個版本的Windows系統(tǒng)。也可以根據(jù)環(huán)境自己調節(jié)環(huán)境的配置,像一般電腦一樣開機。()
答案:對BlockSize是不可以修改的。()
答案:錯rhadoop是用R語言開發(fā)的,MapReduce是一個框架,可以理解是一種思想,可以使用其他語言開發(fā)。()
答案:對Flume具有基于流動數(shù)據(jù)流的簡單靈活的體系結構,具有可調整的可靠性機制以及許多故障轉移和恢復機制,具有強大的功能和容錯能力。()
答案:對添加了一個新的標識符ClusterID用于標識集群中所有的節(jié)點。當格式化一個Namenode,需要提供這個標識符或者自動生成。這個ID可以被用來格式化加入集群的其他Namenode。()
答案:對Flume支持多種接入資源數(shù)據(jù)的類型以及接出數(shù)據(jù)類型。()
答案:對通常是集群的最主要瓶頸是D磁盤。()
答案:錯hadoop大數(shù)據(jù)的兩大核心技術是()
答案:HDFS;MapReduceHive是采用批處理的方式處理海量數(shù)據(jù)。(
)
答案:對FlumeSource是負責接收數(shù)據(jù)到FlumeAgent的組件,接收外部源(如Web服務器)傳遞給它的事件,外部數(shù)據(jù)源以目標FlumeSource可以識別的格式將事件發(fā)送到FlumeSource。()
答案:對YARN中,slave節(jié)點負責以下哪些工作()
答案:監(jiān)督Container的生命周期管理HIVE與傳統(tǒng)SQL數(shù)據(jù)庫對比,下面描述不正確的是(
)。
答案:最終執(zhí)行者:HIVE使用MapReduce和Excutor執(zhí)行,傳統(tǒng)SQL數(shù)據(jù)庫使用Excutor執(zhí)行器下列關于對大數(shù)據(jù)特點的說法中,錯誤的是()。
答案:數(shù)據(jù)價值密度高有關HBase的敘述,正確的是()
答案:提供了簡單的基于Key的查詢方法下列哪個屬性是hdfs—site。xml中的配置?()
答案:dfs.replicationHadoop中,如果將yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent設置為50,下面說法錯誤的是()
答案:QueueA中的每個用戶最多只能獲得50%的資源。(正確答案)下列哪項通常是集群的最主要瓶頸()。
答案:磁盤HBase三層結構的順序是:()
答案:Zookeeper文件,-ROOT-表,.MEATA.表下列對HBase數(shù)據(jù)模型的描述錯誤的是:()
答案:HBase中執(zhí)行更新操作時,會刪除數(shù)據(jù)舊的版本,并生成一個新的版本關于Hadoop單機模式和偽分布式模式的說法,正確的是()
答案:后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況訪問HBase表中的行,有哪些方式:()
答案:全表掃描MapReduce是一種編程模型,用戶只需通過編寫()函數(shù)來實現(xiàn)自己的計算邏輯。
答案:map+reduce()擅長處理和分析大量分布式的非結構化數(shù)據(jù),以分批的方式進行歷史分析。
答案:HadoopHadoop平臺中,要查看YARN服務中一個application的信息,通常需要使用什么命令()
答案:application大數(shù)據(jù)時代,數(shù)據(jù)使用的關鍵是()。
答案:數(shù)據(jù)再利用Sqoop軟件能夠實現(xiàn)關系數(shù)據(jù)庫和HDFS數(shù)據(jù)之間的傳輸,在數(shù)據(jù)導入、導出時都要生成相應的()作業(yè),提高工作性能。
答案:MapReduce下面中不屬于HIVE中的元數(shù)據(jù)信息(
)。
答案:表的屬性(只存儲內(nèi)部表信息)MapReduce是一種并行式的計算模型,用于大規(guī)模數(shù)據(jù)集,通常是大于()的并行計算。
答案:1TBSqoop導入數(shù)據(jù):MySQL,Oracle導入數(shù)據(jù)到Hadoop的HDFS、HIVE、HBASE等數(shù)據(jù)存儲系統(tǒng)。()
答案:對Sqoop就是一個工具,需要在兩個以上節(jié)點上進行安裝即可。()
答案:錯Sqoop核心的功能有導入或遷入、導出或遷出。()
答案:對Sqoop不能自動地完成數(shù)據(jù)類型的映射與轉換。()
答案:錯Sqoop是apache旗下一款“Hadoop和關系數(shù)據(jù)庫服務器之間傳送數(shù)據(jù)”的工具。()
答案:對Flume可以將應用產(chǎn)生的數(shù)據(jù)存儲到任何集中存儲器中,比如HDFS,HBase。()
答案:對Flume的管道是基于事務,保證了數(shù)據(jù)在傳送和接收時的一致性。()
答案:對Flume是可靠的,容錯性高的,可升級的,易管理的,并且不可以定制。()
答案:錯實時性,F(xiàn)lume有一個好處可以實時的將分析數(shù)據(jù)并將數(shù)據(jù)保存在數(shù)據(jù)庫或者其他系統(tǒng)中。()
答案:對Flume的配置很繁瑣,source,channel,sink的關系在配置文件里面交織在一起,便于管理。()
答案:錯Hive有四個驅動器,下面那個不是()。
答案:策略器(Strategyimplement)Hive有什么好處()。
答案:可以通過語句自動編譯mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)Hive的元數(shù)據(jù)存儲在derby和MySQL中有什么區(qū)別()。
答案:多會話(Moresession)下列關于Hive特點總結正確的選項是()。
答案:Hive支持自定義函數(shù),用戶可以根據(jù)自己的需求去定義函數(shù)下列哪個組件不屬于Hive架構()
答案:TaskManagerHBase的每個列族均對應了一個()屬性。
答案:時間戳()是一個實時收集、分析、展示、監(jiān)控數(shù)據(jù)的分布式數(shù)據(jù)庫,它基于HBase存儲和查詢監(jiān)控數(shù)據(jù)。
答案:OpenTSDB在水平方向,HBase的一張表由一個或多個()組成。
答案:列族HBase每個行有一個()唯一標識了行的地址。
答案:行鍵在垂直方向,HBase的一張表有多個()來組成。
答案:行族谷歌公司關于MapReduce模型的論文發(fā)布于()年
答案:2004大數(shù)據(jù)的開發(fā)和利用,關鍵在于大數(shù)據(jù)技術的支撐。其中,MapReduce是分布式數(shù)據(jù)庫。()
答案:錯適合MapReduce框架處理的任何和數(shù)據(jù)集要求待處理的數(shù)據(jù)集可以分解為許多小的數(shù)據(jù)子集,而且每個數(shù)據(jù)子集的處理不依賴也不影響其他數(shù)據(jù)子集的處理。()
答案:對下列關于MapReduce模型的說法錯誤的是()
答案:MapReduce模型是一種理論模型,無法實現(xiàn)以下關于yarn的描述正確的是:()
答案:支持多個框架,yarn不再是一個單純的計算框架,而是一個框架管理器。以下關于yarn的說法正確的是:()
答案:Yarn是采用兩級式資源分配方案對新一代資源管理調度框架YARN的理解正確的是:()
答案:YARN可以實現(xiàn)“一個集群多個框架”,即在一個集群上部署一個統(tǒng)一的資源調度管理框架Yarn附則整個集群的資源管理功能,每個任務都單獨有一個“應用服務器”:()
答案:對Yarn各模塊組成有:()
答案:Resourcemanager、nodemanager、applicationMasterHadoop環(huán)境變量中的HADOOP_HEAPSIZE用于設置所有Hadoop守護線程的內(nèi)存。它默認是()。
答案:1000M配置機架感知的下面哪項正確:()
答案:如果一個機架出問題,不會影響數(shù)據(jù)讀寫;MapReduce會根據(jù)機架獲取離自己比較近的網(wǎng)絡數(shù)據(jù);寫入數(shù)據(jù)的時候會寫到不同機架的DataNode中如果NameNode意外終止,SecondaryNameNode會接替它使集群
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年岳陽貨運從業(yè)資格考試
- 2025年晉城貨運資格證考試有哪些項目
- 2025年南京貨運資格考試答案
- 2025年天津貨運從業(yè)資格證考試題技巧答案詳解
- 電梯維護保養(yǎng)合同(2篇)
- 電力用戶協(xié)議(2篇)
- 2025年市婦聯(lián)執(zhí)委會議上的工作報告
- 浙教版數(shù)學七年級上冊2.5《有理數(shù)的乘方》聽評課記錄1
- 徐州報關委托協(xié)議
- 幼兒園后勤總務工作計劃范本
- 暑期預習高一生物必修二知識點
- 醫(yī)院人體器官捐獻及獲取流程
- 結腸造瘺還納手術配合
- 2024年云南省中考物理真題含解析
- 2025年中國艾草行業(yè)市場現(xiàn)狀、發(fā)展概況、未來前景分析報告
- (閩教版)六年級下英語教學計劃
- 人教版英語高考試卷與參考答案(2024年)
- 河砂、碎石生產(chǎn)質量保證措施方案
- 三位數(shù)除以兩位數(shù)過關練習口算題大全附答案
- 紅樓夢服飾文化
- 湖北省2024年村干部定向考試真題
評論
0/150
提交評論