Hadoop大數據技術與項目實戰(zhàn)知到智慧樹章節(jié)測試課后答案2024年秋山西職業(yè)技術學院_第1頁
Hadoop大數據技術與項目實戰(zhàn)知到智慧樹章節(jié)測試課后答案2024年秋山西職業(yè)技術學院_第2頁
Hadoop大數據技術與項目實戰(zhàn)知到智慧樹章節(jié)測試課后答案2024年秋山西職業(yè)技術學院_第3頁
Hadoop大數據技術與項目實戰(zhàn)知到智慧樹章節(jié)測試課后答案2024年秋山西職業(yè)技術學院_第4頁
免費預覽已結束,剩余5頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Hadoop大數據技術與項目實戰(zhàn)知到智慧樹章節(jié)測試課后答案2024年秋山西職業(yè)技術學院緒論單元測試

下列對大數據的特點描述不正確的是()

A:速度要求快B:數據體量巨大C:數據類型多樣D:價值密度高

答案:價值密度高

第一章單元測試

云主機和物理機的壽命都是永久性的。()

A:錯B:對

答案:錯對于實時性要求高的應用,需要應用實時處理架構。()

A:錯B:對

答案:對數據倉庫是用來存儲數據的而不是分析數據的。()

A:對B:錯

答案:錯在DWS層中,用戶行為日志數據分為公共字段和事件字段。()

A:錯B:對

答案:對項目實施流程中沒有哪一步()

A:下載數據B:數據導出C:數據訪問D:數據倉庫設計開發(fā)

答案:下載數據數據分析在企業(yè)中的作用()

A:直接的獲取經營的利潤B:幫助企業(yè)經營者減少投入C:幫助企業(yè)經營者平衡企業(yè)的收益D:干預經營者的決策

答案:直接的獲取經營的利潤數據結構中哪項不是頁面入口的來源()

A:應用首頁B:pushC:詳情頁D:登錄頁

答案:登錄頁Hadoop的三大發(fā)行版本是()

A:ApacheB:HDPC:CDHD:Java

答案:Apache;HDP;CDH流量分析常見指標有哪些方面()

A:來源分析B:受訪分析C:轉化路徑分析D:訪客分析

答案:來源分析;受訪分析;轉化路徑分析;訪客分析網站流量數據分析的意義有哪些()

A:幫助網站運營人員獲取網站流量信息B:提升網站用戶體驗C:幫助提高網站流量D:從多方面提供網站分析的數據依據

答案:幫助網站運營人員獲取網站流量信息;提升網站用戶體驗;幫助提高網站流量;從多方面提供網站分析的數據依據

第二章單元測試

Hadoop是一種分布式系統基礎架構,主要解決海量數據存儲和海量數據計算兩大問題。()

A:對B:錯

答案:對在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()

A:對B:錯

答案:對在Hadoop分布式集群中,不需要對集群中的每一個節(jié)點都進行ip規(guī)劃。()

A:對B:錯

答案:錯利用HDFS操作命令可以將數據文件從本地上傳到HDFS上,也可以將數據文件從HDFS下載到本地。()

A:錯B:對

答案:對在HDFSAPI操作中,closeFileSystem方法的功能是釋放文件系統對象的資源。()

A:錯B:對

答案:對MapReduce詞頻統計案例中,執(zhí)行map任務的最后階段,會將緩沖區(qū)的數據全部寫入到磁盤。()

A:對B:錯

答案:對Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系統,可用于海量日志采集、聚合和傳輸。()

A:對B:錯

答案:對能在網絡中安全傳輸文件的軟件是()。

A:VMwareB:XshellC:IDEAD:Xftp

答案:Xftp創(chuàng)建了bigdata用戶的命令是()。

A:useraddbigdataB:bigdataALLC:SudoersD:subigdata

答案:useraddbigdata論文(),主要論證的核心是如何采用分布式的架構對海量數據進行分布式計算。

A:MapReduceB:HDFSC:BigTableD:GFS

答案:MapReduce假如我們設定HDFS塊的大小是128M,那么,一個大小為500M的數據文件,將會被拆分成()個分片

A:4B:2C:5D:3

答案:4在Linux命令行中,使用()命令格式化hive元數據庫

A:delB:schematoolC:formatD:clear

答案:schematool在Hive中給表添加數據,使用()方式給表添加數據效率更高。

A:LoadB:insertintoC:appendD:Add

答案:Load關系型數據庫與HDFS之間相互數據遷移的工具是()。

A:fastcopyB:distcpC:sqoopD:fsck

答案:sqoopNotepad++功能有()。

A:語法高亮度顯示、語法折疊功能、支持宏、擴充基本功能的外掛模組B:制作一般的純文字說明文件C:可以連接虛擬機,對虛擬機中的文件進行編輯。D:編寫計算機程序代碼

答案:語法高亮度顯示、語法折疊功能、支持宏、擴充基本功能的外掛模組;制作一般的純文字說明文件;可以連接虛擬機,對虛擬機中的文件進行編輯。;編寫計算機程序代碼Hadoop主要包含()三大功能組件。

A:HDFSB:YARNC:MapReduceD:Hadoop

答案:HDFS;YARN;MapReduceHadoop具有()優(yōu)勢。

A:高容錯性B:高擴展性C:高可靠性D:高效性

答案:高容錯性;高擴展性;高可靠性;高效性下面說法正確的是()。

A:Java編程的核心就是JVM,JVM是JRE的一部分,它是一個虛擬出來的計算機。B:JDK是Java語言的開發(fā)環(huán)境C:JDK包含JRE和JVMD:JRE是java運行時的類庫

答案:Java編程的核心就是JVM,JVM是JRE的一部分,它是一個虛擬出來的計算機。;JDK是Java語言的開發(fā)環(huán)境;JDK包含JRE和JVM;JRE是java運行時的類庫在分布式文件系統HDFS當中提供了兩種操作命令,是()。

A:hadoopfsB:HadoopdfsC:hdfsfsD:hdfsdfs

答案:hadoopfs;hdfsdfsHive是基于Hadoop技術的數據倉庫工具,用來對數據進行()。

A:加載B:分析C:轉化D:提取

答案:加載;分析;轉化;提取使用beeline客戶端遠程訪問Hive之前,需要啟動的兩個服務是()。

A:hive--servicehiveserverB:hive--servicehiveserver2C:hive--servicemetastoreD:hive--servermetastore

答案:hive--servicehiveserver2;hive--servermetastoreHive的復雜數據類型有()三種

A:CharB:MAPC:STRUCTD:ARRAY

答案:MAP;STRUCT;ARRAY成功安裝Zookeeper集群后,查看各節(jié)點的角色信息時,會看到1個、多個()。

A:zkServerB:zookeeperC:followerD:leader

答案:follower;leaderKafka是一種高吞吐量的分布式發(fā)布訂閱消息系統,是Apache基金會開源的消息隊列,該框架由()編寫而成。

A:JavaB:PythonC:ScalaD:C++

答案:Java;Scala

第三章單元測試

業(yè)務字段指的是每個移動端固定的、共有的字段;公共字段代表的是用戶在app中執(zhí)行過的所有操作。()

A:錯B:對

答案:錯在Flume過程中,Flume對接本地磁盤文件,通過tailDir類型實時監(jiān)控當前數據文件中數據內容的變化。()

A:錯B:對

答案:對ETL攔截器主要用于過濾時間戳不合法和json數據不完整的日志。()

A:對B:錯

答案:對Flume分流標記攔截器主要是用于區(qū)分啟動日志和事件日志。()

A:對B:錯

答案:對以下關于Flume的說法正確的是____。()

A:Channel是Flume數據傳輸的基本單元B:Event是Flume數據傳輸的基本單元C:Source是Flume數據傳輸的基本單元D:Sink是Flume數據傳輸的基本單元

答案:Event是Flume數據傳輸的基本單元Flume通過內部的采集數據傳輸機制進行快速的數據傳輸,傳輸完之后會將數據就存儲到____中。()

A:ChannelB:SourceC:KafkaD:HDFS

答案:Kafka可以使用____命令,啟動Kafka的一個消費者。()。

A:kafka-topics.shB:kafka-console-producer.shC:kafka-server-start.shD:kafka-console-consumer.sh

答案:kafka-console-consumer.sh在Flume消費的整體流程中,第一部分是別名配置,在別名配置的過程當中,配置了兩個數據流用來處理()。

A:ETL和分流標記攔截器B:Flume環(huán)境變量C:啟動日志數據和事件日志數據D:Flume數據消費腳本

答案:啟動日志數據和事件日志數據在Flume數據傳輸的過程中,當source將數據傳遞給channel時,數據會先后經過()兩個攔截器。

A:UUID攔截器B:時間戳攔截器C:Flume分流標記攔截器D:ETL攔截器

答案:Flume分流標記攔截器;ETL攔截器Flume的安裝與部署可以分為下列哪三個步驟()。

A:啟動Flume數據消費腳本B:在Flume的配置文件中修改指定配置C:解壓到指定目錄,進行環(huán)境變量的配置D:將Flume安裝包上傳至Linux操作系統

答案:在Flume的配置文件中修改指定配置;解壓到指定目錄,進行環(huán)境變量的配置;將Flume安裝包上傳至Linux操作系統

第四章單元測試

在數據倉庫中,ODS層的作用是保持數據原貌,不做任何修改,起到備份數據的作用()

A:錯B:對

答案:對在數據倉庫中,DWD層的作用是對數據進行清洗()

A:錯B:對

答案:對在ADS層中,通過在啟動日志中統計不同設備ID出現的次數來分析用戶活躍?()

A:錯B:對

答案:對在ADS層中,按照設備ID對日活表分組,登錄次數為1,且在一周前登錄的這種分析方式,分析沉默用戶?()

A:對B:錯

答案:對DWS層統計各個主題對象的當天行為,服務于DWT層的主題寬表。DWS層的寬表字段,是站在不同維度的角度去看事實表,重點關注事實表的度量值,通過與之關聯的事實表,獲得不同的事實表的度量值()

A:對B:錯

答案:對在數據倉庫項目中,我們在DWD層使用()手段清洗數據

A:PythonB:KettleC:SQLD:RDD

答案:SQL在數據倉庫中,用于數據清洗的是哪個層()

A:DWSB:ODSC:DWDD:DWT

答案:DWD數據倉庫一般分為()

A:ODSB:DWSC:ADSD:DWDE:DWT

答案:ODS;DWS;ADS;DWD;DWT在數據倉庫DWD層中,需要清洗哪些數據()

A:空值的去除B:將用戶行為寬表和業(yè)務表進行數據一致處理C:創(chuàng)建分區(qū)表D:過濾核心字段

答案:空值的去除;將用戶行為寬表和業(yè)務表進行數據一致處理;過濾核心字段在數據倉庫中,ODS層做了什么業(yè)務()

A:空去除B:保持數據原貌C:創(chuàng)建分區(qū)表D:采用LZO壓縮

答案:保持數據原貌;創(chuàng)建分區(qū)表;采用LZO壓縮

第五章單元測試

MySQL中,用于創(chuàng)建數據庫的命令是()。

A:createtable數據庫名;B:createdatabase數據庫名;C:use數據庫名;D:dropdatabase數據庫名;

答案:createdatabase數據庫名;使用sqoop進行從Hive到MySQL數據庫的數據遷移時,其命令為()。

A:sqoopimportB:sqoopjobC:sqoopmergeD:sqoopexport

答案:sqoopexportpyecharts中,柱狀圖類是()。

A:LiquidB:LineC:BarD:Pie

答案:Barpyecharts中,餅圖類是()。

A:BarB:LineC:LiquidD:Pie

答案:Pie全局配置項可通過()方法設置。

A:reversal_axisB:add_yaxisC:set_series_optsD:set_global_opts

答案:set_global_opts使用pyecharts工具繪圖時,可直接進行圖表的繪制,無需在程序中導入對應的圖表類。()

A:錯B:對

答案:錯使用pyecharts工具繪圖時,可以通過設置初始化配置項中的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論