系統(tǒng)集成繼續(xù)教育hadoop_第1頁
系統(tǒng)集成繼續(xù)教育hadoop_第2頁
系統(tǒng)集成繼續(xù)教育hadoop_第3頁
系統(tǒng)集成繼續(xù)教育hadoop_第4頁
系統(tǒng)集成繼續(xù)教育hadoop_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1、關(guān)于capacity schedule,說法正確的是A由yahoo!開源的共享集群調(diào)度器B每個隊列內(nèi)部采用1FIFO調(diào)度策略C只能配置一個隊列D可限制每個用戶使用資源量2、部署hadoop時,需要在系統(tǒng)中心創(chuàng)建哪些屬于hadoop組的用戶A hdfsB mapred C mysqld D daemon3、關(guān)于main函數(shù)編寫,說話正確的是A每個應(yīng)用程序?qū)?yīng)一個main函數(shù)B main函數(shù)中需設(shè)置mapper和reducer的實現(xiàn)類C Main函數(shù)中需指定輸出數(shù)據(jù)的類型D main函數(shù)中需指定輸入輸出目錄的位置4、關(guān)于hadoop設(shè)置ssh免密碼登錄,下列說話錯誤的是?A在分布式模式下,啟動

2、所有服務(wù)的,必須設(shè)置免密碼陸B(tài)免密碼登陸可以設(shè)置,也可以不設(shè)置C設(shè)置免密碼登錄是為了在一個節(jié)點上可通過sh啟用所有節(jié)點上的服務(wù)D設(shè)置ssh免密碼登陸是為了讓各個服務(wù)之間正常通信5、編寫一個簡單的mapreduce程序,通常需要實現(xiàn)哪些模塊?A mapper B reducer C main 函數(shù)6、安裝hadoop之前的準備工作有哪些?A準備Linux系統(tǒng)B安裝jdk C、設(shè)置環(huán)境變量D準備hadoop源代碼7、關(guān)于mapreduce任務(wù)調(diào)度器,說法正確的是?A它的基本作用是根據(jù)節(jié)點資源使用情況和作業(yè)的要求將人物調(diào)度到各個節(jié)點上執(zhí)彷他是不可插 拔的,只有一個C他需要考慮的因素很多,包括作業(yè)優(yōu)先

3、級、作業(yè)提交時間等hadoop提供了多種 任務(wù)調(diào)度器8、hadoop生態(tài)系統(tǒng)中大量使用了哪些網(wǎng)絡(luò)接口做為PC和IPC?Aavro BCD9、關(guān)于dfs.replication參數(shù),說法正確的是A表示hdfs中的文件副本數(shù)B默認情況下,參數(shù)值為3C、偽分布模式下,必須調(diào)整為1 D分布模式下,可以調(diào)整大于1的值10、關(guān)于hadoopsteraming程序的測試,說法正確的是?A直接通過linux piper方式調(diào)試B不同語言編寫的程序,調(diào)試方式,基本一致不同語言編寫的程序,調(diào) 試方式完全不同D以上均不正確1、Hadoop及其生態(tài)系統(tǒng),可以部署在?A Linux B OS/2 C DOS D UNI

4、X 正確答案 AD2、下列關(guān)于Hive說法正確的是?A使用HQL作為查詢接口。B使用HDFS作為底層存儲。C使用MapRed作為執(zhí)行層。D以上說法都正確。正確答案ABCD3、下列關(guān)于合并小文件說法有誤的是?A會給HDFS帶來壓力B不會影響處理效率 C通過合并Map和Reduce的結(jié)果文件來消除影響。D會對電腦系統(tǒng)造成損壞。正確答案ACD4、下列描述中符合Map/Reduce勺是?Map是將數(shù)據(jù)映射成Key/Value再交給ReduceReduce先運行然后運彳亍MapMap/Reduce是函數(shù)式的設(shè)計思想Map結(jié)束后,Partitione會將相同Key分到同一個組交給Reduce進程正確答案A

5、CD5、以下軟件中,哪些是日志流的匯總工具?A FlumeNG B Scribe C Rsync D FTP 正確答案 AB6、Hadoop及其生態(tài)系統(tǒng),可以部署在A.Linux B.OS/2 C.DOSD.UNIX 正確 AD二單選題,1、ipv6要求鏈路層的最小mtu為多少字節(jié)?A 64 B、2、關(guān)于hadoopsteraming說法,錯誤的A支持多種語言編寫mapreduce程序B通過標準輸入輸出實現(xiàn)進程間通信C與,linux管道不通D非常適合處 理文本文件3、關(guān)于hadoop任務(wù)調(diào)度器配置,說法錯誤的是?A默認情況下,hadoop采用FIFO調(diào)度器B可以配置使用capacity sch

6、eduler或者fair schedule C使用參數(shù) maprdjobtrackertask scheduler指定使用的調(diào)度器D每個作業(yè),對應(yīng)一個獨立的任務(wù)調(diào)度器4、關(guān)于hadoopsteraming編程方式,說法錯誤的是A比hadoop java編程方式,更容易調(diào)試B僅用于開發(fā),mapper和reducer,其他組件需要采用java實C天生支持文本格式和二進制格式D通常用于簡單的文本數(shù)據(jù)處理,加快開發(fā)效率5、dfs.block.size -數(shù)據(jù)塊大小,默認是?A 16M B 32M C 64M D 128M 正確答案 C6、關(guān)于hadoop JVM說法錯誤是A默認情況下,同一個節(jié)點上,每

7、個任務(wù)運行在一個獨立白Jvm中B jvm重用可讓一個節(jié)點上同一個作業(yè)的同類任務(wù)共用一個vmC JVM重用會增加短作業(yè)運行延遲DJVM 重用可通過參數(shù)mapred.job.jvm.num.tasks設(shè)置7、參數(shù),pleted.map的作用是?A指定Map Task并發(fā)運行數(shù)目B指定Map Task啟動時機C指定Reduce Task啟動時機D指定作業(yè)啟動時機8、io.sort.record.percen嗦引空間所在比例,默認為A0.05 B0.0.1 C0.1 D0.59、hadoopsteraming編程時,如何將數(shù)據(jù)寫到HDFS上A使用標準輸出寫入8使用Socket寫入C使用文件讀寫API寫

8、入D使用HADOOP提供的API寫入10、Hadoop在默認情況下,會將數(shù)據(jù)切分成()大小的)lock。A4kb B8kb C32mb D64mb11、hadoop的計算框架來源哪家公司發(fā)布的論文B谷歌12、Bigtable論文是哪一年發(fā)表的?B200613、下列關(guān)于,Hive和sql描述正確的是A sql不支持索引Bhive支持數(shù)據(jù)更新,Csql擴展性好,Dhive執(zhí)行延遲高14、在組播通信流準備用于傳輸PV6網(wǎng)絡(luò)范圍中,范圍值1代表什么?A節(jié)點本地范圍B鏈路本地范圍C站點本地范圍D組織本地范圍15、hadoop標志物是,A大象16、hive server 重啟后A所有的元數(shù)據(jù)都會消失B部分

9、元數(shù)據(jù)會消失D所有受到元數(shù)據(jù)保存完整17、hadoop生態(tài)系統(tǒng)中用于數(shù)據(jù)挖掘,包含分類聚類等算法的軟件?ANoginx BAutomake CGcc DMahout18、配置hadoop時,linux系統(tǒng)SSH免密碼登錄是?A充分條件,有沒有都可以B必要條件,沒有無法安裝Hadoop C不充分條件D必要條件19、關(guān)于MapReduce基本架構(gòu),下面說法錯誤的是?A20、IETF選擇IPV6作為下一代協(xié)議后,世界范圍內(nèi)開展了多個PV6實驗項目,其中我國的IPV6實驗網(wǎng)是?D中國下一代互聯(lián)網(wǎng)CNGI)21、Hadoop的存儲框架叫什么? D HDFS22、IPV6首部和ipv4首部相比,移入擴展首

10、部的字段是?A首部長度B23、默認情況下map Task s失敗容忍度是多少?A1 B2 C3 D424、一個65M的文件而被切分成數(shù)據(jù)塊后,一備份將在linux系統(tǒng)中占用多少存儲空間?A65M B128M C256MD512M25、Hadoop采用何種存儲方式?A NAS B SAN C D26、下面哪個壓縮機制不隨Hadoop安裝包發(fā)布,?ALZO B SANPPY C ZIP D BZIP27、MAP過程中所使用的默認排序算法是?A歸并排序B桶排序C堆排序D快速排序28、HDFS負責控制分布式系統(tǒng)中的存儲服務(wù)器并保存元數(shù)據(jù)的主節(jié)點被稱為?A Chunkserver B Master C

11、Namenode D29、hadoop生態(tài)系統(tǒng)中,被作為工作流使用的軟件是?A Sqlite B Ncurses C Oozje D Curl30、關(guān)于Slot說法錯誤的是?A Slot不能再map task和reduce task間共享B Slot數(shù)目是靜態(tài)配置的,不能動態(tài)修改C可通過 參數(shù)mapred.tasktrackeimaximum配置map slot D每個節(jié)點上map slot數(shù)目必須一模一樣31、Partition之后所采用的排序算法是?A歸并排序B C D32、IPV4到IPV6的過渡技術(shù)不包括?A同時使用IPV6和IPV4 B IPV6路由協(xié)議C ipv6 over ipv

12、4隧道Ddns設(shè)施33、HADOOP生態(tài)系統(tǒng)中,被作為ETL使用的軟件?A Sqoop B Bigtop C Autoconf D Oracle34、關(guān)于PIG的主要操作正確的是?A load操作:循環(huán)指定數(shù)據(jù)集中的所有數(shù)據(jù)3 FOREACH操作:加載數(shù)據(jù)C D35、部署hadoop時,配置文件里的xml頂級標簽是?A BCD36、IPV6首部和IPV4首部相比,取消的字段是?A首部長度B服務(wù)類型C總長度D生存時間37、Reduce Task數(shù)目有哪個參數(shù)指定?A mapred.reduce.tasks B pleted.mapsC D38、關(guān)于Hadoop java編程方式,說法錯誤的是A比

13、hadoop steraming更容易調(diào)試B Hadoop最原始的編程方式C支持所有功能,是其他編程方式的基礎(chǔ)D相比于其他編程方式,運行效率通常更高39、某文件32M,默認情況下,存儲到HDFS上后,總共會占用多少存儲空間?A 32M B 64M C 128M D 96M1、BigTable對應(yīng)Apache開源項目中的?A Hive B Pig C Sqoop D HBase 正確答案 D2、Hadoop生態(tài)系統(tǒng)中,被作為 ETL使用的軟件是?A Sqoop B Bigtop C Autoconf D Oracle 正確答案 A3、Hadoop生態(tài)系統(tǒng)中,由Facebook開源,使用SQL語言

14、進行離線分析的軟件是?A PigB Pheonix C Shark D Hive 正確答案 D4、Hadoop是由何種語言編寫的?A Scala B Erlang C Java D Python 正確答案 C5、下列哪些服務(wù)是在安裝 Hadoop時需要臨時關(guān)閉?A Bluetoothd B Avahi C Fuse D Iptables 正確答案 D6、HBase內(nèi)置的分布式協(xié)同調(diào)度和鎖叫做?A Bookeeper B ZookeeperC Chubby D Kafka 正確答案 B7、當一個文件向HDFS上傳時,首先需要訪問的是?A Datanode B Namenode C Jobtrac

15、ker D SecondaryNamenode 正確答案 B8、通常來說一個map子進程對應(yīng)幾個數(shù)據(jù)塊?A 一個B二個C三個D更多正確答案 A9、文件上傳到HDFS時,文件切分成數(shù)據(jù)塊的工作是在?A Namenode 完成的 B Datanode 完成的 C client 完成的 D SecondaryNamenode 完成的正確答案C10、在執(zhí)行任務(wù)時,Jobtracker首先會訪問?A Datanode B Namenode C Tasktracker D SecondaryNamenode 正確答案 B11、Hive中所使用的查詢語言通常稱之為?A HQL B SQL C AQL D Q

16、ueryPlan 正確答案 A12、關(guān)于 ALTER TABLE page_view DROP PARTITI(dt=2008-08- 08,country=us。;下列說法 正確的是?A增加分區(qū)B刪除表C重命名表D修改字段正確答案B13、下列關(guān)于合并小文件說法正確的是?A會給HDFS帶來壓力B不會影響處理效率 C通過合并Map和Reduce的結(jié)果文件來消除影響。D會對電腦系統(tǒng)造成損壞。正確答案B14、Hive和sql對比下列正確的是?A Hive不支持索引B sql不支持數(shù)據(jù)更新C Hive擴展性好D sql執(zhí)行延遲高正確答案C15、Pig的主要操作-store操作A循環(huán)指定數(shù)據(jù)集中的所有數(shù)

17、據(jù)。B將制定數(shù)據(jù)集存儲至指定目錄。C聯(lián)合操作,和sql中的union功能一致。D join操作,和sql中的join功能一致。正確答案B16、配置Hadoop時,Linux系統(tǒng)SSH免密碼登陸是?A.充分條件,有沒有都可以B.必要條件,沒有無法安裝HadoopC.不充分條件。D.必要條件正確答案A17、Hadoop的存儲匡架叫十么?A. Lustre B.MooseFS C.MogileFS D.HDFS 正 D18、dfs.block.size -數(shù)據(jù)塊大小,默認是?A 16M B 32M C 64M D 128M 正確答案 C19、io.sort.record.percent 索引空間所在

18、比例,默認為()。A 0.05 B 0.01 C 0.1 D 0.5 正確答案 A20、Hadoop2.x的計算框架叫什么?A. Mpp B.Map/Reduce V2 C.ARM D.Spark21、部署Hadoop時,配置文件里的xml頂級標簽是?A. B. C. D.22、關(guān)于ContenValues類說法正確的是?正確AA.他和Hashtable比較類似,也是負責存儲一些名值對,但是他存儲的名值對當中的名是String類型,而值 都是基本類型。B.他和Hashtable比較類似,也是負責存儲一些名值對,但是他存儲的名值對當中的名是任 意類型,而值都是基本類型。他和Hashtable比較

19、類似,也是負責存儲一些名值對,但是他存儲的名值對當中的名,可以為空,而值都 是String類型。他和Hashtable比較類似,也是負責存儲一些名值對,但是他存儲的名值對當中的名是String類型,而值 也是String類型。23、Hadoop生態(tài)系統(tǒng)中用于數(shù)據(jù)挖掘包含分類聚類等算法的軟件是?A.Nginx B.Automake C.GCC D.Mahout 正確 D24、Hadoop及其生態(tài)系統(tǒng),不能部署在在?正確DA.Windows B.Linux C.Unix D.Os/225、在安裝部署Hadoop時,應(yīng)選用何種JDK或JRE?正確AA.OpenJDK B.SunJDK C.IBM JDK D.Diablo JDK26、Hadoop生態(tài)系統(tǒng)中,由Faceboo肝源,使用SQL語言進行離線分析的軟件是?A.Pig B.Pheonix C.SharD.Hive 正確 D27、Hadoop的存儲框架來源于哪家公司發(fā)布的論文?A.雅虎B.新浪C.谷歌D.百度正確C28、Hadoop是由何種語言編寫的?A.Scala B.ErlangC.Java D.Python 正確 CHadoop 作者Doug CuttingHadoop的基本概念:分布式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論