Hadoop試題試題庫(kù)

上傳人：m*** IP屬地：天津上傳時(shí)間：2021-12-14 格式：DOCX 頁(yè)數(shù)：19 大小：18.17KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩14頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1. 以下哪一項(xiàng)不屬于 Hadoop 可以運(yùn)行的模式 _C_。A. 單機(jī)（本地）模式B. 偽分布式模式C. 互聯(lián)模式D. 分布式模式2. Hadoop 的作者是下面哪一位 _B。A. Martin FowlerB. Doug cuttingC. Kent BeckD. Grace Hopper3. 下列哪個(gè)程序通常與 NameNode 在同一個(gè)節(jié)點(diǎn)啟動(dòng) _DA. TaskTrackerB. DataNodeC. SecondaryNameNodeD. Jobtracker4. HDFS 默認(rèn) Block Size 的大小是 _B_。5. 下列哪項(xiàng)通常是集群的最主要瓶頸 CA. CPUB. 網(wǎng)絡(luò)

2、C. 磁盤(pán) IOD. 內(nèi)存6. 下列關(guān)于 MapReduce說(shuō)法不正確的是 C_。A. MapReduce 是一種計(jì)算框架B. MapReduce 來(lái)源于 google 的學(xué)術(shù)論文C. MapReduce 程序只能用 java 語(yǔ)言編寫(xiě)D. MapReduce 隱藏了并行計(jì)算的細(xì)節(jié)，方便使用8. HDFS 是基于流數(shù)據(jù)模式訪問(wèn)和處理超大文件的需求而開(kāi)發(fā)的，具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征，適合的讀寫(xiě)任務(wù)是_D 。A一次寫(xiě)入，少次讀B多次寫(xiě)入，少次讀C多次寫(xiě)入，多次讀D一次寫(xiě)入，多次讀9. HBase 依靠 _A存儲(chǔ)底層數(shù)據(jù)。A. HDFSB. HadoopC. MemoryD

3、. MapReduce10. HBase 依賴(lài) _D_提供強(qiáng)大的計(jì)算能力。A. ZookeeperB. ChubbyC. RPCD. MapReduce11. HBase 依賴(lài) _A_提供消息通信機(jī)制A. ZookeeperB. ChubbyC. RPCD. Socket12. 下面與 HDFS類(lèi)似的框架是 _C？A. NTFSB. FAT32C. GFSD. EXT313. 關(guān)于 SecondaryNameNode 下面哪項(xiàng)是正確的 _C_。A. 它是 NameNode 的熱備B. 它對(duì)內(nèi)存沒(méi)有要求C. 它的目的是幫助 NameNode 合并編輯日志，減少 NameNode 啟動(dòng)時(shí)間D. S

4、econdaryNameNode 應(yīng)與 NameNode 部署到一個(gè)節(jié)點(diǎn)14. 大數(shù)據(jù)的特點(diǎn)不包括下面哪一項(xiàng) _D_。A. 巨大的數(shù)據(jù)量B. 多結(jié)構(gòu)化數(shù)據(jù)C. 增長(zhǎng)速度快D. 價(jià)值密度高HBase測(cè)試題1. HBase 來(lái)源于哪一項(xiàng)？ CA The Google File SystemB MapReduceC BigTableD Chubby2. 下面對(duì) HBase的描述哪些是正確的？ B 、C、DA 不是開(kāi)源的B 是面向列的C 是分布式的D 是一種 NoSQL數(shù)據(jù)庫(kù)3. HBase 依靠（）存儲(chǔ)底層數(shù)據(jù) AA HDFSB HadoopC MemoryD MapReduce4. HBase 依

5、賴(lài)（）提供消息通信機(jī)制 AA ZookeeperB ChubbyC RPCD Socket5. HBase 依賴(lài)（）提供強(qiáng)大的計(jì)算能力 DA ZookeeperB ChubbyC RPCD MapReduce6. MapReduce 與 HBase的關(guān)系，哪些描述是正確的？B 、CA 兩者不可或缺， MapReduce是 HBase 可以正常運(yùn)行的保證B 兩者不是強(qiáng)關(guān)聯(lián)關(guān)系，沒(méi)有MapReduce， HBase可以正常運(yùn)行C MapReduce 可以直接訪問(wèn) HBaseD 它們之間沒(méi)有任何關(guān)系7. 下面哪些選項(xiàng)正確描述了 HBase 的特性？ A、 B、C、DA 高可靠性B 高性能C 面向列D

6、可伸縮8. 下面與 Zookeeper 類(lèi)似的框架是？ DA ProtobufB JavaC KafkaD Chubby9. 下面與 HDFS類(lèi)似的框架是？ CA NTFSB FAT32C GFSD EXT310. 下面哪些概念是 HBase 框架中使用的？ A、CA HDFSB GridFSC ZookeeperD EXT3第二部分： HBase 核心知識(shí)點(diǎn)11. LSM 含義是？ AA 日志結(jié)構(gòu)合并樹(shù)B 二叉樹(shù)C 平衡二叉樹(shù)D 基于日志結(jié)構(gòu)的合并樹(shù)12. 下面對(duì) LSM結(jié)構(gòu)描述正確的是？ A 、CA 順序存儲(chǔ)B 直接寫(xiě)硬盤(pán)C 需要將數(shù)據(jù) Flush 到磁盤(pán)D 是一種搜索平衡樹(shù)13. LSM

7、更能保證哪種操作的性能？ BA 讀B 寫(xiě)C 隨機(jī)讀D 合并14. LSM 的讀操作和寫(xiě)操作是獨(dú)立的？ A A 是。B 否。C LSM 并不區(qū)分讀和寫(xiě)D LSM 中讀寫(xiě)是同一種操作A 硬盤(pán)上B 內(nèi)存中C 磁盤(pán)陣列中D 閃存中16 HFile 數(shù)據(jù)格式中的 Data 字段用于（）。AA 存儲(chǔ)實(shí)際的 KeyValue 數(shù)據(jù)B 存儲(chǔ)數(shù)據(jù)的起點(diǎn)C 指定字段的長(zhǎng)度D 存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)17 HFile 數(shù)據(jù)格式中的 MetaIndex 字段用于（）。 DA Meta 塊的長(zhǎng)度B Meta 塊的結(jié)束點(diǎn)C Meta 塊數(shù)據(jù)內(nèi)容D Meta 塊的起始點(diǎn)18 HFile 數(shù)據(jù)格式中的 Magic 字段用于（）

8、。AA 存儲(chǔ)隨機(jī)數(shù)，防止數(shù)據(jù)損壞B 存儲(chǔ)數(shù)據(jù)的起點(diǎn)C 存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)D 指定字段的長(zhǎng)度19 HFile 數(shù)據(jù)格式中的 KeyValue 數(shù)據(jù)格式，下列選項(xiàng)描述正確的是（）。 A、 DA 是 byte 數(shù)組B 沒(méi)有固定的結(jié)構(gòu)C 數(shù)據(jù)的大小是定長(zhǎng)的D 有固定的結(jié)構(gòu)20 HFile 數(shù)據(jù)格式中的 KeyValue 數(shù)據(jù)格式中 Value 部分是（）。 CA 擁有復(fù)雜結(jié)構(gòu)的字符串B 字符串C 二進(jìn)制數(shù)據(jù)D 壓縮數(shù)據(jù)第三部分： HBase 高級(jí)應(yīng)用介紹31 HBase 中的批量加載底層使用（）實(shí)現(xiàn)。 AA MapReduceB HiveC CoprocessorD Bloom Filter32.

9、HBase 性能優(yōu)化包含下面的哪些選項(xiàng)？ A、 B、C、DA 讀優(yōu)化B 寫(xiě)優(yōu)化C 配置優(yōu)化D JVM 優(yōu)化33. Rowkey 設(shè)計(jì)的原則，下列哪些選項(xiàng)的描述是正確的？A、B、 CA 盡量保證越短越好B 可以使用漢字C 可以使用字符串D 本身是無(wú)序的34. HBase 構(gòu)建二級(jí)索引的實(shí)現(xiàn)方式有哪些？ A 、BA MapReduceB CoprocessorC Bloom FilterD Filter35. 關(guān)于 HBase二級(jí)索引的描述，哪些是正確的？ A、 BA 核心是倒排表B 二級(jí)索引概念是對(duì)應(yīng) Rowkey 這個(gè)“一級(jí)”索引C 二級(jí)索引使用平衡二叉樹(shù)D 二級(jí)索引使用 LSM結(jié)構(gòu)36. 下

10、列關(guān)于 Bloom Filter 的描述正確的是？ A、 CA 是一個(gè)很長(zhǎng)的二進(jìn)制向量和一系列隨機(jī)映射函數(shù)B 沒(méi)有誤算率C 有一定的誤算率D 可以在 Bloom Filter 中刪除元素第四部分： HBase 安裝、部署、啟動(dòng)37. HBase 官方版本可以安裝在什么操作系統(tǒng)上？ A、B、C A CentOSB UbuntuC RedHatD Windows38. HBase 虛擬分布式模式需要（）個(gè)節(jié)點(diǎn)？ AA 1B 2C 3D 最少 3 個(gè)39. HBase 分布式模式最好需要（）個(gè)節(jié)點(diǎn)？ CA 1B 2C 3D 最少關(guān)于 hadoop 的選擇題1、Doug Cutting 所創(chuàng)立的項(xiàng)目

11、的名稱(chēng)都受到其家人的啟發(fā)，以下項(xiàng)目不是由他創(chuàng)立的項(xiàng)目是A HadoopB NutchC LuceneD Solr答案：D2、配置 Hadoop時(shí)， JAVA_HOM包E含在哪一個(gè)配置文件中ABCD答案：B知識(shí)點(diǎn)： hadoop 配置3、Hadoop配置文件中，顯示覆蓋里的內(nèi)容。在版本中，被分離成三個(gè) XML文件，不包括ABCD答案：A知識(shí)點(diǎn)： hadoop 配置4、HDFS默認(rèn)的當(dāng)前工作目錄是 /user/$USER ，的值需要在哪個(gè)配置文件內(nèi)說(shuō)明A.B.C.D. 以上均不是答案：B知識(shí)點(diǎn)： hadoop 配置5、關(guān)于 Hadoop單機(jī)模式和偽分布式模式的說(shuō)法，正確的是A 兩者都起守

12、護(hù)進(jìn)程，且守護(hù)進(jìn)程運(yùn)行在一臺(tái)機(jī)器上B 單機(jī)模式不使用 HDFS，但加載守護(hù)進(jìn)程C 兩者都不與守護(hù)進(jìn)程交互，避免復(fù)雜性D 后者比前者增加了 HDFS輸入輸出以及可檢查內(nèi)存使用情況答案：D知識(shí)點(diǎn)： hadoop 配置6、下列關(guān)于 Hadoop API 的說(shuō)法錯(cuò)誤的是A Hadoop 的文件 API 不是通用的，只用于 HDFS文件系統(tǒng)B Configuration 類(lèi)的默認(rèn)實(shí)例化方法是以 HDFS系統(tǒng)的資源配置為基礎(chǔ)的C FileStatus 對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D FSDataInputStream 是的子類(lèi)答案：AnamespaceIDB. storageIDC. storageType

13、D. layoutVersion答案：B知識(shí)點(diǎn)：其他三項(xiàng)是公有的。 layoutVersion 是一個(gè)負(fù)整數(shù)，保存了 HDFS的持續(xù)化在硬盤(pán)上的數(shù)據(jù)結(jié)構(gòu)的格式版本號(hào)； namespaceID 是文件系統(tǒng)的唯一標(biāo)識(shí) 符，是在文件系統(tǒng)初次格式化時(shí)生成的； storageType 表示此文件夾中保存的是數(shù)據(jù)節(jié)點(diǎn)的類(lèi)型11、Client 在 HDFS上進(jìn)行文件寫(xiě)入時(shí)， namenode根據(jù)文件大小和配置情況，返回部分 datanode 信息，誰(shuí)負(fù)責(zé)將文件劃分為多個(gè) Block ，根據(jù) DataNode 的地址信息，按順序?qū)懭氲矫恳粋€(gè) DataNode 塊A ClientB NamenodeC

14、 DatanodeD Secondary namenode答案：A知識(shí)點(diǎn)： HDFS文件寫(xiě)入12、HDFS的是基于流數(shù)據(jù)模式訪問(wèn)和處理超大文件的需求而開(kāi)發(fā)的，默認(rèn)的最基本的存儲(chǔ)單位是 64M，具有高容錯(cuò)、高可靠性、高可擴(kuò)展性、高吞吐率等特征，適合的讀寫(xiě)任務(wù)是A一次寫(xiě)入，少次讀寫(xiě)B(tài)多次寫(xiě)入，少次讀寫(xiě)C一次寫(xiě)入，多次讀寫(xiě)D多次寫(xiě)入，多次讀寫(xiě)答案：C知識(shí)點(diǎn)： HDFS特性13、HDFS無(wú)法高效存儲(chǔ)大量小文件，想讓它能處理好小文件，比較可行的改進(jìn) 策略不包括A 利用 SequenceFile 、 MapFile 、 Har 等方式歸檔小文件B 多 Master 設(shè)計(jì)C Block 大小適當(dāng)調(diào)

15、小D 調(diào)大 namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤(pán)里答案：D知識(shí)點(diǎn)： HDFS特性14、關(guān)于 HDFS的文件寫(xiě)入，正確的是A 支持多用戶(hù)對(duì)同一文件的寫(xiě)操作B 用戶(hù)可以在文件任意位置進(jìn)行修改C 默認(rèn)將文件塊復(fù)制成三份存放D 復(fù)制的文件塊默認(rèn)都存在同一機(jī)架上答案：C知識(shí)點(diǎn)：在 HDFS的一個(gè)文件中只有一個(gè)寫(xiě)入者，而且寫(xiě)操作只能在文件末尾完成，即只能執(zhí)行追加操作。默認(rèn)三份文件塊兩塊在同一機(jī)架上，另一份存放在其他機(jī)架上。15、Hadoop fs 中的 -get 和-put 命令操作對(duì)象是A 文件B 目錄C 兩者都是答案：C知識(shí)點(diǎn)： HDFS命令16、Namenode在啟動(dòng)時(shí)自動(dòng)進(jìn)入安全

16、模式，在安全模式階段，說(shuō)法錯(cuò)誤的是 A 安全模式目的是在系統(tǒng)啟動(dòng)時(shí)檢查各個(gè) DataNode 上數(shù)據(jù)塊的有效性 B 根據(jù)策略對(duì)數(shù)據(jù)塊進(jìn)行必要的復(fù)制或刪除C 當(dāng)數(shù)據(jù)塊最小百分比數(shù)滿足的最小副本數(shù)條件時(shí)，會(huì)自動(dòng)退出安全模式D 文件系統(tǒng)允許有修改答案：D知識(shí)點(diǎn)： HDFS安全模式HDfS 中的 block 默認(rèn)保存幾份？答案 A默認(rèn) 3 分a) 3 份b) 2 份c) 1 份d) 不確定27. 下列哪個(gè)程序通常與 NameNode 在一個(gè)節(jié)點(diǎn)啟動(dòng)？答案 Da) SecondaryNameNodeb) DataNodec) TaskTrackerd) Jobtracker28. Hadoop 作者

17、答案 C Doug cuttinga) Martin Fowlerb) Kent Beckc) Doug cutting29. HDFS 默認(rèn) Block Size 答案： Ba) 32MBb) 64MBc) 128MB30、下列哪項(xiàng)通常是集群的最主要瓶頸：答案： C磁盤(pán)a) CPUb) 網(wǎng)絡(luò)c) 磁盤(pán) IOd) 內(nèi)存31. 關(guān)于 SecondaryNameNode 哪項(xiàng)是正確的？答案 Ca) 它是 NameNode 的熱備b) 它對(duì)內(nèi)存沒(méi)有要求c) 它的目的是幫助 NameNode 合并編輯日志，減少 NameNode 啟動(dòng)時(shí)間d) SecondaryNameNode 應(yīng)與 NameNode

18、部署到一個(gè)節(jié)點(diǎn)。多選題：1. 下列哪項(xiàng)可以作為集群的管理？答案： ABDa) Puppetb) Pdshc) Cloudera Managerd) Zookeeper2. 配置機(jī)架感知的下面哪項(xiàng)正確：答案 ABCa) 如果一個(gè)機(jī)架出問(wèn)題，不會(huì)影響數(shù)據(jù)讀寫(xiě)b) 寫(xiě)入數(shù)據(jù)的時(shí)候會(huì)寫(xiě)到不同機(jī)架的 DataNode 中c) MapReduce 會(huì)根據(jù)機(jī)架獲取離自己比較近的網(wǎng)絡(luò)數(shù)據(jù)3. Client 端上傳文件的時(shí)候下列哪項(xiàng)正確？答案 Ba) 數(shù)據(jù)經(jīng)過(guò) NameNode 傳遞給 DataNodeb) Client 端將文件切分為 Block ，依次上傳c) Client 只上傳數(shù)據(jù)到一臺(tái) DataNo

19、de，然后由 NameNode 負(fù)責(zé) Block 復(fù)制工作4. 下列哪個(gè)是 Hadoop 運(yùn)行的模式：答案 ABCa) 單機(jī)版b）偽分布式c）分布式5. Cloudera 提供哪幾種安裝 CDH 的方法？答案： ABCDa）Cloudera managerb）Tarballc）Yumd）Rpm判斷題：1. Ganglia 不僅可以進(jìn)行監(jiān)控，也可以進(jìn)行告警。（正確）2. Block Size 是不可以修改的。（錯(cuò)誤）3. Nagios 不可以監(jiān)控 Hadoop 集群，因?yàn)樗惶峁?Hadoop 支持。（錯(cuò)誤）4. 如果 NameNode 意外終止， SecondaryNameNode會(huì) 接替它使集群繼續(xù)工作。（錯(cuò)誤）5. Cloudera CDH 是需要付費(fèi)使用的。（錯(cuò)誤）6. Hadoop 是 Java 開(kāi)發(fā)的，所以 MapReduce 只支持 Java 語(yǔ)言編寫(xiě)。（錯(cuò)誤）7. Hadoop 支持?jǐn)?shù)據(jù)的隨機(jī)讀寫(xiě)。（錯(cuò) ）8. NameNode負(fù) 責(zé)管理 metadata ，client 端每次讀寫(xiě)請(qǐng)求，它都會(huì)從磁盤(pán)

人人文庫(kù)> 全部分類(lèi)> 應(yīng)用文書(shū) > 工作計(jì)劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

Hadoop試題試題庫(kù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

Hadoop試題試題庫(kù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔