版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)基礎(chǔ)-題庫帶答案1、通過互聯(lián)網(wǎng),查找和了解大數(shù)據(jù)的產(chǎn)生過程。答案:2、通過互聯(lián)網(wǎng),查找和了解大數(shù)據(jù)的應(yīng)用場景(領(lǐng)域)。答案:3、通過互聯(lián)網(wǎng),查找和了解大數(shù)據(jù)研究的意義。答案:4、通過互聯(lián)網(wǎng)查找hadoop集群的組成,根據(jù)上課的講解繪制Hadoop生態(tài)系統(tǒng)的思維導(dǎo)圖或者關(guān)系圖,并簡要說明Hadoop生態(tài)系統(tǒng)中每一部分的功能。答案:5、什么是虛擬機(jī),它的作用是什么?答案:6、簡述啟動(dòng)和關(guān)閉Hadoop集群的方法。答案:7、簡述HDFS中NameNode和DataNode的作用。答案:8、下面哪個(gè)命令可以用于創(chuàng)建HDFS目錄/hdfstest/testA、hdfsdfs-mkdir/hdfstest/testB、hdfsdfs-get/hdfstest/testC、hdfsdfs-cat/hdfstest/testD、hdfsdfs-rmdir/hdfstest/test答案:A9、下列哪個(gè)命令可以下載HDFS文件/hdfstest/test.txtA、hdfsdfs-put/hdfstest/test.txtB、hdfsdfs-get
/hdfstest/test.txtC、hdfsdfs-download/hdfstest/test.txtD、hdfsdfs-move/hdfstest/test.txt答案:B10、刪除HDFS上的文件使用的命令是hadoopfs-delete文件名答案:錯(cuò)誤11、復(fù)制HDFS上的文件可以使用命令hdfsdfs-cp答案:正確12、在HDFS上查看文件內(nèi)容使用命令hdfsdfs-cat答案:正確13、簡述配置windows下Hadoop環(huán)境的基本步驟。答案:14、MapReduce是Hadoop最核心的組件之一。答案:正確15、MapReduce是一種分布式計(jì)算模型。答案:正確16、MapReduce應(yīng)用程序一定要用Java來編寫。答案:錯(cuò)誤17、MapReduce是一種編程模型,用于處理大規(guī)模數(shù)據(jù)集的并行運(yùn)算。答案:正確18、MapReduce執(zhí)行計(jì)算任務(wù)的時(shí)候,沒個(gè)任務(wù)的執(zhí)行過程都被劃分為()階段A、MapB、ReduceC、ResultD、KeyValue答案:AB19、MapReduce的工作過程包括()A、分片、格式化數(shù)據(jù)源B、執(zhí)行MapTaskC、執(zhí)行Shuffle過程D、執(zhí)行ReduceTaskE、寫入文件答案:ABCDE20、查看當(dāng)前節(jié)點(diǎn)的ZooKeeper角色的命令是()A、zkServer.shstatusB、zkServer.shstartC、zkServer.shstopD、zkServer.shformat答案:A21、ZooKeeper默認(rèn)的兩種角色是()A、LeaderB、FollowerC、ObserverD、Master答案:AB22、無論客戶端連接的是哪個(gè)Zookeeper服務(wù)器,其看到的服務(wù)端數(shù)據(jù)模型都是一致的。答案:正確23、Znode有兩種節(jié)點(diǎn),分別是永久節(jié)點(diǎn)和臨時(shí)節(jié)點(diǎn)。答案:正確24、Zookeeper引入Watch機(jī)制實(shí)現(xiàn)分布式的通知功能。答案:正確25、Zookeeper的JavaAPI操作中,setData方法用于更新數(shù)據(jù)。答案:正確26、Zookeeper的JavaAPI操作中,getData方法可以查詢數(shù)據(jù)。答案:正確27、Zookeeper的Shell操作中使用delete命令刪除節(jié)點(diǎn)時(shí),要?jiǎng)h除的節(jié)點(diǎn)存在子節(jié)點(diǎn)的話也可以刪除該節(jié)點(diǎn)。答案:錯(cuò)誤28、Zookeeper的Shell操作中,刪除節(jié)點(diǎn)的方法是用rm命令。答案:錯(cuò)誤29、在Zookeeper的Shell操作中,查看節(jié)點(diǎn)可以用lspath[watch]或getpath[watch]
或ls2path[watch]方法。答案:正確30、在Zookeeper的Shell操作中,rmrpath命令可以遞歸刪除節(jié)點(diǎn)。答案:正確31、Hive是建立在Hadoop文件系統(tǒng)上的一個(gè)數(shù)據(jù)倉庫。答案:正確32、Hive系統(tǒng)架構(gòu)的組成主要包括()A、用戶接口B、跨語言服務(wù)C、底層驅(qū)動(dòng)引擎D、元數(shù)據(jù)存儲(chǔ)系統(tǒng)答案:ABCD33、Hive中所有的數(shù)據(jù)都存儲(chǔ)在()中。A、HBaseB、MysqlC、YarnD、HDFS答案:D34、Hive的安裝模式有()A、內(nèi)嵌模式B、本地模式C、遠(yuǎn)程模式D、網(wǎng)格模式答案:ABC35、Hive是一個(gè)獨(dú)立的數(shù)據(jù)倉庫工具,因此在啟動(dòng)前無需啟動(dòng)任何服務(wù)。答案:錯(cuò)誤36、Hive和Mysql都有String數(shù)據(jù)類型。答案:錯(cuò)誤
解析:Hive有String數(shù)據(jù)類型,Mysql沒有。37、Hive支持Map鍵值對(duì)的復(fù)雜數(shù)據(jù)類型。答案:正確38、Hive中顯示數(shù)據(jù)庫用的命令是showdatabases;答案:正確39、Hive中切換數(shù)據(jù)庫用的命令是USE+數(shù)據(jù)庫名。答案:正確40、Hive中的桶為表提供了額外的結(jié)構(gòu),Hive在處理某些查詢時(shí)利用這個(gè)結(jié)構(gòu),能夠有效地提高查詢效率。答案:正確41、在Flume系統(tǒng)種,在一個(gè)Agent中,同一個(gè)source可以有多個(gè)channel。答案:正確42、在Flume系統(tǒng)中,在一個(gè)Agent中,同一個(gè)sink可以有多個(gè)channel。答案:錯(cuò)誤43、在整個(gè)數(shù)據(jù)傳輸?shù)倪^程中,F(xiàn)lume將流動(dòng)的數(shù)據(jù)封裝到一個(gè)event(事件)中,它是Flume內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧4鸢福赫_44、Flume的核心是把數(shù)據(jù)從數(shù)據(jù)源通過Source收集過來,再將收集的數(shù)據(jù)通過Channel匯集到指定的Sink。答案:正確45、Flume的負(fù)載均衡接收器處理器支持使用輪詢、隨機(jī)機(jī)制進(jìn)行流量分配。答案:正確46、FlumeAgent是一個(gè)JVM進(jìn)程,它承載著數(shù)據(jù)從外部源流向下一個(gè)目標(biāo)的三個(gè)核心組件是Source、Channel和Sink。答案:正確47、一、目前有一個(gè)集群,集群中有三臺(tái)計(jì)算機(jī),分別是hadoop01、hadoop02、hadoop03,都已經(jīng)裝好了Linux操作系統(tǒng),三臺(tái)計(jì)算機(jī)需要完成以下,請(qǐng)按照以下步驟完成操作(操作步驟寫出命令,并截圖;不具備環(huán)境的同學(xué)簡述操作步驟):1.SSH遠(yuǎn)程登錄功能配置(1)安裝并開啟SSH服務(wù)
(2)創(chuàng)建CRT工具連接三臺(tái)服務(wù)器,這里也可以使用其他的連接工具,如xshell,基本原理都一樣
2.三臺(tái)機(jī)器免密登錄(1)三臺(tái)機(jī)器執(zhí)行以下命令,生成公鑰與私鑰
(2)拷貝公鑰到同一臺(tái)主機(jī)(這里都拷貝到hadoop01)
(3)復(fù)制第一臺(tái)機(jī)器的認(rèn)證到其他機(jī)器
3.安裝JDK上傳jdk到/export/software路徑下去,并解壓(1)安裝lrzsz
(2)上傳jdk
(3)解壓并重命名
4.配置JDK環(huán)境變量
5.JDK環(huán)境驗(yàn)證
6.解壓安裝Hadoop上傳hadoop-2.7.4.tar.gz包到/export/software目錄下,并解壓
7.配置Hadoop系統(tǒng)環(huán)境變量
8.Hadoop環(huán)境驗(yàn)證
答案:48、二、請(qǐng)完成以下HDFSShell的相關(guān)操作,寫出操作命令。1.查看hdfs命令:
2.查看相應(yīng)命令的使用方法:
3.創(chuàng)建文件夾:
4.查看hdfs文件(夾)列表:
5.上傳文件到hdfs:
6.查看文件內(nèi)容
7.下載hdfs上的文件:
8.刪除hdfs上的文件:
9.復(fù)制hdfs上的文件:
10.剪切hdfs上的文件:
11.顯示目錄中所有文件的大小
12.創(chuàng)建一個(gè)0字節(jié)的空文件
答案:49、三、請(qǐng)?jiān)贖adoop集群中完成以下Zookeep的操作,寫出相應(yīng)的命令:1.顯示所有操作命令2.查看當(dāng)前Zookeeper中所包含的內(nèi)容3.查看當(dāng)前節(jié)點(diǎn)數(shù)據(jù)4.創(chuàng)建節(jié)點(diǎn)創(chuàng)建序列化永久節(jié)點(diǎn)創(chuàng)建臨時(shí)節(jié)點(diǎn)創(chuàng)建永久節(jié)點(diǎn)5.獲取節(jié)點(diǎn)6.修改節(jié)點(diǎn)7.監(jiān)聽節(jié)點(diǎn)8.刪除節(jié)點(diǎn)
普通刪除的命令
遞歸刪除的命令
答案:50、當(dāng)前大數(shù)據(jù)技術(shù)的基礎(chǔ)是由()首先提出的。A、微軟B、百度C、谷歌D、阿里巴巴答案:C51、大數(shù)據(jù)的起源是()A、金融B、電信C、互聯(lián)網(wǎng)D、公共管理答案:C52、根據(jù)不同的業(yè)務(wù)需求來建立數(shù)據(jù)模型,抽取最有意義的向量,決定選取哪種方法的數(shù)據(jù)分析角色人員是()。A、數(shù)據(jù)管理人員B、數(shù)據(jù)分析員C、研究科學(xué)家D、軟件開發(fā)工程師答案:C53、()反映數(shù)據(jù)的精細(xì)化程度,越細(xì)化的數(shù)據(jù),價(jià)值越高。A、規(guī)模B、活性C、關(guān)聯(lián)度D、顆粒度答案:D54、美國海軍軍官莫里通過對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()。A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)答案:B55、下列關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的是()。A、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征B、處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析E、大數(shù)據(jù)的目的在于發(fā)現(xiàn)新的知識(shí)與洞察并進(jìn)行科學(xué)決策答案:AD56、大數(shù)據(jù)的價(jià)值體現(xiàn)在()A、大數(shù)據(jù)給思維方式帶來了沖擊B、大數(shù)據(jù)為政策制定提供科學(xué)論據(jù)C、大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平D、大數(shù)據(jù)實(shí)現(xiàn)了精準(zhǔn)營銷E、大數(shù)據(jù)的發(fā)力點(diǎn)在于預(yù)測答案:ABCDE57、當(dāng)前大數(shù)據(jù)技術(shù)的基礎(chǔ)包括()A、分布式文件系統(tǒng)B、分布式并行計(jì)算C、關(guān)系型數(shù)據(jù)庫D、分布式數(shù)據(jù)庫答案:ABD58、Hadoop是Java開發(fā)的,所以MapReduce只支持Java語言編寫。答案:錯(cuò)誤
解析:hadoop是用R語言開發(fā)的,MapReduce是一個(gè)框架,可以理解是一種思想,可以使用其他語言開發(fā)。59、Hadoop支持?jǐn)?shù)據(jù)的隨機(jī)讀寫。答案:錯(cuò)誤
解析:lucene是支持隨機(jī)讀寫的,而hdfs只支持隨機(jī)讀。但是HBase可以來補(bǔ)救。HBase提供隨機(jī)讀寫,來解決Hadoop不能處理的問題。HBase自底層設(shè)計(jì)開始即聚焦于各種可伸縮性問題:表可以很“高”,有數(shù)十億個(gè)數(shù)據(jù)行;也可以很“寬”,有數(shù)百萬個(gè)列;水平分區(qū)并在上千個(gè)普通商用機(jī)節(jié)點(diǎn)上自動(dòng)復(fù)制。表的模式是物理存儲(chǔ)的直接反映,使系統(tǒng)有可能提高高效的數(shù)據(jù)結(jié)構(gòu)的序列化、存儲(chǔ)和檢索。60、配置JDK環(huán)境變量時(shí),需要對(duì)下列哪個(gè)文件進(jìn)行修改()A、hadoop-env.shB、core-site.xmlC、hdfs-site.xmlD、profile答案:D61、下面選項(xiàng)中哪一項(xiàng)可以單獨(dú)啟動(dòng)namenode進(jìn)程命令()A、hadoop-daemon.shstartnamenodeB、hadoop-daemon.shnamenodestartC、start
namenode
hadoop-daemon.shD、starthadoop-daemon.sh
namenode答案:A62、以下對(duì)Hadoop主要配置文件描述正確的是()A、core-site.xml:Hadoop核心全局配置文件,可在其他配置文件中引用該文件。B、hdfs-site.xml:HDFS配置文件,繼承core-site.xml配置文件。C、mapred-site.xml:MapReduce配置文件,繼承core-site.xml配置文件。D、以上都正確答案:D63、啟動(dòng)Hadoop集群,要啟動(dòng)內(nèi)部的集群框架是下列的哪個(gè)選項(xiàng)()A、Hadoop集群和HDFS集群框架B、YARN集群和MapReduce集群框架C、HDFS集群和YARN集群框架D、HDFS集群和MapReduce集群框架答案:C64、在下列哪個(gè)配置文件中可以修改數(shù)據(jù)塊的副本數(shù)量()A、core-site.xmlB、hdfs-site.xmlC、slavesD、hadoop-env.sh答案:B65、Hadoop集群啟動(dòng)完成后,通過jps指令查看各節(jié)點(diǎn)的服務(wù)進(jìn)程,主節(jié)點(diǎn)上一定會(huì)存在下列哪個(gè)進(jìn)程()A、NodeManagerB、NameNodeC、DataNodeD、SecondaryNameNode答案:B66、VMware提供兩種類型的克隆,正確的是下列哪項(xiàng)()A、完全克隆和不完全克隆B、鏈接克隆和非鏈接克隆C、完全克隆和鏈接克隆D、鏈接克隆和不完全克隆答案:C67、Hadoop集群的計(jì)算資源是由以下哪一項(xiàng)進(jìn)行管理()A、NameNodeB、DataNodeC、ResourceManagerD、NodeManager答案:C68、下列關(guān)于主節(jié)點(diǎn)的格式化處理說法錯(cuò)誤的是()A、初次啟動(dòng)HDFS集群時(shí),必須對(duì)主節(jié)點(diǎn)進(jìn)行格式化處理B、每次啟動(dòng)HDFS集群,都必須對(duì)主節(jié)點(diǎn)進(jìn)行格式化處理C、初次啟動(dòng)HDFS時(shí),不一定要對(duì)主節(jié)點(diǎn)進(jìn)行格式化處理D、什么時(shí)候主節(jié)點(diǎn)都不需要進(jìn)行格式化處理答案:BCD69、Hadoop集群的部署環(huán)境有下列哪些()A、單機(jī)版環(huán)境B、偽分布式環(huán)境C、完全分布式環(huán)境D、以上都不是答案:ABC70、下面哪個(gè)選項(xiàng)負(fù)責(zé)HDFS數(shù)據(jù)存儲(chǔ)()。A、NameNodeB、DataNodeC、SecondaryNameNodeD、NodeManager答案:B71、HDfS中的block默認(rèn)保存幾份()A、1份B、2份C、3份D、不確定答案:C72、將Windows中的文件上傳到HDFS目錄下,會(huì)涉及到本地計(jì)算機(jī)(Windows)上的文件系統(tǒng)、集群服務(wù)器節(jié)點(diǎn)(Linux)上的文件系統(tǒng)以及HDFS文件系統(tǒng)。答案:正確73、將Windows中的文件上傳到HDFS目錄下,會(huì)涉及到下列哪些文件系統(tǒng)()A、本地計(jì)算機(jī)(Windows)上的文件系統(tǒng)B、集群服務(wù)器節(jié)點(diǎn)(Linux)上的文件系統(tǒng)C、HDFS文件系統(tǒng)D、不需要文件系統(tǒng)答案:ABC74、hadoopfs-chmod777命令的作用是改變文件所屬組。答案:錯(cuò)誤75、maven是專門用于構(gòu)建和管理Java相關(guān)項(xiàng)目的工具,有一個(gè)pom.xml用于維護(hù)當(dāng)前項(xiàng)目都用了哪些jar包。答案:正確76、MapReduce中Map過程輸出的鍵值對(duì),將有下列哪個(gè)組件()進(jìn)行合并處理。A、MapperB、InputFormatC、ReducerD、OutputFormat答案:C77、Combiner組件的作用是對(duì)Map階段輸出的重復(fù)數(shù)據(jù)先做一次合并計(jì)算,再把新的(key,value)作為Reduce階段的輸入。答案:正確78、自定義Combiner時(shí),不需要繼承Reduce類。答案:錯(cuò)誤
解析:自定義Combiner時(shí),需要繼承Reduce類,并且重寫reduce()方法。79、MapReduce性能優(yōu)化策略可以從下列哪些方面進(jìn)行()A、數(shù)據(jù)輸入B、Map階段C、Reduce階段D、Shuffl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 主要領(lǐng)導(dǎo)離職的感言(5篇)
- 新學(xué)期學(xué)習(xí)計(jì)劃十篇
- DB12T 598.10-2015 天津市建設(shè)項(xiàng)目用地控制指標(biāo) 第10部分:非營利性社會(huì)福利設(shè)施項(xiàng)目
- 中秋節(jié)學(xué)校致辭范文(13篇)
- 新學(xué)期學(xué)習(xí)計(jì)劃范文匯編九篇
- 范文新學(xué)期學(xué)習(xí)計(jì)劃模板合集7篇
- DB12∕T 879-2019 倉儲(chǔ)企業(yè)誠信評(píng)價(jià)規(guī)范
- 電動(dòng)叉車維修保養(yǎng)的安全與操作規(guī)范
- 影響水利工程施工質(zhì)量控制的主要因素
- 移動(dòng)通信筆試題
- 農(nóng)貿(mào)市場設(shè)計(jì)要點(diǎn)
- 統(tǒng)計(jì)期末氣象預(yù)報(bào)-2014a
- 電動(dòng)汽車結(jié)構(gòu)與檢修測試題附答案完整版
- 掛面車間操作規(guī)程
- 銑削深攪水泥土攪拌墻技術(shù)規(guī)程-中國土木工程學(xué)會(huì)
- 公路瀝青路面施工技術(shù)規(guī)范JTGF40-2004
- 個(gè)人住房公積金提取申請(qǐng)表
- 員工日常檢查記錄表
- 畫法幾何 華中科大-新3-2
- 辦公生活區(qū)臨建施工方案
- 外墻雙排鋼管腳手架搭設(shè)綜合單價(jià)分析表
評(píng)論
0/150
提交評(píng)論