《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題試卷及答案2套AB卷_第1頁(yè)
《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題試卷及答案2套AB卷_第2頁(yè)
《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題試卷及答案2套AB卷_第3頁(yè)
《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題試卷及答案2套AB卷_第4頁(yè)
《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題試卷及答案2套AB卷_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)平臺(tái)搭建與配置管理第21頁(yè)共21頁(yè)《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題期中試題(閉卷A)題號(hào)一二三四五六七八九十成績(jī)滿分30202030100得分【本套試卷共有4大題,計(jì)66小題】一、選擇題(20題,每題1.5分,共30分)1、Client端上傳文件的時(shí)候下列正確的是()。A.數(shù)據(jù)經(jīng)過(guò)NameNode傳給DataNodeB.Client只上傳數(shù)據(jù)到一臺(tái)DataNodeC.Client端將文件切分為Block,依次上傳D.NameNode負(fù)責(zé)Block復(fù)制工作2、HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在一個(gè)文件系統(tǒng)樹(shù)中,這些信息也會(huì)在硬盤上保存成一下文件()。A.日志B.命名空間鏡像C.兩者都是D.以上都不是3、MapReduce框架提供了一種序列化鍵/值對(duì)的方法,支持這種序列化的類能夠在Map和Reduce過(guò)程中充當(dāng)鍵或值,以下說(shuō)法錯(cuò)誤的是?()A.實(shí)現(xiàn)Writable接口的類是值B.實(shí)現(xiàn)WritableComparable接口的類可以是值或鍵C.Hadoop的基本類型Text并不實(shí)現(xiàn)WritableComparable接口D.鍵和值的數(shù)據(jù)類型可以超出Hadoop自身支持的基本類型4、對(duì)MapReduce的體系結(jié)構(gòu),以下說(shuō)法不正確的是()A.分布式編程架構(gòu)B.以數(shù)據(jù)為中心,更看重吞吐率C.分而治之的思想D.將一個(gè)任務(wù)合并成多個(gè)子任務(wù)5、在創(chuàng)建Linux分區(qū)時(shí),一定要?jiǎng)?chuàng)建()兩個(gè)分區(qū)。A.FAT/NTFSB.FAT/SWAPC.NTFS/SWAPD.SWAP/根分區(qū)6、下面哪個(gè)命令是用來(lái)定義shell的全局變量()。A.exportfsB.aliasC.exportsD.export7、ZooKeeper可以實(shí)現(xiàn)()。A.高吞吐量和低延遲數(shù)量B.高吞吐量和高延遲數(shù)量C.低吞吐量和低延遲數(shù)量D.低吞吐量和高延遲數(shù)量8、分布式應(yīng)用正在運(yùn)行的一組系統(tǒng)稱為()。A.集群B.分布式系統(tǒng)C.單元D.組9、查詢速度的提升是以額外的()為代價(jià)的。A.創(chuàng)建索引B.創(chuàng)建索引和存儲(chǔ)索引C.刪除索引D.存儲(chǔ)索引10、Hive的元數(shù)據(jù)不能夠存儲(chǔ)在哪些位置?()A.mysqlB.derbyC.oracleD.文本文件11、HBase依賴()提供消息通信機(jī)制。A.ZookeeperB.ChubbyC.RPCD.Socket12、LSM含義是?()A.日志結(jié)構(gòu)合并樹(shù)B.二叉樹(shù)C.平衡二叉樹(shù)D.長(zhǎng)平衡二叉樹(shù)13、HFile數(shù)據(jù)格式中的Data字段用于()。A.存儲(chǔ)實(shí)際的KeyValue數(shù)據(jù)B.存儲(chǔ)數(shù)據(jù)的起點(diǎn)C.指定字段的長(zhǎng)度D.存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)14、下列不屬于StreamGrouping方式的是()。A.ShuffleGroupingB.AllGroupingC.FieldsGroupingD.newGrouping15、Storm會(huì)在集群內(nèi)分配對(duì)應(yīng)并行度個(gè)數(shù)的()來(lái)同時(shí)執(zhí)行這一組件。A.哈希值B.ThriftC.task線程D.Worker進(jìn)程16、Storm可以用來(lái)實(shí)時(shí)處理新數(shù)據(jù)和()。A.刪除數(shù)據(jù)庫(kù)B.更新數(shù)據(jù)庫(kù)C.刪除節(jié)點(diǎn)D.更新表17、MapReduce編程模型,鍵值對(duì)<key,value>的key必須實(shí)現(xiàn)哪個(gè)接口?()。A.WritableComparableB.ComparableC.WritableD.LongWritable18、HBase數(shù)據(jù)庫(kù)的BlockCache緩存的數(shù)據(jù)塊中,哪一項(xiàng)不一定能提高效率()。A.–ROOT-表B..META.表C.HFileindexD.普通的數(shù)據(jù)塊19、HBase的Region組成中,必須要有以下哪一項(xiàng)( )。A.StoreFileB.MemStoreC.MetaStoreD.HFile20、設(shè)計(jì)分布式數(shù)據(jù)倉(cāng)庫(kù)hive的數(shù)據(jù)表時(shí),為取樣更高效,一般可以對(duì)表中的連續(xù)字段進(jìn)行什么操作()。A.分桶B.分區(qū)C.索引D.分表二、填空題(20題,每題1分,共10分)21、Spouts會(huì)從外部讀取流數(shù)據(jù)并持續(xù)發(fā)出。22、當(dāng)Spout或者Bolt發(fā)送元組時(shí),它會(huì)把元組發(fā)送到每個(gè)訂閱了該的Bolt上進(jìn)行處理。23、Storm采用了來(lái)作為分布式協(xié)調(diào)組件。24、HBase分布式模式最好需要個(gè)節(jié)點(diǎn)。25、LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲(chǔ)在。26、HBase中Hmaster負(fù)責(zé)監(jiān)控的生命周期。27、Hive遠(yuǎn)程服務(wù)通過(guò)方式訪問(wèn)Hive。28、Hive不支持的更新。29、Hive非常適合于對(duì)那些只在文本末尾添加數(shù)據(jù)的大型數(shù)據(jù)集進(jìn)行。30、分布式應(yīng)用程序可以基于Zookeeper實(shí)現(xiàn)諸如數(shù)據(jù)發(fā)布/訂閱、、命名服務(wù)、分布式協(xié)調(diào)/通知、、、分布式鎖和分布式隊(duì)列等功能。31、注冊(cè)成臨時(shí)節(jié)點(diǎn)后,再服務(wù)端出問(wèn)題時(shí),節(jié)點(diǎn)會(huì)自動(dòng)的從zookeeper上。32、ZooKeeper提供了一項(xiàng)基本服務(wù)是。33、計(jì)算過(guò)程高度抽象到兩個(gè)函數(shù)和。34、每一個(gè)小數(shù)據(jù)都可以完全地進(jìn)行處理。35、大規(guī)模數(shù)據(jù)集的處理包括兩個(gè)核心環(huán)節(jié)。36、ResourceManager默認(rèn)的WebUI訪問(wèn)端口號(hào)為:。37、Hadoop集群搭建中常用的4個(gè)配置文件為:、hdfs-site.xml、mapred-site.xml、。38、HA產(chǎn)生的背景是。39、網(wǎng)絡(luò)管理兩個(gè)重要任務(wù)分別是:和。40、命令是刪除文件命令。三、判斷題,正確填“T”,錯(cuò)誤填“F”(20題,每題1分,共20分)41、Hadoop支持?jǐn)?shù)據(jù)的隨機(jī)讀寫()。42、NameNode負(fù)責(zé)管理元數(shù)據(jù)信息metadata,client端每次讀寫請(qǐng)求,它都會(huì)從磁盤中讀取或會(huì)寫入metadata信息并反饋給client端()。43、MapReduce的inputsplit一定是一個(gè)block()。44、鏈?zhǔn)組apReduce計(jì)算中,對(duì)任意一個(gè)MapReduce作業(yè),Map和Reduce階段可以有無(wú)限個(gè)Mapper,但Reducer只能有一個(gè)()。45、HBase對(duì)于空(NULL)的列,不需要占用存儲(chǔ)空間。()。46、MapReduce適于PB級(jí)別以上的海量數(shù)據(jù)在線處理()。47、MapReduce計(jì)算過(guò)程中,相同的key默認(rèn)會(huì)被發(fā)送到同一個(gè)reducetask處理()。48、HBase可以有列,可以沒(méi)有列族(columnfamily)()。49、/tmp目錄主要用于存儲(chǔ)程序運(yùn)行時(shí)生成的臨時(shí)文件()。50、Linux系統(tǒng)以文本文件的形式保存大備份系統(tǒng)日志,如lastlog()。51、Hadoop是Java開(kāi)發(fā)的,所以MapReduce只支持Java語(yǔ)言編寫()。52、NameNode負(fù)責(zé)管理metadata,client端每次讀寫請(qǐng)求,它都會(huì)從磁盤中讀取或者會(huì)寫入metadata信息并反饋給client端()。53、MapReduce程序可以直接讀取HBase內(nèi)存儲(chǔ)的數(shù)據(jù)內(nèi)容。()54、所有消息交換都是通過(guò)MapReduce框架自身去實(shí)現(xiàn)的。()55、更新ZooKeeper操作是非阻塞式的。()56、在分布式鎖服務(wù)中,就是通過(guò)對(duì)集群進(jìn)行Master選舉,來(lái)解決分布式系統(tǒng)中的單點(diǎn)故障。()57、分區(qū)的主要好處是加快查詢速度。()58、Hive創(chuàng)建內(nèi)部表時(shí),會(huì)將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指向的路徑。()。59、MapReduce程序可以直接讀取HBase內(nèi)存儲(chǔ)的數(shù)據(jù)內(nèi)容。()60、使用Shell命令insert對(duì)HBase中的一張表進(jìn)行數(shù)據(jù)添加操作。()四、簡(jiǎn)答題(6題,每題5分,共30分)61、簡(jiǎn)述HBase的主要技術(shù)特點(diǎn)。答:62、HBase有哪些類型的訪問(wèn)接口?答:63、是否所有的MapReduce程序都需要經(jīng)過(guò)Map和Reduce這兩個(gè)過(guò)程?如果不是,請(qǐng)舉例說(shuō)明。答:64、請(qǐng)描述HDFSHA架構(gòu)組成組建及其具體功能。答:65、hadoop節(jié)點(diǎn)動(dòng)態(tài)上線下線怎么操作?答:66、HAnamenode是如何工作的?答:《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中標(biāo)答期中標(biāo)答A(閉卷)題號(hào)一二三四五六七八九十成績(jī)滿分30202030100得分一、選擇題(20題,每題1.5分,共30分)1-5:CCCDD 6-10:DAABD11-15:AAADC16-20:BADBA二、填空題(20題,每題1分,共20分)21、Tuple 22、Stream23、Zookeeper24、325、內(nèi)存中26、RegionServer27、JDBC28、級(jí)別29、批處理30、負(fù)載均衡集群管理Master選舉31、刪除32、分布式鎖33、MapReduce34、并行35、分布式存儲(chǔ)和分布式計(jì)算36、808837、core-site.xmlyarn-site.xml38、為了解決單NN那可能會(huì)出現(xiàn)宕機(jī)導(dǎo)致集群不可用或數(shù)據(jù)丟失的問(wèn)題39、監(jiān)控控制40、rm三、判斷題(20題,每題1分,共20分)41-45:FFFTT46-50:FFFTF51-55:FFTTT56-60:TTTTF四、簡(jiǎn)答題(6題,每題5分,共60分)61、答:(1)列式存儲(chǔ)(2)表數(shù)據(jù)是稀疏的多維映射表(3)讀寫的嚴(yán)格一致性(4)提供很高的數(shù)據(jù)讀寫速度(5)良好的線性可擴(kuò)展性(6)提供海量數(shù)據(jù)(7)數(shù)據(jù)會(huì)自動(dòng)分片(8)對(duì)于數(shù)據(jù)故障,hbase是有自動(dòng)的失效檢測(cè)和恢復(fù)能力。(9)提供了方便的與HDFS和MAPREDUCE集成的能力62、答:HBase提供了NativeJavaAPI,HBaseShell,ThriftGateway,RESTGateWay,Pig,Hive等訪問(wèn)接口。63、答:不是。略64、答:在一個(gè)典型的HA集群中,一般設(shè)置兩個(gè)名稱節(jié)點(diǎn),其中一個(gè)名稱節(jié)點(diǎn)處于“活躍”狀態(tài),另一個(gè)處于“待命”狀態(tài)。處于活躍狀態(tài)的名稱節(jié)點(diǎn)負(fù)責(zé)對(duì)外處理所有客戶端的請(qǐng)求,而處于待命狀態(tài)的名稱節(jié)點(diǎn)則作為備用節(jié)點(diǎn),保存了足夠多的系統(tǒng)元數(shù)據(jù),當(dāng)名稱節(jié)點(diǎn)提供了“熱備份”,一旦活躍名稱節(jié)點(diǎn)出現(xiàn)故障,就可以立即切換到待命名稱節(jié)點(diǎn),不會(huì)影響到系統(tǒng)的正常對(duì)外服務(wù)。65、答:1)節(jié)點(diǎn)上線操作:當(dāng)要新上線數(shù)據(jù)節(jié)點(diǎn)的時(shí)候,需要把數(shù)據(jù)節(jié)點(diǎn)的名字追加在dfs.hosts文件中(1)關(guān)閉新增節(jié)點(diǎn)的防火墻(2)在NameNode節(jié)點(diǎn)的hosts文件中加入新增數(shù)據(jù)節(jié)點(diǎn)的hostname(3)在每個(gè)新增數(shù)據(jù)節(jié)點(diǎn)的hosts文件中加入NameNode的hostname(4)在NameNode節(jié)點(diǎn)上增加新增節(jié)點(diǎn)的SSH免密碼登錄的操作(5)在NameNode節(jié)點(diǎn)上的dfs.hosts中追加上新增節(jié)點(diǎn)的hostname,(6)在其他節(jié)點(diǎn)上執(zhí)行刷新操作:hdfsdfsadmin-refreshNodes(7)在NameNode節(jié)點(diǎn)上,更改slaves文件,將要上線的數(shù)據(jù)節(jié)點(diǎn)hostname追加到slaves文件中(8)啟動(dòng)DataNode節(jié)點(diǎn)(9)查看NameNode的監(jiān)控頁(yè)面看是否有新增加的節(jié)點(diǎn)2)節(jié)點(diǎn)下線操作:(1)修改/conf/hdfs-site.xml文件(2)確定需要下線的機(jī)器,dfs.osts.exclude文件中配置好需要下架的機(jī)器,這個(gè)是阻止下架的機(jī)器去連接NameNode。(3)配置完成之后進(jìn)行配置的刷新操作./bin/hadoopdfsadmin-refreshNodes,這個(gè)操作的作用是在后臺(tái)進(jìn)行block塊的移動(dòng)。(4)當(dāng)執(zhí)行三的命令完成之后,需要下架的機(jī)器就可以關(guān)閉了,可以查看現(xiàn)在集群上連接的節(jié)點(diǎn),正在執(zhí)行Decommission,會(huì)顯示:DecommissionStatus:Decommissioninprogress執(zhí)行完畢后,會(huì)顯示:DecommissionStatus:Decommissioned(5)機(jī)器下線完畢,將他們從excludes文件中移除。66、答:ZKFailoverController主要職責(zé)1)健康監(jiān)測(cè):周期性的向它監(jiān)控的NN發(fā)送健康探測(cè)命令,從而來(lái)確定某個(gè)NameNode是否處于健康狀態(tài),如果機(jī)器宕機(jī),心跳失敗,那么zkfc就會(huì)標(biāo)記它處于一個(gè)不健康的狀態(tài)。2)會(huì)話管理:如果NN是健康的,zkfc就會(huì)在zookeeper中保持一個(gè)打開(kāi)的會(huì)話,如果NameNode同時(shí)還是Active狀態(tài)的,那么zkfc還會(huì)在Zookeeper中占有一個(gè)類型為短暫類型的znode,當(dāng)這個(gè)NN掛掉時(shí),這個(gè)znode將會(huì)被刪除,然后備用的NN,將會(huì)得到這把鎖,升級(jí)為主NN,同時(shí)標(biāo)記狀態(tài)為Active。3)當(dāng)宕機(jī)的NN新啟動(dòng)時(shí),它會(huì)再次注冊(cè)zookeper,發(fā)現(xiàn)已經(jīng)有znode鎖了,便會(huì)自動(dòng)變?yōu)镾tandby狀態(tài),如此往復(fù)循環(huán),保證高可靠,需要注意,目前僅僅支持最多配置2個(gè)NN。4)master選舉:如上所述,通過(guò)在zookeeper中維持一個(gè)短暫類型的znode,來(lái)實(shí)現(xiàn)搶占式的鎖機(jī)制,從而判斷那個(gè)NameNode為Active狀態(tài)《大數(shù)據(jù)平臺(tái)搭建與配置管理》期中試題期中試題(閉卷B)題號(hào)一二三四五六七八九十成績(jī)滿分30202030100得分【本套試卷共有4大題,計(jì)66小題】一、選擇題(20題,每題1.5分,共30分)1、欲把當(dāng)前目錄下的file1.txt復(fù)制為file2.txt,以下正確的命令是()。A.copyfile1.txtfile2.txtB.cpfile1.txt|file2.txtC.catfile2.txtfile1.txtD.catfile1.txt>file2.txt2、下面哪個(gè)命令可以用來(lái)切換使用者的身份()。A.passwdB.logC.whoD.su3、以下哪個(gè)不是HDFS的守護(hù)進(jìn)程()。A.datanodeB.namenodeC.secondarynamenodeD.mrappmaster/yarnchild4、Hadoop-2.6.5集群中的HDFS的默認(rèn)的數(shù)據(jù)塊的大小是()。A.32MBB.64MBC.128MBD.256MB5、HDFS集群中的namenode職責(zé)不包括()。A.維護(hù)HDFS集群的目錄樹(shù)結(jié)構(gòu)B.維護(hù)HDFS集群的所有數(shù)據(jù)塊的分布、副本數(shù)和負(fù)載均衡C.負(fù)責(zé)保存客戶端上傳的數(shù)據(jù)D.響應(yīng)客戶端的所有讀寫數(shù)據(jù)請(qǐng)求6、下列關(guān)于HDFS的描述正確的是()。A.如果NameNode宕機(jī),SecondaryNameNode會(huì)接替它使集群繼續(xù)工作B.HDFS集群支持?jǐn)?shù)據(jù)的隨機(jī)讀寫C.NameNode磁盤元數(shù)據(jù)不保存Block的位置信息D.DataNode通過(guò)長(zhǎng)連接與NameNode保持通信7、MapReduce是()上的并行計(jì)算。A.運(yùn)行于大規(guī)模集群B.運(yùn)行于磁盤C.運(yùn)行于小規(guī)模集群D.運(yùn)行在復(fù)雜的系統(tǒng)中8、MapReduce框架會(huì)將Map程序就近地在()數(shù)據(jù)所在的節(jié)點(diǎn)運(yùn)行。A.HDFSB.SparkC.MapReduceD.Zookeeper9、MapReduce為了保證任務(wù)的正常執(zhí)行,采用()等多種容錯(cuò)機(jī)制。A.重復(fù)執(zhí)行B.重新開(kāi)始整個(gè)任務(wù)C.直接丟棄執(zhí)行效率低的作業(yè)D.以上都是10、ZooKeeper是集群的(),監(jiān)視著集群中各個(gè)節(jié)點(diǎn)的狀態(tài)根據(jù)節(jié)點(diǎn)提交的反饋進(jìn)行下一步合理操作。A.領(lǐng)導(dǎo)者B.執(zhí)行者C.管理者D.以上都不是11、ZK提供了一定的()可以用來(lái)獲取一個(gè)順序增長(zhǎng)的,可以在集群環(huán)境下使用的ID。A.函數(shù)B.接口C.方法D.類12、名稱空間由()組成。A.磁盤寄存器B.表C.內(nèi)存寄存器D.數(shù)據(jù)寄存器13、hive數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),不可能的來(lái)源有哪些?()A.Mysql或Oracle數(shù)據(jù)庫(kù)B.行為數(shù)據(jù)C.業(yè)務(wù)數(shù)據(jù)系統(tǒng)D.娛樂(lè)資料14、解壓.tar.gz結(jié)尾的HBase壓縮包使用的Linux命令是什么?()A.tar-vfB.tarC.tar-zxD.tar-zxvf15、下以下數(shù)據(jù)第三列,應(yīng)該用哪種數(shù)據(jù)類型存儲(chǔ):1,zhangsan,[90,79.88]。()A.mapB.intC.arrayD.struct16、查詢速度的提升是以額外的()為代價(jià)的。A.創(chuàng)建索引B.創(chuàng)建索引和存儲(chǔ)索引C.刪除索引D.存儲(chǔ)索引17、當(dāng)客戶端發(fā)起一個(gè)Put請(qǐng)求時(shí),首先它從()表中查出該P(yáng)ut數(shù)據(jù)。A.hbase:metaB.hbase:valueC.-ROOT-D.hbase:key18、HBase構(gòu)建二級(jí)索引的實(shí)現(xiàn)方式有哪些?()A.MapReduceB.HiveC.BloomFilterD.Filter19、Storm將()組成的網(wǎng)絡(luò)抽象成Topology。A.Spouts和BoltsB.字段C.GFSD.Tuple20、Storm運(yùn)行在分布式集群中,其運(yùn)行任務(wù)的方式與()類似。A.HDFSB.HBaseC.HadoopD.Zookeeper二、填空題(20題,每題1分,共10分)21、鏈接分為:。22、JDK下解釋執(zhí)行Java的程序是。23、是客戶端需要執(zhí)行的一個(gè)工作單元。24、HDFS在設(shè)計(jì)上采取了多種機(jī)制保證在硬件出錯(cuò)的環(huán)境中實(shí)現(xiàn)數(shù)據(jù)的。25、HDFS不適合用在的應(yīng)用場(chǎng)合。26、HDFS集群中只有唯一一個(gè)名稱節(jié)點(diǎn),該節(jié)點(diǎn)負(fù)責(zé)所有的。27、Map的輸出結(jié)果首先被寫入。28、磁盤包含機(jī)械部件,它是通過(guò)和來(lái)尋址定位數(shù)據(jù)。29、Shuffle優(yōu)化的原則是給Shuffle過(guò)程盡可能多的。30、ZooKeeper允許分布式進(jìn)程通過(guò)共享的相互協(xié)調(diào)。31、分布式應(yīng)用正在運(yùn)行的一組系統(tǒng)稱為。32、ZooKeeper類通過(guò)其構(gòu)造函數(shù)提供功能。33、Hive中創(chuàng)建的目的就是在查詢一個(gè)表中某列值時(shí)提升速度。34、使用命令可以創(chuàng)建一個(gè)指定名字的表。35、WHERE子句是一個(gè)。36、HBase主要用來(lái)存儲(chǔ)和的松散數(shù)據(jù)。37、在HBase中執(zhí)行操作時(shí),并不會(huì)刪除數(shù)據(jù)舊的版本。38、服務(wù)器負(fù)責(zé)存儲(chǔ)和維護(hù)分配給自己的。39、Storm可以用來(lái)實(shí)時(shí)處理新數(shù)據(jù)和。40、Topology中每一個(gè)計(jì)算組件都有一個(gè)執(zhí)行度。三、判斷題,正確填“T”,錯(cuò)誤填“F”(20題,每題1分,共20分)41、Hive本地模式和遠(yuǎn)程模式,最關(guān)鍵的差別是存儲(chǔ)元數(shù)據(jù)的mysql數(shù)據(jù)庫(kù)的安裝位置是在本地還是在遠(yuǎn)端。()42、Hive數(shù)據(jù)類型中date類型是與時(shí)區(qū)無(wú)關(guān)的類型。()43、Hive數(shù)據(jù)類型中,Timestamp類型是與時(shí)區(qū)無(wú)關(guān)的類型。()44、Hive中的表,對(duì)應(yīng)hdfs中文件的目錄。()45、外部表和內(nèi)部表的差別,只是需要添加External關(guān)鍵詞就可以了。()46、刪除外部表,只會(huì)刪除外部表的元數(shù)據(jù)信息,并不會(huì)將外部表的數(shù)據(jù)刪除。()47、刪除外部表,會(huì)同時(shí)刪除外部表的數(shù)據(jù)和元數(shù)據(jù)。()48、在Hive中,執(zhí)行分桶操作,具體哪個(gè)值,分到哪個(gè)桶中,可以通過(guò)對(duì)數(shù)據(jù)進(jìn)行Hash運(yùn)算取得。()49、HBase是一套高性能的分布式數(shù)據(jù)集群,必須在大型機(jī)或者高性能的服務(wù)器上進(jìn)行搭建。()50、HBase是Apache的Hadoop項(xiàng)目的子項(xiàng)目,利用HadoopHDFS作為其文件存儲(chǔ)系統(tǒng),適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。()51、MapReduce程序可以直接讀取HBase內(nèi)存儲(chǔ)的數(shù)據(jù)內(nèi)容。()52、HBase系統(tǒng)適合進(jìn)行多表聯(lián)合查詢以及復(fù)雜性讀寫操作。()53、Hadoop是IBM公司開(kāi)發(fā)的一款商用大數(shù)據(jù)軟件。()54、Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架,能夠處理PB級(jí)數(shù)據(jù)。()55、Hadoop存儲(chǔ)系統(tǒng)HDFS的文件是分塊存儲(chǔ),每個(gè)文件塊默認(rèn)大小為32MB。()56、HDFS系統(tǒng)為了容錯(cuò)保證數(shù)據(jù)塊完整性,每一塊數(shù)據(jù)都采用2份副本。()57、HDFS系統(tǒng)采用NameNode定期向DataNode發(fā)送心跳消息,用于檢測(cè)系統(tǒng)是否正常運(yùn)行。()58、用戶可以通過(guò)”hadoopfs–put”命令獲取遠(yuǎn)端文件數(shù)據(jù)。()59、Nagios不可以監(jiān)控Hadoop集群,因?yàn)樗惶峁〩adoop支持()。60、Ganglia不僅可以進(jìn)行監(jiān)控,也可以進(jìn)行報(bào)警()。四、簡(jiǎn)答題(6題,每題5分,共30分)61、試論述實(shí)現(xiàn)矩陣向量乘法與矩陣乘法采用不同MapReduce策略的原因。62、試論述HBase的三層結(jié)構(gòu)中各層次的名稱和作用。答:63、Storm集群中的Master節(jié)點(diǎn)和Work節(jié)點(diǎn)各自運(yùn)行什么后臺(tái)進(jìn)程?這些進(jìn)程又分別負(fù)責(zé)什么工作?答:64

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論