數(shù)據(jù)工程師培訓(xùn)題庫(kù)(一)_第1頁(yè)
數(shù)據(jù)工程師培訓(xùn)題庫(kù)(一)_第2頁(yè)
數(shù)據(jù)工程師培訓(xùn)題庫(kù)(一)_第3頁(yè)
數(shù)據(jù)工程師培訓(xùn)題庫(kù)(一)_第4頁(yè)
數(shù)據(jù)工程師培訓(xùn)題庫(kù)(一)_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、星環(huán)信息科技(上海)有限公司6、下列計(jì)算框架A . MapReduceTD懶據(jù)平智訓(xùn)證工程師試題B . MATLAB姓名:分?jǐn)?shù):【說(shuō) C . sparka)有觀鼠30題,每題2分,總計(jì)60分 b)主觀題4題,每題10分,總計(jì)40分7)、湃女單0卜卷和托管表描述正確的是()A處表甲數(shù)叫g(shù)儲(chǔ)在本g 托管用的數(shù)據(jù)存儲(chǔ)在hdfs上【不智、項(xiàng)硒w泗會(huì)減好共Incepto)上的元數(shù)據(jù)不會(huì)刪除數(shù)據(jù)文件,刪除外表兩者都 公確ijHFS服務(wù)中,為了保證 Name Node高可用性的角色不包括()&姍界ode會(huì)刪除Inceptor上的元數(shù)據(jù)不會(huì)刪除數(shù)據(jù)文件,刪除托管表兩者都會(huì)被肺屋阿皿1 NodeC、.

2、ZKFC管表或外表,incepotr上的元數(shù)據(jù)和數(shù)據(jù)文件都會(huì)被刪除D . Zookeeper8、以下對(duì)分桶表的描述正確的是()2、NAm卵*"螂岳怖SEE幽1碗柳吳的是(A;嘛怖覷H洲簡(jiǎn)啟動(dòng)時(shí)對(duì)數(shù)據(jù)有效性進(jìn)行檢查&楠麻照|沙塊進(jìn)行必要的復(fù)制或刪除R事幡樹(shù)鼾安全模式D.允許用戶對(duì)文件系統(tǒng)進(jìn)行讀寫(xiě)操作9、以下關(guān)于inceptor excutor資源配置的說(shuō)法正確的有()3、儂怛c贈(zèng)得DF辨幄* 3atio殳黨戰(zhàn)於小為128M此時(shí)我們上傳一份64M 的數(shù)做文Ehu密州襁樣的是HDFS呢就咨 東使用的應(yīng)輯core數(shù)量C、 . 64xcutor內(nèi)核數(shù)和內(nèi)存配置比例一般為1 core:2

3、G memoryD、 . 1 Excutor分布可以指定每個(gè)節(jié)點(diǎn)運(yùn)行的excutor數(shù)量或executor在集群上運(yùn)行的總會(huì)支8他不能指定運(yùn)行的節(jié)點(diǎn)D . 192M 10、假設(shè)使用場(chǎng)景中有如下查詢語(yǔ)句SELEC國(guó)eY/W花OUW歐AV蜘醐是()FROM Empwei源WHERE Depfrtmtn1度IT'管理groUp BYSOe擷口的數(shù)據(jù)塊ORdEr BY娥 Region;通過(guò)holodesk的cube和index手段對(duì)這種過(guò)濾率和聚合率高的業(yè)務(wù)進(jìn)行優(yōu)化,以下建5i孤麗 %務(wù)中,包含以下哪種角色()A. . ResRuAeMTABLE EmployeeB . NodeManager

4、RTiEs(C . AppacheionMAMrD . ConWrtment,''='Sex, Region'B. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = 'RAM', ''='Sex, Region' ''='Department' )C. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = "Department", '&

5、#39;='Department', ''='Sex, Region' )D. CREATE TABLE Employee TBLPROPERTIES ( 'cache' = 'RAM', ''='Department', '='Sex' )11、關(guān)于Hyperbase全局索引的描述,哪些是正確的()A.核心是倒排表B.全局索引概念是對(duì)應(yīng)Rowkey這個(gè)"一級(jí)"索引C.全局索引使用平衡二叉樹(shù)D.全局索引使用B+樹(shù)檢索數(shù)據(jù)12、以下為Hype

6、rbase分布式存儲(chǔ)的最小單元的是()A、Region serverB、RegionC、StoreFileD、Store13、以下有關(guān)Hyperbase說(shuō)法正確的是()A、數(shù)據(jù)類型豐富,支持 String、Int、Char等類型B、Key/value 系統(tǒng),key 由 Row,Column Family,Column Qualifier 組成C、Hyperbase表中rowkey有序,按字典序降序排列D、以上說(shuō)法都不正確14、以下關(guān)于StreamSQL的概念描述正確的是()A. Stream是數(shù)據(jù)流B. Streamjob是對(duì)一個(gè)或多個(gè)stream進(jìn)行計(jì)算并將結(jié)果寫(xiě)進(jìn)一個(gè)流的任務(wù)C. Appl

7、ication 是一個(gè)或多個(gè) streamjob 的集合D.以上說(shuō)法都不正確星環(huán)信息科技(上海)有限公司星環(huán)信息科技(上海)有限公司15、某交通部門(mén)通過(guò)使用流監(jiān)控全市過(guò)往24小時(shí)各個(gè)卡口數(shù)據(jù),要求每分鐘更新一次,原始流為org_stream ,以下實(shí)現(xiàn)正確的是()A. CREATE STREAMWINDOW traffic_stream AS SELECT * FROM original_stream STREAM w1 AS (length '1' minute slide '24' hour);B. CREATE STREAM traffic_streamA

8、S SELECT * FROM original_streamSTREAMWINDOW w1 AS (length '1' minute slide '24' hour);C. CREATE STREAM traffic_streamAS SELECT * FROM original_streamSTREAMWINDOW w1 AS (length '24' hour slide '1' minute);D. CREAT6TREAMraffic_streamASSELECT* FROM)riginal_streamAS (leng

9、th'24' second slide '1' minute);16、以下不是 Zookeeper的功能是()A,配置管理B.集群管理C.分布式鎖D.存儲(chǔ)大量數(shù)據(jù)17、以下服務(wù)需要與 zookeeper進(jìn)行通信的是()A. HMasterB. Active NameNodeC. InceptorSQLD. Active ResourceManager18、下列是關(guān)于flume和sqoop對(duì)比的描述,不正確的是()A . flume 主要用來(lái)采集日志而 sqoop主要用來(lái)做數(shù)據(jù)遷移B . flume主要采集流式數(shù)據(jù)而sqoop主要用來(lái)遷移規(guī)范化數(shù)據(jù)C . flum

10、e 和sqoop都是分布式處理任務(wù)D . flume 主要用于采集多數(shù)據(jù)源小數(shù)據(jù)而sqoop用來(lái)遷移單數(shù)據(jù)源數(shù)據(jù)19、有關(guān)使用sqoop抽取數(shù)據(jù)的原理的描述不正確的是()A . sqoop 在抽取數(shù)據(jù)的時(shí)候可以指定map的個(gè)數(shù),map的個(gè)數(shù)決定在hdfs生成的數(shù)據(jù)文件的個(gè)數(shù)B . sqoop抽取數(shù)據(jù)是個(gè)多節(jié)點(diǎn)并行抽取的過(guò)程,因此map的個(gè)數(shù)設(shè)置的越多性能越好C . sqoop 任務(wù)的切分是根據(jù) split字段的(最大值-最小值)/map數(shù)D . sqoop 抽取數(shù)據(jù)的時(shí)候需要保證執(zhí)行當(dāng)前用戶有權(quán)限執(zhí)行相應(yīng)的操作20、sqoop抽取數(shù)據(jù)時(shí)需要做一些數(shù)據(jù)轉(zhuǎn)換的工作,下面說(shuō)法不正確的是()A . -

11、fields-terminated- by ' 01 ' 用來(lái)設(shè)置在 hdfs生成的文件的分割符B . -hive-drop-import-delims用來(lái)設(shè)置在hdfs生成的文件的存儲(chǔ)形式為列存儲(chǔ)C . -null-string 'N'用來(lái)把所有的 String 類型的空值 轉(zhuǎn)換成hive 的NULL值D . -null-non-string 'N'用來(lái)把非 String 類型的空值 轉(zhuǎn)換成hive 的NULL21、下列有關(guān) A .flume B . flume C . flume D . flumeflume的描述不正確的是(是Apache的

12、一個(gè)子項(xiàng)目主要是一個(gè)日志采集,傳輸系統(tǒng)和sqoop功能相似,因此可以相互替代可以同時(shí)采集集群內(nèi)部和集群外部的日志數(shù)據(jù)22、下列sink中哪些是flume不支持的sink ()A . HDFS sinkB . kafka sinkC . memory sinkD . file roll sink23、以下對(duì)ElasticSearch描述不正確的是()E. ElasticSearch是分布式全文搜索引擎F. ElasticSearch集群中分 master 和 data節(jié)點(diǎn)G. ElasticSearch數(shù)據(jù)存儲(chǔ)在 HDFS±H. ElasticSearch數(shù)據(jù)可以按Shard分布在不同

13、的節(jié)點(diǎn)上24、下列不屬于kafka應(yīng)用場(chǎng)景的是()A .常規(guī)的消息收集B .網(wǎng)站活動(dòng)性跟蹤C(jī) .日志收集D .關(guān)系型數(shù)據(jù)庫(kù)和大數(shù)據(jù)平臺(tái)之間的數(shù)據(jù)遷移25、TDH提供哪幾種認(rèn)證模式()A.所有服務(wù)使用簡(jiǎn)單認(rèn)證模式一一所有服務(wù)都無(wú)需認(rèn)證即可互相訪問(wèn)B.所有服務(wù)都啟用 Kerberos認(rèn)證,用戶要提供 Kerberos principal 和密碼(或者 keytab )來(lái)訪問(wèn)各個(gè)服務(wù)C.所有服務(wù)都啟用 Kerberos同時(shí)Inceptor 啟用LDAPU證D.所有服務(wù)都啟用LDAPU證26、以下對(duì)各組件的運(yùn)維頁(yè)面描述不正確的是()A.通過(guò)Name Node的50070頁(yè)面對(duì)HDFS進(jìn)行監(jiān)控B.通過(guò)R

14、esource Manager的8180對(duì)YARN±運(yùn)行的任務(wù)進(jìn)行監(jiān)控C.通過(guò)HMaster的60010對(duì)HBase進(jìn)行監(jiān)控D.通過(guò)Hue Server的8888頁(yè)面登入 Hue27、Inceptor server服務(wù)無(wú)法啟動(dòng)時(shí),該如何查看日志是()A.查看TDH manager所在節(jié)點(diǎn)/var/log/inceptorsql*/目錄下的日志B. 查看 Inceptor server所在節(jié)點(diǎn) /var/log/inceptorsql*/目錄下的日志C.查看Resource Manager所在節(jié)點(diǎn)/var/log/Yarn*/ 目錄下的日志D.查看任意節(jié)點(diǎn)/var/log/incept

15、orsql*/ 目錄下的日志星環(huán)信息科技(上海)有限公司星環(huán)信息科技(上海)有限公司28、以下對(duì)Hadoop組件的應(yīng)用場(chǎng)景描述正確的是()A. Hive主要用于構(gòu)建大數(shù)據(jù)數(shù)倉(cāng),主要做批處理、統(tǒng)計(jì)分析型業(yè)務(wù)B. Hbase主要用于檢索查詢的OLTP業(yè)務(wù)C.曰asticSearch主要用于全文檢索的關(guān)鍵字查詢業(yè)務(wù)D. Spark Streaming 主要用于實(shí)時(shí)數(shù)據(jù)的業(yè)務(wù)場(chǎng)景29、以下不屬于管理角色的是()A . Name NodeB . HMasterC . Resource ManagerD . Node Manager30、下面哪些工作不屬于集群預(yù)安裝工作()A .為集群中每個(gè)節(jié)點(diǎn)的安裝操作系統(tǒng)B .選一個(gè)節(jié)點(diǎn)作為管理節(jié)點(diǎn),修改其/etc/hosts 文件C .安裝Transwarp Manager管理界面D .配置集群安全模式【客觀簡(jiǎn)答題(每題 10分,共40分)】1、集群有8個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)有8塊硬盤(pán)(

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論