2023阿里云ACA大數(shù)據(jù)復習題題庫及答案

上傳人：新*** IP屬地：河北上傳時間：2024-10-27 格式：PDF 頁數(shù)：123 大?。?3.63MB 積分：12 舉報 版權申訴

已閱讀5頁，還剩118頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

阿里云ACA大數(shù)據(jù)復習題

一、選擇題

1.隨著數(shù)據(jù)爆炸式增長，傳統(tǒng)數(shù)據(jù)體系結構已經(jīng)難以有效的處理大量數(shù)據(jù)集的數(shù)據(jù)，主要是因為大數(shù)

據(jù)（）［多選題］*

A、體量大V

B、來源多樣V

C、生成極快V

D、變化周期慢

E、多變V

2.大數(shù)據(jù)時代傳統(tǒng)數(shù)據(jù)架構或典型數(shù)據(jù)庫軟件工具在處理海量數(shù)據(jù)時存在哪些方面的問題？（）［多選

題］*

A、海量數(shù)據(jù)收集V

B、海量數(shù)據(jù)存儲V

C、海量數(shù)據(jù)管理V

D、海量數(shù)據(jù)的分析V

E、數(shù)據(jù)的共享訪問

3.在大數(shù)據(jù)大規(guī)模應用階段，大數(shù)據(jù)的特征已經(jīng)發(fā)展到了8V。下列選項中屬于8V新特性的是（）［多

選題］*

A."Veracity準確性"V

B."Virtual虛擬性"

C."Visualization可視性"V

D.”Validity合法性"V

E.”Vitality動態(tài)性7

4.在《大數(shù)據(jù)時代》一書中，維克托?邁爾-舍恩伯格和肯尼斯可耶提出大數(shù)據(jù)的"4V"特征。"4V"

特征包含（）［多選題］*

A.Volume規(guī)模性V

B.Vitality動態(tài)性

C.Velocity高速性V

D.Variety多樣性V

E.Value價值性V

5.IBM提出的大數(shù)據(jù)"5V"特征和《大數(shù)據(jù)時代》一書中提出的“4V"的區(qū)別在于哪一個特征（）［單

選題］*

A.Volume規(guī)模性

B.Veracity準確性V

C.Velocity高速性

D.Variety多樣性

E.Value價值性

6.大數(shù)據(jù)4V特征之一是"Value”,表明大數(shù)據(jù)本身具有價值，其提供的核心價值是（1［單選題］*

A.單位數(shù)據(jù)價值高，整體數(shù)據(jù)價值低

B.洞察與預測V

C.存儲與計算

D.資源優(yōu)化配置

E.傳統(tǒng)企業(yè)轉型

7.大數(shù)據(jù)的特征，由維克托邁爾-舍恩伯格和肯尼斯克耶編寫的《大數(shù)據(jù)時代》中提出，下哪一個描述

大數(shù)據(jù)的4V特征是錯誤的？（）［單選題］*

A.Volume規(guī)模性

B.Velocity數(shù)據(jù)變化快

C.Value單位數(shù)據(jù)價值密度高V

D.Variety數(shù)據(jù)類型多

8.IBM提出的大數(shù)據(jù)"5V"特征和《大數(shù)據(jù)時代》一書中提出的“4V"的區(qū)別在于哪一個特征（）［單

選題］*

A.Volume規(guī)模性

B.Veracity準確性V

C.Velocity高速性

D.Variety多樣性

EValue價值性

9.伴隨互聯(lián)網(wǎng)技術的發(fā)展，數(shù)據(jù)呈現(xiàn)出爆炸性增長。數(shù)據(jù)的存儲單位從過去的GB到TB,甚至達到

PB、EB。體現(xiàn)出大數(shù)據(jù)的（）特征。［單選題］*

A.Volume規(guī)模性V

B.Veracity準確性

C.Velocity高速性

D.Variety多樣性

E.Value價值性

10.數(shù)據(jù)的種類和來源多樣化。包括結構化、半結構化和非結構化數(shù)據(jù)，具體表現(xiàn)為網(wǎng)絡日志、音頻、

視頻、圖片、地理位置信息等等，多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。體現(xiàn)了大數(shù)據(jù)的（）

特征。［單選題］*

A.Volume規(guī)模性

B.Veracity準確性

C.Velocity高速性

D.Variety多樣性V

E.Value價值性

11.商業(yè)上要求個性化推薦算法達到實時推薦的效果，如:某網(wǎng)站剛剛發(fā)布的新聞或視頻，用戶可以在

幾分鐘甚至更短的內搜索到。體現(xiàn)了大數(shù)據(jù)的（）特征。［單選題］*

A.Volume規(guī)模性

B.Veracity準確性

C.Velocity高速性V

D.Variety多樣性

E.Value價值性

12.阿里的"淘寶小貸，通過對貸款客戶、供應商、經(jīng)營信用等全方位的評估，就可以在沒有見面情

況下，給客戶放款，這需要在海量的數(shù)據(jù)中判斷客戶的信用。在大數(shù)據(jù)應用中有效客戶量或數(shù)據(jù)量，并不

是數(shù)據(jù)越大這個值越高，而是反比。體現(xiàn)了大數(shù)據(jù)的（）特征。［單選題］*

A.Volume規(guī)模性

B.Veracity準確性

C.Velocity高速性

D.Variety多樣性

E.Value價值性V

13.我們購買電影票前，常常會打開支付寶的"電影演出"小程序，看看電影口碑評分，影評的真實

性會影響消費者的購買行為。收集的數(shù)據(jù)有真有假，那么會對大數(shù)據(jù)分析的結果有影響。體現(xiàn)了大數(shù)據(jù)的

（）特征。［單選題］*

A.Volume規(guī)模性

B.Veracity準確性V

C.Velocity高速性

D.Variety多樣性

E.Value價值性

14.數(shù)據(jù)可視化指使用（）等工具對數(shù)據(jù)進行編碼，在視覺上傳達定量信息。［多選題］*

A.點V

B.線V

C.二維數(shù)據(jù)庫表

D.統(tǒng)計圖或信息圖表V

E.圖表V

15.大數(shù)據(jù)處理流程一般分為5個步驟:數(shù)據(jù)采集、數(shù)據(jù)預處理、（\數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化。［單

選題］*

A.數(shù)據(jù)存儲V

B.數(shù)據(jù)計算

C.數(shù)據(jù)集成

D.數(shù)據(jù)歸約

16.數(shù)據(jù)采集是數(shù)據(jù)預處理的第一步，它是指使用技術手段進行（\［單選題］*

A.數(shù)據(jù)存儲V

B.數(shù)據(jù)分析

C.數(shù)據(jù)收集

D.數(shù)據(jù)挖掘

17.數(shù)據(jù)預處理是將原始數(shù)據(jù)轉換為可理解的格式的過程，數(shù)據(jù)預處理的步驟不包含的選項是？（）［單

選題］*

A.數(shù)據(jù)集成

B.數(shù)據(jù)清洗

C.數(shù)據(jù)脫敏V

D.數(shù)據(jù)歸約

E.數(shù)據(jù)變換

18.有專家在總結人類科研方式的時候，指出人類一共歷經(jīng)了經(jīng)驗科學、理論科學、計算科學和數(shù)據(jù)

密集型科學四種科研方式，其中數(shù)據(jù)密集型科學的代表實驗是？（）［單選題］*

A.典型案例:伽利略球體落地實驗

B.典型案例:阿基米德浮力定律

C.典型案例:超級計算機模擬核爆炸實驗

D.典型案例:大數(shù)據(jù)提速藥物研發(fā)的應用V

19.案例:政務數(shù)據(jù)中臺匯聚了自然人、法人組織、城市資產(chǎn)、城市感知、行為事件、地理空間、宏觀

經(jīng)濟、自然資源、公共服務、電子證照十大主題政務數(shù)據(jù)，開展模型治理和數(shù)據(jù)清洗加工，事前以標準事

項庫為最佳實踐優(yōu)化地方事項庫，事中提供統(tǒng)一的標準數(shù)據(jù)服務，事后對辦件庫分析得出優(yōu)化點反過來豐

富標準事項庫，形成事前事中事后的閉環(huán)。政務數(shù)據(jù)中臺基于政務行業(yè)數(shù)據(jù)模型及智能算法，助力各地政

府快速構建數(shù)據(jù)智能應用，提升各地區(qū)各部門網(wǎng)上政務服務水平。該案例體現(xiàn)了大數(shù)據(jù)在（）領域的應用。

［單選題］*

A.電商

B.人工智能

C.金融風險管控

D.政府決策V

20.云計算是與信息技術、軟件、互聯(lián)網(wǎng)相關的一種服務，這種計算資源共享池叫做"云"，云計算把

許多計算資源集合起來，通過軟件實現(xiàn)自動化管理，只需要很少的人參與，就能讓資源被快速提供。關于

云計算的特點，描述正確的是？（）［多選題］*

A.超大規(guī)模計算V

B.虛擬化V

C.通用性V

D.成本增加

E.維護難度加大

21.云計算的計算能力作為一種商品，可以在互聯(lián)網(wǎng)上流通，就像水、電、煤氣一樣，可以方便地取

用。體現(xiàn)了云計算的特點是（）［單選題］*

A.通用性

B.動態(tài)擴展

C.按需服務V

D.虛擬化

22.云計算和大數(shù)據(jù)的關系密不可分，下列關于云計算和大數(shù)據(jù)的關系，描述正確的是（）［多選題］*

A.大數(shù)據(jù)為云計算提供了技術基礎

B.云計算為大數(shù)據(jù)提供用武之地

C.云計算解決大數(shù)據(jù)應用中存在的存儲、計算等問題，所以云計算是大數(shù)據(jù)的一種技術展現(xiàn)形式”

D大數(shù)據(jù)是以海量數(shù)據(jù)為基礎，為各種計算服務技術提供數(shù)據(jù)支撐，保證技術應用（云計算、物聯(lián)網(wǎng)

等）的可靠性V

23.下列選項中，對公有云、私有云、混合云描述正確的是？（）［多選題］*

A.公有云是由云服務提供商控制，用于云服務用戶和資源的云部署模式V

B.私有云是由云服務客戶控制，用于單一云服務用戶和資源專用的云部署模式。部署在企業(yè)內部，由

企業(yè)內部管理,保證了網(wǎng)絡的安全V

C.混合云是由云服務提供商提供的多種本地資源的組合，但也可以包含多種不帶有本地組件的云平臺

和云服V

D.公有云采用服務租用模式，私有云必須由用戶一次性投入

24.阿里云的云計算提供了多種服務模式,其中應用層使用的是（）［單選題］*

A.SaaSV

B.PaaS

C.IaaS

D.全部本地布署

25.阿里云的云計算提供了多種服務模式，其中平臺層使用的是（）［單選題］*

A.SaaS

B.PaaSV

C.IaaS

D.全部本地布署

26.阿里云的云計算提供了多種服務模式，其中基礎設施使用的是（）［單選題］*

A.SaaS

B.PaaS

C.laaSV

D.全部本地布署

27.云計算和大數(shù)據(jù)的關系密不可分，關于云計算和大數(shù)據(jù)的區(qū)別，描述正確的是？()［單選題］*

A.大數(shù)據(jù)處理的對象是互聯(lián)網(wǎng)資源和應用，云計算處理的對象是數(shù)據(jù)

B.大數(shù)據(jù)是一種互聯(lián)網(wǎng)的虛擬資源存貯，云計算總的來說是一種信息資產(chǎn)

C.”大數(shù)據(jù)的出現(xiàn)在于用戶服務需求的增長，及企業(yè)處理業(yè)務能力的提高，云計算的出現(xiàn)在于用戶和社會

各行各業(yè)所產(chǎn)生大的數(shù)據(jù)呈現(xiàn)幾何倍數(shù)的增長"

D.云計算的價值則是能幫助企業(yè)等壓縮其成本，起到節(jié)約效果。在龐大的數(shù)據(jù)中挖掘其中有效、有價

值的信息這就是大數(shù)據(jù)的價值V

28.()平臺供應商將應用軟件統(tǒng)一部署在自己的服務器上，客戶可以根據(jù)工作實際需求，通過互聯(lián)

網(wǎng)向廠商定購所需的應用軟件服務，按定購的服務多少和時間長短向廠商支付費用。［單選題］*

A.SaaSV

B.PaaS

C.IaaS

D.Nas

29.()平臺提供包括操作系統(tǒng)和圍繞特定應用的必需的服務，供應商提供各種開發(fā)和分發(fā)應用的解

決方案，比如虛擬服務器、操作系統(tǒng)和SDK、點外賣回家吃披薩，自供桌子碗筷等。［單選題］*

A.SaaS

B.PaaSV

C.IaaS

D.Nas

30.()平臺將基礎設施(計算資源和存儲)作為服務出租。如阿里云的各種云資源、自己購買原材料制

作披薩。［單選題］*

A.SaaS

B.PaaS

C.laaSV

D.Nas

31.關于云計算在許多領域有諸多應用，如政務、教育、各種產(chǎn)業(yè)、醫(yī)療等有明顯的表現(xiàn)，描述正確

的是（）［多選題］*

A.政務云，部署公共安全管理、容災備份、城市管理、應急管理、智能交通、社會保障等應用，通過

集約化建設、管理和運行，可以實現(xiàn)信息資源整合和政務資源共享，推動政務管理創(chuàng)新，加快向服務型政

府轉型V

B.醫(yī)療云，實現(xiàn)遠程醫(yī)療，電子病歷，專家會診等V

C.企業(yè)以低廉的成本建立財務、供應鏈、客戶關系等管理應用系統(tǒng)，大大降低企業(yè)信息化門檻，迅速

提升企業(yè)信息化水平，對企業(yè)市場競爭力沒有明顯增加

D.教育云，整合教育資源，實現(xiàn)教育資源共享V

32.關于云計算在許多領域有諸多應用，如政務、教育、各種產(chǎn)業(yè)、醫(yī)療等有明顯的表現(xiàn)，描述正確

的是（）［多選題］*

A.安全管理、容災備份、城市管理、應急管理、智能交通、社會保障等應用，通過集約化建設、管理

和運行，可以實現(xiàn)信息資源整合和政務資源共享，推動政務管理創(chuàng)新，加快向服務型政府轉型V

B.醫(yī)療云，實現(xiàn)遠程醫(yī)療，電子病歷，專家會診等V

C.企業(yè)以低廉的成本建立財務、供應鏈、客戶關系等管理應用系統(tǒng)，大大降低企業(yè)信息化門檻，迅速

提升企業(yè)信息化水平，對企業(yè)市場競爭力沒有明顯增加

D.教育云，整合教育資源，實現(xiàn)教育資源共享V

33.以下哪一項技術為大數(shù)據(jù)提供了技術基礎，大數(shù)據(jù)為這項技術提供用武之地？（）［單選題］*

A.內存計算機

B.網(wǎng)絡計算機

C.云計算V

D.并行計算

34.云計算技術在大數(shù)據(jù)應用過程中提供了哪些支持？（）［多選題］*

A.海量數(shù)據(jù)存儲技術V

B.數(shù)據(jù)清洗和數(shù)據(jù)挖掘

C.分布式計算V

D.海量數(shù)據(jù)管理技術V

35.云計算和大數(shù)據(jù)的關系密不可分，下列關于云計算和大數(shù)據(jù)的關系，描述正確的是（）［多選題］*

A.大數(shù)據(jù)為云計算提供了技術基礎

B.云計算為大數(shù)據(jù)提供用武之地

C.云計算解決大數(shù)據(jù)應用中存在的存儲、計算等問題，所以云計算是大數(shù)據(jù)的一種技術展現(xiàn)形式V

D.大數(shù)據(jù)是以海量數(shù)據(jù)為基礎，為各種計算服務技術提供數(shù)據(jù)支撐，保證技術應用（云計算、物聯(lián)網(wǎng)

等）的可靠性V

36.隨著科技的發(fā)展，云計算和大數(shù)據(jù)關系密不可分，下列選項中，關于云計算與大數(shù)據(jù)的聯(lián)系，描

述正確的是？（）［多選題］*

A.云計算為大數(shù)據(jù)提供了技術基礎V

B.大數(shù)據(jù)為云計算提供用武之地V

C.大數(shù)據(jù)是以技術為體系基礎，解決云計算應用中存在的存儲、計算等問題，所以云計算是大數(shù)據(jù)的

一種技術展現(xiàn)形式

D.大數(shù)據(jù)是以海量數(shù)據(jù)為基礎，為各種計算服務技術提供數(shù)據(jù)支撐，保證技術應用（云計算、物聯(lián)網(wǎng)

等）的可靠性V

37.物聯(lián)網(wǎng)（IoT.Internetofthings）即"萬物相連的互聯(lián)網(wǎng)"，是互聯(lián)網(wǎng)基礎上的延伸和擴展的

網(wǎng)絡，將各種信息傳感設備與網(wǎng)絡結合起來而形成的一個巨大網(wǎng)絡，實現(xiàn)任何時間、任何地點，人、機、

物的互聯(lián)互通。下列選項中，屬于物聯(lián)網(wǎng)特點的是？（）［多選題］*

A.整體感知V

B.可靠傳輸V

C.智能處理V

D.挖掘分析

38.物聯(lián)網(wǎng)可以利用射頻識別、二維碼、智能傳感器等感知設備感知獲取物體的各類信息。體現(xiàn)了物

聯(lián)網(wǎng)的（）特點。［單選題］*

A.整體感知V

B.智能處理

C.可靠傳輸

D.挖掘分析

39.物聯(lián)網(wǎng)通過對互聯(lián)網(wǎng)、無線網(wǎng)絡的融合，將物體的信息實時、準確地傳送，以便信息交流、分享。

體現(xiàn)了物聯(lián)網(wǎng)的（）特點。［單選題］*

A.挖掘分析

B.可靠傳輸V

C.智能處理

D.整體感知

40.使用各種智能技術，對感知和傳送到的數(shù)據(jù)、信息進行分析處理，實現(xiàn)監(jiān)測與控制的智能化。體

現(xiàn)了物聯(lián)網(wǎng)的（）特點。［單選題］

A.可靠傳輸

B.整體感知

C.智能處理V

D.挖掘分析

41.云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)是時下最熱的三種技術，三者之間緊密結合，相互聯(lián)系，促進技術生態(tài)

的繁榮發(fā)展。關于云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)三者之間的關系，描述正確的是？（）［多選題］*

A.大數(shù)據(jù)為云計算提供了技術基礎

B.物聯(lián)網(wǎng)是大數(shù)據(jù)的重要來源V

C.物聯(lián)網(wǎng)為云計算技術提供可廣闊的應用空間V

D.云計算為物聯(lián)網(wǎng)提供海量數(shù)據(jù)存儲能力V

E.物聯(lián)網(wǎng)技術為大數(shù)據(jù)數(shù)據(jù)分析提供支持

F.云計算為大數(shù)據(jù)提供用武之地

42.針對狹義的Hadoop的描述，Hadoop使用（）技術解決數(shù)據(jù)存儲的問題。（）［單選題］*

A、HDFSV

B、Redis

C、MongoDB

D、MySQL

43.針對狹義的Hadoop的描述，Hadoop使用（）技術解決分布式計算的問題。（）［單選題］*

A、Flink

B、MaxCompute

C、MapReduceV

D、Storm

44.Hadoop底層會維護多個數(shù)據(jù)副本，當某個節(jié)點出現(xiàn)故障后,也不會造成損失，為應用穩(wěn)定運作提

供了保障。體現(xiàn)了Hadoop的（）特點。（）［單選題］*

A、高可靠V

B、高擴展

C、高效率

D、高容錯

E、低成本

45.Hadoop集群支持熱插拔，在增加或刪除節(jié)點時無需重新啟動集群，極大提高了集群擴展性能。體

現(xiàn)了Hadoop的（）特點。（）［單選題］*

A、高可靠

B、高擴展V

C、高效率

D、高容錯

E、低成本

46.Hadoop能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù)，并保證各個節(jié)點的動態(tài)平衡,因此處理速度非?？臁ｓw

現(xiàn)了Hadoop的（）特點。（）［單選題］*

A、高可靠

B、高擴展

C、高效率V

D、高容錯

E、低成本

47.Hadoop能夠自動保存數(shù)據(jù)的多個副本，并且能夠自動將失敗的任務重新分配。體現(xiàn)了Hadoop

的（）特點。（）［單選題］*

A、高可靠

B、高擴展

C、高效率

D、高容錯V

E、低成本

48.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎架構。用戶可以在不了解分布式底層細

節(jié)的情況下，開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。下列關于Hadoop的優(yōu)勢，描

述不正確的是（）［單選題］*

A、對于Hadoop來說，當存儲空間不夠，可以添加機器進行擴展如果計算能力不夠，可以配置添加

MapReduce節(jié)點來擴展

B、支持多數(shù)據(jù)源、在應用、用戶方面僅支持單一使用

C、應用范圍廣泛，可以處理文件、數(shù)據(jù)庫、半結構化數(shù)據(jù)V

D、Hadoop是企業(yè)級的平臺，它高可靠、多租戶、而且具有很高的安全性

49.Hadoop是一個分布式計算平臺，用戶可以輕松地在Hadoop上開發(fā)、運行與處理海量數(shù)據(jù)的應

用程序，它主要特點有（）（）［多選題］*

A、高可靠V

B、高精度

C、高擴展V

D、高效率V

E、高容錯V

50.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎架構。用戶可以在不了解分布式底層細

節(jié)的情況下，開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。它包含哪些核心模塊？（）［多

選題］*

A、Hadoop公共包

B、Hadoop分布式文件系統(tǒng)（HDFS）V

C、HadoopYARNV

D、Hadoop的分布式消息系統(tǒng)

E、HadoopM叩Reduce4

51.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎架構。用戶可以在不了解分布式底層細

節(jié)的情況下，開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。關于Hadoop的基本模塊，描

述正確的是？（）［單選題］*

A、Common:支持其他Hadoop模塊的通用程序包

B、HDFS:一個分布式文件系統(tǒng)，能夠以高吞吐量訪問應用中的數(shù)據(jù)V

C、MapReduce:一^??作業(yè)調度和資源管理框架

D、YARN：一個基于MapReduce的大數(shù)據(jù)并行處理程序

52.Hadoop是當前最流行的大數(shù)據(jù)分布式基礎架構，它提供了許多與大數(shù)據(jù)相關的核心功能，并支持

許多核心項目。下列選項中，屬于Hadoop核心組件的是？（）［單選題］*

A、Ambari（安裝、部署、配置、管理工具）

B、Oozie（作業(yè)流調度系統(tǒng)）

C、Hive數(shù)據(jù)倉庫

D、MapReduce分布式計算框架V

53.HDFS是開源分布式文件系統(tǒng)，用于（1是整個Hadoop生態(tài)中的重要組件之一。（）［單選題］*

A、文件的存儲與管理V

B、查找文件和文件夾

C、復制、移動文件或文件夾

D、文件刪除和修改

54.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop組件HDFS是（）［單選

題］*

A。工作流引擎

Bo資源管理系統(tǒng)

C,分布式文件系統(tǒng)，

D。列式數(shù)據(jù)庫

55.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop組件MapReduce,描

述正確的是？［單選題］*

A.工作流引擎

Bo數(shù)據(jù)倉庫

C,分布式計算框架，

D.列式數(shù)據(jù)庫

56.M叩Reduce是一個分布式運算程序的編程框架，下面對M叩Reduce描述正確的是？（）［多選

題］*

的核心為函數(shù)和函數(shù)

AoMapReduceMapReduceV

B。MapReduce用于大規(guī)模數(shù)據(jù)集的并行運算V

不需要應開發(fā)者編寫程序來實現(xiàn)功能

CoMapReduce

D。MapReduce設計理念就是"計算向數(shù)據(jù)靠攏"V

57.M叩Reduce是一個分布式運算程序的編程框架，關于M叩Reduce的特點，描述正確的是？［多

選題］*

A.通過配置Map節(jié)點數(shù)與增加機器數(shù)來擴展計算能力V

B。當分配了計算任的節(jié)點失效時，能自動切換到其它節(jié)點運行該任務V

Co提供了分布式編程接口，易于開發(fā)V

D。隨機處理數(shù)據(jù)、避免順序訪問數(shù)據(jù)

58.MapReduce是一個分布式運算程序的編程框架，關于MapReduce,描述正確的是（）［單選題］*

A.適合海量靜態(tài)數(shù)據(jù)（批數(shù)據(jù)）計算V

B,磁盤10開銷不大

C。易編程，適合實時計算

D。是分布式計算框架,當一臺機器失敗后，可以手動切換至其他節(jié)點運行該任務

59.M叩Reduce是一個分布式運算程序的編程框架，下列選項中，屬于M叩Reduce的缺點是（）［單

選題］*

A.并行計算能力有限

B。磁盤10開銷大V

C.延遲低

D。中間結果在內存中

60.MapReduce是一個分布式運算程序的編程框架，關于MarReduce的優(yōu)點，描述正確的是?（）［多

選題］*

A.實現(xiàn)簡單接口，即可完成分布式程序V

B?？梢酝ㄟ^配置Map任務數(shù)來擴展計算能力V

C.使用在分布式計算框架，所以當一臺機器失敗后，可以自動切換至其他節(jié)點運行該任務V

D。只適合少量的數(shù)據(jù)處理

61.下列選項中關于M叩Reduce描述正確的是（）［單選題］*

A.支持離線數(shù)據(jù)與實時數(shù)據(jù)的處理

Bo在對數(shù)據(jù)處理過程中除了支持Map與Reduce方法外還可以自定義方法來完成數(shù)據(jù)的處理

C.使用在分布式計算框架，所以當一臺機器失敗后，會導致計算任重啟

D。過多的磁盤操作缺乏對分布式內存的支持，不能高效的支持迭代式計算V

62.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop組件YARN是（）［單

選題］*

A。工作流引擎

B。資源管理系統(tǒng)V

C。分布式計算框架

D。列式數(shù)據(jù)庫

63.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Pig,描述

正確的是？（）［單選題］*

A、工作流引擎V

B、數(shù)據(jù)倉庫

C、分布式計算框架

D、列式數(shù)據(jù)庫

64.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Hive,描述

正確的是？（）［單選題］*

A、工作流引擎

B、數(shù)據(jù)倉庫V

C、分布式計算框架

D、列式數(shù)據(jù)庫

65.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件MapReduce,

描述正確的是？()［單選題］*

A、工作流引擎

B、數(shù)據(jù)倉庫

C、分布式計算框架V

D、列式數(shù)據(jù)庫

66.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組成，YARN是

()［單選題］*

A、工作流引擎V

B、數(shù)據(jù)倉庫

C、分布式計算框架

D、列式數(shù)據(jù)庫

67.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件HDFS是()

［單選題］*

A、工作流引擎

B、數(shù)據(jù)倉庫

C、分布式計算框架V

D、列式數(shù)據(jù)庫

68.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Sqoop是

()［單選題］*

A、工作流引擎

B、資源管理系統(tǒng)

C、分布式文件系統(tǒng)

D、ETL工具V

69.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Mahout是

()［單選題］*

A、工作流引擎

B、資源管理系統(tǒng)V

C、分布式文件系統(tǒng)

D、ETL工具

70.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Flume是)

［單選題］*

A、工作流引擎V

B、資源管理系統(tǒng)

C、分布式文件系統(tǒng)

D、ETL工具

71.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Ambari是

()［單選題］*

A、日志收集

B、數(shù)據(jù)挖掘庫

C、分布式文件系統(tǒng)

D、安裝、部署、配置、管理工具V

72.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件HBase是）

［單選題］*

A、工作流引擎

B、資源管理系統(tǒng)

C、分布式文件系統(tǒng)

D、列式數(shù)據(jù)庫V

73.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Zoopkeeper

是（）［單選題］*

A、工作流引擎

B、資源管理系統(tǒng)V

C、分布式文件系統(tǒng)

D、列式數(shù)據(jù)庫

74.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件HBase的功能，

描述正確的是？（）［單選題］*

A、可擴展的分布式數(shù)據(jù)庫，支持大表的結構化數(shù)據(jù)存儲V

B、數(shù)據(jù)倉庫基礎架構，提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴展的機器學習和數(shù)據(jù)挖掘庫

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

75.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件Hive的功能,

描述正確的是？（）［單選題］*

A、可擴展的分布式數(shù)據(jù)庫，支持大表的結構化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎架構，提供數(shù)據(jù)匯總和命令行即席查詢功能V

C、可擴展的機器學習和數(shù)據(jù)挖掘庫

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

76.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件Pig的功能,

描述正確的是？（）［單選題］*

A、可擴展的分布式數(shù)據(jù)庫，支持大表的結構化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎架構，提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴展的機器學習和數(shù)據(jù)挖掘庫

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架V

77.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件Mahout,描

述正確的是？（）［單選題］*

A、可擴展的分布式數(shù)據(jù)庫，支持大表的結構化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎架構，提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴展的機器學習和數(shù)據(jù)挖掘庫V

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

78.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件ZooKeeper,

描述正確的是？（）［單選題］*

A、用于分布式應用的高性能協(xié)調服務V

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架，提供對Hadoop。MapReduce和PigJobs的任務調度與協(xié)

調

E、是大數(shù)據(jù)集日志收集的框架

79.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件Apache

Ambari,描述正確的是？（）［單選題］*

A、用于分布式應用的高性能協(xié)調服務

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具V

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架，提供對Hadoop。M叩Reduce和PigJobs的任務調度與協(xié)

調

E、是大數(shù)據(jù)集日志收集的框架

80.1隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件Sqoop,描

述正確的是？（）［單選題］*

A、用于分布式應用的高性能協(xié)調服務

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具V

D、是一個基于工作流引擎的開源框架，提供對Hadoop。M叩Reduce和PigJobs的任務調度與協(xié)

調

E、是大數(shù)據(jù)集日志收集的框架

81.1下列選項中，關于Hadoop生態(tài)組件Oozie,描述正確的是？（）［單選題］*

A、用于分布式應用的高性能協(xié)調服務

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架，提供對Hadoop。M叩Reduce和PigJobs的任務調度與協(xié)

調V

E、是大數(shù)據(jù)集日志收集的框架

82.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)組件Flume,描述

正確的是？（）［單選題］*

A、用于分布式應用的高性能協(xié)調服務

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架，提供對Hadoop。MapReduce和PigJobs的任務調度與協(xié)

調

E、是大數(shù)據(jù)集日志收集的框架V

83.Hadoop是當前最流行的大數(shù)據(jù)分布式基礎架構，提供了許多與大數(shù)據(jù)相關的核心功能，并支持許

多核心項目。下列選擇中，屬于Hadoop生態(tài)圈組成的是？（）［多選題］*

A、Ambari（安裝、部署、配置、管理工具）V

B、Oozie（作業(yè)流調度系統(tǒng)）V

C、Hive數(shù)據(jù)倉庫V

D、MapReduce分布式計算框架V

E、Pig工作流引擎V

F、Kafka分布式消息

84.Hive是基于Hadoop的一個（）工具，用于查詢和管理駐留在分布式存儲系統(tǒng)中的大型數(shù)據(jù)集。

（）［單選題］*

A、關系型數(shù)據(jù)庫

B、數(shù)據(jù)倉庫V

C、非關系型數(shù)據(jù)庫

D、數(shù)據(jù)庫

85.Hive是構建在Hadoop上的數(shù)據(jù)倉庫框架，關于Hive的描述正確的是？（）［單選題］*

A、Hive的本質是將MapReduce轉化成HQL程序，然后進一步提交給Hadoop框架執(zhí)行

B、不依賴分布式并行計算模型M叩Reduce處理數(shù)據(jù)

C、定義了簡單的類SQL查詢語言HiveQL,用戶可以通過編寫的HiveQL語句運行MapReduce任

務V

D、不依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)

86.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Hive,描述

正確的是？［單選題］*

A.工作流引擎

Bo數(shù)據(jù)倉庫V

C,分布式計算框架

D。列式數(shù)據(jù)庫

87.Hive是基于Hadoop的一個（）的工具,用于查詢和管理在分布式存儲系統(tǒng)中的大型數(shù)據(jù)集。［單

選題］*

A.關系型數(shù)據(jù)庫

B,數(shù)據(jù)倉庫V

C。非關系型數(shù)據(jù)庫

D。數(shù)據(jù)庫

88.Hive是構建在Hadoop上的數(shù)據(jù)倉庫框架，關于Hive的描述正確的是?［單選題］*

A.Hive的本質是將MapReduce轉化成HQL程序，然后進一步提交給Hadoop框架執(zhí)行V

B.不依賴分布式并行計算模型MapReduce處理數(shù)據(jù)

C.定義了簡單的類SQL查詢語言HiveQL,用戶可以通過編寫的HiveQL語句運行M叩Reduce任務

D.不依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)

89.HBase是一個分布式的、面向列的開源數(shù)據(jù)庫，源于（）的一篇論文《BigTable:一個結構化數(shù)據(jù)

的分布式存儲系統(tǒng)》。（）［單選題］*

A、GoogleV

B、Oracle

C、Apache

D、Microsoft

90.存儲數(shù)據(jù)的結構可以分為:結構化、非結構化、半結構化。下列選項中，屬于非結構化數(shù)據(jù)的是？（）

［單選題］*

A、JSON文檔

B、XML文檔

C、日志文件

D、圖片V

91.存儲數(shù)據(jù)的結構可以分為:結構化、非結構化、半結構化。下列選項中，屬于半結構化數(shù)據(jù)的是？（）

［單選題］*

A、JSON文檔V

B、視頻

C、文本

D、圖片

92.以下內容屬于（）類型的數(shù)據(jù)？（）

〈/student>"［單選題］*

A、結構化

B、半結構化V

C、非結構化

93.以下內容是應用程序運行過程中產(chǎn)生的日志信息，它屬于（）類型的數(shù)據(jù)？（）

1997-07-01,10

1998-04-01,26

1997-05-01,-5

1989-06-01,25

1925-05-01,45”［單選題］*

A、結構化

B、半結構化V

C、非結構化

94.HBase是一個分布式的、面向列的開源數(shù)據(jù)庫，關于HBase的特點，描述正確的是？（）［多選題］

A、高可靠V

B、高性能V

C、高精度

D、可伸縮V

95.隨著大數(shù)據(jù)時代的發(fā)展,也八力生態(tài)圈組件越來越豐富。關于出血叩生態(tài)組件延2$6的功能，

描述正確的是?［單選題］*

A,可擴展的分布式數(shù)據(jù)庫，支持大表的結構化數(shù)據(jù)存儲V

B,數(shù)據(jù)倉庫基礎架構，提供數(shù)據(jù)匯總和命令行即席查詢功能

C?？蓴U展的機器學習和數(shù)據(jù)挖掘庫

D。用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

96.Mahout是ApacheSoftwareFoundation（ASF）旗下的-t?開源項目，以下關于Mahout

說法正確的是？（）［單選題］*

A、存儲框架

B、數(shù)據(jù)管理框架

C、數(shù)據(jù)可視化專業(yè)工具

D、可擴展的機器學習算法及其實現(xiàn)V

97.Mahout是ApacheSo代wareFoundation（ASF）旗下的一^^開源項目，提供一些可擴展的（）

領域經(jīng)典算法的實現(xiàn),旨在幫助開發(fā)人員更加方便快捷地實現(xiàn)算法,創(chuàng)建智能應用程序。（）［單選題］*

A、人工智能

B、機器學習V

C、云計算

D、數(shù)據(jù)分析

98.在創(chuàng)建智能應用程序時，Mahout包含許多算法實現(xiàn)，具體包含（）［多選題］*

A、聚類V

B、分類V

C、線性回歸

D、推薦過濾V

E、頻繁子項挖掘V

99.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Mahout是

（）［單選題］*

A,工作流引擎

Bo機器學習和數(shù)據(jù)挖掘庫V

C.分布式文件系統(tǒng)

D。ETL工具

100.下列對Hadoop生態(tài)組件Mahout,描述正確的是？（）［單選題］*

A、可擴展的分布式數(shù)據(jù)庫，支持大表的結構化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎架構，提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴展的機器學習和數(shù)據(jù)挖掘庫V

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

101.Pig是Hadoop生態(tài)圈的組件之一，Pig的數(shù)據(jù)處理語言采?。ǎ┓绞剑徊揭徊降剡M行處理。

（）［單選題］*

A、數(shù)據(jù)流V

B、并行計算

C、分布式計算

D、分布式協(xié)調服務

102.Pig是Hadoop生態(tài)圈的組件之一,關于Pig,描述正確的是？（）［多選題］*

A、Pig是一個基于Hadoop的大規(guī)模數(shù)據(jù)分析平臺V

B、Pig是一個用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架V

C、Pig有一毒口SQL類似的執(zhí)行語句，處理的對象是HDFS上的文件V

D、Pig的數(shù)據(jù)處理語言采取分布式消息訂閱發(fā)布方式

103.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Pig,描述

正確的是？［單選題］*

A.大型數(shù)據(jù)集計算與分析平臺V

Bo數(shù)據(jù)倉庫

C.分布式計算框架

D.列式數(shù)據(jù)庫

104.ZooKeeper是()的框架。Hadoop的許多組件都依賴于ZooKeeper，比如HDFSNameNode

HA的自動切換、HBase的高可用，以及SparkStandalone模式Master的HA機制都是通過

ZooKeeper來實現(xiàn)的。()［單選題］*

A、分布式協(xié)調服務V

B、分布式計算

C、并行計算

D、分布式存儲

105.在Hadoop生態(tài)圈中，Zoopkeeper的主要作用是完成()［單選題］*

A、工作流引擎

B、分布式協(xié)調服務V

C、分布式文件系統(tǒng)

D、列式數(shù)據(jù)庫

106.Sqoop是Hadoop生態(tài)圈的組件之一，主要用于在(\數(shù)據(jù)倉庫(Hive)和Hadoop之間轉移數(shù)

據(jù)的框架。()［單選題］*

A、非關系型數(shù)據(jù)庫

B、關系數(shù)據(jù)庫V

C、NoSQL數(shù)據(jù)庫

107.Sqoop是Hadoop生態(tài)圈的組件之一，它可以將數(shù)據(jù)從Hadoop中導出到（）數(shù)據(jù)庫中（）［單

選題］*

A、Redis

B、MySQLV

C、Memcache

D、MongoDB

108.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Sqoop是

（）［單選題］*

A.工作流引擎

Bo資源管理系統(tǒng)

C.分布式文件系統(tǒng)

工具

DoETLV

109.Flume是由Cloudera提供的一個分布式、高可靠、高可用的服務，是用于分布式的（）框架（）

［單選題］*

A、企業(yè)業(yè)務數(shù)據(jù)收集

B、網(wǎng)絡數(shù)據(jù)收集

C、傳感器數(shù)據(jù)收集

D、日志收集V

110.Flume是Hadoop生態(tài)圈的組件之一，關于Flume的組件功能，描述正確的是（）［多選題］*

A、Source負責接收日志數(shù)據(jù)，不支持不同類型和不同格式的日志，所以需要對日志數(shù)據(jù)處理類型和

格式

B、Source將日志數(shù)據(jù)的寫入到Channel并負責處理操作"V

C、Sink負責從Channel中的獲取數(shù)據(jù)，寫入到接收方，

D、Sink可以獲取接收方的數(shù)據(jù)

111.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Flume是

（）的框架。［單選題］*

A。日志收集V

Bo數(shù)據(jù)挖掘庫

C。分布式文件系統(tǒng)

D。ETL工具

112.Ambari是Hadoop生態(tài)圈的組件之一，關于Ambari的功能描述，錯誤的是？（）［單選題］*

A、Ambari提供了一個分步向導，用于在任意數(shù)量的主機上安裝Hadoop服務

B、提供了一個儀表板來監(jiān)控Hadoop集群的健康和狀態(tài)?？梢赃M行指標收集，不能實現(xiàn)對節(jié)點故障、

剩余磁盤空間不足等做出系統(tǒng)警報V

C、使用AmbariRESTAPI可以將Hadoop配置、管理和監(jiān)控功能輕松集成到他們自己的應用程序

中

D、Ambari為在整個集群中啟動、停止和重新配置Hadoop服務提供集中管理

113.Ambari是Hadoop生態(tài)圈的組件之一Ambari是一種基于Web的工具支持ApacheHadoop

集群的（）［多選題］*

A、配置V

B、管理V

C、監(jiān)控V

D、協(xié)調

114.隨著大數(shù)據(jù)時代的發(fā)展，Hadoop生態(tài)圈組件越來越豐富。關于Hadoop生態(tài)圈組件Ambari

是（）［單選題］*

A.日志收集

Bo數(shù)據(jù)挖掘庫

C。分布式文件系統(tǒng)

D.安裝、部署、配置、管理工具V

115.Oozie是Hadoop生態(tài)圈的組件之一，關于Oozie,描述正確的是？（）［多選題］*

A、Oozie是一個用來管理Hadoop生態(tài)圈job的工作流調度系統(tǒng)V

B、Oozie由Apache公司貢獻給Cloudera

C、Oozie是運行于JavaServlet容器上的一個JavaWeb應用V

D、Oozie的目的是按照DAG（有向無環(huán)圖）調度一系列的Map/Reduce或者Hive等任務。V

116.Spark最早是源于加州大學伯克利分校的MateiZaharia等人發(fā)表的一篇論文。論文提出了一種

（）的概念。（）［單選題］*

A、分布式并行計算

B、分布式文件系統(tǒng)

C、分布式彈性數(shù)據(jù)集（RDD）V

D、分布式微服務

117.ApacheSpark是用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一（）引擎。（）［單選題］*

A、分析V

B、存儲

C、集成

D、挖掘

核心組件包含:、

118.ApacheSparkSparkStreamingSparkSQLXSparkCore,GraphX,MLlib,

下列哪個選項是對GraphX組件的描述？（）［單選題］*

A、提供流計算組件

B、是一個用來處理結構化數(shù)據(jù)的Spark組件

C、基于內存多語言執(zhí)行的核心引擎

D、是一個分布式圖處理框架，它基于Spark平臺提供對圖計算和圖挖掘易用且簡潔的一個子系統(tǒng)V

119.ApacheSpark核心組件包含:SparkStreaming、SparkSQL.SparkCore.GraphX、MLlib,

下列哪個選項是對MLlib組件的描述？（）［單選題］*

A、提供流計算組件

B、是一個用來處理結構化數(shù)據(jù)的Spark組件

C、基于內存多語言執(zhí)行的核心引擎

D、Spark機器學習庫V

120.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設計的快速通用的計算引擎，關于Spark的特點描述，

正確的是？（）［多選題］*

A、可以使用Python、SQL、Scala、Java或R語言，統(tǒng)一離線計算和實時計算開發(fā)方式V

B、通用的SQL分析，快速構建分析報表，運行速度快于大多數(shù)數(shù)倉計算引擎V

C、大規(guī)模科學計算，支持對PB級數(shù)據(jù)執(zhí)行探索性分析V

D、可以在桌面電腦上訓練機器學習算法，但不能使用相同的代碼擴展到包含數(shù)千臺機器的集群上，需

要修改代碼

121.下列選項中（）可以處理離線數(shù)據(jù)也可以處理實時數(shù)據(jù)的計算框架？（）［單選題］*

A、SparkV

B、Strom

C、Hive

D、Pig

122.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設計的，下列選項中，哪些項不屬于Spark的特點？（）

［單選題］*

A、批處理/流式數(shù)據(jù)

B、SQL分析

C、大規(guī)模數(shù)據(jù)存儲V

D、大規(guī)模科學計算

E、機器學習

核心組件有:、、下

123.ApacheSparkSparkStreamingSparkSQLsSparkCore.GraphXMLlib,

列哪個選項是對SparkCore組件的描述？（）［單選題］*

A、提供流計算組件

B、是一個用來處理結構化數(shù)據(jù)的Spark組件

C、基于內存多語言執(zhí)行的核心引擎V

D、GraphX是一個分布式圖處理框架

124.ApacheSpark核心組件有:SparkStreaming、SparkSQLSparkCore,GraphX、MLlib,下

列哪個選項是對SparkSQL組件的描述？（）［單選題］*

A、提供流計算組件

B、是一個用來處理結構化數(shù)據(jù)的Spark組件V

C、基于內存多語言執(zhí)行的核心引擎

D、是一個分布式圖處理框架

E、Spark機器學習庫

125.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設計的快速通用的計算引擎，下列選項中，哪些是Spark

的優(yōu)勢（）?（）［多選題］*

A、開發(fā)比較簡單，支持多語言開發(fā)V

B、提供了多個高層次、簡潔的APW

C、可以通過RDD彈性分布式數(shù)據(jù)集方式編程，具備容錯特征，能在并行計算中高效的進行數(shù)據(jù)共享，

提升計算性能V

D、統(tǒng)一采用DAG無向有環(huán)圖處理模式

126.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設計的快速通用的計算引擎，下列選項中，哪些是Spark

的核心組件？（）［多選題］*

A、SparkStreamingV

B、SparkSQLV

C、SparkGraphXV

D、Spark10

127.ApacheSpark是一款常用于大數(shù)據(jù)工作負載的開源分布式處理系統(tǒng)，關于Spark核心組件的作

用，描述錯誤的是？（）［單選題］*

A、SparkStreaming提供離線計算組件V

B、SparkSQL是一個用來處理結構化數(shù)據(jù)的Spark組件

C、SparkCore基于內存多語言執(zhí)行的核心引擎

D、GraphX是一個分布式圖處理框架

128.Datax是阿里云DataWorks數(shù)據(jù)集成的開源版本，在阿里巴巴集團內被廣泛使用的（）工具/

平臺。Datax實現(xiàn)了包括MySQL、Oracle,OceanBase、SQLServer,Postgre、HDFS、Hive、ADS、

HBase、TableStore(OTS),MaxCompute(ODPS),Hologres.DRDS等各種異構數(shù)據(jù)源之間高效的數(shù)

據(jù)同步功能。()［單選題］*

A、實時數(shù)據(jù)同步

B、離線數(shù)據(jù)同步V

C、整庫增量同步

D、整表增量徒步

129.Datax是阿里云DataWorks數(shù)據(jù)集成的開源版本，關于Datax的描述，以下說法正確的是()

［多選題］*

A、Datax是離線數(shù)據(jù)同步工具V

B、Datax是在線數(shù)據(jù)同步工具

C、Datax支持異構數(shù)據(jù)源V

D、Datax支持增量數(shù)據(jù)回放

130.Azkaban是一個批量工作流任務調度器。關于Azkaban,描述正確的是？()［單選題］*

A、Azkaban是一個批量工作流任務調度器

B、Azkaban主要用于在一個工作流內以一個特定的順序運行一組工作和流程

C、Azkaban使用job文件建立任務之間的依賴關系，并提供一個易用的Web界面供用戶管理和

調度工作流

D、它的配置是通過簡單的update方式對數(shù)據(jù)表進行修改實現(xiàn)，通過配置中的Dependencies來設

置依賴關系V

131.Azkaban是一個批量工作流任務調度器。關于Azkaban，描述不正確的是?［單選題］*

A.Azkaban是一個批量工作流任務調度器V

B.Azkaban主要用于在一個工作流內以一個特定的順序運行一組工作和流程

c.Azkaban使用job文件建立任務之間的依賴關系，并提供一個易用的Web界面供用戶管理和調

度工作流

D.Azkaban是由Linkedin公司推出的任務調試器，它的配置是通過簡單的update方式對數(shù)據(jù)表進

行修改實現(xiàn)

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2023阿里云ACA大數(shù)據(jù)復習題題庫及答案

文檔簡介

溫馨提示

最新文檔

評論

2023阿里云ACA大數(shù)據(jù)復習題題庫及答案

文檔簡介

溫馨提示

最新文檔

評論

相關文檔