2023阿里云ACA大數(shù)據(jù)復(fù)習(xí)題題庫及答案_第1頁
2023阿里云ACA大數(shù)據(jù)復(fù)習(xí)題題庫及答案_第2頁
2023阿里云ACA大數(shù)據(jù)復(fù)習(xí)題題庫及答案_第3頁
2023阿里云ACA大數(shù)據(jù)復(fù)習(xí)題題庫及答案_第4頁
2023阿里云ACA大數(shù)據(jù)復(fù)習(xí)題題庫及答案_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

阿里云ACA大數(shù)據(jù)復(fù)習(xí)題

一、選擇題

1.隨著數(shù)據(jù)爆炸式增長,傳統(tǒng)數(shù)據(jù)體系結(jié)構(gòu)已經(jīng)難以有效的處理大量數(shù)據(jù)集的數(shù)據(jù),主要是因?yàn)榇髷?shù)

據(jù)()[多選題]*

A、體量大V

B、來源多樣V

C、生成極快V

D、變化周期慢

E、多變V

2.大數(shù)據(jù)時代傳統(tǒng)數(shù)據(jù)架構(gòu)或典型數(shù)據(jù)庫軟件工具在處理海量數(shù)據(jù)時存在哪些方面的問題?()[多選

題]*

A、海量數(shù)據(jù)收集V

B、海量數(shù)據(jù)存儲V

C、海量數(shù)據(jù)管理V

D、海量數(shù)據(jù)的分析V

E、數(shù)據(jù)的共享訪問

3.在大數(shù)據(jù)大規(guī)模應(yīng)用階段,大數(shù)據(jù)的特征已經(jīng)發(fā)展到了8V。下列選項(xiàng)中屬于8V新特性的是()[多

選題]*

A."Veracity準(zhǔn)確性"V

B."Virtual虛擬性"

C."Visualization可視性"V

D.”Validity合法性"V

E.”Vitality動態(tài)性7

4.在《大數(shù)據(jù)時代》一書中,維克托?邁爾-舍恩伯格和肯尼斯可耶提出大數(shù)據(jù)的"4V"特征。"4V"

特征包含()[多選題]*

A.Volume規(guī)模性V

B.Vitality動態(tài)性

C.Velocity高速性V

D.Variety多樣性V

E.Value價值性V

5.IBM提出的大數(shù)據(jù)"5V"特征和《大數(shù)據(jù)時代》一書中提出的“4V"的區(qū)別在于哪一個特征()[單

選題]*

A.Volume規(guī)模性

B.Veracity準(zhǔn)確性V

C.Velocity高速性

D.Variety多樣性

E.Value價值性

6.大數(shù)據(jù)4V特征之一是"Value”,表明大數(shù)據(jù)本身具有價值,其提供的核心價值是(1[單選題]*

A.單位數(shù)據(jù)價值高,整體數(shù)據(jù)價值低

B.洞察與預(yù)測V

C.存儲與計算

D.資源優(yōu)化配置

E.傳統(tǒng)企業(yè)轉(zhuǎn)型

7.大數(shù)據(jù)的特征,由維克托邁爾-舍恩伯格和肯尼斯克耶編寫的《大數(shù)據(jù)時代》中提出,下哪一個描述

大數(shù)據(jù)的4V特征是錯誤的?()[單選題]*

A.Volume規(guī)模性

B.Velocity數(shù)據(jù)變化快

C.Value單位數(shù)據(jù)價值密度高V

D.Variety數(shù)據(jù)類型多

8.IBM提出的大數(shù)據(jù)"5V"特征和《大數(shù)據(jù)時代》一書中提出的“4V"的區(qū)別在于哪一個特征()[單

選題]*

A.Volume規(guī)模性

B.Veracity準(zhǔn)確性V

C.Velocity高速性

D.Variety多樣性

EValue價值性

9.伴隨互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)據(jù)呈現(xiàn)出爆炸性增長。數(shù)據(jù)的存儲單位從過去的GB到TB,甚至達(dá)到

PB、EB。體現(xiàn)出大數(shù)據(jù)的()特征。[單選題]*

A.Volume規(guī)模性V

B.Veracity準(zhǔn)確性

C.Velocity高速性

D.Variety多樣性

E.Value價值性

10.數(shù)據(jù)的種類和來源多樣化。包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),具體表現(xiàn)為網(wǎng)絡(luò)日志、音頻、

視頻、圖片、地理位置信息等等,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。體現(xiàn)了大數(shù)據(jù)的()

特征。[單選題]*

A.Volume規(guī)模性

B.Veracity準(zhǔn)確性

C.Velocity高速性

D.Variety多樣性V

E.Value價值性

11.商業(yè)上要求個性化推薦算法達(dá)到實(shí)時推薦的效果,如:某網(wǎng)站剛剛發(fā)布的新聞或視頻,用戶可以在

幾分鐘甚至更短的內(nèi)搜索到。體現(xiàn)了大數(shù)據(jù)的()特征。[單選題]*

A.Volume規(guī)模性

B.Veracity準(zhǔn)確性

C.Velocity高速性V

D.Variety多樣性

E.Value價值性

12.阿里的"淘寶小貸,通過對貸款客戶、供應(yīng)商、經(jīng)營信用等全方位的評估,就可以在沒有見面情

況下,給客戶放款,這需要在海量的數(shù)據(jù)中判斷客戶的信用。在大數(shù)據(jù)應(yīng)用中有效客戶量或數(shù)據(jù)量,并不

是數(shù)據(jù)越大這個值越高,而是反比。體現(xiàn)了大數(shù)據(jù)的()特征。[單選題]*

A.Volume規(guī)模性

B.Veracity準(zhǔn)確性

C.Velocity高速性

D.Variety多樣性

E.Value價值性V

13.我們購買電影票前,常常會打開支付寶的"電影演出"小程序,看看電影口碑評分,影評的真實(shí)

性會影響消費(fèi)者的購買行為。收集的數(shù)據(jù)有真有假,那么會對大數(shù)據(jù)分析的結(jié)果有影響。體現(xiàn)了大數(shù)據(jù)的

()特征。[單選題]*

A.Volume規(guī)模性

B.Veracity準(zhǔn)確性V

C.Velocity高速性

D.Variety多樣性

E.Value價值性

14.數(shù)據(jù)可視化指使用()等工具對數(shù)據(jù)進(jìn)行編碼,在視覺上傳達(dá)定量信息。[多選題]*

A.點(diǎn)V

B.線V

C.二維數(shù)據(jù)庫表

D.統(tǒng)計圖或信息圖表V

E.圖表V

15.大數(shù)據(jù)處理流程一般分為5個步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、(\數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化。[單

選題]*

A.數(shù)據(jù)存儲V

B.數(shù)據(jù)計算

C.數(shù)據(jù)集成

D.數(shù)據(jù)歸約

16.數(shù)據(jù)采集是數(shù)據(jù)預(yù)處理的第一步,它是指使用技術(shù)手段進(jìn)行(\[單選題]*

A.數(shù)據(jù)存儲V

B.數(shù)據(jù)分析

C.數(shù)據(jù)收集

D.數(shù)據(jù)挖掘

17.數(shù)據(jù)預(yù)處理是將原始數(shù)據(jù)轉(zhuǎn)換為可理解的格式的過程,數(shù)據(jù)預(yù)處理的步驟不包含的選項(xiàng)是?()[單

選題]*

A.數(shù)據(jù)集成

B.數(shù)據(jù)清洗

C.數(shù)據(jù)脫敏V

D.數(shù)據(jù)歸約

E.數(shù)據(jù)變換

18.有專家在總結(jié)人類科研方式的時候,指出人類一共歷經(jīng)了經(jīng)驗(yàn)科學(xué)、理論科學(xué)、計算科學(xué)和數(shù)據(jù)

密集型科學(xué)四種科研方式,其中數(shù)據(jù)密集型科學(xué)的代表實(shí)驗(yàn)是?()[單選題]*

A.典型案例:伽利略球體落地實(shí)驗(yàn)

B.典型案例:阿基米德浮力定律

C.典型案例:超級計算機(jī)模擬核爆炸實(shí)驗(yàn)

D.典型案例:大數(shù)據(jù)提速藥物研發(fā)的應(yīng)用V

19.案例:政務(wù)數(shù)據(jù)中臺匯聚了自然人、法人組織、城市資產(chǎn)、城市感知、行為事件、地理空間、宏觀

經(jīng)濟(jì)、自然資源、公共服務(wù)、電子證照十大主題政務(wù)數(shù)據(jù),開展模型治理和數(shù)據(jù)清洗加工,事前以標(biāo)準(zhǔn)事

項(xiàng)庫為最佳實(shí)踐優(yōu)化地方事項(xiàng)庫,事中提供統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)服務(wù),事后對辦件庫分析得出優(yōu)化點(diǎn)反過來豐

富標(biāo)準(zhǔn)事項(xiàng)庫,形成事前事中事后的閉環(huán)。政務(wù)數(shù)據(jù)中臺基于政務(wù)行業(yè)數(shù)據(jù)模型及智能算法,助力各地政

府快速構(gòu)建數(shù)據(jù)智能應(yīng)用,提升各地區(qū)各部門網(wǎng)上政務(wù)服務(wù)水平。該案例體現(xiàn)了大數(shù)據(jù)在()領(lǐng)域的應(yīng)用。

[單選題]*

A.電商

B.人工智能

C.金融風(fēng)險管控

D.政府決策V

20.云計算是與信息技術(shù)、軟件、互聯(lián)網(wǎng)相關(guān)的一種服務(wù),這種計算資源共享池叫做"云",云計算把

許多計算資源集合起來,通過軟件實(shí)現(xiàn)自動化管理,只需要很少的人參與,就能讓資源被快速提供。關(guān)于

云計算的特點(diǎn),描述正確的是?()[多選題]*

A.超大規(guī)模計算V

B.虛擬化V

C.通用性V

D.成本增加

E.維護(hù)難度加大

21.云計算的計算能力作為一種商品,可以在互聯(lián)網(wǎng)上流通,就像水、電、煤氣一樣,可以方便地取

用。體現(xiàn)了云計算的特點(diǎn)是()[單選題]*

A.通用性

B.動態(tài)擴(kuò)展

C.按需服務(wù)V

D.虛擬化

22.云計算和大數(shù)據(jù)的關(guān)系密不可分,下列關(guān)于云計算和大數(shù)據(jù)的關(guān)系,描述正確的是()[多選題]*

A.大數(shù)據(jù)為云計算提供了技術(shù)基礎(chǔ)

B.云計算為大數(shù)據(jù)提供用武之地

C.云計算解決大數(shù)據(jù)應(yīng)用中存在的存儲、計算等問題,所以云計算是大數(shù)據(jù)的一種技術(shù)展現(xiàn)形式”

D大數(shù)據(jù)是以海量數(shù)據(jù)為基礎(chǔ),為各種計算服務(wù)技術(shù)提供數(shù)據(jù)支撐,保證技術(shù)應(yīng)用(云計算、物聯(lián)網(wǎng)

等)的可靠性V

23.下列選項(xiàng)中,對公有云、私有云、混合云描述正確的是?()[多選題]*

A.公有云是由云服務(wù)提供商控制,用于云服務(wù)用戶和資源的云部署模式V

B.私有云是由云服務(wù)客戶控制,用于單一云服務(wù)用戶和資源專用的云部署模式。部署在企業(yè)內(nèi)部,由

企業(yè)內(nèi)部管理,保證了網(wǎng)絡(luò)的安全V

C.混合云是由云服務(wù)提供商提供的多種本地資源的組合,但也可以包含多種不帶有本地組件的云平臺

和云服V

D.公有云采用服務(wù)租用模式,私有云必須由用戶一次性投入

24.阿里云的云計算提供了多種服務(wù)模式,其中應(yīng)用層使用的是()[單選題]*

A.SaaSV

B.PaaS

C.IaaS

D.全部本地布署

25.阿里云的云計算提供了多種服務(wù)模式,其中平臺層使用的是()[單選題]*

A.SaaS

B.PaaSV

C.IaaS

D.全部本地布署

26.阿里云的云計算提供了多種服務(wù)模式,其中基礎(chǔ)設(shè)施使用的是()[單選題]*

A.SaaS

B.PaaS

C.laaSV

D.全部本地布署

27.云計算和大數(shù)據(jù)的關(guān)系密不可分,關(guān)于云計算和大數(shù)據(jù)的區(qū)別,描述正確的是?()[單選題]*

A.大數(shù)據(jù)處理的對象是互聯(lián)網(wǎng)資源和應(yīng)用,云計算處理的對象是數(shù)據(jù)

B.大數(shù)據(jù)是一種互聯(lián)網(wǎng)的虛擬資源存貯,云計算總的來說是一種信息資產(chǎn)

C.”大數(shù)據(jù)的出現(xiàn)在于用戶服務(wù)需求的增長,及企業(yè)處理業(yè)務(wù)能力的提高,云計算的出現(xiàn)在于用戶和社會

各行各業(yè)所產(chǎn)生大的數(shù)據(jù)呈現(xiàn)幾何倍數(shù)的增長"

D.云計算的價值則是能幫助企業(yè)等壓縮其成本,起到節(jié)約效果。在龐大的數(shù)據(jù)中挖掘其中有效、有價

值的信息這就是大數(shù)據(jù)的價值V

28.()平臺供應(yīng)商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,客戶可以根據(jù)工作實(shí)際需求,通過互聯(lián)

網(wǎng)向廠商定購所需的應(yīng)用軟件服務(wù),按定購的服務(wù)多少和時間長短向廠商支付費(fèi)用。[單選題]*

A.SaaSV

B.PaaS

C.IaaS

D.Nas

29.()平臺提供包括操作系統(tǒng)和圍繞特定應(yīng)用的必需的服務(wù),供應(yīng)商提供各種開發(fā)和分發(fā)應(yīng)用的解

決方案,比如虛擬服務(wù)器、操作系統(tǒng)和SDK、點(diǎn)外賣回家吃披薩,自供桌子碗筷等。[單選題]*

A.SaaS

B.PaaSV

C.IaaS

D.Nas

30.()平臺將基礎(chǔ)設(shè)施(計算資源和存儲)作為服務(wù)出租。如阿里云的各種云資源、自己購買原材料制

作披薩。[單選題]*

A.SaaS

B.PaaS

C.laaSV

D.Nas

31.關(guān)于云計算在許多領(lǐng)域有諸多應(yīng)用,如政務(wù)、教育、各種產(chǎn)業(yè)、醫(yī)療等有明顯的表現(xiàn),描述正確

的是()[多選題]*

A.政務(wù)云,部署公共安全管理、容災(zāi)備份、城市管理、應(yīng)急管理、智能交通、社會保障等應(yīng)用,通過

集約化建設(shè)、管理和運(yùn)行,可以實(shí)現(xiàn)信息資源整合和政務(wù)資源共享,推動政務(wù)管理創(chuàng)新,加快向服務(wù)型政

府轉(zhuǎn)型V

B.醫(yī)療云,實(shí)現(xiàn)遠(yuǎn)程醫(yī)療,電子病歷,專家會診等V

C.企業(yè)以低廉的成本建立財務(wù)、供應(yīng)鏈、客戶關(guān)系等管理應(yīng)用系統(tǒng),大大降低企業(yè)信息化門檻,迅速

提升企業(yè)信息化水平,對企業(yè)市場競爭力沒有明顯增加

D.教育云,整合教育資源,實(shí)現(xiàn)教育資源共享V

32.關(guān)于云計算在許多領(lǐng)域有諸多應(yīng)用,如政務(wù)、教育、各種產(chǎn)業(yè)、醫(yī)療等有明顯的表現(xiàn),描述正確

的是()[多選題]*

A.安全管理、容災(zāi)備份、城市管理、應(yīng)急管理、智能交通、社會保障等應(yīng)用,通過集約化建設(shè)、管理

和運(yùn)行,可以實(shí)現(xiàn)信息資源整合和政務(wù)資源共享,推動政務(wù)管理創(chuàng)新,加快向服務(wù)型政府轉(zhuǎn)型V

B.醫(yī)療云,實(shí)現(xiàn)遠(yuǎn)程醫(yī)療,電子病歷,專家會診等V

C.企業(yè)以低廉的成本建立財務(wù)、供應(yīng)鏈、客戶關(guān)系等管理應(yīng)用系統(tǒng),大大降低企業(yè)信息化門檻,迅速

提升企業(yè)信息化水平,對企業(yè)市場競爭力沒有明顯增加

D.教育云,整合教育資源,實(shí)現(xiàn)教育資源共享V

33.以下哪一項(xiàng)技術(shù)為大數(shù)據(jù)提供了技術(shù)基礎(chǔ),大數(shù)據(jù)為這項(xiàng)技術(shù)提供用武之地?()[單選題]*

A.內(nèi)存計算機(jī)

B.網(wǎng)絡(luò)計算機(jī)

C.云計算V

D.并行計算

34.云計算技術(shù)在大數(shù)據(jù)應(yīng)用過程中提供了哪些支持?()[多選題]*

A.海量數(shù)據(jù)存儲技術(shù)V

B.數(shù)據(jù)清洗和數(shù)據(jù)挖掘

C.分布式計算V

D.海量數(shù)據(jù)管理技術(shù)V

35.云計算和大數(shù)據(jù)的關(guān)系密不可分,下列關(guān)于云計算和大數(shù)據(jù)的關(guān)系,描述正確的是()[多選題]*

A.大數(shù)據(jù)為云計算提供了技術(shù)基礎(chǔ)

B.云計算為大數(shù)據(jù)提供用武之地

C.云計算解決大數(shù)據(jù)應(yīng)用中存在的存儲、計算等問題,所以云計算是大數(shù)據(jù)的一種技術(shù)展現(xiàn)形式V

D.大數(shù)據(jù)是以海量數(shù)據(jù)為基礎(chǔ),為各種計算服務(wù)技術(shù)提供數(shù)據(jù)支撐,保證技術(shù)應(yīng)用(云計算、物聯(lián)網(wǎng)

等)的可靠性V

36.隨著科技的發(fā)展,云計算和大數(shù)據(jù)關(guān)系密不可分,下列選項(xiàng)中,關(guān)于云計算與大數(shù)據(jù)的聯(lián)系,描

述正確的是?()[多選題]*

A.云計算為大數(shù)據(jù)提供了技術(shù)基礎(chǔ)V

B.大數(shù)據(jù)為云計算提供用武之地V

C.大數(shù)據(jù)是以技術(shù)為體系基礎(chǔ),解決云計算應(yīng)用中存在的存儲、計算等問題,所以云計算是大數(shù)據(jù)的

一種技術(shù)展現(xiàn)形式

D.大數(shù)據(jù)是以海量數(shù)據(jù)為基礎(chǔ),為各種計算服務(wù)技術(shù)提供數(shù)據(jù)支撐,保證技術(shù)應(yīng)用(云計算、物聯(lián)網(wǎng)

等)的可靠性V

37.物聯(lián)網(wǎng)(IoT.Internetofthings)即"萬物相連的互聯(lián)網(wǎng)",是互聯(lián)網(wǎng)基礎(chǔ)上的延伸和擴(kuò)展的

網(wǎng)絡(luò),將各種信息傳感設(shè)備與網(wǎng)絡(luò)結(jié)合起來而形成的一個巨大網(wǎng)絡(luò),實(shí)現(xiàn)任何時間、任何地點(diǎn),人、機(jī)、

物的互聯(lián)互通。下列選項(xiàng)中,屬于物聯(lián)網(wǎng)特點(diǎn)的是?()[多選題]*

A.整體感知V

B.可靠傳輸V

C.智能處理V

D.挖掘分析

38.物聯(lián)網(wǎng)可以利用射頻識別、二維碼、智能傳感器等感知設(shè)備感知獲取物體的各類信息。體現(xiàn)了物

聯(lián)網(wǎng)的()特點(diǎn)。[單選題]*

A.整體感知V

B.智能處理

C.可靠傳輸

D.挖掘分析

39.物聯(lián)網(wǎng)通過對互聯(lián)網(wǎng)、無線網(wǎng)絡(luò)的融合,將物體的信息實(shí)時、準(zhǔn)確地傳送,以便信息交流、分享。

體現(xiàn)了物聯(lián)網(wǎng)的()特點(diǎn)。[單選題]*

A.挖掘分析

B.可靠傳輸V

C.智能處理

D.整體感知

40.使用各種智能技術(shù),對感知和傳送到的數(shù)據(jù)、信息進(jìn)行分析處理,實(shí)現(xiàn)監(jiān)測與控制的智能化。體

現(xiàn)了物聯(lián)網(wǎng)的()特點(diǎn)。[單選題]

A.可靠傳輸

B.整體感知

C.智能處理V

D.挖掘分析

41.云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)是時下最熱的三種技術(shù),三者之間緊密結(jié)合,相互聯(lián)系,促進(jìn)技術(shù)生態(tài)

的繁榮發(fā)展。關(guān)于云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)三者之間的關(guān)系,描述正確的是?()[多選題]*

A.大數(shù)據(jù)為云計算提供了技術(shù)基礎(chǔ)

B.物聯(lián)網(wǎng)是大數(shù)據(jù)的重要來源V

C.物聯(lián)網(wǎng)為云計算技術(shù)提供可廣闊的應(yīng)用空間V

D.云計算為物聯(lián)網(wǎng)提供海量數(shù)據(jù)存儲能力V

E.物聯(lián)網(wǎng)技術(shù)為大數(shù)據(jù)數(shù)據(jù)分析提供支持

F.云計算為大數(shù)據(jù)提供用武之地

42.針對狹義的Hadoop的描述,Hadoop使用()技術(shù)解決數(shù)據(jù)存儲的問題。()[單選題]*

A、HDFSV

B、Redis

C、MongoDB

D、MySQL

43.針對狹義的Hadoop的描述,Hadoop使用()技術(shù)解決分布式計算的問題。()[單選題]*

A、Flink

B、MaxCompute

C、MapReduceV

D、Storm

44.Hadoop底層會維護(hù)多個數(shù)據(jù)副本,當(dāng)某個節(jié)點(diǎn)出現(xiàn)故障后,也不會造成損失,為應(yīng)用穩(wěn)定運(yùn)作提

供了保障。體現(xiàn)了Hadoop的()特點(diǎn)。()[單選題]*

A、高可靠V

B、高擴(kuò)展

C、高效率

D、高容錯

E、低成本

45.Hadoop集群支持熱插拔,在增加或刪除節(jié)點(diǎn)時無需重新啟動集群,極大提高了集群擴(kuò)展性能。體

現(xiàn)了Hadoop的()特點(diǎn)。()[單選題]*

A、高可靠

B、高擴(kuò)展V

C、高效率

D、高容錯

E、低成本

46.Hadoop能夠在節(jié)點(diǎn)之間動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點(diǎn)的動態(tài)平衡,因此處理速度非常快。體

現(xiàn)了Hadoop的()特點(diǎn)。()[單選題]*

A、高可靠

B、高擴(kuò)展

C、高效率V

D、高容錯

E、低成本

47.Hadoop能夠自動保存數(shù)據(jù)的多個副本,并且能夠自動將失敗的任務(wù)重新分配。體現(xiàn)了Hadoop

的()特點(diǎn)。()[單選題]*

A、高可靠

B、高擴(kuò)展

C、高效率

D、高容錯V

E、低成本

48.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細(xì)

節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲。下列關(guān)于Hadoop的優(yōu)勢,描

述不正確的是()[單選題]*

A、對于Hadoop來說,當(dāng)存儲空間不夠,可以添加機(jī)器進(jìn)行擴(kuò)展如果計算能力不夠,可以配置添加

MapReduce節(jié)點(diǎn)來擴(kuò)展

B、支持多數(shù)據(jù)源、在應(yīng)用、用戶方面僅支持單一使用

C、應(yīng)用范圍廣泛,可以處理文件、數(shù)據(jù)庫、半結(jié)構(gòu)化數(shù)據(jù)V

D、Hadoop是企業(yè)級的平臺,它高可靠、多租戶、而且具有很高的安全性

49.Hadoop是一個分布式計算平臺,用戶可以輕松地在Hadoop上開發(fā)、運(yùn)行與處理海量數(shù)據(jù)的應(yīng)

用程序,它主要特點(diǎn)有()()[多選題]*

A、高可靠V

B、高精度

C、高擴(kuò)展V

D、高效率V

E、高容錯V

50.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細(xì)

節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲。它包含哪些核心模塊?()[多

選題]*

A、Hadoop公共包

B、Hadoop分布式文件系統(tǒng)(HDFS)V

C、HadoopYARNV

D、Hadoop的分布式消息系統(tǒng)

E、HadoopM叩Reduce4

51.Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細(xì)

節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲。關(guān)于Hadoop的基本模塊,描

述正確的是?()[單選題]*

A、Common:支持其他Hadoop模塊的通用程序包

B、HDFS:一個分布式文件系統(tǒng),能夠以高吞吐量訪問應(yīng)用中的數(shù)據(jù)V

C、MapReduce:一^??作業(yè)調(diào)度和資源管理框架

D、YARN:一個基于MapReduce的大數(shù)據(jù)并行處理程序

52.Hadoop是當(dāng)前最流行的大數(shù)據(jù)分布式基礎(chǔ)架構(gòu),它提供了許多與大數(shù)據(jù)相關(guān)的核心功能,并支持

許多核心項(xiàng)目。下列選項(xiàng)中,屬于Hadoop核心組件的是?()[單選題]*

A、Ambari(安裝、部署、配置、管理工具)

B、Oozie(作業(yè)流調(diào)度系統(tǒng))

C、Hive數(shù)據(jù)倉庫

D、MapReduce分布式計算框架V

53.HDFS是開源分布式文件系統(tǒng),用于(1是整個Hadoop生態(tài)中的重要組件之一。()[單選題]*

A、文件的存儲與管理V

B、查找文件和文件夾

C、復(fù)制、移動文件或文件夾

D、文件刪除和修改

54.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop組件HDFS是()[單選

題]*

A。工作流引擎

Bo資源管理系統(tǒng)

C,分布式文件系統(tǒng),

D。列式數(shù)據(jù)庫

55.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop組件MapReduce,描

述正確的是?[單選題]*

A.工作流引擎

Bo數(shù)據(jù)倉庫

C,分布式計算框架,

D.列式數(shù)據(jù)庫

56.M叩Reduce是一個分布式運(yùn)算程序的編程框架,下面對M叩Reduce描述正確的是?()[多選

題]*

的核心為函數(shù)和函數(shù)

AoMapReduceMapReduceV

B。MapReduce用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算V

不需要應(yīng)開發(fā)者編寫程序來實(shí)現(xiàn)功能

CoMapReduce

D。MapReduce設(shè)計理念就是"計算向數(shù)據(jù)靠攏"V

57.M叩Reduce是一個分布式運(yùn)算程序的編程框架,關(guān)于M叩Reduce的特點(diǎn),描述正確的是?[多

選題]*

A.通過配置Map節(jié)點(diǎn)數(shù)與增加機(jī)器數(shù)來擴(kuò)展計算能力V

B。當(dāng)分配了計算任的節(jié)點(diǎn)失效時,能自動切換到其它節(jié)點(diǎn)運(yùn)行該任務(wù)V

Co提供了分布式編程接口,易于開發(fā)V

D。隨機(jī)處理數(shù)據(jù)、避免順序訪問數(shù)據(jù)

58.MapReduce是一個分布式運(yùn)算程序的編程框架,關(guān)于MapReduce,描述正確的是()[單選題]*

A.適合海量靜態(tài)數(shù)據(jù)(批數(shù)據(jù))計算V

B,磁盤10開銷不大

C。易編程,適合實(shí)時計算

D。是分布式計算框架,當(dāng)一臺機(jī)器失敗后,可以手動切換至其他節(jié)點(diǎn)運(yùn)行該任務(wù)

59.M叩Reduce是一個分布式運(yùn)算程序的編程框架,下列選項(xiàng)中,屬于M叩Reduce的缺點(diǎn)是()[單

選題]*

A.并行計算能力有限

B。磁盤10開銷大V

C.延遲低

D。中間結(jié)果在內(nèi)存中

60.MapReduce是一個分布式運(yùn)算程序的編程框架,關(guān)于MarReduce的優(yōu)點(diǎn),描述正確的是?()[多

選題]*

A.實(shí)現(xiàn)簡單接口,即可完成分布式程序V

B。可以通過配置Map任務(wù)數(shù)來擴(kuò)展計算能力V

C.使用在分布式計算框架,所以當(dāng)一臺機(jī)器失敗后,可以自動切換至其他節(jié)點(diǎn)運(yùn)行該任務(wù)V

D。只適合少量的數(shù)據(jù)處理

61.下列選項(xiàng)中關(guān)于M叩Reduce描述正確的是()[單選題]*

A.支持離線數(shù)據(jù)與實(shí)時數(shù)據(jù)的處理

Bo在對數(shù)據(jù)處理過程中除了支持Map與Reduce方法外還可以自定義方法來完成數(shù)據(jù)的處理

C.使用在分布式計算框架,所以當(dāng)一臺機(jī)器失敗后,會導(dǎo)致計算任重啟

D。過多的磁盤操作缺乏對分布式內(nèi)存的支持,不能高效的支持迭代式計算V

62.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop組件YARN是()[單

選題]*

A。工作流引擎

B。資源管理系統(tǒng)V

C。分布式計算框架

D。列式數(shù)據(jù)庫

63.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Pig,描述

正確的是?()[單選題]*

A、工作流引擎V

B、數(shù)據(jù)倉庫

C、分布式計算框架

D、列式數(shù)據(jù)庫

64.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Hive,描述

正確的是?()[單選題]*

A、工作流引擎

B、數(shù)據(jù)倉庫V

C、分布式計算框架

D、列式數(shù)據(jù)庫

65.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件MapReduce,

描述正確的是?()[單選題]*

A、工作流引擎

B、數(shù)據(jù)倉庫

C、分布式計算框架V

D、列式數(shù)據(jù)庫

66.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組成,YARN是

()[單選題]*

A、工作流引擎V

B、數(shù)據(jù)倉庫

C、分布式計算框架

D、列式數(shù)據(jù)庫

67.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件HDFS是()

[單選題]*

A、工作流引擎

B、數(shù)據(jù)倉庫

C、分布式計算框架V

D、列式數(shù)據(jù)庫

68.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Sqoop是

()[單選題]*

A、工作流引擎

B、資源管理系統(tǒng)

C、分布式文件系統(tǒng)

D、ETL工具V

69.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Mahout是

()[單選題]*

A、工作流引擎

B、資源管理系統(tǒng)V

C、分布式文件系統(tǒng)

D、ETL工具

70.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Flume是)

[單選題]*

A、工作流引擎V

B、資源管理系統(tǒng)

C、分布式文件系統(tǒng)

D、ETL工具

71.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Ambari是

()[單選題]*

A、日志收集

B、數(shù)據(jù)挖掘庫

C、分布式文件系統(tǒng)

D、安裝、部署、配置、管理工具V

72.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件HBase是)

[單選題]*

A、工作流引擎

B、資源管理系統(tǒng)

C、分布式文件系統(tǒng)

D、列式數(shù)據(jù)庫V

73.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Zoopkeeper

是()[單選題]*

A、工作流引擎

B、資源管理系統(tǒng)V

C、分布式文件系統(tǒng)

D、列式數(shù)據(jù)庫

74.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件HBase的功能,

描述正確的是?()[單選題]*

A、可擴(kuò)展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲V

B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

75.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Hive的功能,

描述正確的是?()[單選題]*

A、可擴(kuò)展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能V

C、可擴(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

76.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Pig的功能,

描述正確的是?()[單選題]*

A、可擴(kuò)展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架V

77.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Mahout,描

述正確的是?()[單選題]*

A、可擴(kuò)展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫V

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

78.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件ZooKeeper,

描述正確的是?()[單選題]*

A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)V

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架,提供對Hadoop。MapReduce和PigJobs的任務(wù)調(diào)度與協(xié)

調(diào)

E、是大數(shù)據(jù)集日志收集的框架

79.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Apache

Ambari,描述正確的是?()[單選題]*

A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具V

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架,提供對Hadoop。M叩Reduce和PigJobs的任務(wù)調(diào)度與協(xié)

調(diào)

E、是大數(shù)據(jù)集日志收集的框架

80.1隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Sqoop,描

述正確的是?()[單選題]*

A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具V

D、是一個基于工作流引擎的開源框架,提供對Hadoop。M叩Reduce和PigJobs的任務(wù)調(diào)度與協(xié)

調(diào)

E、是大數(shù)據(jù)集日志收集的框架

81.1下列選項(xiàng)中,關(guān)于Hadoop生態(tài)組件Oozie,描述正確的是?()[單選題]*

A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架,提供對Hadoop。M叩Reduce和PigJobs的任務(wù)調(diào)度與協(xié)

調(diào)V

E、是大數(shù)據(jù)集日志收集的框架

82.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)組件Flume,描述

正確的是?()[單選題]*

A、用于分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)

B、是一種支持ApacheHadoop集群的安裝、部署、配置和管理的工具

C、是一種用于在HDFS和RDMS之間傳輸數(shù)據(jù)的工具

D、是一個基于工作流引擎的開源框架,提供對Hadoop。MapReduce和PigJobs的任務(wù)調(diào)度與協(xié)

調(diào)

E、是大數(shù)據(jù)集日志收集的框架V

83.Hadoop是當(dāng)前最流行的大數(shù)據(jù)分布式基礎(chǔ)架構(gòu),提供了許多與大數(shù)據(jù)相關(guān)的核心功能,并支持許

多核心項(xiàng)目。下列選擇中,屬于Hadoop生態(tài)圈組成的是?()[多選題]*

A、Ambari(安裝、部署、配置、管理工具)V

B、Oozie(作業(yè)流調(diào)度系統(tǒng))V

C、Hive數(shù)據(jù)倉庫V

D、MapReduce分布式計算框架V

E、Pig工作流引擎V

F、Kafka分布式消息

84.Hive是基于Hadoop的一個()工具,用于查詢和管理駐留在分布式存儲系統(tǒng)中的大型數(shù)據(jù)集。

()[單選題]*

A、關(guān)系型數(shù)據(jù)庫

B、數(shù)據(jù)倉庫V

C、非關(guān)系型數(shù)據(jù)庫

D、數(shù)據(jù)庫

85.Hive是構(gòu)建在Hadoop上的數(shù)據(jù)倉庫框架,關(guān)于Hive的描述正確的是?()[單選題]*

A、Hive的本質(zhì)是將MapReduce轉(zhuǎn)化成HQL程序,然后進(jìn)一步提交給Hadoop框架執(zhí)行

B、不依賴分布式并行計算模型M叩Reduce處理數(shù)據(jù)

C、定義了簡單的類SQL查詢語言HiveQL,用戶可以通過編寫的HiveQL語句運(yùn)行MapReduce任

務(wù)V

D、不依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)

86.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Hive,描述

正確的是?[單選題]*

A.工作流引擎

Bo數(shù)據(jù)倉庫V

C,分布式計算框架

D。列式數(shù)據(jù)庫

87.Hive是基于Hadoop的一個()的工具,用于查詢和管理在分布式存儲系統(tǒng)中的大型數(shù)據(jù)集。[單

選題]*

A.關(guān)系型數(shù)據(jù)庫

B,數(shù)據(jù)倉庫V

C。非關(guān)系型數(shù)據(jù)庫

D。數(shù)據(jù)庫

88.Hive是構(gòu)建在Hadoop上的數(shù)據(jù)倉庫框架,關(guān)于Hive的描述正確的是?[單選題]*

A.Hive的本質(zhì)是將MapReduce轉(zhuǎn)化成HQL程序,然后進(jìn)一步提交給Hadoop框架執(zhí)行V

B.不依賴分布式并行計算模型MapReduce處理數(shù)據(jù)

C.定義了簡單的類SQL查詢語言HiveQL,用戶可以通過編寫的HiveQL語句運(yùn)行M叩Reduce任務(wù)

D.不依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)

89.HBase是一個分布式的、面向列的開源數(shù)據(jù)庫,源于()的一篇論文《BigTable:一個結(jié)構(gòu)化數(shù)據(jù)

的分布式存儲系統(tǒng)》。()[單選題]*

A、GoogleV

B、Oracle

C、Apache

D、Microsoft

90.存儲數(shù)據(jù)的結(jié)構(gòu)可以分為:結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化。下列選項(xiàng)中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是?()

[單選題]*

A、JSON文檔

B、XML文檔

C、日志文件

D、圖片V

91.存儲數(shù)據(jù)的結(jié)構(gòu)可以分為:結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化。下列選項(xiàng)中,屬于半結(jié)構(gòu)化數(shù)據(jù)的是?()

[單選題]*

A、JSON文檔V

B、視頻

C、文本

D、圖片

92.以下內(nèi)容屬于()類型的數(shù)據(jù)?()

<student>

<name>Amy</name>

<age>18</name>

〈/student>"[單選題]*

A、結(jié)構(gòu)化

B、半結(jié)構(gòu)化V

C、非結(jié)構(gòu)化

93.以下內(nèi)容是應(yīng)用程序運(yùn)行過程中產(chǎn)生的日志信息,它屬于()類型的數(shù)據(jù)?()

1997-07-01,10

1998-04-01,26

1997-05-01,-5

1989-06-01,25

1925-05-01,45”[單選題]*

A、結(jié)構(gòu)化

B、半結(jié)構(gòu)化V

C、非結(jié)構(gòu)化

94.HBase是一個分布式的、面向列的開源數(shù)據(jù)庫,關(guān)于HBase的特點(diǎn),描述正確的是?()[多選題]

A、高可靠V

B、高性能V

C、高精度

D、可伸縮V

95.隨著大數(shù)據(jù)時代的發(fā)展,也八力生態(tài)圈組件越來越豐富。關(guān)于出血叩生態(tài)組件延2$6的功能,

描述正確的是?[單選題]*

A,可擴(kuò)展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲V

B,數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能

C??蓴U(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫

D。用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

96.Mahout是ApacheSoftwareFoundation(ASF)旗下的-t?開源項(xiàng)目,以下關(guān)于Mahout

說法正確的是?()[單選題]*

A、存儲框架

B、數(shù)據(jù)管理框架

C、數(shù)據(jù)可視化專業(yè)工具

D、可擴(kuò)展的機(jī)器學(xué)習(xí)算法及其實(shí)現(xiàn)V

97.Mahout是ApacheSo代wareFoundation(ASF)旗下的一^^開源項(xiàng)目,提供一些可擴(kuò)展的()

領(lǐng)域經(jīng)典算法的實(shí)現(xiàn),旨在幫助開發(fā)人員更加方便快捷地實(shí)現(xiàn)算法,創(chuàng)建智能應(yīng)用程序。()[單選題]*

A、人工智能

B、機(jī)器學(xué)習(xí)V

C、云計算

D、數(shù)據(jù)分析

98.在創(chuàng)建智能應(yīng)用程序時,Mahout包含許多算法實(shí)現(xiàn),具體包含()[多選題]*

A、聚類V

B、分類V

C、線性回歸

D、推薦過濾V

E、頻繁子項(xiàng)挖掘V

99.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Mahout是

()[單選題]*

A,工作流引擎

Bo機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫V

C.分布式文件系統(tǒng)

D。ETL工具

100.下列對Hadoop生態(tài)組件Mahout,描述正確的是?()[單選題]*

A、可擴(kuò)展的分布式數(shù)據(jù)庫,支持大表的結(jié)構(gòu)化數(shù)據(jù)存儲

B、數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),提供數(shù)據(jù)匯總和命令行即席查詢功能

C、可擴(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫V

D、用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架

101.Pig是Hadoop生態(tài)圈的組件之一,Pig的數(shù)據(jù)處理語言采取()方式,一步一步地進(jìn)行處理。

()[單選題]*

A、數(shù)據(jù)流V

B、并行計算

C、分布式計算

D、分布式協(xié)調(diào)服務(wù)

102.Pig是Hadoop生態(tài)圈的組件之一,關(guān)于Pig,描述正確的是?()[多選題]*

A、Pig是一個基于Hadoop的大規(guī)模數(shù)據(jù)分析平臺V

B、Pig是一個用于并行計算的高級數(shù)據(jù)流語言和執(zhí)行框架V

C、Pig有一毒口SQL類似的執(zhí)行語句,處理的對象是HDFS上的文件V

D、Pig的數(shù)據(jù)處理語言采取分布式消息訂閱發(fā)布方式

103.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Pig,描述

正確的是?[單選題]*

A.大型數(shù)據(jù)集計算與分析平臺V

Bo數(shù)據(jù)倉庫

C.分布式計算框架

D.列式數(shù)據(jù)庫

104.ZooKeeper是()的框架。Hadoop的許多組件都依賴于ZooKeeper,比如HDFSNameNode

HA的自動切換、HBase的高可用,以及SparkStandalone模式Master的HA機(jī)制都是通過

ZooKeeper來實(shí)現(xiàn)的。()[單選題]*

A、分布式協(xié)調(diào)服務(wù)V

B、分布式計算

C、并行計算

D、分布式存儲

105.在Hadoop生態(tài)圈中,Zoopkeeper的主要作用是完成()[單選題]*

A、工作流引擎

B、分布式協(xié)調(diào)服務(wù)V

C、分布式文件系統(tǒng)

D、列式數(shù)據(jù)庫

106.Sqoop是Hadoop生態(tài)圈的組件之一,主要用于在(\數(shù)據(jù)倉庫(Hive)和Hadoop之間轉(zhuǎn)移數(shù)

據(jù)的框架。()[單選題]*

A、非關(guān)系型數(shù)據(jù)庫

B、關(guān)系數(shù)據(jù)庫V

C、NoSQL數(shù)據(jù)庫

107.Sqoop是Hadoop生態(tài)圈的組件之一,它可以將數(shù)據(jù)從Hadoop中導(dǎo)出到()數(shù)據(jù)庫中()[單

選題]*

A、Redis

B、MySQLV

C、Memcache

D、MongoDB

108.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Sqoop是

()[單選題]*

A.工作流引擎

Bo資源管理系統(tǒng)

C.分布式文件系統(tǒng)

工具

DoETLV

109.Flume是由Cloudera提供的一個分布式、高可靠、高可用的服務(wù),是用于分布式的()框架()

[單選題]*

A、企業(yè)業(yè)務(wù)數(shù)據(jù)收集

B、網(wǎng)絡(luò)數(shù)據(jù)收集

C、傳感器數(shù)據(jù)收集

D、日志收集V

110.Flume是Hadoop生態(tài)圈的組件之一,關(guān)于Flume的組件功能,描述正確的是()[多選題]*

A、Source負(fù)責(zé)接收日志數(shù)據(jù),不支持不同類型和不同格式的日志,所以需要對日志數(shù)據(jù)處理類型和

格式

B、Source將日志數(shù)據(jù)的寫入到Channel并負(fù)責(zé)處理操作"V

C、Sink負(fù)責(zé)從Channel中的獲取數(shù)據(jù),寫入到接收方,

D、Sink可以獲取接收方的數(shù)據(jù)

111.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Flume是

()的框架。[單選題]*

A。日志收集V

Bo數(shù)據(jù)挖掘庫

C。分布式文件系統(tǒng)

D。ETL工具

112.Ambari是Hadoop生態(tài)圈的組件之一,關(guān)于Ambari的功能描述,錯誤的是?()[單選題]*

A、Ambari提供了一個分步向?qū)?,用于在任意?shù)量的主機(jī)上安裝Hadoop服務(wù)

B、提供了一個儀表板來監(jiān)控Hadoop集群的健康和狀態(tài)。可以進(jìn)行指標(biāo)收集,不能實(shí)現(xiàn)對節(jié)點(diǎn)故障、

剩余磁盤空間不足等做出系統(tǒng)警報V

C、使用AmbariRESTAPI可以將Hadoop配置、管理和監(jiān)控功能輕松集成到他們自己的應(yīng)用程序

D、Ambari為在整個集群中啟動、停止和重新配置Hadoop服務(wù)提供集中管理

113.Ambari是Hadoop生態(tài)圈的組件之一Ambari是一種基于Web的工具支持ApacheHadoop

集群的()[多選題]*

A、配置V

B、管理V

C、監(jiān)控V

D、協(xié)調(diào)

114.隨著大數(shù)據(jù)時代的發(fā)展,Hadoop生態(tài)圈組件越來越豐富。關(guān)于Hadoop生態(tài)圈組件Ambari

是()[單選題]*

A.日志收集

Bo數(shù)據(jù)挖掘庫

C。分布式文件系統(tǒng)

D.安裝、部署、配置、管理工具V

115.Oozie是Hadoop生態(tài)圈的組件之一,關(guān)于Oozie,描述正確的是?()[多選題]*

A、Oozie是一個用來管理Hadoop生態(tài)圈job的工作流調(diào)度系統(tǒng)V

B、Oozie由Apache公司貢獻(xiàn)給Cloudera

C、Oozie是運(yùn)行于JavaServlet容器上的一個JavaWeb應(yīng)用V

D、Oozie的目的是按照DAG(有向無環(huán)圖)調(diào)度一系列的Map/Reduce或者Hive等任務(wù)。V

116.Spark最早是源于加州大學(xué)伯克利分校的MateiZaharia等人發(fā)表的一篇論文。論文提出了一種

()的概念。()[單選題]*

A、分布式并行計算

B、分布式文件系統(tǒng)

C、分布式彈性數(shù)據(jù)集(RDD)V

D、分布式微服務(wù)

117.ApacheSpark是用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一()引擎。()[單選題]*

A、分析V

B、存儲

C、集成

D、挖掘

核心組件包含:、

118.ApacheSparkSparkStreamingSparkSQLXSparkCore,GraphX,MLlib,

下列哪個選項(xiàng)是對GraphX組件的描述?()[單選題]*

A、提供流計算組件

B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件

C、基于內(nèi)存多語言執(zhí)行的核心引擎

D、是一個分布式圖處理框架,它基于Spark平臺提供對圖計算和圖挖掘易用且簡潔的一個子系統(tǒng)V

119.ApacheSpark核心組件包含:SparkStreaming、SparkSQL.SparkCore.GraphX、MLlib,

下列哪個選項(xiàng)是對MLlib組件的描述?()[單選題]*

A、提供流計算組件

B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件

C、基于內(nèi)存多語言執(zhí)行的核心引擎

D、Spark機(jī)器學(xué)習(xí)庫V

120.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,關(guān)于Spark的特點(diǎn)描述,

正確的是?()[多選題]*

A、可以使用Python、SQL、Scala、Java或R語言,統(tǒng)一離線計算和實(shí)時計算開發(fā)方式V

B、通用的SQL分析,快速構(gòu)建分析報表,運(yùn)行速度快于大多數(shù)數(shù)倉計算引擎V

C、大規(guī)??茖W(xué)計算,支持對PB級數(shù)據(jù)執(zhí)行探索性分析V

D、可以在桌面電腦上訓(xùn)練機(jī)器學(xué)習(xí)算法,但不能使用相同的代碼擴(kuò)展到包含數(shù)千臺機(jī)器的集群上,需

要修改代碼

121.下列選項(xiàng)中()可以處理離線數(shù)據(jù)也可以處理實(shí)時數(shù)據(jù)的計算框架?()[單選題]*

A、SparkV

B、Strom

C、Hive

D、Pig

122.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的,下列選項(xiàng)中,哪些項(xiàng)不屬于Spark的特點(diǎn)?()

[單選題]*

A、批處理/流式數(shù)據(jù)

B、SQL分析

C、大規(guī)模數(shù)據(jù)存儲V

D、大規(guī)??茖W(xué)計算

E、機(jī)器學(xué)習(xí)

核心組件有:、、下

123.ApacheSparkSparkStreamingSparkSQLsSparkCore.GraphXMLlib,

列哪個選項(xiàng)是對SparkCore組件的描述?()[單選題]*

A、提供流計算組件

B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件

C、基于內(nèi)存多語言執(zhí)行的核心引擎V

D、GraphX是一個分布式圖處理框架

124.ApacheSpark核心組件有:SparkStreaming、SparkSQLSparkCore,GraphX、MLlib,下

列哪個選項(xiàng)是對SparkSQL組件的描述?()[單選題]*

A、提供流計算組件

B、是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件V

C、基于內(nèi)存多語言執(zhí)行的核心引擎

D、是一個分布式圖處理框架

E、Spark機(jī)器學(xué)習(xí)庫

125.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,下列選項(xiàng)中,哪些是Spark

的優(yōu)勢()?()[多選題]*

A、開發(fā)比較簡單,支持多語言開發(fā)V

B、提供了多個高層次、簡潔的APW

C、可以通過RDD彈性分布式數(shù)據(jù)集方式編程,具備容錯特征,能在并行計算中高效的進(jìn)行數(shù)據(jù)共享,

提升計算性能V

D、統(tǒng)一采用DAG無向有環(huán)圖處理模式

126.ApacheSpark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,下列選項(xiàng)中,哪些是Spark

的核心組件?()[多選題]*

A、SparkStreamingV

B、SparkSQLV

C、SparkGraphXV

D、Spark10

127.ApacheSpark是一款常用于大數(shù)據(jù)工作負(fù)載的開源分布式處理系統(tǒng),關(guān)于Spark核心組件的作

用,描述錯誤的是?()[單選題]*

A、SparkStreaming提供離線計算組件V

B、SparkSQL是一個用來處理結(jié)構(gòu)化數(shù)據(jù)的Spark組件

C、SparkCore基于內(nèi)存多語言執(zhí)行的核心引擎

D、GraphX是一個分布式圖處理框架

128.Datax是阿里云DataWorks數(shù)據(jù)集成的開源版本,在阿里巴巴集團(tuán)內(nèi)被廣泛使用的()工具/

平臺。Datax實(shí)現(xiàn)了包括MySQL、Oracle,OceanBase、SQLServer,Postgre、HDFS、Hive、ADS、

HBase、TableStore(OTS),MaxCompute(ODPS),Hologres.DRDS等各種異構(gòu)數(shù)據(jù)源之間高效的數(shù)

據(jù)同步功能。()[單選題]*

A、實(shí)時數(shù)據(jù)同步

B、離線數(shù)據(jù)同步V

C、整庫增量同步

D、整表增量徒步

129.Datax是阿里云DataWorks數(shù)據(jù)集成的開源版本,關(guān)于Datax的描述,以下說法正確的是()

[多選題]*

A、Datax是離線數(shù)據(jù)同步工具V

B、Datax是在線數(shù)據(jù)同步工具

C、Datax支持異構(gòu)數(shù)據(jù)源V

D、Datax支持增量數(shù)據(jù)回放

130.Azkaban是一個批量工作流任務(wù)調(diào)度器。關(guān)于Azkaban,描述正確的是?()[單選題]*

A、Azkaban是一個批量工作流任務(wù)調(diào)度器

B、Azkaban主要用于在一個工作流內(nèi)以一個特定的順序運(yùn)行一組工作和流程

C、Azkaban使用job文件建立任務(wù)之間的依賴關(guān)系,并提供一個易用的Web界面供用戶管理和

調(diào)度工作流

D、它的配置是通過簡單的update方式對數(shù)據(jù)表進(jìn)行修改實(shí)現(xiàn),通過配置中的Dependencies來設(shè)

置依賴關(guān)系V

131.Azkaban是一個批量工作流任務(wù)調(diào)度器。關(guān)于Azkaban,描述不正確的是?[單選題]*

A.Azkaban是一個批量工作流任務(wù)調(diào)度器V

B.Azkaban主要用于在一個工作流內(nèi)以一個特定的順序運(yùn)行一組工作和流程

c.Azkaban使用job文件建立任務(wù)之間的依賴關(guān)系,并提供一個易用的Web界面供用戶管理和調(diào)

度工作流

D.Azkaban是由Linkedin公司推出的任務(wù)調(diào)試器,它的配置是通過簡單的update方式對數(shù)據(jù)表進(jìn)

行修改實(shí)現(xiàn)

13

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論