




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、單選題1.云計算的服務(wù)模式不包括(C)。A. 基礎(chǔ)設(shè)施即服務(wù)B. 平臺即服務(wù)C. 系統(tǒng)即服務(wù)D. 軟件即服務(wù)2.A公司通過(D)計算云,可以讓用戶通過WebService方式租用計算機來運行自己的計算機應(yīng)用程序。A. GFSB. S3C. HDFSD. EC23.亞馬遜AWS提供的云計算服務(wù)類型有(D)。A.IaaSB.PaaSC.SaaSD.三個選項都是4.2008年10月微軟推出的云計算操作系統(tǒng)是(D)。A.GoogleAppEngineB.EC2C.藍云D.Azure5.關(guān)于全虛擬化技術(shù)敘述錯誤的是(D)。A.全虛擬化也稱原始虛擬化技術(shù)B.指虛擬機模擬了完整的底層硬件C.使得為原始硬件設(shè)計的操作系統(tǒng)或其他系統(tǒng)軟件完全不做任何修改就可以在虛擬機上運行D.使用Hypervisor分享存儲底層的硬件6.關(guān)于硬件輔助虛擬化技術(shù)敘述錯誤的是(D)。A.必須靠系統(tǒng)硬件來完成虛擬化過程B.能夠提高全虛擬化的效率C.使用半虛擬化技術(shù)的XEN也通過該技術(shù)做到支持Windows.Mac等閉源的操作系統(tǒng)D.使用Hypervisor分享存儲底層的硬件7.虛擬化技術(shù)主要用于云計算物理資源的池化,物理資源不包括(D)。A.服務(wù)器B.網(wǎng)絡(luò)C.存儲D.操作系統(tǒng)8.速率最大的協(xié)議是(C)協(xié)議。A.SCSI協(xié)議B.FC協(xié)議C.iSCSI協(xié)議D.SATA協(xié)議9.根據(jù)OverLay的載體不同VXLAN的OverLay分為3種,下列分類不正確的是(D)。A.主機OverLayB.網(wǎng)絡(luò)OverLayC.混合OverLayD.虛實OverLay10.下列描述中錯誤的是(D)。A.集群是指一組桌面計算機或服務(wù)器通過局域網(wǎng)連接在一起。B.集群中每個節(jié)點都運行自己的操作系統(tǒng),節(jié)點之間使用網(wǎng)絡(luò)協(xié)議進行通信。C.最大規(guī)模的集群稱為倉庫級計算機(WSC)。D.倉庫級計算機(WSC)是指大型機。11.大數(shù)據(jù)的核心就是(B)。A.告知與許可B.預(yù)測C.匿名化D.規(guī)?;?2.大數(shù)據(jù)不是要教機器像人一樣思考。相反,它是(A)。A.把數(shù)學(xué)算法運用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性B.被視為一種機器學(xué)習(xí)C.被視為人工智能的一部分D.預(yù)測與懲罰13.大數(shù)據(jù)是指不用隨機分析法這樣的捷徑,而采用(A)的方法。A.所有數(shù)據(jù)B.絕大部分數(shù)據(jù)C.適量數(shù)據(jù)D.少量數(shù)據(jù)14.在大數(shù)據(jù)時代,下列說法正確的是。(B)A.收集數(shù)據(jù)比較簡單B.數(shù)據(jù)是最核心的部分C.對數(shù)據(jù)的分析技術(shù)和技能是最重要的D.數(shù)據(jù)非常重要,一定要很好的保護起來,防止泄露15.在大數(shù)據(jù)時代,我們需要設(shè)立一個不一樣的隱私保護模式,這個模式應(yīng)該著重于(D)為其行為承擔責任。A.數(shù)據(jù)分析者B.個人許可C.數(shù)據(jù)提供者D.數(shù)據(jù)使用者16.下列屬于Hadoop2.0和Hadoop3.0區(qū)別的是(D)。A.Hadoop3.0新增了HDFSHA機制B.Hadoop3.0新增了HDFSfederationC.Hadoop3.0新增了YARN框架D.Hadoop3.0支持多于2個以上的NameNode17.HDFS架構(gòu)中存儲實際數(shù)據(jù)塊的節(jié)點是(C)。A.HDFSHAB.NameNodeC.DatanodeD.StandbyNameNode18.下列不屬于ActiveNamenode節(jié)點功能的是(D)。A.管理HDFS的名稱空間B.管理數(shù)據(jù)塊映射信息C.處理客戶端讀寫請求D.執(zhí)行數(shù)據(jù)塊讀/寫19.下列不屬于YARN的組件是(D)。A.ResourceManager和NodeManagerB.ApplicationMasterC.Container.SchedulerD.ClusterManager20.下列關(guān)于MessageQueue定義正確的是(A)。A. 是一種消息隊列服務(wù)中間件,提供一套完整的信息生產(chǎn).傳遞.消費的軟件系統(tǒng)。B. 是一款用于在Hadoop和關(guān)系數(shù)據(jù)庫服務(wù)器之間傳輸數(shù)據(jù)的工具。C. 提供對數(shù)據(jù)進行簡單處理,并寫到各種數(shù)據(jù)接受方的能力。D. 是基于內(nèi)存計算的大數(shù)據(jù)并行計算框架。21.下列哪個不屬于MessageQueue工具(D)。A. RabbitMQ。B. ActiveMQ。C. Kafka。D. Sqoop。22.下列關(guān)于MapReduce計算框架描述不正確是(D)。A. MapReduce是一種離線數(shù)據(jù)計算框架。B. 源自于Google發(fā)表于2004年12月的MapReduce論文。C. HadoopMapReduce是GoogleMapReduce克隆版。D. MapReduce是Mesos的原生批處理計算框架。23.下列適合MapReduce應(yīng)用場景的是(D)。A.實時計算。B.流式計算。C.DAG計算。D.離線批處理。24.下列屬于Spark核心(SparkCore)的基礎(chǔ)核心功能(B)。A. 提供常用機器學(xué)習(xí)算法的實現(xiàn)。B. 提供內(nèi)存計算.任務(wù)調(diào)度.部署模式.故障恢復(fù).存儲管理等。C. 提供用于圖計算的API,能在海量數(shù)據(jù)上自如地運行復(fù)雜的圖算法。D. 提供高吞吐量.可容錯處理的實時流數(shù)據(jù)處理。25.下列不屬于Strom特性的是(D)。A. 適用場景廣泛,可伸縮性高。B. 保證無數(shù)據(jù)丟失.異常健壯C. 容錯性好.語言無關(guān)性D. 是一個通用資源管理系統(tǒng)和調(diào)度平臺。26.智慧城市的構(gòu)建,不包含(D)。A. 物聯(lián)網(wǎng)。B. 數(shù)字城市。C. 云計算。D. 聯(lián)網(wǎng)監(jiān)控。二.多選題1.云計算通過網(wǎng)絡(luò),借助(ABCD)等先進的商業(yè)模式把強大的計算能力分布到終端用戶手中。A.SaaSB.PaaSC.IaaSD.MSP2.云計算的特征包括(ABCD)。A.隨需應(yīng)變的自助服務(wù).廣泛的網(wǎng)絡(luò)訪問B.資源池化C.快速靈活擴展性D.可計量的服務(wù)3.對于云計算消費者,云計算的優(yōu)勢有(ABD)。A.提高了數(shù)據(jù)的安全性B.大型昂貴軟件平民化C.應(yīng)用系統(tǒng)絕對可靠,不會出現(xiàn)宕機D.提高了用戶體驗4.下列哪些應(yīng)用屬于大數(shù)據(jù)技術(shù)的應(yīng)用(ABCD)。A.電商網(wǎng)站上對注冊用戶瀏覽信息記錄.分析.挖掘,為用戶推送感興趣的商品。B.音視頻網(wǎng)站上通過分析注冊用戶的瀏覽習(xí)慣,為用戶推送感興趣的音視頻。C.政務(wù)領(lǐng)域中的智慧城市建設(shè),如智慧交通.智慧醫(yī)療.智慧教育等。D.手機銀行或網(wǎng)上銀行在用戶畫像基礎(chǔ)上,對用戶群進行定位,挖掘潛在金融服務(wù)需求。5.云計算的服務(wù)模式包括(ABD)。A.基礎(chǔ)設(shè)施即服務(wù)B.平臺即服務(wù)C.系統(tǒng)即服務(wù)D.軟件即服務(wù)6.云計算的劣勢有(BCD)。A.信息技術(shù)產(chǎn)業(yè)進一步合理分工B.嚴重依賴網(wǎng)絡(luò)C.數(shù)據(jù)泄密的環(huán)節(jié)增多D.風險被集中7.云計算部署模型有(ABC)。A.公有云B.私有云C.混合云D.PaaS云8.以下哪些是虛擬化需要解決的問題(ABCD)。A.隔離性B.移動性C.安全性D.可配額/可度量9.根據(jù)虛擬機監(jiān)控器在虛擬化平臺中的位置分為3種模型(ABC)。A.裸機虛擬化模型B.宿主機虛擬化模型C.混合模型D.操作系統(tǒng)虛擬化模型10.I/O設(shè)備虛擬化模式包括(ABC)。A.I/O全虛擬化B.I/O半虛擬化C.I/O直通虛擬化D.內(nèi)存儲器虛擬化11.虛擬技術(shù)特性有(ABCD)。A.分區(qū)B.隔離C.封裝D.相對于硬件獨立12.虛擬化的益處包括(ABCD)。A.實現(xiàn)資源最優(yōu)利用B.實現(xiàn)動態(tài)負載均衡C.通過系統(tǒng)自愈功能提升可靠性D.實現(xiàn)節(jié)能減排13.個人PC上使用比較多的虛擬化工具有(AB)。A.VMwareWorkstationB.VirtualBoxC.XenD.KVM14.NAS的典型應(yīng)用場景有哪些(ABCD)。A.內(nèi)部文件共享B.海量非結(jié)構(gòu)化數(shù)據(jù)C.對帶寬要求較高的數(shù)據(jù)讀寫D.文件級數(shù)據(jù)整合15.存儲云與傳統(tǒng)存儲平臺區(qū)別有哪些(ABCD)。A.快速為用戶部署存儲空間B.按實際用量計費,降低存儲成本C.彈性擴展存儲空間D.系統(tǒng)管理簡單16.開放系統(tǒng)的存儲類型分為內(nèi)置存儲和外掛存儲,其中外掛存儲可分為(ABC)。A.直連式存儲(DAS)B.網(wǎng)絡(luò)接入存儲(NAS)C.存儲區(qū)域網(wǎng)絡(luò)(SAN)D.移動存儲17.根據(jù)實現(xiàn)方式,可將存儲虛擬化分為(AB)。A.帶內(nèi)虛擬化B.帶外虛擬化C.文件虛擬化D.塊虛擬化18.根據(jù)存儲虛擬化實現(xiàn)的位置,可將存儲虛擬化分為(ABC)。A.基于主機的虛擬化B.基于存儲設(shè)備的虛擬化C.基于網(wǎng)絡(luò)的虛擬化D.磁帶或磁帶庫虛擬化19.Overlay主要技術(shù)標準有(ACD)。A.VXLANB.OpenFlowC.NVGRED.STT20.基于SDN的網(wǎng)絡(luò)架構(gòu)可以更容易地實現(xiàn)網(wǎng)絡(luò)虛擬化理由是(ABCDE)A.SDN提供網(wǎng)絡(luò)拓撲統(tǒng)一視圖B.高利用率C.快速故障修復(fù)D.平滑升級E.彈性計算21.NFV依賴SDN(軟件定義網(wǎng)絡(luò))原理,把網(wǎng)絡(luò)操作分成(ABC)A.用戶平面B.控制平面C.管理和編排(MANO)平面D.數(shù)據(jù)平面22.軟件定義網(wǎng)絡(luò)(SDN)特點(ABCD)。A.控制轉(zhuǎn)發(fā)分離B.控制平面集中化C.轉(zhuǎn)發(fā)平面通用化D.控制器軟件可編程23.OpenFlow組件包括(AB)。A.OpenFlow控制器B.OpenFlow交換機C.數(shù)據(jù)轉(zhuǎn)發(fā)平面D.控制平面24.根據(jù)OverLay的載體不同,VXLAN的OverLay分為(ABC)3種。A.主機OverLayB.網(wǎng)絡(luò)OverLayC.混合OverLayD.虛實OverLay25.云平臺管理工具有哪些(ABCD)。A.SystemCenterVMMB.vCenter+vSphereclientC.CloudStackD.OpenStack26.云交付的組成部分中,通信協(xié)議有(ABC)。A.RDP(微軟)B.PCoIP(VMware)C.ICA/HDX(RedHat)D.TCP協(xié)議27.以下屬于IaaS管理工具的有(ABCD)。A.OpenStackB.CloudPlatformC.HelionEucalyptusD.CloudStack28.以下屬于VMware公司的虛擬化平臺組件是(ABCD)。A.EXSiB.vSphereHypervisorC.WorkstationD.Fusion29.以下屬于Microsoft公司的云計算組件是(ABCD)。A.虛擬化平臺WindowsServerContainerB.虛擬化平臺Hyper-VContainerC.云計算管理平臺SystemCenter2016D.通信協(xié)議RemoteFX和RDP8版30.虛擬化平臺軟件有哪些(ABCD)。A.Hyper-VB.EsxiC.xenServerD.KVM31.下列描述中正確的有(ABC)。A.集群是指一組桌面計算機或服務(wù)器通過局域網(wǎng)連接在一起,運轉(zhuǎn)方式類似于一個更大型的計算機。B.集群中每個節(jié)點都運行自己的操作系統(tǒng),節(jié)點之間使用網(wǎng)絡(luò)協(xié)議進行通信。C.最大規(guī)模的集群稱為倉庫級計算機(WSC),它們的設(shè)計方式使數(shù)萬個服務(wù)器像一個服務(wù)器一樣運行。D.倉庫級計算機(WSC)是指大型機。32.以下屬于PaaS管理工具的有(AB)。A.紅帽公司的OpenShiftB.CloudFoundry社區(qū)的CloudFoundryC.Hyper-VD.KVM33.大數(shù)據(jù)的特點對通用大數(shù)據(jù)分析系統(tǒng)架構(gòu)的顯式需求(ABC)。A.海量的計算B.海量的存儲C.快速的計算D.低成本34.大數(shù)據(jù)系統(tǒng)框架主要解決兩個問題(AB)。A.大數(shù)據(jù)存儲B.大數(shù)據(jù)計算C.統(tǒng)計/分析D.數(shù)據(jù)挖掘35.數(shù)據(jù)處理大致分為兩類(AB)。A.OLTP(On-LineTransactionProcessing:聯(lián)機事務(wù)處理)B.OLAP(On-LineAnalyticalProcessing:聯(lián)機分析處理)C.數(shù)據(jù)倉庫D.機器學(xué)習(xí)36.以下屬于大數(shù)據(jù)框架技術(shù)底層資源管理的是(AB)。A.YARNB.MesosC.FlumeD.Storm37.大數(shù)據(jù)4V特點是(ABCD)。A.Volume(體量大)B.Velocity(處理速度快)C.Variety(數(shù)據(jù)類型多)D.Value(價值密度低)38.大數(shù)據(jù)的定義是(AB)。A.指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行捕捉.管理和處理的數(shù)據(jù)集合B.任何超過了一臺計算機處理能力的數(shù)據(jù)量C.具有很大價值的數(shù)據(jù)D.超過個人PC機或筆記本硬盤存儲容量的數(shù)據(jù)39.大數(shù)據(jù)的處理流程涉及(ABCD)。A.數(shù)據(jù)采集B.數(shù)據(jù)導(dǎo)入/預(yù)處理C.統(tǒng)計/分析D.數(shù)據(jù)挖掘與預(yù)測40.大數(shù)據(jù)的科學(xué)價值和社會價值正是體現(xiàn)在(AB)。A.對大數(shù)據(jù)的掌握程度可以轉(zhuǎn)化為經(jīng)濟價值來源B.大數(shù)據(jù)已經(jīng)撼動了世界的方方面面,從商業(yè)科技到醫(yī)療.政府.教育.經(jīng)濟.人文以及社會的其他各個領(lǐng)域C.大數(shù)據(jù)的價值不再單純來源于它的基本用途,而更多源于它的二次利用D.大數(shù)據(jù)時代,很多數(shù)據(jù)在收集的時候并無意用作其他用途,而最終卻產(chǎn)生了很多創(chuàng)新性的用途。41.Hadoop2.x和Hadoop3.x區(qū)別包括(ABCD)。A.Java運行環(huán)境升級為1.8B.HDFS支持糾刪碼C.YARN時間線服務(wù)D.支持多余2個以上的NameNodes42.Hadoop1.0和Hadoop2.0區(qū)別包括(ABC)。A.Hadoop2.0新增了HDFSHA機制B.Hadoop2.0新增了HDFSfederationC.Hadoop2.0新增了YARN框架D.Hadoop2.0的MapReduce本地優(yōu)化,性能提升了30%43.Hadoop2.0和Hadoop3.0區(qū)別包括(ABD)。A.Hadoop3.0的Java運行環(huán)境升級為1.8B.Hadoop3.0支持多于2個以上的NameNodesC.Hadoop3.0新增了YARN框架D.Hadoop3.0的HDFS支持糾刪碼44.HDFS的優(yōu)點包括(ABC)。A. 高容錯性,適合批處理B. 構(gòu)建在廉價機器上C. 適合大數(shù)據(jù)處理,流式文件訪問D. 對延時要求在毫秒級別的應(yīng)用45.下列關(guān)于HDFS描述中正確的有(ABCD)。A. HDFS的文件被拆分成block-sized的chunk,chunk作為獨立單元存儲。B. 整個HDFS集群由Namenode和Datanode構(gòu)成master-worker(主從)模式。C. 采用HA的HDFS集群配置兩個NameNode,分別處于Active和Standby狀態(tài)。D. HDFSFederation提供了一種橫向擴展NameNode的方式。46.下列關(guān)于HDFS架構(gòu)描述中正確的有(ABC)。A. ActiveNamenode屬于主Master(只有一個)。B. ActiveNamenode管理HDFS的名稱空間,管理數(shù)據(jù)塊映射信息。C. ActiveNamenode配置副本策略,處理客戶端讀寫請求D. ActiveNamenode存儲實際的數(shù)據(jù)塊.具體執(zhí)行數(shù)據(jù)塊讀/寫47.下列關(guān)于HDFS架構(gòu)中Client功能描述正確的有(ABC)。A. 與NameNode交互,獲取文件位置信息。B. 與DataNode交互,讀取或者寫入數(shù)據(jù)。C. 完成文件切分,管理HDFSD. 定期合并fsimage和fsedits,推送給NameNode48.HDFS可靠性策略包括(ABCD)。A. 文件完整性,CRC32校驗和副本取代損壞文件。B. Datanode定期向Namenode發(fā)heartbeat。C. 文件多份存儲,主備NameNode實時切換D. 元數(shù)據(jù)信息fsimage和fsedits,推送給NameNode49.以下說法正確的是(ABCD)。A.HDFS源自于Google的GFS論文B.HDFS是一易于擴展的分布式文件系統(tǒng)C.HDFS運行在大量普通廉價機器上,提供容錯機制D.HDFS為大量用戶提供性能不錯的文件存取服務(wù)50.HDFS不適合的場景(ABCD)。A.存儲小文件。B.對延遲要求較高的場景。C.支持多用戶寫入。D.進行文件隨機修改。51.下列關(guān)于YARN框架描述正確的有(ABCD)。A. ResourceManager負責整個集群的資源管理和分配。B. NodeManager是每個節(jié)點上的資源和任務(wù)管理器。C. NodeManager定時向ResourceManager匯報本節(jié)點資源的使用情況和Container的運行狀態(tài)。D. ApplicationMaster負責與RM調(diào)度器協(xié)商以獲取資源。52.下列關(guān)于Mesos資源管理器描述正確的有(ABC)。A. Mesos是一個開源的資源管理系統(tǒng),可以對集群中的資源做彈性管理。B. Mesos是Apache下的開源分布式資源管理框架,被稱為是分布式系統(tǒng)的內(nèi)核。。C. Mesos最初是由加州大學(xué)伯克利分校的AMPLab開發(fā)的。D. Mesos后在TikTok得到廣泛使用。53.下列關(guān)于Mesos與Yarn區(qū)別描述正確是(ABCD)。A. Mesos實現(xiàn)語言是C++,YARN實現(xiàn)語言是Java。B. Mesos中的MesosMaster實現(xiàn)對整個集群資源管理和調(diào)度。C. YARN中的ResourceManager實現(xiàn)對整個集群資源管理和調(diào)度。D. Mesos中的MesosSlave和FrameworkExecutor對應(yīng)YARN中的NodeManager主要實現(xiàn)單個節(jié)點的資源管理.任務(wù)啟動。54.字節(jié)跳動對YARN的定制主要實現(xiàn)(ABCD)。A. 物理資源分配率提升和使用率提升。B. 多種負載場景優(yōu)化。C. 穩(wěn)定性提升。D. 異地多活,全球統(tǒng)一的YARNUI界面。55.下列關(guān)于YARN描述正確的有(ABCD)。A.YARN是一個通用資源管理系統(tǒng)和調(diào)度平臺。B.YARN為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度。C.YARN與運行的用戶程序完全解耦。D.YARN只提供運算資源的調(diào)度。56.下列基于Yarn的計算框架描述正確是(ABC)。A.MapReduce是一種離線數(shù)據(jù)計算框架。B.Storm是Twitter開源的分布式實時大數(shù)據(jù)處理框架。C.Spark是基于內(nèi)存計算的大數(shù)據(jù)并行計算框架。D.Flink是一種離線的數(shù)據(jù)計算框架。57.字節(jié)跳動公司產(chǎn)品對YARN的定制應(yīng)用描述正確是(BC)。A.實現(xiàn)YARN支持單集群使用。B.YARN主要承載著字節(jié)跳動公司內(nèi)的離線作.流式作業(yè).模型訓(xùn)練三大場景。C.公司的抖音.今日頭條等產(chǎn)品重度依賴推薦,團隊對調(diào)度器進行了深度定制。D.將HDFS做成強依賴。58.大數(shù)據(jù)采集過程中或完成后數(shù)據(jù)的預(yù)處理包括(ABCD)。A. 對殘缺數(shù)據(jù)進行預(yù)處理。B. 對錯誤數(shù)據(jù)進行預(yù)處理。C. 對重復(fù)的數(shù)據(jù)進行預(yù)處理。D. 對數(shù)據(jù)的不一致性進行預(yù)處理。59.下列關(guān)于Flume數(shù)據(jù)采集框架描述正確的有(ABC)。A. Flume是一個海量日志采集.聚合和傳輸?shù)南到y(tǒng)。B. Flume支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù)。C. Flume提供對數(shù)據(jù)進行簡單處理,并寫到各種數(shù)據(jù)接受方的能力。D. Flume基于zookeeper協(xié)調(diào)的分布式日志系統(tǒng),也可當做MQ系統(tǒng)。60.下列關(guān)于MessageQueue或消息系統(tǒng)描述正確的有(ABD)。A. MessageQueue負責將數(shù)據(jù)從一個應(yīng)用傳遞到另外一個應(yīng)用,應(yīng)用只需關(guān)注于數(shù)據(jù)。B. 分布式消息傳遞基于可靠的消息隊列,在客戶端應(yīng)用和消息系統(tǒng)之間異步傳遞消息。C. Kafka將數(shù)據(jù)封裝到事件(event)里,然后將事件推入Channel中。D. 常用消息傳遞模式包括點對點傳遞模式和發(fā)布-訂閱模式。61.下列關(guān)于MessageQueue功能描述正確的是(AB)。A. 削峰填谷。B. 程序間解耦。C. 遷移數(shù)據(jù)。D. 轉(zhuǎn)換數(shù)據(jù)格式。62.常用大數(shù)據(jù)采集途徑有(ABCD)。A.數(shù)據(jù)服務(wù)機構(gòu)。B.互聯(lián)網(wǎng)數(shù)據(jù)采集。C.APP移動端數(shù)據(jù)采集。D.智能感知設(shè)備。63.下列關(guān)于Flume架構(gòu)描述正確的有(ABCD)。A.Source是數(shù)據(jù)的收集端,負責將數(shù)據(jù)捕獲后進行特殊的格式化。B.Source將數(shù)據(jù)封裝到事件(event)里,然后將事件推入Channel中。C.Channel是連接Source和Sink的組件,它將保存事件直到Sink處理完該事件。D.Sink負責持久化日志或者把事件推向另一個Source。64.下列關(guān)于數(shù)據(jù)遷移工具Sqoop描述正確的有(ABC)。A.Sqoop是一款用于在Hadoop和關(guān)系數(shù)據(jù)庫服務(wù)器之間傳輸數(shù)據(jù)的工具。B.Sqoop工作機制是將導(dǎo)入或?qū)С雒罘g成MapReduce程序來實現(xiàn)。C.Sqoop工具本質(zhì)就是遷移數(shù)據(jù)。D.Sqoop工具只能用于非關(guān)系型數(shù)據(jù)庫之間遷移。65.下列關(guān)于Kafka描述正確的有(ABC)。A.Kafka是一個分布式.分區(qū)的.多副本的.多訂閱者日志系統(tǒng)。B.Kafka是一基于zookeeper協(xié)調(diào)的分布式日志系統(tǒng)。C.Kafka可以用于web/nginx日志.訪問日志采集,也可用于消息服務(wù)等等。D.Kafka可以用于遷移數(shù)據(jù)。66.下列關(guān)于MapReduce2.0架構(gòu)描述正確的有(ABCD)。A.MapReduce2.0將JobTracker兩個主要的功能資源管理和任務(wù)調(diào)度/監(jiān)控分離成單獨的組件。B.MapReduce2.0架構(gòu)包括ResourceManager.NodeManager.ApplicationMaster.Container組件。C.MapReduce2.0架構(gòu)中的ResourceManager是基于應(yīng)用程序?qū)Y源的需求進行調(diào)度的資源調(diào)度器。D.MapReduce2.0架構(gòu)中的NodeManager是執(zhí)行應(yīng)用程序的容器,監(jiān)控應(yīng)用程序的資源使用情況并且向調(diào)度器匯報。67.下列關(guān)于Spark計算框架描述正確的有(ABC)。A.由加州大學(xué)伯克利分校AMP實驗室(Algorithms,Machines,andPeopleLab)開發(fā)。B.類似HadoopMapReduce的通用并行框架,是基于內(nèi)存計算的大數(shù)據(jù)并行計算框架。C.可用于構(gòu)建大型的.低延遲的數(shù)據(jù)分析應(yīng)用程序。D.Spark運算比Hadoop的MapReduce框架慢。68.下列屬于在Spark核心框架的基礎(chǔ)上提供的計算框架(ABCD)。A.SparkSQL。B.SparkStreaming。C.Spark(machinelearning)。D.GraphX(graph)。69.下列屬于SparkSQL特點的是(ABCD)。A.實現(xiàn)SQL查詢與Spark程序無縫混合。B.可以相同方式連接到任何數(shù)據(jù)源。C.在現(xiàn)有倉庫上運行HiveQL實現(xiàn)與Hive集成:。D.通過JDBC或ODBC連接數(shù)據(jù)庫。70.下列關(guān)于SparkStreaming描述正確的有(ABC)。A. 是構(gòu)建在SparkRDD之上的一款流處理工具。B. 是Spark核心(SparkCore)API的一個擴展。C. 可以實現(xiàn)高吞吐量的,具備容錯機制的實時流數(shù)據(jù)處理。D. 處理后的結(jié)果只能存儲成HDFS文件。71.關(guān)于Spark的RDD描述正確的有(ABC)。A. RDD(ResilentDistributedDatasets)是彈性分布式數(shù)據(jù)集簡稱。B. 是Spark底層的分布式存儲的數(shù)據(jù)結(jié)構(gòu),是Spark的核心。C. SparkAPI的所有操作都是基于RDD的。D. RDD是一種可讀寫的數(shù)據(jù)塊。72.Spark的RDD的基本特性有(ABC)。A. 分區(qū)。B. 不可變。C. 并行操作。D. 各個節(jié)點上的數(shù)據(jù)塊盡可能的存儲在硬盤中。73.下列關(guān)于Spark使用場景描述正確的有(ABC)。A.復(fù)雜的海量數(shù)據(jù)批量處理,時間在數(shù)十分鐘到數(shù)小時之間。B.基于歷史數(shù)據(jù)的交互式查詢,時間在數(shù)十秒到數(shù)十分鐘之間。C.基于實時數(shù)據(jù)流的數(shù)據(jù)處理,時間在數(shù)百毫秒到數(shù)秒之間。D.將數(shù)據(jù)緩存在內(nèi)存中,中間的計算結(jié)果寫入到磁盤的離線數(shù)據(jù)計算框架。74.下列關(guān)于SparkGraphX圖計算描述正確的有(ABC)。A.圖上的計算任務(wù)分成圖并行計算和數(shù)據(jù)并行計算兩種。B.圖并行計算任務(wù)是指那些迭代計算任務(wù),如PageRank。C.數(shù)據(jù)并行計算任務(wù)是指圖上代數(shù)運算,如構(gòu)建一個圖.合并兩個圖.跨越多個圖等。D.將SparkSQL轉(zhuǎn)換成RDD,然后提交到集群執(zhí)行。75.Spark運行架構(gòu)包括(ABCD)。A.集群資源管理器(ClusterManager)。B.運行作業(yè)任務(wù)的工作節(jié)點(WorkerNode)。C.每個應(yīng)用的任務(wù)控制節(jié)點(Driver)。D.每個工作節(jié)點上負責具體任務(wù)的執(zhí)行進程(Executor)。76.Storm的主要組件包括(ABCD)。A. Spouts和Streams。B. Bolts。C. Topology。D. StreamGroupings。77.下列對Storm集群結(jié)構(gòu)描述正確的是(ABCD)。A.Nimbus負責在集群范圍內(nèi)分發(fā)代碼.為Worker分配任務(wù)和監(jiān)測故障。B.Zookeeper負責Nimbus和多個Supervisor之間的所有協(xié)調(diào)工作。C.Worker節(jié)點運行名為“Supervisor”的后臺程序負責監(jiān)聽分配給它所在機器的工作。D.Supervisor負責接受Nimbus分配的任務(wù),管理屬于自己的Worker進程。78.下列Storm工作流程描述正確的是(ABCD)。A.Client節(jié)點提交Topology任務(wù)。B.Nimbus節(jié)點將提交的Topology進行分片,分成一個個Task,分配給相應(yīng)的Supervisor。C.Nimbus節(jié)點將Task和Supervisor相關(guān)的信息提交到Zookeeper集群上。D.Supervisor去Zookeeper集群上認領(lǐng)自己的Task,通知自己的Worker進程進行Task的處理。79.基于Hadoop架構(gòu)設(shè)計一數(shù)據(jù)庫產(chǎn)品Hbase原因有(ABCD)。A. Hadoop無法滿足大規(guī)模數(shù)據(jù)實時處理應(yīng)用的需求。B. HDFS面向批量訪問模式,不是隨機訪問模式。C. 傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫無法應(yīng)對在數(shù)據(jù)規(guī)模劇增時導(dǎo)致的系統(tǒng)擴展性和性能問題。D. 傳統(tǒng)關(guān)系數(shù)據(jù)庫在數(shù)據(jù)結(jié)構(gòu)變化時一般需要停機維護,空列浪費存儲空間。80.關(guān)于Hbase基本架構(gòu)描述正確的是(ABC)。A. RegionServer是數(shù)據(jù)節(jié)點,用來存儲數(shù)據(jù),實時的向Master報告信息。B. Master知道全局RegionServer運行情況,可以控制RegionServer的故障轉(zhuǎn)移和Region的切分。C. Zookeeper作為分布式的協(xié)調(diào)。RegionServer也會把自己的信息寫到ZooKeeper中。D. 無Master過程中,數(shù)據(jù)讀取.region切分.負載均衡無法照常進行。81.Hbase基本架構(gòu)中Zookeeper作為分布式協(xié)調(diào),主要功能包括(ABCD)。A. 保證任何時候,集群中只有一個master。B. 存儲所有Region的尋址入口。C. 實時監(jiān)控Regionserver的上線和下線信息,并實時通知給Master。D. 存儲HBase的schema和table元數(shù)據(jù)。82.Hbase基本架構(gòu)中Master主要功能包括(ABCD)。A. 為Regionserver分配region。B. 負責Regionserver的負載均衡。C. 發(fā)現(xiàn)失效的Regionserver并重新分配其上的region。D. 管理用戶對table的增刪改查操作據(jù)。83.Hbase基本架構(gòu)中RegionServer容錯實現(xiàn)是(ABC)。A. RegionServer定時向Zookeeper匯報心跳。B. 如果一段時間內(nèi)未出現(xiàn)心跳,Master將該RegionServer上的Region重新分配到其他RegionServer上。C. 失效RegionServer上“預(yù)寫”日志由主服務(wù)器進行分割并派送給新的RegionServer。D. Hbase基本架構(gòu)中一般配置3個或5個Zookeeper實例。84.Hbase數(shù)據(jù)模型中邏輯視圖描述正確的是(ABC)。A. HBaseschema可以有多個Table。B. 每個表可由多個ColumnFamily組成。C. HBase可以有DynamicColumn。D. ColumnFamily只包含一個列。85.Hbase數(shù)據(jù)模型中物理視圖描述正確的是(ABCD)。A. Table中的所有行都按照rowkey的字典序排列。B. Table在行的方向上分割為多個Region。C. Region按大小分割的,當增大到一個閥值的時候,region就會等分為兩個新的region。D. Region是HBase中分布式存儲和負載均衡的最小單元。86.在當今云計算.大數(shù)據(jù)盛行的時代,對數(shù)據(jù)庫產(chǎn)品提出以下要求(ABCD)。A. 低延遲的讀寫速度。B. 支撐海量的數(shù)據(jù)和流量。C. 大規(guī)模集群的管理。D. 龐大運營成本的考量。87.下列關(guān)于Hbase描述正確的是(ABCD)。A.HBase是一個開源的非關(guān)系型分布式數(shù)據(jù)庫。B.運行于HDFS文件系統(tǒng)之上。C.是Google的BigTable的開源實現(xiàn)。D.主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)。88.下列哪些數(shù)據(jù)庫產(chǎn)品是NoSQL數(shù)據(jù)庫(ABD)。A.Redis。B.MongoDB。C.MySQL。D.Cassandra。89.下列關(guān)于數(shù)據(jù)倉庫工具Hive架構(gòu)描述正確的是(ABCD)。A. HiveQL通過命令行或者客戶端提交。B. 經(jīng)過Compiler編譯器,運用MetaStore中的元數(shù)據(jù)進行類型檢測和語法分析,生成一個邏輯方案(LogicalPlan)。C. 通過的優(yōu)化處理,產(chǎn)生一個MapReduce任務(wù)。D. Hive的數(shù)據(jù)存儲在HDFS中。90.下列關(guān)于數(shù)據(jù)倉庫工具Hive描述正確的是(ABD)。A.Hive是一個構(gòu)建在Hadoop上的數(shù)據(jù)倉庫框架。B.Hive可以將結(jié)構(gòu)化的數(shù)據(jù)映射為一張數(shù)據(jù)庫表,并提供HQL(HiveSQL)查詢功能。C.Hive是Google的BigTable的開源實現(xiàn),所有的數(shù)據(jù)都存儲在HDFS中。D.Hive的本質(zhì)是將SQL語句轉(zhuǎn)換為MapReduce任務(wù)運行。91.下列關(guān)于數(shù)據(jù)倉庫工具Hive架構(gòu)描述正確的是(ABD)。A.Hive用戶接口主要有三個:CLI,JDBC/ODBC和WebUI,最常用的是CLI。B.Hive將元數(shù)據(jù)存儲在關(guān)系型數(shù)據(jù)庫中,有三種模式可連接到數(shù)據(jù)庫。C.Driver組件主要完成HQL查詢語句的詞法分析.語法分析.編譯.優(yōu)化以及查詢計劃的生成。D.Hive的數(shù)據(jù)存儲在HDFS中,大部分的HQL查詢請求.Hive內(nèi)部自動轉(zhuǎn)換為MapReduce任務(wù)執(zhí)行。92.下列屬于軟件類數(shù)據(jù)可視化工具有(ABC)。A. Tableau。B. FineBI。C. Power-BI。D. Echarts。93.數(shù)據(jù)可視化常用方式有(ABCD)。A. 面積&尺寸可視化。B. 顏色可視化。C. 圖形可視化。D. 地域空間可視化。94.數(shù)據(jù)可視化工具分為(ABD)。A.零編程類。B.開發(fā)工具類。C.畫圖工具。D.專業(yè)圖表類。95.數(shù)據(jù)可視化常用方式包括(ABCD)。A.面積&尺寸可視化。B.顏色.圖形可視化。C.地域空間可視化。D.概念可視化。96.傳統(tǒng)數(shù)據(jù)密集型行業(yè)積極探索和布局大數(shù)據(jù)應(yīng)用表現(xiàn)在(ABCD)。A.投資入股涉及消費各種互聯(lián)網(wǎng)企業(yè)。B.打通多源跨域數(shù)據(jù)。C.提高分析挖掘能力。D.實現(xiàn)科學(xué)決策與運營。97.關(guān)于數(shù)據(jù)的潛在價值,說法正確的是(ABCD)。A. 數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼看到的只是冰山一角,絕大部分隱藏在表面之下。B. 判斷數(shù)據(jù)的價值需要考慮到未來它可能被使用的各種方式,而非僅僅考慮其目前的用途。C. 在基本用途完成后,數(shù)據(jù)的價值仍然存在,只是處于休眠狀態(tài)。D. 數(shù)據(jù)的價值是其所有可能用途的總和。四.判斷題1.日常我們用到的云服務(wù)器.釘釘辦公軟件.百度網(wǎng)盤等應(yīng)用都是云計算服務(wù)廠商提供的云計算服務(wù)。(√)2.公眾普遍認為,2006年8月9日,Google首席執(zhí)行官埃里克·施密特(EricSchmidt)在搜索引擎大會(SESSanJose2006)上首次提出“云計算(CloudComputing)”的概念。(√)3.云計算是把有形的產(chǎn)品(網(wǎng)絡(luò)設(shè)備.服務(wù)器.存儲設(shè)備.各種軟件等)轉(zhuǎn)化為服務(wù)產(chǎn)品(IaaS,PaaS,SaaS),并通過網(wǎng)絡(luò)讓人們遠程在線使用。(√)4.云計算是一種計算模式,能夠提供隨時隨地.便捷的.隨需應(yīng)變的網(wǎng)絡(luò)接入,訪問可配置的計算資源共享池。(√)5.虛擬化是一項技術(shù),而云是一種環(huán)境或服務(wù)。(√)6.百度網(wǎng)盤.有道云筆記.阿里云服務(wù)器.微軟Azure等都是云計算服務(wù)。(√)7.加州大學(xué)伯克利分校給云計算的定義是指數(shù)據(jù)中心中的硬件和系統(tǒng)軟件。(√)8.云計算是從網(wǎng)格計算演化而來的,能夠隨需應(yīng)變的提供資源。(√)9.虛擬化技術(shù)是云計算發(fā)展的一個重要技術(shù)推力。(√)10.PaaS實質(zhì)是將互聯(lián)網(wǎng)資源服務(wù)化為可編程接口。(√)11.虛擬化的主要功能是把單個資源抽象成多個給用戶使用,而云計算則是幫助不同部門或公司訪問一個自動置備的資源池。(√)12.Ceph計算模式是一種完全無中心架構(gòu)(√)13.牛津大學(xué)的計算機教授,克里斯·托弗(ChristopherStrachey)發(fā)表了虛擬化論文,虛擬化是云計算基礎(chǔ)架構(gòu)的基石。(√)14.Hypervisor(虛擬機監(jiān)控程序)軟件可有效分隔物理資源,并將這些資源分配給不同虛擬環(huán)境使用。(√)15.Hypervisor(虛擬機監(jiān)控程序)接管物理資源,并√它們進行劃分,以便虛擬環(huán)境能夠√其進行使用。(√)16.虛擬化技術(shù)主要用于云計算物理資源的池化,從而可以彈性地分配給用戶。(√)17.2006年,Intel和AMD等廠商相繼將√虛擬化技術(shù)的支持加入到x86體系結(jié)構(gòu)的中央處理器中(AMD-V,IntelVT-x),使原來純軟件實現(xiàn)的各項功能可以用借助硬件的力量實現(xiàn)提速。(√)18.2007年1月,Sun公司發(fā)布了開源虛擬化軟件VirtualBox。同年Xen被Citrix(思杰)收購。(√)19.2008年9月4日,RedHat收購以色列公司Qumranet,并著手使用KVM替換在RedHat中的使用的Xen。(√)20.2010年10月21日,NASA發(fā)布了可以IaaS(基礎(chǔ)設(shè)施即服務(wù))云操作系統(tǒng)OpenStack,第一個版本Austin(奧斯丁)。(√)21.半虛擬化技術(shù)是指虛擬機模擬了完整的底層硬件,包括處理器.物理內(nèi)存.時鐘.外設(shè)等。(×)22.全虛擬化同時能夠支持多個不同的操作系統(tǒng)。(√)23.虛擬機(VM)是在一個硬件平臺上模擬一個或者多個獨立的和實際底層硬件相同的執(zhí)行環(huán)境。(√)24.GuestOS通過虛擬機監(jiān)控器提供的抽象層來實現(xiàn)對物理資源的訪問和操作。(√)25.VMM或Hypervisor稱為虛擬機監(jiān)控器,負責為虛擬機統(tǒng)一分配CPU.內(nèi)存和外設(shè),調(diào)度虛擬資源。(√)26.存儲虛擬化是指將存儲資源集中到一個大容量的資源池并實行單點統(tǒng)一管理,無需中斷應(yīng)用即可改變存儲系統(tǒng)和數(shù)據(jù)遷移。(√)27.軟件定義網(wǎng)絡(luò)(SDN)將網(wǎng)絡(luò)管理與底層網(wǎng)絡(luò)基礎(chǔ)設(shè)施分離開來,允許管理員動態(tài)調(diào)整整個網(wǎng)絡(luò)的流量,以滿足不斷變化的需求。(√)28.虛擬化存儲環(huán)境下,無論后端物理存儲是什么設(shè)備,服務(wù)器及其應(yīng)用系統(tǒng)看到的都是其物理設(shè)備的邏輯映像。(√)29.存儲云是指通過互聯(lián)網(wǎng)或內(nèi)部網(wǎng)提供給云用戶,是一個可擴展的彈性的存儲或數(shù)據(jù)服務(wù),物理存儲設(shè)備√用戶是透明的。(√)30.網(wǎng)絡(luò)虛擬化是一種網(wǎng)絡(luò)技術(shù),可以在物理拓撲上創(chuàng)建虛擬網(wǎng)絡(luò)?;赟DN的網(wǎng)絡(luò)架構(gòu)可以更容易地實現(xiàn)網(wǎng)絡(luò)虛擬化。(√)31.OpenFlow協(xié)議是SDN架構(gòu)中位于控制面和轉(zhuǎn)發(fā)面的第一個標準通信接口,允許直接訪問和操控網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)面。(√)32.Overlay(疊加網(wǎng)絡(luò).覆蓋網(wǎng)絡(luò))是通過在現(xiàn)有網(wǎng)絡(luò)上疊加一個虛擬的邏輯網(wǎng)絡(luò),讓原有網(wǎng)絡(luò)盡量不做改造,通過定義的邏輯網(wǎng)絡(luò)來實現(xiàn)業(yè)務(wù)邏輯,解決原有數(shù)據(jù)中心的網(wǎng)絡(luò)問題。(√)33.Overlay(疊加網(wǎng)絡(luò).覆蓋網(wǎng)絡(luò))是一種隧道封裝技術(shù),將二層網(wǎng)絡(luò)封裝在三層/四層報文中進行傳遞,提供了一種解決數(shù)據(jù)平面轉(zhuǎn)發(fā)和多租戶隔離的技術(shù)手段。(√)34.虛擬交換機(vSwitch)就是利用虛擬平臺,通過軟件的方式實現(xiàn)的交換機部件。(√)35.IaaS云計算解決方案中,云平臺管理工具主要解決如何管理大量虛擬機的問題,包括創(chuàng)建.啟動.停止.備份.遷移虛擬機,以及計算資源的管理和分配。(√)36.IaaS云計算解決方案中,交付部分主要解決如何讓遠端的用戶使用虛擬機的問題。(√)37.最大規(guī)模的集群稱為倉庫級計算機(WSC),它們的設(shè)計方式使數(shù)萬個服務(wù)器像一個服務(wù)器一樣運行。(√)38.虛擬機要運行在虛擬機軟件(虛擬機監(jiān)控器)里,而虛擬機軟件運行在物理機上。(√)39.XenServer是Citrix(思杰)的虛擬化平臺組件,開源,直接安裝在裸機上,核心代碼是Linux和Xen。(√)40.IaaS云計算解決方案中,虛擬化平臺(硬件資源.虛擬軟件)主要解決如何運行虛擬機的問題。(√)41.SaaS云管理工具與業(yè)務(wù)關(guān)聯(lián)性大,目前沒有統(tǒng)一的標準版產(chǎn)品。(√)42.一般地,SaaS云管理軟件包含兩大部分:一是SaaS業(yè)務(wù)門戶,二是SaaS管理門戶。(√)43.大數(shù)據(jù)系統(tǒng)硬件架構(gòu)底層的資源包括存儲資源.計算資源,通過網(wǎng)絡(luò)資源實現(xiàn)連接。(√)44.“大數(shù)據(jù)”其實是海量數(shù)據(jù)采集清洗轉(zhuǎn)換.數(shù)據(jù)存儲.數(shù)據(jù)分析.數(shù)據(jù)服務(wù)等場景解決方案的一個統(tǒng)稱。(√)45.大數(shù)據(jù)思維,是指一種意識,認為公開的數(shù)據(jù)一旦處理得當就能為千百萬人急需解決的問題提供答案。(√)46.大數(shù)據(jù)處理通過對數(shù)據(jù)執(zhí)行操作提高理解能力,揭示出數(shù)據(jù)蘊含的模式,并針對復(fù)雜互動獲得見解。(√)47.大數(shù)據(jù)處理框架負責對大數(shù)據(jù)系統(tǒng)中的數(shù)據(jù)進行計算,是大數(shù)據(jù)系統(tǒng)最基本的組件。(√)48.ApacheHadoop是一種專用于流處理的處理框架,新版Hadoop包含多個組件(HDFS.YARN.MapReduce)。(×)49.ApacheStorm是一種包含流處理能力的下一代批處理框架。Storm框架基于內(nèi)存計算及處理優(yōu)化,保證了集群計算的效率。(×)50.ApacheFlink是一種可以處理批處理任務(wù)的流處理框架。用于對無界和有界數(shù)據(jù)流進行有狀態(tài)計算。(√)51.通用的大數(shù)據(jù)分析系統(tǒng)的核心設(shè)計理念包括并行化.規(guī)模經(jīng)濟.虛擬化。(√)52.大數(shù)據(jù)框架技術(shù)中消息系統(tǒng)技術(shù)有:Kafka.StormMQ.ZeroMQ.RabbitMQ。(√)53.HadoopMapReduce.Spark屬于離線計算框架技術(shù)。(√)54.2007年Hadoop誕生,Hadoop是一個大數(shù)據(jù)計算框架,提供海量數(shù)據(jù)存儲(HDFS).查詢(HBase)和計算(MapReduce)能力。(√)55.2017年12月Hadoop3.0版本加入了通用YARN資源管理器,MapReduce和HDFS有效解耦。(×)56.Hadoop2.0版本加入了通用YARN資源管理器,用以協(xié)調(diào)各個組件√系統(tǒng)資源的利用,合理分配集群CPU.內(nèi)存資源。(√)57.Hadoop2.0版本中,MapReduce2.0只是一個計算框架,具體資源調(diào)度全部交給Yarn框架。(√)58.Hadoop3.0版本中HDFS支持糾刪碼,糾刪碼相比于副本機制節(jié)省了一半以上的存儲空間,普通副本機制需要3倍存儲空間而這種機制只需1.4倍即可。(√)59.HDFS文件的元數(shù)據(jù)保存在NameNode的內(nèi)存中,整個文件系統(tǒng)的文件數(shù)量會受限于NameNode的內(nèi)存大小。(√)60.HDFS架構(gòu)中DataNode有多個,屬于Slave。DataNode存儲實際的數(shù)據(jù)塊.具體執(zhí)行數(shù)據(jù)塊讀/寫。(√)61.StandbyNameNode在架構(gòu)中是NameNode的熱備,當ActiveNameNode出現(xiàn)故障時,快速切換為新的ActiveNameNode。(√)62.采用HA(HighAvailability:高可用性)的HDFS集群配置兩個NameNode,分別處于Active和Standby狀態(tài)。當ActiveNameNode故障之后,Standby接過責任繼續(xù)提供服務(wù)。(√)63.HDFSFederation提供了一種橫向擴展NameNode的方式。在Federation模式中,每個NameNode管理命名空間的一部分。(√)64.傳統(tǒng)的NFS不是一種典型的分布式系統(tǒng),雖然它的文件的確放在遠端(單一)的服務(wù)器上面。(√)65.HDFS文件被切分成固定大小的數(shù)據(jù)塊,為實現(xiàn)高吞吐率,默認數(shù)據(jù)塊大小為128MB。(√)66.HDFS文件不僅支持追加,還支持文件任意offset的修改。(×)67.HDFS不支持多用戶寫入,也無法進行文件隨機修改。僅支持以append的方式,即通過追加的方式添加到文件結(jié)尾處。(√)68.Container是YARN中的資源抽象,它封裝了某個節(jié)點上的多維度資源,如內(nèi)存.CPU.磁盤.網(wǎng)絡(luò)等。(√)68.NodeManager(NM)是一個全局的資源管理器,負責整個系統(tǒng)的資源管理和分配。(×)69.NodeManager(NM)是每個節(jié)點上的資源和任務(wù)管理器。它定時地向RM匯報本節(jié)點上的資源使用情況和各個Container的運行狀態(tài);另一方面,它接收并處理來自AM的Container啟動/停止等各種請求。(√)70.YARN框架中組件ApplicationMaster負責管理整個系統(tǒng)中所有應(yīng)用程序,ApplicationsManager(應(yīng)用程序管理器)管理在YARN內(nèi)運行的每個應(yīng)用程序?qū)嵗#ā粒?1.Mesos組件中NodeManager用來實現(xiàn)√整個集群的資源管理和調(diào)度。(×)72.Storm集群結(jié)構(gòu)中,主節(jié)點Jobtracker,從節(jié)點Tasktracker。(×)73.Storm集群結(jié)構(gòu)中,Nimbus和Supervisors之間所有的協(xié)調(diào)工作是通過一個Zookeeper集群來管理。(√)74.MapReduce.Storm.Spark.Tez等計算框架都可以整合在YARN上運行,只要他們各自的框架中有符合YARN規(guī)范的資源請求機制即可。(√)75.YARN基于ZooKeeper實現(xiàn)HA,主提供服務(wù),備同步主的信息。主掛掉,備立即做切換接替主進行服務(wù)。(√)76.Mesos是一個開源的資源管理系統(tǒng),可以√集群中的資源做彈性管理,目前twitter,apple等公司在大量使用Mesos管理集群資源。(√)77.YARN采用雙層調(diào)度框架,ResourceManager將資源分配給AppMaster,AppMaster將資源進一步分配給各個Task。(√)78.Mesos組件中FrameworkScheduler組件是實現(xiàn)單個應(yīng)用程序的管理和資源二次調(diào)度。(√)79.Spark是一種包含流處理能力的下一代批處理框架。主要應(yīng)用在廣告.報表.推薦系統(tǒng)等業(yè)務(wù)上。(√)80.YARN天生是為批處理而設(shè)計的,很多地方與流式或模型訓(xùn)練場景并不匹配,為了給批處理.流式.模型訓(xùn)練三大場景更好的體驗,字節(jié)跳動√YARN做一些定制工作。(√)81.Flume是一流數(shù)據(jù)采集框架,適合采集互聯(lián)網(wǎng)用戶行為數(shù)據(jù)。Kafka日志采集框架,主要在日志系統(tǒng)采集各類數(shù)據(jù)。(×)82.Sqoop數(shù)據(jù)遷移框架,主要用于在Hadoop(如Hive)與傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(如mysql)間進行數(shù)據(jù)的遷移。(√)83.事件是Flume的基本數(shù)據(jù)單位,一個Event就是一條記錄,由head和body兩個部分組成,head存儲的是管道,body存儲的是字節(jié)數(shù)組。(√)84.Flume可以高速采集數(shù)據(jù),采集的數(shù)據(jù)能夠以想要的文件格式及壓縮方式存儲在HDFS上。(√)85.多SinkAgent或多路復(fù)用流架構(gòu),可在agent中將混雜的日志流分開,然后給每種日志建立一個自己的傳輸通道。(√)86.Flume架構(gòu)中Sink負責持久化日志或者把事件推向另一個Source。(√)87.Sqoop的兩大核心功能是,將關(guān)系型數(shù)據(jù)庫中某張表的數(shù)據(jù)抽取到Hadoop上,或?qū)adoop上的數(shù)據(jù)導(dǎo)出到關(guān)系型數(shù)據(jù)庫(√)88.sqoop2架構(gòu)中,引入了sqoopServer,便于集中化的管理接口訪問.Connector和元數(shù)據(jù)。(√)89.發(fā)布-訂閱模式是將消息持久化到一個隊列中,有一個或多個消費者消費隊列中的數(shù)據(jù),但是一條消息只能被消費一次。(×)90.Kafka集群包含一個或多個服務(wù)器,服務(wù)器節(jié)點稱為broker。每條發(fā)布到Kafka集群的消息都有一個類別,這個類別被稱為Topic。(√)91.消息隊列所涵蓋的功能遠不止于隊列(Queue),其本質(zhì)是兩個進程傳遞信息的一種方法。(√)92.各行業(yè)海量的數(shù)據(jù)中,大約20%左右屬于結(jié)構(gòu)化的數(shù)據(jù),80%的數(shù)據(jù)屬于廣泛存在于社交網(wǎng)絡(luò).物聯(lián)網(wǎng).電子商務(wù)等領(lǐng)域的非結(jié)構(gòu)化數(shù)據(jù)。(√)93.大數(shù)據(jù)的處理流程的第一步就是大數(shù)據(jù)的采集與預(yù)處理。(√)94.發(fā)布-訂閱消息傳遞模式是將消息持久化到一個topic中。消費者可以訂閱一個或多個topic,消費者可以消費該topic中所有的數(shù)據(jù),同一條數(shù)據(jù)可以被多個消費者消費。(√)95.MapReduce2.0將JobTracker兩個主要的功能資源管理和任務(wù)調(diào)度/監(jiān)控分離成單獨的組件。(√)96.如果任務(wù)運行在它將處理的數(shù)據(jù)所在的節(jié)點,則稱該任務(wù)具有“數(shù)據(jù)本地性”。(√)97.MapReduce計算框架具有數(shù)據(jù)本地性特性,本地性可避免跨節(jié)點或機架數(shù)據(jù)傳輸,提高運行效率。(√)98.Spark使用先進的DAG(DirectedAcyclicGraph,有向無環(huán)圖)執(zhí)行引擎,以支持循環(huán)數(shù)據(jù)流與內(nèi)存計算。(√)99.MapReduce計算模型執(zhí)行效率比較慢,SparkSQL執(zhí)行效率非???。(√)100.SparkSQL是將SparkSQL轉(zhuǎn)換成RDD,然后提交到集群執(zhí)行,執(zhí)行效率非常快。(√)101.SparkStreaming運行原理是將持續(xù)不斷輸入的數(shù)據(jù)流,按照一定時間間隔,轉(zhuǎn)換成多個batch分片,交給SparkEngine引擎,以批量生成最終結(jié)果流。(√)102.MLlib是Spark提供的可擴展的機器學(xué)習(xí)庫,一個專門針√大數(shù)據(jù)處理的通用的.快速的引擎。(√)103.MLlib提供的API主要分為spark.mllib和spark.ml兩大類。(√)104.SparkGraphX是Spark中用于圖和圖計算的組件。(√)105.一個Spark應(yīng)用(Application)由一個任務(wù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能水電安裝與運維勞務(wù)承包合同
- 幼兒園教師聘用合同(2025年度)附幼兒教育特色課程開發(fā)協(xié)議
- 2025年度智慧城市交通管理技術(shù)入股合同
- 2025年度驛站轉(zhuǎn)讓與聯(lián)合經(jīng)營合作協(xié)議范本
- 二零二五年度智能電網(wǎng)建設(shè)終止協(xié)議通知函
- 實習(xí)律師協(xié)議(2025年度)-金融衍生品法律事務(wù)
- 賬戶變更后補充保障服務(wù)協(xié)議2025
- 二零二五年度婚內(nèi)房產(chǎn)贈與撤銷及財產(chǎn)返還協(xié)議
- 二零二五年度教師實習(xí)實訓(xùn)基地與實習(xí)生實習(xí)期間生活管理合同
- 2025年度綠色農(nóng)業(yè)病蟲害防治藥害賠償協(xié)議
- 關(guān)于魯迅簡介
- 余華讀書分享名著導(dǎo)讀《文城》
- Horiba 流量計中文說明書
- 鑒定前設(shè)施設(shè)備檢查記錄表樣本
- 植物組織培養(yǎng)(園林植物教研組)-說課稿
- 高三二輪專題復(fù)習(xí)化學(xué)課件-分布系數(shù)(分數(shù))圖像
- 變更更正戶口項目申請表
- (譯林版)六年級英語完形填空100篇(含答案和講解)
- 云南省蒙自市長橋海水庫擴建工程環(huán)評報告
- 大數(shù)據(jù)分析教學(xué)大綱教案
- 質(zhì)量手冊(依據(jù)ISO9001:2023年標準)
評論
0/150
提交評論