MOOC 大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué) 中國(guó)大學(xué)慕課答案_第1頁(yè)
MOOC 大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué) 中國(guó)大學(xué)慕課答案_第2頁(yè)
MOOC 大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué) 中國(guó)大學(xué)慕課答案_第3頁(yè)
MOOC 大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué) 中國(guó)大學(xué)慕課答案_第4頁(yè)
MOOC 大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué) 中國(guó)大學(xué)慕課答案_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

MOOC大數(shù)據(jù)技術(shù)導(dǎo)論-北京理工大學(xué)中國(guó)大學(xué)慕課答案第1章單元測(cè)驗(yàn)1、問(wèn)題:大數(shù)據(jù)是一個(gè)什么領(lǐng)域的問(wèn)題()。選項(xiàng):A、計(jì)算機(jī)領(lǐng)域B、數(shù)學(xué)統(tǒng)計(jì)領(lǐng)域C、業(yè)務(wù)領(lǐng)域D、多學(xué)科綜合領(lǐng)域正確答案:【多學(xué)科綜合領(lǐng)域】2、問(wèn)題:科學(xué)研究第四范式數(shù)據(jù)思維采用()。選項(xiàng):A、科學(xué)歸納B、模型推演C、仿真模擬D、關(guān)聯(lián)分析正確答案:【關(guān)聯(lián)分析】3、問(wèn)題:大數(shù)據(jù)的優(yōu)勢(shì)包括()。選項(xiàng):A、數(shù)據(jù)體量大B、收集時(shí)間短C、數(shù)據(jù)類型豐富D、價(jià)值密度高正確答案:【數(shù)據(jù)體量大#收集時(shí)間短#數(shù)據(jù)類型豐富】4、問(wèn)題:大數(shù)據(jù)處理框架之批處理框架()。選項(xiàng):A、hadoopB、SparkC、FlinkD、jvm正確答案:【hadoop#Spark#Flink】5、問(wèn)題:大數(shù)據(jù)處理框架之流計(jì)算框架()。選項(xiàng):A、hadoopB、SparkstreamingC、FlinkD、STORM正確答案:【Sparkstreaming#Flink#STORM】6、填空題:系統(tǒng)的控制方式一般分為模型驅(qū)動(dòng)和_____________。正確答案:【數(shù)據(jù)驅(qū)動(dòng)】7、填空題:4V特征:數(shù)據(jù)規(guī)模大、_________、數(shù)據(jù)處理速度快、價(jià)值密度低。正確答案:【數(shù)據(jù)類型多】8、填空題:大數(shù)據(jù)的處理過(guò)程:數(shù)據(jù)獲取與管理、數(shù)據(jù)存儲(chǔ)與處理、數(shù)據(jù)分析與______、結(jié)合領(lǐng)域的大數(shù)據(jù)應(yīng)用。正確答案:【理解】9、填空題:科學(xué)研究的第三范式計(jì)算思維-______。正確答案:【仿真模擬】10、填空題:大數(shù)據(jù)領(lǐng)域的職業(yè)包括首席數(shù)據(jù)官、系統(tǒng)架構(gòu)師、___________、領(lǐng)域科學(xué)家。正確答案:【數(shù)據(jù)分析師】第2章單元測(cè)驗(yàn)1、問(wèn)題:選項(xiàng):A、M1-M2-M3-S4-M5-M6-M8-S7B、M1-M2-M5-M8-M6-M3-S7-S4C、M1-M2-M3-S4-M5-M6-S7-M8D、M1-M2-M5-M8-M6-M3-S4-S7正確答案:【M1-M2-M5-M8-M6-M3-S7-S4】2、問(wèn)題:下面科學(xué)研究的四個(gè)范式順序正確的是()。選項(xiàng):A、經(jīng)驗(yàn)范式-理論范式-模擬范式-數(shù)據(jù)密集型范式B、理論范式-模擬范式-經(jīng)驗(yàn)范式-數(shù)據(jù)密集型范式C、理論范式-模擬范式-數(shù)據(jù)密集型范式-經(jīng)驗(yàn)范式D、理論范式-經(jīng)驗(yàn)范式-數(shù)據(jù)密集型范式-模擬范式正確答案:【經(jīng)驗(yàn)范式-理論范式-模擬范式-數(shù)據(jù)密集型范式】3、問(wèn)題:以數(shù)據(jù)考察為基礎(chǔ),聯(lián)合理論、實(shí)驗(yàn)和模擬一體的數(shù)據(jù)密集計(jì)算的范式是以下哪個(gè)范式()。選項(xiàng):A、經(jīng)驗(yàn)范式B、理論范式C、模擬范式D、數(shù)據(jù)密集型范式正確答案:【數(shù)據(jù)密集型范式】4、問(wèn)題:在大數(shù)據(jù)生命周期的各個(gè)階段中,工作最多的是哪個(gè)階段()。選項(xiàng):A、數(shù)據(jù)存儲(chǔ)B、數(shù)據(jù)收集和整理C、數(shù)據(jù)分析D、數(shù)據(jù)治理正確答案:【數(shù)據(jù)收集和整理】5、問(wèn)題:在增量抽取方法中,需要計(jì)算MD5校驗(yàn)碼的是哪種增量抽取方法()。選項(xiàng):A、日志對(duì)比B、時(shí)間戳C、觸發(fā)器D、全表對(duì)比正確答案:【全表對(duì)比】6、問(wèn)題:在網(wǎng)絡(luò)爬蟲(chóng)策略中需要根據(jù)鏈接計(jì)算網(wǎng)頁(yè)重要性的是以下哪個(gè)算法()。選項(xiàng):A、深度優(yōu)先B、廣度優(yōu)先C、局部PageRank策略D、OPIC正確答案:【局部PageRank策略】7、問(wèn)題:大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)包括()。選項(xiàng):A、圖像B、文本C、語(yǔ)音D、視頻正確答案:【圖像#文本#語(yǔ)音#視頻】8、問(wèn)題:大數(shù)據(jù)中的半結(jié)構(gòu)化數(shù)據(jù)包括()。選項(xiàng):A、辦公文檔B、電子郵件C、XMLD、HTML正確答案:【電子郵件#XML#HTML】9、問(wèn)題:常見(jiàn)的分布式網(wǎng)絡(luò)爬蟲(chóng)架構(gòu)有()。選項(xiàng):A、Master-workerB、Master-slaveC、peer-peerD、Mixed正確答案:【Master-slave#peer-peer#Mixed】10、問(wèn)題:以下哪些內(nèi)容屬于深網(wǎng)內(nèi)容()。選項(xiàng):A、通過(guò)搜索引擎搜索得到的結(jié)果B、Web上可訪問(wèn)的非網(wǎng)頁(yè)文件,比如圖片文件,Pdf和word文檔等C、通過(guò)填寫(xiě)表單形成對(duì)后臺(tái)在線數(shù)據(jù)庫(kù)的查詢而得到的動(dòng)態(tài)頁(yè)面D、需要注冊(cè)或其他限制才能訪問(wèn)的內(nèi)容正確答案:【W(wǎng)eb上可訪問(wèn)的非網(wǎng)頁(yè)文件,比如圖片文件,Pdf和word文檔等#通過(guò)填寫(xiě)表單形成對(duì)后臺(tái)在線數(shù)據(jù)庫(kù)的查詢而得到的動(dòng)態(tài)頁(yè)面#需要注冊(cè)或其他限制才能訪問(wèn)的內(nèi)容】第3章單元測(cè)驗(yàn)1、問(wèn)題:HBase依靠()存儲(chǔ)底層數(shù)據(jù)。選項(xiàng):A、HDFSB、HadoopC、MemoryD、MapReduce正確答案:【HDFS】2、問(wèn)題:下列選項(xiàng)中哪些不是NoSQL數(shù)據(jù)庫(kù)的特點(diǎn)()。選項(xiàng):A、靈活的可擴(kuò)展性B、動(dòng)態(tài)的數(shù)據(jù)遷移C、與云計(jì)算緊密融合D、靈活的數(shù)據(jù)模型正確答案:【動(dòng)態(tài)的數(shù)據(jù)遷移】3、問(wèn)題:HDFS中文件塊默認(rèn)保存幾份()。選項(xiàng):A、1份B、2份C、3份D、4份正確答案:【3份】4、問(wèn)題:下面與HDFS類似的框架是()。選項(xiàng):A、NTFSB、FAT32C、GFSD、EXT3正確答案:【GFS】5、問(wèn)題:分布式文件系統(tǒng)改變了數(shù)據(jù)存儲(chǔ)和管理方式,相對(duì)于本地文件系統(tǒng)具有哪些優(yōu)勢(shì)()。選項(xiàng):A、低成本B、易擴(kuò)展C、強(qiáng)可靠D、高可用正確答案:【低成本#易擴(kuò)展#強(qiáng)可靠#高可用】6、問(wèn)題:下面對(duì)HBase的描述哪些是正確的()。選項(xiàng):A、不是開(kāi)源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫(kù)正確答案:【是面向列的#是分布式的#是一種NoSQL數(shù)據(jù)庫(kù)】7、問(wèn)題:Hadoop的框架最核心的設(shè)計(jì)是()。選項(xiàng):A、HDFSB、MapReduceC、NamenodeD、Datanode正確答案:【HDFS#MapReduce】8、問(wèn)題:HBase的實(shí)現(xiàn)包括哪幾個(gè)主要的功能組件()。選項(xiàng):A、庫(kù)函數(shù)B、一個(gè)Master主服務(wù)器C、許多個(gè)Region服務(wù)器D、一個(gè)Region服務(wù)器正確答案:【庫(kù)函數(shù)#一個(gè)Master主服務(wù)器#許多個(gè)Region服務(wù)器】9、問(wèn)題:HDFS專為解決大數(shù)據(jù)存儲(chǔ)問(wèn)題而產(chǎn)生的,其具備了以下哪些特點(diǎn)()。選項(xiàng):A、兼容廉價(jià)的硬件設(shè)備B、流數(shù)據(jù)讀寫(xiě)C、大數(shù)據(jù)集D、復(fù)雜的文件模型E、強(qiáng)大的跨平臺(tái)兼容性正確答案:【兼容廉價(jià)的硬件設(shè)備#流數(shù)據(jù)讀寫(xiě)#大數(shù)據(jù)集#強(qiáng)大的跨平臺(tái)兼容性】10、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的明顯優(yōu)勢(shì)在于()。選項(xiàng):A、實(shí)現(xiàn)數(shù)據(jù)完整性B、支持超大規(guī)模數(shù)據(jù)存儲(chǔ)C、靈活的數(shù)據(jù)模型可以很好的支持Web2.0應(yīng)用D、具有強(qiáng)大的橫向擴(kuò)展能力正確答案:【支持超大規(guī)模數(shù)據(jù)存儲(chǔ)#靈活的數(shù)據(jù)模型可以很好的支持Web2.0應(yīng)用#具有強(qiáng)大的橫向擴(kuò)展能力】第4章單元測(cè)驗(yàn)1、問(wèn)題:大數(shù)據(jù)可視化分析有效融合計(jì)算機(jī)的______和人的_____,以獲得對(duì)于大規(guī)模復(fù)雜數(shù)據(jù)集的洞察力。選項(xiàng):A、計(jì)算能力、認(rèn)知能力B、計(jì)算能力、分析能力C、分析能力、觀察能力D、認(rèn)知能力、計(jì)算能力正確答案:【計(jì)算能力、認(rèn)知能力】2、問(wèn)題:下列關(guān)于數(shù)據(jù)可視化的介紹,不正確的是()。選項(xiàng):A、可視化技術(shù)被大量應(yīng)用于統(tǒng)計(jì)學(xué)領(lǐng)域、地理信息系統(tǒng)、數(shù)據(jù)挖掘分析、商務(wù)智能工具等。B、統(tǒng)計(jì)圖表有餅圖、時(shí)間序列圖、散點(diǎn)圖、等高線圖等多種形式C、可視化分析用到了支持信息可視化的用戶界面以及支持分析過(guò)程的人機(jī)交互方式與技術(shù)。D、雷達(dá)圖不適用于多維數(shù)據(jù)。正確答案:【雷達(dá)圖不適用于多維數(shù)據(jù)?!?、問(wèn)題:以下哪個(gè)不是數(shù)據(jù)可視化方法和技術(shù)?選項(xiàng):A、圖可視化技術(shù)B、多維數(shù)據(jù)可視化技術(shù)C、時(shí)空數(shù)據(jù)可視化技術(shù)D、混合建模技術(shù)正確答案:【混合建模技術(shù)】4、問(wèn)題:關(guān)于數(shù)據(jù)挖掘任務(wù),下列說(shuō)法正確的是()選項(xiàng):A、聚類是描述性任務(wù)。B、分類屬于預(yù)測(cè)性任務(wù)C、聚類屬于無(wú)監(jiān)督范疇。D、回歸分析屬于描述性任務(wù)正確答案:【聚類是描述性任務(wù)。#分類屬于預(yù)測(cè)性任務(wù)#聚類屬于無(wú)監(jiān)督范疇?!?、問(wèn)題:下列可以用于多維數(shù)據(jù)可視化的方法有()選項(xiàng):A、GMapB、平行坐標(biāo)系C、雷達(dá)圖D、散點(diǎn)圖矩陣正確答案:【平行坐標(biāo)系#雷達(dá)圖#散點(diǎn)圖矩陣】6、問(wèn)題:設(shè)X是非空集合,對(duì)于X中任意的兩個(gè)元素x與y,按某一法則都對(duì)應(yīng)唯一的實(shí)數(shù)d(x,y),而且滿足下述()性質(zhì),則稱d(x,y)為x與y的距離。選項(xiàng):A、非負(fù)性d(x,y)≥0B、Bd(x,y)=d(y,x)C、對(duì)于任意的x,y,z∈X,有d(x,y)≤d(x,z)+d(z,y)D、傳遞性正確答案:【非負(fù)性d(x,y)≥0#Bd(x,y)=d(y,x)#對(duì)于任意的x,y,z∈X,有d(x,y)≤d(x,z)+d(z,y)】7、問(wèn)題:以下哪些是數(shù)據(jù)可視化的作用()選項(xiàng):A、協(xié)助思考B、探索數(shù)據(jù)C、作為大量工作記憶的外界輔助D、理解信息正確答案:【協(xié)助思考#探索數(shù)據(jù)#作為大量工作記憶的外界輔助#理解信息】8、問(wèn)題:預(yù)測(cè)任務(wù)的目標(biāo)是導(dǎo)出和概括數(shù)據(jù)中有潛在聯(lián)系的模式(相關(guān)、趨勢(shì)、聚類、軌跡和異常)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】9、問(wèn)題:文本是大數(shù)據(jù)時(shí)代結(jié)構(gòu)數(shù)據(jù)類型的典型代表。選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】10、問(wèn)題:PCA是一種有監(jiān)督的降維方法。選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】11、問(wèn)題:Textflow用河流的運(yùn)動(dòng)表達(dá)了文本主題的誕生、發(fā)展、合并、分裂、消亡的過(guò)程。導(dǎo)致主題演變的原因往往是主題關(guān)鍵詞的變化。選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】12、問(wèn)題:聚類是在沒(méi)有先驗(yàn)知識(shí)的情況下進(jìn)行的。選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】13、填空題:將收入在范圍$12,000至$98,000內(nèi)的收入規(guī)范化到區(qū)間[0.0,1.0],$73,600將被規(guī)范為:(保留兩位小數(shù))正確答案:【0.72】14、填空題:兩個(gè)向量的方向差異可以表示為兩個(gè)向量夾角的。正確答案:【余弦】15、填空題:圖的簡(jiǎn)化中,技術(shù)會(huì)將相似形狀的邊連接線集中在一起構(gòu)成約束,降低視覺(jué)復(fù)雜度,使節(jié)點(diǎn)間的連接關(guān)系更加清楚。正確答案:【邊邦定】第5章單元測(cè)驗(yàn)1、問(wèn)題:在Spark運(yùn)行時(shí),()為程序構(gòu)建基本運(yùn)行環(huán)境Sparkcontext對(duì)象(應(yīng)用管家),向資源管理器進(jìn)行資源申請(qǐng),任務(wù)分配與監(jiān)控。選項(xiàng):A、DriverprogramB、SparkEnvironmentC、DAGSchedulerD、TaskScheduler正確答案:【Driverprogram】2、問(wèn)題:Spark的組件中,用于做查詢分析的是()。選項(xiàng):A、SparkSQLB、SparkStreamingC、SparkMLibD、SparkCore正確答案:【SparkSQL】3、問(wèn)題:以下屬于Spark的特點(diǎn)的有()。選項(xiàng):A、SpeedB、ConciseC、In-memoryprocessingD、LazyEvaluation正確答案:【Speed#Concise#In-memoryprocessing#LazyEvaluation】4、問(wèn)題:MapReduce執(zhí)行的全過(guò)程包括以下幾個(gè)主要階段()。選項(xiàng):A、從分布式文件系統(tǒng)讀入數(shù)據(jù)B、執(zhí)行Map任務(wù)輸出中間結(jié)果C、通過(guò)Shuffle階段把中間結(jié)果分區(qū)排序整理后發(fā)送給Reduce任務(wù)D、執(zhí)行Reduce任務(wù)得到最終結(jié)果并寫(xiě)入分布式系統(tǒng)文件正確答案:【從分布式文件系統(tǒng)讀入數(shù)據(jù)#執(zhí)行Map任務(wù)輸出中間結(jié)果#通過(guò)Shuffle階段把中間結(jié)果分區(qū)排序整理后發(fā)送給Reduce任務(wù)#執(zhí)行Reduce任務(wù)得到最終結(jié)果并寫(xiě)入分布式系統(tǒng)文件】5、問(wèn)題:RDD的兩種主要操作類型是()。選項(xiàng):A、TransformB、ActionC、MapD、Reduce正確答案:【Transform#Action】6、問(wèn)題:關(guān)于RDD論述正確的是()。選項(xiàng):A、RDD提供一種高度受限的共享內(nèi)存模型,是一個(gè)彈性分布式數(shù)據(jù)集B、RDD讀取的數(shù)據(jù)都存儲(chǔ)在一臺(tái)機(jī)器上C、RDD是只讀存儲(chǔ)D、RDD支持各種粗粒度和細(xì)粒度的操作正確答案:【RDD提供一種高度受限的共享內(nèi)存模型,是一個(gè)彈性分布式數(shù)據(jù)集#RDD是只讀存儲(chǔ)】7、問(wèn)題:Spark支持的開(kāi)發(fā)語(yǔ)言有()。選項(xiàng):A、JavaB、C語(yǔ)言C、PythonD、Scala正確答案:【Java#Python#Scala】8、問(wèn)題:Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目包括()。選項(xiàng):A、HadoopB、SparkC、StormD、HDFS正確答案:【Hadoop#Spark#Storm】9、問(wèn)題:Shuffle過(guò)程分為Map端的操作和Reduce端的操作。()選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】10、問(wèn)題:Hadoop擅長(zhǎng)批處理,不適合流計(jì)算。()選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】11、問(wèn)題:MapReduce設(shè)計(jì)的一個(gè)理念是“數(shù)據(jù)向計(jì)算靠攏”,并采用“分而治之”的策略。()選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】12、問(wèn)題:Shuffle過(guò)程是指對(duì)Map輸出結(jié)果進(jìn)行分區(qū)、排序、合并等處理并交給Reduce的過(guò)程。()選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】第六章習(xí)題1、問(wèn)題:數(shù)據(jù)匿名化的原因有哪些選項(xiàng):A、實(shí)現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶的隱私B、防止數(shù)據(jù)被篡改C、壓縮數(shù)據(jù)的存儲(chǔ)空間D、實(shí)現(xiàn)數(shù)據(jù)清洗正確答案:【實(shí)現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶的隱私】2、問(wèn)題:下列哪些信息可能會(huì)侵犯用戶的隱私選項(xiàng):A、搜索引擎的搜索記錄B、瀏覽器的訪問(wèn)痕跡C、電商平臺(tái)的購(gòu)物記錄D、地圖應(yīng)用的搜索記錄正確答案:【搜索引擎的搜索記錄#瀏覽器的訪問(wèn)痕跡#電商平臺(tái)的購(gòu)物記錄#地圖應(yīng)用的搜索記錄】3、問(wèn)題:下列哪些方法可以實(shí)現(xiàn)匿名化選項(xiàng):A、元組抑制B、屬性泛化C、屬性置換D、屬性擾亂正確答案:【元組抑制#屬性泛化#屬性置換#屬性擾亂】4、問(wèn)題:關(guān)于隱私保護(hù)技術(shù),以下描述正確的包括選項(xiàng):A、K-匿名的局限性是容易遭受同質(zhì)性攻擊B、L-多樣性的局限性是容易遭受相似性攻擊C、T-相近比K-匿名和L-多樣性有更強(qiáng)的隱私保護(hù)性能D、K-匿名無(wú)法保證敏感值缺乏多樣性正確答案:【K-匿名的局限性是容易遭受同質(zhì)性攻擊#L-多樣性的局限性是容易遭受相似性攻擊#T-相近比K-匿名和L-多樣性有更強(qiáng)的隱私保護(hù)性能#K-匿名無(wú)法保證敏感值缺乏多樣性】5、問(wèn)題:計(jì)算k-匿名的算法分類包括選項(xiàng):A、基于泛化和基于元組抑制的算法B、基于全局和基于局部記錄的算法C、基于層次和基于劃分的算法D、基于集合枚舉和基于格搜索的算法正確答案:【基于泛化和基于元組抑制的算法#基于全局和基于局部記錄的算法#基于層次和基于劃分的算法】6、問(wèn)題:K-匿名規(guī)則滿足子集屬性和泛化屬性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】7、問(wèn)題:蒙德里安算法是一種基于劃分的算法選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】8、問(wèn)題:極小全域泛化的集合構(gòu)成一個(gè)反鏈選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】9、問(wèn)題:熵l-多樣性滿足子集屬性和泛化屬性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】10、問(wèn)題:遞歸(c,l)-多樣性不滿足泛化屬性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】第6章單元測(cè)驗(yàn)1、問(wèn)題:數(shù)據(jù)匿名化的原因有哪些選項(xiàng):A、實(shí)現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶的隱私B、防止數(shù)據(jù)被篡改C、壓縮數(shù)據(jù)的存儲(chǔ)空間D、實(shí)現(xiàn)數(shù)據(jù)清洗正確答案:【實(shí)現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶的隱私】2、問(wèn)題:下列哪些信息可能會(huì)侵犯用戶的隱私選項(xiàng):A、搜索引擎的搜索記錄B、瀏覽器的訪問(wèn)痕跡C、電商平臺(tái)的購(gòu)物記錄D、地圖應(yīng)用的搜索記錄正確答案:【搜索引擎的搜索記錄#瀏覽器的訪問(wèn)痕跡#電商平臺(tái)的購(gòu)物記錄#地圖應(yīng)用的搜索記錄】3、問(wèn)題:下列哪些方法可以實(shí)現(xiàn)匿名化選項(xiàng):A、元組抑制B、屬性泛化C、屬性置換D、屬性擾亂正確答案:【元組抑制#屬性泛化#屬性置換#屬性擾亂】4、問(wèn)題:關(guān)于隱私保護(hù)技術(shù),以下描述正確的包括選項(xiàng):A、K-匿名的局限性是容易遭受同質(zhì)性攻擊B、L-多樣性的局限性是容易遭受相似性攻擊C、T-相近比K-匿名和L-多樣性有更強(qiáng)的隱私保護(hù)性能D、K-匿名無(wú)法保證敏感值缺乏多樣性正確答案:【K-匿名的局限性是容易遭受同質(zhì)性攻擊#L-多樣性的局限性是容易遭受相似性攻擊#T-相近比K-匿名和L-多樣性有更強(qiáng)的隱私保護(hù)性能#K-匿名無(wú)法保證敏感值缺乏多樣性】5、問(wèn)題:計(jì)算k-匿名的算法分類包括選項(xiàng):A、基于泛化和基于元組抑制的算法B、基于全局和基于局部記錄的算法C、基于層次和基于劃分的算法D、基于集合枚舉和基于格搜索的算法正確答案:【基于泛化和基于元組抑制的算法#基于全局和基于局部記錄的算法#基于層次和基于劃分的算法】6、問(wèn)題:K-匿名規(guī)則滿足子集屬性和泛化屬性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】7、問(wèn)題:蒙德里安算法是一種基于劃分的算法選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】8、問(wèn)題:極小全域泛化的集合構(gòu)成一個(gè)反鏈選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】9、問(wèn)題:熵l-多樣性滿足子集屬性和泛化屬性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】10、問(wèn)題:遞歸(c,l)-多樣性不滿足泛化屬性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】第7章單元測(cè)驗(yàn)1、問(wèn)題:在“看不見(jiàn)的動(dòng)機(jī)中”由于數(shù)據(jù)使用者和數(shù)據(jù)生成機(jī)構(gòu)都是()的生產(chǎn)大數(shù)據(jù),忽略了人們行為背后趨利避害的動(dòng)機(jī)的大數(shù)據(jù)統(tǒng)計(jì)分析。選項(xiàng):A、無(wú)意識(shí)B、有意識(shí)C、自主選擇D、趨向選擇正確答案:【無(wú)意識(shí)】2、問(wèn)題:小數(shù)據(jù)強(qiáng)調(diào)采樣,精確以及因果關(guān)系,大數(shù)據(jù)強(qiáng)調(diào)()。選項(xiàng):A、全樣B、非精確C、相關(guān)關(guān)系D、因果關(guān)系正確答案:【全樣#非精確#相關(guān)關(guān)系】3、問(wèn)題:大數(shù)據(jù)面臨的挑戰(zhàn)包括()。選項(xiàng):A、大數(shù)據(jù)自大B、算法演化C、數(shù)據(jù)來(lái)源少D、看不見(jiàn)的動(dòng)機(jī)正確答案:【大數(shù)據(jù)自大#算法演化#看不見(jiàn)的動(dòng)機(jī)】4、填空題:數(shù)據(jù)收集過(guò)程的性質(zhì)發(fā)生了變化,大數(shù)據(jù)不再只是被動(dòng)記錄使用者的決策,而是通過(guò)______,積極參與到使用者的行為決策中。正確答案:【算法演化】5、填空題:夜光遙感挖掘是通過(guò)在遙感圖像中提取________數(shù)據(jù)進(jìn)行繪制和分析。正確答案:【燈光】6、填空題:“大數(shù)據(jù)自大(bigdatahubris)”的傾向,即認(rèn)為_(kāi)______,?這里的關(guān)鍵是,企業(yè)或者機(jī)構(gòu)擁有的這個(gè)稱為總體的數(shù)據(jù)和研究問(wèn)題關(guān)心的總體是否相同.正確答案:【自己擁有的數(shù)據(jù)是總體】7、填空題:在大數(shù)據(jù)分析中只關(guān)心________而不關(guān)注因果關(guān)系。正確答案:【相關(guān)關(guān)系】8、填空題:熱力圖是通過(guò)__________數(shù)據(jù)進(jìn)行繪制和分析。正確答案:【位置】9、填空題:谷歌通過(guò)__________來(lái)預(yù)測(cè)流感發(fā)病率。正確答案:【搜索關(guān)鍵詞】10、填空題:_______未卜先知的故事,常被看做大數(shù)據(jù)分析優(yōu)勢(shì)的明證。正確答案:【谷歌流感預(yù)測(cè)】大數(shù)據(jù)技術(shù)導(dǎo)論期末試題1、問(wèn)題:大數(shù)據(jù)是一個(gè)什么領(lǐng)域的問(wèn)題?選項(xiàng):A、業(yè)務(wù)領(lǐng)域B、計(jì)算機(jī)領(lǐng)域C、多學(xué)科綜合領(lǐng)域D、數(shù)學(xué)統(tǒng)計(jì)領(lǐng)域正確答案:【多學(xué)科綜合領(lǐng)域】2、問(wèn)題:以下哪種技術(shù)對(duì)大數(shù)據(jù)技術(shù)的發(fā)展起了最重要基礎(chǔ)支撐作用?選項(xiàng):A、云計(jì)算技術(shù)B、信息安全技術(shù)C、物聯(lián)網(wǎng)技術(shù)D、數(shù)據(jù)庫(kù)技術(shù)正確答案:【云計(jì)算技術(shù)】3、問(wèn)題:科學(xué)研究的第三范式是計(jì)算思維-()選項(xiàng):A、仿真模擬B、模型推演C、關(guān)聯(lián)分析D、科學(xué)歸納正確答案:【仿真模擬】4、問(wèn)題:與大數(shù)據(jù)直接相關(guān)的職業(yè)不包括選項(xiàng):A、數(shù)據(jù)分析師B、系統(tǒng)架構(gòu)師C、領(lǐng)域科學(xué)家D、首席執(zhí)行官正確答案:【首席執(zhí)行官】5、問(wèn)題:下面科學(xué)研究的四個(gè)范式順序正確的是()選項(xiàng):A、理論范式-模擬范式-經(jīng)驗(yàn)范式-數(shù)據(jù)密集型范式B、理論范式-模擬范式-數(shù)據(jù)密集型范式-經(jīng)驗(yàn)范式C、理論范式-經(jīng)驗(yàn)范式-數(shù)據(jù)密集型范式-模擬范式D、經(jīng)驗(yàn)范式-理論范式-模擬范式-數(shù)據(jù)密集型范式正確答案:【經(jīng)驗(yàn)范式-理論范式-模擬范式-數(shù)據(jù)密集型范式】6、問(wèn)題:在大數(shù)據(jù)生命周期的各個(gè)階段中,工作最多的是哪個(gè)階段()選項(xiàng):A、數(shù)據(jù)分析B、數(shù)據(jù)收集和整理C、數(shù)據(jù)治理D、數(shù)據(jù)存儲(chǔ)正確答案:【數(shù)據(jù)收集和整理】7、問(wèn)題:在網(wǎng)絡(luò)爬蟲(chóng)策略中需要根據(jù)鏈接計(jì)算網(wǎng)頁(yè)重要性的是以下哪個(gè)算法()選項(xiàng):A、局部PageRank策略B、廣度優(yōu)先C、深度優(yōu)先D、OPIC正確答案:【局部PageRank策略】8、問(wèn)題:常見(jiàn)的分布式網(wǎng)絡(luò)爬蟲(chóng)架構(gòu)不包含()選項(xiàng):A、Master-slaveB、MixedC、Master-workerD、peer-peer正確答案:【Master-worker】9、問(wèn)題:以下哪項(xiàng)不是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的弱點(diǎn)?選項(xiàng):A、無(wú)法滿足海量數(shù)據(jù)的管理要求B、無(wú)法滿足數(shù)據(jù)高并發(fā)的需求C、無(wú)法滿足數(shù)據(jù)一致性和完整性的需求D、無(wú)法滿足高拓展性和高可用性的需求正確答案:【無(wú)法滿足數(shù)據(jù)一致性和完整性的需求】10、問(wèn)題:下列對(duì)HBase數(shù)據(jù)模型的描述錯(cuò)誤的是選項(xiàng):A、每個(gè)HBase表都由若干行組成,每個(gè)行由行鍵(rowkey)來(lái)標(biāo)識(shí)B、HBase是一個(gè)稀疏、多維度、排序的映射表,這張表的索引是行鍵、列族、列限定符和時(shí)間戳C、HBase中執(zhí)行更新操作時(shí),會(huì)刪除數(shù)據(jù)舊的版本,并生成一個(gè)新的版本D、HBase列族支持動(dòng)態(tài)擴(kuò)展,可以很輕松地添加一個(gè)列族或列正確答案:【HBase中執(zhí)行更新操作時(shí),會(huì)刪除數(shù)據(jù)舊的版本,并生成一個(gè)新的版本】11、問(wèn)題:HBase是一種()數(shù)據(jù)庫(kù)選項(xiàng):A、關(guān)系數(shù)據(jù)庫(kù)B、文檔數(shù)據(jù)庫(kù)C、列式數(shù)據(jù)庫(kù)D、行式數(shù)據(jù)庫(kù)正確答案:【列式數(shù)據(jù)庫(kù)】12、問(wèn)題:訪問(wèn)HBase表中的行,不可以用以下哪種方式選項(xiàng):A、通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)B、全表掃描C、通過(guò)某列的值區(qū)間D、通過(guò)單個(gè)行健訪問(wèn)正確答案:【通過(guò)某列的值區(qū)間】13、問(wèn)題:分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的,這些節(jié)點(diǎn)分為兩類,一類存儲(chǔ)元數(shù)據(jù)叫(),另一類存儲(chǔ)具體數(shù)據(jù)叫()選項(xiàng):A、名稱節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)B、名稱節(jié)點(diǎn),主節(jié)點(diǎn)C、從節(jié)點(diǎn),主節(jié)點(diǎn)D、數(shù)據(jù)節(jié)點(diǎn),名稱節(jié)點(diǎn)正確答案:【名稱節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)】14、問(wèn)題:HDFS中文件塊默認(rèn)保存幾份()選項(xiàng):A、2份B、3份C、4份D、5份正確答案:【3份】15、問(wèn)題:下面與HDFS類似的框架是()選項(xiàng):A、FAT32B、NTFSC、GFSD、EXT3正確答案:【GFS】16、問(wèn)題:下列關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)的比較,不正確的是選項(xiàng):A、NoSQL數(shù)據(jù)庫(kù)缺乏統(tǒng)一的查詢語(yǔ)言,而關(guān)系型數(shù)據(jù)庫(kù)有標(biāo)準(zhǔn)化查詢語(yǔ)言B、NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性,關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性C、NoSQL數(shù)據(jù)庫(kù)具有弱一致性,關(guān)系型數(shù)據(jù)庫(kù)具有強(qiáng)一致性D、NoSQL數(shù)據(jù)庫(kù)的可擴(kuò)展性比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)更好正確答案:【NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性,關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性】17、問(wèn)題:下列數(shù)據(jù)庫(kù)屬于文檔數(shù)據(jù)庫(kù)的是選項(xiàng):A、HBaseB、RedisC、MongoDBD、MySQL正確答案:【MongoDB】18、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的CAP不包含()選項(xiàng):A、一致性B、可用性C、分區(qū)容忍性D、持久性正確答案:【持久性】19、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的BASE不包含()選項(xiàng):A、持續(xù)性B、最終一致性C、基本可用D、軟狀態(tài)正確答案:【持續(xù)性】20、問(wèn)題:關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù),下列說(shuō)法不正確的是:選項(xiàng):A、NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ),具有強(qiáng)大的橫向擴(kuò)展能力B、NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn),但隨著NoSQL的發(fā)展,終將取代關(guān)系數(shù)據(jù)庫(kù)C、大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性D、關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ),NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)正確答案:【NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn),但隨著NoSQL的發(fā)展,終將取代關(guān)系數(shù)據(jù)庫(kù)】21、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的明顯優(yōu)勢(shì)不包含()選項(xiàng):A、具有強(qiáng)大的橫向擴(kuò)展能力B、靈活的數(shù)據(jù)模型可以很好的支持Web2.0應(yīng)用C、實(shí)現(xiàn)數(shù)據(jù)完整性D、支持超大規(guī)模數(shù)據(jù)存儲(chǔ)正確答案:【實(shí)現(xiàn)數(shù)據(jù)完整性】22、問(wèn)題:下列關(guān)于數(shù)據(jù)可視化的介紹,不正確的是()選項(xiàng):A、可視化分析用到了支持信息可視化的用戶界面以及支持分析過(guò)程的人機(jī)交互方式與技術(shù)B、統(tǒng)計(jì)圖表有餅圖、時(shí)間序列圖、散點(diǎn)圖、等高線圖等多種形式C、可視化技術(shù)被大量應(yīng)用于統(tǒng)計(jì)學(xué)領(lǐng)域、地理信息系統(tǒng)、數(shù)據(jù)挖掘分析、商務(wù)智能工具等D、雷達(dá)圖不適用于多維數(shù)據(jù)正確答案:【雷達(dá)圖不適用于多維數(shù)據(jù)】23、問(wèn)題:關(guān)于數(shù)據(jù)挖掘任務(wù),下列說(shuō)法不正確的是()選項(xiàng):A、聚類屬于無(wú)監(jiān)督范疇B、聚類是描述性任務(wù)C、回歸分析屬于描述性任務(wù)D、分類屬于預(yù)測(cè)性任務(wù)正確答案:【回歸分析屬于描述性任務(wù)】24、問(wèn)題:下列不可以用于多維數(shù)據(jù)可視化的方法有()選項(xiàng):A、GMapB、散點(diǎn)圖矩陣C、平行坐標(biāo)系D、雷達(dá)圖正確答案:【GMap】25、問(wèn)題:數(shù)據(jù)度量的常用方法不包括:選項(xiàng):A、相似性函數(shù)B、夾角余弦C、相關(guān)系數(shù)D、聚類系數(shù)正確答案:【聚類系數(shù)】26、問(wèn)題:Spark的組件中,用于做查詢分析的是()選項(xiàng):A、SparkMLibB、SparkCoreC、SparkStreamingD、SparkSQL正確答案:【SparkSQL】27、問(wèn)題:關(guān)于MapReduce,下列說(shuō)法錯(cuò)誤的是選項(xiàng):A、不同的Map任務(wù)之間不能互相通信B、MapReduce框架采用了Master/Slave架構(gòu),包括一個(gè)Master和若干個(gè)SlaveC、Map函數(shù)將輸入的元素轉(zhuǎn)換成key,value形式的鍵值對(duì)D、Hadoop框架是用Java實(shí)現(xiàn)的,MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)正確答案:【Hadoop框架是用Java實(shí)現(xiàn)的,MapReduce應(yīng)用程序則一定要用Java來(lái)寫(xiě)】28、問(wèn)題:傳統(tǒng)并行計(jì)算框架(比如MPI)和MapReduce并行計(jì)算框架相比較的特點(diǎn)不包含選項(xiàng):A、前者相比后者學(xué)習(xí)起來(lái)更容易B、前者是共享式(共享內(nèi)存/共享存儲(chǔ)),容錯(cuò)性差,后者是非共享式的,容錯(cuò)性好C、前者所需硬件價(jià)格貴,可擴(kuò)展性差,后者硬件便宜,擴(kuò)展性好D、前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型,后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型正確答案:【前者相比后者學(xué)習(xí)起來(lái)更容易】29、問(wèn)題:關(guān)于RDD論述正確的是()選項(xiàng):A、RDD讀取的數(shù)據(jù)都存儲(chǔ)在一臺(tái)機(jī)器上B、RDD是一種高效的可讀寫(xiě)存儲(chǔ)C、RDD提供一種高度受限的共享內(nèi)存模型,是一個(gè)彈性分布式數(shù)據(jù)集D、RDD支持各種粗粒度和細(xì)粒度的操作,是一個(gè)高效的多模態(tài)處理系統(tǒng)正確答案:【RDD提供一種高度受限的共享內(nèi)存模型,是一個(gè)彈性分布式數(shù)據(jù)集】30、問(wèn)題:Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目不包括()選項(xiàng):A、MapReduceB、SparkC、StormD、Hadoop正確答案:【MapReduce】31、問(wèn)題:利用大數(shù)據(jù)特性進(jìn)行隱私保護(hù)的方式不包含:選項(xiàng):A、數(shù)據(jù)匿名化B、屬性多樣性C、差分隱私保護(hù)D、數(shù)據(jù)加密傳輸技術(shù)正確答案:【數(shù)據(jù)加密傳輸技術(shù)】32、問(wèn)題:以下哪項(xiàng)對(duì)數(shù)據(jù)隱私問(wèn)題的影響相對(duì)最小選項(xiàng):A、證明P=NPB、研制出量子計(jì)算機(jī)C、政府和企業(yè)成立安全聯(lián)盟D、發(fā)現(xiàn)了新的可計(jì)算哈希碰撞正確答案:【政府和企業(yè)成立安全聯(lián)盟】33、問(wèn)題:大數(shù)據(jù)分析的挑戰(zhàn)不包括()選項(xiàng):A、大數(shù)據(jù)自大B、算法演化C、看不見(jiàn)的動(dòng)機(jī)D、無(wú)處不在的數(shù)據(jù)正確答案:【無(wú)處不在的數(shù)據(jù)】34、問(wèn)題:科學(xué)研究的第一到第四范式數(shù)據(jù)思維依次分別采用:仿真模擬、模型推演、關(guān)聯(lián)分析、科學(xué)歸納選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】35、問(wèn)題:大數(shù)據(jù)的優(yōu)勢(shì)包含:數(shù)據(jù)體量大,數(shù)據(jù)類型豐富,價(jià)值密度高,收集時(shí)間短選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】36、問(wèn)題:大數(shù)據(jù)處理中的批處理框架包含F(xiàn)link、hadoop、jvm、Spark選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】37、問(wèn)題:大數(shù)據(jù)處理中的流計(jì)算框架包含F(xiàn)link、Sparkstreaming、STORM選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】38、問(wèn)題:大數(shù)據(jù)處理中批流融合計(jì)算很難,目前業(yè)界關(guān)于此類研究處于空白狀態(tài)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】39、問(wèn)題:系統(tǒng)的控制方式一般分為模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】40、問(wèn)題:4V特征包含:數(shù)據(jù)規(guī)模大、數(shù)據(jù)密度低、數(shù)據(jù)處理速度快、價(jià)值密度低選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】41、問(wèn)題:大數(shù)據(jù)的處理過(guò)程包含,數(shù)據(jù)獲取與管理、數(shù)據(jù)存儲(chǔ)與處理、數(shù)據(jù)分析與理解、結(jié)合領(lǐng)域的大數(shù)據(jù)應(yīng)用選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】42、問(wèn)題:模擬范式是以數(shù)據(jù)考察為基礎(chǔ),聯(lián)合理論、實(shí)驗(yàn)和模擬一體的數(shù)據(jù)密集計(jì)算的范式選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】43、問(wèn)題:全表對(duì)比是一種需要計(jì)算MD5校驗(yàn)碼的非增量抽取方法選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】44、問(wèn)題:大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)包括視頻、圖像、語(yǔ)音、文本選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】45、問(wèn)題:電子表格Excel、網(wǎng)頁(yè)HTML均屬于結(jié)構(gòu)化數(shù)據(jù)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】46、問(wèn)題:通過(guò)使用詞組查詢搜索引擎搜索得到的結(jié)果、通過(guò)填寫(xiě)表單形成對(duì)后臺(tái)在線數(shù)據(jù)庫(kù)的查詢而得到的動(dòng)態(tài)頁(yè)面、需要注冊(cè)或其他限制才能訪問(wèn)的內(nèi)容都屬于深網(wǎng)內(nèi)容選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】47、問(wèn)題:HBase依靠Hadoop存儲(chǔ)底層數(shù)據(jù)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】48、問(wèn)題:NoSQL的數(shù)據(jù)特點(diǎn)包含與云計(jì)算緊密融合,靈活的可擴(kuò)展性,動(dòng)態(tài)的數(shù)據(jù)遷移、靈活的數(shù)據(jù)模型選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】49、問(wèn)題:HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn)帶來(lái)的局限性主要包括集群的可用性、命名空間的限制、隔離問(wèn)題以及性能的瓶頸選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】50、問(wèn)題:在分布式文件系統(tǒng)中,采用采用多副本冗余存儲(chǔ)可以節(jié)約存儲(chǔ)空間、保證數(shù)據(jù)可靠性、更容易檢查數(shù)據(jù)錯(cuò)誤并加快數(shù)據(jù)傳輸速度選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】51、問(wèn)題:分布式文件系統(tǒng)改變了數(shù)據(jù)存儲(chǔ)和管理方式,相對(duì)于本地文件系統(tǒng)具有易擴(kuò)展、低成本、強(qiáng)可靠、高可用的優(yōu)勢(shì)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】52、問(wèn)題:HBase是一種開(kāi)源的,是面向行的、分布式的NoSQL數(shù)據(jù)庫(kù)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】53、問(wèn)題:Hadoop的框架最核心的設(shè)計(jì)是HDFS和MapReduce選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】54、問(wèn)題:HBase的實(shí)現(xiàn)主要包含許多個(gè)Master主服務(wù)器、Region服務(wù)器及庫(kù)函數(shù)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】55、問(wèn)題:HDFS專為解決大數(shù)據(jù)存儲(chǔ)問(wèn)題而產(chǎn)生的,其具備了強(qiáng)大的跨平臺(tái)兼容性,支持批和流數(shù)據(jù)讀寫(xiě),實(shí)現(xiàn)了低延時(shí)數(shù)據(jù)訪問(wèn),并兼容廉價(jià)的硬件設(shè)備選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】56、問(wèn)題:NoSQL數(shù)據(jù)庫(kù)的三大理論基石包括BASE、CAP和最終一致性選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】57、問(wèn)題:目前,NoSQL的含義是“NotonlySQL”,而不是“NoSQL”。選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】58、問(wèn)題:一個(gè)數(shù)據(jù)庫(kù)事務(wù)具有ACID是指:原子性,一致性,持久性,隔離性。選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】59、問(wèn)題:數(shù)據(jù)可視化方法和技術(shù)包含多維數(shù)據(jù)可視化技術(shù)、圖可視化技術(shù)、時(shí)空數(shù)據(jù)可視化技術(shù)以及混合建模技術(shù)選項(xiàng):A、正確B、錯(cuò)誤正確答案:【錯(cuò)誤】60、問(wèn)題:數(shù)據(jù)可視化可以理解信息、探索數(shù)據(jù)、協(xié)助思考,并作為大量工作記憶的外界輔助選項(xiàng):A、正確B、錯(cuò)誤正確答案:【正確】61、問(wèn)題:預(yù)測(cè)任務(wù)的目標(biāo)是導(dǎo)出和概

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論