大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷28)_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷28)_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷28)_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷28)_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷28)_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷28)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共144題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在一個(gè)文件系統(tǒng)樹(shù)中,這些信息也會(huì)在硬盤(pán)上保存成以下文件:A)日志B)命名空間鏡像C)兩者都是答案:C解析:HDFS對(duì)文件系統(tǒng)目錄樹(shù)的持久化就是對(duì)editlog日志文件與fsimage鏡像文件的操作。[單選題]2.我們?cè)谧鰧?shí)驗(yàn)時(shí),會(huì)經(jīng)常用到?日期?轉(zhuǎn)換器,下列不屬于?日期?轉(zhuǎn)換器的一項(xiàng)是()A)ChoiceB)DateFormatC)DatePartD)StringToDateTime答案:A解析:[單選題]3.關(guān)于大數(shù)據(jù)在社會(huì)綜合治理中的作用,以下理解不正確的是()。A)大數(shù)據(jù)的應(yīng)用能夠杜絕抗生素的濫用B)大數(shù)據(jù)的應(yīng)用能夠維護(hù)社會(huì)治安C)大數(shù)據(jù)的應(yīng)用有利于走群眾路線(xiàn)D)大數(shù)據(jù)的應(yīng)用能夠加強(qiáng)交通管理答案:A解析:[單選題]4.關(guān)于OLAP的特性,下面正確的是:①快速性;②可分析性;③多維性;④信息性;⑤共享性()A)①②③B)②③④C)①②③④D)①②③④⑤答案:D解析:OLAP具有快速性、可分析性、多維性、信息性、共享性等特征。[單選題]5.以下關(guān)于深度學(xué)習(xí)框架的描述,正確的是()A)Tensorfiow是一款使用c++語(yǔ)言開(kāi)發(fā)的開(kāi)源數(shù)學(xué)計(jì)算軟件B)Caffe對(duì)于卷積網(wǎng)絡(luò)的支持特別好,同時(shí)提供的C++接口,也提供了mat1ab接口和python接口C)PyTorch的前身便是Torch,其底層和Torch框架一樣,但是使用Python重新寫(xiě)了很多內(nèi)容D)以上答案都正確答案:D解析:[單選題]6.優(yōu)化管理體系,實(shí)現(xiàn)管理模式從(___)向(___)轉(zhuǎn)變,向各級(jí)組織和業(yè)務(wù)賦能。A)數(shù)據(jù)化,業(yè)務(wù)化B)平臺(tái)化,集約化C)條塊化,共享化D)縱向貫通,橫向貫通答案:C解析:[單選題]7.()肯定是寬依賴(lài)操作。A)mapB)?atMapC)reduceByKeyD)sample答案:C解析:Spark中常見(jiàn)的窄依賴(lài)操作包括map、?ler、union、sample等,寬依賴(lài)操作包括ReduceByKey、groupByKey、join等。[單選題]8.AUC是衡量()模型優(yōu)劣的一種評(píng)價(jià)指標(biāo)。A)回歸B)分類(lèi)C)二分類(lèi)D)聚類(lèi)答案:C解析:[單選題]9.ApacheKudu是通過(guò)什么方式來(lái)提高OLAP性能的?A)預(yù)計(jì)算B)列式存儲(chǔ)C)內(nèi)存存儲(chǔ)D)硬件加速答案:B解析:[單選題]10.為提高計(jì)算性能,Spark中Transformation操作采用的是()計(jì)算模式。A)活性B)惰性C)實(shí)時(shí)D)非實(shí)時(shí)答案:B解析:[單選題]11.人工智能研究的一項(xiàng)基本內(nèi)容是機(jī)器感知。以下列舉中的()不屬于機(jī)器感知的領(lǐng)域。A)使機(jī)器具有視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、味覺(jué)、嗅覺(jué)等感知能力。B)讓機(jī)器具有理解文字的能力。C)使機(jī)器具有能夠獲取新知識(shí)、學(xué)習(xí)新技巧的能力。D)使機(jī)器具有聽(tīng)懂人類(lèi)語(yǔ)言的能力答案:C解析:[單選題]12.在python3中執(zhí)行以下代碼段a=21b=10print(ab)時(shí),輸出為()。A)TrueB)FalseC)NoneD)Error答案:D解析:[單選題]13.當(dāng)往往一本書(shū)中其實(shí)通常使用到的詞匯表是非常小的,這就會(huì)導(dǎo)致一本書(shū)的表示向量中存在大量的0.這樣的向量稱(chēng)為()。A)零向量B)滿(mǎn)秩向量C)稀疏向量D)普通向量答案:C解析:[單選題]14.處理變量時(shí),Python是否區(qū)分大小寫(xiě)?A)區(qū)分B)不區(qū)分C)取決于操作系統(tǒng)D)以上都不對(duì)答案:A解析:[單選題]15.()的基本想法是適當(dāng)考慮一部分屬性間的相互依賴(lài)信息,從而既不需要進(jìn)行完全聯(lián)合概率計(jì)算,又不至于徹底忽略了比較強(qiáng)的屬性依賴(lài)關(guān)系。A)貝葉斯判定準(zhǔn)則B)貝葉斯決策論C)樸素貝葉斯分類(lèi)器D)半樸素貝葉斯分類(lèi)器答案:D解析:[單選題]16.商品的()用于在搜索和瀏覽列表時(shí)更準(zhǔn)確的找到該商品。--A)關(guān)鍵詞B)描述C)提示D)詳情答案:A解析:[單選題]17.有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)特點(diǎn),不正確的描述是()。A)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)要從數(shù)據(jù)出發(fā)B)數(shù)據(jù)倉(cāng)庫(kù)使用的需求在開(kāi)發(fā)初期就要明確C)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)是一個(gè)不斷循環(huán)的過(guò)程,是啟發(fā)式的開(kāi)發(fā)D)在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析和處理更靈活,且沒(méi)有固定的模式答案:A解析:數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)要從需求出發(fā)。[單選題]18.分類(lèi)模型評(píng)估指標(biāo)不包括()A)F1-scoreB)平均絕對(duì)誤差C)準(zhǔn)確率D)AUC答案:B解析:[單選題]19.以下圖像分割方法中,屬于基于圖像灰度分布的閾值方法的是A)區(qū)域合并、分裂法B)最大類(lèi)間、內(nèi)方差比法C)已知形狀的曲線(xiàn)檢測(cè)D)區(qū)域生長(zhǎng)法答案:B解析:[單選題]20.MySQL是一種()數(shù)據(jù)庫(kù)管理系統(tǒng)。A)層次型B)網(wǎng)絡(luò)型C)關(guān)系型D)對(duì)象型答案:C解析:[單選題]21.若a=np.array([[7,2,3],[8,5,6]]),則print(np.sort(a,1))的結(jié)果為(__)。A)[[723][856]]B)[[237][568]]C)[235678]D)[[235][678]]答案:B解析:[單選題]22.下面描述錯(cuò)誤的是:()A)?探針盒子?就是一款自動(dòng)收集用戶(hù)隱私的產(chǎn)品B)許多顧客在使用WiFi之后會(huì)收到大量的廣告信息,甚至自己的手機(jī)號(hào)碼也會(huì)被當(dāng)做信息進(jìn)行多次買(mǎi)賣(mài)C)在免費(fèi)上網(wǎng)的背后,其實(shí)也存在著不小的信息安全風(fēng)險(xiǎn),或許一不小心,就落入了電腦黑客們?cè)O(shè)計(jì)的WiFi陷阱之中D)免費(fèi)WIFI都是安全的,可以放心使用答案:D解析:[單選題]23.當(dāng)云主機(jī)模板出現(xiàn)通用漏洞,將產(chǎn)生以下哪種風(fēng)險(xiǎn):()A)主機(jī)不穩(wěn)定B)網(wǎng)絡(luò)性能下降C)該模板創(chuàng)建的云主機(jī)被批量入侵D)沒(méi)有影響答案:C解析:[單選題]24.下列選項(xiàng)中,運(yùn)行后會(huì)輸出1、2、3的是()A)foriinrange(3):print(i)B)foriinrange(2):print(i+1)C)nums=[0,1,2]foriinnums:print(i+1)D)i=1whilei<3:print(i)i=i+1答案:C解析:[單選題]25.作為分布式消息隊(duì)列,既有非常優(yōu)秀的吞吐量,又有較高的可靠性和擴(kuò)展性,同時(shí)接受SparkStreaming的請(qǐng)求,將流量日志按序發(fā)送給SparkStreaming集群是()A)FlumeB)ZookeeperC)KafkaD)Sparkstreaming答案:C解析:[單選題]26.在HDFS的數(shù)據(jù)讀取過(guò)程中,DistributedFileSystem獲取這些信息后,生成一個(gè)()對(duì)象實(shí)例返回給客戶(hù)端。A)DistributedFileSystemB)FSDataInputStreamC)FSDataOutputStreamD)InputSystem答案:B解析:[單選題]27.哪個(gè)軟件架構(gòu)是Google提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的A)GFSB)MapReduceC)ChubbyD)Bigtable答案:B解析:[單選題]28.np.exp(1)的結(jié)果是多少?A)1B)2C)0D)2.718281828459答案:D解析:[單選題]29.下列選項(xiàng)描述錯(cuò)誤的是?()A)HadoopHA即集群中包含SecondaryNameNode作為備份節(jié)點(diǎn)存在。B)ResourceManager負(fù)責(zé)的是整個(gè)Yarn集群資源的監(jiān)控、分配和管理工作C)NodeManager負(fù)責(zé)定時(shí)的向ResourceManager匯報(bào)所在節(jié)點(diǎn)的資源使用情況以及接收并處理來(lái)自ApplicationMaster的啟動(dòng)停止容器(Container)的各種請(qǐng)求。D)初次啟動(dòng)HadoopHA集群時(shí),需要將格式化文件系統(tǒng)后的目錄拷貝至另外一臺(tái)答案:A解析:[單選題]30.大數(shù)據(jù)4V特征不包括A)規(guī)模性(Volume)B)有效地(Valid)C)多樣性(Varity)D)高速性(Velocity)答案:B解析:[單選題]31.下列關(guān)于GaussDB200的數(shù)據(jù)類(lèi)型轉(zhuǎn)換說(shuō)法正確的是()A)如果需要保留空字符串時(shí),需要新建兼容性為Postgres的數(shù)據(jù)庫(kù)。B)在查詢(xún)中,對(duì)常量不需要顯式指定數(shù)據(jù)類(lèi)型。C)在ORACLE兼容模式下,在導(dǎo)入數(shù)據(jù)時(shí),空字符串會(huì)自動(dòng)過(guò)濾。D)不同數(shù)據(jù)類(lèi)型比較或轉(zhuǎn)換時(shí),使用強(qiáng)制類(lèi)型轉(zhuǎn)換,以防隱式類(lèi)型轉(zhuǎn)換結(jié)果與預(yù)期不符。答案:D解析:[單選題]32.HBase交互模式中,查看當(dāng)前服務(wù)狀態(tài)的命令是()A)serviceB)servicesC)statusD)statu答案:C解析:[單選題]33.HBase依賴(lài)()提供強(qiáng)大的計(jì)算能力A)ZookeeperB)ChubbyC)RPCD)MapReduce答案:D解析:記住即可[單選題]34.()是MapReduce的?心臟?,是?奇跡?發(fā)生的地方A)CombineB)ShuffleC)PartitionD)Sort答案:B解析:[單選題]35.LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲(chǔ)在()。A)硬盤(pán)上B)內(nèi)存中C)磁盤(pán)陣列中D)閃存中答案:B解析:LSM結(jié)構(gòu)寫(xiě)數(shù)據(jù)時(shí),首先將數(shù)據(jù)緩存到內(nèi)存中的一個(gè)有序樹(shù)結(jié)構(gòu)中(稱(chēng)為memtable)[單選題]36.將內(nèi)存引用賦值給另一個(gè)變量的操作叫(__)。A)深拷貝B)指針C)參數(shù)實(shí)例化D)淺拷貝答案:D解析:[單選題]37.txt=open(filename)返回的是()。A)變量B)常數(shù)C)文件內(nèi)容D)文件對(duì)象答案:D解析:[單選題]38.以下哪個(gè)組件樣式是在所有的可視化圖表中普遍存在的?A)圖例B)軸線(xiàn)C)標(biāo)題D)網(wǎng)格線(xiàn)答案:C解析:[單選題]39.使用同態(tài)濾波方法進(jìn)行圖像增強(qiáng)時(shí),不包含以下哪個(gè)過(guò)程A)通過(guò)對(duì)圖像取對(duì)數(shù),將圖像模型中的入射分量與反射分量的乘積項(xiàng)分開(kāi)B)將對(duì)數(shù)圖像通過(guò)傅里葉變換變到頻域,在頻域選擇合適的濾波函數(shù),進(jìn)行減弱低頻和加強(qiáng)高頻的濾波C)計(jì)算圖像中各個(gè)灰度值的累計(jì)分布概率D)對(duì)濾波結(jié)果進(jìn)行傅里葉逆變換和對(duì)數(shù)逆運(yùn)算答案:C解析:[單選題]40.上傳當(dāng)前目錄下的本地文件file.txt到分布式文件系統(tǒng)HDFS的?/path?目錄下的Shell命令是()。A)hdfsdfs-put/pathfile.txtB)hadoopdfs-put/pathfile.txtC)hdfsfs-putfile.txt/pathD)hdfsdfs-putfile.txt/path答案:D解析:[單選題]41.社交網(wǎng)絡(luò)產(chǎn)生了海量用戶(hù)以及實(shí)時(shí)和完整的數(shù)據(jù),同時(shí)社交網(wǎng)絡(luò)也記錄了用戶(hù)群體的(),通過(guò)深入挖掘這些數(shù)據(jù)來(lái)了解用戶(hù),然后將這些分析后的數(shù)據(jù)信息推給需要的品牌商家或是微博營(yíng)銷(xiāo)公司A)地址B)行為C)情緒D)來(lái)源答案:C解析:[單選題]42.以下屬于FROM子查詢(xún)的是()。--A)標(biāo)量子查詢(xún)B)列子查詢(xún)C)行子查詢(xún)D)表子查詢(xún)答案:D解析:[單選題]43.計(jì)算機(jī)顯示器主要采用哪一種彩色模型()。A)RGBB)CMY和CMYKC)HISD)HSV答案:A解析:[單選題]44.為數(shù)據(jù)表創(chuàng)建索引的目的是()A)提高查詢(xún)的檢索性能B)歸類(lèi)C)創(chuàng)建唯一索引D)創(chuàng)建主鍵答案:A解析:[單選題]45.在連接互聯(lián)網(wǎng)的計(jì)算機(jī)上()處理、存儲(chǔ)涉及國(guó)家秘密和企業(yè)秘密信息。A)可以B)只要網(wǎng)絡(luò)環(huán)境是安全的,就可以C)不確定D)嚴(yán)禁答案:D解析:[單選題]46.()是交叉驗(yàn)證法的一種特例。A)自助法B)留一法C)交叉驗(yàn)證法D)錯(cuò)誤率分析答案:B解析:[單選題]47.下列關(guān)于構(gòu)造函數(shù)說(shuō)法錯(cuò)誤的是(___)。A)python中如果子類(lèi)有自己的構(gòu)造函數(shù),不會(huì)自動(dòng)調(diào)用父類(lèi)的構(gòu)造函數(shù)B)如果需要用到父類(lèi)的構(gòu)造函數(shù),則需要在子類(lèi)的構(gòu)造函數(shù)中顯式的調(diào)用C)如果子類(lèi)沒(méi)有自己的構(gòu)造函數(shù),則會(huì)直接從父類(lèi)繼承構(gòu)造函數(shù)D)無(wú)論子類(lèi)有沒(méi)有構(gòu)造函數(shù),子類(lèi)都會(huì)自動(dòng)調(diào)用父類(lèi)的構(gòu)造函數(shù)答案:D解析:[單選題]48.以下哪一項(xiàng)屬于非結(jié)構(gòu)化數(shù)據(jù)。A)企業(yè)ERP數(shù)據(jù)B)財(cái)務(wù)系統(tǒng)數(shù)據(jù)C)視頻監(jiān)控?cái)?shù)據(jù)D)日志數(shù)據(jù)答案:C解析:[單選題]49.()是表現(xiàn)數(shù)據(jù)分布對(duì)稱(chēng)性的指標(biāo)。A)斜率B)偏斜度C)偏度D)偏離度答案:B解析:偏斜度是對(duì)統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向及程度的度量。在偏態(tài)分布中,當(dāng)偏斜度為正值時(shí),分布正偏,即眾數(shù)位于算術(shù)平均數(shù)的左側(cè);當(dāng)偏斜度為負(fù)值時(shí),分布負(fù)偏,即眾數(shù)位于算術(shù)平均數(shù)的右側(cè)。[單選題]50.Python中用于釋放類(lèi)占用資源的方法是()。A)__init__B)__del__C)_delD)delete答案:B解析:[單選題]51.寫(xiě)入數(shù)據(jù)到HDFS的Sink組件是()。A)HiveB)HBaseC)HDFSD)Hadoop答案:C解析:[單選題]52.關(guān)于機(jī)器學(xué)習(xí)中的目標(biāo)函數(shù),說(shuō)法錯(cuò)誤的是()A)、目標(biāo)函數(shù)(TA、rgetFunC、tion)又稱(chēng)為?評(píng)價(jià)函數(shù)(EvA、luA、tionFunC、tion)?B)、是機(jī)器學(xué)習(xí)算法中需要最大化或最小化一個(gè)函數(shù)C)、可以直接、精確地表示目標(biāo)函數(shù)D)、目標(biāo)函數(shù)包含誤差函數(shù)和正則化項(xiàng)。答案:C解析:[單選題]53.以下關(guān)于NoSQL數(shù)據(jù)庫(kù)描述錯(cuò)誤的是:()A)NoSQL是一種不同于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)設(shè)計(jì)方式,是對(duì)非關(guān)系型數(shù)據(jù)庫(kù)的統(tǒng)稱(chēng)B)NoSQL所采用的數(shù)據(jù)模型并非傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的關(guān)系模型,而是類(lèi)似鍵/值、列族、文檔等非關(guān)系模型C)NoSQL數(shù)據(jù)庫(kù)有固定的表結(jié)構(gòu),通常存在較多連接操作D)與關(guān)系數(shù)據(jù)庫(kù)相比,NoSQL具有靈活的水平可擴(kuò)展性.可以支持海量數(shù)據(jù)存儲(chǔ)答案:C解析:[單選題]54.下列哪一項(xiàng)不屬于HDFS采用抽象的塊概念帶來(lái)的好處?A)簡(jiǎn)化系統(tǒng)設(shè)計(jì)B)支持大規(guī)模文件存儲(chǔ)C)強(qiáng)大的跨平臺(tái)兼容性D)適合數(shù)據(jù)備份答案:C解析:[單選題]55.Hadoop1.0默認(rèn)的調(diào)度器策略是哪個(gè)()A)先進(jìn)先出調(diào)度器B)計(jì)算能力調(diào)度器C)公平調(diào)度器D)優(yōu)先級(jí)調(diào)度器答案:A解析:[單選題]56.貝葉斯網(wǎng)結(jié)構(gòu)有效地表達(dá)了屬性的(__)。A)相互制約性B)條件獨(dú)立性C)取值D)含義答案:B解析:[單選題]57.下列Python語(yǔ)句執(zhí)行后的結(jié)果是:i=2s=0whileiA)8B)12C)18D)24答案:B解析:[單選題]58.若學(xué)習(xí)算法不依賴(lài)于環(huán)境建模,則稱(chēng)為(__)A)免模型學(xué)習(xí)B)機(jī)器學(xué)習(xí)C)深度學(xué)習(xí)D)蒙特卡羅強(qiáng)化學(xué)習(xí)答案:A解析:[單選題]59.若arr=np.array([1,2,3]),則arr*arr的輸出為(__)。A)([1,4,9])B)([1,2,3])C)([2,4,6])D)([3,6,9])答案:A解析:[單選題]60.YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)下列選項(xiàng)中的()進(jìn)行標(biāo)簽化。A)AppMasterB)ResourceManagerC)NodeManagerD)Container答案:C解析:[單選題]61.我們可以利用--query參數(shù)將表的查詢(xún)結(jié)果導(dǎo)入HDFS中,使用該參數(shù)時(shí)需要注意必須要和()參數(shù)一起使用。A)--tableB)--target-dirC)--fields-terminated-byD)--where答案:B解析:[單選題]62.下列關(guān)于大數(shù)據(jù)的說(shuō)法中正確的是()A)大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)等特點(diǎn)B)處理大數(shù)據(jù)主要依靠人工進(jìn)行計(jì)算C)大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D)大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析答案:C解析:[單選題]63.通過(guò)HBase創(chuàng)建表的的時(shí)候指定命名空間的語(yǔ)法正確的是()A)namespace:tableB)namespacetableC)namespace-tableD)namespace>table答案:A解析:[單選題]64.只要具有適當(dāng)?shù)恼咄苿?dòng),大數(shù)據(jù)的使用將成為未來(lái)提高競(jìng)爭(zhēng)力、生產(chǎn)力、創(chuàng)新能力以及()的關(guān)鍵要素。A)提高消費(fèi)B)提高GDPC)提高生活水平D)創(chuàng)造消費(fèi)者盈余答案:D解析:[單選題]65.假設(shè)一種基因同時(shí)導(dǎo)致兩件事情:一是使人喜歡抽煙,二是使這個(gè)人患肺癌。這句話(huà)種基因與抽煙.肺癌之間是()關(guān)系,而吸煙和肺癌則是()關(guān)系。A)因果;相關(guān)B)相關(guān);因果C)并列;相關(guān)D)因果;并列答案:A解析:[單選題]66.pythonmy.pyv1v2命令運(yùn)行腳本,通過(guò)fromsysimportargv如何獲得v2的參數(shù)值()。A)argv[0]B)argv[1]C)argv[2]D)argv[3]答案:C解析:[單選題]67.HBase只有一個(gè)針對(duì)行健的索引,如果要訪(fǎng)問(wèn)HBase表中的行,下面哪種方式是不可行的?A)通過(guò)單個(gè)行健訪(fǎng)問(wèn)B)通過(guò)時(shí)間戳訪(fǎng)問(wèn)C)通過(guò)一個(gè)行健的區(qū)間來(lái)訪(fǎng)問(wèn)D)全表掃描答案:B解析:[單選題]68.HBase獲得Connection連接正確的是()A)Connectionconn=ConnectionFactory.createConnection(conf);B)Connectionconn=ConnectionFactory.createConnection();C)Connectionconn=Connection.createConnection(conf);D)Connectionconn=Connection.createConnection();答案:A解析:[單選題]69.以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過(guò)程域"數(shù)據(jù)戰(zhàn)略"。A)數(shù)據(jù)戰(zhàn)略制定B)業(yè)務(wù)術(shù)語(yǔ)表C)數(shù)據(jù)質(zhì)量評(píng)估D)過(guò)程質(zhì)量保障答案:A解析:數(shù)據(jù)戰(zhàn)略制定屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過(guò)程域"數(shù)據(jù)戰(zhàn)略"。[單選題]70.計(jì)算單個(gè)特征跟類(lèi)別變量之間的關(guān)系的方法不包括()A)Pearson相關(guān)系數(shù)B)方差C)Gini-index(基尼指數(shù))D)IG(信息增益)答案:B解析:[單選題]71.按照班級(jí)進(jìn)行分組()A)ORDERBYCLASSESB)DORDERCLASSESC)GROUPBYCLASSESD)GROUPCLASSES答案:C解析:[單選題]72.Hadoop配置文件中,hadoop-site.xml顯示覆蓋hadoop-default.xml里的內(nèi)容。在版本0.20中,hadoop-site.xml被分離成三個(gè)XML文件,不包括A)conf-site.xmlB)mapred-site.xmlC)core-site.xmlD)hdfs-site.xml答案:A解析:hadoop配置Conf沒(méi)見(jiàn)過(guò),就不選[單選題]73.用于刪除約束的命令是A)ALTERTABLEMODIFYCONSTRAINTB)DROPCONSTRAINTC)ALTERTABLEDROPCONSTRAINTD)ALTERCONSTRAINTDROP答案:C解析:[單選題]74.大數(shù)據(jù)的4V特性不包括A)Volume(大量)B)Velocity(高速)C)Visual(可視)D)Variety(多樣)答案:C解析:[單選題]75.可分解為偏差、方差與噪聲之和的是()。A)訓(xùn)練誤差(trainingerror)B)經(jīng)驗(yàn)誤差(empiricalerror)C)均方誤差(meansquarederror)D)泛化誤差(generalizationerror)答案:D解析:泛化誤差可分解為偏差、方差與噪聲之和。[單選題]76.下面屬于數(shù)據(jù)權(quán)限的特權(quán)是()。--A)DROPB)ALTERC)DELETED)以上答案全部正確答案:C解析:[單選題]77.a="Iwantto",如想得到I,則需要()A)a[8:]B)a[0:1]C)a[7:]D)a[9:]答案:B解析:[單選題]78.()是分類(lèi)錯(cuò)誤的樣本數(shù)占樣本總數(shù)的比例。A)精度B)錯(cuò)誤率C)正確率D)誤差答案:B解析:[單選題]79.預(yù)剪枝是指在決策樹(shù)生成過(guò)程中,對(duì)每個(gè)結(jié)點(diǎn)在劃分(__)進(jìn)行估計(jì)。A)前B)中C)后D)不估計(jì)答案:A解析:[單選題]80.下面關(guān)于數(shù)據(jù)權(quán)的描述,錯(cuò)誤的是:()A)數(shù)據(jù)權(quán)的概念發(fā)起于英國(guó),主要將其視為信息社會(huì)的一項(xiàng)基木公民權(quán)利B)數(shù)據(jù)權(quán)包括兩個(gè)方面:數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)利C)數(shù)據(jù)主權(quán)的主體是國(guó)家,是一個(gè)國(guó)家獨(dú)立自主對(duì)本國(guó)數(shù)據(jù)進(jìn)行管理和利用的權(quán)力D)數(shù)據(jù)主權(quán)的主體是公民,是相對(duì)應(yīng)于公民數(shù)據(jù)采集義務(wù)而形成的對(duì)數(shù)據(jù)利用的權(quán)利答案:D解析:[單選題]81.Hive查詢(xún)語(yǔ)言和SQL的一個(gè)不同之處在于()操作A)GroupB)JoinC)PartitionD)Union答案:C解析:[單選題]82.()提供針對(duì)集群中每個(gè)節(jié)點(diǎn)的服務(wù),從監(jiān)督對(duì)一個(gè)容器的終身管理到監(jiān)視資源和跟蹤節(jié)點(diǎn)健康A(chǔ))ResourceMangerB)NodeMangerC)ApplicationMasterD)Container答案:B解析:[單選題]83.altertabletableNamesettblproperties('EXTERNAL?='FALSE?);執(zhí)行該Hive命令能實(shí)現(xiàn)以下哪一個(gè)目標(biāo)?A)修改外部表tableName為內(nèi)部表B)刪除tableName表的元數(shù)據(jù)信息C)修改內(nèi)部表tableName為外部表D)移動(dòng)tableName數(shù)據(jù)到外部存儲(chǔ)系統(tǒng)答案:A解析:[單選題]84.與以下代碼段var=100ifvar==200:print("1-Gotatrueexpressionvalue")print(var)elifvar==150:print("2-Gotatrueexpressionvalue")print(var)elifvar==100:print("3-Gotatrueexpressionvalue")print(var)else:print("4-Gotafalseexpressionvalue")print(var)等效的列表描述()。A)1-Gotatrueexpressionvalue100B)2-Gotatrueexpressionvalue100C)3-Gotatrueexpressionvalue100D)4-Gotatrueexpressionvalue100答案:C解析:[單選題]85.()一般采用圖表或數(shù)學(xué)方法描述數(shù)據(jù)的統(tǒng)計(jì)特征,如分布狀態(tài)、數(shù)值特征等。A)推斷統(tǒng)計(jì)B)預(yù)測(cè)分析C)描述統(tǒng)計(jì)D)診斷分析答案:C解析:[單選題]86.作為技術(shù)人員,小王被Maxcompute強(qiáng)大的數(shù)據(jù)處理能力吸引,想去體驗(yàn)一下。他快速注冊(cè)了一個(gè)阿里云帳號(hào),進(jìn)入官網(wǎng)后試圖創(chuàng)建一個(gè)名字為test_project的Maxcomputeproject,結(jié)果沒(méi)有成功。分析,小王出錯(cuò)的最有可能的原因是:()。A)帳號(hào)未充值,余額不足導(dǎo)致出錯(cuò)B)帳號(hào)未開(kāi)通Maxcompute的使用權(quán)限C)未創(chuàng)建合適的accessID和accessKeyD)項(xiàng)目名字和現(xiàn)有的其他帳戶(hù)的名字重復(fù)答案:D解析:[單選題]87.通過(guò)HBase提創(chuàng)建表的關(guān)鍵字是()A)insertB)createC)addD)以上都不正確答案:B解析:[單選題]88.關(guān)于概率圖模型下列敘述,正確的是:A)貝葉斯網(wǎng)絡(luò)是有向圖模型,馬爾可夫網(wǎng)絡(luò)是無(wú)向圖模型B)貝葉斯網(wǎng)絡(luò)是無(wú)向圖模型,馬爾可夫網(wǎng)絡(luò)是有向圖模型C)貝葉斯網(wǎng)絡(luò)是有向圖模型,馬爾可夫網(wǎng)絡(luò)是有向圖模型D)貝葉斯網(wǎng)絡(luò)是無(wú)向圖模型,馬爾可夫網(wǎng)絡(luò)是無(wú)向圖模型答案:A解析:[單選題]89.LSM更能保證哪種操作的性能?A)讀B)寫(xiě)C)隨機(jī)讀D)合并答案:B解析:LSM的思想,在于對(duì)數(shù)據(jù)的修改增量保持在內(nèi)存中,達(dá)到指定的限制后將這些修改操作批量寫(xiě)入到磁盤(pán)中,相比較于寫(xiě)入操作的高性能,讀取需要合并內(nèi)存中最近修改的操作和磁盤(pán)中歷史的數(shù)據(jù),即需要先看是否在內(nèi)存中,若沒(méi)有命中,還要訪(fǎng)問(wèn)磁盤(pán)文件。[單選題]90.機(jī)器學(xué)習(xí)訓(xùn)練時(shí),Mini-Batch的大小優(yōu)選為2的事,如256或512它背后的原因是()A)Mini-Batch為偶數(shù)的時(shí)候,梯度下降算法訓(xùn)練的史決B)Mini-Batch設(shè)為2的罪,是為了符合CPU、GPU的內(nèi)存要求,利于并行化處理C)不使用偶數(shù)時(shí),損失函數(shù)是不穩(wěn)定的D)以上答案都不正確答案:B解析:[單選題]91.下列關(guān)于半監(jiān)督支持向量機(jī)說(shuō)法錯(cuò)誤的是(__)。A)半監(jiān)督支持向量機(jī)是針對(duì)二分類(lèi)問(wèn)題的學(xué)習(xí)算法B)半監(jiān)督支持向量機(jī)尋求一個(gè)在所有樣本上間隔最小化的劃分超平面C)半監(jiān)督支持向量機(jī)采用局部搜索來(lái)迭代地尋找其優(yōu)化問(wèn)題的近似解D)半監(jiān)督支持向量機(jī)試圖考慮對(duì)未標(biāo)記樣本進(jìn)行各種可能的標(biāo)記指派答案:B解析:[單選題]92.np.array()的作用是(__)。A)將輸入數(shù)據(jù)轉(zhuǎn)化為ndarrayB)將輸入數(shù)據(jù)轉(zhuǎn)化為arrayC)將輸入數(shù)據(jù)轉(zhuǎn)化為列表D)數(shù)組轉(zhuǎn)置答案:A解析:[單選題]93.網(wǎng)絡(luò)的價(jià)值在于網(wǎng)絡(luò)的互聯(lián),聯(lián)網(wǎng)的接點(diǎn)數(shù)與其價(jià)值呈現(xiàn)()的方式,聯(lián)網(wǎng)越多,系統(tǒng)的價(jià)值越大。A)對(duì)數(shù)B)指數(shù)C)正比D)反比答案:B解析:[單選題]94.下面關(guān)于網(wǎng)絡(luò)爬蟲(chóng)的描述錯(cuò)誤的是:()A)網(wǎng)絡(luò)爬蟲(chóng)是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序B)為搜索引擎從萬(wàn)維網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成部分C)爬蟲(chóng)從一個(gè)或若干個(gè)初始網(wǎng)頁(yè)的URL開(kāi)始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿(mǎn)足系統(tǒng)的一定停止條件D)網(wǎng)絡(luò)爬蟲(chóng)的行為和人們?cè)L問(wèn)網(wǎng)站的行為是完全不同的答案:D解析:[單選題]95.以下哪些算法,可以用神經(jīng)網(wǎng)絡(luò)去構(gòu)造:1.KNN2.線(xiàn)性回歸3.對(duì)數(shù)幾率回歸A)1和2B)2和3C)1,2和3D)以上都不是答案:B解析:[單選題]96.sparksql的查詢(xún)優(yōu)化器是A)DataFrameB)CatalystC)RddD)DataSet答案:B解析:[單選題]97.HBase的一個(gè)典型應(yīng)用是webtable,它是一個(gè)以網(wǎng)頁(yè)()為主鍵的表。A)標(biāo)題B)URLC)內(nèi)容D)類(lèi)別答案:B解析:webtable中,以網(wǎng)頁(yè)URL為主鍵。[單選題]98.下列關(guān)于氣泡圖的說(shuō)法中,錯(cuò)誤的是()A)氣泡圖中氣泡的顏色是系統(tǒng)統(tǒng)一設(shè)置的,無(wú)法人為調(diào)整B)氣泡大小的不同意味著所代表的的數(shù)值的不同C)氣泡圖中的圖形形狀不一定是圓形D)可以為每個(gè)氣泡打上標(biāo)簽使其展示的數(shù)值更加直觀化答案:A解析:[單選題]99.以下哪項(xiàng)方法不屬于漢語(yǔ)分詞方法?()A)雙向掃描法B)正向最大匹配法C)逐詞遍歷法D)詞向量匹配法答案:D解析:[單選題]100.()模式:hadoop安裝時(shí)的默認(rèn)模式,不對(duì)配置文件進(jìn)行修改。A)聯(lián)機(jī)B)單機(jī)C)虛擬分布D)完全分布答案:B解析:[單選題]101.ythonWeb開(kāi)發(fā)方向的第三方庫(kù)是A)DjangoB)scipyC)pandasD)requests答案:A解析:[單選題]102.在選擇神經(jīng)網(wǎng)絡(luò)的深度時(shí),下面那些參數(shù)需要考慮?()(1)神經(jīng)網(wǎng)絡(luò)的類(lèi)型(如MLP,CNN)(2)輸入數(shù)據(jù)(3)計(jì)算能力(硬件和軟件能力決定)(4)學(xué)習(xí)速率(5)映射的輸出函數(shù)A)1,2,4,5B)LeakyRelu是Relu的一個(gè)變種,他在xC)都需要考慮D)1,3,4,5答案:C解析:[單選題]103.某企業(yè)準(zhǔn)備上線(xiàn)一個(gè)項(xiàng)目,去搜集國(guó)內(nèi)主要門(mén)戶(hù)、論壇中和本公司相關(guān)的消息,一旦有符合預(yù)定義類(lèi)型的消息出現(xiàn),將第一時(shí)間反饋給公司的公共關(guān)系部,該場(chǎng)景屬于典型的()。A)流計(jì)算B)在線(xiàn)計(jì)算C)OLTPD)離線(xiàn)計(jì)算答案:A解析:[單選題]104.按性別對(duì)職工數(shù)據(jù)集進(jìn)行匯總統(tǒng)計(jì)時(shí),需要對(duì)性別列進(jìn)行哪個(gè)操作才能完成統(tǒng)計(jì)匯總?()A)分組B)聚合C)排列D)統(tǒng)計(jì)答案:A解析:[單選題]105.執(zhí)行"abcdef"[2:]語(yǔ)句時(shí)輸出是()。A)abcB)abcdC)cdefD)cde答案:C解析:[單選題]106.如果問(wèn)題存在最優(yōu)解,則下面幾種搜索算法中,()必然可以得到該最優(yōu)解。A)廣度優(yōu)先搜索B)深度優(yōu)先搜索C)有界深度優(yōu)先搜索D)啟發(fā)式搜索答案:A解析:[單選題]107.所有預(yù)測(cè)模型在廣義上都可稱(chēng)為一個(gè)或一組()A)公式B)邏輯C)命題D)規(guī)則答案:D解析:[單選題]108.一個(gè)MapReduce程序中的MapTask的個(gè)數(shù)由()決定。A)輸入的總文件數(shù)B)客戶(hù)端程序設(shè)置的mapTask的個(gè)數(shù)C)Fi1eInputFormat.getSplits(JobContexjob)計(jì)算出的邏輯切片的數(shù)量D)輸入的總文件大小/數(shù)據(jù)塊大小答案:C解析:[單選題]109.ETL工具工作過(guò)程不包含以下哪項(xiàng)?A)清洗B)傳遞C)加載D)轉(zhuǎn)換答案:B解析:[單選題]110.下面關(guān)于MapReduce的描述中正確的是?A)MapReduce程序必須包含Mapper和ReducerB)MapReduce程序的MapTask可以任意指定C)MapReduce程序的ReduceTask可以任意指定D)MapReduce程序的默認(rèn)數(shù)據(jù)讀取組件是TextInputFormat答案:D解析:[單選題]111.下列選項(xiàng)中不是hadoop特點(diǎn)的是()。A)可靠性B)擴(kuò)容能力C)高效率D)成本高答案:D解析:[單選題]112.HDFS無(wú)法高效存儲(chǔ)大量小文件,想讓它能處理好小文件,比較可行的改進(jìn)策略不包括A)利用SequenceFile、MapFile、Har等方式歸檔小文件B)多Master設(shè)計(jì)C)Block大小適當(dāng)調(diào)小D)調(diào)大namenode內(nèi)存或?qū)⑽募到y(tǒng)元數(shù)據(jù)存到硬盤(pán)里答案:D解析:HDFS特性secondaryNamenode會(huì)將內(nèi)存中合并后的的元數(shù)據(jù)存到硬盤(pán)[單選題]113.某二叉樹(shù)共有12個(gè)結(jié)點(diǎn),其中葉子結(jié)點(diǎn)只有1個(gè)。則該二叉樹(shù)的深度為(根結(jié)點(diǎn)在第1層)___________。A)8B)12C)6D)3答案:B解析:[單選題]114.關(guān)于云數(shù)據(jù)庫(kù)描述不對(duì)的是()A)云數(shù)據(jù)可支持關(guān)系型數(shù)據(jù)庫(kù)B)數(shù)據(jù)庫(kù)支持按量計(jì)費(fèi)C)支持創(chuàng)建只讀實(shí)例D)支持備份與恢復(fù),可保留歷史2周數(shù)據(jù)答案:D解析:[單選題]115.有關(guān)MapReduce的輸入輸出,說(shuō)法錯(cuò)誤的是A)鏈接多個(gè)MapReduce作業(yè)時(shí),序列文件是首選格式B)FileInputFormat中實(shí)現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片,分片數(shù)目和大小任意定義C)想完全禁止輸出,可以使用NullOutputFormatD)每個(gè)reduce需將它的輸出寫(xiě)入自己的文件中,輸出無(wú)需分片答案:B解析:分片數(shù)目在numSplits中限定,分片大小必須大于mapred.min.size個(gè)字節(jié),但小于文件系統(tǒng)的塊[單選題]116.若a=np.abs(-5),則print(a)輸出為(__)。A)-6B)-4C)-5D)5答案:D解析:[單選題]117.以下關(guān)于程序控制結(jié)構(gòu)描述錯(cuò)誤的是:A)單分支結(jié)構(gòu)是用if保留字判斷滿(mǎn)足一個(gè)條件,就執(zhí)行相應(yīng)的處理代碼B)二分支結(jié)構(gòu)是用if-else根據(jù)條件的真假,執(zhí)行兩種處理代碼C)多分支結(jié)構(gòu)是用if-elif-else處理多種可能的情況D)在Python的程序流程圖中可以用處理框表示計(jì)算的輸出結(jié)果答案:D解析:[單選題]118.下列關(guān)于核函數(shù)特性的描述,錯(cuò)誤的是()A)只要一個(gè)對(duì)稱(chēng)函數(shù)所對(duì)應(yīng)的核矩陣半正定,就能稱(chēng)為核函數(shù)十B)核函數(shù)選擇作為支持向量機(jī)的最大變數(shù)中C)核函數(shù)將影響支持向量機(jī)的性能D)按函數(shù)是一種降雄模型答案:D解析:[單選題]119.RDD中的數(shù)據(jù)被()在集群中,使得任務(wù)可以并行執(zhí)行。A)順序存儲(chǔ)B)連續(xù)存儲(chǔ)C)分塊存儲(chǔ)D)分區(qū)存儲(chǔ)答案:D解析:RDD為分區(qū)存儲(chǔ)。[單選題]120.把詞典中的詞按照由長(zhǎng)到短遞減的順序逐字搜索整個(gè)待處理的材料,一直到把全部的詞切分出來(lái)為止。不論分詞詞典多大,被處理的材料多么小,都得把這個(gè)分詞詞典匹配一遍。這種方法叫(__)。A)正向最大匹配法B)逆向最大匹配法C)逐詞遍歷法D)隱馬爾科夫模型答案:C解析:[單選題]121.關(guān)于eval函數(shù),以下選項(xiàng)中描述錯(cuò)誤的是A)eval函數(shù)的作用是將輸入的字符串轉(zhuǎn)為Python語(yǔ)句,并執(zhí)行該語(yǔ)句B)如果用戶(hù)希望輸入一個(gè)數(shù)字,并用程序?qū)@個(gè)數(shù)字進(jìn)行計(jì)算,可以采用eval(input())組合C)執(zhí)行eval("Hello")和執(zhí)行eval("'Hello'")得到相同的結(jié)果D)eval函數(shù)的定義為:eval(source,globals=None,locals=None,/)答案:C解析:[單選題]122.KNN算法中K指的是:A)K個(gè)樣本B)相鄰的K個(gè)鄰居C)K次迭代D)K次方答案:B解析:[單選題]123.在使用--query參數(shù)指定查詢(xún)語(yǔ)句時(shí),需要注意的是()A)在查詢(xún)語(yǔ)句中一定要有where條件且在where條件中必須包含$CONDITIONSB)在查詢(xún)語(yǔ)句中一定要有select語(yǔ)句且在select語(yǔ)句中必須包含$CONDITIONSC)在查詢(xún)語(yǔ)句中一定要有where條件且在where條件中必須包含CONDITIONSD)在查詢(xún)語(yǔ)句中一定要有select語(yǔ)句且在select語(yǔ)句中必須包含CONDITIONS答案:A解析:[單選題]124.對(duì)GaussDB200描述不正確的是?()A)并行架構(gòu)B)易運(yùn)維,安全可靠C)行列不能混存D)節(jié)點(diǎn)多,易擴(kuò)展答案:C解析:[單選題]125.某電商網(wǎng)站想要實(shí)現(xiàn)熱銷(xiāo)商品的實(shí)時(shí)TopN排名,可以使用哪種技術(shù)實(shí)現(xiàn)?A)Elasticsearch的快速檢索B)HBase的rowkey索引C)Hive的關(guān)聯(lián)查詢(xún)分析D)Redis的排序計(jì)算答案:D解析:[單選題]126.目前精準(zhǔn)營(yíng)銷(xiāo)產(chǎn)品提供幾種服務(wù)方式:()A)1種B)2種C)3種D)4種答案:B解析:[單選題]127.查看一張表中數(shù)據(jù)的最后修改時(shí)間,正確的方法是:()。A)找管理員從后臺(tái)查B)DESC命令C)SHOWTABLES命令D)SELECTLAST_MODIFY_TIMEFROMTABLE答案:B解析:[單選題]128.()是Spark中用于結(jié)構(gòu)化數(shù)據(jù)處理的軟件包。A)SPARKCOREB)SparkSQLC)SparkStreamingD)Mllib答案:B解析:[單選題]129.若要對(duì)圖片進(jìn)行檢索,-般選擇什么工具較好?A)MysQLB)HDFSC)ElasticSearchD)Hive答案:C解析:[單選題]130.HDFS中當(dāng)前block大小為128M,如果當(dāng)前要上傳到HDFS中的文件大小為300M,那么在存儲(chǔ)時(shí)會(huì)分配()個(gè)block進(jìn)行存儲(chǔ)。A)1B)2C)3D)4答案:C解析:[單選題]131.直方圖均衡化適用于增強(qiáng)直方圖呈()分布的圖像。A)尖峰B)波形C)隨機(jī)D)高斯答案:A解析:[單選題]132.物聯(lián)網(wǎng)(IoT,InternetofThings)即?物物相連的互聯(lián)網(wǎng)?,是()向物理世界的滲透、拓展和延伸。A)物理理論B)信息世界C)互聯(lián)網(wǎng)D)能源互聯(lián)網(wǎng)答案:C解析:[單選題]133.企業(yè)數(shù)據(jù)分析平臺(tái)在根據(jù)不同的業(yè)務(wù)場(chǎng)景需求,搭建不同的大數(shù)據(jù)分析平臺(tái),如適應(yīng)離線(xiàn)批處理的Hadoop平臺(tái);適應(yīng)實(shí)時(shí)處理的流計(jì)算平臺(tái)等,這種架構(gòu)屬于哪種類(lèi)型的架構(gòu)?A)分離架構(gòu)B)單一架構(gòu)C)融合架構(gòu)D)多維架構(gòu)答案:A解析:[單選題]134.Python解釋器的提示符為()。A)>B)>>C)>>>D)#答案:C解析:Python解釋器的提示符為>>>。[單選題]135.Matplotlib設(shè)置好圖表元素后,以下哪個(gè)代碼可以使圖表自動(dòng)調(diào)整格式()A)fig.fit()B)fig.tight()C)fig.fit_layout()D)fig.tight_layout()答案:D解析:[單選題]136.下列關(guān)于類(lèi)屬性和實(shí)例屬性的說(shuō)法中,描述正確的是()。A)類(lèi)屬性既可以顯式定義,又能在方法中定義B)公有類(lèi)屬性可以通過(guò)類(lèi)和類(lèi)的實(shí)例訪(fǎng)問(wèn)C)通過(guò)類(lèi)可以獲取實(shí)例屬性的值D)類(lèi)的實(shí)例只能獲取實(shí)例屬性的值答案:B解析:[單選題]137.下面描述錯(cuò)誤的是:()A)數(shù)據(jù)分析可以分為廣義的數(shù)據(jù)分析和狹義的數(shù)據(jù)分析B)廣義的數(shù)據(jù)分析就包括狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘。C)數(shù)據(jù)挖掘就是指狹義的數(shù)據(jù)分析D)數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中挖掘出未知的、且有價(jià)值的信息和知識(shí)的過(guò)程答案:C解析:[單選題]138.以下()文件中主要用來(lái)配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。A)core-site.xmlB)mapred-site.xmlC)hdfs-site.xmlD)yarn-site.xml答案:D解析:[單選題]139.須以正確的順序傳入函數(shù),調(diào)用時(shí)的數(shù)量必須和聲明時(shí)的一樣的參數(shù)是()。A)位置參數(shù)B)默認(rèn)值參數(shù)C)可變參數(shù)D)關(guān)鍵字參數(shù)答案:A解析:位置參數(shù)須以正確的順序傳入函數(shù),調(diào)用時(shí)的數(shù)量必須和聲明時(shí)的一樣。[單選題]140.電商大數(shù)據(jù)存在的安全風(fēng)險(xiǎn)不包括()。A)數(shù)據(jù)版權(quán)缺乏保護(hù)B)數(shù)據(jù)產(chǎn)權(quán)歸屬不清C)大數(shù)據(jù)?殺熟?現(xiàn)象D)業(yè)務(wù)數(shù)據(jù)跨境傳輸答案:C解析:[單選題]141.主成分分析(PCA)是一種重要的降維技術(shù),以下對(duì)于PCA的描述不正確的是:A)主成分分析是一種無(wú)監(jiān)督方法B)主成分?jǐn)?shù)量一定小于等于特征的數(shù)量C)各個(gè)主成分之間相互正交D)原始數(shù)據(jù)在第一主成分上的投影方差最小答案:D解析:[單選題]142.下列方法中,默認(rèn)刪除列表最后一個(gè)元素的是()。A)delB)remove()C)pop()D)extend()答案:C解析:[單選題]143.將字符串分隔使用什么函數(shù)()A)splitB)stripC)encodeD)print答案:A解析:[單選題]144.下列關(guān)于回歸算法,不正確的是()A)回歸算法可以用最小二乘法求解B)最大似然估計(jì)可以得到和最小二乘法相同的結(jié)果C)回歸算法加入絕對(duì)值項(xiàng)是嶺回歸D)回歸算法也會(huì)產(chǎn)生過(guò)擬合問(wèn)題答案:C解析:第2部分:多項(xiàng)選擇題,共63題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.Client上傳文件的時(shí)候下列哪項(xiàng)正確()A)數(shù)據(jù)經(jīng)過(guò)NameNode傳遞給DataNodeB)Client端文件以Block為單位,管道方式依次傳到DataNodeC)Client只上傳數(shù)據(jù)到一臺(tái)Datanode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D)當(dāng)某個(gè)Datanode失敗,客戶(hù)端會(huì)繼續(xù)傳給其他DataNode答案:BD解析:[多選題]146.以下關(guān)于Hive的Metastore描述正確的是()【選兩項(xiàng)】A)Metastore保存了Hive的元數(shù)據(jù)信息B)Metastore的安裝模式不能用內(nèi)嵌模式C)Metastore的安裝模式有本地模式D)Metastore的安裝模式默認(rèn)是遠(yuǎn)程模式答案:AC解析:[多選題]147.對(duì)文本類(lèi)型的數(shù)據(jù)進(jìn)行轉(zhuǎn)換加工,以下選項(xiàng)中哪些文本函數(shù)處理的對(duì)象是一個(gè)文本字符串,處理完的輸出結(jié)果也是一個(gè)文本字符串()A)ConcatenatB)LeftC)UpperD)Replace答案:BCD解析:[多選題]148.下列是SVM核函數(shù)的是:()A)多項(xiàng)式核函數(shù)B)logistic核函數(shù)C)徑向基核函數(shù)D)Sigmoid核函數(shù)答案:ACD解析:[多選題]149.大數(shù)據(jù)產(chǎn)業(yè)是指一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合。以下哪些屬于大數(shù)據(jù)產(chǎn)業(yè)的某個(gè)環(huán)節(jié)():A)IT基礎(chǔ)設(shè)施層B)數(shù)據(jù)源層C)數(shù)據(jù)管理層D)數(shù)析層答案:ABCD解析:[多選題]150.Spark支持的計(jì)算模型有()。A)批處理B)實(shí)時(shí)計(jì)算C)機(jī)器學(xué)習(xí)模型D)交互式查詢(xún)答案:ABCD解析:Spark支持的計(jì)算模型有批處理、實(shí)時(shí)計(jì)算、機(jī)器學(xué)習(xí)模型、交互式查詢(xún)。[多選題]151.下列對(duì)于客服端的描述,哪些是正確的?A)客戶(hù)端是用戶(hù)操作HDFS最常用的方式,HDFS在部署時(shí)都提供了客戶(hù)端B)HDFS客戶(hù)端是一個(gè)庫(kù),暴露了HDFS文件系統(tǒng)接口C)嚴(yán)格來(lái)說(shuō),客戶(hù)端并不算是HDFS的一部分D)客戶(hù)端可以支持打開(kāi)、讀取、寫(xiě)入等常見(jiàn)的操作答案:ABCD解析:[多選題]152.Flink計(jì)算時(shí)間不包含以下哪幾種時(shí)間語(yǔ)義?A)DelayTime(延遲時(shí)間)B)StartTime(開(kāi)始時(shí)間)C)ProcessingTime(處理)D)EventTime(事件時(shí)間)答案:AB解析:[多選題]153.Flume進(jìn)程級(jí)聯(lián)時(shí),以下哪些sink類(lèi)型用于接收上一跳Flume發(fā)送過(guò)來(lái)的數(shù)據(jù)?A)avrosinkB)thriftsinkC)HDFSsinkD)NullSink答案:BC解析:[多選題]154.電信大數(shù)據(jù)PaaS平臺(tái)產(chǎn)品基本包包含以下哪幾類(lèi)服務(wù):()A)數(shù)據(jù)存儲(chǔ)服務(wù)B)離線(xiàn)分析服務(wù)C)應(yīng)用開(kāi)發(fā)環(huán)境及框架服務(wù)D)數(shù)據(jù)挖掘服務(wù)、MPPDB服務(wù)答案:ABC解析:[多選題]155.在Spark中,彈性分布式數(shù)據(jù)集的特點(diǎn)包括()。A)可分區(qū)B)可序列化C)可直接修改D)可持久化答案:ABD解析:RDD不可修改。[多選題]156.以下哪些選項(xiàng)屬于離線(xiàn)批處理的特點(diǎn)?A)處理時(shí)間相對(duì)較長(zhǎng)B)數(shù)據(jù)不落地、存儲(chǔ)量不大C)數(shù)據(jù)吞吐量較大D)處理數(shù)據(jù)量相對(duì)較大答案:ACD解析:[多選題]157.下列說(shuō)法正確的是(___)。A)Python提供了兩個(gè)內(nèi)置函數(shù)從標(biāo)準(zhǔn)輸入讀入一行文本B)Python默認(rèn)的標(biāo)準(zhǔn)輸入是鍵盤(pán)C)raw_input([prompt])函數(shù)從標(biāo)準(zhǔn)輸入讀取一個(gè)行,并返回一個(gè)字符串D)raw_input可以接收一個(gè)Python表達(dá)式作為輸入,并將運(yùn)算結(jié)果返回答案:ABC解析:[多選題]158.下面屬于維歸約常用的線(xiàn)性代數(shù)技術(shù)的有:()A)主成分分析B)特征提取C)奇異值分解D)特征加權(quán)答案:AC解析:[多選題]159.()是Spark比MapReduce計(jì)算快的原因。A)基于內(nèi)存的計(jì)算B)基于DAG的調(diào)度框架C)基于Lineage的容錯(cuò)機(jī)制D)基于分布式計(jì)算的框架答案:ABC解析:Spark比MapReduce計(jì)算快的原因包括基于內(nèi)存計(jì)算、使用基于Lineage的容錯(cuò)機(jī)制和基于DAG的調(diào)度框架。[多選題]160.HBase讀數(shù)據(jù)時(shí)需要讀取哪幾部分?jǐn)?shù)據(jù)?A)HlocB)MemStoreC)HfileD)HDFS答案:BC解析:[多選題]161.黨中央、國(guó)務(wù)院高度重視網(wǎng)絡(luò)安全工作,出臺(tái)了一系列法律、法規(guī)和專(zhuān)項(xiàng)文件,其中針對(duì)()等,提出了明確法律規(guī)定和要求,必須認(rèn)真貫徹。A)保障數(shù)據(jù)與個(gè)人信息安全B)維護(hù)信息內(nèi)容安全C)保護(hù)國(guó)家和企業(yè)秘密D)確保網(wǎng)絡(luò)意識(shí)形態(tài)安全答案:ABCD解析:[多選題]162.以下數(shù)據(jù)加工函數(shù)中屬于對(duì)字符串類(lèi)型數(shù)據(jù)進(jìn)行加工的是()A)trimB)replaceC)calculateD)mod答案:AB解析:[多選題]163.下列關(guān)于核函數(shù)的說(shuō)法正確的是(__)。A)任何一個(gè)函數(shù)都可以作為核函數(shù)B)只要一個(gè)對(duì)稱(chēng)函數(shù)所對(duì)應(yīng)的核矩陣半正定,它就能作為核函數(shù)使用C)任何一個(gè)核函數(shù)都隱式地定義了一個(gè)再生核希爾伯特空間D)核函數(shù)可將低維空間中線(xiàn)性可分的數(shù)據(jù)映射到高維空間,使其線(xiàn)性不可分答案:BC解析:[多選題]164.()是大數(shù)據(jù)應(yīng)用的步驟。A)數(shù)據(jù)輸入B)建模分析C)使用決策支持工具輸出結(jié)果D)驗(yàn)證假設(shè)答案:ABC解析:[多選題]165.HBase集群定時(shí)執(zhí)行Compaction的目的是什么A)減少同一個(gè)Region,同一個(gè)ColumnFamily下的文件數(shù)目B)提升數(shù)據(jù)讀取性能C)減少同一個(gè)ColumnFamily的文件數(shù)據(jù)D)減少同一個(gè)Region的文件數(shù)目答案:AB解析:[多選題]166.假設(shè)目標(biāo)遍歷的類(lèi)別非常不平衡,即主要類(lèi)別占據(jù)了訓(xùn)練數(shù)據(jù)的99%,現(xiàn)在你的模型在訓(xùn)練集上表現(xiàn)為99%的準(zhǔn)確度,那么下面說(shuō)法正確的是()A)準(zhǔn)確度并不適合衡量不平衡類(lèi)別問(wèn)題B)準(zhǔn)確度適合衡量不平衡類(lèi)別問(wèn)題C)精確度和召回率適合于衡量不平衡類(lèi)別問(wèn)題D)精確度和召回率不適合衡量不平衡類(lèi)別問(wèn)題答案:AC解析:[多選題]167.a=np.array([1,2,3,4,5,6,7,8])以下(__)命令可以使輸出結(jié)果為([5,6,7])。A)a[4:7]B)a[5:8]C)a[4:-1]D)a[5:]答案:AC解析:[多選題]168.大數(shù)據(jù)處理流程可以概括為以下哪幾步?()A)挖掘B)采集C)統(tǒng)計(jì)和分析D)導(dǎo)入和預(yù)處理答案:ABCD解析:[多選題]169.關(guān)于語(yǔ)句limit5,5,說(shuō)法正確的是A)表示檢索出第5行開(kāi)始的5條記錄B)表示檢索出行6開(kāi)始的5條記錄C)表示檢索出第6行開(kāi)始的5條記錄D)表示檢索出行5開(kāi)始的5條記錄答案:CD解析:[多選題]170.定量變量就是通常所說(shuō)的連續(xù)量,它們是由測(cè)量或計(jì)數(shù)、統(tǒng)計(jì)所得到的量,這些變量具有數(shù)值特征,以下屬于定量變量的有()A)性別B)長(zhǎng)度C)產(chǎn)量D)職業(yè)答案:BC解析:[多選題]171.專(zhuān)業(yè)審計(jì)軟件有()A)ACLB)IDEAC)MicrosoftOfficeD)QlikView答案:AB解析:[多選題]172.在下列關(guān)于關(guān)系的敘述中,正確的是()A)C)行在表中的順序無(wú)關(guān)緊要B)A)表中任意兩行的值不能相同C)D)列在表中的順序無(wú)關(guān)緊要D)B)表中任意兩列的值不能相同答案:ABC解析:[多選題]173.下列關(guān)于數(shù)據(jù)產(chǎn)品研發(fā)的說(shuō)法錯(cuò)誤的有()。A)從加工程度看,可以將數(shù)據(jù)分為一次數(shù)據(jù)、二次數(shù)據(jù)和三次數(shù)據(jù)B)一次數(shù)據(jù)中往往存在缺失值、噪聲、錯(cuò)誤或虛假數(shù)據(jù)等質(zhì)量問(wèn)題C)二次數(shù)據(jù)是對(duì)一次數(shù)據(jù)進(jìn)行深度處理或分析后得到的增值數(shù)據(jù)D)三次數(shù)據(jù)是對(duì)二次數(shù)據(jù)進(jìn)行洞察與分析后得到的、可以直接用于決策支持的洞見(jiàn)數(shù)據(jù)答案:ABD解析:二次數(shù)據(jù)是一種按照信息的生產(chǎn)過(guò)程和加工深度進(jìn)行對(duì)信息進(jìn)行分類(lèi)的,是指根據(jù)特定的需求,對(duì)一次信息進(jìn)行加工、分析、改編、重組、綜合概括生成的信息。[多選題]174.數(shù)據(jù)戰(zhàn)略的基本問(wèn)題有(__)。A)數(shù)據(jù)戰(zhàn)略的定位B)數(shù)據(jù)戰(zhàn)略的目標(biāo)C)數(shù)據(jù)戰(zhàn)略的側(cè)重點(diǎn)D)數(shù)據(jù)戰(zhàn)略的范疇答案:ABCD解析:[多選題]175.語(yǔ)句?CREATETABLEmydb.temp()?用于從mydb.user表中復(fù)制已有的表結(jié)構(gòu)。--A)FROMmydb.userB)(FROMmydb.user)C)LIKEmydb.userD)(LIKEmydb.user)答案:CD解析:[多選題]176.客戶(hù)端使用給get方式讀取HBase用戶(hù)數(shù)據(jù)時(shí),需要查詢(xún)meta表哪些數(shù)據(jù)?A)Region起始rowkeyB)RegionServer地址C)Region分裂時(shí)間D)Region大小答案:AB解析:[多選題]177.與傳統(tǒng)的分布式程序設(shè)計(jì)相比,Mapreduce封裝了()等細(xì)節(jié),還提供了一個(gè)簡(jiǎn)單而強(qiáng)大的接口A)并行處理B)容錯(cuò)處理C)本地化計(jì)算D)負(fù)載均衡答案:ABCD解析:[多選題]178.客戶(hù)端使用get方式讀取HBase用戶(hù)數(shù)據(jù)時(shí),需要查詢(xún)meta表的哪些數(shù)據(jù)?A)RegionServer地址B)Region起始rowkeyC)Region大小D)Region分裂時(shí)間答案:AB解析:[多選題]179.根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,擔(dān)保圈鏈模塊,擔(dān)保圈鏈頁(yè)面右側(cè)展示()、()按鈕。A)擔(dān)保篩選B)關(guān)聯(lián)篩選C)全景風(fēng)險(xiǎn)視圖D)企業(yè)信用智能分析報(bào)告答案:AB解析:[多選題]180.Hive的系統(tǒng)架構(gòu)主要包括哪幾個(gè)模塊:()A)探查模塊B)驅(qū)動(dòng)模塊C)元數(shù)據(jù)存儲(chǔ)模塊D)用戶(hù)接口模塊答案:BCD解析:[多選題]181.Pandas中主要的數(shù)據(jù)結(jié)構(gòu)有()。A)DataB)DataFrameC)FrameD)Series答案:BD解析:Pandas的兩種主要數(shù)據(jù)結(jié)構(gòu)為Series和DataFrame。[多選題]182.下面哪些是循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出模式A)多輸出B)單輸出C)同步多輸出D)異步多輸出答案:ABD解析:[多選題]183.DRDS做平滑擴(kuò)容的時(shí)候,現(xiàn)有的數(shù)據(jù)庫(kù)中的表需要滿(mǎn)足()要求。A)拆分表需要有主鍵B)拆分表需要?jiǎng)h除主鍵C)單表需要做小表廣播D)單表需有主鍵答案:AC解析:[多選題]184.下列關(guān)于學(xué)習(xí)器的性能度量說(shuō)法正確的是(__)。A)對(duì)于二分類(lèi)問(wèn)題,可將樣例根據(jù)其真實(shí)類(lèi)別與學(xué)習(xí)器預(yù)測(cè)類(lèi)別的組合劃分為:真正例、假正例、真反例、假反例B)查準(zhǔn)率和查全率是一對(duì)矛盾的度量C)一般來(lái)說(shuō),查準(zhǔn)率越高,查全率往往也偏高D)一般來(lái)說(shuō),查準(zhǔn)率越高,查全率往往偏低答案:ABD解析:[多選題]185.大數(shù)據(jù)計(jì)算框架Flink的支持哪些資源調(diào)度方式?A)DockerB)YARNC)StandaloneD)Mesos答案:ABCD解析:[多選題]186.在GaussDB200中,關(guān)于Schema和Database,下面說(shuō)法正確的是()?A)Database之間無(wú)法直接訪(fǎng)問(wèn),但通過(guò)權(quán)限授予可以訪(fǎng)問(wèn)數(shù)據(jù)。B)相比于Database,Schema的隔離更加的徹底。C)Schema和用戶(hù)強(qiáng)相關(guān)的,通過(guò)權(quán)限控制語(yǔ)法可以實(shí)現(xiàn)不同用戶(hù)對(duì)各Schema的權(quán)限。D)二者都能實(shí)現(xiàn)資源隔離。答案:ACD解析:[多選題]187.為什么RNN網(wǎng)絡(luò)的激活函數(shù)要選用雙曲正切而不是sigmod呢?A)使用sigmod函數(shù)容易出現(xiàn)梯度消失B)sigmod的導(dǎo)數(shù)形式較為復(fù)雜C)雙曲正切更簡(jiǎn)單D)sigmoid函數(shù)實(shí)現(xiàn)較為復(fù)雜答案:AB解析:[多選題]188.下列說(shuō)法正確的是?A)MapReduce體系結(jié)構(gòu)主要由四個(gè)部分組成,分別是:Client、JobTracker、TaskTracker以及TaskB)Task分為MapTask和ReduceTask兩種,均由TaskTracker啟動(dòng)C)在MapReduce工作流程中,所有的數(shù)據(jù)交換都是通過(guò)MapReduce框架自身去實(shí)現(xiàn)的D)在MapReduce工作流程中,用戶(hù)不能顯式地從一臺(tái)機(jī)器向另一臺(tái)機(jī)器發(fā)送消息答案:ABCD解析:[多選題]189.相對(duì)于HadoopMapReduce,Spark的特點(diǎn)有()。A)通用性B)易用性C)速度快D)容錯(cuò)性答案:ABC解析:[多選題]190.數(shù)據(jù)科學(xué)的基本流程主要包括()A)數(shù)據(jù)化,即獲取零次數(shù)據(jù)B)數(shù)據(jù)加工,且將3C精神融入其中C)驗(yàn)證性分析,且事先提出假設(shè)D)數(shù)據(jù)產(chǎn)品的提供,且僅提供最終產(chǎn)品答案:AB解析:[多選題]191.遇到以下()情況,視圖數(shù)據(jù)操作可能會(huì)失敗。--A)視圖涉及多張數(shù)據(jù)表B)沒(méi)有滿(mǎn)足視圖的基本表對(duì)字段的約束條件C)創(chuàng)建視圖的SELECT字段含有MAX()函數(shù)D)定義視圖的SELECT語(yǔ)句中使用了GROUPBY答案:ABCD解析:[多選題]192.下面提到的編程框架,()是MaxCompute支持的。A)SQLB)MapReduceC)MPID)Graph答案:ABCD解析:[多選題]193.為落實(shí)數(shù)據(jù)安全全過(guò)程管控,在發(fā)布環(huán)節(jié),嚴(yán)格對(duì)外發(fā)和傳播數(shù)據(jù)安全審查,落實(shí)信息內(nèi)容合規(guī)性審核,發(fā)現(xiàn)違法違規(guī)信息應(yīng)()。A)立即停止傳輸和發(fā)布B)采取消除等處置措施,防止信息擴(kuò)散C)對(duì)信息進(jìn)行保密D)保存有關(guān)記錄答案:ABD解析:[多選題]194.(__)不屬于推斷統(tǒng)計(jì)的方法。A)區(qū)間估計(jì)B)參數(shù)估計(jì)C)假設(shè)檢驗(yàn)D)相關(guān)分析答案:AD解析:[多選題]195.圖像識(shí)別的一般步驟包括()。A)預(yù)處理B)特征提取C)超像素生成D)識(shí)別分類(lèi)答案:ABD解析:圖像識(shí)別中的一般步驟包括預(yù)處理、特征提取和識(shí)別分類(lèi)。超像素生成并非必要步驟。[多選題]196.在Hive的條件語(yǔ)句中,關(guān)于條件A>B理解正確的有()【選三項(xiàng)】A)A為null,則返回為trueB)B為null,則返回為nullC)如果A大于B則返回trueD)如果A小于B返回false答案:BCD解析:[多選題]197.一個(gè)完整的推薦系統(tǒng)通常包括哪3個(gè)組成模塊:()A)用戶(hù)建模模塊B)推薦對(duì)象建模模塊C)推薦算法模塊D)可視化模塊答案:ABC解析:[多選題]198.Hive特性包括哪些?A)支持MapReduce,Tez,Spsrk等多種計(jì)算引擎。B)靈活方便的ETL(extract/transform/load.C)易用易編程。D)可直接訪(fǎng)問(wèn)DFS文件以及HBase答案:ABCD解析:[多選題]199.有關(guān)實(shí)時(shí)檢索引擎中各組件的聯(lián)系與定位,以下描述中正確的有哪些項(xiàng)?A)HBaseoElasticSearch的組合滿(mǎn)足了大部分的用戶(hù)實(shí)時(shí)檢索訴求B)ElasticSearch存儲(chǔ)數(shù)據(jù)性?xún)r(jià)比低,但是其能夠滿(mǎn)足場(chǎng)景中多級(jí)索引的實(shí)時(shí)查詢(xún)需求,同時(shí)還能夠?qū)ξ臋n分詞建立索引C)與HBase相比,ElasticSearch在海量數(shù)據(jù)的情景下存儲(chǔ)性能不如HBase,故選擇HBase作為海量數(shù)據(jù)存儲(chǔ)的基石D)圖數(shù)據(jù)庫(kù)可以完美的解決復(fù)雜多級(jí)關(guān)系查詢(xún)分析,選用GES來(lái)解決圖數(shù)據(jù)的實(shí)時(shí)查詢(xún)需求答案:ABCD解析:[多選題]200.哪些方式能夠操作HBase的數(shù)據(jù)?A)客戶(hù)端命令B)PhoenixSQLC)JavaAPID)HivesQL答案:ABCD解析:[多選題]201.從Hadoop實(shí)現(xiàn)角度看,MapReduce1.0的計(jì)算框架主要由哪幾個(gè)部分?A)編程模型B)數(shù)據(jù)處理引擎C)運(yùn)行時(shí)環(huán)境D)資源管理答案:ABC解析:[多選題]202.下列哪些是常用分詞方法?A)基于Binarytree的分詞方法B)基于HMM的分詞方法C)基于CRF的分詞方法D)基于Kmeans的分詞方法答案:BC解析:[多選題]203.下面()接口或工具是MaxCompute用于導(dǎo)入導(dǎo)出數(shù)據(jù)的。A)TunnelB)DataxC)CDPD)Dship答案:ABCD解析:[多選題]204.以下哪些選項(xiàng)是Kafka的特點(diǎn)?A)支持消息隨機(jī)讀取B)高吞吐C)分布式D)消息持久化答案:BCD解析:[多選題]205.客戶(hù)端上傳文件的時(shí)候哪項(xiàng)是正確的?()()A)數(shù)據(jù)經(jīng)過(guò)NameNode傳遞給DataNodeB)客戶(hù)端端將文件切分為多個(gè)Block,依次上傳C)客戶(hù)端只上傳數(shù)據(jù)到一臺(tái)DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D)客戶(hù)端發(fā)起文件上傳請(qǐng)求,通過(guò)RPC與NameNode建立通訊。答案:BD解析:[多選題]206.假設(shè)一行數(shù)據(jù)內(nèi)容有三列數(shù)據(jù)分別為:ID:"1"NAME:"張三"AGE:"23歲"。請(qǐng)使用hive的函數(shù)生成一個(gè)新的字段:"1-張三-23歲"。A)concat(ID,'-',NAME,'-',AGE)B)concat_ws('-',ID,NAME,AGE)C)ID+'-'+NAME+'-'+AGED)ID||'-'||NAME||'-'||AGE答案:AB解析:第3部分:判斷題,共42題,請(qǐng)判斷題目是否正確。[判斷題]207.stack()的逆操作是unstack(),默認(rèn)為拆疊最后一層。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]208.在DWS服務(wù)中,通過(guò)GDS并行導(dǎo)入數(shù)據(jù)時(shí),需要明確DWS的集群IP地址。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]209.正則表達(dá)式'python|perl'或'p(ython|erl)'都可以匹配'python'或'perl'。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]210.Python只能使用內(nèi)置數(shù)據(jù)庫(kù)SQLite,無(wú)法訪(fǎng)問(wèn)MSSQLServer、ACCESS或Oracle、MySQL等數(shù)據(jù)庫(kù)A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]211.非結(jié)構(gòu)化數(shù)據(jù)是可以直接用傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)和管理的數(shù)據(jù)。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]212.在面向?qū)ο蟪绦蛟O(shè)計(jì)中,函數(shù)和方法是完全一樣的,都必須為所有參數(shù)進(jìn)行傳值。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]213.Zookeeper集群宕機(jī)數(shù)超過(guò)集群數(shù)一半,則Zookeeper服務(wù)失效。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]214.云計(jì)算就是軟件在云端無(wú)所不在、無(wú)限強(qiáng)大的計(jì)算。也叫網(wǎng)絡(luò)化計(jì)算或網(wǎng)格計(jì)算A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]215.數(shù)據(jù)科學(xué)是根據(jù)"數(shù)據(jù)世界"的分析結(jié)果,對(duì)"現(xiàn)實(shí)世界"進(jìn)行預(yù)測(cè)、洞見(jiàn)、解釋或決策的新興科學(xué)。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]216.MySQL默認(rèn)查詢(xún)會(huì)去除重復(fù)記錄,只保留一條。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]217.啤酒與尿布的經(jīng)典案例,充分體現(xiàn)了實(shí)驗(yàn)思維在大據(jù)分析理念中的重要性。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]218.屬性可以像數(shù)據(jù)成員一樣進(jìn)行訪(fǎng)問(wèn),但賦值時(shí)具有方法的優(yōu)點(diǎn),可以對(duì)新值進(jìn)行檢查A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]219.阿里云流計(jì)算目前可以支持SQL和MapReduce。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]220.大數(shù)據(jù)平臺(tái)采集系統(tǒng)的功能為:匯聚不同來(lái)源的數(shù)據(jù),接口數(shù)據(jù)清洗、稽核校驗(yàn)、模型規(guī)范后,將數(shù)據(jù)規(guī)整到相關(guān)域,統(tǒng)一存放在大數(shù)據(jù)平臺(tái)指定地方,形成接口層數(shù)據(jù)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]221.語(yǔ)句?SHOWTABLESLIKEnew%?可獲取以new開(kāi)頭的數(shù)據(jù)表。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]222.線(xiàn)性回歸不是用來(lái)預(yù)測(cè)數(shù)據(jù)的方法。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]223.Hive定義了一種類(lèi)似SQL的查詢(xún)語(yǔ)言(HQL),將HQL轉(zhuǎn)化為MapReduce任務(wù)在Hadoop上執(zhí)行,通常用于在線(xiàn)分析。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]224.數(shù)據(jù)類(lèi)型VARCHAR(255)存儲(chǔ)ab占用的字節(jié)數(shù)為2。--A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]225.只有Python擴(kuò)展庫(kù)才需要導(dǎo)入以后才能使用其中的對(duì)象,Python標(biāo)準(zhǔn)庫(kù)不需要導(dǎo)入即可使用其中的所有對(duì)象和方法。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]226.2016年9月,國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,10月,十八屆六中全會(huì)將大數(shù)據(jù)上升為國(guó)家戰(zhàn)略A)正確

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論