大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷7)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷7)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷7)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷7)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷7)_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷7)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共145題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.()屬于Spark框架中的可擴(kuò)展機(jī)器學(xué)習(xí)庫。A)MLibB)GraphXStreamingC)SparkSQL[單選題]2.在支持向量機(jī)中,?間隔?是指(__)。A)非支持向量到劃分超平面間的距離之和B)支持向量之間的距離C)支持向量和非支持向量之間的距離D)支持向量到超平面的距離之和[單選題]3.當(dāng)大數(shù)據(jù)業(yè)務(wù)人員希望通過1ike關(guān)鍵字來查詢Hive表中的某些數(shù)據(jù)時(shí),需要添加以下哪個(gè)關(guān)鍵字符用于匹配數(shù)據(jù)?A)%B)AC)$D)&[單選題]4.列表對象的sort()函數(shù)用來對列表元素進(jìn)行原地排序,該函數(shù)返回值為()。A)FalseB)NoneC)TrueD)報(bào)錯[單選題]5.數(shù)據(jù)被稱為信息時(shí)代的?石油?,正在成為企業(yè)的核心資產(chǎn)。下列說法不正確的是()。A)企業(yè)應(yīng)更加重視大數(shù)據(jù)技術(shù)應(yīng)用推廣B)企業(yè)需要培養(yǎng)和引進(jìn)數(shù)據(jù)應(yīng)用人才C)可以未經(jīng)許可任意使用其它企業(yè)的數(shù)據(jù)D)核心數(shù)據(jù)必須通過加密備份等嚴(yán)密保護(hù)[單選題]6.下列哪項(xiàng)方法不屬于圖像分割方法()。A)邊緣檢測法B)閾值分割法C)區(qū)域分割法D)特征提取法[單選題]7.輸人圖像已被轉(zhuǎn)換為大小為28x28的矩陣和大小為7x7的步幅為1的核心/濾波十器卷和提陣的大小是()A)22x22B)21x21C)28x28D)7x7[單選題]8.下列哪一項(xiàng)不是大數(shù)據(jù)架構(gòu)中需要考慮的要點(diǎn)?A)業(yè)務(wù)分解B)業(yè)務(wù)聯(lián)動C)持續(xù)發(fā)展D)獨(dú)立開發(fā)[單選題]9.根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)戰(zhàn)略安排,第二個(gè)階段是到()年,建成泛在電力物聯(lián)網(wǎng)。A)2020B)2021C)2024D)2025[單選題]10.下列對于錯誤率的公式,解釋正確的是(__)。A)統(tǒng)計(jì)分類器預(yù)測出來的結(jié)果與真實(shí)結(jié)果不相同的個(gè)數(shù),然后除以總的樣例集D的個(gè)數(shù)。B)先統(tǒng)計(jì)分類正確的樣本數(shù),然后除以總的樣例集D的個(gè)數(shù)。C)預(yù)測為正的樣例中有多少是真正的正樣例D)樣本中的正例有多少被預(yù)測正確[單選題]11.python屬于()語言A)低級B)高級C)中級D)底層[單選題]12.為了保障流應(yīng)用的快照存儲的可靠性,快照主要存儲在哪里?A)jobManager的內(nèi)存中B)可靠性高的單機(jī)數(shù)據(jù)庫中C)本地文件系統(tǒng)中D)hdfs中[單選題]13.假設(shè)precision='四'/(TP+FP),reca11=TP/(回'+FN),則在二分類問題中,當(dāng)測試集的正例和負(fù)例數(shù)量不均衡時(shí),以下評價(jià)方案中()是相對不合理的A)Accuracy:(TP+τN)/a11B)F-va1ue:2reca11precisionJ(r,∞劇增r∞ision)C)G-mean:sq此(precision*reca11)D)AUC:曲線下面積[單選題]14.假設(shè)屬性的取值范圍是-957~924,當(dāng)屬性的值為426時(shí),采用小數(shù)定標(biāo)規(guī)范化方法對應(yīng)的轉(zhuǎn)換結(jié)果是:()A)0.421B)0.433C)0.426D)0.489[單選題]15.在Hadoop框架中()為大數(shù)據(jù)提供了存儲。A)HDFSB)MapReduceC)YARND)Container[單選題]16.執(zhí)行以下代碼段i=0whilei<3:print(i,end='')i+=1else:print(0)時(shí),輸出為()。A)01230B)0120C)012D)Error[單選題]17.如果各因素之間數(shù)量級及單位不同,比如:溫度10~20℃,產(chǎn)生熱量300~400J。進(jìn)行計(jì)算之前應(yīng)進(jìn)行何種操作?A)參數(shù)歸一化B)參數(shù)平均值化C)參數(shù)二值化D)參數(shù)標(biāo)準(zhǔn)方差化[單選題]18.Jupyternotebook的記事本文件擴(kuò)展名為:A)mB)pyC)pycD)ipynb[單選題]19.Hadoop的兩大核心技術(shù)是()。A)MapReduce和HBaseB)HDFS和HBaseC)HDFS和MapReduceD)GFS和MapReduce[單選題]20.如果想按照空格分隔字符串則使用A)lenB)splitC)lowerD)upper[單選題]21.數(shù)據(jù)產(chǎn)品開發(fā)的關(guān)鍵環(huán)節(jié)是()A)數(shù)據(jù)收集B)數(shù)據(jù)預(yù)處理C)數(shù)據(jù)學(xué)習(xí)D)數(shù)據(jù)加工[單選題]22.長短時(shí)記憶網(wǎng)絡(luò)屬于一種()A)全連接神經(jīng)網(wǎng)絡(luò)B)門控RNNC)BP神經(jīng)網(wǎng)絡(luò)D)現(xiàn)向RNN[單選題]23.文本信息往往包含客觀事實(shí)和主觀情感,對于文本的情感分析主要是識別文章中的主觀類詞語,其中()不適用于情感分析。A)表達(dá)觀點(diǎn)的關(guān)鍵詞B)表達(dá)程度的關(guān)鍵詞C)表達(dá)情緒的關(guān)鍵詞D)表達(dá)客觀事實(shí)的關(guān)鍵詞[單選題]24.數(shù)據(jù)中臺定位于為各專業(yè)提供數(shù)據(jù)共享和分析應(yīng)用服務(wù),以()為基礎(chǔ),根據(jù)數(shù)據(jù)共享和分析應(yīng)用的需求,沉淀共性數(shù)據(jù)服務(wù)能力,通過數(shù)據(jù)服務(wù)滿足各類需求,支撐前端應(yīng)用和業(yè)務(wù)中臺服務(wù)構(gòu)建。A)業(yè)務(wù)中臺B)企業(yè)中臺C)全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心D)物聯(lián)管理平臺[單選題]25.在機(jī)器學(xué)習(xí)中,不屬于常用的沖突消解策略是()。A)投票法B)排序法C)元規(guī)則法D)加權(quán)法[單選題]26.()是一種建立在Hadoop之上的數(shù)據(jù)倉庫架構(gòu)。A)HDFSB)FlumeC)SqoopD)Hive[單選題]27.以下哪項(xiàng)屬于DDL操作()A)updateB)createC)insertD)delete[單選題]28.下列對大數(shù)據(jù)4V特征的說法中,錯誤的是A)數(shù)據(jù)規(guī)模大B)數(shù)據(jù)價(jià)值密度高C)數(shù)據(jù)類型多樣D)數(shù)據(jù)處理速度快[單選題]29.某電商使用ADS進(jìn)行數(shù)據(jù)分析,其中商品信息表記錄了商品的型號、價(jià)格、廠家等等信息,從數(shù)據(jù)分析角度來講,它是一張維表,該表包含了超過2000萬條的紀(jì)錄,大小在5G左右,在ADS中該()。A)建表時(shí)指定為ADS的維表,將分區(qū)數(shù)設(shè)置為1B)建表時(shí)指定為ADS的維表,即不進(jìn)行拆分,可以和任意表關(guān)聯(lián)C)必須建成ADS分區(qū)表,將會有一些限制,比如不能和不同普通表組上的表進(jìn)行關(guān)聯(lián)等D)可將該表直接打開到和該表關(guān)聯(lián)的事實(shí)表中,做成一張寬表,減少join,提升性能[單選題]30.以下說法中:①一個(gè)機(jī)器學(xué)習(xí)模型,如果有較高準(zhǔn)確率,總是說明這個(gè)分類器是好的;②如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低;③如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯誤率總是會降低,正確的是()。A)1B)2C)3D)1、3[單選題]31.下列選項(xiàng)中,屬于Python關(guān)鍵字的是()。A)nameB)isC)ifD)and[單選題]32.當(dāng)zookeeper集群的節(jié)點(diǎn)數(shù)為5節(jié)點(diǎn)時(shí),請問集群的容災(zāi)能力和多少節(jié)點(diǎn)是等價(jià)的?A)3B)4C)5D)以上全不正確[單選題]33.s=0n=int(input())foriinrange(1,n+1):a1=0forjinrange(1,i+1):a1+=ja=1.0/a1s+=aprint("s=%.1f"%s)當(dāng)輸入的n為4時(shí),輸出S=()。A)1.5B)1.4C)1.6D)1.7[單選題]34.下列關(guān)于漏斗圖的說法中,錯誤的是()A)漏斗圖往往適用于業(yè)務(wù)流程上的順序關(guān)系B)漏斗圖可以通過漏斗中梯形的大小,清晰地展示出不同數(shù)值的大小C)漏斗圖與餅圖同樣適用于表示占比的情況D)漏斗圖不適用于表示無邏輯順序的分類對比情況[單選題]35.Hive創(chuàng)建()時(shí),會將數(shù)據(jù)移動到數(shù)據(jù)倉庫指向的路徑;創(chuàng)建(),僅記錄數(shù)據(jù)所在的路徑,不對數(shù)據(jù)的位置做任何改變A)內(nèi)部表.外部表B)內(nèi)部表.元數(shù)據(jù)C)原元數(shù)據(jù).外部表D)外部表.托管表[單選題]36.向量空間模型的缺陷不包括()。A)維度災(zāi)難B)模型稀疏性C)語義信息缺失D)無法計(jì)算文本相似度[單選題]37.在Hadoop生態(tài)系統(tǒng)中,()可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射成一張數(shù)據(jù)庫表,并提供簡單的查詢語言。A)pigB)HBaseC)HiveD)MapReduce[單選題]38.()可以進(jìn)行排序,生成序列號等一般的聚合函數(shù)無法實(shí)現(xiàn)的高級操作。A)集合函數(shù)B)聚合函數(shù)C)窗口函數(shù)D)文本函數(shù)[單選題]39.數(shù)據(jù)可視化的方法論基礎(chǔ)是()。A)統(tǒng)計(jì)圖表B)視覺編碼C)圖論D)圖形符號學(xué)[單選題]40.()是一門以可視交互為基礎(chǔ),綜合運(yùn)用圖形學(xué)、數(shù)據(jù)挖掘和人機(jī)交互等技術(shù)等多個(gè)學(xué)科領(lǐng)域的知識,以實(shí)現(xiàn)人機(jī)協(xié)同完成可視化任務(wù)為主要目的分析推理性學(xué)科。A)科學(xué)可視化B)可視分析學(xué)C)數(shù)據(jù)可視化D)信息可視化[單選題]41.()數(shù)據(jù)中臺技術(shù)能力主要包括數(shù)據(jù)接入、存儲計(jì)算、數(shù)據(jù)分析、數(shù)據(jù)服務(wù)、數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)運(yùn)營管理六個(gè)方面,以下哪些不屬于結(jié)構(gòu)化數(shù)據(jù)存儲。A)分布式關(guān)系型數(shù)據(jù)庫B)分析型數(shù)據(jù)庫C)分布式文件系統(tǒng)D)分布式數(shù)據(jù)倉庫[單選題]42.以下關(guān)于云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)之間的關(guān)系,論述錯誤的是()。A)云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)三者緊密相關(guān),相輔相成B)云計(jì)算側(cè)重于數(shù)據(jù)分析C)物聯(lián)網(wǎng)可以借助于大數(shù)據(jù)實(shí)現(xiàn)海量數(shù)據(jù)的分析D)物聯(lián)網(wǎng)可以借助于云計(jì)算實(shí)現(xiàn)海量數(shù)據(jù)的存儲[單選題]43.圖像分割是(__)的過程。A)改變圖像大小B)將圖像分成多個(gè)小區(qū)域C)去除干擾信號D)使圖像變得更加豐富[單選題]44.當(dāng)數(shù)據(jù)出現(xiàn)較多缺失值時(shí),下面哪些處理方法不不夠合理?A)把NaN直接作為一個(gè)特征,把變量映射到高維空間B)用均值、中值、分位數(shù)、眾數(shù)、隨機(jī)值填充C)用插值法填充D)把具有缺失值的樣本刪除掉[單選題]45.下列哪個(gè)不屬于RDD中常用的TransformationA)map(func)B)reduce(func)C)groupByKey(numTasks)D)filter(func)[單選題]46.大數(shù)據(jù)的分布式計(jì)算使用下面哪項(xiàng)技術(shù)?()A)HDFSB)MapReduceC)NutchD)Hive[單選題]47.以下關(guān)于Zookeeper關(guān)鍵特性中的原子性說法正確的是:()。A)客戶端發(fā)送的更新會按照他們發(fā)送的順序進(jìn)行應(yīng)用B)鞥新只能全部完成或失敗,不會部分完成C)一條消息被一個(gè)server接受,將會被所有的server接受D)集群中無論那臺服務(wù)器,對外展示的均是統(tǒng)一視圖[單選題]48.在支持向量機(jī)中,()允許支持向量機(jī)在一些樣本上出錯。A)硬間隔B)軟間隔C)核函數(shù)D)拉格朗日乘子法[單選題]49.為了檢驗(yàn)連續(xù)變量x,y之間的線性關(guān)系,下列哪種圖最合適?A)條形圖B)散點(diǎn)圖C)直方圖D)都不對[單選題]50.Flume中的JDBCChanne1內(nèi)置數(shù)據(jù)庫是哪個(gè)?A)DerbyB)OracleC)sqlServerD)MySql[單選題]51.在MaxComputeSQL中,concat('a',null,'b')的執(zhí)行結(jié)果是:()。A)aB)anullbC)abD)null[單選題]52.對ElasticSearch描述正確的是?A)客戶端必須把索引請求發(fā)給EsMasterB)客戶端必須把索引請求發(fā)給shardC)客戶端必須把索引請求發(fā)給EsNodeD)客戶端必須把索引請求發(fā)給指定的EsNode[單選題]53.運(yùn)行下面程序,可以獲得兩個(gè)數(shù)組元素匹配的位置的操作是()。輸入:a=np.array([1,2,3,2,3,4,3,4,5,6])B=np.array([7,2,10,2,7,4,9,4,9,8])期望輸出:(array([1,3,5,7]),)A)np.where(a!=b)B)np.where(a==b)C)np.where(a=b)D)np.where(a>b)[單選題]54.在Zookeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResourceManager產(chǎn)生故障時(shí),StandbyResourceManager會從以下哪些目錄中獲取Application相關(guān)信息?A)metastoreB)StatestoreC)StoreageD)Warehouse[單選題]55.以下()是對DMM(數(shù)據(jù)管理成熟度模型)中"已管理級"基本特點(diǎn)的正確表述。A)組織機(jī)構(gòu)的數(shù)據(jù)管理關(guān)鍵活動能夠根據(jù)結(jié)構(gòu)自身的反饋以及外部環(huán)境的變革進(jìn)行不斷優(yōu)化B)組織機(jī)構(gòu)已用定量化的方式管理其關(guān)鍵過程的執(zhí)行過程C)組織機(jī)構(gòu)只有在項(xiàng)目管理過程中執(zhí)行了D.M給出的關(guān)鍵過程,而缺乏機(jī)構(gòu)層次的統(tǒng)籌與管理D)組織機(jī)構(gòu)的數(shù)據(jù)管理工作超出了項(xiàng)目管理的范疇,由組織機(jī)構(gòu)統(tǒng)一管理其數(shù)據(jù)管理關(guān)鍵過程[單選題]56.以下關(guān)于文件的描述,錯誤的是:A)二進(jìn)制文件和文本文件的操作步驟都是?打開-操作-關(guān)閉?B)open()打開文件之后,文件的內(nèi)容并沒有在內(nèi)存中C)open()只能打開一個(gè)已經(jīng)存在的文件D)文件讀寫之后,要調(diào)用close()才能確保文件被保存在磁盤中了[單選題]57.Matplotlib中的legend()函數(shù)的作用是()。A)設(shè)置標(biāo)簽文本B)繪制網(wǎng)格線C)標(biāo)示不同圖形的文本標(biāo)簽圖例D)設(shè)置x軸的數(shù)值顯示范圍[單選題]58.以下程序輸出的結(jié)果是()。(提示:ord(:?a?)==97)list_demo=[1,2,3,4,5,'a','b']print(list_demo[1],list_demo[5])A)1,5B)2,aC)1,97D)2,97[單選題]59.在存儲過程中有如下代碼:DECLAREiD、INTDEFAULT0;REPEATSETid=id+1;UNTILid>=10;END、REPEAT;下面選項(xiàng)中,對于代碼的功能描述正確的是()。--A)實(shí)現(xiàn)1~10之間的數(shù)字累加B)實(shí)現(xiàn)1~10之間的數(shù)字遍歷C)當(dāng)id=10時(shí)循環(huán)就會退出執(zhí)行D)以上代碼會出現(xiàn)語法錯誤[單選題]60.每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場景,以下()是用于批處理的。A)MapReduceB)DremelC)StormD)Pregel[單選題]61.tf.nn.rnn_cell.BasicLSTMCell(n_hidden,forget_bias=1.0,state_is_tuple=True)函數(shù)中的參數(shù)forget_bias的含義是()。A)神經(jīng)元個(gè)數(shù)B)遺忘系數(shù)C)返回狀態(tài)D)神經(jīng)元類型[單選題]62.下列關(guān)于HBase的BloomFilter特性理解正確的是:()。A)用來過濾數(shù)據(jù)B)用來優(yōu)化隨機(jī)讀取的性能C)會增加存儲的消耗D)可以準(zhǔn)確判斷某條數(shù)據(jù)不存在[單選題]63.關(guān)于?與/或?圖表示法的敘述中,正確的是:()。A)?與/或?圖就是用?AND?與?OR?連續(xù)各個(gè)部分的圖形,用來描述各部分的因果關(guān)系。B)?與/或?圖就是用?AND?與?OR?連續(xù)各個(gè)部分的圖形,用來描述各部分之間的不確定關(guān)系。C)?與/或?圖就是用?與?節(jié)點(diǎn)與?或?節(jié)點(diǎn)組合起來的樹形圖,用來描述某類問題的層次關(guān)系。D)?與/或?圖就是用?與?節(jié)點(diǎn)與?或?節(jié)點(diǎn)組合起來的樹形圖,用來描述某類問題的求解過程。[單選題]64.在Hadoop配置文件中,以下屬于core-site.xml文件主要內(nèi)容的是()A)用于定義系統(tǒng)級別的參數(shù),如HDFSURL、Hadoop的臨時(shí)目錄等。B)名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置、文件副本的個(gè)數(shù)文件讀取權(quán)限等。C)配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。D)包括JobHistoryServer和應(yīng)用程序參數(shù)兩部分,如reduce任務(wù)的默認(rèn)個(gè)數(shù)、任務(wù)所能夠使用內(nèi)存的默認(rèn)上下限等。[單選題]65.Relief的擴(kuò)展變體Relief-F能夠處理(__)問題。A)二分類B)多分類C)回歸D)降維[單選題]66.np.floor()函數(shù)的作用是(__)。A)計(jì)算每個(gè)元素的模B)計(jì)算每個(gè)元素的符號C)計(jì)算每個(gè)元素的最小整數(shù)值D)計(jì)算每個(gè)元素的小數(shù)部分[單選題]67.下列論據(jù)中,能夠支撐?大數(shù)據(jù)無所不能?的觀點(diǎn)的是()。A)互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B)大數(shù)據(jù)存在泡沫C)大數(shù)據(jù)具有非常高的成本D)個(gè)人隱私泄露與信息安全擔(dān)憂[單選題]68.下述說法錯誤的是()A)、關(guān)聯(lián)規(guī)則屬于半監(jiān)督學(xué)習(xí)B)、有監(jiān)督學(xué)習(xí)使用已知模式預(yù)測數(shù)據(jù),其使用前提是訓(xùn)練集為帶標(biāo)簽數(shù)據(jù)C)、當(dāng)訓(xùn)練集中是不帶標(biāo)簽的信息時(shí),通常采用無監(jiān)督學(xué)習(xí)算法D)、半監(jiān)督學(xué)習(xí)算法有半監(jiān)督分類方法(如生成式方法、判別式方法等)[單選題]69.數(shù)據(jù)管理成熟度模型中成熟度等級最高是哪一級()。A)已優(yōu)化級B)已測量級C)已定義級D)已管理級[單選題]70.以下說法正確的是:A)一個(gè)機(jī)器學(xué)習(xí)模型,如果有較高準(zhǔn)確率,總是說明這個(gè)分類器是好的B)如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低C)不可以使用聚類?類別id?作為一個(gè)新的特征項(xiàng),用監(jiān)督學(xué)習(xí)進(jìn)行學(xué)習(xí)D)ABC全錯[單選題]71.根據(jù)《大數(shù)據(jù)風(fēng)控平臺項(xiàng)目操作手冊》,公司客戶管理菜單下,新增()按鈕。A)數(shù)據(jù)補(bǔ)錄、準(zhǔn)入風(fēng)險(xiǎn)探測、最終受益人B)客戶信息預(yù)警、準(zhǔn)入風(fēng)險(xiǎn)探測、最終受益人C)影像操作、準(zhǔn)入風(fēng)險(xiǎn)探測、最終受益人D)擔(dān)保圈鏈、關(guān)聯(lián)關(guān)系圖譜、全景風(fēng)險(xiǎn)視圖、企業(yè)信用智能分析報(bào)告、準(zhǔn)入風(fēng)險(xiǎn)探測、最終受益人[單選題]72.現(xiàn)有如下代碼:sum=0foriinrange(100):if(i%10):continuesum=sum+iprint(sum)若運(yùn)行代碼,輸出的結(jié)果為()A)5050B)4950C)450D)45[單選題]73.DELETE和TRUNCATE刪除自動增長字段從1~4的所有值后,再次插入數(shù)據(jù)此字段的值分別為()。--A)1和1B)5和5C)1和5D)5和1[單選題]74.大數(shù)據(jù)時(shí)代的一大特征是萬物互聯(lián)與融合,下列說法錯誤的是()。A)人均入網(wǎng)設(shè)備增加B)融入各個(gè)領(lǐng)域行業(yè)C)個(gè)人信息安全問題凸顯D)信息安全領(lǐng)域影響不大[單選題]75.下面關(guān)于政府信息公開與政府?dāng)?shù)據(jù)開放的描述,錯誤的是:()A)政府信息公開與政府?dāng)?shù)據(jù)開放是一對既相互區(qū)別又相互聯(lián)系的概念B)信息是沒有經(jīng)過任何加工與解讀的原始記錄,沒有明確的含義,而數(shù)據(jù)則是經(jīng)過加工處理并被賦予一定含義的C)政府信息公開主要是為了對公眾知情權(quán)的滿足而出現(xiàn)的D)政府?dāng)?shù)據(jù)開放強(qiáng)調(diào)的是數(shù)據(jù)的再利用,公眾可享數(shù)據(jù)利用創(chuàng)造的經(jīng)濟(jì)和社會價(jià)值[單選題]76.用機(jī)器代碼表示的數(shù)據(jù)庫模式稱為()A)物理模式B)邏輯模式C)源模式D)目標(biāo)模式[單選題]77.萬維網(wǎng)的實(shí)施國家是()A)英國B)美國C)德國D)印度[單選題]78.某大數(shù)據(jù)業(yè)務(wù)人員在查詢某張表的業(yè)務(wù)數(shù)據(jù)時(shí),希望查詢出來的數(shù)值結(jié)果保留兩位小數(shù),他應(yīng)該使用哪個(gè)函數(shù)來實(shí)現(xiàn)?A)TrimB)roundC)absD)rand[單選題]79.卷積神經(jīng)網(wǎng)絡(luò)中池化層的作用是()。A)尋找圖像中的細(xì)節(jié)特征B)輸入圖片C)減少下一層的計(jì)算,防止過擬合D)輸出圖片[單選題]80.Kafka中數(shù)據(jù)從Producer到Broker和Broker到Consumer分別是那種傳遞方式A)pullpushB)pullpullC)pushpushD)pushpull[單選題]81.哪個(gè)模塊是負(fù)責(zé)FusionInsightManbager用戶數(shù)據(jù)存儲的?A)CASB)AOSC)KerberosD)LDAP[單選題]82.國家電網(wǎng)有限公司數(shù)據(jù)管理辦法規(guī)定,公司()是數(shù)據(jù)管理工作的領(lǐng)導(dǎo)決策機(jī)構(gòu),A)規(guī)章制度管理委員會B)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組C)互聯(lián)網(wǎng)部D)大數(shù)據(jù)中心[單選題]83.下列組件中MapReduce編程模型中最后執(zhí)行的是()。A)MapperB)PartitionerC)ReducerD)RecordReader[單選題]84.關(guān)于多層前饋神經(jīng)網(wǎng)絡(luò)的描述,錯誤的是()A)輸出層與輸入層之間包含隱含層,且隱含層和輸出層都擁有激活函數(shù)的神經(jīng)元B)神經(jīng)元之間存在同層連接以及跨層連接C)輸入層僅僅是接收輸入,不進(jìn)行函數(shù)處理十D)每層神經(jīng)元上一層與下一層全互連[單選題]85.大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用不包括以下哪項(xiàng)?()A)股票交易B)市場情緒分析C)信貸風(fēng)險(xiǎn)分析D)大數(shù)據(jù)征信[單選題]86.np.dot([[1,2,3],[1,2,3],[1,2,3]],[[2,1,1],[2,1,1],[2,1,1]])的輸出結(jié)果是()。A)[[1,2,6,6],[12,6,6],[12,6,6]]B)[[2,2,3],[2,2,3],[2,2,3]]C)[[1,2,3],[1,2,3],[1,2,3]]D)[[2,1,1,],[2,1,1],[2,1,1]][單選題]87.某籃運(yùn)動員在三分線投球的命中率是2(1),他投球10次,恰好投進(jìn)3個(gè)球的概率為()。A)128(15)B)16(3)C)8(5)D)16(7)[單選題]88.數(shù)據(jù)產(chǎn)品開發(fā)工作之中需要特別注意的基本活動不包括()。A)創(chuàng)造性設(shè)計(jì)B)數(shù)據(jù)洞見C)虛擬化D)個(gè)性化描述[單選題]89.?啤酒與尿布?的故事,體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A)我為人人,人人為我B)全樣而非抽樣C)效率而非精確D)相關(guān)而非因果[單選題]90.字符串中,成員資格判斷使用的關(guān)鍵字是()A)limitB)toC)inD)len[單選題]91.以下選項(xiàng)中,不屬于大數(shù)據(jù)對人才能力的要求是()A)業(yè)務(wù)能力B)數(shù)學(xué)統(tǒng)計(jì)能力C)IT技術(shù)能力D)邏輯思維能力[單選題]92.下列SQL語句中,修改表結(jié)構(gòu)的是A)ALTERB)CREATEC)UPDATED)INSERT[單選題]93.下列關(guān)于文本圖的說法中,錯誤的是()A)文本圖不適合展示數(shù)據(jù)太少的數(shù)據(jù)集B)文本圖不適用于展示無明顯差異的數(shù)據(jù)集,因?yàn)闊o明顯差異的數(shù)據(jù)集會使得出的文本圖缺少關(guān)鍵詞,無法帶來突出感C)可以在文本圖中添加標(biāo)簽以使可視化結(jié)果更為直觀D)文本圖又可稱為詞云圖[單選題]94.(__)是常用的估計(jì)參數(shù)隱變量的利器,它是一種迭代的方法。A)邊際似然B)EM算法C)貝葉斯決策D)貝葉斯分類器[單選題]95.MapReduce中哪一種文件輸入格式可以自動切割并合并小文件?()A)NLinelmputFormatB)TextInputFormatC)CombineFileInputFormatD)KeyValueTextInputFormat[單選題]96.下列關(guān)于GaussDB200的局部聚簇技術(shù)說法正確的是(?A)局部聚簇技術(shù)可以應(yīng)用在GaUssDB200的所有表中,B)局部聚簇在某些場景下可以提交檢素效壑,所以在創(chuàng)建表時(shí)根據(jù)業(yè)務(wù)場旻應(yīng)創(chuàng)建寥個(gè)PCKC)PCK通過min/max稀疏素引實(shí)現(xiàn)事實(shí)表快速過掃描D)PCK對應(yīng)的列盡量不要為空值。[單選題]97.具體由創(chuàng)建世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室統(tǒng)籌組織,下設(shè)()個(gè)常設(shè)小組A)3B)4C)2D)5[單選題]98.教育大數(shù)據(jù)面臨的安全風(fēng)險(xiǎn)中,影響范圍最大的是()。A)學(xué)生隱私保護(hù)B)學(xué)校OA數(shù)據(jù)C)云計(jì)算安全風(fēng)險(xiǎn)D)缺乏行業(yè)安全標(biāo)準(zhǔn)[單選題]99.()和假設(shè)檢驗(yàn)又可歸結(jié)為統(tǒng)計(jì)推斷的范疇即對總體的數(shù)量特征做出具有一定可靠程度的估計(jì)和判斷A)參數(shù)估計(jì)B)邏輯分析C)方差分析D)回歸分析[單選題]100.下列語句執(zhí)行的結(jié)果是()>>>a=1>>>b=2*a/4>>>a="one">>>print(a,b)A)one0B)10C)one0.5D)one,0.5[單選題]101.下列不屬于RDBMS常用的數(shù)據(jù)庫軟件有()A)OracleB)SQLServerC)MySQLD)redis[單選題]102.我國在大數(shù)據(jù)時(shí)代的國家信息安全需要用總體安全觀進(jìn)行認(rèn)知,下列說法正確的是()。A)以人民安全為宗旨B)以政治安全為根本C)以經(jīng)濟(jì)安全為基礎(chǔ)D)以發(fā)達(dá)國家為榜樣[單選題]103.一般將原始業(yè)務(wù)數(shù)據(jù)分為多個(gè)部分,()用于模型的構(gòu)建。A)訓(xùn)練集B)測試集C)驗(yàn)證集D)全部數(shù)據(jù)[單選題]104.(__)是指對已有數(shù)據(jù)在盡量少的先驗(yàn)假設(shè)條件下進(jìn)行探索,并通過作圖,制表等手段探索數(shù)據(jù)結(jié)構(gòu)和規(guī)律的一種方法。A)統(tǒng)計(jì)分析B)驗(yàn)證性分析C)數(shù)據(jù)洞見D)探索性數(shù)據(jù)分析[單選題]105.下列算法中:①KNN;②線性回歸;③對數(shù)幾率回歸,可以用神經(jīng)網(wǎng)絡(luò)去構(gòu)造的()A)①②B)②③C)①②③D)以上答案都不正確[單選題]106.大數(shù)據(jù)是指不用隨機(jī)分析法這樣的捷徑,而采用()的方法。A)所有數(shù)據(jù)B)部分?jǐn)?shù)據(jù)C)少量數(shù)據(jù)D)抽樣數(shù)據(jù)[單選題]107.多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()A)一對一B)一對其余C)一對多D)多對多[單選題]108.下列關(guān)于儀表盤圖的說法中,錯誤的是()A)儀表盤圖可以直觀地表現(xiàn)出某個(gè)指標(biāo)的進(jìn)度或?qū)嶋H情況B)一個(gè)可視化組建中只能創(chuàng)建多個(gè)儀表盤C)儀表盤中的儀表板最小值為目標(biāo)值D)儀表盤中指針指向的位置為指針值,即當(dāng)前值[單選題]109.使用CREATETABLE語句的()子句,在創(chuàng)建基本表時(shí)可以啟用全文本搜索A)FULLTEXTB)ENGINEC)FROMD)WHRER[單選題]110.基于Bagging的集成學(xué)習(xí)代表算法有()。A)AdaboostB)GBDTC)XGBOOSTD)隨機(jī)森林[單選題]111.執(zhí)行以下代碼段pets=['dog','cat','dog','goldfish','cat','rabbit','cat']while'cat'inpets:pets.remove('cat')print(pets)時(shí),輸出為()。A)['dog','cat','dog','goldfish','cat','rabbit','cat']B)['dog','dog','goldfish','rabbit']C)['dog','dog','goldfish','cat','rabbit','cat']D)['dog','dog','goldfish','rabbit','cat'][單選題]112.下列關(guān)于DataFrame說法正確的是()A)DataFrame結(jié)構(gòu)是由索引和數(shù)據(jù)組成B)DataFrame的行索引位于最右側(cè)C)創(chuàng)建一個(gè)DataFrame對象時(shí)需要指定索引D)DataFrame每列的數(shù)據(jù)類型必須是相同的[單選題]113.下面哪個(gè)RDD操作是窄依賴()A)joinB)filterC)groupByKeyD)sort[單選題]114.TF-IDF與該詞在整個(gè)語言中的出現(xiàn)次數(shù)成(__)。A)正比B)反比C)無關(guān)D)冪次[單選題]115.Spark集群搭建中,配置集群免密登錄時(shí),需要用到的命令是(__)。A)ssh-key-trsaB)ssh-gen-trsaC)ssh-kygen-trsaD)ssh-keygen-trsa[單選題]116.tensorflow中的tf.nn.max_pool()函數(shù)中的padding參數(shù),作用是()。A)池化方法B)是否要在邊緣補(bǔ)零C)是否要排序D)該層的名稱[單選題]117.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()。A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B)在分析方法上更注重相關(guān)分析而不是因果分析C)在分析效果上更追究效率而不是絕對精確D)在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)[單選題]118.在Hive的配置文件中()表示Hive的DDL語句的輸出格式。A)hive.ddl.output.formatB)hive.exec.planC)press.outputD)hive.map.aggr[單選題]119.以下python代碼運(yùn)行結(jié)果為()。$;$defSum(a,b=3,c=5):$;$returnsum([a,b,c])$;$print(Sum(a=8,c=2))$;$print(Sum(8))$;$print(Sum(8,2))A)13,16,15B)10,8,10C)13,8,10D)10,16,10[單選題]120.Scipy中,線性模塊是()模塊。A)fftpackB)signalC)linalgD)ndimage[單選題]121.關(guān)于ADS的權(quán)限模型,下列()描述是正確的。A)每個(gè)權(quán)限級別能聚合其下面級別的所有權(quán)限B)導(dǎo)出數(shù)據(jù)時(shí)需要DUMPDATA、DESCRIBE和SELECT權(quán)限,同時(shí)需要數(shù)據(jù)導(dǎo)出目的地的數(shù)據(jù)寫入相關(guān)權(quán)限C)查詢表數(shù)據(jù)需要SELECT權(quán)限,最小級別是表D)ADS的授權(quán)模型和MySQL非常相似,比如ADS支持針對用戶在host上授權(quán)[單選題]122.更新列表時(shí)可以使用以下哪幾種方法來添加列表項(xiàng)()。A)append(),next(),pop()B)index(),clear(),extend()C)append(),extend(),insert()D)remove(),super(),pop()[單選題]123.任何一個(gè)核函數(shù)都隱式地定義了一個(gè)()空間。A)希爾伯特空間B)再生希爾伯特空間C)再生核希爾伯特空間D)歐式空間[單選題]124.下列語句打開文件的位置應(yīng)該在()f=open('itheima.txt','w')A)C盤根目錄下B)D盤根目錄下C)Python安裝目錄下D)與源文件在相同的目錄下[單選題]125.關(guān)于云主機(jī)登錄方式描述對的是()A)Windows通過遠(yuǎn)程桌面(MSTSC)方式登錄B)Linux通過SSH方式登錄C)通過控制臺方式(VNC)登錄D)以上描述均對[單選題]126.在很長一段時(shí)間內(nèi),下列關(guān)于人工智能研究領(lǐng)域的說法中錯誤的是()A)一部分研究人員堅(jiān)持采用傳統(tǒng)的人工智能方法解決問題,簡單來說就是模仿人。B)一部分研究人員倡導(dǎo)數(shù)據(jù)驅(qū)動。C)?模仿人?的原因之一是可獲取的數(shù)據(jù)太多,無法處理D)大數(shù)據(jù)時(shí)代,強(qiáng)調(diào)以數(shù)據(jù)為中心[單選題]127.某公司計(jì)劃上線新系統(tǒng),數(shù)據(jù)庫工程師使用Hive數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)分析,現(xiàn)在界面提示:"o:jdbc:hive2://86:2181/>"信息,現(xiàn)已完成數(shù)據(jù)庫的創(chuàng)建工作,那么他將如何繼續(xù)開始數(shù)據(jù)庫的使用?A)usedatabaseB)startdatabaseC)restartdatabaseD)continuedatabase[單選題]128.matplotlib中的axvspan函數(shù)作用是什么()A)在x軸標(biāo)示不同圖形的文本標(biāo)簽圖例B)繪制垂直于x的參考區(qū)域C)添加x軸內(nèi)容細(xì)節(jié)的指向性注釋文本D)添加x軸標(biāo)題[單選題]129.NumericToString是文本函數(shù)的一種,它的功能是()。A)把一個(gè)字符串轉(zhuǎn)換為數(shù)值B)把二進(jìn)制轉(zhuǎn)換為字符串C)把一個(gè)CSN序列轉(zhuǎn)換成字符串D)把一個(gè)數(shù)值數(shù)據(jù)轉(zhuǎn)換為字符串[單選題]130.信息增益(),意味著使用屬性進(jìn)行劃分所獲得的純度提升。A)越大B)越小C)不變D)無法確定[單選題]131.創(chuàng)建存儲過程,CREATEORREPLACEPROCEDUREproc_whi1e_1oop(maxvalininteger)ASDECLARElint:=maxval/2;BEGINWHILEi<maxvalLOOPraiseinfo'%',i;i:=i+1;ENDLOOP:END:下面循環(huán)語句在Messages內(nèi)的輸出是()CALLproc_while_loop(9);A)5678B)456789C)56789D)45678[單選題]132.在【連接】面板,join條件中輸入正確的一項(xiàng)是()A)`差旅費(fèi)超額百分比`.userid=`用戶`.idB)?差旅費(fèi)超額百分比.userid=用戶.id?C)?差旅費(fèi)超額百分比.userid==用戶.id?D)``差旅費(fèi)超額百分比``.userid=``用戶``.id[單選題]133.以下哪個(gè)不是大數(shù)據(jù)的數(shù)據(jù)計(jì)算引擎?A)SparkB)MapReduceC)FlumeD)Flink[單選題]134.Spark比MapReduce快的原因不包括()。A)Spark基于內(nèi)存迭代,而MapReduce基于磁盤迭代B)DAG計(jì)算模型相比MapReduce更有效率C)Spark是粗粒度的資源調(diào)度,而MapReduce是細(xì)粒度的資源調(diào)度D)Spark支持交互式處理,MapReduce善于處理流計(jì)算[單選題]135.支持子程序調(diào)用的數(shù)據(jù)結(jié)構(gòu)是A)隊(duì)列B)二叉樹C)樹D)棧[單選題]136.假定訓(xùn)練了一個(gè)線性SVM并推斷出這個(gè)模型出現(xiàn)了欠擬合現(xiàn)象,在下一次訓(xùn)練時(shí),應(yīng)該采取的措施是()。A)增加數(shù)據(jù)點(diǎn)B)減少數(shù)據(jù)點(diǎn)C)增加特征D)減少特征[單選題]137.以下關(guān)于繪圖標(biāo)準(zhǔn)流程說法錯誤的是()。A)繪制最簡單的圖形可以不用創(chuàng)建畫布B)添加圖例可以在繪制圖形之前C)添加x軸、y軸的標(biāo)簽可以在繪制圖形之前D)修改x軸標(biāo)簽、y軸標(biāo)簽和繪制圖形沒有先后[單選題]138.以下關(guān)于人機(jī)交互,描述錯誤的是:()A)人機(jī)交互是一門研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)科B)人機(jī)交互界面通常是指用戶不可見的C)系統(tǒng)可以是各種各樣的機(jī)器.也可以是計(jì)算機(jī)化的系統(tǒng)和軟件D)用戶通過人機(jī)交互界面與系統(tǒng)交流.并進(jìn)行操作[單選題]139.線性模型中的權(quán)重w值可以看做各個(gè)屬性x的()。A)正則化系數(shù)B)對最終決策結(jié)果的貢獻(xiàn)度C)高維映射D)取值[單選題]140.大數(shù)據(jù)的4V特性不包括()。A)Volume(大量)B)Velocity(高速)C)Visua1(可視.)D)Vi缸iety(多樣)[單選題]141.語義網(wǎng)絡(luò)的組成部分為:()A)框架和弧線B)狀態(tài)和算符C)節(jié)點(diǎn)和鏈D)槽和值[單選題]142.下列關(guān)于HBase的集群結(jié)構(gòu)描述有誤的是()A)HBase的服務(wù)器體系結(jié)構(gòu)遵從簡單的主/從服務(wù)器架構(gòu),它由HRegionServer群和HBaseMasterServer構(gòu)成。B)當(dāng)表的大小超過設(shè)置的值時(shí),HBase會自動地將表劃分為不同的區(qū)域,每個(gè)區(qū)域包含所有行的子集。C)HBase邏輯上的表可能會被劃分成多個(gè)HRegion,然后存儲到HRegionServer群中。D)ZooKeeper本身并不存儲HBase中的任何數(shù)據(jù),它存儲的是從數(shù)據(jù)到HRegionServer的映射,告訴每臺HRegionServer它要維護(hù)哪些HRegion。[單選題]143.大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的tunnel命令行工具對上傳的數(shù)據(jù)有格式上的要求,它支持()格式的數(shù)據(jù)。A)JSON文件B)xml文件C)xls文件D)csv文件[單選題]144.決策樹中,同一路徑上的所有屬性之間是()關(guān)系A(chǔ))因果B)相關(guān)C)邏輯或D)邏輯與第2部分:多項(xiàng)選擇題,共62題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.以下哪些選項(xiàng)關(guān)于決策樹的說法是正確的()A)冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響B(tài))子樹可能在決策樹中重復(fù)多次C)決策樹算法對于噪聲的干擾非常敏感D)尋找最佳決策樹是NP完全問題[多選題]146.下列有關(guān)RDBMS的描述正確的是()。A)數(shù)據(jù)以表的形式出現(xiàn)B)每行為各種記錄名稱C)每列為記錄名稱所對應(yīng)的的數(shù)據(jù)域D)許多的行和列組成一張表單[多選題]147.下列有關(guān)類的說法正確的是(___)。A)當(dāng)類被實(shí)例化時(shí)自動執(zhí)行的函數(shù)__init__(),如果沒有寫自定義的構(gòu)造函數(shù),則會執(zhí)行默認(rèn)構(gòu)造函數(shù)B)析構(gòu)函數(shù)_del__()也是可選的,如果不提供,則Python會在后臺提供默認(rèn)析構(gòu)函數(shù)C)當(dāng)使用del刪除對象時(shí),會調(diào)用他本身的析構(gòu)函數(shù)D)當(dāng)對象在某個(gè)作用域中調(diào)用完畢,在跳出其作用域的同時(shí)析構(gòu)函數(shù)也會被調(diào)用一次,這樣可以用來釋放內(nèi)存空間[多選題]148.在評價(jià)不平衡類問題分類的度量方法有如下幾種:()A)F1度量B)召回率(recall)C)精度(precision)D)真正率(turepositiverate,TPR)[多選題]149.簇有效性的面向相似性的度量包括()A)精度B)Rand統(tǒng)計(jì)量C)Jaccard系數(shù)D)召回率[多選題]150.Flink窗口按分割標(biāo)準(zhǔn)劃分為以下哪幾種?A)容量窗口B)時(shí)間窗口C)事件窗口D)滾動窗口[多選題]151.精準(zhǔn)營銷三要素是:A)人B)位置C)物D)性別[多選題]152.fusininsightHD平臺中,那些組件支持對列表加密?A)HDFSB)FlinkC)hbaseD)hive[多選題]153.Flink窗口按分割標(biāo)準(zhǔn)劃分為以下幾種?A)容量窗口B)滾動窗口C)時(shí)間窗口D)事件窗口[多選題]154.Flume適用于以下哪些場景的數(shù)據(jù)收集?A)Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B)本地文件數(shù)據(jù)采集C)應(yīng)用系統(tǒng)產(chǎn)生的日志采集D)大量數(shù)據(jù)的實(shí)時(shí)數(shù)據(jù)采集[多選題]155.HDFS不適用于以下哪些場景?A)流式數(shù)據(jù)訪問B)大量小文件存儲C)大文件存儲與訪問D)隨機(jī)寫入[多選題]156.下列對ApplicationMaster的功能描述正確的是()。A)當(dāng)用戶作業(yè)提交時(shí),ApplicationMaster與ResourceManger獲取資源,ResourceManger會以容器的形式為ApplicationMaster分配資源B)把獲取的資源進(jìn)一步分配給各個(gè)任務(wù)C)定時(shí)向ResourceManger發(fā)送?心跳?消息,報(bào)告資源的使用情況和應(yīng)用的進(jìn)度消息D)當(dāng)作業(yè)完成時(shí),ApplicationMaster向ResourceManger注銷容器,執(zhí)行周期完成[多選題]157.在算術(shù)運(yùn)算符、比較運(yùn)算符、邏輯運(yùn)算符,這三種符號中,它們的優(yōu)先級排列不正確的是()A)算術(shù)/邏輯/比較B)比較/邏輯/算術(shù)C)比較/算術(shù)/邏輯D)算術(shù)/比較/邏輯[多選題]158.Flink能夠通過哪幾種方式提供容錯機(jī)制A)窗B)事件時(shí)間C)流重放D)狀態(tài)快照[多選題]159.SQL中SELECT語句的完整語法較復(fù)雜,但至少包含的有()A)SELECTB)FROMC)GROUPD)INTO[多選題]160.下列有關(guān)Flume的描述正確的是()。A)Flume具有一定的容錯性B)Flume使用Java編寫C)Flume不支持failoverD)Flume是一個(gè)分布式的輕量級工具,適應(yīng)各種方式的數(shù)據(jù)收集[多選題]161.以下屬于決策樹算法是:()A)CLSB)ID3C)C4.5D)CART[多選題]162.以下關(guān)于模塊的描述正確的是()。A)在?from-import?中,以兩個(gè)下劃線開頭的標(biāo)識符是私有的,不會導(dǎo)入B)dir()內(nèi)置函數(shù)監(jiān)視主模塊命名空間中的項(xiàng)目C)以?from-import?導(dǎo)入的形式,所有標(biāo)識符(無論它們是私有的還是公共的)均被導(dǎo)入D)加載模塊后,將自動生成擴(kuò)展名為.pyc的模塊的編譯版本[多選題]163.下列關(guān)于偏差、方差、均方差、泛化誤差的作用表述正確的是(__)。A)偏差刻畫了模型本身的擬合能力B)方差刻畫了數(shù)據(jù)擾動所造成的影響C)噪聲刻畫了學(xué)習(xí)問題本身的難度D)泛化誤差可分解為方差與噪音之和。[多選題]164.下面不屬于數(shù)據(jù)分析平臺的有(__)。A)uberB)datameerC)ArimoD)Farmers[多選題]165.下列對HDFS的特點(diǎn)描述正確的是()。A)HDFS可以存儲超大文件B)HDFS采用流式數(shù)據(jù)訪問模式存儲數(shù)據(jù)C)HDFS具有低時(shí)間延遲的數(shù)據(jù)訪問特點(diǎn)D)HDFS允許在文件尾部添加新的數(shù)據(jù)(追加)[多選題]166.完整性約束通常包括()A)實(shí)體完整性B)域完整性C)參照完整性D)用戶定義完整性[多選題]167.下面哪幾項(xiàng)屬于ElasticSearch的擴(kuò)展插件?A)bigdeskB)headC)IKAnalyzerD)hadoop[多選題]168.以下哪些屬于大數(shù)據(jù)存儲與管理技術(shù)?A)HDFSB)HBaseC)TezD)Durid[多選題]169.以下哪些選項(xiàng)是實(shí)時(shí)檢索適用的場景?A)查詢條件比較復(fù)雜的場景B)查詢速度要求高的場景C)圖片查詢場景D)高并發(fā)的場景[多選題]170.自定義計(jì)數(shù)器有三部分組成分別是()。A)分組名B)時(shí)間C)計(jì)數(shù)器名D)計(jì)數(shù)器的值[多選題]171.Kafka每個(gè)Partition在物理上對應(yīng)的文件夾下存儲哪些文件?A)素引文件B)配置文件C)用戶文件D)消息文件[多選題]172.Zookeeper是一個(gè)很好的集群管理工具,被大量用于分布式計(jì)算,它主要提供什么服務(wù)?A)配置維護(hù)B)域名服務(wù)C)分布式同步D)負(fù)載均衡服務(wù)[多選題]173.邏輯回歸的優(yōu)點(diǎn)有哪些?()A)形式簡單B)模型效果不錯C)訓(xùn)練速度快D)方便輸出結(jié)果調(diào)整[多選題]174.ETL包含下列哪些過程A)數(shù)據(jù)抽取B)數(shù)據(jù)轉(zhuǎn)換C)數(shù)據(jù)加載D)數(shù)據(jù)展現(xiàn)[多選題]175.從形式語言表達(dá)能力而言,規(guī)則可分為兩類:(__)和(__)。A)命題規(guī)則B)一階規(guī)則C)原子命題D)邏輯連接詞[多選題]176.以下屬于數(shù)據(jù)轉(zhuǎn)換的方法的是()。A)中心化變換B)標(biāo)準(zhǔn)化變換C)對數(shù)變換D)極差標(biāo)準(zhǔn)化變換[多選題]177.使用ADS可以很好的支持即席查詢,對一些復(fù)雜的查詢,也能在很短的時(shí)間內(nèi)返回處理結(jié)果。以下關(guān)于ADS中查詢涉及的說法正確的有:()。A)如果用戶的查詢的條件會指定聚集列的內(nèi)容或者范圍,那么這樣的查詢性能便會有較大的提升B)處于關(guān)聯(lián)方便的考慮,普通表可以放在維度表組上,這樣該表和其他任意表關(guān)聯(lián)都不在受表組的限制C)ADS中join會優(yōu)先采用hashjoin,如果不滿足hashjoin的條件,優(yōu)化器才會選取其他的關(guān)聯(lián)方法D)需要關(guān)聯(lián)查詢的普通表,需要放在同一個(gè)表組上[多選題]178.以下哪些模塊是屬于Spark組件的?A)StreamingB)MLLibC)GraphXD)Hive[多選題]179.HBase提供了Shell命令行,可以通過命令行模式進(jìn)行()【選三項(xiàng)】A)創(chuàng)建表B)重啟HbaseC)更新D)刪除和查詢數(shù)據(jù)[多選題]180.HBase的三層結(jié)構(gòu)中,三層指的是哪三層?A)Zookeeper文件B)-ROOT-表C)META.表D)數(shù)據(jù)類型[多選題]181.堅(jiān)持(___)的原則,以企業(yè)級共享服務(wù)為核心,逐步沉淀共性業(yè)務(wù)和數(shù)據(jù)服務(wù)能力,打造企業(yè)中臺,包括業(yè)務(wù)中臺和數(shù)據(jù)中臺。A)問題導(dǎo)向B)業(yè)務(wù)驅(qū)動C)閉環(huán)管理D)急用先行[多選題]182.以下哪些不是常見的時(shí)間序列算法模型?()A)RSIB)MACDC)ARMAD)KDJ[多選題]183.StructuredStreaming支持的數(shù)據(jù)源包括?A)HDFSB)KafkaC)SocketD)RateStream[多選題]184.以下屬于聚類算法的是()A)K均值B)DBSCANC)AprioriD)Jarvis-Patrick(JP)[多選題]185.傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的性質(zhì)是什么?A)上一時(shí)刻的網(wǎng)絡(luò)狀態(tài)信息將會作用于下一時(shí)刻的網(wǎng)絡(luò)狀態(tài)B)并行處理序列中所有信息C)容易梯度爆炸/消失D)易于搭建[多選題]186.類的特點(diǎn)有()。A)封裝B)繼承C)多態(tài)D)重復(fù)[多選題]187.下列關(guān)于數(shù)據(jù)流轉(zhuǎn)和應(yīng)用的說法正確的有()。A)數(shù)據(jù)流轉(zhuǎn)和應(yīng)用過程中應(yīng)確保可追溯、可復(fù)查B)前序環(huán)節(jié)應(yīng)保證數(shù)據(jù)的真實(shí)、完整C)前序環(huán)節(jié)應(yīng)及時(shí)傳遞到后序環(huán)節(jié)D)前后環(huán)節(jié)數(shù)據(jù)應(yīng)保持銜接一致[多選題]188.以下選項(xiàng)中屬于數(shù)據(jù)科學(xué)家必備的核心能力包括()。A)數(shù)據(jù)的ETL轉(zhuǎn)換B)數(shù)據(jù)產(chǎn)品開發(fā)能力C)基于數(shù)據(jù)提出好的研究假設(shè)或問題,并完成對應(yīng)的試驗(yàn)設(shè)計(jì)D)數(shù)據(jù)庫/數(shù)據(jù)倉庫的維護(hù)[多選題]189.以下()方法可以支持MaxCompute中受保護(hù)項(xiàng)目空間的數(shù)據(jù)流出。A)使用owner通過ACL授權(quán)B)使用owner通過policy授權(quán)C)設(shè)置例外(ExceptionPolicy)D)設(shè)置項(xiàng)目互信(TrustedProject)[多選題]190.下列不屬于無監(jiān)督學(xué)習(xí)的是:()A)kmeansB)svmC)最大熵D)crf[多選題]191.下列關(guān)于Series說法正確的是()。A)Series是一個(gè)類似一維數(shù)組的對象B)Series可以保存任何類型的數(shù)據(jù)C)Series由數(shù)據(jù)和索引構(gòu)成D)Series結(jié)構(gòu)的數(shù)據(jù)位于索引的左側(cè)[多選題]192.下面數(shù)據(jù)是字符串的是A)"zhongguo"B)""C)"""a"""D)abc[多選題]193.管理非結(jié)構(gòu)化數(shù)據(jù)常采用()。A)NoSQLB)NewSQLC)關(guān)系云技術(shù)D)關(guān)系數(shù)據(jù)庫技術(shù)[多選題]194.下面與權(quán)限相關(guān)的數(shù)據(jù)表有()。--A)userB)dbC)tables_privD)columns_priv[多選題]195.下列關(guān)于交叉驗(yàn)證法描述正確的是(__)。A)交叉驗(yàn)證法先將數(shù)據(jù)集劃分為k個(gè)大小相似的互斥子集B)交叉驗(yàn)證法將數(shù)據(jù)集劃分成的k個(gè)子集應(yīng)盡可能保持?jǐn)?shù)據(jù)分布的一致性C)通常把交叉驗(yàn)證法稱為k折交叉驗(yàn)證D)假定數(shù)據(jù)集D中包含m個(gè)樣本,若令交叉驗(yàn)證法中的系數(shù)k=m,則得到了交叉驗(yàn)證法的一個(gè)特例:自助法[多選題]196.(__)是圖像降噪的方法。A)空間域合成法B)中值濾波器C)最小值濾波D)非線性小波變換[多選題]197.以下(__)是一元通用函數(shù)。A)np.add()B)np.maximum()C)np.exp()D)np.sqrt()[多選題]198.列關(guān)于MapJoin說法有誤的是()A)兩份數(shù)據(jù)data1和data2會被map分別讀入,解析成以連接字段為key,以查詢字段為value的key-value對,并標(biāo)明數(shù)據(jù)來源是data1還是data2。B)reducetask會接收來自data1和data2的相同key的數(shù)據(jù),在reduce端進(jìn)行乘積連接。C)需要有一份數(shù)據(jù)比較小,在map端能夠把它加載到內(nèi)存,并進(jìn)行join操作。D)大份數(shù)據(jù)作為MapTask的輸入[多選題]199.大數(shù)據(jù)平臺的計(jì)算組件主要有()。A)StormB)SparkC)MapReduceD)Sqoop[多選題]200.大數(shù)據(jù)計(jì)算框架Flink的支持哪些資源調(diào)度方式?A)StandaloneB)YARNC)MesosD)Docker[多選題]201.下列語句在python3中的結(jié)果為1.5的是()。A)3/2B)3//2C)3/2.0D)3//2.0[多選題]202.下列Hive的分區(qū)表描述正確的是()A)Hive中的每個(gè)表都可以擁有一個(gè)或者多個(gè)分區(qū),每個(gè)分區(qū)以文件的形式單獨(dú)存在表文件夾的目錄下。B)分區(qū)是以字段的形式在表結(jié)構(gòu)中存在,通過desctable命令可以查看到字段存在。C)分區(qū)字段不存放實(shí)際的數(shù)據(jù)內(nèi)容,僅僅是分區(qū)的表示。D)分區(qū)字段不能出現(xiàn)在表定義的列中[多選題]203.以下哪些是HDFS的核心組件?A)ClientB)NameNodeC)DataNodeD)Product[多選題]204.以下對HDFS中提供文件讀寫的類描述正確的是()。A)FSDataOutputStream是HDFSAPI中提供文件寫入文件的類。B)FSDataOutputStream是與DataNode交互的接口類。C)FSDataOutputStream是HDFSAPI中提供讀取文件的類,通過FileSystemi的close方法獲取讀取數(shù)據(jù)流。D)FSDataOutputStreami通過FileSystem的create和append方法獲取寫入數(shù)據(jù)流。[多選題]205.基于Hadoop開源大數(shù)據(jù)平臺主要提供了針對數(shù)據(jù)分布式計(jì)算和存儲能力,如下屬于分布式存儲組件的有()。A)MapReduceB)SparkC)HDFSD)HBase[多選題]206.下面屬于數(shù)據(jù)集的一般特性的有:()A)連續(xù)性B)維度C)稀疏性D)分辨率E)相異性第3部分:判斷題,共42題,請判斷題目是否正確。[判斷題]207.表達(dá)式sum(range(10))的值為10。A)正確B)錯誤[判斷題]208.HadoopHA是集群中啟動兩臺或兩臺以上機(jī)器充當(dāng)NameNode,避免一臺NameNode節(jié)點(diǎn)發(fā)生故障導(dǎo)致整個(gè)集群不可用的情況。()A)正確B)錯誤[判斷題]209.字典可以作為集合的元素。A)正確B)錯誤[判斷題]210.假設(shè)列表對象aList的值為[3,4,5,6,7,9,11,13,15,17],那么切片aList[3:7]得到的值是[6,7,9]。A)正確B)錯誤[判斷題]211.print("tianjin">"beijing")的運(yùn)行結(jié)果為True。A)正確B)錯誤[判斷題]212.0o12f是合法的八進(jìn)制數(shù)字。A)正確B)錯誤[判斷題]213.大數(shù)據(jù)平臺安全管理系統(tǒng)的功能為:從各系統(tǒng)獲取日志,同時(shí)為各系統(tǒng)提供安全控制策略。A)正確B)錯誤[判斷題]214.深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一部分,機(jī)器學(xué)習(xí)又是人工智能的一部分。A)正確B)錯誤[判斷題]215.一張數(shù)據(jù)表中最多只允許包含一個(gè)主鍵約束。--A)正確B)錯誤[判斷題]216.某電商公司的一位數(shù)據(jù)分析師在使用Hive進(jìn)行數(shù)據(jù)分析時(shí),不慎刪除了一個(gè)外部表,那么元數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)將一起都被刪除,并且數(shù)據(jù)不可恢復(fù)。A)正確B)錯誤[判斷題]217.如果自變量X和因變量Y之間存在高度的非線性和復(fù)雜關(guān)系,那么樹模型很可能優(yōu)于經(jīng)典回歸方法。以上說法()。A)正確B)錯誤C)無法確定D)模型效果差別不大[判斷題]218.已知table=''A)正確B)錯誤[判斷題]219.使用配置規(guī)劃工具對FusioninsightHDV100R00C50集群進(jìn)行規(guī)劃時(shí),可以用V100R002C60版本的配置規(guī)劃工具來規(guī)劃。A)正確B)錯誤[判斷題]220.表達(dá)式{1,2}*2的值為{1,2,1,2}。A)正確B)錯誤[判斷題]221.因?yàn)镠DFS有多個(gè)副本,所以NameNode是不存在單點(diǎn)問題的。()A)正確B)錯誤[判斷題]222.數(shù)據(jù)挖掘的日的是發(fā)現(xiàn)數(shù)據(jù)集中的模式或規(guī)律,數(shù)據(jù)挖掘有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩種方式。()A)正確B)錯誤[判斷題]223.數(shù)據(jù)湖探索(DataLakeInsight,簡稱DLI)兼容標(biāo)準(zhǔn)SQL。A)正確B)錯誤[判斷題]224.可視化技術(shù)對于分析的數(shù)據(jù)類型通常不是專用性的。A)正確B)錯誤[判斷題]225.刪除數(shù)據(jù)時(shí)若沒有設(shè)置條件,則系統(tǒng)不會刪除表中的任何記錄。--A)正確B)錯誤[判斷題]226.帶有else子句的循環(huán)如果因?yàn)閳?zhí)行了break語句而退出的話,則會執(zhí)行else子句中的代碼。A)正確B)錯誤[判斷題]227.隨著數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量大小的指數(shù)遞增,那么OLTP就會慢慢被OLAP所替代。A)正確B)錯誤[判斷題]228.中國電信的疫情防控行程查詢助手為翼知疫行,為政府及個(gè)人提供了包括區(qū)域風(fēng)險(xiǎn)查詢、疫情預(yù)測查詢、返程報(bào)告查詢、行程查詢和接觸查詢等功能。A)正確B)錯誤[判斷題]229.決策樹是一種基于樹形結(jié)構(gòu)的預(yù)測模型,每一個(gè)樹形分叉代表一個(gè)分類條件,葉子節(jié)點(diǎn)代表最終的分類結(jié)果,其優(yōu)點(diǎn)在于易于實(shí)現(xiàn),決策時(shí)間短,并且適合處理非數(shù)值型數(shù)據(jù)。A)正確B)錯誤[判斷題]230.通過對象不能調(diào)用類方法和靜態(tài)方法。A)正確B)錯誤[判斷題]231.在為企業(yè)的IT系統(tǒng)做架構(gòu)設(shè)計(jì)時(shí),成本是一個(gè)很重要的考慮因素。對于分析型數(shù)據(jù)庫(AnalyticDB,原ADS)和大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS),前者使用了SSD盤存儲數(shù)據(jù),價(jià)格比較責(zé),因此在兩個(gè)產(chǎn)品都能實(shí)現(xiàn)的場景下,優(yōu)先選擇大數(shù)據(jù)計(jì)算服務(wù),會降低用戶的整體使用成本。A)正確B)錯誤[判斷題]232.計(jì)算機(jī)在人工管理階段沒有操作系統(tǒng)和管理數(shù)據(jù)的軟件。--A)正確B)錯誤[判斷題]233.Spark是以RDD概念為中心運(yùn)行的。A)正確B)錯誤[判斷題]234.Python中定義函數(shù)的關(guān)鍵字是def。A)正確B)錯誤[判斷題]235.大數(shù)據(jù)平臺專區(qū)是基于集團(tuán)大數(shù)據(jù)平臺為省公司打造的一站式數(shù)據(jù)應(yīng)用開發(fā)平臺,能夠?yàn)楦魇¢_發(fā)者提供從底層(計(jì)算、存儲、工具能力)、中間(OpenAPI、模型)到上層應(yīng)用快速數(shù)據(jù)科學(xué)探索的一條龍服務(wù)。A)正確B)錯誤[判斷題]236.Hive使用length()函數(shù)可以求出輸出的數(shù)量。()A)正確B)錯誤[判斷題]237.DataNode首次加入cluster的時(shí)候,如果log中報(bào)告不兼容文件版本,那需要NameNode執(zhí)行?hadoopnamenode-format?操作格式化磁盤。()A)正確B)錯誤[判斷題]238.Series是一個(gè)類似于一維數(shù)組的對象。()A)正確B)錯誤[判斷題]239.Python內(nèi)置的集合set中元素順序是按元素的哈希值進(jìn)行存儲的,并不是按先后順序。A)正確B)錯誤[判斷題]240.大數(shù)據(jù)可以用于流行病預(yù)測?A)正確B)錯誤[判斷題]241.數(shù)據(jù)表中字段的創(chuàng)建順序與其在數(shù)據(jù)庫中存儲的順序相同。--A)正確B)錯誤[判斷題]242.Map階段處理數(shù)據(jù)時(shí),是按照Key的哈希值與ReduceTask數(shù)量取模進(jìn)行分區(qū)的規(guī)則。()A)正確B)錯誤[判斷題]243.SET('RUNNING','SING')類型的字段允許插入空字符('')。--A)正確B)錯誤[判斷題]244.表達(dá)式chr(ord('a')^32^32)的值為'a'。A)正確B)錯誤[判斷題]245.布爾類型是特殊的浮點(diǎn)型。()A)正確B)錯誤[判斷題]246.用戶可以跨項(xiàng)目空間讀未保護(hù)的項(xiàng)目空間數(shù)據(jù)。A)正確B)錯誤[判斷題]247.萬維網(wǎng)之父是彼得.德魯克。A)正確B)錯誤[判斷題]248.在一個(gè)軟件的設(shè)計(jì)與開發(fā)中,所有類名、函數(shù)名、變量名都應(yīng)該遵循統(tǒng)一的風(fēng)格和規(guī)范。A)正確B)錯誤第4部分:問答題,共11題,請?jiān)诳瞻滋幪顚懻_答案。[問答題]249.數(shù)據(jù)清洗是一種使用模式識別和其他技術(shù),在將原始數(shù)據(jù)轉(zhuǎn)換和移到數(shù)據(jù)倉庫之前來升級原始數(shù)據(jù)質(zhì)量的技術(shù)。()A)錯誤B)正確[問答題]250.Hive中的?Groupby?指的是通過一定規(guī)則將一個(gè)數(shù)據(jù)集劃分成若干個(gè)小的數(shù)據(jù)集,然后針對若干個(gè)小的數(shù)據(jù)集進(jìn)行數(shù)據(jù)分組處理。A)TrueB)False[問答題]251.在Python中導(dǎo)入模塊中的對象有哪幾種方式?[問答題]252.在Flink中,checkpoint機(jī)制能夠保證應(yīng)用在運(yùn)行過程中出現(xiàn)失效時(shí),從某一個(gè)檢查點(diǎn)恢復(fù),在此過程中,流快照是根據(jù)數(shù)據(jù)流入建立的A)TRUEB)FALSE[問答題]253.Hadoop2.x版本中的HDFS是由(NameNode、DataNode和SecondaryNameNode)組成。[問答題]254.請簡述Python中格式化字符串的幾種方式。[問答題]255.HDFS文件寫入流程是?()Client向NameNode發(fā)起文件寫入的請求。()NameNode根據(jù)文件大小和文件塊配置情況,返回給Client它所管理部分DataNode的信息。()Client將文件劃分為多個(gè)Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€(gè)DataNode塊中。[問答題]256.DataFrame類對象屬于二維結(jié)構(gòu),它同時(shí)擁有【】索引和【】索引。[問答題]257.啟動yarn的shell腳本為()[問答題]258.Hadoop發(fā)行版本分為開源社區(qū)版和()[問答題]259.Yarn-Client和Yarn-Cluster主要區(qū)別是ApplicationMaster進(jìn)程的區(qū)別A)TRUEB)FALSE[單選題]260.Maxcompute的屏顯行數(shù)可以通過管理控制臺實(shí)現(xiàn),最大的顯示條數(shù)是:()。A)100條B)10000條C)1000條D)5000條1.答案:A解析:2.答案:D解析:3.答案:A解析:4.答案:B解析:列表對象的sort()函數(shù)用來對列表元素進(jìn)行原地排序,該函數(shù)返回值為None。5.答案:C解析:6.答案:D解析:7.答案:A解析:8.答案:D解析:9.答案:C解析:10.答案:A解析:11.答案:B解析:12.答案:D解析:13.答案:A解析:14.答案:C解析:二、多選題15.答案:A解析:16.答案:B解析:17.答案:A解析:18.答案:D解析:19.答案:C解析:20.答案:B解析:21.答案:D解析:數(shù)據(jù)加工(DataWrangling或DataMunging)是數(shù)據(jù)產(chǎn)品開發(fā)的關(guān)鍵環(huán)節(jié)。22.答案:B解析:23.答案:D解析:表達(dá)客觀事實(shí)的關(guān)鍵詞是對事物的客觀性描述,不帶有感情色彩和情感傾向,即為客觀性文本,不適用于情感分析。而主觀性文本則是作者對各種事物的看法或想法,帶有作者的喜好厭惡等情感傾向,如ABC中表觀點(diǎn)、程度和情緒的關(guān)鍵詞都是帶有情感傾向的主觀性文本,適用于情感分析。24.答案:C解析:25.答案:D解析:常用的沖突消解策略有投票法、排序法、元規(guī)則法等。26.答案:D解析:27.答案:B解析:28.答案:B解析:29.答案:C解析:30.答案:C解析:如果增加模型復(fù)雜度,那么模型的測試錯誤率總是會降低,訓(xùn)練錯誤率可能降低,也可能增高。31.答案:A解析:32.答案:D解析:33.答案:C解析:34.答案:C解析:漏斗圖不適合表示無邏輯順序的分類對比,如果要表示無邏輯順序的分類對比情況,請使用柱狀圖。漏斗圖也不適合表示占比情況,如果要表示占比情況,請使用餅圖。35.答案:A解析:36.答案:D解析:無法計(jì)算文本相似度的原因有出現(xiàn)新詞在向量模型中沒有該詞匯或分詞工具對于詞匯切分與上次不同等其他原因。37.答案:C解析:38.答案:C解析:39.答案:B解析:數(shù)據(jù)可視化的方法體系的方法論基礎(chǔ)主要是指"視覺編碼"。"視覺編碼"為其他數(shù)據(jù)可視化方法提供了方法論基礎(chǔ),奠定了數(shù)據(jù)可視化方法體系的根基。40.答案:B解析:41.答案:C解析:42.答案:B解析:43.答案:B解析:44.答案:D解析:45.答案:B解析:46.答案:B解析:47.答案:B解析:48.答案:B解析:在支持向量機(jī)中,軟間隔允許支持向量機(jī)在一些樣本上出錯。49.答案:B解析:50.答案:A解析:51.答案:D解析:52.答案:A解析:53.答案:B解析:np.where()在只有一個(gè)參數(shù)時(shí)返回?cái)?shù)值不為0元素的下標(biāo)。29454.答案:B解析:55.答案:D解析:DMM(數(shù)據(jù)管理成熟度模型)中"已管理級"的基本特點(diǎn)是組織機(jī)構(gòu)的數(shù)據(jù)管理工作超出了項(xiàng)目管理的范疇,由組織機(jī)構(gòu)統(tǒng)一管理其數(shù)據(jù)管理關(guān)鍵過程。56.答案:C解析:57.答案:C解析:legend()函數(shù)用于添加圖例。58.答案:B解析:59.答案:D解析:60.答案:A解析:61.答案:B解析:62.答案:C解析:63.答案:D解析:64.答案:A解析:65.答案:B解析:66.答案:C解析:67.答案:A解析:68.答案:A解析:69.答案:A解析:已優(yōu)化是數(shù)據(jù)管理成熟度模型中成熟度的最高等級。70.答案:D解析:71.答案:D解析:72.答案:C解析:73.答案:D解析:74.答案:D解析:75.答案:B解析:76.答案:D解析:77.答案:B解析:78.答案:B解析:79.答案:C解析:80.答案:D解析:81.答案:D解析:82.答案:B解析:83.答案:C解析:MapReduce編程模型中四個(gè)組件的執(zhí)行順序是RecordReader→Mapper→Partitioner→Reducer。84.答案:B解析:85.答案:A解析:86.答案:A解析:矩陣乘法運(yùn)算,此處算第一個(gè)數(shù)就可以排除其他選項(xiàng)。87.答案:A解析:投籃只有兩種結(jié)果;進(jìn)或者不進(jìn),符合二項(xiàng)分布,二項(xiàng)分布概率的概率可以用公式P(X=k)=pk(1-p)n-k求得,其中n=10代表試驗(yàn)次數(shù),k=3代表事件連續(xù)發(fā)生的次數(shù),p=1/2代表事件發(fā)生的概率。88.答案:D解析:數(shù)據(jù)產(chǎn)品開發(fā)工作之中需要注意有創(chuàng)造性設(shè)計(jì)、數(shù)據(jù)洞見、虛擬化等基本活動。89.答案:D解析:90.答案:C解析:91.答案:C解析:92.答案:A解析:93.答案:C解析:94.答案:B解析:95.答案:C解析:96.答案:C解析:97.答案:A解析:98.答案:A解析:99.答案:A解析:100.答案:C解析:101.答案:D解析:102.答案:D解析:103.答案:A解析:訓(xùn)練集、測試集和驗(yàn)證集的功能分別為訓(xùn)練(構(gòu)建)模型、測試模型以及模型選擇與超級參數(shù)的調(diào)優(yōu)。104.答案:D解析:105.答案:B解析:106.答案:A解析:大數(shù)據(jù)的一種表現(xiàn)形式為接近其總體的"所有數(shù)據(jù)"。107.答案:A解析:108.答案:C解析:儀表盤中的儀表板最小值為0,最大值為目標(biāo)值。109.答案:A解析:110.答案:D解析:基于Boosting的集成學(xué)習(xí)算法的集成學(xué)習(xí)代表算法包含Adaboost、GBDT、XGBOOST,隨機(jī)森林是基于Bagging。111.答案:B解析:112.答案:A解析:113.答案:B解析:114.答案:B解析:115.答案:D解析:116.答案:B解析:117.答案:B解析:本次分析主要分析了大風(fēng)和洋流可能發(fā)生的地與安全航路的相關(guān)性。118.答案:A解析:119.答案:A解析:120.答案:C解析:fftpack是傅里葉變換模塊,signal是信號處理模塊,linalg是線性代數(shù)模塊,Ndimage是多維圖像處理模塊。121.答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論