版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷16)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.下列新客戶風(fēng)險等級劃分標(biāo)準(zhǔn)中,說法錯的是()A)短期內(nèi)一般可疑報告次數(shù)為3以上--高風(fēng)險B)自然人客戶由他人代辦開戶-一般風(fēng)險C)新開客戶屬于容易洗錢的行業(yè)-高風(fēng)險D)短期內(nèi)客戶單筆金額為10萬以上的現(xiàn)金收交易累計3次以上-一般風(fēng)險答案:C解析:[單選題]2.關(guān)于k-meA、ns說法不正確的是()A)、k-meA、ns聚類是一種典型的基于距離的聚類算法B)、它采用距離作為相似性的評價指標(biāo),即認(rèn)為兩個對象的距離越近,其相似度就越大C)、k-meA、ns聚類的目的是尋找固定數(shù)目的簇,而每個簇由距離靠近的對象組成D)、在k-meA、ns聚類中,k個初始聚類中心點的選取對聚類結(jié)果的影響不是很大答案:D解析:[單選題]3.通常會單獨購買獨立設(shè)備組為其服務(wù)的行業(yè)是?()A)電商行業(yè)B)金融行業(yè)C)視頻行業(yè)D)新聞網(wǎng)站答案:B解析:[單選題]4.變量的不確定性越大,相對應(yīng)信息熵的變化是()。A)熵變小B)熵變大C)不變D)以上答案都不正確答案:B解析:信息熵(informationentropy)是度量樣本集合純度最常用的一種指標(biāo),信息熵越大,變量的不確定性越大。[單選題]5.大數(shù)據(jù)分析人員小張發(fā)現(xiàn),所在的互聯(lián)網(wǎng)公司的注冊人數(shù)往往會隨著時間有一定的變化,為了更加直觀展示這種趨勢,最合適的圖表是()A)點圖B)熱力點圖C)線型圖D)雷達(dá)圖答案:C解析:[單選題]6.下列關(guān)于數(shù)據(jù)倉庫隨時間變化的描述不正確的是()。A)數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照C)數(shù)據(jù)倉庫隨時間變化不斷刪去舊的數(shù)據(jù)內(nèi)容D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進(jìn)行重新綜合答案:C解析:一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。[單選題]7.Flume支持監(jiān)控并傳輸目錄下新增的文件,可實現(xiàn)實時數(shù)據(jù)傳輸,以下描述的是哪一類Source?A)httpsourceB)execsourceC)syslogsourceD)spoolingdirectorysource答案:D解析:[單選題]8.下面哪個不是Hadoop的輸出數(shù)據(jù)格式()A)文本輸出B)二進(jìn)制輸出C)單一輸出D)多輸出答案:C解析:Hadoop的輸出數(shù)據(jù)格式分為文本輸出、二進(jìn)制輸出和多輸出。沒有單一輸出數(shù)據(jù)格式。/andrewgb/article/details/49668801[單選題]9.自行車用戶信息表中收集了用戶的各類信息,包括用戶的出生日期及用戶第一次購買自行車的日期。為了得到用戶第一次購買自行車的年齡,應(yīng)使用()函數(shù)。A)DateDiffB)DatePartC)DatetimeToStringD)FormatDate答案:A解析:[單選題]10.表示數(shù)據(jù)分布是否為對稱性的統(tǒng)計量是()。A)方差B)中位數(shù)C)偏態(tài)D)峰態(tài)答案:C解析:偏態(tài)(Skewness)描述數(shù)據(jù)分布的對稱性,當(dāng)偏態(tài)系數(shù)等于0時,對應(yīng)數(shù)據(jù)的分布為對稱;否則分布為非對稱。峰態(tài)(Kurtosis)描述數(shù)據(jù)分布的平峰或尖峰程度,當(dāng)峰態(tài)系數(shù)等于0時,數(shù)據(jù)分布為標(biāo)準(zhǔn)正態(tài)分布;否則比正態(tài)分布更平或更尖。[單選題]11.在SVM中,若想求解非線性情況下的問題可借助于(__)。A)核函數(shù)B)激活函數(shù)C)損失函數(shù)D)優(yōu)化函數(shù)答案:A解析:[單選題]12.以下關(guān)于機(jī)器學(xué)習(xí)描述錯誤的是(__)。A)機(jī)器學(xué)習(xí)的目標(biāo)是使學(xué)得的模型能很好地適用于?新樣本?B)學(xué)得模型適用于新樣本的能力,稱為?泛化?能力C)具有強(qiáng)泛化能力的模型不能很好地適用于整個樣本空間D)一般認(rèn)為,數(shù)據(jù)樣本越多,獲得的模型的泛化能力越強(qiáng)答案:C解析:[單選題]13.以下代碼哪個能夠打印出138-9922-0202這個電話號碼,注意格式需要完全一致?()A)print(?138?)print(?9922?)print(?0202?)B)print(?138?,end=??)print(?9922?,end=??)print(?0202?,end=??)C)print(?138?,sep=?-?)print(?9922?,sep=?-?)print(?0202?,sep=?-?)D)print(?138?,end=?-?)print(?9922?,end=?-?)print(?0202?)答案:D解析:[單選題]14.下列表述正確的是()。A)if語句總是與else成對出現(xiàn)B)if語句總是與elif成對出現(xiàn)C)if語句分支嵌套實現(xiàn)多分支D)if語句只能實現(xiàn)二分支答案:C解析:if語句可以成單出現(xiàn)也可以與elif、else實現(xiàn)分支嵌套功能。[單選題]15.()在劃分屬性時是在當(dāng)前結(jié)點的屬性集合中選擇一個最優(yōu)屬性。A)AdaBoostB)RFC)BaggingD)傳統(tǒng)決策樹答案:D解析:[單選題]16.()負(fù)責(zé)組織制定管理信息系統(tǒng)數(shù)據(jù)安全保護(hù)方案,并對安全保護(hù)措施技術(shù)落實情況進(jìn)行檢查。A)國網(wǎng)安質(zhì)部B)國網(wǎng)信通部C)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組D)國網(wǎng)辦公廳答案:B解析:[單選題]17.關(guān)于批量數(shù)據(jù)處理組件的描述不正確的是?A)Hive:傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理速度較慢。B)SparkSQL:新型SsQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。C)Spark:新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。D)MapReducer傳統(tǒng)批處理引整用于處理非SoL類,尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類批處理作業(yè),使用廣泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。答案:D解析:[單選題]18.()可在保證訓(xùn)練精度的情況下降低模型的復(fù)雜度。A)正則化系數(shù)無窮大B)正則化系數(shù)幾乎為0C)選擇合適的正則化參數(shù)D)以上答案都不正確答案:C解析:選擇合適的正則化參數(shù)可在保證訓(xùn)練精度的情況下降低模型的復(fù)雜度。[單選題]19.下列對于查全率的描述,解釋正確的是(__)。A)統(tǒng)計分類器預(yù)測出來的結(jié)果與真實結(jié)果不相同的個數(shù),然后除以總的樣例集D的個數(shù)。B)先統(tǒng)計分類正確的樣本數(shù),然后除以總的樣例集D的個數(shù)。C)預(yù)測為正的樣例中有多少是真正的正樣例D)樣本中的正例有多少被預(yù)測正確答案:D解析:[單選題]20.在大數(shù)據(jù)計算服務(wù)的數(shù)據(jù)倉庫中的訂單表fact_order,建表語句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的數(shù)據(jù)是從ods_order加工而來,ods_order建表語句如下:createtableods_order(order_idstring,order_amtbigint,order_dtstring);ods_order中有一條記錄數(shù)據(jù)值是order_idorder_amtorder_dt000110020160301運(yùn)行SQL語句將數(shù)據(jù)從ods_order加載到fact_order中:insertoverwritetablefact_orderpartition(dt=?20160301?)select*fromods_order;對此語句的執(zhí)行結(jié)果描述正確的是:()。A)提交SQL時會報語法錯誤B)語句可以執(zhí)行,order_amt的值會被自動的轉(zhuǎn)為double類型C)語句可以執(zhí)行,但是這條數(shù)據(jù)會被當(dāng)作臟數(shù)據(jù)丟棄D)目標(biāo)表與源表中的數(shù)據(jù)類型不一致,執(zhí)行出錯答案:B解析:[單選題]21.下面哪個RDD操作肯定是寬依賴()A)mapB)flatMapC)reduceByKeyD)sample答案:C解析:[單選題]22.若設(shè)1.啟動,2.診斷,3.建立,4.行動,5.學(xué)習(xí),則DMM模型中的順序為(__)。A)12345B)12354C)13254D)13245答案:A解析:[單選題]23.下圖展示了StructuredStreaming的計算模型。通過觀察可以得出最終T3的計算結(jié)果是?A)Dog1,owl1B)Cat2,dog4,owl2C)Cat2,dog3,owl1D)Cat1,cat1,dog2,dog2,owl2答案:B解析:[單選題]24.以下()不是大數(shù)據(jù)時代新興的技術(shù)。A)HadoopB)MySQLC)SparkD)HBase答案:B解析:[單選題]25.下面關(guān)于數(shù)據(jù)加工相關(guān)描述不正確的有(__)。A)數(shù)據(jù)加工是數(shù)據(jù)科學(xué)中關(guān)注的新問題之一B)數(shù)據(jù)加工是為了提升數(shù)據(jù)質(zhì)量、降低數(shù)據(jù)計算復(fù)雜度C)數(shù)據(jù)科學(xué)中數(shù)據(jù)加工就是傳統(tǒng)數(shù)據(jù)處理D)數(shù)據(jù)脫敏屬于數(shù)據(jù)加工答案:C解析:[單選題]26.屬于有監(jiān)督學(xué)習(xí)的是()A)、k-meA、nB)、主成分分析C)、關(guān)聯(lián)規(guī)則分析D)、線性回歸答案:D解析:[單選題]27.關(guān)于實時檢索技術(shù)的應(yīng)用場景,以下描述中錯誤的是哪一個選項?A)公安系統(tǒng)數(shù)據(jù)量大、業(yè)務(wù)要求復(fù)雜,因此無法借助實時檢索技術(shù)提高處警效率B)實時檢索要求在小批量數(shù)據(jù)集上需達(dá)到毫秒級的時延C)在金融風(fēng)控場景中,利用實時檢索技術(shù),客戶可以在發(fā)生危險交易前及時上損D)運(yùn)營商可以借助實時檢索技術(shù),查詢某個時間段用戶的流量記錄,以應(yīng)對不良APP偷跑流量引發(fā)的投訴答案:A解析:[單選題]28.scipy.stats模塊中對隨機(jī)變量進(jìn)行隨機(jī)取值的函數(shù)是()。A)rvsB)pdfC)cdfD)sf答案:A解析:stats模塊中的rvs函數(shù)對隨機(jī)變量進(jìn)行取值。[單選題]29.有下面的程序段ifk0:ifk>5:ifk>8:x=0else:x=1else:ifk>2:x=3else:x=4其中k取那組值時x=3()A)3,4,5B)3,4C)5,6,7D)4,5答案:A解析:[單選題]30.從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)出一組能用于對未見示例進(jìn)行判別的規(guī)則,這個過程稱為(__)。A)機(jī)器學(xué)習(xí)B)規(guī)則學(xué)習(xí)C)直推學(xué)習(xí)D)主動學(xué)習(xí)答案:B解析:[單選題]31.preprocessing.Normalizer表示(__)。A)一個函數(shù)B)一個參數(shù)C)一個類D)一個變量答案:C解析:[單選題]32.將兩篇文本通過詞袋模型變?yōu)橄蛄磕P?,通過計算向量的()來計算兩個文本間的相似度。A)正弦距離B)余弦距離C)長度D)方向答案:B解析:[單選題]33.文件book.txt在當(dāng)前程序所在目錄內(nèi),其內(nèi)容是一段文本:book,下面代碼的輸出結(jié)果是:txt=open("book.txt","r")print(txt)txt.close()A)book.txtB)txtC)bookD)以上答案都不對答案:D解析:[單選題]34.將Python中的.py文件轉(zhuǎn)換為.pyc文件的組件為()。A)編輯器B)編譯器C)虛擬機(jī)D)解釋器答案:B解析:將Python中的.py文件轉(zhuǎn)換為.pyc文件的組件為編譯器。[單選題]35.下面組件哪個是負(fù)布式資源調(diào)度與管理的:()A)YARNB)FIumeC)ZookeeperD)Kafka答案:A解析:[單選題]36.DRDS的讀策略中不包含:()A)主庫讀B)均衡C)自定義D)主庫寫答案:D解析:[單選題]37.下列選項中,主要用于決定整個MapReduce程序性能高低的階段是()A)MapTaskB)ReduceTaskC)分片、格式化數(shù)據(jù)源D)Shuffle答案:D解析:Rack是用來存放部署Hadoop集群服務(wù)器的機(jī)架[單選題]38.ETL工具工作過程不包含以下哪項?A)清洗B)傳遞C)加載D)轉(zhuǎn)換答案:B解析:[單選題]39.對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,下列說法正確的是()。A)需要將這些樣本全部強(qiáng)制轉(zhuǎn)換為支持向量B)需要將這些樣本中可以轉(zhuǎn)化的樣本轉(zhuǎn)換為支持向量.不能轉(zhuǎn)換的直接刪除C)移去或者減少這些樣本對分類結(jié)果沒有影響D)以上都不對答案:C解析:支持向量機(jī)的一個重要性質(zhì):訓(xùn)練完成后,大部分的訓(xùn)練樣本都不需保留,最終模型僅與支持向量有關(guān)。[單選題]40.(__)是一種著名的過濾式特征選擇方法。A)k-meansB)k近鄰C)支持向量機(jī)D)Relief答案:D解析:[單選題]41.在大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)的表中存有一批網(wǎng)站及其相互之間鏈接關(guān)系,開發(fā)人員希望通過pagerank算法來分析這批網(wǎng)站的排名,即把網(wǎng)站看做節(jié)點,把網(wǎng)站之間的連接關(guān)系看做權(quán)重,從而實現(xiàn)對網(wǎng)站的評分。()計算框架更適合實現(xiàn)這個場景。A)SQLB)MapReduceC)GraphD)Tunnel答案:C解析:[單選題]42.下列關(guān)于數(shù)據(jù)創(chuàng)新的說法正確的是()。A)多個數(shù)據(jù)集的總和價值等于單個數(shù)據(jù)集價值相加B)由于數(shù)據(jù)的再利用,數(shù)據(jù)應(yīng)該永久保存下去C)相同數(shù)據(jù)多次用于相同或類似用途,其有效性會降低D)數(shù)據(jù)只有開放價值才可以得到真正釋放答案:D解析:略。[單選題]43.刪除經(jīng)銷商1018的數(shù)據(jù)記錄的代碼為()fromdistributorswheredistri_num=1018A)droptableB)delete*C)dropcolumnD)delete答案:D解析:[單選題]44.大數(shù)據(jù)的起源是()A)金融B)電信C)互聯(lián)網(wǎng)D)公共管理答案:C解析:[單選題]45.python3中round(15.5)與round(16.5)的結(jié)果分別為()。A)16,16B)16,17C)17,16D)17,17答案:A解析:[單選題]46.一般將原始業(yè)務(wù)數(shù)據(jù)分為多個部分,()用于模型的構(gòu)建。A)訓(xùn)練集B)測試集C)驗證集D)全部數(shù)據(jù)答案:A解析:訓(xùn)練集、測試集和驗證集的功能分別為訓(xùn)練(構(gòu)建)模型、測試模型以及模型選擇與超級參數(shù)的調(diào)優(yōu)。[單選題]47.關(guān)于Kafka盤容量不足的告警,對于可能的原因以下分析不正確的是?A)用于存儲Kafka數(shù)據(jù)的磁盤配置(如磁盤數(shù)目、磁盤大小等)無法滿足當(dāng)前業(yè)務(wù)數(shù)據(jù)流量,導(dǎo)致磁盤使用率達(dá)到上限B)數(shù)據(jù)保存時間配置過長,數(shù)據(jù)累積達(dá)到磁盤使用率上限C)業(yè)務(wù)規(guī)劃不合理,導(dǎo)致數(shù)據(jù)分配不均,使部分磁盤達(dá)到使用率上限。D)Broker節(jié)點故障導(dǎo)致答案:D解析:[單選題]48.數(shù)據(jù)倉庫僅僅是提供存儲的,提供一種()的服務(wù),不面向最終分析用戶:而數(shù)據(jù)集市是()的,面向最終用戶。A)面向分析應(yīng)用、面向數(shù)據(jù)管理B)面向事務(wù)交互、面向數(shù)據(jù)管理C)面向數(shù)據(jù)管理、面向分析應(yīng)用D)面向分析應(yīng)用、面向事務(wù)交互答案:A解析:[單選題]49.在邏輯回歸輸出與日標(biāo)對比的情況下,以下評估指標(biāo)中()不適用A)AUC-ROCB)準(zhǔn)確度C)LoglossD)均方誤差答案:D解析:[單選題]50.網(wǎng)站在運(yùn)過程中,會有用戶訪問并產(chǎn)生行為數(shù)據(jù),要想對這些數(shù)據(jù)進(jìn)行處理挖掘,如果是高線批處理下的方案配置,描述不正確的是A)球據(jù)存儲:HDFS或MySqlB)數(shù)據(jù)導(dǎo)入導(dǎo)出:LoaderC)數(shù)據(jù)采集傳輸:FlumeD)數(shù)據(jù)計算:Storm答案:D解析:[單選題]51.Hadoop的作者是下面哪一位______。A)MartinFowlerB)DougcuttingC)KentBeckD)GraceHopper答案:B解析:A.MartinFowler【敏捷開發(fā)方法論-軟件開發(fā)教父】B.Dougcutting【Hadoop作者,道格·卡廷】C.KentBeck【極限編程,測試驅(qū)動開發(fā),實現(xiàn)模式】D.GraceHopper【Cobol語言之母,發(fā)明世界上第一個編譯器】[單選題]52.ResultScanner無參的next()方法返回下一個可用的行組成的Result實例,含參的next(rows)方法返回()A)一個Result實例B)一個Result實例數(shù)組C)一個整型D)以上都不正確答案:B解析:[單選題]53.對于隨機(jī)森林和GradientBoostingTrees,下面說法正確的是:A)在隨機(jī)森林的單個樹中,樹和樹之間是有依賴的,而GradientBoostingTrees中的單個樹之間是沒有依賴的B)這兩個模型都使用隨機(jī)特征子集,來生成許多單個的樹C)我們可以并行地生成GradientBoostingTrees單個樹,因為它們之間是沒有依賴的D)GradientBoostingTrees訓(xùn)練模型的表現(xiàn)總是比隨機(jī)森林好答案:B解析:[單選題]54.()用于說明在父RDD上執(zhí)行何種計算。A)分區(qū)B)算子C)日志D)數(shù)據(jù)塊答案:B解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.HBase的數(shù)據(jù)文件HFile中一個KeyValue格式包括哪些信息A)KeyB)ValueC)TimeStampD)KeyType答案:ABCD解析:[多選題]56.在FusionInsight產(chǎn)品中,關(guān)于Kafka組件說法正確的是?A)在創(chuàng)建Topic時,副本數(shù)不得大于當(dāng)前存活的Broker實例個數(shù),否則創(chuàng)建Topic將會失敗B)Kafka的Producer發(fā)送消息時,可以指定該消息被哪個Consumer消費(fèi)C)Kafka會將元數(shù)據(jù)信息存放到Zookeeper上D)Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄答案:ACD解析:[多選題]57.下列關(guān)于Explain的關(guān)鍵字描述正確的是()A)在Explain的基礎(chǔ)上,通過添加Analyze同時顯示該語句執(zhí)行時每個算子的實際開銷(單位B毫秒)和行數(shù)信息,對于判斷優(yōu)化器的估算是否準(zhǔn)確提供依據(jù)。B)在Explain的基礎(chǔ)上,添加Verbose顯示出計劃的額外詳細(xì)信息,包括每個算子的輸出列,重分布算子的分布列等。C)Explain通過指定option選項參數(shù)FORMAT來指定輸出格式,默認(rèn)是text格式。D)在Explain的基礎(chǔ)上,添加Performance顯示出計劃的額外詳細(xì)信息,包括每個算子的輸出列,重分布算子的分布列等。答案:ABC解析:[多選題]58.大數(shù)據(jù)計算服務(wù)中,表ods_sale_detail存放的是銷售明細(xì)記錄,建表語句如下:createtableods_sale_detail(sale_datedatetime,regionstring,amtdecimal);其中sale_date字段表示銷售的日期,amt表示銷售金額,想要找出所有匯總銷售額大于10000的日期以及當(dāng)日的銷售額,以下()SQL可以達(dá)到這個目的。A)selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datewhereamt>10000;B)selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datewheresum(amt)>10000;C)selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datehavingsum(amt)>10000;D)select*from(selectsale_date,sum(amt)s_amtfromsale_dategroupbysale_date)subwheres_amt>10000;答案:CD解析:[多選題]59.關(guān)于自頂向下的設(shè)計過程,以下選項錯誤的是()。A)在總體設(shè)計之前就已經(jīng)解決了程序設(shè)計的細(xì)節(jié)B)僅解決程序的細(xì)節(jié)C)計劃的總體設(shè)計在細(xì)節(jié)之前就已解決D)僅解決程序設(shè)計問題答案:ABD解析:[多選題]60.()可以做LSTM學(xué)習(xí)。A)MATLABB)tensorflowC)kreasD)word答案:ABC解析:[多選題]61.在FusionInsight集群規(guī)劃時,以下哪些集群命名是系統(tǒng)允許的?A)FusionInsight-123B)FusionInsight_123C)FusionInsight123D)123FusionInsight答案:BCD解析:[多選題]62.Python的優(yōu)點有()。A)變量不用預(yù)定義類型B)數(shù)據(jù)結(jié)構(gòu)功能強(qiáng)大C)語言可解釋性強(qiáng)D)變量類型固定答案:ABC解析:Python變量在使用前不必定義變量類型。[多選題]63.Redis應(yīng)用開發(fā)在之激動業(yè)務(wù)目標(biāo)時需要考慮以下哪些因素?A)數(shù)據(jù)量B)讀寫性能C)數(shù)據(jù)質(zhì)量D)持久化答案:ABD解析:[多選題]64.Hadoop的特性主要包括:()A)高可靠性B)高可擴(kuò)展性C)高容錯性D)成本高答案:ABC解析:[多選題]65.根據(jù)《大數(shù)據(jù)風(fēng)控平臺項目操作手冊》,日常工作提示(預(yù)警)中,新增()3種工作提示預(yù)警。A)近30天存在外部風(fēng)險信息B)貸后風(fēng)險預(yù)警提示C)存在可引入的集團(tuán)家譜D)待處理的征信申請?zhí)幹么鸢?ABC解析:[多選題]66.下列屬于樸素貝葉斯分類器的特點的是(__)。A)樸素貝葉斯模型假設(shè)屬性之間相互關(guān)聯(lián)B)算法邏輯簡單,易于實現(xiàn)C)實際問題中,運(yùn)用拉普拉斯修正避免了因訓(xùn)練樣本不充分導(dǎo)致概率估計值為0的問題。D)分類過程中時空開銷小答案:BCD解析:[多選題]67.RDD的特征有:A)readonlyB)partitionC)distributionD)fault-tolerance答案:ABCD解析:[多選題]68.下面系統(tǒng)中屬于關(guān)系數(shù)據(jù)庫管理系統(tǒng)的是()A)MS_SQLSERVERB)OracleC)IMSD)DB2答案:ABD解析:[多選題]69.HBase中包含的一些典型的Filter有哪些?A)SingleColumnValueFilterB)FilterListC)RowFilterD)KeyOnlyFilter答案:ABCD解析:[多選題]70.數(shù)據(jù)科學(xué)基本原則中,蘭世界原則指的是()A)精神世界B)數(shù)據(jù)世界C)物理世界D)數(shù)字世界答案:ABC解析:[多選題]71.關(guān)于梯度消失和梯度爆炸,以下說法正確的是:()A)根據(jù)鏈?zhǔn)椒▌t,如果每一層神經(jīng)元對上一層的輸出的偏導(dǎo)乘上權(quán)重結(jié)果都小于1的話,那么即使這個結(jié)果是0.99,在經(jīng)過足夠多層傳播之后,誤差對輸入層的偏導(dǎo)會趨于0B)可以采用ReLU激活函數(shù)有效地解決梯皮消失的情況C)根據(jù)鏈?zhǔn)椒▌t,如果每一層神經(jīng)元對上一層的輸出的偏導(dǎo)乘上權(quán)重結(jié)果都大于1的話,在經(jīng)過足夠多層傳播之后,誤差對輸入層的偏導(dǎo)會趨于無窮大D)可以通過減小初始權(quán)重矩陣的值來緩解棉度爆炸數(shù)也是0-1的數(shù),其連乘后,結(jié)果會變得很小,導(dǎo)致梯度消失。若我們初始化的w是很大答案:ABCD解析:[多選題]72.下列說法正確的是()。A)在Map階段對輸入文件的每個內(nèi)容都解析成一個鍵值對B)在生成每個鍵值對時僅調(diào)用一次map函數(shù)C)在map函數(shù)中,接受一個鍵值對,并陳勝一組中間鍵值對D)在shuffle階段將所有具有相同鍵的鍵值對發(fā)送給同一個reduce函數(shù)答案:ABCD解析:[多選題]73.Kafka每個Partition在物理上對應(yīng)的文件夾下存儲哪些文件?A)素引文件B)配置文件C)用戶文件D)消息文件答案:BC解析:[多選題]74.對于顯示操作以下說法正確的是()A)showdatabase;顯示所有數(shù)據(jù)庫B)showtable;顯示所有表C)showtables;顯示所有表D)showdatabases;顯示所有數(shù)據(jù)庫答案:CD解析:[多選題]75.大數(shù)據(jù)偏見包括()。A)數(shù)據(jù)源的選擇偏見B)算法與模型偏見C)結(jié)果解讀方法的偏見D)數(shù)據(jù)呈現(xiàn)方式的偏見答案:ABCD解析:大數(shù)據(jù)偏見是數(shù)據(jù)科學(xué)項目中必須關(guān)注和加以避免的問題,上述四個活動中均可能出現(xiàn)偏見。[多選題]76.下列選項是數(shù)值數(shù)據(jù)類型(即可用于算術(shù)表達(dá)式)的有()。A)0xffB)99C)122D)"1002"答案:ABC解析:D為字符串類型。[多選題]77.以下屬于HBase特性的有()【選三項】A)可靠性B)高效性C)面向行D)可伸縮以及可在廉價PCServer搭建大規(guī)模結(jié)構(gòu)化存儲集群答案:ABD解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.阿里云MaxComputeSQL中,位運(yùn)算也可以支持隱式類型轉(zhuǎn)換。A)正確B)錯誤答案:錯解析:[判斷題]79.()一句delete語句能刪除多行。A)正確B)錯誤答案:對解析:[判斷題]80.互聯(lián)網(wǎng)是收集大數(shù)據(jù)的唯一途徑A)正確B)錯誤答案:錯解析:[判斷題]81.文本文件是可以迭代的,可以使用forlineinfp類似的語句遍歷文件對象fp中的每一行。A)正確B)錯誤答案:對解析:[判斷題]82.以追加模式打開文件時,文件指針指向文件尾。A)正確B)錯誤答案:對解析:[判斷題]83.如果僅僅是用于控制循環(huán)次數(shù),那么使用foriinrange(20)和foriinrange(20,40)的作用是等價的。A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東科技學(xué)院《素描2》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東江門幼兒師范高等??茖W(xué)校《電子商務(wù)與電子支付》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東行政職業(yè)學(xué)院《土力學(xué)與地基基礎(chǔ)(B)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工貿(mào)職業(yè)技術(shù)學(xué)院《三維技術(shù)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工程職業(yè)技術(shù)學(xué)院《多元統(tǒng)計分析(SPSS)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東財貿(mào)職業(yè)學(xué)院《播音主持創(chuàng)作實踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 《模具開發(fā)》課件
- 基本藥物制度政策培訓(xùn)課件
- 油庫反恐課件培訓(xùn)
- 贛西科技職業(yè)學(xué)院《教師語言與書寫技能》2023-2024學(xué)年第一學(xué)期期末試卷
- GB/T 45002-2024水泥膠砂保水率測定方法
- 2024年《論教育》全文課件
- 浙江省溫州市鹿城區(qū)2023-2024學(xué)年三年級上學(xué)期期末數(shù)學(xué)試卷
- 生命安全與救援學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- (正式版)SHT 3158-2024 石油化工管殼式余熱鍋爐
- 大一中國近代史綱要期末考試試題及答案
- 文創(chuàng)園項目可行性方案
- 馬工程版《中國經(jīng)濟(jì)史》各章思考題答題要點及詳解
- OBE理念下的一流專業(yè)和課程建設(shè)
- 一年級口算天天練(可直接打印)
- 建筑幕墻安裝工程監(jiān)理實施細(xì)則(工程通用版范本)
評論
0/150
提交評論