




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷16)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.下列新客戶風(fēng)險(xiǎn)等級(jí)劃分標(biāo)準(zhǔn)中,說法錯(cuò)的是()A)短期內(nèi)一般可疑報(bào)告次數(shù)為3以上--高風(fēng)險(xiǎn)B)自然人客戶由他人代辦開戶-一般風(fēng)險(xiǎn)C)新開客戶屬于容易洗錢的行業(yè)-高風(fēng)險(xiǎn)D)短期內(nèi)客戶單筆金額為10萬以上的現(xiàn)金收交易累計(jì)3次以上-一般風(fēng)險(xiǎn)答案:C解析:[單選題]2.關(guān)于k-meA、ns說法不正確的是()A)、k-meA、ns聚類是一種典型的基于距離的聚類算法B)、它采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大C)、k-meA、ns聚類的目的是尋找固定數(shù)目的簇,而每個(gè)簇由距離靠近的對(duì)象組成D)、在k-meA、ns聚類中,k個(gè)初始聚類中心點(diǎn)的選取對(duì)聚類結(jié)果的影響不是很大答案:D解析:[單選題]3.通常會(huì)單獨(dú)購買獨(dú)立設(shè)備組為其服務(wù)的行業(yè)是?()A)電商行業(yè)B)金融行業(yè)C)視頻行業(yè)D)新聞網(wǎng)站答案:B解析:[單選題]4.變量的不確定性越大,相對(duì)應(yīng)信息熵的變化是()。A)熵變小B)熵變大C)不變D)以上答案都不正確答案:B解析:信息熵(informationentropy)是度量樣本集合純度最常用的一種指標(biāo),信息熵越大,變量的不確定性越大。[單選題]5.大數(shù)據(jù)分析人員小張發(fā)現(xiàn),所在的互聯(lián)網(wǎng)公司的注冊(cè)人數(shù)往往會(huì)隨著時(shí)間有一定的變化,為了更加直觀展示這種趨勢,最合適的圖表是()A)點(diǎn)圖B)熱力點(diǎn)圖C)線型圖D)雷達(dá)圖答案:C解析:[單選題]6.下列關(guān)于數(shù)據(jù)倉庫隨時(shí)間變化的描述不正確的是()。A)數(shù)據(jù)倉庫隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容B)捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照C)數(shù)據(jù)倉庫隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合答案:C解析:一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。[單選題]7.Flume支持監(jiān)控并傳輸目錄下新增的文件,可實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)傳輸,以下描述的是哪一類Source?A)httpsourceB)execsourceC)syslogsourceD)spoolingdirectorysource答案:D解析:[單選題]8.下面哪個(gè)不是Hadoop的輸出數(shù)據(jù)格式()A)文本輸出B)二進(jìn)制輸出C)單一輸出D)多輸出答案:C解析:Hadoop的輸出數(shù)據(jù)格式分為文本輸出、二進(jìn)制輸出和多輸出。沒有單一輸出數(shù)據(jù)格式。/andrewgb/article/details/49668801[單選題]9.自行車用戶信息表中收集了用戶的各類信息,包括用戶的出生日期及用戶第一次購買自行車的日期。為了得到用戶第一次購買自行車的年齡,應(yīng)使用()函數(shù)。A)DateDiffB)DatePartC)DatetimeToStringD)FormatDate答案:A解析:[單選題]10.表示數(shù)據(jù)分布是否為對(duì)稱性的統(tǒng)計(jì)量是()。A)方差B)中位數(shù)C)偏態(tài)D)峰態(tài)答案:C解析:偏態(tài)(Skewness)描述數(shù)據(jù)分布的對(duì)稱性,當(dāng)偏態(tài)系數(shù)等于0時(shí),對(duì)應(yīng)數(shù)據(jù)的分布為對(duì)稱;否則分布為非對(duì)稱。峰態(tài)(Kurtosis)描述數(shù)據(jù)分布的平峰或尖峰程度,當(dāng)峰態(tài)系數(shù)等于0時(shí),數(shù)據(jù)分布為標(biāo)準(zhǔn)正態(tài)分布;否則比正態(tài)分布更平或更尖。[單選題]11.在SVM中,若想求解非線性情況下的問題可借助于(__)。A)核函數(shù)B)激活函數(shù)C)損失函數(shù)D)優(yōu)化函數(shù)答案:A解析:[單選題]12.以下關(guān)于機(jī)器學(xué)習(xí)描述錯(cuò)誤的是(__)。A)機(jī)器學(xué)習(xí)的目標(biāo)是使學(xué)得的模型能很好地適用于?新樣本?B)學(xué)得模型適用于新樣本的能力,稱為?泛化?能力C)具有強(qiáng)泛化能力的模型不能很好地適用于整個(gè)樣本空間D)一般認(rèn)為,數(shù)據(jù)樣本越多,獲得的模型的泛化能力越強(qiáng)答案:C解析:[單選題]13.以下代碼哪個(gè)能夠打印出138-9922-0202這個(gè)電話號(hào)碼,注意格式需要完全一致?()A)print(?138?)print(?9922?)print(?0202?)B)print(?138?,end=??)print(?9922?,end=??)print(?0202?,end=??)C)print(?138?,sep=?-?)print(?9922?,sep=?-?)print(?0202?,sep=?-?)D)print(?138?,end=?-?)print(?9922?,end=?-?)print(?0202?)答案:D解析:[單選題]14.下列表述正確的是()。A)if語句總是與else成對(duì)出現(xiàn)B)if語句總是與elif成對(duì)出現(xiàn)C)if語句分支嵌套實(shí)現(xiàn)多分支D)if語句只能實(shí)現(xiàn)二分支答案:C解析:if語句可以成單出現(xiàn)也可以與elif、else實(shí)現(xiàn)分支嵌套功能。[單選題]15.()在劃分屬性時(shí)是在當(dāng)前結(jié)點(diǎn)的屬性集合中選擇一個(gè)最優(yōu)屬性。A)AdaBoostB)RFC)BaggingD)傳統(tǒng)決策樹答案:D解析:[單選題]16.()負(fù)責(zé)組織制定管理信息系統(tǒng)數(shù)據(jù)安全保護(hù)方案,并對(duì)安全保護(hù)措施技術(shù)落實(shí)情況進(jìn)行檢查。A)國網(wǎng)安質(zhì)部B)國網(wǎng)信通部C)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組D)國網(wǎng)辦公廳答案:B解析:[單選題]17.關(guān)于批量數(shù)據(jù)處理組件的描述不正確的是?A)Hive:傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理速度較慢。B)SparkSQL:新型SsQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。C)Spark:新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。D)MapReducer傳統(tǒng)批處理引整用于處理非SoL類,尤其是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類批處理作業(yè),使用廣泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。答案:D解析:[單選題]18.()可在保證訓(xùn)練精度的情況下降低模型的復(fù)雜度。A)正則化系數(shù)無窮大B)正則化系數(shù)幾乎為0C)選擇合適的正則化參數(shù)D)以上答案都不正確答案:C解析:選擇合適的正則化參數(shù)可在保證訓(xùn)練精度的情況下降低模型的復(fù)雜度。[單選題]19.下列對(duì)于查全率的描述,解釋正確的是(__)。A)統(tǒng)計(jì)分類器預(yù)測出來的結(jié)果與真實(shí)結(jié)果不相同的個(gè)數(shù),然后除以總的樣例集D的個(gè)數(shù)。B)先統(tǒng)計(jì)分類正確的樣本數(shù),然后除以總的樣例集D的個(gè)數(shù)。C)預(yù)測為正的樣例中有多少是真正的正樣例D)樣本中的正例有多少被預(yù)測正確答案:D解析:[單選題]20.在大數(shù)據(jù)計(jì)算服務(wù)的數(shù)據(jù)倉庫中的訂單表fact_order,建表語句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的數(shù)據(jù)是從ods_order加工而來,ods_order建表語句如下:createtableods_order(order_idstring,order_amtbigint,order_dtstring);ods_order中有一條記錄數(shù)據(jù)值是order_idorder_amtorder_dt000110020160301運(yùn)行SQL語句將數(shù)據(jù)從ods_order加載到fact_order中:insertoverwritetablefact_orderpartition(dt=?20160301?)select*fromods_order;對(duì)此語句的執(zhí)行結(jié)果描述正確的是:()。A)提交SQL時(shí)會(huì)報(bào)語法錯(cuò)誤B)語句可以執(zhí)行,order_amt的值會(huì)被自動(dòng)的轉(zhuǎn)為double類型C)語句可以執(zhí)行,但是這條數(shù)據(jù)會(huì)被當(dāng)作臟數(shù)據(jù)丟棄D)目標(biāo)表與源表中的數(shù)據(jù)類型不一致,執(zhí)行出錯(cuò)答案:B解析:[單選題]21.下面哪個(gè)RDD操作肯定是寬依賴()A)mapB)flatMapC)reduceByKeyD)sample答案:C解析:[單選題]22.若設(shè)1.啟動(dòng),2.診斷,3.建立,4.行動(dòng),5.學(xué)習(xí),則DMM模型中的順序?yàn)?__)。A)12345B)12354C)13254D)13245答案:A解析:[單選題]23.下圖展示了StructuredStreaming的計(jì)算模型。通過觀察可以得出最終T3的計(jì)算結(jié)果是?A)Dog1,owl1B)Cat2,dog4,owl2C)Cat2,dog3,owl1D)Cat1,cat1,dog2,dog2,owl2答案:B解析:[單選題]24.以下()不是大數(shù)據(jù)時(shí)代新興的技術(shù)。A)HadoopB)MySQLC)SparkD)HBase答案:B解析:[單選題]25.下面關(guān)于數(shù)據(jù)加工相關(guān)描述不正確的有(__)。A)數(shù)據(jù)加工是數(shù)據(jù)科學(xué)中關(guān)注的新問題之一B)數(shù)據(jù)加工是為了提升數(shù)據(jù)質(zhì)量、降低數(shù)據(jù)計(jì)算復(fù)雜度C)數(shù)據(jù)科學(xué)中數(shù)據(jù)加工就是傳統(tǒng)數(shù)據(jù)處理D)數(shù)據(jù)脫敏屬于數(shù)據(jù)加工答案:C解析:[單選題]26.屬于有監(jiān)督學(xué)習(xí)的是()A)、k-meA、nB)、主成分分析C)、關(guān)聯(lián)規(guī)則分析D)、線性回歸答案:D解析:[單選題]27.關(guān)于實(shí)時(shí)檢索技術(shù)的應(yīng)用場景,以下描述中錯(cuò)誤的是哪一個(gè)選項(xiàng)?A)公安系統(tǒng)數(shù)據(jù)量大、業(yè)務(wù)要求復(fù)雜,因此無法借助實(shí)時(shí)檢索技術(shù)提高處警效率B)實(shí)時(shí)檢索要求在小批量數(shù)據(jù)集上需達(dá)到毫秒級(jí)的時(shí)延C)在金融風(fēng)控場景中,利用實(shí)時(shí)檢索技術(shù),客戶可以在發(fā)生危險(xiǎn)交易前及時(shí)上損D)運(yùn)營商可以借助實(shí)時(shí)檢索技術(shù),查詢某個(gè)時(shí)間段用戶的流量記錄,以應(yīng)對(duì)不良APP偷跑流量引發(fā)的投訴答案:A解析:[單選題]28.scipy.stats模塊中對(duì)隨機(jī)變量進(jìn)行隨機(jī)取值的函數(shù)是()。A)rvsB)pdfC)cdfD)sf答案:A解析:stats模塊中的rvs函數(shù)對(duì)隨機(jī)變量進(jìn)行取值。[單選題]29.有下面的程序段ifk0:ifk>5:ifk>8:x=0else:x=1else:ifk>2:x=3else:x=4其中k取那組值時(shí)x=3()A)3,4,5B)3,4C)5,6,7D)4,5答案:A解析:[單選題]30.從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)出一組能用于對(duì)未見示例進(jìn)行判別的規(guī)則,這個(gè)過程稱為(__)。A)機(jī)器學(xué)習(xí)B)規(guī)則學(xué)習(xí)C)直推學(xué)習(xí)D)主動(dòng)學(xué)習(xí)答案:B解析:[單選題]31.preprocessing.Normalizer表示(__)。A)一個(gè)函數(shù)B)一個(gè)參數(shù)C)一個(gè)類D)一個(gè)變量答案:C解析:[單選題]32.將兩篇文本通過詞袋模型變?yōu)橄蛄磕P停ㄟ^計(jì)算向量的()來計(jì)算兩個(gè)文本間的相似度。A)正弦距離B)余弦距離C)長度D)方向答案:B解析:[單選題]33.文件book.txt在當(dāng)前程序所在目錄內(nèi),其內(nèi)容是一段文本:book,下面代碼的輸出結(jié)果是:txt=open("book.txt","r")print(txt)txt.close()A)book.txtB)txtC)bookD)以上答案都不對(duì)答案:D解析:[單選題]34.將Python中的.py文件轉(zhuǎn)換為.pyc文件的組件為()。A)編輯器B)編譯器C)虛擬機(jī)D)解釋器答案:B解析:將Python中的.py文件轉(zhuǎn)換為.pyc文件的組件為編譯器。[單選題]35.下面組件哪個(gè)是負(fù)布式資源調(diào)度與管理的:()A)YARNB)FIumeC)ZookeeperD)Kafka答案:A解析:[單選題]36.DRDS的讀策略中不包含:()A)主庫讀B)均衡C)自定義D)主庫寫答案:D解析:[單選題]37.下列選項(xiàng)中,主要用于決定整個(gè)MapReduce程序性能高低的階段是()A)MapTaskB)ReduceTaskC)分片、格式化數(shù)據(jù)源D)Shuffle答案:D解析:Rack是用來存放部署Hadoop集群服務(wù)器的機(jī)架[單選題]38.ETL工具工作過程不包含以下哪項(xiàng)?A)清洗B)傳遞C)加載D)轉(zhuǎn)換答案:B解析:[單選題]39.對(duì)于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,下列說法正確的是()。A)需要將這些樣本全部強(qiáng)制轉(zhuǎn)換為支持向量B)需要將這些樣本中可以轉(zhuǎn)化的樣本轉(zhuǎn)換為支持向量.不能轉(zhuǎn)換的直接刪除C)移去或者減少這些樣本對(duì)分類結(jié)果沒有影響D)以上都不對(duì)答案:C解析:支持向量機(jī)的一個(gè)重要性質(zhì):訓(xùn)練完成后,大部分的訓(xùn)練樣本都不需保留,最終模型僅與支持向量有關(guān)。[單選題]40.(__)是一種著名的過濾式特征選擇方法。A)k-meansB)k近鄰C)支持向量機(jī)D)Relief答案:D解析:[單選題]41.在大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的表中存有一批網(wǎng)站及其相互之間鏈接關(guān)系,開發(fā)人員希望通過pagerank算法來分析這批網(wǎng)站的排名,即把網(wǎng)站看做節(jié)點(diǎn),把網(wǎng)站之間的連接關(guān)系看做權(quán)重,從而實(shí)現(xiàn)對(duì)網(wǎng)站的評(píng)分。()計(jì)算框架更適合實(shí)現(xiàn)這個(gè)場景。A)SQLB)MapReduceC)GraphD)Tunnel答案:C解析:[單選題]42.下列關(guān)于數(shù)據(jù)創(chuàng)新的說法正確的是()。A)多個(gè)數(shù)據(jù)集的總和價(jià)值等于單個(gè)數(shù)據(jù)集價(jià)值相加B)由于數(shù)據(jù)的再利用,數(shù)據(jù)應(yīng)該永久保存下去C)相同數(shù)據(jù)多次用于相同或類似用途,其有效性會(huì)降低D)數(shù)據(jù)只有開放價(jià)值才可以得到真正釋放答案:D解析:略。[單選題]43.刪除經(jīng)銷商1018的數(shù)據(jù)記錄的代碼為()fromdistributorswheredistri_num=1018A)droptableB)delete*C)dropcolumnD)delete答案:D解析:[單選題]44.大數(shù)據(jù)的起源是()A)金融B)電信C)互聯(lián)網(wǎng)D)公共管理答案:C解析:[單選題]45.python3中round(15.5)與round(16.5)的結(jié)果分別為()。A)16,16B)16,17C)17,16D)17,17答案:A解析:[單選題]46.一般將原始業(yè)務(wù)數(shù)據(jù)分為多個(gè)部分,()用于模型的構(gòu)建。A)訓(xùn)練集B)測試集C)驗(yàn)證集D)全部數(shù)據(jù)答案:A解析:訓(xùn)練集、測試集和驗(yàn)證集的功能分別為訓(xùn)練(構(gòu)建)模型、測試模型以及模型選擇與超級(jí)參數(shù)的調(diào)優(yōu)。[單選題]47.關(guān)于Kafka盤容量不足的告警,對(duì)于可能的原因以下分析不正確的是?A)用于存儲(chǔ)Kafka數(shù)據(jù)的磁盤配置(如磁盤數(shù)目、磁盤大小等)無法滿足當(dāng)前業(yè)務(wù)數(shù)據(jù)流量,導(dǎo)致磁盤使用率達(dá)到上限B)數(shù)據(jù)保存時(shí)間配置過長,數(shù)據(jù)累積達(dá)到磁盤使用率上限C)業(yè)務(wù)規(guī)劃不合理,導(dǎo)致數(shù)據(jù)分配不均,使部分磁盤達(dá)到使用率上限。D)Broker節(jié)點(diǎn)故障導(dǎo)致答案:D解析:[單選題]48.數(shù)據(jù)倉庫僅僅是提供存儲(chǔ)的,提供一種()的服務(wù),不面向最終分析用戶:而數(shù)據(jù)集市是()的,面向最終用戶。A)面向分析應(yīng)用、面向數(shù)據(jù)管理B)面向事務(wù)交互、面向數(shù)據(jù)管理C)面向數(shù)據(jù)管理、面向分析應(yīng)用D)面向分析應(yīng)用、面向事務(wù)交互答案:A解析:[單選題]49.在邏輯回歸輸出與日標(biāo)對(duì)比的情況下,以下評(píng)估指標(biāo)中()不適用A)AUC-ROCB)準(zhǔn)確度C)LoglossD)均方誤差答案:D解析:[單選題]50.網(wǎng)站在運(yùn)過程中,會(huì)有用戶訪問并產(chǎn)生行為數(shù)據(jù),要想對(duì)這些數(shù)據(jù)進(jìn)行處理挖掘,如果是高線批處理下的方案配置,描述不正確的是A)球據(jù)存儲(chǔ):HDFS或MySqlB)數(shù)據(jù)導(dǎo)入導(dǎo)出:LoaderC)數(shù)據(jù)采集傳輸:FlumeD)數(shù)據(jù)計(jì)算:Storm答案:D解析:[單選題]51.Hadoop的作者是下面哪一位______。A)MartinFowlerB)DougcuttingC)KentBeckD)GraceHopper答案:B解析:A.MartinFowler【敏捷開發(fā)方法論-軟件開發(fā)教父】B.Dougcutting【Hadoop作者,道格·卡廷】C.KentBeck【極限編程,測試驅(qū)動(dòng)開發(fā),實(shí)現(xiàn)模式】D.GraceHopper【Cobol語言之母,發(fā)明世界上第一個(gè)編譯器】[單選題]52.ResultScanner無參的next()方法返回下一個(gè)可用的行組成的Result實(shí)例,含參的next(rows)方法返回()A)一個(gè)Result實(shí)例B)一個(gè)Result實(shí)例數(shù)組C)一個(gè)整型D)以上都不正確答案:B解析:[單選題]53.對(duì)于隨機(jī)森林和GradientBoostingTrees,下面說法正確的是:A)在隨機(jī)森林的單個(gè)樹中,樹和樹之間是有依賴的,而GradientBoostingTrees中的單個(gè)樹之間是沒有依賴的B)這兩個(gè)模型都使用隨機(jī)特征子集,來生成許多單個(gè)的樹C)我們可以并行地生成GradientBoostingTrees單個(gè)樹,因?yàn)樗鼈冎g是沒有依賴的D)GradientBoostingTrees訓(xùn)練模型的表現(xiàn)總是比隨機(jī)森林好答案:B解析:[單選題]54.()用于說明在父RDD上執(zhí)行何種計(jì)算。A)分區(qū)B)算子C)日志D)數(shù)據(jù)塊答案:B解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.HBase的數(shù)據(jù)文件HFile中一個(gè)KeyValue格式包括哪些信息A)KeyB)ValueC)TimeStampD)KeyType答案:ABCD解析:[多選題]56.在FusionInsight產(chǎn)品中,關(guān)于Kafka組件說法正確的是?A)在創(chuàng)建Topic時(shí),副本數(shù)不得大于當(dāng)前存活的Broker實(shí)例個(gè)數(shù),否則創(chuàng)建Topic將會(huì)失敗B)Kafka的Producer發(fā)送消息時(shí),可以指定該消息被哪個(gè)Consumer消費(fèi)C)Kafka會(huì)將元數(shù)據(jù)信息存放到Zookeeper上D)Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄答案:ACD解析:[多選題]57.下列關(guān)于Explain的關(guān)鍵字描述正確的是()A)在Explain的基礎(chǔ)上,通過添加Analyze同時(shí)顯示該語句執(zhí)行時(shí)每個(gè)算子的實(shí)際開銷(單位B毫秒)和行數(shù)信息,對(duì)于判斷優(yōu)化器的估算是否準(zhǔn)確提供依據(jù)。B)在Explain的基礎(chǔ)上,添加Verbose顯示出計(jì)劃的額外詳細(xì)信息,包括每個(gè)算子的輸出列,重分布算子的分布列等。C)Explain通過指定option選項(xiàng)參數(shù)FORMAT來指定輸出格式,默認(rèn)是text格式。D)在Explain的基礎(chǔ)上,添加Performance顯示出計(jì)劃的額外詳細(xì)信息,包括每個(gè)算子的輸出列,重分布算子的分布列等。答案:ABC解析:[多選題]58.大數(shù)據(jù)計(jì)算服務(wù)中,表ods_sale_detail存放的是銷售明細(xì)記錄,建表語句如下:createtableods_sale_detail(sale_datedatetime,regionstring,amtdecimal);其中sale_date字段表示銷售的日期,amt表示銷售金額,想要找出所有匯總銷售額大于10000的日期以及當(dāng)日的銷售額,以下()SQL可以達(dá)到這個(gè)目的。A)selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datewhereamt>10000;B)selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datewheresum(amt)>10000;C)selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datehavingsum(amt)>10000;D)select*from(selectsale_date,sum(amt)s_amtfromsale_dategroupbysale_date)subwheres_amt>10000;答案:CD解析:[多選題]59.關(guān)于自頂向下的設(shè)計(jì)過程,以下選項(xiàng)錯(cuò)誤的是()。A)在總體設(shè)計(jì)之前就已經(jīng)解決了程序設(shè)計(jì)的細(xì)節(jié)B)僅解決程序的細(xì)節(jié)C)計(jì)劃的總體設(shè)計(jì)在細(xì)節(jié)之前就已解決D)僅解決程序設(shè)計(jì)問題答案:ABD解析:[多選題]60.()可以做LSTM學(xué)習(xí)。A)MATLABB)tensorflowC)kreasD)word答案:ABC解析:[多選題]61.在FusionInsight集群規(guī)劃時(shí),以下哪些集群命名是系統(tǒng)允許的?A)FusionInsight-123B)FusionInsight_123C)FusionInsight123D)123FusionInsight答案:BCD解析:[多選題]62.Python的優(yōu)點(diǎn)有()。A)變量不用預(yù)定義類型B)數(shù)據(jù)結(jié)構(gòu)功能強(qiáng)大C)語言可解釋性強(qiáng)D)變量類型固定答案:ABC解析:Python變量在使用前不必定義變量類型。[多選題]63.Redis應(yīng)用開發(fā)在之激動(dòng)業(yè)務(wù)目標(biāo)時(shí)需要考慮以下哪些因素?A)數(shù)據(jù)量B)讀寫性能C)數(shù)據(jù)質(zhì)量D)持久化答案:ABD解析:[多選題]64.Hadoop的特性主要包括:()A)高可靠性B)高可擴(kuò)展性C)高容錯(cuò)性D)成本高答案:ABC解析:[多選題]65.根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,日常工作提示(預(yù)警)中,新增()3種工作提示預(yù)警。A)近30天存在外部風(fēng)險(xiǎn)信息B)貸后風(fēng)險(xiǎn)預(yù)警提示C)存在可引入的集團(tuán)家譜D)待處理的征信申請(qǐng)?zhí)幹么鸢?ABC解析:[多選題]66.下列屬于樸素貝葉斯分類器的特點(diǎn)的是(__)。A)樸素貝葉斯模型假設(shè)屬性之間相互關(guān)聯(lián)B)算法邏輯簡單,易于實(shí)現(xiàn)C)實(shí)際問題中,運(yùn)用拉普拉斯修正避免了因訓(xùn)練樣本不充分導(dǎo)致概率估計(jì)值為0的問題。D)分類過程中時(shí)空開銷小答案:BCD解析:[多選題]67.RDD的特征有:A)readonlyB)partitionC)distributionD)fault-tolerance答案:ABCD解析:[多選題]68.下面系統(tǒng)中屬于關(guān)系數(shù)據(jù)庫管理系統(tǒng)的是()A)MS_SQLSERVERB)OracleC)IMSD)DB2答案:ABD解析:[多選題]69.HBase中包含的一些典型的Filter有哪些?A)SingleColumnValueFilterB)FilterListC)RowFilterD)KeyOnlyFilter答案:ABCD解析:[多選題]70.數(shù)據(jù)科學(xué)基本原則中,蘭世界原則指的是()A)精神世界B)數(shù)據(jù)世界C)物理世界D)數(shù)字世界答案:ABC解析:[多選題]71.關(guān)于梯度消失和梯度爆炸,以下說法正確的是:()A)根據(jù)鏈?zhǔn)椒▌t,如果每一層神經(jīng)元對(duì)上一層的輸出的偏導(dǎo)乘上權(quán)重結(jié)果都小于1的話,那么即使這個(gè)結(jié)果是0.99,在經(jīng)過足夠多層傳播之后,誤差對(duì)輸入層的偏導(dǎo)會(huì)趨于0B)可以采用ReLU激活函數(shù)有效地解決梯皮消失的情況C)根據(jù)鏈?zhǔn)椒▌t,如果每一層神經(jīng)元對(duì)上一層的輸出的偏導(dǎo)乘上權(quán)重結(jié)果都大于1的話,在經(jīng)過足夠多層傳播之后,誤差對(duì)輸入層的偏導(dǎo)會(huì)趨于無窮大D)可以通過減小初始權(quán)重矩陣的值來緩解棉度爆炸數(shù)也是0-1的數(shù),其連乘后,結(jié)果會(huì)變得很小,導(dǎo)致梯度消失。若我們初始化的w是很大答案:ABCD解析:[多選題]72.下列說法正確的是()。A)在Map階段對(duì)輸入文件的每個(gè)內(nèi)容都解析成一個(gè)鍵值對(duì)B)在生成每個(gè)鍵值對(duì)時(shí)僅調(diào)用一次map函數(shù)C)在map函數(shù)中,接受一個(gè)鍵值對(duì),并陳勝一組中間鍵值對(duì)D)在shuffle階段將所有具有相同鍵的鍵值對(duì)發(fā)送給同一個(gè)reduce函數(shù)答案:ABCD解析:[多選題]73.Kafka每個(gè)Partition在物理上對(duì)應(yīng)的文件夾下存儲(chǔ)哪些文件?A)素引文件B)配置文件C)用戶文件D)消息文件答案:BC解析:[多選題]74.對(duì)于顯示操作以下說法正確的是()A)showdatabase;顯示所有數(shù)據(jù)庫B)showtable;顯示所有表C)showtables;顯示所有表D)showdatabases;顯示所有數(shù)據(jù)庫答案:CD解析:[多選題]75.大數(shù)據(jù)偏見包括()。A)數(shù)據(jù)源的選擇偏見B)算法與模型偏見C)結(jié)果解讀方法的偏見D)數(shù)據(jù)呈現(xiàn)方式的偏見答案:ABCD解析:大數(shù)據(jù)偏見是數(shù)據(jù)科學(xué)項(xiàng)目中必須關(guān)注和加以避免的問題,上述四個(gè)活動(dòng)中均可能出現(xiàn)偏見。[多選題]76.下列選項(xiàng)是數(shù)值數(shù)據(jù)類型(即可用于算術(shù)表達(dá)式)的有()。A)0xffB)99C)122D)"1002"答案:ABC解析:D為字符串類型。[多選題]77.以下屬于HBase特性的有()【選三項(xiàng)】A)可靠性B)高效性C)面向行D)可伸縮以及可在廉價(jià)PCServer搭建大規(guī)模結(jié)構(gòu)化存儲(chǔ)集群答案:ABD解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.阿里云MaxComputeSQL中,位運(yùn)算也可以支持隱式類型轉(zhuǎn)換。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.()一句delete語句能刪除多行。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]80.互聯(lián)網(wǎng)是收集大數(shù)據(jù)的唯一途徑A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.文本文件是可以迭代的,可以使用forlineinfp類似的語句遍歷文件對(duì)象fp中的每一行。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.以追加模式打開文件時(shí),文件指針指向文件尾。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.如果僅僅是用于控制循環(huán)次數(shù),那么使用foriinrange(20)和foriinrange(20,40)的作用是等價(jià)的。A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于界面斷裂損傷的鋼橋面瀝青鋪裝層粘結(jié)失效行為及機(jī)理研究
- 體育期末教學(xué)工作總結(jié)(20篇)
- 中介電子合同范本
- 施工合同與中標(biāo)合同范本
- 水稻銷售合同范本
- 無機(jī)-有機(jī)混酸回收廢脫硝催化劑中釩的研究
- 2025年全熱風(fēng)載流焊機(jī)項(xiàng)目合作計(jì)劃書
- 瘠性陶瓷漿料的穩(wěn)定性判據(jù)研究
- 川西地區(qū)二疊系烴源巖特征及生烴潛力評(píng)價(jià)
- 商業(yè)健康保險(xiǎn)AI智能設(shè)備企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 《智能建造導(dǎo)論》 課件 劉占省 第1-5章 智能建造的興起-智能建造與全生命周期的目標(biāo)規(guī)劃
- 經(jīng)濟(jì)數(shù)學(xué)《線性代數(shù)》期末試卷一(含答案解析)
- 個(gè)人民事起訴狀模板
- 勞務(wù)人員管理制度(7篇)
- 事故隱患安全培訓(xùn)事故排查安全隱患
- 新人教版高中數(shù)學(xué)選擇性必修第一冊(cè)全套精品課件
- 新公務(wù)員法培訓(xùn)課件
- 領(lǐng)導(dǎo)干部的國學(xué)修養(yǎng)講義
- 05-第三章-環(huán)境污染物的生物轉(zhuǎn)運(yùn)和生物轉(zhuǎn)化-生物轉(zhuǎn)化幻燈片
- 公司精益改善項(xiàng)目推進(jìn)管理制度及激勵(lì)方案
- 工科高等數(shù)學(xué)(下)知到章節(jié)答案智慧樹2023年上海海洋大學(xué)
評(píng)論
0/150
提交評(píng)論