大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷57)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷57)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷57)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷57)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷57)_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷57)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共54題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.在Matplotlib中調(diào)整后可以顯示中文的參數(shù)是()。A)lines.linestyleB)lines.linewidthC)font.sans-serifD)axes.unicodeminus答案:C解析:C項(xiàng)是在plt.rcparams中設(shè)置字體以正確顯示中文。[單選題]2.YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)下列選項(xiàng)中的()進(jìn)行標(biāo)簽化。A)AppMasterB)ResourceManagerC)NodeManagerD)Container答案:C解析:[單選題]3.構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò),將前一層的輸出和它自身作為輸入()有反饋連接A)循環(huán)神經(jīng)網(wǎng)絡(luò)B)卷積神經(jīng)網(wǎng)絡(luò)C)限制玻爾茲曼機(jī)D)都不是答案:A解析:[單選題]4.若將2轉(zhuǎn)換為0b10,應(yīng)該使用()函數(shù)。A)oct()B)bin()C)hex()D)int()答案:B解析:[單選題]5.以下()在關(guān)系模型中表示屬性的取值范圍。--A)元組B)鍵C)屬性D)域答案:D解析:[單選題]6.()采用概率模型來表達(dá)聚類原型。A)K均值算法B)學(xué)習(xí)向量量化C)高斯混合聚類D)密度聚類答案:C解析:[單選題]7.下列屬于分組表中的是()A)形狀B)風(fēng)格C)背景D)標(biāo)題答案:A解析:class="fr-ficfr-dib"BCD其他表都有。[單選題]8.Python使用()關(guān)鍵字自定義一個(gè)函數(shù)。A)functionB)funcC)defD)lambda答案:C解析:[單選題]9.多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()A)一對(duì)一B)一對(duì)其余C)一對(duì)多D)多對(duì)多答案:A解析:[單選題]10.(__)代表的是生成數(shù)據(jù)的機(jī)構(gòu)。A)數(shù)據(jù)資源B)數(shù)據(jù)源C)數(shù)據(jù)端D)數(shù)據(jù)站答案:A解析:[單選題]11.對(duì)組織機(jī)構(gòu)的數(shù)據(jù)管理成熟度等級(jí)劃分中的已執(zhí)行級(jí)的描述錯(cuò)誤的是()。A)在具體項(xiàng)目中,DMM關(guān)鍵過程域(KPA)中給出的關(guān)鍵過程已被執(zhí)行,但隨意性和臨時(shí)性較大B)DMM關(guān)鍵過程的執(zhí)行不僅僅局限于特定業(yè)務(wù)范疇,存在跨越不同業(yè)務(wù)領(lǐng)域的關(guān)鍵過程C)缺少針對(duì)DMM關(guān)鍵過程的反饋與優(yōu)化D)雖然有可能在特定業(yè)務(wù)過程中進(jìn)行了基礎(chǔ)性改進(jìn),但沒有進(jìn)行持續(xù)跟進(jìn),也未拓展到整個(gè)組織機(jī)構(gòu)答案:B解析:DMM的執(zhí)行級(jí)(PerformedLevel):組織機(jī)構(gòu)只在個(gè)別項(xiàng)目的范圍之內(nèi)"執(zhí)行"了DMM給出的關(guān)鍵過程,但缺乏機(jī)構(gòu)層次的統(tǒng)籌與管理。主要特點(diǎn)如下:①在具體項(xiàng)目中,DMM關(guān)鍵過程域(KPA)中給出的關(guān)鍵過程(KeyProcess)已被執(zhí)行,但隨意性和臨時(shí)性較大。②DMM關(guān)鍵過程(KeyProcess)的執(zhí)行往往僅限于特定業(yè)務(wù)范疇,很少存在跨越不同業(yè)務(wù)領(lǐng)域的關(guān)鍵過程。③缺少針對(duì)DMM關(guān)鍵過程(KeyProcess)的反饋與優(yōu)化。以DMM關(guān)鍵過程(KeyProcess)中的"數(shù)據(jù)質(zhì)量"為例,其數(shù)據(jù)管理工作可能過于集中在一個(gè)特定業(yè)務(wù),如"數(shù)據(jù)修復(fù)活動(dòng)",并沒有擴(kuò)散到整個(gè)的業(yè)務(wù)范圍或并沒有開展對(duì)數(shù)據(jù)修復(fù)活動(dòng)本身的反饋與優(yōu)化工作;④雖然有可能在特定業(yè)務(wù)過程中已進(jìn)行了基礎(chǔ)性改進(jìn),但沒有進(jìn)行持續(xù)跟進(jìn),也未拓展到整個(gè)組織機(jī)構(gòu);⑤)組織機(jī)構(gòu)沒有統(tǒng)籌其數(shù)據(jù)管理工作,而數(shù)據(jù)管理活動(dòng)局限在具體項(xiàng)目中,主要按照其具體項(xiàng)目的實(shí)施需求進(jìn)行,如果一個(gè)具體項(xiàng)目中需要進(jìn)行數(shù)據(jù)管理,可能會(huì)執(zhí)行DMM中給出的相關(guān)過程,反之亦然。[單選題]12.云計(jì)算包括3種類型。面向所有用戶提供服務(wù),只要是注冊(cè)付費(fèi)的用戶都可以使用,這種云計(jì)算屬于:()A)公有云B)私有云C)混合云D)獨(dú)立云答案:A解析:[單選題]13.DAGScheduler將每個(gè)()打包成TaskSet交給TaskScheduler調(diào)度。A)TaskB)JobC)DAGD)Stage答案:D解析:[單選題]14.關(guān)于Python語言的特點(diǎn),以下選項(xiàng)中描述錯(cuò)誤的是()。A)Python語言是非開源語言B)Python語言是跨平臺(tái)語言C)$;$Python語言是多模型語言D)Python語言是腳本語言答案:A解析:[單選題]15.以下選項(xiàng)中由客戶端編碼決定的是()。--A)character_set_serverB)character_set_databaseC)character_sets_dirD)character_set_results答案:D解析:[單選題]16.假設(shè)屬性income的最大最小值分別是98000元和12000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性income的73600元將被轉(zhuǎn)化為()。A)0.821B)1.224C)1.45D)0.716答案:D解析:[單選題]17.HBase中可以啟動(dòng)多個(gè)HMaster,通過ZooKeeper的主選舉(MasterElection)機(jī)制保證總有()Master在運(yùn)行A)1個(gè)B)2個(gè)C)多個(gè)D)以上都不正確答案:A解析:[單選題]18.引用集合數(shù)據(jù)類型中的元素選擇sub數(shù)組中第一個(gè)元素進(jìn)行查詢,正確的是()A)selectname,subordinates[0]fromemplyees;B)selectname,subordinates[1]fromemplyees;C)selectname,subordinatesfromemplyees;D)以上都不正確答案:A解析:[單選題]19.在能源互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)架構(gòu)中,()將不僅作為能源傳輸、轉(zhuǎn)換的樞紐,更是承載各種服務(wù),連接各方利益,實(shí)現(xiàn)信息交互、共享,支撐各種交易的平臺(tái)。A)電能B)電網(wǎng)C)電廠D)電力設(shè)備制造企業(yè)答案:B解析:[單選題]20.YARN服務(wù)中,如果要給隊(duì)列QueueA設(shè)置容量為30%,應(yīng)該配置哪個(gè)參數(shù)?A)yarn.scheduler.capacity.root.Queueuser.limit-factorB)yarn.scheduler.capacity.root.QueueA.minimun-suer-limit-precentC)yarn.scheduler.capacity.root.QueueA.capacityD)yarn.scheduler.capacity.root.QueueA.state答案:C解析:[單選題]21.S和T是兩個(gè)集合,對(duì)S|T的描述正確的是()A)、S和T的差運(yùn)算,包括在集合S但不在T中的元素B)、S和T的并運(yùn)算,包括在集合S和T中的所有元素C)、S和T的交運(yùn)算,包括同時(shí)在集合S和T中的元素D)、S和T的補(bǔ)運(yùn)算,包括集合S和T中的非相同元素答案:B解析:[單選題]22.HDfS中的block默認(rèn)保存幾份?A)3份B)2份C)1份D)不確定答案:A解析:HDFS默認(rèn)BlockSize64MB,block默認(rèn)保存3份。記住即可[單選題]23.使用OTSJavaSDK進(jìn)行表操作時(shí)需要?jiǎng)?chuàng)建,以下()不屬于構(gòu)造此對(duì)象時(shí)必須提供的信息。A)實(shí)例名稱B)AccountIDC)EndpointD)AccessKeySecret答案:B解析:[單選題]24.數(shù)據(jù)資產(chǎn)維護(hù)是指為保證數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)進(jìn)行()等處理的過程。A)更正B)刪除C)補(bǔ)充錄入D)以上答案都正確答案:D解析:數(shù)據(jù)資產(chǎn)維護(hù)是指為保證數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)進(jìn)行更正、刪除、補(bǔ)充錄入等處理的過程。[單選題]25.下面屬于查詢分析計(jì)算技術(shù)的是:()A)SparkB)StormC)HiveD)Pregel答案:C解析:[單選題]26.HDFS讀取文件時(shí)用的是哪一個(gè)read方法?A)DataInputStreamB)FSDataInputStreamC)DataOutputStreamD)FSDataOutputStream答案:B解析:[單選題]27.執(zhí)行以下代碼段importmathprint(math.factorial(5))時(shí),輸出為()。A)120B)15C)[1,2,3,4,5]D)3125答案:A解析:[單選題]28.altertabletableNamesettblproperties('EXTERNAL?='FALSE?);執(zhí)行該Hive命令能實(shí)現(xiàn)以下哪一個(gè)目標(biāo)?A)修改外部表tableName為內(nèi)部表B)刪除tableName表的元數(shù)據(jù)信息C)修改內(nèi)部表tableName為外部表D)移動(dòng)tableName數(shù)據(jù)到外部存儲(chǔ)系統(tǒng)答案:A解析:[單選題]29.下列關(guān)于HDFS機(jī)架感知中兩個(gè)DataNode之間的距離說法哪個(gè)不正確?A)同一個(gè)DataNode之間的distance為0;B)同一個(gè)rack下的不同的DataNode之間的distance為2;C)同一個(gè)IDC下的不同的DataNode之間的distance為4;D)不同的IDC下的DataNode之間的distance為8;答案:D解析:[單選題]30.下列能體現(xiàn)大數(shù)據(jù)思維的是()A)大數(shù)據(jù)思維是要追求數(shù)據(jù)的精確性B)大數(shù)據(jù)思維是要抓住樣本數(shù)據(jù)C)大數(shù)據(jù)思維是要通過少量數(shù)據(jù)觀察數(shù)據(jù)間關(guān)系D)大數(shù)據(jù)思維是要從自然思維轉(zhuǎn)變?yōu)橹悄芩季S答案:D解析:[單選題]31.以下可以用于比較運(yùn)算的函數(shù)是()。--A)RAND()B)POW()C)CEIL()D)IN()答案:D解析:[單選題]32.數(shù)據(jù)的可用性取決于()。A)數(shù)據(jù)分析B)數(shù)據(jù)集采C)數(shù)據(jù)質(zhì)量D)數(shù)據(jù)需求答案:C解析:[單選題]33.為了防止個(gè)人信息泄露,下列做法不正確的是()。A)關(guān)閉電腦攝像頭B)不下載不明APPC)抖音發(fā)布個(gè)人地址D)手機(jī)設(shè)置多重密碼答案:C解析:[單選題]34.以下屬于Hive的架構(gòu)組件的是?A)HLogB)DriverC)MasterD)NameNode答案:B解析:[單選題]35.關(guān)于Hive建表基本操作,描述正確的是:()。A)一旦表建好,不可再修改表名B)一旦表建好,不可再增加新列C)創(chuàng)建外表時(shí)需要指定external關(guān)鍵字D)一旦表建好,不可再修改列名答案:C解析:[單選題]36.下列關(guān)于traintestsplit函數(shù)的說法正確的是()。A)train_test_split能夠?qū)?shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集B)生成的訓(xùn)練集和測試集在賦值的時(shí)候可以調(diào)換位置,系統(tǒng)能夠自動(dòng)識(shí)別C)train_test_split每次的劃分結(jié)果不同,無法解決D)train_test_split函數(shù)可以自行決定訓(xùn)練集和測試集的占比答案:D解析:[單選題]37.創(chuàng)建Loader作業(yè)中,可以在以下哪個(gè)步驟中設(shè)置過濾器類型?A)輸入設(shè)置B)轉(zhuǎn)換C)基本信息D)輸出答案:A解析:[單選題]38.主節(jié)點(diǎn)程序()。A)NameNodeB)DataNodeC)SecondaryNameNodeD)Jobtracker答案:A解析:[單選題]39.運(yùn)行以下程序,輸出結(jié)果的是:str1="NanjingUniversity"str2=str1[:7]+"Normal"+str1[-10:]print(str2)A)NormalUB)NanjingNormalC)NormalUniversityD)NanjingNormalUniversity答案:D解析:[單選題]40.當(dāng)數(shù)據(jù)經(jīng)過設(shè)計(jì)好的流程處理后,接下來需要進(jìn)行可視化展示。在DEEP中需要將處理后的數(shù)據(jù)落地到(),就能在DEEP可視化模塊中進(jìn)行可視化展示。A)云數(shù)據(jù)庫的表中B)關(guān)系數(shù)據(jù)庫C)數(shù)據(jù)源D)Excel的工作表中答案:A解析:[單選題]41.在HBase的專用過濾器中,單列排除過濾器是()A)SingleValueExcludeFilterB)SingleColumnExcludeFilterC)SingleColumnValueExcludeFilterD)ColumnValueExcludeFilter答案:C解析:[單選題]42.DIKW金字塔模型中,頂層與底層的名稱分別為()。A)智慧與數(shù)據(jù)B)知識(shí)與數(shù)據(jù)C)智慧與數(shù)值D)知識(shí)與數(shù)值答案:A解析:[單選題]43.Python尋找標(biāo)識(shí)符命名空間的順序是()。A)Python首先搜索全局命名空間,然后搜索本地命名空間,最后搜索內(nèi)置命名空間B)Python首先搜索本地命名空間,然后是全局命名空間,最后是內(nèi)置命名空間C)Python首先搜索內(nèi)置命名空間,然后搜索全局命名空間,最后是本地命名空間D)Python首先搜索內(nèi)置命名空間,然后是本地命名空間,最后是全局命名空間答案:B解析:[單選題]44.劃分聚類算法是一種簡單的較為基本的重要聚類方法。它的主要思想是通過將數(shù)據(jù)點(diǎn)集分為()個(gè)劃分,并使用重復(fù)的控制策略使某個(gè)準(zhǔn)則最優(yōu)化,以達(dá)到最終的結(jié)果A)DB)KC)ED)F答案:B解析:劃分聚類算法K-Means將數(shù)據(jù)點(diǎn)集分為K個(gè)子集。[單選題]45.點(diǎn)擊率問題是這樣一個(gè)預(yù)測問題,99%的人是不會(huì)點(diǎn)擊的,而1%的人是會(huì)點(diǎn)擊進(jìn)去的,所以這是一個(gè)非常不平衡的數(shù)據(jù)集。假設(shè),現(xiàn)在我們已經(jīng)建了一個(gè)模型來分類,而且有了99%的預(yù)測準(zhǔn)確率,我們可以下的結(jié)論是()。A)模型預(yù)測準(zhǔn)確率已經(jīng)很高了,我們不需要做什么了B)模型預(yù)測準(zhǔn)確率不高,我們需要做點(diǎn)什么改進(jìn)模型C)無法下結(jié)論D)以上答案都不正確答案:C解析:類別不均衡的情況下,不能用準(zhǔn)確率做分類評(píng)估指標(biāo),因?yàn)槿袛酁椴粫?huì)點(diǎn),準(zhǔn)確率也是99%,此時(shí)分類器一點(diǎn)用都沒有。[單選題]46.數(shù)據(jù)科學(xué)家采用()方法判斷數(shù)據(jù)是否?干凈?。A)、數(shù)據(jù)處理B)、數(shù)據(jù)加工C)、數(shù)據(jù)審計(jì)D)、數(shù)據(jù)化答案:C解析:[單選題]47.在k均值算法中,假定聚類簇?cái)?shù)k=3,則在算法開始時(shí)隨機(jī)選?。╛_)個(gè)樣本作為初始均值向量A)1B)2C)3D)任意答案:C解析:[單選題]48.電商大數(shù)據(jù)存在的安全風(fēng)險(xiǎn)不包括()。A)數(shù)據(jù)版權(quán)缺乏保護(hù)B)數(shù)據(jù)產(chǎn)權(quán)歸屬不清C)大數(shù)據(jù)?殺熟?現(xiàn)象D)業(yè)務(wù)數(shù)據(jù)跨境傳輸答案:C解析:[單選題]49.以下不能創(chuàng)建一個(gè)字典的語句是A)dict1={}B)dict2={3:5}C)dict3={[1,2,3]:?uestc?}D)dict4={(1,2,3):?uestc?}答案:C解析:[單選題]50.關(guān)于下列Python語句的說法正確的是()ifi==1:s=1A)i==1,s=1都是賦值語句B)i==1,s=1都是關(guān)系表達(dá)式C)i==1是關(guān)系表達(dá)式,s=1是賦值語句D)i==1是賦值語句,s=1是關(guān)系表達(dá)式答案:C解析:[單選題]51.下面關(guān)于關(guān)系數(shù)據(jù)庫特點(diǎn)的描述,錯(cuò)誤的是:()A)采用表格的儲(chǔ)存方式,數(shù)據(jù)以行和列的方式進(jìn)行存儲(chǔ),要讀取和査詢都方便B)為了規(guī)范化數(shù)據(jù)、減少重復(fù)數(shù)據(jù)以及利用好存儲(chǔ)空間,把數(shù)據(jù)按照蟻小關(guān)系表的形式進(jìn)行存儲(chǔ)C)由于關(guān)系數(shù)據(jù)庫將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)表中,數(shù)據(jù)操作的瓶頸岀現(xiàn)在多張數(shù)據(jù)表的操作中.而且數(shù)據(jù)表越多這個(gè)問題越嚴(yán)重D)關(guān)系數(shù)據(jù)庫采用非結(jié)構(gòu)化査詢語言來對(duì)數(shù)據(jù)庫進(jìn)行査詢答案:D解析:[單選題]52.下列濾波器中對(duì)圖像中的椒鹽噪聲濾波效果最好的是()。A)中值濾波B)均值濾波C)最大值濾波D)最小值濾波答案:A解析:[單選題]53.大數(shù)據(jù)的起源()A)電信B)互聯(lián)網(wǎng)C)金融D)公共管理答案:B解析:[單選題]54.Kafka中數(shù)據(jù)從Producer到Broker和Broker到Consumer分別是那種傳遞方式A)pullpushB)pullpullC)pushpushD)pushpull答案:D解析:第2部分:多項(xiàng)選擇題,共26題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.數(shù)據(jù)表在設(shè)計(jì)時(shí)應(yīng)遵循以下()原則。--A)避免數(shù)據(jù)經(jīng)常發(fā)生變化B)避免經(jīng)常修改表結(jié)構(gòu)C)盡可能詳細(xì)地記錄日志D)避免刪除數(shù)據(jù)答案:ABCD解析:[多選題]56.以下正確的指令有()。A)pipupdateB)pipinstall-UpipC)piplistD)pip--help答案:BCD解析:[多選題]57.大數(shù)據(jù)分析相關(guān)技術(shù)主要特征包括?A)機(jī)器學(xué)習(xí),全量特征B)數(shù)據(jù)背后事件關(guān)聯(lián)性分析C)基于海量數(shù)據(jù)為基礎(chǔ)D)基于精確樣本為基礎(chǔ)答案:ABC解析:[多選題]58.Flume進(jìn)程級(jí)聯(lián)時(shí),以下哪些sink類型用于接收上一跳Flume發(fā)送過來的數(shù)據(jù)?A)avrosinkB)thriftsinkC)HDFSsinkD)NullSink答案:BC解析:[多選題]59.釋放預(yù)處理語句使用()。--A)ALLOCATEPREPAREB)DEALLOCATEPREPAREC)DELETEPREPARED)DROPPREPARE答案:BD解析:[多選題]60.下列表示同一種學(xué)習(xí)方法的是(__)。A)集成學(xué)習(xí)B)多分類器系統(tǒng)C)基于委員會(huì)的學(xué)習(xí)D)平均策略答案:ABC解析:[多選題]61.某大數(shù)據(jù)業(yè)務(wù)人員因誤操作,導(dǎo)致某條Hive的Insert語句執(zhí)行了多次,使得數(shù)據(jù)出現(xiàn)了重復(fù)的現(xiàn)象,為了避免下次再次出現(xiàn)這種問題。以下哪些操作是可取的?A)添動(dòng)加Hive表的唯一索引,保正數(shù)據(jù)不重復(fù)。B)改造SQL語句,在插入前添動(dòng)加清空操作如truncateC)改造SQL語句,添加關(guān)鍵字Overwrite使得數(shù)據(jù)以夏蓋的方式寫入。D)添動(dòng)加權(quán)限,使得業(yè)務(wù)人員只執(zhí)行單次插入。答案:ABCD解析:[多選題]62.ADS提供()批量導(dǎo)入數(shù)據(jù)的方式。A)通過batchinsert命令B)通過rest-likeapi方式C)通過insertD)datapipeline系列命令答案:CD解析:[多選題]63.以下能創(chuàng)建一個(gè)字典的語句是()。A)dict1={}B)dict2={3:5}C)dict3=dict([2,5],[3,4])D)dict4=dict(([1,2],[3,4]))答案:ABD解析:[多選題]64.按照應(yīng)用類型,F(xiàn)link窗口可以劃分為以下哪幾種?A)事件窗口B)容量窗口C)滾動(dòng)窗口D)時(shí)間窗口答案:ACD解析:[多選題]65.實(shí)時(shí)檢索的解決方案中有哪些組件?A)HBaseB)HadoopC)ElasticSearchD)Hive答案:AC解析:[多選題]66.避免?數(shù)據(jù)孤島?的方法包括:A)關(guān)鍵匹配變量B)數(shù)據(jù)融合C)數(shù)據(jù)輸入D)利用樣本框答案:ABD解析:[多選題]67.某開發(fā)團(tuán)隊(duì)要使用E1asticSearch做檢索工具,下列哪些選項(xiàng)可以用E1asticSearch檢索?A)關(guān)系型數(shù)據(jù)庫數(shù)據(jù)B)圖片C)xml文檔D)向量化數(shù)據(jù)答案:ABC解析:[多選題]68.以下關(guān)于函數(shù)的作用描述正確的是()。A)減少代碼重復(fù)B)將復(fù)雜的問題分解為更簡單的部分C)提高代碼的清晰度D)提高語句的共享性答案:ABCD解析:[多選題]69.生成一個(gè)新的RDD方式有:A)從其他stablestorage讀取生成B)定義一個(gè)RDD變量C)從其他RDD轉(zhuǎn)換而來D)由一個(gè)已經(jīng)存在的Scala集合創(chuàng)建答案:ACD解析:[多選題]70.對(duì)RDD執(zhí)行的操作有一下幾種:A)創(chuàng)建B)轉(zhuǎn)換C)控制D)執(zhí)行答案:ABCD解析:[多選題]71.以下哪層是卷積神經(jīng)網(wǎng)絡(luò)的組成部分(A)卷積層B)中間層C)池化層D)全連接層答案:ACD解析:卷積神經(jīng)網(wǎng)絡(luò)的組成部分不包括中間層。[多選題]72.關(guān)于HDFS中NameNode的作用描述的正確的是?A)管理HDFS的名稱空間(NameSpace)B)配置副本策略通常為3份C)處理客戶端讀寫請(qǐng)求D)執(zhí)行數(shù)據(jù)塊的讀/寫操作答案:ABC解析:[多選題]73.下列關(guān)于偏差、方差、均方差、泛化誤差的作用表述正確的是(__)。A)偏差刻畫了模型本身的擬合能力B)方差刻畫了數(shù)據(jù)擾動(dòng)所造成的影響C)噪聲刻畫了學(xué)習(xí)問題本身的難度D)泛化誤差可分解為方差與噪音之和。答案:ABC解析:[多選題]74.下列可以用于實(shí)現(xiàn)爬蟲功能的有()。A)BeautifulSoup庫B)re模塊C)Scrapy框架D)urllibrequest庫答案:ACD解析:re是正則模塊不含網(wǎng)絡(luò)功能,但可以用它將爬下來的數(shù)據(jù)進(jìn)行處理。[多選題]75.Hadoop組件Zookeeper的設(shè)計(jì)目標(biāo)和主要特點(diǎn)包括()。A)簡單性B)自我復(fù)制C)順序訪問D)高速讀取答案:ABCD解析:[多選題]76.關(guān)于?大數(shù)據(jù)摩爾定律?,以下說法正確的是:()A)人類社會(huì)產(chǎn)生的數(shù)據(jù)一直都在以每年50%的速度増長B)人類社會(huì)的數(shù)據(jù)量大約每兩年就増加一倍C)人類在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量之和D)人類社會(huì)的數(shù)據(jù)量以每年10%的速度増長答案:ABC解析:[多選題]77.基于語義的情感詞典方法有(__)等流程。A)構(gòu)建詞典B)統(tǒng)計(jì)詞頻C)構(gòu)建傾向性計(jì)算算法D)確定閾值答案:ACD解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.在DWS服務(wù)中,通過GDS并行導(dǎo)入數(shù)據(jù)時(shí),需要明確DWS的集群IP地址。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.3NF消除了傳遞函數(shù)依賴。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]80.定義函數(shù)時(shí),帶有默認(rèn)值的參數(shù)必須出現(xiàn)在參數(shù)列表的最右端,任何一個(gè)帶有默認(rèn)值的參數(shù)右邊不允許出現(xiàn)沒有默認(rèn)值的參數(shù)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.量化是一種把定性指標(biāo)轉(zhuǎn)換為定量指標(biāo)的方法,用具體的數(shù)據(jù)表示出來。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.CIoudera是Hadoop商業(yè)版的發(fā)布公司。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.在阿里云大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)中,當(dāng)一個(gè)用戶被移除出項(xiàng)目空間(project)后,與該用戶有關(guān)的ACL授權(quán)仍然會(huì)被保留。一旦該用戶以后被再添加到該項(xiàng)目空間時(shí),該用戶的歷史的ACL授權(quán)訪問權(quán)限將被重新激活。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.from_arrays()方法是將元組列表轉(zhuǎn)換為MultiIndex對(duì)象。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]85.DataNode首次加入cluster的時(shí)候,如果log中報(bào)告不兼容文件版本,那需要NameNode執(zhí)行?Hadoopnamenode-format?操作格式化磁盤。A)正確B)錯(cuò)誤答案:錯(cuò)解析:首先明白介紹,什么ClusterIDClusterID添加了一個(gè)新的標(biāo)識(shí)符ClusterID用于標(biāo)識(shí)集群中所有的節(jié)點(diǎn)。當(dāng)格式化一個(gè)Namenode,需要提供這個(gè)標(biāo)識(shí)符或者自動(dòng)生成。這個(gè)ID可以被用來格式化加入集群的其他Namenode。二次整理有的同學(xué)問題的重點(diǎn)不是上面分析內(nèi)容:內(nèi)容如下:這個(gè)報(bào)錯(cuò)是說

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論