大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷2)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷2)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷2)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷2)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷2)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共145題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.Spark中Job的劃分是依據(jù)()A)依賴B)Action算子C)Transformation算子[單選題]2.下圖展示了StructuredStreaming的計(jì)算模型。通過觀察可以得出最終T3的計(jì)算結(jié)果是?A)Dog1,owl1B)Cat2,dog4,owl2C)Cat2,dog3,owl1D)Cat1,cat1,dog2,dog2,owl2[單選題]3.在電子商務(wù)網(wǎng)站進(jìn)行網(wǎng)購時,用戶的點(diǎn)擊流數(shù)據(jù)會被實(shí)時發(fā)送到后端的大數(shù)據(jù)分析平臺進(jìn)行處理,平臺根據(jù)用戶的特征,找到與其購買興趣匹配的其他用戶群體,再把其他用戶曾經(jīng)購買過而該用戶還沒購買過的相關(guān)商品推薦給該用戶。這個過程需要()A)高效率性。B)高精確性。C)明確的因果關(guān)系。D)符合用戶需求。[單選題]4.數(shù)據(jù)挖掘中()是最常用的聚類算法A)RNN算法B)CNN算法C)K-means算法D)FP-growth算法[單選題]5.在?大數(shù)據(jù)財(cái)務(wù)分析?的可視化模塊中,下列說法錯誤的是()A)每一個圖表類型均可以設(shè)置其圖形屬性B)每一個圖表類型均可以設(shè)置其組件樣式C)絕大部分的圖表在坐標(biāo)系中完成,坐標(biāo)系主要由橫軸與縱軸組成D)一個坐標(biāo)系中只允許設(shè)置一個參數(shù)(維度或指標(biāo))[單選題]6.Spark的默認(rèn)存儲級別()A)MEMORY_ONLYB)MEMORY_ONLY_SERC)MEMORY_AND_DISKD)MEMORY_AND_DISK_SER[單選題]7.商業(yè)秘密數(shù)據(jù)脫離本單位(含網(wǎng)絡(luò)、信息系統(tǒng)及各種介質(zhì))環(huán)境須經(jīng)()業(yè)務(wù)主管部門和保密部門審批。A)公司部門級及以上單位B)市級及以上單位C)省級及以上單位D)國家級單位[單選題]8.關(guān)于數(shù)據(jù)分析,下列說法正確的是()。A)描述性分析和預(yù)測性分析是診斷性分析的基礎(chǔ)B)診斷性分析是對規(guī)范性分析的進(jìn)一步理解C)預(yù)測性分析是規(guī)范性分析的基礎(chǔ)D)規(guī)范性分析是數(shù)據(jù)分析的最高階段,可以直接產(chǎn)生產(chǎn)業(yè)價值[單選題]9.下面哪個選項(xiàng)不是神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中過擬合的防止方法?()A)L2正則化B)dropoutC)修改學(xué)習(xí)率的大小D)提前終止[單選題]10.某圖書管理系統(tǒng)使用Maxcompute進(jìn)行離線數(shù)據(jù)分析,現(xiàn)在他們要將同一類目的書籍的名稱拼成一個字符串,即將屬于同一分組的字符串合并在一列展示,以下()內(nèi)置函數(shù)可以實(shí)現(xiàn)這一功能。A)regexp_instrB)concatC)split_partD)wm_concat[單選題]11.關(guān)于胡煥庸線即黑河-騰沖線描述錯誤的是:A)與400mm降水線高度重合B)是近年來通過數(shù)據(jù)分析得到的C)人口密度分布符合這個分布D)這條線百年來變化不大[單選題]12.關(guān)于數(shù)據(jù)清洗,不正確的說法是()。A)對單數(shù)據(jù)源,主鍵取值不能重復(fù)B)多數(shù)據(jù)源會存在數(shù)據(jù)重復(fù)、單位不一致的問題C)連續(xù)型數(shù)據(jù)不存在冗余問題D)缺失值可以采用刪除和填補(bǔ)等方法處理[單選題]13.以下哪一項(xiàng)不是Spark框架可以滿足的大數(shù)據(jù)分析場景?A)批處理B)即席查詢C)流處理D)大批量shuffle的實(shí)時需求[單選題]14.HBase的Region是由哪個服務(wù)進(jìn)程來管理的?A)HRegionServerB)ZooKeeperC)HMasterD)DataNode[單選題]15.下列哪一項(xiàng)不屬于儀表板的布局模式()A)標(biāo)準(zhǔn)模式B)自由模式C)標(biāo)準(zhǔn)模式(分頁)D)自由模式(分頁)[單選題]16.神經(jīng)網(wǎng)絡(luò)研究屬于下列()學(xué)派A)符號主義B)連接主義C)行為主義D)都不是[單選題]17.從數(shù)據(jù)庫架構(gòu)設(shè)計(jì)來看,主要有以下哪些設(shè)計(jì)思路?A)Shared-DiskB)Shared-EveryingC)Shared-NothingD)以上全正確[單選題]18.命令行客戶端工具的選項(xiàng)中,()用于指定連接的端口號。--A)-hB)-uC)-pD)-P[單選題]19.云主機(jī)管理的資源,不包括()A)vCPUB)內(nèi)存C)顯示器D)存儲[單選題]20.2012年,()政府發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,標(biāo)志著大數(shù)據(jù)已經(jīng)成為重要的時代特征A)中國B)美國C)日本D)英國[單選題]21.請閱讀下面的代碼:num_one=12defsum(num_two):globalnum_onenum_one=90returnnum_one+num_twoprint(sum(10))運(yùn)行代碼,輸出結(jié)果為()。A)102B)100C)22D)12[單選題]22.下列哪項(xiàng)不屬于銀行有大數(shù)據(jù)能力需求()A)數(shù)據(jù)挖掘B)關(guān)聯(lián)分析C)預(yù)測性模型D)數(shù)據(jù)質(zhì)量[單選題]23.在DRS中,以下遷移任務(wù)命名錯誤的是:()。A)ABCedB)ab-cdC)abcd001D)abcd#001[單選題]24.下列選項(xiàng)中優(yōu)先級級別最高的是()。--A)~(按位取反)B)^C)&&D)&[單選題]25.(__)的學(xué)習(xí)目的是生成一顆泛化能力強(qiáng),即處理未見示例能力強(qiáng)的決策樹。A)線性回歸B)貝葉斯分類器C)神經(jīng)網(wǎng)絡(luò)D)決策樹[單選題]26.大數(shù)據(jù)是指不用隨機(jī)分析法這樣的捷徑,而采用()的方法A)絕大部分?jǐn)?shù)據(jù)B)所有數(shù)據(jù)C)適量數(shù)據(jù)D)少量數(shù)據(jù)[單選題]27.世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室統(tǒng)籌組織,下設(shè)技術(shù)組、商務(wù)組和管理優(yōu)化組3個常設(shè)小組,技術(shù)組的組長部門是()A)國網(wǎng)人資部B)國網(wǎng)營銷部C)國網(wǎng)財(cái)務(wù)部D)國網(wǎng)互聯(lián)網(wǎng)部[單選題]28.Flume的輸出叫做()。A)接收器B)源C)數(shù)據(jù)流D)通道[單選題]29.在HBase中,刪除整個表結(jié)構(gòu)的命令是()A)truncateB)dropC)deleteD)以上都不正確[單選題]30.閱讀下列程序r=10c=2s=r*cprint(s)運(yùn)行結(jié)果是A)20B)12C)8D)出錯[單選題]31.(__)是將數(shù)據(jù)轉(zhuǎn)換為產(chǎn)品的藝術(shù)。A)數(shù)據(jù)柔術(shù)B)數(shù)據(jù)處理C)數(shù)據(jù)加工D)數(shù)據(jù)設(shè)計(jì)[單選題]32.在HBase物理存儲結(jié)構(gòu)中,region按大小分割的,每個表一開始有()region。A)一個B)兩個C)三個D)不確定[單選題]33.在線性回歸問題中,我們用R方來衡量擬合的好壞。在線性回歸模型中增加特征值并再訓(xùn)練同一模型。下列說法正確的是()。A)如果R方上升,則該變量是顯著的B)如果R方下降,則該變量不顯著C)單單R方不能反映變量重要性,不能就此得出正確結(jié)論D)以上答案都不正確[單選題]34.人類應(yīng)具備的三大思維能力是指()A)逆向思維、演繹思維和發(fā)散思維B)實(shí)驗(yàn)思維、理論思維和計(jì)算思維C)抽象思維、邏輯思維和形象思維D)計(jì)算思維、理論思維和辯證思維[單選題]35.以下插入記錄正確的()A)insertintoemp(ename,hiredate,sal)values(value1,value2,value3);B)insertintoemp(ename,sal)values(value1,value2,value3);C)insertintoemp(ename)values(value1,value2,value3);D)insertintoemp(ename,hiredate,sal)values(value1,value2);[單選題]36.過濾式特征選擇與學(xué)習(xí)器(),包裹式特征選擇與學(xué)習(xí)器()。A)相關(guān),相關(guān)B)相關(guān),不相關(guān)C)不相關(guān),相關(guān)D)不相關(guān),不相關(guān)[單選題]37.下列選項(xiàng)中,()能保證表中字段值的唯一性。--A)默認(rèn)約束B)非空約束C)唯一約束D)以上答案都不正確[單選題]38.關(guān)于ADS中的ECU,()說法是正確的。A)接入節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)可以指定不同類型的ECU,并且需要在創(chuàng)建DB時就確定,DB一旦創(chuàng)建,ECU類型不能修改B)ECU的數(shù)量,在DB創(chuàng)建后可以修改。即使在DB的使用過程中,也可以隨時調(diào)整(擴(kuò)容或者縮容)C)接入節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)必須指定相同類型的ECU,并且需要在創(chuàng)建DB時就確定,DB一旦創(chuàng)建,ECU類型不能修改D)創(chuàng)建DB時可以指定ECU的數(shù)量,必須為偶數(shù),最小為4[單選題]39.對于數(shù)據(jù)3,3,2,3,6,3,10,3,6,3,2,得出以下結(jié)論:①這組數(shù)據(jù)的眾數(shù)是3;②這組數(shù)據(jù)的眾數(shù)與中位數(shù)的數(shù)值不相等;③這組數(shù)據(jù)的中位數(shù)與平均數(shù)的數(shù)值不相等;@準(zhǔn)組數(shù)據(jù)的平均數(shù)與眾數(shù)的數(shù)值相等。其中正確結(jié)論的個數(shù)為()。A)lB)2C)3D)4[單選題]40.在全文本搜索的函數(shù)中,用于指定被搜索的列的是()A)MATCH()B)AGAINST()C)FULLTEXT()D)REGEXP()[單選題]41.3**3的結(jié)果為()。A)1B)3C)9D)27[單選題]42.()的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過程。A)數(shù)據(jù)處理B)數(shù)據(jù)計(jì)算C)數(shù)據(jù)加工D)整齊數(shù)據(jù)[單選題]43.(__)用于將非線性引入神經(jīng)網(wǎng)絡(luò)。它會將值縮小到較小的范圍內(nèi)。A)損失函數(shù)B)優(yōu)化函數(shù)C)激活函數(shù)D)目標(biāo)函數(shù)[單選題]44.當(dāng)決策樹很小時,訓(xùn)練和檢驗(yàn)誤差都很大,這種情況稱作(___)。A)模型擬合不足B)模型過擬合C)泛化能力好D)模型擬合適當(dāng)[單選題]45.關(guān)于ADS的聚集列,下列說法不正確的是:()。A)如果用戶的查詢Query的條件中會指定聚集列的內(nèi)容或范圍,那么這樣的查詢性能便會有較大的提升B)聚集列可以在建表后進(jìn)行修改,修改后DB會在后臺自動刷新數(shù)據(jù)C)一個分區(qū)內(nèi)聚集列內(nèi)容相同的數(shù)據(jù)會盡可能的分布在同樣的區(qū)塊內(nèi)存D)創(chuàng)建表時可以指定一列或者若干列作為聚集列[單選題]46.()表達(dá)了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達(dá)到的期望泛化誤差的下界,即刻畫了學(xué)習(xí)問題本身的難度。A)偏差B)方差C)噪聲D)泛化誤差[單選題]47.金融界數(shù)據(jù)安全事件頻頻發(fā)生,產(chǎn)生諸多不良后果。金融大數(shù)據(jù)的安全風(fēng)險不包括()。A)金融大數(shù)據(jù)高度集中B)智能終端安全性低C)監(jiān)管不力或缺失D)從業(yè)人員安全意識高[單選題]48.下列選項(xiàng)中,與classPerson等價的是()。A)classPerson(Object)B)classPerson(Animal)C)classPerson(object)D)classPerson:object[單選題]49.大數(shù)據(jù)獲取的個人信息比傳統(tǒng)調(diào)研獲得的個人信息真實(shí)性()。A)相同B)更高C)更低D)不確定[單選題]50.某項(xiàng)目小組接到-個大數(shù)據(jù)實(shí)時分析項(xiàng)目,且對實(shí)時性要求很高。請問以下哪種大數(shù)據(jù)計(jì)算框架最合適A)MapReduceB)HBaseC)SparkD)Flink[單選題]51.下面哪種學(xué)習(xí)方式引入了額外的專家知識,通過與外界的交互來將部分未標(biāo)記樣本轉(zhuǎn)變?yōu)橛袠?biāo)記樣本(__)。A)純半監(jiān)督學(xué)習(xí)B)半監(jiān)督學(xué)習(xí)C)直推學(xué)習(xí)D)主動學(xué)習(xí)[單選題]52.()在訓(xùn)練的每一輪都要檢查當(dāng)前生成的基學(xué)習(xí)器是否滿足基本條件。A)支持向量機(jī)B)Boosting算法C)貝葉斯分類器D)Bagging算法[單選題]53.隨機(jī)試驗(yàn)所有可能出現(xiàn)的結(jié)果稱為()。A)基本事件B)樣本C)全部事件D)樣本空間[單選題]54.當(dāng)在卷積神經(jīng)網(wǎng)絡(luò)中加人池化層(pool恒.glay,町)時,變換的不變性會被保留該說十法()正確A)不知道B)看情況C)是D)否[單選題]55.某電商公司數(shù)據(jù)庫高級工程師進(jìn)行大數(shù)據(jù)分析,現(xiàn)在界面提示:"0:jdbe:hive2://86:2181/>"信息,那么他最有可能在進(jìn)行什么場錄的數(shù)據(jù)分析工作?A)實(shí)時檢素場景B)離線批處理場景C)圖搜索場景D)實(shí)時流開發(fā)場景[單選題]56.()對監(jiān)管數(shù)據(jù)質(zhì)量承擔(dān)最終責(zé)任A)董事長B)風(fēng)險管理部C)行長D)數(shù)據(jù)運(yùn)管部[單選題]57.有關(guān)Hadoop的陳述哪個是錯誤的()A)它運(yùn)行在通用硬件上B)它是Apache軟件基金會(ASF)下的項(xiàng)目C)它是最好的實(shí)時流式數(shù)據(jù)處理框架D)Hadoop對數(shù)據(jù)的處理是有延遲的[單選題]58.下面關(guān)于貝葉斯學(xué)習(xí)相關(guān)描述正確的有(__)。A)貝葉斯學(xué)習(xí)等價于頻數(shù)概率B)頻數(shù)概率引入先驗(yàn)知識和邏輯推理來處理不確定問題C)貝葉斯學(xué)習(xí)只從數(shù)據(jù)本身獲得結(jié)論D)貝葉斯學(xué)習(xí)是一種以貝葉斯法則為基礎(chǔ)的,并通過概率手段進(jìn)行學(xué)習(xí)的方法[單選題]59.numpy矩陣之間的內(nèi)積使用什么函數(shù)?A)np.dot()B)np.cross()C)np.outer()D)np.svd()[單選題]60.如果想替換字符串指定字符使用字符串方法A)countB)replaceC)lowerD)upper[單選題]61.()對應(yīng)于決策樹結(jié)果,其他節(jié)點(diǎn)對應(yīng)于()。A)葉節(jié)點(diǎn),屬性測試B)根結(jié)點(diǎn),學(xué)習(xí)測試C)內(nèi)部節(jié)點(diǎn),學(xué)習(xí)測試D)葉節(jié)點(diǎn),分類測試[單選題]62.在一個神經(jīng)網(wǎng)絡(luò)中,下面哪種方法可以用來處理過擬合?()A)DropoutB)分批歸一化(BatchNormalization)C)正則化(regularization)D)都可以[單選題]63.某學(xué)生正在學(xué)習(xí)ElasticSearch,請你幫他分析下,下列代碼的作用是什么?VX:HWRZKSTKA)插入數(shù)據(jù),更新素引B)插入數(shù)據(jù),創(chuàng)建素引C)更新索引D)創(chuàng)建數(shù)據(jù)[單選題]64.下面關(guān)于分布式文件系統(tǒng)HDFS的描述正確的是()。A)分布式文件系統(tǒng)HDFS是GoogleBigtable的一種開源實(shí)現(xiàn)B)分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS(GoogleFileSystem)的一種開源實(shí)現(xiàn)C)分布式文件系統(tǒng)HDFS比較適合存儲大量零碎的小文件D)分布式文件系統(tǒng)HDFS是一種關(guān)系型數(shù)據(jù)庫[單選題]65.使用MaxComputeSQL更新數(shù)據(jù)時,以下說法中不正確的是:()。A)使用動態(tài)分區(qū)插入數(shù)據(jù)時,需在語句中指定分區(qū)值,且只要出現(xiàn)在select子句中最后一個位置即可,也可為該值指定一個易于識別的別名B)進(jìn)行insert更新數(shù)據(jù)操作時,源表與目標(biāo)表的對應(yīng)關(guān)系依賴于在select子句中列的順序,而不是表與表之間列名的對應(yīng)關(guān)系C)向某個具體的分區(qū)插入數(shù)據(jù)時,分區(qū)列不允許出現(xiàn)在select列表中D)支持在一個語句中實(shí)現(xiàn)讀取一次寫入多個目標(biāo)表的操作[單選題]66.下面代碼的輸出結(jié)果是a=1000000b="-"print("{0:{2}^{1},}\n{0:{2}>{1},}\n{0:{2}A)1,000,0001,000,0001,000,000B)1,000,0001,000,0001,000,000C)1,000,0001,000,0001,000,000D)1,000,0001,000,0001,000,000[單選題]67.下列哪個不屬于物聯(lián)網(wǎng)的應(yīng)用?A)智能物流B)智能安防C)環(huán)保監(jiān)測D)數(shù)據(jù)清洗[單選題]68.Hive是建立在()之上的一個數(shù)據(jù)倉庫A)HDFSB)MapReduceC)HadoopD)HBase[單選題]69.()屬于SVM應(yīng)用A)文本和超文本分類B)圖像分類C)新文章聚類D)以上均是[單選題]70.詞匯表的增長將會導(dǎo)致文檔向量不斷的增長,表現(xiàn)為文檔向量的()不斷增加。A)個數(shù)B)維度C)集合D)元素[單選題]71.當(dāng)ElasticSearch集群有節(jié)點(diǎn)加入或退出時,集群數(shù)據(jù)會發(fā)生什么操作?A)數(shù)據(jù)重分布B)數(shù)據(jù)重建C)數(shù)據(jù)更新D)數(shù)據(jù)重載[單選題]72.調(diào)用Zookeeper對象創(chuàng)建的節(jié)點(diǎn),不包括()。A)持久節(jié)點(diǎn)B)臨時節(jié)點(diǎn)C)持久順序節(jié)點(diǎn)D)DataNode節(jié)點(diǎn)[單選題]73.(__)又稱情感傾向性分析,是指對給定的文本,識別其中主觀性文本的傾向是肯定還是否定的,或者說是正面還是負(fù)面的,是情感分析領(lǐng)域研究最多的A)情感分類B)情感檢索C)情感抽取D)情感分析[單選題]74.華為FusionInsightHD是國內(nèi)首家符合國家金融等級保護(hù)的大數(shù)據(jù)平臺,其安全性現(xiàn)在以下哪些方面?A)系統(tǒng)安全B)權(quán)限認(rèn)證C)數(shù)據(jù)安全D)以上全都正確[單選題]75.HBASE中使用的壓縮算法是()A)gzipB)LZOC)SnappyD)ZAPPY[單選題]76.早期的云計(jì)算產(chǎn)品AWS是由哪家企業(yè)提出的A)微軟B)亞馬遜C)IBMD)谷歌[單選題]77.在數(shù)據(jù)添加過濾規(guī)則后,在源庫執(zhí)行更新操作的處理原則,應(yīng)以:()為首要目標(biāo)。A)數(shù)據(jù)一致B)數(shù)據(jù)規(guī)范C)數(shù)量相同D)數(shù)據(jù)唯一[單選題]78.以下關(guān)于StreamExecution持實(shí)查詢過程的描項(xiàng)哪項(xiàng)是正確的?A)獲取最新數(shù)據(jù)offsets--offsets寫入offsetLog--優(yōu)化LogicaLPLam--構(gòu)造LogicalPlan--計(jì)算結(jié)果sink--計(jì)算完成commitB)獲取最新數(shù)據(jù)offsets--offsets寫入offsetLog--構(gòu)造LogicalPlan--優(yōu)化LogicaLPLam計(jì)算完成commit--計(jì)算結(jié)果sinkC)offsets寫入offsetLog--獲取最新數(shù)據(jù)offsets--構(gòu)造LogicalPlan--優(yōu)化LogicaLPLam--計(jì)算結(jié)果sink計(jì)算完成commitD)獲取最新數(shù)據(jù)offsets--offsets寫入offsetLog--構(gòu)造LogicalPlan--優(yōu)化LogicaLPLam--計(jì)算結(jié)果sink計(jì)算完成commit[單選題]79.于Python的數(shù)字類型,以下選項(xiàng)中描述錯誤的是A)Python整數(shù)類型提供了4種進(jìn)制表示:十進(jìn)制、二進(jìn)制、八進(jìn)制和十六進(jìn)制B)Python語言要求所有浮點(diǎn)數(shù)必須帶有小數(shù)部分C)Python語言中,復(fù)數(shù)類型中實(shí)數(shù)部分和虛數(shù)部分的數(shù)值都是浮點(diǎn)類型,復(fù)數(shù)的虛數(shù)部分通過后綴?C?或者?c?來表示D)Python語言提供int、float、complex等數(shù)字類型[單選題]80.在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()A)頻繁子集挖掘B)頻繁于圈挖掘C)頻繁數(shù)據(jù)項(xiàng)挖掘D)頻繁模式挖掘[單選題]81.使用梯度下降算法的步驟是什么?(___)_x000b_1.計(jì)算實(shí)際值與預(yù)測值之間的誤差_x000b_2.重申,直到你找到最好的網(wǎng)絡(luò)權(quán)重_x000b_3.通過網(wǎng)絡(luò)傳遞輸入并從輸出層獲取值_x000b_4.初始化隨機(jī)權(quán)重和偏差_x000b_5.通過梯度下降loss函數(shù)計(jì)算方法更新權(quán)重和偏差A(yù))4,3,1,5,2B)4,5,3,2,1C)4,2,1,5,3D)4,3,2,5,1[單選題]82.關(guān)于OLAP的特性,下面正確的是:①快速性;②可分析性:③多維性:④信息性;⑤共享性()A)①②③B)②③④C)①②③④D)①②③④⑤[單選題]83.Flume支持監(jiān)控并傳輸目錄下新增的文件,可實(shí)現(xiàn)準(zhǔn)實(shí)時的數(shù)據(jù)傳輸,以上描述的是哪一類source?A)spoolingdirectorysoureB)httpsourceC)execsourceD)syslogsource[單選題]84.將兩篇文本通過詞袋模型變?yōu)橄蛄磕P?,通過計(jì)算向量的()來計(jì)算兩個文本間的相似度。A)正弦距離B)余弦距離C)長度D)方向[單選題]85.下列哪個選項(xiàng)可以用來判斷HBase表是否存在?(A)admin.tableExists(tableNameB)admin.tableExists(TableNamevalueOf(tableName)C)admin.getTable(tableNameD)tables.containsKey(tableName)[單選題]86.python中,若deff1(a,b,c):print(a+b),則nums=(1,2,3);f1(nums)的程序運(yùn)行結(jié)果是。()A)語法錯B)6C)3D)1[單選題]87.以下關(guān)于StreamExecution持續(xù)查詢過程的描述哪項(xiàng)是正確的?A)獲取最新斂據(jù)oftsetsoftsets與入ottsetLog--構(gòu)道LogicalPlan--優(yōu)化LogicalPlan--計(jì)算完成commit--計(jì)算結(jié)果SinkB)offsets寫入offsetLog--獲取最新數(shù)據(jù)offsets-構(gòu)造LogicalPlan-優(yōu)化LogicalPlan--計(jì)算結(jié)果Sink--計(jì)算完成commitC)獲取最新數(shù)據(jù)offsets--offsets寫入offsetlog--構(gòu)造LogicalPlan--優(yōu)化LogicalPlan--計(jì)算結(jié)果Sink--計(jì)算完成comitD)獲取最新數(shù)據(jù)ofsets--offsets寫入ofsetL.og--優(yōu)化Logica1Plan--構(gòu)造LogicalPlan--計(jì)算結(jié)果Sink--計(jì)算完成commit[單選題]88.下列哪個命令是從HDFS下載目錄/文件到本地的?A)dfs-putB)dfs-catC)dfs-getD)dfs-mkdir[單選題]89.下列對圖數(shù)據(jù)庫描述正確的是?A)存儲圖片的數(shù)據(jù)庫B)以?圖?數(shù)據(jù)結(jié)構(gòu)存儲和查詢數(shù)據(jù)的數(shù)據(jù)庫C)數(shù)據(jù)倉庫的一種D)與關(guān)系型數(shù)據(jù)庫類似的數(shù)據(jù)庫[單選題]90.刪除數(shù)據(jù)表中的一條記錄用以下哪一項(xiàng)()A)DELETEDB)DELETEC)DROPD)UPDATE[單選題]91.Numpy中創(chuàng)建全為0的矩陣使用什么?A)np.zeros()B)np.ones()C)np.empty()D)np.arange()[單選題]92.泛在電力物聯(lián)網(wǎng)將電力用戶及其設(shè)備、電網(wǎng)企業(yè)及其設(shè)備、發(fā)電企業(yè)及其設(shè)備、供應(yīng)商及其設(shè)備,以及人和物連接起來,產(chǎn)生(),為用戶、電網(wǎng)、發(fā)電、供應(yīng)商和政府社會服務(wù)。A)集群效應(yīng)B)共同價值C)經(jīng)濟(jì)效益D)共享數(shù)據(jù)[單選題]93.()是指通過訓(xùn)練而得到一種識別規(guī)則,通過此識別規(guī)則可以得到一種特征分類,使圖像識別技術(shù)能夠得到高識別率。A)預(yù)處理B)特征抽取和選擇C)分類器設(shè)計(jì)D)分類決策[單選題]94.Flume的高級組件不包含以下哪個?A)SinkProcessorB)ChannelInterceptorC)ChannelSelectorD)SourceInterceptor[單選題]95.()不是最近鄰分類器的特點(diǎn)。A)它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測,不必維護(hù)源自數(shù)據(jù)的模型B)分類一個測試樣例開銷很大C)最近鄰分類器基于全局信息進(jìn)行預(yù)測D)可以生產(chǎn)任意形狀的決策邊界[單選題]96.下面這段代碼的作用是什么?A)創(chuàng)建索引B)刪除索引C)維護(hù)親引D)更新索引[單選題]97.風(fēng)險防控產(chǎn)品中的三元組驗(yàn)證是以什么形式對外服務(wù)的:()A)SaaS應(yīng)用B)組件C)接口D)平臺[單選題]98.以下程序不可能的輸出結(jié)果是:fromrandomimport*x=[30,45,50,90]print(choice(x))A)30B)45C)55D)90[單選題]99.以下哪項(xiàng)用來分組()A)ORDERBYB)ORDEREDBYC)GROUPBYD)GROUPEDBY[單選題]100.Hadoop的MapReduce組件擅長處理哪些場景的計(jì)算任務(wù)?A)迭代計(jì)算B)離線計(jì)算C)實(shí)時交互計(jì)算D)流式計(jì)算[單選題]101.在Hive的查詢語句中,表示A按位取反正確的是()A)#AB)^AC)#REF!D)~A[單選題]102.不屬于判別式模型的是()。A)決策樹B)BP神經(jīng)網(wǎng)絡(luò)C)支持向量機(jī)D)貝葉斯[單選題]103.下列選項(xiàng)中,關(guān)于SSH服務(wù)說法正確的是()A)SSH服務(wù)是一種傳輸協(xié)議B)SSH服務(wù)是一種通信協(xié)議C)SSH服務(wù)是一種數(shù)據(jù)包協(xié)議D)SSH服務(wù)是一種網(wǎng)絡(luò)安全協(xié)議[單選題]104.?ab?+?c?+2結(jié)果是A)abc2B)abcabcC)報錯D)ababcc[單選題]105.getcwd()的作用是()。A)刪除指定路徑的目錄B)改變當(dāng)前工作目錄到指定的路徑C)以數(shù)字權(quán)限模式創(chuàng)建目錄D)返回當(dāng)前工作目錄[單選題]106.HBase依賴()提供消息通信機(jī)制A)ZookeeperB)ChubbyC)SocketD)RPC[單選題]107.在HBase物理存儲結(jié)構(gòu)中,table表中的所有行都按照()的字典序排序。A)ASCIIB)keyC)rowkeyD)keyrow[單選題]108.下面哪項(xiàng)不屬于循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出模式。()A)單輸出B)多輸出C)同步多輸出D)異步多輸出[單選題]109.屬于深度學(xué)習(xí)框架的是()A)TensorfiowB)CafIeC)PyTorchD)以上答案都正確[單選題]110.在專家系統(tǒng)的開發(fā)過程中使用的專家系統(tǒng)工具一般分為專家系統(tǒng)的()與通用專家系統(tǒng)工具兩類。A)模型工具B)外殼C)知識庫工具D)專用工具[單選題]111.管理網(wǎng)絡(luò)中跨多臺計(jì)算機(jī)存儲的文件系統(tǒng)稱為()。A)MapReduceB)HDFSC)HadoopD)Hive[單選題]112.()是指數(shù)據(jù)減去一個總括統(tǒng)計(jì)量或模型擬合值時的殘余部分A)極值B)標(biāo)準(zhǔn)值C)平均值D)殘值[單選題]113.概率密度函數(shù)服從正態(tài)分布的噪聲,叫做(__)。A)泊松噪聲B)高斯噪聲C)乘性噪聲D)椒鹽噪聲[單選題]114.為了得到和SVD一樣的投射(projection),你需要在PCA中怎樣做A)將數(shù)據(jù)轉(zhuǎn)換成零均值B)將數(shù)據(jù)轉(zhuǎn)換成零中位數(shù)C)將數(shù)據(jù)轉(zhuǎn)換成最大值D)以上方法不行[單選題]115.下面不屬于數(shù)據(jù)歸約方法有(__)。A)維歸約B)度歸約C)值歸約D)數(shù)據(jù)壓縮[單選題]116.在k近鄰學(xué)習(xí)算法中,隨著k的增加,上界將逐漸降低,當(dāng)k區(qū)域無窮大時,上界和下界碰到一起,k近鄰法就達(dá)到了()。A)貝葉斯錯誤率B)漸進(jìn)錯誤率C)最優(yōu)值D)上界[單選題]117.定義類如下classHello():def__init__(self,name)=namedefshowInfo(self)print()下面代碼能正常執(zhí)行的A)h=Helloh.showInfo()B)h=Hello()h.showInfo(?張三?)C)h=Hello(?張三?)h.showInfo()D)h=Hello(?admin?)showInfo[單選題]118.下列Python文件模式中,不可寫的模式是(___)。A)?r?B)?W?C)?a?D)?W+?[單選題]119.在MapReduce中,通常將Map拆分成M個片段、Reduce拆分成R個片段,下面描述中錯誤的是()。A)MapReduce中單臺機(jī)器上執(zhí)行大量不同的任務(wù)可以提高集群的負(fù)載均衡能力B)Master必須執(zhí)行O(M+R)次調(diào)度C)Master在內(nèi)存中保存oO(M+R)個狀態(tài)D)M和R要比集群中Worker數(shù)量多[單選題]120.()是Scikit-Learn中的支持向量機(jī)模塊。A)MinBatchKMeansB)SVCC)LinearRegressionD)Regression[單選題]121.Hadoop具有特性不包括()。A)高可靠性B)高效性C)高可擴(kuò)展性D)低容錯性[單選題]122.軟件開發(fā)的結(jié)構(gòu)化生命周期方法將軟件生命周期劃分成A)定義、開發(fā)、運(yùn)行維護(hù)B)設(shè)計(jì)階段、編程階段、測試階段C)總體設(shè)計(jì)、詳細(xì)設(shè)計(jì)、編程調(diào)試D)需求分析、功能定義、系統(tǒng)設(shè)計(jì)[單選題]123.運(yùn)行以下程序,輸出結(jié)果的是:str1="NanjingUniversity"str2=str1[:7]+"Normal"+str1[-10:]print(str2)A)NormalUB)NanjingNormalC)NormalUniversityD)NanjingNormalUniversity[單選題]124.進(jìn)入要操作的數(shù)據(jù)庫TEST用以下哪一項(xiàng)()A)INTESTB)SHOWTESTC)USERTESTD)USETEST[單選題]125.在HBase的專用過濾器中,單列排除過濾器是()A)SingleValueExcludeFilterB)SingleColumnExcludeFilterC)SingleColumnValueExcludeFilterD)ColumnValueExcludeFilter[單選題]126.下列關(guān)于神經(jīng)網(wǎng)絡(luò)的說法中:①增加神經(jīng)網(wǎng)絡(luò)層數(shù),可能會增加測試數(shù)據(jù)集的分類錯誤率;②減少神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小測試數(shù)據(jù)集的分類錯誤率;③增加神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小訓(xùn)練數(shù)據(jù)集的分類錯誤率,正確的是()A)①B)①③C)①②D)②[單選題]127.決策樹是基于(__)結(jié)構(gòu)來進(jìn)行決策的。A)樹B)鏈C)隊(duì)列D)棧[單選題]128.以下關(guān)于公共安全行業(yè)專題分析與查詢業(yè)務(wù)場景描述錯誤的選項(xiàng)是()。A)適用標(biāo)準(zhǔn)SQL語句進(jìn)行查詢,根據(jù)查詢結(jié)果篩選目標(biāo)人群,偵辦案件。B)原始數(shù)據(jù)經(jīng)過批處理后結(jié)果寫入到指定的文件目錄,供交互時查詢。C)臨時交互式查詢?nèi)蝿?wù)對數(shù)據(jù)進(jìn)行精確或者模糊查詢。D)數(shù)據(jù)湖內(nèi)多個數(shù)據(jù)源只能單獨(dú)訪問再呈現(xiàn)結(jié)果。[單選題]129.hbase的底層數(shù)據(jù)以答案:的形式存在的?A)keyvalueB)列存儲C)行存儲D)實(shí)時存儲[單選題]130.Spark的大數(shù)據(jù)處理平臺是建立在同一抽象的()之上。A)HDFSB)HBaseC)RDDD)MR[單選題]131.下面哪個是詞向量的一種形式?A)二叉樹B)Word2VecC)哈希編碼D)線段樹[單選題]132.python語句print(chr(65))的運(yùn)行結(jié)果是。()A)65B)6C)5D)A[單選題]133.關(guān)于大數(shù)據(jù)交易在發(fā)展過程中遇到的問題.下面描述錯誤的是:()A)互聯(lián)網(wǎng)數(shù)據(jù)馬太效應(yīng)顯現(xiàn)B)市場信用體系缺失、監(jiān)管有待加強(qiáng)C)大數(shù)據(jù)交易規(guī)則和標(biāo)準(zhǔn)缺乏D)數(shù)據(jù)質(zhì)量評價與估值定價已經(jīng)很完善[單選題]134.下面不屬于云計(jì)算技術(shù)的有(__)。A)HadoopB)SparkC)YARND)集中式計(jì)算[單選題]135.若k為整形,下述while循環(huán)執(zhí)行的次數(shù)為:()k=1000whilek>1:print(k)k=k/2A)9B)10C)11D)100[單選題]136.下列哪一項(xiàng)是大數(shù)據(jù)技術(shù)領(lǐng)域的實(shí)施標(biāo)準(zhǔn)?A)GoogleAPPB)MapReduceC)HadoopD)HDFS[單選題]137.tbl_p為一個Maxcompute的分區(qū)表,包含一個p1=?1?的分區(qū),現(xiàn)在想把該分區(qū)上的數(shù)據(jù)刪除,達(dá)到使用select*fromtblwherepi=?1?查詢時,返回結(jié)果為空的目的。以下()SQL可以實(shí)現(xiàn)該功能。A)truncatetabletbl;B)altertabletbldroppartition(p1=?1?);C)insertintotabletblselect*frontblwhere1=2;D)deletefromtabletbl;[單選題]138.查看Kafka某Topic的Partition詳細(xì)信息時,使用如下哪個命令A(yù))bin/kafka-topics.sh--createB)bin/kafka-topics.sh-listC)bin/kafka-topics.sh-describeD)bin/kafka-topics.sh-delete[單選題]139.HDFS以()訪問模式來存儲超大文件,運(yùn)行于商用硬件集群上。A)數(shù)據(jù)B)字節(jié)C)流式數(shù)據(jù)D)數(shù)組[單選題]140.OTS種以()方式來存儲數(shù)據(jù)。A)對象B)二維表C)鍵值對D)聚簇列[單選題]141.在一個基本的Hadoop集群中,SecondaryNameNode主要負(fù)責(zé)什么?A)幫助NameNode收集文件系統(tǒng)運(yùn)行的狀態(tài)信息B)負(fù)責(zé)執(zhí)行由JobTracker指派的任務(wù)C)協(xié)調(diào)數(shù)據(jù)計(jì)算任務(wù)D)負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲[單選題]142.下列哪個方法不屬于情感分析的評測?A)COAE評測B)cifar10數(shù)據(jù)集評測C)CCFTCCI評測D)TAC評測[單選題]143.SaaS是()的簡稱A)軟件即服務(wù)B)平臺即服務(wù)C)基礎(chǔ)設(shè)施即服務(wù)D)硬件即服務(wù)[單選題]144.time庫的time.time()函數(shù)的作用是()。A)返回系統(tǒng)當(dāng)前時間戳對應(yīng)的易讀字符串表示B)返回系統(tǒng)當(dāng)前時間戳對應(yīng)的struct_time對象C)返回系統(tǒng)當(dāng)前時間戳對應(yīng)的本地時間的struct_time對象,本地之間經(jīng)過時區(qū)轉(zhuǎn)換D)返回系統(tǒng)當(dāng)前的時間戳第2部分:多項(xiàng)選擇題,共62題,每題至少兩個正確答案,多選或少選均不得分。[多選題]145.norm.stats()函數(shù)返回的內(nèi)容有(__)。A)均值B)方差C)偏態(tài)D)峰度[多選題]146.以下關(guān)于數(shù)據(jù)維度的描述,正確的是()。A)采用列表表示一維數(shù)據(jù),不同數(shù)據(jù)類型的元素是可以的B)JSON格式可以表示比二維數(shù)據(jù)還復(fù)雜的高維數(shù)據(jù)C)二維數(shù)據(jù)可以看成是一維數(shù)據(jù)的組合形式D)字典不可以表示二維以上的高維數(shù)據(jù)[多選題]147.使用用戶管理控制臺創(chuàng)建ADS時,需要提供ECU的()信息。A)存儲B)數(shù)量C)類型D)vCPU[多選題]148.基于語義的情感詞典方法有(__)等流程。A)構(gòu)建詞典B)統(tǒng)計(jì)詞頻C)構(gòu)建傾向性計(jì)算算法D)確定閾值[多選題]149.下列方法是TF-IDF的變種的有()。A)TFCB)EWCC)ITCD)IG[多選題]150.為了保證應(yīng)用獲得可預(yù)期的性能,需要設(shè)置OTS表的()。A)預(yù)留存儲空間B)預(yù)留處理內(nèi)存C)預(yù)留寫吞吐量D)預(yù)留讀吞吐量[多選題]151.數(shù)據(jù)可視化狹義上與(__)概念平行,廣義上包含這些概念。A)信息可視化B)科學(xué)可視化C)可視分析學(xué)D)可視化理論[多選題]152.下列關(guān)于流計(jì)算特點(diǎn)的描述中,正確的是:()。A)實(shí)時且流式的B)數(shù)據(jù)是無界的C)事件觸發(fā)D)用戶觸[多選題]153.SparkonYARN有兩種模式,分別是()A)yarn-client模式B)yarn-local模式C)yarn-cluster模式D)yarn-application模式[多選題]154.強(qiáng)化學(xué)習(xí)中的?策略?就相當(dāng)于監(jiān)督學(xué)習(xí)中(__)或(__)。A)分類器B)決策樹C)隨機(jī)森林D)回歸器[多選題]155.一個好的分類模型必須具有(___)。A)低訓(xùn)練誤差B)低泛化誤差C)過擬合D)欠擬合[多選題]156.大數(shù)據(jù)將會對社會發(fā)展產(chǎn)生深遠(yuǎn)的影響.具體表現(xiàn)在以下哪幾個方面:A)大數(shù)據(jù)決策成為一種新的決策方式B)大數(shù)據(jù)成為提升國家治理能力的新途徑C)大數(shù)據(jù)應(yīng)用促進(jìn)信息技術(shù)與各行業(yè)的深度融合D)大數(shù)據(jù)開發(fā)推動新技術(shù)和新應(yīng)用的不斷涌現(xiàn)[多選題]157.下列關(guān)于Hive中的視圖說法正確的是()A)和關(guān)系型數(shù)據(jù)庫一樣,Hive中也提供了視圖的功能,它享用基本表的數(shù)據(jù),不會生成另外一份數(shù)據(jù)。B)Hive中只有物化視圖,沒有邏輯視圖。C)Hive中的視圖只能SELECT/LOAD/INSERT/UPDATE/DELETE數(shù)據(jù)。D)Hive中的視圖在創(chuàng)建時候,只是保存了一份元數(shù)據(jù),當(dāng)查詢視圖的時候,才開始執(zhí)行視圖對應(yīng)的那些子查詢。[多選題]158.通過(),提出公司數(shù)據(jù)資產(chǎn)需求。A)結(jié)合業(yè)務(wù)管理現(xiàn)狀和未來發(fā)展B)研究各項(xiàng)業(yè)務(wù)與數(shù)據(jù)的完全映射C)形成公司業(yè)務(wù)數(shù)據(jù)集D)分析與現(xiàn)有數(shù)據(jù)資源的差異[多選題]159.下列關(guān)于文檔數(shù)據(jù)庫的描述,哪些是正確的?()A)性能好(高并發(fā)),靈活性高B)具備統(tǒng)一的査詢語法C)文檔數(shù)據(jù)庫支持文檔間的事務(wù)D)復(fù)雜性低,數(shù)據(jù)結(jié)構(gòu)靈活[多選題]160.某大數(shù)據(jù)運(yùn)維人員需要將部分?jǐn)?shù)據(jù)導(dǎo)入Hive數(shù)據(jù)表中,以下哪些做法是可取的?A)將數(shù)據(jù)導(dǎo)入到FTP服務(wù)器中,通過創(chuàng)建外表的方式導(dǎo)入到Hive表中。B)將數(shù)據(jù)導(dǎo)入到集群服務(wù)器上,通過loaddatalocal命令導(dǎo)入到Hive表中。C)將數(shù)據(jù)導(dǎo)入到HDFS文件系統(tǒng)中,通過loaddata命令導(dǎo)入到Hive表中。D)將數(shù)據(jù)導(dǎo)入到本地電腦中,然后使用loaddatalocal命令導(dǎo)入到Hive表中。[多選題]161.使用MySQL客戶端連接ADS時,()信息是必須的。A)端口B)服務(wù)器地址C)數(shù)據(jù)庫名稱D)AccountID[多選題]162.以下不能創(chuàng)建一個字典的語句是()A)dict3={[1,2,3]:"fighting"}B)dict3={(1,2,3):"fighting"}C)dict3={{1:1}:"fighting"}D)dict3={([1,6],2,3):"fighting"}[多選題]163.我們建立一個5000個特征,100萬數(shù)據(jù)的機(jī)器學(xué)習(xí)模型.我們怎么有效地應(yīng)對這樣的大數(shù)據(jù)訓(xùn)練A)我們隨機(jī)抽取一些樣本,在這些少量樣本之上訓(xùn)練B)我們可以試用在線機(jī)器學(xué)習(xí)算法C)我們應(yīng)用PCA算法降維,減少特征數(shù)D)無法應(yīng)對[多選題]164.Hive的數(shù)據(jù)模型包括()A)數(shù)據(jù)庫B)管理表C)數(shù)據(jù)表D)外部表[多選題]165.以下是復(fù)數(shù)的有()。A)k=2+3jB)k=complex(2,3)C)k=2+3lD)k=2+3J[多選題]166.以下哪些是離線批處理的特點(diǎn)?A)處理數(shù)據(jù)格式多樣B)支持SQL類作業(yè)和自定義作業(yè)C)處理數(shù)據(jù)量巨大D)處理時間要求高[多選題]167.根據(jù)《國網(wǎng)數(shù)據(jù)管理辦法》(2019征求意見稿),公司數(shù)據(jù)質(zhì)量管理主要包括():A)數(shù)據(jù)質(zhì)量規(guī)則管理B)數(shù)據(jù)質(zhì)量評估C)數(shù)據(jù)問題整改D)數(shù)據(jù)質(zhì)量核查[多選題]168.深度學(xué)習(xí)適用的領(lǐng)域有()A)計(jì)算機(jī)視覺B)語言識別C)自然語言處理D)自動駕駛[多選題]169.(__)是基于字符串匹配的分詞方法。A)正向最大匹配法B)逆向最大匹配法C)最少切分D)隱馬爾科夫模型[多選題]170.金融大數(shù)據(jù)方案中我們都提供哪些服務(wù)內(nèi)容:()A)用戶碼號關(guān)聯(lián)性B)用戶非常規(guī)行為探測C)終端類型分析D)用戶金融行為偏好、反欺詐分析[多選題]171.關(guān)于現(xiàn)階段大數(shù)據(jù)技術(shù)體系,說法正確的是()。A)基礎(chǔ)設(shè)施提供數(shù)據(jù)計(jì)算、數(shù)據(jù)存儲、數(shù)據(jù)加工(DataWrangling或DataMunging)等服務(wù)B)數(shù)據(jù)流處理、統(tǒng)計(jì)工具、日志分析都屬于常用的開源工C)數(shù)據(jù)資源代表的是生成數(shù)據(jù)的機(jī)構(gòu)D)數(shù)據(jù)源與App為數(shù)據(jù)科學(xué)和大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)提供數(shù)據(jù)內(nèi)容[多選題]172.HBase的主要特點(diǎn)有哪些?A)面向列B)高性能C)可伸縮D)高可靠性[多選題]173.常見的聚類性能度量外部指標(biāo)有()。A)Jaccard系數(shù)B)DB指數(shù)C)FM指數(shù)D)以上答案都正確[多選題]174.交易產(chǎn)品的類型主要包括哪幾種:()A)APIB)數(shù)據(jù)包C)云服務(wù)D)解決方案[多選題]175.下列說法中,關(guān)于InputFormat接口定義的getSplits()方法說法正確的是()。A)用來從分片中讀取數(shù)據(jù)B)負(fù)責(zé)創(chuàng)建RecordReader對象C)實(shí)現(xiàn)了邏輯切片機(jī)制D)getSplits()方法的切片大小splitSize是由minSize、maxSize和blockSize的值確定的[多選題]176.(__)主要關(guān)注的是過去。A)描述性分析B)診斷性分析C)預(yù)測性分析D)規(guī)范性分析[多選題]177.ElasticSearch支持的gateway類型有?A)AmazonS3B)本地文件系統(tǒng)C)HDFSD)AmazonS5[多選題]178.Hadoop由哪幾部分組成()A)CommonB)hdfsC)YarnD)MapReduce[多選題]179.特征選擇方法有()A)AIC赤池信息準(zhǔn)則B)LARS嵌入式特征選擇方法C)LVW包裹式特征選擇方法D)Relief過濾式特征選擇方法[多選題]180.實(shí)時場景的典型特點(diǎn)是?A)數(shù)據(jù)量大B)數(shù)據(jù)格式多C)時延要求高D)交互式查詢[多選題]181.以下哪個聚類算法是屬于基于原型的聚類()A)模糊C均值B)EM算法C)SOMD)CLIQUE[多選題]182.()對象的操作不需要通過Maxcompute的任務(wù)(Task)來完成。A)projectB)UDFC)instanceD)resource[多選題]183.下面關(guān)于使用UPDATE語句,正確的是()A)被定義為NOTNULL的列不可以被更新為NULLB)不能在一個子查詢中更新一個表,同時從同一個表中選擇C)不能把ORDERBY或LIMIT與多表語法的UPDATE語句同時使用D)如果把一列設(shè)置為其當(dāng)前含有的值,則該列不會更新[多選題]184.下列屬于Gensim庫的特性的有()。A)訓(xùn)練語料的預(yù)處理B)主題向量的變換C)文檔相似度的計(jì)算D)文章切分詞語統(tǒng)計(jì)計(jì)算[多選題]185.下列關(guān)于Spark中的RDD描述正確的有()。A)RDD(ResilientDistributedDataset)叫作彈性分布式數(shù)據(jù)集,是Spark中最基本的數(shù)據(jù)抽象B)Resilient:表示彈性的C)Destributed:分布式,可以并行在集群計(jì)算D)Dataset:就是一個集合,用于存放數(shù)據(jù)[多選題]186.Shuffle操作包含當(dāng)前階段的(__)和下一階段的(__)。A)ShuffleWriteB)ShuffleReadC)WriteD)Read[多選題]187.下列函數(shù)是一元通用函數(shù)的有()。A)np.add()B)np.maximum()C)np.exp()D)np.sqrt()[多選題]188.下列屬于CNN關(guān)鍵層的有()。A)輸入層B)卷積層C)激活層D)池化層[多選題]189.以下哪些是mySQL數(shù)據(jù)類型()A)BIGINTB)TINYINTC)INTEGERD)INT[多選題]190.下列關(guān)于Ridge回歸,說法正確的是()?A)若λ=0,則等價于一般的線性回歸B)若λ=0,則不等價于一般的線性回歸C)若λ=+∞,則得到的權(quán)重系數(shù)很小,接近于零D)若λ=+∞,則得到的權(quán)重系數(shù)很大,接近與無窮大[多選題]191.K均值聚類和層次聚類在一些方面有重大差異。以下說法正確的是()。A)在K均值聚類中,必須在運(yùn)行算法前選定想要的簇的個數(shù)B)在K均值聚類中,可以在運(yùn)行算法后選定想要的簇的個數(shù)C)在層次聚類中,可以在運(yùn)行算法后選定想要的簇的個數(shù)D)K均值聚類算法所需的計(jì)算量比層次聚類算法小得多[多選題]192.下列關(guān)于MapReduce全局計(jì)數(shù)器說法正確的是()A)MapReduce計(jì)數(shù)器是用來記錄Job的執(zhí)行進(jìn)度和狀態(tài)的,它的作用可以理解為日志。B)MapReduce內(nèi)置計(jì)數(shù)器主要用來記錄作業(yè)的運(yùn)行結(jié)果C)自定義計(jì)數(shù)器的好處在于整個計(jì)數(shù)的過程只需要在map階段就可以完成,而且也可以不做任何輸出D)我們可以自定義枚舉聲明計(jì)數(shù)器[多選題]193.大數(shù)據(jù)的主要特征表現(xiàn)為A)數(shù)據(jù)容量大B)商業(yè)價值高C)處理速度快D)數(shù)據(jù)類型多[多選題]194.收集個人信息的合法性要求對個人信息控制者的要求包括()A)不得欺詐、誘騙、強(qiáng)迫個人信息主體提供其個人信息B)不得隱瞞產(chǎn)品或服務(wù)所具有的收集個人信息的功能C)不得從非法渠道獲取個人信息D)不得收集法律法規(guī)明令禁止收集的個人信息[多選題]195.以下可些選項(xiàng)是Kafka的特點(diǎn)?A)支持消息隨機(jī)讀取B)分布式C)消息持久化D)高吞吐[多選題]196.聚類性能度量大致有兩類,一類是(__),另一類是(__)。A)外部指標(biāo)B)內(nèi)部指標(biāo)C)簇內(nèi)相似度D)簇間相似度[多選題]197.數(shù)據(jù)倉庫在技術(shù)上的工作過程是:()A)數(shù)據(jù)的抽取B)存儲和管理C)數(shù)據(jù)的表現(xiàn)D)數(shù)據(jù)倉庫設(shè)計(jì)[多選題]198.數(shù)據(jù)集成可以分為(__)。A)內(nèi)容集成B)結(jié)構(gòu)集成C)模式集成D)概念集成[多選題]199.在Loader歷史作業(yè)記錄中,可以查看以下哪些內(nèi)容?A)作業(yè)狀態(tài)B)臟數(shù)據(jù)鏈接C)錯誤行/文件數(shù)量D)作業(yè)開始/運(yùn)行時間[多選題]200.在數(shù)據(jù)安全領(lǐng)域常用的P2DR模型中,P、D和R代表的是()。A)策略B)防護(hù)C)檢測D)響應(yīng)[多選題]201.大數(shù)據(jù)的頂層設(shè)計(jì)要堅(jiān)持的理念是()A)數(shù)據(jù)是資源B)安全是保障C)應(yīng)用是核心D)產(chǎn)業(yè)是目的[多選題]202.常用的代價函數(shù)有()。A)均方誤差B)均方根誤差C)平均絕對誤差D)交叉熵[多選題]203.下面關(guān)于Flink的描述正確的是:()A)Flink和Spark一樣,都是基于磁盤的計(jì)算框架B)當(dāng)全部運(yùn)行在HadoopC)Flink的流計(jì)算性能和Storm差不多,可以支持毫秒級的響應(yīng)D)Spark的市場影響力和社區(qū)活躍度明顯超過Flink[多選題]204.以下關(guān)于Loader的描述中,正確的有哪幾項(xiàng)?A)提供可視化向?qū)降淖鳂I(yè)配置管理界面。B)是基于開源Flume研發(fā),做了大量優(yōu)化和擴(kuò)展。C)提供定時調(diào)度任務(wù),周期性執(zhí)行Loader作業(yè)。D)在界面中可指定多種不同的數(shù)據(jù)源、配置數(shù)據(jù)的清洗和轉(zhuǎn)換步驟、配置集群存儲系統(tǒng)。[多選題]205.下列關(guān)于python中變量的使用,正確的是()。A)變量不必事先聲明B)變量無須先創(chuàng)建和賦值而直接使用C)變量無須指定類型D)可以使用del釋放資源[多選題]206.在現(xiàn)實(shí)世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的。描述處理該問題的各種方法有:()A)忽略元組B)使用屬性的平均值填充空缺值C)使用一個全局常量填充空缺值D)使用與給定元組屬同一類的所有樣本的平均值E)使用最可能的值填充空缺值第3部分:判斷題,共42題,請判斷題目是否正確。[判斷題]207.使用A)正確B)錯誤[判斷題]208.僅僅知道變量的均值(Mean)和中值(Median),就能計(jì)算的到變量的偏斜度(Skewness)A)正確B)錯誤[判斷題]209.調(diào)用函數(shù)時傳遞的實(shí)參個數(shù)必須與函數(shù)形參個數(shù)相等才行。A)正確B)錯誤[判斷題]210.Hadoop1.0和2.0都具備完善的HDFSHA策略。()A)正確B)錯誤[判斷題]211.COUNT聚合是對指定的集求值,刪除該集中的重復(fù)元組,然后返回結(jié)果集。()A)正確B)錯誤[判斷題]212.表達(dá)式list('[1,2,3]')的值是[1,2,3]。A)正確B)錯誤[判斷題]213.每個Topic都由一個或者多個Partitions構(gòu)成,Partition數(shù)量決定了每個Consumergroup中并發(fā)消費(fèi)者的最大數(shù)量。A)正確B)錯誤[判斷題]214.Formatdate轉(zhuǎn)換器使用時可以不區(qū)分日期形式()A)正確B)錯誤[判斷題]215.在噪聲數(shù)據(jù)中,波動數(shù)據(jù)比離群點(diǎn)數(shù)據(jù)偏離整體水平更大。A)正確B)錯誤[判斷題]216.移動互聯(lián)網(wǎng)實(shí)現(xiàn)了人人相連、人物相聯(lián)、物物相連。A)正確B)錯誤[判斷題]217.高頻交易,市場輿情分析,信貸風(fēng)險分析等這些金融領(lǐng)域的研究內(nèi)容均可以利用大數(shù)據(jù)技術(shù)進(jìn)行分析。A)正確B)錯誤[判斷題]218.數(shù)據(jù)表中的字段盡量保存不變的量,如設(shè)置出生日期而非年齡。--A)正確B)錯誤[判斷題]219.表達(dá)式1<2<3的值為True。A)正確B)錯誤[判斷題]220.MySQL中為所有字段插入記錄時,省略字段名稱,必須嚴(yán)格按照數(shù)據(jù)表結(jié)構(gòu)插入對應(yīng)的值。--A)正確B)錯誤[判斷題]221.內(nèi)置函數(shù)len()返回指定序列的元素個數(shù),適用于列表、元組、字符串、字典、集合以及range、zip等迭代對象。A)正確B)錯誤[判斷題]222.物聯(lián)網(wǎng)產(chǎn)業(yè)一般通過網(wǎng)絡(luò)提供商來進(jìn)行信息采集。A)正確B)錯誤[判斷題]223.文件對象的tell()方法用來返回文件指針的當(dāng)前位置。A)正確B)錯誤[判斷題]224.表達(dá)式':'A)正確B)錯誤[判斷題]225.使用del命令或者列表對象的remove()方法刪除列表中元素時會影響列表中部分元素的索引。A)正確B)錯誤[判斷題]226.大數(shù)據(jù)的思維會把原來的銷售概念變成服務(wù)概念A(yù))正確B)錯誤[判斷題]227.文本多進(jìn)多出是對文本類型的數(shù)據(jù)進(jìn)行轉(zhuǎn)換加工,處理的對象是一個文本字符串,處理完的輸出結(jié)果也是一個文本字符串。A)正確B)錯誤[判斷題]228.創(chuàng)建類的對象時,系統(tǒng)會自動調(diào)用構(gòu)造方法進(jìn)行初始化。()A)正確B)錯誤[判斷題]229.數(shù)據(jù)清洗的方法包括缺失值處理、噪聲數(shù)據(jù)清除、一致性檢查、重復(fù)數(shù)據(jù)記錄處理等。A)正確B)錯誤[判斷題]230.假設(shè)x為列表對象,那么xA)正確B)錯誤[判斷題]231.生成器表達(dá)式的計(jì)算結(jié)果是一個元組。()A)正確B)錯誤[判斷題]232.Pandas只有Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu)。()A)正確B)錯誤[判斷題]233.當(dāng)今世界的四大趨勢是指經(jīng)濟(jì)全球化、全球城市化、全球信息化、信息智慧化A)正確B)錯誤[判斷題]234.刪除列表中重復(fù)元素最簡單的方法是將其轉(zhuǎn)換為集合后再重新轉(zhuǎn)換為列表。A)正確B)錯誤[判斷題]235.技術(shù)選型時應(yīng)該采用最新的技術(shù)不需要考慮技術(shù)的穩(wěn)定性。A)正確B)錯誤[判斷題]236.rjust()方法用于將字符串的字符以右對齊方式進(jìn)行顯示。()A)正確B)錯誤[判斷題]237.訓(xùn)練完SVM模型后,不是支持向量的那些樣本我們可以丟掉,也可以繼續(xù)分類。()A)正確B)錯誤[判斷題]238.Oracle存儲過程可以使用阿里云流計(jì)算替換。A)正確B)錯誤[判斷題]239.數(shù)據(jù)質(zhì)量監(jiān)控DQC(DataQualityControl)模塊是對數(shù)據(jù)庫里的數(shù)據(jù)質(zhì)量進(jìn)行質(zhì)量管理的工具。A)正確B)錯誤[判斷題]240.子查詢語句是一條完整的SELECT語句,能夠獨(dú)立的執(zhí)行。--A)正確B)錯誤[判斷題]241.以3為實(shí)部4為虛部,Python復(fù)數(shù)的表達(dá)形式為3+4J。A)正確B)錯誤[判斷題]242.假設(shè)re模塊已成功導(dǎo)入,并且有pattern=pile('^'+'\.'.join([r'\d{1,3}'foriinrange(4)])+'$'),那么表達(dá)式pattern.match('03')的值為NoneA)正確B)錯誤[判斷題]243.Producer通過Push的方式將消息發(fā)送到Broker。A)正確B)錯誤[判斷題]244.TEXT和BLOB類型數(shù)據(jù)都根據(jù)二進(jìn)制編碼進(jìn)行比較和排序。--A)正確B)錯誤[判斷題]245.為了減少磁盤寫入的次數(shù),Broker會將消息暫時buffer起來,當(dāng)消息的個數(shù)達(dá)到一定閥值時,再flush到磁盤,這樣減少了磁盤IO調(diào)用的次數(shù)。A)正確B)錯誤[判斷題]246.由于Hadoop的設(shè)計(jì)對硬件要求低,因此無需構(gòu)建在昂貴的高可用性機(jī)器上,導(dǎo)致無法保證數(shù)據(jù)的可靠性、安全性和高可用性。A)正確B)錯誤[判斷題]247.()字符串?2008-8-15?和整數(shù)20080815都可以代表2008年8月15日。A)正確B)錯誤[判斷題]248.表達(dá)式{1,3,2}>{1,2,3}的值為True。A)正確B)錯誤第4部分:問答題,共11題,請?jiān)诳瞻滋幪顚懻_答案。[問答題]249.()是一種意識,認(rèn)為公開的數(shù)據(jù)一旦處理得當(dāng)就能為千百萬人急需解決的問題提供答案。[問答題]250.通過()管理兩個或者多個NameNode,使一個NameNode為()狀態(tài),并且同步每個NN的元數(shù)據(jù),如果active狀態(tài)的NN宕機(jī)后馬上啟用狀態(tài)為()狀態(tài)的備用節(jié)點(diǎn)。[問答題]251.hadoop-env.sh是用于做什么的?[問答題]252.()中引入了資源管理框架Yarn。[問答題]253.如何使用pip命令安裝numpy、scipy模塊[問答題]254.大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其中()為數(shù)據(jù)的主要部分。[問答題]255.請簡單介紹Python中的數(shù)據(jù)類型和數(shù)字類型。[問答題]256.HDFS體系結(jié)構(gòu)是?HDFS采用了主從()結(jié)構(gòu)模型,一個HDFS集群是由一個NameNode和若干個DataNode組成的。其中NameNode作為主服務(wù)器,管理文件系統(tǒng)的命名空間和客戶端對文件的訪問操作;集群中的DataNode管理存儲的數(shù)據(jù)[問答題]257.JobTracker和TaskTracker[問答題]258.在Spark中引人RDD概念的目的是實(shí)現(xiàn)()。[問答題]259.我們通過執(zhí)行()命令,可以使得配置的環(huán)境變量文件生效。[單選題]260.語義網(wǎng)絡(luò)表達(dá)知識時,有向弧AKO鏈、ISA鏈?zhǔn)怯脕肀磉_(dá)節(jié)點(diǎn)知識的()。A)無悖性B)可擴(kuò)充性C)繼承性1.答案:B解析:2.答案:B解析:3.答案:A解析:4.答案:C解析:5.答案:D解析:6.答案:A解析:7.答案:C解析:8.答案:C解析:在數(shù)據(jù)分析中,流程分為以下方式;描述性分析、診斷性分析、預(yù)測性分析、規(guī)范性分析。9.答案:C解析:10.答案:D解析:11.答案:B解析:12.答案:C解析:連續(xù)型數(shù)據(jù)可能存在冗余問題。13.答案:D解析:14.答案:A解析:15.答案:C解析:16.答案:B解析:17.答案:D解析:18.答案:D解析:19.答案:C解析:20.答案:B解析:21.答案:B解析:22.答案:D解析:23.答案:D解析:24.答案:A解析:25.答案:D解析:26.答案:B解析:27.答案:D解析:28.答案:A解析:29.答案:B解析:30.答案:A解析:31.答案:A解析:32.答案:A解析:33.答案:C解析:單單R方不能表示變量顯著性,因?yàn)槊看渭尤胍粋€特征值,R方都會上升或維持不變。但在調(diào)整R方的情況下這也有誤(如果特征值顯著的話,調(diào)整R方會上升)。34.答案:B解析:35.答案:A解析:36.答案:C解析:過濾式特征選擇先對數(shù)據(jù)集進(jìn)行特征選擇,然后再訓(xùn)練學(xué)習(xí)器,特征選擇過程與后續(xù)學(xué)習(xí)器無關(guān)。包裹式特征選擇把最終將要使用的學(xué)習(xí)器的性能作為特征子集的評價準(zhǔn)則。37.答案:C解析:38.答案:B解析:39.答案:B解析:40.答案:A解析:41.答案:D解析:42.答案:C解析:數(shù)據(jù)加工(DataWrangling或DataMunging)的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過程。從加工程度看,數(shù)據(jù)可以分為零次、一次、二次、三次數(shù)據(jù)。43.答案:C解析:44.答案:A解析:45.答案:B解析:46.答案:C解析:泛化誤差可分解為偏差、方差與噪聲之和。偏差度量了學(xué)習(xí)算法的期望預(yù)測與真實(shí)結(jié)果的偏離程度,即刻畫了學(xué)習(xí)算法本身的擬合能力;方差度量了同樣大小的訓(xùn)練集的變動所導(dǎo)致的學(xué)習(xí)性能的變化,即刻畫了數(shù)據(jù)擾動所造成的影響;噪聲則表達(dá)了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達(dá)到的期望泛化誤差的F界,即刻畫了學(xué)習(xí)問題本身的難度。47.答案:D解析:48.答案:C解析:49.答案:B解析:50.答案:D解析:51.答案:D解析:52.答案:B解析:53.答案:D解析:隨機(jī)試驗(yàn)中的每一個可能出現(xiàn)的試驗(yàn)結(jié)果稱為這個試驗(yàn)的一個樣本點(diǎn)。全體樣本點(diǎn)組成的集合,即隨機(jī)試驗(yàn)的所有可能出現(xiàn)的結(jié)果稱為這個試驗(yàn)的樣本空間。54.答案:B解析:55.答案:B解析:56.答案:A解析:57.答案:C解析:58.答案:D解析:59.答案:A解析:60.答案:B解析:61.答案:A解析:決簧樹包含一個根節(jié)點(diǎn)、若子內(nèi)部節(jié)點(diǎn)和若干葉節(jié)點(diǎn)。葉節(jié)點(diǎn)對應(yīng)于決策結(jié)果,其他每個節(jié)點(diǎn)則對應(yīng)于一個屬性測試。62.答案:D解析:63.答案:B解析:64.答案:B解析:65.答案:A解析:66.答案:D解析:67.答案:D解析:68.答案:C解析:69.答案:D解析:70.答案:B解析:71.答案:A解析:72.答案:D解析:73.答案:A解析:74.答案:D解析:75.答案:C解析:76.答案:B解析:77.答案:A解析:78.答案:D解析:79.答案:C解析:80.答案:B解析:81.答案:A解析:82.答案:D解析:83.答案:A解析:84.答案:B解析:85.答案:B解析:86.答案:C解析:87.答案:C解析:88.答案:C解析:89.答案:B解析:90.答案:B解析:91.答案:A解析:92.答案:D解析:93.答案:C解析:94.答案:B解析:95.答案:C解析:k近鄰中的近鄰指的是距離待預(yù)測數(shù)據(jù)的數(shù)據(jù)點(diǎn),而k近鄰指的是取距k近的前幾個數(shù)據(jù)點(diǎn),并非基于全局信息進(jìn)行預(yù)測。96.答案:A解析:97.答案:C解析:98.答案:C解析:99.答案:C解析:100.答案:B解析:101.答案:D解析:102.答案:D解析:103.答案:D解析:104.答案:C解析:105.答案:D解析:106.答案:D解析:107.答案:C解析:108.答案:C解析:109.答案:D解析:110.答案:B解析:111.答案:B解析:112.答案:D解析:殘值在數(shù)理統(tǒng)計(jì)中是指實(shí)際觀察值與估計(jì)值(擬合值)之間的差。113.答案:B解析:114.答案:A解析:115.答案:B解析:116.答案:A解析:117.答案:C解析:118.答案:A解析:119.答案:C解析:120.答案:B解析:SVM是Sklearn中的支持向量機(jī)模塊,包括分類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論