版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試題說(shuō)明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案16(500題)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案16
L[單選題]HDFS的NameNo加負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在
一個(gè)文件系統(tǒng)樹(shù)中,這些信息也會(huì)在硬盤(pán)上保存成以下文件:
A)日志
B)命名空間鏡像
C)兩者都是
2.[單選題]反演歸結(jié)(消解)證明定理時(shí),若當(dāng)前歸結(jié)式是()時(shí),則定理得證。
A)永真式
B)包孕式(subsumed)
C)空子句
3.[單選題]以下屬于分類分析的是()
A)、線性回歸
B)、平穩(wěn)序列預(yù)測(cè)
C)、決策樹(shù)分析
D)、單因素方差分析
4.[單選題]以下描述不正確的是(_)。
A)干凈數(shù)據(jù)是相對(duì)于“臟數(shù)據(jù)”的一種提法
B)整齊數(shù)據(jù)是相對(duì)于“亂數(shù)據(jù)”的一種提法
C)存在缺失值的數(shù)據(jù)是亂數(shù)據(jù)
D)數(shù)據(jù)質(zhì)量有問(wèn)題是臟數(shù)據(jù)
5.[單選題]下列關(guān)于Python包的說(shuō)法正確的是()。
A)利用pip包管理器更新已安裝包的代碼是pipupdate包名
B)單獨(dú)導(dǎo)入包名即可導(dǎo)入包中所包含的所有子模塊
C)下載安裝、更新、查看、移除包等行為可以在命令行中進(jìn)行,但不可以在Jupyternotebook中
進(jìn)行
D)下載安裝、更新、查看、移除包等行為既可以用pip工具,也可以用conda工具
6.[單選題]下面關(guān)于ID3算法中說(shuō)法錯(cuò)誤的是
A)ID3算法要求特征必須離散化
B)信息增益可以用嫡,而不是GINI系數(shù)來(lái)計(jì)算
C)選取信息增益最大的特征,作為樹(shù)的根節(jié)點(diǎn)
D)ID3算法是一個(gè)二叉樹(shù)模型
7.[單選題]執(zhí)行以下代碼段listl=[2445,133,12254,123]print(min(listl),max(listl))時(shí)
,輸出為()o
A)1232445
B)2445133
012312254
D)122542445
8.[單選題]以查準(zhǔn)率為縱軸、查全率為橫軸作圖,就得到了查準(zhǔn)率-查全率曲線,簡(jiǎn)稱(_)。
A)雙曲線
B)P-R曲線
C)科克曲線
D)共物曲線
9.[單選題]()情況下,LDA會(huì)失敗。
A)如果有辨識(shí)性的信息不是平均值,而是數(shù)據(jù)的方差
B)如果有辨識(shí)性的信息是平均值,而不是數(shù)據(jù)方差
0如果有辨識(shí)性的信息是數(shù)據(jù)的均值和方差
D)以上答案都不正確
10.[單選題]在HBase數(shù)據(jù)模型中,列必須用()來(lái)定義。
A)鍵
B)族
C)單元格
D)時(shí)間戳
11.[單選題]Hadoop中MapReduce組件擅長(zhǎng)處理()場(chǎng)景的計(jì)算任務(wù)。
A)迭代計(jì)算
B)離線計(jì)算
C)實(shí)時(shí)交互計(jì)算
D)流式計(jì)算
12.[單選題]HBase只有一個(gè)針對(duì)行健的索引,如果要訪問(wèn)HBase表中的行,下面哪種方式是不可行的
?
A)通過(guò)單個(gè)行健訪問(wèn)
B)通過(guò)時(shí)間戳訪問(wèn)
C)通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)
D)全表掃描
13.[單選題]執(zhí)行a=np.array([[1,2,3],[4,5,6]]);print(np.append(a,[[7,8,9]],axis=
0))結(jié)果為?
A)[123456789]
B)[[147]L258][369]]
C)[[123][456][789]]
D)[[1,2,3,4,5,6,7,8,9]]
14.[單選題]執(zhí)行以下代碼段pets=['dog','cat','dog','goldfish1,'cat','rabbit',
'cat']while'cat'inpets:pets,remove('cat')print(pets)輸出為(.)0
A)['dog','cat','dog','goldfish','cat','rabbit','cat']
B)['dog','dog','goldfish','rabbit']
C)['dog','dog','goldfish','cat','rabbit','cat']
D)['dog','dog','goldfish','rabbit','cat']
15.[單選題]TF-IDF模型中IDF是指(_)°
A)詞頻數(shù)
B)逆文檔頻率
C)詞頻率
D)逆文檔頻數(shù)
16.[單選題]當(dāng)訓(xùn)練樣本近似線性可分時(shí),通過(guò)(),學(xué)習(xí)一個(gè)()
A)硬間隔,最大化非線性支持向量機(jī)
B)軟間隔,最大化線性支持向量機(jī)
C)硬間隔,最大化線性支持向量機(jī)
D)軟間隔,最大化非線性支持向量機(jī)
17.[單選題]Stage的Task的數(shù)量由什么決定()
A)Partition
B)Job
C)Stage
D)TaskScheduler
18.[單選題]HBase作為數(shù)據(jù)存儲(chǔ)組件封裝于大數(shù)據(jù)平臺(tái),用于()存儲(chǔ)。
A)關(guān)系型數(shù)據(jù)庫(kù)
B)分布式文件
0非關(guān)系型數(shù)據(jù)庫(kù)
D)列式存儲(chǔ)
19.[單選題]為了解決如何模擬人類的感性思維,例如視覺(jué)理解、直覺(jué)思維、悟性等,研究者找到一
個(gè)重要的信息處理的機(jī)制是()。
A)A專家系統(tǒng)
B)人工神經(jīng)網(wǎng)絡(luò)
C)模式識(shí)別
D)智能代理
20.[單選題]已知一個(gè)數(shù)據(jù)集,n為特征數(shù),m為訓(xùn)練樣本數(shù),如果n較小,而且m大小中等
(例如n為1?1000,而m為10?10000),則一般選擇()。
A)邏輯回歸模型
B)不帶核的支持向量機(jī)
C)高斯核的支持向量機(jī)
D)多項(xiàng)式核的支持向量機(jī)
21.[單選題]在大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的表中存有一批網(wǎng)站及其相互之間鏈接關(guān)
系,開(kāi)發(fā)人員希望通過(guò)pagerank算法來(lái)分析這批網(wǎng)站的排名,即把網(wǎng)站看做節(jié)點(diǎn),把網(wǎng)站之間的連
接關(guān)系看做權(quán)重,從而實(shí)現(xiàn)對(duì)網(wǎng)站的評(píng)分。()計(jì)算框架更適合實(shí)現(xiàn)這個(gè)場(chǎng)景。
A)SQL
B)MapReduce
C)Graph
D)Tunnel
22.[單選題]數(shù)據(jù)科學(xué)家采用()方法判斷數(shù)據(jù)是否“干凈”。
A)、數(shù)據(jù)處理
B)、數(shù)據(jù)加工
C)、數(shù)據(jù)審計(jì)
D)、數(shù)據(jù)化
23.[單選題]D剛常用的激活函數(shù)有()
A)sigmoid
B)tanh
C)ReLU
D)以上答案都正確
24.[單選題]表t中有1000萬(wàn)行數(shù)據(jù),想要隨意抽取10行數(shù)據(jù),在odpscmd中執(zhí)行消耗時(shí)間最短的方式
是:()。
A)select*fromtwhererownum<=10
B)gett10
C)select*fromtlimit10
D)readt10
25.[單選題]舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書(shū)中明確指出,大數(shù)據(jù)時(shí)代
最大的轉(zhuǎn)變就是思維方式的三種轉(zhuǎn)變,其中不包括()
A)全樣而非抽樣
B)效率而非精確
C)相關(guān)而非因果
D)務(wù)實(shí)而非務(wù)虛
26.[單選題]機(jī)器學(xué)習(xí)中做特征選擇時(shí),可能用到的方法有?
A)卡方
B)信息增益
C)期望交叉病
D)以上都有
27.[單選題]假設(shè)file是文本文件對(duì)象,下列哪個(gè)選項(xiàng)可讀取file的一行內(nèi)容?()
A)file.read()
B)file.read(200)
C)file.readline()
D)file.readlines()
28.[單選題]下列關(guān)于大數(shù)據(jù)的分析理念的說(shuō)法中,錯(cuò)誤的是()。
A)在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)
B)在分析方法上更注重相關(guān)分析而不是因果分析
C)在分析效果上更追求效率而不是絕對(duì)精確
D)在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)
29.[單選題]以下關(guān)于人機(jī)交互,描述錯(cuò)誤的是:()
A)人機(jī)交互是一門(mén)研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)科
B)人機(jī)交互界面通常是指用戶不可見(jiàn)的
C)系統(tǒng)可以是各種各樣的機(jī)器.也可以是計(jì)算機(jī)化的系統(tǒng)和軟件
D)用戶通過(guò)人機(jī)交互界面與系統(tǒng)交流.并進(jìn)行操作
30.[單選題]當(dāng)前社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()
A)互聯(lián)網(wǎng)
B)物聯(lián)網(wǎng)
C)綜合國(guó)力
D)自然資源
31.[單選題]下面代碼運(yùn)行結(jié)果()。a=Itry:a+=1except:a+=lelse:a+=Ifinally:a+=
Iprint(a)
A)2
B)3
04
D)5
32.[單選題]HDFS架構(gòu)中有兩個(gè)()。
A)DataNodes
B)JobTracke
C)NameNode
D)SecondayNameNode
33.[單選題]已知一組數(shù)據(jù)的協(xié)方差矩陣P,下面關(guān)于主分量說(shuō)法錯(cuò)誤的是()。
A)主分量分析的最佳準(zhǔn)則是對(duì)一組數(shù)據(jù)進(jìn)行按一組正交基分解,在只取相同數(shù)量分量的條件下,以均
方誤差計(jì)算截尾誤差最小
B)在經(jīng)主分量分解后,協(xié)方差矩陣成為對(duì)角矩陣
C)主分量分析就是K-L變換
D)主分量是通過(guò)求協(xié)方差矩陣的特征值得到
34.[單選題]ID、F采用了IWF的幾次平方?()
A)、一次
B)、二次
0、三次
D)、四次
35.[單選題]下面關(guān)于假設(shè)檢驗(yàn)相關(guān)描述不正確的有(_)。
A)先對(duì)總體均值進(jìn)行假設(shè),然后利用樣本來(lái)檢驗(yàn)假設(shè)是否成立這屬于假設(shè)檢驗(yàn)
B)區(qū)間估計(jì)不是假設(shè)檢驗(yàn)
0非參數(shù)假設(shè)檢驗(yàn)是假設(shè)檢驗(yàn)
D)點(diǎn)估計(jì)是假設(shè)檢驗(yàn)
36.[單選題]對(duì)于信息增益,決策樹(shù)分裂節(jié)點(diǎn),下面說(shuō)法正確的是()1純度高的節(jié)點(diǎn)需要更多的信
息去區(qū)分2信息增益可以用”1比特-炳”獲得3如果選擇一個(gè)屬性具有許多歸類值,那么這個(gè)信息
增益是有偏差的
A)1
B)2
C)2和3
D)所有以上
37.[單選題]執(zhí)行以下代碼段classfruits:def_init_(self,price):self,price=priceobj
=fruits(10)obj.quantity=8obj.bags=2print(obj.quantity+len(obj.—diet—))時(shí),輸出
為(一)o
A)8
B)9
C)10
D)ll
38.[單選題]把詞典中的詞按照由長(zhǎng)到短遞減的順序逐字搜索整個(gè)待處理的材料,一直到把全部的詞
切分出來(lái)為止。不論分詞詞典多大,被處理的材料多么小,都得把這個(gè)分詞詞典匹配一遍。這種方
法叫(_)o
A)正向最大匹配法
B)逆向最大匹配法
C)逐詞遍歷法
D)隱馬爾科夫模型
39.[單選題]關(guān)于Pandas中數(shù)據(jù)排序,下列說(shuō)法正確的是()
A)即可以按照行索引排序,也可以按照列索引排序
B)sort_index()方法表示按照值進(jìn)行排序
C)sort_values()方法表示按照索引進(jìn)行排序
D)默認(rèn)情況下,sort_index()方法按照降序排列
40.[單選題]以下對(duì)大數(shù)據(jù)4V特性描述不正確的是(__)o
A)在大數(shù)據(jù)中,價(jià)值與數(shù)據(jù)總量的大小不存在線性關(guān)系
B)數(shù)據(jù)量大是相對(duì)計(jì)算與存儲(chǔ)能力而定的
C)Volume是指數(shù)據(jù)大
D)大數(shù)據(jù)中所說(shuō)的“速度”包括兩種:增長(zhǎng)速度和處理速度
41.[單選題]()的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過(guò)程。
A)數(shù)據(jù)處理
B)數(shù)據(jù)計(jì)算
C)數(shù)據(jù)加工
D)整齊數(shù)據(jù)
42.[單選題]非關(guān)系型數(shù)據(jù)庫(kù)不包括
A)Hbase
B)Mapreduce
C)Neo4j
D)MongoDB
43.[單選題]下列方法中,可以對(duì)列表元素排序的是()。
A)sort()
B)reverse()
C)max()
D)list()
44.[單選題]mkdir()的作用是(—_)o
A)刪除指定路徑的目錄
B)改變當(dāng)前工作目錄到指定的路徑
C)以數(shù)字權(quán)限模式創(chuàng)建目錄
D)返回當(dāng)前工作目錄
45.[單選題]圖像識(shí)別常用softmA、x函數(shù)接在模型的輸出上,其作用為:()。
A)、增加不同類別之間的區(qū)分度
B)、突出輸出向量中類標(biāo)的對(duì)應(yīng)的維度
C)、對(duì)輸出歸一化,同時(shí)以概率的更好解釋輸出向量
D)、過(guò)濾無(wú)用的環(huán)境信息
46.[單選題]建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖
26掘的哪一類任務(wù)?
A)、根據(jù)內(nèi)容檢索
B)、建模描述
C)、預(yù)測(cè)建模
D)、尋找模式和規(guī)則
47.[單選題]下列哪一項(xiàng)不屬于大數(shù)據(jù)的治理:()
A)安全問(wèn)題
B)成本問(wèn)題
C)針對(duì)大用戶
D)信息生命周期管理
48.[單選題]大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)是阿里巴巴自主研發(fā)的海量數(shù)據(jù)處理平臺(tái)
,主要服務(wù)于批量結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和計(jì)算。以下()場(chǎng)景不適合使用大數(shù)據(jù)計(jì)算服務(wù)實(shí)現(xiàn)。
A)大數(shù)據(jù)的分析建模
B)海量數(shù)據(jù)倉(cāng)庫(kù)
OOLTP
D)網(wǎng)站日志離線分析
49.[單選題]構(gòu)造方法是類的一個(gè)特殊方法,Python中它的名稱為。。
A)與類同名
B)construct
C)—init—
D)init
50.[單選題]在HBase系統(tǒng)架構(gòu)中,HRegionServer主要負(fù)責(zé)相應(yīng)用戶I/O請(qǐng)求,向()文件系統(tǒng)中讀寫(xiě)
數(shù)據(jù)
A)HAFS
B)HBFS
OHCFS
D)HDFS
51.[單選題]以下關(guān)于機(jī)器學(xué)習(xí),描述錯(cuò)誤的是:。
A)是一門(mén)涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、.腦科學(xué)等諸多領(lǐng)
域的交叉學(xué)科
B)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能
C)機(jī)器學(xué)習(xí)強(qiáng)調(diào)三個(gè)關(guān)鍵詞:算法、模型、訓(xùn)練
D)基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一
52.[單選題]ClouderaNavigator是唯一企業(yè)級(jí)Hadoop數(shù)據(jù)治理平臺(tái),以下哪個(gè)不是他的功能
?()
A)支持元數(shù)據(jù)標(biāo)簽、分類和搜索
B)提供多維分析
C)提供數(shù)據(jù)溯源和依賴關(guān)系
D)提供操作審計(jì)
53.[單選題]FusioninsightManager不能夠管理哪個(gè)對(duì)象?
A)Sprk
B)主機(jī)OS
OYARN
D)HDFS
54.[單選題]以下不是開(kāi)源工具特點(diǎn)的是0。
A)免費(fèi)
B)可以直接獲取源代碼
C)用戶可以修改源代碼并不加說(shuō)明用于自己的軟件中
D)開(kāi)源工具一樣具有版權(quán)
55.[單選題]MapReduce中在程序的某個(gè)位置可以插入(—),記錄數(shù)據(jù)或進(jìn)度的變化情況。
A)計(jì)數(shù)器
B)對(duì)象
C數(shù)組
D)索引
56.[單選題]按照國(guó)家法律法規(guī)和公司保密管理規(guī)定,制定數(shù)據(jù)資產(chǎn)脫敏策略,對(duì)涉及個(gè)人隱私及單
位商密的數(shù)據(jù)進(jìn)行()后方可共享和開(kāi)放。
A)分類處理
B)清洗處理
C)脫敏處理
D)切片處理
57.[單選題]按照維度將多個(gè)矩陣連接起來(lái)應(yīng)該用哪個(gè)函數(shù)?
A)np.mul
B)np.sum
C)np.concatenat
D)np.mat
58.[單選題]導(dǎo)入模塊的方式錯(cuò)誤的是
A)importmo
B)frommoimport
C)importmoasm
D)importmfrommo
59.[單選題]長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計(jì)用來(lái)解決什么問(wèn)題?
A)傳統(tǒng)RNN存在的梯度消失/爆炸問(wèn)題
B)傳統(tǒng)RNN計(jì)算量大的問(wèn)題
C)傳統(tǒng)RNN速度較慢的問(wèn)題
D)傳統(tǒng)RNN容易過(guò)過(guò)擬合的問(wèn)題
60.[單選題]多分類LDA將樣本投影到NT維空間,NT通常遠(yuǎn)小于數(shù)據(jù)原有的屬性數(shù),可通過(guò)這個(gè)投
影來(lái)減小樣本點(diǎn)的維數(shù),且投影過(guò)程中使用了類別信息,因此LDA也常被視為一種經(jīng)典的()技術(shù)
A)無(wú)監(jiān)督特征選擇
B)無(wú)監(jiān)督降維
C)監(jiān)督特征選擇
D)監(jiān)督降維
61.[單選題]什么關(guān)于TFTDF模型描述錯(cuò)誤的是?
A)TF意思是詞頻
B)1DF是逆文本頻率
C)該模型基于概率圖模型方法
D)是一種信息檢索和數(shù)據(jù)挖掘常用加權(quán)技術(shù)
62.[單選題]某大數(shù)據(jù)運(yùn)維人員想通過(guò)shell命令上傳某個(gè)文件至HDFS文件系統(tǒng)中。以下哪個(gè)命令能
幫助他完成這個(gè)操作?
A)-cat
B)-upload
C)-put
D)-get
63.[單選題]大數(shù)據(jù)最顯著的特征是:()。
A)數(shù)據(jù)規(guī)模大
B)數(shù)據(jù)類型多樣
C)數(shù)據(jù)處理速度快
D)數(shù)據(jù)價(jià)值密度高
64.[單選題]關(guān)于Hive在FusioninsightHD中的架構(gòu)描述錯(cuò)誤的是:
A)只要有一個(gè)Hiveserver不可用,整個(gè)Hive集群便不可用
B)HiveServer負(fù)責(zé)接受客戶端請(qǐng)求、解析、執(zhí)行HQL命令并返回查詢結(jié)果
C)MetaDtore用于提供元數(shù)據(jù)服務(wù),依賴于DBService
D)在用一時(shí)間點(diǎn),HiveServer只有一個(gè)處于Active狀態(tài),另一個(gè)則處于Standby
65.[單選題]調(diào)用自定義函數(shù)使用()。-
A)CALL
B)LOAD
C)CREATE
D)SELECT
66.[單選題]集合運(yùn)算算子指的是?
A)SetOp
B)ArrayOP
C)HashOp
D)ListOp
67.[單選題]在HBase的專用過(guò)濾器中,前綴過(guò)濾器是()
A)PrefixComparatorFilter
B)PrefixFilter
C)ComparatorFilter
D)PrefixValueFiIter
68.[單選題]Yarn中設(shè)置隊(duì)里queueA的最大使用資源量,需要配置哪個(gè)參數(shù)
A)yarn.scheduler,capacity,root.Queueuser-limit-factor
B)yarn.scheduler,capacity,root.QueueA.minimum-user-limit-percent
C)yarn,scheduler,capacity,root.QueueA.state
D)yarn.scheduler.capacity,root.QueueA.maxmum-capacity
69.[單選題]下面關(guān)于ZooKeeper特性的描述錯(cuò)誤的是?
A)消息更新只能成功或者失敗,沒(méi)有中間狀態(tài)
B)ZooKeeper節(jié)點(diǎn)數(shù)必須為奇數(shù)個(gè)
C)一條消息要被超過(guò)半數(shù)的Server接收,它將可以成功寫(xiě)入磁盤(pán)
D)客戶端所發(fā)送的更新會(huì)按照它們被發(fā)送的順序進(jìn)行應(yīng)用
70.[單選題]部署HBase時(shí)需要依賴于哪個(gè)資源協(xié)調(diào)組件
A)Yarn
B)ZooKeeper
C)Sqoop
D)HDFS
71.[單選題]HBase架構(gòu)的四大組件中,()分布式協(xié)調(diào)服務(wù)器。
A)Zookeeper
B)Master
C)RegionServer
D)Client
72.[單選題]HBase自動(dòng)把表水平劃分成(一)。
A)塊
B)單元
C)域
D)區(qū)域
73.[單選題]關(guān)于K均值和OBSCAN的比較,以下說(shuō)法不正確的是()
A)K均值丟棄被它識(shí)別為噪聲的對(duì)象,而OBSCAN一般聚類所有對(duì)象
B)K均值使用簇的基于原型的概念,而OBSCAN使用基于密度的概念
OK均值很難處理非球形的簇和不同大小的簇,OBSCAN可以處理不同大小和不同形狀的簇
D)K均佳可以發(fā)現(xiàn)不是明顯分離的簇,即使簇有重疊也可以發(fā)現(xiàn),但是OBSC劇會(huì)合并有重疊的簇
74.[單選題]HBase是一種可伸縮、高可靠、高性能、分布式和面向()的動(dòng)態(tài)模式數(shù)據(jù)庫(kù)。
A)列
B)行
C)行和列
D)元組
75.[單選題]數(shù)據(jù)資產(chǎn)維護(hù)是指為保證數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)進(jìn)行()等處理的過(guò)程。
A)更正
B)刪除
C)補(bǔ)充錄入
D)以上答案都正確
76.[單選題]如圖,以下關(guān)于Kafka消息消費(fèi)者Consumer讀取消息的描述,錯(cuò)誤的有?
A)Consumer使用Offset來(lái)記錄讀取的位置
B)圖片中的藍(lán)色框?yàn)镵afka的一個(gè)Topic,即可以理解為一個(gè)隊(duì)列,每個(gè)格子代表一條消息。
C)生產(chǎn)者產(chǎn)生的消息逐條放到Topic的末尾
D)消費(fèi)者從右至左順序讀取消息
77.[單選題]人工智能是一門(mén)()
A)數(shù)學(xué)與生理學(xué)
B)心理學(xué)與生理學(xué)
C)語(yǔ)言學(xué)
D)綜合性的交叉學(xué)科與邊緣學(xué)科
78.[單選題]有關(guān)Hive支持的基本數(shù)據(jù)類型,以下那個(gè)是2byte有符合整數(shù)()
A)Tinyint
B)Smalint
C)Int
D)Bigint
79.[單選題]將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)入到Hadoop平臺(tái)的工具是。。
A)import
B)export
C)overwrite
D)drop
80.[單選題]以下哪個(gè)不是外部客戶()
A)能源供應(yīng)商
B)政府部門(mén)
C)能源服務(wù)商
D)生產(chǎn)客戶
81.[單選題]修改資源的化導(dǎo)入excel的操作列應(yīng)該填寫(xiě)()。
A)插入
B)更新
C)刪除
D)追加
82.[單選題]下列不是開(kāi)源工具特點(diǎn)的是()。
A)免費(fèi)
B)可以直接獲取源代碼
C)用戶可以修改源代碼并不加說(shuō)明用于自己的軟件中
D)開(kāi)源工具一樣具有版權(quán)
83.[單選題]下列對(duì)圖數(shù)據(jù)庫(kù)描述正確的是?Z
A)以圖”數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)和查詢數(shù)據(jù)的教據(jù)庫(kù)
B)存儲(chǔ)圖片的數(shù)據(jù)庫(kù)
C)與關(guān)系型數(shù)據(jù)庫(kù)美似的數(shù)據(jù)庫(kù)
D)數(shù)據(jù)倉(cāng)庫(kù)的一種
84.[單選題]下面關(guān)于機(jī)器學(xué)習(xí)相關(guān)描述不正確的有(_)。
A)機(jī)器學(xué)習(xí)的主要議題是如何實(shí)現(xiàn)和優(yōu)化機(jī)器的自我學(xué)習(xí)
B)機(jī)器學(xué)習(xí)的基本思路是以訓(xùn)練集為輸入,通過(guò)機(jī)器學(xué)習(xí)算法讓機(jī)器學(xué)習(xí)到能夠處理更多數(shù)據(jù)的能
力
C)AlphaGo的核心技術(shù)是深度學(xué)習(xí)與增強(qiáng)學(xué)習(xí)
D)機(jī)器學(xué)習(xí)的只能是預(yù)定義的
85.[單選題]圖像降噪的作用(_)?
A)改變圖像大小
B)將圖像分成多個(gè)小單位
C)去除干擾信號(hào)
D)使圖像變得更加豐富
86.[單選題]執(zhí)行以下代碼段a=21b=10print(a==b)時(shí),輸出為()。
A)True
B)False
C)None
D)Error
87.[單選題]下列哪個(gè)方法不屬于情感分析的評(píng)測(cè)?
A)COAE評(píng)測(cè)
B)cifa門(mén)0數(shù)據(jù)集評(píng)測(cè)
OCCFTCCI評(píng)測(cè)
D)TAC評(píng)測(cè)
88.[單選題]根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)戰(zhàn)略安排,第二個(gè)階段是到。年,建成泛在電力物聯(lián)網(wǎng)。
A)2020
B)2021
02024
D)2025
89.[單選題]哪個(gè)不是Flume的channel類型?
A)MemoryChannel
B)FileChannel
C)JDBCCHannel
D)HDFSChannel
90.[單選題]python語(yǔ)句print(chr(65))的運(yùn)行結(jié)果是。。
A)65
B)6
05
D)A
91.[單選題]以下關(guān)于Hive和關(guān)系數(shù)據(jù)庫(kù)的區(qū)別描述錯(cuò)誤的是()
A)Hive的查詢語(yǔ)言是HQL,關(guān)系型數(shù)據(jù)庫(kù)的查詢語(yǔ)言是SQL
B)Hive的數(shù)據(jù)格式是用戶定義,關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)格式是系統(tǒng)決定
C)Hive可擴(kuò)展性高,關(guān)系型數(shù)據(jù)庫(kù)可擴(kuò)展性低
D)Hive的數(shù)據(jù)規(guī)模小,關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)規(guī)模大
92.[單選題]在Apriori算法中,候選項(xiàng)集劃分為不同的桶,存放在()中
A)字典
B)集合
OHash樹(shù)
D)列表
93.[單選題]Numpy中對(duì)數(shù)組進(jìn)行轉(zhuǎn)置的函數(shù)是()。
A)transpose()
B)rollaxis()
C)swapaxes()
D)tan()
94.[單選題]關(guān)于GaussDB200的兩種跨集群方式EC(ExtensionConnector)和FT(Foreign
Table),以下說(shuō)法正確的是()?
A)在連接之前都要先做好集群互信操作。
B)EC配置簡(jiǎn)單,理論上可以連接任何支持ODBC的同構(gòu)/異構(gòu)數(shù)據(jù)庫(kù)。
C)二者都可以充分利用GaussDB200的分布式計(jì)算能力。
D)FT配置復(fù)雜,只能支持GaussDB200同構(gòu)數(shù)據(jù)庫(kù)。
95.[單選題]Fusioninsight系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在單個(gè)節(jié)點(diǎn)內(nèi)不需要經(jīng)過(guò)哪個(gè)環(huán)節(jié)?
A)Source
B)Channel
OSink
D)topic
96.[單選題]在Scipy中,想要生成20個(gè)服從正態(tài)分布的隨機(jī)數(shù)使用函數(shù)()。
A)stats,uniform,rvs(size=20)
B)stats,norm,rvs(size=20)
C)stats,beta,rvs(size=20)
D)stats,poisson.rvs(size=20)
97.[單選題]下列是正確的變量名的是(―)。
A)if
B)char
C)input
D)IF
98.[單選題]關(guān)于公民的隱私權(quán),下面描述錯(cuò)誤的是:()
A)修改權(quán)是隱私權(quán)利人具有的依法了解自身信息資料是否被行政主體利用的權(quán)利
B)支配權(quán)是隱私權(quán)利人的基本權(quán)利之一,隱私權(quán)利人對(duì)自己的個(gè)人信息的收集、儲(chǔ)存、傳播、使用
、開(kāi)放等享有支配權(quán)
C)保障權(quán)是指公民有權(quán)要求政府在數(shù)據(jù)開(kāi)放的過(guò)程中保障涉及其個(gè)人隱私的信息資料不被開(kāi)放、不
被濫用和不被泄露
D)救濟(jì)權(quán)是公民在自身的合法權(quán)益受到侵害時(shí),按照法定程序采取法律手段維護(hù)自身權(quán)益的權(quán)利
99.[單選題]Maxcompute中負(fù)責(zé)對(duì)等待提交的task進(jìn)行排序的模塊是:()。
A)scheduler
B)controller
C)executor
D)worker
100.[單選題]不良信用記錄會(huì)在征信系統(tǒng)里保存()年
A)1
B)3
C)5
D)10
101.[單選題]關(guān)于正則化項(xiàng),說(shuō)法錯(cuò)誤的是0
A)、在機(jī)器學(xué)習(xí)中,如果單方面追求“誤差函數(shù)”的取值最小,則很容易造成機(jī)器學(xué)習(xí)
的“欠擬合”現(xiàn)象。
B)、”過(guò)擬合(Overfit)”就是目標(biāo)函數(shù)在已知數(shù)據(jù)(如訓(xùn)練集)上的擬合性能非常高
(如準(zhǔn)確率達(dá)到100%),而在未知數(shù)據(jù)(如測(cè)試集或新數(shù)據(jù))上的擬合準(zhǔn)確率低(如準(zhǔn)
確率低于50%)□
C)、為了防止過(guò)擬合現(xiàn)象的出現(xiàn),機(jī)器學(xué)習(xí)通常采取“正則化項(xiàng)”。
D)、正則化項(xiàng)有L1項(xiàng)(LILoss)和L2項(xiàng)(L2Loss),二者的區(qū)別在于所涉及的距離計(jì)算
方法和回歸方法不同
102.[單選題]數(shù)據(jù)變換的策略包括()。
A)平滑處理、特征構(gòu)造、聚集、標(biāo)準(zhǔn)化、離散化
B)平滑處理、特征構(gòu)造、聚集、審計(jì)、離散化
C)平滑處理、聚集、標(biāo)準(zhǔn)化、審計(jì)、離散化
D)特征構(gòu)造、聚集、標(biāo)準(zhǔn)化、審計(jì)、離散化
103.[單選題]TFTDF與該詞在整個(gè)語(yǔ)言中的出現(xiàn)次數(shù)成(_)。
A)正比
B)反比
C)無(wú)關(guān)
D)嘉次
104.[單選題]Streaming主要通過(guò)zookeeper提供以下的()實(shí)現(xiàn)事件偵聽(tīng)。
A)分布式鎖機(jī)制
B)Watcher
C)Checkpoint
D)ACK
105.[單選題]LSTM的全稱是()。
A)卷積神經(jīng)網(wǎng)絡(luò)
B)長(zhǎng)短時(shí)記憶
C)區(qū)域神經(jīng)網(wǎng)絡(luò)
D)循環(huán)神經(jīng)網(wǎng)絡(luò)
106.[單選題]為了提高Kafka的容錯(cuò)性,Kafka支持Partition的復(fù)制策略,以下關(guān)于Leader
Partition和FollowerPartition的描述錯(cuò)誤的是
A)Kafka針對(duì)Partition的復(fù)制需要選出一個(gè)Leader。由該Leader負(fù)責(zé)Partition的讀寫(xiě)操作
o其他的副本節(jié)點(diǎn)只是負(fù)責(zé)數(shù)據(jù)同步
B)由于LeaderServer承載了全部的請(qǐng)求壓力。因此從集群的整體考慮,Kafka會(huì)將Leader均衡的分
散在每個(gè)實(shí)例上,來(lái)確保數(shù)據(jù)均衡
C)一個(gè)Kafka集群各個(gè)節(jié)點(diǎn)間不可能互為L(zhǎng)eader和Flower
D)如果Leader失效。那么將會(huì)有其他follower來(lái)接管答案:成為新的Leader
107.[單選題]大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用不包括以下哪項(xiàng)?()
A)股票交易
B)市場(chǎng)情緒分析
C)信貸風(fēng)險(xiǎn)分析
D)大數(shù)據(jù)征信
108.[單選題]執(zhí)行以下代碼段時(shí)tl=(1,2,4,3)t2=(1,2,3,4)print(tl<t2)時(shí),輸出為
(一)o
A)True
B)False
C)Error
D)None
109.[單選題]采集數(shù)據(jù)字典首先應(yīng)該()。
A)啟動(dòng)extractor
B)對(duì)數(shù)據(jù)庫(kù)用戶授權(quán)
C)配置連接信息
D)安裝驅(qū)動(dòng)包
110.[單選題]MaxCompute的Mapjoin不支持()。
A)or連接關(guān)聯(lián)條件
B)不等職連接
C)fullouterjoin
D)等值連接
111.[單選題]下面組件哪個(gè)是數(shù)據(jù)挖掘庫(kù):()
A)Zookeeper
B)Mahout
C)MySQL
D)HBase
112.[單選題]大數(shù)據(jù)正快速發(fā)展為對(duì)數(shù)量巨大.來(lái)源分散.格式多樣的數(shù)據(jù)進(jìn)行采集.存儲(chǔ)和關(guān)聯(lián)分析
,從中發(fā)現(xiàn)新知識(shí).創(chuàng)造新價(jià)值.提升新能力的()。
A)新一代技術(shù)平臺(tái)
B)新一代信息技術(shù)和服務(wù)業(yè)態(tài)
C)新一代服務(wù)業(yè)態(tài)
D)新一代信息技術(shù)
113.[單選題]下列Python語(yǔ)法表述不正確的是
A)if語(yǔ)句的第二行必須有縮進(jìn)
B)while語(yǔ)句的第二行必須有縮進(jìn)
C)else后不加冒號(hào)
D)while循環(huán)語(yǔ)句的條件之后必須有冒號(hào)
114.[單選題]為了防止個(gè)人信息泄露,下列做法不正確的是()o
A)關(guān)閉電腦攝像頭
B)不下載不明APP
C)抖音發(fā)布個(gè)人地址
D)手機(jī)設(shè)置多重密碼
115.[單選題]下對(duì)GaussDB200雙AZ集群描述不正確是?
A)災(zāi)備集群不同步數(shù)據(jù)時(shí),可以提供讀寫(xiě)服務(wù)
B)主集群不可用時(shí),災(zāi)備集群提供正常服務(wù)
C)主集群提供正常服務(wù),文備集群只同步數(shù)據(jù)
D)周期性數(shù)據(jù)同步
116.[單選題]關(guān)于過(guò)擬合下面說(shuō)法錯(cuò)誤的是()
A)過(guò)擬合是可以避免的
B)過(guò)擬合是訓(xùn)練過(guò)度使泛化能力下降
C)相比過(guò)擬合,欠擬合比較容易解決
D)根據(jù)少量訓(xùn)練記錄做出分類決策的模型也容易受過(guò)分?jǐn)M合的影響
117.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,財(cái)務(wù)智能分析中的財(cái)務(wù)科目異動(dòng)分析模塊
,點(diǎn)擊()可切換變化率的兩種計(jì)算方式(選擇該期財(cái)報(bào)科目的去年同比值或與今年年初的比較值
)O
A)合并/本部
B)B.按報(bào)告期/按年度切換
OC.同比變化率/比年初變化率
D)D.以上都不對(duì)
118.[單選題]下列對(duì)于Sigmoid函數(shù)的說(shuō)法,錯(cuò)誤的是()
A)存在梯度爆炸的問(wèn)題
B)不是關(guān)于原點(diǎn)對(duì)稱
C)計(jì)算exp比較耗時(shí)
D)存在梯度消失的問(wèn)題
119.[單選題]數(shù)據(jù)產(chǎn)品的定義是()。
A)數(shù)據(jù)產(chǎn)品是指能夠供給市場(chǎng),被人們使用和消費(fèi),并能滿足人們某種需求的任何東西
B)數(shù)據(jù)產(chǎn)品是可以發(fā)揮數(shù)據(jù)價(jià)值去輔助用戶更優(yōu)地做決策(甚至行動(dòng))的一種產(chǎn)品形式
C)數(shù)據(jù)產(chǎn)品是指為了滿足自身的需要,通過(guò)科技發(fā)明或經(jīng)驗(yàn)總結(jié)而形成的技術(shù)
D)數(shù)據(jù)產(chǎn)品是數(shù)據(jù)科學(xué)的結(jié)果,創(chuàng)造了新的實(shí)物形態(tài)和使用價(jià)值的產(chǎn)品。
120.[單選題]大數(shù)據(jù)的最顯著特征是()o
A)數(shù)據(jù)規(guī)模大
B)數(shù)據(jù)類型多樣
C)數(shù)據(jù)處理速度快
D)數(shù)據(jù)價(jià)值密度高
121.[單選題]池化層的作用是()o
A)標(biāo)準(zhǔn)化處理輸入特征
B)對(duì)特征圖進(jìn)行特征選擇和信息過(guò)濾
C)對(duì)提取的特征進(jìn)行非線性組合以得到輸出
D)直接輸出每個(gè)像素的分類結(jié)果
122.[單選題]python語(yǔ)句s=,hello';print(s[1:3])輸出結(jié)果是。()
A)hel
B)he
Oell
D)el
123.[單選題](一)代表了Oracle數(shù)據(jù)庫(kù)中最小粒度的邏輯數(shù)據(jù)存儲(chǔ)層次。
A)表空間
B)盤(pán)區(qū)
C)數(shù)據(jù)文件
D)數(shù)據(jù)塊
124.[單選題]假設(shè)您已在數(shù)據(jù)集上擬合了一個(gè)復(fù)雜的回歸模型?,F(xiàn)在,您正在使用Ridge回歸,并調(diào)
整參數(shù)人以減少其復(fù)雜性。下面的描述哪個(gè)表達(dá)了偏差和方差與人的關(guān)系()。
A)在人非常小的情況下,偏差低,方差低
B)在人非常小的情況下,偏差低,方差高
C)在人非常小的情況下,偏差高,方差低
D)在人非常小的情況下,偏差低,方差低
125.[單選題]閱讀下列程序defe_check(n):t=Oif(n>500):t=n0.9elif(n
>200):t=nO.7else:t=n0.6returntprint("電費(fèi):>e_check(100))運(yùn)行結(jié)果是
A)電費(fèi):90
B)電費(fèi):80
C)電費(fèi):60
D)以上都不對(duì)
126.[單選題]()就是“平臺(tái)提供的數(shù)據(jù)超過(guò)一定規(guī)模后,產(chǎn)生的用戶交互會(huì)越少”。
A)逆向互作用定律
B)最小數(shù)據(jù)原則
C)最大交互原則
D)數(shù)據(jù)-交互平衡原則
127.[單選題]下面哪個(gè)Flume功能可以給Event添加Header信息。
A)數(shù)倉(cāng)與大數(shù)據(jù)的并行架構(gòu)
B)低成本高擴(kuò)震性的傳統(tǒng)數(shù)倉(cāng)架構(gòu)
C)以數(shù)倉(cāng)為核心,大數(shù)據(jù)平臺(tái)為延伸的融合架構(gòu)
D)大數(shù)據(jù)平臺(tái)為核心的架構(gòu)
128.[單選題]數(shù)據(jù)故事話的‘情景'不包括()。
A)還原情景
B)統(tǒng)計(jì)情景
C)移植情景
D)虛構(gòu)情景
129.[單選題]()反映數(shù)據(jù)的精細(xì)化程度,越細(xì)化的數(shù)據(jù),價(jià)值越高。
A)規(guī)模
B)活性
C)關(guān)聯(lián)度
D)顆粒度
130.[單選題]載入和保存niatlab文件的方法在scipy的(—)模塊中。
A)scipy.cluster
B)scipy.io
C)scipy.constants
D)scipy.linalg
131.[單選題]關(guān)于Redis集群拓?fù)湫畔?,下面描述正確的是:()。
A)客戶端緩存有集群的拓?fù)湫畔?/p>
B)服務(wù)端緩存有集群的拓?fù)湫畔?/p>
C)兩者都是
D)兩者多不是
132.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,系統(tǒng)在【審查審批管理】一級(jí)菜單下增加【
征信報(bào)告審批】二級(jí)菜單,審批人員可在此菜單下的()節(jié)點(diǎn)查看已審批批準(zhǔn)的征信報(bào)告查詢申請(qǐng)
A)待處理
B)B.審批批準(zhǔn)
0C.審批否決
D)D.以上都不對(duì)
133.[單選題]如果使用split分割字符串,返回的數(shù)據(jù)類型是
A)list
B)str
C)int
D)float
134.[單選題]下列選項(xiàng)描述錯(cuò)誤的是?()
A)HadoopHA即集群中包含SecondaryNameNode作為備份節(jié)點(diǎn)存在。
B)ResourceManager負(fù)責(zé)的是整個(gè)Yarn集群資源的監(jiān)控、分配和管理工作
C)NodeManager負(fù)責(zé)定時(shí)的向ResourceManager匯報(bào)所在節(jié)點(diǎn)的資源使用情況以及接收并處理來(lái)自
ApplicationMaster的啟動(dòng)停止容器(Container)的各種請(qǐng)求。
D)初次啟動(dòng)HadoopHA集群時(shí),需要將格式化文件系統(tǒng)后的目錄拷貝至另外一臺(tái)
135.[單選題]np.eye(2)函數(shù)的作用是()。
A)輸出一個(gè)全都是0的數(shù)組
B)輸出一個(gè)全都是1的數(shù)組
C)輸出一個(gè)全都是2的數(shù)組
D)輸出一個(gè)二維單位矩陣
136.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,財(cái)務(wù)智能分析中的上市公司行業(yè)標(biāo)準(zhǔn)值比對(duì)
模塊,上市公司行業(yè)標(biāo)準(zhǔn)值比對(duì)僅提供()的標(biāo)準(zhǔn)值比對(duì),不區(qū)分大型行業(yè)、中型行業(yè)、小型行業(yè)
O
A)全行業(yè)
B)B.大型行業(yè)
0C.中型行業(yè)
D)D.小型行業(yè)
137.[單選題]數(shù)據(jù)使用環(huán)節(jié)的安全技術(shù)措施除防火墻、()、防病毒、防DDOS、漏洞檢測(cè)等網(wǎng)絡(luò)
安全防護(hù)技術(shù)措施外,還需實(shí)現(xiàn)以下安全技術(shù)能力:賬號(hào)權(quán)限管理、數(shù)據(jù)安全域、數(shù)據(jù)脫敏、日志
管理和審計(jì)、異常行為實(shí)時(shí)監(jiān)控和終端數(shù)據(jù)防泄漏。
A)入侵檢測(cè)
B)病毒檢測(cè)
C)程序檢測(cè)
D)進(jìn)程檢測(cè)
138.[單選題]以某一圖表中的項(xiàng)為單位對(duì)關(guān)聯(lián)圖表進(jìn)行數(shù)據(jù)篩選,建立圖表間聯(lián)動(dòng)關(guān)系的功能是?(
)
A)全局篩選
B)計(jì)量單位
C)圖表聯(lián)動(dòng)
D)數(shù)據(jù)凸顯
139.[單選題]下列語(yǔ)句描述錯(cuò)誤的是()
A)可以通過(guò)CLI方式、Java
B)Sqoop底層會(huì)將Sqoop命令轉(zhuǎn)換為MapReduce任務(wù),并通過(guò)Sqoop連接器進(jìn)行數(shù)據(jù)的導(dǎo)入導(dǎo)出操作。
OSqoop是獨(dú)立的數(shù)據(jù)遷移工具,可以在任何系統(tǒng)上執(zhí)行。
D)如果在Hadoop分布式集群環(huán)境下,連接MySQL服務(wù)器參數(shù)不能是localhost或127.0.0.1。
140.[單選題](_)不是遺傳算法基本算子。
A)選擇
B)感染
C)突變
D)交叉
141.[單選題]使用MaxcomputeSQL:createtabletlliket2;建表時(shí),表tl不會(huì)具有表t2的(
)屬性。
A)分區(qū)
B)生命周期
C)二級(jí)分區(qū)
D)字段的注釋
142.[單選題]關(guān)于KNN說(shuō)法錯(cuò)誤的是0
A)、為尋找k個(gè)最近的鄰居
B)、當(dāng)一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)都屬于某一個(gè)類別時(shí),該
29樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。
C)、該方法在確定分類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來(lái)決定待分類樣
本所屬的類別。
D)、KNN算法主要靠判別類域的方法來(lái)確定所屬類別。
143.[單選題]GoogleAPP為人們提供的云計(jì)算服務(wù)屬于下面哪種服務(wù)?
A)SaaS
B)PaaS
C)laaS
D)DaaS
144.[單選題]在HDFS的數(shù)據(jù)讀取過(guò)程中,客戶端讀取完所有數(shù)據(jù)塊后,調(diào)用()的close。接口關(guān)閉
這個(gè)文件。
A)DistributedFileSystem
B)FSDatalnputStream
C)FSDataOutputStream
D)InputSystem
145.[單選題]HBase底層依賴于Hadoop環(huán)境,它們是基于()系統(tǒng)開(kāi)發(fā)的
A)windows7
B)Unix/Linux
C)XP
D)windows10
146.[單選題]信息增益對(duì)可取值數(shù)目()的屬性有所偏好,增益率對(duì)可取值數(shù)目()的屬性有所偏好
A)較高,較高
B)較高,較低
C)較低,較高
D)較低,較低
147.[單選題]下列描述中不屬于數(shù)據(jù)治理內(nèi)容的是()。
A)理解自己的數(shù)據(jù)
B)行為規(guī)范的制定
C)崗位職責(zé)的定義
D)獲得更多的數(shù)據(jù)
148.[單選題]大數(shù)據(jù)涌現(xiàn)現(xiàn)象的形式有多種,不屬于大數(shù)據(jù)涌現(xiàn)形式的是()。
A)價(jià)值涌現(xiàn)
B)隱私涌現(xiàn)
C)物質(zhì)涌現(xiàn)
D)質(zhì)量涌現(xiàn)
149.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNode實(shí)現(xiàn)的功能是()。
A)管理文件系統(tǒng)的命名空間
B)管理存儲(chǔ)空間
C)分配算力
D)調(diào)控算法
150.[單選題]決策樹(shù)的基本流程遵循(_)的策略。
A)貪心
B)最優(yōu)化
C)分而治之
D)順序
151.[單選題]下列關(guān)于GaussDB200的數(shù)據(jù)類型轉(zhuǎn)換說(shuō)法正確的是。
A)如果需要保留空字符串時(shí),需要新建兼容性為Postgres的數(shù)據(jù)庫(kù)。
B)在查詢中,對(duì)常量不需要顯式指定數(shù)據(jù)類型。
C)在ORACLE兼容模式下,在導(dǎo)入數(shù)據(jù)時(shí),空字符串會(huì)自動(dòng)過(guò)濾。
D)不同數(shù)據(jù)類型比較或轉(zhuǎn)換時(shí),使用強(qiáng)制類型轉(zhuǎn)換,以防隱式類型轉(zhuǎn)換結(jié)果與預(yù)期不符。
152.[單選題]以下變量名中不是關(guān)鍵字的是(一)。
A)message
B)nonlocal
C)assert
D)lambda
153.[單選題]FusioninsightHD部署時(shí),同一集群內(nèi)的Flumeserve節(jié)點(diǎn)建議至少部署幾個(gè)
A)1
B)2
03
D)4
154.[單選題]下面關(guān)于政府信息公開(kāi)與政府?dāng)?shù)據(jù)開(kāi)放的描述,錯(cuò)誤的是:()
A)政府信息公開(kāi)與政府?dāng)?shù)據(jù)開(kāi)放是一對(duì)既相互區(qū)別又相互聯(lián)系的概念
B)信息是沒(méi)有經(jīng)過(guò)任何加工與解讀的原始記錄,沒(méi)有明確的含義,而數(shù)據(jù)則是經(jīng)過(guò)加工處理并被賦
予一定含義的
C)政府信息公開(kāi)主要是為了對(duì)公眾知情權(quán)的滿足而出現(xiàn)的
D)政府?dāng)?shù)據(jù)開(kāi)放強(qiáng)調(diào)的是數(shù)據(jù)的再利用,公眾可以分享數(shù)據(jù)利用創(chuàng)造的經(jīng)濟(jì)和社會(huì)價(jià)值
155.[單選題]現(xiàn)實(shí)中往往會(huì)遇到“不完整”的訓(xùn)練樣本,在這種存在屬性變量值未知的情形下,可
用(_)。
A)邊際似然
B)EM算法
C)貝葉斯決策
D)貝葉斯分類器
156.[單選題]下面哪個(gè)操作肯定是寬依賴()
A)map
B)flatMap
C)reduceByKey
D)sample
157.[單選題]下列關(guān)于數(shù)據(jù)交易市場(chǎng)的說(shuō)法中,錯(cuò)的是()o
A)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物
B)商業(yè)化的數(shù)據(jù)交易活動(dòng)催生了多方參與的第三方數(shù)據(jù)交易市場(chǎng)
C)數(shù)據(jù)交易市場(chǎng)通過(guò)生產(chǎn)數(shù)據(jù)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助
D)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)資源化的必然產(chǎn)物
158.[單選題]利用到每個(gè)聚類中心和的遠(yuǎn)近判斷離群值的方法,可以基于的算法為0。
A)K-means
B)KNN
OSVM
D)LinearRegression
159.[單選題]任一隨機(jī)事件出現(xiàn)的概率P為()。
A)TWPW1
B)P<0
C)P21
D)OWPW1
160.[單選題]當(dāng)原始數(shù)據(jù)的存在形式不符合目標(biāo)算法的要求時(shí),需要對(duì)原始數(shù)據(jù)進(jìn)行(_)。
A)數(shù)據(jù)變換
B)數(shù)據(jù)加工
C)數(shù)據(jù)清洗
D)數(shù)據(jù)集成
161.[單選題]下列對(duì)數(shù)據(jù)定義語(yǔ)言(DDL)描述正確的是(—)。
A)DDL關(guān)心的是數(shù)據(jù)庫(kù)中的數(shù)據(jù)
B)完成數(shù)據(jù)的增刪改查操作
C)控制對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)
D)定義數(shù)據(jù)庫(kù)的結(jié)構(gòu)
162.[單選題]Shark與SparkSQL的關(guān)系是:()
A)二者沒(méi)有任何關(guān)系
B)Shark是Spark
C)Spark
D)二者是一個(gè)軟件的兩個(gè)不同名稱,本質(zhì)上是一個(gè)東西
163.[單選題]打開(kāi)一個(gè)已有文件,在文件末尾添加信息,正確的打開(kāi)方式為()。
A)r
B)w
C)a
D)w+
164.[單選題]Loader作業(yè)運(yùn)行前后,需要保證哪些節(jié)點(diǎn)與外部數(shù)據(jù)源通訊?
A)Loader進(jìn)程所在的節(jié)點(diǎn)
B)運(yùn)行MapReduce作業(yè)的節(jié)點(diǎn)
C)前面兩個(gè)都需要
D)前面兩個(gè)都不需要
165.[單選題]基于Boosting的集成學(xué)習(xí)代表算法有()
A)Adaboost
B)GBDT
OXGB00ST
D)隨機(jī)森林
166.[單選題]著名的C4.5決策樹(shù)算法使用(_)來(lái)選擇最優(yōu)劃分屬性。
A)信息增益
B)增益率
C)基尼指數(shù)
D)均值
167.[單選題]kafka-clustermirroring工具可以實(shí)現(xiàn)以下那些功能?
A)kafka集群數(shù)據(jù)同步方案
B)kafka單集群內(nèi)數(shù)據(jù)備份
Okafka單集群內(nèi)數(shù)據(jù)恢復(fù)
D)以全部不對(duì)
168.[單選題]下面關(guān)于詞袋模型的說(shuō)法,錯(cuò)誤的是()
A)飼袋模型使用一個(gè)多重集對(duì)文本中出現(xiàn)的單詞進(jìn)行編碼
B)詞袋模型不考慮詞語(yǔ)原本在句子中的順序
C)詞袋模型可以應(yīng)用于文檔分類和檢索,同時(shí)受到編碼信息的限制
D)飼袋模型產(chǎn)生的靈感來(lái)源于包含類似單坷的文檔經(jīng)常有相似的含義
169.[單選題]關(guān)于ADS中的ECU,()說(shuō)法是正確的。
A)接入節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)可以指定不同類型的ECU,并且需要在創(chuàng)建DB時(shí)就確定,DB一旦創(chuàng)建,ECU類
型不能修改
B)ECU的數(shù)量,在DB創(chuàng)建后可以修改。即使在DB的使用過(guò)程中,也可以隨時(shí)調(diào)整(擴(kuò)容或者縮容)
C)接入節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)必須指定相同類型的ECU,并且需要在創(chuàng)建DB時(shí)就確定,DB一旦創(chuàng)建,ECU類
型不能修改
D)創(chuàng)建DB時(shí)可以指定ECU的數(shù)量,必須為偶數(shù),最小為4
170.[單選題]在方差分析中,()反映的是樣本數(shù)據(jù)與其組平均值的差異。
A)總離差
B)組間誤差
C)抽樣誤差
D)組內(nèi)誤差
171.[單選題]以下不屬于數(shù)據(jù)科學(xué)的研究目的的是(一)o
A)大數(shù)據(jù)及其運(yùn)動(dòng)規(guī)律的揭示
B)從數(shù)據(jù)到智慧的轉(zhuǎn)化
C)數(shù)據(jù)解釋
D)數(shù)據(jù)驅(qū)動(dòng)型決策支持
172.[單選題]YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化?
A)AppMaster
B)ResourceManager
C)NodeManager
D)Container
173.[單選題]使用sklearn中的留一法對(duì)大小為n的數(shù)據(jù)進(jìn)行交叉驗(yàn)證時(shí),需要(_)次模型訓(xùn)練。
A)n-2
B)n-1
C)n
D)1
174.[單選題]決策樹(shù)模型的規(guī)模應(yīng)當(dāng)是()
A)越復(fù)雜越好
B)越簡(jiǎn)單越好
C)適當(dāng)限制其復(fù)雜程度
D)盡可能利用所有特征
175.[單選題]以下程序輸出到文件text,csv里的結(jié)果是:fo=open("text,csv","w')x=
[90,87,93]fo.write(",join(str(x)))fo.close()
A)[90,87,93]
B)90,87,93
C),9,0,,,,8,7,,,,9,3,
D)[,9t0,,,,8,7,,,,9,3,]
176.[單選題]當(dāng)我們需要在一張圖表中特意指出某個(gè)特殊點(diǎn),并加上標(biāo)注達(dá)到醒目的目的時(shí),需要
用到()函數(shù)。
A)pit.axvspan()
B)pit.axhspan()
C)pit.annotate()
D)plt.text()
177.[單選題]大數(shù)據(jù)計(jì)算服務(wù)支持基于標(biāo)簽的安全,它是項(xiàng)目空間級(jí)別的一種強(qiáng)制訪問(wèn)控制策略
,它的引入是為了讓項(xiàng)目空間管理員能更加靈活地控制用戶對(duì)敏感數(shù)據(jù)的訪問(wèn)。LabelSecurity可以
對(duì)敏感數(shù)據(jù)的()粒度進(jìn)行控制。
A)分區(qū)
B)表
C)列
D)行
178.[單選題]數(shù)據(jù)集成的基本類型是()。
A)內(nèi)容集成、結(jié)構(gòu)集成
B)內(nèi)容集成、規(guī)約集成
C)規(guī)約集成、結(jié)構(gòu)集成
D)模式集成、結(jié)構(gòu)集成
179.[單選題]特征工程的目的是()。
A)找到最合適的算法
B)得到最好的輸入數(shù)據(jù)
C)減低模型復(fù)雜度
D)加快計(jì)算速度
180.[單選題]在Flink的運(yùn)行過(guò)程中,負(fù)責(zé)申請(qǐng)資源的角色是:()。
A)ResourceManager
B)JobManager
OClient
D)TaskManager
181.[單選題]以下描述不正確的是(_)。
A)平滑處理是為了去掉噪聲
B)聚集是進(jìn)行粗粒度計(jì)算
C)標(biāo)準(zhǔn)化是用區(qū)間或概念標(biāo)簽表示數(shù)據(jù)
D)特征構(gòu)造是構(gòu)造出新的特征
182.[單選題]大數(shù)據(jù)對(duì)影視行業(yè)的影響不包括下列哪項(xiàng)?()
A)利用大數(shù)據(jù)對(duì)海量用戶數(shù)據(jù)進(jìn)行分析,幫助投資方做出明智的選擇
B)了解用戶當(dāng)前關(guān)注的題材,以便覺(jué)得拍什么作品
C)業(yè)內(nèi)人士根據(jù)多年的市場(chǎng)經(jīng)驗(yàn)分析觀眾認(rèn)可的作品類型
D)了解觀眾追棒的明星,邀請(qǐng)合適的演員
183.[單選題]以下說(shuō)法對(duì)的是:()
A)當(dāng)前云公司提供的公有云存儲(chǔ)只能通過(guò)互聯(lián)網(wǎng)訪問(wèn)
B)對(duì)象存儲(chǔ)不可以在客戶機(jī)房建設(shè)
C)對(duì)象存儲(chǔ)可以存儲(chǔ)數(shù)據(jù)庫(kù)數(shù)據(jù)
D)客戶數(shù)據(jù)傳輸慢與客戶開(kāi)通的資源池帶寬大小有關(guān)系
184.[單選題]萬(wàn)維網(wǎng)的實(shí)施國(guó)家是()
A)英國(guó)
B)美國(guó)
C)德國(guó)
D)印度
185.[單選題]決策樹(shù)中的葉結(jié)點(diǎn)對(duì)應(yīng)于()。
A)屬性
B)樣本
C)決策結(jié)果
D)標(biāo)簽值
186.[單選題]關(guān)于層次聚類算法:①不斷重復(fù)直到達(dá)到預(yù)設(shè)的聚類簇?cái)?shù);②不斷合并距離最近的聚類
簇;③對(duì)初始聚類簇和相應(yīng)的距離矩陣初始化;④對(duì)合并得到的聚類簇進(jìn)行更新正確的執(zhí)行順序?yàn)?
A)①②③④
B)①③②④
C)③②④①
D)③④①②
187.[單選題]關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的對(duì)比,下列描述錯(cuò)誤的是:()。
A)Hive元數(shù)據(jù)存儲(chǔ)獨(dú)立于數(shù)據(jù)存儲(chǔ)之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,二傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)
據(jù)應(yīng)用單一,靈活性低
B)Hive基于HDFS存儲(chǔ),理論上存儲(chǔ)可以無(wú)限擴(kuò)容,而傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)量有上限
C)由于Hive的數(shù)據(jù)存儲(chǔ)在HDFS上,所以可以保證數(shù)據(jù)的高容錯(cuò),高可靠
D)由于Hive基于大數(shù)據(jù)平臺(tái),所以查詢效率比傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)快
188.[單選題]傅里葉變換得到的頻譜中,低頻系數(shù)對(duì)應(yīng)于()o
A)物體邊緣
B)噪聲
C)變化平緩部分
D)變化劇烈部分
189.[單選題]下列關(guān)于線性模型的描述錯(cuò)誤的是0。
A)支持向量機(jī)的判別函數(shù)一定屬于線性函數(shù)
B)在樣本為某些分布情況時(shí),線性判別函數(shù)可以成為最小錯(cuò)誤率或最小風(fēng)險(xiǎn)意義
下的最優(yōu)分類器
C)在一般情況下,線性分類器只能是次優(yōu)分類器
D)線性分類器簡(jiǎn)單而且在很多期情況下效果接近最優(yōu),所以應(yīng)用比較廣泛
190.[單選題]下列哪些不屬于詞袋模型的應(yīng)用?
A)文檔分類
B)提取文章主題
C)文本向量化
D)統(tǒng)計(jì)詞頻
191.[單選題]在Hive的連接查詢中,內(nèi)連接通過(guò)關(guān)鍵字()進(jìn)行標(biāo)識(shí)
A)innerjoin
B)leftouterjoin
C)rightouterjoin
D)fullouterjoin
192.[單選題]檢測(cè)一元正態(tài)分布中的離群點(diǎn),屬于異常檢測(cè)中的基于()的離群點(diǎn)檢測(cè)。
A)統(tǒng)計(jì)方法
B)鄰近皮
C)密度
D)機(jī)器學(xué)習(xí)技術(shù)
193.[單選題]執(zhí)行以下代碼段t=(1,2)print(2*t)時(shí),輸出為(.)0
A)(1,2,1,2)
B)[1,2,1,2]
0(1,1,2,2)
D)[l,1,2,2]
194.[單選題]scikitTearn中的k-means類,哪個(gè)參數(shù)是用來(lái)調(diào)節(jié)k值的()
A)n_clusters
B)maxiter
C)n_init
D)init
195.[單選題]在配置Linux網(wǎng)絡(luò)參數(shù)時(shí),固定IP地址是將路由協(xié)議配置為()。
A)static
B)dynamic
C)immutable
D)variable
196.[單選題]在數(shù)據(jù)添加過(guò)濾規(guī)則后,在源庫(kù)執(zhí)行更新操作的處理原則,應(yīng)以:()為首要目標(biāo)。
A)數(shù)據(jù)一致
B)數(shù)據(jù)規(guī)范
C)數(shù)量相同
D)數(shù)據(jù)唯一
197.[單選題]以下()只有完全符合給定的判斷條件才返回1。-
A)帶ANY關(guān)鍵字的子查詢
B)帶ALL關(guān)鍵字的子查詢
C)帶IN關(guān)鍵字的子查詢
D)以上答案都不正確
198.[單選題]在HDFS文件系統(tǒng)根目錄下創(chuàng)建一個(gè)名為mydir的文件夾的命令是()。
A)hdfs.create(newPath("hdfs:/mydir"))
B)hdfs.open(newPath("hdfs:/mydir"))
C)hdfs.mkdirs("hdfs:/mydir")
D)hdfs.mkdirs(newPath("hdfs:/mydir"))
199.[單選題]圖像識(shí)別常用softmax函數(shù)接在模型的輸出上,其作用為:()。
A)增加不同類別之間的區(qū)分度
B)突出輸出向量中類標(biāo)的對(duì)應(yīng)的維度
C)對(duì)輸出歸一化,同時(shí)以概率的更好解釋輸出向量
D)過(guò)濾無(wú)用的環(huán)境信息
200.[單選題]以下哪個(gè)組件是Spark中用于結(jié)構(gòu)化數(shù)據(jù)處理的組件:()
A)SparkSQL
B)SparkCore
C)Sparkstreaming
D)Structuredstreaming
201.[單選題]關(guān)于GaussDB200的數(shù)據(jù)并行導(dǎo)出,下列說(shuō)法正確的是(?
A)Remote模式效率受網(wǎng)終帶寬影響
B)Local模式效率受網(wǎng)絡(luò)帶寬影響
ORemote模式是指將數(shù)據(jù)導(dǎo)出到集群本地服務(wù)器上。
D)Loca模式是導(dǎo)出文件到本地電腦
202.[單選題]關(guān)于支持向量機(jī)SVM,下列說(shuō)法錯(cuò)誤的是()
A)L2正則項(xiàng),作用是最大化分類間隔,使得分類器擁有更強(qiáng)的泛化能力
B)Hinge損失函數(shù),作用是最小化經(jīng)驗(yàn)分類錯(cuò)誤
C)分類間隔為代表向量的模
D)當(dāng)參數(shù)C越小時(shí),分類間隔越大,分類錯(cuò)誤越多,趨于欠學(xué)習(xí)
203.[單選題]當(dāng)訓(xùn)練集特征非常多,而實(shí)例非常少的時(shí)候,可以采用()
A)sigmoid拔的支持向量機(jī)
B)不帶核的支持向量機(jī)
C)高斯核的支持向量機(jī)
D)多項(xiàng)式核的支持向量機(jī)
204.[單選題]如果Python程序執(zhí)行時(shí),產(chǎn)生了“unexpectedindent”的錯(cuò)誤,其原因是:
A)代碼中使用了錯(cuò)誤的關(guān)鍵字
B)代碼中缺少“:”符號(hào)
C)代碼里的語(yǔ)句嵌套層次太多
D)代碼中出現(xiàn)了縮進(jìn)不匹配的問(wèn)題
205.[單選題]在GaussDB200中常用的邏輯操作符有AND.OR和NOT,它們之間的運(yùn)算優(yōu)先級(jí)順序?yàn)?/p>
()?
A)AND,OR>NOT
B)NOT>AND>OR
C)OR>AND>NOT
D)NOT>OR>AND
206.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,財(cái)務(wù)智能分析模塊,【財(cái)務(wù)指標(biāo)趨勢(shì)分析】
頁(yè)面的左上角圖表部分,最多支持()種財(cái)務(wù)指標(biāo)的圖表分析,超過(guò)3種后,再次選擇則予以提示。
A)1
B)B.3
C)C.30
D)D.50
207.[單選題]HBase使用一個(gè)()節(jié)點(diǎn)協(xié)調(diào)管理一個(gè)或多個(gè)RegionServer從屬機(jī)。
A)NameNode
B)DataNode
C)JobTracker
D)Master
208.[單選題]以下哪個(gè)場(chǎng)景適合使用ZooKeeper?
A)對(duì)象存儲(chǔ)
B)故障檢測(cè)
C)熱點(diǎn)訪問(wèn)
D)流式計(jì)算
209.[單選題]以下哪個(gè)屬于大數(shù)據(jù)在電信行業(yè)的數(shù)據(jù)商業(yè)化方面的應(yīng)用()
A)客服中心優(yōu)化
B)網(wǎng)絡(luò)優(yōu)化
C)網(wǎng)絡(luò)管理
D)精準(zhǔn)廣告
210.[單選題]有關(guān)MapReduce的輸入輸出,說(shuō)法錯(cuò)誤的是()
A)鏈接多個(gè)MapReduce作業(yè)時(shí),序列文件是首選格式
B)FileInputFormat中實(shí)現(xiàn)的getSplits()可以把輸入數(shù)據(jù)劃分為分片,分片數(shù)目和大小任意定義
C)想完全禁止輸出,可以使用NullOutputFormat
D)每個(gè)reduce需將它的輸出寫(xiě)入自己的文件中,輸出無(wú)需分片
211.[單選題]以下不屬于大數(shù)據(jù)在社會(huì)活動(dòng)中的典型應(yīng)用的是()。
A)美團(tuán)實(shí)現(xiàn)了快速精準(zhǔn)的送餐服務(wù)
B)共享單車、滴滴打車方便了人們的日常出行
C)快遞實(shí)現(xiàn)了訂單的實(shí)時(shí)跟蹤
D)供電公司提供電費(fèi)賬單查詢
212.[單選題]具有體量大、來(lái)源多樣、生成極快和多變等特征并且難以用傳統(tǒng)數(shù)據(jù)體系機(jī)構(gòu)有效處
理的包含大量數(shù)據(jù)集的數(shù)據(jù)是()。
A)海量數(shù)據(jù)
B)大數(shù)據(jù)
C)厚數(shù)據(jù)
D)異構(gòu)數(shù)據(jù)
213.[單選題]Python語(yǔ)言屬于□()
A)機(jī)器語(yǔ)言
B)匯編語(yǔ)言
C)高級(jí)語(yǔ)言
D)以上都不是
214.[單選題]Hadoop中,Reducer的三個(gè)階段是()
A)Shuffle-Sort-Reduce
B)Shuffle-Reduce-Sort
C)Reduce-Shuffle-Sort
D)Sort-Shuffle-Reduce
215.[單選題]與HMM和MEMM模型相比,CRF模型的優(yōu)勢(shì)不包含()。
A)特征靈活
B)速度快
C)可容納較多上下文信息
D)全局最優(yōu)
216.[單選題]MacOS系統(tǒng)的開(kāi)發(fā)者是()
A)微軟公司
B)惠普公司
C)蘋(píng)果公司
D)IBM公司
217.[單選題]MaxComputeSQL提供touch操作用來(lái)修改分區(qū)的()屬性。
A)CreateTime
B)LastDataUsedTime
C)LastDataAccessTime
D)LastDataModifiedTime
218.[單選題]下面關(guān)于分析學(xué)習(xí)描述不正確的是(_)。
A)分析學(xué)習(xí)是相對(duì)歸納學(xué)習(xí)的一種提法
B)分析學(xué)習(xí)使用先驗(yàn)知識(shí)來(lái)減小待搜索假設(shè)空間的復(fù)雜度
C)分析學(xué)習(xí)的優(yōu)點(diǎn)是可以從稀疏數(shù)據(jù)中學(xué)習(xí)
D)分析學(xué)習(xí)通過(guò)統(tǒng)計(jì)推理來(lái)論證
219.[單選題]下列選項(xiàng)中,用于向文件中寫(xiě)入數(shù)據(jù)的是()
A)open()
B)write()
C)close()
D)read()
220.[單選題]如果我們現(xiàn)有一個(gè)安裝2.6.5版本的Hadoop集群,在不修改默認(rèn)配置的情況下存儲(chǔ)
200個(gè)200M的文本文件,請(qǐng)問(wèn)最終會(huì)在集群中產(chǎn)生()個(gè)數(shù)據(jù)塊(包括副本)。
A)200
B)40000
O400
D)1200
221.[單選題]下面關(guān)于"WHEREiD、<>ANY(子查詢語(yǔ)句)”描述正確的是()。-
A)表示只有id不等于子查詢語(yǔ)句的任意一個(gè)結(jié)果時(shí)才成立
B)當(dāng)“<〉”替換為“<=>”時(shí),ANY子查詢的執(zhí)行效果等價(jià)于IN關(guān)鍵字
C)表示只有id不等于子查詢語(yǔ)句的全部結(jié)果時(shí)才成立
D)以上說(shuō)法都不正確
222.[單選題]下列關(guān)于k-means的優(yōu)點(diǎn)不正確的是()
A)原理簡(jiǎn)單
B)k值容易選取
C)聚類效果較好
D)可解釋性強(qiáng)
223.[單選題]以下哪個(gè)不是HDFS的進(jìn)程()
A)SecondaryNode
B)NameNode
C)ResourceManager
D)DataNode
224.[單選題]下列選項(xiàng)中,符合類的命名規(guī)范的是()o
A)HolidayResort
B)HolidayResort
C)holidayResort
D)hol
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022年大學(xué)力學(xué)專業(yè)大學(xué)物理下冊(cè)開(kāi)學(xué)考試試題B卷-含答案
- 石河子大學(xué)《語(yǔ)言與文化》2021-2022學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《水工程法規(guī)》2021-2022學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《口腔解剖生理學(xué)一》2021-2022學(xué)年第一學(xué)期期末試卷
- 石河子大學(xué)《工程制圖》2021-2022學(xué)年第一學(xué)期期末試卷
- 沈陽(yáng)理工大學(xué)《數(shù)字圖象處理》2023-2024學(xué)年期末試卷
- 沈陽(yáng)理工大學(xué)《流體與工程熱力學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 沈陽(yáng)理工大學(xué)《俄漢筆譯》2023-2024學(xué)年第一學(xué)期期末試卷
- 沈陽(yáng)理工大學(xué)《超精密制造工程》2022-2023學(xué)年第一學(xué)期期末試卷
- 合伙人開(kāi)足療店合同協(xié)議書(shū)范本
- 關(guān)于研學(xué)旅行活動(dòng)的戰(zhàn)略合作框架協(xié)議書(shū)
- 外貿(mào)業(yè)務(wù)與國(guó)際市場(chǎng)開(kāi)拓培訓(xùn)
- 巡察流程培訓(xùn)課件
- 學(xué)校級(jí)綠色教育存在的問(wèn)題與改革策略
- 檢察機(jī)關(guān)保密知識(shí)講座
- 產(chǎn)品市場(chǎng)推廣效果報(bào)告
- 2024電力企業(yè)數(shù)據(jù)資源編碼規(guī)范
- Java程序設(shè)計(jì)項(xiàng)目式教程 教案 單元10 Java圖形用戶界面設(shè)計(jì)
- 【小學(xué)心理健康教育分析國(guó)內(nèi)外文獻(xiàn)綜述4100字】
- 高考復(fù)習(xí)遞推思維方法在物理高考題中的應(yīng)用
- 槍械介紹課件
評(píng)論
0/150
提交評(píng)論