大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項(xiàng)選擇題,共145題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.假設(shè)有n組數(shù)據(jù)集,每組數(shù)據(jù)集中,x的平均值都是9,x的方差都是11,y的平均值都是7.50,x與y的相關(guān)系數(shù)都是0.816,擬合的線性回歸方程都是y=3.00+0.500x。那么這n組數(shù)據(jù)集()。A)一樣B)不一樣C)無法確定是否一樣[單選題]2.下列關(guān)于數(shù)據(jù)的說法,不正確的是()A)數(shù)據(jù)的類別有多種多樣B)數(shù)據(jù)庫中的一列代表一個特征C)一組數(shù)據(jù)平均值不會受異常值影響D)數(shù)據(jù)點(diǎn)之間的距離滿足d_ij+d_jk≥d_ik[單選題]3.數(shù)據(jù)清洗的方法不包括()。A)缺失值處理B)噪聲數(shù)據(jù)清除C)一致性檢查D)重復(fù)數(shù)據(jù)記錄處理[單選題]4.namenode默認(rèn)的webUI訪問端口號是()A)50070B)50060C)50050D)50040[單選題]5.后剪枝過程(___)地對樹中的所有非葉節(jié)點(diǎn)進(jìn)行逐一考察,其訓(xùn)練時間開銷比未剪枝決策樹和預(yù)剪枝決策樹要(___)得多。A)自頂向下,小B)自頂向下,大C)自底向上,大D)自底向上,小[單選題]6.()主要為組織機(jī)構(gòu)提供企業(yè)級應(yīng)用技術(shù)或工具。A)企業(yè)應(yīng)用B)行業(yè)應(yīng)用C)基礎(chǔ)應(yīng)用D)組織應(yīng)用[單選題]7.下列關(guān)于使用MapReduce編程模型實(shí)現(xiàn)SQL中的join操作錯誤的是?A)ReduceJoin可以實(shí)現(xiàn)內(nèi)鏈接,也能實(shí)現(xiàn)各種外連接B)ReduceJoin的join操作是在MapReduce程序中的reducer階段完成的C)MapJoin也適合各種join場景,也能實(shí)現(xiàn)內(nèi)連接和各種外鏈接D)MapJoin不會產(chǎn)生數(shù)據(jù)傾斜[單選題]8.plt.scatter()函數(shù)中的參數(shù)c表示的含義是(__)。A)x軸上的數(shù)值B)y軸上的數(shù)值C)散點(diǎn)圖中的標(biāo)記顏色D)標(biāo)記圖形內(nèi)容的標(biāo)簽文件[單選題]9.下列算法中,()更適合做時間序列建模。A)CNNB)決策樹C)LSTMD)貝葉斯算法[單選題]10.在HBase中,過濾器頂層抽象類是()A)FilterB)FilterListC)WhileMatchFilterD)SkipFilter[單選題]11.MRV2使用YARN進(jìn)行了資源管理,其中()是資源分配的單位A)NodeManagerB)ApplicationMasterC)slotD)Container[單選題]12.LasVegasWrapper是一種典型的(__)算法。A)過濾式選擇B)嵌入式選擇C)包裹式選擇D)正則化[單選題]13.preprocessing.OrdinalEncoder的作用是(__)。A)將分類特征轉(zhuǎn)換為分類數(shù)值B)獨(dú)熱編碼C)分類轉(zhuǎn)換為分類數(shù)值D)對缺失值進(jìn)行填補(bǔ)[單選題]14.1TB(兆兆字節(jié)-Terabyte)相當(dāng)于()A)1024GBB)1024MBC)1024KBD)1024Bytes[單選題]15.感知機(jī)中,()是M-P神經(jīng)元,也稱為闊值邏輯單元A)輸入層B)輸出層C)第一層D)第二層[單選題]16.下列哪一個不屬于Hadoop的大數(shù)據(jù)層的功能?A)數(shù)據(jù)挖掘B)離線分析C)實(shí)時計算D)BI分析[單選題]17.Hadoop的哪個包的功能是根據(jù)DDL(數(shù)據(jù)描述語言)自動生成他們的編解碼函數(shù)()A)recordB)metricsC)utilD)tool[單選題]18.啟動YARN后,默認(rèn)的web訪問端口是多少?A)8000B)9000C)8080D)8088[單選題]19.以下()組件負(fù)責(zé)存儲業(yè)務(wù)數(shù)據(jù)、執(zhí)行數(shù)據(jù)查詢?nèi)蝿?wù)以及向CN返回執(zhí)行結(jié)果。A)GTMB)WLMC)CND)DN[單選題]20.FusionnInsigetHD系統(tǒng)中,Flume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過哪個組件?A)SourceB)SinkC)TopicD)Channel[單選題]21.圖像識別常用softmax函數(shù)接在模型的輸出上,其作用為:()。A)增加不同類別之間的區(qū)分度B)突出輸出向量中類標(biāo)的對應(yīng)的維度C)對輸出歸一化,同時以概率的更好解釋輸出向量D)過濾無用的環(huán)境信息[單選題]22.假設(shè)在龐大的數(shù)據(jù)集上使用Logistic回歸模型,可能遇到一個問題,Logistic回歸需要很長時間才能訓(xùn)練,如果對相同的數(shù)據(jù)進(jìn)行邏輯回歸,則花費(fèi)更少的時間,并給出比較相似的精度的方法是()。A)降低學(xué)習(xí)率,減少選代次數(shù)B)降低學(xué)習(xí)率,增加迭代次數(shù)C)提高學(xué)習(xí)率,增加迭代次數(shù)D)增加學(xué)習(xí)率,減少迭代次數(shù)[單選題]23.假定你使用SVM學(xué)習(xí)數(shù)據(jù)X,數(shù)據(jù)X里面有些點(diǎn)存在錯誤?,F(xiàn)在如果你使用一個二次核函數(shù),多項(xiàng)式階數(shù)為2,使用松弛變量C作為超參之一。當(dāng)你使用較大的C(C趨于無窮),則()。A)仍然能正確分類數(shù)據(jù)B)不能正確分類C)不確定D)以上均不正確[單選題]24.下列有關(guān)HDFS的容錯機(jī)制描述錯誤的是()。A)HDFS可以使用機(jī)架位感知的方法實(shí)現(xiàn)容錯機(jī)制B)HDFS可以使用基于erasurecode的方法實(shí)現(xiàn)容錯機(jī)制C)HDFS使用機(jī)架位感知的方法先把一份拷貝放入同機(jī)架上的機(jī)器,然后在拷貝一份到其他服務(wù)器D)HDFS使用機(jī)架位感知的方法先把一份拷貝放入同機(jī)架上的機(jī)器,然后在拷貝一份到同機(jī)架機(jī)器的不同位置上[單選題]25.內(nèi)部用戶有作業(yè)層、管理層、()A)執(zhí)行層B)決策層C)建議層D)推送層[單選題]26.第一數(shù)字定律中使用概率最大的數(shù)字是()。A)0B)1C)2D)3[單選題]27.從Maxcompute導(dǎo)入數(shù)據(jù)到ADS的時候,導(dǎo)入路徑格式為:()。A)odps://project_name/table_namepartiton_specB)odps://project_name/table_name:partiton_specC)odps://project_name/table_name(partiton_spec)D)odps://project_name/table_name/partiton_spec[單選題]28.下面程序中最后X_scaled值為多少()>>>fromsklearnimportpreprocessing>>>importnumpyasnp>>>X=np.array([[1.,-1.,2.],...[2.,0.,0.],...[0.,1.,-1.]])>>>X_scaled=preprocessing.scale(X)A)array([[0....,-1.22...,1.33...],[-1.22...,0....,-0.26...],[1.22...,1.22...,-1.06...]])B)array([[0....,-1.22...,1.33...],[1.22...,0....,-0.26...],[-1.22...,1.22...,-1.06...]])C)array([[0....,-1.22...,1.33...],[1.22...,0....,0.26...],[-1.22...,1.22...,-1.06...]])D)array([[0....,-1.22...,1.33...],[1.22...,0....,-0.26...],[-1.22...,1.22...,1.06...]])[單選題]29.將灰度圖像轉(zhuǎn)換成二值圖像的命令為()。A)ind2grayB)ind2rgbC)im2bwD)ind2bw[單選題]30.某超市研究銷售記錄數(shù)據(jù)后發(fā)現(xiàn),買面包的人很大概率會購買啤酒,這種屬于數(shù)據(jù)挖掘的哪類問題?()A)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B)聚類C)分類D)自然語言處理[單選題]31.從學(xué)習(xí)的過程角度話分,可將數(shù)據(jù)挖掘算法劃分為()A)機(jī)器學(xué)習(xí)和統(tǒng)計學(xué)算法B)有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)C)直接型數(shù)據(jù)挖掘算法和間接型數(shù)據(jù)挖掘算法D)假設(shè)檢驗(yàn)型算法和知識發(fā)現(xiàn)型算法[單選題]32.通過(),激發(fā)和調(diào)動省、市、縣和直屬單位積極性,大膽探索、主動創(chuàng)新,不斷累積疊加新業(yè)務(wù)、新業(yè)態(tài)、新模式。A)組織機(jī)構(gòu)B)基層首創(chuàng)C)頂層設(shè)計D)信息模型[單選題]33.令N為數(shù)據(jù)集的大小[注:設(shè)訓(xùn)練樣本(xi,yi),N即訓(xùn)練樣本個數(shù)],d是輸入空間的維數(shù)(注:d即向量xi的維數(shù))。硬間隔SVM問題的原始形式[即在不等式約束(yi(wTxi+b)≥1)下最小化(1/2)wTw]在沒有轉(zhuǎn)化為拉格朗日對偶問題之前,是()。A)一個含N個變量的二次規(guī)劃問題B)一個含N+1個變量的二次規(guī)劃問題C)一個含d個變量的二次規(guī)劃問題D)一個含d+1個變量的二次規(guī)劃問題[單選題]34.在集成學(xué)習(xí)中,對于數(shù)據(jù)型輸出,最常見的結(jié)合策略是()A)平均法B)投票法C)學(xué)習(xí)法D)以上答案都正確[單選題]35.關(guān)于HBase中HFile的描述不正確的是?A)一個HFile屬于一個regionB)一個HFile包含多個列族的數(shù)據(jù)C)一個HFile包含多列數(shù)據(jù)D)一個HFile包含多行數(shù)據(jù)[單選題]36.基礎(chǔ)IT資源的管理部分屬于()A)IAASB)PAASC)SAASD)以上都不是[單選題]37.詞袋模型、TF-IDF、Word2vec等模型都有的作用是()。A)文本情感分析B)文本特征向量化C)文本特征離散化D)文本特征分布式[單選題]38.以下哪項(xiàng)不提供交互式查詢服務(wù)?A)EchartB)ImpaleC)EylinD)Presto[單選題]39.以下關(guān)于HiveSQL基本操作描述正確的是?A)創(chuàng)建外部表必須要指定location信息B)創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字C)加載數(shù)據(jù)到Hive時源數(shù)據(jù)必須是HDFS的一個路徑D)創(chuàng)建表時可以指定列分割符[單選題]40.個性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖據(jù)基礎(chǔ)上的一種高級商務(wù)智能平臺,以幫助()為其顧客購物提供完全個性化的決策支持和信息服務(wù)。A)公司B)單位C)電子商務(wù)網(wǎng)站D)跨國企業(yè)[單選題]41.下列哪一項(xiàng)不是StructuredStreaming支持的Source數(shù)據(jù)源。A)KafkaB)SocektC)HiveD)Hdfs[單選題]42.關(guān)于logit回歸和SVM不正確的是()A)Logit回歸目標(biāo)函數(shù)是最小化后驗(yàn)概率B)Logit回歸可以用于預(yù)測事件發(fā)生概率的大小C)SVM目標(biāo)是結(jié)構(gòu)風(fēng)險最小化D)SVM可以有效避免模型過擬合[單選題]43.()是Spark中用來進(jìn)行圖計算的庫函數(shù)。A)GraphXB)SparkSQLC)SparkStreamingD)Mllib[單選題]44.以下不屬于Hive交互式Shell模式下的常用命令的是()A)resetB)exitC)deleteD)java[單選題]45.關(guān)于Python中的復(fù)數(shù),下列說法錯誤的是A)表示復(fù)數(shù)的語法是real+imagejB)實(shí)部和虛部都是浮點(diǎn)數(shù)C)虛部必須后綴j,且必須是小寫D)方法conjugate返回復(fù)數(shù)的共軛復(fù)數(shù)[單選題]46.關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉庫的對比,下列描述錯誤的是:()。A)Hive元數(shù)據(jù)存儲獨(dú)立于數(shù)據(jù)存儲之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,二傳統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)應(yīng)用單一,靈活性低B)Hive基于HDFS存儲,理論上存儲可以無限擴(kuò)容,而傳統(tǒng)數(shù)據(jù)倉庫存儲量有上限C)由于Hive的數(shù)據(jù)存儲在HDFS上,所以可以保證數(shù)據(jù)的高容錯,高可靠D)由于Hive基于大數(shù)據(jù)平臺,所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快[單選題]47.關(guān)于Maxcomputepolicy授權(quán),說法不正確的是:()。A)支持根據(jù)IP授權(quán)B)支持授權(quán)的時間段C)支持根據(jù)數(shù)據(jù)敏感級授權(quán)D)支持表名通配符授權(quán)[單選題]48.圖像中的椒鹽噪聲可以用(__)去除。A)中值濾波B)均值濾波C)最大值濾波D)最小值濾波[單選題]49.執(zhí)行以下代碼段print("D",end='')print("C",end='')print("B",end='')print("A",end='')時,輸出為()。A)D,C,B,AB)DCBAC)DCBAD)DCBA[單選題]50.采用模板[-11]主要檢測()方向的邊緣。A)水平B)45°C)垂直D)135°[單選題]51.請選出隨機(jī)函數(shù)()A)abs(x)B)random()C)pow(x,y)D)ceil(x)[單選題]52.以下代碼的作用是?i=0whileiA)輸出0~10的所有數(shù)字B)輸出0~9的所有數(shù)字C)一直輸出0不停止D)輸出一個0[單選題]53.Numpy數(shù)組輸出的原則是()。A)從左到右,從下到上B)從左到右,從上到下C)從右到左,從下到上D)從右到左,從上到下[單選題]54.下面屬于批處理技術(shù)的是:()A)MapReduceB)StormC)SparkD)GraphX[單選題]55.Flink的哪種機(jī)制可以保證task運(yùn)行失敗時,其狀態(tài)能夠恢復(fù)?A)窗口B)有狀態(tài)處理C)事件時間D)檢查點(diǎn)[單選題]56.安裝HBase,配置環(huán)境變量,命令是()A)vi/etc/profile.d/mysql-eco.shB)vi/etc/profile.d/hive-eco.shC)vi/etc/profile.d/hbase-eco.shD)vi/etc/profile.d/hadoop-eco.sh[單選題]57.國網(wǎng)公司泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案要求,完成企業(yè)級數(shù)據(jù)中臺和客戶服務(wù)、電網(wǎng)資源兩類業(yè)務(wù)中臺試點(diǎn)建設(shè)。推進(jìn)營配貫通優(yōu)化提升,營配增量數(shù)據(jù)及時維護(hù)率(___),業(yè)財數(shù)據(jù)貫通率(___)。A)70%,80%B)100%,70%C)100%,80%D)80%,70%[單選題]58.下列不是數(shù)據(jù)科學(xué)項(xiàng)目的主要角色()。A)項(xiàng)目發(fā)起人B)項(xiàng)目經(jīng)理C)操作員D)驗(yàn)收人員[單選題]59.未來二十年就是()為王的時代。A)文化B)工業(yè)C)數(shù)據(jù)D)農(nóng)業(yè)[單選題]60.下列關(guān)于函數(shù)的說法中,描述錯誤的是()。A)函數(shù)可以減少重復(fù)的代碼,使得程序更加模塊化B)不同的函數(shù)中可以使用相同名字的變量C)調(diào)用函數(shù)時,實(shí)參的傳遞順序與形參的順序可以不同D)匿名函數(shù)與使用關(guān)鍵字def定義的函數(shù)沒有區(qū)別[單選題]61.對MapReduce計算框架中生成的鍵值對的說法正確的是()。A)可以有相同的鍵,值必須唯一B)可以有相同的值,鍵必須唯一C)可以有相同的鍵,也可以有相同的佳D)鍵和值都必須唯一[單選題]62.Spark中引入RDD概念的目的是()。A)數(shù)據(jù)存儲B)數(shù)據(jù)查重C)提升容錯能力D)增強(qiáng)數(shù)據(jù)一致性[單選題]63.某公司總經(jīng)理在公司年會上,希望清楚地展示出公司本年度發(fā)展的關(guān)鍵詞、以及公司經(jīng)歷的令人記憶深刻的大事件,他可以選擇的圖表是()A)氣泡圖B)面積圖C)地圖D)文本圖[單選題]64.令N為數(shù)據(jù)集的大小[注:設(shè)訓(xùn)練樣本(xi,yi),N即訓(xùn)練樣本個數(shù)],d是輸入空間的維數(shù)(注:d即向量xi的維數(shù))。則硬間隔SVM問題的原始形式[即在不等式約束[y(wTx+b)≥1]下最小化(1/2)wTw]在沒有轉(zhuǎn)化為拉格朗日對偶問題之前是()。A)一個含N個變量的二次規(guī)劃問題B)一個含N+1個變量的二次規(guī)劃問題C)一個含d個變量的二次規(guī)劃問題D)一個含d+1個變量的二次規(guī)劃問題[單選題]65.下列選項(xiàng)中,用于獲取當(dāng)前目錄的是()A)open()B)write()C)getcwd()D)read()[單選題]66.下列關(guān)于在Matplotlib的說法正確的是()。A)散點(diǎn)圖不能在子圖中繪制B)散點(diǎn)圖的x軸刻度必須為數(shù)值C)折線圖可以用作查看特征間的趨勢關(guān)系D)箱線圖可以用來查看特征間的相關(guān)關(guān)系311[單選題]67.探索性分析與驗(yàn)證性分析的不同點(diǎn)是()。A)探索性分析需要事先假設(shè)B)探索性分析比驗(yàn)證性分析復(fù)雜C)探索性分析在前D)驗(yàn)證性分析在前[單選題]68.堅持頂層設(shè)計和基層首創(chuàng)相結(jié)合,通過()對新興業(yè)務(wù)進(jìn)行初步規(guī)劃,引導(dǎo)基層單位突出重點(diǎn)A)信息模型B)人工智能C)智慧物聯(lián)D)頂層設(shè)計[單選題]69.信息熵是度量(__)最常用的一種指標(biāo)。A)樣本的個數(shù)B)樣本的維度C)樣本的純度D)樣本的冗余度[單選題]70.下列語句在Python中非法的是()。A)x=y=z=1B)x=(y=z+1)C)x,y=y,xD)x+=y[單選題]71.HDFS中Namenode的主備仲裁,是由哪個組件控制的A)HDFSClientB)NodeManagerC)ResourceManagerD)ZooKeeperFailoverController[單選題]72.在抽樣方法中,當(dāng)合適的樣本容量很難確定時,可以使用的抽樣方法是()。A)有放回的簡單隨機(jī)抽樣B)無放回的簡單隨機(jī)抽樣C)分層抽樣D)漸進(jìn)抽樣[單選題]73.下列關(guān)于阿里云流計算的描述總,錯誤的是:()。A)是運(yùn)行在阿里云平臺上的流式大數(shù)據(jù)分析平臺B)提供給用戶在云上進(jìn)行流式數(shù)據(jù)實(shí)時化分析工具C)可以使用阿里云StreamSQL進(jìn)行流式數(shù)據(jù)分析D)流計算的數(shù)據(jù)存儲是基于盤古分布式文件系統(tǒng)的[單選題]74.HBase中KeyValue數(shù)據(jù)的存儲格式是()。A)HFileB)HLogFileC)SequenceFileD)TXT[單選題]75.程序片段:x="foo"y=2print(x+y)執(zhí)行以上三句指令后將會顯示:A)fooB)foo2C)foofooD)Can'tconvert'int'objecttostrimplicitly[單選題]76.df.tail()這個函數(shù)是用來()。A)用來創(chuàng)建數(shù)據(jù)B)用來展現(xiàn)數(shù)據(jù)C)用來分析數(shù)據(jù)D)用來刪除數(shù)據(jù)[單選題]77.在Spark中()是工作節(jié)點(diǎn)上運(yùn)行的一組計算進(jìn)程。A)DAGSchedulerB)TaskSchedulerC)ExecutorD)ClusterManager[單選題]78.對于一個圖像識別問題(在一張照片里找出一只貓),()可以更好地解決這個問題A)循環(huán)神經(jīng)網(wǎng)絡(luò)B)感知機(jī)C)多層感知機(jī)D)卷積神經(jīng)網(wǎng)絡(luò)[單選題]79.關(guān)于正則化項(xiàng),說法錯誤的是()A)、在機(jī)器學(xué)習(xí)中,如果單方面追求?誤差函數(shù)?的取值最小,則很容易造成機(jī)器學(xué)習(xí)的?欠擬合?現(xiàn)象。B)、?過擬合(Overfit)?就是目標(biāo)函數(shù)在已知數(shù)據(jù)(如訓(xùn)練集)上的擬合性能非常高(如準(zhǔn)確率達(dá)到100%),而在未知數(shù)據(jù)(如測試集或新數(shù)據(jù))上的擬合準(zhǔn)確率低(如準(zhǔn)確率低于50%)。C)、為了防止過擬合現(xiàn)象的出現(xiàn),機(jī)器學(xué)習(xí)通常采取?正則化項(xiàng)?。D)、正則化項(xiàng)有L1項(xiàng)(L1Loss)和L2項(xiàng)(L2Loss),二者的區(qū)別在于所涉及的距離計算方法和回歸方法不同[單選題]80.下列關(guān)于Hadoop中MapReduce的說法正確的是()。A)可以沒有Reduce任務(wù)B)Reducer輸入為隨機(jī)輸入C)Shuf?e主要實(shí)現(xiàn)數(shù)據(jù)可視化功能D)一個Reducer只能從一個Map復(fù)制所需要的partition[單選題]81.()負(fù)責(zé)HDFS數(shù)據(jù)存儲。A)NameNodeB)JobTrackerC)DataNodeD)SecondaryNameNode[單選題]82.根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險預(yù)警信號管理辦法(試行)》,域外分行的紅色級信號,轄內(nèi)支行管戶客戶經(jīng)理應(yīng)在接收到系統(tǒng)所推送信號當(dāng)日立即聯(lián)系客戶開展預(yù)警信號風(fēng)險核實(shí)工作,限期()個工作日內(nèi)制定出針對性的處置措施。A)1B)3C)5D)10[單選題]83.()模式,只適合于Hive簡單試用及單元測試。A)單用戶模式B)多用戶模式C)多用戶遠(yuǎn)程模式D)單用戶遠(yuǎn)程模式[單選題]84.在k均值算法中,假定聚類簇數(shù)k=3,則在算法開始時隨機(jī)選?。╛_)個樣本作為初始均值向量A)1B)2C)3D)任意[單選題]85.HBase中的批量加載底層使用()實(shí)現(xiàn)。A)MapReduceB)HiveC)CoprocessorD)BloomFilter[單選題]86.詞袋模型是在自然語言處理和信息檢索中的一種簡單假設(shè)。在這種模型中,文本(段落或者文檔)被看作是()的詞匯集合,忽略語法甚至是單詞的順序。A)無序B)有序C)無意義D)規(guī)范[單選題]87.(__)是指樣本空間中具有代表性的點(diǎn)。A)樣本點(diǎn)B)原點(diǎn)C)原型D)實(shí)例[單選題]88.數(shù)據(jù)恢復(fù)必須堅持審批登記制。需要恢復(fù)數(shù)據(jù)時,報批準(zhǔn)后方可進(jìn)行;恢復(fù)數(shù)據(jù)必須堅持(),一人操作,一人監(jiān)督,并詳細(xì)登記;恢復(fù)過程中若有異常情況,應(yīng)及時與有關(guān)技術(shù)人員聯(lián)系,不得任意處理;若恢復(fù)異常對業(yè)務(wù)造成重大影響,必須向主管領(lǐng)導(dǎo)匯報,并組織實(shí)施補(bǔ)救。A)雙人制B)復(fù)核制C)AA制D)單人制[單選題]89.下列去噪方法中能較好地保持圖像邊緣的是()。A)中值濾波B)雙邊濾波C)均值濾波D)高斯濾波[單選題]90.表達(dá)式print("{:.2f}".format(20-2**3+10/3**2*5))的結(jié)果是:A)55B)56C)22D)17.56[單選題]91.以下不屬于大數(shù)據(jù)系統(tǒng)端風(fēng)險的是()A)數(shù)據(jù)系統(tǒng)的申請、查看流程B)數(shù)據(jù)查看權(quán)限C)系統(tǒng)平臺的穩(wěn)定性D)數(shù)據(jù)庫管理、存儲[單選題]92.我想使用JavaAPI刪除HDFS中的非空文件夾/123,以下選項(xiàng)正確的是()A)fs.delete(newPath("/123"));B)fs.delete(newPath("/123"),false);C)fs.delete(newPath("/123"),true);D)delete()方法只能刪除文件或非空文件夾,不能直接刪除非空文件夾[單選題]93.下面算法屬于局部處理的是()。A)灰度線性變換B)二值化C)傅里葉變換D)中值濾波[單選題]94.()是窄依賴操作。A)joinB)flterC)groupD)sort[單選題]95.在Hive的查詢語句中,表示A和B按位取或的是()A)A|BB)A&BC)A-BD)A~B[單選題]96.Python代碼中mpl.rcParams['font.sans-serif']=['SimHei']的作用是()。A)設(shè)置圖表中文顯示的字體B)設(shè)置圖表圖例的位置C)設(shè)置圖表標(biāo)題的顏色D)設(shè)置圖表標(biāo)題的位置[單選題]97.假如使用Lasso回歸來擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(X1,X2,…,X100)?,F(xiàn)在,把其中一個特征的值擴(kuò)大10倍(如特征X1),然后用相同的正則化參數(shù)對Lasso回歸進(jìn)行修正。那么下列說法正確的是()。A)特征X1很可能被排除在模型之外B)特征X1很可能還包含在模型之中C)無法確定特征X1是否被舍D)以上答案都不正確[單選題]98.Redis中相對于AOF持久化,對RDB持久化描述正確的是?A)內(nèi)存占用過多,持久化文件尺寸較大B)占用較多的磁盤IO開支C)會丟失最后一次持久化以后的數(shù)據(jù)D)恢復(fù)數(shù)據(jù)相對較慢,寫入數(shù)據(jù)相對較快[單選題]99.VARCHAR(4)類型的字段存儲'abcd'占用的字節(jié)數(shù)為()。--A)1B)3C)4D)5[單選題]100.下列不屬于可視化視覺下的數(shù)據(jù)類型的是()。A)定類數(shù)據(jù)B)定序數(shù)據(jù)C)定寬數(shù)據(jù)D)定比數(shù)據(jù)[單選題]101.np.argmax()函數(shù)的作用是()。A)輸出數(shù)組的最大值B)輸出數(shù)組最大值的索引下標(biāo)C)輸出數(shù)組的最小值D)輸出數(shù)組最小值的索引下標(biāo)[單選題]102.CNN神經(jīng)網(wǎng)絡(luò)對圖像特征提取帶來了變革性的變化,使之前的人工特征提取升級到數(shù)據(jù)驅(qū)動的自動特征提取,在CNN中,起到特征提取作用的網(wǎng)絡(luò)層是()。A)卷積層B)全連接層C)池化層D)采樣層[單選題]103.神經(jīng)網(wǎng)絡(luò)感知機(jī)只有()神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能神經(jīng)元A)輸出層B)輸入層C)感知層D)網(wǎng)絡(luò)層[單選題]104.pandas中的解析函數(shù)read_cvs,默認(rèn)的分隔符是(___)。A)逗號B)分號C)?\t?D)句號[單選題]105.以下關(guān)于數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問權(quán)限的說法正確的有()。A)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號僅供責(zé)任人登錄使用,不得借與他人B)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號密碼不超過6個月要更換一次C)為了保密,對數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號的登錄時間、時長等實(shí)行無痕跡管理D)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問權(quán)限實(shí)行匿名制管理[單選題]106.CSV是一種通用的、相對簡單的文件格式,被用戶、商業(yè)和科學(xué)廣泛應(yīng)用?,F(xiàn)在需要在DEEP平臺中將多個字符串拼接成CSV格式的字符串。請選擇適用的數(shù)值轉(zhuǎn)換器:A)CeilingB)CsvAssembleC)CsnToStringD)TermExtract[單選題]107.HDFS的優(yōu)點(diǎn)不包含哪個?A)處理超大文件B)運(yùn)行于廉價機(jī)器上C)高效存儲大量小文件D)流式的訪問數(shù)據(jù)[單選題]108.在大數(shù)據(jù)的計算模式中,流計算解決的是什么問題?A)針對大規(guī)模數(shù)據(jù)的批量處理B)針對大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)的處理C)大規(guī)模數(shù)據(jù)的存儲管理和查詢分析D)針對流數(shù)據(jù)的實(shí)時計算[單選題]109.云計算模式追求高效、經(jīng)濟(jì)、安全的綜合效益,是企業(yè)信息化建設(shè)()的必然結(jié)果。作為互聯(lián)網(wǎng)主流技術(shù)趨勢,云計算已經(jīng)在不斷改變我們的工作和生活。A)一體化、集約化B)經(jīng)濟(jì)化、集約化C)智能化、精益化D)智能化、高效化[單選題]110.下列算法中:①K-NN最近鄰算法:②線性回歸;③邏輯回歸,可以用神經(jīng)網(wǎng)絡(luò)構(gòu)建的算法是()A)①②B)②③C)①②③D)以上都不是[單選題]111.下面不屬于跨平臺性基礎(chǔ)設(shè)施和跨平臺分析工具的有(__)。A)IBMB)MicrosoftC)AmazonD)redeo[單選題]112.Python語言定義的class的初始化函數(shù)的函數(shù)名是()。A)initB)initC)initD)init[單選題]113.格式化日期的函數(shù)是()A)DATEDIFF()B)DATE_FORMAT()C)DAY()D)CURDATE()[單選題]114.下列一系列處理,在基本保持原始數(shù)據(jù)完整性的基礎(chǔ)上,減小數(shù)據(jù)規(guī)模的是()A)數(shù)據(jù)清洗B)數(shù)據(jù)融合C)數(shù)據(jù)規(guī)約D)數(shù)據(jù)挖掘[單選題]115.RDD有Transformation和Action算子,下列屬于Action算子的是?A)mapB)saveAsTextFileC)FilterD)reduceByKey[單選題]116.假如table中有一條記錄,字段列coll值為空,下面()條件會將此條記錄查詢出來。A)coll="B)coll!="C)collisnullD)collisnotnull[單選題]117.以下語句錯誤的是()A)altertableempdeletecolumnaddcolumn;B)altertableempmodifycolumnaddcolumnchar(10);C)altertableempchangeaddcolumnaddcolumnint;D)altertableempaddcolumnaddcolumnint;[單選題]118.下列符號中,表示Python中單行注釋的是()。A)#B)//C)D)???[單選題]119.下列代碼要打開的文件應(yīng)該在()。f=open('itheima.txt','w')A)C盤根目錄B)D盤根目錄C)Python安裝目錄D)程序所在目錄[單選題]120.DRDS不具備()特性。A)小表廣播B)分庫分表C)平滑擴(kuò)容D)智能索引[單選題]121.np.full()的作用是(__)。A)創(chuàng)建全零矩陣B)根據(jù)給定的形狀創(chuàng)建指定數(shù)值的矩陣C)創(chuàng)建對角矩陣D)顯示矩陣[單選題]122.傳統(tǒng)處理數(shù)據(jù)的數(shù)據(jù)規(guī)模的單位是:()。A)TBB)EBC)PBD)GB[單選題]123.Hbase的底層以()形式存在。A)keyvalueB)列存儲C)行存儲D)實(shí)時存儲[單選題]124.如果有變量a=[1,2,3,4,5,6],能夠得到列表[3,4,5]的表達(dá)式為()A)a[2:5]B)a[3:5]C)a[3:-1]D)a[3,4,5][單選題]125.下面關(guān)于詞袋模型的說法,錯誤的是()A)飼袋模型使用一個多重集對文本中出現(xiàn)的單詞進(jìn)行編碼B)詞袋模型不考慮詞語原本在句子中的順序C)詞袋模型可以應(yīng)用于文檔分類和檢索,同時受到編碼信息的限制D)飼袋模型產(chǎn)生的靈感來源于包含類似單坷的文檔經(jīng)常有相似的含義[單選題]126.Pandas在執(zhí)行算術(shù)運(yùn)算時,沒有對齊的位置會使用()進(jìn)行補(bǔ)齊。A)NullB)0C)NaND)null_values[單選題]127.()可以為遠(yuǎn)程客戶端提供執(zhí)行Hive查詢服務(wù)。A)MetastoreB)HiveServer2C)BeelineD)MySQL[單選題]128.關(guān)于Hive說法正確的是()。A)一種數(shù)據(jù)倉庫B)一種數(shù)據(jù)處理工具C)一種可視化工具D)一種分析算法[單選題]129.在Hive中有數(shù)據(jù)表employee,將其重命名為emp命令正確的是()A)altertableemployeerenametoemp;B)updatetableemployeerenametoemp;C)altertableemployeerenameemp;D)updatetableemployeerenameemp;[單選題]130.HDFS默認(rèn)的最基本的儲存單位是?A)數(shù)據(jù)塊B)元數(shù)據(jù)節(jié)點(diǎn)C)數(shù)據(jù)節(jié)點(diǎn)D)從元數(shù)據(jù)節(jié)點(diǎn)[單選題]131.PageRank是一個函數(shù),它對Web中的每個網(wǎng)頁賦予一個實(shí)數(shù)值。它的意圖在于網(wǎng)頁的PageRank越高,那么它就()。A)相關(guān)性越高B)越不重要C)相關(guān)性越低D)越重要[單選題]132.哪個不是Flume的channel類型?A)MemoryChannelB)FileChannelC)JDBCCHannelD)HDFSChannel[單選題]133.()使用目錄節(jié)點(diǎn)樹的方式(類似文件系統(tǒng))存儲數(shù)據(jù),主要用途是維護(hù)和監(jiān)聽所存數(shù)據(jù)的狀態(tài)變化,以實(shí)現(xiàn)對集群的管理。A)ZookeeperB)HBaseC)HiveD)Sqoop[單選題]134.下面不屬于客戶服務(wù)的有(__)。A)ravelB)medalliaC)gainsightD)frame.ai[單選題]135.執(zhí)行下列語句后的顯示結(jié)果是什么?>>>s='hi'>>>print('hi',2*s)A)hihihiB)"hi"hihiC)hihihiD)hihihi[單選題]136.下列關(guān)于基本元數(shù)據(jù)描述正確的是()。A)基本元數(shù)據(jù)是與數(shù)據(jù)源、數(shù)據(jù)倉庫、數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C)基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理、分析處理以及管理方面的信息[單選題]137.CART決策樹通常采用()剪枝方法。A)REP(錯誤率降低)B)CCP(代價復(fù)雜度)C)PEP(悲觀剪枝)D)預(yù)剪枝[單選題]138.下列關(guān)于JobTracker敘述不正確的一項(xiàng)為()。A)MapReduce框架的使用者B)協(xié)調(diào)MapReduce作業(yè)C)分配任務(wù)D)監(jiān)控任務(wù)[單選題]139.在編寫程序時經(jīng)常要對某一個條件進(jìn)行判斷,?條件?只有?成立?或?不成立?兩種結(jié)果。成立用?True?表示,不成立用?False?表示。下列關(guān)系表達(dá)式中,結(jié)果為?True?的是()A)2>5B)3>=3C)1!=1D)6==5[單選題]140.根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)和發(fā)展需要,借鑒()思維,動態(tài)優(yōu)化各層級組織機(jī)構(gòu)、職責(zé)范圍和管理權(quán)限,打造柔性組織,推動前端融合。A)能源網(wǎng)B)信息網(wǎng)C)智能網(wǎng)D)互聯(lián)網(wǎng)[單選題]141.以下()屬于NoSQL數(shù)據(jù)庫中Key-Value的缺點(diǎn)。A)不記錄結(jié)構(gòu)信息B)查詢性能不高,缺乏統(tǒng)一查詢語法C)功能相對有限D(zhuǎn))功能相對有限,不易于做分布式集群[單選題]142.涉及《網(wǎng)絡(luò)安全法》等法律法規(guī)的相關(guān)事項(xiàng)不包括()。A)落實(shí)公司關(guān)鍵信息基礎(chǔ)設(shè)施數(shù)據(jù)安全保護(hù)要求B)禁止公網(wǎng)傳輸相關(guān)數(shù)據(jù)。C)履行網(wǎng)絡(luò)運(yùn)營者的數(shù)據(jù)安全責(zé)任與義務(wù)D)落實(shí)國家大數(shù)據(jù)安全保護(hù)要求。[單選題]143.數(shù)組允許批量計算而無須任何for循環(huán),這種特性叫(__)。A)矩陣化B)便捷化C)批量化D)向量化[單選題]144.Spark是用以下()編程語言實(shí)現(xiàn)的。A)CB)C++C)JAVAD)Scala第2部分:多項(xiàng)選擇題,共62題,每題至少兩個正確答案,多選或少選均不得分。[多選題]145.流數(shù)據(jù)模型的共性有哪些?A)數(shù)據(jù)實(shí)時到達(dá)B)數(shù)據(jù)到達(dá)次序獨(dú)立,不受應(yīng)用系統(tǒng)所控制C)數(shù)據(jù)規(guī)模宏大且不能預(yù)知其最大值D)數(shù)據(jù)一經(jīng)處理,除非特意保存,否則不能被再次取出處理,或者再次提取數(shù)據(jù)代價昂貴[多選題]146.協(xié)同推進(jìn)智慧物聯(lián),重點(diǎn)是統(tǒng)一(),設(shè)計面向傳感和支撐邊緣聚合計算的設(shè)備級配用電統(tǒng)一信息模型A)終端功能設(shè)計B)接入標(biāo)準(zhǔn)C)交互規(guī)范D)入網(wǎng)許可[多選題]147.K-Means優(yōu)點(diǎn)()A)簡單易于理解B)時間復(fù)雜度低C)簡單易于實(shí)現(xiàn)D)以上說法都不對[多選題]148.關(guān)于MaxcomputePolicy授權(quán)的特點(diǎn),說法正確的是:()。A)授權(quán)對象支持以通配符?*?B)刪除一個對象時,與該對象相關(guān)的policy授權(quán)會被刪除C)policy支持通過xml文件的方式授權(quán)D)當(dāng)Allow和deny同時存在時,則以deny優(yōu)先原則[多選題]149.FusionInsightHD集群中包含了多種服務(wù),每種服務(wù)又由若干角色組成,下面哪些是服務(wù)的角色?A)HDFSB)NameNodeC)DataNodeD)HBase[多選題]150.在大數(shù)據(jù)時代,可視化技術(shù)可以支持實(shí)現(xiàn)哪些目標(biāo)?()A)觀測、跟蹤數(shù)據(jù)B)分析數(shù)據(jù)C)輔助理解數(shù)據(jù)D)增強(qiáng)數(shù)據(jù)吸引力[多選題]151.非結(jié)構(gòu)化數(shù)據(jù)的管理常采用()。A)NoSQLB)NewSQLC)mysqlD)關(guān)系云[多選題]152.加的組合滿足了大部分的用戶實(shí)時查詢訴求?A)MapReduceB)HBaseC)ElasticSearchD)Hive[多選題]153.可視化視角下的數(shù)據(jù)類型主要有四類,下面說法錯誤的是()A)定類數(shù)據(jù)可支持判斷是否相等的操作,還可以進(jìn)行大小比較B)定距數(shù)據(jù)的?0?的位置一般具有任意性,不代表對應(yīng)失誤是否存在C)定序數(shù)據(jù)中的?0?表示不存在D)定比數(shù)據(jù)用于記錄事物的量化信息[多選題]154.下列有關(guān)Zookeeper的特點(diǎn)描述正確的是()。A)Zookeeper具有高可用性B)Zookeeper采用松耦合交互方式C)Zookeeper是一個資源庫D)Zookeeper是一個精簡的文件系統(tǒng)[多選題]155.感知機(jī)中,(__)接收外界輸入信號后傳遞給(__)。A)輸入層B)輸出層C)第一層D)第二層[多選題]156.NoSQL數(shù)據(jù)庫具有以下幾個特點(diǎn):()A)靈活的可擴(kuò)展性B)靈活的數(shù)據(jù)模型C)與云計算緊密融合D)數(shù)據(jù)模型比較死板[多選題]157.下面系統(tǒng)中屬于關(guān)系數(shù)據(jù)庫管理系統(tǒng)的是()A)MS_SQLSERVERB)OracleC)IMSD)DB2[多選題]158.信息科技為大數(shù)據(jù)時代提供技術(shù)支撐,主要體現(xiàn)在哪三個方面:()A)存儲設(shè)備容量不斷増加B)CPU處理能力大幅提升C)量子計算機(jī)全面普及D)網(wǎng)絡(luò)帶寛不斷増加[多選題]159.執(zhí)行HBase讀取數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分?jǐn)?shù)據(jù)?A)HMasterB)HFileC)HlogD)MemStore[多選題]160.圖像識別通常有()等等A)輪廓識別B)特征識別C)色彩識別D)材質(zhì)識別[多選題]161.大數(shù)據(jù)的來源包括()。A)互聯(lián)網(wǎng)數(shù)據(jù)B)實(shí)時數(shù)據(jù)C)探測數(shù)據(jù)D)傳感器數(shù)據(jù)[多選題]162.在HBase中,下列Table提供的獲取Scan實(shí)例的方法正確的有()【選三項(xiàng)】A)ResultScannergetScanner(Scanscan)throwsIOExceptionB)ResultScannergetScanner(String[]str)throwsIOExceptionC)ResultScannergetScanner(byte[]family)throwsIOExceptionD)ResultScannergetScanner(byte[]family,byte[]qualifier)throwsIOException[多選題]163.下列哪些屬于CRF模型對于HMM和MEMM模型的優(yōu)勢()A)特征靈活B)速度快C)可容納較多上下文信息D)全局最優(yōu)[多選題]164.關(guān)于學(xué)習(xí)器結(jié)合的描述,正確的是()A)避免羊?qū)W習(xí)器可能因誤選而導(dǎo)致泛化性能不佳B)降低陷入局部極小點(diǎn)的風(fēng)險C)假設(shè)空間擴(kuò)大,有可能學(xué)得更好的近似D)多學(xué)習(xí)器結(jié)合有可能沖突[多選題]165.以下哪些選項(xiàng)屬于FusionInsight數(shù)據(jù)安全性?A)操作系統(tǒng)安全加固B)組件數(shù)據(jù)加密C)數(shù)據(jù)完整性校驗(yàn)D)用戶權(quán)限認(rèn)證管理[多選題]166.下列不屬于聚類性能度量內(nèi)部指標(biāo)的是(A)DB指數(shù)B)Dunn指數(shù)C)Jaccard系數(shù)D)FM系數(shù)[多選題]167.Spark的運(yùn)行需要(__)和(__)的支持。A)JavaB)C++C)ScalaD)C[多選題]168.決策樹中包含以下哪些結(jié)點(diǎn)()A)根結(jié)點(diǎn)(rootnode)B)內(nèi)部結(jié)點(diǎn)(internalnode)C)外部結(jié)點(diǎn)(externalnode)D)葉結(jié)點(diǎn)(leafnode)[多選題]169.下列哪些現(xiàn)象屬于乘性噪聲。()A)電視光柵的退化B)二值圖像上的胡椒鹽噪聲C)信道傳輸受擾D)膠片材料的退化[多選題]170.研發(fā)部署物聯(lián)管理中心,推進(jìn)()等源網(wǎng)荷儲各類型終端標(biāo)準(zhǔn)化接入和統(tǒng)一物聯(lián)管理A)配用電B)輸變電C)電源側(cè)D)客戶側(cè)[多選題]171.下列屬于數(shù)值優(yōu)化算法的是()。A)梯度下降法B)牛頓法C)極大似然法D)邏輯回歸[多選題]172.Hive中表的類型可以簡單的分為()【選三項(xiàng)】A)內(nèi)部表B)外部表C)分庫表D)分桶表[多選題]173.聯(lián)接可將水平方向上合并兩個數(shù)據(jù)集合,并產(chǎn)生一個新的結(jié)果集合。聯(lián)接可分為()A)內(nèi)部聯(lián)接B)外部聯(lián)接C)順序聯(lián)接D)交叉聯(lián)接[多選題]174.對缺失數(shù)據(jù)的分析有()A)特征分析B)溯源分析C)影響分析D)原因分析[多選題]175.實(shí)時檢索解決方案支持的數(shù)據(jù)采集有哪些?A)LoaderB)SparkC)GraphBase導(dǎo)入工具D)SparkStreaming[多選題]176.下面關(guān)于數(shù)據(jù)粒度的描述正確的是:()A)粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細(xì)程度和級別B)數(shù)據(jù)越詳細(xì),粒度就越小,級別也就越高C)數(shù)據(jù)綜合度越高,粒度也就越大,級別也就越高D)粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量[多選題]177.a=np.array([1,2,3,4,5,6,7,8])以下(__)命令可以使輸出結(jié)果為[7]。A)a[6]B)a[7]C)a[-2]D)a[-1][多選題]178.國網(wǎng)人資部的職責(zé)是()A)電力物聯(lián)網(wǎng)組織優(yōu)化診斷B)優(yōu)化調(diào)整泛在電力物聯(lián)網(wǎng)管理、研發(fā)、建設(shè)和運(yùn)營組織機(jī)構(gòu)和管控模式C)負(fù)責(zé)優(yōu)化流程,制定激勵措施D)負(fù)責(zé)開展商業(yè)模式的創(chuàng)新研究[多選題]179.以下關(guān)于列表函數(shù)解說正確的是()A)len(list)求列表元素個數(shù)B)max(list)求返回列表元素最小的值C)min(list)求返回列表元素最大的值D)list()將其它類型轉(zhuǎn)為列表[多選題]180.在使用Spark時,通常只有()情況下考慮對RDD進(jìn)行序列化處理。A)在完成成本較高的操作之后B)在執(zhí)行容易失敗的操作之前C)當(dāng)RDD被重復(fù)使用D)當(dāng)RDD間依賴關(guān)系復(fù)雜[多選題]181.卷積神經(jīng)網(wǎng)絡(luò)中常用的池化函數(shù)包括()A)最大池化函數(shù)B)L2范數(shù)C)相鄰矩形區(qū)域內(nèi)的平均值D)基于據(jù)中心像章距離的加權(quán)平均函數(shù)[多選題]182.關(guān)于insert語句下列說法正確的是()A)insertinto表名values(字段名1對應(yīng)的值);B)insertinto表名values(字段名1對應(yīng)的值,字段名2對應(yīng)值);C)insertinto表名(字段名1)value(字段名1對應(yīng)的值);D)insertinto表名(字段名1,字段名2)values(字段名1對應(yīng)的值,字段名2對應(yīng)值);[多選題]183.以下有關(guān)卸載CentOS-7中MySQL相關(guān)的依賴相關(guān)命令描述正確的有()【選兩項(xiàng)】A)可以使用#rpm-qagrepmysql命令查看安裝的MySQL依賴B)設(shè)置開機(jī)啟動項(xiàng)的命令為#chkconfigmysqlonC)顯示數(shù)據(jù)庫的命令為showdatabase;D)可以使用#servicemysqlstart命令啟動MySQL服務(wù)[多選題]184.有兩種策略常用來緩解BP網(wǎng)絡(luò)的過擬合,分別是(__)和(__)。A)晚停B)早停C)正則化D)加入損失函數(shù)[多選題]185.數(shù)據(jù)脫敏的方法主要包括:()第6章數(shù)據(jù)存儲與管理A)數(shù)據(jù)替換B)無效化C)隨機(jī)化D)偏移和取整[多選題]186.大數(shù)據(jù)分析相關(guān)技術(shù)主要特征包括?A)機(jī)器學(xué)習(xí),全量特征B)數(shù)據(jù)背后事件關(guān)聯(lián)性分析C)基于海量數(shù)據(jù)為基礎(chǔ)D)基于精確樣本為基礎(chǔ)[多選題]187.以下Python表達(dá)式合法的有()。A)len([1,2,3])B)[1,2,3]+[4,5,6]C)['Hi!']*4D)3in[1,2,3][多選題]188.已定義級(DefinedLevel)的主要特點(diǎn)包括()。A)組織機(jī)構(gòu)已明確給出了關(guān)鍵過程的"標(biāo)準(zhǔn)定義",并定期對其進(jìn)行改進(jìn)B)已提供了關(guān)鍵過程的測量與預(yù)測方法C)關(guān)鍵過程的執(zhí)行過程并不是簡單或死板地執(zhí)行組織機(jī)構(gòu)給出的"標(biāo)準(zhǔn)定義",而是根據(jù)具體業(yè)務(wù)進(jìn)行了一定的"裁剪"工作D)數(shù)據(jù)的重要性已成為組織機(jī)構(gòu)層次的共識,將數(shù)據(jù)當(dāng)作成功實(shí)現(xiàn)組織機(jī)構(gòu)使命的關(guān)鍵因素之一[多選題]189.行存表相比于列存表的區(qū)別是?A)行存表按行存儲數(shù)據(jù),列存表按列存儲數(shù)據(jù)B)同樣的數(shù)據(jù),采用行存表存儲比列存儲所耗的時間更少。C)行存表面向百方級以下數(shù)據(jù)量,列存表面向千萬級以上數(shù)據(jù)量D)行存表適合數(shù)據(jù)更新,列存表合做數(shù)據(jù)聚臺。[多選題]190.Hadoop的HDFS是一種分布式文件系統(tǒng),其適合()的數(shù)據(jù)存儲和管理。A)大量小文件存儲B)高容錯、高吞吐量C)低延遲讀取D)流式數(shù)據(jù)訪問[多選題]191.MapReduce的作業(yè)主要包括什么?A)從磁盤或從網(wǎng)絡(luò)讀取數(shù)據(jù),即IO密集工作B)計算數(shù)據(jù),即CPU密集工作C)針對不同的工作節(jié)點(diǎn)選擇合適硬件類型D)負(fù)責(zé)協(xié)調(diào)集群中的數(shù)據(jù)存儲[多選題]192.噪聲數(shù)據(jù)的產(chǎn)生原因主要有()。A)采集設(shè)備有問題B)數(shù)據(jù)錄入過程中產(chǎn)生錯誤C)數(shù)據(jù)傳輸過程出現(xiàn)錯誤D)數(shù)據(jù)采集源不完備[多選題]193.在大數(shù)據(jù)計算服務(wù)SQL中使用distributeby和sortby可以對數(shù)據(jù)進(jìn)行局部排序,以下對distributeby、sortby的用法描述正確的有:()。A)數(shù)據(jù)會按照distributeby指定的列進(jìn)行分片,hash值相同的數(shù)據(jù)會在一個分片中B)使用sortby子句時,必須有distributeby子句C)sortby和orderby的用法沒有區(qū)別D)在一個分片中,數(shù)據(jù)會按照sortby指定的列進(jìn)行局部排序[多選題]194.以下關(guān)于分詞說法正確的是(__)。A)中文分詞的方法其實(shí)只能用于中文應(yīng)用B)現(xiàn)有的分詞算法可分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計的分詞方法。C)在中文里,?詞?和?詞組?邊界清晰D)按照是否與詞性標(biāo)注過程相結(jié)合,又可以分為單純分詞方法和分詞與標(biāo)注相結(jié)合的一體化方法。[多選題]195.在Hive架構(gòu)中,支持的數(shù)據(jù)操作有()。A)插入B)查詢C)刪除D)分析[多選題]196.以下哪些組件屬于大數(shù)據(jù)采集傳輸工具?A)KafkaB)FlumeC)LoaderD)Sqoop[多選題]197.開發(fā)Hive應(yīng)用時,不可避免地需要設(shè)定Hive的參數(shù)。對于一般參數(shù),我們可以使用以下哪幾種方式來進(jìn)行設(shè)定?()A)配置文件hive-site.xml(全局有效)B)命令行參數(shù):使用hive命令啟動Hive時,可以在命令行添加-hiveconfA.property=value來設(shè)定參數(shù),這一設(shè)定僅對本次啟動的session有效。C)參數(shù)聲明:使用hiveServer2/beeline啟動Hive時,可以在命令行添加--hiveconfproperty=value來設(shè)定參數(shù)。D)參數(shù)聲明:可以在Hive的客戶端中使用--hiveconf關(guān)鍵字設(shè)定參數(shù)。[多選題]198.數(shù)據(jù)分析主要實(shí)現(xiàn)哪三大作用:()A)誤差分析B)現(xiàn)狀分析C)原因分析D)預(yù)測分析[多選題]199.HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在一個文件系統(tǒng)樹中,這些信息也會在硬盤上保存成以下文件:()A)日志B)命名空間鏡像C)存儲塊復(fù)制信息D)集群配置信息[多選題]200.下面()選項(xiàng)是正確的Python標(biāo)準(zhǔn)庫對象導(dǎo)入語句。A)importmath.sinassinB)frommathimportsinC)importmath.*D)frommathimport*[多選題]201.下面關(guān)于SparkStreaming的描述正確的是:()A)SparkB)SparkC)SparkD)Spark[多選題]202.常見的回歸分析的種類有()。A)線性回歸B)系數(shù)回歸C)邏輯回歸D)曲線回歸[多選題]203.下列關(guān)于HDFS文件寫入的描述正確的有()。A)不支持多用戶對同一文件的寫操作B)用戶不可以在文件任意位置進(jìn)行修改C)默認(rèn)將文件復(fù)制成三份存放D)復(fù)制的文件塊默認(rèn)不存在同一機(jī)架上[多選題]204.調(diào)用Zookeeper客戶端命令中包含哪些信息?A)Ip地址B)端口號C)服務(wù)器名稱D)用戶名[多選題]205.若b=np.array([True,False,False]),以下能輸出[FalseTrueTrue]的是(__)。A)print(b-1)B)print(~b)C)print(np.logical_not(b))D)print(>>b)[多選題]206.可視分析學(xué)的特點(diǎn)包含()。A)強(qiáng)調(diào)數(shù)據(jù)到知識的轉(zhuǎn)換過程B)強(qiáng)調(diào)可視化分析與自動化建模之間的相互作用C)強(qiáng)調(diào)數(shù)據(jù)映射和數(shù)據(jù)挖掘的重要性D)強(qiáng)調(diào)數(shù)據(jù)加工(DataWrangling或DataMunging)工作的必要性E)強(qiáng)調(diào)人機(jī)交互的重要性第3部分:判斷題,共42題,請判斷題目是否正確。[判斷題]207.Graph節(jié)點(diǎn)中Halted標(biāo)志的含義是節(jié)點(diǎn)參與迭代計算。A)正確B)錯誤[判斷題]208.HDFS中的DataNode用于存儲實(shí)際的數(shù)據(jù),將自己管理的數(shù)據(jù)塊上報給C1ient,運(yùn)行多個實(shí)例。A)正確B)錯誤[判斷題]209.Kafka適用于實(shí)時性要求不高的場景。()A)正確B)錯誤[判斷題]210.訓(xùn)練完SVM模塑后,不是支持向量的那些樣本我們可以丟掉,也可以繼續(xù)分類。()A)正確B)錯誤[判斷題]211.關(guān)系型數(shù)據(jù)庫仍然是大數(shù)據(jù)處理中的關(guān)鍵技術(shù)。A)正確B)錯誤[判斷題]212.網(wǎng)絡(luò)空間是人類利用信息設(shè)施構(gòu)造、實(shí)現(xiàn)信息交互、進(jìn)而影響人類思想和行為的虛實(shí)結(jié)合的空間。A)正確B)錯誤[判斷題]213.安裝FusionlnsightHD軟件包前,必須在本節(jié)點(diǎn)/etc/hosts文件中配置集群中所有節(jié)點(diǎn)的主機(jī)名稱與業(yè)務(wù)IP的映射關(guān)系A(chǔ))正確B)錯誤[判斷題]214.Python使用縮進(jìn)來體現(xiàn)代碼之間的邏輯關(guān)系。A)正確B)錯誤[判斷題]215.正則表達(dá)式對象的match()方法可以在字符串的指定位置開始進(jìn)行指定模式的匹配。A)正確B)錯誤[判斷題]216.含有外鍵約束的從表字段不能修改表結(jié)構(gòu)。--A)正確B)錯誤[判斷題]217.通過擴(kuò)容的方式,解決不了傳統(tǒng)文件系統(tǒng)遇到存儲瓶頸的問題。A)正確B)錯誤[判斷題]218.GaussDB200在內(nèi)部使用行標(biāo)識符(CTID)記錄數(shù)據(jù)在表中的邏輯位置。A)正確B)錯誤[判斷題]219.Hbase最小的存儲單元是Region。A)正確B)錯誤[判斷題]220.Hadoop存在多個副本,且默認(rèn)備份數(shù)量是3。()A)正確B)錯誤[判斷題]221.在編寫函數(shù)時,建議首先對形參進(jìn)行類型檢查和數(shù)值范圍檢查之后再編寫功能代碼,或者使用異常處理結(jié)構(gòu),盡量避免代碼拋出異常而導(dǎo)致程序崩潰A)正確B)錯誤[判斷題]222.二進(jìn)制文件不能使用記事本程序打開。A)正確B)錯誤[判斷題]223.數(shù)據(jù)表的默認(rèn)字符集是latin1時,插入中文數(shù)據(jù)會出現(xiàn)錯誤提示。--A)正確B)錯誤[判斷題]224.pip命令也支持?jǐn)U展名為A)正確B)錯誤[判斷題]225.Logistic回歸目標(biāo)函數(shù)是最小化后驗(yàn)概率。()A)正確B)錯誤[判斷題]226.Channels支持事務(wù),提供較弱的順序保證,可以連接任何數(shù)量的Source和Sink。A)正確B)錯誤[判斷題]227.在Hive中,Driver負(fù)責(zé)管理HiveQL執(zhí)行的生命周期,并貫穿Hive任務(wù)整個執(zhí)行期間。A)正確B)錯誤[判斷題]228.Test'@''中的IP地址''表示遠(yuǎn)程主機(jī)。--A)正確B)錯誤[判斷題]229.分析顧客消費(fèi)行業(yè),以便有針對性的向其推薦感興趣的服務(wù),屬于關(guān)聯(lián)規(guī)則挖掘問題A)正確B)錯誤[判斷題]230.信息化主要是產(chǎn)生和整合數(shù)據(jù),大數(shù)據(jù)是把對經(jīng)驗(yàn)的挖掘和利用做到極致,智能化的核心是會學(xué)習(xí)的機(jī)器、可對未知的事件進(jìn)行模擬。A)正確B)錯誤[判斷題]231.GZIP壓縮算法比LZO更快。()A)正確B)錯誤[判斷題]232.檢測一元正態(tài)分布中的離群點(diǎn),屬于異常檢測中的基于密度的離群點(diǎn)檢測。()A)正確B)錯誤[判斷題]233.Python擴(kuò)展庫xlwt支持對Excel2003或更低版本的Excel文件進(jìn)行寫操作。A)正確B)錯誤[判斷題]234.數(shù)據(jù)去重可以解決人為的多次提交或應(yīng)用系統(tǒng)自身等問題導(dǎo)致的相同的數(shù)據(jù)重復(fù)錄入。()A)正確B)錯誤[判斷題]235.()對于字符串型數(shù)據(jù),空字符串??就是NULL,對于數(shù)值型數(shù)據(jù)0就是NULL。A)正確B)錯誤[判斷題]236.字典的?鍵?必須是不可變的。A)正確B)錯誤[判斷題]237.Python字典中的?鍵?不允許重復(fù)。A)正確B)錯誤[判斷題]238.外鍵約束在刪除的同時會刪除自動創(chuàng)建的外鍵索引。--A)正確B)錯誤[判斷題]239.()UPDATE語句修改的是表中數(shù)據(jù)行中的數(shù)據(jù),也可以修改表的結(jié)構(gòu)。A)正確B)錯誤[判斷題]240.Redis每個數(shù)據(jù)庫對外都是以一個從0開始的遞增數(shù)字命名,支持自定義。A)正確B)錯誤[判斷題]241.大數(shù)據(jù)的存儲方案通常對一份數(shù)據(jù)在不同節(jié)點(diǎn)上存儲多份副本,以提高系統(tǒng)容錯性。()A)正確B)錯誤[判斷題]242.刪除正在登錄的用戶,只有該用戶會話關(guān)閉后才會生效。--A)正確B)錯誤[判斷題]243.相同內(nèi)容的字符串使用不同的編碼格式進(jìn)行編碼得到的結(jié)果并不完全相同。A)正確B)錯誤[判斷題]244.當(dāng)添加的資源為分區(qū)表時,MaxCompute僅將整張表作為資源,不能將分區(qū)視為資源。A)正確B)錯誤[判斷題]245.HBase支持Rowkey查詢和二級索引查詢。A)正確B)錯誤[判斷題]246.lambda表達(dá)式中可以使用任意復(fù)雜的表達(dá)式,但是必須只編寫一個表達(dá)式。A)正確B)錯誤[判斷題]247.大數(shù)據(jù)分析是對總體數(shù)據(jù),尤其是針對傳統(tǒng)手段捕捉到的數(shù)據(jù)之外的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析。A)正確B)錯誤[判斷題]248.GES的計算層,不僅提供圖數(shù)據(jù)庫核心引擎,還提供模糊檢索,全文檢索等能力。A)正確B)錯誤第4部分:問答題,共11題,請在空白處填寫正確答案。[問答題]249.NameNode和DataNode通過(),可以檢測DataNode是否工作。[問答題]250.HDFS的namenode保存了一個文件包括哪些數(shù)據(jù)塊,分布在哪些數(shù)據(jù)節(jié)點(diǎn)上,這些信息也存儲在硬盤上。A)正確B)錯誤[問答題]251.NameNode與DataNode通過()機(jī)制互相通信。[問答題]252.智慧醫(yī)療具有哪些優(yōu)點(diǎn):()促進(jìn)優(yōu)質(zhì)醫(yī)療資源的共享避免患者重復(fù)檢查促進(jìn)醫(yī)療智能化有助于實(shí)現(xiàn)全民免費(fèi)醫(yī)療[問答題]253.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次允許task都是從3個有副本的機(jī)器上傳輸需要處理的文件.A)TrueB)False[問答題]254.Mapreduce過程中,默認(rèn)情況下,一個分片就是一個塊,也是一個mapTask.A)trueB)false[問答題]255.ReduceTask在Sort階段,為了將key相同的數(shù)據(jù)聚在一起,Hadoop采用了基于()的策略。[問答題]256.MapReduce程序的運(yùn)行模式主要有兩種,分別是本地運(yùn)行模式和()[問答題]257.大數(shù)據(jù)的四大特征是大量(Volume).()和()價值(Value)。[問答題]258.Flink采用checkpoint機(jī)制保障應(yīng)用程序運(yùn)行中的容錯性。A)TRUEB)FALSE[問答題]259.數(shù)據(jù)科學(xué)領(lǐng)域常用的工具之一--()是統(tǒng)計學(xué)家發(fā)明的語言。[單選題]260.下面哪個程序負(fù)責(zé)HDFS數(shù)據(jù)存儲。A)NameNodeB)JobtrackerC)DatanodeD)secondaryNameNodeE)tasktracker1.答案:C解析:只比較平均值、方差、相關(guān)系數(shù)和回歸方程,無法確定數(shù)據(jù)集是否相同,還需比較Anscombe'squartet。2.答案:C解析:3.答案:D解析:4.答案:A解析:5.答案:C解析:6.答案:A解析:7.答案:C解析:8.答案:C解析:9.答案:C解析:LSTM為長短時記憶網(wǎng)絡(luò),是一種時間遞歸神經(jīng)網(wǎng)絡(luò)。10.答案:A解析:11.答案:D解析:12.答案:C解析:13.答案:A解析:14.答案:A解析:15.答案:B解析:16.答案:C解析:17.答案:A解析:A、record【根據(jù)DDL自動生成它們的編解碼函數(shù)】B、metrics【信息收集,由于監(jiān)控】C、util【工具類】D、tool【提供命令行工具,如distcp(集群間復(fù)制數(shù)據(jù))、archive(打包歸檔)】/frady-p-2704658.html18.答案:D解析:19.答案:D解析:20.答案:C解析:21.答案:C解析:22.答案:D解析:如果在訓(xùn)練時減少選代次數(shù),就能花費(fèi)更少的時間獲得相同的精度,但需要增加學(xué)習(xí)率。23.答案:A解析:采用更大的C,誤分類點(diǎn)的懲罰就更大,因此決策邊界將盡可能完美地分類數(shù)據(jù)。24.答案:D解析:25.答案:B解析:26.答案:B解析:第一數(shù)字定律表示,數(shù)字"1"的使用最多接近三分之一,"2"為17.6%,"3"為12.5%,依次遞減,"9"的頻率是4.6%。27.答案:D解析:28.答案:B解析:29.答案:C解析:30.答案:A解析:31.答案:A解析:32.答案:B解析:33.答案:D解析:欲找到具有最大間隔的劃分超平面,也就是要找到能滿足題中不等式約束的參數(shù)w和b,是一個含d+1個變量的二次規(guī)劃問題。34.答案:A解析:35.答案:B解析:36.答案:A解析:37.答案:B解析:詞袋模型是把每篇文章表示成一個向量。向量中每一維代表一個單詞,其值代表重要程度,重要程度就是用TF-IDF計算的。Word2vec就是詞嵌入模型之一,詞嵌入時將詞向量化的模型的通稱,其核心思想是將每個詞映射成低維--K維空間(通常K為50~300)的一個稠密向量。所以,三者都將文本特征向量化。38.答案:A解析:39.答案:D解析:40.答案:C解析:41.答案:C解析:42.答案:A解析:43.答案:A解析:44.答案:D解析:45.答案:C解析:46.答案:D解析:47.答案:C解析:48.答案:A解析:49.答案:C解析:50.答案:C解析:51.答案:B解析:52.答案:C解析:53.答案:B解析:Numpy數(shù)組輸出時遵循以下原則:從左到右,從上到下。54.答案:A解析:55.答案:D解析:56.答案:D解析:57.答案:C解析:58.答案:D解析:數(shù)據(jù)科學(xué)項(xiàng)目涉及的主要角色有項(xiàng)目發(fā)起人(ProjectSponsor)、項(xiàng)目經(jīng)理(ProjectManager)、客戶(Client)、數(shù)據(jù)科學(xué)家(DataScientist)、數(shù)據(jù)工程師(DataEngineer)、操作員(Operations)等59.答案:C解析:60.答案:C解析:61.答案:C解析:62.答案:C解析:在Spark中引入RDD概念的目的是實(shí)現(xiàn)Spark的并行操作和靈活的容錯能力。63.答案:D解析:64.答案:D解析:欲找到具有最大間隔的劃分超平面,也就是要找到能滿足題中不等式約束的參數(shù)W和B,是一個含d+1個變量的二次規(guī)劃問題。65.答案:C解析:66.答案:C解析:A、B選項(xiàng),散點(diǎn)圖可以在子圖中繪制且x軸刻度可以是文本等非數(shù)值,D選項(xiàng)中箱線圖由于查看數(shù)據(jù)的分布。67.答案:C解析:驗(yàn)證性分析需要事先假設(shè),因數(shù)據(jù)不同復(fù)雜程度也不同,探索性分析一般在前,為驗(yàn)證性分析提供參考。68.答案:D解析:69.答案:C解析:70.答案:B解析:賦值語句不能用于賦值。71.答案:D解析:72.答案:D解析:略。73.答案:D解析:74.答案:A解析:HBase中KeyValue數(shù)據(jù)的存儲格式是HFile。75.答案:D解析:76.答案:B解析:tail()函數(shù)查看最后幾條數(shù)據(jù),類似的,head()查看前幾行數(shù)據(jù),sample()查看隨機(jī)幾行數(shù)據(jù)。77.答案:C解析:78.答案:D解析:79.答案:A解析:80.答案:A解析:MapReduce中的Reduce并不是必須存在的。81.答案:C解析:DataNode負(fù)責(zé)HDFS的數(shù)據(jù)塊存儲。82.答案:B解析:83.答案:A解析:84.答案:C解析:85.答案:A解析:HBase批量導(dǎo)入兩種方式:①利用MapReduce中封裝好的方法。②利用Bulkload。86.答案:A解析:87.答案:C解析:88.答案:A解析:89.答案:A解析:中值濾波法是一種非線性平滑技術(shù),它將每一像素點(diǎn)的灰度值設(shè)置為該點(diǎn)某鄰域窗口內(nèi)的所有像素點(diǎn)灰度值的中值。中值濾波對脈沖噪聲有良好的濾除作用,特別是在濾除噪聲的同時,能夠保護(hù)信號的邊緣,使之不被模糊。90.答案:D解析:91.答案:A解析:92.答案:C解析:93.答案:D解析:94.答案:B解析:spark中常見的窄依賴操作包括map、filer、union、sample等,寬依賴的操作包括reduceByKey、groupByKey、join等。95.答案:A解析:96.答案:A解析:97.答案:B解析:將特征X1擴(kuò)大10倍,它對應(yīng)的回歸系數(shù)將相應(yīng)會減小,但不為0,仍然滿足β的正則化約束,因此可能還包含在模型之中。98.答案:C解析:99.答案:D解析:100.答案:C解析:從可視化處理視角看,可以將數(shù)據(jù)分為定類數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)和定比數(shù)據(jù)4個類型,并采用不同的視覺映射方法。在可視化領(lǐng)域,對數(shù)據(jù)進(jìn)行分類分析是由于不同類型的數(shù)據(jù)可支持的操作類型不同。101.答案:B解析:argmax()的作用是輸出數(shù)組中最大值的索引下標(biāo)。102.答案:A解析:卷積層負(fù)責(zé)提取特征,采樣層負(fù)責(zé)特征選擇,全連接層負(fù)責(zé)分類。103.答案:A解析:104.答案:A解析:105.答案:A解析:106.答案:B解析:107.答案:C解析:108.答案:D解析:109.答案:A解析:110.答案:B解析:111.答案:D解析:112.答案:B解析:Python語言定義的class的初始化函數(shù)的函數(shù)名是init。113.答案:B解析:114.答案:C解析:115.答案:B解析:116.答案:C解析:117.答案:A解析:118.答案:A解析:119.答案:D解析:120.答案:D解析:121.答案:B解析:122.答案:D解析:123.答案:A解析:124.答案:A解析:125.答案:C解析:126.答案:B解析:127.答案:B解析:128.答案:A解析:Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,用來進(jìn)行數(shù)據(jù)提取、轉(zhuǎn)化、加載,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規(guī)模數(shù)據(jù)的機(jī)制。129.答案:A解析:130.答案:A解析:131.答案:D解析:PageRank認(rèn)為,如果A頁面有一個鏈接指向B頁面,那就可以看作是A頁面對B頁面的一種信任或推薦。所以,如果一個頁面的反向鏈接越多,根據(jù)這些鏈接的價值加權(quán)越高,那搜索引擎就會判斷這樣的頁面更為重要。132.答案:D解析:133.答案:A解析:134.答案:A解析:135.答案:C解析:136.答案:D解析:基本元數(shù)據(jù)(Metadata)又稱中介數(shù)據(jù)、中繼數(shù)據(jù),為描述數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)。137.答案:B解析:138.答案:A解析:139.答案:B解析:140.答案:D解析:141.答案:A解析:142.答案:B解析:143.答案:D解析:144.答案:D解析:145.答案:ABCD解析:146.答案:ABC解析:147.答案:ABC解析:148.答案:AD解析:149.答案:BC解析:150.答案:ABCD解析:151.答案:ABD解析:152.答案:BC解析:153.答案:AC解析:154.答案:ABCD解析:155.答案:AB解析:156.答案:ABC解析:157.答案:ABD解析:158.答案:ABD解析:159.答案:BD解析:160.答案:ABCD解析:161.答案:ABCD解析:162.答案:ACD解析:163.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論