大數(shù)據(jù)開發(fā)基礎(chǔ)(習題卷27)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習題卷27)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習題卷27)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習題卷27)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習題卷27)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習題卷27)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.消息系統(tǒng)Kafka如何保證高吞吐能力?A)多訂閱者機制B)Partition機制C)持久性機制D)冗余備份機制答案:B解析:[單選題]2.有關(guān)Hive支持的基本數(shù)據(jù)類型,以下那個是8byte有符合整數(shù)()A)TinyintB)SmalintC)IntD)Bigint答案:D解析:[單選題]3.()是人類獲得信息的最主要途徑.A)味覺B)視覺C)聽覺D)觸覺答案:B解析:[單選題]4.優(yōu)化管理體系,實現(xiàn)管理模式從(___)向(___)轉(zhuǎn)變,向各級組織和業(yè)務(wù)賦能。A)數(shù)據(jù)化,業(yè)務(wù)化B)平臺化,集約化C)條塊化,共享化D)縱向貫通,橫向貫通答案:C解析:[單選題]5.不屬于數(shù)據(jù)脫敏的要求的是()。A)雙向性B)單向性C)無殘留D)易于實現(xiàn)答案:A解析:[單選題]6.各單位應(yīng)對各域間邊界、尤其是互聯(lián)網(wǎng)邊界的數(shù)據(jù)流量,建立健全數(shù)據(jù)監(jiān)測、審計機制及相關(guān)技防措施,審計日志應(yīng)留存不少于()個月A)一B)三C)六D)十二答案:C解析:[單選題]7.以下關(guān)于增益率說法正確的是(___)A)ID3算法使用增益率選擇最優(yōu)劃分屬性B)增益率準則對可取值數(shù)目較多的屬性有所偏好C)屬性a的可能取值數(shù)目越多,IV(a)的值通常越大D)C4.5算法先從候選劃分屬性中找出信息增益低于平均水平的屬性,再從中選擇增益率最高的答案:C解析:[單選題]8.關(guān)于正則化項,說法錯誤的是()A)、在機器學習中,如果單方面追求?誤差函數(shù)?的取值最小,則很容易造成機器學習的?欠擬合?現(xiàn)象。B)、?過擬合(Overfit)?就是目標函數(shù)在已知數(shù)據(jù)(如訓練集)上的擬合性能非常高(如準確率達到100%),而在未知數(shù)據(jù)(如測試集或新數(shù)據(jù))上的擬合準確率低(如準確率低于50%)。C)、為了防止過擬合現(xiàn)象的出現(xiàn),機器學習通常采取?正則化項?。D)、正則化項有L1項(L1Loss)和L2項(L2Loss),二者的區(qū)別在于所涉及的距離計算方法和回歸方法不同答案:A解析:[單選題]9.在其他條件不變的前提下,()容易引起機器學習中的過擬合問題。A)增加訓練集量B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)C)刪除稀疏的特征D)SVM算法中使用高斯核/RBF核代替線性核答案:D解析:神經(jīng)網(wǎng)絡(luò)減少隱藏層節(jié)點,就是在減少參數(shù),只會將訓練誤差變高,不會導致過擬合。D選項中SVM高斯核函數(shù)比線性核函數(shù)模型更復雜,容易過擬合。[單選題]10.下面哪種不屬于數(shù)據(jù)預處理的方法?A)變量代換B)離散化C)聚集D)估計遺漏值答案:D解析:[單選題]11.(__)假設(shè)聚類結(jié)構(gòu)能通過一組原型刻畫,在顯示聚類任務(wù)中極為常用。A)原型聚類B)密度聚類C)層次聚類D)AGNES答案:A解析:[單選題]12.安裝HBase,配置環(huán)境變量,命令是()A)vi/etc/profile.d/mysql-eco.shB)vi/etc/profile.d/hive-eco.shC)vi/etc/profile.d/hbase-eco.shD)vi/etc/profile.d/hadoop-eco.sh答案:D解析:[單選題]13.下列算法中sklearn中未提及的是()。A)K-means聚類算法B)LogisticRegressionC)KNN算法D)Apriori關(guān)聯(lián)規(guī)則算法答案:D解析:關(guān)聯(lián)規(guī)則在Sklearn庫中未涉及。[單選題]14.一般而言,在個體學習器性能相差較大時宜使用(),而在個體學習器性能相近時宜使用()A)簡單平均法,加權(quán)平均法B)加權(quán)平均法,簡單平均法C)簡單平均法,簡單平均法D)加權(quán)平均法,加權(quán)平均法答案:B解析:[單選題]15.()模式,多個Hive用戶通過網(wǎng)絡(luò)連接到數(shù)據(jù)庫。A)單用戶模式B)多用戶模式C)多用戶遠程模式D)單用戶遠程模式答案:B解析:[單選題]16.IDC的定義除了揭示大數(shù)據(jù)傳統(tǒng)3V基本特征,即Volume、Variety和Velocity,還增添了一個新特征是A)量大B)速度快C)應(yīng)用廣D)價值答案:D解析:[單選題]17.任何一個核函數(shù)都隱式地定義了一個()空間。A)希爾伯特空間B)再生希爾伯特空間C)再生核希爾伯特空間D)歐式空間答案:C解析:[單選題]18.x=1defchange(a):x+=1printxchange(x)代碼執(zhí)行結(jié)果是(___)。A)1B)2C)3D)報錯答案:D解析:[單選題]19.以下()文件中主要用來配置ResourceManager,NodeManager的通信端口,web監(jiān)控端口等。A)core-site.xmlB)mapred-site.xmlC)hdfs-site.xmlD)yarn-site.xml答案:D解析:[單選題]20.()是一個觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制產(chǎn)生的。A)邊界點B)質(zhì)心C)離群點D)核心點答案:C解析:[單選題]21.ClusterManager是()A)主節(jié)點B)從節(jié)點C)執(zhí)行器D)上下文答案:A解析:[單選題]22.概率圖模型中最常用的采樣技術(shù)是馬爾科夫鏈蒙特卡洛(MCMC)方法,以下關(guān)于其方法流程有如下內(nèi)容,1.設(shè)法構(gòu)造一條馬爾科夫鏈,使其收斂至平穩(wěn)分布恰為待估計參數(shù)的后驗分布;2.通過馬爾科夫鏈產(chǎn)生符合后驗分布的樣本;3.利用估計結(jié)果構(gòu)造馬爾科夫鏈;4.對樣本進行估計;請選擇正確的排序:A)1,2,3,4B)4,3,1,2C)3,1,2,4D)1,2,4答案:D解析:[單選題]23.大數(shù)據(jù)解決方案中的哪一層可以幫助定義和分類各個必要的組件?A)業(yè)務(wù)層B)網(wǎng)絡(luò)層C)服務(wù)層D)邏輯層答案:D解析:[單選題]24.sparksql開發(fā)的一般過程是A)創(chuàng)建DataFrame->sql開發(fā)->查看結(jié)果/寫表B)創(chuàng)建DataFrame->查看結(jié)果/寫表->sql開發(fā)C)sql開發(fā)->創(chuàng)建DataFrame->查看結(jié)果/寫表D)sql開發(fā)->查看結(jié)果/寫表->創(chuàng)建DataFrame答案:A解析:[單選題]25.對ElasticSearch描述正確的是?A)客戶端必須把索引請求發(fā)給EsMasterB)客戶端必須把索引請求發(fā)給shardC)客戶端必須把索引請求發(fā)給EsNodeD)客戶端必須把索引請求發(fā)給指定的EsNode答案:A解析:[單選題]26.Hive創(chuàng)建內(nèi)部表之后,表的?Table_type?屬性的值為()A)Managed_tableB)Manag_tableC)Managed_dataD)以上都不對答案:A解析:[單選題]27.計算之樹中,通用計算環(huán)境的演化思維是怎么概括的()A)元器件--由電子管、晶體管到集成電路、大規(guī)模集成電路和超大規(guī)模集成電路B)程序執(zhí)行環(huán)境--由CPU-內(nèi)存環(huán)境,到CPU-存儲體系環(huán)境,到多CPU-多存儲器環(huán)境,再到云計算虛擬存儲環(huán)境C)網(wǎng)絡(luò)運行環(huán)境--由個人計算機到局域網(wǎng)、廣域網(wǎng)再到InternetD)以上三個說法都不對答案:B解析:[單選題]28.可分解為偏差、方差與噪聲之和的是()。A)訓練誤差(trainingerror)B)經(jīng)驗誤差(empiricalerror)C)均方誤差(meansquarederror)D)泛化誤差(generalizationerror)答案:D解析:泛化誤差可分解為偏差、方差與噪聲之和。[單選題]29.OTS的單表可以存儲規(guī)模較大的數(shù)據(jù)。目前單表存儲的限制為:()。A)10TB)100TC)沒有上限D(zhuǎn))1T答案:C解析:[單選題]30.下面關(guān)于數(shù)據(jù)科學與統(tǒng)計學的關(guān)系描述不正確的有(__)。A)數(shù)據(jù)科學是統(tǒng)計學的主要基礎(chǔ)理論之一B)數(shù)據(jù)科學的工具往往來自于統(tǒng)計學C)統(tǒng)計學家在數(shù)據(jù)科學的發(fā)展中做出過突出貢獻D)第一篇以?數(shù)據(jù)科學?為標題的論文是由統(tǒng)計學家完成的答案:A解析:[單選題]31.關(guān)于SOM神經(jīng)網(wǎng)絡(luò)的描述,錯誤的是()A)一種競爭學習型的無監(jiān)督神經(jīng)網(wǎng)絡(luò)B)將高雄輸入數(shù)據(jù)映射到低維空間,保持輸入數(shù)據(jù)在高維空間的拓撲結(jié)構(gòu)C)SOM尋優(yōu)目標為每個輸出神經(jīng)元找到合適的權(quán)重D)輸出層神經(jīng)元以矩陣方式排列在二維空間答案:C解析:[單選題]32.有人發(fā)現(xiàn)統(tǒng)計數(shù)字會撒謊,產(chǎn)生這種現(xiàn)象的原因不包括()。A)采集的數(shù)據(jù)不完整B)存儲的數(shù)據(jù)被篡改C)數(shù)據(jù)內(nèi)容更新慢D)可視化技術(shù)效果單一答案:D解析:[單選題]33.下面這條GaussDB200語句?calldbms_erval(1,'sysdate+1.0/24');"的意思是A)修改Job1的Interva為每隔24小時執(zhí)行一次。B)修改Job1的Interval為每隔1小時執(zhí)行一次。C)修改Job1的Interval為每隔1/24小時執(zhí)行一次。D)修改Job1的Interval為每隔24分鐘執(zhí)行一次。答案:B解析:[單選題]34.在Flink框架中,下列()是流處理和批處理的計算引擎。A)standaloneB)RuntimeC)FlinkCoreD)DataStream答案:B解析:[單選題]35.下列有關(guān)OGG的描述錯誤的是()。A)OGG可以實現(xiàn)一對一、廣播、聚合、級聯(lián)等多種靈活的拓撲結(jié)構(gòu)B)OGG管理維護相對直觀,使用自帶的管理工具,能夠?qū)ζ溥M行圖形化界面的管理C)OGG支持異構(gòu)復制D)OGG不支持異構(gòu)復制答案:D解析:[單選題]36.下列關(guān)于模型能力(modelcapacity指神經(jīng)網(wǎng)絡(luò)模型能擬合復雜函數(shù)的能力)的描述,正確的是()A)隱藏層層數(shù)增加,模型能力增加B)Dropout的比例增加,模型能力增加C)學習率增加,模型能力增加D)都不正確答案:A解析:[單選題]37.HBase依賴()提供消息通信機制A)ZookeeperB)ChubbyC)RPCD)Socket答案:A解析:[單選題]38.機器學習研究的主要內(nèi)容是在計算機上從數(shù)據(jù)中產(chǎn)生()的算法,即學習算法。A)模型B)樣本C)規(guī)律D)示例答案:A解析:[單選題]39.在分布式環(huán)境系統(tǒng)中,引入()可以防止內(nèi)存數(shù)據(jù)就會丟失A)HLogB)HRegionC)ZooKeeperD)Server答案:A解析:[單選題]40.下面關(guān)于數(shù)據(jù)科學與機器學習的關(guān)系描述不正確的有(__)。A)機器學習為數(shù)據(jù)科學中充分發(fā)揮計算機的自動數(shù)據(jù)處理能力提供了重要的手段B)機器學習是數(shù)據(jù)科學的主要理論基礎(chǔ)之一C)機器學習為數(shù)據(jù)科學中擴展人的數(shù)據(jù)處理能力提供了重要的手段D)機器學習的基礎(chǔ)理論包含數(shù)據(jù)科學答案:D解析:[單選題]41.下列關(guān)于軟支持向量機的說法正確的是(__)。A)軟間隔支持向量機不可應(yīng)用拉格朗日乘子法求解B)軟間隔支持向量機和硬間隔支持向量機完全相同C)軟間隔支持向量機只能使用Hinge損失函數(shù)D)軟間隔支持向量機的目標函數(shù)仍是一個二次規(guī)劃問題答案:D解析:[單選題]42.在回歸分析中,說法正確的是()。A)解釋變量和被解釋變量都是隨機變量B)解釋變量為非隨機變量,被解釋變量為隨機變量C)解釋變量和被解釋變量都為非隨機變量D)解釋變量為隨機變量,被解釋變量為非隨機變量答案:B解析:[單選題]43.以下()組件負責接收來自應(yīng)用的訪問請求,并向客戶端返回執(zhí)行結(jié)果。A)GTMB)WLMC)CND)DN答案:C解析:[單選題]44.將從源數(shù)據(jù)源獲取的數(shù)據(jù)按照業(yè)務(wù)需求,轉(zhuǎn)換成目的數(shù)據(jù)源要求的形式,并對錯誤、不一致的數(shù)據(jù)進行清洗和加工這一過程稱為()。A)數(shù)據(jù)抽取B)數(shù)據(jù)轉(zhuǎn)換C)數(shù)據(jù)加載D)數(shù)據(jù)存儲答案:B解析:[單選題]45.OLAM技術(shù)一般簡稱為?數(shù)據(jù)聯(lián)機分析挖掘?,下面說法正確的是:A)OLAP和OLAM都基于客戶機/服務(wù)器模式,只有后者有與用戶的交互性B)由于OLAM的立方體和用于OLAP的立方體有本質(zhì)的區(qū)別C)基于WEB的OLAM是WEB技術(shù)與OLAM技術(shù)的結(jié)合D)OLAM服務(wù)器通過用戶圖形借口接收用戶的分析指令,在元數(shù)據(jù)的知道下,對超級立方體作一定的操作答案:D解析:[單選題]46.()是指制定數(shù)據(jù)資產(chǎn)發(fā)展戰(zhàn)略、規(guī)劃和年度計劃并組織實施。A)數(shù)據(jù)資產(chǎn)規(guī)劃與計劃管理B)發(fā)展戰(zhàn)略管理C)數(shù)據(jù)質(zhì)量管理D)年度使用計劃管理答案:A解析:[單選題]47.批處理常用的組件不包括哪個?A)StormB)HiveC)FlumeD)Spark答案:A解析:[單選題]48.關(guān)于Hadoop單機模式和偽分布式模式的說法,正確的是A)兩者都起守護進程,且守護進程運行在一臺機器上B)單機模式不使用HDFS,但加載守護進程C)兩者都不與守護進程交互,避免復雜性D)后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況答案:D解析:hadoop配置A.兩者都起守護進程,且守護進程運行在一臺機器上【因為不需要與其他節(jié)點交互,單機模式不加載守護進程】B.單機模式不使用HDFS,但加載守護進程【單機模式不使用HDFS,不加載守護進程】C.兩者都不與守護進程交互,避免復雜性【偽分布式模式在單機模式之上允許檢查內(nèi)存使用情況,HDFS輸入輸出,以及其他的守護進程交互】D.后者比前者增加了HDFS輸入輸出以及可檢查內(nèi)存使用情況【對的對的】[單選題]49.用決策樹法訓練大量數(shù)據(jù)集時,()最節(jié)約時間。A)增加樹的深度B)增加學習率C)減少數(shù)的深度D)減少樹的個數(shù)答案:C解析:減少樹的深度,相當于加入了一個正則化項,可以降低模型復雜度。[單選題]50.執(zhí)行如下代碼:importtimeprint(time.time())以下選項中描述錯誤的是A)time庫是Python的標準庫B)可使用time.ctime(),顯示為更可讀的形式C)time.sleep(5)推遲調(diào)用線程的運行,單位為毫秒D)輸出自1970年1月1日00:00:00AM以來的秒數(shù)答案:C解析:[單選題]51.一個關(guān)系只有一個()A)外碼B)候選碼C)超碼D)主碼答案:D解析:[單選題]52.下列描述說法錯誤的是?()A)SecureCRT是一款支持SSH的終端仿真程序,它能夠在Windows操作系統(tǒng)上遠程連接Linux服務(wù)器執(zhí)行操作。B)Hadoop是一個用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及Windows系統(tǒng)上進行安裝使用。C)VMwareWorkstation是一款虛擬計算機的軟件,用戶可以在單一的桌面上同時操作不同的操作系統(tǒng)。D)SSH是一個軟件,專為遠程登錄會話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。答案:D解析:[單選題]53.Sklearn庫中對數(shù)據(jù)進行預處理和規(guī)范化主要依靠()模塊。A)neighbors模塊B)preprocessing模塊C)pipeline模塊D)datasets模塊315答案:B解析:sklearn.preprocessing模塊包括縮放、居中、歸一化、二值化和插補方法,主要是對數(shù)據(jù)進行預處理和規(guī)范化。[單選題]54.客戶端首次查詢HBase數(shù)據(jù)庫時,首先需要從哪個表開始查找()A)METAB)ROOTC)用戶表D)信息表答案:B解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.我們想要減少數(shù)據(jù)集中的特征數(shù)即降維,以下方案合適的是()。A)使用前向特征選擇方法B)使用后向特征排除方法C)我們先,把所有特征都使用,去訓練一個模型,得到測試集上的表現(xiàn)。然后我們?nèi)サ粢粋€特征,再去訓練,用交叉驗證看看測試集上的表現(xiàn)。如果表現(xiàn)比原來還要好,我們可以去除這個特征D)查看相關(guān)性表,去除相關(guān)性最高的一些特征答案:ABCD解析:前向特征選擇方法和后向特征排除方法是特征選擇的常用方法。如果前向特征選擇方法和后向特征排除方法在大數(shù)據(jù)上不活用,可以用這里C中方法。用相關(guān)性的度量去刪除多余特征也是一個可行的方法。[多選題]56.下面有關(guān)Mahout組件的功能表達正確的是()。A)推薦引擎B)聚類C)分類D)查詢答案:ABC解析:[多選題]57.Python非常重視代碼的可讀性,對代碼布局和排版有非常嚴格的要求。以下關(guān)于Python代碼編寫說法正確的是()。A)字符串加字符串程序運行后會出錯。B)盡量不寫過長的語句,以保證代碼具有較好的可讀性。C)如果在正確的位置輸入冒號,下一行會自動進行縮進。D)等號(=)是賦值的意思,左邊是值,右邊是變量。答案:BC解析:[多選題]58.在哪些場景下不能使用HBase作為存儲系統(tǒng)()?A)需要ACID特性B)海量數(shù)據(jù)存儲C)主鍵查詢D)大文件,視頻等答案:AD解析:[多選題]59.關(guān)于ADS的ECU說法()是正確的。A)ECU的型號在DB創(chuàng)建后不可更改B)資源計量的最小單位C)ECU數(shù)量可以在使用中擴容或者縮容D)ECU數(shù)量變化是瞬時的同步操作。答案:ABC解析:[多選題]60.Kafka的特點包括()。A)分布式B)消息持久化C)高吞吐D)支持消息隨機讀取答案:ABC解析:[多選題]61.數(shù)據(jù)資產(chǎn)維護是指為保證數(shù)據(jù)質(zhì)量,對數(shù)據(jù)進行()等處理的過程。A)更正B)刪除C)補充錄入D)查詢答案:ABC解析:[多選題]62.在Hive架構(gòu)中,支持的數(shù)據(jù)操作有()。A)插入B)查詢C)刪除D)分析答案:BD解析:Hive提供簡單的HiveQL查詢、分析功能,可以較好地滿足基于數(shù)據(jù)倉庫的統(tǒng)計分析需要。[多選題]63.Maxcomputetunnel命令目前支持的操作包括:()。A)mergeB)purgeC)uploadD)list答案:BC解析:[多選題]64.HBaseHMaster主要負責什么?A)表的增刪改查B)Region分布調(diào)整C)用戶數(shù)據(jù)讀寫D)Regionserver負均衡答案:ABD解析:[多選題]65.下面關(guān)于flink窗口的描述錯誤的是A)滾動窗口在時間上是重疊的B)滾動窗口在時間上是不重疊的C)滑動動窗口之間時間點不存在重疊D)滑動窗口之間時間點存在重疊答案:AC解析:[多選題]66.Spark的部署模式包括()。A)本地模式B)Standalone模式C)SparkOnYARND)SparkonMesos答案:ABCD解析:[多選題]67.建立大數(shù)據(jù)需要設(shè)計一個什么樣的大型系統(tǒng)A)能夠把應(yīng)用放到合適的平臺上B)能夠開發(fā)出相應(yīng)應(yīng)用C)能夠處理數(shù)據(jù)D)能夠存儲數(shù)據(jù)答案:ABCD解析:[多選題]68.CNN能應(yīng)用于playingGo的原因描述正確的是?A)第一層hiddenlayer用于檢測圖像的pattern,而大部分patter通常比整張圖像的大小要小,對于一個neuron來說不用去看整張圖像來檢測patternB)同樣pattern可能出現(xiàn)在圖像的不同區(qū)域,而這些pattern代表同樣的含義,可以共用同一個neuron同一組參數(shù)C)一幅圖像可以做subsampling來減少圖片的大小,從而減少參數(shù)D)對圖片像素點進行行列抽取答案:AB解析:[多選題]69.如圖所示,Flink流式理接口DataStreamAPI支持的語言包括?A)JavaB)C語言C)ScalaD)Python答案:ACD解析:[多選題]70.下列說法正確的是(___)。A)Windows系統(tǒng)默認未安裝Python,但有必要檢查系統(tǒng)是否安裝了它B)在Python2.7中,print是函數(shù)C)Python3沒有內(nèi)置函數(shù)unicode()D)print不應(yīng)用作變量名答案:ACD解析:[多選題]71.Oracle數(shù)據(jù)庫中事務(wù)的特性包括()。A)原子性B)一致性C)隔離性D)持久性答案:ABCD解析:[多選題]72.下列關(guān)于文本圖的說法中,正確的有()A)文本圖通常適用于需要展示關(guān)鍵詞、突出重點的業(yè)務(wù)場景B)可以通過為文本圖中的文本添加顏色、設(shè)置大小等方式達到強調(diào)的作用C)文本圖以其獨有的?高級感?,近年來在實務(wù)中越來越多地被使用到D)文本圖可以代替熱力點圖使用答案:ABC解析:[多選題]73.Loader可以實現(xiàn)以下哪些轉(zhuǎn)換規(guī)則?A)長整型時間轉(zhuǎn)換B)增量轉(zhuǎn)換C)拼接轉(zhuǎn)換D)空值轉(zhuǎn)換答案:ABCD解析:[多選題]74.大數(shù)據(jù)作為一種數(shù)據(jù)集合,它的含義包括A)數(shù)據(jù)很大B)很有價值C)構(gòu)成復雜D)變化很快答案:ACD解析:[多選題]75.以下屬于圖像平滑算法的是()。A)中值濾波B)均值濾波C)鄰域平均法D)拉普拉斯濾波器答案:ABC解析:[多選題]76.關(guān)于Maxcompute中小文件的說法,正確的是:()。A)在reduce計算過程或者實時tunnel數(shù)據(jù)采集過程,會產(chǎn)生大量小文件B)小文件越多,會造成浪費資源,影響整體的執(zhí)行性能,并且影響磁盤空間的利用率C)目前提供兩種可供選擇的小文件合并的方法:ALTER合并模式和SQL合并模式D)大小小于盤古文件系統(tǒng)中的塊BLOCK大小的文件,稱之為小文件答案:AB解析:[多選題]77.請找出下列對字典操作正確的選項()dict={?name?:?python?,?age?:17,?class?:?first?}A)dict[?age?]=18更新字典age的值B)dict[?scholl?]=?云課堂?添加信息schollC)deldict[?name?]刪除?name?一個元素值D)dict[?first?]=?class?取字典的值答案:ABC解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.MRS的安全模式一般是用于生產(chǎn)環(huán)境。A)正確B)錯誤答案:對解析:[判斷題]79.因不同的數(shù)據(jù)類型存儲的空間大小不一樣,所以在選擇數(shù)據(jù)類型時,只需考慮數(shù)據(jù)類型損耗的存儲空間大小。A)正確B)錯誤答案:錯解析:[判斷題]80.已知字典x={i:str(i+3)foriinrange(3)},那么表達式''A)正確B)錯誤答案:對解析:[判斷題]81.數(shù)據(jù)挖掘的目標不在于數(shù)據(jù)采集策略,而在于對于已經(jīng)存在的數(shù)據(jù)進行模式的發(fā)掘。A)正確B)錯誤答案:對解析:[判斷題]82.在tryA)正確B)錯誤答案:錯解析:[判斷題]83.已知f=lambdan:len(bin(n)[bin(n)A)正確B)錯誤答案:錯解析:[判斷題]84.由于Combiner組件不允許改變業(yè)務(wù)邏輯,所以無論調(diào)用多少次Combiner,Reduce的輸出結(jié)果都是一樣的。A)正確B)錯誤答案:對解析:由于Combiner組件不允許改變業(yè)務(wù)邏輯,所以無論調(diào)用多少次Combiner,Reduce的輸出結(jié)果都是一樣的。[判斷題]85.BINARY關(guān)鍵字修飾的字符串比較時嚴格區(qū)分大小寫和空格。--A)正確B)錯誤答案:對解析:[判斷題]86.Flume的perties配置文件中可以配置多個channle來傳輸數(shù)據(jù)。[]*A)正確B)錯誤答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論