大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷48)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷48)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷48)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷48)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷48)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷48)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共54題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.以下哪項不屬于Apache頂級項目?A)FlinkB)StormC)EclipseD)Spark答案:C解析:[單選題]2.()算法是一種最有影響的挖掘關(guān)聯(lián)規(guī)則頻繁項目集的算法。A)FP-growthB)EClatC)聚類D)Apdori答案:D解析:Apdori算法是一種最有影響的挖掘關(guān)聯(lián)規(guī)則頻繁項目集的算法。[單選題]3.刪除一個HBase表分為兩步,第一步()表,第二步()表。A)disabled,dropB)disable,dropC)disabled,deleteD)disable,delete答案:B解析:[單選題]4.2015年,美國2150萬個社保賬號被黑客盜取。該事件反映出的問題是()。A)大數(shù)據(jù)時代個人信息安全成為關(guān)注熱點B)美國政府的信息安全技術(shù)水平低C)黑客只對個人社保賬號感興趣D)美國公民的信息安全意識普遍不高答案:A解析:[單選題]5.Pandas在執(zhí)行算術(shù)運算時,沒有對齊的位置會使用()進行補齊。A)NullB)0C)NaND)null_values答案:B解析:[單選題]6.下面哪種結(jié)果不是利用機器學(xué)習(xí)算法從數(shù)據(jù)中得到的?()A)回歸模型B)規(guī)則C)常識D)神經(jīng)網(wǎng)絡(luò)答案:C解析:[單選題]7.HDFS的錯誤檢測不包括()。A)NameNode檢測B)DataNode檢測C)數(shù)據(jù)錯誤檢測D)冗余檢測答案:D解析:[單選題]8.以下關(guān)于Hive內(nèi)置函數(shù)描述正確的是()。A)descfunctionsupper:查看系統(tǒng)自帶的函數(shù)B)to_date()獲取當(dāng)前日期C)substr):求字符串長度D)trim0:去除空字符串答案:D解析:[單選題]9.以下程序的輸出結(jié)果是:L1=['abc',['123','456']]L2=['1','2','3']print(L1>L2)A)FalseB)TypeError:'>'notsupportedbetweeninstancesof'list'and'str'C)1D)True答案:D解析:[單選題]10.運營人員為了搞促銷,需要找出目標(biāo)客戶名單,這批客戶的信息存儲在大數(shù)據(jù)計算服務(wù)(MaxCompute,原ODPS)的user表中,并且用戶名字段username中包含?vip?字樣,通過執(zhí)行SQL語句()可以找出這批客戶。A)select*fromuserwhereusernamecontains(?vip?)B)select*fromuserwhereusername=?vip?C)select*fromuserwhereusernamelike?*vip*?D)select*fromuserwhereusernamelike?%vip%?答案:D解析:[單選題]11.某電商網(wǎng)站想要實現(xiàn)熱銷商品的實時TopN排名,可以使用哪種技術(shù)實現(xiàn)?A)Elasticsearch的快速檢索B)HBase的rowkey索引C)Hive的關(guān)聯(lián)查詢分析D)Redis的排序計算答案:D解析:[單選題]12.我們想在大數(shù)據(jù)集上訓(xùn)練決策樹,為了使用較少時間,我們可以A)增加樹的深度B)增加學(xué)習(xí)率(learningrate)C)減少樹的深度D)減少樹的數(shù)量答案:C解析:[單選題]13.下面關(guān)于網(wǎng)絡(luò)爬蟲的描述錯誤的是:()A)網(wǎng)絡(luò)爬蟲是一個自動提取網(wǎng)頁的程序B)為搜索引擎從萬維網(wǎng)上下載網(wǎng)頁,是搜索引擎的重要組成部分C)爬蟲從一個或若干個初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當(dāng)前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的一定停止條件D)網(wǎng)絡(luò)爬蟲的行為和人們訪問網(wǎng)站的行為是完全不同的答案:D解析:[單選題]14.AGNES是一種采用(__)策略的層次聚類算法。A)自頂向下B)自底向上C)自左至右D)自右至左答案:B解析:[單選題]15.對于ADS,()說法不正確。A)ADS表存在主鍵,即可根據(jù)主鍵使用delete刪除紀(jì)錄B)普通表分區(qū)列如果是字符串型,則不支持普通表之間的joinC)自查詢之間不支持joinD)ADS通過UNION(ALL)各個分區(qū)內(nèi)的查詢結(jié)果實現(xiàn)自查詢答案:A解析:[單選題]16.關(guān)于OTS中分片的說法正確的是:()。A)一個分片可能包含多個分片鍵B)同一個分片上的紀(jì)錄擁有相同的分片鍵C)單個分片數(shù)據(jù)量最大不能超過1TD)相同分片鍵的紀(jì)錄不一定在同一分片上答案:A解析:[單選題]17.聚類算法的性能度量可稱為()A)密度估計B)異常檢測C)有效性指標(biāo)D)分布結(jié)構(gòu)答案:C解析:[單選題]18.loader頁面是基于開源()的圖形化數(shù)據(jù)遷移工具。A)HueB)SqoopC)KettleD)Hadoop答案:B解析:[單選題]19.DAGScheduler負責(zé)()級的調(diào)度,主要是將DAG切分成若干()。A)Stage,StagesB)Stage,TasksC)Task,StagesD)Task,Tasks答案:A解析:[單選題]20.對線下零售而言,做好大數(shù)據(jù)分析應(yīng)用的前提是。A)增加統(tǒng)計種類B)擴大營業(yè)面積C)增加數(shù)據(jù)來源D)開展優(yōu)惠促銷答案:C解析:[單選題]21.Concatenate函數(shù)的功能是()A)把一個字符串按照指定字符串分隔成數(shù)組B)提取出和正則表達式匹配的所有字符串組成數(shù)組C)從一個字符串中截取特定長度的子串D)把多個字符串按次序連接成一個字符答案:D解析:[單選題]22.哪個不是Flume的channel類型?A)MemoryChannelB)FileChannelC)JDBCCHannelD)HDFSChannel答案:D解析:[單選題]23.下列哪個不屬于可視化工具?()A)GoogleB)D3C)Visual.lyD)Spark答案:D解析:[單選題]24.下面不屬于數(shù)據(jù)科學(xué)主要研究內(nèi)容的有(__)。A)基礎(chǔ)理論B)數(shù)據(jù)管理C)數(shù)據(jù)分析D)數(shù)據(jù)商務(wù)答案:D解析:[單選題]25.以下對Hadoop的說法錯誤的是()。A)Hadoop是基于Java語言開發(fā)的,只支持Java語言編程B)Hadoop2.0增加了NameNodeHA和Wire-compatibility兩個重大特性C)HadoopMapReduce是針對谷歌MapReduce的開源實現(xiàn),通常用于大規(guī)模數(shù)據(jù)集的并行計算D)Hadoop的核心是HDFS和MapReduce答案:A解析:[單選題]26.第一次信息化浪潮主要解決什么問題?A)信息傳輸B)信息處理C)信息轉(zhuǎn)換D)信息爆炸答案:B解析:[單選題]27.下列關(guān)于集成學(xué)習(xí)模型中弱學(xué)習(xí)者的描述錯誤的是()。A)經(jīng)常不會過擬合B)通常帶有高偏差,所以其并不能解決復(fù)雜學(xué)習(xí)問題C)通常會過擬合D)通常擁有低方差答案:C解析:弱學(xué)習(xí)者是問題的特定部分。所以他們通常不會過擬合,這也就意味著弱學(xué)習(xí)者通常擁有低方差和高偏差。[單選題]28.已知初始問題的描述,通過一系列變換把此問題最終變?yōu)橐粋€子問題集合;這些子問題的解可以直接得到,從而解決了初始問題。這是知識表示法叫()A)狀態(tài)空間法B)問題歸約法C)謂詞邏輯法D)語義網(wǎng)絡(luò)法答案:B解析:[單選題]29.IBM在3V的基礎(chǔ)上又歸納總結(jié)了第4個V是指A)真實和準(zhǔn)確B)無時不在C)巨量D)極速答案:A解析:[單選題]30.大數(shù)據(jù)審計旨在將?數(shù)據(jù)孤島型、業(yè)務(wù)封閉型、模式單一型?向?()一體化、業(yè)務(wù)一體化、模式一體化?的方向推進發(fā)展A)數(shù)據(jù)B)信息C)科技D)方式答案:A解析:[單選題]31.在Spark技術(shù)中,RDD實現(xiàn)了用戶的邏輯,而(__)是Storage模塊與其他模塊交互最主要的類,它提供了讀和寫B(tài)lock的接口。A)org.apache.spark.storage.BlockB)org.spark.storage.BlockManagerC)org.apache.spark.BlockManagerD)org.apache.spark.storage.BlockManager答案:D解析:[單選題]32.關(guān)于?from-import?形式,以下錯誤的選項是()。A)從模塊名導(dǎo)入標(biāo)識符B)這種導(dǎo)入形式可以防止名稱沖突C)被導(dǎo)入模塊的命名空間是模塊導(dǎo)入的一部分D)模塊中的標(biāo)識符可直接訪問為標(biāo)識符答案:B解析:[單選題]33.關(guān)于Kafka磁盤容量不足的告警,對于可能的原因以下分析不正確的是?A)業(yè)務(wù)規(guī)劃不合理,導(dǎo)致數(shù)據(jù)分配不均,使部分磁盤達到使用率上限B)數(shù)據(jù)保存時間配置過長,數(shù)據(jù)累計達到磁盤使用率上限C)Broker節(jié)點故障導(dǎo)致D)用于存儲Kafka數(shù)據(jù)的磁盤配置答案:如磁盤數(shù)目,磁盤大小等,無法滿足當(dāng)前業(yè)務(wù)數(shù)據(jù)流量,導(dǎo)致磁盤使用率達到上限答案:C解析:[單選題]34.若要在基本表S中增加一列CN(課程名),可用()A)ADDTABLESALTER(CNCHAR(8))B)ALTERTABLESADD(CNCHAR(8))C)ADDTABLES(CNCHAR(8))D)ALTERTABLES(ADDCNCHAR(8))答案:B解析:[單選題]35.關(guān)于概率圖模型下列敘述,正確的是:A)貝葉斯網(wǎng)絡(luò)是有向圖模型,馬爾可夫網(wǎng)絡(luò)是無向圖模型B)貝葉斯網(wǎng)絡(luò)是無向圖模型,馬爾可夫網(wǎng)絡(luò)是有向圖模型C)貝葉斯網(wǎng)絡(luò)是有向圖模型,馬爾可夫網(wǎng)絡(luò)是有向圖模型D)貝葉斯網(wǎng)絡(luò)是無向圖模型,馬爾可夫網(wǎng)絡(luò)是無向圖模型答案:A解析:[單選題]36.?神威-太湖之光?1分鐘算力,相當(dāng)于全球72億人同時用計算器不間斷計算:A)2年B)32年C)432年D)5432年答案:B解析:[單選題]37.以下關(guān)于歸納偏好描述錯誤的是(___)。A)不是每一個有效的機器學(xué)習(xí)算法必有其歸納偏好B)歸納偏好可看做學(xué)習(xí)算法自身在一個可能很龐大的假設(shè)空間中對假設(shè)進行選擇的啟發(fā)式或?價值觀?C)歸納偏好對應(yīng)了學(xué)習(xí)算法本身所做出的的關(guān)于?什么樣的模型更好?的假設(shè)D)如果沒有歸納偏好,學(xué)習(xí)算法在每次進行預(yù)測時將隨機抽選訓(xùn)練集上的等效假設(shè)答案:A解析:[單選題]38.當(dāng)上傳本地文件到QuickBI中做展現(xiàn)時,數(shù)據(jù)被保存到了()。A)QuickB自帶的探索空間B)QuickBI自帶的MaxComputeC)AnalyticDBD)客戶端本地緩存答案:A解析:[單選題]39.某大數(shù)據(jù)業(yè)務(wù)人員對某些數(shù)據(jù)創(chuàng)建Hive表結(jié)構(gòu),其中某個數(shù)據(jù)為時間類型yyyyMMdd,那么可以使用以下哪一項作為字段類型?A)varcahrB)stringC)doubleD)int答案:B解析:[單選題]40.給出如下代碼:DictColor={"seashell":"海貝色","gold":"金色","pink":"粉紅色","brown":"棕色","purple":"紫色","tomato":"西紅柿色"}以下選項中能輸出?海貝色?的是A)print(DictColor.keys())B)print(DictColor["海貝色"])C)print(DictColor.values())D)print(DictColor["seashell"])答案:D解析:[單選題]41.RDD的()算子會會觸發(fā)執(zhí)行,向Spark引擎提交,生成一個job,并返回相應(yīng)的結(jié)果。A)創(chuàng)建B)轉(zhuǎn)換C)控制D)執(zhí)行答案:D解析:[單選題]42.下列關(guān)于數(shù)據(jù)交易市場的說法中,錯誤的是()。A)數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物B)商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場C)數(shù)據(jù)交易市場通過生產(chǎn)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助D)數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物答案:C解析:數(shù)據(jù)交易市場不生產(chǎn)數(shù)據(jù)。[單選題]43.某項目小組接到一個大數(shù)據(jù)實時分析項目,且對實時性要求很高。請問以下哪種大數(shù)據(jù)計算框架最合適?A)FlinkB)MapReduceC)HBaseD)Spark答案:A解析:[單選題]44.DRDS和普通的關(guān)系型數(shù)據(jù)庫(如MySQL)相比,SQL優(yōu)化要特別考慮的是:()。A)磁盤IO開銷B)內(nèi)存開銷C)并發(fā)度D)網(wǎng)絡(luò)IO開銷答案:D解析:[單選題]45.大數(shù)據(jù)計算服務(wù)中的日志表log是一張分區(qū)表,分區(qū)鍵是dt,每天產(chǎn)生一個分區(qū)用于存儲當(dāng)天新增的數(shù)據(jù),現(xiàn)在共有dt=?20160101?至dt=?20160131?共31個分區(qū)的數(shù)據(jù),為了刪除20160101當(dāng)天新增的數(shù)據(jù),可以通過()方式實現(xiàn)。A)deletefromlogwheredt=?20160101?B)altertablelogdroppartition(dt=?20160101?)C)truncatetablewheredt=?20160101?D)droppartitionlog(dt=?20160101?)答案:B解析:[單選題]46.下列哪些不是目前機器學(xué)習(xí)所面臨的問題是()。A)測試集的規(guī)模B)維度災(zāi)難C)特征工程D)過擬合答案:A解析:目前,機器學(xué)習(xí)領(lǐng)域所面臨的主要挑戰(zhàn)包括過擬合(Overfiting)、維度災(zāi)難(CurseofDimensionality)、特征工程(FeatureEngineering)、算法的可擴展性(Scalability)和模型集成。[單選題]47.關(guān)于隨機森林和AdaBoost說法不正確的是A)和AdaBoost相比,隨機森林對錯誤和離群點更魯棒B)隨機森林準(zhǔn)確率不依賴于個體分類器的實例和他們之間的依賴性C)隨機森林對每次劃分所考慮的屬性數(shù)很敏感D)AdaBoost初始時每個訓(xùn)練元組被賦予相等的權(quán)重答案:B解析:[單選題]48.Flume的基礎(chǔ)架構(gòu)不包含以下哪部分?A)ChannelB)BrokerC)SourceD)Sink答案:B解析:[單選題]49.tuple函數(shù)可以達到的效果是()。A)計算元組元素個數(shù)B)返回元組中元素最大值C)將元組轉(zhuǎn)換成列表D)將列表轉(zhuǎn)換成元組答案:D解析:tuple函數(shù)轉(zhuǎn)換成元組。[單選題]50.()參數(shù)的增加可能會造成隨機森林?jǐn)?shù)據(jù)過擬合。A)樹的數(shù)量B)樹的深度C)樣本數(shù)據(jù)份數(shù)D)葉數(shù)據(jù)尺寸答案:B解析:[單選題]51.對于數(shù)據(jù)3,3,2,3,6,3,10,3,6,3,2,得出以下結(jié)論:①這組數(shù)據(jù)的眾數(shù)是3;②這組數(shù)據(jù)的眾數(shù)與中位數(shù)的數(shù)值不相等;③這組數(shù)據(jù)的中位數(shù)與平均數(shù)的數(shù)值不相等;④這組數(shù)據(jù)的平均數(shù)與眾數(shù)的數(shù)值相等。其中正確結(jié)論的個數(shù)為()。A)1B)2C)3D)4答案:B解析:眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)最多的變量值;中位數(shù)是指一組數(shù)據(jù)排序后處于中間位置的變量值,均值是各數(shù)值加總求和再除以總的個數(shù)。此題中眾數(shù)為3,中位數(shù)為3,平均值為4,故①和③正確。[單選題]52.若是想要實現(xiàn)自定義分組規(guī)則,則需要自定義Class類,然后繼承()類。A)WritableComparatorB)ComparatorC)WritableD)WritableComparable答案:A解析:[單選題]53.下列描述中不屬于情感分析的具體任務(wù)是()。A)情感分類B)觀點抽取C)觀點問答D)段落匹配答案:D解析:情感分析又稱意見挖掘、傾向性分析等,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,包括情感分類、觀點抽取、觀點問答等,沒有段落匹配。[單選題]54.()使用目錄節(jié)點樹的方式(類似文件系統(tǒng))存儲數(shù)據(jù),主要用途是維護和監(jiān)聽所存數(shù)據(jù)的狀態(tài)變化,以實現(xiàn)對集群的管理。A)ZookeeperB)HBaseC)HiveD)Sqoop答案:A解析:第2部分:多項選擇題,共26題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.通用的概率分布類封裝在(__)。A)continuousrandomvariablesB)normC)discreterandomvariablesD)gamma答案:AC解析:[多選題]56.關(guān)于表連接算子的說法誤的是?A)默認情況下,執(zhí)行效率來說HashJoin最高。B)算子的選擇是SQL根據(jù)邏輯自行選擇的,與人為無關(guān)。C)表連接算子主要有Nestloop、Merge]oin、HashJoinD)聚合操作如groupby會觸發(fā)Mergejoin答案:CD解析:[多選題]57.集成學(xué)習(xí)中增強多樣性的常見做法有()A)數(shù)據(jù)樣本擾動B)輸入屬性擾動C)輸出表示擾動D)算法參數(shù)擾動答案:ABCD解析:[多選題]58.哪些是離線批處理的特點?A)處理數(shù)據(jù)量巨大,PB級B)處理時間要求高C)容易產(chǎn)生資源搶占D)多個作業(yè)調(diào)度復(fù)雜答案:ACD解析:[多選題]59.訓(xùn)練CNN時,GPU顯存溢出,此時可以采取什么辦法?()A)減少mini_batch大小B)移除一些卷積層C)減少圖片輸入大小D)增加激活函數(shù)答案:ABC解析:[多選題]60.ADS中不支持以下()表連接方式。A)rightjoinB)笛卡爾積C)semijoinD)fulljoin答案:ACD解析:[多選題]61.下列關(guān)于數(shù)據(jù)科學(xué)中常用的統(tǒng)計學(xué)知識說法錯誤的是()。A)從行為目的與思維方式看,數(shù)據(jù)統(tǒng)計方法可以分為基本分析方法和元分析方法B)從方法論角度看,基于統(tǒng)計的數(shù)據(jù)分析方法又可分為描述統(tǒng)計和推斷統(tǒng)計C)描述統(tǒng)計可分為集中趨勢分析、離中趨勢分析、參數(shù)估計和假設(shè)檢驗D)推斷統(tǒng)計包括采樣分布和相關(guān)分析答案:ABCD解析:從行為目的與思維方式看,數(shù)據(jù)統(tǒng)計方法包括描述統(tǒng)計、假設(shè)檢驗、相關(guān)分析、方差分析、回歸分析、聚類分析等;從方法論角度看,描述統(tǒng)計可分為集中趨勢分析和離散趨勢分析;推斷統(tǒng)計包括總體參數(shù)估計和假設(shè)檢驗兩方面內(nèi)容。[多選題]62.數(shù)據(jù)挖掘的挖掘方法包括()。A)聚類B)回歸分析C)神經(jīng)網(wǎng)絡(luò)D)決策樹算法答案:ABCD解析:利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等。分類方法有決策樹算法、KNN算法(K-NearestNeighbor))、SVM算法、VSM算法、Bayes算法、神經(jīng)網(wǎng)絡(luò)等。聚類算法有基于密度、基于層次、基于模型、基于網(wǎng)格等。關(guān)聯(lián)規(guī)則算法有Apriori算法、FP-Growth算法。[多選題]63.關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的敘述中,正確的是()A)可用于處理時間序列數(shù)據(jù)B)可用于處理圖像數(shù)據(jù)C)卷積網(wǎng)絡(luò)中使用的卷積運算就是數(shù)學(xué)中的卷積計算D)至少在網(wǎng)絡(luò)的一層中使用卷積答案:ABD解析:[多選題]64.關(guān)于數(shù)據(jù)科學(xué)的基本原則,下面說法正確的是()A)數(shù)據(jù)科學(xué)的研究和應(yīng)用的獨特視角為?數(shù)據(jù)能為我做什么?B)數(shù)據(jù)科學(xué)強調(diào)的是將數(shù)據(jù)轉(zhuǎn)換為信息、知識和智慧之后,用它們解決實際問題C)數(shù)據(jù)科學(xué)不是?一個人的舞臺?,而是?一個團隊的平臺?D)?基于數(shù)據(jù)的智能?的重要特點是?數(shù)據(jù)復(fù)雜、但算法簡單?答案:ACD解析:[多選題]65.()是卷積神經(jīng)網(wǎng)絡(luò)的池化層。A)convolutionB)maxpoolingC)averagepoolingD)fullconnection答案:BC解析:[多選題]66.以下說法正確的是()A)一個服務(wù)器只能有一個數(shù)據(jù)庫B)一個服務(wù)器可以有多個數(shù)據(jù)庫C)一個數(shù)據(jù)庫只能建立一張數(shù)據(jù)表D)一個數(shù)據(jù)庫可以建立多張數(shù)據(jù)表答案:BD解析:[多選題]67.LSTM應(yīng)用場景有()A)翻譯語言B)語音識別C)圍像識別D)股票預(yù)測答案:ABD解析:[多選題]68.在開發(fā)大數(shù)據(jù)計算服務(wù)的MapReduce時,可以使用JobClient類中的接口提交MapReduce作業(yè)。目前提交方式支持()。A)遠程提交B)本地提交C)阻塞方式D)非阻塞方式答案:CD解析:[多選題]69.Apriori算法的計算復(fù)雜度受()影響A)支持度閩值B)項數(shù)(維度)C)事務(wù)教D)事務(wù)平均寬度答案:ABCD解析:[多選題]70.從加工程度看,以下關(guān)于數(shù)據(jù)說法正確的是()A)零次數(shù)據(jù)就是沒有經(jīng)過預(yù)處理的原始數(shù)據(jù)B)一次數(shù)據(jù)就是預(yù)處理過的數(shù)據(jù),即干凈數(shù)據(jù)C)二次數(shù)據(jù)就是分析處理的結(jié)果,即增值數(shù)據(jù)D)三次數(shù)據(jù)就是可以直接用于決策的洞見數(shù)據(jù)答案:ABCD解析:[多選題]71.下列選項參數(shù)是Sqoop指令的是?()()A)importB)outputC)inputD)export答案:AD解析:[多選題]72.完整性約束通常包括()A)實體完整性B)域完整性C)參照完整性D)用戶定義完整性答案:ABCD解析:在關(guān)系數(shù)據(jù)庫中,完整性約束通常包括;①實體完整性:規(guī)定表的每一行在關(guān)系表中是唯一的實體。②域完整性;指關(guān)系表中的列必須滿足某種特定的數(shù)據(jù)類型約束,其中約束又句括取值范圍、精度等規(guī)定。③參照完整性.指兩個關(guān)系表的主關(guān)鍵字和外關(guān)鍵字的數(shù)據(jù)應(yīng)一致,保證了表之間的數(shù)據(jù)的一致性,防止了數(shù)據(jù)丟失或無意義的數(shù)據(jù)在數(shù)據(jù)庫中擴散。④用戶定義的完整性;不同的關(guān)系數(shù)據(jù)庫系統(tǒng)根據(jù)其應(yīng)用環(huán)境的不同,往往還需要一些特殊的約束條件。用戶定義的完整性即針對某個特定關(guān)系數(shù)據(jù)庫的約束條件,它反映某一具體應(yīng)用必須滿足的語義要求。[多選題]73.智能終端研發(fā)部署應(yīng)充分考慮其他專業(yè)需求,實現(xiàn)配用電側(cè)()跨專業(yè)復(fù)用,推動各專業(yè)共建共享A)采集裝置B)通信資源C)邊緣計算D)數(shù)據(jù)資源答案:ABCD解析:[多選題]74.數(shù)據(jù)科學(xué)是()。A)新興科學(xué)B)交叉性學(xué)科C)獨立學(xué)科D)一整套知識體系答案:ABCD解析:[多選題]75.信息時代的三大定律指的是()。A)摩爾定律B)吉爾德定律C)麥特卡爾夫定律D)牛頓定律答案:ABC解析:[多選題]76.Hadoop運行模式包括()。A)本地模式B)偽分布模式C)完全分布模式D)遠程訪問模式答案:ABC解析:[多選題]77.下列關(guān)于超鏈接的說法正確的有()。A)語句<ahref="formhtml">FillOurForm</a>指向的是同一服務(wù)器同一目錄下的FormhtmlB)語句<ahref="stuff/cathtml">Catalog</a>指向的是同一服務(wù)器子目錄stuff下的CathtmlC)語句<ahref="/parenthtml">Parent</a>指向的是同一服務(wù)器父目錄下的parenthtmlD)語句<ahref="wwwdevbgorg"target="_blank">BASD</a>指向的是內(nèi)部的網(wǎng)站答案:ABC解析:D指向的是外部網(wǎng)站333第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.任何數(shù)據(jù)流節(jié)點均可以設(shè)置查看器()A)正確B)錯誤答案:錯解析:[判斷題]79.Python集合中的元素不允許重復(fù)。A)正確B)錯誤答案:對解析:[判斷題]80.數(shù)據(jù)科學(xué)家能夠從堆積如山的大數(shù)據(jù)中找到金礦,并將其價值以易懂的形式傳達給決策者,最終得以在業(yè)務(wù)上實現(xiàn)A)正確B)錯誤答案:對解析:[判斷題]81.偽分布式模式下的Hadoop功能與完全分布式模式下的Hadoop功能相同。()A)正確B)錯誤答案:對解析:[判斷題]82.文件打開的默認方式是只讀。()A)正確B)錯誤答案:對解析:[判斷題]83.成員測試運算符in作用于集合時比作用于列表快得多。A)正確B)錯誤答案:對解析:[判斷題]84.集合支持雙向索引,最后一個元素的索引是-1。A)正確B)錯誤答案:錯解析:[判斷題]85.GraphBash通過數(shù)據(jù)庫引擎將數(shù)據(jù)通過ji算框架導(dǎo)入Hbase和Spark進行存儲。A)正確B)錯誤答案:錯解析:[判斷題]86.聯(lián)合查詢必須保證查詢字段的數(shù)量相同。--A)正確B)錯誤答案:對解析:[判斷題]87.家庭分戶信息對于大數(shù)據(jù)自動授信審批沒有任何意義A)正確B)錯誤答案:錯解析:[判斷題]88.12.Hadoop默認調(diào)度器策略為FIFOA)正確B)錯誤答案:對解析:hadoop1.x使用的默認調(diào)度器就是FIFO。[判斷題]89.非結(jié)構(gòu)化數(shù)據(jù)是可以直接用傳統(tǒng)關(guān)系數(shù)據(jù)庫存儲和管理的數(shù)據(jù)。()A)正確B)錯誤答案:錯解析:[判斷題]90.DataNode在客戶端或者NameNode的調(diào)度下,存儲并檢索數(shù)據(jù)塊,對數(shù)據(jù)塊進行創(chuàng)建、刪除等操作。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論