保山學(xué)院《大數(shù)據(jù)原理與技術(shù)課程設(shè)計(jì)》2021-2022學(xué)年期末試卷_第1頁
保山學(xué)院《大數(shù)據(jù)原理與技術(shù)課程設(shè)計(jì)》2021-2022學(xué)年期末試卷_第2頁
保山學(xué)院《大數(shù)據(jù)原理與技術(shù)課程設(shè)計(jì)》2021-2022學(xué)年期末試卷_第3頁
保山學(xué)院《大數(shù)據(jù)原理與技術(shù)課程設(shè)計(jì)》2021-2022學(xué)年期末試卷_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

自覺遵守考場紀(jì)律如考試作弊此答卷無效密自覺遵守考場紀(jì)律如考試作弊此答卷無效密封線第1頁,共3頁保山學(xué)院

《大數(shù)據(jù)原理與技術(shù)課程設(shè)計(jì)》2021-2022學(xué)年期末試卷院(系)_______班級(jí)_______學(xué)號(hào)_______姓名_______題號(hào)一二三總分得分批閱人一、單選題(本大題共20個(gè)小題,每小題2分,共40分.在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的.)1、在大數(shù)據(jù)中,數(shù)據(jù)清洗的主要目的是什么?()A.提高數(shù)據(jù)質(zhì)量B.減少數(shù)據(jù)量C.改變數(shù)據(jù)格式D.增加數(shù)據(jù)復(fù)雜性2、在大數(shù)據(jù)中,數(shù)據(jù)遷移的策略不包括()A.全量遷移B.增量遷移C.隨機(jī)遷移D.混合遷移3、Hadoop生態(tài)系統(tǒng)中的哪個(gè)組件用于資源管理?()A.YARNB.MapReduceC.HDFSD.HBase4、以下哪個(gè)不是大數(shù)據(jù)存儲(chǔ)的架構(gòu)?()A.集中式存儲(chǔ)B.分布式存儲(chǔ)C.云存儲(chǔ)D.本地存儲(chǔ)5、以下哪種算法常用于大數(shù)據(jù)的分類問題?()A.聚類算法B.關(guān)聯(lián)規(guī)則挖掘C.決策樹D.回歸分析6、以下哪個(gè)不是大數(shù)據(jù)的安全風(fēng)險(xiǎn)?()A.數(shù)據(jù)泄露B.數(shù)據(jù)丟失C.數(shù)據(jù)冗余D.非法訪問7、在大數(shù)據(jù)中,數(shù)據(jù)脫敏的主要方法是()A.替換B.加密C.刪除D.以上都是8、以下哪項(xiàng)不是大數(shù)據(jù)的特點(diǎn)?()A.數(shù)據(jù)量大B.數(shù)據(jù)類型多樣C.數(shù)據(jù)價(jià)值密度高D.處理速度快9、以下哪種技術(shù)用于大數(shù)據(jù)的特征工程?()A.數(shù)據(jù)標(biāo)準(zhǔn)化B.特征選擇C.特征提取D.以上都是10、大數(shù)據(jù)中的數(shù)據(jù)預(yù)處理不包括()A.數(shù)據(jù)集成B.數(shù)據(jù)規(guī)約C.數(shù)據(jù)轉(zhuǎn)換D.數(shù)據(jù)刪除11、Hadoop生態(tài)系統(tǒng)中的核心組件是()A.HiveB.HBaseC.MapReduceD.Spark12、以下哪種技術(shù)用于大數(shù)據(jù)的流處理?()A.KafkaB.MongoDBC.MySQLD.Redis13、以下哪種算法常用于大數(shù)據(jù)的聚類分析?()A.K-MeansB.決策樹C.線性回歸D.邏輯回歸14、大數(shù)據(jù)中的數(shù)據(jù)融合方法不包括?()A.基于規(guī)則的融合B.基于機(jī)器學(xué)習(xí)的融合C.隨機(jī)融合D.基于本體的融合15、大數(shù)據(jù)中的數(shù)據(jù)可視化原則不包括()A.準(zhǔn)確性B.簡潔性C.復(fù)雜性D.交互性16、Spark相對(duì)于Hadoop的優(yōu)勢在于()A.內(nèi)存計(jì)算B.存儲(chǔ)容量大C.處理速度慢D.配置復(fù)雜17、在大數(shù)據(jù)中,數(shù)據(jù)治理的目標(biāo)不包括()A.提高數(shù)據(jù)質(zhì)量B.保障數(shù)據(jù)安全C.降低數(shù)據(jù)存儲(chǔ)成本D.增加數(shù)據(jù)量18、在大數(shù)據(jù)中,數(shù)據(jù)歸檔的目的是()A.節(jié)省存儲(chǔ)空間B.提高數(shù)據(jù)處理速度C.保證數(shù)據(jù)安全性D.以上都是19、在大數(shù)據(jù)中,數(shù)據(jù)壓縮的目的是()A.減少數(shù)據(jù)量B.提高數(shù)據(jù)安全性C.方便數(shù)據(jù)傳輸D.以上都是20、大數(shù)據(jù)中的數(shù)據(jù)融合是指()A.合并多個(gè)數(shù)據(jù)源的數(shù)據(jù)B.對(duì)數(shù)據(jù)進(jìn)行加密C.對(duì)數(shù)據(jù)進(jìn)行壓縮D.以上都不是二、簡答題(本大題共4個(gè)小題,共40分)1、(本題10分)解釋大數(shù)據(jù)分析的主要流程。2、(本題10分)在大數(shù)據(jù)中,如何處理異常值?3、(本題10分)解釋數(shù)據(jù)血緣關(guān)系在數(shù)據(jù)遷移中的作用。4、(本題10分)什么是數(shù)據(jù)血緣的可視化分析工具的關(guān)鍵特性?三、綜合分析題(本大題共2個(gè)小題,共20分)1、(本題10分)分析大數(shù)據(jù)在紡織行業(yè)的應(yīng)用,如生產(chǎn)質(zhì)量控制、市

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論