大數(shù)據(jù)技術導論-北京理工大學中國大學mooc課后章節(jié)答案期末考試題庫2023年_第1頁
大數(shù)據(jù)技術導論-北京理工大學中國大學mooc課后章節(jié)答案期末考試題庫2023年_第2頁
大數(shù)據(jù)技術導論-北京理工大學中國大學mooc課后章節(jié)答案期末考試題庫2023年_第3頁
大數(shù)據(jù)技術導論-北京理工大學中國大學mooc課后章節(jié)答案期末考試題庫2023年_第4頁
大數(shù)據(jù)技術導論-北京理工大學中國大學mooc課后章節(jié)答案期末考試題庫2023年_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數(shù)據(jù)技術導論_北京理工大學中國大學mooc課后章節(jié)答案期末考試題庫2023年MapReduce設計的一個理念是“數(shù)據(jù)向計算靠攏”,并采用“分而治之”的策略。()

參考答案:

錯誤

將收入在范圍$12,000至$98,000內的收入規(guī)范化到區(qū)間[0.0,1.0],$73,600將被規(guī)范為:(保留兩位小數(shù))

參考答案:

0.72

Hadoop擅長批處理,不適合流計算。()

參考答案:

正確

以下哪個不是數(shù)據(jù)可視化方法和技術?

參考答案:

混合建模技術

文本是大數(shù)據(jù)時代結構數(shù)據(jù)類型的典型代表。

參考答案:

錯誤

下列可以用于多維數(shù)據(jù)可視化的方法有()

參考答案:

雷達圖_散點圖矩陣_平行坐標系

Textflow用河流的運動表達了文本主題的誕生、發(fā)展、合并、分裂、消亡的過程。導致主題演變的原因往往是主題關鍵詞的變化。

參考答案:

正確

4V特征:數(shù)據(jù)規(guī)模大、_________、數(shù)據(jù)處理速度快、價值密度低。

參考答案:

數(shù)據(jù)類型多

K-匿名規(guī)則滿足子集屬性和泛化屬性

參考答案:

正確

計算k-匿名的算法分類包括

參考答案:

基于泛化和基于元組抑制的算法_基于層次和基于劃分的算法_基于全局和基于局部記錄的算法

關于隱私保護技術,以下描述正確的包括

參考答案:

K-匿名的局限性是容易遭受同質性攻擊_T-相近比K-匿名和L-多樣性有更強的隱私保護性能_L-多樣性的局限性是容易遭受相似性攻擊_K-匿名無法保證敏感值缺乏多樣性

下列哪些方法可以實現(xiàn)匿名化

參考答案:

元組抑制_屬性置換_屬性擾亂_屬性泛化

下列哪些信息可能會侵犯用戶的隱私

參考答案:

電商平臺的購物記錄_搜索引擎的搜索記錄_地圖應用的搜索記錄_瀏覽器的訪問痕跡

數(shù)據(jù)匿名化的原因有哪些

參考答案:

實現(xiàn)數(shù)據(jù)共享發(fā)布,而不泄漏用戶的隱私

MapReduce執(zhí)行的全過程包括以下幾個主要階段()。

參考答案:

從分布式文件系統(tǒng)讀入數(shù)據(jù)_通過Shuffle階段把中間結果分區(qū)排序整理后發(fā)送給Reduce任務_執(zhí)行Reduce任務得到最終結果并寫入分布式系統(tǒng)文件_執(zhí)行Map任務輸出中間結果

以下哪些是數(shù)據(jù)可視化的作用()

參考答案:

作為大量工作記憶的外界輔助_協(xié)助思考_理解信息_探索數(shù)據(jù)

在大數(shù)據(jù)生命周期的各個階段中,工作最多的是哪個階段()。

參考答案:

數(shù)據(jù)收集和整理

大數(shù)據(jù)中的半結構化數(shù)據(jù)包括()。

參考答案:

XML_HTML_電子郵件

大數(shù)據(jù)處理框架之批處理框架()。

參考答案:

Spark_hadoop_Flink

大數(shù)據(jù)的優(yōu)勢包括()。

參考答案:

數(shù)據(jù)體量大_數(shù)據(jù)類型豐富_收集時間短

設X是非空集合,對于X中任意的兩個元素x與y,按某一法則都對應唯一的實數(shù)d(x,y),而且滿足下述()性質,則稱d(x,y)為x與y的距離。

參考答案:

對于任意的x,y,z∈X,有d(x,y)≤d(x,z)+d(z,y)_Bd(x,y)=d(y,x)_非負性d(x,y)≥0

關于數(shù)據(jù)挖掘任務,下列說法正確的是()

參考答案:

聚類屬于無監(jiān)督范疇。_分類屬于預測性任務_聚類是描述性任務。

下列關于數(shù)據(jù)可視化的介紹,不正確的是()。

參考答案:

雷達圖不適用于多維數(shù)據(jù)。

大數(shù)據(jù)可視化分析有效融合計算機的______和人的_____,以獲得對于大規(guī)模復雜數(shù)據(jù)集的洞察力。

參考答案:

計算能力、認知能力

以數(shù)據(jù)考察為基礎,聯(lián)合理論、實驗和模擬一體的數(shù)據(jù)密集計算的范式是以下哪個范式()。

參考答案:

數(shù)據(jù)密集型范式

在“看不見的動機中”由于數(shù)據(jù)使用者和數(shù)據(jù)生成機構都是()的生產大數(shù)據(jù),忽略了人們行為背后趨利避害的動機的大數(shù)據(jù)統(tǒng)計分析。

參考答案:

無意識

系統(tǒng)的控制方式一般分為模型驅動和_____________。

參考答案:

數(shù)據(jù)驅動

大數(shù)據(jù)處理框架之流計算框架()。

參考答案:

Sparkstreaming_Flink_STORM

大數(shù)據(jù)是一個什么領域的問題()。

參考答案:

多學科綜合領域

在增量抽取方法中,需要計算MD5校驗碼的是哪種增量抽取方法()。

參考答案:

全表對比

以下屬于Spark的特點的有()。

參考答案:

LazyEvaluation_In-memory

processing_Concise_Speed

Shuffle過程是指對Map輸出結果進行分區(qū)、排序、合并等處理并交給Reduce的過程。()

參考答案:

正確

Shuffle過程分為Map端的操作和Reduce端的操作。()

參考答案:

正確

Spark的組件中,用于做查詢分析的是()。

參考答案:

SparkSQL

以下哪些內容屬于深網內容()。

參考答案:

需要注冊或其他限制才能訪問的內容_Web上可訪問的非網頁文件,比如圖片文件,Pdf和word文檔等_通過填寫表單形成對后臺在線數(shù)據(jù)庫的查詢而得到的動態(tài)頁面

常見的分布式網絡爬蟲架構有()。

參考答案:

peer-peer_Mixed_Master-slave

HDFS中文件塊默認保存幾份()。

參考答案:

3份

圖的簡化中,技術會將相似形狀的邊連接線集中在一起構成約束,降低視覺復雜度,使節(jié)點間的連接關系更加清楚。

參考答案:

邊邦定

分布式文件系統(tǒng)改變了數(shù)據(jù)存儲和管理方式,相對于本地文件系統(tǒng)具有哪些優(yōu)勢()。

參考答案:

低成本_高可用_強可靠_易擴展

兩個向量的方向差異可以表示為兩個向量夾角的。

參考答案:

余弦

HBase依靠()存儲底層數(shù)據(jù)。

參考答案:

HDFS

關于RDD論述正確的是()。

參考答案:

RDD是只讀存儲_RDD提供一種高度受限的共享內存模型,是一個彈性分布式數(shù)據(jù)集

聚類是在沒有先驗知識的情況下進行的。

參考答案:

正確

PCA是一種有監(jiān)督的降維方法。

參考答案:

錯誤

下面與HDFS類似的框架是()。

參考答案:

GFS

在網絡爬蟲策略中需要根據(jù)鏈接計算網頁重要性的是以下哪個算法()。

參考答案:

局部PageRank策略

大數(shù)據(jù)中的非結構化數(shù)據(jù)包括()。

參考答案:

視頻_文本_圖像_語音

科學研究第四范式數(shù)據(jù)思維采用()。

參考答案:

關聯(lián)分析

Apache軟件基金會最重要的三大分布式計算系統(tǒng)開源項目包括()。

參考答案:

Storm_Hadoop_Spark

Spark支持的開發(fā)語言有()。

參考答案:

Java_Python_Scala

預測任務的目標是導出和概括數(shù)據(jù)中有潛在聯(lián)系的模式(相關、趨勢、聚類、軌跡和異常)

參考答案:

錯誤

下面科學研究的四個范式順序正確的是()。

參考答案:

經驗范式-理論范式-模擬范式-數(shù)據(jù)密集型范式

RDD的兩種主要操作類型是()。

參考答案:

Action_Transform

在Spark運行時,()為程序構建基本運行環(huán)境Sparkcontext對象(應用管家),向資源管理器進行資源申請,任務分配與監(jiān)控。

參考答案:

Driverprogram

下列選項中哪些不是NoSQL數(shù)據(jù)庫的特點()。

參考答案:

動態(tài)的數(shù)據(jù)遷移

大數(shù)據(jù)領域的職業(yè)包括首席數(shù)據(jù)官、系統(tǒng)架構師、___________、領域科學家。

參考答案:

數(shù)據(jù)分析師

科學研究的第三范式計算思維-______。

參考答案:

仿真模擬

大數(shù)據(jù)的處理過程:數(shù)據(jù)獲取與管理、數(shù)據(jù)存儲與處理、數(shù)據(jù)分析與______、結合領域的大數(shù)據(jù)應用。

參考答案:

理解

蒙德里安算法是一種基于劃分的算法

參考答案:

正確

極小全域泛化的集合構成一個反鏈

參考答案:

正確

熵l-多樣性滿足子集屬性和泛化屬性

參考答案:

正確

遞歸(c,l)-多樣性不滿足泛化屬性

參考答案:

錯誤

小數(shù)據(jù)強調采樣,精確以及因果關系,大數(shù)據(jù)強調()。

參考答案:

全樣_相關關系_非精確

大數(shù)據(jù)面臨的挑戰(zhàn)包括()。

參考答案:

看不見的動機_大數(shù)據(jù)自大_算法演化

下面對HBase的描述哪些是正確的()。

參考答案:

是面向列的_是一種NoSQL數(shù)據(jù)庫_是分布式的

數(shù)據(jù)收集過程的性質發(fā)生了變化,大數(shù)據(jù)不再只是被動記錄使用者的決策,而是通過______,積極參與到使用者的行為決策中。

參考答案:

算法演化

夜光遙感挖掘是通過在遙感圖像中提取________數(shù)據(jù)進行繪制和分析。

參考答案:

燈光

“大數(shù)據(jù)自大(bigdatahubris)”的傾向,即認為_______,這里的關鍵是,企業(yè)或者機構擁有的這個稱為總體的數(shù)據(jù)和研究問題關心的總體是否相同.

參考答案:

自己擁有的數(shù)據(jù)是總體

Hadoop的框架最核心的設計是()。

參考答案:

HDFS_MapReduce

HBase的實現(xiàn)包括哪幾個主要的功能組件()。

參考答案:

許多個Region服務器_庫函數(shù)_一個Master主服務器

HDFS專為解決大數(shù)據(jù)存儲問題而產生的,其具備了以下哪些特點()。

參考答案:

強大的跨平臺兼容性_兼容廉價的硬件設備_大數(shù)據(jù)集

在大數(shù)據(jù)分析中只關心________而不關注因果關系。

參考答

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論