數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)的關(guān)系考核試卷_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)的關(guān)系考核試卷_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)的關(guān)系考核試卷_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)的關(guān)系考核試卷_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)的關(guān)系考核試卷_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)的關(guān)系考核試卷考生姓名:__________答題日期:_______得分:_________判卷人:_________

一、單項(xiàng)選擇題(本題共20小題,每小題1分,共20分,在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的)

1.數(shù)據(jù)倉(cāng)庫(kù)的主要目的是?()

A.提供在線(xiàn)事務(wù)處理

B.支持決策制定

C.存儲(chǔ)實(shí)時(shí)數(shù)據(jù)

D.簡(jiǎn)化數(shù)據(jù)備份

2.以下哪項(xiàng)不是數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)?()

A.面向主題

B.集成性

C.實(shí)時(shí)性

D.非易失性

3.大數(shù)據(jù)的“V”特征中不包括以下哪項(xiàng)?()

A.速度(Velocity)

B.數(shù)量(Volume)

C.多樣性(Variety)

D.準(zhǔn)確性(Veracity)

4.下列哪個(gè)不是大數(shù)據(jù)技術(shù)的主流處理工具?()

A.Hadoop

B.Spark

C.SQL

D.NoSQL

5.數(shù)據(jù)倉(cāng)庫(kù)通常采用哪種數(shù)據(jù)模型?()

A.層次模型

B.關(guān)系模型

C.網(wǎng)狀模型

D.面向?qū)ο竽P?/p>

6.在數(shù)據(jù)倉(cāng)庫(kù)中,星型模式與雪花模式的主要區(qū)別是?()

A.星型模式有更多的維度表

B.雪花模式有更多的維度表

C.星型模式不包含事實(shí)表

D.雪花模式不包含事實(shí)表

7.大數(shù)據(jù)中的“數(shù)據(jù)清洗”是指?()

A.刪除所有數(shù)據(jù)

B.優(yōu)化數(shù)據(jù)存儲(chǔ)

C.提高數(shù)據(jù)質(zhì)量

D.恢復(fù)丟失數(shù)據(jù)

8.以下哪種技術(shù)主要用于大數(shù)據(jù)的實(shí)時(shí)處理?()

A.MapReduce

B.SparkStreaming

C.Hive

D.Pig

9.數(shù)據(jù)倉(cāng)庫(kù)的ETL過(guò)程是指?()

A.數(shù)據(jù)抽取、轉(zhuǎn)換、加載

B.數(shù)據(jù)集成、轉(zhuǎn)換、刪除

C.數(shù)據(jù)提取、傳輸、鏈接

D.數(shù)據(jù)估算、測(cè)試、加載

10.以下哪種技術(shù)不是大數(shù)據(jù)的存儲(chǔ)技術(shù)?()

A.HDFS

B.HBase

C.Redis

D.MySQL

11.在數(shù)據(jù)倉(cāng)庫(kù)中,事實(shí)表通常包含?()

A.描述性信息

B.鍵和度量值

C.日期和時(shí)間戳

D.文本數(shù)據(jù)

12.大數(shù)據(jù)分析常用的統(tǒng)計(jì)分析方法不包括以下哪項(xiàng)?()

A.描述性分析

B.探索性分析

C.驗(yàn)證性分析

D.預(yù)測(cè)性分析

13.以下哪項(xiàng)是數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的主要步驟?()

A.數(shù)據(jù)建模、數(shù)據(jù)清洗、數(shù)據(jù)集成

B.數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載

C.數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)挖掘

D.數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)檢索、數(shù)據(jù)展示

14.在大數(shù)據(jù)生態(tài)中,Hadoop的核心組件是什么?()

A.HadoopYARN

B.HadoopMapReduce

C.HadoopHive

D.HadoopHDFS

15.以下哪種語(yǔ)言不常用于大數(shù)據(jù)處理?()

A.Java

B.Python

C.R

D.C#

16.數(shù)據(jù)倉(cāng)庫(kù)的元數(shù)據(jù)主要用于?()

A.存儲(chǔ)數(shù)據(jù)

B.描述數(shù)據(jù)

C.分析數(shù)據(jù)

D.轉(zhuǎn)換數(shù)據(jù)

17.大數(shù)據(jù)技術(shù)中,哪種技術(shù)主要用于數(shù)據(jù)挖掘?()

A.SQL

B.MapReduce

C.Mahout

D.Pig

18.以下哪種方法不適合處理大數(shù)據(jù)的可變性?()

A.數(shù)據(jù)標(biāo)準(zhǔn)化

B.數(shù)據(jù)清洗

C.數(shù)據(jù)壓縮

D.數(shù)據(jù)去重

19.數(shù)據(jù)倉(cāng)庫(kù)的多維分析技術(shù)主要包括哪些?()

A.切片、切塊、旋轉(zhuǎn)

B.分類(lèi)、回歸、聚類(lèi)

C.抽象、簡(jiǎn)化、可視化

D.比較、評(píng)估、預(yù)測(cè)

20.以下哪個(gè)不是大數(shù)據(jù)安全方面的挑戰(zhàn)?()

A.數(shù)據(jù)隱私

B.數(shù)據(jù)安全

C.數(shù)據(jù)集成

D.數(shù)據(jù)訪(fǎng)問(wèn)控制

(以下為答題紙部分,請(qǐng)考生在此處填寫(xiě)答案)

二、多選題(本題共20小題,每小題1.5分,共30分,在每小題給出的四個(gè)選項(xiàng)中,至少有一項(xiàng)是符合題目要求的)

1.數(shù)據(jù)倉(cāng)庫(kù)的主要用途包括?()

A.支持復(fù)雜的查詢(xún)分析

B.數(shù)據(jù)備份

C.長(zhǎng)期數(shù)據(jù)存儲(chǔ)

D.實(shí)時(shí)數(shù)據(jù)更新

2.大數(shù)據(jù)的“5V”特征包括以下哪些?()

A.大量(Volume)

B.高速(Velocity)

C.多樣性(Variety)

D.真實(shí)性(Veracity)

3.以下哪些是大數(shù)據(jù)處理框架?()

A.Hadoop

B.Spark

C.Flink

D.SQLServer

4.數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中的事實(shí)表類(lèi)型有哪些?()

A.事務(wù)型事實(shí)表

B.周期型事實(shí)表

C.累計(jì)型事實(shí)表

D.混合型事實(shí)表

5.以下哪些技術(shù)可以用于大數(shù)據(jù)分析?()

A.R語(yǔ)言

B.Python

C.SQL

D.Excel

6.數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)集成涉及以下哪些方面?()

A.數(shù)據(jù)清洗

B.數(shù)據(jù)轉(zhuǎn)換

C.數(shù)據(jù)整合

D.數(shù)據(jù)抽取

7.以下哪些是大數(shù)據(jù)安全的關(guān)鍵要素?()

A.訪(fǎng)問(wèn)控制

B.數(shù)據(jù)加密

C.安全審計(jì)

D.數(shù)據(jù)備份

8.以下哪些是大數(shù)據(jù)處理的基本流程?()

A.數(shù)據(jù)采集

B.數(shù)據(jù)存儲(chǔ)

C.數(shù)據(jù)處理

D.數(shù)據(jù)展現(xiàn)

9.常見(jiàn)的數(shù)據(jù)倉(cāng)庫(kù)建模方法有哪些?()

A.星型模式

B.雪花模式

C.數(shù)據(jù)挖掘

D.聚合模型

10.以下哪些技術(shù)可以用于大數(shù)據(jù)的實(shí)時(shí)分析?()

A.Storm

B.SparkStreaming

C.Kafka

D.HBase

11.數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)質(zhì)量管理包括以下哪些?()

A.數(shù)據(jù)質(zhì)量控制

B.數(shù)據(jù)質(zhì)量評(píng)估

C.數(shù)據(jù)質(zhì)量改進(jìn)

D.數(shù)據(jù)質(zhì)量監(jiān)控

12.以下哪些是大數(shù)據(jù)時(shí)代的挑戰(zhàn)?()

A.數(shù)據(jù)增長(zhǎng)速度

B.數(shù)據(jù)多樣性

C.數(shù)據(jù)存儲(chǔ)成本

D.數(shù)據(jù)分析復(fù)雜性

13.以下哪些是大數(shù)據(jù)分析中的預(yù)測(cè)分析工具?()

A.時(shí)間序列分析

B.回歸分析

C.決策樹(shù)

D.聚類(lèi)分析

14.大數(shù)據(jù)技術(shù)中,哪些組件用于數(shù)據(jù)處理?()

A.HadoopMapReduce

B.SparkRDD

C.FlinkDataSet

D.Hive

15.以下哪些技術(shù)可以用于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)展現(xiàn)?()

A.Tableau

B.PowerBI

C.QlikView

D.Excel

16.以下哪些是數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施步驟?()

A.需求分析

B.數(shù)據(jù)建模

C.系統(tǒng)開(kāi)發(fā)

D.運(yùn)維支持

17.以下哪些是大數(shù)據(jù)中的數(shù)據(jù)源?()

A.結(jié)構(gòu)化數(shù)據(jù)

B.半結(jié)構(gòu)化數(shù)據(jù)

C.非結(jié)構(gòu)化數(shù)據(jù)

D.所有以上選項(xiàng)

18.以下哪些是大數(shù)據(jù)分析中常用的數(shù)據(jù)挖掘算法?()

A.分類(lèi)算法

B.聚類(lèi)算法

C.預(yù)測(cè)算法

D.關(guān)聯(lián)規(guī)則算法

19.以下哪些技術(shù)可以用于大數(shù)據(jù)的分布式存儲(chǔ)?()

A.HDFS

B.Ceph

C.GlusterFS

D.Alluxio

20.以下哪些是數(shù)據(jù)倉(cāng)庫(kù)的優(yōu)勢(shì)?()

A.提供統(tǒng)一的數(shù)據(jù)視圖

B.支持復(fù)雜的查詢(xún)

C.數(shù)據(jù)歷史記錄的保存

D.提高數(shù)據(jù)處理的實(shí)時(shí)性

(以下為答題紙部分,請(qǐng)考生在此處填寫(xiě)答案)

三、填空題(本題共10小題,每小題2分,共20分,請(qǐng)將正確答案填到題目空白處)

1.數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題、集成、隨時(shí)間變化的、非易失的數(shù)據(jù)集合,用于支持決策制定。

答案:__________

2.大數(shù)據(jù)的“5V”特征中,__________指的是數(shù)據(jù)的真實(shí)性。

答案:__________

3.在大數(shù)據(jù)技術(shù)中,__________是一個(gè)開(kāi)源的分布式計(jì)算平臺(tái)。

答案:__________

4.數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常通過(guò)__________過(guò)程(ETL)進(jìn)行集成。

答案:__________

5.事實(shí)表通常包含度量值和__________。

答案:__________

6.在大數(shù)據(jù)生態(tài)系統(tǒng)中,__________用于流式數(shù)據(jù)處理。

答案:__________

7.數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的第一步是進(jìn)行__________分析。

答案:__________

8.大數(shù)據(jù)分析中,__________是用于預(yù)測(cè)分析的常用技術(shù)。

答案:__________

9.在數(shù)據(jù)倉(cāng)庫(kù)中,__________是用于描述數(shù)據(jù)的數(shù)據(jù)。

答案:__________

10.__________是一種用于數(shù)據(jù)倉(cāng)庫(kù)中復(fù)雜查詢(xún)的技術(shù)。

答案:__________

四、判斷題(本題共10小題,每題1分,共10分,正確的請(qǐng)?jiān)诖痤}括號(hào)中畫(huà)√,錯(cuò)誤的畫(huà)×)

1.數(shù)據(jù)倉(cāng)庫(kù)主要用于存儲(chǔ)實(shí)時(shí)數(shù)據(jù)。()

答案:__________

2.大數(shù)據(jù)的處理速度必須非??欤ǔT诿爰?jí)或毫秒級(jí)完成。()

答案:__________

3.在大數(shù)據(jù)分析中,Hive可以處理實(shí)時(shí)的查詢(xún)請(qǐng)求。()

答案:__________

4.數(shù)據(jù)倉(cāng)庫(kù)中的事實(shí)表包含描述性信息。()

答案:__________

5.SQL語(yǔ)言不適用于大數(shù)據(jù)處理。()

答案:__________

6.大數(shù)據(jù)技術(shù)可以處理所有類(lèi)型的數(shù)據(jù),包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。()

答案:__________

7.數(shù)據(jù)倉(cāng)庫(kù)的建立是一個(gè)短期且簡(jiǎn)單的過(guò)程。()

答案:__________

8.在大數(shù)據(jù)分析中,預(yù)測(cè)分析主要關(guān)注數(shù)據(jù)的過(guò)去和現(xiàn)在。()

答案:__________

9.數(shù)據(jù)倉(cāng)庫(kù)的元數(shù)據(jù)是用于存儲(chǔ)用戶(hù)查詢(xún)結(jié)果的。()

答案:__________

10.大數(shù)據(jù)處理中,數(shù)據(jù)的安全性不是主要關(guān)注的問(wèn)題。()

答案:__________

五、主觀(guān)題(本題共4小題,每題5分,共20分)

1.請(qǐng)描述數(shù)據(jù)倉(cāng)庫(kù)的基本概念及其在商業(yè)智能(BI)中的作用。

答案:__________

2.大數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)有何不同?請(qǐng)列舉至少三個(gè)區(qū)別。

答案:__________

3.請(qǐng)?jiān)敿?xì)說(shuō)明數(shù)據(jù)倉(cāng)庫(kù)中ETL過(guò)程的重要性及其包含的主要步驟。

答案:__________

4.在大數(shù)據(jù)分析中,如何處理數(shù)據(jù)質(zhì)量和數(shù)據(jù)隱私的問(wèn)題?請(qǐng)?zhí)岢鲋辽賰煞N解決策略。

答案:__________

標(biāo)準(zhǔn)答案

一、單項(xiàng)選擇題

1.B

2.C

3.D

4.C

5.B

6.A

7.C

8.B

9.A

10.D

11.B

12.C

13.A

14.B

15.D

16.B

17.C

18.C

19.A

20.C

二、多選題

1.A,C

2.A,B,C,D

3.A,B,C

4.A,B,C,D

5.A,B,C

6.A,B,C,D

7.A,B,C

8.A,B,C,D

9.A,B,D

10.A,B,C

11.A,B,C,D

12.A,B,C,D

13.A,B,C,D

14.A,B,C,D

15.A,B,C

16.A,B,C,D

17.A,B,C,D

18.A,B,C,D

19.A,B,C,D

20.A,B,C

三、填空題

1.面向主題、集成、隨時(shí)間變化的、非易失的數(shù)據(jù)集合

2.真實(shí)性(Veracity)

3.Hadoop

4.數(shù)據(jù)抽取、轉(zhuǎn)換、加載(ETL)

5.鍵

6.Storm

7.需求分析

8.回歸分析

9.元數(shù)據(jù)

10.OLAP

四、判斷題

1.×

2.√

3.×

4.×

5.×

6.√

7.×

8.×

9.×

10.×

五、主觀(guān)題(參考)

1.數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)用于支持企業(yè)決策制定的數(shù)據(jù)集合,它通過(guò)集成來(lái)自不同源的數(shù)據(jù)并提供統(tǒng)一的數(shù)據(jù)視圖,幫助組織分析歷史數(shù)據(jù),從而實(shí)現(xiàn)商業(yè)智能。

2.大數(shù)據(jù)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別:

-數(shù)據(jù)量:大數(shù)據(jù)涉及處理PB級(jí)別以上的數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)通常處理GB

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論