《大數(shù)據(jù)基礎(chǔ)》課程期末考試試題及答案 B 卷_第1頁
《大數(shù)據(jù)基礎(chǔ)》課程期末考試試題及答案 B 卷_第2頁
《大數(shù)據(jù)基礎(chǔ)》課程期末考試試題及答案 B 卷_第3頁
《大數(shù)據(jù)基礎(chǔ)》課程期末考試試題及答案 B 卷_第4頁
《大數(shù)據(jù)基礎(chǔ)》課程期末考試試題及答案 B 卷_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

班級名稱姓名班級名稱姓名學(xué)號考室裝訂線《大數(shù)據(jù)基礎(chǔ)》課程期末考試試題B卷一、單選題(每小題2分,共30分)1、一般認(rèn)為,多大級別的數(shù)據(jù)就是大數(shù)據(jù)了()A、GBB、TBC、EBD、MB2、以下哪一項屬于半結(jié)構(gòu)化數(shù)據(jù)?()A、圖片B、音頻C、HTML文件D、word文檔3、以下哪一項不是大數(shù)據(jù)的特征?()A、數(shù)據(jù)規(guī)模大B、數(shù)據(jù)類型多樣C、數(shù)據(jù)處理速度快D、數(shù)據(jù)價值密度高4、相當(dāng)于在裸機(jī)基礎(chǔ)上再加上操作系統(tǒng)和數(shù)據(jù)庫軟件的云計算服務(wù)模式是哪一種?()A、SaaSB、IaaSC、PaaSD、GaaS5、以下關(guān)于“云計算”和“大數(shù)據(jù)”的說法,錯誤的是()A、云計算與大數(shù)據(jù)都是為數(shù)據(jù)存儲和處理服務(wù)的,都需要占用大量的存儲和計算資源B、數(shù)據(jù)根植于云計算C、最終目的都是通過充分挖掘海量數(shù)據(jù)以發(fā)現(xiàn)數(shù)據(jù)中的價值D、云計算可以節(jié)省IT部署成本6、()的核心思想可以概括成確定性(或者可預(yù)測性)和因果關(guān)系。A、實驗思維B、機(jī)械思維C、大數(shù)據(jù)思維D、相關(guān)思維7、智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)用。A、傳感器 B、網(wǎng)絡(luò)爬蟲 C、API接口 D、統(tǒng)計報表8、相比依賴于小數(shù)據(jù)和精確性的時代,大數(shù)據(jù)因為更強(qiáng)調(diào)數(shù)據(jù)的(),幫助我們進(jìn)一步接近事實的真相。A、安全性B、完整性C、混雜性D、完整性和混雜性9、數(shù)據(jù)清洗的方法不包括()A、處理殘缺數(shù)據(jù) B、處理噪聲數(shù)據(jù)C、處理冗余數(shù)據(jù) D、一致性檢查10、大數(shù)據(jù)的一個重要特征就是數(shù)據(jù)量大。ZB和TB之間的換算關(guān)系是以下哪一個?()A、1ZB=2^10TBB、1ZB=2^20TBC、1ZB=2^30TBD、1ZB=2^40TB11、下列對于機(jī)械硬盤與固態(tài)硬盤的描述哪一種說法是錯誤的?()A、機(jī)械硬盤不抗摔,通電不能移動,否則易損壞B、機(jī)械硬盤相對固態(tài)硬盤讀寫速度更慢C、機(jī)械硬盤相對于固態(tài)硬盤成本更低。D、機(jī)械硬盤相對于固態(tài)硬盤噪音更小。12、下列關(guān)于文件系統(tǒng)的描述不正確的是()。A.在文件系統(tǒng)上編寫應(yīng)用程序的效率不高 B.文件系統(tǒng)不支持對文件的并發(fā)訪問C.文件系統(tǒng)通常不可避免數(shù)據(jù)冗余 D.文件系統(tǒng)容易有效保證數(shù)據(jù)安全性和保密性13、數(shù)據(jù)倉庫的最終目的是?()A、收集業(yè)務(wù)需求B、建立數(shù)據(jù)倉庫邏輯模型C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析D、為用戶和業(yè)務(wù)部門提供決策支持14、假設(shè)要對產(chǎn)品用戶畫像進(jìn)行分析,適合選用哪種大數(shù)據(jù)分析模型進(jìn)行分析()A、屬性分析模型B、分布分析模型C、用戶分群分析模型D、用戶行為路徑分析模型15、下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯誤的是()。A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)D、在分析效果上更追求效率而不是絕對精準(zhǔn)二、多選題(每小題3分,共30分)(完全正確給3分,少選得1分,錯選、多選均不記分)1、以下哪些是云計算的特征()A、廣泛的網(wǎng)絡(luò)訪問B、按需自助式服務(wù)C、快速彈性使用D、租用方式單一2、下列屬于大數(shù)據(jù)思維的核心原理的有()。A.數(shù)據(jù)核心原理B.數(shù)據(jù)價值原理C.全樣本原理D.關(guān)注效率原理3、使用八爪魚采集器采集數(shù)據(jù)具有以下特點(diǎn)()A.可以對指定元素進(jìn)行采集 B.采集過程可以觀察網(wǎng)頁和預(yù)覽數(shù)據(jù)變化來驗證采集設(shè)置是否正確C.可以對采集中的流程步驟進(jìn)行修改D.采集過程不需要編寫任何代碼4.下列描述中表示會產(chǎn)生冗余數(shù)據(jù)的是()。A.某數(shù)據(jù)集的變量名稱為“用戶編碼”而在另一個數(shù)據(jù)集中為“ID”B.?dāng)?shù)據(jù)集中某兩個變量之間存在相關(guān)或推導(dǎo)關(guān)系C.某數(shù)據(jù)集中的商品價格以“元”為單位,另一個數(shù)據(jù)集中卻為“萬元”D.某數(shù)據(jù)集的規(guī)范是“3位”,而另一個數(shù)據(jù)集中的要求位“5位”5.在缺失數(shù)據(jù)清洗過程中,如果缺失字段的重要性高,缺失率高,采用的策略有()。A.嘗試從其他渠道取數(shù)補(bǔ)全B.去除記錄,并在結(jié)果中標(biāo)明C.使用其它字段通過計算獲取D.不做處理或簡單填充6.DAS直接附加存儲就是將存儲設(shè)備通過SCSI接口直接連接到一臺服務(wù)器上使用,它的優(yōu)點(diǎn)主要體現(xiàn)在()A.購置成本低,配置簡單 B.使用方法與使用本機(jī)硬盤并無太大差別C.比較適合中小企業(yè)使用D.便于集中管理、分析和使用

7.下列說法正確的是()。A.結(jié)構(gòu)化思維就是把復(fù)雜問題分解成多種單一因素,并使之條理化、綱領(lǐng)化 B.假說演繹思維是以假設(shè)作為思考的起點(diǎn),先提出問題,然后用MECE原則梳理關(guān)聯(lián)因素間的結(jié)構(gòu)關(guān)系。C.指標(biāo)化思維就是在數(shù)據(jù)分析時都按照統(tǒng)一指標(biāo)來進(jìn)行分析。D.在維度思維分析中,維度越多越好。8.?dāng)?shù)據(jù)可視化可以通過()等手段直觀、生動、形象展示數(shù)據(jù)的形式。A.?dāng)?shù)字 B.圖表C.動畫 D.圖形9.下列哪些圖表可以用來反映事物的分布、占比情況()。A.散點(diǎn)圖 B.氣泡圖C.詞云圖D.折線圖10.下列哪些體現(xiàn)了大數(shù)據(jù)安全的特征()A.安全屏障一旦被攻破,攻擊者就能一次性獲得較大收益。B.個人信息權(quán)利被動削弱,用戶的隱私安全受到威脅C.大數(shù)據(jù)技術(shù)被應(yīng)用到攻擊手段中,攻擊目的由原來的單純竊取數(shù)據(jù)變?yōu)椴倏v分析結(jié)果D.大數(shù)據(jù)成為高級可持續(xù)攻擊的載體三、判斷題(每小題1分,共10分)1.大數(shù)據(jù)分析中一定要考慮所有數(shù)據(jù)的準(zhǔn)確性()。2、大數(shù)據(jù)時代,事物各組成要素之間的關(guān)系將是簡單的線性因果關(guān)系。()3、政府部門可以把大數(shù)據(jù)技術(shù)融入“輿情分析”,這是大數(shù)據(jù)對決策方式的影響。()。4、網(wǎng)絡(luò)爬蟲是利用數(shù)據(jù)挖掘技術(shù)將非結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁中抽取出來,按照一定的規(guī)則和排列格式將數(shù)據(jù)進(jìn)行分類處理,并存儲成一系列具有統(tǒng)一格式的結(jié)構(gòu)化數(shù)據(jù)文件()。5、原始數(shù)據(jù)的數(shù)據(jù)質(zhì)量不一,但是有一些因素會影響數(shù)據(jù)的質(zhì)量,比如信息因素、技術(shù)因素、流程因素以及實踐因素。()6、2022年8月份銷售額與2022年7月銷售額對比稱為同比。()7、數(shù)據(jù)存儲反映系統(tǒng)中靜止的數(shù)據(jù),表現(xiàn)出靜態(tài)數(shù)據(jù)的特征。()8、同樣一份數(shù)據(jù),可以選擇使用不同類型的圖表實現(xiàn)相同目標(biāo),所以可以根據(jù)表現(xiàn)形式的美觀來決定選擇哪種圖表()。9、建立指標(biāo)體系可以按因果結(jié)構(gòu)劃分進(jìn)行指標(biāo)分解,也可按照業(yè)務(wù)職能結(jié)構(gòu)劃分映射更多維度。()10、在網(wǎng)上參加的活動,發(fā)表及閱讀什么帖子、點(diǎn)贊,也可能成為隱私。()。四、問答題(共30分)1、比較區(qū)分?jǐn)?shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約各自的目的(10分)2、根據(jù)提供的下列表1和表2數(shù)據(jù),使用維度分析思維,能夠得到哪些相關(guān)信息?(注意,這里的維度可以是1個維度,也可以是2個維度,表1和表2可以結(jié)合起來使用)(10分)表1商品信息表品牌機(jī)型容量產(chǎn)品型號上市日期售價小米86G+64GXM80632018年5月2299蘋果X128GAPPXD22017年9月6399蘋果XS256GAPPXS32018年9月10099華為Mate208G+128GHWM232018年10月4499華為Mate20pro8G+128GHWMP222018年10月6399………………表2客戶成交訂單表訂單號產(chǎn)品型號用戶名下單時間實付價折扣城市……50023861HWMP22wulei2018年10月21日61990.885北京……50023862HWMP22zhuxin2018年11月2日60990.885南京……50023863APPXS3kkoo2018年11月21日99990.9杭州………………3、闡述大數(shù)據(jù)時代,如何進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論