數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試題_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試題_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘試題_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1 武漢大學(xué)計(jì)算機(jī)學(xué)院 2014級(jí)研究生“數(shù)據(jù)倉庫和數(shù)據(jù)挖掘”課程期末考試試題 要求:所有的題目的解答均寫在答題紙上,需寫清楚題目的序號(hào)。每張答題紙都要寫 上姓名和學(xué)號(hào)。 一、單項(xiàng)選擇題(每小題 2分,共20分) 1. 下面列出的條目中,()不是數(shù)據(jù)倉庫的基本特征。 B A. 數(shù)據(jù)倉庫是面向主題的 B.數(shù)據(jù)倉庫是面向事務(wù)的 C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對(duì)穩(wěn)定的 D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的 2. 數(shù)據(jù)倉庫是隨著時(shí)間變化的,下面的描述不正確的是( )。 A. 數(shù)據(jù)倉庫隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容 B. 捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照 C. 數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容 C D. 數(shù)

2、據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新 綜合 3. 以下關(guān)于數(shù)據(jù)倉庫設(shè)計(jì)的說法中( )是錯(cuò)誤的。A A. 數(shù)據(jù)倉庫項(xiàng)目的需求很難把握,所以不可能從用戶的需求出發(fā)來進(jìn)行數(shù)據(jù)倉庫的設(shè) 計(jì),只能從數(shù)據(jù)出發(fā)進(jìn)行設(shè)計(jì) B. 在進(jìn)行數(shù)據(jù)倉庫主題數(shù)據(jù)模型設(shè)計(jì)時(shí),應(yīng)該按面向部門業(yè)務(wù)應(yīng)用的方式來設(shè)計(jì)數(shù)據(jù) 模型 C. 在進(jìn)行數(shù)據(jù)倉庫主題數(shù)據(jù)模型設(shè)計(jì)時(shí)要強(qiáng)調(diào)數(shù)據(jù)的集成性 D. 在進(jìn)行數(shù)據(jù)倉庫概念模型設(shè)計(jì)時(shí),需要設(shè)計(jì)實(shí)體關(guān)系圖,給出數(shù)據(jù)表的劃分,并給 出每個(gè)屬性的定義域 4. 以下關(guān)于OLAP的描述中()是錯(cuò)誤的。A A. 一個(gè)多維數(shù)組可以表示為(維 1,維2,維n) B. 維的一個(gè)取

3、值稱為該維的一個(gè)維成員 C. OLAP是聯(lián)機(jī)分析處理 D. OLAP是數(shù)據(jù)倉庫進(jìn)行分析決策的基礎(chǔ) 5. 多維數(shù)據(jù)模型中,下列()模式不屬于多維模式。 D A. 星型模式 B.雪花模式 C.星座模式 D.網(wǎng)型模式 6. 通常頻繁項(xiàng)集、頻繁閉項(xiàng)集和最大頻繁項(xiàng)集之間的關(guān)系是( )。C 7. 決策樹中不包含()結(jié)點(diǎn)。C 2 A. 根結(jié)點(diǎn) B.內(nèi)部結(jié)點(diǎn) C.外部結(jié)點(diǎn) D.葉結(jié)點(diǎn) 8. 下面選項(xiàng)中t不是s的子序列的是()。C A. s= t= B. s= t= C. s= t= D. s= t= 9. 前饋神經(jīng)網(wǎng)絡(luò)用于分類時(shí),以下( )是不合理的迭代結(jié)束條件。 D A. 前一周期所有的Awij都很小,小于

4、某個(gè)指定的閾值 B. 前一周期未正確分類的樣本百分比小于某個(gè)閾值 C. 超過預(yù)先指定的周期數(shù) D. 學(xué)習(xí)率小于某個(gè)閾值 10. 以下敘述中,()是錯(cuò)誤的。D A. 邏輯回歸用于分析二分類或有次序的依變量和自變量之間的關(guān)系 B. SVM是一種基于分類邊界的方法 C. 樸素貝葉斯算法和樹增強(qiáng)樸素貝葉斯算法是按照描述屬性是否獨(dú)立來劃分的 D. 以上都不對(duì) 二、 (20分)假設(shè)某大型人事部門已有一個(gè)人事管理系統(tǒng),包含如下數(shù)據(jù)表: 職工(編號(hào),姓名,出生日期,工作地點(diǎn),月工資,備注) 現(xiàn)要設(shè)計(jì)一個(gè)人事數(shù)據(jù)倉庫,用于分析各地區(qū)(華北、華中、華東、 ,) 、各年齡層次 (老、中、青)的工資水平(高、中、低)

5、等。 回答以下問題: (1) 根據(jù)你的思考設(shè)計(jì)該數(shù)據(jù)倉庫的模式圖, 包含每個(gè)維表和事實(shí)表的結(jié)構(gòu)。(10分) (2) 指出你設(shè)計(jì)的數(shù)據(jù)倉庫屬于哪種模式。 (5分) (3) 由出生日期,工作地點(diǎn),月工資 的基本方體開始,求華東地區(qū)的青年職工中高 收入的人數(shù),應(yīng)當(dāng)執(zhí)行哪些 OLAP操作? ( 5分) 三、 (20分)有一個(gè)如表1所示的事務(wù)數(shù)據(jù)庫,設(shè)最小支持度為 40%,最小置信度為 80%。 表1 一個(gè)事務(wù)數(shù)據(jù)庫 TID (編號(hào)) Itemset (項(xiàng)集) 1 1 , 3, 4 2 2, 3, 4, 5 3 1, 3, 5, 7 4 2、5 5 1, 2, 4, 6, 7 6 2, 4, 6 回答以

6、下問題: (1) 采用Apriori算法求出所有的頻繁集。要求給出求解過程。 (15分) 3 (2) 求出所有與元規(guī)則item 1 A item2item3”相匹配的強(qiáng)關(guān)聯(lián)規(guī)則。 (5分) 四、(15分)對(duì)于如表2所示的決策表(U , C U D), C=a, b, c, d, D=e,回答以 下問題: (1) 求 U/C 和 U/D。(5 分) (2) 求POSC(D),該決策表是否為一致(或協(xié)調(diào))決策表? (5分) (3) 采用分辨矩陣求其所有條件屬性約簡(jiǎn)和核。 (5分) 表2 一個(gè)決策表 U a b c d e 1 1 0 2 1 1 2 1 0 2 0 1 3 1 2 0 0 2 4 1 2 2 1 0 5 2 1 0 0 2 6 2 1 1 0 2 7 2 1 2 1 1 五、(25分)回答以下關(guān)于聚類的問題: (1) k-中心點(diǎn)算法和k-均值算法相比有什么優(yōu)點(diǎn)? ( 5分) (2) BIRCH算法是什么類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論