數(shù)據(jù)倉庫和數(shù)據(jù)挖掘試題答案南京理工研究生_第1頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘試題答案南京理工研究生_第2頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘試題答案南京理工研究生_第3頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘試題答案南京理工研究生_第4頁
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘試題答案南京理工研究生_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘I. 選擇題,為每個(gè)問題選擇最合適的答案(10×2%20%)1. 數(shù)據(jù)倉庫上的業(yè)務(wù)處理稱作B。A. 聯(lián)機(jī)事務(wù)處理B. 聯(lián)機(jī)分析處理C. 聯(lián)機(jī)輸入處理D. 聯(lián)機(jī)查詢處理2. 在自然演化體系結(jié)構(gòu)中,關(guān)于導(dǎo)致數(shù)據(jù)缺乏可信性的原因的說法哪個(gè)不正確?DA. 數(shù)據(jù)無時(shí)基B. 抽取程序的算法有差異C. 抽取的層次不同D. 缺乏集成性3. 下面哪項(xiàng)關(guān)于OLTP與OLAP訪問特點(diǎn)的說法是不正確的。AA. OLTP和OLAP對(duì)于響應(yīng)時(shí)間的要求都高B. OLTP訪問頻率高,OLAP訪問頻率低C. OLAP訪問大量的歷史,執(zhí)行大量統(tǒng)計(jì)操作D. OLTP數(shù)據(jù)處理具有并發(fā)性4. 下面關(guān)于數(shù)據(jù)倉

2、庫中數(shù)據(jù)的說法錯(cuò)誤的是?A. 數(shù)據(jù)越詳細(xì),粒度越小,層次級(jí)別就越高。B. 在估計(jì)直接存儲(chǔ)設(shè)備數(shù)時(shí),如數(shù)據(jù)超過1000萬行必須強(qiáng)制采取雙重粒度級(jí)。C. 數(shù)據(jù)倉庫大部分分析是針對(duì)被壓縮的、存取效率高的輕度級(jí)數(shù)據(jù)進(jìn)行的。D. 數(shù)據(jù)分割便于數(shù)據(jù)的重構(gòu)、重組和恢復(fù),以提高創(chuàng)建索引和順序掃描的效率。5. 下面關(guān)于數(shù)據(jù)倉庫的數(shù)據(jù)存儲(chǔ)方式的說法哪個(gè)是不正確的?FE. 虛擬存儲(chǔ)方式中,數(shù)據(jù)倉庫的數(shù)據(jù)仍然在源數(shù)據(jù)中。F. 星型模式下的維表規(guī)范化的,而雪花模式下的不需要規(guī)范化G. 在查詢效率方面,星型模式效率更高H. 在事實(shí)星座模式中有多個(gè)事實(shí)表,且它們共享相同的維表6. 下面關(guān)于星型模型的說法哪個(gè)是不正確的?I.

3、 有一個(gè)包含大量數(shù)據(jù)的事實(shí)表J. 有一組小的附屬表,稱為維表,每維一個(gè)。K. 事實(shí)表的每個(gè)字段都是事實(shí)度量字段L. 事實(shí)中每條元組都含有指向各個(gè)維表的外鍵和一些相應(yīng)的度量數(shù)據(jù)。7. 下面關(guān)于數(shù)據(jù)倉庫的數(shù)據(jù)追加的說法哪個(gè)是不正確的?CA. 時(shí)標(biāo)法需要為記錄數(shù)據(jù)增加一個(gè)時(shí)間標(biāo)志。B. 前后映像文件方法需要掃描整個(gè)數(shù)據(jù)庫,占用較多資源,對(duì)性能有較大影響C. DELTA不需要掃描整個(gè)數(shù)據(jù)庫,效率較高,應(yīng)用普遍D. 日志文件法也不需要掃描整個(gè)數(shù)據(jù)庫,是固有機(jī)制。8. 假設(shè)收入屬性的最小與最大分別是10000和90000,現(xiàn)在想把當(dāng)前值30000映射到區(qū)間0,1,若采用最大最小數(shù)據(jù)規(guī)范方法,計(jì)算結(jié)果是多少

4、?BA. 0.25B. 0.375C. 0.125D. 0.59. 下面關(guān)于維的概念哪個(gè)是不正確的? CA. 維是人們觀察數(shù)據(jù)的特定角度。B. 維的層次性是由觀察數(shù)據(jù)細(xì)致程度不同造成的。C. “某年某月某日”是時(shí)間維的層次。D. “月、季、年”是時(shí)間維的層次。10. 數(shù)據(jù)倉庫開發(fā)應(yīng)用周期可分為三個(gè)階段,下列哪項(xiàng)不是其中某個(gè)階段? C? BA. 規(guī)劃分析階段B. 體系結(jié)構(gòu)設(shè)計(jì)階段C. 設(shè)計(jì)實(shí)施階段D. 使用維護(hù)階段II. 簡(jiǎn)答題 (4×5%20%)1. 在現(xiàn)實(shí)世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的,描述處理該問題的方法?(至少給出5種不同的方法) 空缺的數(shù)據(jù)會(huì)影響數(shù)據(jù)挖掘的質(zhì)量,

5、所以應(yīng)該處理忽略該元組人工填寫空缺值使用一個(gè)全局常量填空使用屬性的平均值填充空缺值使用與給定元組屬同一類的所有樣本的平均值使用最可能的值填充空缺值2. 簡(jiǎn)述數(shù)據(jù)倉庫的四個(gè)基本特征?面向主題,集成的,非易失的,隨時(shí)間改變的3. 簡(jiǎn)述輪轉(zhuǎn)綜合數(shù)據(jù)存儲(chǔ)的過程?簡(jiǎn)單逐日堆積數(shù)據(jù)的一種變種。數(shù)據(jù)用與前面相同的處理方法從操作型環(huán)境輸入到數(shù)據(jù)倉庫環(huán)境中,只是在輪轉(zhuǎn)綜合文件中的數(shù)據(jù)才被輸入到不同的結(jié)構(gòu)形式中。4. 簡(jiǎn)述數(shù)據(jù)庫數(shù)據(jù)與數(shù)據(jù)倉庫數(shù)據(jù)的異同?II. 設(shè)計(jì)題 (5×12%60%)1、 假定大學(xué)的數(shù)據(jù)倉庫包含4個(gè)維student學(xué)生、course課程、semester學(xué)期、instructor教

6、師,2個(gè)度量count和avg_grade。在最低的概念層(例如對(duì)于給定的學(xué)生、課程、學(xué)期和教師組合),度量avg_grade存放學(xué)生的實(shí)際成績(jī)。在較高概念層,avg_grade存放給定組合的平均成績(jī)。a)為數(shù)據(jù)倉庫畫出雪花模式圖8%b)由基本立方體學(xué)生、課程、學(xué)期、教師開始,列出大學(xué)每個(gè)學(xué)生的“計(jì)算機(jī)導(dǎo)論”課程的平均成績(jī),應(yīng)當(dāng)使用哪些OLAP操作(如由學(xué)期上卷到年)?4%上卷到年,切塊(學(xué)期、課程)、切片2、 假定數(shù)據(jù)倉庫包含4個(gè)維date時(shí)間, spectator觀眾, location地區(qū)和game節(jié)目,2個(gè)度量count和charge。其中,charge是觀眾在給定的日期觀看節(jié)目的付費(fèi)

7、。觀眾可以是學(xué)生、成年人或老人,每類觀眾有不同的收費(fèi)標(biāo)準(zhǔn)。a)畫出該數(shù)據(jù)倉庫的星形模式圖8%b)由基本立方體date,spectator,location,game開始,為列出2011年觀眾在GM-Place的總付費(fèi),應(yīng)當(dāng)執(zhí)行哪些OLAP操作?4% 3.4假定BigUniversity的數(shù)據(jù)倉庫包含如下4個(gè)維:student(student_name, area_id, major, status, university),course(course_name, department),semester(semester, year)和instructor(dept, rank);2個(gè)度量:c

8、ount和avg_grade。 在最低概念層,度量avg_grade存放學(xué)生的實(shí)際課程成績(jī)。在較高概念層,avg_grade存放給定組合的平均成績(jī)。 (a) 為該數(shù)據(jù)倉庫畫出雪花形模式圖。 (b) 由基本方體student, course, semester, instructor開始,為列出BigUniversity每個(gè)學(xué)生的CS課程的平均成績(jī),應(yīng)當(dāng)使用哪些特殊的OLAP操作。 解答: a) 為該數(shù)據(jù)倉庫畫出雪花形模式圖。雪花模式如圖所示。 b) 由基本方體student, course, semester, instructor開始,為列出BigUniversity每個(gè)學(xué)生的CS課程的平均

9、成績(jī),應(yīng)當(dāng)使用哪些特殊的OLAP操作。 這些特殊的聯(lián)機(jī)分析處理(OLAP)操作有: i. 沿課程(course)維從course_id“上卷”到department。 ii. 沿學(xué)生(student)維從student_id“上卷”到university。 iii. 取department=“CS”和university=“Big University”,沿課程(course)維和學(xué)生(student)維切片。 iv. 沿學(xué)生(student)維從university下鉆到student_name。 3.5 假定數(shù)據(jù)倉庫包含4個(gè)維:date, spectator, location和game;

10、和2個(gè)度量:count和charge,其中charge是觀眾在給定的日期觀看節(jié)目的付費(fèi)。觀眾可以是學(xué)生、成年人或老年人,每類觀眾有不同的收費(fèi)標(biāo)準(zhǔn)。 (e) 畫出該數(shù)據(jù)倉庫的星形模式圖。 (f) 由基本方體date, spectator, location, game開始,為列出2004年學(xué)生觀眾在GM_Place的總付費(fèi),應(yīng)當(dāng)執(zhí)行那些OLAP操作? 解答: (a) 畫出該數(shù)據(jù)倉庫的星形模式圖。 (b) 由基本方體date, spectator, location, game開始,為列出2004年學(xué)生觀眾在GM_Place的總付費(fèi),應(yīng)當(dāng)執(zhí)行那些OLAP操作? 􀁺 沿日期(date)軸從date_id上卷到y(tǒng)ear。 􀁺 沿節(jié)目(game)軸從game_id上卷到all。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論