數(shù)據(jù)倉庫期末試卷_第1頁
數(shù)據(jù)倉庫期末試卷_第2頁
數(shù)據(jù)倉庫期末試卷_第3頁
數(shù)據(jù)倉庫期末試卷_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上數(shù)據(jù)倉庫考試試題姓名 陸志鵬 得分 一、(15分)請(qǐng)解釋“數(shù)據(jù)孤島”的含義,為什么會(huì)引起“數(shù)據(jù)孤島”現(xiàn)象,有哪些解決辦法?答:數(shù)據(jù)孤島可以認(rèn)為是"數(shù)據(jù)的污染".之所以產(chǎn)生數(shù)據(jù)孤島這樣的情況,有這么幾個(gè)原因:、對(duì)于一些大中企業(yè),數(shù)據(jù)可能分散于各個(gè)分支機(jī)構(gòu),匯總速度慢、決策速度慢,缺乏實(shí)時(shí)性管理;數(shù)據(jù)分散且缺乏標(biāo)準(zhǔn)化,形成信息孤島;公司與公司之間、部門與部門之間,數(shù)據(jù)缺乏標(biāo)準(zhǔn)化、有價(jià)值資料無法充分利用,信息化系統(tǒng)不具備數(shù)據(jù)整合功能,對(duì)決策支持能力不強(qiáng)。、信息部門建設(shè)的相對(duì)滯后,如果信息部門不能盡快滿足業(yè)務(wù)對(duì)數(shù)據(jù)處理的要求,那業(yè)務(wù)部門就可能獨(dú)自開發(fā)業(yè)務(wù)系

2、統(tǒng),這種情況現(xiàn)在還是普遍存在、缺少企業(yè)內(nèi)信息化建設(shè)的戰(zhàn)略和標(biāo)準(zhǔn),如果不能做到信息系統(tǒng)建設(shè)的統(tǒng)一,由不同部門,不同公司來建設(shè)的話,必須有一個(gè)標(biāo)準(zhǔn)能夠使得日后的互通比較容易實(shí)現(xiàn)。解決數(shù)據(jù)孤島的辦法:企業(yè)數(shù)據(jù)集成,使用數(shù)據(jù)倉庫。二、(15分)數(shù)據(jù)倉庫與數(shù)據(jù)庫系統(tǒng)有什么關(guān)系?答:數(shù)據(jù)庫一般存儲(chǔ)在線交易數(shù)據(jù),數(shù)據(jù)庫主要是處理實(shí)時(shí)性的任務(wù),是面向事務(wù)的,因此是做OLTP(聯(lián)機(jī)處理)方面的工作。數(shù)據(jù)倉庫是決策支持系統(tǒng)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境,數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問題。數(shù)據(jù)倉庫是面向主題,集成,隨時(shí)間變化,數(shù)據(jù)倉庫系統(tǒng)是一個(gè)信息提供平臺(tái),他從業(yè)務(wù)處理系統(tǒng)獲得數(shù)據(jù),主要以星型模型和

3、雪花模型進(jìn)行數(shù)據(jù)組織,并為用戶提供各種手段從數(shù)據(jù)中獲取信息和知識(shí),一般和數(shù)據(jù)挖掘結(jié)合在一起用于管理者決策,對(duì)一段時(shí)期內(nèi)集聚的數(shù)據(jù)做分析,因此是OLAP(聯(lián)機(jī)分析處理)方面的工作。數(shù)據(jù)庫是數(shù)據(jù)倉庫的基礎(chǔ)。三、(15分)什么是元數(shù)據(jù)?元數(shù)據(jù)在數(shù)據(jù)倉庫中有什么作用?怎樣建立元數(shù)據(jù)才能更好地發(fā)揮其作用?對(duì)元數(shù)據(jù)怎么管理?答:1. 元數(shù)據(jù)就是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。在數(shù)據(jù)倉庫中,元數(shù)據(jù)可對(duì)數(shù)據(jù)倉庫中的各種數(shù)據(jù)進(jìn)行詳細(xì)的描述和說明,說明每個(gè)數(shù)據(jù)的上下文關(guān)系,是每個(gè)數(shù)據(jù)具有符合現(xiàn)實(shí)的真實(shí)含義,是最終用戶了解這些數(shù)據(jù)之間的關(guān)系。2.元數(shù)據(jù)在數(shù)據(jù)倉庫中的作用:為決策支持分

4、析員和高層決策人員服務(wù)提供便利,解決面向應(yīng)用的操作性環(huán)境和數(shù)據(jù)倉庫的復(fù)雜關(guān)系,起到輔助決策分析過程中定位數(shù)據(jù)倉庫目錄的作用。3.建立的元數(shù)據(jù)支援要包括以下信息:數(shù)據(jù)結(jié)構(gòu)、用于綜合的算法、從業(yè)務(wù)到數(shù)據(jù)倉庫的規(guī)劃。4.對(duì)元數(shù)據(jù)的管理有主動(dòng)的方式和被動(dòng)的方式。元數(shù)據(jù)的管理所需要具有的標(biāo)準(zhǔn)有:1)支持企業(yè)范圍內(nèi)的體系結(jié)構(gòu)。2)基于元數(shù)據(jù)知識(shí)庫的方法。3)配置管理。4)支持開放的元數(shù)據(jù)交換標(biāo)準(zhǔn)。5)動(dòng)態(tài)交換和同步。6)支持內(nèi)部和外部系統(tǒng)。四、(15分)什么是休眠數(shù)據(jù)?處理休眠數(shù)據(jù)的方案有哪些?答:數(shù)據(jù)倉庫中那些不被經(jīng)常使用的數(shù)據(jù),即那些很少被使用的,并且有可能永遠(yuǎn)不會(huì)被使用的數(shù)據(jù),被稱為“休眠數(shù)據(jù)”。解

5、決方案:1)鄰線存儲(chǔ)方案。在數(shù)據(jù)倉庫中加入高容量、相對(duì)便宜的存儲(chǔ)系統(tǒng)形成二級(jí)數(shù)據(jù)存儲(chǔ)模式,將休眠數(shù)據(jù)從數(shù)據(jù)倉庫轉(zhuǎn)移到該系統(tǒng)中,并對(duì)外提供透明的數(shù)據(jù)訪問功能。鄰線存儲(chǔ)方案以比較經(jīng)濟(jì)的方式為數(shù)據(jù)倉庫的數(shù)據(jù)庫提供了極大的擴(kuò)充能力,并提高了整體數(shù)據(jù)訪問的性能。2)活動(dòng)監(jiān)視器。使用活動(dòng)監(jiān)視器檢測(cè)數(shù)據(jù)倉庫內(nèi)部的活動(dòng),就能搜集到如何區(qū)分休眠數(shù)據(jù)的信息。3)跨媒體存儲(chǔ)管理器??缑襟w存儲(chǔ)器對(duì)數(shù)據(jù)請(qǐng)求敏感,并按一定的周期從數(shù)據(jù)倉庫中向鄰線存儲(chǔ)系統(tǒng)中轉(zhuǎn)移數(shù)據(jù)釋放相應(yīng)的存儲(chǔ)空間。五、(15分)數(shù)據(jù)倉庫的結(jié)構(gòu)有哪三部分組成,各個(gè)部分起什么作用?答:數(shù)據(jù)倉庫結(jié)構(gòu)通常由數(shù)據(jù)倉庫、管理部分和分析工具三部分組成。1) 數(shù)據(jù)倉庫

6、管理部分。數(shù)據(jù)倉庫的數(shù)據(jù)來自多個(gè)數(shù)據(jù)源,包括企業(yè)內(nèi)部數(shù)據(jù)和市場調(diào)查與分析的外部數(shù)據(jù)。管理部分包括對(duì)數(shù)據(jù)的安全、歸檔、維護(hù)和恢復(fù)等工作。數(shù)據(jù)倉庫管理部分的組成:定義部件;數(shù)據(jù)獲取部件;管理部件;元數(shù)據(jù)管理。2) 數(shù)據(jù)倉庫工具集。數(shù)據(jù)倉庫工具集主要由一些分析工具組成,如檢索查詢工具,多維數(shù)據(jù)的OLAP分析工具,統(tǒng)計(jì)工具以及數(shù)據(jù)挖掘工具等。六、(15分)建立數(shù)據(jù)倉庫一般要做五個(gè)方面的工作,請(qǐng)?jiān)敿?xì)說明這五方面工作的具體內(nèi)容?答:1)概念模式設(shè)計(jì)。進(jìn)行概念模式設(shè)計(jì)完成的工作主要是界定系統(tǒng)邊界和確定主要的主題域及其內(nèi)容。概念模式設(shè)計(jì)的成果是在原有的數(shù)據(jù)庫的基礎(chǔ)上建立一個(gè)較為穩(wěn)固的概念模型。2)技術(shù)準(zhǔn)備工作

7、。技術(shù)準(zhǔn)備工作階段的主要工作是進(jìn)行技術(shù)評(píng)估和技術(shù)環(huán)境的準(zhǔn)備。3)邏輯模型設(shè)計(jì)。邏輯模型設(shè)計(jì)主要有以下工作:分析主題域,確定當(dāng)前要裝載的主題;確定粒度層次劃分;確定數(shù)據(jù)分割策略;關(guān)系模式定義;記錄系統(tǒng)定義。4)物理模型設(shè)計(jì)。物理模型設(shè)計(jì)主要有以下工作:確定數(shù)據(jù)存儲(chǔ)結(jié)構(gòu);確定索引策略;確定數(shù)據(jù)存放位置;確定存儲(chǔ)分配。5)數(shù)據(jù)倉庫的生成。進(jìn)行設(shè)計(jì)接口和將數(shù)據(jù)裝載入。數(shù)據(jù)裝入后,還要在其上建立數(shù)據(jù)倉庫的應(yīng)用。七、(10分)自選一題,有關(guān)數(shù)據(jù)倉庫范圍理論或應(yīng)用題,或大或小。數(shù)據(jù)倉庫的哪三級(jí)模式答:提高數(shù)據(jù)倉庫性能的方法有:1. 粒度劃分。粒度的劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量,以及所適合的查詢類型。一般需要將數(shù)據(jù)劃分為:詳細(xì)數(shù)據(jù)、輕度綜合、高度綜合3級(jí)或更多級(jí)數(shù)據(jù)。劃分粒度的步驟為:1)估算數(shù)據(jù)倉庫中數(shù)據(jù)的行數(shù)和所需占用的空間大??;2)確定粒度的劃分。2. 分割。提高數(shù)據(jù)倉庫性能的另一種方法是數(shù)據(jù)分割。數(shù)據(jù)倉庫中分片的方式有:水平分片、垂直分片、混合分片和導(dǎo)出分片。按時(shí)間進(jìn)行分割是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論