數(shù)據(jù)庫(kù)未來(lái)發(fā)展趨勢(shì)(更新版)_第1頁(yè)
數(shù)據(jù)庫(kù)未來(lái)發(fā)展趨勢(shì)(更新版)_第2頁(yè)
數(shù)據(jù)庫(kù)未來(lái)發(fā)展趨勢(shì)(更新版)_第3頁(yè)
數(shù)據(jù)庫(kù)未來(lái)發(fā)展趨勢(shì)(更新版)_第4頁(yè)
數(shù)據(jù)庫(kù)未來(lái)發(fā)展趨勢(shì)(更新版)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、東華大學(xué)報(bào)告名稱: 數(shù)據(jù)庫(kù)技術(shù)最新發(fā)展學(xué) 院:專 業(yè):姓 名:學(xué) 號(hào):指導(dǎo)老師: 2015-12-101.引言自從計(jì)算機(jī)問(wèn)世以后,就有了處理數(shù)據(jù)、管理數(shù)據(jù)的需求,由此,計(jì)算機(jī)技術(shù)新的研究分支數(shù)據(jù)庫(kù)技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)庫(kù)(Databases,簡(jiǎn)稱DB)是指長(zhǎng)期保存在計(jì)算機(jī)的存儲(chǔ)設(shè)備上、并按照某種模型組織起來(lái)的、可以被各種用戶或應(yīng)用共享的數(shù)據(jù)的集合。數(shù)據(jù)庫(kù)管理系統(tǒng)(Database Management Systems,簡(jiǎn)稱DBMS)是指提供各種數(shù)據(jù)管理服務(wù)的計(jì)算機(jī)軟件系統(tǒng),這種服務(wù)包括數(shù)據(jù)對(duì)象定義、數(shù)據(jù)存儲(chǔ)與備份、數(shù)據(jù)訪問(wèn)與更新、數(shù)據(jù)統(tǒng)計(jì)與分析、數(shù)據(jù)安全保護(hù)、數(shù)據(jù)庫(kù)運(yùn)行管理以及數(shù)據(jù)庫(kù)建立和維護(hù)等。

2、隨著計(jì)算機(jī)應(yīng)用領(lǐng)域的不斷拓展和多媒體技術(shù)的發(fā)展,數(shù)據(jù)庫(kù)已是計(jì)算機(jī)科學(xué)技術(shù)中發(fā)展最快、應(yīng)用最廣泛的重要分支之一。從20世紀(jì)60年代末開(kāi)始,數(shù)據(jù)庫(kù)系統(tǒng)已從第一代層次數(shù)據(jù)庫(kù)、網(wǎng)狀數(shù)據(jù)庫(kù),第二代的關(guān)系數(shù)據(jù)庫(kù)系統(tǒng),發(fā)展到第三代以面向?qū)ο竽P蜑橹饕卣鞯臄?shù)據(jù)庫(kù)系統(tǒng)。關(guān)系數(shù)據(jù)庫(kù)理論和技術(shù)在7080年代得到長(zhǎng)足的發(fā)展和廣泛而有效地應(yīng)用,80年代,關(guān)系數(shù)據(jù)庫(kù)成為應(yīng)用的主流,幾乎所有新推出的數(shù)據(jù)庫(kù)管理系統(tǒng)(DataBaseManagementSystem,DBMS)產(chǎn)品都是關(guān)系型的,他在計(jì)算機(jī)數(shù)據(jù)管理的發(fā)展史上是一個(gè)重要的里程碑,這種數(shù)據(jù)庫(kù)具有數(shù)據(jù)結(jié)構(gòu)化、最低冗余度、較高的程序與數(shù)據(jù)獨(dú)立性、易于擴(kuò)充、易于編制應(yīng)用

3、程序等優(yōu)點(diǎn),目前較大的信息系統(tǒng)都是建立在關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)理論設(shè)計(jì)之上的。但是,這些數(shù)據(jù)庫(kù)系統(tǒng)包括層次數(shù)據(jù)庫(kù)、網(wǎng)狀數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù),不論其模型和技術(shù)上有何差別,卻主要是面向和支持商業(yè)和事務(wù)處理應(yīng)用領(lǐng)域的數(shù)據(jù)管理。然而,隨著用戶應(yīng)用需求的提高、硬件技術(shù)的發(fā)展和InternetIntranet提供的豐富多彩的多媒體交流方式,促進(jìn)了數(shù)據(jù)庫(kù)技術(shù)與網(wǎng)絡(luò)通信技術(shù)、人工智能技術(shù)、面向?qū)ο蟪绦蛟O(shè)計(jì)技術(shù)、并行計(jì)算技術(shù)等相互滲透,互相結(jié)合,成為當(dāng)前數(shù)據(jù)庫(kù)技術(shù)發(fā)展的主要特征,形成了數(shù)據(jù)庫(kù)新技術(shù)。目前,數(shù)據(jù)庫(kù)技術(shù)已相當(dāng)成熟,被廣泛應(yīng)用于各行各業(yè)中,成為現(xiàn)代信息技術(shù)的重要組成部分,是現(xiàn)代計(jì)算機(jī)信息系統(tǒng)和計(jì)算機(jī)應(yīng)用系統(tǒng)的基

4、礎(chǔ)和核心。2.數(shù)據(jù)庫(kù)技術(shù)的發(fā)展歷程在數(shù)據(jù)庫(kù)系統(tǒng)出現(xiàn)以前,各個(gè)應(yīng)用擁有自己的專用數(shù)據(jù),通常存放在專用文件中,這些數(shù)據(jù)與其他文件中數(shù)據(jù)有大量的重復(fù),造成了資源與人力的浪費(fèi)。隨著機(jī)器內(nèi)存儲(chǔ)數(shù)據(jù)的日益增多,數(shù)據(jù)重復(fù)的問(wèn)題越來(lái)越突出。于是人們就想到將數(shù)據(jù)集中存儲(chǔ)、統(tǒng)一管理,這樣就演變成數(shù)據(jù)庫(kù)管理系統(tǒng)而形成數(shù)據(jù)庫(kù)技術(shù)。數(shù)據(jù)庫(kù)的誕生以20世紀(jì)60年代IBM 推出的數(shù)據(jù)庫(kù)管理產(chǎn)品IMS為標(biāo)志。1969年IBM 公司研制了基于層次模型數(shù)據(jù)庫(kù)管理系統(tǒng)IMS(Information Management System),并作為商品化軟件投入市場(chǎng)。數(shù)據(jù)庫(kù)的出現(xiàn),實(shí)現(xiàn)了數(shù)據(jù)資源的整體管理。IMS系統(tǒng)的推出,使得數(shù)據(jù)庫(kù)概

5、念得到了普及,也使得人們認(rèn)識(shí)到數(shù)據(jù)的價(jià)值和統(tǒng)一管理的必要性。由于IMS是將數(shù)據(jù)組織成層次的形式來(lái)管理,對(duì)非層次數(shù)據(jù)使用虛擬紀(jì)錄,大量指針的使用降低了數(shù)據(jù)使用的效率,同時(shí),數(shù)據(jù)庫(kù)管理系統(tǒng)提供的數(shù)據(jù)模型機(jī)及數(shù)據(jù)庫(kù)語(yǔ)言比較低級(jí),數(shù)據(jù)的獨(dú)立性也比較差,給使用帶來(lái)了很大的局限性。為了克服這些缺點(diǎn),美國(guó)數(shù)據(jù)庫(kù)系統(tǒng)語(yǔ)言協(xié)會(huì)(CODASYL,即Conference On Data System Language)下屬的數(shù)據(jù)庫(kù)任務(wù)組(DBTG,即DataBase Task Group)對(duì)數(shù)據(jù)庫(kù)的方法和技術(shù)進(jìn)行了系統(tǒng)研究,并提出了著名的DBTG報(bào)告。該報(bào)告確定并建立了數(shù)據(jù)庫(kù)系統(tǒng)的許多基本概念、方法和技術(shù),報(bào)告成為

6、網(wǎng)狀數(shù)據(jù)模型的典型技術(shù)代表,它奠定了數(shù)據(jù)庫(kù)發(fā)展的基礎(chǔ),并影響著以后的研究。網(wǎng)狀模型是基于圖來(lái)組織數(shù)據(jù)的,對(duì)數(shù)據(jù)的訪問(wèn)和操縱需要遍歷數(shù)據(jù)鏈來(lái)完成。因這種有效的實(shí)現(xiàn)方式對(duì)系統(tǒng)使用者提出了很高的要求,所以阻礙了系統(tǒng)的推廣應(yīng)用。1970年IBM公司的E.F.Codd表了著名的基于關(guān)系模型的數(shù)據(jù)庫(kù)技術(shù)的論文大型共享數(shù)據(jù)庫(kù)數(shù)據(jù)的關(guān)系模型,并獲得1981年ACM圖靈獎(jiǎng),標(biāo)志著關(guān)系型數(shù)據(jù)庫(kù)模型的誕生。由于關(guān)系模型的簡(jiǎn)單易理解及其所具有的堅(jiān)實(shí)理論基礎(chǔ),整個(gè)20世紀(jì)70年代和80 年代的前半期,數(shù)據(jù)庫(kù)界集中圍繞關(guān)系數(shù)據(jù)庫(kù)進(jìn)行了大量的研究和開(kāi)發(fā)工作,對(duì)關(guān)系數(shù)據(jù)庫(kù)概念的實(shí)用化投入了大量的精力。80年代以來(lái),關(guān)系系統(tǒng)逐

7、漸代替網(wǎng)狀系統(tǒng)和層次系統(tǒng)而占領(lǐng)了市場(chǎng)。但是,關(guān)系模型不能用一張表模型表示出復(fù)雜對(duì)象的語(yǔ)義,不擅長(zhǎng)于數(shù)據(jù)類型較多、較復(fù)雜的領(lǐng)域。在這種需求的驅(qū)動(dòng)下,數(shù)據(jù)庫(kù)模型又進(jìn)入了新的研究階段面向?qū)ο髷?shù)據(jù)庫(kù)的研究。面向?qū)ο髷?shù)據(jù)庫(kù)是指支持面向?qū)ο筇匦缘臄?shù)據(jù)庫(kù),它提供了面向?qū)ο蟮慕7椒?、編程語(yǔ)言和數(shù)據(jù)庫(kù)語(yǔ)言。1989年在東京舉行了關(guān)于面向?qū)ο髷?shù)據(jù)庫(kù)的國(guó)際會(huì)議,第一次定義了面向?qū)ο髷?shù)據(jù)庫(kù)管理系統(tǒng)所應(yīng)實(shí)現(xiàn)的功能:支持復(fù)雜對(duì)象、支持對(duì)象標(biāo)識(shí)、允許對(duì)象封裝、支持類型或類、支持繼承、避免過(guò)早綁定、計(jì)算性完整、可擴(kuò)充、能記住數(shù)據(jù)位置、能管理非常大型的數(shù)據(jù)庫(kù)、接收并發(fā)用戶、能從軟硬件失效中恢復(fù)、用簡(jiǎn)單的方法支持?jǐn)?shù)據(jù)查詢。作為

8、一項(xiàng)新興的技術(shù),面向?qū)ο髷?shù)據(jù)庫(kù)的發(fā)展遠(yuǎn)不如關(guān)系數(shù)據(jù)庫(kù)成熟。因此,面向?qū)ο髷?shù)據(jù)庫(kù)還有待于進(jìn)一步研究。3.數(shù)據(jù)庫(kù)技術(shù)的現(xiàn)狀及發(fā)展趨勢(shì)1980年以前,數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,主要體現(xiàn)在數(shù)據(jù)庫(kù)的模型設(shè)計(jì)上。進(jìn)入90年代后,計(jì)算機(jī)領(lǐng)域中其它新興技術(shù)的發(fā)展對(duì)數(shù)據(jù)庫(kù)技術(shù)產(chǎn)生了重大影響。數(shù)據(jù)庫(kù)技術(shù)與網(wǎng)絡(luò)通信技術(shù)、人工智能技術(shù)、多媒體技術(shù)等相互滲透,相互結(jié)合,使數(shù)據(jù)庫(kù)技術(shù)的新內(nèi)容層出不窮。數(shù)據(jù)庫(kù)的許多概念、應(yīng)用領(lǐng)域,甚至某些原理都有了重大的發(fā)展和變化,形成了數(shù)據(jù)庫(kù)領(lǐng)域眾多的研究分支和課題,產(chǎn)生了一系列新型數(shù)據(jù)庫(kù)。分析目前數(shù)據(jù)庫(kù)的應(yīng)用情況,可以發(fā)現(xiàn):經(jīng)過(guò)多年的積累,企業(yè)和部門積累的數(shù)據(jù)越來(lái)越多,許多企業(yè)面臨著“數(shù)據(jù)爆炸

9、”可知識(shí)缺乏的困境。如何解決海量數(shù)據(jù)的存儲(chǔ)管理、如何挖掘大量數(shù)據(jù)中包含的信息和知識(shí),已成為目前的急待解決的問(wèn)題。所以,數(shù)據(jù)庫(kù)技術(shù)除了核心問(wèn)題的研究外,市場(chǎng)的需求導(dǎo)致了以下幾種數(shù)據(jù)庫(kù)的發(fā)展及一些研究熱點(diǎn):3.1 分布式數(shù)據(jù)庫(kù)80年代,研制了許多分布式數(shù)據(jù)庫(kù)的原型系統(tǒng),攻克了分布式數(shù)據(jù)庫(kù)中許多理論和技術(shù)難點(diǎn)。90年代開(kāi)始,主要的數(shù)據(jù)庫(kù)廠商對(duì)集中式數(shù)據(jù)庫(kù)管理系統(tǒng)的核心加以改造,逐步加入分布處理功能,向分布式數(shù)據(jù)庫(kù)管理系統(tǒng)發(fā)展。目前,分布式數(shù)據(jù)庫(kù)開(kāi)始進(jìn)入實(shí)用階段?,F(xiàn)有的分布式數(shù)據(jù)庫(kù)技術(shù)尚不能解決異構(gòu)數(shù)據(jù)和系統(tǒng)的許多問(wèn)題。雖然已有很多數(shù)據(jù)庫(kù)研究單位在進(jìn)行異構(gòu)系統(tǒng)集成問(wèn)題的探索,并且已有一些系統(tǒng)宣稱在一定

10、程度上實(shí)現(xiàn)了異構(gòu)系統(tǒng)的互操作,但是異構(gòu)分布式數(shù)據(jù)庫(kù)技術(shù)還未成熟。3.2 并行數(shù)據(jù)庫(kù)并行數(shù)據(jù)庫(kù)系統(tǒng)是在并行機(jī)上運(yùn)行的具有并行處理能力的數(shù)據(jù)庫(kù)系統(tǒng)。最近,一些著名的數(shù)據(jù)庫(kù)廠商開(kāi)始在數(shù)據(jù)庫(kù)產(chǎn)品中增加并行處理能力,試圖在并行計(jì)算機(jī)系統(tǒng)上運(yùn)行。他們只是使用并行數(shù)據(jù)流方法對(duì)原有系統(tǒng)加以簡(jiǎn)單的擴(kuò)充,既沒(méi)有使用并行數(shù)據(jù)操作算法,也沒(méi)有并行數(shù)據(jù)查詢優(yōu)化的能力,都不是真正的并行數(shù)據(jù)庫(kù)系統(tǒng)。目前,并行數(shù)據(jù)庫(kù)的研究工作集中在體系結(jié)構(gòu)、并行算法與查詢優(yōu)化等。3.3 主動(dòng)數(shù)據(jù)庫(kù)主動(dòng)數(shù)據(jù)庫(kù)是相對(duì)于傳統(tǒng)數(shù)據(jù)庫(kù)的被動(dòng)性而言的。許多實(shí)際的應(yīng)用領(lǐng)域,如計(jì)算機(jī)集成制造系統(tǒng)、管理信息系統(tǒng)、辦公室自動(dòng)化系統(tǒng)中常常希望數(shù)據(jù)庫(kù)系統(tǒng)在緊急情況

11、下能根據(jù)數(shù)據(jù)庫(kù)的當(dāng)前狀態(tài),主動(dòng)適時(shí)地做出反應(yīng),執(zhí)行某些操作,向用戶提供有關(guān)信息。傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)是被動(dòng)的系統(tǒng),它只能被動(dòng)地按照用戶給出的明確請(qǐng)求執(zhí)行相應(yīng)的數(shù)據(jù)庫(kù)操作,很難充分適應(yīng)這些應(yīng)用的主動(dòng)要求,因此在傳統(tǒng)數(shù)據(jù)庫(kù)基礎(chǔ)上,結(jié)合人工智能技術(shù)和面向?qū)ο蠹夹g(shù)提出了主動(dòng)數(shù)據(jù)庫(kù)。主動(dòng)數(shù)據(jù)庫(kù)的主要目標(biāo)是提供對(duì)緊急情況及時(shí)反應(yīng)的能力,同時(shí)提高數(shù)據(jù)庫(kù)管理系統(tǒng)的模塊化程度。主動(dòng)數(shù)據(jù)庫(kù)通常采用的方法是在傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)中嵌入!#(即事件條件動(dòng)作)規(guī)則,在某一事件發(fā)生時(shí)引發(fā)數(shù)據(jù)庫(kù)管理系統(tǒng)去檢測(cè)數(shù)據(jù)庫(kù)當(dāng)前狀態(tài),看是否滿足設(shè)定的條件,若條件滿足,便觸發(fā)規(guī)定動(dòng)作的執(zhí)行。3.4 知識(shí)庫(kù)知識(shí)數(shù)據(jù)庫(kù)系統(tǒng)的功能是如何把由大量的事實(shí)、

12、規(guī)則、概念組成的知識(shí)存儲(chǔ)起來(lái),進(jìn)行管理,并向用戶提供方便快速的檢索、查詢手段。因此,知識(shí)數(shù)據(jù)庫(kù)可定義為:知識(shí)、經(jīng)驗(yàn)、規(guī)則和事實(shí)的集合。知識(shí)數(shù)據(jù)庫(kù)系統(tǒng)應(yīng)具備對(duì)知識(shí)的表示方法;對(duì)知識(shí)系統(tǒng)化的組織管理;知識(shí)庫(kù)的操作;庫(kù)的查詢與檢索;知識(shí)的獲取與學(xué)習(xí);知識(shí)的編輯;庫(kù)的管理等功能。知識(shí)數(shù)據(jù)庫(kù)是人工智能技術(shù)與數(shù)據(jù)庫(kù)技術(shù)的結(jié)合。3.5 多媒體數(shù)據(jù)庫(kù)隨著多媒體技術(shù)的發(fā)展,多媒體應(yīng)用逐步深入,多媒體應(yīng)用涉及大量的多媒體信息,它們包括圖形、文本、圖像、聲音、視頻等信息。多媒體信息系統(tǒng)的建立強(qiáng)烈地呼喚著管理多媒體的數(shù)據(jù)庫(kù)技術(shù),在這樣的背景下,產(chǎn)生了多媒體數(shù)據(jù)庫(kù)技術(shù)。多媒體數(shù)據(jù)庫(kù)應(yīng)具備的功能要求為:能表示和理解多媒體

13、數(shù)據(jù),能刻畫(huà)、管理和表現(xiàn)各種媒體數(shù)據(jù)的特性和相互關(guān)系;具備物理數(shù)據(jù)獨(dú)立性、邏輯數(shù)據(jù)獨(dú)立性和媒體數(shù)據(jù)獨(dú)立性,媒體類型可擴(kuò)展;提供更為靈活的模式定義和修改功能,支持模式進(jìn)化與演變,具備某些長(zhǎng)事務(wù)處理的能力;提供多媒體訪問(wèn)的多種手段,近似性查詢,混合方式訪問(wèn)等。多媒體數(shù)據(jù)管理系統(tǒng)在多媒體應(yīng)用中非常重要,它為多媒體應(yīng)用提供了基本數(shù)據(jù)支撐。多媒體數(shù)據(jù)庫(kù)的研究始于80年代中期,在多年的技術(shù)研究和系統(tǒng)開(kāi)發(fā)中,獲得了很大的成果。但目前還沒(méi)有功能完善、技術(shù)成熟的多媒體數(shù)據(jù)庫(kù)管理系統(tǒng)。3.6 XML數(shù)據(jù)庫(kù)經(jīng)過(guò)近幾年業(yè)界同仁的共同努力,XML數(shù)據(jù)庫(kù)技術(shù)取得了很大的進(jìn)展,已經(jīng)有若干種XML數(shù)據(jù)庫(kù)產(chǎn)品問(wèn)世并服務(wù)于社會(huì)生

14、活的各個(gè)方面。但是,XML數(shù)據(jù)庫(kù)的事業(yè)才剛剛開(kāi)始,還有很多問(wèn)題等待著我們?nèi)ソ鉀Q。 未來(lái)幾年,XML數(shù)據(jù)庫(kù)技術(shù)有可能在下述方面取得進(jìn)展:異構(gòu)數(shù)據(jù)源的集成;底層索引結(jié)構(gòu); 并發(fā)加鎖協(xié)議。XML模式規(guī)范化是一個(gè)值得關(guān)注的方向。一旦取得突破,將會(huì)使我們可以像在關(guān)系庫(kù)中那樣方便地設(shè)計(jì)XML數(shù)據(jù)庫(kù)的結(jié)構(gòu),消除數(shù)據(jù)的冗余和不一致現(xiàn)象。目前,這一領(lǐng)域已經(jīng)成為學(xué)術(shù)界關(guān)注的熱點(diǎn)。但是,完整的、為業(yè)界所公認(rèn)的理論體系尚未建立。 3.7 模糊數(shù)據(jù)庫(kù)模糊數(shù)據(jù)庫(kù)是在一般數(shù)據(jù)庫(kù)系統(tǒng)中引入”模糊”概念,進(jìn)而對(duì)模糊數(shù)據(jù)、數(shù)據(jù)間的模糊關(guān)系與模糊約束實(shí)施模糊數(shù)據(jù)操作和查詢的數(shù)據(jù)庫(kù)系統(tǒng)。模糊數(shù)據(jù)庫(kù)系統(tǒng)中的研究?jī)?nèi)容涉及模糊數(shù)據(jù)庫(kù)的形式

15、定義、模糊數(shù)據(jù)庫(kù)的數(shù)據(jù)模型、模物數(shù)據(jù)庫(kù)語(yǔ)言設(shè)計(jì)、模糊數(shù)據(jù)庫(kù)設(shè)計(jì)方法及模糊數(shù)據(jù)庫(kù)管理系統(tǒng)的實(shí)現(xiàn)。近年來(lái),也有許多工作是對(duì)關(guān)系之外的其它效據(jù)模型進(jìn)行模糊擴(kuò)展,如模糊E-R(實(shí)體關(guān)系)、模糊多媒體數(shù)據(jù)庫(kù)等。當(dāng)前,科研人員在模糊數(shù)據(jù)庫(kù)的研究、開(kāi)發(fā)與應(yīng)用系統(tǒng)的建立方面都做了不少工作,但是,擺在人們面前的問(wèn)題是如何進(jìn)一步研究與開(kāi)發(fā)大型適用的模糊數(shù)據(jù)庫(kù)商業(yè)性系統(tǒng)。3.8 數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理(OLAP)為了有效地支持決策分析,近幾年人們提出了數(shù)據(jù)倉(cāng)庫(kù)的概念。數(shù)據(jù)倉(cāng)庫(kù)就是從不同的源數(shù)據(jù)中抽取數(shù)據(jù),將其整理轉(zhuǎn)換成新的存儲(chǔ)格式,為決策目的將數(shù)據(jù)聚合在一種特殊的格式中,這種支持管理決策過(guò)程的、面向主題的、集成的、

16、穩(wěn)定的、不同時(shí)的數(shù)據(jù)聚合稱為數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)。數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的組織方式有虛擬存儲(chǔ)、基于關(guān)系表的存儲(chǔ)和多維數(shù)據(jù)庫(kù)存儲(chǔ)3種存儲(chǔ)方式。整個(gè)倉(cāng)庫(kù)系統(tǒng)可分為數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)與管理、分析處理3個(gè)功能部分。由于數(shù)據(jù)倉(cāng)庫(kù)是集成信息的存儲(chǔ)中心,由數(shù)據(jù)存儲(chǔ)管理器收集整理源信息的數(shù)據(jù)成為倉(cāng)庫(kù)系統(tǒng)使用的數(shù)據(jù)格式和數(shù)據(jù)模型,并自動(dòng)監(jiān)測(cè)數(shù)據(jù)源中數(shù)據(jù)的變化,反映到存儲(chǔ)中心,對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行更新維護(hù)。而聯(lián)機(jī)分析處理(OLAP)是數(shù)據(jù)倉(cāng)庫(kù)上的最重要應(yīng)用,是決策分析的關(guān)鍵。數(shù)據(jù)倉(cāng)庫(kù)是為了有效地支持決策分析,而從操作數(shù)據(jù)庫(kù)中提取并經(jīng)過(guò)加工后所得到的數(shù)據(jù)集合,是一個(gè)特殊的數(shù)據(jù)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)也需要由一個(gè)數(shù)據(jù)庫(kù)管理系

17、統(tǒng)支持,它有關(guān)系型和多維型兩類數(shù)據(jù)庫(kù)管理系統(tǒng)。3.9 數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining)又稱數(shù)據(jù)開(kāi)采,就是從大量的、不全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程,提取的知識(shí)表現(xiàn)為概念(Concepts)、規(guī)則(Rules)、規(guī)律模式約束等形式。在人工智能領(lǐng)域又習(xí)慣稱其為數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(KDD,即Knowledge Discovery in Database)。其本質(zhì)類似于人腦對(duì)客觀世界的反映,從客觀的事實(shí)中抽象成主觀的知識(shí),然后指導(dǎo)客觀實(shí)踐,數(shù)據(jù)挖掘就是從客體的數(shù)據(jù)庫(kù)中概括抽象提取規(guī)律性的東西以供決策支持系統(tǒng)的建立和使用。數(shù)

18、據(jù)開(kāi)采以數(shù)據(jù)庫(kù)中的數(shù)據(jù)為數(shù)據(jù)源,整個(gè)過(guò)程可分為數(shù)據(jù)集成、數(shù)據(jù)選擇、預(yù)處理、數(shù)據(jù)開(kāi)采、結(jié)果表達(dá)和解析等過(guò)程。開(kāi)采的范圍可針對(duì)多媒體數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、Web數(shù)據(jù)庫(kù)、主動(dòng)型數(shù)據(jù)庫(kù)、時(shí)間型及概率型數(shù)據(jù)庫(kù)等。采用的技術(shù)有人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、遺傳算法、規(guī)則歸納、分類、聚類、減維、模式識(shí)別、不確定性處理等。發(fā)現(xiàn)的知識(shí)有廣義型知識(shí)、特征型知識(shí)、差異型知識(shí)、關(guān)聯(lián)型知識(shí)、預(yù)測(cè)型知識(shí)、偏離型知識(shí)。目前數(shù)據(jù)采掘的研究和應(yīng)用所面臨的主要挑戰(zhàn)是:對(duì)大型數(shù)據(jù)庫(kù)的數(shù)據(jù)采掘方法;對(duì)非結(jié)構(gòu)和無(wú)結(jié)構(gòu)數(shù)據(jù)庫(kù)中的數(shù)據(jù)采掘操作;用戶參與的交互采掘;對(duì)采掘得到的知識(shí)的證實(shí)技術(shù);知識(shí)的解釋和表達(dá)機(jī)制;由于數(shù)據(jù)庫(kù)的更新,原有知識(shí)的修正;采掘

19、所得知識(shí)庫(kù)的建立、使用和維護(hù)。3.10 面向?qū)ο髷?shù)據(jù)庫(kù)及數(shù)據(jù)可視化技術(shù)面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)將數(shù)據(jù)作為能自動(dòng)重新得到和共享的對(duì)象存儲(chǔ),包含在對(duì)象中的是完成每一項(xiàng)數(shù)據(jù)庫(kù)事務(wù)處理指令,這些對(duì)象可能包含不同類型的數(shù)據(jù),包括傳統(tǒng)的數(shù)據(jù)和處理過(guò)程,也包括聲音、圖形和視頻信號(hào),對(duì)象可以共享和重用。面向?qū)ο蟮臄?shù)據(jù)庫(kù)系統(tǒng)的這些特性通過(guò)重用和建立新的多媒體應(yīng)用能力使軟件開(kāi)發(fā)變得容易,這些應(yīng)用可以將不同類型的數(shù)據(jù)結(jié)合起來(lái)。面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)的好處是他支持WWW應(yīng)用能力。然而,面向?qū)ο蟮臄?shù)據(jù)庫(kù)是一項(xiàng)相對(duì)較新的技術(shù),尚缺乏理論支持,他可能在處理大量包含很多事務(wù)的數(shù)據(jù)方面比關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)慢得多,但人們已經(jīng)開(kāi)發(fā)了混合關(guān)系對(duì)象

20、數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)將關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)處理事務(wù)的能力與面向?qū)ο髷?shù)據(jù)庫(kù)系統(tǒng)處理復(fù)雜關(guān)系與新型數(shù)據(jù)的能力結(jié)合起來(lái)。 數(shù)據(jù)可視化是指在計(jì)算機(jī)屏幕上以圖形或圖像方式,形象地向用戶顯示各種數(shù)據(jù),使用戶快速地理解和吸收數(shù)據(jù)所表示的信息,以提高人的大腦二次處理信息的速度和能力??梢?jiàn),數(shù)據(jù)可視化是提高人類吸收和處理信息的速度和能力的重要途徑。數(shù)據(jù)可視化是一個(gè)剛剛開(kāi)始的新的研究領(lǐng)域,還有許多問(wèn)題有待探索。目前已經(jīng)被提出的數(shù)據(jù)可視化技術(shù)有:幾何可視化技術(shù)、基于圖標(biāo)的可視化技術(shù)、基于象素的可視化技術(shù)、分析可視化技術(shù)等。4數(shù)據(jù)庫(kù)技術(shù)的未來(lái)發(fā)展數(shù)據(jù)、計(jì)算機(jī)硬件和數(shù)據(jù)庫(kù)應(yīng)用,這三者推動(dòng)著數(shù)據(jù)庫(kù)技術(shù)與系統(tǒng)的發(fā)展。數(shù)據(jù)庫(kù)要管

21、理的數(shù)據(jù)的復(fù)雜度和數(shù)據(jù)量都在迅速增長(zhǎng);計(jì)算機(jī)硬件平臺(tái)的發(fā)展仍然實(shí)踐著摩爾定律;數(shù)據(jù)庫(kù)應(yīng)用迅速向深度、廣度擴(kuò)展。尤其是互聯(lián)網(wǎng)的出現(xiàn),極大地改變了數(shù)據(jù)庫(kù)的應(yīng)用環(huán)境,向數(shù)據(jù)庫(kù)領(lǐng)域提出了前所未有的技術(shù)挑戰(zhàn)。這些因素的變化推動(dòng)著數(shù)據(jù)庫(kù)技術(shù)的進(jìn)步,出現(xiàn)了一批新的數(shù)據(jù)庫(kù)技術(shù),如Web數(shù)據(jù)庫(kù)技術(shù)、并行數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)與聯(lián)機(jī)分析技術(shù)、數(shù)據(jù)挖掘與商務(wù)智能技術(shù)、內(nèi)容管理技術(shù)、海量數(shù)據(jù)管理技術(shù)等。限于篇幅,本文不可能逐一去展開(kāi)來(lái)闡述這些方面的變化,只是從這些變化中歸納出數(shù)據(jù)庫(kù)技術(shù)發(fā)展呈現(xiàn)出的突出特點(diǎn)?!八母摺奔碊BMS具有高可靠性、高性能、高可伸縮性和高安全性。數(shù)據(jù)庫(kù)是企業(yè)信息系統(tǒng)的核心和基礎(chǔ),其可靠性和性能是企

22、業(yè)領(lǐng)導(dǎo)人非常關(guān)心的問(wèn)題。因?yàn)?,一旦宕機(jī)會(huì)給企業(yè)造成巨大的經(jīng)濟(jì)損失,甚至?xí)鸱傻募m紛。最典型的例子就是證券交易系統(tǒng),如果在一個(gè)行情來(lái)臨的時(shí)候,由于交易量的猛增,造成數(shù)據(jù)庫(kù)系統(tǒng)的處理能力不足,導(dǎo)致數(shù)據(jù)庫(kù)系統(tǒng)崩潰,將會(huì)給證券公司和股民造成巨大的損失。在我國(guó)計(jì)算機(jī)應(yīng)用的早期,由于計(jì)算機(jī)系統(tǒng)還不是企業(yè)運(yùn)營(yíng)必要的成分,人們對(duì)數(shù)據(jù)庫(kù)的重要性認(rèn)識(shí)不足,而且為了經(jīng)費(fèi)上的節(jié)約常常采用一些低層次的數(shù)據(jù)管理軟件,如dBASE等,或者盜版的軟件。但是,隨著信息化進(jìn)程的深化,計(jì)算機(jī)系統(tǒng)越來(lái)越成為企業(yè)運(yùn)營(yíng)的不可缺少的部分,這時(shí),數(shù)據(jù)庫(kù)系統(tǒng)的穩(wěn)定和高效是必要的條件。在互聯(lián)網(wǎng)環(huán)境下還要考慮支持幾千或上萬(wàn)個(gè)用戶同時(shí)存取和7x

23、24小時(shí)不間斷運(yùn)行的要求,提供聯(lián)機(jī)數(shù)據(jù)備份、容錯(cuò)、容災(zāi)以及信息安全措施等。事實(shí)上,數(shù)據(jù)庫(kù)系統(tǒng)的穩(wěn)定和高效也是技術(shù)上長(zhǎng)久不衰的追求。此外,從企業(yè)信息系統(tǒng)發(fā)展的角度上看,一個(gè)系統(tǒng)的可擴(kuò)展能力也是非常重要的。由于業(yè)務(wù)的擴(kuò)大,原來(lái)的系統(tǒng)規(guī)模和能力已經(jīng)不再適應(yīng)新的要求的時(shí)候,不是重新更換更高檔次的機(jī)器,而是在原有的基礎(chǔ)上增加新的設(shè)備,如處理器、存儲(chǔ)器等,從而達(dá)到分散負(fù)載的目的。數(shù)據(jù)的安全性是另一個(gè)重要的課題,普通的基于授權(quán)的機(jī)制已經(jīng)不能滿足許多應(yīng)用的要求,新的基于角色的授權(quán)機(jī)制以及一些安全功能要素,如存儲(chǔ)隱通道分析、標(biāo)記、加密、推理控制等,在一些應(yīng)用中成為切切實(shí)實(shí)的需要?!盎ヂ?lián)”指數(shù)據(jù)庫(kù)系統(tǒng)要支持互聯(lián)網(wǎng)

24、環(huán)境下的應(yīng)用,要支持信息系統(tǒng)間“互聯(lián)互訪”,要實(shí)現(xiàn)不同數(shù)據(jù)庫(kù)間的數(shù)據(jù)交換和共享,要處理以XML類型的數(shù)據(jù)為代表的網(wǎng)上數(shù)據(jù),甚至要考慮無(wú)線通訊發(fā)展帶來(lái)的革命性的變化。與傳統(tǒng)的數(shù)據(jù)庫(kù)相比,互聯(lián)網(wǎng)環(huán)境下的數(shù)據(jù)庫(kù)系統(tǒng)要具備處理更大量的數(shù)據(jù)以及為更多的用戶提供服務(wù)的能力,要提供對(duì)長(zhǎng)事務(wù)的有效支持,要提供對(duì)XML類型數(shù)據(jù)的快速存取的有效支持?!皡f(xié)同”面向行業(yè)應(yīng)用領(lǐng)域要求,在DBMS核心基礎(chǔ)上,開(kāi)發(fā)豐富的數(shù)據(jù)庫(kù)套件及應(yīng)用構(gòu)件,通過(guò)與制造業(yè)信息化、電子政務(wù)等領(lǐng)域應(yīng)用套件捆綁,形成以DBMS為核心的面向行業(yè)的應(yīng)用軟件產(chǎn)品家族。滿足應(yīng)用需求,協(xié)同發(fā)展數(shù)據(jù)庫(kù)套件與應(yīng)用構(gòu)件,已成為當(dāng)今數(shù)據(jù)庫(kù)技術(shù)與產(chǎn)品發(fā)展的新趨勢(shì)。規(guī)

25、劃中的Oracle11i的主要擴(kuò)展方面據(jù)稱主要也是各種面向應(yīng)用套件的支持。此外,數(shù)據(jù)庫(kù)的發(fā)展還有以下一些新特點(diǎn):(1)提供持續(xù)的數(shù)據(jù)可用性構(gòu)建一個(gè)高可用性 IT 基礎(chǔ)架構(gòu),對(duì)所有希望在當(dāng)今瞬息萬(wàn)變的經(jīng)濟(jì)環(huán)境中立于不敗之地并取得成功的企業(yè)而言都至關(guān)重要。作為數(shù)據(jù)庫(kù)市場(chǎng)的領(lǐng)跑者,Oracle在其最新的10g數(shù)據(jù)庫(kù)版本中增強(qiáng)了RAC技術(shù)。微軟公司在其最新的數(shù)據(jù)庫(kù)SQL Server 2005中利用數(shù)據(jù)庫(kù)鏡像、故障轉(zhuǎn)移群集和改進(jìn)聯(lián)機(jī)操作等特性,可將故障時(shí)間控制到最低,并有助于確保企業(yè)系統(tǒng)隨時(shí)接受訪問(wèn)調(diào)用。(2)用低成本實(shí)現(xiàn)系統(tǒng)的伸縮性大多數(shù)企業(yè)的每個(gè)主要應(yīng)用系統(tǒng)都擁有專門的存儲(chǔ)器和服務(wù)器,這樣傳統(tǒng)的布

26、署,個(gè)別看好像效果不錯(cuò)。但這樣做的后果就是必須付出高昂的代價(jià),來(lái)滿足大量系統(tǒng)的維護(hù),而且因故障節(jié)點(diǎn)的增多,系統(tǒng)更容易出現(xiàn)故障。 此外,由于單個(gè)系統(tǒng)必須有足夠的規(guī)模以適應(yīng)高峰容量,但資源卻難以從一個(gè)系統(tǒng)轉(zhuǎn)移到另一個(gè)系統(tǒng),結(jié)果導(dǎo)致企業(yè)存儲(chǔ)器和 CPU 資源大量閑置。分析家認(rèn)為,目前企業(yè)內(nèi)部一般的存儲(chǔ)器的利用率僅為 50%,而 CPU 利用率則是可憐的15-20%。(3)保證互聯(lián)網(wǎng)架構(gòu)下的安全企業(yè)將應(yīng)用架構(gòu)在互聯(lián)網(wǎng)平臺(tái)上,都面臨如何保護(hù)互聯(lián)網(wǎng)架構(gòu)下的數(shù)據(jù)安全問(wèn)題。各大數(shù)據(jù)庫(kù)廠商嗅到其中的巨大商機(jī),加強(qiáng)了其數(shù)據(jù)庫(kù)產(chǎn)品在數(shù)據(jù)安全上的支持。甲骨文公司在其10g版本中提供的存儲(chǔ)數(shù)據(jù)加密、虛擬私有數(shù)據(jù)庫(kù)、Label Security等技術(shù);微軟的SQL server 2005通過(guò)數(shù)據(jù)庫(kù)加密、缺省安全設(shè)置、口令策略實(shí)施

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論