數(shù)據(jù)庫PPT第1章 數(shù)據(jù)庫系統(tǒng)概述_第1頁
數(shù)據(jù)庫PPT第1章 數(shù)據(jù)庫系統(tǒng)概述_第2頁
數(shù)據(jù)庫PPT第1章 數(shù)據(jù)庫系統(tǒng)概述_第3頁
數(shù)據(jù)庫PPT第1章 數(shù)據(jù)庫系統(tǒng)概述_第4頁
數(shù)據(jù)庫PPT第1章 數(shù)據(jù)庫系統(tǒng)概述_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)庫系統(tǒng)概論第1章主要內(nèi)容理解數(shù)據(jù)庫基本概念01了解數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展02了解數(shù)據(jù)庫的體系結(jié)構(gòu)03

1、信息信息(Information)就是對各種事物的存在方式、運動狀態(tài)和相互聯(lián)系特征的一種表達和陳述,是自然界、人類社會和人類思維活動普遍存在的一切物質(zhì)和事物的屬性,它存在于人們的周圍?!?.1數(shù)據(jù)庫基本概念

2、信號信號(Signal)是信息的物理載體,如電信號、光信號、磁信號等。信息需要以某種信號的形式體現(xiàn)出來。信號可能攜帶某些信息。

3、數(shù)據(jù)數(shù)據(jù)(Data)是信號的符號化表示。如身高數(shù)據(jù)、薪酬數(shù)據(jù)、道路暢通指數(shù)數(shù)據(jù)、語音數(shù)據(jù)、視頻數(shù)據(jù)等等。數(shù)據(jù)(Data)是用來記錄信息的可識別的符號,是信息的具體表現(xiàn)形式。數(shù)據(jù)用型和值來表示,數(shù)據(jù)的型是指數(shù)據(jù)內(nèi)容存儲在媒體上的具體形式;數(shù)據(jù)的值是指所描述的客觀事物的具體特性。

如一個人的身高可以表示為“1.80”或“1米8”,其中“1.80”和“1米8”是值,但這兩個值的型是不一樣的,一個用實數(shù)來描述,而另一個用字符串來描述。

數(shù)據(jù)+語義才得到信息數(shù)據(jù)不僅包括數(shù)字、文字形式,而且還包括圖形、圖像、聲音、動畫等多媒體數(shù)據(jù)?!?.1數(shù)據(jù)庫基本概念:數(shù)據(jù)大數(shù)據(jù)(BigDate)的4個V特征:Volume、Velocity、Variety、Veracity數(shù)據(jù)體量大。指大型數(shù)據(jù)集,從TB級越到PB級數(shù)據(jù)處理速度快。在數(shù)據(jù)量非常龐大的情況下,要做到對數(shù)據(jù)的實時處理數(shù)據(jù)多樣性。數(shù)據(jù)類型多,既包括傳統(tǒng)格式數(shù)據(jù),也包括來自互聯(lián)網(wǎng)的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等。數(shù)據(jù)的真實性。追求有價值的數(shù)據(jù)。§1.1數(shù)據(jù)庫基本概念:大數(shù)據(jù)數(shù)據(jù)處理也稱信息處理,是指將信息轉(zhuǎn)換成數(shù)據(jù)的過程。數(shù)據(jù)處理的內(nèi)容主要包括數(shù)據(jù)的采集、組織、整理、存儲、加工、維護、查詢和傳播等一系列活動。數(shù)據(jù)處理的目的是從大量的數(shù)據(jù)中,根據(jù)數(shù)據(jù)自身的規(guī)律和它們之間固有的聯(lián)系,通過分析、歸納、推理等科學(xué)手段,提取出有效的信息資源?!?.1數(shù)據(jù)庫基本概念:數(shù)據(jù)處理數(shù)據(jù)處理的工作分為以下3個方面。數(shù)據(jù)管理。主要任務(wù)是收集信息,將信息用數(shù)據(jù)表示并按類別組織保存。數(shù)據(jù)傳播。通過數(shù)據(jù)傳播,信息在空間或時間上以各種形式傳遞。數(shù)據(jù)加工。主要任務(wù)是對數(shù)據(jù)進行變換、抽取和運算。數(shù)據(jù)庫(DataBase,DB)是按照一定結(jié)構(gòu)組織并長期存儲在計算機內(nèi)的、可共享的大量數(shù)據(jù)的集合。其特點:持久性:保證數(shù)據(jù)能大量地、長期地存儲結(jié)構(gòu)化:按照一定的結(jié)構(gòu)(數(shù)據(jù)模型)來組織數(shù)據(jù),數(shù)據(jù)間有聯(lián)系有語義可共享:方便為不同的應(yīng)用服務(wù)

它將數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和存儲,具有較小的冗余度、較高的數(shù)據(jù)獨立性和易擴展性、可被各類用戶共享等特點?!?.1數(shù)據(jù)庫基本概念:數(shù)據(jù)庫數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,DBMS)是組織管理數(shù)據(jù)的軟件系統(tǒng),位于用戶與操作系統(tǒng)(OS)之間的一層數(shù)據(jù)管理軟件,它為用戶或應(yīng)用程序提供訪問數(shù)據(jù)庫的方法,包括數(shù)據(jù)庫的創(chuàng)建、查詢、更新及各種數(shù)據(jù)控制,它是數(shù)據(jù)庫系統(tǒng)的核心?!?.1數(shù)據(jù)庫基本概念:數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)一般由計算機軟件公司提供,目前比較流行的DBMS有Oracle、MySQL、SQLServer、PostgreSQL、MongoDB、Access等?!?.1數(shù)據(jù)庫基本概念:數(shù)據(jù)庫管理系統(tǒng)MySQL排名:來自/en/ranking數(shù)據(jù)庫管理系統(tǒng)的主要功能:數(shù)據(jù)定義功能:DBMS提供數(shù)據(jù)定義語言(DataDefinitionLanguage,DDL),用戶通過它可以方便地對數(shù)據(jù)庫中的數(shù)據(jù)對象進行定義。數(shù)據(jù)操縱功能:DBMS還提供數(shù)據(jù)操縱語言(DataManipulationLanguage,DML),用戶可以使用DML操縱數(shù)據(jù)實現(xiàn)對數(shù)據(jù)庫的基本操作,如查詢、插入、刪除和修改等。數(shù)據(jù)庫的運行管理:數(shù)據(jù)庫在創(chuàng)建、運用和維護時由DBMS統(tǒng)一管理、統(tǒng)一控制,以保證數(shù)據(jù)的安全性、完整性、多用戶對數(shù)據(jù)的并發(fā)使用及發(fā)生故障后的系統(tǒng)恢復(fù)。數(shù)據(jù)庫的創(chuàng)建和維護功能:數(shù)據(jù)庫的創(chuàng)建和維護功能包括數(shù)據(jù)庫初始數(shù)據(jù)的輸入、轉(zhuǎn)換功能,數(shù)據(jù)庫的轉(zhuǎn)儲、恢復(fù)功能,數(shù)據(jù)庫的組織功能和性能監(jiān)視、分析功能等。這些功能通常是由一些實用程序完成。§1.1數(shù)據(jù)庫基本概念:數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫應(yīng)用系統(tǒng)(DataBaseApplicationSystem)凡使用數(shù)據(jù)庫技術(shù)管理其數(shù)據(jù)的系統(tǒng)都稱為數(shù)據(jù)庫應(yīng)用系統(tǒng)。數(shù)據(jù)庫應(yīng)用系統(tǒng)的應(yīng)用非常廣泛,它可以用于事務(wù)管理、計算機輔助設(shè)計、人工智能等系統(tǒng)中。§1.1數(shù)據(jù)庫基本概念:數(shù)據(jù)庫應(yīng)用系統(tǒng)教務(wù)管理系統(tǒng)、網(wǎng)絡(luò)銷售系統(tǒng)、工資管理系統(tǒng)、票務(wù)系統(tǒng)、銀行系統(tǒng)、遠程醫(yī)療系統(tǒng)、人臉識別系統(tǒng)等等?!?.1數(shù)據(jù)庫基本概念:數(shù)據(jù)庫應(yīng)用系統(tǒng)在計算機應(yīng)用系統(tǒng)中加入了數(shù)據(jù)庫系統(tǒng),就構(gòu)成了數(shù)據(jù)庫應(yīng)用系統(tǒng)。主要包括如下組成部分:硬件平臺

:系統(tǒng)搭建所需的物理設(shè)備,包括計算機設(shè)備、存儲設(shè)備和網(wǎng)絡(luò)通信設(shè)備等;軟件平臺:運行在硬件平臺上的系統(tǒng)軟件;數(shù)據(jù)庫:存儲在存儲設(shè)備中的所有數(shù)據(jù)的集合;數(shù)據(jù)庫管理系統(tǒng):進行數(shù)據(jù)組織、維護等管理的系統(tǒng);數(shù)據(jù)庫管理員:構(gòu)建、運行、維護數(shù)據(jù)庫的維護的運行管理人員;計算機應(yīng)用系統(tǒng):運行在數(shù)據(jù)庫上的特定應(yīng)用軟件;用戶:數(shù)據(jù)庫的使用者?!?.2數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展人工管理階段文件系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階段20世紀50年代前期,計算機主要用于科學(xué)計算,數(shù)據(jù)處理都是通過手工方式進行的。當時的計算機上沒有專門管理數(shù)據(jù)的軟件,也沒有像磁盤這樣可以隨機存取的外部存儲設(shè)備。數(shù)據(jù)由計算或處理它的程序自行攜帶,數(shù)據(jù)和應(yīng)用程序一一對應(yīng)。因此,這一時期計算機數(shù)據(jù)管理的特點是:數(shù)據(jù)的獨立性差,數(shù)據(jù)不能被長期保存,數(shù)據(jù)的冗余度大等。人工管理階段應(yīng)用程序與數(shù)據(jù)之間的關(guān)系如下圖所示:§1.2數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展:人工管理階段20世紀50年代后期至60年代中后期,磁盤成為計算機的主要外存儲器。在軟件方面,出現(xiàn)了高級語言和操作系統(tǒng)。在此階段,數(shù)據(jù)以文件的形式進行組織,并能長期保留在外存儲器上,用戶能對數(shù)據(jù)文件進行查詢、修改、插入和刪除等操作。程序與數(shù)據(jù)有了一定的獨立性,程序和數(shù)據(jù)分開存儲,然而依舊存在數(shù)據(jù)的冗余度大及數(shù)據(jù)的不一致性等缺點。文件系統(tǒng)階段應(yīng)用程序與數(shù)據(jù)之間的關(guān)系如下圖所示:§1.2數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展:文件系統(tǒng)階段§1.2數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展:文件系統(tǒng)階段文件系統(tǒng)管理數(shù)據(jù)的主要不足:數(shù)據(jù)獨立性差:應(yīng)用程序與數(shù)據(jù)文件的耦合性強,特定格式的數(shù)據(jù)文件只能有特定的程序才能操作。數(shù)據(jù)文件的冗余性高:數(shù)據(jù)文件數(shù)據(jù)有很高的冗余度,不可避免有大量重復(fù),造成存儲資源的浪費。數(shù)據(jù)共享性弱:難以在不同應(yīng)用程序之間傳輸和共享。數(shù)據(jù)的安全性低:數(shù)據(jù)難以實現(xiàn)按授權(quán)分別訪問的需求,在安全性方面有很大的缺陷。維護成本高:數(shù)據(jù)文件和應(yīng)用程序的強耦合性對于系統(tǒng)的維護也帶來了極大的不便。20世紀60年代后期,計算機的硬件和軟件都有了進一步的發(fā)展,信息量的爆炸式膨脹帶來了數(shù)據(jù)量的急劇增長,為了解決日益增長的數(shù)據(jù)量帶來的數(shù)據(jù)管理上的嚴重問題,數(shù)據(jù)庫技術(shù)逐漸發(fā)展和成熟起來。文件系統(tǒng)階段應(yīng)用程序與數(shù)據(jù)之間的關(guān)系如下圖所示:

數(shù)據(jù)庫技術(shù)使數(shù)據(jù)有了統(tǒng)一的結(jié)構(gòu),對所有的數(shù)據(jù)進行統(tǒng)一、集中、獨立的管理,以實現(xiàn)數(shù)據(jù)的共享,保證數(shù)據(jù)的完整和安全,提高了數(shù)據(jù)管理效率。在應(yīng)用程序和數(shù)據(jù)庫之間有數(shù)據(jù)庫管理系統(tǒng)(DataBaseManagementSystem,DBMS)。數(shù)據(jù)庫管理系統(tǒng)對數(shù)據(jù)的處理方式與文件系統(tǒng)不同,它把所有應(yīng)用程序中使用的數(shù)據(jù)匯集在一起,并以記錄為單位存儲起來,便于應(yīng)用程序使用。§1.2數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展:數(shù)據(jù)庫系統(tǒng)階段§1.2數(shù)據(jù)管理技術(shù)的產(chǎn)生與發(fā)展:數(shù)據(jù)庫系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)管理數(shù)據(jù)的特點:數(shù)據(jù)獨立性強:數(shù)據(jù)管理可以獨立完成,不需要再依賴應(yīng)用程序來直接管理數(shù)據(jù)。數(shù)據(jù)冗余度低:從整體上組織和設(shè)計數(shù)據(jù)的邏輯模式和存儲模式,使得數(shù)據(jù)中的各個實體與屬性可以獨立存在,降低存儲的冗余度。數(shù)據(jù)一致性高:使用數(shù)據(jù)庫統(tǒng)一管理數(shù)據(jù),保證數(shù)據(jù)在數(shù)據(jù)庫中的一致性。數(shù)據(jù)共享性好:數(shù)據(jù)面向所有外部調(diào)用,不再服務(wù)于某一程序,數(shù)據(jù)的共享得以實現(xiàn)。數(shù)據(jù)的安全性強:有完善的權(quán)限管理,沒有經(jīng)過授權(quán)的數(shù)據(jù)訪問是不被接受的。管理效率高:把數(shù)據(jù)管理任務(wù)從應(yīng)用系統(tǒng)中分離出來,由專門人員管理,效率高。模式的概念§1.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)數(shù)據(jù)的“型”和“值”:“型”主要指的是對各種數(shù)據(jù)的屬性和結(jié)構(gòu)的定義與描述。它是各種具體數(shù)據(jù)的抽象與提煉,描述出具體數(shù)據(jù)共有的特征?!爸怠眲t是具體數(shù)據(jù)實例的描述,是刻畫事物各方面屬性的定性或定量的具體值。

型:客戶(編號,姓名,性別,注冊日期,電話)

值:('101’,‘薛為民’,‘男’,‘2012-01-09’,‘16800001111’)數(shù)據(jù)庫的模式:數(shù)據(jù)庫的所有型的集合,稱為該數(shù)據(jù)庫的模式(Schema)。模式是數(shù)據(jù)庫中全體數(shù)據(jù)結(jié)構(gòu)和特征的描述。構(gòu)造數(shù)據(jù)庫模式(數(shù)據(jù)建模):三個世界的映射現(xiàn)實世界中客觀對象的抽象過程如下圖所示:§1.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)§1.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)數(shù)據(jù)庫的三級模式結(jié)構(gòu)是數(shù)據(jù)3個抽象級別,它把數(shù)據(jù)的具體組織留給DBMS去處理,用戶只要抽象地處理數(shù)據(jù),而不必關(guān)心數(shù)據(jù)在計算機中的表示和存儲,這樣就減輕了用戶使用系統(tǒng)的負擔。三級結(jié)構(gòu)之間差別往往很大,為了實現(xiàn)這3個抽象級別的聯(lián)系和轉(zhuǎn)換,DBMS在三級結(jié)構(gòu)之間提供了兩級映像(Mapping):外模式-模式映像、模式-內(nèi)模式映像。正是這兩級映像保證了數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)能夠具有較高的邏輯獨立性和物理獨立性。外模式處于用戶級,也稱為用戶視圖(VIEW),它最接近用戶,是單個用戶看到并獲準使用的那部分數(shù)據(jù)的邏輯結(jié)構(gòu);模式又叫概念模式,是對數(shù)據(jù)庫所有用戶的數(shù)據(jù)的整體邏輯描述,是所有外模式的全體;內(nèi)模式處于物理級,又稱為存儲模式?!?.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)三級模式,兩級映射外模式處于用戶級,也稱為用戶視圖(VIEW),它最接近用戶,是單個用戶看到并獲準使用的那部分數(shù)據(jù)的邏輯結(jié)構(gòu);模式又叫概念模式,是對數(shù)據(jù)庫所有用戶的數(shù)據(jù)的整體邏輯描述,是所有外模式的全體;內(nèi)模式處于物理級,又稱為存儲模式。§1.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)三級模式,兩級映射模式實際上是數(shù)據(jù)庫數(shù)據(jù)在概念級上的完整抽象,一個數(shù)據(jù)庫只有一個模式?!?.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu):模式模式(Schema)也稱概念模式(ConceptualSchema)或邏輯模式,是對數(shù)據(jù)庫中全部數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,是所有用戶的公共數(shù)據(jù)視圖。它是數(shù)據(jù)庫系統(tǒng)模式結(jié)構(gòu)的中間層,既不涉及數(shù)據(jù)的物理存儲細節(jié)和硬件環(huán)境,也不涉及具體的應(yīng)用程序及所使用的應(yīng)用開發(fā)工具和高級程序設(shè)計語言。定義模式時不僅要定義數(shù)據(jù)的邏輯結(jié)構(gòu),例如數(shù)據(jù)記錄由哪些數(shù)據(jù)項構(gòu)成,數(shù)據(jù)項的名稱、類型、取值范圍等,而且還要定義數(shù)據(jù)項之間的聯(lián)系,定義不同記錄之間的聯(lián)系,以及定義與數(shù)據(jù)有關(guān)的完整性、安全性等要求。外模式通常是模式的子集,一個數(shù)據(jù)庫可以有多個外模式?!?.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu):外模式外模式(ExternalSchema)也稱子模式(Subschema)或用戶模式,它是對數(shù)據(jù)庫用戶(包括程序員和最終用戶)能夠看見和使用的局部數(shù)據(jù)的邏輯結(jié)構(gòu)和特征的描述,即個別用戶涉及的數(shù)據(jù)的邏輯結(jié)構(gòu)。

外模式是保證數(shù)據(jù)庫安全性的一個有效措施,每個用戶只能看見或訪問所對應(yīng)的外模式中的數(shù)據(jù),數(shù)據(jù)庫中的其余數(shù)據(jù)是不可見的?!?.3數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu):內(nèi)模式內(nèi)模式(InternalSchema)也稱存儲模式(StorageSchema)或物理模式,一個數(shù)據(jù)庫只有一個內(nèi)模式。內(nèi)模式是對數(shù)據(jù)物理結(jié)構(gòu)和存儲方式的描述,是數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部的表示方式。例如,記錄的存儲方式是順序存儲、按照B樹結(jié)構(gòu)存儲還是按hash方法存儲;索引按照什么方式組織;數(shù)據(jù)是否壓縮存儲,是否加密;數(shù)據(jù)的存儲記錄結(jié)構(gòu)有何規(guī)定等。

內(nèi)模式的設(shè)計目標是將系統(tǒng)的模式(全局邏輯結(jié)構(gòu))組織成最優(yōu)的物理模式,以提高數(shù)據(jù)的存取效率,改善系統(tǒng)的性能指標。模式描述的是數(shù)據(jù)的全局邏輯結(jié)構(gòu),外模式描述的是數(shù)據(jù)的局部邏輯結(jié)構(gòu),對應(yīng)于同一個模式可以有任意多個外模式。對于每個外模式,數(shù)據(jù)庫系統(tǒng)都有一個外模式/模式映像,它定義了該外模式與模式之間的對應(yīng)關(guān)系。這些映像定義通常包含在各自外模式的描述中。數(shù)據(jù)庫中只有一個模式,也只有一個內(nèi)模式,所以模式/內(nèi)模式映像是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論