數(shù)據(jù)庫原理及應用教程(第5版) (微課版)課件 第1章 數(shù)據(jù)庫系統(tǒng)概述_第1頁
數(shù)據(jù)庫原理及應用教程(第5版) (微課版)課件 第1章 數(shù)據(jù)庫系統(tǒng)概述_第2頁
數(shù)據(jù)庫原理及應用教程(第5版) (微課版)課件 第1章 數(shù)據(jù)庫系統(tǒng)概述_第3頁
數(shù)據(jù)庫原理及應用教程(第5版) (微課版)課件 第1章 數(shù)據(jù)庫系統(tǒng)概述_第4頁
數(shù)據(jù)庫原理及應用教程(第5版) (微課版)課件 第1章 數(shù)據(jù)庫系統(tǒng)概述_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

北京市優(yōu)質本科課程教材數(shù)據(jù)庫原理及應用教程(第5版)“十二五”普通高等教育本科國家級規(guī)劃教材國家級一流線上課程配套教材第1章數(shù)據(jù)庫系統(tǒng)概述第1章數(shù)據(jù)庫系統(tǒng)概述本章目錄信息、數(shù)據(jù)、數(shù)據(jù)處理與數(shù)據(jù)管理01OPTION02OPTION數(shù)據(jù)庫技術的產生、發(fā)展03OPTION數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)04OPTION數(shù)據(jù)庫系統(tǒng)的內部體系結構數(shù)據(jù)庫系統(tǒng)的外部體系結構05OPTION06OPTION三個世界及其有關概念07OPTION數(shù)據(jù)模型的分類08OPTION數(shù)據(jù)庫領域的新技術1.1信息、數(shù)據(jù)、數(shù)據(jù)處理與數(shù)據(jù)管理1.1.1信息與數(shù)據(jù)學號:S1姓名:趙亦性別:女年齡:17歲所在系別:計算機信息的特征可存儲、加工、傳遞和再生可以感知源于物質和能量信息是人腦對現(xiàn)實世界事物的存在方式、運動狀態(tài)以及事物之間聯(lián)系的抽象反映。信息是客觀存在的,人類有意識地對信息進行采集并加工、傳遞,從而形成了各種消息、情報、指令、數(shù)據(jù)及信號等。1.1信息、數(shù)據(jù)、數(shù)據(jù)處理與數(shù)據(jù)管理1.1.1信息與數(shù)據(jù)數(shù)據(jù)是由用來記錄信息的可識別的符號組合的,是信息的具體表現(xiàn)形式。數(shù)據(jù)的表現(xiàn)包括數(shù)字、文字、圖形、圖像、聲音和視頻等,它們都可以經(jīng)過數(shù)字化后存儲到計算機中。S1趙亦女17歲計算機1.1信息、數(shù)據(jù)、數(shù)據(jù)處理與數(shù)據(jù)管理1.1.1信息與數(shù)據(jù)數(shù)據(jù)與信息的聯(lián)系數(shù)據(jù)是信息的符號表示,信息則是對數(shù)據(jù)的語義解釋。本門課程的考試人數(shù)為100,考試通過率為90%數(shù)據(jù)“100”和“90%”被賦予了特定的語義,此處的100表示的是“考試人數(shù)為100”,90%表示的是“考試通過率是90%”。信息=數(shù)據(jù)+語義1.1信息、數(shù)據(jù)、數(shù)據(jù)處理與數(shù)據(jù)管理1.1.2數(shù)據(jù)處理與數(shù)據(jù)管理將數(shù)據(jù)轉換成信息的過程,包括數(shù)據(jù)的收集、管理、加工利用乃至信息輸出、演變推導等數(shù)據(jù)處理

數(shù)據(jù)管理

數(shù)據(jù)的分類、組織、編碼、存儲、維護、檢索等操作信息=數(shù)據(jù)+數(shù)據(jù)處理產出輸出結果

原料輸入“數(shù)據(jù)處理”的真正含義應該是為了產生信息而處理數(shù)據(jù)1.2數(shù)據(jù)庫技術的產生、發(fā)展人工管理階段文件系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階段數(shù)據(jù)無專門的存取設備,無專用軟件管理數(shù)據(jù),不共享,無獨立性數(shù)據(jù)以文件形式長期保存,由文件系統(tǒng)管理數(shù)據(jù),程序與數(shù)據(jù)間有一定獨立性,文件的形式已經(jīng)多樣化,數(shù)據(jù)具有一定的共享性數(shù)據(jù)結構化,共享性高、冗余度低,獨立性高,有統(tǒng)一的數(shù)據(jù)管理和控制功能DBMS

數(shù)據(jù)的安全性控制、數(shù)據(jù)的完整性控制、并發(fā)控制、數(shù)據(jù)恢復1.2數(shù)據(jù)庫技術的產生、發(fā)展1.人工管理階段人工管理階段應用程序與數(shù)據(jù)之間的對應關系1.2數(shù)據(jù)庫技術的產生、發(fā)展2.文件系統(tǒng)階段文件系統(tǒng)階段應用程序與數(shù)據(jù)之間的對應關系1.2數(shù)據(jù)庫技術的產生、發(fā)展3.數(shù)據(jù)庫系統(tǒng)階段數(shù)據(jù)庫系統(tǒng)階段應用程序與數(shù)據(jù)之間的對應關系1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.1數(shù)據(jù)庫系統(tǒng)的組成數(shù)據(jù)庫系統(tǒng)由數(shù)據(jù)庫、數(shù)據(jù)庫用戶、計算機硬件系統(tǒng)和計算機軟件系統(tǒng)組成,可用下圖表示(圖中省略了計算機硬件系統(tǒng))。1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.1數(shù)據(jù)庫系統(tǒng)的組成數(shù)據(jù)庫數(shù)據(jù)庫是存儲在計算機內、有組織的、可共享的數(shù)據(jù)和數(shù)據(jù)對象(如表、視圖、存儲過程和觸發(fā)器等)的集合,這種集合按一定的數(shù)據(jù)模型(或結構)組織、描述并長期存儲,同時能以安全和可靠的方法進行數(shù)據(jù)的檢索和存儲。數(shù)據(jù)庫的特點:集成性,共享性1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.1數(shù)據(jù)庫系統(tǒng)的組成2.數(shù)據(jù)庫用戶最終用戶應用程序員數(shù)據(jù)庫管理員對數(shù)據(jù)庫進行存儲、維護和檢索等操作非計算機專業(yè)人員使用數(shù)據(jù)庫設計和編制應用程序并進行調試和安裝負責設計、建立、管理和維護數(shù)據(jù)庫以及協(xié)調用戶對數(shù)據(jù)庫要求的個人或工作團隊1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.1數(shù)據(jù)庫系統(tǒng)的組成3.軟件系統(tǒng)軟件(Software)系統(tǒng)主要包括操作系統(tǒng)(OperatingSystem,OS)、數(shù)據(jù)庫管理系統(tǒng)(DBMS)、應用開發(fā)工具和應用系統(tǒng)等。在計算機硬件層之上,操作系統(tǒng)統(tǒng)一管理計算機資源。DBMS可借助操作系統(tǒng)完成對硬件的訪問,并能對數(shù)據(jù)庫的數(shù)據(jù)進行存取、維護和管理。數(shù)據(jù)庫系統(tǒng)的各類人員、應用程序等對數(shù)據(jù)庫的各種操作請求,都必須通過DBMS完成。DBMS是數(shù)據(jù)庫系統(tǒng)的核心軟件。1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.1數(shù)據(jù)庫系統(tǒng)的組成4.硬件系統(tǒng)硬件(Hardware)系統(tǒng)指存儲和運行數(shù)據(jù)庫系統(tǒng)的硬件設備,包括CPU、內存、大容量的存儲設備、輸入/輸出設備和外部設備等。OS硬件應用系統(tǒng)應用開發(fā)工具DBMS1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)(DBMS)DBSDBMS核心數(shù)據(jù)定義查詢更新各種控制1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)1.DBMS的功能1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)1.DBMS的功能數(shù)據(jù)定義功能DBMS提供數(shù)據(jù)定義語言(DataDefineLanguage,DDL),定義數(shù)據(jù)的模式、外模式和內模式三級模式結構,定義模式/內模式和外模式/模式二級映像,定義有關的約束條件。用DDL定義的各種模式需要通過相應的模式翻譯程序轉換為機器內部代碼表示形式,保存在數(shù)據(jù)字典(DataDictionary,DD)(或稱為系統(tǒng)目錄)中。數(shù)據(jù)字典是DBMS存取數(shù)據(jù)的基本依據(jù)。因此,DBMS中應包括DDL的編譯程序。1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)1.DBMS的功能數(shù)據(jù)操縱功能DBMS提供數(shù)據(jù)操縱語言(DataManipulationLanguage,DML)實現(xiàn)對數(shù)據(jù)庫的基本操作,包括檢索、更新(包括插入、修改和刪除)等。DML有兩類宿主型自主型獨立使用嵌入在如Fortran、Pascal、C等高級語言中1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)1.DBMS的功能數(shù)據(jù)庫運行管理功能對數(shù)據(jù)庫運行的管理是DBMS運行的核心部分。DBMS對數(shù)據(jù)庫的控制主要通過四個方面實現(xiàn):數(shù)據(jù)的安全性控制、數(shù)據(jù)的完整性控制、多用戶環(huán)境下的數(shù)據(jù)并發(fā)控制和數(shù)據(jù)庫的恢復。數(shù)據(jù)庫的建立和維護數(shù)據(jù)庫的建立包括數(shù)據(jù)庫的初始數(shù)據(jù)的裝入與數(shù)據(jù)轉換等,數(shù)據(jù)庫的維護包括數(shù)據(jù)庫的轉儲、恢復、重組織與重構造、系統(tǒng)性能監(jiān)視與分析等。這些功能分別由DBMS的各個實用程序來完成。1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)1.DBMS的功能數(shù)據(jù)通信接口DBMS提供與其他軟件系統(tǒng)進行通信的功能。一般,DBMS提供了與其他DBMS或文件系統(tǒng)的接口,從而使該DBMS能夠將數(shù)據(jù)轉換為另一個DBMS或文件系統(tǒng)能夠接受的格式,或者可接收其他DBMS或文件系統(tǒng)的數(shù)據(jù),實現(xiàn)用戶程序與DBMS、DBMS與DBMS、DBMS與文件系統(tǒng)之間的通信。通常這些功能要與操作系統(tǒng)協(xié)調完成。數(shù)據(jù)組織、存儲和管理DBMS負責對數(shù)據(jù)庫中需要存放的各種數(shù)據(jù)(如數(shù)據(jù)字典、用戶數(shù)據(jù)、存取路徑等)的組織、存儲和管理工作,確定以何種文件結構和存取方式物理地組織這些數(shù)據(jù),以提高存儲空間利用率和對數(shù)據(jù)庫進行增、刪、查、改的效率。1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)2.DBMS的組成語言編譯處理程序系統(tǒng)運行控制程序系統(tǒng)建立、維護程序數(shù)據(jù)字典數(shù)據(jù)定義語言DDL編譯程序數(shù)據(jù)操縱語言DML編譯程序系統(tǒng)總控程序安全性控制程序完整性控制程序并發(fā)控制程序數(shù)據(jù)存取和更新程序通信控制程序裝配程序重組程序系統(tǒng)恢復程序描述數(shù)據(jù)庫中有關信息的數(shù)據(jù)目錄1.3數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)1.3.2數(shù)據(jù)庫管理系統(tǒng)3.DBMS的數(shù)據(jù)存取的過程(1)用戶使用某種特定的數(shù)據(jù)操作語言向DBMS發(fā)出存取請求。(2)DBMS接受請求并將該請求解釋轉換成機器代碼指令。(3)DBMS依次檢查外模式、外模式/模式映像、模式、模式/內模式映像及存儲結構定義。(4)DBMS對存儲數(shù)據(jù)庫執(zhí)行必要的存取操作。(5)從對數(shù)據(jù)庫的存取操作中接受結果。(6)對得到的結果進行必要的處理,如格式轉換等。(7)將處理的結果返回給用戶。1.4數(shù)據(jù)庫系統(tǒng)的內部體系結構1.4.1三級模式與二級映像數(shù)據(jù)庫系統(tǒng)模式的概念模式(Schema)是數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結構和特征的描述,它僅涉及型的描述,而不涉及具體的值。模式的一個具體值稱為模式的一個實例(Instance)。同一個模式可以有很多實例。學號姓名

性別年齡系別

001101

張立男20計算機型值模式實例1.4數(shù)據(jù)庫系統(tǒng)的內部體系結構1.4.1三級模式與二級映像2.三級模式與二級映像三級模式結構與二級映像功能示意圖1.4數(shù)據(jù)庫系統(tǒng)的內部體系結構1.4.1三級模式與二級映像2.三級模式與二級映像數(shù)據(jù)庫中全體數(shù)據(jù)的邏輯結構和特征的描述數(shù)據(jù)庫用戶能看到并允許使用的那部分局部數(shù)據(jù)的邏輯結構和特征的描述它是對數(shù)據(jù)庫存儲結構的描述,是數(shù)據(jù)在數(shù)據(jù)庫內部的表示方式可有多個只有一個-內模式是整個數(shù)據(jù)庫實際存儲的表示-模式是整個數(shù)據(jù)庫實際存儲的抽象表示-外模式是邏輯模式的某一部分的抽象表示外模式模式內模式1.4數(shù)據(jù)庫系統(tǒng)的內部體系結構1.4.1三級模式與二級映像2.三級模式與二級映像外模式/模式映像數(shù)據(jù)庫中的同一模式可以有任意多個外模式,對于每一個外模式,都存在一個外模式/模式映像,所以,在一個數(shù)據(jù)庫系統(tǒng)中,外模式/模式映像有多個。模式/內模式映像數(shù)據(jù)庫中的模式和內模式都只有一個,所以,在一個數(shù)據(jù)庫系統(tǒng)中,模式/內模式映像是唯一的,它確定了數(shù)據(jù)的全局邏輯結構與存儲結構之間的對應關系。1.4數(shù)據(jù)庫系統(tǒng)的內部體系結構1.4.2數(shù)據(jù)的邏輯和物理獨立性外模式/模式映象模式/內模式映象保證了數(shù)據(jù)與程序間的邏輯獨立性確保了數(shù)據(jù)的物理獨立性1.4數(shù)據(jù)庫系統(tǒng)的內部體系結構1.4.3數(shù)據(jù)庫系統(tǒng)的三級模式與二級映像的優(yōu)點保證數(shù)據(jù)的獨立性有利于數(shù)據(jù)的安全保密有利于數(shù)據(jù)共享簡化了用戶接口數(shù)據(jù)庫系統(tǒng)三級模式與二級映像的優(yōu)點1.5數(shù)據(jù)庫系統(tǒng)的外部體系結構單用戶結構的數(shù)據(jù)庫系統(tǒng)主從式結構的數(shù)據(jù)庫系統(tǒng)分布式結構的數(shù)據(jù)庫系統(tǒng)客戶/服務器結構的數(shù)據(jù)庫系統(tǒng)瀏覽器/服務器結構的數(shù)據(jù)庫系統(tǒng)一臺計算機,不能共享數(shù)據(jù)大型主機帶多個終端;主機處理,終端輸出是分布在計算機網(wǎng)絡上的多個邏輯相關的數(shù)據(jù)庫的集合把DBMS的功能與應用程序分開;管理數(shù)據(jù)的結點稱為服務器應用DBMS的結點稱為客戶機將客戶端運行的應用程序轉移到應用服務器上,充當了客戶機和數(shù)據(jù)庫服務器的中介1.6三個世界及其有關概念1.6.1現(xiàn)實世界現(xiàn)實世界,即客觀存在的世界。其中存在著各種事物及它們之間的聯(lián)系,每個事物都有自己的特征或性質。例如,要描述一個學生,常選用學號、姓名、性別、年齡、系別等來描述,有了這些特征,就能區(qū)分不同的學生。現(xiàn)實世界中,事物之間是相互聯(lián)系的,而這種聯(lián)系可能是多方面的。例如,在學生管理系統(tǒng)中,可以選擇“學生選修課程”這一聯(lián)系表示學生和課程之間的關系。1.6三個世界及其有關概念1.6.2信息世界1.信息世界及其有關概念型值屬性名具體值實體屬性客觀存在并且可以相互區(qū)別的“事物”稱為實體實體可以是具體的人、事、物,也可以是抽象的事件

實體所具有的某一特性稱為屬性1.6三個世界及其有關概念1.6.2信息世界1.信息世界及其有關概念單個實體型內部的聯(lián)系通常是指組成實體的各屬性之間的聯(lián)系實體型之間的聯(lián)系通常是指不同實體集之間的聯(lián)系具有相同屬性的實體必然具有共同的特征同型實體的集合稱為實體集能唯一標識一個實體的屬性或屬性集稱為實體的碼某一屬性的取值范圍稱為該屬性的域學生(學號,姓名,年齡,性別,系)實體型碼域聯(lián)系實體集1.6三個世界及其有關概念1.6.2信息世界2.兩個實體型之間的聯(lián)系兩個實體型之間的聯(lián)系是指兩個不同的實體集間的聯(lián)系,有如下三種類型。1.6三個世界及其有關概念1.6.2信息世界3.兩個以上實體型之間的聯(lián)系兩個以上的實體型之間也存在著一對一、一對多和多對多的聯(lián)系。例如,對于課程、教師與參考書三個實體型,如果一門課程可以有若干個教師講授,使用若干本參考書,而每一個教師只講授一門課程,每一本參考書只供一門課程使用,則課程與教師、參考書之間的聯(lián)系是一對多的聯(lián)系。4.單個實體型內部的聯(lián)系同一個實體集內的各個實體之間存在的聯(lián)系,也可以有一對一、一對多和多對多的聯(lián)系。例如,職工實體型內部具有領導與被領導的聯(lián)系,即某一職工“領導”若干名職工,而一個職工僅被另外一個職工直接領導,因此,在職工實體集內部這種聯(lián)系,就是一對多的聯(lián)系。1.6三個世界及其有關概念1.6.3計算機世界標記實體屬性的命名單位稱為字段。能唯一標識文件中每個記錄的字段或字段集,稱為記錄的關鍵字。同一類記錄的集合稱為文件。如,所有學生的記錄組成了一個學生文件。字段的有序集合稱為記錄。如,一個學生(990001,張立,20,男,計算機)為一個記錄。字段Field記錄Record文件File關鍵字Key1.6三個世界及其有關概念1.6.3計算機世界三個世界各術語的對應關系現(xiàn)實世界

信息世界

計算機世界事物總體 實體集文件事物個體 實體記錄特征 屬性字段事物間聯(lián)系 實體模型數(shù)據(jù)模型1.6三個世界及其有關概念1.6.4三個世界之間的聯(lián)系如下圖所示,在實際的數(shù)據(jù)處理過程中,首先將現(xiàn)實世界的事物及聯(lián)系抽象成信息世界的概念模型,然后再抽象成計算機世界的數(shù)據(jù)模型。概念模型并不依賴于具體的計算機系統(tǒng),不是某一個DBMS所支持的數(shù)據(jù)模型,它是計算機內部數(shù)據(jù)的抽象表示;概念模型經(jīng)過抽象,轉換成計算機上某一DBMS支持的數(shù)據(jù)模型。1.7數(shù)據(jù)模型的分類1.7.1數(shù)據(jù)模型的組成要素1.數(shù)據(jù)結構數(shù)據(jù)結構描述的是數(shù)據(jù)庫的靜態(tài)特性,是數(shù)據(jù)模型中最基本的部分,不同的數(shù)據(jù)模型采用不同的數(shù)據(jù)結構。2.數(shù)據(jù)操作數(shù)據(jù)操作是指對數(shù)據(jù)庫中的各種數(shù)據(jù)允許執(zhí)行的操作的集合,包括操作及相應的操作規(guī)則,描述了數(shù)據(jù)庫的動態(tài)特性。數(shù)據(jù)庫有查詢和更新(包括插入、刪除和修改)兩類操作。數(shù)據(jù)模型必須定義這些操作的確切含義、操作符號、操作規(guī)則(如優(yōu)先級)以及實現(xiàn)操作的語言。1.7數(shù)據(jù)模型的分類1.7.1數(shù)據(jù)模型的組成要素3.數(shù)據(jù)的完整性約束數(shù)據(jù)的完整性約束條件是一組完整性規(guī)則的集合。完整性規(guī)則是給定的數(shù)據(jù)模型中數(shù)據(jù)及其聯(lián)系所具有的制約和依存規(guī)則,用以限定符合數(shù)據(jù)模型的數(shù)據(jù)庫狀態(tài)以及狀態(tài)的變化,以保證數(shù)據(jù)的正確、有效、相容。數(shù)據(jù)模型應該反映和規(guī)定本數(shù)據(jù)模型必須遵守的基本的和通用的完整性約束條件,還應該提供定義完整性約束條件的機制,以反映具體應用所涉及的數(shù)據(jù)必須遵守的特定的語義約束條件。例如,在學生管理數(shù)據(jù)庫中,學生的年齡不得超過40歲。1.7數(shù)據(jù)模型的分類1.7.2層次模型無雙親,根節(jié)點·每棵樹有且僅有一個結點沒有雙親,該結點

就是根結點·根以外的其他結點有且僅有一個雙親結點·父子結點之間的聯(lián)系是一對多(1:n)的聯(lián)系層次模型有向樹的示意圖1.7數(shù)據(jù)模型的分類1.7.2層次模型TS數(shù)據(jù)庫模型具有四個記錄型:D,R,S,TS與T是葉結點,它們沒有子女結點由D到R,R到T,由D到S均是一對多的關系1.7數(shù)據(jù)模型的分類1.7.2層次模型層次模型的數(shù)據(jù)操縱與數(shù)據(jù)完整性約束進行插入操作時,如果沒有相應的雙親結點值就不能插入子女結點值。進行刪除操作時,如果刪除雙親結點值,則相應的子女結點值也被同時刪除。修改操作時,應修改所有相應的記錄,以保證數(shù)據(jù)的一致性。層次模型的優(yōu)缺點結構簡單,層次分明查詢效率高提供良好的數(shù)據(jù)完整性支持不能直接表示多對多聯(lián)系插入和刪除數(shù)據(jù)限制太多查詢子女結點必須通過雙親結點優(yōu)點缺點1.7數(shù)據(jù)模型的分類1.7.3網(wǎng)狀模型網(wǎng)狀模型的數(shù)據(jù)結構網(wǎng)狀模型是采用有向圖結構表示記錄型與記錄型之間聯(lián)系的數(shù)據(jù)模型。每個結點表示一個記錄型,每個記錄型可包含若干個字段,記錄型描述的是實體。結點間的帶箭頭的連線(或有向邊)表示記錄型間的1:n的父子聯(lián)系。網(wǎng)狀模型的特點:有一個以上的結點沒有雙親結點允許結點有多個雙親結點允許兩個結點之間有多種聯(lián)系(復合聯(lián)系)1.7數(shù)據(jù)模型的分類1.7.3網(wǎng)狀模型網(wǎng)狀模型的數(shù)據(jù)操縱與完整性約束插入數(shù)據(jù)時,允許插入尚未確定雙親結點值的子女結點值。刪除數(shù)據(jù)時,允許只刪除雙親結點值。修改數(shù)據(jù)時,只需更新指定記錄即可。網(wǎng)狀模型的優(yōu)缺點可表示實體間的多種復雜聯(lián)系具有良好的性能和存儲效率數(shù)據(jù)結構復雜數(shù)據(jù)定義語言、數(shù)據(jù)操縱語言復雜用戶需要了解網(wǎng)狀模型的實現(xiàn)細節(jié)優(yōu)點缺點1.7數(shù)據(jù)模型的分類1.7.4關系模型關系模型的數(shù)據(jù)結構及有關概念小型數(shù)據(jù)庫系統(tǒng):Foxpro、Access大型數(shù)據(jù)庫系統(tǒng):Oracle、SQLServer、Informix、Sybase關系二維表SNO學號SN姓名SEX性別AGE年齡DEPT系別S1趙亦女17計算機S2錢爾男18信息S3孫珊女20信息S4李思男21自動化S5周武男19計算機S6吳麗女20自動化元組屬性域:屬性的取值范圍,{男,女}1.7數(shù)據(jù)模型的分類1.7.4關系模型每一行對應的列的屬性值,即為元組中的一個屬性值??晌┮粯俗R一個元組的屬性或屬性集,也稱為關系鍵或主碼,如S表中學號可以惟一確定一個學生,為學生關系的主碼。關系模式是對關系的描述,是關系模型的“型”。一般表示為:關系名(屬性1,屬性2,……屬性n)如:學生(學號,姓名,性別,年齡,系別)關系實例是關系模式的“值”,是關系的數(shù)據(jù),相當于二維表中的數(shù)據(jù)。分量關鍵字關系模式關系實例1.7數(shù)據(jù)模型的分類1.7.4關系模型關系模型的數(shù)據(jù)操縱與完整性約束關系模型中的數(shù)據(jù)操作是集合操作,操作對象和操作結果都是關系,即若干元組的集合。關系模型把對數(shù)據(jù)的存取路徑隱蔽起來,用戶只要指出“干什么”,而不必詳細說明“怎么干”,從而大大地提高了數(shù)據(jù)的獨立性,提高了用戶操作效率。關系模型的優(yōu)缺點有嚴格的數(shù)學理論根據(jù)用關系描述實體間的聯(lián)系具有更高的數(shù)據(jù)獨立性、更好的安全保密性查詢效率不如非關系模型優(yōu)點缺點1.7數(shù)據(jù)模型的分類1.7.5非關系模型(NoSQL,NotOnlySQL)NoSQL的特點:易擴展NoSQL數(shù)據(jù)庫中的數(shù)據(jù)之間無關系,非常容易擴展。大數(shù)據(jù)量,高性能NoSQL數(shù)據(jù)庫都具有非常高的讀寫性能,尤其在大數(shù)據(jù)量下,同樣表現(xiàn)優(yōu)秀。應用靈活NoSQL無須事先為要存儲的數(shù)據(jù)建立字段,隨時可以存儲自定義的數(shù)據(jù)格式。這點在大數(shù)據(jù)量的Web2.0時代尤其明顯。高可用NoSQL在不太影響性能的情況,就可以方便地實現(xiàn)高可用的架構。比如Cassandra、HBase模型,通過復制模型也能實現(xiàn)高可用。1.7數(shù)據(jù)模型的分類1.7.6面向對象模型對象和對象標識對象是現(xiàn)實世界中實體的模型化。對象標識獨立于對象的內容和存儲位置,是一種邏輯標識符,通常由系統(tǒng)產生,它在整個系統(tǒng)范圍內是惟一的。兩個對象即使內部狀態(tài)值和方法都相同,如標識符不同,仍認為是兩個相等而不同的對象。每個對象都包含一組屬性和一組方法。一個學生一門課程一次考試記錄對象屬性方法對象屬性方法……1.7數(shù)據(jù)模型的分類1.7.6面向對象模型類(Class)和繼承(Inheritance)具有同樣屬性和方法集的所有對象構成了一個對象類,一個對象是某一類的實例。類的屬性域可以是基本數(shù)據(jù)類型(如整型、實型、字符型等),也可以是類。類的表示具有層次性和繼承性。對象類型值1.8數(shù)據(jù)庫領域的新技術1.8.1分布式數(shù)據(jù)庫分布式數(shù)據(jù)庫的定義分布式數(shù)據(jù)庫是一組結構化的數(shù)據(jù)集合,它們在邏輯上屬于同一系統(tǒng),而在物理上分布在計算機網(wǎng)絡的不同結點上。分布式數(shù)據(jù)庫的特點自治與共享冗余的控制分布事務執(zhí)行的復雜性數(shù)據(jù)的獨立性

數(shù)據(jù)冗余的透明性數(shù)據(jù)分布透明性物理數(shù)據(jù)透明性邏輯數(shù)據(jù)透明性1.8數(shù)據(jù)庫領域的新技術1.8.1分布式數(shù)據(jù)庫

集中式系統(tǒng)和分布式系統(tǒng)

集中式數(shù)據(jù)庫就是集中在一個中心場地的電子計算機上,以統(tǒng)一處理方式所支持的數(shù)據(jù)庫。集中控制處理效率高,可靠性好;數(shù)據(jù)冗余少,數(shù)據(jù)獨立性高;易于支持復雜的物理結構去獲得對數(shù)據(jù)的有效訪問。1.8數(shù)據(jù)庫領域的新技術1.8.2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術數(shù)據(jù)倉庫就是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,通常用于輔助決策支持。對多個異構數(shù)據(jù)源的有效集成,集成后按照主題進行重組,包含歷史數(shù)據(jù)。存放在數(shù)據(jù)倉庫中的數(shù)據(jù)通常不再修改,用于做進一步的分析型數(shù)據(jù)處理。1.數(shù)據(jù)倉庫的定義2.數(shù)據(jù)倉庫的體系結構1.8數(shù)據(jù)庫領域的新技術1.8.2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術3.數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(DataMining),就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單地說,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識,又被稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)。4.數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘的分析方法可以分為兩類:直接數(shù)據(jù)挖掘與間接數(shù)據(jù)挖掘。直接數(shù)據(jù)挖掘的目標是利用可用的數(shù)據(jù)建立一個模型,這個模型對剩余的數(shù)據(jù),比如對一個特定的變量進行描述。間接數(shù)據(jù)挖掘的目標中并沒有選出某一具體的變量并用模型進行描述,而是在所有的變量中建立起某種關系。1.8數(shù)據(jù)庫領域的新技術1.8.3大數(shù)據(jù)技術1.大數(shù)據(jù)技術的產生背景隨著硬件存儲成本的持續(xù)下降、互聯(lián)網(wǎng)技術和物聯(lián)網(wǎng)技術的高速發(fā)展,現(xiàn)代社會每天正以不可想象的速度產生各類數(shù)據(jù),如電子商務網(wǎng)站的用戶訪問日志、微博中評論和轉發(fā)信息、各類短視頻和微電影、各類商品的物流配送信息、手機通話記錄等。這些數(shù)據(jù)或流入已經(jīng)運行的數(shù)據(jù)庫系統(tǒng),或形成具有結構化的各類文件,或形成具有非結構化特征的視頻和圖像文件。據(jù)統(tǒng)計,Google每分鐘進行200萬次搜索,全球每分鐘發(fā)送2億封電子郵件,12306網(wǎng)站春節(jié)期間一天的訪問量為84億次。總之,人們已經(jīng)步入一個以各類數(shù)據(jù)為中心的全新時代——大數(shù)據(jù)時代。1.8數(shù)據(jù)庫領域的新技術1.8.3大數(shù)據(jù)技術2.大數(shù)據(jù)的概念普遍采用大數(shù)據(jù)的4V特性來描述大數(shù)據(jù),即“數(shù)據(jù)量大(Volume)”、“數(shù)據(jù)類型繁多(Variety)”、“數(shù)據(jù)處理速度快(Velocity)”和“數(shù)據(jù)價值密度低(Value)”?!皵?shù)據(jù)量大”是從數(shù)據(jù)規(guī)模的角度描述大數(shù)據(jù)的。大數(shù)據(jù)的數(shù)據(jù)量可以從數(shù)百TB到數(shù)百PB,甚至到EB的規(guī)模?!皵?shù)據(jù)類型繁多”是從數(shù)據(jù)來源和數(shù)據(jù)種類的角度描述大數(shù)據(jù)的。大數(shù)據(jù)的數(shù)據(jù)類型可以宏觀分為結構化數(shù)據(jù)和非結構化數(shù)據(jù)?!皵?shù)據(jù)處理速度快”是從數(shù)據(jù)的產生和處理的角度描述大數(shù)據(jù)的?!皵?shù)據(jù)價值密度低”是從大數(shù)據(jù)潛藏的價值分布情況描述大數(shù)據(jù)的。雖然大數(shù)據(jù)中具有很多有價值的潛在信息,但其價值的密度遠遠低于傳統(tǒng)關系型數(shù)據(jù)庫中的數(shù)據(jù)價值。1.8數(shù)據(jù)庫領域的新技術1.8.3大數(shù)據(jù)技術3.大數(shù)據(jù)的關鍵技術目前大數(shù)據(jù)所涉及的關鍵技術主要包括數(shù)據(jù)的采集和遷移、數(shù)據(jù)的存儲和管理、數(shù)據(jù)的處理和分析、數(shù)據(jù)安全和隱私保護。4.大數(shù)據(jù)技術的應用場景目前,大數(shù)據(jù)技術的應用已經(jīng)非常普遍,涉及的領域包括傳統(tǒng)零售業(yè)、金融業(yè)、醫(yī)療業(yè)和政府機構等。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術1.NewSQL的定義和特點NewSQL是各種新型可伸縮高性能SQL數(shù)據(jù)庫的簡稱,旨在為在線事物處理(OLTP)工作負載提供NoSQL系統(tǒng)的可擴展性,同時保持傳統(tǒng)數(shù)據(jù)庫系統(tǒng)的ACID保證。NewSQL仍然采用關系數(shù)據(jù)模型,支持SQL查詢,擁有強一致性和事物一致性。另外,NewSQL借鑒了NoSQL的架構,有很好的水平擴展性,支持海量數(shù)據(jù)存儲。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術2.NewSQL系統(tǒng)的分類(1)新型架構新型架構NewSQL不是擴展已有系統(tǒng),而是從全新的起點開始設計,采用分布式架構,包含支持多節(jié)點并發(fā)控制、基于復制的容錯、流控制和分布式查詢處理等組件。這樣做的優(yōu)點是系統(tǒng)所有部分都可以針對多節(jié)點環(huán)境進行優(yōu)化,包括查詢優(yōu)化、節(jié)點間通信協(xié)議優(yōu)化等。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術2.NewSQL系統(tǒng)的分類(2)透明的數(shù)據(jù)分片中間件系統(tǒng)提供數(shù)據(jù)分片中間件,用戶可以借助它們將數(shù)據(jù)庫分成多個部分,并存儲到由多個單節(jié)點機器組成的集群中,每一個節(jié)點都運行相同的數(shù)據(jù)庫管理系統(tǒng),只維護自己負責的整個數(shù)據(jù)庫中的一部分數(shù)據(jù),不能被不用的應用獨立訪問或修改。集中化的中間組件負責分配查詢,協(xié)調事務,同時也管理數(shù)據(jù)的位置,復制和跨節(jié)點的數(shù)據(jù)分區(qū)。集群典型的架構是在每個節(jié)點上都安裝一個中階層和中間件通信,這個組件負責代替中間件在數(shù)據(jù)庫管理系統(tǒng)實例上執(zhí)行查詢并返回結果,最后由中間件整合。使用數(shù)據(jù)分片中間件的核心優(yōu)勢是能夠非常簡單地替換已經(jīng)使用了單節(jié)點數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)庫,開發(fā)者無需對應用做任何修改。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術2.NewSQL系統(tǒng)的分類(3)Database-as-a-ServiceDatabase-as-a-Service是云服務提供商的NewSQL方案,通過云服務,用戶不需要在自己的硬件設備上或者云端虛擬機上安裝和維護數(shù)據(jù)庫管理系統(tǒng)。Database-as-a-Service提供商負責維護所有數(shù)據(jù)庫物理機及其配置,包括系統(tǒng)優(yōu)化、賦值和備份。交付給用戶的只是一個連接數(shù)據(jù)庫管理系統(tǒng)的網(wǎng)絡鏈接,以及一個用于監(jiān)控的儀表盤頁面或者一組用于系統(tǒng)控制的API。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術3.NewSQL的常用產品(1)SpannerSpanner是谷歌公司設計、開發(fā)和部署的,是一個可擴展的、全球分布式的數(shù)據(jù)庫系統(tǒng),后續(xù)的很多NewSQL數(shù)據(jù)庫系統(tǒng)都借鑒了Spanner的思想。Spanner被組織成多個zone的集合,每個zone都類似于一個BigTable服務器的部署。(2)CockroachDBCockroachDB是Spanner的開源版本,支持標準SQL接口、線性擴展、強一致性、高可用性等重要特性。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術3.NewSQL的常用產品(3)TiDBTiDB是PingCAP公司自主設計,支持在線事物處理與在線分析處理,可以水平擴容或者縮容、金融高可用性、實時HTAP、云原生的分布式數(shù)據(jù)庫。(4)OceanBaseOceanBase是由螞蟻集團自主研發(fā)的企業(yè)級分布式關系數(shù)據(jù)庫,基于分布式框架和通用服務器、實現(xiàn)了金融機構可靠性以及數(shù)據(jù)一致性。(5)TDSQLTDSQLMySQL是騰訊研發(fā)的一款分布式數(shù)據(jù)庫產品,具備強一致性、高可用、全球部署架構、分布式水平擴展、高性能、企業(yè)級安全等特性。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術4.NewSQL的應用領域(1)金融業(yè)互聯(lián)網(wǎng)特色金融業(yè)務中,單筆交易變小、交易次數(shù)變多、NewSQL技術可以支持這類應用。(2)電子商務電子商務平臺都是基于分布式數(shù)據(jù)庫,NewaSQL的分布結構保證了數(shù)據(jù)庫免受物理硬件性能限制,實現(xiàn)性能在線擴展。1.8數(shù)據(jù)庫領域的新技術1.8.4NewSQL技術4.NewSQL的應用領域(3)海量數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論