交通運輸信息管理_第1頁
交通運輸信息管理_第2頁
交通運輸信息管理_第3頁
交通運輸信息管理_第4頁
交通運輸信息管理_第5頁
已閱讀5頁,還剩83頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、交交通通工工程程學學院院崔崔書書堂堂主主講講第二章信息系統(tǒng)數(shù)據(jù)庫第二章信息系統(tǒng)數(shù)據(jù)庫 2.1 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識數(shù)據(jù)庫系統(tǒng)基礎知識 2.2 2.2 信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫2.3 運輸信息系統(tǒng)中的數(shù)據(jù)倉庫運輸信息系統(tǒng)中的數(shù)據(jù)倉庫 2.4 數(shù)據(jù)庫設計數(shù)據(jù)庫設計交通運輸信息管理交通運輸信息管理 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 數(shù)據(jù)庫是關于數(shù)據(jù)管理的技術,是計算機科數(shù)據(jù)庫是關于數(shù)據(jù)管理的技術,是計算機科學的重要分文。隨著數(shù)據(jù)庫技術的成熟相信息應學的重要分文。隨著數(shù)據(jù)庫技術的成熟相信息應用的普及,人類積累的信息量正在迅速增長,數(shù)用的普及,人類積累的信息量正在迅速增長,數(shù)據(jù)庫已經(jīng)

2、成為企業(yè)存儲信息、管理信息的重要技據(jù)庫已經(jīng)成為企業(yè)存儲信息、管理信息的重要技術手段,成為企業(yè)管理的基本組成部分。術手段,成為企業(yè)管理的基本組成部分。 1 1什么是數(shù)據(jù)庫什么是數(shù)據(jù)庫 數(shù)據(jù)庫就是利用計算機存儲和管理數(shù)據(jù)所建立的數(shù)據(jù)集合,數(shù)據(jù)庫就是利用計算機存儲和管理數(shù)據(jù)所建立的數(shù)據(jù)集合,是由一個互相關聯(lián)的數(shù)據(jù)集合和一組用以訪問這些數(shù)據(jù)的程序是由一個互相關聯(lián)的數(shù)據(jù)集合和一組用以訪問這些數(shù)據(jù)的程序組成。它是數(shù)據(jù)庫系統(tǒng)的重要組成部分。組成。它是數(shù)據(jù)庫系統(tǒng)的重要組成部分。 數(shù)據(jù)庫管理的基本目標是提供一個方便地、有效地存取和數(shù)據(jù)庫管理的基本目標是提供一個方便地、有效地存取和管理大量數(shù)據(jù)信息的環(huán)境。管理大量

3、數(shù)據(jù)信息的環(huán)境。 一、一、 數(shù)據(jù)庫的基本概念數(shù)據(jù)庫的基本概念數(shù)據(jù)庫的核心是數(shù)據(jù)管理,數(shù)據(jù)庫的核心是數(shù)據(jù)管理,數(shù)據(jù)管理數(shù)據(jù)管理是指對各種形式的數(shù)據(jù)進行收集、分是指對各種形式的數(shù)據(jù)進行收集、分類、組織、編碼、存儲、檢索和維護等一系列活動的總和。其目的:類、組織、編碼、存儲、檢索和維護等一系列活動的總和。其目的: 1 1)從大量的、原始的數(shù)據(jù)中抽取、推導出對人們有價值的信息作為決策依)從大量的、原始的數(shù)據(jù)中抽取、推導出對人們有價值的信息作為決策依據(jù);據(jù); 2 2)借助計算機科學地保存和管理復雜的大量的數(shù)據(jù),以便人們能方便而充)借助計算機科學地保存和管理復雜的大量的數(shù)據(jù),以便人們能方便而充分地利用這些

4、寶貴的信息資源。分地利用這些寶貴的信息資源。 數(shù)據(jù)庫是反映數(shù)據(jù)本身的內容而且反映數(shù)據(jù)之間的聯(lián)系。為什么要設計數(shù)據(jù)庫?l 保存數(shù)據(jù)l 擴展人們的記憶,共享信息;l 幫助人們控制與之相關的事物 因此,數(shù)據(jù)庫往往不是孤立的,通常是一個更大的信息控制系統(tǒng)的部分。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 2 2、數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫系統(tǒng)l 數(shù)據(jù)庫系統(tǒng)是由計算機系統(tǒng)、數(shù)據(jù)、數(shù)據(jù)庫管理系統(tǒng)和有關人員組成的數(shù)據(jù)庫系統(tǒng)是由計算機系統(tǒng)、數(shù)據(jù)、數(shù)據(jù)庫管理系統(tǒng)和有關人員組成的具有高度組織的總體。具有高度組織的總體。l 主要組成部分:主要組成部分:l 計算機系統(tǒng)計算機系統(tǒng)l 數(shù)據(jù)庫數(shù)據(jù)庫l 數(shù)據(jù)庫管理系統(tǒng)(數(shù)據(jù)庫管理系統(tǒng)(DNMS)

5、DNMS)l 人員人員 (1)(1)數(shù)據(jù)庫管理員。數(shù)據(jù)庫管理員。 (2)(2)系統(tǒng)程序員。系統(tǒng)程序員。 (3)(3)用戶。用戶。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 把數(shù)據(jù)庫比做圖書館一個圖書館要想很好地為讀者服務,必須完成以下工作: (1)建立完善的書卡 (2)圖書應有組織地存放在書庫中 (3)規(guī)定借閱權限 (4)建立周密的借閱管理制度 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 對數(shù)據(jù)庫來說,也要完成類似于圖書館的上述工作(1)建立數(shù)據(jù)模型 數(shù)據(jù)模型是對客觀事物及其聯(lián)系的數(shù)據(jù)描述反映各種數(shù)據(jù)之間的內在聯(lián)系。數(shù)據(jù)庫不僅要存儲這些數(shù)據(jù),更重要的是根據(jù)需求建立數(shù)據(jù)之間的聯(lián)系模型,其目的就是方便用戶利用數(shù)據(jù),使用戶可以根

6、據(jù)數(shù)據(jù)模型快速訪問數(shù)據(jù)庫中的數(shù)據(jù)(如查詢檢索、增加、修改和刪除)。(2)有組織地存儲數(shù)據(jù) 數(shù)據(jù)庫中的數(shù)據(jù)是有組織地存放在存儲設備上的,并建立數(shù)據(jù)模型到物理存儲位置的對應表(這種對應稱為映射),這樣數(shù)據(jù)庫管理系統(tǒng)就能夠按照用戶的訪問請求,快速找到被訪問的數(shù)據(jù),而不必關心數(shù)據(jù)在數(shù)據(jù)庫中的物理存儲位置,就像讀者可以按書卡填寫借書單,而不用顧及書籍存放在書庫的具體位置一樣。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 (3)設定訪問權限 用戶對數(shù)據(jù)庫的訪問是受訪問權限控制的。數(shù)據(jù)庫設計者首先根據(jù)使用用戶設定合法用戶標識(用戶名和口令),然后依據(jù)席同用戶身份規(guī)定用戶不同的訪問權限和級別并授權。當一個用戶訪問數(shù)據(jù)庫時,數(shù)

7、據(jù)庫管理系統(tǒng)首先要檢查用戶身份,合法用戶才能進入數(shù)據(jù)庫系統(tǒng),當用戶對數(shù)據(jù)庫執(zhí)行操作時,系統(tǒng)檢查用戶權限,檢變通過后才執(zhí)行允許的操作。 (4)建立完善的數(shù)據(jù)管理體系 設立“數(shù)據(jù)庫系統(tǒng)“的目的是為了管理大量信息。對數(shù)據(jù)的管理既涉及數(shù)據(jù)存儲結構的定義,又涉及信息操作機削的提供。此外,數(shù)據(jù)庫系統(tǒng)還必須提供信息的安全性、完整性保證,數(shù)據(jù)庫系統(tǒng)的并發(fā)控制、災難恢復等管理機制。完善的數(shù)據(jù)管理體系是數(shù)據(jù)庫最重要的特征之一,也是衡量數(shù)據(jù)庫性能的一個重要指標。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 2數(shù)據(jù)庫的發(fā)展 20世紀60年代早期,文件系統(tǒng)是數(shù)據(jù)管理的主要技術,用戶的數(shù)據(jù)文件主要存儲在磁帶上,它的組織方式是順序的,數(shù)據(jù)

8、的訪問是通過Io設備的輸入輸出完成的,一組數(shù)據(jù)對應一個程序,如圖61所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 0世紀60年代中后期,直接存儲設備磁鼓、磁盤,特別是硬盤的廣泛應用極大地改變了數(shù)據(jù)處理的情況。文件的邏輯結構與物理存儲結構由系統(tǒng)進行轉換,程序與數(shù)據(jù)有了一定的獨立性。數(shù)據(jù)管理軟件中還增加了一些安全、保密檢查機構,部分系統(tǒng)允許用戶之間以文件為單位共享數(shù)據(jù),如圖所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 突出的問題是: (1)數(shù)據(jù)和程序缺乏獨立性 (2)數(shù)據(jù)冗余度大 由于相同數(shù)據(jù)的重復存儲,各自管理,給數(shù)據(jù)的修改和維護帶來了困難、容易造成數(shù)據(jù)的不一致件。(3)數(shù)據(jù)訪問困難 文件系統(tǒng)中數(shù)據(jù)訪問是以特定的程

9、序而向特定的作用的,沒有通用的能對變化的需求做出快速反應的數(shù)據(jù)檢索系統(tǒng),因此,不同的數(shù)據(jù)訪問需要編寫不問的應用程序。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 20世紀60年代末期數(shù)據(jù)庫管理技術應運而生。最初的數(shù)據(jù)庫主要是網(wǎng)狀數(shù)據(jù)庫和層次數(shù)據(jù)庫。它們可以創(chuàng)建和操作表或樹這樣的數(shù)據(jù)結構。 20世紀助年代,關系數(shù)據(jù)庫占據(jù)了數(shù)據(jù)庫系統(tǒng)的主導地位。在關系數(shù)據(jù)庫中,幾乎所有處理數(shù)據(jù)底層的細節(jié)工作都由數(shù)據(jù)庫自動完成,關系模型的簡單性和能夠對程序員隱藏所有實現(xiàn)細節(jié)的能力使關系數(shù)據(jù)庫迅速發(fā)展起來。 在20世紀80年代人們還對并行和分布式數(shù)據(jù)庫進行了許多研究,面向對象的數(shù)據(jù)庫也開始出現(xiàn)。 20世紀90年代末,隨著互聯(lián)網(wǎng)爆炸式

10、的發(fā)展,使數(shù)據(jù)庫比以前有了更廣泛的應用。現(xiàn)在的數(shù)據(jù)庫必須支持很高的事物處理速度,而且還要有很高的可靠性和24x 7的可用性(一天24小時,一周7天都可用,也就是沒有進行維護的停機時間)。數(shù)掘庫系統(tǒng)還必須支持網(wǎng)絡接口。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 3數(shù)據(jù)庫的特征 ()數(shù)據(jù)和程序的獨立性較高 (2)數(shù)據(jù)冗余度小,共享度高,易擴充l 可以大大減小數(shù)據(jù)的冗余度,既節(jié)約存儲空間,減少存取時間又可避免數(shù)據(jù)之間的不相容性和不一致性。 (3)數(shù)據(jù)結構化l 數(shù)據(jù)庫在描述數(shù)據(jù)時不僅要求描述數(shù)據(jù)本身,還要求描述數(shù)據(jù)之間的聯(lián)系,即建立數(shù)據(jù)模型。這樣,數(shù)據(jù)庫中的數(shù)據(jù)便結構化廠,數(shù)據(jù)的結構化是數(shù)據(jù)庫的重要特征之一。 2.

11、1 數(shù)據(jù)庫系統(tǒng)基礎知識 (4)統(tǒng)一的數(shù)據(jù)控制功能 數(shù)據(jù)庫是系統(tǒng)中各用戶的共享資源。計算機的共享一般是并發(fā)的,許多用戶同時使用數(shù)據(jù)庫,因此系統(tǒng)必須提供以下三方而的控制功能。A 數(shù)據(jù)的安全性控制 數(shù)據(jù)的安全性是指保護數(shù)據(jù)以防止不合法的使用所造成數(shù)據(jù)的泄密和破壞。B 數(shù)據(jù)的完整性 數(shù)據(jù)的完整性指數(shù)據(jù)的正確性、有效性與相容性。系統(tǒng)提供必要的功能,保證數(shù)據(jù)庫中的數(shù)據(jù)在輸入、修改過程中始終符合原來的定義和規(guī)定。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 C 并發(fā)控制 當多個用戶的并發(fā)進程同時存取、修改數(shù)據(jù)庫時,可能會發(fā)生互相干擾而得到錯誤的結果并使數(shù)據(jù)庫完整性遭到破壞,因此必須對多用戶的并發(fā)操作加以控制、協(xié)調。數(shù)據(jù)庫系

12、統(tǒng)的程序和數(shù)據(jù)的關系如圖所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 數(shù)據(jù)庫是通用的綜合的數(shù)據(jù)集合。它可以供各種用數(shù)據(jù)庫是通用的綜合的數(shù)據(jù)集合。它可以供各種用戶共享且具有最小冗余度和較高的數(shù)據(jù)與程序的獨立戶共享且具有最小冗余度和較高的數(shù)據(jù)與程序的獨立性。由于多種程序并發(fā)地位用數(shù)據(jù)庫,數(shù)據(jù)庫提供安性。由于多種程序并發(fā)地位用數(shù)據(jù)庫,數(shù)據(jù)庫提供安全性、完整性等控制。全性、完整性等控制。 數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)(DBMS)(DBMS)在建立、使用和維護數(shù)據(jù)時在建立、使用和維護數(shù)據(jù)時對數(shù)據(jù)庫進行統(tǒng)一控制。對數(shù)據(jù)庫進行統(tǒng)一控制。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 二、二、 數(shù)據(jù)模型數(shù)據(jù)模型 數(shù)據(jù)庫是企業(yè)或部門所涉及

13、的數(shù)據(jù)的綜合,不僅反數(shù)據(jù)庫是企業(yè)或部門所涉及的數(shù)據(jù)的綜合,不僅反映數(shù)據(jù)本身的內容,而且反映數(shù)據(jù)之間的聯(lián)系,數(shù)據(jù)庫映數(shù)據(jù)本身的內容,而且反映數(shù)據(jù)之間的聯(lián)系,數(shù)據(jù)庫結構的基礎是數(shù)據(jù)模型。結構的基礎是數(shù)據(jù)模型。數(shù)據(jù)模型是對客觀事物及其聯(lián)數(shù)據(jù)模型是對客觀事物及其聯(lián)系的數(shù)據(jù)描述,是描述數(shù)據(jù)、數(shù)據(jù)聯(lián)系、數(shù)據(jù)語義以及系的數(shù)據(jù)描述,是描述數(shù)據(jù)、數(shù)據(jù)聯(lián)系、數(shù)據(jù)語義以及一致性約束的概念工具的集合。一致性約束的概念工具的集合。數(shù)據(jù)模型給出了一種邏數(shù)據(jù)模型給出了一種邏輯層的數(shù)據(jù)庫設計方法,在這部分我們概述目前常用的輯層的數(shù)據(jù)庫設計方法,在這部分我們概述目前常用的兩種數(shù)據(jù)模型:兩種數(shù)據(jù)模型: 實體一聯(lián)系模型實體一聯(lián)系模

14、型 關系模型。關系模型。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 1實體一聯(lián)系模型 為了用數(shù)據(jù)庫來模擬現(xiàn)實世界中的客觀對象,人為了用數(shù)據(jù)庫來模擬現(xiàn)實世界中的客觀對象,人們需要將現(xiàn)實世界的這些對象經(jīng)過選擇、命名、分類、們需要將現(xiàn)實世界的這些對象經(jīng)過選擇、命名、分類、整理等活動抽象為一種信息結構。這個過程常用的方整理等活動抽象為一種信息結構。這個過程常用的方法是建立客觀對象的實體一聯(lián)系(法是建立客觀對象的實體一聯(lián)系(ER)ER)數(shù)據(jù)模型。數(shù)據(jù)模型。 現(xiàn)實世界是由一組稱為現(xiàn)實世界是由一組稱為實體實體的基本對象及這些對的基本對象及這些對象間的聯(lián)系組成。象間的聯(lián)系組成。ERER模型力圖表達數(shù)據(jù)的意義模型力圖表達數(shù)據(jù)

15、的意義, ,可以可以將現(xiàn)實世界事實的含義和相互關系映射成概念模式,此將現(xiàn)實世界事實的含義和相互關系映射成概念模式,此模型的提出是為了有助于數(shù)據(jù)庫的設計,通過定義數(shù)據(jù)模型的提出是為了有助于數(shù)據(jù)庫的設計,通過定義數(shù)據(jù)模式來實現(xiàn)數(shù)據(jù)庫的全局邏輯結構的設計。模式來實現(xiàn)數(shù)據(jù)庫的全局邏輯結構的設計。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 E-R模型所采用的三個主要概念是:實體集、聯(lián)系集和屬性。 (1)實體集l 實體實體(entity):(entity):是指明客觀存在并相互區(qū)別的事物。是指明客觀存在并相互區(qū)別的事物。 實體可以是具體對象。實體可以是具體對象。 l 例。一本書、一個工廠、一種材料等。例。一本書、一個工

16、廠、一種材料等。 實體也可以是抽象的概念和聯(lián)系。實體也可以是抽象的概念和聯(lián)系。 l 例。學生的一次選課、一次借書等。例。學生的一次選課、一次借書等。 l 實體集實體集(entity set):(entity set):具有相同性質的同類實體的具有相同性質的同類實體的集合。集合。l 例。所有教師、所有選課等。例。所有教師、所有選課等。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 (2)屬性l屬性屬性(attribute)(attribute):實體具有許多特性,每一個特性稱為屬性。實體是通過屬性來表示。屬性:實體具有許多特性,每一個特性稱為屬性。實體是通過屬性來表示。屬性是實體集中每個成員具有的描述性性質。是實

17、體集中每個成員具有的描述性性質。l例。學生的實體可由學號、姓名、性別、年齡、系別等屬性組成例。學生的實體可由學號、姓名、性別、年齡、系別等屬性組成。 l每個屬性有一個取值范圍,即值域。每個屬性有一個取值范圍,即值域。 l例。性別的取值范圍是例。性別的取值范圍是“男男”或或“女女”。對某個客戶實體,它的客戶號的編碼是。對某個客戶實體,它的客戶號的編碼是001001,客,客戶名稱的值是東方電機,地址是上海徐匯區(qū)。戶名稱的值是東方電機,地址是上海徐匯區(qū)。l一般來說、每個實體集中要創(chuàng)建或分配包含一個或幾個屬性的屬性子集一般來說、每個實體集中要創(chuàng)建或分配包含一個或幾個屬性的屬性子集惟一標識實體惟一標識實

18、體,這,這個屬性子集被稱為該實體集的個屬性子集被稱為該實體集的主關鍵字主關鍵字。又叫主鍵。又叫主鍵(key)(key):惟一標識實體的屬性集。:惟一標識實體的屬性集。 l舉例。學生實體的學號可作為學生實體的主鍵。舉例。學生實體的學號可作為學生實體的主鍵。l下表所示為運輸管理信息系統(tǒng)中運輸管理數(shù)據(jù)庫的一部分,其中有兩個實體集:客戶實體集下表所示為運輸管理信息系統(tǒng)中運輸管理數(shù)據(jù)庫的一部分,其中有兩個實體集:客戶實體集( (表表62)62)和訂單實體集和訂單實體集( (表表63)63),主關鍵字以下劃線表示,主關鍵字以下劃線表示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 客戶實體集 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識

19、訂單實體集 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 (3)聯(lián)系集 聯(lián)系是指多個實體間的相互關聯(lián)。聯(lián)系是指多個實體間的相互關聯(lián)。 兩個實體集兩個實體集A A和和B B之間的聯(lián)系可分為四類:之間的聯(lián)系可分為四類:l 一對一。一對一。A A中的一個實體至多同中的一個實體至多同B B中的一個實體相聯(lián)系,如圖中的一個實體相聯(lián)系,如圖(a)(a)所示。所示。l 一對多。一對多。A A中的一個實體可以同中的一個實體可以同B B中的任意數(shù)目的實體相聯(lián)系,而中的任意數(shù)目的實體相聯(lián)系,而B B中的一個實中的一個實體至多同體至多同A A中的一個實體相聯(lián)系如圖中的一個實體相聯(lián)系如圖(b(b所示。所示。l 多對一。多對一。A A中

20、的一個實體至多同中的一個實體至多同B B中的一個實體相聯(lián)系,而中的一個實體相聯(lián)系,而B B中的一個實體可以中的一個實體可以同同A A中的任意數(shù)目的實體相聯(lián)系,如圖中的任意數(shù)目的實體相聯(lián)系,如圖(c)(c)所示。所示。多對多。多對多。A A中的一個實體可以同中的一個實體可以同B B中的任意數(shù)目的實體相聯(lián)系中的任意數(shù)目的實體相聯(lián)系B B中的一個實體中的一個實體也可以同也可以同A A中的任意數(shù)目的實體相聯(lián)系,如圖中的任意數(shù)目的實體相聯(lián)系,如圖(d)(d)所示。所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 l 一對一聯(lián)系,記為一對一聯(lián)系,記為1:11:1。

21、 l 例。工廠與廠長之間,科研任務與課題組長之例。工廠與廠長之間,科研任務與課題組長之間都是間都是1:11:1聯(lián)系。聯(lián)系。 l 一對多聯(lián)系,記為一對多聯(lián)系,記為1:N1:N。 l 例。一個學校有若干學生,而每個學生都在一例。一個學校有若干學生,而每個學生都在一個學校學習,學校與學生之間是一對多的聯(lián)系。個學校學習,學校與學生之間是一對多的聯(lián)系。 l 多對多聯(lián)系,記為多對多聯(lián)系,記為M:NM:N。 l 例。課程與學生之間,一個學生可選多門課程,例。課程與學生之間,一個學生可選多門課程,而每一門課程可有多個學生選修,課程與學生之間而每一門課程可有多個學生選修,課程與學生之間是多對多的聯(lián)系。是多對多的

22、聯(lián)系。 (4)實體一聯(lián)系圖 數(shù)據(jù)庫的實體一聯(lián)系模型可以用E一R圖做圖形化表示。這種圖形化表示技術的簡單性及其圖示的清晰性是E一R模型被廣泛使用的重要原因。ER圖中包括如下幾個主要組件:l 矩形,表示實體集。l 橢圓,表示屬性。l 菱形,表示聯(lián)系。l 線段,將屬性連接到實體集或將實體集連接到聯(lián)系集中,并在直線上標注聯(lián)系的種類,如: 1:1表示1對l的聯(lián)系。1:n表示1對多的聯(lián)系。M:1表示多對1的聯(lián)系。n:m表示多對多的聯(lián)系。 一個表示倉儲管理中供貨聯(lián)系的ER圖如圖所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 ER模型是一個很好的方法,但現(xiàn)有數(shù)據(jù)庫中沒有一個能直接接受ER模型。主要因為ER只能說明實體以及

23、實體間語義的聯(lián)系,還不能進一步說明詳細的數(shù)據(jù)結構。一般在解決實際問題中,總是先設計一個ER模型轉換成計算機能實現(xiàn)的數(shù)據(jù)模型。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 2關系模型 關系模型是建立在數(shù)學概念基礎上的,用表的集合來表示關系模型是建立在數(shù)學概念基礎上的,用表的集合來表示數(shù)據(jù)和數(shù)據(jù)間的聯(lián)系。所以,關系模型是通過表格數(shù)據(jù)來表示數(shù)據(jù)和數(shù)據(jù)間的聯(lián)系。所以,關系模型是通過表格數(shù)據(jù)來表示實現(xiàn)和實體間聯(lián)系。實現(xiàn)和實體間聯(lián)系。 關系模型的幾個術語:關系模型的幾個術語:l 關系:一張表對應于一個關系,表名即關系名。關系:一張表對應于一個關系,表名即關系名。l 元組:表中的一行稱為一個元組或記錄。元組:表中的一行稱為

24、一個元組或記錄。l 屬性:表中的一列稱為屬性,列名即屬性名。屬性:表中的一列稱為屬性,列名即屬性名。l 主碼主碼( (主關鍵字主關鍵字) ):表中的某個屬性組,它們的值惟:表中的某個屬性組,它們的值惟l 域:屬性的取值范圍。域:屬性的取值范圍。l 分量:元組中的一個屬性值。分量:元組中的一個屬性值。 一個運輸管理系統(tǒng)的貨品關系表如表所示。一個運輸管理系統(tǒng)的貨品關系表如表所示。 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 2.1 數(shù)據(jù)庫系統(tǒng)基礎知識 關系數(shù)據(jù)庫是一種共享的數(shù)據(jù)知識庫,是目前信息系統(tǒng)產最常用的一種數(shù)據(jù)庫,運輸信息系統(tǒng)的數(shù)據(jù)庫基本上都是關系數(shù)據(jù)庫。 關系數(shù)據(jù)庫其核心部分是關系模型。2.2 信息系統(tǒng)中

25、的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫 2.2 信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫 一、一、 關系數(shù)據(jù)庫的基本攝念關系數(shù)據(jù)庫的基本攝念1數(shù)據(jù)結構關系數(shù)據(jù)庫的數(shù)據(jù)結構單一,是二維表的結構,如表65、66所示2.2 2.2 信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫2基本術語(1)關鍵字或碼。在關系的諸屬性中,惟一能夠用來標識元組的屬性(或屬性的組合)稱為關鍵字或碼。 在一個關系中,關鍵字的值不能為空,也不能重復。(2)候選關鍵字或候選碼。如果在一個關系中存在多個屬性(或組合)能用來惟一標識該關系的元織,則這些屬性或(組合)就稱為該關系的候選關鍵字或候選碼。(3)主關鍵字或主碼。在一個關系

26、的若干個候選關鍵字中指定作為關鍵字的屬性。(4)非主屬性。其他的屬性。 2.2 信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫 (5)外部關鍵字或外外鍵鍵。當關系中的某個屬性(或組合)雖個是該關系的關鍵宇或只是非關鍵字的一部分,卻是另一個關系的關鍵字時,稱該屬性為這個關系的外鍵。 如學生關系中的學部號雖不是關鍵字,卻是教學部關系的關鍵字,所以,學部號為學生關系的外鍵。(6)主表與從表。主表與從表是與外鍵相關聯(lián)的兩個表,以外鍵為主鍵的表為主表,外鍵所在的表為從表。 如上面的學生關系是從表,教學部關系是主表。 需要注意的是,關系模式是穩(wěn)定的但隨著數(shù)據(jù)庫中數(shù)據(jù)的不斷更新,是隨時間不斷變化的。 2.2

27、信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫 二、關系數(shù)據(jù)庫的數(shù)據(jù)完整性和安全性二、關系數(shù)據(jù)庫的數(shù)據(jù)完整性和安全性1完整性 數(shù)據(jù)庫的數(shù)據(jù)完整性是指數(shù)據(jù)庫中數(shù)據(jù)的正確性、相一致性。數(shù)據(jù)庫的數(shù)據(jù)完整性是指數(shù)據(jù)庫中數(shù)據(jù)的正確性、相一致性。在數(shù)在數(shù)據(jù)庫中定義數(shù)據(jù)的完整性約束是為了保證授權用戶對數(shù)據(jù)庫進行修改時不據(jù)庫中定義數(shù)據(jù)的完整性約束是為了保證授權用戶對數(shù)據(jù)庫進行修改時不會破壞數(shù)據(jù)的一致性。防止對數(shù)據(jù)庫的會破壞數(shù)據(jù)的一致性。防止對數(shù)據(jù)庫的意外破壞意外破壞。 為了維護數(shù)據(jù)中數(shù)據(jù)的正確性和一致性,在對關系數(shù)據(jù)庫進行插入、為了維護數(shù)據(jù)中數(shù)據(jù)的正確性和一致性,在對關系數(shù)據(jù)庫進行插入、刪除和修改時,必須遵循刪

28、除和修改時,必須遵循下述三類完整性下述三類完整性原則。原則。 (1)(1)實體完整性規(guī)則。實體完整性規(guī)則。這條規(guī)則要求關系中元組的主控屬性不能有空值。如這條規(guī)則要求關系中元組的主控屬性不能有空值。如果出現(xiàn)空值,主鍵就起不了惟一標識的作用。果出現(xiàn)空值,主鍵就起不了惟一標識的作用。(2)(2)引用完整性規(guī)則。引用完整性規(guī)則。這條規(guī)則要求不允許引用不存在的元組。這條規(guī)則要求不允許引用不存在的元組。(3)(3)用自定義的完整性規(guī)則。用自定義的完整性規(guī)則。這是針對某一具體數(shù)據(jù)的約束條件,由應用環(huán)這是針對某一具體數(shù)據(jù)的約束條件,由應用環(huán)境決定。境決定。 2.2 信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)庫

29、 2安全性 除了完整性約束保護意外引入的不一致性之外,數(shù)據(jù)庫除了完整性約束保護意外引入的不一致性之外,數(shù)據(jù)庫個存儲的數(shù)據(jù)還要防止個存儲的數(shù)據(jù)還要防止未經(jīng)授權的訪問和蓄意的破壞或修改未經(jīng)授權的訪問和蓄意的破壞或修改。 數(shù)據(jù)庫安全性指保護數(shù)據(jù)庫不受惡意訪問。數(shù)據(jù)庫安全性指保護數(shù)據(jù)庫不受惡意訪問。絕對杜絕對絕對杜絕對數(shù)據(jù)庫的惡意濫用是不可能的,但可以使那些企圖在沒有適數(shù)據(jù)庫的惡意濫用是不可能的,但可以使那些企圖在沒有適當授權情況下訪問數(shù)據(jù)庫的代價足夠高,以阻止絕大多數(shù)這當授權情況下訪問數(shù)據(jù)庫的代價足夠高,以阻止絕大多數(shù)這樣的訪問企圖。樣的訪問企圖。 2.2 信息系統(tǒng)中的關系數(shù)據(jù)庫信息系統(tǒng)中的關系數(shù)據(jù)

30、庫 為了保護數(shù)據(jù)庫,我們必須在幾個層次上采取安全性措施:(1)(1)數(shù)據(jù)庫系統(tǒng)層次數(shù)據(jù)庫系統(tǒng)層次。數(shù)據(jù)庫系統(tǒng)的某些用戶獲得的授權可能只允許他訪問數(shù)據(jù)。數(shù)據(jù)庫系統(tǒng)的某些用戶獲得的授權可能只允許他訪問數(shù)據(jù)庫中的有限部分,而另外一些用戶獲得的授權可能允許他提出杏詢,但不允庫中的有限部分,而另外一些用戶獲得的授權可能允許他提出杏詢,但不允許他修改數(shù)據(jù)。保證這樣的授權限制不被違反是數(shù)據(jù)庫系統(tǒng)的責任。許他修改數(shù)據(jù)。保證這樣的授權限制不被違反是數(shù)據(jù)庫系統(tǒng)的責任。(2)(2)操作系統(tǒng)層次操作系統(tǒng)層次。不管數(shù)據(jù)庫多安全、搽作系統(tǒng)安全性方面的弱點總是可能成。不管數(shù)據(jù)庫多安全、搽作系統(tǒng)安全性方面的弱點總是可能成為對

31、數(shù)據(jù)庫進行未經(jīng)授權訪問的一種手段。為對數(shù)據(jù)庫進行未經(jīng)授權訪問的一種手段。 (3)(3)網(wǎng)絡層次網(wǎng)絡層次。由于幾乎所有的數(shù)據(jù)庫系統(tǒng)都允許通過終端或網(wǎng)絡進行遠程訪問,。由于幾乎所有的數(shù)據(jù)庫系統(tǒng)都允許通過終端或網(wǎng)絡進行遠程訪問,網(wǎng)絡軟件的軟件層安全性和物理安全性一樣重要,不管在互聯(lián)網(wǎng)上還是在私網(wǎng)絡軟件的軟件層安全性和物理安全性一樣重要,不管在互聯(lián)網(wǎng)上還是在私有的網(wǎng)絡內。有的網(wǎng)絡內。(4)(4)物理層次物理層次。計算機系統(tǒng)所位于的結點(一個或多個。計算機系統(tǒng)所位于的結點(一個或多個) )必須在物理層受到保護,必須在物理層受到保護,以防止入侵者強行進入或暗中潛入。以防止入侵者強行進入或暗中潛入。(5)(

32、5)人員層次人員層次。對用戶的授權必須格外小心以減少授權用戶接受賄賠或其他好。對用戶的授權必須格外小心以減少授權用戶接受賄賠或其他好處而給入侵者提供訪問機會的可能性。處而給入侵者提供訪問機會的可能性。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫( (自學自學) ) 數(shù)據(jù)倉庫作為近些年來發(fā)展迅速的一種數(shù)據(jù)倉庫作為近些年來發(fā)展迅速的一種新興技術,將記錄業(yè)務活動的數(shù)據(jù)庫數(shù)據(jù)經(jīng)新興技術,將記錄業(yè)務活動的數(shù)據(jù)庫數(shù)據(jù)經(jīng)過再加工,形成一個綜合并面向分析的環(huán)境,過再加工,形成一個綜合并面向分析的環(huán)境,實現(xiàn)業(yè)務信息的增值服務,運輸數(shù)據(jù)倉庫已實現(xiàn)業(yè)務信息的增值服務,運輸數(shù)據(jù)倉庫已經(jīng)成為運輸管理中數(shù)據(jù)分析和聯(lián)

33、機分析處理經(jīng)成為運輸管理中數(shù)據(jù)分析和聯(lián)機分析處理日趨重要的平臺。日趨重要的平臺。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 一、數(shù)據(jù)倉庫的基本概念一、數(shù)據(jù)倉庫的基本概念1 1數(shù)據(jù)倉庫定義數(shù)據(jù)倉庫定義 數(shù)據(jù)倉庫是計算機和運輸?shù)葦?shù)據(jù)應用發(fā)展到一定階段的必然產物。數(shù)數(shù)據(jù)倉庫是計算機和運輸?shù)葦?shù)據(jù)應用發(fā)展到一定階段的必然產物。數(shù)據(jù)倉庫的目的是為了建立一種體系化的數(shù)據(jù)存儲環(huán)境,將分析決策所需的大據(jù)倉庫的目的是為了建立一種體系化的數(shù)據(jù)存儲環(huán)境,將分析決策所需的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,使分散、不一致的操作數(shù)據(jù)轉換成集量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,使分散、不一致的操作數(shù)據(jù)轉

34、換成集成、統(tǒng)一的信息。企業(yè)內不同單位、不同角色的成員都可以在此單一環(huán)境之成、統(tǒng)一的信息。企業(yè)內不同單位、不同角色的成員都可以在此單一環(huán)境之下,通過運用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問題、新的分析與下,通過運用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問題、新的分析與思維進而發(fā)展出制度化的決策支持系統(tǒng),并獲取更多的經(jīng)營效益。要實現(xiàn)思維進而發(fā)展出制度化的決策支持系統(tǒng),并獲取更多的經(jīng)營效益。要實現(xiàn)這個目的必須獲取大量的歷史數(shù)據(jù)和匯總數(shù)據(jù)。這個目的必須獲取大量的歷史數(shù)據(jù)和匯總數(shù)據(jù)。 完整的數(shù)據(jù)倉庫應包括完整的數(shù)據(jù)倉庫應包括3 3個方面的技術內容:個方面的技術內容:數(shù)據(jù)倉庫技術、聯(lián)機分析數(shù)據(jù)倉庫技術

35、、聯(lián)機分析處理處理(OLAP)(OLAP)技術和數(shù)據(jù)挖掘技術和數(shù)據(jù)挖掘(DM)(DM)技術,技術,它是一個十分龐大的系統(tǒng)。目前已有它是一個十分龐大的系統(tǒng)。目前已有許多商品化的數(shù)據(jù)倉庫軟件,如:許多商品化的數(shù)據(jù)倉庫軟件,如:IBMIBM等有實力的公司相繼推出了自三的數(shù)等有實力的公司相繼推出了自三的數(shù)據(jù)倉庫解決方案。據(jù)倉庫解決方案。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 數(shù)據(jù)倉庫的定義數(shù)據(jù)倉庫的定義:“數(shù)據(jù)倉庫是一個面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)倉庫是一個面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,支持管理中的決策制定過程數(shù)據(jù)集合,支持管理中的決策制定過程

36、。”數(shù)據(jù)倉庫具有數(shù)據(jù)倉庫具有如下特征如下特征, (1)(1)面向主題面向主題 主題主題是一個面向抽象的慨念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)是一個面向抽象的慨念,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類后進行分析利用的抽象。數(shù)據(jù)倉庫是為決策支持提供服務的,因綜合、歸類后進行分析利用的抽象。數(shù)據(jù)倉庫是為決策支持提供服務的,因此數(shù)據(jù)的組織應是圍繞著主題的,如:此數(shù)據(jù)的組織應是圍繞著主題的,如:顧客、供應商、產品和銷售組織顧客、供應商、產品和銷售組織。數(shù)。數(shù)據(jù)倉庫關注決策者的數(shù)據(jù)建模與分析,而不是集中于組織機構的日常操作相據(jù)倉庫關注決策者的數(shù)據(jù)建模與分析,而不是集中于組織機構的日常操作相事

37、務處理。因此,數(shù)據(jù)倉庫具有排除對決策無用的數(shù)據(jù)、提供特定主題的簡事務處理。因此,數(shù)據(jù)倉庫具有排除對決策無用的數(shù)據(jù)、提供特定主題的簡明特征。明特征。(2)(2)數(shù)據(jù)是集成的數(shù)據(jù)是集成的 數(shù)據(jù)倉庫的數(shù)據(jù)并不是原有數(shù)據(jù)的簡單拷貝,必須經(jīng)過綜合、計算,拋數(shù)據(jù)倉庫的數(shù)據(jù)并不是原有數(shù)據(jù)的簡單拷貝,必須經(jīng)過綜合、計算,拋棄分析處理不需要的數(shù)據(jù)項增加一些可能涉及的外部數(shù)據(jù)。使用數(shù)據(jù)清理棄分析處理不需要的數(shù)據(jù)項增加一些可能涉及的外部數(shù)據(jù)。使用數(shù)據(jù)清理和數(shù)據(jù)集成技術,確保命名約定、編碼結構等的一致性,以保證數(shù)據(jù)的質量。和數(shù)據(jù)集成技術,確保命名約定、編碼結構等的一致性,以保證數(shù)據(jù)的質量。 對源數(shù)據(jù)的集成是數(shù)據(jù)倉庫建

38、設中最關鍵也是最復雜的一步。對源數(shù)據(jù)的集成是數(shù)據(jù)倉庫建設中最關鍵也是最復雜的一步。(3)(3)穩(wěn)定性穩(wěn)定性 從數(shù)據(jù)的使用上看,數(shù)據(jù)倉庫的數(shù)據(jù)是穩(wěn)定的,不可更改的。即最從數(shù)據(jù)的使用上看,數(shù)據(jù)倉庫的數(shù)據(jù)是穩(wěn)定的,不可更改的。即最終用戶只能通過分析進行查詢和分析而不能修改。終用戶只能通過分析進行查詢和分析而不能修改。 從數(shù)據(jù)的內容上看,數(shù)據(jù)倉庫存儲的是企業(yè)當前和歷史的數(shù)據(jù),因從數(shù)據(jù)的內容上看,數(shù)據(jù)倉庫存儲的是企業(yè)當前和歷史的數(shù)據(jù),因此,也可以說數(shù)據(jù)倉庫在一定時間間隔內是穩(wěn)定的。此,也可以說數(shù)據(jù)倉庫在一定時間間隔內是穩(wěn)定的。(4)(4)數(shù)據(jù)的時變性數(shù)據(jù)的時變性 數(shù)據(jù)倉庫的數(shù)據(jù)穩(wěn)定、不可更改是針對應用而

39、言的,但并不是說,數(shù)據(jù)倉庫的數(shù)據(jù)穩(wěn)定、不可更改是針對應用而言的,但并不是說,數(shù)據(jù)從進入數(shù)據(jù)倉庫中就永遠不變,這些數(shù)據(jù)是隨時間變化而定期更新數(shù)據(jù)從進入數(shù)據(jù)倉庫中就永遠不變,這些數(shù)據(jù)是隨時間變化而定期更新的。每隔一段時間,數(shù)據(jù)倉庫就將運行數(shù)據(jù)庫系統(tǒng)中產生的數(shù)據(jù)進行轉的。每隔一段時間,數(shù)據(jù)倉庫就將運行數(shù)據(jù)庫系統(tǒng)中產生的數(shù)據(jù)進行轉換,集成到數(shù)據(jù)倉庫中。換,集成到數(shù)據(jù)倉庫中。(5)(5)支持決策分析支持決策分析 建立數(shù)據(jù)倉庫并不是取代原有的運行數(shù)據(jù)庫系統(tǒng),其目的是為了將建立數(shù)據(jù)倉庫并不是取代原有的運行數(shù)據(jù)庫系統(tǒng),其目的是為了將企業(yè)多年來已經(jīng)收集到的信息按一個統(tǒng)一且一致的企業(yè)級視圖組織并存企業(yè)多年來已經(jīng)收

40、集到的信息按一個統(tǒng)一且一致的企業(yè)級視圖組織并存儲。然后對這些數(shù)據(jù)進行分析,從中得出有關企業(yè)經(jīng)營狀況、客戶需求、儲。然后對這些數(shù)據(jù)進行分析,從中得出有關企業(yè)經(jīng)營狀況、客戶需求、對手情況以及以后發(fā)展趨勢等有用信息。幫助企業(yè)及時、正確把握機會、對手情況以及以后發(fā)展趨勢等有用信息。幫助企業(yè)及時、正確把握機會、以求公激烈的競爭中獲得更大的利益。以求公激烈的競爭中獲得更大的利益。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 2數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的區(qū)別 傳統(tǒng)的關系型數(shù)據(jù)庫遵循一致的關系模型,其中的數(shù)據(jù)以表格的方式傳統(tǒng)的關系型數(shù)據(jù)庫遵循一致的關系模型,其中的數(shù)據(jù)以表格的方式存儲,并且能用

41、統(tǒng)一的結構化查詢語言存儲,并且能用統(tǒng)一的結構化查詢語言sQLsQL進行數(shù)據(jù)查詢,數(shù)據(jù)庫系進行數(shù)據(jù)查詢,數(shù)據(jù)庫系統(tǒng)的主要任務是執(zhí)行聯(lián)機事務和查詢處理,通常,這類系統(tǒng)被稱為統(tǒng)的主要任務是執(zhí)行聯(lián)機事務和查詢處理,通常,這類系統(tǒng)被稱為聯(lián)機聯(lián)機事務處理事務處理(OLTP)(OLTP),其重點在于完成業(yè)務處理,及時給予用戶響應,它涵其重點在于完成業(yè)務處理,及時給予用戶響應,它涵蓋了企業(yè)的大部分日常操作,如購買、庫存、制造蓋了企業(yè)的大部分日常操作,如購買、庫存、制造h h銀行、工資、注冊、銀行、工資、注冊、記賬等這類系統(tǒng)用于創(chuàng)建操作數(shù)據(jù)。記賬等這類系統(tǒng)用于創(chuàng)建操作數(shù)據(jù)。 當數(shù)據(jù)庫系統(tǒng)應用到一定階段時,企業(yè)家

42、們便發(fā)現(xiàn)僅依賴擁有數(shù)據(jù)庫當數(shù)據(jù)庫系統(tǒng)應用到一定階段時,企業(yè)家們便發(fā)現(xiàn)僅依賴擁有數(shù)據(jù)庫系統(tǒng)已經(jīng)不足以獲得市場競爭的優(yōu)勢。他們需要對自身業(yè)務的運行以及系統(tǒng)已經(jīng)不足以獲得市場競爭的優(yōu)勢。他們需要對自身業(yè)務的運行以及整個市場相關行業(yè)的態(tài)勢進行分析,需要根據(jù)客戶、賣主和產品等主題整個市場相關行業(yè)的態(tài)勢進行分析,需要根據(jù)客戶、賣主和產品等主題進行組合,回答決策者的問題,如進行組合,回答決策者的問題,如“在過去的季度里,咨詢哪三樣產品在過去的季度里,咨詢哪三樣產品的熱線電話最多的熱線電話最多?”?”,根據(jù)分析結果,做出有利的決策。這些決策需要對,根據(jù)分析結果,做出有利的決策。這些決策需要對大量的業(yè)務數(shù)據(jù),包

43、括歷史業(yè)務數(shù)據(jù),進行分析,數(shù)據(jù)倉庫就是基于對大量的業(yè)務數(shù)據(jù),包括歷史業(yè)務數(shù)據(jù),進行分析,數(shù)據(jù)倉庫就是基于對業(yè)務數(shù)據(jù)進行決策分析而創(chuàng)建的數(shù)據(jù)管理系統(tǒng)。因此,這類系統(tǒng)一般地業(yè)務數(shù)據(jù)進行決策分析而創(chuàng)建的數(shù)據(jù)管理系統(tǒng)。因此,這類系統(tǒng)一般地是用于是用于聯(lián)機分析處理系統(tǒng)聯(lián)機分析處理系統(tǒng)(OLAP)(OLAP)。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) OLTPOLTP數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別概述如下:數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別概述如下: (1 1)用戶和系統(tǒng)的面向性:)用戶和系統(tǒng)的面向性:OLTPOLTP數(shù)據(jù)庫是面向顧客的,用于數(shù)據(jù)庫是面向顧客的,用于記錄相處理業(yè)務員、客戶的業(yè)務

44、過程和查詢處理,數(shù)據(jù)倉庫是面記錄相處理業(yè)務員、客戶的業(yè)務過程和查詢處理,數(shù)據(jù)倉庫是面向市場的,用于知識工人向市場的,用于知識工人( (包括經(jīng)理、主管和分忻人員包括經(jīng)理、主管和分忻人員) )的數(shù)據(jù)分的數(shù)據(jù)分析。析。 (2)(2)數(shù)據(jù)內容:數(shù)據(jù)內容:OLTPOLTP數(shù)據(jù)庫主要用于管理當前發(fā)生的數(shù)據(jù),通數(shù)據(jù)庫主要用于管理當前發(fā)生的數(shù)據(jù),通常,這種數(shù)據(jù)太瑣碎,難以用于決策;數(shù)據(jù)倉庫主要用于管理大常,這種數(shù)據(jù)太瑣碎,難以用于決策;數(shù)據(jù)倉庫主要用于管理大量歷史數(shù)據(jù),提供匯總和聚集機制,并在不同的綜合級別上存儲量歷史數(shù)據(jù),提供匯總和聚集機制,并在不同的綜合級別上存儲和管理信息。和管理信息。 (3)(3)數(shù)據(jù)

45、庫設計:通常,數(shù)據(jù)庫設計:通常,OLTPOLTP數(shù)據(jù)庫系統(tǒng)采用實體一聯(lián)系數(shù)據(jù)庫系統(tǒng)采用實體一聯(lián)系(ER)(ER)模型和面向應用的數(shù)據(jù)庫設計;而數(shù)據(jù)倉庫系統(tǒng)通常采用星型或模型和面向應用的數(shù)據(jù)庫設計;而數(shù)據(jù)倉庫系統(tǒng)通常采用星型或葵花模型和面向主題的數(shù)據(jù)庫設計??P秃兔嫦蛑黝}的數(shù)據(jù)庫設計。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) (4)(4)視圖:視圖:OLTPOLTP數(shù)據(jù)庫系統(tǒng)主要關注一個企業(yè)或部門內部的數(shù)據(jù)庫系統(tǒng)主要關注一個企業(yè)或部門內部的當前數(shù)據(jù),面不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù);相比之當前數(shù)據(jù),面不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù);相比之下,由于組織的變化,數(shù)據(jù)倉庫系

46、統(tǒng)常??缭綌?shù)據(jù)庫模式下,由于組織的變化,數(shù)據(jù)倉庫系統(tǒng)常常跨越數(shù)據(jù)庫模式的多個版本,并處理來自不同組織的信息,是由多個數(shù)據(jù)的多個版本,并處理來自不同組織的信息,是由多個數(shù)據(jù)存儲集成的信息。由于數(shù)據(jù)量巨大,數(shù)據(jù)倉庫的數(shù)據(jù)也常存儲集成的信息。由于數(shù)據(jù)量巨大,數(shù)據(jù)倉庫的數(shù)據(jù)也常存放在多個存儲介質上。存放在多個存儲介質上。 (5)(5)訪問模式:訪問模式:OLTPOLTP數(shù)據(jù)系統(tǒng)訪問主要是由各種可變的操作數(shù)據(jù)系統(tǒng)訪問主要是由各種可變的操作組成,這種系統(tǒng)需要并行控制和恢復機制;然而,對數(shù)據(jù)組成,這種系統(tǒng)需要并行控制和恢復機制;然而,對數(shù)據(jù)倉庫系統(tǒng)的訪問大部分是用于查詢分析對話操作。倉庫系統(tǒng)的訪問大部分是用

47、于查詢分析對話操作。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) l 總之,數(shù)據(jù)倉庫并非是一個僅僅存儲數(shù)據(jù)的簡單總之,數(shù)據(jù)倉庫并非是一個僅僅存儲數(shù)據(jù)的簡單信息庫,它實際上是一個信息庫,它實際上是一個“以大型數(shù)據(jù)管理信息以大型數(shù)據(jù)管理信息系統(tǒng)為基礎,附加在這個數(shù)據(jù)庫系統(tǒng)之上并存儲系統(tǒng)為基礎,附加在這個數(shù)據(jù)庫系統(tǒng)之上并存儲了企業(yè)所有業(yè)務數(shù)據(jù)庫中獲取的綜合數(shù)據(jù)并能利了企業(yè)所有業(yè)務數(shù)據(jù)庫中獲取的綜合數(shù)據(jù)并能利用這些綜合數(shù)據(jù)為用戶提供經(jīng)過處理后的有用信用這些綜合數(shù)據(jù)為用戶提供經(jīng)過處理后的有用信息的應用系統(tǒng)息的應用系統(tǒng)”。數(shù)據(jù)倉庫更多的是一種管理技。數(shù)據(jù)倉庫更多的是一種管理技術,它將企

48、業(yè)網(wǎng)絡中分布的商業(yè)數(shù)據(jù)集成到術,它將企業(yè)網(wǎng)絡中分布的商業(yè)數(shù)據(jù)集成到起、起、為決策者提供各種類型的數(shù)據(jù)分析,對企業(yè)領導為決策者提供各種類型的數(shù)據(jù)分析,對企業(yè)領導者起到?jīng)Q策支持智囊團的作用為決策支持系統(tǒng)者起到?jīng)Q策支持智囊團的作用為決策支持系統(tǒng)提供提供個新的途徑個新的途徑。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 二、數(shù)據(jù)倉庫的數(shù)據(jù)模型二、數(shù)據(jù)倉庫的數(shù)據(jù)模型l 實體一聯(lián)系數(shù)據(jù)模型廣泛用少關系數(shù)據(jù)庫設汁。在那里,數(shù)據(jù)庫模式由實體的集合和它們之間的聯(lián)系組成。這種數(shù)據(jù)模型適用于聯(lián)機事務處理(oLTP)。然而數(shù)據(jù)倉庫需要簡明的、面向主題的模式便于聯(lián)機數(shù)據(jù)分析。l 最流行的數(shù)據(jù)倉庫數(shù)據(jù)

49、模型是多維數(shù)據(jù)模型。此外,還有星型數(shù)據(jù)模型和雪花型數(shù)據(jù)模型。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 1多維數(shù)據(jù)模型 數(shù)據(jù)模型是數(shù)據(jù)倉庫研究的重點問題。在多維數(shù)據(jù)模型中,把數(shù)據(jù)集合的屬性分為度和維兩類,度類數(shù)據(jù)反映的是數(shù)據(jù)的數(shù)字測量值(如:銷售量、投資額及收入等),它們是依賴于一組“維”的、這些維類數(shù)據(jù)提供了測量值的關聯(lián)關系。例如銷售量與城市、產品名稱和銷售的時間有關,這組相關的維惟一地決定了銷售量這個測量值。因此,多維數(shù)據(jù)模型就是把測量的值放在這樣一些有層次的維構成的多維空間中。下圖中的小格內存儲的數(shù)據(jù)可以假設為商品的銷售量。該模型包括商品、城市、日期等多維。 2.3

50、 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 圖 多維數(shù)據(jù)模型 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 多維數(shù)據(jù)模型的另一個特點是對一維或多維所做的結多維數(shù)據(jù)模型的另一個特點是對一維或多維所做的結合運算,例如對總銷售量按城市進行汁算和排序,這些運合運算,例如對總銷售量按城市進行汁算和排序,這些運算包括對同樣維所限定的測量值比較算包括對同樣維所限定的測量值比較( (如銷售量與預算如銷售量與預算) )。一般來說時間維是一個有特殊意義的維,它對決策中的一般來說時間維是一個有特殊意義的維,它對決策中的趨勢分析很重要。趨勢分析很重要。 針對多維模型產生的針對多維模型產

51、生的0W0W分析方法,分析方法,一般有以下幾種一般有以下幾種。 (1)(1)旋轉。即將表格的橫、縱坐標交換旋轉。即將表格的橫、縱坐標交換(X(X,Y)(YY)(Y,x)x)。 (2)(2)上鉆和下鉆。即根據(jù)維的層次提升所關心的數(shù)據(jù)或降低上鉆和下鉆。即根據(jù)維的層次提升所關心的數(shù)據(jù)或降低觀察層次。觀察層次。 (3)(3)切片。主要根據(jù)維的限定做投影、選擇等數(shù)據(jù)庫操作而切片。主要根據(jù)維的限定做投影、選擇等數(shù)據(jù)庫操作而獲取數(shù)據(jù)。獲取數(shù)據(jù)。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 2星型模型 大多數(shù)的數(shù)據(jù)倉庫部采用如圖大多數(shù)的數(shù)據(jù)倉庫部采用如圖610610所示的所示的“星型星型”

52、模型來表示多維數(shù)據(jù)模型。數(shù)據(jù)庫中包括一個模型來表示多維數(shù)據(jù)模型。數(shù)據(jù)庫中包括一個“事實表事實表”,對于每一維部有一個對于每一維部有一個“維表維表”。事實表中的每條元組都包。事實表中的每條元組都包含有指向各個表的外鍵和一些相應的測量數(shù)據(jù),維表中記含有指向各個表的外鍵和一些相應的測量數(shù)據(jù),維表中記錄的是有關這一繼的屬性。錄的是有關這一繼的屬性。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 圖圖 星型模型星型模型 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) l 從圖中可以看出事實表中的每一元組只是包含了一些指針(即外鍵),而對應的主鍵分別放在不同的表中。如“訂

53、單號”放在“訂貨表”中,每個指針指向個維表,這就構成了數(shù)據(jù)庫的多維聯(lián)系。相應每條元組中多維外鍵限定數(shù)字測量值。在每個維表中除包含每一維的主鍵外,還要說明該維的一些其他屬性字段。維表記錄廠維的層次關系。l 在數(shù)據(jù)倉庫模型中執(zhí)行杏詢的分析過程,需要花大量時間在相關表中尋找數(shù)據(jù)。而星型模型使數(shù)據(jù)倉庫的復雜杏詢可以百接通過各維的層次比較、上鉆及下鉆等操作完成。在數(shù)據(jù)倉庫中除了維表和事實表的數(shù)據(jù)外,還應當包含一些已領處理的綜合數(shù)據(jù),這些綜合數(shù)據(jù)可以通過創(chuàng)建“概括表”(例如視圖)進行存儲。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫(自學自學) 3雪花模型l “雪花模型”是對星型模型的擴展。如果某個

54、頂點有多個歸類層次,就形成雪花型模型。它對星型模型的維表進一步層次化,所有的各維表可能鉑擴展為小的畢實表,形成一些局部的“層次”區(qū)域。它的優(yōu)點是:通過最大限度地減少數(shù)據(jù)存儲量以及聯(lián)合較小的維表來改善查詢性能。l 下圖所示的“產品”與“產品目錄”維表與事實表的關系區(qū)域,是在數(shù)據(jù)倉庫的數(shù)據(jù)組織上對用戶查詢需求的擴展。使用數(shù)據(jù)倉庫和查詢工具完成一些簡單的二維或三絕查詢,既滿足了用戶對復雜數(shù)據(jù)倉庫查詢的需求,又能在無須訪問過多數(shù)據(jù)的情況下,完成一些簡單查詢功能。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫(自學自學) 圖 雪花模型 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學)

55、l 雪花模型由于擴展了維表的層次,可以減少數(shù)據(jù)冗余。這鐘表易于維護、并節(jié)省存儲空間因為當維結構作為列包含在較高層次的維表中時,隨著維表內元組數(shù)據(jù)量的增加,大維表可能非常大。然而與巨大的事實表相比,這種空間的節(jié)省可以忽略;此外,由于執(zhí)行查詢需要更多的連接操作,雪花結構可能降低瀏覽的性能。這樣系統(tǒng)的性能可能相對受到影響。因此,數(shù)據(jù)倉庫設計時,雪花模型不如星型模型流行。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫(自學自學) 三、數(shù)據(jù)倉庫的開發(fā)模式三、數(shù)據(jù)倉庫的開發(fā)模式 隨著數(shù)據(jù)倉庫技術的發(fā)展,數(shù)據(jù)倉庫的開發(fā)模隨著數(shù)據(jù)倉庫技術的發(fā)展,數(shù)據(jù)倉庫的開發(fā)模式已從最初的式已從最初的“由上而下由上而下”

56、模式發(fā)展到下列模式發(fā)展到下列6 6種模式種模式。1 1由上而下模式由上而下模式 由上而下的開發(fā)模式是指將原來分散存儲在企由上而下的開發(fā)模式是指將原來分散存儲在企業(yè)各處的聯(lián)抓交易數(shù)據(jù)庫中的有用數(shù)據(jù),通過篩選、業(yè)各處的聯(lián)抓交易數(shù)據(jù)庫中的有用數(shù)據(jù),通過篩選、過濾、轉換、聚集等處理步驟建立一個過濾、轉換、聚集等處理步驟建立一個 這個整這個整體性數(shù)據(jù)倉庫將提供客戶一個一致性的數(shù)據(jù)格式和體性數(shù)據(jù)倉庫將提供客戶一個一致性的數(shù)據(jù)格式和一致性的軟件環(huán)境。理論上來說,決策支持所需的一致性的軟件環(huán)境。理論上來說,決策支持所需的數(shù)據(jù)都應該涵蓋在這個整體性數(shù)據(jù)庫中。數(shù)據(jù)集市數(shù)據(jù)都應該涵蓋在這個整體性數(shù)據(jù)庫中。數(shù)據(jù)集市中

57、存儲的數(shù)據(jù),是為了某個部門的決策支持應用而中存儲的數(shù)據(jù),是為了某個部門的決策支持應用而專門從整體性數(shù)據(jù)倉庫中篩選的,它是整體性數(shù)據(jù)專門從整體性數(shù)據(jù)倉庫中篩選的,它是整體性數(shù)據(jù)倉庫中的倉庫中的個子集。在由上而下模式中、數(shù)據(jù)集市個子集。在由上而下模式中、數(shù)據(jù)集市和數(shù)據(jù)倉庫的關系是單方面的,即數(shù)據(jù)從數(shù)據(jù)倉庫和數(shù)據(jù)倉庫的關系是單方面的,即數(shù)據(jù)從數(shù)據(jù)倉庫流向數(shù)據(jù)集市。流向數(shù)據(jù)集市。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫(自學自學) 圖 由上而下模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 2由下而上模式 由下而上模式(如圖 所示)是從構造各個部門或特定的企業(yè)問題的數(shù)據(jù)

58、集市開始,而整體性數(shù)據(jù)倉庫是建立在這些數(shù)據(jù)集市的基礎上。圖 由下而上開發(fā)模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) 由下而上開發(fā)模式的特點是:初期投資少,見效快。因為它在構造部門數(shù)據(jù)集市時,只需要較少的人做出決策,而所解決的問題是較小的商業(yè)問題。由下而上的開發(fā)模式可以使一個部門在數(shù)據(jù)倉庫發(fā)展初期盡可能少花費資金,在做出有效的投入之前評估技術的成本收益狀況。3 3平行開發(fā)模式平行開發(fā)模式 平行開發(fā)模式(如圖所示)是指在個整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型的指導下,數(shù)據(jù)集市的建立和整體性數(shù)據(jù)倉庫的建立同步進行。 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫(自學自學) 圖 平行

59、開發(fā)模式 2.3 信息系統(tǒng)中的數(shù)據(jù)倉庫信息系統(tǒng)中的數(shù)據(jù)倉庫 (自學自學) l 在平行開發(fā)模式中,由于數(shù)據(jù)集市的建立是在一個統(tǒng)一的整體性數(shù)據(jù)在平行開發(fā)模式中,由于數(shù)據(jù)集市的建立是在一個統(tǒng)一的整體性數(shù)據(jù)模型的指導下進行的,可避免各部門在開發(fā)各自的數(shù)據(jù)集市時的盲目性,模型的指導下進行的,可避免各部門在開發(fā)各自的數(shù)據(jù)集市時的盲目性,減少各個數(shù)據(jù)集市之間的數(shù)據(jù)冗余和不一致性。事實上,一些部門在建立減少各個數(shù)據(jù)集市之間的數(shù)據(jù)冗余和不一致性。事實上,一些部門在建立數(shù)據(jù)集市的過程中所遇到的問題及其解決方案、所獲得的經(jīng)驗,將決定數(shù)據(jù)集市的過程中所遇到的問題及其解決方案、所獲得的經(jīng)驗,將決定整體性數(shù)據(jù)倉庫的數(shù)據(jù)模

60、型做出相應的改變,這些變化將使其他部門在建整體性數(shù)據(jù)倉庫的數(shù)據(jù)模型做出相應的改變,這些變化將使其他部門在建立數(shù)據(jù)集市時受益,也有助于整體性數(shù)據(jù)倉庫的構造。在乎行開發(fā)模式中,立數(shù)據(jù)集市時受益,也有助于整體性數(shù)據(jù)倉庫的構造。在乎行開發(fā)模式中,數(shù)據(jù)集市的這種相對獨立性有利于整體性數(shù)據(jù)倉庫的構造。一旦整體性數(shù)數(shù)據(jù)集市的這種相對獨立性有利于整體性數(shù)據(jù)倉庫的構造。一旦整體性數(shù)據(jù)倉庫建立好之后,各個部門的數(shù)據(jù)集市將成為整體性數(shù)據(jù)倉庫的一個子據(jù)倉庫建立好之后,各個部門的數(shù)據(jù)集市將成為整體性數(shù)據(jù)倉庫的一個子集,整體性數(shù)據(jù)倉庫將負責為各個部門已建好的和即將要建立的數(shù)據(jù)集市集,整體性數(shù)據(jù)倉庫將負責為各個部門已建好的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論