企業(yè)信息化-數(shù)據(jù)管理_第1頁
企業(yè)信息化-數(shù)據(jù)管理_第2頁
企業(yè)信息化-數(shù)據(jù)管理_第3頁
企業(yè)信息化-數(shù)據(jù)管理_第4頁
企業(yè)信息化-數(shù)據(jù)管理_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)管理數(shù)據(jù)管理包包括數(shù)據(jù)的的存儲、檢檢索和操縱縱。為了能能夠在系統(tǒng)統(tǒng)開發(fā)和開開展業(yè)務(wù)工工作期間有有效地與信信息服務(wù)人人員進行聯(lián)聯(lián)系,用戶戶管理人員員應(yīng)具備本本章中所提提到的有關(guān)關(guān)概念、方方法和術(shù)語語方面的業(yè)業(yè)務(wù)知識。一、數(shù)據(jù)據(jù)和信息計算機系統(tǒng)統(tǒng)并不存儲儲信息,只只存儲數(shù)據(jù)據(jù)。數(shù)據(jù)是是獲得信息息的原始材材料,為了了滿足定期期存取的需需要,它們們被存儲在在二級(輔助)存儲設(shè)備備(磁盤和磁磁帶)上。信息息是經(jīng)過同同化、聚合合和“加工”后的有特特定含義的的數(shù)據(jù)。為為了突擊數(shù)數(shù)據(jù)和信息息之間的差差別,我們們考察下面面的例子。一個部門門領(lǐng)導(dǎo)要求求每個職工工分別在一一張紙上寫寫下他們的的年齡。每每張紙只有

2、有一行含義義簡單的數(shù)數(shù)據(jù)。然而而經(jīng)理可以以從這些數(shù)數(shù)據(jù)中獲得得信息。他他能夠以此此確定超過過50歲的職職工有多少少、職工平平均年齡是是多少,最最年輕的職職工年齡是是多少等等等。人們經(jīng)經(jīng)常使用“信息處理理”這個詞匯匯容易造成成誤解,實實際上,它它的真正含含義是為了了產(chǎn)生信息息而處理數(shù)數(shù)據(jù)。二、數(shù)據(jù)組組織的層次次體系 任任何信息系系統(tǒng)都有一一個數(shù)據(jù)組組織的層次次體系。在在該層次體體系中,每每一后繼層層都是其前前驅(qū)層數(shù)據(jù)據(jù)元組合的的結(jié)果,最最終實現(xiàn)一一個綜合的的數(shù)據(jù)庫。處于第一一層的“位”用戶是不不必了解的的,而其它它五層則是是用戶輸入入和請求數(shù)數(shù)據(jù)時合理理的需要。數(shù)據(jù)是一一切信息系系統(tǒng)的基礎(chǔ)礎(chǔ)。一

3、個高高質(zhì)量的計計算機信息息系統(tǒng)的最最終用戶必必須具備數(shù)數(shù)據(jù)的組織織及其處理理方面的知知識。 ? 位 位位是主存儲儲器和輔助助存儲器的的基本單位位。計算機機是電子的的,因而只只能實現(xiàn)兩兩種狀態(tài)。從物理上上講,可以以通過不同同途徑來實實現(xiàn)這兩種種狀態(tài)(電流的方方向,開關(guān)關(guān),涂在帶帶上和盤上上的鐵淦氧氧的磁性排排列)。由于每每一位只能能表示兩種種狀態(tài),因因此,必須須將位組合合才能形成成字母數(shù)字字字符。由由位組合成成的字母數(shù)數(shù)字字符被被暫時存放放在主存儲儲器中,或或永久地存存放在輔助助存儲器中中。在主存存和輔存中中存放的是是字母數(shù)字字字符的內(nèi)內(nèi)部表示形形式(例如,如如果采用EEBC-DDIC編碼碼體制

4、,則則1100000100表示字母母A,而1111100001表示數(shù)數(shù)字1)。 在在輸入時,對對字母數(shù)字字字符進行行編碼以形形成若干位位的組合,而而在輸出時時進行譯碼碼。目前還還沒有工業(yè)業(yè)標準的編編碼體制。最為流行行的編碼體體制是六位位二進制編編碼的十進進制碼(BBCD),七七位ASCCII碼以以及八位擴擴充二進制制編碼的十十進制交換換碼(EBBCDICC-發(fā)音為為eb-sse-diik)。 六六位編碼最最多可以表表示64個字符符(2?66)。七位位編碼可以以表示1228個字符符,而八位位編碼可以以表示2556個字符符。讀者可可能會問:既然用六六位就可以以對一個字字符編碼。為什么還還要用八位位

5、來編碼?這是因為為六位碼的的64種可能能的組合只只夠表示字字母、數(shù)字字和18個特殊殊符號。如如果希望有有表示大寫寫和小寫字字母,那么么六位編碼碼就不夠用用了。因此此,就需要要具有1228種組合合的七位編編碼。 目目前還難以以想象出對對128種以以上的位的的組合需要要。引進八八位編碼體體制(EBBCDICC)是為了了利用這一一個事實,即即只用4位(24-具有16種可能能的組合)來表示一一個數(shù)值數(shù)數(shù)據(jù)。因此此,一個88位的編碼碼實際上可可以用來表表示兩個十十進制數(shù)字字。由于所所存儲的數(shù)數(shù)據(jù)多數(shù)是是數(shù)值數(shù)據(jù)據(jù),所以將將兩個數(shù)字字的編碼壓壓縮成八位位可以節(jié)省省存儲空間間。EBCCDIC的的8位組合稱稱

6、之為一個個字節(jié)。而而BCD的六六位就構(gòu)成成一個字節(jié)節(jié)。在BCCD和ASCIII編碼體體制中,字字節(jié)是字符符的同義詞詞。在EBBCDICC編碼體制制中,由于于可以將兩兩個數(shù)字壓壓縮到一個個字節(jié)中,所所以EBCCDIC的的字節(jié)與字字符間并不不一一對應(yīng)應(yīng)。然而,在在涉及到存存儲容量時時,則經(jīng)常常交替地使使用字符和和字節(jié)。一一個磁盤組組可以有8800兆字字節(jié)容量(即800兆字字節(jié)的永久久存儲器),而一臺臺計算機的的主存可以以有8兆字節(jié)(作為處理理用的兆字字節(jié)的高速速臨時存儲儲器)。較小的的存儲設(shè)備備用千字節(jié)節(jié)(一千個字字節(jié)的倍數(shù)數(shù)來度量)。通常將將兆和千分分別縮寫“M”和“K”。 在在邏輯上講講,一個

7、EEBCDIIC字節(jié)是是8位,而實實際上它有有9位。由于于要將這些些位在計算算機和外部部設(shè)備(或遠程終終端)之間傳送送,所以在在計算機硬硬件中使用用了一種內(nèi)內(nèi)部校驗方方法來保證證傳送數(shù)據(jù)據(jù)的準確性性。這種構(gòu)構(gòu)驗方法之之一是給傳傳送的數(shù)據(jù)據(jù)附加一位位奇偶校驗驗位,用該該位來發(fā)現(xiàn)現(xiàn)在傳送過過程中是否否丟失了一一位。計算算機可以采采用偶數(shù)奇奇偶校驗或或奇數(shù)奇偶偶校驗法,即即每一字符符要包含偶偶數(shù)個或奇奇數(shù)個“開狀態(tài)”位。假定定某臺計算算機采用偶偶數(shù)奇偶校校驗法,如如果要將一一個EBCCDIC的的字母A(它具有奇奇數(shù)個“開”位-1100000001)寫到到磁帶上,那那么在傳送送之前為了了維持偶校校驗,

8、則需需要增加一一位奇偶位位(即:11110000001偶偶數(shù)個“開”位),在將字字符寫到磁磁帶之前,硬硬件自動計計算“開”位的個數(shù)數(shù)。如果計計算機結(jié)果果是奇數(shù),則則說明已經(jīng)經(jīng)出現(xiàn)了奇奇偶校驗錯錯誤,計算算機自動向向操作員發(fā)發(fā)出警告。 ? 字符符(字節(jié)) 在在通過鍵盤盤(光符號識識別器或其其他輸入設(shè)設(shè)備)輸入一個個字符時,機機器直接將將字符翻譯譯成某特定定的編碼系系統(tǒng)中一串串位的組合合。一個計計算機系統(tǒng)統(tǒng)可以使用用不止一種種編碼體制制。例如,某某些計算機機系統(tǒng)中將將ASCIII編碼體體制用于數(shù)數(shù)據(jù)通信,而而將EBCCDIC編編碼體制用用于數(shù)據(jù)存存儲。 ? 數(shù)據(jù)據(jù)元 描描述數(shù)據(jù)元元的最好辦辦法是舉

9、例例說明。一一個人的社社會保險號號、姓名、信用卡號號、街道地地址和婚姻姻狀況等都都是數(shù)據(jù)元元。在數(shù)據(jù)據(jù)的層次體體系中,數(shù)數(shù)據(jù)元是最最低一層的的邏輯單位位,為了形形成一個邏邏輯單位,需需要將若干干位和若干干字節(jié)組合合在一起。一個日期期不一定是是一個數(shù)據(jù)據(jù)元,它可可以是三個個數(shù)據(jù)元:年、月、日。對地地址來說,也也是同樣的的。一個地地址中可以以包括州、城市、街街道地址和和郵政碼這這四個數(shù)據(jù)據(jù)元。從邏邏輯上可以以把日期和和地址都看看成是一個個數(shù)據(jù)元,但但是輸出這這種數(shù)據(jù)元元是不方便便的。例如如,通常在在輸出時總總是把街道道地址單寫寫一行,因因而應(yīng)該把把一個地址址的幾個數(shù)數(shù)據(jù)元分開開。此外,由由于姓名和

10、和地址文件件經(jīng)常按郵郵政碼排序序,因此,需需要將郵政政碼作為一一個邏輯實實體(數(shù)據(jù)元)來對待。 根根據(jù)上下文文的需要,有有時也把數(shù)數(shù)據(jù)元稱作作為字段(記錄中的的字段)。數(shù)據(jù)元元是泛指的的,而數(shù)據(jù)據(jù)項才是實實際的實體體(或?qū)嶋H的的“值”)。例如如,社會保保險號是一一個數(shù)據(jù)元元,而44454877279和和4421141588則是兩個個數(shù)據(jù)項。 為為了節(jié)省輸輸入數(shù)據(jù)時時敲打鍵盤盤的時間和和存儲空間間,在輸入入數(shù)據(jù)時通通常將數(shù)據(jù)據(jù)元編碼。例如,通通常將職工工主文件中中的“性別”數(shù)據(jù)元編編碼,這樣樣,數(shù)據(jù)錄錄入員就可可以簡單的的輸入“MM”或“F”來代代替“Maale”(男)或“Femmale”(女)

11、。在輸出出時再將“M”和“F”分別別翻譯成“男”或“女”。 在在設(shè)計數(shù)據(jù)據(jù)元時,可可以使一個個數(shù)據(jù)項(如帳號)的編碼具具有特定的的含義,從從而可以向向用戶提供供信息。例例如,可以以將一個大大學的六位位帳號編碼碼如下:表20.66.1 舉舉一個例子子,RBII001將將表示生物物系的1另研究項項目的帳號號。 ? 記錄錄 將將邏輯上相相關(guān)的數(shù)據(jù)據(jù)元組合在在一起就形形成一個記記錄。表220.6.2列舉了了一個職工工記錄中可可能包含的的若干數(shù)據(jù)據(jù)元,以及及作為職工工記錄的一一個值的若若干數(shù)據(jù)項項。記錄是是能夠從數(shù)數(shù)據(jù)庫中存取的最低低一層的邏邏輯單位。例如,如如果一個人人事經(jīng)理需需要知道阿阿溫肥訪芩芩溝

12、幕橐鱟鱟純觶敲矗桶閹惱黽鍬即癰癰嬤腥隼隼床偷街鞔鞔娼寫懟 ? 文件件 文文件是邏輯輯上相關(guān)的的記錄的集集合。職工工主文件包包含每一個個職工的記記錄。庫存存文件包含含每一種庫庫存貨物的的記錄。應(yīng)應(yīng)收帳目文文件包含每每個顧客的的記錄。“文件”這個詞有有時也指某某臺二級存存儲設(shè)備上上的一塊已已命名的區(qū)區(qū)域,該區(qū)區(qū)域中可以以包含程序序代碼、教教材、數(shù)據(jù)據(jù),甚至還還可以包含含輸出報表表。 ? 數(shù)據(jù)據(jù)庫數(shù)據(jù)庫是一一種作為計計算機系統(tǒng)統(tǒng)資源共享享的全部數(shù)數(shù)據(jù)之集合合。有時根根據(jù)不同應(yīng)應(yīng)用領(lǐng)域可可將該資源源共享數(shù)據(jù)據(jù)分成若干干段。例如如,財會數(shù)數(shù)據(jù)庫可以以劃分為一一個應(yīng)用領(lǐng)領(lǐng)域,它可可以包含六六個不同的的文件

13、。讀讀者應(yīng)該注注意到:用用“文件”來組織數(shù)數(shù)據(jù)這種方方法將帶來來數(shù)據(jù)的冗冗余。也就就是說,為為了在處理理時使用,必必須將某些些數(shù)據(jù)元重重復(fù)地存放放在幾個文文件中。例例如,在一一所大學的的安置辦公公室、宿舍舍管理處、財務(wù)支持持辦公室以以及注冊處處等都有可可能保存學學生文件。像學生名名、校內(nèi)地地址這類數(shù)數(shù)據(jù)元幾乎乎在每個文文件中都重重復(fù)出現(xiàn)。在對開發(fā)發(fā)一個綜合合的學生信信息系統(tǒng)進進行可行性性分析時,一一些系統(tǒng)分分析員在美美國西南部部一所規(guī)模模很大的大大學中發(fā)現(xiàn)現(xiàn)有75個計算算機文件中中都包含學學生名和校校內(nèi)地址。采用先進進的數(shù)據(jù)庫庫管理系統(tǒng)統(tǒng)比之傳統(tǒng)統(tǒng)的文件系系統(tǒng)有較大大的改進,它它使得用戶戶可以

14、將存存儲數(shù)據(jù)的的重復(fù)程度度減至最小小。三、數(shù)據(jù)庫庫的概念與與用途 ? 數(shù)據(jù)據(jù)庫的概念念 什什么是數(shù)據(jù)據(jù)庫呢?當人們從從不同的角角度來描述述這一概念念時就有不不同的定義義(當然是描描述性的)。例如,稱稱數(shù)據(jù)庫是是一個“記錄保存存系統(tǒng)”(該定義強強調(diào)了數(shù)據(jù)據(jù)庫是若干干記錄的集集合)。又如稱稱數(shù)據(jù)庫是是“人們?yōu)榻饨鉀Q特定的的任務(wù),以以一定的組組織方式存存儲在一起起的相關(guān)的的數(shù)據(jù)的集集合”(該定義義側(cè)重于數(shù)數(shù)據(jù)的組織織)。更有甚甚者稱數(shù)據(jù)據(jù)庫是“一個數(shù)據(jù)據(jù)倉庫”。當然,這這種說法雖雖然形象,但但并不嚴謹謹。嚴格地地說,數(shù)據(jù)據(jù)庫是“按照數(shù)據(jù)據(jù)結(jié)構(gòu)來組組織、存儲儲和管理數(shù)數(shù)據(jù)的倉庫庫”。在經(jīng)濟濟管理的日日

15、常工作中中,常常需需要把某些些相關(guān)的數(shù)數(shù)據(jù)放進這這樣“倉庫”,并根據(jù)據(jù)管理的需需要進行相相應(yīng)的處理理。例如,企企業(yè)或事業(yè)業(yè)單位的人人事部門常常常要把本本單位職工工的基本情情況(職工號、姓名、年年齡、性別別、籍貫、工資、簡簡歷等)存放在表表20.66.3中,這這張表就可可以看成是是一個數(shù)據(jù)據(jù)庫。有了了這個“數(shù)據(jù)倉庫庫”我們就可可以根據(jù)需需要隨時查查詢某職工工的基本情情況,也可可以查詢工工資在某個個范圍內(nèi)的的職工人數(shù)數(shù)等等。這這些工作如如果都能在在計算機上上自動進行行,那我們們的人事管管理就可以以達到極高高的水平。此外,在在財務(wù)管理理、倉庫管管理、生產(chǎn)產(chǎn)管理中也也需要建立立眾多的這這種“數(shù)據(jù)庫”,

16、使其可可以利用計計算機實現(xiàn)現(xiàn)財務(wù)、倉倉庫、生產(chǎn)產(chǎn)的自動化化管理。 JJ.Marrtin給給數(shù)據(jù)庫下下了一個比比較完整的的定義:數(shù)數(shù)據(jù)庫是存存儲在一起起的相關(guān)數(shù)數(shù)據(jù)的集合合,這些數(shù)數(shù)據(jù)是結(jié)構(gòu)構(gòu)化的,無無有害的或或不必要的的冗余,并并為多種應(yīng)應(yīng)用服務(wù);數(shù)據(jù)的存存儲獨立于于使用它的的程序;對對數(shù)據(jù)庫插插入新數(shù)據(jù)據(jù),修改和和檢索原有有數(shù)據(jù)均能能按一種公公用的和可可控制的方方式進行。當某個系系統(tǒng)中存在在結(jié)構(gòu)上完完全分開的的若干個數(shù)數(shù)據(jù)庫時,則則該系統(tǒng)包包含一個“數(shù)據(jù)庫集集合”。 ? 數(shù)據(jù)據(jù)庫的優(yōu)點點 使使用數(shù)據(jù)庫庫可以帶來來許多好處處:如減少少了數(shù)據(jù)的的冗余度,從從而大大地地節(jié)省了數(shù)數(shù)據(jù)的存儲儲空間;實

17、實現(xiàn)數(shù)據(jù)資資源的充分分共享等等等。此外,數(shù)數(shù)據(jù)庫技術(shù)術(shù)還為用戶戶提供了非非常簡便的的使用手段段使用戶易易于編寫有有關(guān)數(shù)據(jù)庫庫應(yīng)用程序序。特別是是近年來推推出的微型型計算機關(guān)關(guān)系數(shù)據(jù)庫庫管理系統(tǒng)統(tǒng)dBASSELL,操操作直觀,使使用靈活,編編程方便,環(huán)環(huán)境適應(yīng)廣廣泛(一般的十十六位機,如如IBM/PC/XXT,國產(chǎn)產(chǎn)長城05520等均均可運行種種軟件),數(shù)據(jù)處處理能力極極強。數(shù)據(jù)據(jù)庫在我國國正得到愈愈來愈廣泛泛的應(yīng)用,必必將成為經(jīng)經(jīng)濟管理的的有力工具具。 數(shù)數(shù)據(jù)庫是通通過數(shù)據(jù)庫庫管理系統(tǒng)統(tǒng)(DBMMS-DAATA BBASE MANAAGEMEENT SSYSTEEM)軟件件來實現(xiàn)數(shù)數(shù)據(jù)的存儲儲

18、、管理與與使用的ddBASEELL就是是一種數(shù)據(jù)據(jù)庫管理系系統(tǒng)軟件。 ? 數(shù)據(jù)據(jù)庫結(jié)構(gòu)與與數(shù)據(jù)庫種種類 數(shù)數(shù)據(jù)庫通常常分為層次次式數(shù)據(jù)庫庫、網(wǎng)絡(luò)式式數(shù)據(jù)庫和和關(guān)系式數(shù)數(shù)據(jù)庫三種種。而不同同的數(shù)據(jù)庫庫是按不同同的數(shù)據(jù)結(jié)結(jié)構(gòu)來聯(lián)系系和組織的的。 11.數(shù)據(jù)結(jié)結(jié)構(gòu)模型 (1)數(shù)據(jù)據(jù)結(jié)構(gòu) 所所謂數(shù)據(jù)結(jié)結(jié)構(gòu)是指數(shù)數(shù)據(jù)的組織織形式或數(shù)數(shù)據(jù)之間的的聯(lián)系。如如果用D表示數(shù)據(jù)據(jù),用R表示數(shù)據(jù)據(jù)對象之間間存在的關(guān)關(guān)系集合,則則將DS(D,R)稱為數(shù)數(shù)據(jù)結(jié)構(gòu)。例如,設(shè)設(shè)有一個電電話號碼簿簿,它記錄錄了n個人的名名字和相應(yīng)應(yīng)的電話號號碼。為了了方便地查查找某人的的電話號碼碼,將人名名和號碼按按字典順序序排列,并并在名

19、字的的后面跟隨隨著對應(yīng)的的電話號碼碼。這樣,若若要查找某某人的電話話號碼(假定他的的名字的第第一個字母母是Y),那么么只須查找找以Y開頭的那那些名字就就可以了。該例中,數(shù)數(shù)據(jù)的集合合D就是人名名和電話號號碼,它們們之間的聯(lián)聯(lián)系R就是按字字典順序的的排列,其其相應(yīng)的數(shù)數(shù)據(jù)結(jié)構(gòu)就就是DS(D,R),即一一個數(shù)組。 (2)數(shù)據(jù)據(jù)結(jié)構(gòu)種類類 數(shù)數(shù)據(jù)結(jié)構(gòu)又又分為數(shù)據(jù)據(jù)的邏輯結(jié)結(jié)構(gòu)和數(shù)據(jù)據(jù)的物理結(jié)結(jié)構(gòu)。數(shù)據(jù)據(jù)的邏輯結(jié)結(jié)構(gòu)是從邏邏輯的角度度(即數(shù)據(jù)間間的聯(lián)系和和組織方式式)來觀察數(shù)數(shù)據(jù),分析析數(shù)據(jù),與與數(shù)據(jù)的存存儲位置無無關(guān)。數(shù)據(jù)據(jù)的物理結(jié)結(jié)構(gòu)是指數(shù)數(shù)據(jù)在計算算機中存放放的結(jié)構(gòu),即即數(shù)據(jù)的邏邏輯結(jié)構(gòu)在在計算

20、機中中的實現(xiàn)形形式,所以以物理結(jié)構(gòu)構(gòu)也被稱為為存儲結(jié)構(gòu)構(gòu)。本節(jié)只只研究數(shù)據(jù)據(jù)的邏輯結(jié)結(jié)構(gòu),并將將反映和實實現(xiàn)數(shù)據(jù)聯(lián)聯(lián)系的方法法稱為數(shù)據(jù)據(jù)模型。 目目前,比較較流行的數(shù)數(shù)據(jù)模型有有三種,即即按圖論理理論建立的的層次結(jié)構(gòu)構(gòu)模型和網(wǎng)網(wǎng)狀結(jié)構(gòu)模模型以及按按關(guān)系理論論建立的關(guān)關(guān)系結(jié)構(gòu)模模型。 22.層次、網(wǎng)狀和關(guān)關(guān)系數(shù)據(jù)庫庫系統(tǒng) (1)層次次結(jié)構(gòu)模型型 層層次結(jié)構(gòu)模模型實質(zhì)上上是一種有有根結(jié)點的的定向有序序樹(在數(shù)學中中“樹”被定義為為一個無回回的連通圖圖)。例如圖圖20.66.4是一一個高等學學校的組織織結(jié)構(gòu)圖。這個組織織結(jié)構(gòu)圖像像一棵樹,校校部就是樹樹根(稱為根結(jié)結(jié)點),各系、專業(yè)、教教師、學生生等

21、為枝點點(稱為結(jié)點點),樹根與與枝點之間間的聯(lián)系稱稱為邊,樹樹根與邊之之比為1:N,即樹樹根只有一一個,樹枝枝有N個。這種種數(shù)據(jù)結(jié)構(gòu)構(gòu)模型的一一般結(jié)構(gòu)見見圖20.6.5所所示。圖20.66.4 高等學校校的組織結(jié)結(jié)構(gòu)圖 圖20.66.5 層次結(jié)構(gòu)構(gòu)模型 圖圖20.66.5中,Ri(i1,2,6)代表表記錄(即數(shù)據(jù)的的集合),其中R11就是根結(jié)結(jié)點(如果Ri看成是是一個家族族,則R11就是祖先先,它是RR2、R3、R4的雙親親,而R22、R3、R4互為兄兄弟),R5、R6也是兄兄弟,且其其雙親為RR3。R2、R4、R5、R6又被稱稱為葉結(jié)點點(即無子女女的結(jié)點)。這樣,RRi(i1,2,6)就組

22、組成了以RR1為樹根根的一棵樹樹,這就是是一個層次次數(shù)據(jù)結(jié)構(gòu)構(gòu)模型。 按按照層次模模型建立的的數(shù)據(jù)庫系系統(tǒng)稱為層層次模型數(shù)數(shù)據(jù)庫系統(tǒng)統(tǒng)。IMSS(Infformaationn Mannage-menttSysttem)是是其典型代代表。 (2)網(wǎng)狀狀結(jié)構(gòu)模型型? 在在圖20.6.6中中,給出了了某醫(yī)院醫(yī)醫(yī)生、病房房和病人之之間的聯(lián)系系。即每個個醫(yī)生負責責治療三個個病人,每每個病房可可住一到四四個病人。如果將醫(yī)醫(yī)生看成是是一個數(shù)據(jù)據(jù)集合,病病人和病房房分別是另另外兩個數(shù)數(shù)據(jù)集合,那那么醫(yī)生、病人和病病房的比例例關(guān)系就是是M:N:P(即M個醫(yī)生,NN個病人,PP間病房)。這種數(shù)數(shù)據(jù)結(jié)構(gòu)就就是網(wǎng)狀數(shù)

23、數(shù)據(jù)結(jié)構(gòu),它它的一般結(jié)結(jié)構(gòu)模型如如圖20.6.7所所示。在圖圖中,記錄錄Ri(ii1,2,8)滿足以以下條件: 可以有一一個以上的的結(jié)點無雙雙親(如R1、R2、R3)。 至少有一一個結(jié)點有有多于一個個以上的雙雙親。在“醫(yī)生、病病人、病房房”例中,“醫(yī)生集合合有若干個個結(jié)點(MM個醫(yī)生結(jié)結(jié)點)無“雙親”,而“病房”集合有P個結(jié)點(即病房),并有一一個以上的的“雙親”(即病人人)。圖20.66.6 醫(yī)生、病病房和病人人之間的關(guān)關(guān)系圖20.66.7 網(wǎng)狀結(jié)構(gòu)構(gòu)模型 按按照網(wǎng)狀數(shù)數(shù)據(jù)結(jié)構(gòu)建建立的數(shù)據(jù)據(jù)庫系統(tǒng)稱稱為網(wǎng)狀數(shù)數(shù)據(jù)庫系統(tǒng)統(tǒng),其典型型代表是DDBTG(Dataa Basse Taask GGro

24、upp)。用數(shù)數(shù)學方法可可將網(wǎng)狀數(shù)數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)轉(zhuǎn)化為層次次數(shù)據(jù)結(jié)構(gòu)構(gòu)。 (3)關(guān)系系結(jié)構(gòu)模型型 關(guān)關(guān)系式數(shù)據(jù)據(jù)結(jié)構(gòu)把一一些復(fù)雜的的數(shù)據(jù)結(jié)構(gòu)構(gòu)歸結(jié)為簡簡單的二元元關(guān)系(即二維表表格形式)。例如某某單位的職職工關(guān)系就就是一個二二元關(guān)系(見表20.6.8)。這個四四行六列的的表格的每每一列稱為為一個字段段(即屬性),字段名名相當于標標題欄中的的標題(屬性名稱稱);表的每每一行是包包含了六個個屬性(工號、姓姓名、年齡齡、性別、職務(wù)、工工資)的一個六六元組,即即一個人的的記錄。這這個表格清清晰地反映映出該單位位職工的基基本情況。表20.66.8 職工基本本情況 通通常一個mm行、n列的二維維表格的結(jié)結(jié)構(gòu)如

25、表220.6.9所示。 表表中每一行行表示一個個記錄值,每每一列表示示一個屬性性(即字段或或數(shù)據(jù)項)。該表一一共有m個記錄。每個記錄錄包含n個屬性。 作作為一個關(guān)關(guān)系的二維維表,必須須滿足以下下條件: (1)表中中每一列必必須是基本本數(shù)據(jù)項(即不可再再分解)。 (2)表中中每一列必必須具有相相同的數(shù)據(jù)據(jù)類型(例如字符符型或數(shù)值值型)。 (3)表中中每一列的的名字必須須是唯一的的。 (4)表中中不應(yīng)有內(nèi)內(nèi)容完全相相同的行。 (5)行的的順序與列列的順序不不影響表格格中所表示示的信息的的含義。 由由關(guān)系數(shù)據(jù)據(jù)結(jié)構(gòu)組成成的數(shù)據(jù)庫庫系統(tǒng)被稱稱為關(guān)系數(shù)數(shù)據(jù)庫系統(tǒng)統(tǒng)。 在在關(guān)系數(shù)據(jù)據(jù)庫中,對對數(shù)據(jù)的操操作

26、幾乎全全部建立在在一個或多多個關(guān)系表表格上,通通過對這些些關(guān)系表格格的分類、合并、連連接或選取取等運算來來實現(xiàn)數(shù)據(jù)據(jù)的管理。dBASSEII就就是這類數(shù)數(shù)據(jù)庫管理理系統(tǒng)的典典型代表。對于一個個實際的應(yīng)應(yīng)用問題(如人事管管理問題),有時需需要多個關(guān)關(guān)系才能實實現(xiàn)。用ddBASEEII建立立起來的一一個關(guān)系稱稱為一個數(shù)數(shù)據(jù)庫(或稱數(shù)據(jù)據(jù)庫文件),而把對對應(yīng)多個關(guān)關(guān)系建立起起來的多個個數(shù)據(jù)庫稱稱為數(shù)據(jù)庫庫系統(tǒng)。ddBASEEII的另另一個重要要功能是通通過建立命命令文件來來實現(xiàn)對數(shù)數(shù)據(jù)庫的使使用和管理理,對于一一個數(shù)據(jù)庫庫系統(tǒng)相應(yīng)應(yīng)的命令序序列文件,稱稱為該數(shù)據(jù)據(jù)庫的應(yīng)用用系統(tǒng)。因因此,可以以概括地

27、說說,一個關(guān)關(guān)系稱為一一個數(shù)據(jù)庫庫,若干個個數(shù)據(jù)庫可可以構(gòu)成一一個數(shù)據(jù)庫庫系統(tǒng)。數(shù)數(shù)據(jù)庫系統(tǒng)統(tǒng)可以派生生出各種不不同類型的的輔助文件件和建立它它的應(yīng)用系系統(tǒng)。 ? 數(shù)據(jù)據(jù)庫的要求求與特性 為為了使各種種類型的數(shù)數(shù)據(jù)庫系統(tǒng)統(tǒng)能夠充分分發(fā)揮它們們的優(yōu)越性性,必須對對數(shù)據(jù)庫管管理系統(tǒng)的的使用提出出一些明確確的要求。 11.建立數(shù)數(shù)據(jù)庫文件件的要求 (1)盡量量減少數(shù)據(jù)據(jù)的重復(fù),使使數(shù)據(jù)具有有最小的冗冗余度。計計算機早期期應(yīng)用中的的文件管理理系統(tǒng),由由于數(shù)據(jù)文文件是用戶戶各自建立立的,幾個個用戶即使使有許多相相同的數(shù)據(jù)據(jù)也得放在在各自的文文件中,因因而造成存存儲的數(shù)據(jù)據(jù)大量重復(fù)復(fù),浪費存存儲空間。數(shù)據(jù)

28、庫技技術(shù)正是為為了克服這這一缺點而而出現(xiàn)的,所所以在組織織數(shù)據(jù)的存存儲時應(yīng)避避免出現(xiàn)冗冗余。 (2)提高高數(shù)據(jù)的利利用率,使使眾多用戶戶都能共享享數(shù)據(jù)資源源。 (3)注意意保持數(shù)據(jù)據(jù)的完整性性。這對某某些需要歷歷史數(shù)據(jù)來來進行預(yù)測測、決策的的部門(如統(tǒng)計局局、銀行等等)特別重要要。 (4)注意意同一數(shù)據(jù)據(jù)描述方法法的一致性性,使數(shù)據(jù)據(jù)操作不致致發(fā)生混亂亂。如一個個人的學歷歷在人事檔檔案中是大大學畢業(yè),而而在科技檔檔案中卻是是大學程度度,這樣就就容易造成成混亂。 (5)對于于某些需要要保密的數(shù)數(shù)據(jù),必須須增設(shè)保密密措施。 (6)數(shù)據(jù)據(jù)的查找率率高,根據(jù)據(jù)需要數(shù)據(jù)據(jù)應(yīng)能被及及時維護。2.數(shù)據(jù)庫庫文

29、件的特特征無論使用哪哪一種數(shù)據(jù)據(jù)庫管理系系統(tǒng),由它它們所建立立的數(shù)據(jù)庫庫文件都可可以看成是是具有相同同性質(zhì)的記記錄的集合合,因而這這些數(shù)據(jù)庫庫文件都有有相同的特特性: (1)文件件的記錄格格式相同,長長度相等。 (2)不同同的行是不不同的記錄錄,因而具具有不同的的內(nèi)容。 (3)不同同的列表示示不同的字字段名,同同一列中的的數(shù)據(jù)的性性質(zhì)(屬性)相同。 (4)每一一行各列的的內(nèi)容是不不能分割的的,但行的的順序和列列的順序不不影響文件件內(nèi)容的表表達。 33.文件的的分類 對對文件引用用最多的是是主文件和和事物文件件。其他的的文件分類類還包括表表文件、備備份文件、檔案的輸輸出文件等等。下面將將講述這些

30、些文件。 (1)主文文件。主文文件是某特特定應(yīng)用領(lǐng)領(lǐng)域的永久久性的數(shù)據(jù)據(jù)資源。主主文件包含含那些被定定期存取以以提供信息息和經(jīng)常更更新以反映映最新狀態(tài)態(tài)的記錄。典型的主主文件有庫庫存文件、職工主文文件和收帳帳主文件等等。 (2)事務(wù)務(wù)文件。事事務(wù)文件包包含著作為為一個信息息系統(tǒng)的數(shù)數(shù)據(jù)活動(事務(wù))的那些記記錄。這些些事務(wù)被分分批以構(gòu)成成事務(wù)文件件。例如,從從每周工資資卡上錄制制下來的數(shù)數(shù)分批存放放在一個事事務(wù)文件上上,然后對對照工資清清單文件進進行處理以以便打印出出工資支票票和工資記記錄簿。 (3)表文文件。表文文件是一些些表格。之之所以單獨獨建立表文文件而不把把表設(shè)計在在程序中是是為了便于于

31、修改。例例如,一個個公用事業(yè)業(yè)公司的稅稅率表或國國內(nèi)稅務(wù)局局的稅率就就可以存儲儲在表中文文件。 (4)備用用文件。備備用文件是是現(xiàn)有生產(chǎn)產(chǎn)性文件的的一個復(fù)制制品。一旦旦生產(chǎn)性文文件受到破破壞,利用用備用文件件就可以重重新建立生生產(chǎn)性文件件。 (5)檔案案文件。檔檔案文件不不是提供當當前處理使使用的,而而是保存起起來作為歷歷史參照的的。例如,國國內(nèi)稅務(wù)局局(IRSS)可能要要求檢查某某個人最近近15年的歷歷史。實際際上,檔案案文件恰恰恰是在給定定時間內(nèi)工工作的一個個“快照”。 (6)輸出出文件。輸輸出文件包包含將要打打印在打印印機上的、顯在屏幕幕上的或者者繪制在繪繪圖儀上的的那些信息息的數(shù)值映映

32、象。輸出出文件可以以是“假脫機的的”(存儲在在輔存設(shè)備備上),當輸出出設(shè)備可用時才進行行實際的輸輸出。四、數(shù)據(jù)的的操縱和檢檢索綜合數(shù)數(shù)據(jù)庫管理理系統(tǒng) 到到目前為止止,我們集集中討論了了傳統(tǒng)的文文件處理。此處,文文件是作為為一個獨立立的邏輯實實體來處理理的,而且且通常與某某個特定的的業(yè)務(wù)領(lǐng)域域相聯(lián)系。為了把業(yè)業(yè)務(wù)上相近近的那些部部門的文件件綜合在一一起,必須須預(yù)先排序序記錄和合合并文件。這樣做可可能耗費大大量的時間間,有時甚甚至是不可可能實現(xiàn)的的。 通通常,文件件是為了滿滿足特定業(yè)業(yè)務(wù)領(lǐng)域某某部門的專專門需要而而設(shè)計的,如如果某部門門想使用保保存在一個個文件上的的部分數(shù)據(jù)據(jù),而該文文件是另一一部

33、門為自自己使用而而設(shè)計的,那那么他們必必須抽取這這些數(shù)據(jù)并并重新整理理后才能使使用。大多多數(shù)部門總總是寧愿建建立和保持持和一個類類似(而不同)的文件以以更好地滿滿足自己的的使用要求求,而不愿愿兼顧其他他部門的業(yè)業(yè)務(wù)需要。這樣做的的結(jié)果形成成了大量的的帶有重復(fù)復(fù)數(shù)據(jù)的文文件。前面面的例子中中已經(jīng)提到到,某所大大學就保存存了75個獨立立的計算機機文件,而而每個文件件中都包含含有學生記記錄。每當當一個學生生結(jié)婚了或或者改換了了住處時,則則必須修改改75個文件件。 數(shù)數(shù)據(jù)的冗余余會使成本本提高,而而設(shè)計一個個綜合的資資源共享數(shù)數(shù)據(jù)庫則可可以把數(shù)據(jù)據(jù)冗余度降降低到最小小程度。綜綜合的資源源共享數(shù)據(jù)據(jù)庫把

34、公司司看作一個個整體來提提供服務(wù),而而不只是為為公司某特特殊部門服服務(wù)。利用用數(shù)據(jù)庫管管理系統(tǒng)(DBMSS)軟件就就可能實現(xiàn)現(xiàn)一個綜合合的數(shù)據(jù)庫庫。 早早在70年代初初期就出現(xiàn)現(xiàn)了DBMMS技術(shù),但但是直到770年代末末期仍未得得到普遍的的接受。早早期的DBBMS“軟軟件包”效率不高高,實際上上比傳統(tǒng)的的文件處理理的要求更更高的硬件件能力。目目前DBMMS對硬件件的要求已已經(jīng)降低了了,甚至在在小型計算算機系統(tǒng)上上也能運行行DBMSS軟件,造造成推遲接接受和實現(xiàn)現(xiàn)DBMSS技術(shù)的主主要原因可可能是信息息服務(wù)人員員缺乏專門門的知識,而而且用戶管管理人員又又不愿合作作和支持建建立一個共共享的數(shù)據(jù)據(jù)庫

35、。目前前對于設(shè)計計和運行DDBMS軟軟件已經(jīng)有有了廣泛的的了解,而而且部分用用戶管理人人員已經(jīng)認認識到應(yīng)該該把信息作作為一個公公司的資源源來看待。 ? 數(shù)據(jù)據(jù)庫環(huán)境的的好處 11.經(jīng)濟上上的好處。通過先進進的數(shù)據(jù)結(jié)結(jié)構(gòu)技術(shù),DBMS提供了最小化數(shù)據(jù)冗余度的可能性。當然,為了提高處理效率,即使有了DBMS幫助,有時還需要在共享的數(shù)據(jù)庫中保留一定的重復(fù)數(shù)據(jù)。由于減少了數(shù)據(jù)的冗余度,從而也簡化了收集和更新數(shù)據(jù)的過程。就前面的例子而言,只需要在一處(數(shù)據(jù)庫中)更新學生地址就可以了。 22.數(shù)據(jù)庫庫技術(shù)也給給信息服務(wù)務(wù)專業(yè)人員員帶來的好好處。綜合合資源共享享數(shù)據(jù)庫為為系統(tǒng)分析析員打開了了嶄新的大大門。數(shù)

36、據(jù)據(jù)庫能向系系統(tǒng)分析員員提供傳統(tǒng)統(tǒng)文件所不不能提供的的信息。由由于有了DDBMS,就就更容易得得到數(shù)據(jù),因因此使程序序設(shè)計任務(wù)務(wù)要比原先先更為簡單單。此外,數(shù)數(shù)據(jù)是獨立立于程序的的。這意味味著用戶管管理人員可可以增加數(shù)數(shù)據(jù)庫中的的數(shù)據(jù)、修修改庫中的的現(xiàn)有數(shù)據(jù)據(jù)或者從庫庫中刪除數(shù)數(shù)據(jù),這些些并不影響響現(xiàn)有的程程序,而在在過去則需需要測試和和修改幾十十個(有時幾百百個)程序。當當然,數(shù)據(jù)據(jù)庫管理系系統(tǒng)還有其其它重要的的優(yōu)點,但但是這些已已超出本書書的范圍。 33.信息方方面的好處處。一個綜綜合資源共共享數(shù)據(jù)庫庫能以有序序的方式提提供一種滿滿足信息要要求的結(jié)構(gòu)構(gòu)。實際上上,數(shù)據(jù)庫庫是能夠充充分利用公

37、公司信息資資源的唯一一工具。由由于數(shù)據(jù)庫庫和DBMMS在產(chǎn)生生報表方面面提供了極極大的靈活活性,因此此,也給決決策過程帶帶來了同樣樣的靈活性性。 44.DBMMS軟件在在支持聯(lián)機機系統(tǒng)方面面是特別有有價值的。共享數(shù)據(jù)據(jù)庫不僅可可供多個用用戶存取而而且還特別別能反映出出數(shù)據(jù)的當當前狀態(tài)。對于許多多查詢來說說,及時性性是很關(guān)鍵鍵的。例如如,某個經(jīng)經(jīng)理由于設(shè)設(shè)備故障不不得不關(guān)閉閉某個工作作站,此時時他有可能能要查詢其其它工作站站的狀態(tài),并并且利用得得到的信息息來改變進進行中的工工作路線。 ? 方法法 DDBMS克克服了傳統(tǒng)統(tǒng)文件處理理的局限性性。它依靠靠靈活多變變的數(shù)據(jù)結(jié)結(jié)構(gòu)(將數(shù)據(jù)元元及記錄彼彼此

38、聯(lián)系的的方法)來做到這這一點?;诓煌瑪?shù)數(shù)據(jù)結(jié)構(gòu)的的DBMSS之間差別別很大。有有三種設(shè)計計DBMSS軟件的方方法 11.數(shù)據(jù)系系統(tǒng)語言會會議(COODASYYL)設(shè)計計并發(fā)布的的基于網(wǎng)絡(luò)絡(luò)或叢形數(shù)數(shù)據(jù)結(jié)構(gòu)的的DBMSS指南。 22.IBMM的信息管管理系統(tǒng)(IBS)使用的一一種層次結(jié)結(jié)構(gòu)。 33.某些最最近設(shè)計的的基于關(guān)系系數(shù)據(jù)結(jié)構(gòu)構(gòu)的DBMMS。 上上述的每一一種方法是是基本概念念和術(shù)語的的差別都很很大。因此此,為了減減少混淆和和便于理解解,以下的的闡述和討討論只使用用網(wǎng)絡(luò)方法法。 ? 庫設(shè)設(shè)計 11.數(shù)據(jù)庫庫設(shè)計方法法 我我們通過下下面的例子子來說明數(shù)數(shù)據(jù)庫管理理系統(tǒng)和一一種數(shù)據(jù)庫庫設(shè)

39、計方法法的原理??疾煜率鍪銮闆r。 某某圖書館保保存了一個個文件,該該文件每一一個記錄都都包含了下下述數(shù)據(jù)元元: (1)書名名 (2)作者者 (3)出版版社 (4)出版版社地址 (5)類別別 (6)出版版年份圖書館館長長希望在獲獲得決策信信息方面有有更多的靈靈活性。而而現(xiàn)在文件件不可能滿滿足其要求求。經(jīng)過與與信息處理理人員交換換意見之后后,他們決決定實現(xiàn)一一個基于CCODASSYL的數(shù)數(shù)據(jù)庫管理理系統(tǒng)。檢查現(xiàn)有文文件發(fā)現(xiàn)某某些數(shù)據(jù)重重復(fù)出現(xiàn)。每本書(每一書名名)都分別有有一個記錄錄。于是,寫寫過幾本書書的作者的的名字在他他寫的每本本書的記錄錄中重復(fù)出出現(xiàn)。在一一個圖書館館里可能有有某出版社社出版的數(shù)數(shù)百本,甚甚至數(shù)千本本書,但是是在該文件件的每本書書的記錄中中都重復(fù)地地出現(xiàn)出版版社名和出出版社地址址。 22.設(shè)立數(shù)數(shù)據(jù)庫的步步驟 設(shè)設(shè)計數(shù)據(jù)庫庫的方法之之一是使用用主題詞一一屬性矩陣陣作為識別別記錄和這這些記錄之之間關(guān)系的的一個輔助助工具。以以下各步驟驟描述了這這種設(shè)計數(shù)數(shù)據(jù)庫的方方法。第一步,在在圖20.6.100的主題詞詞一屬性矩矩陣的左邊邊列出了邏邏輯主題詞詞。在本例例中,這些些主題詞是是:書名、作者和出出版社。在在矩陣的頂頂端列出了了所有可能能的屬性。屬性是提提供與主題題詞有關(guān)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論