![數(shù)據(jù)處理的技術(shù)課件_第1頁](http://file4.renrendoc.com/view/f6b67fe54e1fb3b3365356799a52ee99/f6b67fe54e1fb3b3365356799a52ee991.gif)
![數(shù)據(jù)處理的技術(shù)課件_第2頁](http://file4.renrendoc.com/view/f6b67fe54e1fb3b3365356799a52ee99/f6b67fe54e1fb3b3365356799a52ee992.gif)
![數(shù)據(jù)處理的技術(shù)課件_第3頁](http://file4.renrendoc.com/view/f6b67fe54e1fb3b3365356799a52ee99/f6b67fe54e1fb3b3365356799a52ee993.gif)
![數(shù)據(jù)處理的技術(shù)課件_第4頁](http://file4.renrendoc.com/view/f6b67fe54e1fb3b3365356799a52ee99/f6b67fe54e1fb3b3365356799a52ee994.gif)
![數(shù)據(jù)處理的技術(shù)課件_第5頁](http://file4.renrendoc.com/view/f6b67fe54e1fb3b3365356799a52ee99/f6b67fe54e1fb3b3365356799a52ee995.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第四章 數(shù)據(jù)處理的技術(shù)第一節(jié) 數(shù)據(jù)處理概述 第二節(jié) 數(shù)據(jù)庫技術(shù)復(fù)習(xí)思考題四第一節(jié) 數(shù)據(jù)處理概述 (一)數(shù)據(jù)處理的內(nèi)容 所謂數(shù)據(jù)處理,就是把來自科學(xué)研究、生產(chǎn)實(shí)踐和社會(huì)經(jīng)濟(jì)活動(dòng)等領(lǐng)域中的原始數(shù)據(jù)用一定的設(shè)備和一定的手段按一定的使用要求加工處理成另一種形式的數(shù)據(jù),以便獲得對(duì)人們決策有價(jià)值的信息的過程。1. 數(shù)據(jù)的采集 數(shù)據(jù)的采集就是按照用戶的需要和系統(tǒng)的要求收集必要的原始數(shù)據(jù)。這是數(shù)據(jù)處理工作的第一步。它直接影響到加工信息的質(zhì)量。在數(shù)據(jù)采集中,不僅要及時(shí)準(zhǔn)確,而且還要有針對(duì)性,即根據(jù)處理的目的和需要有選擇地加以采集。一、數(shù)據(jù)處理的主要內(nèi)容與方式 第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式1
2、. 數(shù)據(jù)的采集 數(shù)據(jù)采集可以是人工采集,也可以通過聯(lián)機(jī)方式形成自動(dòng)化數(shù)據(jù)采集系統(tǒng)。 人工采集的數(shù)據(jù),一般是經(jīng)過一定的中間環(huán)節(jié)而獲得的數(shù)據(jù),如檔案文件、賬冊(cè)、票據(jù)、憑證等。利用人工采集的主要優(yōu)點(diǎn)是簡單經(jīng)濟(jì),缺點(diǎn)是及時(shí)性差,出錯(cuò)率高。 聯(lián)機(jī)方式采集數(shù)據(jù),主要是將某種計(jì)算裝置、測(cè)試裝置等直接與電子數(shù)據(jù)處理系統(tǒng)相聯(lián)接,利用電磁感應(yīng)、光電感應(yīng)、聲電感應(yīng)、電熱感應(yīng)及機(jī)械原理等,將所需要的有關(guān)數(shù)值或狀態(tài)數(shù)據(jù)直接送入計(jì)算機(jī)數(shù)據(jù)處理系統(tǒng)直接處理。采用自動(dòng)化裝置采集數(shù)據(jù)的優(yōu)點(diǎn)是快速、準(zhǔn)確,缺點(diǎn)是投資較大。 數(shù)據(jù)的轉(zhuǎn)換也叫數(shù)據(jù)的預(yù)處理,是將采集到的原始數(shù)據(jù)通過一定手段轉(zhuǎn)換成適合于計(jì)算機(jī)處理的形式,使數(shù)據(jù)代碼化。如職
3、工文件中的職工性別,年齡,工作單位等數(shù)據(jù),對(duì)計(jì)算機(jī)系統(tǒng)來說可以用相應(yīng)的代碼表示這些數(shù)據(jù),如用0、1或MF表示性別,用00001表示工作單位號(hào)。數(shù)據(jù)的轉(zhuǎn)換一定要注意正確性、完整性檢查。2. 數(shù)據(jù)的轉(zhuǎn)換及錄入第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式 分類是根據(jù)一定順序?qū)o序的數(shù)據(jù)元素調(diào)整成為一個(gè)有序序列,也就是將數(shù)據(jù)元素按某一關(guān)鍵字的先后次序(升序或降序)進(jìn)行排序,形成一個(gè)有序文件。如生產(chǎn)統(tǒng)計(jì)報(bào)表要求按產(chǎn)值的大小對(duì)各車間排序;工資文件按職工編號(hào)排序或按工資的多少排序等。 合并是將兩個(gè)或多個(gè)簡單有序集合中的數(shù)據(jù)按同樣的順序連接成一個(gè)有序集合。合并后的文件,可以增加記錄的數(shù)量,也可以增加數(shù)據(jù)
4、項(xiàng)。3. 數(shù)據(jù)的分類與合并第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式 數(shù)據(jù)的運(yùn)算包括數(shù)據(jù)的算術(shù)運(yùn)算、邏輯運(yùn)算及復(fù)雜的數(shù)學(xué)模型求解。4. 數(shù)據(jù)的運(yùn)算 數(shù)據(jù)的傳輸有兩層含義:一是指實(shí)現(xiàn)數(shù)據(jù)資源的共享與交換,例如,利用網(wǎng)絡(luò)和通訊技術(shù)共享各網(wǎng)點(diǎn)的數(shù)據(jù)資源,一是數(shù)據(jù)處理結(jié)果的輸出,常以報(bào)告、文件、圖表等形式輸出給各用戶、并傳送到各部門。第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式5. 數(shù)據(jù)的傳輸6. 數(shù)據(jù)的存儲(chǔ) 數(shù)據(jù)的存儲(chǔ)就是對(duì)原始待加工的數(shù)據(jù)及已加工后的各種信息的儲(chǔ)存。為此需要確定儲(chǔ)存哪些信息、儲(chǔ)存多長時(shí)間、以何種方式儲(chǔ)存、采用何種數(shù)據(jù)結(jié)構(gòu),以符合速度快、占用存儲(chǔ)器的容量少、成本低等多方
5、面的要求。 數(shù)據(jù)的更新、維護(hù)是指對(duì)原文件中的記錄或數(shù)據(jù)項(xiàng)進(jìn)行修改、插入(增加)、刪除及數(shù)據(jù)存儲(chǔ)的調(diào)整,數(shù)據(jù)正確性的檢驗(yàn)和安全性的保證等。第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式7. 數(shù)據(jù)的更新、維護(hù)8. 數(shù)據(jù)的檢索 數(shù)據(jù)的檢索即為從計(jì)算機(jī)存儲(chǔ)的數(shù)據(jù)中查找和選取所需要的數(shù)據(jù)。采用何種方式檢索,取決于數(shù)據(jù)存儲(chǔ)的形式。例如,在職工文件中可按職工編號(hào)或姓名查找某職工的工資、出生年月、職稱、職務(wù)等。(二)數(shù)據(jù)處理的方式 根據(jù)數(shù)據(jù)的發(fā)生及數(shù)據(jù)處理的響應(yīng)時(shí)間的不同,數(shù)據(jù)處理方式可分為批處理(batch processing)方式和實(shí)時(shí)處理(real time processing)方式兩種。 1.
6、 批處理方式 批處理方式也叫匯總處理方式。它是把一定時(shí)間內(nèi)準(zhǔn)備處理的各個(gè)業(yè)務(wù)地點(diǎn)的數(shù)據(jù)累積成批后,一次輸入到計(jì)算機(jī)集中進(jìn)行加工處理。例如,工資計(jì)算中,把一個(gè)月中的各項(xiàng)津貼、扣款憑證等積累起來,在發(fā)薪前一次輸入到計(jì)算機(jī),經(jīng)處理以后打印一次工資單。根據(jù)系統(tǒng)與用戶之間距離的遠(yuǎn)近不同,數(shù)據(jù)處理方式可分為本地批處理和遠(yuǎn)程批處理方式。 第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式 (1)本地批處理 本地批處理的數(shù)據(jù)輸入輸出發(fā)生在計(jì)算中心,它把待處理的數(shù)據(jù)通過郵寄、運(yùn)輸工具等送到計(jì)算中心,然后用一定手段輸入計(jì)算機(jī)進(jìn)行批處理。根據(jù)向計(jì)算機(jī)輸人數(shù)據(jù)的方式不同,本地批處理又可分為中心批處理、聯(lián)機(jī)批處理及脫機(jī)
7、批處理三種方式。 (2)遠(yuǎn)程批處理方式 這種批處理方式是通過把數(shù)據(jù)從分散的遠(yuǎn)程終端經(jīng)過通信線路輸入到計(jì)算機(jī),經(jīng)批處理后再把處理結(jié)果返回到運(yùn)送終端。 批處理的優(yōu)點(diǎn)是效率高,缺點(diǎn)是不及時(shí)。 1. 批處理方式第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式 實(shí)時(shí)處理方式是指在數(shù)據(jù)產(chǎn)生的同時(shí),立即輸入計(jì)算機(jī),計(jì)算機(jī)即時(shí)作出響應(yīng)并進(jìn)行相應(yīng)的處理,將處理結(jié)果直接傳遞給用戶。實(shí)時(shí)處理方式的應(yīng)用領(lǐng)域非常廣泛,例如,監(jiān)控系統(tǒng)、窗口詢問系統(tǒng)、金融流通系統(tǒng)、飛機(jī)訂票系統(tǒng)等。實(shí)時(shí)處理又可分為聯(lián)機(jī)實(shí)時(shí)處理與分時(shí)處理兩種方式。2. 實(shí)時(shí)處理方式 聯(lián)機(jī)實(shí)時(shí)處理方式 聯(lián)機(jī)方式是用戶通過終端輸入的數(shù)據(jù)立即由中央計(jì)算機(jī)處理,并
8、向用戶終端輸出處理信息。它包括詢問方式、事務(wù)數(shù)據(jù)處理方式和信息交換等方式。 (二)數(shù)據(jù)處理的方式 第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式 所謂分時(shí),就是指一個(gè)計(jì)算機(jī)系統(tǒng)可以由許多獨(dú)立的用戶共享,每個(gè)用戶都可以分到一個(gè)雖短但一再出現(xiàn)的計(jì)算時(shí)間片,使其感到只有自己一個(gè)人在使用計(jì)算機(jī),并且都能得到最快的響應(yīng)。這種多用戶共用計(jì)算機(jī)的分時(shí)處理又稱會(huì)話型處理或即時(shí)處理。 分時(shí)處理方式 實(shí)時(shí)處理方式的優(yōu)點(diǎn)是響應(yīng)迅速,人機(jī)配合良好,缺點(diǎn)是不能面向大量的數(shù)據(jù)處理,且由于線路費(fèi)用增加而使成本提高。2. 實(shí)時(shí)處理方式第一節(jié) 數(shù)據(jù)處理概述 一、數(shù)據(jù)處理的主要內(nèi)容與方式(一)數(shù)據(jù)結(jié)構(gòu)的概念及形式1、數(shù)據(jù)結(jié)構(gòu)
9、的概念 “數(shù)據(jù)結(jié)構(gòu)”是為了解決和研究非數(shù)值數(shù)據(jù)處理問題而提出的理論和方法。 在任何問題中,數(shù)據(jù)元素之間都存在著某種聯(lián)系,這種數(shù)據(jù)元素之間所存在的相互關(guān)系我們稱之為數(shù)據(jù)的邏輯結(jié)構(gòu)而數(shù)據(jù)元素在計(jì)算機(jī)存儲(chǔ)器中的表示稱之為數(shù)據(jù)的物理結(jié)構(gòu),或稱為存儲(chǔ)結(jié)構(gòu)。第一節(jié) 數(shù)據(jù)處理概述 二、數(shù)據(jù)結(jié)構(gòu)與文件組織2、數(shù)據(jù)結(jié)構(gòu)的主要形式 在數(shù)據(jù)處理過程中常用的數(shù)據(jù)結(jié)構(gòu)有線性表、堆棧、隊(duì)列、樹及圖等形式。2、數(shù)據(jù)結(jié)構(gòu)的主要形式 (1) 線性表 線性表(linear list)是一種最基本、最簡單,也是應(yīng)用最廣泛的數(shù)據(jù)結(jié)構(gòu)。 線性表是由n個(gè)數(shù)據(jù)元素組成的有限序列(al,a2,an)。至于每個(gè)元素ai的具體含義,可按不同的情
10、況和要求賦予不同的內(nèi)涵,它可以是一個(gè)數(shù),一個(gè)符號(hào),一串文字,也可以是其它更復(fù)雜的信息。在復(fù)雜的線性表中,一個(gè)數(shù)據(jù)元素可以由若干數(shù)據(jù)項(xiàng)(item)組成。通常我們將含有多個(gè)數(shù)據(jù)項(xiàng)的數(shù)據(jù)元素稱為記錄(record)。第一節(jié) 數(shù)據(jù)處理概述 二、數(shù)據(jù)結(jié)構(gòu)與文件組織 表4.1 學(xué)生基本狀況登記表學(xué) 號(hào)姓 名年 齡性 別班 級(jí)籍 貫96070201張建平20男96信息河北96070202郝曉麗19女96信息河北96070203陳玉東21男96信息天津2、數(shù)據(jù)結(jié)構(gòu)的主要形式 第一節(jié) 數(shù)據(jù)處理概述 (1) 線性表 例如,一個(gè)學(xué)校的學(xué)生基本情況登記表(見表4.l),也構(gòu)成一個(gè)線性表,它的數(shù)據(jù)元素(或稱為記錄)由六
11、個(gè)數(shù)據(jù)項(xiàng):學(xué)號(hào)、姓名、年齡、性別、班級(jí)、籍貫組成。(2)堆棧 堆棧(stack)是一種特殊的線性表,其數(shù)據(jù)元素只能從表的一端進(jìn)行插入和刪除。允許插入和刪除操作的一端稱為棧頂(top),不允許插入和刪除的一端稱為棧底(bottom),堆棧用來保存尚未處理而又等待處理的數(shù)據(jù)項(xiàng),這些數(shù)據(jù)項(xiàng)的處理是依據(jù)后進(jìn)先出的規(guī)則。也就是說,取出(刪除)元素順序恰好是最后進(jìn)棧的元素。如食堂里的一疊盤子,如果每次只允許一個(gè)一個(gè)地往上堆,一個(gè)一個(gè)地往下取,而不允許從中間抽出或插入。2、數(shù)據(jù)結(jié)構(gòu)的主要形式 第一節(jié) 數(shù)據(jù)處理概述 隊(duì)列也是一種特殊的線性表,它規(guī)定在表的一端進(jìn)行插入,在另一端進(jìn)行刪除。隊(duì)列是依照先進(jìn)先出的原則
12、。因此,通常把隊(duì)列又叫作先進(jìn)先出表。簡稱為FIFO(First In First Out)表。所有需要進(jìn)隊(duì)的數(shù)據(jù)項(xiàng),只能從隊(duì)列的一端進(jìn)入,該端稱為隊(duì)列的首部(front),而從另一端刪除,該端稱為隊(duì)列的尾部(rear)。隊(duì)列是一個(gè)兩端均打開的向量,它限制數(shù)據(jù)項(xiàng)從隊(duì)列的一端移到另一端,保證處理的次序與原來的次序一致。2、數(shù)據(jù)結(jié)構(gòu)的主要形式 第一節(jié) 數(shù)據(jù)處理概述 (3)隊(duì)列 樹(tree)就是一種重要的非線性數(shù)據(jù)結(jié)構(gòu),它是以分支關(guān)系定義的層次結(jié)構(gòu)。它可以遞歸地定義:樹是一個(gè)有n(n1)個(gè)節(jié)點(diǎn)的有限集合,并滿足: 有一個(gè)特殊的節(jié)點(diǎn)稱為根節(jié)點(diǎn)(root)。 除根節(jié)點(diǎn)之外的其余結(jié)點(diǎn)可分為m(m0)個(gè)互不
13、相交的有限集合t1,t2,tm,其中每一個(gè)集合本身又是一棵樹。并且稱為根的子樹(subtree)。 2、數(shù)據(jù)結(jié)構(gòu)的主要形式 第一節(jié) 數(shù)據(jù)處理概述 (4)樹 圖是比樹更復(fù)雜的一種非線性數(shù)據(jù)結(jié)構(gòu)。圖中節(jié)點(diǎn)之間的聯(lián)系是任意的,任何一個(gè)節(jié)點(diǎn)都可以與其它節(jié)點(diǎn)相連接,呈現(xiàn)出一種網(wǎng)狀形式。 嚴(yán)格地講,一個(gè)圖G是由兩個(gè)集合V和E組成,V是有限的非空頂點(diǎn)式稱節(jié)點(diǎn)集,E是邊的有限集,并分別用V(G)和E(G)表示圖中的頂點(diǎn)集和邊集,G=(V、E)表示圖。 樹中至少有一個(gè)根節(jié)點(diǎn),每一個(gè)節(jié)點(diǎn),相對(duì)于根有一個(gè)層次,規(guī)定根為節(jié)0層,其它節(jié)點(diǎn)根據(jù)所處的位置依次為第1層,第2層。樹中的最大層次加1稱為樹的高度或稱深度。一個(gè)節(jié)
14、點(diǎn)子樹的個(gè)樹稱為該節(jié)點(diǎn)的度(degree)。度為零的節(jié)點(diǎn)稱為終端節(jié)點(diǎn)。2、數(shù)據(jù)結(jié)構(gòu)的主要形式 第一節(jié) 數(shù)據(jù)處理概述 (4)樹(5)圖 計(jì)算機(jī)處理用的文件具有特定的含義。文件(file)是由性質(zhì)相同的記錄組成的集合。根據(jù)所記錄的內(nèi)容,文件大致可分為兩類:程序文件與數(shù)據(jù)文件。(二)文件組織第一節(jié) 數(shù)據(jù)處理概述 二、數(shù)據(jù)結(jié)構(gòu)與文件組織1. 文件及文件組織的含義 程序文件是把程序作為庫加以管理的文件,它包含各種高級(jí)語言程序、進(jìn)行各種數(shù)據(jù)處理的實(shí)用程序以及用戶應(yīng)用程序文件;而用戶在程序中定義、處理的文件均為數(shù)據(jù)文件。 文件的組織和其它類型的數(shù)據(jù)組織一樣,主要是研究它的邏輯結(jié)構(gòu)和物理結(jié)構(gòu)。文件的邏輯結(jié)構(gòu)是
15、指呈現(xiàn)在用戶面前的數(shù)據(jù)組織形式,是用戶對(duì)數(shù)據(jù)的表示和存取的方式。文件的物理結(jié)構(gòu)是指數(shù)據(jù)在外存上的存儲(chǔ)方式,是數(shù)據(jù)的物理表示和組織。文件的邏輯結(jié)構(gòu)主要著眼于用戶的使用方便;文件的物理結(jié)構(gòu)則應(yīng)考慮存儲(chǔ)空間的利用率和減少存取記錄的時(shí)間。第一節(jié) 數(shù)據(jù)處理概述 二、數(shù)據(jù)結(jié)構(gòu)與文件組織2. 文件的組織方式 根據(jù)外存介質(zhì)類型以及記錄的訪問形式的不同,文件可以有各種各樣的組織方式,這里主要介紹順序文件,索引文件和直接存取文件。1. 文件及文件組織的含義(l)順序文件 順序文件是按記錄的序號(hào)或記錄的相對(duì)位置來進(jìn)行存取的文件組織形式。順序文件是物理結(jié)構(gòu)最簡單的文件。在這種結(jié)構(gòu)中,記錄是按進(jìn)入的次序順序存放在存儲(chǔ)器
16、上,邏輯結(jié)構(gòu)和物理結(jié)構(gòu)一致。若相繼的兩個(gè)記錄在存儲(chǔ)介質(zhì)上的存儲(chǔ)位置相鄰,則又稱為連續(xù)文件;若物理記錄之間的次序由指針相鏈表示,則稱為串鏈文件。 對(duì)順序文件如果要求記錄對(duì)關(guān)鍵字有序,則記錄進(jìn)入應(yīng)按關(guān)鍵字進(jìn)行排列。例如,如果班級(jí)學(xué)生文件的關(guān)鍵字是學(xué)生的學(xué)號(hào),按照記錄的順序,學(xué)號(hào)為35012的記錄將放在學(xué)號(hào)為35013的前面。第一節(jié) 數(shù)據(jù)處理概述 二、數(shù)據(jù)結(jié)構(gòu)與文件組織2. 文件的組織方式(2) 索引文件 在索引文件組織中,決定存儲(chǔ)單元地址的操作與記錄的存取是分開的。 對(duì)于按關(guān)鍵字存取的文件結(jié)構(gòu),若用關(guān)鍵字直接對(duì)文件進(jìn)行查找,不論是順序查找還是折半查找,都因大量記錄的輸入、輸出使查找速度很慢。為此,
17、可以建立一個(gè)表,用來指示關(guān)鍵字值與相應(yīng)建立的存儲(chǔ)地址之間的對(duì)應(yīng)關(guān)系,如圖4.1所示。圖4.1 記錄與存儲(chǔ)地址的關(guān)系第一節(jié) 數(shù)據(jù)處理概述 2. 文件的組織方式 利用這個(gè)圖可以減少查找時(shí)間,提高處理速度。圖中Ki為關(guān)鍵字值;RKi表示關(guān)鍵字值為Ki的記錄;A(RKi)為記錄RK的存儲(chǔ)地址。這個(gè)圖中的表叫做索引,其中的Ki,A(RKi)則稱為索引項(xiàng)。 具有索引項(xiàng)的文件稱為索引文件,它是由索引和文件本身兩部分組成的。相應(yīng)的,索引文件的存儲(chǔ)分為兩個(gè)區(qū):索引區(qū)和記錄區(qū)。(2) 索引文件第一節(jié) 數(shù)據(jù)處理概述 2. 文件的組織方式(3)直接存取文件 直接存取文件是指用哈希法進(jìn)行組織的文件。對(duì)于磁盤來說,記錄通
18、常是成組存放的,每一個(gè)存儲(chǔ)單位存放若干個(gè)記錄,這種存儲(chǔ)單位叫做桶(bucket)。按桶尋址,一次IO操作可以把一個(gè)桶的全部記錄讀入到內(nèi)存緩沖區(qū),或者從內(nèi)存寫入外存。通常,一個(gè)桶可以存放M個(gè)記錄,一個(gè)文件空間分為n個(gè)桶,編號(hào)為0,1,2,n-1。哈希函數(shù)H(K)是把關(guān)鍵字值轉(zhuǎn)換成桶地址。 直接存取文件比索引、順序文件更簡單,它的特點(diǎn)是:文件隨機(jī)存放;記錄未排序;不能按關(guān)鍵字值讀出;插人數(shù)據(jù)方便;存取速度快;節(jié)省空間;不占用索引區(qū)。 第一節(jié) 數(shù)據(jù)處理概述 2. 文件的組織方式第二節(jié) 數(shù)據(jù)庫技術(shù)一、數(shù)據(jù)庫基本概念 數(shù)據(jù)庫:是指被計(jì)算機(jī)存儲(chǔ)起來的數(shù)據(jù)及數(shù)據(jù)間邏輯關(guān)系的集合。換句話說,數(shù)據(jù)庫是通過文件而
19、組織起來的,具有最小冗余度、獨(dú)立性、共享性和統(tǒng)一管理等特點(diǎn)的數(shù)據(jù)集合。 數(shù)據(jù)庫管理系統(tǒng):是一個(gè)以統(tǒng)一的方式管理、維護(hù)數(shù)據(jù)庫中的數(shù)據(jù)的一系列軟件的集合。 數(shù)據(jù)庫系統(tǒng):是指在計(jì)算機(jī)系統(tǒng)中引進(jìn)數(shù)據(jù)庫后的系統(tǒng)構(gòu)成。一般由數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、計(jì)算機(jī)軟件、硬件以及系統(tǒng)人員和用戶等組成。1. 幾個(gè)常用的術(shù)語 數(shù)據(jù)模型體現(xiàn)了數(shù)據(jù)的組織形式及數(shù)據(jù)之間的聯(lián)系,是實(shí)現(xiàn)現(xiàn)實(shí)世界的事物如何轉(zhuǎn)變?yōu)樾畔⑹澜绲膶?shí)體和屬性,再轉(zhuǎn)變成計(jì)算機(jī)世界的記錄和數(shù)據(jù)項(xiàng)的關(guān)鍵。第二節(jié) 數(shù)據(jù)庫技術(shù)二、數(shù)據(jù)模型 現(xiàn)實(shí)世界中客觀存在并可相互區(qū)別的“事物”被稱之為實(shí)體。實(shí)體可以指人,也可以指物,可以指實(shí)際的東西(如汽車、書),也可以指抽象和概念
20、性的東西(如一次借書,一種感情),還可以指“事物”與“事物”之間的聯(lián)系(如訂貨)。在數(shù)據(jù)庫組織中,指客觀存在的與某一應(yīng)用有關(guān)的事物。(l)實(shí)體(entity)(2)屬性(attribute) 實(shí)體具有的某種(或若干種)特性或特征被稱之為屬性。例如人的“姓名”、“年齡”、“性別”,產(chǎn)品的“顏色”、“重量”、“單價(jià)”等,這些都表示了“人”、“產(chǎn)品”這兩個(gè)實(shí)體的固有特征。屬性是對(duì)實(shí)體特征的抽象描述,屬性的具體取值稱為屬性值,例如:“王芳,21,女”這些值均為屬性值。1. 幾個(gè)常用的術(shù)語第二節(jié) 數(shù)據(jù)庫技術(shù)(3)實(shí)體集(entity set) 同一類型的實(shí)體集合被稱為實(shí)體集,即具有同一類屬性的客觀存在的
21、事物集合。例如所有的人是一個(gè)實(shí)體集,所有的中國人也是一個(gè)實(shí)體集,所有活著的人也是一個(gè)實(shí)體集,只不過范圍有大有小,區(qū)分的特征有多有少而已。(4)域(domain) 域是屬性的取值范圍,是由屬性值構(gòu)成的集合。即同一實(shí)體集中各實(shí)體同一屬性具有的值在一定范疇之內(nèi),這范疇稱為該屬性的值域,簡稱為域。一個(gè)屬性的值域可以是整數(shù)、實(shí)數(shù)、字符串等,如“人”這個(gè)實(shí)體集的姓名屬性的值域是字符串,“高度”的值域是實(shí)數(shù),“年齡”的值域是整數(shù),“性別的值域?yàn)椋?、女)。通常屬性是個(gè)變量,屬性值是變量所取的值,而域是變量取值的集合。 (5)聯(lián)系(relationship) 聯(lián)系一般指實(shí)體相互之間關(guān)系的抽象表示,亦即現(xiàn)實(shí)世界
22、中事物之間的語義關(guān)系。例如“系”屬于“學(xué)校”,“教師”與“學(xué)生”屬于“系”,“廠長”領(lǐng)導(dǎo)“工人”,“工人”生產(chǎn)“產(chǎn)品”,“產(chǎn)品”使用“材料”等。 1. 幾個(gè)常用的術(shù)語第二節(jié) 數(shù)據(jù)庫技術(shù)2. 實(shí)體聯(lián)系模型(entity relationship model)兩個(gè)實(shí)體集之間的聯(lián)系可分為三類,如圖4.2所示。圖4.2二元關(guān)系模型第二節(jié) 數(shù)據(jù)庫技術(shù)二、數(shù)據(jù)模型 (1)一對(duì)一聯(lián)系(onetoone) 一對(duì)一的聯(lián)系是指對(duì)于實(shí)體集A中的每一實(shí)體,實(shí)體集B中至多有一個(gè)實(shí)體與之有聯(lián)系,反之亦然,則實(shí)體集A與實(shí)體集B具有一對(duì)一的聯(lián)系。例如醫(yī)院中的住院病人與病床的聯(lián)系就是一對(duì)一的,即一個(gè)病人只占一張病床,而一張病床
23、也只被一個(gè)病人占用。 (2)一對(duì)多聯(lián)系(onetomany) 一對(duì)多的聯(lián)系是指對(duì)于實(shí)體集A中的每一實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n0)與之有聯(lián)系;反之,實(shí)體集B中每一個(gè)實(shí)體,實(shí)體A中最多只有一個(gè)實(shí)體與之有聯(lián)系,則稱實(shí)體集A與實(shí)體集B有一對(duì)多的聯(lián)系。例如醫(yī)院中的病房與住院的病人的聯(lián)系就是一對(duì)多的,即一間病房可以有多個(gè)病人,但每個(gè)病人只住一個(gè)病房。2. 實(shí)體聯(lián)系模型(entity relationship model)第二節(jié) 數(shù)據(jù)庫技術(shù) (3)多對(duì)多聯(lián)系(manytomany) 多對(duì)多聯(lián)系是指對(duì)于實(shí)體集A中的每一個(gè)實(shí)體,實(shí)體集B中有n個(gè)實(shí)體(n0)與之有聯(lián)系;反之,實(shí)體集B中的每一個(gè)實(shí)體,實(shí)體集A中
24、有m個(gè)實(shí)體(m0)與之有關(guān)系,則稱實(shí)體集A與實(shí)體集B有多對(duì)多的聯(lián)系。例如工人與技能之間的關(guān)系就是多對(duì)多的關(guān)系,即一個(gè)工人可以有多種技能,一種技能也可為多個(gè)工人所掌握。 3. 數(shù)據(jù)庫的數(shù)據(jù)模型 數(shù)據(jù)模型是對(duì)客觀事物及其聯(lián)系的數(shù)據(jù)描述,是實(shí)體聯(lián)系模型數(shù)據(jù)化。 2. 實(shí)體聯(lián)系模型(entity relationship model)第二節(jié) 數(shù)據(jù)庫技術(shù)(l)層次模型(Hierarchical Model) 層次模型是層次式數(shù)據(jù)庫所采用的數(shù)據(jù)模型,它是以樹結(jié)構(gòu)作為基本結(jié)構(gòu),通過樹結(jié)構(gòu)及樹結(jié)構(gòu)之間的邏輯關(guān)系來表示數(shù)據(jù)間聯(lián)系的一種模型,它反映了現(xiàn)實(shí)世界中實(shí)體之間的一對(duì)多的關(guān)系。 層次式數(shù)據(jù)模型的優(yōu)點(diǎn)是層次清
25、楚,結(jié)點(diǎn)間的聯(lián)系簡單。缺點(diǎn)是處理個(gè)別記錄效率低,數(shù)據(jù)庫文件的維護(hù)麻煩。 (2)網(wǎng)狀模型(Network Model) 網(wǎng)狀模型又叫網(wǎng)絡(luò)模型,它反映了現(xiàn)實(shí)世界中實(shí)體間存在的較為復(fù)雜的聯(lián)系。 在網(wǎng)狀結(jié)構(gòu)中,任何一個(gè)已知實(shí)體可以有任意個(gè)上屬記錄和下屬記錄。網(wǎng)狀結(jié)構(gòu)克服了層次結(jié)構(gòu)中的許多固有缺陷,但網(wǎng)狀結(jié)構(gòu)太復(fù)雜,數(shù)據(jù)處理快又繁雜,而且適合于某一網(wǎng)狀結(jié)構(gòu)的處理方法往往不適合于別的網(wǎng)狀結(jié)構(gòu)。3. 數(shù)據(jù)庫的數(shù)據(jù)模型第二節(jié) 數(shù)據(jù)庫技術(shù)(3)關(guān)系模型(Relational Model) 關(guān)系模型是采用二維表格式的數(shù)據(jù)模型,在一張二維表中,一個(gè)豎列反映實(shí)體的某一屬性,我們稱之為字段。表中的一行形成一個(gè)實(shí)體,我們
26、稱之為記錄,它由各個(gè)數(shù)據(jù)項(xiàng)(字段值)所組成,反映了某一實(shí)體的所有有關(guān)特性。由許多行、許多列組成的二維表可以用來反映同類實(shí)體(或?qū)嶓w集)的所有有關(guān)的信息,稱為數(shù)據(jù)庫文件。 關(guān)系式數(shù)據(jù)模型是一種數(shù)學(xué)化的模型。關(guān)系式數(shù)據(jù)結(jié)構(gòu)具有堅(jiān)實(shí)的數(shù)學(xué)理論基礎(chǔ),簡單、明了、直觀、容易理解和掌握,在現(xiàn)實(shí)生活中應(yīng)用最多,因此關(guān)系式數(shù)據(jù)庫得到了非常廣泛的應(yīng)用。而且,由于層次式和網(wǎng)狀式數(shù)據(jù)結(jié)構(gòu)都可以通過一定方法轉(zhuǎn)化為關(guān)系式數(shù)據(jù)模型來處理。因此,關(guān)系式數(shù)據(jù)庫被認(rèn)為是今后數(shù)據(jù)庫的發(fā)展方向。3. 數(shù)據(jù)庫的數(shù)據(jù)模型第二節(jié) 數(shù)據(jù)庫技術(shù) 目前數(shù)據(jù)庫的系統(tǒng)結(jié)構(gòu)基本上采用的是三級(jí)結(jié)構(gòu)模式,即對(duì)應(yīng)于全局邏輯級(jí)的模式,對(duì)應(yīng)于用戶級(jí)分模式和對(duì)
27、應(yīng)于物理存儲(chǔ)級(jí)的存儲(chǔ)模式。如圖4.3所示。 圖4.3 數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)示意圖 第二節(jié) 數(shù)據(jù)庫技術(shù)三、數(shù)據(jù)庫的系統(tǒng)結(jié)構(gòu) 數(shù)據(jù)庫管理系統(tǒng)(Data Base Management System, DBM)是對(duì)數(shù)據(jù)進(jìn)行管理的軟件系統(tǒng),是為數(shù)據(jù)庫建立、使用和維護(hù)而配置的。數(shù)據(jù)庫管理系統(tǒng)的主要目的是使數(shù)據(jù)作為一種可管理的資源,從而使數(shù)據(jù)易于為各種用戶所共享,增進(jìn)數(shù)據(jù)的安全性、完整性和可用性,提高數(shù)據(jù)的獨(dú)立性。(1)數(shù)據(jù)定義語言數(shù)據(jù)定義語言用以定義數(shù)據(jù)庫的各級(jí)數(shù)據(jù)結(jié)構(gòu)及它們之間的映象,還包括各種完整性約束和安全性措施。依描述的對(duì)象不同,它可分為模式數(shù)據(jù)描述語言、子模式數(shù)據(jù)描述語言和物理數(shù)據(jù)描述語言。1. 數(shù)
28、據(jù)庫管理系統(tǒng)的組成數(shù)據(jù)庫管理系統(tǒng)由下列三類軟件組成:第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)據(jù)庫管理系統(tǒng)(2)數(shù)據(jù)操縱語言 數(shù)據(jù)操縱語言為用戶或應(yīng)用程序訪問數(shù)據(jù)庫提供接口,它因數(shù)據(jù)庫系統(tǒng)而異。但一般可分為獨(dú)立式查詢語言和嵌入式查詢語言兩大類。獨(dú)立式查詢語言可以獨(dú)立使用,交互地對(duì)數(shù)據(jù)庫進(jìn)行操縱。它的特點(diǎn)是命令簡單,使用方便;便于非程序員用戶使用;但功能有限,需要專門的編譯程序。嵌入式查詢語言,不獨(dú)立使用,而是嵌入到某種高級(jí)語言中使用。第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)據(jù)庫管理系統(tǒng)1. 數(shù)據(jù)庫管理系統(tǒng)的組成(3)數(shù)據(jù)庫運(yùn)行控制系統(tǒng) 數(shù)據(jù)庫運(yùn)行控制系統(tǒng)是數(shù)據(jù)管理系統(tǒng)的核心,它包含各種例行程序。主要有:第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)
29、據(jù)庫管理系統(tǒng)1. 數(shù)據(jù)庫管理系統(tǒng)的組成 存儲(chǔ)控制例行程序,支持各種環(huán)境下由數(shù)據(jù)庫管理系統(tǒng)或用戶提出的對(duì)數(shù)據(jù)的存取請(qǐng)求; 安全性控制例行程序,用于授權(quán)機(jī)制的管理控制; 完整性控制例行系統(tǒng),用于各種完整性校驗(yàn)與控制; 事務(wù)管理例行程序,用于事務(wù)完整性控制與并發(fā)控制。此外還有恢復(fù)例行程序、監(jiān)控例行程序、系統(tǒng)總控例行程序和通信控制例行程序等。2. 數(shù)據(jù)庫管理系統(tǒng)的工作方式數(shù)據(jù)庫管理系統(tǒng)的工作方式有以下幾種: (1)終端用戶工作方式 在這種方式下,用戶使用鍵盤輸入某一帶有參數(shù)的命令,向數(shù)據(jù)庫存取數(shù)據(jù)。用發(fā)出的命令經(jīng)過遠(yuǎn)程處理后,由數(shù)據(jù)庫管理系統(tǒng)作進(jìn)一步加工并給出命令執(zhí)行結(jié)果。這種工作方式一般稱為單命令工
30、作方式或問答式工作方式。 (2)批處理工作方式 批處理工作方式也稱為程序方式,用戶應(yīng)用數(shù)據(jù)庫操縱語言編出完整的程序后運(yùn)行,機(jī)器根據(jù)應(yīng)用程序的指示完成所需的一系列工作。第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)據(jù)庫管理系統(tǒng)(3)在線用戶工作方式在線用戶工作方式也稱為聯(lián)機(jī)用戶工作方式,也是用數(shù)據(jù)操縱語言工作的,這一點(diǎn)和批處理工作方式一樣。但因?yàn)槠涑绦蚴峭ㄟ^鍵盤輸入,也要經(jīng)過遠(yuǎn)程處理程序,這一點(diǎn)又和終端用戶工作方式相似。2. 數(shù)據(jù)庫管理系統(tǒng)的工作方式第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)據(jù)庫管理系統(tǒng)3. 關(guān)系數(shù)據(jù)庫的特點(diǎn) (1)簡單、靈活易用。由于它對(duì)實(shí)體集及實(shí)體集間的聯(lián)系均采用關(guān)系來描述,對(duì)各種用戶(最終用戶、程序員、DBA等)
31、提供統(tǒng)一的單一數(shù)據(jù)結(jié)構(gòu)形式,使用戶很容易掌握和應(yīng)用這種模型和系統(tǒng)。(2)關(guān)系數(shù)據(jù)語言具有較好的非過程化特性,從而面向非專業(yè)用戶,同時(shí)應(yīng)用系統(tǒng)的開發(fā)效率也大大提高。第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)據(jù)庫管理系統(tǒng)3. 關(guān)系數(shù)據(jù)庫的特點(diǎn)(3)有更高的數(shù)據(jù)獨(dú)立性。邏輯數(shù)據(jù)庫結(jié)構(gòu)及其操作完全獨(dú)立于數(shù)據(jù)的物理存儲(chǔ)方式,應(yīng)用程序不必關(guān)心其物理存儲(chǔ)細(xì)節(jié),不受存儲(chǔ)結(jié)構(gòu)變化的影響,因而與層次、網(wǎng)絡(luò)系統(tǒng)相比有更好的獨(dú)立性。(4)易于實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的重組和控制,簡化了DBA的工作。(5)易于實(shí)現(xiàn)各種不可預(yù)計(jì)的隨機(jī)查詢,從而對(duì)管理決策活動(dòng)中數(shù)據(jù)庫應(yīng)用提供較好的支持。第二節(jié) 數(shù)據(jù)庫技術(shù)四、數(shù)據(jù)庫管理系統(tǒng)3. 關(guān)系數(shù)據(jù)庫的特點(diǎn)(6)理
32、論基礎(chǔ)好,數(shù)據(jù)庫的研究更加科學(xué)化,尤其是關(guān)系操作的完備性,規(guī)范化及查詢優(yōu)化等方法,為數(shù)據(jù)庫技術(shù)的成熟奠定了很好的基礎(chǔ)。(7)易于向推理系統(tǒng)和知識(shí)庫系統(tǒng)擴(kuò)展和綜合。關(guān)系數(shù)據(jù)語言與一階謂詞邏輯間具有固有的內(nèi)在聯(lián)系,從而為以關(guān)系數(shù)據(jù)庫為基礎(chǔ)的推理系統(tǒng)和知識(shí)庫的研究提供了方便。 在關(guān)系型數(shù)據(jù)庫中,用范式(Normal Format,NF)來衡量數(shù)據(jù)庫規(guī)范的層次,要想設(shè)計(jì)一個(gè)好的關(guān)系,必須使關(guān)系滿足一定的約束條件。此約束已形成了范式,分成幾個(gè)等級(jí),一級(jí)比一級(jí)要求嚴(yán)格。根據(jù)關(guān)系模式滿足的不同性質(zhì)和規(guī)范化的程度,把關(guān)系模式分為1NF、 2NF 、3NF、 BCNF、 4NF、5NF 。 一個(gè)較低范式的關(guān)系,
33、可以通過關(guān)系的無損分解轉(zhuǎn)換為若干個(gè)較高級(jí)的范式關(guān)系的集合,這一過程稱為關(guān)系的規(guī)范化。第三節(jié) 關(guān)系規(guī)范化1、1NF定義:如果關(guān)系R的所有屬性都是不可再分的數(shù)據(jù)項(xiàng),則稱該關(guān)系屬于第一范式,記為:R1NF。1NF的關(guān)系是從關(guān)系的基本性質(zhì)而來的,任何關(guān)系必須遵守。第三節(jié) 關(guān)系規(guī)范化表1.關(guān)系W的樣值示意日期 工號(hào) 姓名 工種 定額 超額 車間 車間 主任905 101 李一 車工 80 22% 金工 李明 905 102 張二 車工 80 17% 金工 李明 905 103 王三 鉗工 75 14% 工具 趙杰 905 104 李四 銑工 70 20% 金工 李明 906101 李一 車工 80 19
34、% 金工 李明 906102 張二 車工 80 25% 金工 李明 906103 王三 鉗工 75 16% 工具 趙杰 906104 李四 銑工 70 26% 金工 李明 W(日期, 工號(hào), 姓名, 工種, 定額,超額, 車間, 車間主任) 從表1中,不難發(fā)現(xiàn)其中存在以下毛?。簲?shù)據(jù)冗余大修改麻煩 插入異常 刪除異常 W(日期, 工號(hào), 姓名, 工種, 定額,超額, 車間, 車間主任)第三節(jié) 關(guān)系規(guī)范化原因:w關(guān)系不夠規(guī)范,即對(duì)w的限制太少,造成其中存放的信息太雜亂。W關(guān)系中屬性間存在著完全依賴、部分依賴、傳遞依賴三種不同的依賴情況。2、2NF定義:如果關(guān)系R1NF,且它的每一非主屬性都完全依賴于主鍵,則稱R屬于第二范式,記為:R2NF。 第三節(jié) 關(guān)系規(guī)范化W(日期, 工號(hào), 姓名, 工種, 定額,超額, 車間, 車間主任)W1+W2W分解其中:w1(日期, 工號(hào), 超額) w2(工號(hào), 姓名, 工種, 定額, 車間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版數(shù)學(xué)八年級(jí)上冊(cè)《實(shí)驗(yàn)與探究三角形中邊與角之間的不等關(guān)系》聽評(píng)課記錄
- 魯教版歷史六年級(jí)上冊(cè)第5課《夏、商、西周的興亡》聽課評(píng)課記錄
- 魯人版道德與法治九年級(jí)下冊(cè)13.1《綠水青山就是金山銀山》聽課評(píng)課記錄1
- 部審人教版八年級(jí)數(shù)學(xué)下冊(cè)聽評(píng)課記錄18.2.1 第1課時(shí)《矩形的性質(zhì)》
- 七年級(jí)上冊(cè)道德與法治第十課綻放生命之花聽課評(píng)課記錄(2課時(shí))
- 星球版地理八年級(jí)下冊(cè)《第二節(jié) 生態(tài)環(huán)境保護(hù)與資源開發(fā)》聽課評(píng)課記錄1
- 人教版歷史八年級(jí)上冊(cè)第22課《抗日戰(zhàn)爭的勝利》聽課評(píng)課記錄
- 小學(xué)五年級(jí)聽評(píng)課記錄
- 魯教版數(shù)學(xué)七年級(jí)上冊(cè)1.1《認(rèn)識(shí)三角形》聽評(píng)課記錄5
- 蘇科版數(shù)學(xué)七年級(jí)下冊(cè)聽評(píng)課記錄7.3圖形的平移1
- 四年級(jí)計(jì)算題大全(列豎式計(jì)算,可打印)
- 科技計(jì)劃項(xiàng)目申報(bào)培訓(xùn)
- 591食堂不合格食品處置制度
- 產(chǎn)業(yè)鏈鏈長分工表
- 國際金融課件(完整版)
- 導(dǎo)向標(biāo)識(shí)系統(tǒng)設(shè)計(jì)(一)課件
- 220t鍋爐課程設(shè)計(jì) 李學(xué)玉
- 全英文劇本 《劇院魅影》
- 北京城的中軸線PPT通用課件
- 黑布林繪本 Dad-for-Sale 出售爸爸課件
- 京東方頂崗實(shí)習(xí)報(bào)告1
評(píng)論
0/150
提交評(píng)論