版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、-第 6 章數(shù)據(jù)庫設計與實施 數(shù)據(jù)庫設計與實施 6.1 數(shù)據(jù)庫設計概述 6.2 數(shù)據(jù)庫規(guī)劃 6.3 需求分析 6.4 概念結構設計 6.5 邏輯結構設計 6.6 物理結構設計 6.7 數(shù)據(jù)庫的實施和維護 6.1 數(shù)據(jù)庫設計概述 6.1.1 數(shù)據(jù)庫設計概念 6.1.2 數(shù)據(jù)庫設計步驟 6.1.3 數(shù)據(jù)庫設計的特點 返回6.1.1 數(shù)據(jù)庫設計概念(1)1、理解數(shù)據(jù)庫設計的三個角度 通俗地角度:數(shù)據(jù)庫設計就是根據(jù)用戶需求和選擇的數(shù)據(jù)庫管理系統(tǒng)對一個單位或部門的數(shù)據(jù)進行重新組織和構造的過程。 數(shù)據(jù)庫應用開發(fā)人員的角度:數(shù)據(jù)庫設計就是對一個給定的實際應用環(huán)境,如何利用數(shù)據(jù)庫管理系統(tǒng)、系統(tǒng)軟件和相關的硬件
2、系統(tǒng),將用戶的需求轉化成有效的數(shù)據(jù)庫模式,并使該數(shù)據(jù)庫模式易于適應用戶新的數(shù)據(jù)需求的過程。 數(shù)據(jù)庫設計概念(2) 數(shù)據(jù)庫理論的抽象角度:數(shù)據(jù)庫設計就是根據(jù)用戶需求和特定數(shù)據(jù)庫管理系統(tǒng)的具體特點,將現(xiàn)實世界的數(shù)據(jù)特征抽象為概念數(shù)據(jù)模型表示,構造出最優(yōu)的數(shù)據(jù)庫模式,使之既能正確反映現(xiàn)實世界的信息及其聯(lián)系,又能滿足用戶各種應用需求(信息要求和處理要求)的過程。數(shù)據(jù)庫設計概念(3)2、數(shù)據(jù)庫實施:把數(shù)據(jù)按照數(shù)據(jù)庫設計中規(guī)定的數(shù)據(jù)組織形式將數(shù)據(jù)裝入數(shù)據(jù)庫的過程。3、數(shù)據(jù)庫設計人員應該具備的技術和知識 數(shù)據(jù)庫的基本知識和數(shù)據(jù)庫設計技術; 計算機科學的基礎知識和程序設計的方法和技巧; 軟件工程的原理和方法;
3、 應用領域的知識。返回6.1.2 數(shù)據(jù)庫設計步驟(1)1、數(shù)據(jù)庫系統(tǒng)的生存期:數(shù)據(jù)庫應用系統(tǒng)從開始規(guī)劃、分析、設計、實施、投入運行后的維護直到被新的系統(tǒng)取代而停止使用的整個期間,它通常將包含4個時期(或7個階段),即規(guī)劃時期、設計時期(需求分析、概念設計、邏輯設計、物理設計)、實施時期和運行維護時期。 數(shù)據(jù)庫設計步驟(2)2.數(shù)據(jù)庫系統(tǒng)的生存期內(nèi)各階段的主要任務如下: 1、數(shù)據(jù)庫規(guī)劃時期 2、數(shù)據(jù)庫設計時期 3、數(shù)據(jù)庫實施時期 4、數(shù)據(jù)庫運行與維護時期 返回數(shù)據(jù)庫規(guī)劃時期數(shù)據(jù)庫規(guī)劃時期:進行建立數(shù)據(jù)庫的必要性和可行性分析。通過評審的可行性分析報告是這個時期的結束標記。 返回數(shù)據(jù)庫設計時期這個時
4、期一般分為如下的4個階段: 需求分析階段 概念結構設計階段 邏輯結構設計階段 物理結構設計階段 返回需求分析階段(1)需求分析階段:利用數(shù)據(jù)庫設計理論和方法,對現(xiàn)實世界的對象(組織、部門、企業(yè)等),即用戶的現(xiàn)行系統(tǒng)進行詳細調(diào)查,收集支持系統(tǒng)目標的基礎數(shù)據(jù)及其處理需求,其主要需求有: 信息需求,即數(shù)據(jù)庫中應該存儲哪些數(shù)據(jù)。 處理需求,即對數(shù)據(jù)庫的動態(tài)性能需求,如響應時間,處理方式等。 安全性和完整性方面的需求 返回概念結構設計階段概念結構設計階段:在需求分析的基礎上,通過對用戶需求進行分析、歸納、抽象,形成一個獨立于具體dbms和計算機硬件結構的整體概念結構,即概念模式。 返回邏輯結構設計階段邏
5、輯結構設計階段:在概念結構設計的基礎上,在一定的原則指導下將概念模式(e-r圖)轉換為某個具體dbms支持的數(shù)據(jù)模型相符合的、經(jīng)過優(yōu)化的邏輯結構。 返回 物理結構設計階段物理結構設計階段:為邏輯數(shù)據(jù)結構選取一個最適合應用環(huán)境的物理結構,包括存儲結構和存取方法等。 返回數(shù)據(jù)庫實施時期數(shù)據(jù)庫實施時期:用dbms提供的數(shù)據(jù)定義語言(ddl)和其它實用程序將數(shù)據(jù)庫邏輯結構設計和物理設結構計結果用ddl嚴格描述出來,成為dbms可以接受的源代碼,再經(jīng)過調(diào)試產(chǎn)生目標模式,最后將數(shù)據(jù)裝入數(shù)據(jù)庫。返回數(shù)據(jù)庫運行與維護時期數(shù)據(jù)庫運行與維護時期:收集和登記數(shù)據(jù)庫運行的情況記錄,用于評價并改善數(shù)據(jù)庫系統(tǒng)的性能。 返
6、回6.1.3 數(shù)據(jù)庫設計的特點(1)具有如下特點: 1、反復性 (iterative); 2、試探性 (tentative) ; 3、多步性 (multistage) ; 4、面向數(shù)據(jù) (data-oriented) 。返回反復性反復性(iterative):數(shù)據(jù)庫設計需要反復修改,逐步完善。因為前階段的設計是后階段設計的起點和基礎,而后階段設計也會向前階段反饋,提出新的要求。 返回試探性試探性(tentative):由于設計過程中面臨各種各樣的要求和制約因素,且這些因素之間往往是矛盾的,導致數(shù)據(jù)庫設計過程的試探性和設計結果的不唯一性。 返回多步性 多步性(multistage):數(shù)據(jù)庫的設計
7、常常由不同的人員分階段進行,其目的是進行技術分工和分段把關,逐級審查,以保證設計的質(zhì)量和進度。返回面向數(shù)據(jù)面向數(shù)據(jù)(data-oriented):在數(shù)據(jù)庫設計中實施以信息需求為主,兼顧處理需求的設計策略。 說明:計算機應用系統(tǒng)設計的有兩種方法 信息需求為主,兼顧處理需求的方法稱為面向數(shù)據(jù)的方法(data-oriented approach) 以處理需求為主,兼顧信息需求的設計方法稱為面向過程的方法(process-oriented approach)。返回6.2 數(shù)據(jù)庫規(guī)劃1、數(shù)據(jù)庫規(guī)劃工作的重要性:直接關系到整個數(shù)據(jù)庫系統(tǒng)的成敗,對一個企業(yè)或部門的信息化建設進程都將產(chǎn)生深遠的影響。2、數(shù)據(jù)庫
8、規(guī)劃時期的主要工作:確定數(shù)據(jù)庫系統(tǒng)在企業(yè)或部門的計算機系統(tǒng)中的地位以及各個數(shù)據(jù)庫之間的聯(lián)系;分析企業(yè)的基本業(yè)務功能,確定數(shù)據(jù)庫支持的業(yè)務范圍;回答是建立一個綜合的數(shù)據(jù)庫,還是建立若干個專門的數(shù)據(jù)庫等問題,并對建立數(shù)據(jù)庫的必要性和可行性進行分析。返回6.3 需求分析 6.3.1 需求分析的任務 6.3.2 需求分析的步驟 6.3.3 數(shù)據(jù)字典 返回6.3.1 需求分析的任務通過詳細調(diào)查用戶的現(xiàn)行系統(tǒng)(手工系統(tǒng)或計算機系統(tǒng))的工作情況,深入了解其數(shù)據(jù)的性質(zhì)和數(shù)據(jù)的使用情況,數(shù)據(jù)的處理流程、流向、流量等,并仔細地分析用戶在數(shù)據(jù)格式、數(shù)據(jù)處理、數(shù)據(jù)庫安全性、可靠性以及數(shù)據(jù)的完整性方面的需求,按一定規(guī)范
9、要求寫出設計者和用戶都能理解的文檔需求分析說明書。返回6.3.2 需求分析的步驟需求分析的任務可分解為以下三個步驟:1 需求調(diào)查2 分析整理3 撰寫需求分析說明書4 評審返回1.需求調(diào)查 需求調(diào)查的目的 需求調(diào)查的內(nèi)容 需求調(diào)查的方式 需求調(diào)查的策略 返回需求調(diào)查的目的需求調(diào)查的目的:獲得各個組織機構的業(yè)務數(shù)據(jù)及其相互聯(lián)系的信息,為分析整理工作做好前期基礎工作。返回需求調(diào)查的內(nèi)容 組織機構情況:各個組織機構的組成,各部門的職責,各部門管理工作存在的問題,各部門中哪些業(yè)務適合計算機管理,哪些業(yè)務不適合計算機管理。 業(yè)務活動現(xiàn)狀:各部門輸入和使用的數(shù)據(jù),加工處理這些數(shù)據(jù)的方法,處理結果的輸出去向,
10、輸入/輸出數(shù)據(jù)的格式,以及數(shù)據(jù)庫中需要存儲的數(shù)據(jù)。 外部要求:調(diào)查數(shù)據(jù)處理的響應時間、頻度和發(fā)生的規(guī)則,以及經(jīng)濟性、安全性及完整性要求。 未來規(guī)劃中對數(shù)據(jù)的應用需求等。返回需求調(diào)查方式 個別交談:仔細了解該用戶業(yè)務范圍的用戶需求,特點是調(diào)查時不受其它人員的影響。 開座談會:獲得不同業(yè)務之間的聯(lián)系信息,特點是與會人員能互相啟發(fā)。 發(fā)調(diào)查表:獲得設計人員關心的用戶需求問題。特點是調(diào)查目的準確,但效果依賴于調(diào)查表設計的質(zhì)量。 跟班作業(yè):獲得業(yè)務活動情況和用戶需求。特點是用戶需求準確但比較費時。 查閱記錄:獲得具體的業(yè)務細節(jié)。返回需求調(diào)查的策略 對高層負責人:對高層負責人:個別交談方式??色@得有關企業(yè)
11、高層管理活動和決策過程的信息需求以及企業(yè)的運行政策、未來發(fā)展變化趨勢等與戰(zhàn)略規(guī)劃有關的信息。 對中層管理人員對中層管理人員:開座談會、個別交談或發(fā)調(diào)查表、查閱記錄的調(diào)查方式??色@得企業(yè)的具體業(yè)務控制方式和約束條件,不同業(yè)務之間的接口,日??刂乒芾淼男畔⑿枨蟛㈩A測未來發(fā)展的潛在信息需求。 對基層業(yè)務人員對基層業(yè)務人員:發(fā)調(diào)查表、個別交談、跟班作業(yè)或召開小型座談會的調(diào)查方式??色@得每項具體業(yè)務的輸入輸出數(shù)據(jù)和工作過程、數(shù)據(jù)處理要求和約束條件等。返回2.分析整理分析整理的工作主要有: 1、業(yè)務流程分析與表示 2、需求信息的補充描述 返回業(yè)務流程分析與表示業(yè)務流程分析與表示。通過業(yè)務流程分析,獲得業(yè)務
12、流程及業(yè)務與數(shù)據(jù)聯(lián)系的形式描述。一般采用數(shù)據(jù)流分析法,分析結果以數(shù)據(jù)流圖(data flow diagram, dfd圖)表示。dfd圖描述了數(shù)據(jù)與處理關系及其數(shù)據(jù)流動的方向。返回需求信息的補充描述需求信息的補充描述。除了用dfd圖描述用戶需求外,還需要用一些規(guī)范化表格對其細節(jié)信息進行補充描述。這些細節(jié)補充信息主要有: 數(shù)據(jù)字典:詳細內(nèi)容在6.3.3節(jié)介紹。 業(yè)務活動清單:列出每一部門中最基本的工作任務,包括任務的定義、操作類型、執(zhí)行頻度、所屬部門涉及的數(shù)據(jù)項以及數(shù)據(jù)處理響應時間要求。 其它需求清單:如完整性、一致性要求,安全性要求以及預期變化的影響需求等。返回3.撰寫需求分析說明書撰寫需求分
13、析說明書:在需求調(diào)查的分析整理基礎上,依據(jù)一定的規(guī)范(國家標準或企業(yè)標準)編寫出需求分析說明書。 返回4.評審 評審的目的:確認需求階段的任務是否完成,以保證設計的質(zhì)量,避免重大的疏漏或者錯誤。 評審人員構成:項目組成員,非項目組的專家和主管部門負責人。 評審結果的作用:通過評審的需求分析說明書是需求分析階段的結束標志,也是下一個設計階段的輸入,并作為項目驗收和鑒定的依據(jù)之一。返回6.3.3 數(shù)據(jù)字典1. 數(shù)據(jù)字典的內(nèi)容 2 . 數(shù)據(jù)字典的實現(xiàn) 返回1.數(shù)據(jù)字典的內(nèi)容 (1) 數(shù)據(jù)字典:對數(shù)據(jù)庫(dfd圖)中數(shù)據(jù)性質(zhì)的描述,即元數(shù)據(jù),而不是數(shù)據(jù)本身。它是對數(shù)據(jù)流程圖上各個元素作出詳細的定義和說
14、明。 數(shù)據(jù)字典包括的內(nèi)容:數(shù)據(jù)項、數(shù)據(jù)結構、數(shù)據(jù)流、數(shù)據(jù)存儲和處理過程 返回數(shù)據(jù)項數(shù)據(jù)項:數(shù)據(jù)的基本單元,即最小單位。數(shù)據(jù)項的描述方法和內(nèi)容是: 數(shù)據(jù)項描述=數(shù)據(jù)項名,數(shù)據(jù)項含義說明,別名,數(shù)據(jù)類型,長度,取值范圍,取值含義,與其他數(shù)據(jù)項的邏輯關系。其中: 別名,也稱數(shù)據(jù)項別名,是數(shù)據(jù)項名稱的其它等價名字。 出現(xiàn)別名的主要原因有:對于同樣的數(shù)據(jù),不同的用戶使用不同的名字。同一個設計人員在不同時期對同一個數(shù)據(jù)使用了不同的名字。兩個設計人員在設計中對同一數(shù)據(jù)項使用了不同的名字。 取值范圍:規(guī)定了數(shù)據(jù)項的取值區(qū)間或其值所在的集合。 與其它數(shù)據(jù)項的邏輯關系:數(shù)據(jù)完整性約束條件。返回數(shù)據(jù)結構 數(shù)據(jù)結構:
15、若干數(shù)據(jù)項組成的有意義的集合,反映了數(shù)據(jù)之間的組合關系。 數(shù)據(jù)結構的描述方法和內(nèi)容是: 數(shù)據(jù)結構描述=數(shù)據(jù)結構名,含義說明,組成:數(shù)據(jù)項名列表返回數(shù)據(jù)流 數(shù)據(jù)流:某一處理輸入(輸出)的數(shù)據(jù)項或者數(shù)據(jù)結構。數(shù)據(jù)流的描述方法和內(nèi)容是:數(shù)據(jù)流描述=數(shù)據(jù)流名,說明,數(shù)據(jù)流來源,數(shù)據(jù)流去向,組成:數(shù)據(jù)結構,平均流量,高峰期流量其中: 數(shù)據(jù)流來源說明該數(shù)據(jù)流來自哪個處理過程。 數(shù)據(jù)流去向說明該數(shù)據(jù)流將傳送給哪個處理過程。 平均流量是指單位時間(每天、每周、每月等)的傳輸次數(shù)。 峰期流量則是指在高峰時期的數(shù)據(jù)傳輸次數(shù)。返回數(shù)據(jù)存儲數(shù)據(jù)存儲:處理過程中需要保存的數(shù)據(jù)集合,是數(shù)據(jù)流的來源和去向之一。它可以是手工
16、憑證、手工文檔,也可以是計算機文件等。數(shù)據(jù)存儲的描述方法和內(nèi)容是:數(shù)據(jù)存儲描述=數(shù)據(jù)存儲名,說明,編號,輸入的數(shù)據(jù)流,輸出的數(shù)據(jù)流,組成:數(shù)據(jù)結構,數(shù)據(jù)量,存取方式.其中: 數(shù)據(jù)量是指每次存取多少數(shù)據(jù),每天(或每小時、每周等)存取幾次等。 存取方法包括批處理或者聯(lián)機處理,檢索或者更新,順序檢索或者隨機檢索等。 輸入的數(shù)據(jù)流用于指明其來源,輸出的數(shù)據(jù)流用于指出其去向。 返回處理過程處理過程:處理過程也稱加工過程,這里指數(shù)據(jù)庫應用程序模塊。其具體處理邏輯一般用判定表或判定樹來描述,也可用程序流程圖或盒圖(n-s)來描述,但在數(shù)據(jù)字典中只描述處理過程的說明性信息,其描述方法和內(nèi)容是:處理過程描述=處
17、理過程名,說明,輸入:數(shù)據(jù)流,輸出:數(shù)據(jù)流,處理:簡要說明其中:簡要說明用于說明該處理過程的功能及處理要求,即該處理過程用來做什么(而不是怎樣做)和處理要求。處理要求是物理設計的輸入及性能評價的標準。返回2.數(shù)據(jù)字典的實現(xiàn) 實現(xiàn)數(shù)據(jù)字典的三種途徑:全人工過程,全自動化過程(利用數(shù)據(jù)字典處理程序)和混合過程(用正文編輯程序,報告生成程序等實用程序幫助人工過程)。 實現(xiàn)的數(shù)據(jù)字典應具有的特點: 通過名字能方便地查詢數(shù)據(jù)的定義。 沒有數(shù)據(jù)冗余。 容易更新和更改。 定義的書寫方式簡單方便,而且嚴格。返回6.4 概念結構設計概念結構設計:把需求分析階段得到用戶需求(已用數(shù)據(jù)字典和數(shù)據(jù)流圖表示)抽象為概念
18、模型表示的過程。數(shù)據(jù)庫概念結構設計中常用e-r模型來描述概念結構.6.4.1 基本方法6.4.2 主要設計步驟返回6.4.1 基本方法 1、將用戶需求抽象為e-r模式的基本方法:(1)集中式設計法;(2)分散-集成設計法 ;2、e-r模式設計的策略 返回集中式設計法集中式設計法:根據(jù)用戶需求由一個統(tǒng)一的機構或人員一次設計出數(shù)據(jù)庫的全局e-r模式,其特點是設計簡單方便,容易保證e-r模式的統(tǒng)一性與一致性,但它僅適用于小型或并不復雜的數(shù)據(jù)庫設計問題,而對大型的或語義關聯(lián)復雜的數(shù)據(jù)庫設計并不適用。返回分散-集成設計法分散-集成設計法:設計過程分解成兩步,首先將一個企業(yè)或部門的用戶需求,根據(jù)某種原則將
19、其分解成若干個部分,并對每個部分設計局部e-r模式,然后將各個局部e-r模式進行集成,并消除集成過程中可能會出現(xiàn)的沖突,最終形成一個全局e-r模式。其特點是設計過程比較復雜,但能較好的反映用戶需求,對于大型和復雜的數(shù)據(jù)庫設計問題比較有效。返回e-r模式設計的策略 自上而下:自上而下:先定義全局e-r模式框架,然后逐步進行細化,即先從抽象級別高且普遍性強的實體集開始設計,然后逐步進行細化、具體化與特殊化處理。 自下而上:自下而上:先從具體的實體開始,然后逐步進行抽象化,普遍化與一般化,最后形成一個較高層次的抽象實體集,其設計過程與自上而下策略的過程相反。 由內(nèi)向外由內(nèi)向外:也稱為逐步擴張策略,即
20、先從最基本與最明顯的實體集著手逐步擴展至非基本、不明顯的其它實體集。 混合策略:混合策略:將上面三種策略同時應用于e-r模式設計過程之中。 返回6.4.2 主要設計步驟 e-r模式設計一般分為三步:設計局部e-r模式;將局部e-r模式集成為全局e-r模式;對全局e-r模式進行優(yōu)化得到基于e-r模型的數(shù)據(jù)庫概念結構。1. 設計局部e-r模式 2. 合并局部e-r模式 3. 優(yōu)化全局e-r模式返回1.設計局部e-r模式 局部e-r模式的設計一般又可分解為以下步驟: 1、確定局部e-r模式的范圍 2、定義實體型 3、定義聯(lián)系返回確定局部e-r模式的范圍確定局部e-r模式的范圍:將用戶需求劃分成若干個
21、部分,其劃分方法有: 根據(jù)企業(yè)的組織機構對其進行自然劃分,并為它們分別設計局部e-r模式。 根據(jù)數(shù)據(jù)庫提供的服務種類進行劃分,使得每一種服務所使用的數(shù)據(jù)明顯地不同于其它種類,并為每一類服務設計一個局部e-r模式。返回定義實體型定義實體型:每一個局部e-r模式都包括一些實體型,即從選定的局部范圍中的用戶需求出發(fā),確定每一個實體型的屬性及其屬性名和主鍵。 區(qū)分實體與屬性的一些原則 給實體集與屬性命名:其原則是清晰明了便于記憶,并盡可能采用用戶熟悉的名字,減少沖突,方便使用。 確定實體標識:即確定實體集的主鍵。在列出實體集的所有候選鍵的基礎上,選擇一個作為主鍵。 非空值原則:保證主鍵中的屬性不出現(xiàn)空
22、值。返回區(qū)分實體與屬性的原則 信息描述原則:一般地說,實體需要進一步用某些屬性進行描述,而屬性則不需要。 依賴性原則:一般地講,屬性僅單向依賴于某個實體,且這種依賴是包含性依賴,如學生實體中的學號、學生姓名等均單向依賴于學生。 一致性原則:一個實體由若干個屬性組成,這些屬性間有內(nèi)在的關聯(lián)性與一致性,如學生實體有學號、學生姓名、年齡、專業(yè)等屬性,它們分別獨立表示實體的某個特性,并在總體上協(xié)調(diào)一致,互相配合,構成了一個統(tǒng)一的整體。返回定義聯(lián)系定義聯(lián)系:即判斷實體集之間是否存在聯(lián)系,并定義實體集之間聯(lián)系的類型。 實體集之間的聯(lián)系方式: 定義聯(lián)系的方法: 為實體集之間的聯(lián)系命名:聯(lián)系的命名應反映聯(lián)系的
23、語義性質(zhì),通常采用某個動詞命名,如“選修”、“講授”、“使用”等。 確定每個聯(lián)系存在屬性,并為其命名。返回實體集之間的聯(lián)系方式存在性聯(lián)系。如學校有教師、教師有學生等。功能性聯(lián)系。如教師授課,教師參與管理學生等。事件聯(lián)系。如學生借書,學生打網(wǎng)球等。返回定義聯(lián)系的方法利用上面介紹的三種聯(lián)系方式去檢查e-r模式中兩個實體集之間是否存在聯(lián)系,并確定這些聯(lián)系的類型(1:1、1:n或n:m)。此外,還要考慮實體集內(nèi)部是否存在聯(lián)系,多個實體集之間是否存在聯(lián)系,并盡量消去冗余的聯(lián)系。 返回2.合并局部e-r模式 合并局部e-r模式為全局e-r模式的過程可分成三步: (1)確定公共實體型 (2)合并局部e-r模
24、式 (3)消除沖突:消除合并過程中局部e-r模式之間出現(xiàn)的不一致描述,即沖突。 (3)消除沖突的方法. 返回確定公共實體型確定多個局部e-r模式之間的公共實體型。一般根據(jù)實體型名稱和主鍵來認定公共實體型,即把同名實體型作為一個候選的公共實體型,把具有相同主鍵的實體型作為另一個候選的公共實體型。返回合并局部e-r模式首先將兩個具有公共實體型的局部e-r模式進行合并,然后每次將一個新的、與前面已合并模式具有公共實體型的局部e-r模式合并起來,最后再加入獨立的局部e-r模式,這樣即可終獲得全局e-r模式。返回沖突類型兩個局部e-r模式之間可能出現(xiàn)的沖突類型: 屬性沖突,主要指屬性值的類型、取值范圍,
25、或者計量單位的沖突。 命名沖突,主要指同名異義和異名同義兩種沖突,包括屬性名,實體型名,聯(lián)系名之間的沖突。同名異義,即不同意義的對象具有相同的名字;異名同義,即同一意義的對象具有不同的名字。 結構沖突 . 返回結構沖突 主要有表現(xiàn)為 同一對象在不同的局部e-r模式中的抽象不一致,比如職工,在某個局部e-r模式中抽象為實體,而在另一局部e-r模式中則抽象為屬性; 同一實體在不同的局部e-r模式中其屬性組成不同,包括屬性個數(shù)、次序等; 實體集之間的聯(lián)系在不同的局部e-r模式中呈現(xiàn)不同的類型,如實體集a與b在某一局部e-r模式中是多對多聯(lián)系,而在另一局部e-r模式中又是一對多聯(lián)系; 在某一局部e-r
26、模式中a與b發(fā)生聯(lián)系,而在另一局部e-r模式中a、b、c三者之間有聯(lián)系。返回消除沖突的方法消除沖突的方法 屬性沖突和命名沖突一般通過設計人員之間的討論,協(xié)商等方法即可得到解決,而結構沖突則需要全體設計人員和用戶經(jīng)過仔細分析,認真討論,確定一個能夠反映用戶需求、全體用戶共同理解和接受的統(tǒng)一結構之后才能解決。 返回3.優(yōu)化全局e-r模式 全局e-r模式的質(zhì)量標準:能全面、準確地反映用戶需求,且具有實體型的個數(shù)盡可能少;實體型所含屬性個數(shù)盡可能少;實體型之間聯(lián)系無冗余等特性。 優(yōu)化全局e-r模式的幾個方法 實體型的合并:將兩個有聯(lián)系的實體型的合并為一個實體型。 冗余屬性的消除:消除合并為全局e-r模
27、式后產(chǎn)生的冗余屬性。 冗余聯(lián)系的消除:消除全局模式中存在的冗余聯(lián)系。 優(yōu)化全局e-r模式的原則:在存儲空間、訪問效率和維護代價之間進行權衡,對實體型進行恰當?shù)暮喜?,適當消去部分冗余屬性和冗余聯(lián)系。返回6.5 邏輯結構設計數(shù)據(jù)庫邏輯結構設計:將全局e-r模式轉化成具體dbms能夠支持的數(shù)據(jù)庫模式。 6.5.1 e-r模式到關系模式的轉換 6.5.2 關系模式的優(yōu)化 返回6.5.1 e-r模式到關系模式的轉換 1、實體型的轉換:對于e-r模式中的每個實體型,設計一個關系模式與之對應,使該關系模式包含實體型的所有屬性,用下劃線來表示關系模式的主鍵和外鍵所包含的屬性。2、聯(lián)系的轉換返回聯(lián)系的轉換 1:
28、1聯(lián)系的轉換:先將兩個實體型分別轉換為關系模式,再將聯(lián)系的屬性和其中一個實體型對應關系模式的主鍵屬性加入到另一個關系模式中。 1:n聯(lián)系的轉換:先將兩個實體型分別轉換為關系模式,再將聯(lián)系的屬性和1端對應關系模式的主鍵屬性加入到n端對應的關系模式中。 對m:n聯(lián)系的轉換:先將兩個實體型分別轉換為關系模式,再將聯(lián)系轉換為一個關系型,其屬性由聯(lián)系的屬性和前面兩個關系模式的主鍵屬性構成。返回6.5.2關系模式的優(yōu)化1. 規(guī)范化處理2. 模式的評價與修正返回1.規(guī)范化處理 規(guī)范化處理的目的:減少乃至消除關系模式中存在的各種異常,保證其完整性和一致性,提高存儲效率。 規(guī)范化處理的步驟: 確定規(guī)范級別:考察
29、關系模式的數(shù)據(jù)依賴集合,如果僅為函數(shù)依賴,則3nf或bcnf是適當?shù)臉藴?。如果?shù)據(jù)依賴集合還包括多值依賴,則可將4nf作為其規(guī)范化級別。 實施規(guī)范化分解:在確定關系模式需要的規(guī)范級別之后,將關系模式分解為相應級別的范式,并保持函數(shù)依賴和無損聯(lián)接性要求。返回2.模式的評價與修正 模式評價目的:檢查所得到的數(shù)據(jù)庫模式是否完全滿足用戶的功能要求,是否具有較高的效率,并確定哪些是需要加以修正的。 模式評價主要包括的內(nèi)容 模式修正:根據(jù)模式評價的結果,對已生成的模式集合進行修正。 返回模式評價主要包括的內(nèi)容 功能評價:根據(jù)需求分析的結果,檢查規(guī)范化后的關系模式集合是否支持用戶的所有應用要求。對于涉及多個
30、關系模式的應用需求,還應評價它們是否具有無損聯(lián)接性。 性能評價:一般利用邏輯記錄訪問估算方法對連接運算、存儲空間等性能作一些估計,并為模式的修改或后面的物理設計提出一些建議。返回模式修正 需求增加的修正:因為需求分析、概念結構設計的疏漏導致某些應用得不到支持的修正,需增加新的關系模式或屬性。 查詢效率需求的修正: 存儲空間限制的修正:為了節(jié)省存儲空間而要求修正關系模式,可按以下方法處理。返回查詢效率需求的修正 減少連接運算:減少連接運算:對于一些常用的、性能要求較高的、涉及多個關系的連接查詢,可對這些關系模式按連接查詢使用的頻率進行合并,以減少聯(lián)接操作,提高查詢效率。 減小關系的大小和數(shù)據(jù)量:
31、減小關系的大小和數(shù)據(jù)量:為了提高查詢的速度,可把一個關系分成若干個小的關系。 使用快照技術:使用快照技術:對有些只需要某一歷史時段數(shù)據(jù)的應用(如統(tǒng)計報表)定義一個快照,并定期自動刷新。返回存儲空間限制的修正 節(jié)省每個屬性所占的空間:在定義屬性時,不僅要求自然和易于理解,也要考慮節(jié)省存儲空間。 減少重復數(shù)據(jù)所占存儲空間:滿足規(guī)范化要求的關系模式仍然可能由于某些屬性值的重復而占用過多的存儲空間。通過構造一個代碼轉換的關系模式,可以減少存儲空間的占用。返回6.6物理結構設計目前流行的商品化關系數(shù)據(jù)庫管理系統(tǒng)(rdbms)中,數(shù)據(jù)庫的大量內(nèi)部物理結構都由rdbms自動完成,留給用戶參與的物理結構設計內(nèi)
32、容主要有如下幾種:6.6.1 聚簇設計:確定每個關系是否需要建立聚簇,若需要,應在什么屬性列上建立。6.6.2 索引設計:確定每個關系是否需要建立索引,若需要,應在什么屬性列上建立。6.6.3 分區(qū)設計:確定數(shù)據(jù)庫數(shù)據(jù)存放在哪些磁盤上,數(shù)據(jù)如何分配。 6.6.4 確定系統(tǒng)配置參數(shù):根據(jù)dbms產(chǎn)品提供了一些存儲分配參數(shù),數(shù)據(jù)庫進行物理優(yōu)化。6.6.5 評價物理結構:估算各種方案的存儲空間、存取時間和維護代價,對估算結果進行權衡、比較,選擇出一個較優(yōu)的合理的物理結構。返回6.6.1 聚簇設計1、聚簇(cluster):將有關的數(shù)據(jù)元組按聚簇屬性順序集中存放于一個物理塊內(nèi)或若干相鄰物理塊內(nèi)或同一柱
33、面內(nèi),以提高查詢效率的數(shù)據(jù)存儲結構。2、聚簇設計:根據(jù)用戶需求確定每個關系是否需要建立聚簇,如果需要,則應確定在該關系的哪些屬性列上建立聚簇。3、建立聚簇的特定情況返回建立聚簇的特定情況 當對一個關系的某些屬性列的訪問是該關系的主要應用,而對其它屬性的訪問很少或是次要應用時,可以考慮對該關系在這些屬性列上建立聚簇。 如果一個關系在某些屬性列上的值重復率很高,則可以考慮對該關系在這些組屬性列上建立聚簇。 如果一個關系一旦裝入數(shù)據(jù),某些屬性列的值很少修改,也很少增加或刪除元組,則可以考慮對該關系在這些組屬性列上建立聚簇。 返回 6.6.2 索引設計1、索引(index)設計的目的:提高數(shù)據(jù)庫訪問效
34、率。2、建立索引的幾種情況返回建立索引的幾種情況 在主鍵屬性列和外鍵屬性列上通常都可分別建立索引,不僅有助于唯一性檢查和完整性檢查,而且可以加快連接查詢的速度。 以查詢?yōu)橹鞯年P系可建立盡可能多的索引。 對等值連接,但滿足條件的元組較少的查詢可考慮建立索引。 如果查詢可以從索引直接得到結果而不必訪問關系,則對此種查詢可建立索引。比如,為查詢某各屬性的min、max、avg、sum、count等函數(shù)值,可在該屬性列上建立索引。返回6.6.3 分區(qū)設計1、分區(qū)設計:數(shù)據(jù)庫中的數(shù)據(jù),包括關系、索引、聚簇、日志等在多個磁盤上存放位置的設計。其目的是提高系統(tǒng)性能。2、磁盤分區(qū)設計的一般原則 減少訪問沖突,提高i/o并行性。 分散熱點數(shù)據(jù),均衡i/o負擔。 保證關鍵數(shù)據(jù)快速訪問,緩解系統(tǒng)瓶頸。返回6.7 數(shù)據(jù)庫的實施和維護數(shù)據(jù)庫的實施:根據(jù)數(shù)據(jù)庫的邏輯結構設計和物理結構設計的結果,在具體rdbms支持的計算機系統(tǒng)上建立實際的數(shù)據(jù)庫模式、裝入數(shù)據(jù)、并進行測試和試運行的過程。6.7.1 數(shù)據(jù)庫的建立與調(diào)整6.7.2 數(shù)據(jù)庫系統(tǒng)的試運行 6.7.3 數(shù)據(jù)庫系統(tǒng)的運行和維護 返回6.7.1 數(shù)據(jù)庫的建立與調(diào)整1 數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度在建航天發(fā)射基地轉讓合同3篇
- 2024年商業(yè)綜合體建設施工合同4篇
- 2024年個體借款協(xié)議樣本6篇
- 2024年度攪拌站混凝土生產(chǎn)與質(zhì)量控制合同2篇
- 2024年度品牌授權與產(chǎn)品銷售代理協(xié)議
- 2024年度事業(yè)單位員工晉升與晉級方案合同3篇
- 2024版臨時停車場場地借用及收費合同3篇
- 2024年度香港股權轉讓過程中保密協(xié)議的范本3篇
- 2024衛(wèi)生院雙向轉診醫(yī)防融合服務合作協(xié)議3篇
- 2024年電影投資居間合作協(xié)議書范本3篇
- 計量經(jīng)濟學論文-城鎮(zhèn)單位就業(yè)人員工資總額的影響因素
- 《農(nóng)業(yè)企業(yè)經(jīng)營管理》試題及答案(U)
- 山東省聊城市2024-2025學年高一上學期11月期中物理試題
- 孫悟空課件教學課件
- 華南理工大學《自然語言處理》2023-2024學年期末試卷
- 新能源行業(yè)光伏發(fā)電與儲能技術方案
- 中國高血壓防治指南(2024年修訂版)要點解讀
- 24秋國開《西方行政學說》形考任務1答案(第2套)
- 2024巡察整改方案和整改措施
- 醫(yī)院冬季防雪防凍工作應急預案
- 2024年公共管理學考試題庫及答案
評論
0/150
提交評論