數(shù)據(jù)中心方案設(shè)計(jì)_第1頁(yè)
數(shù)據(jù)中心方案設(shè)計(jì)_第2頁(yè)
數(shù)據(jù)中心方案設(shè)計(jì)_第3頁(yè)
數(shù)據(jù)中心方案設(shè)計(jì)_第4頁(yè)
數(shù)據(jù)中心方案設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.wd數(shù)據(jù)中心方案設(shè)計(jì)Bychja、系統(tǒng)拓?fù)鋱Db、4.5.1 設(shè)計(jì)目標(biāo)建立一個(gè)集中分散、異構(gòu)、可擴(kuò)大、可集成、有統(tǒng)一數(shù)據(jù)模型、有多種角度視圖的、可交換的和安全可靠的復(fù)合數(shù)據(jù)庫(kù)系統(tǒng)。它將成為政府各種業(yè)務(wù)系統(tǒng)、政府部門(mén)之間協(xié)同工作的數(shù)據(jù)中心,是政府門(mén)戶的信息中心,多媒體、文檔資料和政策法規(guī)的存儲(chǔ)中心和預(yù)測(cè)決策所需的數(shù)據(jù)倉(cāng)庫(kù)中心。4.5.2 數(shù)據(jù)中心設(shè)計(jì)基礎(chǔ)4.5.2.1 現(xiàn)狀分析對(duì)于一個(gè)完整的電子政務(wù)系統(tǒng)來(lái)說(shuō),統(tǒng)一的框架和相應(yīng)的數(shù)據(jù)模式是十分重要的。電子政務(wù)的構(gòu)建,正經(jīng)歷著由以技術(shù)為中心向以數(shù)據(jù)為中心的方向轉(zhuǎn)變,沒(méi)有數(shù)據(jù)也就沒(méi)有信息,也就沒(méi)有政府網(wǎng)站及電子政府。數(shù)據(jù)中心在電子政務(wù)系統(tǒng)中處于中心地位

2、,具有公共數(shù)據(jù)信息庫(kù)、模型庫(kù)、文件交換站以及發(fā)布信息的政府門(mén)戶網(wǎng)站的功能,各數(shù)據(jù)源將自己的數(shù)據(jù)上傳給數(shù)據(jù)中心,而各部門(mén)根據(jù)自己的需要從數(shù)據(jù)中心獲取數(shù)據(jù),實(shí)施自己的應(yīng)用。按信息的應(yīng)用屬性,可將電子政務(wù)的數(shù)據(jù)類(lèi)型分為空間數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、政務(wù)數(shù)據(jù)、專(zhuān)題數(shù)據(jù)和多媒體語(yǔ)音數(shù)據(jù)。整合政務(wù)信息資源,建立和改造政務(wù)數(shù)據(jù)庫(kù),并建立人口、法人機(jī)構(gòu)、空間地理和自然資源、以及宏觀經(jīng)濟(jì)四個(gè)基礎(chǔ)數(shù)據(jù)庫(kù),將成為我國(guó)今后數(shù)年電子政務(wù)建立的關(guān)鍵。由于我國(guó)政府各部門(mén)對(duì)信息化建立的深遠(yuǎn)意義認(rèn)識(shí)不夠,以及政務(wù)建立有一個(gè)開(kāi)展過(guò)程,造成了政府各部門(mén)、城市各行業(yè)信息化開(kāi)展步調(diào)不一,從而使政務(wù)信息化建立存在一些問(wèn)題:、信息的共享、公開(kāi)沒(méi)有立

3、發(fā),信息采集、儲(chǔ)存標(biāo)準(zhǔn)不統(tǒng)一,造成了互聯(lián)互通不暢,共享程度低。、信息共享機(jī)制尚未建立,各職能部門(mén)內(nèi)部的信息相對(duì)封閉,產(chǎn)生了信息孤島效應(yīng),造成了信息資源的巨大浪費(fèi)。、大局部單位業(yè)務(wù)應(yīng)用系統(tǒng)還未形成一個(gè)內(nèi)部資源共享、有效運(yùn)行的整體,需要在電子政務(wù)設(shè)計(jì)建立的過(guò)場(chǎng)中進(jìn)展整合和改造。、網(wǎng)絡(luò)建立各自為政,構(gòu)造不合理,互連互通十分困難。、安全性存在隱患,人門(mén)還不放心在網(wǎng)上共享數(shù)據(jù)。基于以上問(wèn)題,需要在法律、技術(shù)、設(shè)備、管理等多方面加以考慮。政府?dāng)?shù)據(jù)資源的建立,將有助于打破各級(jí)政府和部門(mén)對(duì)信息的壟斷和封閉,能夠有效整合政務(wù)信息資源,強(qiáng)化對(duì)信息資源的不斷開(kāi)發(fā)、更新和維護(hù);從長(zhǎng)遠(yuǎn)來(lái)說(shuō),這項(xiàng)工作的開(kāi)展,將有助于推動(dòng)

4、政府信息資源對(duì)社會(huì)的開(kāi)放,使之發(fā)揮巨大的社會(huì)效益和經(jīng)濟(jì)效益。 4.5.2.2 資源分類(lèi)數(shù)據(jù)中心是電子政務(wù)數(shù)據(jù)資源建立的基礎(chǔ),它是各類(lèi)信息采集、加工和整合的平臺(tái)。數(shù)據(jù)中心資源大致可分為三大類(lèi),一是元數(shù)據(jù)庫(kù)、政務(wù)敘詞表和分類(lèi)體系與代碼表,二是GIS平臺(tái),三是服務(wù)資源。 1 元數(shù)據(jù)庫(kù)考慮到今后各職能部門(mén)的信息聯(lián)接與交換,電子政務(wù)元數(shù)據(jù)庫(kù)必需嚴(yán)格定義并向全網(wǎng)開(kāi)放,否那么將造成今后機(jī)構(gòu)間數(shù)據(jù)交換無(wú)法實(shí)現(xiàn)。具體內(nèi)容請(qǐng)參見(jiàn)4.3.3和4.3.4節(jié)。2 政務(wù)敘詞表 電子政務(wù)與電子商務(wù)的一個(gè)顯著不同是前者是為主題所驅(qū)動(dòng)的,而后者是交易驅(qū)動(dòng)的。在主題驅(qū)動(dòng)系統(tǒng)中,標(biāo)準(zhǔn)主題詞敘詞庫(kù)是至關(guān)重要的,因?yàn)樗菐?kù)內(nèi)資源組織、

5、管理以及庫(kù)際資源交換的基礎(chǔ)。標(biāo)準(zhǔn)政務(wù)敘詞表即是對(duì)所有入庫(kù)資源進(jìn)展科學(xué)標(biāo)引、描述與分類(lèi),通過(guò)敘詞嚴(yán)格的語(yǔ)義內(nèi)涵和位屬關(guān)聯(lián),建立所有資源在主題層的映射關(guān)系,對(duì)各類(lèi)信息產(chǎn)品和服務(wù)過(guò)程起到基準(zhǔn)性、標(biāo)準(zhǔn)性、參照性、構(gòu)造性和工具性的支持作用,以實(shí)現(xiàn)全庫(kù)資源的有序化,并提升其可用性。 如"Internet"有"因特網(wǎng)"、"互聯(lián)網(wǎng)"、"網(wǎng)際網(wǎng)路"等名稱(chēng),僅以其中一個(gè)名稱(chēng)進(jìn)展全文檢索、關(guān)鍵詞檢索等并不能保證文獻(xiàn)的查全率。而嚴(yán)格定義的敘詞表會(huì)在這些表達(dá)間建立關(guān)聯(lián),同時(shí)還會(huì)給出相關(guān)同位詞,如"Internet"的同位

6、詞有"Intranet"即"內(nèi)部網(wǎng)"、"企業(yè)網(wǎng)"、"內(nèi)聯(lián)網(wǎng)"、"內(nèi)特網(wǎng)"等,以及"Extranet""外部網(wǎng)"、"外聯(lián)網(wǎng)"、"外特網(wǎng)"等,上位詞有"計(jì)算機(jī)網(wǎng)絡(luò)"、"網(wǎng)絡(luò)"以及"無(wú)線互聯(lián)網(wǎng)"、"移動(dòng)互聯(lián)網(wǎng)"等下位詞。 資源庫(kù)中所有的文獻(xiàn)資源只有在標(biāo)引并與敘詞庫(kù)建立映射后,才能使用戶在主題查詢時(shí)能進(jìn)退自如。政務(wù)資源敘詞表大致由如下分詞表組成:

7、機(jī)關(guān)公文主題詞表、宏觀經(jīng)濟(jì)主題詞表、行業(yè)主題詞表、社會(huì)事業(yè)主題詞表以及科學(xué)與技術(shù)主題詞表等。 3信息分類(lèi)、代碼和指標(biāo)體系表 分類(lèi)與代碼對(duì)于庫(kù)中信息的組織管理和服務(wù)是極其重要的,同時(shí),隨著國(guó)際經(jīng)濟(jì)一體化進(jìn)程的加快,與國(guó)際標(biāo)準(zhǔn)信息分類(lèi)體系的兼容問(wèn)題也日益重要。這些分類(lèi)代碼體系涉及到國(guó)民經(jīng)濟(jì)行業(yè)分類(lèi)代碼、聯(lián)合國(guó)及各國(guó)海關(guān)協(xié)調(diào)制度HS分類(lèi)與代碼、北美工業(yè)標(biāo)準(zhǔn)分類(lèi)代碼NAICS體系、全國(guó)行政區(qū)劃分類(lèi)與代碼擴(kuò)展到鄉(xiāng)鎮(zhèn)級(jí)、全國(guó)工農(nóng)業(yè)產(chǎn)品/商品分類(lèi)代碼、各主導(dǎo)行業(yè)信息分類(lèi)與代碼以及文件格式及其構(gòu)造描述標(biāo)準(zhǔn)代碼等。 此外,各種指標(biāo)體系與格式化文件對(duì)于政府的宏觀管理和決策分析也是極其重要的。此類(lèi)數(shù)據(jù)常以表格形式出

8、現(xiàn),并在各級(jí)機(jī)關(guān)部門(mén)中流轉(zhuǎn)生成,它們之間的交換也以表格形式進(jìn)展。所以,字段統(tǒng)一、代碼統(tǒng)一、格式統(tǒng)一、定義統(tǒng)一的表格是主管部門(mén)從事經(jīng)濟(jì)分析、數(shù)據(jù)再處理和決策支持的前提。 4GIS平臺(tái) 幾乎所有的經(jīng)濟(jì)、產(chǎn)業(yè)與社會(huì)信息都與地理空間信息相關(guān),近年來(lái)GIS已融入IT業(yè)的主體,并成為各類(lèi)數(shù)據(jù)綜合可視化的基礎(chǔ)平臺(tái)。與專(zhuān)業(yè)數(shù)據(jù)結(jié)合的各類(lèi)專(zhuān)題電子地圖更是各地政府進(jìn)展區(qū)域經(jīng)濟(jì)與社會(huì)開(kāi)展規(guī)劃、開(kāi)展招商引資、比較本地與周邊地區(qū)競(jìng)爭(zhēng)優(yōu)勢(shì)不可缺少的工具。同時(shí),政務(wù)數(shù)據(jù)庫(kù)的資源只有在與GIS整合后,才能產(chǎn)生質(zhì)變,真正為政府宏觀調(diào)控起到?jīng)Q策支持的作用。5服務(wù)資源電子政務(wù)系統(tǒng)的服務(wù)對(duì)象有4類(lèi):政府機(jī)構(gòu)、公務(wù)員、公民、企業(yè)單位。

9、服務(wù)資源即指直接為這4類(lèi)客戶提供服務(wù)的信息。其中包括政府系統(tǒng)辦公數(shù)據(jù)、各類(lèi)業(yè)務(wù)數(shù)據(jù)、國(guó)家政策指令,各種政務(wù)圖像、視頻,還包括電子商務(wù)、工商、稅務(wù)、金融、海關(guān)、法律、衛(wèi)生、醫(yī)療、教育、職業(yè)等基礎(chǔ)設(shè)施服務(wù)信息。4.5.2.3 數(shù)據(jù)特性1靜態(tài)數(shù)據(jù)與動(dòng)態(tài)數(shù)據(jù)電子政務(wù)數(shù)據(jù)中心必須滿足電子政務(wù)平臺(tái)進(jìn)展數(shù)據(jù)交換的需要,同時(shí)還必須滿足在平臺(tái)上建立的各業(yè)務(wù)系統(tǒng)進(jìn)展綜合業(yè)務(wù)處理的要求,并為門(mén)戶系統(tǒng)提供各種靜態(tài)和動(dòng)態(tài)的數(shù)據(jù)、信息。所謂靜態(tài)信息是指對(duì)電子政務(wù)的運(yùn)行中不經(jīng)常變化,供各個(gè)業(yè)務(wù)系統(tǒng)查詢、處理的數(shù)據(jù)或信息:政策、法規(guī)、元數(shù)據(jù)、資料庫(kù)、各種多媒體數(shù)據(jù)等,它們會(huì)隨著時(shí)間而逐步增大。所謂動(dòng)態(tài)數(shù)據(jù)是指隨著運(yùn)行而增加、

10、修改的數(shù)據(jù):并聯(lián)審批中文件流轉(zhuǎn)狀態(tài)數(shù)據(jù),反映企業(yè)、個(gè)人所處狀態(tài)的數(shù)據(jù),國(guó)民經(jīng)濟(jì)運(yùn)行狀態(tài)的數(shù)據(jù)等。動(dòng)態(tài)數(shù)據(jù)同各個(gè)局委辦的信息密切相關(guān),但又是面向主題的,如社會(huì)保險(xiǎn)這個(gè)主題,實(shí)際上同保險(xiǎn)、工資、稅務(wù)和銀行密切相關(guān);個(gè)人信用使用主題,它的數(shù)據(jù)與銀行、稅務(wù)、個(gè)人消費(fèi)、個(gè)人收入密切相關(guān)。2微觀應(yīng)用與宏觀應(yīng)用的數(shù)據(jù)共享政府業(yè)務(wù)中的信息應(yīng)用有微觀的應(yīng)用與宏觀應(yīng)用之分,微觀數(shù)據(jù)的應(yīng)用主要是針對(duì)個(gè)案的事務(wù)處理。比方工商登記,業(yè)務(wù)申報(bào),稅務(wù)處理,個(gè)人勞保、補(bǔ)助、婚喪、駕照、護(hù)照、醫(yī)療等等。微觀事務(wù)處理的業(yè)務(wù)既包含對(duì)社會(huì)市場(chǎng)秩序的監(jiān)管,又包含對(duì)企業(yè)、對(duì)公眾的服務(wù)。這類(lèi)事務(wù)處理的工作主要是由基層的一線人員來(lái)承擔(dān)的,其

11、信息共享的特點(diǎn)是:由來(lái)自不同方面的信息要圍繞一個(gè)主體來(lái)整合起來(lái),比方將醫(yī)療衛(wèi)生、方案生育、社會(huì)保障等信息依據(jù)人的身份證號(hào)碼整合起來(lái),這就構(gòu)成了以人為主題的數(shù)據(jù)庫(kù)。同樣還可以建立以法人為主題的數(shù)據(jù)庫(kù)來(lái)整合法人的信息咨詢。實(shí)際上,微觀信息共享的核心是將不同來(lái)源的數(shù)據(jù)資源,整合為主題數(shù)據(jù)庫(kù)。微觀數(shù)據(jù)的收集經(jīng)常是由不同的主管部門(mén)來(lái)做的,如公安、稅務(wù)、衛(wèi)生部門(mén)、社保部門(mén)、工商部門(mén)等。要讓這些部門(mén)收集的數(shù)據(jù)依據(jù)主題(主體)整合起來(lái)并不是容易的,首先必須要解決這些部門(mén)主觀上的抵抗,這是一個(gè)政務(wù)改革與利益處置的問(wèn)題。在技術(shù)上,要求有非常標(biāo)準(zhǔn)化的唯一的主體編碼,并要開(kāi)放數(shù)據(jù)構(gòu)造,這樣才有利于可共享的主題數(shù)據(jù)庫(kù)的

12、誕生。進(jìn)一步,我們應(yīng)當(dāng)盡量通過(guò)一表式的調(diào)查、登記,將盡可能多的數(shù)據(jù)集中地通過(guò)一次調(diào)查來(lái)完成,從而能盡量地節(jié)約本錢(qián)。由于管理的角度不一樣,我們很難通過(guò)一個(gè)主題數(shù)據(jù)來(lái)集中所有的共享數(shù)據(jù),也許,我們還是需要幾個(gè)系統(tǒng)來(lái)分別處理各自的業(yè)務(wù),但是,經(jīng)過(guò)數(shù)據(jù)整合設(shè)計(jì)之后的系統(tǒng),肯定能夠降低數(shù)據(jù)收集的總本錢(qián),并為微觀業(yè)務(wù)提供更有效的服務(wù)。宏觀應(yīng)用的數(shù)據(jù)共享,主要是為領(lǐng)導(dǎo)層服務(wù),希望通過(guò)共享數(shù)據(jù)資源來(lái)提高政府的決策水平。然而如何從紛繁龐雜的數(shù)據(jù)中挖掘出有用的信息進(jìn)展預(yù)測(cè)分析,如何更好地管理和決策呢我們可以選擇數(shù)據(jù)倉(cāng)庫(kù)Data Warehouse作為決策支持系統(tǒng)的核心。數(shù)據(jù)倉(cāng)庫(kù)是支持管理決策過(guò)程的、面向主題的、集

13、成的、不可更新的且隨時(shí)間不斷變化的數(shù)據(jù)集合。利用數(shù)據(jù)倉(cāng)庫(kù),對(duì)源數(shù)據(jù)經(jīng)過(guò)提取、轉(zhuǎn)換、加載形成統(tǒng)一的數(shù)據(jù)格式,再利用數(shù)據(jù)挖掘和OLAP分析工具為決策者提供所需的信息。數(shù)據(jù)倉(cāng)庫(kù)的使用者主要是機(jī)關(guān)單位、市委領(lǐng)導(dǎo)等決策相關(guān)人員,為他們提供在業(yè)務(wù)辦公基礎(chǔ)數(shù)據(jù)庫(kù)的基礎(chǔ)上各種層次匯總的數(shù)據(jù),幫助他們進(jìn)展各種決策支持。對(duì)于數(shù)據(jù)倉(cāng)庫(kù)的概念我們可以從兩個(gè)層次予以理解,首先,數(shù)據(jù)倉(cāng)庫(kù)用于支持決策,面向分析型數(shù)據(jù)處理,它不同于現(xiàn)有的業(yè)務(wù)型數(shù)據(jù)庫(kù);其次,數(shù)據(jù)倉(cāng)庫(kù)是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)展了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般不再修改。數(shù)據(jù)倉(cāng)庫(kù)主要有三方面的作用:首先,數(shù)據(jù)倉(cāng)庫(kù)提供了標(biāo)

14、準(zhǔn)的報(bào)表和圖表功能,其中的數(shù)據(jù)來(lái)源于不同的多個(gè)事務(wù)處理系統(tǒng),因此,數(shù)據(jù)倉(cāng)庫(kù)的報(bào)表和圖表是關(guān)于整個(gè)集成信息的報(bào)表和圖表;其次,數(shù)據(jù)倉(cāng)庫(kù)支持多維分析,多維分析是通過(guò)把一個(gè)實(shí)體的多項(xiàng)重要的屬性定義為多個(gè)維度,使得用戶能方便地匯總數(shù)據(jù)集,簡(jiǎn)化了數(shù)據(jù)的分析處理邏輯,并能對(duì)不同維度值的數(shù)據(jù)進(jìn)展比較,而維度那么表示了對(duì)信息的不同理解角度。應(yīng)用多維分析可以在一個(gè)查詢中對(duì)不同階段的數(shù)據(jù)進(jìn)展縱向或橫向比較,這在決策過(guò)程中非常有用;第三,數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵基礎(chǔ),數(shù)據(jù)挖掘技術(shù)要在已有數(shù)據(jù)中識(shí)別數(shù)據(jù)的模式,以幫助用戶理解現(xiàn)有的信息,并在已有信息的基礎(chǔ)上,對(duì)未來(lái)的狀況作出預(yù)測(cè)。雖然數(shù)據(jù)倉(cāng)庫(kù)也有面向主題的定義,但

15、這些主題是較長(zhǎng)時(shí)間的,具有戰(zhàn)略定義的主題。由以上分析可見(jiàn),根據(jù)數(shù)據(jù)庫(kù)的操作性、數(shù)據(jù)的語(yǔ)義,應(yīng)該把數(shù)據(jù)庫(kù)分為三大類(lèi):一般意義的數(shù)據(jù)庫(kù)即關(guān)系數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)DB;供綜合業(yè)務(wù)系統(tǒng)和門(mén)戶使用的面向主題的數(shù)據(jù)庫(kù)OSD;數(shù)據(jù)倉(cāng)庫(kù),它是供內(nèi)門(mén)戶決策者使用的數(shù)據(jù)庫(kù)DW。DB數(shù)據(jù)主要分布在各局委辦,數(shù)據(jù)中心只有少量的;所以它是集中分布的。面向主題的操作數(shù)據(jù)庫(kù)OSD是電子政務(wù)數(shù)據(jù)中心的主體,它是DB按主題映射的數(shù)據(jù)庫(kù);數(shù)據(jù)倉(cāng)庫(kù)建立在DB和OSD之上的主題數(shù)據(jù)庫(kù)。這三種數(shù)據(jù)庫(kù)的關(guān)系描述如下:面向主題的操作數(shù)據(jù)庫(kù)是數(shù)據(jù)庫(kù)體系的中間層,一方面包含全局一致的、細(xì)節(jié)的、當(dāng)前或接近當(dāng)前的數(shù)據(jù);另一方面它是面向主題的,集成的

16、數(shù)據(jù)環(huán)境,且數(shù)據(jù)量小,供各個(gè)綜合業(yè)務(wù)系統(tǒng)查詢處理使用,主要用作輔助完成日常決策的數(shù)據(jù)分析處理。所以這種數(shù)據(jù)庫(kù)的主要特征是:l 系統(tǒng)功能表4-1設(shè)計(jì)目標(biāo) 處理類(lèi)型 主要功能 需求特征中層輔助決策與綜合查詢 日常管理和控制的決策,事務(wù)處理與決策分析并存 聯(lián)機(jī)事務(wù)處理聯(lián)機(jī)分析 綜合全局中層l 數(shù)據(jù)特征表4-2內(nèi)容 來(lái)源 組織 穩(wěn)定性 綜合性 特征當(dāng)前或接近當(dāng)前的數(shù)據(jù) 政府系統(tǒng)內(nèi)部 主題 較穩(wěn)定允許更新 某一主題的綜合和詳細(xì)數(shù)據(jù) 全域一致的數(shù)據(jù)環(huán)境l 數(shù)據(jù)庫(kù)的主要用戶該數(shù)據(jù)庫(kù)是反映某一主題的數(shù)據(jù),其用戶是政府工作人員和就某一主題進(jìn)展綜合查詢的人員。3集中分布式數(shù)據(jù)管理當(dāng)我們的微觀數(shù)據(jù)規(guī)模非常大的時(shí)候,

17、依靠集中的數(shù)據(jù)處理會(huì)是很不方便的,我們可以將數(shù)據(jù)庫(kù)建立分散化,由本地來(lái)進(jìn)展數(shù)據(jù)收集、整理和數(shù)據(jù)庫(kù)更新。然而,數(shù)據(jù)的使用卻不能是地區(qū)化的,數(shù)據(jù)的查詢是全國(guó)范圍的。這樣,共享數(shù)據(jù)的管理與共享數(shù)據(jù)的使用范圍就會(huì)不一致。為了解決這一問(wèn)題,可以考慮使用標(biāo)準(zhǔn)的目錄數(shù)據(jù)庫(kù),統(tǒng)一構(gòu)造的目錄數(shù)據(jù)庫(kù)將允許多層次分布式的建立自己的子系統(tǒng),而又能自然形成一個(gè)整體,以支持統(tǒng)一的數(shù)據(jù)庫(kù)查詢,這對(duì)于建立大規(guī)模的主題數(shù)據(jù)庫(kù)體系是非常有效的。數(shù)據(jù)就近的管理與聯(lián)合統(tǒng)一的使用不僅會(huì)大大提高數(shù)據(jù)共享的范圍,而且會(huì)有效地降低數(shù)據(jù)維護(hù)管理的本錢(qián)。4數(shù)據(jù)源的異構(gòu)性數(shù)據(jù)源異構(gòu)性主要表現(xiàn)在兩方面:s 系統(tǒng)異構(gòu),數(shù)據(jù)源所依賴(lài)的應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)管

18、理系統(tǒng)乃至操作系統(tǒng)之間的不同構(gòu)成了系統(tǒng)異構(gòu)。s 模式異構(gòu),數(shù)據(jù)源在存儲(chǔ)模式上的不同。一般的存儲(chǔ)模式包括關(guān)系模式、對(duì)象模式、對(duì)象關(guān)系模式和文檔嵌套模式等幾種,其中關(guān)系模式為主流存儲(chǔ)模式。需要注意的是,即便是同一類(lèi)存儲(chǔ)模式,它們的模式構(gòu)造可能也存在著差異。例如Oracle所采用的數(shù)據(jù)類(lèi)型與SQLServer所采用的數(shù)據(jù)類(lèi)型并不是完全一致的。4.5.2.4 數(shù)據(jù)整合和集成需求異構(gòu)數(shù)據(jù)源的數(shù)據(jù)整合和集成的目的是為綜合應(yīng)用系統(tǒng)提供集成的、統(tǒng)一的、安全的、快捷的信息查詢、數(shù)據(jù)挖掘和決策支持服務(wù)。為了滿足這個(gè)需求條件,整合、集成后的數(shù)據(jù)必須保證一定的集成性、完整性、一致性和訪問(wèn)安全性。1、集成性各種原先孤立

19、的業(yè)務(wù)信息系統(tǒng)數(shù)據(jù)經(jīng)過(guò)整合、集成后,應(yīng)該到達(dá)查詢一個(gè)綜合信息不必再到各個(gè)業(yè)務(wù)系統(tǒng)進(jìn)展分別查詢和人工處理,只要在數(shù)據(jù)中心中就可以直接訪問(wèn)到,即整合、集成后的數(shù)據(jù)是各異構(gòu)業(yè)務(wù)數(shù)據(jù)的有機(jī)集成和關(guān)聯(lián)存儲(chǔ)整合、開(kāi)掘出各業(yè)務(wù)數(shù)據(jù)間的內(nèi)在關(guān)聯(lián)關(guān)系,而不是簡(jiǎn)單、孤立的堆放在一個(gè)數(shù)據(jù)庫(kù)系統(tǒng)里。2.完整性包括數(shù)據(jù)完整性和約束完整性兩方面。s 數(shù)據(jù)完整性是指完整提取數(shù)據(jù)本身,一般來(lái)說(shuō),這一點(diǎn)較容易到達(dá)。s 約束完整性,約束是指數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,是唯一表征數(shù)據(jù)間邏輯的特征。保證約束的完整性是良好的數(shù)據(jù)發(fā)布和交換的前提,可以方便數(shù)據(jù)處理過(guò)程,提高效率。3.一致性不同業(yè)務(wù)信息資源之間存在著語(yǔ)義上的區(qū)別。這些語(yǔ)義上

20、的不同會(huì)引起各種不完整甚至錯(cuò)誤信息的產(chǎn)生,從簡(jiǎn)單的名字語(yǔ)義沖突不同的名字代表一樣的概念,到復(fù)雜的構(gòu)造語(yǔ)義沖突不同的模型表達(dá)同樣的信息。語(yǔ)義沖突會(huì)帶來(lái)數(shù)據(jù)集成結(jié)果的冗余,干擾數(shù)據(jù)處理、發(fā)布和交換。整合、集成后的數(shù)據(jù)應(yīng)該根據(jù)一定的數(shù)據(jù)轉(zhuǎn)換模式和業(yè)務(wù)規(guī)那么進(jìn)展統(tǒng)一數(shù)據(jù)構(gòu)造和字段語(yǔ)義編碼轉(zhuǎn)換。4.訪問(wèn)安全性由于數(shù)據(jù)庫(kù)資源可能歸屬不同的單位,各業(yè)務(wù)數(shù)據(jù)系統(tǒng)有著各自的用戶權(quán)限管理模式,訪問(wèn)和安全管理很不方便,不能集中、統(tǒng)一管理。所以既要保證能訪問(wèn)異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),又要保障原有數(shù)據(jù)庫(kù)的權(quán)限不被侵犯,實(shí)現(xiàn)對(duì)原有數(shù)據(jù)源訪問(wèn)權(quán)限的隔離和控制,就需要設(shè)計(jì)數(shù)據(jù)中心統(tǒng)一的用戶安全管理模式來(lái)解決此問(wèn)題。值得注意的是,多

21、個(gè)數(shù)據(jù)源之間的數(shù)據(jù)集成,并不是要將全部的數(shù)據(jù)進(jìn)展集成,那么如何定義要集成的范圍,就構(gòu)成了集成內(nèi)容的限定問(wèn)題。針對(duì)異構(gòu)數(shù)據(jù)源的整合和集成需求,可以采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和數(shù)據(jù)抽取工具來(lái)實(shí)現(xiàn)。另外,根據(jù)國(guó)務(wù)院17號(hào)文件精神,電子政務(wù)系統(tǒng)需要"整合信息資源,建立人口、法人單位、空間地理和自然資源、宏觀經(jīng)濟(jì)四個(gè)基礎(chǔ)數(shù)據(jù)庫(kù)"。為什么選擇這四個(gè)庫(kù)而不選擇別的數(shù)據(jù)庫(kù)呢這是基于基礎(chǔ)性、公益性、戰(zhàn)略性考慮的。由于這四個(gè)數(shù)據(jù)庫(kù)對(duì)別的數(shù)據(jù)庫(kù)建立來(lái)說(shuō)是一種公共產(chǎn)品,其它數(shù)據(jù)庫(kù)需要通過(guò)它的服務(wù),在它的基礎(chǔ)上不斷開(kāi)展,而產(chǎn)業(yè)庫(kù)可以由中介機(jī)構(gòu)來(lái)做。4.5.2.5 數(shù)據(jù)元標(biāo)準(zhǔn)化很多信息的描述、定義、獲取、表示形

22、式由于缺乏統(tǒng)一、嚴(yán)格的標(biāo)準(zhǔn),致使大量的信息數(shù)據(jù)處于分散的、部門(mén)所有的和各自為政的狀態(tài),造成數(shù)據(jù)信息資源浪費(fèi),不利于實(shí)現(xiàn)全社會(huì)的數(shù)據(jù)共享。為了提高政務(wù)信息的共享和集成分析,保證為政府的管理決策和社會(huì)各階層提供科學(xué)準(zhǔn)確的信息,迫切需要開(kāi)發(fā)出一種統(tǒng)一的、以標(biāo)準(zhǔn)數(shù)據(jù)元形式的對(duì)政務(wù)信息的表示方法,以支持政務(wù)信息的共享和交換。 數(shù)據(jù)元Data Element是表示概念的一類(lèi)數(shù)據(jù),其特性可由支持信息交換的一組數(shù)據(jù)元屬性來(lái)表示。或者說(shuō)數(shù)據(jù)元是一組可識(shí)別和可定義的數(shù)據(jù) 基本單元。一般來(lái)說(shuō)數(shù)據(jù)元由數(shù)據(jù)元的名稱(chēng)、屬性、表示三局部組成。 數(shù)據(jù)元是用一組屬性描述其定義、標(biāo)示、表達(dá)和允許值的一個(gè)數(shù)據(jù)單元。 組成數(shù)據(jù)元標(biāo)準(zhǔn)

23、的 基本屬性分為標(biāo)示類(lèi)屬性、定義類(lèi)屬性、關(guān)系類(lèi)屬性、表示類(lèi)屬性、管理類(lèi)屬性。當(dāng)然還可以根據(jù)需要增加擴(kuò)展屬性。數(shù)據(jù)元屬性應(yīng)依照一種標(biāo)準(zhǔn)方式來(lái)注冊(cè)和控制,以便數(shù)據(jù)元字典中的數(shù)據(jù)元在信息交換中保持一致性,并且能夠在不同的數(shù)據(jù)管理環(huán)境中進(jìn)展數(shù)據(jù)元管理。數(shù)據(jù)元的 基本屬性主要有以下幾類(lèi): s 標(biāo)示類(lèi),適用于數(shù)據(jù)元標(biāo)示的屬性。包括名稱(chēng)、標(biāo)示符、版本、注冊(cè)機(jī)構(gòu)、同義名稱(chēng)、相關(guān)環(huán)境。 s 定義類(lèi),描述數(shù)據(jù)元語(yǔ)義方面的屬性。包括定義。 s 關(guān)系類(lèi),描述數(shù)據(jù)元之間相互關(guān)聯(lián)和或數(shù)據(jù)元與分類(lèi)模式、數(shù)據(jù)元概念、對(duì)象、實(shí)體之間關(guān)聯(lián)的屬性包括分類(lèi)模式、關(guān)鍵字、相關(guān)數(shù)據(jù)參照、關(guān)系類(lèi)型。 s 表示類(lèi),描述數(shù)據(jù)元表示方面的屬性包

24、括表示類(lèi)別、表示形式、數(shù)據(jù)元值的數(shù)據(jù)類(lèi)型、數(shù)據(jù)元值的最大長(zhǎng)度、數(shù)據(jù)元值的最小長(zhǎng)度、表示格式、數(shù)據(jù)元允許值。 s 管理類(lèi),描述數(shù)據(jù)元管理與控制方面的屬性包括主管機(jī)構(gòu)、注冊(cè)狀態(tài)、提交機(jī)構(gòu)、備注。 在這些 基本屬性中名稱(chēng)、定義、表示類(lèi)別、表示形式、數(shù)據(jù)元值的數(shù)據(jù)類(lèi)型、數(shù)據(jù)元值的最大長(zhǎng)度、數(shù)據(jù)元值的最小長(zhǎng)度、數(shù)據(jù)元允許值是在描述數(shù)據(jù)元時(shí)是必選的。 數(shù)據(jù)元表示是在數(shù)據(jù)處理和信息交換過(guò)程中數(shù)據(jù)元所采用的格式。如數(shù)據(jù)的長(zhǎng)度、數(shù)據(jù)的類(lèi)型等都要給予說(shuō)明,數(shù)據(jù)元的格式受數(shù)據(jù)元的屬性及應(yīng)用環(huán)境限定。 數(shù)據(jù)元可分為通用數(shù)據(jù)元和應(yīng)用數(shù)據(jù)元。通用數(shù)據(jù)元是獨(dú)立于任何具體的應(yīng)用而存在的數(shù)據(jù)元,其功能是為應(yīng)用領(lǐng)域的數(shù)據(jù)元設(shè)計(jì)也

25、就是為應(yīng)用數(shù)據(jù)元的設(shè)計(jì)提供一部通用數(shù)據(jù)元字典。應(yīng)用數(shù)據(jù)元是在特定領(lǐng)域內(nèi)使用的數(shù)據(jù)元集,例如在電子政務(wù)領(lǐng)域的應(yīng)用。從這個(gè)意義上來(lái)講國(guó)家標(biāo)準(zhǔn)?數(shù)據(jù)元及交換格式、信息交換、日期和時(shí)間表示法?就應(yīng)該是一部通用數(shù)據(jù)元字典。 所謂數(shù)據(jù)元的標(biāo)準(zhǔn)化就是對(duì)數(shù)據(jù)元的總則、定義、描述、分類(lèi)、表示和注冊(cè)等制定統(tǒng)一的標(biāo)準(zhǔn),并加以貫徹、實(shí)施的過(guò)程。在大量繁雜的政務(wù)信息中,哪些概念可以作為我們定義數(shù)據(jù)元的基礎(chǔ),數(shù)據(jù)元概念的特性中哪一個(gè)可以繼承下來(lái)作為派生的通用數(shù)據(jù)元的特性,通用數(shù)據(jù)元特性中的又有哪些可以被應(yīng)用數(shù)據(jù)元所繼承。以上這些問(wèn)題都是數(shù)據(jù)元標(biāo)準(zhǔn)化過(guò)程所要解決的。 隨著社會(huì)的開(kāi)展,信息在社會(huì)各個(gè)行業(yè)中的作用不斷提高,數(shù)據(jù)

26、元標(biāo)準(zhǔn)也越來(lái)越引起各個(gè)行業(yè)的重視。人們認(rèn)識(shí)到只要對(duì)信息按共同約定的規(guī)那么進(jìn)展統(tǒng)一組織、分類(lèi)與表示,使用同一的概念,并用一樣的表示,就能做到共識(shí),不致產(chǎn)生歧義。這種簡(jiǎn)化的概念表述,提高了數(shù)據(jù)的準(zhǔn)確性,有利于數(shù)據(jù)的共享、交換。 各政務(wù)系統(tǒng)所要處理的對(duì)象主要是數(shù)據(jù),數(shù)據(jù)元標(biāo)準(zhǔn)所要起的作用就是用一個(gè)統(tǒng)一的標(biāo)準(zhǔn)來(lái)描述、定義、標(biāo)準(zhǔn)這些系統(tǒng)所要處理的數(shù)據(jù),為系統(tǒng)間的數(shù)據(jù)共享、數(shù)據(jù)交換提供一個(gè)公用的信息接口。這個(gè)公用的信息接口的基礎(chǔ)是政府部門(mén)的數(shù)據(jù)環(huán)境建立,而數(shù)據(jù)環(huán)境建立的基礎(chǔ)就是用數(shù)據(jù)元標(biāo)準(zhǔn)來(lái)描述數(shù)據(jù)源,建立電子政務(wù)領(lǐng)域的應(yīng)用數(shù)據(jù)元字典。這個(gè)公用的信息接口實(shí)際上就是我們對(duì)政務(wù)領(lǐng)域的信息以數(shù)據(jù)元標(biāo)準(zhǔn)進(jìn)展描述,

27、形成一個(gè)大家都廣泛承受,并在政務(wù)系統(tǒng)的開(kāi)發(fā)過(guò)程中遵守的規(guī)那么。在此基礎(chǔ)上,各種系統(tǒng)之間的數(shù)據(jù)共享、數(shù)據(jù)交換成為可能。數(shù)據(jù)元的標(biāo)準(zhǔn)化過(guò)程起到了一個(gè)針對(duì)要處理的數(shù)據(jù)源進(jìn)展標(biāo)準(zhǔn)化的作用。通過(guò)這個(gè)過(guò)程,標(biāo)準(zhǔn)了其中的概念、定義、以及知識(shí)的描述,形成了數(shù)據(jù)元詞典,根據(jù)這個(gè)詞典一方面數(shù)據(jù)庫(kù)的內(nèi)容的標(biāo)準(zhǔn)有了依據(jù),另一方面數(shù)據(jù)庫(kù)的構(gòu)造也得到了標(biāo)準(zhǔn)。4.5.26 模型設(shè)計(jì)基礎(chǔ)異類(lèi)軟件產(chǎn)品、應(yīng)用程序、和數(shù)據(jù)庫(kù)系統(tǒng)想要有效地互操作,它們必須要對(duì)彼此間的信息構(gòu)造有一個(gè)共同的理解。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),或是與數(shù)據(jù)有關(guān)的信息,通常由信息的構(gòu)造描述組成。元數(shù)據(jù)對(duì)不同廠商提供的異類(lèi)軟件系統(tǒng)和產(chǎn)品之間的集成起著不可或缺的作用。

28、傳統(tǒng)的四層元數(shù)據(jù)體系構(gòu)造圖如下:圖4-9 四層元數(shù)據(jù)體系構(gòu)造l 數(shù)據(jù)層0層是用戶對(duì)象層,它表示的是"目標(biāo)"數(shù)據(jù),即我們所希望描述的信息。比方在特定關(guān)系數(shù)據(jù)庫(kù)中表示為特定表的實(shí)例。例如,公民 基本信息表中某個(gè)具體公民的信息,相當(dāng)于公民 基本信息表中的一條記錄。CitizenNo Name Age Address張三 28 武漢李四 45 北京l 模型層1層包含描述目標(biāo)數(shù)據(jù)的數(shù)據(jù)模型。比方在特定關(guān)系數(shù)據(jù)庫(kù)中表示為特定的表、特定表的約束主鍵、外鍵等、特定表的構(gòu)造等。例如,公民 基本信息表的構(gòu)造,即該表中包含哪些列,以及各個(gè)列的數(shù)據(jù)類(lèi)型等。Table Column Attribut

29、eCitizen CitizenNo NumericName StringAge NumericAddress Stringl 元模型2層包含了定義模型層的元數(shù)據(jù),也就是表示M1層元數(shù)據(jù)的抽象語(yǔ)言。比方在關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中,表示為特定數(shù)據(jù)庫(kù)中表的定義、列的定義、主鍵的定義和外鍵的定義等。相當(dāng)于UML元模型定義的很多元素如類(lèi),操作,屬性,關(guān)聯(lián)等等。DataStore Component File Table Column Attr l 元元模型層3層是由定義元數(shù)據(jù)構(gòu)造和語(yǔ)法的描述組成,也可以說(shuō)它是定義各種元數(shù)據(jù)的抽象語(yǔ)言。傳統(tǒng)的元數(shù)據(jù)集成圖4-10是數(shù)據(jù)中心中一個(gè)典型的信息供應(yīng)鏈ISC的例如。信息

30、從其源頭即原始數(shù)據(jù)的提供者流出,經(jīng)過(guò)一系列精煉過(guò)程,最終產(chǎn)生信息產(chǎn)品。這些產(chǎn)品可能對(duì)于高層決策者來(lái)說(shuō)具有重大的戰(zhàn)略價(jià)值。圖4-10 數(shù)據(jù)中心中的信息供應(yīng)鏈以上每個(gè)軟件產(chǎn)品和工具,在它們能在數(shù)據(jù)層上有效集成之前,必須在元數(shù)據(jù)層上被集成。元數(shù)據(jù)集成是有效的數(shù)據(jù)集成的一個(gè)先決條件。然而,元數(shù)據(jù)的集成是十分困難的,因?yàn)榇蠖鄶?shù)的業(yè)務(wù)產(chǎn)品使用千差萬(wàn)別的格式存儲(chǔ)元數(shù)據(jù)。具有不同元數(shù)據(jù)的工具,往往是通過(guò)建立復(fù)雜的元數(shù)據(jù)橋來(lái)集成的。元數(shù)據(jù)橋是一種能將一個(gè)產(chǎn)品的元數(shù)據(jù)轉(zhuǎn)換成另一個(gè)產(chǎn)品所需元數(shù)據(jù)格式的一段軟件。元數(shù)據(jù)橋的構(gòu)建是一項(xiàng)艱巨、消耗大的過(guò)程。這樣的橋需要具有它要集成的每個(gè)產(chǎn)品的元數(shù)據(jù)構(gòu)造和接口的詳細(xì)知識(shí);關(guān)

31、于不同模型間如何相互映射的知識(shí)也要融入橋中。圖4-11 在信息供應(yīng)鏈中增加一個(gè)元數(shù)據(jù)庫(kù)圖4-11中使用了元數(shù)據(jù)庫(kù),它突出顯示了定義對(duì)全局可獲得的、和廣泛被理解的元數(shù)據(jù)是有必要的。元數(shù)據(jù)庫(kù)是具有特定目的的數(shù)據(jù)庫(kù),它存儲(chǔ)、控制所處環(huán)境中,除它自身之外的所有相關(guān)的元數(shù)據(jù)組件,并對(duì)這些元數(shù)據(jù)組件是可獲得的。從圖中我們可以看到,各種軟件產(chǎn)品從中央元數(shù)據(jù)庫(kù)中提取全局?jǐn)?shù)據(jù),而不是通過(guò)與其它產(chǎn)品的點(diǎn)到點(diǎn)連接。這個(gè)存儲(chǔ)庫(kù)包含了定義信息供應(yīng)鏈可推廣至數(shù)據(jù)中心的所有元數(shù)據(jù)的單一定義。這個(gè)定義基于一個(gè)針對(duì)存儲(chǔ)庫(kù)產(chǎn)品本身的元數(shù)據(jù)模型。每個(gè)產(chǎn)品必須實(shí)現(xiàn)它自己的存儲(chǔ)庫(kù)訪問(wèn)層即另一種形式的橋,該層理解與特定存儲(chǔ)庫(kù)相關(guān)的元數(shù)據(jù)

32、構(gòu)造例如接口和元模型,還知道如何將這些與存儲(chǔ)庫(kù)相關(guān)的構(gòu)造映射為與產(chǎn)品相關(guān)的元數(shù)據(jù)構(gòu)造。這種類(lèi)型的配置通常稱(chēng)為星型元數(shù)據(jù)體系構(gòu)造。以上這個(gè)方法雖然減輕了建立很多點(diǎn)到點(diǎn)的橋的需要,但建立橋的問(wèn)題仍然沒(méi)有完全消除。我們還是需要為每一個(gè)軟件組件開(kāi)發(fā)一個(gè)不同的訪問(wèn)層該層可以由產(chǎn)品廠商、存儲(chǔ)庫(kù)廠商或者第三方參謀開(kāi)發(fā),每一個(gè)訪問(wèn)層仍然是與某一特定的存儲(chǔ)庫(kù)產(chǎn)品相關(guān)的。基于模型的元數(shù)據(jù)集成可以有效地解決這個(gè)問(wèn)題?;谀P偷脑獢?shù)據(jù)集成用一種形式化語(yǔ)言如UML描述的模型圖4-12可以被用來(lái)定義描述某種信息構(gòu)造或模式的元數(shù)據(jù)。這種形式化語(yǔ)言可以被翻譯成相應(yīng)的元數(shù)據(jù)定義,后者能被用來(lái)創(chuàng)立信息構(gòu)造本身的真正的實(shí)例。這些各

33、式各樣的形式化模型通常是平臺(tái)無(wú)關(guān)的,它們并不顯示用來(lái)配置實(shí)際的信息構(gòu)造的計(jì)算機(jī)平臺(tái)的物理特性,因?yàn)樾问交UZ(yǔ)言如UML以及其它各種數(shù)據(jù)建模語(yǔ)言的定義通常是與平臺(tái)無(wú)關(guān)的。一個(gè)SQL DDL語(yǔ)句集可以被看成是一個(gè)與平臺(tái)相關(guān)的模型,因?yàn)樗鼈冇靡粋€(gè)特定計(jì)算機(jī)平臺(tái)的語(yǔ)言定義目標(biāo)信息構(gòu)造例如,一個(gè)與SQL兼容的關(guān)系數(shù)據(jù)庫(kù)引擎。將一個(gè)形式化模型轉(zhuǎn)換為SQL DDL的假定的翻譯過(guò)程,稱(chēng)為將與平臺(tái)無(wú)關(guān)的模型映射為與平臺(tái)相關(guān)的模型,該映射是基于翻譯過(guò)程所實(shí)現(xiàn)的某些形式化映射的規(guī)那么集。圖4-12 簡(jiǎn)單關(guān)系數(shù)據(jù)表模型由上我們可以得出三個(gè)非常重要的結(jié)論: 一個(gè)信息構(gòu)造的任何形式化模型都是定義該信息構(gòu)造的元數(shù)據(jù)元數(shù)據(jù)

34、本質(zhì)上是它所描述的數(shù)據(jù)的一個(gè)形式化模型 元數(shù)據(jù),當(dāng)用一個(gè)形式化的、與平臺(tái)無(wú)關(guān)的模型表示時(shí),可以獨(dú)立于任何特定的目標(biāo)平臺(tái)而存在。 元數(shù)據(jù),當(dāng)用一個(gè)形式化的、與平臺(tái)無(wú)關(guān)的模型表示時(shí),可以被翻譯成假設(shè)干與平臺(tái)相關(guān)的模型中的任何一個(gè),每一個(gè)代表一個(gè)不同的目標(biāo)平臺(tái)當(dāng)然要特定適當(dāng)?shù)挠成湟?guī)那么以及實(shí)現(xiàn)這些規(guī)那么。元數(shù)據(jù)集成的一個(gè)可能的方法就是開(kāi)發(fā)一個(gè)元數(shù)據(jù)的外部表示,它不依賴(lài)于任何一個(gè)特定的產(chǎn)品和工具。這樣一個(gè)表示是基于信息構(gòu)造的形式化的、與平臺(tái)無(wú)關(guān)的模型,該模型用一種恰當(dāng)?shù)恼Z(yǔ)言如UML描述。一個(gè)產(chǎn)品用這樣一個(gè)形式化模型作為它自己的元數(shù)據(jù)的基礎(chǔ),通過(guò)調(diào)用一個(gè)恰當(dāng)?shù)膶?dǎo)入映射import mapping過(guò)程將這

35、個(gè)形式化模型翻譯成它自己的、與產(chǎn)品相關(guān)的元數(shù)據(jù)的實(shí)例。類(lèi)似的,一個(gè)產(chǎn)品可以通過(guò)一個(gè)將它自己的內(nèi)部元數(shù)據(jù)翻譯成一個(gè)與平臺(tái)無(wú)關(guān)的形式化模型的導(dǎo)出映射export mapping過(guò)程,將它所有的元數(shù)據(jù)顯示給其它產(chǎn)品。這個(gè)方案在哪些方面優(yōu)于前面提到元數(shù)據(jù)橋解決方案呢? 元數(shù)據(jù)橋的主要問(wèn)題是每座橋要在兩個(gè)與產(chǎn)品相關(guān)的模型之間進(jìn)展映射,橋本質(zhì)上需要將元數(shù)據(jù)從一個(gè)產(chǎn)品的元模型規(guī)定的格式轉(zhuǎn)換成另一個(gè)與產(chǎn)品相關(guān)的元模型所規(guī)定格式?,F(xiàn)在,元模型本身被外部化externalized,與特定的實(shí)現(xiàn)平臺(tái)無(wú)關(guān);并且,產(chǎn)品交換的元數(shù)據(jù)也基于這個(gè)公共的、外部的元模型,這樣,在各自的實(shí)現(xiàn)模型間翻譯的問(wèn)題也就不存在了。這種元數(shù)據(jù)

36、級(jí)的集成和互操作方法稱(chēng)為模型驅(qū)動(dòng)的元數(shù)據(jù)體系構(gòu)造。從 基本上說(shuō),它是由軟件產(chǎn)品之間元數(shù)據(jù)的交換構(gòu)成,這里的元數(shù)據(jù)定義是以形式化的、與平臺(tái)無(wú)關(guān)的模型來(lái)表示的。參與的軟件產(chǎn)品和工具就定義整個(gè)域的公共元模型達(dá)成一致,這樣它們就能很方便的理解該元模型的任何實(shí)例例如可能被交換的、任何共享的元數(shù)據(jù)。任何產(chǎn)品將這個(gè)共享的元數(shù)據(jù)映射為它自己內(nèi)部的元數(shù)據(jù)表式方式。這要求元模型在它的領(lǐng)域有一個(gè)完整的描述。 OMG的公共倉(cāng)庫(kù)元模型Common Warehouse MetamodelCWM就是一個(gè)基于模型的元數(shù)據(jù)集成的實(shí)現(xiàn)典范,它是一個(gè)完整描述數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)分析領(lǐng)域的元模型。作為一個(gè)元模型,CWM提供了構(gòu)建元數(shù)據(jù)例如

37、模型或者元模型的實(shí)例所需的語(yǔ)義和語(yǔ)法。CWM實(shí)際上是由假設(shè)干互不一樣但又嚴(yán)密相關(guān)的元模型構(gòu)成。圖4-13描述了CWM的總體構(gòu)造,每一塊代表CWM的一個(gè)元模型或包。由CWM某個(gè)包的得到的某特定的模型例如,某個(gè)元模型的實(shí)例定義了描述對(duì)應(yīng)功能域中數(shù)據(jù)的元數(shù)據(jù)。例如,由關(guān)系元模型得到的某個(gè)模型是描述某些關(guān)系數(shù)據(jù)的實(shí)例即產(chǎn)品數(shù)據(jù)表的行集合的元數(shù)據(jù)。管 理 層Management 數(shù)據(jù)倉(cāng)庫(kù)處理包Warehouse Process 數(shù)據(jù)倉(cāng)庫(kù)操作包Warehouse Operation分 析 層Analysis 轉(zhuǎn)換包Transformation 聯(lián)機(jī)分析、處理包OLAP 數(shù)據(jù)挖掘包Data Mining 信

38、息可視化包InformationVisualization 業(yè)務(wù)命名規(guī)那么包BusinessNomenclature資源層Resource 對(duì)象包Object 關(guān)系包Relational 記錄包Record 多維包Multidimensional XML包XML基礎(chǔ)層Foundation 業(yè)務(wù)信息包BusinessInformation 數(shù)據(jù)類(lèi)型包Data Type 表達(dá)式包Expressions 鍵和索引包Keys and Indexes 軟件配置包Software Deployment 類(lèi)型映射包Type Mapping對(duì)象模型層Object Model 核心包Core 行為包Behavi

39、oral 聯(lián)系包Relationships 實(shí)例包Instance圖4.13 CWM元模型層次圖另外,基于模型的元數(shù)據(jù)集成體系構(gòu)造要求有一種形式化語(yǔ)言,它能夠以共享的、與平臺(tái)無(wú)關(guān)的模型來(lái)表示元數(shù)據(jù)。在CWM中,這種語(yǔ)言是UML事實(shí)上是UML的一個(gè)特定子集。首先,最低的一層是對(duì)象層,這個(gè)UML的子層用作CWM的 基本元模型。對(duì)象層由4個(gè)元模型構(gòu)成:核心元模型、行為元模型、關(guān)系元模型和實(shí)例元模型。其中的關(guān)系元模型定義了模型元素之間的 基本關(guān)系如表和列之間的關(guān)聯(lián)?;A(chǔ)層為更高層次提供CWM特定的服務(wù)。例如,數(shù)據(jù)類(lèi)型元模型為定義 基本數(shù)據(jù)類(lèi)型和構(gòu)造數(shù)據(jù)類(lèi)型提供基礎(chǔ)構(gòu)造;類(lèi)型映射元模型定義的新類(lèi)型使我們

40、能夠在不同類(lèi)型的系統(tǒng)之間建立映射模型對(duì)于確保不同軟件工具和平臺(tái)之間的互操作性很顯然是必不可少的;索引元模型同樣以對(duì)象層的 基本模型元素為基礎(chǔ),定義了唯一鍵和外鍵的抽象概念,這對(duì)于建立關(guān)系數(shù)據(jù)庫(kù)的模型至關(guān)重要,同時(shí)它對(duì)面向記錄的和多維的數(shù)據(jù)庫(kù)同樣重要。業(yè)務(wù)信息元模型定義的元素支持對(duì) 基本業(yè)務(wù)信息的建模。資源層定義了各種數(shù)據(jù)資源的不同類(lèi)型。該層含有的元模型包,允許描述面向?qū)ο蟮臄?shù)據(jù)庫(kù)和應(yīng)用系統(tǒng)、關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)、傳統(tǒng)的面向記錄的數(shù)據(jù)源諸如文件和記錄模型數(shù)據(jù)庫(kù)管理系統(tǒng),以及由聯(lián)線分析處理OLAP工具和XML流建立的多維數(shù)據(jù)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)和ISC信息供應(yīng)鏈中需要管理的各種數(shù)據(jù)資源,我們可以用CWM去定

41、義表示各種類(lèi)型的數(shù)據(jù)資源的元數(shù)據(jù)。分析層中最重要的是轉(zhuǎn)換元模型,這個(gè)元模型定義的模型元素用來(lái)指定數(shù)據(jù)資源模型資源層元模型的實(shí)例之間源和目標(biāo)的映射及轉(zhuǎn)換,同時(shí)也指定數(shù)據(jù)資源模型和各種分析模型之間源和目標(biāo)的映射及轉(zhuǎn)換。 分析層還提供了數(shù)據(jù)挖掘、業(yè)務(wù)術(shù)語(yǔ)、信息可視化元模型,它們支持對(duì)面向分析的元數(shù)據(jù)進(jìn)展建模。數(shù)據(jù)挖掘元模型定義的模型元素用來(lái)指定與各種數(shù)據(jù)挖掘工具相關(guān)的元數(shù)據(jù),這些工具經(jīng)常用來(lái)從各種數(shù)據(jù)資源中抽取重要的模式和趨勢(shì);業(yè)務(wù)術(shù)語(yǔ)元模型定義的元數(shù)據(jù)負(fù)責(zé)定義業(yè)務(wù)術(shù)語(yǔ)和概念并對(duì)其分類(lèi);可視化元模型定義的模型元素能夠創(chuàng)立與先進(jìn)的報(bào)表工具和可視化工具相關(guān)的元數(shù)據(jù)??偠灾@些元模型提供了建立支持IS

42、C信息供應(yīng)鏈分析階段的那些元數(shù)據(jù)所需的語(yǔ)義構(gòu)造。最后,管理層元模型支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的日常操作和管理。數(shù)據(jù)倉(cāng)庫(kù)過(guò)程元模型使我們能夠?qū)δ承┨囟ǖ臄?shù)據(jù)倉(cāng)庫(kù)過(guò)程進(jìn)展建模,例如ETL數(shù)據(jù)提取、轉(zhuǎn)換和裝載過(guò)程;數(shù)據(jù)倉(cāng)庫(kù)操作元模型定義的模型元素用來(lái)創(chuàng)立定義特定的周期性的常規(guī)操作的元數(shù)據(jù),例如預(yù)定的事件及其相互的依賴(lài)關(guān)系。這些元數(shù)據(jù)對(duì)于ETL數(shù)據(jù)提取,轉(zhuǎn)換和裝載工具,基于時(shí)間的排序工具以及其它倉(cāng)庫(kù)管理工具十分有用。由上,CWM提供了基于模型的元數(shù)據(jù)集成體系構(gòu)造所需的、用于描述問(wèn)題域的語(yǔ)義完整的公共元模型。如果構(gòu)建數(shù)據(jù)中心用到的各種軟件產(chǎn)品、工具和數(shù)據(jù)庫(kù)產(chǎn)品就CWM元模型達(dá)成一致,它們就都能理解CWM元模型的實(shí)例模

43、型或者元數(shù)據(jù),元數(shù)據(jù)很容易在各局部之間進(jìn)展交換和共享。一個(gè)關(guān)于數(shù)據(jù)中心的完整的模型,從前端的數(shù)據(jù)資源,到轉(zhuǎn)換和凈化,再到終端用戶分析,再到數(shù)據(jù)倉(cāng)庫(kù)管理,都能用CWM的元模型來(lái)建立。公共元模型,作為基于模型的元數(shù)據(jù)集成方法的核心,必須依照一定的形式化規(guī)那么一種抽象語(yǔ)言來(lái)建立,以確保所有的軟件都能用一樣的、預(yù)期的方式對(duì)其進(jìn)展解釋。對(duì)CWM而言,OMG的元對(duì)象設(shè)施MOF提供了所需的形式化規(guī)那么集。MOF是為元模型標(biāo)準(zhǔn)定義公共抽象語(yǔ)言的一種OMG標(biāo)準(zhǔn)。MOF本質(zhì)上是一種元元模型,或者說(shuō)是元模型的模型有時(shí)候稱(chēng)為本體ontology,它定義了對(duì)離散系統(tǒng)建模要用到的元模型中的 基本元素、語(yǔ)法和構(gòu)造。MOF是

44、UML和CWM的公共模型,MOF使不同的元模型代表不同領(lǐng)域可以互操作。遵循MOF標(biāo)準(zhǔn)的應(yīng)用軟件一點(diǎn)也不了解某個(gè)模型實(shí)例與特定領(lǐng)域相關(guān)的接口的情況,但是它仍然能夠通過(guò)使用反射接口的通用操作對(duì)該模型進(jìn)展讀取和更新的操作。MOF的語(yǔ)義一般定義了支持模型創(chuàng)立、發(fā)現(xiàn)、轉(zhuǎn)換和更新的某些元數(shù)據(jù)庫(kù)服務(wù)。特別的,MOF定義了模型生命周期的語(yǔ)義。模型生命周期定義了關(guān)于元數(shù)據(jù)的創(chuàng)立和發(fā)布的有效操作,特別是結(jié)合到可視化建模的時(shí)候例如,面向UML建模的工具。例如,新開(kāi)發(fā)的元模型可以存儲(chǔ)在MOF存儲(chǔ)庫(kù)中,并與其它以存在的元模型結(jié)合起來(lái)使用。一個(gè)支持MOF的存儲(chǔ)庫(kù)除了負(fù)責(zé)元數(shù)據(jù)的創(chuàng)立和獲取,還提供了很多重要的元數(shù)據(jù)相關(guān)服務(wù)

45、例如持續(xù)化、版本控制、查詢等。總而言之,MOF試圖給出建立元對(duì)象模型的統(tǒng)一標(biāo)準(zhǔn),其主要活動(dòng)是描述元對(duì)象和建立元對(duì)象模型,以便通過(guò)共享元數(shù)據(jù),到達(dá)不同操作系統(tǒng)的、不同應(yīng)用程序、不同數(shù)據(jù)庫(kù)平臺(tái)等的互操作性的目的。基于模型的元數(shù)據(jù)集成方法還要求有一個(gè)用于交換共享元數(shù)據(jù)實(shí)例的公共交換格式,以及訪問(wèn)元數(shù)據(jù)的公共程序接口。CWM使用的XML互換編碼XMI是定義如何將支持MOF的元模型如CWM映射到XML的一個(gè)OMG標(biāo)準(zhǔn)。XMI準(zhǔn)確定義了在XML文檔中如何用XML標(biāo)簽定義CWM元模型的實(shí)例。CWM元模型用來(lái)定義以XML DTD形式表示的XML標(biāo)簽集。然后CWM的元數(shù)據(jù)例如CWM元模型的實(shí)例在XML文檔中被序

46、列化serialized。每個(gè)元數(shù)據(jù)的實(shí)例都作為XML元素的內(nèi)容存儲(chǔ)起來(lái),而這些元素是由適當(dāng)?shù)脑P蜆?biāo)簽限定的。XMI解決了用基于標(biāo)簽的語(yǔ)言表示對(duì)象及其關(guān)聯(lián)時(shí)面臨的許多難題。另外,XMI只是使用XML的一種方法,這意味著標(biāo)簽和標(biāo)簽描述的項(xiàng)元素內(nèi)容可以打包到同一個(gè)文件,使得應(yīng)用程序能夠很容易的理解文檔內(nèi)容。內(nèi)容的交流既是自描述也是異步的,這也是基于XML和XMI的交互在分布異構(gòu)環(huán)境中為什么這么重要的原因。對(duì)CWM元數(shù)據(jù)資源的程序訪問(wèn)是由從支持MOF的元模型到各種編程語(yǔ)言的映射標(biāo)準(zhǔn)來(lái)定義的。MOF標(biāo)準(zhǔn)特別定義了從任何支持MOF的元模型,例如CWM,到OMG的IDL的映射。CWM標(biāo)準(zhǔn)包含完整的IDL

47、定義。用選定的某種語(yǔ)言例如Java或C+定義程序接口,必須使用適當(dāng)目標(biāo)語(yǔ)言編譯器將CWM IDL編譯為符合目標(biāo)語(yǔ)言語(yǔ)法的接口定義。最后,我們認(rèn)為一個(gè)基于模型的元數(shù)據(jù)集成解決方案還必須提供一些擴(kuò)展模型的標(biāo)準(zhǔn)方法,這對(duì)于定義CWM沒(méi)有考慮到的、與產(chǎn)品高度相關(guān)的元數(shù)據(jù)而言是必不可少的。4.5.27 數(shù)據(jù)庫(kù)類(lèi)型按數(shù)據(jù)庫(kù)所服務(wù)的業(yè)務(wù)功能,可把數(shù)據(jù)庫(kù)分成如下種類(lèi)以下圖僅供參考圖4-14 數(shù)據(jù)庫(kù)類(lèi)型四大基礎(chǔ)數(shù)據(jù)庫(kù):包括人口數(shù)據(jù)庫(kù)、法人單位數(shù)據(jù)庫(kù)、空間地理和自然資源數(shù)據(jù)庫(kù)、以及宏觀經(jīng)濟(jì)數(shù)據(jù)庫(kù)。主題操作數(shù)據(jù)庫(kù):存有經(jīng)常使用的業(yè)務(wù)數(shù)據(jù),可存在數(shù)據(jù)中心,但大量的是以目錄形式存儲(chǔ),而其數(shù)據(jù)總是存在各局委辦,這樣既保證了數(shù)據(jù)的動(dòng)態(tài)更新的一致性,也保證了數(shù)據(jù)的安全性。但設(shè)計(jì)業(yè)務(wù)數(shù)據(jù)時(shí),要在響應(yīng)速度,冗余,一致性上作

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論