元數(shù)據(jù)管理的五種成熟度_第1頁
元數(shù)據(jù)管理的五種成熟度_第2頁
元數(shù)據(jù)管理的五種成熟度_第3頁
元數(shù)據(jù)管理的五種成熟度_第4頁
元數(shù)據(jù)管理的五種成熟度_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、元數(shù)據(jù)管理的五種成熟度元數(shù)據(jù)管理的五種成熟度當(dāng)企業(yè)內(nèi)外部的數(shù)據(jù)越來越多時,元數(shù)據(jù)管理就會成為許多公司的一個關(guān)鍵問題。本文從用戶、處理和技術(shù)的不同角度,描述企業(yè)元數(shù)據(jù)管理的不同成熟度模型和企業(yè)沿著成熟度階梯向上提升的步驟。對于什么是元數(shù)據(jù),目前存在著許多種不同的描述。本文中的元數(shù)據(jù)包括技術(shù)上的元數(shù)據(jù)和業(yè)務(wù)上的元數(shù)據(jù)。技術(shù)上的元數(shù)據(jù)指數(shù)據(jù)源的位置、數(shù)據(jù)訪問協(xié)議(ODBCODBC、JDBCJDBC、SQL*NETSQL*NET 等)、數(shù)據(jù)源的物理結(jié)構(gòu)(如數(shù)據(jù)庫描述、表定義、欄目描述等)、數(shù)據(jù)源的邏輯結(jié)構(gòu)(ERER 模型、目標(biāo)模型、實體模型)等。業(yè)務(wù)上的元數(shù)據(jù)指與信息獲取有關(guān)的上下文信息、 定義企業(yè)組

2、織機構(gòu)和產(chǎn)品層級的分類法、用來定義商業(yè)術(shù)語的控制性詞匯的詞匯表或參考數(shù)據(jù),例如醫(yī)學(xué)詞典、金融術(shù)語等。所謂元數(shù)據(jù)管理,就是對技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)進行管理,其目標(biāo)是為了提升共享、重新獲取和理解企業(yè)信息資產(chǎn)的水平。不對元數(shù)據(jù)進行管理或管理不得當(dāng),信息將被丟失或處于隱匿狀態(tài)而難以被用戶使用,數(shù)據(jù)集成將十分昂貴,不能對業(yè)務(wù)進行有效支撐。終端用戶要識別相關(guān)的信息將十分困難,最終用戶將失去對數(shù)據(jù)的信任。本文描述了元數(shù)據(jù)管理的五級成熟度模型。各個公司可以依據(jù)本公司人們怎樣處理元數(shù)據(jù)的行為特征,利用它作為指導(dǎo),決定公司目前所處的級別。第一級:隨機狀態(tài)(Ad-hocAd-hoc)行為特征在這一級上,對元數(shù)據(jù)的管

3、理是隨機的。元數(shù)據(jù)由莫個人或奧一組人員在局部產(chǎn)生或獲取,并在局部使用。在大多數(shù)時間里,元數(shù)據(jù)是隱匿在信息中,比如存儲于諸如 WordWord、ExcelExcel 等形式的辦公文檔,這些文檔使用的術(shù)語僅局部的用戶能知道其確切含義。人們通過與““責(zé)任人””直接通信或通過信息會話來獲取這些知識。 在局部環(huán)境工作數(shù)月或數(shù)年后,人們使這些元數(shù)據(jù)以及對它的理解內(nèi)在化,使對這種信息有習(xí)慣性的理解。在這一階段,元數(shù)據(jù)通過組織機構(gòu)緩慢的傳播或根本不傳播,這取決于局部小組與其他小組間的通信量的大小,這些元數(shù)據(jù)可能永遠&#82

4、20;“待””在該局部小組或莫個人那兒。如果這樣的小組或個人調(diào)離,則這種元數(shù)據(jù)信息可能永遠丟失。人元數(shù)據(jù)知識保留在人的大腦中。在這種環(huán)境中,知道(或不知道)與誰交談對于理解元數(shù)據(jù)成為一件十分重要的事。處理元數(shù)據(jù)要通過與““責(zé)任人””的交談才能共享。新來者需要通過他們的日常工作來學(xué)習(xí)元數(shù)據(jù)。外部人員難以理解元數(shù)據(jù),他們必須與““責(zé)任人””交談才能得到他們想要的東西。因為元數(shù)據(jù)在局

5、部產(chǎn)生或抓取并在局部使用,所以通常也只能在局部修改,這種修改通常也不會通知公司里其他的組織。技術(shù)可以用各種不同的工具來生成元數(shù)據(jù)。絕大部分是面向個人電腦的應(yīng)用軟件。例如,ERWinERWin 可用于數(shù)據(jù)庫建模,RationaRational l用于為對象建模、ExcelExcel 用于生成商品列表等。這些工具都沒有設(shè)計成可以交換信息,因此,只能在當(dāng)?shù)氐奈募到y(tǒng)中保存所生成的元數(shù)據(jù)。第二級:發(fā)現(xiàn)行為特征在元數(shù)據(jù)管理的這一級上,可以發(fā)現(xiàn)在不同企業(yè)之間的元數(shù)據(jù)。像第一級的情況一樣,元數(shù)據(jù)仍然在局部產(chǎn)生和抓取,然而,它處于可發(fā)現(xiàn)狀態(tài),這樣的元數(shù)據(jù)在企業(yè)一級顯露,使得每一個對它有興趣的人都能隨時了解&a

6、mp;#8220;“什么已經(jīng)存在””o o 元數(shù)據(jù)仍然可以在局部級上維護,然后更新中央知識庫,但它們?nèi)匀皇褂貌煌拿?。結(jié)果,相同的名字被用于表示意義不同的事情,而同一件事情則使用了幾個不同的名字。盡管如此,相比之下,從不同來源來的數(shù)據(jù)和數(shù)據(jù)的含義已經(jīng)具有了更多的透明度。對于商業(yè)用戶,如果他們需要,現(xiàn)存的技術(shù)可為他們提供有關(guān)數(shù)據(jù)的來源和怎樣對數(shù)據(jù)進行計算的信息。人人們開始感知到共享元數(shù)據(jù)信息的重要性。業(yè)務(wù)分析員、數(shù)據(jù)擁有者和應(yīng)用開發(fā)者現(xiàn)在自覺地將元數(shù)據(jù)信息加載到中央知識庫中。處理元數(shù)據(jù)知識經(jīng)由中央數(shù)據(jù)庫進行共享。憑借對中央知識庫地理

7、解,人們能夠發(fā)現(xiàn)在其他應(yīng)用系統(tǒng)中的數(shù)據(jù)。然而,由于使用術(shù)語的不同,人們互相之間需要交流,以便弄清莫些元數(shù)據(jù)的含義。而且,由于元數(shù)據(jù)的更新不受任何方式的控制,使得這種更新沒有告示或貼切的分析。技術(shù)有一些元數(shù)據(jù)管理工具可用于共享來自數(shù)據(jù)源的元數(shù)據(jù),并能把來自不同建模工具的邏輯元數(shù)據(jù)導(dǎo)入到元數(shù)據(jù)知識庫中。AGRochadeAGRochade、UniconUnicon、MetaMatrixMetaMatrix 是該類產(chǎn)品的一些例子。然而,除了以商業(yè)含義來定義數(shù)據(jù)表格的欄目名之外,這些工具沒有一個能很好地抓取元數(shù)據(jù)。第三級:管理控制行為特征這一級對元數(shù)據(jù)的修改進行集中管理。局部業(yè)務(wù)單元或開發(fā)小組如不通知

8、其他的元數(shù)據(jù)保管者和用戶,就不再能按照自己的想法對元數(shù)據(jù)進行修改。在一個地方發(fā)起的元數(shù)據(jù)的修改將傳播給其他地方。有各種工具和方法可用于不同業(yè)務(wù)單元之間交換元數(shù)據(jù)。為了整合不同數(shù)據(jù)源中的數(shù)據(jù),仍然必須用手工進行數(shù)據(jù)的映射,以解決不同數(shù)據(jù)源的數(shù)據(jù)整合。但是,這種映射在一個中央知識庫上進行維護和管理。人數(shù)據(jù)擁有者、應(yīng)用開發(fā)人員、用戶和其他的數(shù)據(jù)保存者現(xiàn)在比以往任何時候更清楚元數(shù)據(jù)管理的重要性。人們遵循有關(guān)元數(shù)據(jù)管理的““監(jiān)督””處理操作規(guī)程。在對元數(shù)據(jù)進行修改前,他們就分析這種修改將會產(chǎn)生的影響。他們認(rèn)識到元數(shù)據(jù)的共享將

9、使組織的運作更有效,并使他們的生活更輕松。處理建立了監(jiān)督體系結(jié)構(gòu)(誰是數(shù)據(jù)和應(yīng)用的擁有者),監(jiān)督資產(chǎn)(數(shù)據(jù)倉庫、數(shù)據(jù)集市、命名標(biāo)準(zhǔn))和流程(何時開始更新、如何更新)。技術(shù)有幾個工具經(jīng)常被用于元數(shù)據(jù)的監(jiān)督處理。SchemaLogicSchemaLogic 是一種新興的工具,通常被用于幫助監(jiān)督處理發(fā)現(xiàn)業(yè)務(wù)的詞匯及其分類。還有一些軟件提供商正在相互競爭,以填補這一空間,但還沒有一家能提供商用的產(chǎn)品。第四級:優(yōu)化行為特征在對元數(shù)據(jù)實施集中存儲并通過監(jiān)督體制對元數(shù)據(jù)進行管理后,企業(yè)會發(fā)現(xiàn),通過標(biāo)準(zhǔn)化和整合可以實施有意義的優(yōu)化。為了優(yōu)化各業(yè)務(wù)單元之間的各種沖突和各個副本,人們開發(fā)了一個企業(yè)數(shù)據(jù)模型和詞匯表

10、。人們可以將這些標(biāo)準(zhǔn)模型和詞匯表用于各種新的應(yīng)用。時機成熟時,可以把各種老的應(yīng)用遷移到這些模型上。人在這一級,人們堅持不懈地探索優(yōu)化的途徑。人們協(xié)同工作,通過在數(shù)據(jù)的入口點確認(rèn)數(shù)據(jù)的有效性來提高數(shù)據(jù)的質(zhì)量。通過確定各業(yè)務(wù)實體的權(quán)威數(shù)據(jù)源,使數(shù)據(jù)的映射達到最小化。數(shù)據(jù)開始從一個業(yè)務(wù)單元平滑地流到另一個業(yè)務(wù)單元,而不用擔(dān)心昂貴的數(shù)據(jù)集成成本。處理首先,生成企業(yè)數(shù)據(jù)模型,并在中央知識庫進行維護。第二,對數(shù)據(jù)模型中定義的每一個實體確定權(quán)威數(shù)據(jù)源或企業(yè)應(yīng)用的主參照數(shù)據(jù),然后將業(yè)務(wù)的上下文信息和含義與這些數(shù)據(jù)源進行關(guān)聯(lián)。在整個組織中對業(yè)務(wù)的詞匯表進行標(biāo)準(zhǔn)化。豉勵應(yīng)用開發(fā)小組使用這些標(biāo)準(zhǔn)化的術(shù)語,來生成、傳

11、播和表示信息。技術(shù)目前,僅有少數(shù)幾個能幫助企業(yè)實施優(yōu)化的工具。而且,每一個工具只能完成其中一到兩個任務(wù),還沒有哪個工具能做企業(yè)優(yōu)化所需的所有事情。第五級:自動化行為特征在這一級,元數(shù)據(jù)管理是自動進行的。當(dāng)在邏輯層次發(fā)生元數(shù)據(jù)更新時,它們將被傳播到物理層次。反之,當(dāng)在物理層次發(fā)生更新時,邏輯層次將被更新,以反映這種更新。在元數(shù)據(jù)中的任何變化也將觸發(fā)業(yè)務(wù)工作流,以處理其他各個業(yè)務(wù)系統(tǒng)所需的相對應(yīng)的任何修改。由于各個應(yīng)用系統(tǒng)遵照相同的詞匯表,它們之間的關(guān)系可以通過知識本體進行推斷,所以,各應(yīng)用系統(tǒng)之間數(shù)據(jù)格式的映射自動產(chǎn)生人人們把元數(shù)據(jù)管理作為常規(guī)業(yè)務(wù)的組成部分。就像電信網(wǎng)對業(yè)務(wù)的支持一樣,元數(shù)據(jù)成為組織運作中一種關(guān)鍵的、普遍存在的、無形的資產(chǎn)。元數(shù)據(jù)管理變成業(yè)務(wù)處理的一個主要組成部分,而且,整個業(yè)務(wù)運作都要依賴于它。事實上,如果元數(shù)據(jù)管理實施得很好,人們可以無需關(guān)心它在何處。在自動化級,元數(shù)據(jù)管理成為一種使能器,而不被視為一種障礙。處理在這一級,元數(shù)據(jù)管理的處理較為理想。絕大多數(shù)處理是自動完成的。人們從手工和程序處理過程中解放由來。他們在元數(shù)據(jù)判定上可以工作得更有效。當(dāng)業(yè)務(wù)變化時,由知識工人對企業(yè)數(shù)據(jù)模型、詞匯表和知識本體進行維護。這樣一種改變立即會在各個應(yīng)用中反

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論