元數(shù)據(jù)管理的五種成熟度_第1頁
元數(shù)據(jù)管理的五種成熟度_第2頁
元數(shù)據(jù)管理的五種成熟度_第3頁
元數(shù)據(jù)管理的五種成熟度_第4頁
元數(shù)據(jù)管理的五種成熟度_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、元數(shù)據(jù)管理的五種成熟度. 元數(shù)據(jù)管理的五種成熟度 當企業(yè)內外部的數(shù)據(jù)越來越多時,元數(shù)據(jù)管理就會成為許多公司的一個關鍵問題。本文從用戶、處理和技術的不同角度,描述企業(yè)元數(shù)據(jù)管理的不同成熟度模型和企業(yè)沿著成熟度階梯向上提升的步驟。 對于什么是元數(shù)據(jù),目前存在著許多種不同的描述。本文中的元數(shù)據(jù)包括技術上的元數(shù)據(jù)和業(yè)務上的元數(shù)據(jù)。技術上的元數(shù)據(jù)指數(shù)據(jù)源的位置、數(shù)據(jù)訪問協(xié)議(ODBC、JDBC、SQL*NET等)、數(shù)據(jù)源的物理結構(如數(shù)據(jù)庫描述、表定義、欄目描述等)、數(shù)據(jù)源的邏輯結構(ER模型、目標模型、實體模型)等。業(yè)務上的元數(shù)據(jù)指與信息獲取有關的上下文信息、定義企業(yè)組織機構和產(chǎn)品層級的分類法、用來定

2、義商業(yè)術語的控制性詞匯的詞匯表或參考數(shù)據(jù),例如醫(yī)學詞典、金融術語等。 所謂元數(shù)據(jù)管理,就是對技術元數(shù)據(jù)和業(yè)務元數(shù)據(jù)進行管理,其目標是為了提升共享、重新獲取和理解企業(yè)信息資產(chǎn)的水平。不對元數(shù)據(jù)進行管理或管理不得當,信息將被丟失或處于隱匿狀態(tài)而難以被用戶使用,數(shù)據(jù)集成將十分昂貴,不能對業(yè)務進行有效支撐。終端用戶要識別相關的信息將十分困難,最終用戶將失去對數(shù)據(jù)的信任。本文描述了元數(shù)據(jù)管理的五級成熟度模型。各個公司可以依據(jù)本公司人們怎樣處理元數(shù)據(jù)的行為特征,利用它作為指導,決定公司目前所處的級別。 第一級: 隨機狀態(tài)(Ad-hoc) 行為特征 在這一級上,對元數(shù)據(jù)的管理是隨機的。元數(shù)據(jù)由某個人或某一組

3、人員在局部產(chǎn)生或獲取,并在局部使用。在大多數(shù)時間里,元數(shù)據(jù)是隱匿在信息中,比如存儲于諸如Word、Excel等形式的辦公文檔,這些文檔使用的術語僅局部的用戶能知道其確切含義。人們通過與“責任人”直接通信或通過信息會話來獲取這些知識。在局部環(huán)境工作數(shù)月或數(shù)年后,人們使這些元數(shù)據(jù)以及對它的理解內在化,使對這種信息有習慣性的理解。 在這一階段,元數(shù)據(jù)通過組織機構緩慢的傳播或根本不傳播,這取決于局部小組與其他小組間的通信量的大小,這些元數(shù)據(jù)可能永遠“待”在該局部小組或某個人那兒。如果這樣的小組或個人調離,則這種元數(shù)據(jù)信息可

4、能永遠丟失。 人 元數(shù)據(jù)知識保留在人的大腦中。在這種環(huán)境中,知道(或不知道)與誰交談對于理解元數(shù)據(jù)成為一件十分重要的事。 處理 元數(shù)據(jù)要通過與“責任人”的交談才能共享。新來者需要通過他們的日常工作來學習元數(shù)據(jù)。外部人員難以理解元數(shù)據(jù),他們必須與“責任人”交談才能得到他們想要的東西。因為元數(shù)據(jù)在局部產(chǎn)生或抓取并在局部使用,所以通常也只能在局部修改,這種修改通常也不會通知公司里其他的組織。 技術 可以用各種不同的工具來生成元數(shù)據(jù)。絕大部分是面向個人電腦的應用軟件。例如,ERWin可用于數(shù)據(jù)庫建模,Rational用于為

5、對象建模、Excel用于生成商品列表等。這些工具都沒有設計成可以交換信息,因此,只能在當?shù)氐奈募到y(tǒng)中保存所生成的元數(shù)據(jù)。 第二級: 發(fā)現(xiàn) 行為特征 在元數(shù)據(jù)管理的這一級上,可以發(fā)現(xiàn)在不同企業(yè)之間的元數(shù)據(jù)。像第一級的情況一樣,元數(shù)據(jù)仍然在局部產(chǎn)生和抓取,然而,它處于可發(fā)現(xiàn)狀態(tài),這樣的元數(shù)據(jù)在企業(yè)一級顯露,使得每一個對它有興趣的人都能隨時了解“什么已經(jīng)存在”。元數(shù)據(jù)仍然可以在局部級上維護,然后更新中央知識庫,但它們仍然使用不同的命名法。結果,相同的名字被用于表示意義不同的事情,而同一件事情則使用了幾個不同的名字。 盡管如此,相比之下,從不同來源來的數(shù)據(jù)和數(shù)

6、據(jù)的含義已經(jīng)具有了更多的透明度。對于商業(yè)用戶,如果他們需要,現(xiàn)存的技術可為他們提供有關數(shù)據(jù)的來源和怎樣對數(shù)據(jù)進行計算的信息。 人 人們開始感知到共享元數(shù)據(jù)信息的重要性。業(yè)務分析員、數(shù)據(jù)擁有者和應用開發(fā)者現(xiàn)在自覺地將元數(shù)據(jù)信息加載到中央知識庫中。 處理 元數(shù)據(jù)知識經(jīng)由中央數(shù)據(jù)庫進行共享。憑借對中央知識庫地理解,人們能夠發(fā)現(xiàn)在其他應用系統(tǒng)中的數(shù)據(jù)。然而,由于使用術語的不同,人們互相之間需要交流,以便弄清某些元數(shù)據(jù)的含義。而且,由于元數(shù)據(jù)的更新不受任何方式的控制,使得這種更新沒有告示或貼切的分析。 技術 有一些元數(shù)據(jù)管理工具可用于共享來自數(shù)據(jù)源的元數(shù)據(jù),并能把來自不同建模工具的邏輯元數(shù)據(jù)導入到元數(shù)據(jù)

7、知識庫中。AG Rochade、Unicon、MetaMatrix是該類產(chǎn)品的一些例子。然而,除了以商業(yè)含義來定義數(shù)據(jù)表格的欄目名之外,這些工具沒有一個能很好地抓取元數(shù)據(jù)。 第三級: 管理控制 行為特征 這一級對元數(shù)據(jù)的修改進行集中管理。局部業(yè)務單元或開發(fā)小組如不通知其他的元數(shù)據(jù)保管者和用戶,就不再能按照自己的想法對元數(shù)據(jù)進行修改。在一個地方發(fā)起的元數(shù)據(jù)的修改將傳播給其他地方。有各種工具和方法可用于不同業(yè)務單元之間交換元數(shù)據(jù)。為了整合不同數(shù)據(jù)源中的數(shù)據(jù),仍然必須用手工進行數(shù)據(jù)的映射,以解決不同數(shù)據(jù)源的數(shù)據(jù)整合。但是,這種映射在一個中央知識庫上進行維護和管理。 人 數(shù)據(jù)擁有者、應用開發(fā)人員、用戶

8、和其他的數(shù)據(jù)保存者現(xiàn)在比以往任何時候更清楚元數(shù)據(jù)管理的重要性。人們遵循有關元數(shù)據(jù)管理的“監(jiān)督”處理操作規(guī)程。在對元數(shù)據(jù)進行修改前,他們就分析這種修改將會產(chǎn)生的影響。他們認識到元數(shù)據(jù)的共享將使組織的運作更有效,并使他們的生活更輕松。 處理 建立了監(jiān)督體系結構(誰是數(shù)據(jù)和應用的擁有者),監(jiān)督資產(chǎn)(數(shù)據(jù)倉庫、數(shù)據(jù)集市、命名標準)和流程(何時開始更新、如何更新)。 技術 有幾個工具經(jīng)常被用于元數(shù)據(jù)的監(jiān)督處理。SchemaLogic是一種新興的工具,通常被用于幫助監(jiān)督處理發(fā)現(xiàn)業(yè)務的詞匯及其分類。還有一些軟件提供商正在相互競爭,以填補這一空間,但還沒有一家能提供商用

9、的產(chǎn)品。 第四級: 優(yōu)化 行為特征 在對元數(shù)據(jù)實施集中存儲并通過監(jiān)督體制對元數(shù)據(jù)進行管理后,企業(yè)會發(fā)現(xiàn),通過標準化和整合可以實施有意義的優(yōu)化。為了優(yōu)化各業(yè)務單元之間的各種沖突和各個副本,人們開發(fā)了一個企業(yè)數(shù)據(jù)模型和詞匯表。人們可以將這些標準模型和詞匯表用于各種新的應用。時機成熟時,可以把各種老的應用遷移到這些模型上。 人 在這一級,人們堅持不懈地探索優(yōu)化的途徑。人們協(xié)同工作,通過在數(shù)據(jù)的入口點確認數(shù)據(jù)的有效性來提高數(shù)據(jù)的質量。通過確定各業(yè)務實體的權威數(shù)據(jù)源,使數(shù)據(jù)的映射達到最小化。數(shù)據(jù)開始從一個業(yè)務單元平滑地流到另一個業(yè)務單元,而不用擔心昂貴的數(shù)據(jù)集成成本。 處理 首先,生成企業(yè)數(shù)據(jù)模型,并在

10、中央知識庫進行維護。第二,對數(shù)據(jù)模型中定義的每一個實體確定權威數(shù)據(jù)源或企業(yè)應用的主參照數(shù)據(jù),然后將業(yè)務的上下文信息和含義與這些數(shù)據(jù)源進行關聯(lián)。在整個組織中對業(yè)務的詞匯表進行標準化。鼓勵應用開發(fā)小組使用這些標準化的術語,來生成、傳播和表示信息。 技術 目前,僅有少數(shù)幾個能幫助企業(yè)實施優(yōu)化的工具。而且,每一個工具只能完成其中一到兩個任務,還沒有哪個工具能做企業(yè)優(yōu)化所需的所有事情。 第五級: 自動化 行為特征 在這一級,元數(shù)據(jù)管理是自動進行的。當在邏輯層次發(fā)生元數(shù)據(jù)更新時,它們將被傳播到物理層次。反之,當在物理層次發(fā)生更新時,邏輯層次將被更新,以反映這種更新。在元數(shù)據(jù)中的任何變化也將觸發(fā)業(yè)務工作流,

11、以處理其他各個業(yè)務系統(tǒng)所需的相對應的任何修改。由于各個應用系統(tǒng)遵照相同的詞匯表,它們之間的關系可以通過知識本體進行推斷,所以,各應用系統(tǒng)之間數(shù)據(jù)格式的映射自動產(chǎn)生。 人 人們把元數(shù)據(jù)管理作為常規(guī)業(yè)務的組成部分。就像電信網(wǎng)對業(yè)務的支持一樣,元數(shù)據(jù)成為組織運作中一種關鍵的、普遍存在的、無形的資產(chǎn)。元數(shù)據(jù)管理變成業(yè)務處理的一個主要組成部分,而且,整個業(yè)務運作都要依賴于它。事實上,如果元數(shù)據(jù)管理實施得很好,人們可以無需關心它在何處。在自動化級,元數(shù)據(jù)管理成為一種使能器,而不被視為一種障礙。 處理 在這一級,元數(shù)據(jù)管理的處理較為理想。絕大多數(shù)處理是自動完成的。人們從手工和程序處理過程中解放出來。他們在元數(shù)據(jù)判定上可以工作得更有效。當業(yè)務變化時,由知識工人對企業(yè)數(shù)據(jù)模型、詞匯表和知識本體進行維護。這樣一種改變立即會在各個應用中反映出來。例如,假如一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論