數(shù)據(jù)質(zhì)量對主數(shù)據(jù)管理的重要性_第1頁
數(shù)據(jù)質(zhì)量對主數(shù)據(jù)管理的重要性_第2頁
數(shù)據(jù)質(zhì)量對主數(shù)據(jù)管理的重要性_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、我們都熟知很多大型組織數(shù)據(jù)質(zhì)量差的情況。例如, 你知道發(fā)送給你的信件和賬單上, 你的姓名有多少種拼寫錯誤的版本嗎?這種問題的出現(xiàn)有幾個根本原因。首先, 公司的數(shù)據(jù)質(zhì)量存在基本問題。 人們總是會對激勵做出反應(yīng), 做數(shù)據(jù)錄入的人并不是組織中最高薪的人。 如果他們做銷售, 他們會關(guān)心你 的信用卡消費明細, 因為否則的話他們不會得到支付傭金, 但是其它關(guān)于你的信息可能就不 會太吸引他們了。但是, 一旦獲取了數(shù)據(jù),新的問題就出現(xiàn)了。 數(shù)據(jù)過時的很快:根據(jù)美國人口普查局的 數(shù)據(jù)顯示,在美國每年有15%的人群變更地址(在英國這個數(shù)值大約是11%)。對于你打交道的所有公司和政府部門,有多少會及時更新你的個人數(shù)

2、據(jù)?當然, 在這里我們是在談?wù)摷償?shù)據(jù)質(zhì)量問題, 也就是地址記錄正確還是錯誤。 在大公司 和數(shù)據(jù)占重要地位的情況下會有更多潛在問題。根據(jù)我的公司 2008 年的一份“信息差異” 調(diào)查,平均來看, 大公司有六套不同的系統(tǒng)來保存設(shè)想中的客戶主數(shù)據(jù), 平均有九套生產(chǎn)數(shù) 據(jù),有 13%的參與調(diào)查者有 100 套以上的數(shù)據(jù)來源。 沒有人打算把這一團混亂的情況暴露出 來,但是大部分大型公司都有成打的甚至有上百套獨立的應(yīng)用(這更切合實際的情況) ,從 ERP到銷售協(xié)力自動控制,從供應(yīng)鏈到營銷等等各種系統(tǒng),大量的電子表格推動了許多公司。當新應(yīng)用部署時, 從手工臺賬、 電子表格或者從其它一些現(xiàn)存的信息來源提取信息

3、是很 常見的事情。 理想情況下可能會有合適的維護界面, 但是更可能是一次性數(shù)據(jù)導(dǎo)入, 隨著時 間推移這些來源會開始慢慢分離,因為它們是獨立維護的。即便這種問題可以避免, 但是對于收購其他公司的公司, 合并過來的計算機系統(tǒng)是不可 能魔術(shù)般地一夜之間完成整合; 一次整合可能會花上幾年時間。 對于一年要做許多收購的全 球化公司,我們不難看到, 即使是最純粹最完備的技術(shù)架構(gòu)也會很快出現(xiàn)不一致數(shù)據(jù)的問題。走進主數(shù)據(jù)管理該是主數(shù)據(jù)管理( MDM )登場的時候了。它基本上不是一個新話題,但是在過去幾十 年來,人們開發(fā)了那么多種技術(shù),為管理主數(shù)據(jù)(區(qū)別于傳統(tǒng)數(shù)據(jù))提供了專門的集線器。 這種思路考慮, 這些集線

4、器可以提供單一的授權(quán)的主數(shù)據(jù)源, 給需要信息的其它系統(tǒng)。 然而, 主數(shù)據(jù)管理基本還處在初生期, 甚至還未進入青少年期, 相對來講只有很少部分公司能夠完 整地在整個企業(yè)范圍內(nèi)和所有數(shù)據(jù)領(lǐng)域范圍內(nèi)成功實施主數(shù)據(jù)管理。比較明確的一點是,主數(shù)據(jù)策略和數(shù)據(jù)質(zhì)量是密切相關(guān)的。在2010 年的信息差異調(diào)查報告中, 參與調(diào)查者表示他們 10%的主數(shù)據(jù)管理項目有數(shù)據(jù)質(zhì)量活動的預(yù)算, 而實際花費平 均值為 30%,是他們估算預(yù)期的三倍。 隨著時間推移, 許多主數(shù)據(jù)管理供應(yīng)商都充分意識到 了這一點。數(shù)據(jù)質(zhì)量市場在一開始的時候,很少有供應(yīng)商集成數(shù)據(jù)質(zhì)量產(chǎn)品, 大部分可選的 “合作伙伴”都是與 數(shù)據(jù)質(zhì)量供應(yīng)商約定的,比

5、如 Trillium 和 Address Doctor (已經(jīng)被 Informatica 公司收購)。數(shù)據(jù)質(zhì)量市場一直有一個圍繞處理客戶名稱和地址的問題,許多供應(yīng)商擅長處理本地郵政地址,但是很少有供應(yīng)商能提供有效的輸入給其它數(shù)據(jù)領(lǐng)域,比如產(chǎn)品或資產(chǎn)數(shù)據(jù)。這種領(lǐng)域比客戶姓名和地址更復(fù)雜,結(jié)構(gòu)化程度更低。所以以眾所周知的算法應(yīng)用簡單規(guī)則的方式就更難執(zhí)行了,比如"Soundex”和"Levenshtein”可以被應(yīng)用于客戶數(shù)據(jù)。相對而言,很少有數(shù)據(jù)質(zhì)量供應(yīng)商在客戶數(shù)據(jù)上迷失,盡管有一些供應(yīng)商(比如:Datactics公司,Inquera公司和已經(jīng)被甲骨文公司收購的Silver C

6、reek公司)是專門做產(chǎn)品數(shù)據(jù)的。我認為這種集成會走的更遠。雖然不考慮主數(shù)據(jù)管理也可能執(zhí)行數(shù)據(jù)質(zhì)量項目,但是反過來就不一定了:每個主數(shù)據(jù)項目必須有數(shù)據(jù)質(zhì)量組件。如果你不這么認為,你的公司很快就會發(fā)現(xiàn)數(shù)據(jù)質(zhì)量工作會消耗掉你主數(shù)據(jù)管理預(yù)算的巨大部分。這是因為數(shù)據(jù)質(zhì)量的狀況總是比人們預(yù)想的要糟糕一一我從沒有看到一個主數(shù)據(jù)管理項目的數(shù)據(jù)質(zhì)量比預(yù)期的要更好。對于主數(shù)據(jù)管理軟件供應(yīng)商來說,更重要的應(yīng)該是考慮數(shù)據(jù)質(zhì)量如何可以無縫地嵌入到他們的軟件中,尤其是關(guān)于如何處理比客戶姓名和地址更進一步的數(shù)據(jù)質(zhì)量。市場上有大量數(shù)據(jù)質(zhì)量供應(yīng)商,所以有許多合作伙伴和并購機會,但是不固定的合作關(guān)系對于目前環(huán)境來講并不是什么好

7、事。從企業(yè)的視角來看,這意味著數(shù)據(jù)質(zhì)量為主數(shù)據(jù)管理項目的核心部分,你需要在評估軟件和規(guī)劃項目時考慮它, 研究供應(yīng)商提供了哪些數(shù)據(jù)質(zhì)量功能,集成性能好不好,在你的特定數(shù)據(jù)環(huán)境下運行情況如何。如果你的主數(shù)據(jù)管理項目主旨是圍繞產(chǎn)品、資產(chǎn)或者金融數(shù)據(jù)的話,供應(yīng)商提供的客戶數(shù)據(jù)匹配算法演示不能說明什么。最重要的是,要為你項目中的數(shù)據(jù)質(zhì)量組件留出充足的資源。5771001803090012095 5790368228596330825771001803090012386 5761373997357606965771001803090013594 578077579902515512577100180309

8、0012387 5771649826018180515771001803090012138 5721311921589183265771001803090012359 5790368223610760535771001803090012356 5761352861437917425771001803090012355 57508786970469327917088100343355274 10122994432583337917088100343355275 10186673293883200817088100343356107 10158115250150052217088100343356108 10100018005987173217088100343354295 10107419414268701717088100343356184 10187866086962880217088100343356185 10177583117408667417088100343356109 10108601437357284617088100343356110 1011522072160149161708810

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論