




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2萬(wàn)字詳解數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)指標(biāo)數(shù)據(jù)治理體系建設(shè)方法論一、數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)概念英文名稱(chēng)為DataWarehouse,可簡(jiǎn)寫(xiě)為DW或DWH。數(shù)據(jù)倉(cāng)庫(kù)的目的是構(gòu)建面向分析的集成化數(shù)據(jù)環(huán)境,為企業(yè)提供決策支持(DecisionSupport)。它出于分析性報(bào)告和決策支持目的而創(chuàng)建。數(shù)據(jù)倉(cāng)庫(kù)本身并不“生產(chǎn)”任何數(shù)據(jù),同時(shí)自身也不需要“消費(fèi)”任何的數(shù)據(jù),數(shù)據(jù)來(lái)源于外部,并且開(kāi)放給外部應(yīng)用,這也是為什么叫“倉(cāng)庫(kù)”,而不叫“工廠”的原因?;咎卣鲾?shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、非易失的和時(shí)變的數(shù)據(jù)集合,用以支持管理決策。面向主題:
傳統(tǒng)數(shù)據(jù)庫(kù)中,最大的特點(diǎn)是面向應(yīng)用進(jìn)行數(shù)據(jù)的組織,各個(gè)業(yè)務(wù)系統(tǒng)可能是相互分離的。而數(shù)據(jù)倉(cāng)庫(kù)則是面向主題的。主題是一個(gè)抽象的概念,是較高層次上企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類(lèi)并進(jìn)行分析利用的抽象。在邏輯意義上,它是對(duì)應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對(duì)象。
集成性:
通過(guò)對(duì)分散、獨(dú)立、異構(gòu)的數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行抽取、清理、轉(zhuǎn)換和匯總便得到了數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù),這樣保證了數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)關(guān)于整個(gè)企業(yè)的一致性。
數(shù)據(jù)倉(cāng)庫(kù)中的綜合數(shù)據(jù)不能從原有的數(shù)據(jù)庫(kù)系統(tǒng)直接得到。因此在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,必然要經(jīng)過(guò)統(tǒng)一與綜合,這一步是數(shù)據(jù)倉(cāng)庫(kù)建設(shè)中最關(guān)鍵、最復(fù)雜的一步,所要完成的工作有:
要統(tǒng)一源數(shù)據(jù)中所有矛盾之處,如字段的同名異義、異名同義、單位不統(tǒng)一、字長(zhǎng)不一致,等等。
進(jìn)行數(shù)據(jù)綜合和計(jì)算。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)綜合工作可以在從原有數(shù)據(jù)庫(kù)抽取數(shù)據(jù)時(shí)生成,但許多是在數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部生成的,即進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后進(jìn)行綜合生成的。
下圖說(shuō)明一個(gè)保險(xiǎn)公司綜合數(shù)據(jù)的簡(jiǎn)單處理過(guò)程,其中數(shù)據(jù)倉(cāng)庫(kù)中與“保險(xiǎn)”主題有關(guān)的數(shù)據(jù)來(lái)自于多個(gè)不同的操作型系統(tǒng)。這些系統(tǒng)內(nèi)部數(shù)據(jù)的命名可能不同,數(shù)據(jù)格式也可能不同。把不同來(lái)源的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)之前,需要去除這些不一致。非易失性(不可更新性)
數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)反映的是一段相當(dāng)長(zhǎng)的時(shí)間內(nèi)歷史數(shù)據(jù)的內(nèi)容,是不同時(shí)點(diǎn)的數(shù)據(jù)庫(kù)快照的集合,以及基于這些快照進(jìn)行統(tǒng)計(jì)、綜合和重組的導(dǎo)出數(shù)據(jù)。
數(shù)據(jù)非易失性主要是針對(duì)應(yīng)用而言。數(shù)據(jù)倉(cāng)庫(kù)的用戶(hù)對(duì)數(shù)據(jù)的操作大多是數(shù)據(jù)查詢(xún)或比較復(fù)雜的挖掘,一旦數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下被較長(zhǎng)時(shí)間保留。數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢(xún)操作,但修改和刪除操作很少。因此,數(shù)據(jù)經(jīng)加工和集成進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)后是極少更新的,通常只需要定期的加載和更新。
時(shí)變性
數(shù)據(jù)倉(cāng)庫(kù)包含各種粒度的歷史數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)可能與某個(gè)特定日期、星期、月份、季度或者年份有關(guān)。數(shù)據(jù)倉(cāng)庫(kù)的目的是通過(guò)分析企業(yè)過(guò)去一段時(shí)間業(yè)務(wù)的經(jīng)營(yíng)狀況,挖掘其中隱藏的模式。雖然數(shù)據(jù)倉(cāng)庫(kù)的用戶(hù)不能修改數(shù)據(jù),但并不是說(shuō)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是永遠(yuǎn)不變的。分析的結(jié)果只能反映過(guò)去的情況,當(dāng)業(yè)務(wù)變化后,挖掘出的模式會(huì)失去時(shí)效性。因此數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)需要更新,以適應(yīng)決策的需要。從這個(gè)角度講,數(shù)據(jù)倉(cāng)庫(kù)建設(shè)是一個(gè)項(xiàng)目,更是一個(gè)過(guò)程。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)隨時(shí)間的變化表現(xiàn)在以下幾個(gè)方面:
(1)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)時(shí)限一般要遠(yuǎn)遠(yuǎn)長(zhǎng)于操作型數(shù)據(jù)的數(shù)據(jù)時(shí)限。
(2)操作型系統(tǒng)存儲(chǔ)的是當(dāng)前數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是歷史數(shù)據(jù)。
(3)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照時(shí)間順序追加的,它們都帶有時(shí)間屬性。數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)的區(qū)別數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別實(shí)際講的是OLTP與OLAP的區(qū)別。操作型處理,叫聯(lián)機(jī)事務(wù)處理OLTP(On-LineTransactionProcessing,),也可以稱(chēng)面向交易的處理系統(tǒng),它是針對(duì)具體業(yè)務(wù)在數(shù)據(jù)庫(kù)聯(lián)機(jī)的日常操作,通常對(duì)少數(shù)記錄進(jìn)行查詢(xún)、修改。用戶(hù)較為關(guān)心操作的響應(yīng)時(shí)間、數(shù)據(jù)的安全性、完整性和并發(fā)支持的用戶(hù)數(shù)等問(wèn)題。傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)作為數(shù)據(jù)管理的主要手段,主要用于操作型處理,像Mysql,Oracle等關(guān)系型數(shù)據(jù)庫(kù)一般屬于OLTP。分析型處理,叫聯(lián)機(jī)分析處理OLAP(On-LineAnalyticalProcessing)一般針對(duì)某些主題的歷史數(shù)據(jù)進(jìn)行分析,支持管理決策。首先要明白,數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn),并不是要取代數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是面向主題設(shè)計(jì)的。數(shù)據(jù)庫(kù)一般存儲(chǔ)業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)的一般是歷史數(shù)據(jù)。數(shù)據(jù)庫(kù)設(shè)計(jì)是盡量避免冗余,一般針對(duì)某一業(yè)務(wù)應(yīng)用進(jìn)行設(shè)計(jì),比如一張簡(jiǎn)單的User表,記錄用戶(hù)名、密碼等簡(jiǎn)單數(shù)據(jù)即可,符合業(yè)務(wù)應(yīng)用,但是不符合分析。數(shù)據(jù)倉(cāng)庫(kù)在設(shè)計(jì)是有意引入冗余,依照分析需求,分析維度、分析指標(biāo)進(jìn)行設(shè)計(jì)。數(shù)據(jù)庫(kù)是為捕獲數(shù)據(jù)而設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是為分析數(shù)據(jù)而設(shè)計(jì)。以銀行業(yè)務(wù)為例。數(shù)據(jù)庫(kù)是事務(wù)系統(tǒng)的數(shù)據(jù)平臺(tái),客戶(hù)在銀行做的每筆交易都會(huì)寫(xiě)入數(shù)據(jù)庫(kù),被記錄下來(lái),這里,可以簡(jiǎn)單地理解為用數(shù)據(jù)庫(kù)記賬。數(shù)據(jù)倉(cāng)庫(kù)是分析系統(tǒng)的數(shù)據(jù)平臺(tái),它從事務(wù)系統(tǒng)獲取數(shù)據(jù),并做匯總、加工,為決策者提供決策的依據(jù)。比如,某銀行某分行一個(gè)月發(fā)生多少交易,該分行當(dāng)前存款余額是多少。如果存款又多,消費(fèi)交易又多,那么該地區(qū)就有必要設(shè)立ATM了。
顯然,銀行的交易量是巨大的,通常以百萬(wàn)甚至千萬(wàn)次來(lái)計(jì)算。事務(wù)系統(tǒng)是實(shí)時(shí)的,這就要求時(shí)效性,客戶(hù)存一筆錢(qián)需要幾十秒是無(wú)法忍受的,這就要求數(shù)據(jù)庫(kù)只能存儲(chǔ)很短一段時(shí)間的數(shù)據(jù)。而分析系統(tǒng)是事后的,它要提供關(guān)注時(shí)間段內(nèi)所有的有效數(shù)據(jù)。這些數(shù)據(jù)是海量的,匯總計(jì)算起來(lái)也要慢一些,但是,只要能夠提供有效的分析數(shù)據(jù)就達(dá)到目的了。數(shù)據(jù)倉(cāng)庫(kù),是在數(shù)據(jù)庫(kù)已經(jīng)大量存在的情況下,為了進(jìn)一步挖掘數(shù)據(jù)資源、為了決策需要而產(chǎn)生的,它決不是所謂的“大型數(shù)據(jù)庫(kù)”。數(shù)據(jù)倉(cāng)庫(kù)分層架構(gòu)按照數(shù)據(jù)流入流出的過(guò)程,數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)可分為:源數(shù)據(jù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)源于不同的源數(shù)據(jù),并提供多樣的數(shù)據(jù)應(yīng)用,數(shù)據(jù)自下而上流入數(shù)據(jù)倉(cāng)庫(kù)后向上層開(kāi)放應(yīng)用,而數(shù)據(jù)倉(cāng)庫(kù)只是中間集成化數(shù)據(jù)管理的一個(gè)平臺(tái)。源數(shù)據(jù):此層數(shù)據(jù)無(wú)任何更改,直接沿用外圍系統(tǒng)數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù),不對(duì)外開(kāi)放;為臨時(shí)存儲(chǔ)層,是接口數(shù)據(jù)的臨時(shí)存儲(chǔ)區(qū)域,為后一步的數(shù)據(jù)處理做準(zhǔn)備。數(shù)據(jù)倉(cāng)庫(kù):也稱(chēng)為細(xì)節(jié)層,DW層的數(shù)據(jù)應(yīng)該是一致的、準(zhǔn)確的、干凈的數(shù)據(jù),即對(duì)源系統(tǒng)數(shù)據(jù)進(jìn)行了清洗(去除了雜質(zhì))后的數(shù)據(jù)。數(shù)據(jù)應(yīng)用:前端應(yīng)用直接讀取的數(shù)據(jù)源;根據(jù)報(bào)表、專(zhuān)題分析需求而計(jì)算生成的數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)從各數(shù)據(jù)源獲取數(shù)據(jù)及在數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)轉(zhuǎn)換和流動(dòng)都可以認(rèn)為是ETL(抽取Extra,轉(zhuǎn)化Transfer,裝載Load)的過(guò)程,ETL是數(shù)據(jù)倉(cāng)庫(kù)的流水線,也可以認(rèn)為是數(shù)據(jù)倉(cāng)庫(kù)的血液,它維系著數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的新陳代謝,而數(shù)據(jù)倉(cāng)庫(kù)日常的管理和維護(hù)工作的大部分精力就是保持ETL的正常和穩(wěn)定。那么為什么要數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行分層呢?用空間換時(shí)間,通過(guò)大量的預(yù)處理來(lái)提升應(yīng)用系統(tǒng)的用戶(hù)體驗(yàn)(效率),因此數(shù)據(jù)倉(cāng)庫(kù)會(huì)存在大量冗余的數(shù)據(jù);不分層的話,如果源業(yè)務(wù)系統(tǒng)的業(yè)務(wù)規(guī)則發(fā)生變化將會(huì)影響整個(gè)數(shù)據(jù)清洗過(guò)程,工作量巨大。
通過(guò)數(shù)據(jù)分層管理可以簡(jiǎn)化數(shù)據(jù)清洗的過(guò)程,因?yàn)榘言瓉?lái)一步的工作分到了多個(gè)步驟去完成,相當(dāng)于把一個(gè)復(fù)雜的工作拆成了多個(gè)簡(jiǎn)單的工作,把一個(gè)大的黑盒變成了一個(gè)白盒,每一層的處理邏輯都相對(duì)簡(jiǎn)單和容易理解,這樣我們比較容易保證每一個(gè)步驟的正確性,當(dāng)數(shù)據(jù)發(fā)生錯(cuò)誤的時(shí)候,往往我們只需要局部調(diào)整某個(gè)步驟即可。數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)的管理元數(shù)據(jù)(MetaDate),主要記錄數(shù)據(jù)倉(cāng)庫(kù)中模型的定義、各層級(jí)間的映射關(guān)系、監(jiān)控?cái)?shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)狀態(tài)及ETL的任務(wù)運(yùn)行狀態(tài)。一般會(huì)通過(guò)元數(shù)據(jù)資料庫(kù)(MetadataRepository)來(lái)統(tǒng)一地存儲(chǔ)和管理元數(shù)據(jù),其主要目的是使數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)、部署、操作和管理能達(dá)成協(xié)同和一致。元數(shù)據(jù)是數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)的重要組成部分,元數(shù)據(jù)管理是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)中的關(guān)鍵組件,貫穿數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建的整個(gè)過(guò)程,直接影響著數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建、使用和維護(hù)。構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的主要步驟之一是ETL。這時(shí)元數(shù)據(jù)將發(fā)揮重要的作用,它定義了源數(shù)據(jù)系統(tǒng)到數(shù)據(jù)倉(cāng)庫(kù)的映射、數(shù)據(jù)轉(zhuǎn)換的規(guī)則、數(shù)據(jù)倉(cāng)庫(kù)的邏輯結(jié)構(gòu)、數(shù)據(jù)更新的規(guī)則、數(shù)據(jù)導(dǎo)入歷史記錄以及裝載周期等相關(guān)內(nèi)容。數(shù)據(jù)抽取和轉(zhuǎn)換的專(zhuān)家以及數(shù)據(jù)倉(cāng)庫(kù)管理員正是通過(guò)元數(shù)據(jù)高效地構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。
用戶(hù)在使用數(shù)據(jù)倉(cāng)庫(kù)時(shí),通過(guò)元數(shù)據(jù)訪問(wèn)數(shù)據(jù),明確數(shù)據(jù)項(xiàng)的含義以及定制報(bào)表。
數(shù)據(jù)倉(cāng)庫(kù)的規(guī)模及其復(fù)雜性離不開(kāi)正確的元數(shù)據(jù)管理,包括增加或移除外部數(shù)據(jù)源,改變數(shù)據(jù)清洗方法,控制出錯(cuò)的查詢(xún)以及安排備份等。元數(shù)據(jù)可分為技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。技術(shù)元數(shù)據(jù)為開(kāi)發(fā)和管理數(shù)據(jù)倉(cāng)庫(kù)的IT人員使用,它描述了與數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)、管理和維護(hù)相關(guān)的數(shù)據(jù),包括數(shù)據(jù)源信息、數(shù)據(jù)轉(zhuǎn)換描述、數(shù)據(jù)倉(cāng)庫(kù)模型、數(shù)據(jù)清洗與更新規(guī)則、數(shù)據(jù)映射和訪問(wèn)權(quán)限等。而業(yè)務(wù)元數(shù)據(jù)為管理層和業(yè)務(wù)分析人員服務(wù),從業(yè)務(wù)角度描述數(shù)據(jù),包括商務(wù)術(shù)語(yǔ)、數(shù)據(jù)倉(cāng)庫(kù)中有什么數(shù)據(jù)、數(shù)據(jù)的位置和數(shù)據(jù)的可用性等,幫助業(yè)務(wù)人員更好地理解數(shù)據(jù)倉(cāng)庫(kù)中哪些數(shù)據(jù)是可用的以及如何使用。由上可見(jiàn),元數(shù)據(jù)不僅定義了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的模式、來(lái)源、抽取和轉(zhuǎn)換規(guī)則等,而且是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)運(yùn)行的基礎(chǔ),元數(shù)據(jù)把數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中各個(gè)松散的組件聯(lián)系起來(lái),組成了一個(gè)有機(jī)的整體。數(shù)倉(cāng)建模方法數(shù)據(jù)倉(cāng)庫(kù)的建模方法有很多種,每一種建模方法代表了哲學(xué)上的一個(gè)觀點(diǎn),代表了一種歸納、概括世界的一種方法。常見(jiàn)的有范式建模法、維度建模法、實(shí)體建模法等,每種方法從本質(zhì)上將是從不同的角度看待業(yè)務(wù)中的問(wèn)題。1.范式建模法(ThirdNormalForm,3NF)范式建模法其實(shí)是我們?cè)跇?gòu)建數(shù)據(jù)模型常用的一個(gè)方法,該方法的主要由Inmon所提倡,主要解決關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ),利用的一種技術(shù)層面上的方法。目前,我們?cè)陉P(guān)系型數(shù)據(jù)庫(kù)中的建模方法,大部分采用的是三范式建模法。范式是符合某一種級(jí)別的關(guān)系模式的集合。構(gòu)造數(shù)據(jù)庫(kù)必須遵循一定的規(guī)則,而在關(guān)系型數(shù)據(jù)庫(kù)中這種規(guī)則就是范式,這一過(guò)程也被稱(chēng)為規(guī)范化。目前關(guān)系數(shù)據(jù)庫(kù)有六種范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、Boyce-Codd范式(BCNF)、第四范式(4NF)和第五范式(5NF)。在數(shù)據(jù)倉(cāng)庫(kù)的模型設(shè)計(jì)中,一般采用第三范式。一個(gè)符合第三范式的關(guān)系必須具有以下三個(gè)條件:每個(gè)屬性值唯一,不具有多義性;
每個(gè)非主屬性必須完全依賴(lài)于整個(gè)主鍵,而非主鍵的一部分;
每個(gè)非主屬性不能依賴(lài)于其他關(guān)系中的屬性,因?yàn)檫@樣的話,這種屬性應(yīng)該歸到其他關(guān)系中去。范式建模根據(jù)Inmon的觀點(diǎn),數(shù)據(jù)倉(cāng)庫(kù)模型的建設(shè)方法和業(yè)務(wù)系統(tǒng)的企業(yè)數(shù)據(jù)模型類(lèi)似。在業(yè)務(wù)系統(tǒng)中,企業(yè)數(shù)據(jù)模型決定了數(shù)據(jù)的來(lái)源,而企業(yè)數(shù)據(jù)模型也分為兩個(gè)層次,即主題域模型和邏輯模型。同樣,主題域模型可以看成是業(yè)務(wù)模型的概念模型,而邏輯模型則是域模型在關(guān)系型數(shù)據(jù)庫(kù)上的實(shí)例化。2.維度建模法(DimensionalModeling)維度模型是數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域另一位大師RalphKimall所倡導(dǎo),他的《數(shù)據(jù)倉(cāng)庫(kù)工具箱》是數(shù)據(jù)倉(cāng)庫(kù)工程領(lǐng)域最流行的數(shù)倉(cāng)建模經(jīng)典。維度建模以分析決策的需求出發(fā)構(gòu)建模型,構(gòu)建的數(shù)據(jù)模型為分析需求服務(wù),因此它重點(diǎn)解決用戶(hù)如何更快速完成分析需求,同時(shí)還有較好的大規(guī)模復(fù)雜查詢(xún)的響應(yīng)性能。維度建模典型的代表是我們比較熟知的星形模型(Star-schema),以及在一些特殊場(chǎng)景下適用的雪花模型(Snow-schema)。維度建模中比較重要的概念就是事實(shí)表(Facttable)和維度表(Dimensiontable)。其最簡(jiǎn)單的描述就是,按照事實(shí)表、維度表來(lái)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市。目前在互聯(lián)網(wǎng)公司最常用的建模方法就是維度建模,稍后將重點(diǎn)講解3.實(shí)體建模法(EntityModeling)實(shí)體建模法并不是數(shù)據(jù)倉(cāng)庫(kù)建模中常見(jiàn)的一個(gè)方法,它來(lái)源于哲學(xué)的一個(gè)流派。從哲學(xué)的意義上說(shuō),客觀世界應(yīng)該是可以細(xì)分的,客觀世界應(yīng)該可以分成由一個(gè)個(gè)實(shí)體,以及實(shí)體與實(shí)體之間的關(guān)系組成。那么我們?cè)跀?shù)據(jù)倉(cāng)庫(kù)的建模過(guò)程中完全可以引入這個(gè)抽象的方法,將整個(gè)業(yè)務(wù)也可以劃分成一個(gè)個(gè)的實(shí)體,而每個(gè)實(shí)體之間的關(guān)系,以及針對(duì)這些關(guān)系的說(shuō)明就是我們數(shù)據(jù)建模需要做的工作。雖然實(shí)體法粗看起來(lái)好像有一些抽象,其實(shí)理解起來(lái)很容易。即我們可以將任何一個(gè)業(yè)務(wù)過(guò)程劃分成3個(gè)部分,實(shí)體,事件,說(shuō)明,如下圖所示:實(shí)體建模上圖表述的是一個(gè)抽象的含義,如果我們描述一個(gè)簡(jiǎn)單的事實(shí):“小明開(kāi)車(chē)去學(xué)校上學(xué)”。以這個(gè)業(yè)務(wù)事實(shí)為例,我們可以把“小明”,“學(xué)?!笨闯墒且粋€(gè)實(shí)體,“上學(xué)”描述的是一個(gè)業(yè)務(wù)過(guò)程,我們?cè)谶@里可以抽象為一個(gè)具體“事件”,而“開(kāi)車(chē)去”則可以看成是事件“上學(xué)”的一個(gè)說(shuō)明。維度建模維度建模是專(zhuān)門(mén)應(yīng)用于分析型數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市建模的方法。數(shù)據(jù)集市可以理解為是一種"小型數(shù)據(jù)倉(cāng)庫(kù)"。1.維度建模中表的類(lèi)型事實(shí)表發(fā)生在現(xiàn)實(shí)世界中的操作型事件,其所產(chǎn)生的可度量數(shù)值,存儲(chǔ)在事實(shí)表中。從最低的粒度級(jí)別來(lái)看,事實(shí)表行對(duì)應(yīng)一個(gè)度量事件,反之亦然。事實(shí)表表示對(duì)分析主題的度量。比如一次購(gòu)買(mǎi)行為我們就可以理解為是一個(gè)事實(shí)。事實(shí)與維度圖中的訂單表就是一個(gè)事實(shí)表,你可以理解他就是在現(xiàn)實(shí)中發(fā)生的一次操作型事件,我們每完成一個(gè)訂單,就會(huì)在訂單中增加一條記錄。事實(shí)表的特征:表里沒(méi)有存放實(shí)際的內(nèi)容,他是一堆主鍵的集合,這些ID分別能對(duì)應(yīng)到維度表中的一條記錄。事實(shí)表包含了與各維度表相關(guān)聯(lián)的外鍵,可與維度表關(guān)聯(lián)。事實(shí)表的度量通常是數(shù)值類(lèi)型,且記錄數(shù)會(huì)不斷增加,表數(shù)據(jù)規(guī)模迅速增長(zhǎng)。明細(xì)表(寬表):事實(shí)表的數(shù)據(jù)中,有些屬性共同組成了一個(gè)字段(糅合在一起),比如年月日時(shí)分秒構(gòu)成了時(shí)間,當(dāng)需要根據(jù)某一屬性進(jìn)行分組統(tǒng)計(jì)的時(shí)候,需要截取拼接之類(lèi)的操作,效率極低。如:為了分析方便,可以事實(shí)表中的一個(gè)字段切割提取多個(gè)屬性出來(lái)構(gòu)成新的字段,因?yàn)樽侄巫兌嗔耍苑Q(chēng)為寬表,原來(lái)的成為窄表。將上述的local_time字段擴(kuò)展為如下6個(gè)字段:又因?yàn)閷挶淼男畔⒏忧逦骷?xì),所以也可以稱(chēng)之為明細(xì)表。2.維度表每個(gè)維度表都包含單一的主鍵列。維度表的主鍵可以作為與之關(guān)聯(lián)的任何事實(shí)表的外鍵,當(dāng)然,維度表行的描述環(huán)境應(yīng)與事實(shí)表行完全對(duì)應(yīng)。維度表通常比較寬,是扁平型非規(guī)范表,包含大量的低粒度的文本屬性。維度表示你要對(duì)數(shù)據(jù)進(jìn)行分析時(shí)所用的一個(gè)量,比如你要分析產(chǎn)品銷(xiāo)售情況,你可以選擇按類(lèi)別來(lái)進(jìn)行分析,或按區(qū)域來(lái)分析。每個(gè)類(lèi)別就構(gòu)成一個(gè)維度。上圖中的用戶(hù)表、商家表、時(shí)間表這些都屬于維度表,這些表都有一個(gè)唯一的主鍵,然后在表中存放了詳細(xì)的數(shù)據(jù)信息。總的說(shuō)來(lái),在數(shù)據(jù)倉(cāng)庫(kù)中不需要嚴(yán)格遵守規(guī)范化設(shè)計(jì)原則。因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)的主導(dǎo)功能就是面向分析,以查詢(xún)?yōu)橹?,不涉及?shù)據(jù)更新操作。事實(shí)表的設(shè)計(jì)是以能夠正確記錄歷史信息為準(zhǔn)則,維度表的設(shè)計(jì)是以能夠以合適的角度來(lái)聚合主題內(nèi)容為準(zhǔn)則。2.維度建模三種模式星型模式星形模式(StarSchema)是最常用的維度建模方式。星型模式是以事實(shí)表為中心,所有的維度表直接連接在事實(shí)表上,像星星一樣。星形模式的維度建模由一個(gè)事實(shí)表和一組維表成,且具有以下特點(diǎn):a.維表只和事實(shí)表關(guān)聯(lián),維表之間沒(méi)有關(guān)聯(lián);b.每個(gè)維表主鍵為單列,且該主鍵放置在事實(shí)表中,作為兩邊連接的外鍵;c.以事實(shí)表為核心,維表圍繞核心呈星形分布;雪花模式雪花模式(SnowflakeSchema)是對(duì)星形模式的擴(kuò)展。雪花模式的維度表可以擁有其他維度表的,雖然這種模型相比星型更規(guī)范一些,但是由于這種模型不太容易理解,維護(hù)成本比較高,而且性能方面需要關(guān)聯(lián)多層維表,性能也比星型模型要低。所以一般不是很常用。3.星座模式星座模式是星型模式延伸而來(lái),星型模式是基于一張事實(shí)表的,而星座模式是基于多張事實(shí)表的,而且共享維度信息。前面介紹的兩種維度建模方法都是多維表對(duì)應(yīng)單事實(shí)表,但在很多時(shí)候維度空間內(nèi)的事實(shí)表不止一個(gè),而一個(gè)維表也可能被多個(gè)事實(shí)表用到。在業(yè)務(wù)發(fā)展后期,絕大部分維度建模都采用的是星座模式。3.維度建模過(guò)程我們知道維度建模的表類(lèi)型有事實(shí)表,維度表;模式有星形模型,雪花模型,星座模型這些概念了,但是實(shí)際業(yè)務(wù)中,給了我們一堆數(shù)據(jù),我們?cè)趺茨眠@些數(shù)據(jù)進(jìn)行數(shù)倉(cāng)建設(shè)呢,數(shù)倉(cāng)工具箱作者根據(jù)自身60多年的實(shí)際業(yè)務(wù)經(jīng)驗(yàn),給我們總結(jié)了如下四步,請(qǐng)務(wù)必記??!數(shù)倉(cāng)工具箱中的維度建模四步走:維度建模四步走請(qǐng)牢記以上四步,不管什么業(yè)務(wù),就按照這個(gè)步驟來(lái),順序不要搞亂,因?yàn)檫@四步是環(huán)環(huán)相扣,步步相連。下面詳細(xì)拆解下每個(gè)步驟怎么做1、選擇業(yè)務(wù)過(guò)程維度建模是緊貼業(yè)務(wù)的,所以必須以業(yè)務(wù)為根基進(jìn)行建模,那么選擇業(yè)務(wù)過(guò)程,顧名思義就是在整個(gè)業(yè)務(wù)流程中選取我們需要建模的業(yè)務(wù),根據(jù)運(yùn)營(yíng)提供的需求及日后的易擴(kuò)展性等進(jìn)行選擇業(yè)務(wù)。比如商城,整個(gè)商城流程分為商家端,用戶(hù)端,平臺(tái)端,運(yùn)營(yíng)需求是總訂單量,訂單人數(shù),及用戶(hù)的購(gòu)買(mǎi)情況等,我們選擇業(yè)務(wù)過(guò)程就選擇用戶(hù)端的數(shù)據(jù),商家及平臺(tái)端暫不考慮。業(yè)務(wù)選擇非常重要,因?yàn)楹竺嫠械牟襟E都是基于此業(yè)務(wù)數(shù)據(jù)展開(kāi)的。2、聲明粒度先舉個(gè)例子:對(duì)于用戶(hù)來(lái)說(shuō),一個(gè)用戶(hù)有一個(gè)身份證號(hào),一個(gè)戶(hù)籍地址,多個(gè)手機(jī)號(hào),多張銀行卡,那么與用戶(hù)粒度相同的粒度屬性有身份證粒度,戶(hù)籍地址粒度,比用戶(hù)粒度更細(xì)的粒度有手機(jī)號(hào)粒度,銀行卡粒度,存在一對(duì)一的關(guān)系就是相同粒度。為什么要提相同粒度呢,因?yàn)榫S度建模中要求我們,在同一事實(shí)表中,必須具有相同的粒度,同一事實(shí)表中不要混用多種不同的粒度,不同的粒度數(shù)據(jù)建立不同的事實(shí)表。并且從給定的業(yè)務(wù)過(guò)程獲取數(shù)據(jù)時(shí),強(qiáng)烈建議從關(guān)注原子粒度開(kāi)始設(shè)計(jì),也就是從最細(xì)粒度開(kāi)始,因?yàn)樵恿6饶軌虺惺軣o(wú)法預(yù)期的用戶(hù)查詢(xún)。但是上卷匯總粒度對(duì)查詢(xún)性能的提升很重要的,所以對(duì)于有明確需求的數(shù)據(jù),我們建立針對(duì)需求的上卷匯總粒度,對(duì)需求不明朗的數(shù)據(jù)我們建立原子粒度。3、確認(rèn)維度維度表是作為業(yè)務(wù)分析的入口和描述性標(biāo)識(shí),所以也被稱(chēng)為數(shù)據(jù)倉(cāng)庫(kù)的“靈魂”。在一堆的數(shù)據(jù)中怎么確認(rèn)哪些是維度屬性呢,如果該列是對(duì)具體值的描述,是一個(gè)文本或常量,某一約束和行標(biāo)識(shí)的參與者,此時(shí)該屬性往往是維度屬性,數(shù)倉(cāng)工具箱中告訴我們牢牢掌握事實(shí)表的粒度,就能將所有可能存在的維度區(qū)分開(kāi),并且要確保維度表中不能出現(xiàn)重復(fù)數(shù)據(jù),應(yīng)使維度主鍵唯一4、確認(rèn)事實(shí)事實(shí)表是用來(lái)度量的,基本上都以數(shù)量值表示,事實(shí)表中的每行對(duì)應(yīng)一個(gè)度量,每行中的數(shù)據(jù)是一個(gè)特定級(jí)別的細(xì)節(jié)數(shù)據(jù),稱(chēng)為粒度。維度建模的核心原則之一是同一事實(shí)表中的所有度量必須具有相同的粒度。這樣能確保不會(huì)出現(xiàn)重復(fù)計(jì)算度量的問(wèn)題。有時(shí)候往往不能確定該列數(shù)據(jù)是事實(shí)屬性還是維度屬性。記住最實(shí)用的事實(shí)就是數(shù)值類(lèi)型和可加類(lèi)事實(shí)。所以可以通過(guò)分析該列是否是一種包含多個(gè)值并作為計(jì)算的參與者的度量,這種情況下該列往往是事實(shí)。實(shí)際業(yè)務(wù)中數(shù)倉(cāng)分層數(shù)倉(cāng)分層要結(jié)合公司業(yè)務(wù)進(jìn)行,并且需要清晰明確各層職責(zé),要保證數(shù)據(jù)層的穩(wěn)定又要屏蔽對(duì)下游影響,一般采用如下分層結(jié)構(gòu):數(shù)據(jù)分層架構(gòu)數(shù)據(jù)層具體實(shí)現(xiàn)使用四張圖說(shuō)明每層的具體實(shí)現(xiàn)數(shù)據(jù)源層ODS數(shù)據(jù)源層
數(shù)據(jù)源層主要將各個(gè)業(yè)務(wù)數(shù)據(jù)導(dǎo)入到大數(shù)據(jù)平臺(tái),作為業(yè)務(wù)數(shù)據(jù)的快照存儲(chǔ)。數(shù)據(jù)明細(xì)層DW數(shù)據(jù)明細(xì)層事實(shí)表中的每行對(duì)應(yīng)一個(gè)度量,每行中的數(shù)據(jù)是一個(gè)特定級(jí)別的細(xì)節(jié)數(shù)據(jù),稱(chēng)為粒度。維度建模的核心原則之一是同一事實(shí)表中的所有度量必須具有相同的粒度。這樣能確保不會(huì)出現(xiàn)重復(fù)計(jì)算度量的問(wèn)題。維度表一般都是單一主鍵,少數(shù)是聯(lián)合主鍵,注意維度表不要出現(xiàn)重復(fù)數(shù)據(jù),否則和事實(shí)表關(guān)聯(lián)會(huì)出現(xiàn)數(shù)據(jù)發(fā)散問(wèn)題。有時(shí)候往往不能確定該列數(shù)據(jù)是事實(shí)屬性還是維度屬性。記住最實(shí)用的事實(shí)就是數(shù)值類(lèi)型和可加類(lèi)事實(shí)。所以可以通過(guò)分析該列是否是一種包含多個(gè)值并作為計(jì)算的參與者的度量,這種情況下該列往往是事實(shí);如果該列是對(duì)具體值的描述,是一個(gè)文本或常量,某一約束和行標(biāo)識(shí)的參與者,此時(shí)該屬性往往是維度屬性。但是還是要結(jié)合業(yè)務(wù)進(jìn)行最終判斷是維度還是事實(shí)。數(shù)據(jù)輕度匯總層DM數(shù)據(jù)輕度匯總層
此層命名為輕匯總層,就代表這一層已經(jīng)開(kāi)始對(duì)數(shù)據(jù)進(jìn)行匯總,但是不是完全匯總,只是對(duì)相同粒度的數(shù)據(jù)進(jìn)行關(guān)聯(lián)匯總,不同粒度但是有關(guān)系的數(shù)據(jù)也可進(jìn)行匯總,此時(shí)需要將粒度通過(guò)聚合等操作進(jìn)行統(tǒng)一。數(shù)據(jù)應(yīng)用層APP數(shù)據(jù)應(yīng)用層
數(shù)據(jù)應(yīng)用層的表就是提供給用戶(hù)使用的,數(shù)倉(cāng)建設(shè)到此就接近尾聲了,接下來(lái)就根據(jù)不同的需求進(jìn)行不同的取數(shù),如直接進(jìn)行報(bào)表展示,或提供給數(shù)據(jù)分析的同事所需的數(shù)據(jù),或其他的業(yè)務(wù)支撐。最后技術(shù)是為業(yè)務(wù)服務(wù)的,業(yè)務(wù)是為公司創(chuàng)造價(jià)值的,離開(kāi)業(yè)務(wù)的技術(shù)是無(wú)意義的。所以數(shù)倉(cāng)的建設(shè)與業(yè)務(wù)是息息相關(guān)的,公司的業(yè)務(wù)不同,數(shù)倉(cāng)的建設(shè)也是不同的,只有適合的才是最好的。二、指標(biāo)體系指標(biāo)體系是什么?如何使用OSM模型和AARRR模型搭建指標(biāo)體系?如何統(tǒng)一流程、規(guī)范化、工具化管理指標(biāo)體系?本文會(huì)對(duì)建設(shè)的方法論結(jié)合滴滴數(shù)據(jù)指標(biāo)體系建設(shè)實(shí)踐進(jìn)行解答分析。什么是指標(biāo)體系1.指標(biāo)體系定義指標(biāo)體系是將零散單點(diǎn)的具有相互聯(lián)系的指標(biāo),系統(tǒng)化的組織起來(lái),通過(guò)單點(diǎn)看全局,通過(guò)全局解決單點(diǎn)的問(wèn)題。它主要由指標(biāo)和體系兩部分組成。指標(biāo)是指將業(yè)務(wù)單元細(xì)分后量化的度量值,它使得業(yè)務(wù)目標(biāo)可描述、可度量、可拆解,它是業(yè)務(wù)和數(shù)據(jù)的結(jié)合,是統(tǒng)計(jì)的基礎(chǔ),也是量化效果的重要依據(jù)。指標(biāo)主要分為結(jié)果型和過(guò)程型:結(jié)果型指標(biāo):用于衡量用戶(hù)發(fā)生某個(gè)動(dòng)作后所產(chǎn)生的結(jié)果,通常是延后知道的,很難進(jìn)行干預(yù)。結(jié)果型指標(biāo)更多的是監(jiān)控?cái)?shù)據(jù)異常,或者是監(jiān)控某個(gè)場(chǎng)景下用戶(hù)需求是否被滿(mǎn)足過(guò)程型指標(biāo):用戶(hù)在做某個(gè)動(dòng)作時(shí)候所產(chǎn)生的指標(biāo),可以通過(guò)某些運(yùn)營(yíng)策略來(lái)影響這個(gè)過(guò)程指標(biāo),從而影響最終的結(jié)果,過(guò)程型指標(biāo)更加關(guān)注用戶(hù)的需求為什么被滿(mǎn)足或沒(méi)被滿(mǎn)足體系是由不同的維度組成,而維度是指用戶(hù)觀察、思考與表述某事物的“思維角度”,維度是指標(biāo)體系的核心,沒(méi)有維度,單純說(shuō)指標(biāo)是沒(méi)有任何意義的。維度主要分為定性維度和定量維度,定性維度,主要是偏文字描述類(lèi)如城市、性別、職業(yè)等;定量維度,主要是數(shù)值類(lèi)描述如收入、年齡等,對(duì)定量維度需要做數(shù)值分組處理。2.指標(biāo)體系生命周期生命周期主要包含定義、生產(chǎn)、消費(fèi)、下線四個(gè)階段。針對(duì)整個(gè)生命周期要持續(xù)做指標(biāo)運(yùn)維、質(zhì)量保障,同時(shí)為了提高指標(biāo)數(shù)據(jù)復(fù)用度,降低用戶(hù)使用成本需要做對(duì)應(yīng)的數(shù)據(jù)運(yùn)營(yíng)工作。3.綜合使用場(chǎng)景指標(biāo)體系主要是結(jié)合用戶(hù)的業(yè)務(wù)場(chǎng)景來(lái)進(jìn)行使用,多個(gè)不同的指標(biāo)和維度可以組合起來(lái)進(jìn)行業(yè)務(wù)的綜合分析,用戶(hù)可通過(guò)指標(biāo)的變化看到整體業(yè)務(wù)的變化,并能夠快速發(fā)現(xiàn)問(wèn)題、定位問(wèn)題。常用的場(chǎng)景一種是決策分析的場(chǎng)景,通過(guò)數(shù)據(jù)看清業(yè)務(wù)現(xiàn)狀進(jìn)行戰(zhàn)略決策支持;另一種是運(yùn)營(yíng)分析場(chǎng)景,無(wú)論是做用戶(hù)運(yùn)營(yíng)、產(chǎn)品運(yùn)營(yíng)還是活動(dòng)運(yùn)營(yíng)都需要各類(lèi)指標(biāo)數(shù)據(jù)的支撐去看清問(wèn)題、分析問(wèn)題和指導(dǎo)解決問(wèn)題。為什么搭建指標(biāo)體系1.衡量業(yè)務(wù)發(fā)展質(zhì)量指標(biāo)體系可以反映業(yè)務(wù)客觀事實(shí),看清業(yè)務(wù)發(fā)展現(xiàn)狀,通過(guò)指標(biāo)對(duì)業(yè)務(wù)質(zhì)量進(jìn)行衡量,把控業(yè)務(wù)發(fā)展情況,針對(duì)發(fā)現(xiàn)的業(yè)務(wù)問(wèn)題聚焦解決,促進(jìn)業(yè)務(wù)有序增長(zhǎng)2.建立指標(biāo)因果關(guān)系主要明確結(jié)果型指標(biāo)和過(guò)程型指標(biāo)關(guān)系,通過(guò)結(jié)果指標(biāo)回溯過(guò)程指標(biāo),找到解決問(wèn)題的核心原因3.指導(dǎo)用戶(hù)分析工作目的建立產(chǎn)品評(píng)估體系、活動(dòng)效果評(píng)估體系、智能運(yùn)營(yíng)分析體系4.指導(dǎo)基礎(chǔ)數(shù)據(jù)建設(shè)明確基礎(chǔ)數(shù)據(jù)建設(shè)方向,集中資源,避免過(guò)程和結(jié)果分析指標(biāo)數(shù)據(jù)的遺漏或缺失5.指導(dǎo)內(nèi)容產(chǎn)品建設(shè)結(jié)合用戶(hù)的業(yè)務(wù)場(chǎng)景來(lái)進(jìn)行使用,多個(gè)不同的指標(biāo)和維度可以組合起來(lái)進(jìn)行業(yè)務(wù)的綜合分析,用戶(hù)可通過(guò)指標(biāo)的變化看到整體業(yè)務(wù)的變化,并能夠快速發(fā)現(xiàn)問(wèn)題、定位問(wèn)題6.統(tǒng)一指標(biāo)消費(fèi)口徑企業(yè)內(nèi)統(tǒng)一關(guān)鍵指標(biāo)業(yè)務(wù)口徑及計(jì)算口徑,統(tǒng)一企業(yè)業(yè)務(wù)目標(biāo),實(shí)現(xiàn)自上而下目標(biāo)驅(qū)動(dòng)如何搭建指標(biāo)體系指標(biāo)體系建設(shè)的常用方法是通過(guò)場(chǎng)景化進(jìn)行指標(biāo)體系的搭建,以用戶(hù)的視角場(chǎng)景化思考,自上而下業(yè)務(wù)驅(qū)動(dòng)指標(biāo)體系建設(shè),所以要在特定場(chǎng)景下做好指標(biāo)體系建設(shè),需要先選好指標(biāo),然后用科學(xué)的方法搭建指標(biāo)體系。1.科學(xué)方法選指標(biāo)選指標(biāo)常用方法是指標(biāo)分級(jí)方法和OSM模型。指標(biāo)分級(jí)主要是指標(biāo)內(nèi)容縱向的思考,根據(jù)企業(yè)戰(zhàn)略目標(biāo)、組織及業(yè)務(wù)過(guò)程進(jìn)行自上而下的指標(biāo)分級(jí),對(duì)指標(biāo)進(jìn)行層層剖析,主要分為三級(jí)T1、T2、T3。T1指標(biāo):公司戰(zhàn)略層面指標(biāo)用于衡量公司整體目標(biāo)達(dá)成情況的指標(biāo),主要是決策類(lèi)指標(biāo),T1指標(biāo)使用通常服務(wù)于公司戰(zhàn)略決策層T2指標(biāo):業(yè)務(wù)策略層面指標(biāo)為達(dá)成T1指標(biāo)的目標(biāo),公司會(huì)對(duì)目標(biāo)拆解到業(yè)務(wù)線或事業(yè)群,并有針對(duì)性做出一系列運(yùn)營(yíng)策略,T2指標(biāo)通常反映的是策略結(jié)果屬于支持性指標(biāo)同時(shí)也是業(yè)務(wù)線或事業(yè)群的核心指標(biāo)。T2指標(biāo)是T1指標(biāo)的縱向的路徑拆解,便于T1指標(biāo)的問(wèn)題定位,T2指標(biāo)使用通常服務(wù)業(yè)務(wù)線或事業(yè)群T3指標(biāo):業(yè)務(wù)執(zhí)行層面指標(biāo)T3指標(biāo)是對(duì)T2指標(biāo)的拆解,用于定位T2指標(biāo)的問(wèn)題。T3指標(biāo)通常也是業(yè)務(wù)過(guò)程中最多的指標(biāo)。根據(jù)各職能部門(mén)目標(biāo)的不同,其關(guān)注的指標(biāo)也各有差異。T3指標(biāo)的使用通??梢灾笇?dǎo)一線運(yùn)營(yíng)或分析人員開(kāi)展工作,內(nèi)容偏過(guò)程性指標(biāo),可以快速引導(dǎo)一線人員做出相應(yīng)的動(dòng)作。例如:成交率的指標(biāo)分級(jí)OSM模型(Obejective,Strategy,Measurement)是指標(biāo)體系建設(shè)過(guò)程中輔助確定核心的重要方法,包含業(yè)務(wù)目標(biāo)、業(yè)務(wù)策略、業(yè)務(wù)度量,是指標(biāo)內(nèi)容橫向的思考。O用戶(hù)使用產(chǎn)品的目標(biāo)是什么?產(chǎn)品滿(mǎn)足了用戶(hù)的什么需求?主要從用戶(hù)視角和業(yè)務(wù)視角確定目標(biāo),原則是切實(shí)可行、易理解、可干預(yù)、正向有益S為了達(dá)成上述目標(biāo)我采取的策略是什么?M這些策略隨之帶來(lái)的數(shù)據(jù)指標(biāo)變化有哪些?以滴滴網(wǎng)約車(chē)為例,按照OSM模型,它的指標(biāo)是什么樣的?
O:用戶(hù)來(lái)使用滴滴這個(gè)產(chǎn)品,需求和目標(biāo)是什么?
用戶(hù)需求及目標(biāo)是便捷、快速打到車(chē),安全到達(dá)目的地
那如何讓用戶(hù)感受到自己的需求被滿(mǎn)足了呢?
S:滴滴做的策略是:
便捷方面,提供了獨(dú)立APP版本、小程序版本,還可以多渠道打到車(chē),例如在高德、微信、支付寶都有打車(chē)入口;起始、目的地地圖智能精準(zhǔn)定位;最優(yōu)路線選擇等
快速方面,針對(duì)不同人群不同訴求提供了多品類(lèi)產(chǎn)品選擇,例如快車(chē)、優(yōu)享、拼車(chē)、出租車(chē)等業(yè)務(wù),根據(jù)早晚高峰提高熱點(diǎn)區(qū)域運(yùn)力,減少用戶(hù)排隊(duì)時(shí)間
安全方面,司機(jī)準(zhǔn)入機(jī)制,司機(jī)合規(guī)機(jī)制,司機(jī)畫(huà)像
M:我們需要針對(duì)這些策略去做指標(biāo),在這里面我們的指標(biāo)分別是結(jié)果指標(biāo)和過(guò)程指標(biāo):
結(jié)果指標(biāo):渠道轉(zhuǎn)化完成率、乘客取消率、供需比、司機(jī)服務(wù)分
過(guò)程指標(biāo):渠道發(fā)單數(shù)、渠道完單數(shù)、排隊(duì)乘客數(shù)、乘客排隊(duì)時(shí)長(zhǎng)、司機(jī)好評(píng)率、司機(jī)接單量、司機(jī)取消數(shù)等
指標(biāo)選取之后,下面就是最重要的分析維度選擇了,前面指標(biāo)體系定義里講過(guò)維度是指標(biāo)體系的核心,沒(méi)有維度,單純說(shuō)指標(biāo)是沒(méi)有任何意義的。所以維度選擇層面主要通過(guò)數(shù)據(jù)分析視角結(jié)合實(shí)際分析業(yè)務(wù)場(chǎng)景來(lái)確定。例如城市維度、商圈維度、渠道維度、時(shí)間維度、用戶(hù)標(biāo)簽維度等。2.用分析模型搭建指標(biāo)體系在《精益數(shù)據(jù)分析》一書(shū)中給出了兩套比較常用的指標(biāo)體系建設(shè)方法論,其中一個(gè)就是比較有名的海盜指標(biāo)法,也就是我們經(jīng)常聽(tīng)到的AARRR海盜模型。海盜模型是用戶(hù)分析的經(jīng)典模型,它反映了增長(zhǎng)是系統(tǒng)性地貫穿于用戶(hù)生命周期各個(gè)階段的:用戶(hù)拉新(Acquisition)、用戶(hù)激活(Activation)、用戶(hù)留存(Retention)、商業(yè)變現(xiàn)(Revenue)、用戶(hù)推薦(Referral)。AARRR模型A拉新通過(guò)各種推廣渠道,以各種方式獲取目標(biāo)用戶(hù),并對(duì)各種營(yíng)銷(xiāo)渠道的效果評(píng)估,不斷優(yōu)化投入策略,降低獲客成本。涉及關(guān)鍵指標(biāo)例如新增注冊(cè)用戶(hù)數(shù)、激活率、注冊(cè)轉(zhuǎn)化率、新客留存率、下載量、安裝量等A活躍活躍用戶(hù)指真正開(kāi)始使用了產(chǎn)品提供的價(jià)值,我們需要掌握用戶(hù)的行為數(shù)據(jù),監(jiān)控產(chǎn)品健康程度。這個(gè)模塊主要反映用戶(hù)進(jìn)入產(chǎn)品的行為表現(xiàn),是產(chǎn)品體驗(yàn)的核心所在。涉及關(guān)鍵指標(biāo)例如DAU/MAU、日均使用時(shí)長(zhǎng)、啟動(dòng)APP時(shí)長(zhǎng)、啟動(dòng)APP次數(shù)等R留存衡量用戶(hù)粘性和質(zhì)量的指標(biāo)。涉及關(guān)鍵指標(biāo)例如留存率、流失率等R變現(xiàn)主要用來(lái)衡量產(chǎn)品商業(yè)價(jià)值。涉及關(guān)鍵指標(biāo)例如生命周期價(jià)值(LTV)、客單價(jià)、GMV等R推薦衡量用戶(hù)自傳播程度和口碑情況。涉及關(guān)鍵指標(biāo)例如邀請(qǐng)率、裂變系數(shù)等可以根據(jù)實(shí)際業(yè)務(wù)場(chǎng)景,結(jié)合使用OSM和AARRR模型,來(lái)系統(tǒng)性的選擇不同階段所需要的核心數(shù)據(jù)指標(biāo)。3.場(chǎng)景化搭建指標(biāo)體系目前階段互聯(lián)網(wǎng)業(yè)務(wù)比較流行的一種通用抽象場(chǎng)景“人、貨、場(chǎng)”,實(shí)際就是我們?nèi)粘Kf(shuō)的用戶(hù)、產(chǎn)品、場(chǎng)景,在通俗點(diǎn)講就是誰(shuí)在什么場(chǎng)景下使用了什么產(chǎn)品,不同的商業(yè)模式會(huì)有不同的組合模式。以滴滴實(shí)際場(chǎng)景為例:哪些場(chǎng)景(此處場(chǎng)景定義為終端,如Native,微信,支付寶)的什么人(乘客)在平臺(tái)上使用了哪些貨(平臺(tái)業(yè)務(wù)線,如快車(chē)/專(zhuān)車(chē)等),進(jìn)而為評(píng)估用戶(hù)增長(zhǎng)的價(jià)值和效果。"人"的視角從“人”的視角,我們比較關(guān)心的是什么乘客在什么時(shí)間打的車(chē),排了多長(zhǎng)時(shí)間,等了多長(zhǎng)時(shí)間上車(chē),周期內(nèi)第幾次打車(chē),打車(chē)花了多少錢(qián),是否有投訴和取消行為,具體到數(shù)據(jù)指標(biāo)主要看發(fā)單用戶(hù)數(shù)、完單用戶(hù)數(shù)、客單價(jià)、周期內(nèi)完單訂單數(shù)、取消訂單數(shù)、評(píng)價(jià)訂單數(shù)等。"貨"的視角從“貨”的視角,我們比較關(guān)心的就是成交了多少,交易額多少,花了多少,到具體數(shù)據(jù)指標(biāo)主要會(huì)看GMV、成交率、取消率指標(biāo),在進(jìn)一步會(huì)細(xì)分到城市、區(qū)域,一級(jí)品類(lèi)、二級(jí)品類(lèi)。數(shù)據(jù)的效果通過(guò)目標(biāo)對(duì)比,橫向?qū)Ρ?、歷史比較等方式進(jìn)行分析確定。"場(chǎng)"的視角從“場(chǎng)”的視角,我們比較關(guān)心的就是哪個(gè)渠道用戶(hù)點(diǎn)擊量大曝光率大,帶來(lái)了多少新用戶(hù),完成多少交易訂單,客單價(jià)是多少;或者是哪個(gè)活動(dòng)拉新或促活效果怎么樣轉(zhuǎn)化率多少,結(jié)合場(chǎng)景數(shù)據(jù)實(shí)際情況制定對(duì)應(yīng)策略。以上分別從“人”、“貨”、“場(chǎng)”三個(gè)角度進(jìn)行了數(shù)據(jù)指標(biāo)和分析維度的提煉,下面我們把三類(lèi)指標(biāo)結(jié)合指標(biāo)分級(jí)方法進(jìn)行分解關(guān)聯(lián)。怎么管理指標(biāo)體系1.痛點(diǎn)分析主要從業(yè)務(wù)、技術(shù)、產(chǎn)品三個(gè)視角來(lái)看:業(yè)務(wù)視角業(yè)務(wù)分析場(chǎng)景指標(biāo)、維度不明確;頻繁的需求變更和反復(fù)迭代,數(shù)據(jù)報(bào)表臃腫,數(shù)據(jù)參差不齊;用戶(hù)分析具體業(yè)務(wù)問(wèn)題找數(shù)據(jù)、核對(duì)確認(rèn)數(shù)據(jù)成本較高。技術(shù)視角指標(biāo)定義,指標(biāo)命名混亂,指標(biāo)不唯一,指標(biāo)維護(hù)口徑不一致;指標(biāo)生產(chǎn),重復(fù)建設(shè);數(shù)據(jù)匯算成本較高;指標(biāo)消費(fèi),數(shù)據(jù)出口不統(tǒng)一,重復(fù)輸出,輸出口徑不一致;產(chǎn)品視角缺乏系統(tǒng)產(chǎn)品化支持從生產(chǎn)到消費(fèi)數(shù)據(jù)流沒(méi)有系統(tǒng)產(chǎn)品層面打通;2.管理目標(biāo)技術(shù)目標(biāo)統(tǒng)一指標(biāo)和維度管理,指標(biāo)命名、計(jì)算口徑、統(tǒng)計(jì)來(lái)源唯一,維度定義規(guī)范、維度值一致業(yè)務(wù)目標(biāo)統(tǒng)一數(shù)據(jù)出口、場(chǎng)景化覆蓋產(chǎn)品目標(biāo)指標(biāo)體系管理工具產(chǎn)品化落地;指標(biāo)體系內(nèi)容產(chǎn)品化落地支持決策、分析、運(yùn)營(yíng)例如決策北極星、智能運(yùn)營(yíng)分析產(chǎn)品等3.模型架構(gòu)業(yè)務(wù)板塊定義原則:業(yè)務(wù)邏輯層面進(jìn)行抽象、物理組織架構(gòu)層面進(jìn)行細(xì)分,可根據(jù)實(shí)際業(yè)務(wù)情況進(jìn)行層級(jí)分拆細(xì)化,層級(jí)分級(jí)建議進(jìn)行最多進(jìn)行三級(jí)分拆,一級(jí)細(xì)分可公司層面統(tǒng)一規(guī)范確定,二級(jí)及后續(xù)拆分可根據(jù)業(yè)務(wù)線實(shí)際業(yè)務(wù)進(jìn)行拆分。例如滴滴出行領(lǐng)域業(yè)務(wù)邏輯層面兩輪車(chē)和四輪車(chē)都屬于出行領(lǐng)域可抽象出行業(yè)務(wù)板塊(level一級(jí)),根據(jù)物理組織架構(gòu)層面在進(jìn)行細(xì)分普惠、網(wǎng)約車(chē)、出租車(chē)、順風(fēng)車(chē)(level二級(jí)),后續(xù)根據(jù)實(shí)際業(yè)務(wù)需求可在細(xì)分,網(wǎng)約車(chē)可細(xì)分獨(dú)乘、合乘,普惠可細(xì)分單車(chē)、企業(yè)級(jí)。規(guī)范定義數(shù)據(jù)域指面向業(yè)務(wù)分析,將業(yè)務(wù)過(guò)程或者維度進(jìn)行抽象的集合。其中,業(yè)務(wù)過(guò)程可以概括為一個(gè)個(gè)不拆分的行為事件,在業(yè)務(wù)過(guò)程之下,可以定義指標(biāo);維度,是度量的環(huán)境,如乘客呼單事件,呼單類(lèi)型是維度。為了保障整個(gè)體系的生命力,數(shù)據(jù)域是需要抽象提煉,并且長(zhǎng)期維護(hù)更新的,變動(dòng)需執(zhí)行變更流程。業(yè)務(wù)過(guò)程指公司的業(yè)務(wù)活動(dòng)事件,如呼單、支付都是業(yè)務(wù)過(guò)程。其中,業(yè)務(wù)過(guò)程不可拆分。時(shí)間周期用來(lái)明確統(tǒng)計(jì)的時(shí)間范圍或者時(shí)間點(diǎn),如最近30天、自然周、截止當(dāng)日等。修飾類(lèi)型是對(duì)修飾詞的一種抽象劃分。修飾類(lèi)型從屬于某個(gè)業(yè)務(wù)域,如日志域的訪問(wèn)終端類(lèi)型涵蓋APP端、PC端等修飾詞。修飾詞指的是統(tǒng)計(jì)維度以外指標(biāo)的業(yè)務(wù)場(chǎng)景限定抽象,修飾詞屬于一種修飾類(lèi)型,如在日志域的訪問(wèn)終端類(lèi)型下,有修飾詞APP、PC端等。度量/原子指標(biāo)原子指標(biāo)和度量含義相同,基于某一業(yè)務(wù)事件行為下的度量,是業(yè)務(wù)定義中不可再拆分的指標(biāo),具有明確業(yè)務(wù)含義的名稱(chēng),如支付金額。維度維度是度量的環(huán)境,用來(lái)反映業(yè)務(wù)的一類(lèi)屬性,這類(lèi)屬性的集合構(gòu)成一個(gè)維度,也可以稱(chēng)為實(shí)體對(duì)象。維度屬于一個(gè)數(shù)據(jù)域,如地理維度(其中包括國(guó)家、地區(qū)、省市等)、時(shí)間維度(其中包括年、季、月、周、日等級(jí)別內(nèi)容)。維度屬性維度屬性隸屬于一個(gè)維度,如地理維度里面的國(guó)家名稱(chēng)、國(guó)家ID、省份名稱(chēng)等都屬于維度屬性。指標(biāo)分類(lèi)主要分為原子指標(biāo)、派生指標(biāo)、衍生指標(biāo)原子指標(biāo)基于某一業(yè)務(wù)事件行為下的度量,是業(yè)務(wù)定義中不可再拆分的指標(biāo),具有明確業(yè)務(wù)含義的名稱(chēng),如呼單量、交易金額派生指標(biāo)是1個(gè)原子指標(biāo)+多個(gè)修飾詞(可選)+時(shí)間周期,是原子指標(biāo)業(yè)務(wù)統(tǒng)計(jì)范圍的圈定。派生指標(biāo)又分以下二種類(lèi)型:事務(wù)型指標(biāo)是指對(duì)業(yè)務(wù)過(guò)程進(jìn)行衡量的指標(biāo)。例如,呼單量、訂單支付金額,這類(lèi)指標(biāo)需要維護(hù)原子指標(biāo)以及修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標(biāo)。存量型指標(biāo)是指對(duì)實(shí)體對(duì)象(如司機(jī)、乘客)某些狀態(tài)的統(tǒng)計(jì),例如注冊(cè)司機(jī)總數(shù)、注冊(cè)乘客總數(shù),這類(lèi)指標(biāo)需要維護(hù)原子指標(biāo)以及修飾詞,在此基礎(chǔ)上創(chuàng)建派生指標(biāo),對(duì)應(yīng)的時(shí)間周期一般為“歷史截止當(dāng)前某個(gè)時(shí)間”。衍生指標(biāo)是在事務(wù)性指標(biāo)和存量型指標(biāo)的基礎(chǔ)上復(fù)合成的。主要有比率型、比例型、統(tǒng)計(jì)型均值。模型設(shè)計(jì)主要采用維度建模方法進(jìn)行構(gòu)建,基礎(chǔ)業(yè)務(wù)明細(xì)事實(shí)表主要存儲(chǔ)維度屬性集合和度量/原子指標(biāo);分析業(yè)務(wù)匯總事實(shí)表按照指標(biāo)類(lèi)別(去重指標(biāo)、非去重指標(biāo))分類(lèi)存儲(chǔ),非去重指標(biāo)匯總事實(shí)表存儲(chǔ)統(tǒng)計(jì)維度集合、原子指標(biāo)或派生指標(biāo),去重指標(biāo)匯總事實(shí)表只存儲(chǔ)分析實(shí)體統(tǒng)計(jì)標(biāo)簽集合。指標(biāo)體系在數(shù)倉(cāng)物理實(shí)現(xiàn)層面主要是結(jié)合數(shù)倉(cāng)模型分層架構(gòu)進(jìn)行指導(dǎo)建設(shè),滴滴的指標(biāo)數(shù)據(jù)主要存儲(chǔ)在DWM層,作為指標(biāo)的核心管理層。指標(biāo)體系元數(shù)據(jù)管理維度管理包括基礎(chǔ)信息和技術(shù)信息,由不同角色進(jìn)行維護(hù)管理?;A(chǔ)信息對(duì)應(yīng)維度的業(yè)務(wù)信息,由業(yè)務(wù)管理人員、數(shù)據(jù)產(chǎn)品或BI分析師維護(hù),主要包括維度名稱(chēng)、業(yè)務(wù)定義、業(yè)務(wù)分類(lèi)。技術(shù)信息對(duì)應(yīng)維度的數(shù)據(jù)信息,由數(shù)據(jù)研發(fā)維護(hù),主要包括是否有維表(是枚舉維度還是有獨(dú)立的物理維表)、是否是日期維、對(duì)應(yīng)code英文名稱(chēng)和中文名稱(chēng)、對(duì)應(yīng)name英文名稱(chēng)和中文名稱(chēng)。如果維度有維度物理表,則需要和對(duì)應(yīng)的維度物理表綁定,設(shè)置code和name對(duì)應(yīng)的字段。如果維度是枚舉維,則需要填寫(xiě)對(duì)應(yīng)的code和name。維度的統(tǒng)一管理,有利于以后數(shù)據(jù)表的標(biāo)準(zhǔn)化,也便于用戶(hù)的查詢(xún)使用。指標(biāo)管理包括基礎(chǔ)信息、技術(shù)信息和衍生信息,由不同角色進(jìn)行維護(hù)管理?;A(chǔ)信息對(duì)應(yīng)指標(biāo)的業(yè)務(wù)信息,由業(yè)務(wù)管理人員、數(shù)據(jù)產(chǎn)品或BI分析師維護(hù),主要包括歸屬信息(業(yè)務(wù)板塊、數(shù)據(jù)域、業(yè)務(wù)過(guò)程),基本信息(指標(biāo)名稱(chēng)、指標(biāo)英文名稱(chēng)、指標(biāo)定義、統(tǒng)計(jì)算法說(shuō)明、指標(biāo)類(lèi)型(去重、非去重)),業(yè)務(wù)場(chǎng)景信息(分析維度,場(chǎng)景描述);技術(shù)信息對(duì)應(yīng)指標(biāo)的物理模型信息,由數(shù)據(jù)研發(fā)進(jìn)行維護(hù),主要包括對(duì)應(yīng)物理表及字段信息;衍生信息對(duì)應(yīng)關(guān)聯(lián)派生或衍生指標(biāo)信息、關(guān)聯(lián)數(shù)據(jù)應(yīng)用和業(yè)務(wù)場(chǎng)景信息,便于用戶(hù)查詢(xún)指標(biāo)被哪些其它指標(biāo)和數(shù)據(jù)應(yīng)用使用,提供指標(biāo)血緣分析追查數(shù)據(jù)來(lái)源的能力。原子指標(biāo)定義歸屬信息+基本信息+業(yè)務(wù)場(chǎng)景信息派生指標(biāo)定義時(shí)間周期+修飾詞集合+原子指標(biāo)修飾類(lèi)型主要包含類(lèi)型說(shuō)明、統(tǒng)計(jì)算法說(shuō)明、數(shù)據(jù)源(可選)指標(biāo)體系建設(shè)流程建模流程建模流程主要是從業(yè)務(wù)視角指導(dǎo)工程師對(duì)需求場(chǎng)景涉及的指標(biāo)進(jìn)行主題抽象,歸類(lèi),統(tǒng)一業(yè)務(wù)術(shù)語(yǔ),減少溝通成本,同時(shí)避免后續(xù)的指標(biāo)重復(fù)建設(shè)。分析數(shù)據(jù)體系是模型架構(gòu)中匯總事實(shí)表的物理集合,業(yè)務(wù)邏輯層面根據(jù)業(yè)務(wù)分析對(duì)象或場(chǎng)景進(jìn)行指標(biāo)體系抽象沉淀。滴滴出行主要是根據(jù)分析對(duì)象進(jìn)行主題抽象的,例如司機(jī)主題、安全主題、體驗(yàn)主題、城市主題等。指標(biāo)分類(lèi)主要是根據(jù)實(shí)際業(yè)務(wù)過(guò)程進(jìn)行抽象分類(lèi),例如司機(jī)交易類(lèi)指標(biāo)、司機(jī)注冊(cè)類(lèi)指標(biāo)、司機(jī)增長(zhǎng)類(lèi)指標(biāo)等?;A(chǔ)數(shù)據(jù)體系是模型架構(gòu)中明細(xì)事實(shí)表和基礎(chǔ)維度表的物理集合,業(yè)務(wù)邏輯層面根據(jù)實(shí)際業(yè)務(wù)場(chǎng)景進(jìn)行抽象例如司機(jī)合規(guī)、乘客注冊(cè)等,還原業(yè)務(wù)核心業(yè)務(wù)過(guò)程。開(kāi)發(fā)流程開(kāi)發(fā)流程是從技術(shù)視角指導(dǎo)工程師進(jìn)行指標(biāo)體系生產(chǎn)、運(yùn)維及質(zhì)量管控,也是數(shù)據(jù)產(chǎn)品或數(shù)據(jù)分析師和數(shù)倉(cāng)研發(fā)溝通協(xié)調(diào)的橋梁。指標(biāo)體系圖譜建設(shè)指標(biāo)體系圖譜概述指標(biāo)體系圖譜也可稱(chēng)為數(shù)據(jù)分析圖譜主要是依據(jù)實(shí)際業(yè)務(wù)場(chǎng)景抽象業(yè)務(wù)分析實(shí)體,整合梳理實(shí)體涉及的業(yè)務(wù)分類(lèi)、分析指標(biāo)和維度的集合。建設(shè)方法:主要是通過(guò)業(yè)務(wù)思維、用戶(hù)視角去構(gòu)建,把業(yè)務(wù)和數(shù)據(jù)緊密關(guān)聯(lián)起來(lái),把指標(biāo)結(jié)構(gòu)化分類(lèi)組織建設(shè)目的:對(duì)于用戶(hù):便于用戶(hù)能夠快速定位所需指標(biāo)和維度,同時(shí)通過(guò)業(yè)務(wù)場(chǎng)景化沉淀指標(biāo)體系,能夠快速觸達(dá)用戶(hù)數(shù)據(jù)訴求對(duì)于研發(fā):利于后續(xù)指標(biāo)生產(chǎn)模型設(shè)計(jì)、數(shù)據(jù)內(nèi)容邊界化、數(shù)據(jù)體系建設(shè)迭代量化和數(shù)據(jù)資產(chǎn)的落地指標(biāo)體系產(chǎn)品化指標(biāo)體系涉及的產(chǎn)品集主要是依據(jù)其生命周期進(jìn)行相應(yīng)建設(shè),通過(guò)產(chǎn)品工具打通數(shù)據(jù)流,實(shí)現(xiàn)指標(biāo)體系統(tǒng)一化、自動(dòng)化、規(guī)范化、流程化管理。因?yàn)橹笜?biāo)體系建設(shè)本質(zhì)目標(biāo)是服務(wù)業(yè)務(wù),實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)價(jià)值,所以建設(shè)的核心原則是“輕標(biāo)準(zhǔn)、重場(chǎng)景,從管控式到服務(wù)式”。通過(guò)工具、產(chǎn)品、技術(shù)和組織的融合提高用戶(hù)使用數(shù)據(jù)效率,加速業(yè)務(wù)創(chuàng)新迭代。其中和指標(biāo)體系方法論強(qiáng)相關(guān)產(chǎn)品就是指標(biāo)字典工具的落地,其產(chǎn)品的定位及價(jià)值:支撐指標(biāo)管理規(guī)范從方法到落地的工具,自動(dòng)生成規(guī)范指標(biāo),解決指標(biāo)名稱(chēng)混亂、指標(biāo)不唯一的問(wèn)題,消除數(shù)據(jù)的二義性統(tǒng)一對(duì)外提供標(biāo)準(zhǔn)的指標(biāo)口徑和元數(shù)據(jù)信息工具設(shè)計(jì)流程(方法論->定義->生產(chǎn)->消費(fèi))指標(biāo)定義指標(biāo)生產(chǎn)這部分整體介紹了指標(biāo)體系建設(shè)方法論和工具產(chǎn)品的建設(shè)情況,目前指標(biāo)字典和開(kāi)發(fā)工具已實(shí)現(xiàn)流程打通,與數(shù)據(jù)消費(fèi)產(chǎn)品的打通后續(xù)會(huì)通過(guò)DataAPI方式提供數(shù)據(jù)服務(wù),規(guī)劃建設(shè)中。
三、數(shù)據(jù)治理
一、數(shù)據(jù)治理治的是“數(shù)據(jù)”嗎?
數(shù)據(jù)是指對(duì)客觀事件進(jìn)行記錄并可以鑒別的符號(hào),是對(duì)客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些物理符號(hào)的組合。其實(shí)在我看來(lái),數(shù)據(jù)可以分為兩個(gè)部分,一是數(shù)字,二是文字。數(shù)字是沒(méi)有意義的抽象符號(hào),數(shù)據(jù)是有意義的數(shù)字。文字表意,數(shù)字表量,當(dāng)兩者結(jié)合起來(lái),數(shù)據(jù)就產(chǎn)生了。
在我們的生活和工作當(dāng)中,數(shù)據(jù)無(wú)處不在。對(duì)企業(yè)來(lái)講,有很多數(shù)據(jù)是無(wú)關(guān)企業(yè)重大利益的數(shù)據(jù),是沒(méi)有治理的必要的。數(shù)據(jù)治理的對(duì)象必須是重要的數(shù)據(jù)資源,是關(guān)乎企業(yè)重大商業(yè)利益的數(shù)據(jù)資源,這樣的數(shù)據(jù)資源可以稱(chēng)其為“數(shù)據(jù)資產(chǎn)”。正如北大教授王漢生先生所說(shuō):“數(shù)據(jù)治理不是對(duì)“數(shù)據(jù)”的治理,而是對(duì)“數(shù)據(jù)資產(chǎn)”的治理,是對(duì)數(shù)據(jù)資產(chǎn)所有相關(guān)方利益的協(xié)調(diào)與規(guī)范?!蔽覀冃枰珠_(kāi)來(lái)理解這句話:①什么是數(shù)據(jù)資產(chǎn)?②數(shù)據(jù)資產(chǎn)的相關(guān)利益方是誰(shuí)?③協(xié)調(diào)與規(guī)范什么?先說(shuō)一說(shuō)什么是數(shù)據(jù)資產(chǎn)。我們說(shuō)不是所有數(shù)據(jù)都是數(shù)據(jù)資產(chǎn),那到底什么才是數(shù)據(jù)資產(chǎn)呢?《企業(yè)會(huì)計(jì)準(zhǔn)則-基本準(zhǔn)則》第20條規(guī)定:“資產(chǎn)是指企業(yè)過(guò)去的交易或者事項(xiàng)形成的、由企業(yè)擁有或者控制的、預(yù)期會(huì)給企業(yè)帶來(lái)經(jīng)濟(jì)利益的資源。”如果照貓畫(huà)虎修改一下,不難獲得一個(gè)關(guān)于數(shù)據(jù)資產(chǎn)的定義:“數(shù)據(jù)資產(chǎn)是指企業(yè)過(guò)去的交易或者事項(xiàng)形成的,由企業(yè)擁有或者控制的,預(yù)期會(huì)給企業(yè)帶來(lái)經(jīng)濟(jì)利益的數(shù)據(jù)資源?!庇纱丝梢?jiàn),數(shù)據(jù)要成為數(shù)據(jù)資產(chǎn),至少要滿(mǎn)足3個(gè)核心必要條件:①數(shù)據(jù)資產(chǎn)應(yīng)該是企業(yè)的交易或者事項(xiàng)形成的;②企業(yè)擁有或者控制;③預(yù)期會(huì)給企業(yè)帶來(lái)經(jīng)濟(jì)利益。數(shù)據(jù)資產(chǎn)的利益相關(guān)方是誰(shuí)?
根據(jù)數(shù)據(jù)資產(chǎn)的定義,數(shù)據(jù)資產(chǎn)的利益相關(guān)方,包括:①數(shù)據(jù)的生產(chǎn)者,即通過(guò)業(yè)務(wù)交易或事項(xiàng)產(chǎn)生數(shù)據(jù)的人或組織。②數(shù)據(jù)的擁有或控制者,生產(chǎn)數(shù)據(jù)的人不一定是擁有數(shù)據(jù),就像我們天天上網(wǎng)的各種數(shù)據(jù)都不歸我們自己所有,而是落在了各個(gè)互聯(lián)網(wǎng)公司的數(shù)據(jù)庫(kù)中。③數(shù)據(jù)價(jià)值和經(jīng)濟(jì)利益的收益者。數(shù)據(jù)治理就是對(duì)數(shù)據(jù)生產(chǎn)者、擁有或控制者,數(shù)據(jù)價(jià)值獲益者的規(guī)范和協(xié)調(diào)。都什么是需要協(xié)調(diào)和規(guī)范?
首先是數(shù)據(jù)的標(biāo)準(zhǔn)化,定義統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),“寫(xiě)中國(guó)字、說(shuō)普通話”讓數(shù)據(jù)資產(chǎn)的相關(guān)利益方在同一個(gè)“頻道”溝通。數(shù)據(jù)的標(biāo)準(zhǔn)化包含幾個(gè)層面:①數(shù)據(jù)模型標(biāo)準(zhǔn)化。②核心數(shù)據(jù)實(shí)體的標(biāo)準(zhǔn)化(主數(shù)據(jù)的標(biāo)準(zhǔn)化)。③關(guān)鍵指標(biāo)的標(biāo)準(zhǔn)化。其次是數(shù)據(jù)的確權(quán)。數(shù)據(jù)一旦成為資產(chǎn),就一定有擁有方,或者實(shí)際控制人,可以把他們統(tǒng)稱(chēng)產(chǎn)權(quán)人。與實(shí)物不同的是,實(shí)物的產(chǎn)權(quán)是比較明確的,數(shù)據(jù)則比較復(fù)雜。產(chǎn)品在生產(chǎn)制造過(guò)程中,并沒(méi)有與消費(fèi)者交易之前,制造商擁有完全產(chǎn)權(quán)。產(chǎn)品生產(chǎn)出來(lái)后,消費(fèi)者通過(guò)購(gòu)買(mǎi)支付相應(yīng)的貨幣,便擁有了產(chǎn)品的產(chǎn)權(quán)。而數(shù)據(jù)的生產(chǎn)過(guò)程就不一樣了,我們的各種上網(wǎng)行為每天都會(huì)產(chǎn)生大量的數(shù)據(jù),例如:網(wǎng)上購(gòu)物、瀏覽網(wǎng)頁(yè)、使用地圖、評(píng)論/評(píng)價(jià)……。這些數(shù)據(jù)到底歸誰(shuí)所有?控制權(quán)該如何治理?這是擺在面前的一個(gè)難題!我們看到近幾年一些不良商家,利用我們的上網(wǎng)數(shù)據(jù),導(dǎo)致安全隱私泄密的事件也層出不窮。希望隨著技術(shù)和商業(yè)的進(jìn)步,盡快能夠找到解決方案!第三是流程的優(yōu)化。數(shù)據(jù)治理的兩個(gè)目標(biāo):一個(gè)是提質(zhì)量,一個(gè)是控安全?;ヂ?lián)網(wǎng)數(shù)據(jù)的確權(quán)目前已經(jīng)是一個(gè)世界級(jí)難題,做好企業(yè)業(yè)務(wù)流程的優(yōu)化可能會(huì)對(duì)隱私保護(hù)起到一定的作用。通過(guò)業(yè)務(wù)流程優(yōu)化,規(guī)范數(shù)據(jù)從產(chǎn)生、處理、使用到銷(xiāo)毀的整個(gè)生命周期,使得數(shù)據(jù)在各階段、各流程環(huán)節(jié)安全可控,合規(guī)使用。另外,通過(guò)一定的流程優(yōu)化,通過(guò)對(duì)相關(guān)流程進(jìn)行監(jiān)管,按照數(shù)據(jù)的質(zhì)量規(guī)則進(jìn)行數(shù)據(jù)校驗(yàn),符合“垃圾進(jìn)、垃圾出”的數(shù)據(jù)采集、處理、存儲(chǔ)原則,提升數(shù)據(jù)治理,賦能業(yè)務(wù)應(yīng)用。二、數(shù)據(jù)治理到底在哪里治?
數(shù)據(jù)治理到底應(yīng)該放在中臺(tái),還是后臺(tái),我個(gè)人的理解是:小數(shù)據(jù)標(biāo)準(zhǔn)化治理靠人工、大數(shù)據(jù)預(yù)測(cè)性分析靠智能,將兩者結(jié)合起來(lái):“人工+智能”形成了完整的數(shù)據(jù)治理技術(shù)體系。一個(gè)企業(yè)的數(shù)據(jù)治理既離不開(kāi)小數(shù)據(jù)的標(biāo)準(zhǔn)化治理,也離不開(kāi)大數(shù)據(jù)的預(yù)測(cè)性分析。
這里的小數(shù)據(jù),是在承載事物實(shí)體的數(shù)據(jù),例如:人、財(cái)、物等,是企業(yè)所有業(yè)務(wù)開(kāi)展的載體。其實(shí)說(shuō)白了就是主數(shù)據(jù)管理。對(duì)于主數(shù)據(jù)的治理筆者認(rèn)為是一個(gè)后臺(tái)行為,治理核心是“唯一數(shù)據(jù)源、統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)”,而要達(dá)到這一目標(biāo)是需要從數(shù)據(jù)的源頭抓起的,并且需要大量的人為干預(yù),比如:數(shù)據(jù)標(biāo)準(zhǔn)的制定和落實(shí),數(shù)據(jù)質(zhì)量的清洗,數(shù)據(jù)的申請(qǐng)審批,數(shù)據(jù)的分發(fā)和共享等。從這里也能夠看出小數(shù)據(jù)的治理,追求的是標(biāo)準(zhǔn)化、精確化,應(yīng)該是一個(gè)后臺(tái)行為。而在大數(shù)據(jù)時(shí)代,得益于大數(shù)據(jù)技術(shù)的突破,大量的結(jié)構(gòu)化、非結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù)能夠得到儲(chǔ)存、處理、計(jì)算和分析,這一方面提升了我們從海量數(shù)據(jù)中獲取知識(shí)和洞見(jiàn)的能力。對(duì)于大數(shù)據(jù),傳統(tǒng)的一味追求精確的思維受到了挑戰(zhàn)。而對(duì)于大數(shù)據(jù)的治理,允許一定程度上的容錯(cuò),反而可以在宏觀層面擁有更好的知識(shí)和洞察力。對(duì)于大數(shù)據(jù)的治理更多的是采用AI技術(shù),例如:知識(shí)圖譜、語(yǔ)音識(shí)別等,對(duì)大數(shù)據(jù)的采集、處理、使用過(guò)程加以控制,使其能夠合規(guī)使用。所以,大數(shù)據(jù)的治理放在中臺(tái)似乎更為合適。三、數(shù)據(jù)治理到底應(yīng)該怎么治?1、找癥狀,明確目標(biāo)
任何企業(yè)實(shí)施數(shù)據(jù)治理都不是為了治理數(shù)據(jù)而治理數(shù)據(jù),其背后都是管理和業(yè)務(wù)目標(biāo)的驅(qū)動(dòng)。企業(yè)中普遍存在的數(shù)據(jù)質(zhì)量問(wèn)題有:數(shù)據(jù)不一致、數(shù)據(jù)重復(fù)、數(shù)據(jù)不準(zhǔn)確、數(shù)據(jù)不完整、數(shù)據(jù)關(guān)系混亂、數(shù)據(jù)不及時(shí)等。由于這些數(shù)據(jù)問(wèn)題的存在對(duì)業(yè)務(wù)的開(kāi)展和業(yè)務(wù)部門(mén)之間的溝通造成了較大的困擾,產(chǎn)生了很大的成本;各異構(gòu)的系統(tǒng)中數(shù)據(jù)不一致,導(dǎo)致業(yè)務(wù)系統(tǒng)之間的應(yīng)用集成無(wú)法開(kāi)展;數(shù)據(jù)質(zhì)量差無(wú)法支撐數(shù)據(jù)分析,分析結(jié)果與實(shí)際偏差較大。然而要實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)管理、數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)的目標(biāo),沒(méi)有高質(zhì)量的數(shù)據(jù)支撐是行不通的。
目標(biāo):企業(yè)實(shí)施數(shù)據(jù)治理的第一步,就是要明確數(shù)據(jù)治理的目標(biāo),理清數(shù)據(jù)治理的關(guān)鍵點(diǎn)。技術(shù)工具:實(shí)地調(diào)研、高層訪談、組織架構(gòu)圖。輸入:企業(yè)數(shù)據(jù)戰(zhàn)略規(guī)劃,亟待解決的業(yè)務(wù)問(wèn)題,經(jīng)營(yíng)發(fā)展需求,業(yè)務(wù)需求等;輸出:數(shù)據(jù)治理的初步溝通方案,項(xiàng)目任務(wù)書(shū),工作計(jì)劃表;2、理數(shù)據(jù),現(xiàn)狀分析針對(duì)企業(yè)數(shù)據(jù)治理所處的內(nèi)外部環(huán)境,從組織、人員、流程、數(shù)據(jù)四個(gè)方面入手,進(jìn)行數(shù)據(jù)治理現(xiàn)狀的分析。某企業(yè)數(shù)據(jù)治理痛點(diǎn)分析
組織方面:是否有專(zhuān)業(yè)的數(shù)據(jù)治理組織,是否明確崗位職責(zé)和分工。人員方面:數(shù)據(jù)人才的資源配置情況,包括數(shù)據(jù)標(biāo)準(zhǔn)化人員、數(shù)據(jù)建模人員,數(shù)據(jù)分析人員,數(shù)據(jù)開(kāi)發(fā)人員等,以及數(shù)據(jù)人才的占比情況。流程方面:數(shù)據(jù)管理的現(xiàn)狀,是否有歸口管理部門(mén),是否有數(shù)據(jù)管理的流程、流程各環(huán)節(jié)的數(shù)據(jù)控制情況等;數(shù)據(jù)方面:梳理數(shù)據(jù)質(zhì)量問(wèn)題列表,例如:數(shù)據(jù)不一致問(wèn)題,數(shù)據(jù)不完整,數(shù)據(jù)不準(zhǔn)確、數(shù)據(jù)不真實(shí)、數(shù)據(jù)不及時(shí)、數(shù)據(jù)關(guān)系混亂,以及數(shù)據(jù)的隱私與安全問(wèn)題等。目標(biāo):分析企業(yè)數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量的現(xiàn)狀,確定初步數(shù)據(jù)治理成熟度評(píng)估方案。技術(shù)工具:實(shí)地訪談、調(diào)研表、數(shù)據(jù)質(zhì)量問(wèn)題評(píng)議表、關(guān)鍵數(shù)據(jù)識(shí)別方法論(例如:主數(shù)據(jù)特征識(shí)別法);輸入:需求及現(xiàn)狀調(diào)研表、訪談?dòng)涗?、?shù)據(jù)樣本、數(shù)據(jù)架構(gòu)、數(shù)據(jù)管理制度和流程文件;輸出:數(shù)據(jù)問(wèn)題列表、數(shù)據(jù)U/C矩陣、數(shù)據(jù)治理現(xiàn)狀分析報(bào)告、數(shù)據(jù)治理評(píng)估方案;3、數(shù)據(jù)治理成熟度評(píng)估數(shù)據(jù)治理成熟度反映了組織進(jìn)行數(shù)據(jù)治理所具備的條件和水平,包括元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、業(yè)務(wù)流程整合、主數(shù)據(jù)管理和信息生命周期管理。CMMIDMM數(shù)據(jù)管理能力成熟度評(píng)估模型數(shù)據(jù)治理成熟度評(píng)估是利用標(biāo)準(zhǔn)的成熟度評(píng)估工具結(jié)合行業(yè)最佳實(shí)踐,針對(duì)企業(yè)的數(shù)據(jù)治理現(xiàn)狀進(jìn)行的客觀評(píng)價(jià)和打分,找到企業(yè)數(shù)據(jù)治理的短板,以便制定切實(shí)可行的行動(dòng)方案。數(shù)據(jù)治理成熟度結(jié)束后形成初步的行動(dòng)方案,一般包括數(shù)據(jù)治理戰(zhàn)略,數(shù)據(jù)治理指標(biāo),數(shù)據(jù)治理規(guī)則,數(shù)據(jù)治理權(quán)責(zé)。數(shù)據(jù)治理愿景和使命是數(shù)據(jù)治理的整體目標(biāo);數(shù)據(jù)治理指標(biāo)定義了數(shù)據(jù)治理目標(biāo)的衡量方法;數(shù)據(jù)治理規(guī)則和定義包括與數(shù)據(jù)相關(guān)的政策、標(biāo)準(zhǔn)、合規(guī)要求、業(yè)務(wù)規(guī)則和數(shù)據(jù)定義等;權(quán)利和職責(zé)規(guī)定了由誰(shuí)來(lái)負(fù)責(zé)制訂數(shù)據(jù)相關(guān)的決策、何時(shí)實(shí)施、如何實(shí)施,以及組織和個(gè)人在數(shù)據(jù)治理策略中該做什么。目標(biāo):結(jié)合業(yè)界標(biāo)準(zhǔn)的數(shù)據(jù)治理成熟度模型,根據(jù)企業(yè)管理和業(yè)務(wù)需求進(jìn)行數(shù)據(jù)治理成熟的評(píng)估,形成初步的數(shù)據(jù)治理策略和行動(dòng)路線。技術(shù)工具:數(shù)據(jù)治理評(píng)估模型,例如:DCMM,CMMIDMM,IBM數(shù)據(jù)治理成熟度評(píng)估模型等;輸入:第2步的輸入以及數(shù)據(jù)治理評(píng)估模型、數(shù)據(jù)治理評(píng)估工具(評(píng)估指標(biāo)、打分表等);輸出:數(shù)據(jù)治理評(píng)估結(jié)果,數(shù)據(jù)治理策略,初步的行動(dòng)方案;4、數(shù)據(jù)質(zhì)量問(wèn)題根因分析數(shù)據(jù)治理的目的是解決數(shù)據(jù)質(zhì)量問(wèn)題提升數(shù)據(jù)質(zhì)量,從而為數(shù)據(jù)驅(qū)動(dòng)的數(shù)字化企業(yè)提供源動(dòng)力,而提到數(shù)據(jù)質(zhì)量問(wèn)題,做過(guò)BI、數(shù)倉(cāng)的同學(xué)一定知道,這是一個(gè)技術(shù)和業(yè)務(wù)“經(jīng)常打架”相互推諉的問(wèn)題。某企業(yè)數(shù)據(jù)問(wèn)題根因分析魚(yú)骨圖產(chǎn)生數(shù)據(jù)質(zhì)量問(wèn)題的原因有很多,有業(yè)務(wù)方面的、有管理方面的、也有技術(shù)方面的,按照80/20法則,80%的問(wèn)題是由20%的原因造成起的。所以,如果能夠解決這20%的問(wèn)題,就能得到80%的改進(jìn)。目標(biāo):分析并找到數(shù)據(jù)質(zhì)量問(wèn)題產(chǎn)生的根本原因,制定行之有效的解決方案;技術(shù)工具:頭腦風(fēng)暴、5W1H、SWOT、因果(魚(yú)刺)圖、帕拉圖等;輸入:數(shù)據(jù)問(wèn)題列表、數(shù)據(jù)U/C矩陣、數(shù)據(jù)治理現(xiàn)狀分析報(bào)告、數(shù)據(jù)治理評(píng)估結(jié)果;輸出:數(shù)據(jù)質(zhì)量評(píng)估結(jié)果、對(duì)業(yè)務(wù)的潛在影響和根本原因。5、業(yè)務(wù)影響及實(shí)施優(yōu)先級(jí)評(píng)估通過(guò)數(shù)據(jù)治理成熟度評(píng)估,從組織、流程、制度、人員、技術(shù)等方面找到企業(yè)在數(shù)據(jù)治理的待提升的領(lǐng)域和環(huán)節(jié),再通過(guò)數(shù)據(jù)質(zhì)量根因分析找到數(shù)據(jù)質(zhì)量問(wèn)題發(fā)生的根本原因,進(jìn)一步明確了數(shù)據(jù)治理的目標(biāo)和內(nèi)容。再接下來(lái),就需要確定數(shù)據(jù)治理策略,定義數(shù)據(jù)治理的實(shí)施優(yōu)先級(jí)。某企業(yè)主數(shù)據(jù)治理實(shí)施優(yōu)先級(jí)評(píng)估不同的數(shù)據(jù)治理領(lǐng)域解決的是不同的問(wèn)題,而數(shù)據(jù)治理的每個(gè)領(lǐng)域都有它的實(shí)施難點(diǎn),對(duì)企業(yè)來(lái)說(shuō),需要從業(yè)務(wù)的影響程度,問(wèn)題的緊急程度、實(shí)施的難易程度等多個(gè)維度進(jìn)行分析和權(quán)衡,從而找到符合企業(yè)需求并滿(mǎn)足企業(yè)發(fā)展的方案。目標(biāo):確定數(shù)據(jù)治理核心領(lǐng)域和支撐體系的建設(shè)/實(shí)施優(yōu)先級(jí);技術(shù)工具:四象限法則(分別從業(yè)務(wù)影響程度/實(shí)施難以程度,問(wèn)題重要程度/問(wèn)題緊急程度繪制優(yōu)先級(jí)矩陣)、KANO模型輸入:數(shù)據(jù)治理成熟度能力評(píng)估結(jié)果、數(shù)據(jù)質(zhì)量問(wèn)題根因分析結(jié)果;輸出:數(shù)據(jù)治理實(shí)施優(yōu)先級(jí)策略6、制定數(shù)據(jù)治理行動(dòng)路線和計(jì)劃路線圖是使用特定技術(shù)方案幫助達(dá)到短期或者長(zhǎng)期目標(biāo)的計(jì)劃,用于新產(chǎn)品、項(xiàng)目或技術(shù)領(lǐng)域的開(kāi)發(fā),是指應(yīng)用簡(jiǎn)潔的圖形、表格、文字等形式描述技術(shù)變化的步驟或技術(shù)相關(guān)環(huán)節(jié)之間的邏輯關(guān)系。路線圖是一種目標(biāo)計(jì)劃,就是把未來(lái)計(jì)劃要做的事列出來(lái),直至達(dá)到某一個(gè)目標(biāo),就好像沿著地圖路線一步一步找到終點(diǎn)一樣,故稱(chēng)路線圖。某企業(yè)數(shù)據(jù)治理實(shí)施路線圖企業(yè)數(shù)據(jù)治理的實(shí)施路線圖的制定是以企業(yè)數(shù)據(jù)戰(zhàn)略——愿景和使命為綱領(lǐng),以急用優(yōu)先為原則,以分步實(shí)施為策略進(jìn)行了整體設(shè)計(jì)和規(guī)劃。實(shí)施路線圖主要包含的內(nèi)容:分幾個(gè)階段實(shí)施,每個(gè)階段的目標(biāo)、工作內(nèi)容、時(shí)間節(jié)點(diǎn)要求、環(huán)境條件等。筆者觀點(diǎn):任何一個(gè)企業(yè)的數(shù)據(jù)治理都不是一蹴而就,一步到位的,需要循序漸進(jìn)、持續(xù)優(yōu)化!實(shí)施路線圖就是基于此產(chǎn)生的,因此說(shuō)數(shù)據(jù)治理實(shí)施路線圖也是說(shuō)服利益相關(guān)者支持的一個(gè)重要手段。目標(biāo):確定數(shù)據(jù)治理的階段以及每個(gè)階段的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)小容量注射劑行業(yè)發(fā)展?jié)摿Ψ治黾巴顿Y戰(zhàn)略咨詢(xún)報(bào)告
- 普通人普通力
- 嗨我的"組裝"愛(ài)情
- 一年級(jí)語(yǔ)文知識(shí)點(diǎn)梳理下冊(cè)
- 大字制作合同范本
- 中國(guó)大中型客車(chē)行業(yè)運(yùn)行態(tài)勢(shì)及未來(lái)發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 陶藝項(xiàng)目調(diào)研報(bào)告
- 2025年中國(guó)鹽酸胺碘酮市場(chǎng)供需現(xiàn)狀及投資戰(zhàn)略研究報(bào)告
- 一年級(jí)上冊(cè)語(yǔ)文知識(shí)點(diǎn)歸納總結(jié)
- 服裝、鞋帽批發(fā)服務(wù)項(xiàng)目可行性研究分析報(bào)告
- 甘草種植技術(shù)課件
- 冀教版英語(yǔ)九年級(jí)Unit 5 單詞短語(yǔ)預(yù)習(xí)復(fù)習(xí)單
- 公司安全生產(chǎn)監(jiān)督管理辦法
- 鋼筋工工藝與實(shí)習(xí)(第二版)課件匯總?cè)珪?shū)電子教案完整版課件最全幻燈片(最新)課件電子教案幻燈片
- 煤礦從業(yè)人員考試題庫(kù)全答案(word版)
- 洞頂回填技術(shù)交底
- 最簡(jiǎn)易的帕累托圖制作方法簡(jiǎn)介PPT通用課件
- 城市軌道交通應(yīng)急處理課程標(biāo)準(zhǔn)
- 初二下分式混合計(jì)算練習(xí)1(附答案)
- (完整版)振幅調(diào)制與解調(diào)習(xí)題及其解答
- 抗震支架施工安裝合同
評(píng)論
0/150
提交評(píng)論