版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
—
01
—“養(yǎng)數(shù)據(jù)”的內涵“養(yǎng)數(shù)據(jù)”其實也算不上是一個新詞兒了,車品覺老師的《決戰(zhàn)大數(shù)據(jù)》(2014年出版)一書中就曾提到:“主動收集數(shù)據(jù)的行為即為養(yǎng)數(shù)據(jù)”。筆者認為“養(yǎng)數(shù)據(jù)”不僅在數(shù)據(jù)收集上,而是應貫穿在數(shù)據(jù)的收集、處理和使用的全生命周期中。養(yǎng)數(shù)據(jù)就如同“養(yǎng)貓、養(yǎng)狗、養(yǎng)孩子”一樣,需要持續(xù)地投入?!梆B(yǎng)”有兩個層面的含義,一是要將數(shù)據(jù)“養(yǎng)大”,收集、積累和沉淀大量的數(shù)據(jù);二是要將數(shù)據(jù)“養(yǎng)活”,提升數(shù)據(jù)的“活性”,讓數(shù)據(jù)易用、好用!1、養(yǎng)“大”數(shù)據(jù)養(yǎng)“大”數(shù)據(jù),就是收集、積累和沉淀大量的數(shù)據(jù),讓企業(yè)有數(shù)據(jù)可用。這里有個誤區(qū),究竟數(shù)據(jù)養(yǎng)多大才算是“大”?其實,養(yǎng)“大”數(shù)據(jù)不在于收集的數(shù)據(jù)體量有多大,更重要的是能夠為企業(yè)帶來多大的潛在價值!2014年大數(shù)據(jù)正如火如荼的時候,我們接到一個大數(shù)據(jù)項目,客戶的要求是將所有業(yè)務系統(tǒng)的數(shù)據(jù)全部接入到大數(shù)據(jù)平臺,具體為什么要收集這些數(shù)據(jù),要這些數(shù)據(jù)干什么?這些問題客戶并沒有想好。按照當時客戶的思路是:大數(shù)據(jù)一定是有價值的,雖然我們現(xiàn)在不知道怎么用它,但我們現(xiàn)在把它收集起來,說不定將來的哪一天就能用到了。后來,數(shù)據(jù)收集的越來越多,管理的成本越來越大,但實際上卻沒有使用起來,雖然該項目最終成功驗收了,但在我看來,這個項目不算是一個成功的項目,因為它沒有給客戶真正帶來價值。沒有目標的收集數(shù)據(jù),就只是單純的收集數(shù)據(jù),并不是“養(yǎng)數(shù)據(jù)”?!梆B(yǎng)數(shù)據(jù)”是需要帶有明確的目的性的,因為數(shù)據(jù)是枯燥的,數(shù)據(jù)也不會自己說話,需要人運用適當?shù)姆椒◤倪@些枯燥的數(shù)據(jù)中提取有價值的信息。因此,“養(yǎng)數(shù)據(jù)”的過程,需要對數(shù)據(jù)收集的內容、渠道、方法進行策劃,以確保通過正確的方法收集正確的數(shù)據(jù),進而確保數(shù)據(jù)分析過程是有效的。2、養(yǎng)“活”數(shù)據(jù)養(yǎng)“活”數(shù)據(jù),提升數(shù)據(jù)的“活性”和質量,打通數(shù)據(jù)孤島,實現(xiàn)數(shù)據(jù)交換共享,讓企業(yè)有可用數(shù)據(jù)。盲目的收集數(shù)據(jù)并不能讓數(shù)據(jù)“活”起來,所收集的數(shù)據(jù)都是“死數(shù)據(jù)”。所謂“死數(shù)據(jù)”也叫“暗數(shù)據(jù)”,指那些企業(yè)在日常業(yè)務活動中收集、處理和存儲,但未被發(fā)掘或理解、不具備特定用途的數(shù)據(jù)。我們上文講過“數(shù)據(jù)收集要有目的性”,這沒錯。但在實際的數(shù)據(jù)收集的過程中,很多情況下我們并不能直接收集到所需的關鍵數(shù)據(jù),這就要求企業(yè)不僅要“活”做數(shù)據(jù)收集,還要“活”做數(shù)據(jù)管理,提升數(shù)據(jù)質量并以避免“死數(shù)據(jù)/暗數(shù)據(jù)”的發(fā)生?!盎睢弊鰯?shù)據(jù)收集是針對不同的數(shù)據(jù)類型、不同的應用場景,采用不同的數(shù)據(jù)收集方法進行靈活收集數(shù)據(jù)。“活”做數(shù)據(jù)管理的重點是建立靈活的數(shù)據(jù)管理和共享機制,讓合適的人在合適的時間能夠獲得合適的數(shù)據(jù)。—
02
—企業(yè)數(shù)據(jù)到底怎么“養(yǎng)”?介紹了養(yǎng)數(shù)據(jù)的概念,可能很多人更加關心到底該如何“養(yǎng)數(shù)據(jù)”。個人認為企業(yè)要養(yǎng)好數(shù)據(jù),得從以下5個方面入手。1、將“養(yǎng)數(shù)據(jù)”作為一種戰(zhàn)略關于數(shù)據(jù)如何賦能數(shù)字化轉型,大家談的更多的是數(shù)據(jù)分析、數(shù)據(jù)挖掘、模型、算法、可視化、報表、儀表板、大屏等數(shù)據(jù)應用相關內容,我們把這些內容都可以稱為“用數(shù)據(jù)”。但是,“巧婦難為無米之炊”,如果企業(yè)“無數(shù)據(jù)可用”,那模型再強大、算法再完美、界面再漂亮,可能也無濟于事?!坝脭?shù)據(jù)”需要的是技術、方法和工具,而“養(yǎng)數(shù)據(jù)”一定從戰(zhàn)略思維開始。只有將數(shù)據(jù)不斷“養(yǎng)大、養(yǎng)活”數(shù)據(jù)的價值才能被激發(fā)和釋放。正如車品覺老師所說“養(yǎng)數(shù)據(jù)是一種數(shù)據(jù)戰(zhàn)略,是基于深入業(yè)務理解的更高層次的商業(yè)決策,數(shù)據(jù)養(yǎng)的時間越早,積累的數(shù)據(jù)也就越多。”2、從收集數(shù)據(jù)開始,將數(shù)據(jù)“養(yǎng)大”保證企業(yè)“有數(shù)據(jù)可用”,從有效和正確的收集數(shù)據(jù)開始,數(shù)據(jù)收集越早,積累的越多,能夠帶來的潛在價值就越大。人們普遍認為數(shù)據(jù)收集就是需要將來自不同來源系統(tǒng)的數(shù)據(jù)復制或遷移到一個中央數(shù)據(jù)存儲庫中(例如如數(shù)據(jù)倉庫或者數(shù)據(jù)湖),進行統(tǒng)一管理。但這只是數(shù)據(jù)收集的一個環(huán)節(jié)而已,并不是數(shù)據(jù)收集的全過程。不同的行業(yè)、不同的業(yè)務場景、不同的數(shù)據(jù)類型,所需要的數(shù)據(jù)收集流程也不一樣,核心的流程總體可以歸納如下:①確定收集需求,數(shù)據(jù)收集一定是為業(yè)務需求服務的,不能盲目收集,數(shù)據(jù)收集到“最小夠用”即可。沒有目標的盲目收集,不僅可能造成成本的浪費,還可能引發(fā)“合規(guī)性”的風險(例如違反個人信息保護法)。②確定數(shù)據(jù)源,明確要從哪里獲取數(shù)據(jù),例如:企業(yè)內部還是外部數(shù)據(jù)。③確定收集方式,針對不同數(shù)據(jù)應用需求和數(shù)據(jù)源類型選擇相應的數(shù)據(jù)采集方式,例如:表單采集、報表采集、庫表批采、文件采集、消息采集、流式采集、爬蟲采集、埋點采集等。④執(zhí)行數(shù)據(jù)收集。在收集非結構化、半結構化數(shù)據(jù)過程中利用圖像識別、語音識別、自然語言處理等AI技術對這些數(shù)據(jù)進行結構化處理,并提供統(tǒng)一的元數(shù)據(jù)查詢,是解決“無數(shù)據(jù)可用”的一個重要解決方案。遺憾的是,這些技術還處于探索階段,還未形成普及化的產(chǎn)品和應用。⑤分析驗證,驗證收集的數(shù)據(jù)是否有效,是否能夠滿足業(yè)務所需。⑥數(shù)據(jù)入湖,將收集/采集的數(shù)據(jù)存入中央數(shù)據(jù)存儲庫中(數(shù)據(jù)湖或數(shù)據(jù)倉庫)。3、靈活的數(shù)據(jù)管理機制,將數(shù)據(jù)“養(yǎng)活”盡管我們明確了數(shù)據(jù)需求,定義了數(shù)據(jù)源,但也并不是每個收集來的數(shù)據(jù)對企業(yè)都是有價值的。在數(shù)據(jù)收集來之后,數(shù)據(jù)分析之前,所有數(shù)據(jù)都必須經(jīng)過統(tǒng)一組織和管理,包括數(shù)據(jù)的清洗、編目、整合和治理,“盤活”數(shù)據(jù),讓數(shù)據(jù)能夠被“看得見、找得到、用得好”,提升數(shù)據(jù)的價值。①數(shù)據(jù)處理。對收集來的結構化和非結構化數(shù)據(jù)進行轉換和整理,確保數(shù)據(jù)正確、有效、可用和安全。統(tǒng)一提取這些數(shù)據(jù)的元數(shù)據(jù)并進行存儲和管理,并補齊關鍵元數(shù)據(jù),使其具備可識別性。②數(shù)據(jù)編目。數(shù)據(jù)編目就是為數(shù)據(jù)建立一個目錄,并向用戶提供獲取數(shù)據(jù)可訪問性、健康和位置等內容所需的必要信息。編目的方式有手工編目和自動編目,主要涉及數(shù)據(jù)的識別、編目和發(fā)現(xiàn)。隨著機器學習、人工智能等技術的應用,增強了企業(yè)數(shù)據(jù)管理的能力,讓編目工作越來越自動化。③數(shù)據(jù)服務?;跀?shù)據(jù)目錄開發(fā)和發(fā)布數(shù)據(jù)服務,控制訪問權限,讓合適的用戶在合適的時間找到合適的數(shù)據(jù),并監(jiān)控數(shù)據(jù)服務的使用情況,以便根據(jù)數(shù)據(jù)的質量和使用情況,對相關數(shù)據(jù)及時作出反饋和調整。4、數(shù)據(jù)來源于業(yè)務,最終還是要回歸業(yè)務在企業(yè)數(shù)字化轉型的路上,必須牢記的一個原則是“數(shù)據(jù)來源于業(yè)務,且必須回歸于業(yè)務”,我們將數(shù)據(jù)“養(yǎng)大”、“養(yǎng)活”不是目的,而是過程,“養(yǎng)數(shù)據(jù)”的本質目的還是要讓數(shù)據(jù)能夠對企業(yè)的業(yè)務起到更好的驅動或支撐作用。①數(shù)據(jù)是由業(yè)務產(chǎn)生的,從業(yè)務規(guī)劃和設計之初,就要做好“養(yǎng)數(shù)據(jù)”的準備。大到整體的企業(yè)架構規(guī)劃,小到一個業(yè)務模塊的流程、表單和操作設計,都需要考慮如何才能收集到完整、準確、真實的數(shù)據(jù),做好與之對應的數(shù)據(jù)規(guī)劃,例如:數(shù)據(jù)架構、數(shù)據(jù)標準、數(shù)據(jù)分布、數(shù)據(jù)流向等。②“養(yǎng)數(shù)據(jù)千日,用數(shù)據(jù)一時”,將“養(yǎng)數(shù)據(jù)”作為企業(yè)的一種習慣,一種文化,企業(yè)的數(shù)據(jù)戰(zhàn)略才能真正落地。同時,只養(yǎng)好數(shù)據(jù)還不夠,還需要培養(yǎng)“數(shù)據(jù)化思維”,堅持“用數(shù)據(jù)說話、用數(shù)據(jù)管理、用數(shù)據(jù)決策”,將數(shù)據(jù)應用在日常工作中。③養(yǎng)數(shù)據(jù)、用數(shù)據(jù)、流程優(yōu)化,是一個相互作用,互為驅動的關系。企業(yè)業(yè)務是經(jīng)常變化的,因此“養(yǎng)數(shù)據(jù)、用數(shù)據(jù)”的過程也需要隨著業(yè)務的變化而進行調整。另一方面,數(shù)據(jù)的分析、挖掘和應用,也會發(fā)現(xiàn)業(yè)務的一些問題、不足或機會,這時候企業(yè)就需要對業(yè)務流程進行調整、優(yōu)化,甚至重構?!?/p>
03
—治數(shù)VS養(yǎng)數(shù),哪個棋高一招?這是一個偽命題,如果你看過我之前的數(shù)據(jù)治理文章,也不難得出這個結論:治數(shù)與養(yǎng)數(shù)并沒有高低之分,養(yǎng)數(shù)據(jù)也是一種數(shù)據(jù)治理的策略,而數(shù)據(jù)治理以全面的視角,為養(yǎng)數(shù)據(jù)提供保障。本質上,養(yǎng)數(shù)據(jù)即為數(shù)據(jù)治理,數(shù)據(jù)治理也是養(yǎng)數(shù)據(jù)!1、狹義理解:養(yǎng)數(shù)據(jù)過程的治數(shù)上文我們說過,養(yǎng)數(shù)據(jù)就像養(yǎng)小孩一樣,需要持續(xù)投入,以使其茁壯成長。但這個過程并不容易,有孩子的讀者一定深有體會,孩子生病即使只是最為普通的感冒,也會讓父母操碎了心。養(yǎng)數(shù)據(jù)的過程也一樣,你的數(shù)據(jù)寶寶也是會經(jīng)?!吧 钡?,例如:生了病就得治,早治早好!這里的“治”主要是針對數(shù)據(jù)問題的“癥狀”進行治理,是狹義層面的治理,以解決實際數(shù)據(jù)問題為主,常見的治理手段包括:主數(shù)據(jù)管理,元數(shù)據(jù)管理、數(shù)據(jù)標準管理、數(shù)據(jù)質量管理等。2、廣義理解:養(yǎng)數(shù)據(jù)過程的治數(shù)“養(yǎng)數(shù)據(jù)”是企業(yè)的數(shù)據(jù)戰(zhàn)略,一定從戰(zhàn)略思維開始,不僅包含了數(shù)據(jù)收集和管理的各種技術、方法和工具,更包含了數(shù)據(jù)管理的組織、制度和流程。在我的新書《一本書講透數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度虛擬現(xiàn)實設備研發(fā)與委托生產(chǎn)合同
- 2024年度機械設備買賣合同樣本
- 2024年度人力資源外包與招聘服務協(xié)議
- 2024年度物流園區(qū)建設與運營合同
- 2024年員工保密協(xié)議模板
- 2024年度自建房施工合同終止合同
- 2024年工程預付款資金監(jiān)管協(xié)議
- 2024出版社與作者之間的出版合同
- 2024年度企業(yè)文化建設合作協(xié)議
- 2024年建筑企業(yè)與監(jiān)理單位服務協(xié)議
- 中國女性生理健康白皮書
- 天然氣巡檢記錄表
- 甲苯磺酸瑞馬唑侖臨床應用
- 民法典講座-繼承篇
- 外包施工單位入廠安全培訓(通用)
- 糖尿病健康知識宣教課件
- 客戶接觸點管理課件
- Python語言學習通超星課后章節(jié)答案期末考試題庫2023年
- 醫(yī)學-心臟驟停急救培訓-心臟驟停急救教學課件
- 高中英語-Book 1 Unit 4 Click for a friend教學課件設計
- 年產(chǎn)30萬噸碳酸鈣粉建設項目可行性研究報告
評論
0/150
提交評論