企業(yè)數(shù)字化轉(zhuǎn)型全域數(shù)據(jù)平臺能力規(guī)劃建設(shè)方案_第1頁
企業(yè)數(shù)字化轉(zhuǎn)型全域數(shù)據(jù)平臺能力規(guī)劃建設(shè)方案_第2頁
企業(yè)數(shù)字化轉(zhuǎn)型全域數(shù)據(jù)平臺能力規(guī)劃建設(shè)方案_第3頁
企業(yè)數(shù)字化轉(zhuǎn)型全域數(shù)據(jù)平臺能力規(guī)劃建設(shè)方案_第4頁
企業(yè)數(shù)字化轉(zhuǎn)型全域數(shù)據(jù)平臺能力規(guī)劃建設(shè)方案_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

企業(yè)數(shù)字化轉(zhuǎn)型全域數(shù)據(jù)平臺能力規(guī)劃建設(shè)方案(PPT)整理制作:郎豐利1519制作時(shí)間:2023年睿利而行整理制作:郎豐利1519制作時(shí)間:2023年睿利而行整理制作:郎豐利1519制作時(shí)間:2023年睿利而行2023年目錄1、全域數(shù)據(jù)平臺能力規(guī)劃2、數(shù)據(jù)應(yīng)用能力建設(shè)3、數(shù)據(jù)能力分步演進(jìn)策略整理制作:郎豐利1519制作時(shí)間:2023年睿利而行整理制作:郎豐利1519制作時(shí)間:2023年睿利而行整理制作:郎豐利1519制作時(shí)間:2023年睿利而行全域數(shù)據(jù)平臺建設(shè)–需求與目標(biāo)功能覆蓋我們需要一個(gè)什么樣的數(shù)據(jù)平臺?什么樣的數(shù)據(jù)架構(gòu)?去滿足對數(shù)據(jù)收集、處理、管治、應(yīng)用的全域需求?固化的需求數(shù)據(jù)格式的技術(shù)類型(關(guān)系型數(shù)據(jù)庫、文件、接口流式數(shù)據(jù))數(shù)據(jù)處理的技術(shù)工具組件(數(shù)據(jù)庫、大數(shù)據(jù)平臺、數(shù)據(jù)采集工具、檢索分析挖掘算法、數(shù)據(jù)可視化工具)數(shù)據(jù)治理的手段和模式(數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量規(guī)則、數(shù)據(jù)巡檢、數(shù)據(jù)生命周期管理、元數(shù)據(jù)管理)業(yè)務(wù)數(shù)據(jù)類型擴(kuò)展(企業(yè)內(nèi)部的IT系統(tǒng)建設(shè)、業(yè)務(wù)類型拓展)非固化需求數(shù)據(jù)應(yīng)用需求擴(kuò)展(外部系統(tǒng)對數(shù)據(jù)的應(yīng)用的需求,種類和數(shù)量需求,不可預(yù)期)數(shù)據(jù)量的增加(基于現(xiàn)有系統(tǒng)的數(shù)據(jù)線性增長、新業(yè)務(wù)數(shù)據(jù)體量的增加)架構(gòu)支撐固化技術(shù)性功能,模式匹配業(yè)務(wù)驅(qū)動功能,組合新增組件化引擎,規(guī)則適配彈性化拓展,能力組合數(shù)據(jù)平臺能力建設(shè)-全域數(shù)據(jù)平臺藍(lán)圖運(yùn)營管治域數(shù)據(jù)應(yīng)用層數(shù)據(jù)加工層源數(shù)據(jù)層元數(shù)據(jù)管理數(shù)據(jù)標(biāo)準(zhǔn)管理數(shù)據(jù)質(zhì)量管理數(shù)據(jù)生命周期管理數(shù)據(jù)指標(biāo)管理數(shù)據(jù)安全管理數(shù)據(jù)資產(chǎn)管理數(shù)據(jù)運(yùn)營保障結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)流式實(shí)時(shí)數(shù)據(jù)貼源企業(yè)數(shù)據(jù)湖實(shí)時(shí)數(shù)據(jù)Hub主題數(shù)據(jù)基礎(chǔ)數(shù)據(jù)主數(shù)據(jù)數(shù)據(jù)檢索集市主題分析集市數(shù)據(jù)探索集市報(bào)表型集市

數(shù)據(jù)應(yīng)用報(bào)表服務(wù)決策分析專題分析AI探索數(shù)據(jù)查詢實(shí)時(shí)指標(biāo)監(jiān)控多層聚合數(shù)據(jù)倉庫平臺ETL運(yùn)維支撐域任務(wù)調(diào)度資源管理用戶管理服務(wù)管理權(quán)限管理巡檢管理監(jiān)控管理運(yùn)維管理參數(shù)管理運(yùn)營管理日志管理消息通知實(shí)時(shí)數(shù)據(jù)訂閱數(shù)據(jù)開放平臺數(shù)據(jù)中臺域數(shù)據(jù)服務(wù)配置工具分析挖掘算法設(shè)計(jì)工具自助報(bào)表分析開發(fā)工具數(shù)據(jù)模型設(shè)計(jì)配置工具ETL數(shù)據(jù)配置轉(zhuǎn)換工具研發(fā)支撐域流式數(shù)據(jù)計(jì)算配置工具數(shù)據(jù)采集配置式研發(fā)工具實(shí)時(shí)數(shù)據(jù)流采集數(shù)據(jù)庫采集統(tǒng)一數(shù)據(jù)采集文本文件采集流式文件采集二進(jìn)制文件采集檢索服務(wù)應(yīng)用服務(wù)分析服務(wù)企業(yè)數(shù)據(jù)服務(wù)應(yīng)用服務(wù)檢索服務(wù)分析服務(wù)數(shù)據(jù)平臺能力建設(shè)-數(shù)據(jù)管治平臺數(shù)據(jù)資產(chǎn)戰(zhàn)略數(shù)據(jù)應(yīng)用與服務(wù)數(shù)據(jù)管理保障機(jī)制促進(jìn)支撐實(shí)現(xiàn)支撐數(shù)據(jù)戰(zhàn)略與規(guī)劃數(shù)據(jù)組織與職責(zé)數(shù)據(jù)制度與管理流程數(shù)據(jù)服務(wù)管理數(shù)據(jù)需求管理數(shù)據(jù)產(chǎn)品管理數(shù)據(jù)服務(wù)訪問管理數(shù)據(jù)架構(gòu)管理數(shù)據(jù)標(biāo)準(zhǔn)管理數(shù)據(jù)質(zhì)量管理元數(shù)據(jù)管理數(shù)據(jù)指標(biāo)管理數(shù)據(jù)生命周期管理數(shù)據(jù)安全管理文檔與內(nèi)容管理①管控治理框架數(shù)據(jù)平臺能力建設(shè)-數(shù)據(jù)管治平臺②管控治理功能架構(gòu)整理制作:郎豐利1519制作時(shí)間:2023年睿利而行整理制作:郎豐利1519制作時(shí)間:2023年睿利而行整理制作:郎豐利1519制作時(shí)間:2023年睿利而行數(shù)據(jù)平臺能力建設(shè)-數(shù)據(jù)管治平臺③能力建設(shè)核心目標(biāo)組織目標(biāo):建立適配的數(shù)據(jù)管理團(tuán)隊(duì)和角色組織體系,可以根據(jù)數(shù)據(jù)規(guī)模和應(yīng)用范圍,靈活伸縮。制度目標(biāo):針對數(shù)據(jù)特性,建立一套符合發(fā)展趨勢的企業(yè)數(shù)據(jù)管理制度,制度可根據(jù)發(fā)展不斷更新;流程目標(biāo):制度執(zhí)行保障,流程規(guī)范,其執(zhí)行狀態(tài)可以電子流或者手動流程,但流程的過程必須有數(shù)據(jù)沉淀可追溯工具目標(biāo):一套自動化,低操作門檻的數(shù)據(jù)管理工具,實(shí)現(xiàn)數(shù)據(jù)的全生命周期過程的管理宏觀目標(biāo):為數(shù)據(jù)提供組織、流程、制度和工具保障,推進(jìn)企業(yè)數(shù)據(jù)的資產(chǎn)化,讓數(shù)據(jù)從成本向利潤轉(zhuǎn)化微觀目標(biāo):基于數(shù)據(jù)的生命周期,建立一套保障其質(zhì)量的元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)生命周期管理、數(shù)據(jù)安全的能力,并通過有效的事后檢核,暴露問題,并追蹤問題的解決元數(shù)據(jù):建立元數(shù)據(jù)庫,實(shí)現(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)化,并實(shí)現(xiàn)元數(shù)據(jù)的日常檢核和問題跟蹤;建立元數(shù)據(jù)關(guān)聯(lián),實(shí)現(xiàn)血緣追溯和影響分析。數(shù)據(jù)標(biāo)準(zhǔn):引入國際、國家和行業(yè)標(biāo)準(zhǔn),并根據(jù)企業(yè)業(yè)務(wù)特性,梳理自定義的業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn);數(shù)據(jù)質(zhì)量:實(shí)現(xiàn)數(shù)據(jù)質(zhì)量規(guī)則庫,梳理各類型業(yè)務(wù)質(zhì)量規(guī)則,實(shí)現(xiàn)常態(tài)化數(shù)據(jù)質(zhì)量檢核,出具報(bào)告并追蹤問題的解決;數(shù)據(jù)生命周期管理:從數(shù)據(jù)產(chǎn)生,到消亡,整個(gè)過程實(shí)現(xiàn)狀態(tài)的追蹤,以及狀態(tài)變化的定義和檢核,比如:數(shù)據(jù)備份、數(shù)據(jù)歸檔、數(shù)據(jù)消亡;

基于數(shù)據(jù)基礎(chǔ)狀態(tài)及企業(yè)的業(yè)務(wù)特性,建立一整套數(shù)據(jù)應(yīng)該遵循的標(biāo)準(zhǔn)和質(zhì)量規(guī)則,同時(shí)實(shí)現(xiàn)數(shù)據(jù)向標(biāo)準(zhǔn)化和合規(guī)化轉(zhuǎn)換治理,并且構(gòu)建能維持和保障實(shí)現(xiàn)長效治理目標(biāo)的一系列組織、制度和流程!數(shù)據(jù)平臺能力建設(shè)-數(shù)據(jù)中臺數(shù)據(jù)應(yīng)用層數(shù)據(jù)加工層源數(shù)據(jù)層貼源企業(yè)數(shù)據(jù)湖數(shù)據(jù)探索集市經(jīng)營分析集市數(shù)據(jù)檢索集市報(bào)表集市報(bào)表統(tǒng)計(jì)應(yīng)用投資分析用戶全景畫像信息檢索價(jià)格走勢實(shí)時(shí)輿情數(shù)據(jù)監(jiān)控多層聚合數(shù)據(jù)倉庫平臺實(shí)時(shí)交易數(shù)據(jù)訂閱拍賣系統(tǒng)內(nèi)部數(shù)據(jù)媒體系統(tǒng)交易系統(tǒng)拍賣數(shù)據(jù)外部數(shù)據(jù)輿情數(shù)據(jù)媒介數(shù)據(jù)………...交易系統(tǒng)拍賣系統(tǒng)媒體系統(tǒng)……實(shí)時(shí)數(shù)據(jù)HUB藝術(shù)品主題拍賣主題用戶主題交易主題輿情主題…….業(yè)務(wù)主題集市轉(zhuǎn)換、清洗、加載主題實(shí)時(shí)數(shù)據(jù)1主題實(shí)時(shí)數(shù)據(jù)2主題實(shí)時(shí)數(shù)據(jù)3……...…實(shí)時(shí)數(shù)據(jù)服務(wù)數(shù)據(jù)集市數(shù)據(jù)應(yīng)用……知識圖譜實(shí)時(shí)數(shù)據(jù)流采集數(shù)據(jù)庫采集統(tǒng)一數(shù)據(jù)采集文本文件采集二進(jìn)制文件采集流式文件采集拍賣數(shù)據(jù)輿情數(shù)據(jù)媒介數(shù)據(jù)…...作者主題①中臺功能框架比對評估實(shí)時(shí)輿情服務(wù)層數(shù)據(jù)開放平臺投資分析實(shí)時(shí)輿情知識圖譜企業(yè)數(shù)據(jù)服務(wù)用戶畫像決策分析報(bào)表統(tǒng)計(jì)............全域數(shù)據(jù)平臺建設(shè)-數(shù)據(jù)中臺應(yīng)用層存儲處理層數(shù)據(jù)源層實(shí)時(shí)數(shù)據(jù)采集在/離線數(shù)據(jù)采集貼源企業(yè)數(shù)據(jù)湖(數(shù)據(jù)湖集成組件Kylo+數(shù)據(jù)湖存儲和分析組件易鯨捷數(shù)據(jù)庫

)數(shù)據(jù)檢索集市(HadoopImpala+ES)經(jīng)營分析集市(Mysql)數(shù)據(jù)探索集市(HadoopSpark)報(bào)表集市(Mysql)數(shù)據(jù)應(yīng)用微服務(wù)(自助配置式應(yīng)用服務(wù):SpringBoot+HttpRestful服務(wù)接口/WebService服務(wù)接口)數(shù)據(jù)可視化組件(D3、Echarts、Highcharts)數(shù)據(jù)分析挖掘組件(Spark)多層聚合數(shù)據(jù)倉庫平臺實(shí)時(shí)數(shù)據(jù)HUB緩存(Kafka集群)業(yè)務(wù)主題集市(HadoopHDP)ETL組件(Kettle、Informatic)數(shù)據(jù)集市數(shù)據(jù)應(yīng)用關(guān)系型數(shù)據(jù)庫文本型文件二進(jìn)制文件數(shù)據(jù)流關(guān)系型數(shù)據(jù)庫采集適配組件(Sqoop、Kettle、Informatic)文本型文件采集適配組件(FTP+文本加載工具)二進(jìn)制文件采集適配組件(FTP)流式數(shù)據(jù)采集適配組件(Restful數(shù)據(jù)接口、Flume)流式計(jì)算(Storm集群)主題關(guān)系型數(shù)據(jù)倉庫(Mysql/開源GreenPlum)主題大數(shù)據(jù)型數(shù)據(jù)倉庫(HadoopTrafodion+Kylin)機(jī)器學(xué)習(xí)組件(淺度學(xué)習(xí)SparkMllib+深度學(xué)習(xí)googleTensorflow)自助報(bào)表分析工具(Brio、Congos..)服務(wù)層②中臺技術(shù)框架全域數(shù)據(jù)平臺建設(shè)-數(shù)據(jù)開放平臺數(shù)據(jù)開放平臺投資分析用戶全景畫像信息檢索交易價(jià)格走勢……知識圖譜價(jià)值比對評估實(shí)時(shí)輿情數(shù)據(jù)API開放接口數(shù)據(jù)開放應(yīng)用數(shù)據(jù)微應(yīng)用第三方系統(tǒng)第三方網(wǎng)站系統(tǒng)第三方營銷系統(tǒng)......2C個(gè)人用戶2B企業(yè)用戶系統(tǒng)集成接口調(diào)用用戶體驗(yàn)應(yīng)用訪問1、全域數(shù)據(jù)平臺能力規(guī)劃2、數(shù)據(jù)應(yīng)用能力建設(shè)3、數(shù)據(jù)能力分步演進(jìn)策略數(shù)據(jù)應(yīng)用能力建設(shè)–知識圖譜能力建設(shè)知識圖譜建設(shè)方案與策略數(shù)據(jù)治理主數(shù)據(jù)資產(chǎn)管理建設(shè)知識圖譜構(gòu)建數(shù)據(jù)中臺服務(wù)共享目標(biāo):完成數(shù)據(jù)的深度治理實(shí)施,資產(chǎn)化轉(zhuǎn)變1、完善現(xiàn)有數(shù)據(jù)及關(guān)聯(lián)事件維度數(shù)據(jù)模型:2、對關(guān)鍵描述屬性字段進(jìn)行程序和人工的修補(bǔ)治理,保證這些信息和數(shù)據(jù)處于行業(yè)的獨(dú)一無二的完善性地位;1、建立數(shù)據(jù)管理及重大事件的數(shù)據(jù)知識圖譜邏輯模型;2、構(gòu)建知識圖譜技術(shù)平臺,完備各技術(shù)組件;3、知識圖譜實(shí)施,建立行業(yè)最完備的知識體系,最大幅度提升資產(chǎn)價(jià)值1、利用數(shù)據(jù)中臺的開放服務(wù),有步驟對基礎(chǔ)數(shù)據(jù)及基于這些基礎(chǔ)數(shù)據(jù)上的應(yīng)用,逐步開放;2、核心建立以API微服務(wù)為基礎(chǔ)的數(shù)據(jù)開放模式;3、在數(shù)據(jù)上直接建立應(yīng)用,用戶可直接體驗(yàn)?zāi)繕?biāo):以主數(shù)據(jù)模式實(shí)現(xiàn)對數(shù)據(jù)的長效管理1、構(gòu)建主數(shù)據(jù)平臺,對數(shù)據(jù)實(shí)現(xiàn)“一品一檔”的資產(chǎn)式管理;2、調(diào)整數(shù)據(jù)模型,建立事件關(guān)聯(lián)模型;3、建立主數(shù)據(jù)的更新同步機(jī)制目標(biāo):建立知識圖譜,實(shí)現(xiàn)全生命數(shù)據(jù)的融合目標(biāo):實(shí)現(xiàn)知識數(shù)據(jù)的外放共享,推進(jìn)資產(chǎn)變現(xiàn)第一步第二步第三步第四步數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)用戶畫像是海量數(shù)據(jù)的標(biāo)簽化,幫助企業(yè)更精準(zhǔn)解決問題他們是誰?他們的需求?他們的行為?我們的用戶價(jià)值大小?如何進(jìn)行產(chǎn)品定位?如何優(yōu)化用戶體驗(yàn)?如何進(jìn)行精準(zhǔn)投放?海量數(shù)據(jù)用戶標(biāo)簽解決問題用戶畫像的建設(shè)價(jià)值數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)用戶畫像的建設(shè)過程Step

02Step

01Step

04Step

03Step

06Step

05確認(rèn)目標(biāo)營銷/產(chǎn)品/定位?頭腦風(fēng)暴用戶矩陣、關(guān)聯(lián)規(guī)則,獲取可能的人物標(biāo)簽收集數(shù)據(jù)屬性、行為、CRM等定義標(biāo)簽動機(jī)/輕重度/消費(fèi)/生活形態(tài)等人群分類因子分析-聚類分析-交叉分析優(yōu)先級排列頻率/市場大小/收益的潛力/競爭優(yōu)勢或策略等數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)用戶標(biāo)簽體系基于用戶人群的基本屬性,可將標(biāo)簽體系進(jìn)行劃分人口屬性性別年齡職業(yè)婚姻狀況學(xué)歷教育……商業(yè)人口屬性工作崗位公司規(guī)模行業(yè)類型……行為屬性訪問媒體訪問時(shí)長訪問頻次……興趣標(biāo)簽個(gè)人愛好生活習(xí)性生活方式生活社交服務(wù)需求消費(fèi)意向物品購買商旅購買汽車購買CRM客戶狀態(tài)會員狀態(tài)生命價(jià)值擁有產(chǎn)品根據(jù)所得用戶標(biāo)簽,對用戶進(jìn)行特征歸類,搭建用戶畫像整合用戶標(biāo)簽用戶群體分類建立用戶畫像70%使用iPhone鯨魚用戶中價(jià)值用戶低價(jià)值用戶高價(jià)值用戶特征分析月消費(fèi)金額>1000元60%為IT行業(yè)數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)用戶標(biāo)簽構(gòu)建畫像數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)個(gè)性化推薦能力模式-千人千面的個(gè)性化智能推薦拓?fù)湓L客標(biāo)簽化標(biāo)簽庫主數(shù)據(jù)畫像訪客畫像標(biāo)簽匹配主數(shù)據(jù)訪客標(biāo)簽庫標(biāo)簽映射交易/舊用戶群畫像交易畫像歷史匹配聚類信息匹配歷史交易/已知特征用戶樣本訓(xùn)練庫專家依賴2C網(wǎng)站……訪客行為信息關(guān)聯(lián)畫像行業(yè)標(biāo)簽訪客標(biāo)簽映射轉(zhuǎn)換規(guī)則協(xié)同過濾標(biāo)簽化標(biāo)簽化主數(shù)據(jù)信息畫像手機(jī)App標(biāo)簽化數(shù)據(jù)數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)核心技術(shù)-基于內(nèi)容的核心推薦算法假設(shè)用戶A喜歡物品A和物品C,用戶B喜歡物品A,物品B和物品C,用戶C喜歡物品A,從這些用戶的歷史喜好可以分析出物品A和物品C時(shí)比較類似的,喜歡物品A的人都喜歡物品C,基于這個(gè)數(shù)據(jù)可以推斷用戶C很有可能也喜歡物品C,所以系統(tǒng)會將物品C推薦給用戶C?;趦?nèi)容的協(xié)同過濾推薦:,使用所有用戶對物品或者信息的偏好,發(fā)現(xiàn)物品和物品之間的相似度,然后根據(jù)用戶的歷史偏好信息,將類似的物品推薦給用戶?;谟脩舻膮f(xié)同過濾推薦:根據(jù)所有用戶對物品或者信息的偏好,發(fā)現(xiàn)與當(dāng)前用戶口味和偏好相似的“鄰居”用戶群,在一般的應(yīng)用中是采用計(jì)算“K-鄰居”的算法;然后,基于這K個(gè)鄰居的歷史偏好信息,為當(dāng)前用戶進(jìn)行推薦假設(shè)用戶A喜歡物品A,物品C,用戶B喜歡物品B,用戶C喜歡物品A,物品C和物品D;從這些用戶的歷史喜好信息中,我們可以發(fā)現(xiàn)用戶A和用戶C的口味和偏好是比較類似的,同時(shí)用戶C還喜歡物品D,那么我們可以推斷用戶A可能也喜歡物品D,因此可以將物品D推薦給用戶A數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)核心技術(shù)-內(nèi)容標(biāo)簽構(gòu)建內(nèi)容獲取,包括應(yīng)用名,URL等,如果是URL,需要采用網(wǎng)絡(luò)爬蟲對該URL的內(nèi)容進(jìn)行爬取和分析。建立內(nèi)容標(biāo)簽體系,對內(nèi)容進(jìn)行統(tǒng)一管理。內(nèi)容標(biāo)簽主要有三類:受眾與定位標(biāo)簽、內(nèi)容分類標(biāo)簽、內(nèi)容標(biāo)簽。建立內(nèi)容標(biāo)簽體系,對內(nèi)容進(jìn)行統(tǒng)一管理。內(nèi)容獲取,網(wǎng)絡(luò)爬蟲或人工分類方式。人工或者自動為用戶訪問的內(nèi)容打上相應(yīng)的內(nèi)容標(biāo)簽。用戶訪問網(wǎng)頁識別應(yīng)用識別網(wǎng)絡(luò)爬蟲內(nèi)容識別網(wǎng)站、應(yīng)用識別自動分類標(biāo)簽人工分類標(biāo)簽熱門標(biāo)簽內(nèi)容爬蟲文本處理機(jī)器學(xué)習(xí)自動標(biāo)簽數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)核心技術(shù)-用戶標(biāo)簽構(gòu)建基于用戶行為內(nèi)容數(shù)據(jù),通過分詞等技術(shù)進(jìn)行解析,處理后以結(jié)構(gòu)化的形式存儲,對用戶使用習(xí)慣、內(nèi)容偏好等一系列屬性進(jìn)行分析挖掘,以用戶需求和特征把握為出發(fā)點(diǎn),為不同的用戶打上內(nèi)容特征標(biāo)簽。通過數(shù)據(jù)服務(wù)為其他業(yè)務(wù)或第方營銷系統(tǒng)或廣告平臺提供支撐。熱點(diǎn)應(yīng)用排行用戶應(yīng)用偏好……上網(wǎng)行為分析從瀏覽量、瀏覽用戶數(shù)、流量、時(shí)段等維度分析各種類型的應(yīng)用排行,準(zhǔn)確掌握流量的應(yīng)用分布和效益;分析有哪些第三方業(yè)務(wù)能夠通過合作和推廣提高流量收益;每天抓取熱門軟件下載排行榜等內(nèi)容,提供向用戶推薦的內(nèi)容。熱點(diǎn)內(nèi)容排行用戶內(nèi)容偏好熱點(diǎn)網(wǎng)站排行……上網(wǎng)內(nèi)容分析上網(wǎng)時(shí)段上網(wǎng)方式流量分布……上網(wǎng)方式分析根據(jù)用戶訪問網(wǎng)站的記錄分析出用戶最關(guān)注和最常訪問的網(wǎng)站和欄目,了解用戶整體關(guān)注點(diǎn);按主題分類,針對特定類型網(wǎng)站,比如閱讀類網(wǎng)站進(jìn)一步細(xì)分訪問內(nèi)容的類型;根據(jù)內(nèi)容標(biāo)簽為用戶打上內(nèi)容偏好標(biāo)簽從用戶上網(wǎng)時(shí)段、上網(wǎng)方式、訪問站點(diǎn)、流量等維度分析用戶的上網(wǎng)行為,準(zhǔn)備掌握用戶的上網(wǎng)習(xí)慣,以便根據(jù)用戶習(xí)慣在合適的時(shí)間推薦合適的內(nèi)容,提高推薦轉(zhuǎn)化率;數(shù)據(jù)基礎(chǔ)用戶網(wǎng)絡(luò)訪問標(biāo)簽庫靈活的標(biāo)簽分類及配置數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)核心技術(shù)-用戶基本信息挖掘分析對基本的性別、年齡、消費(fèi)能力等關(guān)鍵特征,結(jié)合基礎(chǔ)的數(shù)據(jù)挖掘算法,形成了符合特征的計(jì)算模型。以性別為例:三個(gè)算法交叉驗(yàn)證,提高精準(zhǔn)度,準(zhǔn)確度可達(dá)80%以上決策樹模型特征示例:訪問日志訪問內(nèi)容分類分析方法2方法3模型訓(xùn)練姓名分詞分類訪問內(nèi)容文本特征變量學(xué)習(xí)樣本訪問行為決策樹模型訪問行為決策樹模型模型訓(xùn)練交叉驗(yàn)證方法1海量的文本bayes性別分類詞庫示例:數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)核心技術(shù)-保證標(biāo)簽準(zhǔn)確性和完備性用戶響應(yīng)、反饋迭代優(yōu)化用戶行為分析內(nèi)容標(biāo)簽?zāi)P统恋碛脩魧傩詡€(gè)性化推薦、智能運(yùn)營等應(yīng)用用戶標(biāo)簽體系標(biāo)簽智能優(yōu)化閉環(huán)可以基于國內(nèi)外已成熟的用戶特征分類劃分理論,借鑒國內(nèi)外知名網(wǎng)站的內(nèi)容Tag體系,結(jié)合自有運(yùn)營經(jīng)驗(yàn)和技術(shù)積累,建立具備自有業(yè)務(wù)特征的、行業(yè)領(lǐng)先的標(biāo)簽體系。標(biāo)簽算法:基于Ontology的興趣計(jì)算模型如何完備的標(biāo)簽體系特點(diǎn):無“冷啟動”問題,億級用戶的標(biāo)簽沉淀標(biāo)簽更新機(jī)制,根據(jù)業(yè)務(wù)發(fā)展不斷增減,根據(jù)使用反饋不段優(yōu)化采用多算法A/B測試技術(shù),確保標(biāo)簽準(zhǔn)確性數(shù)據(jù)應(yīng)用能力建設(shè)–用戶畫像及個(gè)性化推薦能力建設(shè)核心建設(shè)步驟及策略完善用戶行為數(shù)據(jù)采集建設(shè)用戶主數(shù)據(jù)平臺用戶畫像及個(gè)性化推薦能力建設(shè)目標(biāo):完成全量用戶行為數(shù)據(jù)的采集,完善用戶行為特征數(shù)據(jù)1、從用戶觸點(diǎn)處,實(shí)現(xiàn)前后端對用戶全量數(shù)據(jù)的采集;2、建立統(tǒng)一的用戶行為數(shù)據(jù)模型,并統(tǒng)一所有系統(tǒng)的行為數(shù)據(jù)協(xié)議標(biāo)準(zhǔn),實(shí)現(xiàn)用戶行為數(shù)據(jù)的統(tǒng)一融合;1、基于用戶主數(shù)據(jù),建設(shè)用戶標(biāo)簽體系;基礎(chǔ)屬性構(gòu)建基礎(chǔ)標(biāo)簽、行為屬性構(gòu)建習(xí)慣喜好標(biāo)簽2、利用用戶標(biāo)簽,對用戶進(jìn)行業(yè)務(wù)全景畫像塑造;3、打造個(gè)性化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論