版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 大數(shù)據(jù)平臺有助于提升現(xiàn)網(wǎng)分析能力 p 基于Hadoop構(gòu)建 大數(shù)據(jù)的用戶行為 分析系統(tǒng) p 系統(tǒng)提供了核心的 分布式云存儲、分 布式并行計算、分 布式數(shù)據(jù)倉庫、分 布式列數(shù)據(jù)庫整體 解決方案 路由器 路由 器 互聯(lián)網(wǎng) 分光鏡像 日志采集 網(wǎng)元設(shè)備(GGSN PDSNWAP網(wǎng)關(guān)、NET網(wǎng)關(guān)/ 數(shù)據(jù)采集Agent Apache日志 DPI 數(shù)據(jù)爬取 數(shù)據(jù)爬取 建設(shè)方案 防火墻 WWW網(wǎng)站 WAP網(wǎng)站 正向采集 用戶行為 數(shù)據(jù) 反向采集 互聯(lián)網(wǎng)數(shù) 據(jù) 方案延伸 p 基于Hadoop的大數(shù)據(jù)解決方案提供了 基礎(chǔ)的云存儲和云計算的能力,基于 該技術(shù)框架可進(jìn)行應(yīng)用的擴(kuò)展和衍 生。 p 基于用戶互聯(lián)網(wǎng)訪問
2、行為分析結(jié)果, 形成詳細(xì)的戶興趣愛好列表,可進(jìn)行 即時、精準(zhǔn)的廣告投放 collector Pcap數(shù)據(jù)(DPI) 核心設(shè)備話單 互聯(lián)網(wǎng)頁面數(shù)據(jù) 20 大數(shù)據(jù)平臺有效提升數(shù)據(jù)查詢速度 Ø 以手機(jī)上網(wǎng)詳單查詢?yōu)閼?yīng)用案例 關(guān)鍵性指標(biāo) 數(shù)據(jù)存儲 p 上網(wǎng)記錄入庫時間:一般 小于30分鐘,實(shí)際約10分 鐘 p 歷史5個月+當(dāng)前月 數(shù)據(jù)查詢 p 上網(wǎng)記錄查詢速度:不高 于1秒(不含用戶訪問查詢 頁面的時間) p 并發(fā)查詢數(shù)目:1000請求 /秒 系統(tǒng) 構(gòu)成 p 系統(tǒng)主要包含數(shù)據(jù)采集子系統(tǒng)、數(shù)據(jù)入庫子系統(tǒng)、數(shù)據(jù)存儲子系統(tǒng)、 數(shù)據(jù)查詢與分析子系統(tǒng) p 采用Hadoop/HBase作為上網(wǎng)記錄存儲方
3、案 p 采用MapReduce/Hive作用統(tǒng)計分析和數(shù)據(jù)挖掘工具 21 大數(shù)據(jù)平臺適應(yīng)復(fù)雜數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)整合應(yīng)用 n 項(xiàng)目背景 運(yùn)營商建設(shè)有多套垂直的網(wǎng)管子系統(tǒng),目前系統(tǒng)數(shù)據(jù)集中程度不夠,還未形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù) 共享框架,對運(yùn)營支撐的支撐力度不夠,而網(wǎng)絡(luò)運(yùn)維分析在面向服務(wù)轉(zhuǎn)型的過程中對數(shù)據(jù)的匯聚和共 享要求極為迫切,因此需要建立統(tǒng)一的網(wǎng)管資源池 p 網(wǎng)管資源池主要負(fù)責(zé)各個垂直網(wǎng)管子系統(tǒng)信令數(shù)據(jù)、日志數(shù)據(jù)的、告警數(shù)據(jù)的統(tǒng)一管理,實(shí)現(xiàn)跨平臺 的數(shù)據(jù)整合、數(shù)據(jù)應(yīng)用和數(shù)據(jù)共享等功能, p 網(wǎng)管統(tǒng)一資源池需提供海量歷史數(shù)據(jù)的查詢功能,滿足運(yùn)維人員日常信息查詢和信息追溯的需要。 p 系統(tǒng)與呼叫中心
4、、工單系統(tǒng)對接,實(shí)現(xiàn)快速的數(shù)據(jù)交付(工單生成、告警觸發(fā)) p n 難點(diǎn)分析 多個垂直網(wǎng)管系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)千差萬別,抽取后的數(shù)據(jù)無法關(guān)聯(lián)形成統(tǒng)一的數(shù)據(jù)集合,傳統(tǒng)關(guān)系型數(shù) 據(jù)庫優(yōu)勢無法體現(xiàn) p 系統(tǒng)需要滿足OLAP類應(yīng)用分析,并面向上層應(yīng)用提供一致性的數(shù)據(jù)查詢,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫受限 于數(shù)據(jù)體量和數(shù)據(jù)種類,無法滿足多類型的海量數(shù)據(jù)的查詢和分析要求 p 系統(tǒng)需同時從多個數(shù)據(jù)源實(shí)現(xiàn)數(shù)據(jù)庫數(shù)據(jù)、信令數(shù)據(jù)和日志數(shù)據(jù)的采集,傳統(tǒng)的ETL工具無法滿足流 式數(shù)據(jù)的采集要求,導(dǎo)致進(jìn)程擁塞。 p n 建設(shè)方案 基于不同的數(shù)據(jù)源及應(yīng)用分析模式采用Flume、Sqoop等系統(tǒng)工具完成結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的導(dǎo)入 基于HDFS實(shí)現(xiàn)海量歷史數(shù)據(jù)的存儲 Hive組件可通過SQL命令完成大數(shù)據(jù)的統(tǒng)計分析,并與傳統(tǒng)關(guān)系型數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度公積金貸款購房合同標(biāo)準(zhǔn)解讀3篇
- 二零二五版企業(yè)間借款合同范本9篇
- 二零二五年度防盜門安全認(rèn)證及銷售合同2篇
- 二零二五年度車輛保險居間代理合同(含優(yōu)惠方案)3篇
- 二零二五版特色果樹種植基地承包經(jīng)營合同3篇
- 影視作品評價與獎項(xiàng)申報2025年度合同3篇
- 二零二五年綠色節(jié)能LED廣告租賃合同3篇
- 深圳市2025年度人才住房裝修補(bǔ)助購房合同3篇
- 二零二五版汽車抵押貸款車輛殘值評估合同3篇
- 二零二五年度金融產(chǎn)品發(fā)行與銷售合同3篇
- 軟件項(xiàng)目應(yīng)急措施及方案
- 2025河北邯鄲經(jīng)開國控資產(chǎn)運(yùn)營管理限公司招聘專業(yè)技術(shù)人才5名高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年民法典知識競賽考試題庫及答案(共50題)
- 2025老年公寓合同管理制度
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級上冊 期末綜合卷(含答案)
- 鈑金設(shè)備操作培訓(xùn)
- 中考英語688高頻詞大綱詞頻表
- 九年級初三中考物理綜合復(fù)習(xí)測試卷3套(含答案)
- 移民推薦信4篇【精選】
- 管理制度評價表(填寫模板)
- 工地設(shè)計代表服務(wù)記錄
評論
0/150
提交評論