中國(guó)電信經(jīng)營(yíng)分析系統(tǒng)資料_第1頁(yè)
中國(guó)電信經(jīng)營(yíng)分析系統(tǒng)資料_第2頁(yè)
中國(guó)電信經(jīng)營(yíng)分析系統(tǒng)資料_第3頁(yè)
中國(guó)電信經(jīng)營(yíng)分析系統(tǒng)資料_第4頁(yè)
中國(guó)電信經(jīng)營(yíng)分析系統(tǒng)資料_第5頁(yè)
已閱讀5頁(yè),還剩97頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、經(jīng)營(yíng)分析(fnx)系統(tǒng)技術(shù)交流中國(guó)電信經(jīng)營(yíng)分析(fnx)系統(tǒng)共一百零二頁(yè)第一部分:公司介紹第二部分:需求說(shuō)明(shumng)第三部分:解決方案第四部分:?jiǎn)栴}交流目錄(ml)共一百零二頁(yè)P(yáng)art1 公司(n s)介紹共一百零二頁(yè)第一(dy)部分:公司介紹第二部分:需求說(shuō)明第三部分:解決方案第四部分:?jiǎn)栴}交流Part2 需求(xqi)說(shuō)明共一百零二頁(yè)背景(bijng)企業(yè)經(jīng)營(yíng)發(fā)展的結(jié)果以業(yè)務(wù)(yw)為中心話單量小、業(yè)務(wù)少、用戶少以客戶為中心大數(shù)據(jù)量、業(yè)務(wù)多、異構(gòu)數(shù)據(jù)、決策分析技術(shù)發(fā)展的結(jié)果數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)人工智能數(shù)據(jù)挖掘聯(lián)機(jī)分析共一百零二頁(yè)企業(yè)(qy)信息化的四個(gè)進(jìn)程數(shù)據(jù)信息知識(shí)施效在線分析數(shù)據(jù)挖

2、掘客戶關(guān)系管理數(shù)據(jù)倉(cāng)庫(kù)=營(yíng)銷自動(dòng)化=銷售隊(duì)伍自動(dòng)化=客戶服務(wù)與技術(shù)支持=事實(shí)發(fā)生了什么?=為什么會(huì)發(fā)生?=對(duì)象是誰(shuí)?=還會(huì)發(fā)生什么?共一百零二頁(yè)經(jīng)營(yíng)分析(fnx)系統(tǒng)信息流圖 共一百零二頁(yè)建設(shè)(jinsh)目標(biāo)建立一個(gè)統(tǒng)一的數(shù)據(jù)信息平臺(tái)采用先進(jìn)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和分析挖掘工具,提取數(shù)據(jù)中的有價(jià)值信息為企業(yè)的客戶服務(wù)、市場(chǎng)營(yíng)銷等工作提供科學(xué)(kxu)有效的支撐,提升企業(yè)的運(yùn)營(yíng)水平和競(jìng)爭(zhēng)能力,體現(xiàn)以客戶為中心的經(jīng)營(yíng)理念共一百零二頁(yè)建設(shè)(jinsh)原則兩級(jí)系統(tǒng),三層結(jié)構(gòu)整合業(yè)務(wù)數(shù)據(jù)、面向經(jīng)營(yíng)分析(fnx) 能通過(guò)多種手段實(shí)現(xiàn)業(yè)務(wù)智能主題可擴(kuò)充、新增及重構(gòu)成為業(yè)務(wù)決策者專業(yè)的咨詢顧問(wèn) 經(jīng)營(yíng)分析系統(tǒng)的開(kāi)發(fā)

3、與建設(shè)將分階段進(jìn)行共一百零二頁(yè)系統(tǒng)(xtng)功能支持與各種主流數(shù)據(jù)庫(kù)平臺(tái)、多維分析引擎、數(shù)據(jù)挖掘引擎和前端展示(zhnsh)工具的無(wú)縫集成開(kāi)放的應(yīng)用程序接口和工具提供統(tǒng)一的數(shù)據(jù)倉(cāng)庫(kù)平臺(tái),支持后續(xù)應(yīng)用和擴(kuò)展可定制化的客戶界面統(tǒng)一的用戶和權(quán)限管理機(jī)制共一百零二頁(yè)主題分析(fnx)及專題分析(fnx)前端用戶/瀏覽器應(yīng)用服務(wù)器 /Web Server業(yè)務(wù)主題分析服務(wù)質(zhì)量模塊用戶分析模塊業(yè)務(wù)分析模塊收益分析模塊市場(chǎng)營(yíng)銷分析模塊市場(chǎng)競(jìng)爭(zhēng)分析模塊新業(yè)務(wù)分析模塊合作服務(wù)方分析模塊大客戶分析模塊專題分析業(yè)務(wù)(含新業(yè)務(wù))專題市場(chǎng)、競(jìng)爭(zhēng)專題大客戶發(fā)展、異動(dòng)專題客戶專題分析數(shù)據(jù)倉(cāng)庫(kù)共一百零二頁(yè)業(yè)務(wù)管理模型(mxn

4、g)共一百零二頁(yè)P(yáng)art3 解決方案技術(shù)體系結(jié)構(gòu)主要廠商(chngshng)產(chǎn)品介紹共一百零二頁(yè)體系結(jié)構(gòu)BOSSMIS/OA網(wǎng)管其它數(shù)據(jù)源數(shù)據(jù)源共一百零二頁(yè)BOSS系統(tǒng)(xtng)網(wǎng)管客服其它1 數(shù)據(jù)源BOSSMIS/OA網(wǎng)管其它數(shù)據(jù)源數(shù)據(jù)源數(shù)據(jù)源共一百零二頁(yè)數(shù)據(jù)源省BOSS系統(tǒng)的數(shù)據(jù):批價(jià)后的詳單帳務(wù)數(shù)據(jù)欠費(fèi)記錄(jl)繳費(fèi)記錄欺詐記錄客戶信息資源記錄營(yíng)業(yè)記錄投訴記錄查詢記錄結(jié)算數(shù)據(jù)人工錄入的信息網(wǎng)管系統(tǒng)的數(shù)據(jù) 熱點(diǎn)小區(qū)(xio q) 接通率 故障信息客服數(shù)據(jù) 投訴信息 服務(wù)狀況其他數(shù)據(jù) 人工輸入共一百零二頁(yè)數(shù)據(jù)源細(xì)分計(jì)費(fèi)子系統(tǒng):通話詳單(原始、計(jì)費(fèi)后)、詳單格式計(jì)費(fèi)使用費(fèi)率表錯(cuò)誤話單結(jié)算話

5、單帳務(wù)子系統(tǒng):帳務(wù)數(shù)據(jù)欠費(fèi)記錄(jl)繳費(fèi)記錄、繳費(fèi)方式欺詐記錄營(yíng)業(yè)子系統(tǒng):用戶資料及信用度資源使用記錄營(yíng)業(yè)廳、營(yíng)業(yè)員資料客服子系統(tǒng):投訴記錄用戶查詢記錄網(wǎng)管系統(tǒng):接通率數(shù)據(jù)掉話率數(shù)據(jù)手工錄入數(shù)據(jù):市場(chǎng)調(diào)查結(jié)果記錄市場(chǎng)宣傳費(fèi)用和形式記錄流水型增長(zhǎng)數(shù)據(jù):通話詳單(原始、計(jì)費(fèi)后)錯(cuò)誤話單帳務(wù)數(shù)據(jù)欠費(fèi)記錄繳費(fèi)記錄欺詐記錄資源使用記錄投訴記錄用戶查詢記錄財(cái)務(wù)數(shù)據(jù)物流數(shù)據(jù)市場(chǎng)調(diào)查結(jié)果記錄市場(chǎng)宣傳費(fèi)用和形式記錄變化更新(gngxn)數(shù)據(jù):計(jì)費(fèi)使用費(fèi)率表繳費(fèi)方式用戶資料及信用度營(yíng)業(yè)廳、營(yíng)業(yè)員資料共一百零二頁(yè)BOSSMIS/OA網(wǎng)管其它數(shù)據(jù)源數(shù)據(jù)源數(shù)據(jù)(shj)獲取層2 數(shù)據(jù)(shj)獲取層共一百零二頁(yè)數(shù)據(jù)來(lái)

6、源首先直接快速傳輸?shù)椒侄未鎯?chǔ)區(qū),再?gòu)姆侄未鎯?chǔ)區(qū)經(jīng)過(guò)清洗、轉(zhuǎn)換、映射等復(fù)雜的數(shù)據(jù)移動(dòng)處理(chl)轉(zhuǎn)移到目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)中。以保證數(shù)據(jù)的快速導(dǎo)入而盡量減小對(duì)業(yè)務(wù)系統(tǒng)造成的壓力。有數(shù)據(jù)庫(kù)和文件二種方式,分別對(duì)應(yīng)于不同運(yùn)營(yíng)系統(tǒng)的數(shù)據(jù)源。數(shù)據(jù)集成 異構(gòu)數(shù)據(jù)源整合臨時(shí)(ln sh)存儲(chǔ)區(qū)(Staging Area)共一百零二頁(yè)BOSS與經(jīng)營(yíng)分析系統(tǒng)的連接(linji)方案計(jì)費(fèi)營(yíng)帳經(jīng)營(yíng)分析系統(tǒng)DW客服采集BOSS系統(tǒng)ODS文件加載,例如采用sql*load數(shù)據(jù)集成,例如采用OWB,Pl/Sql,CA Advantage Data Transformer數(shù)據(jù)清洗、轉(zhuǎn)換,如采用OWB,Pl/Sql共一百零二頁(yè)Sq

7、l*Load實(shí)現(xiàn)(shxin)方式1、掌握源文件的文件格式2、定義(dngy)目的ODS的對(duì)應(yīng)表結(jié)構(gòu)3、編寫(xiě)執(zhí)行的腳本4、運(yùn)行腳本5、查看運(yùn)行的日志例子:將pt0431文件的記錄裝載進(jìn)入表cc_test中實(shí)現(xiàn):1、依據(jù)文件pt0431格式和表cc_test的結(jié)構(gòu),編寫(xiě)腳本jl.ldr:LOAD DATAINFILE ./pt0431INTO TABLE cc_test(文件格式與表結(jié)構(gòu)對(duì)應(yīng)關(guān)系定義)2、編寫(xiě)控制腳本jl.sql:sqlload userid=ht/hello control=jl.ldr log=jl.log3、執(zhí)行:#sh jl4、查看日志文件jl.log共一百零二頁(yè)P(yáng)l/S

8、ql實(shí)現(xiàn)(shxin)方式有些數(shù)據(jù)需要經(jīng)過(guò)程序處理后才能很好的被使用。例如(lr):基于批價(jià)詳單來(lái)分析話務(wù)流向時(shí)需要利用詳單記錄中的Other_party字段。Other_party可能的存在形式:1795X+固定電話號(hào)碼;013XH1H2H3H4N1-N4;13XH1H2H3H4N1-N4;00+電話號(hào)碼;特殊號(hào)碼:110、119、1861等;172X1X2;只有經(jīng)過(guò)一定的處理,才能分析去話的方向是聯(lián)通、電信,國(guó)際,特殊呼叫等適用于隨機(jī)獲取數(shù)據(jù)共一百零二頁(yè) ETL 環(huán)境(hunjng)和處理流程來(lái)源 OLTP系統(tǒng)數(shù)據(jù)轉(zhuǎn)化引擎緩存來(lái)源 主機(jī)或 C/S 系統(tǒng)轉(zhuǎn)化引擎數(shù)據(jù)倉(cāng)庫(kù)企業(yè)元數(shù)據(jù)數(shù)據(jù)集市數(shù)據(jù)

9、集市數(shù)據(jù)集市數(shù)據(jù)集市掃描元數(shù)據(jù)要求資源規(guī)劃交付用戶流程數(shù)據(jù)倉(cāng)庫(kù)監(jiān)控任務(wù)調(diào)度數(shù)據(jù)抽取數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)加載索引建立數(shù)據(jù)聚合元數(shù)據(jù)導(dǎo)入元數(shù)據(jù)維護(hù)BOSSOANMSELSE共一百零二頁(yè)抽取(chu q)策略1、對(duì)于有時(shí)間線的數(shù)據(jù)增量抽取,例如:服務(wù)信息表, 由于有處理時(shí)間,可增量抽取2、沒(méi)時(shí)間線的數(shù)據(jù)則完全抽取,例如客戶信息表3、明細(xì)帳單、綜合帳單在出帳后,例如出帳后第二天 抽取4、對(duì)于文件,象BOSS系統(tǒng)(xtng)的結(jié)算清單、計(jì)費(fèi)清單按文 件生成周期實(shí)時(shí)抽取共一百零二頁(yè)3 數(shù)據(jù)(shj)存儲(chǔ)層BOSSMIS/OA網(wǎng)管其它數(shù)據(jù)源數(shù)據(jù)源數(shù)據(jù)(shj)存儲(chǔ)層共一百零二頁(yè)基礎(chǔ)(jch)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)來(lái)源

10、數(shù)據(jù)結(jié)構(gòu)3NF星型結(jié)構(gòu)雪花結(jié)構(gòu)完整性和有效性檢查(jinch),對(duì)冗余和不一致的數(shù)據(jù)進(jìn)行了清洗和轉(zhuǎn)換。數(shù)據(jù)量將非常龐大。 3NF減少數(shù)據(jù)冗余減少存儲(chǔ)容量靈活的擴(kuò)展能力執(zhí)行效率相對(duì)較低共一百零二頁(yè)數(shù)據(jù)(shj)集市數(shù)據(jù)倉(cāng)庫(kù)的子集(z j),主要面向某特定主題。數(shù)據(jù)來(lái)源對(duì)基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的復(fù)制、分布或聚合數(shù)據(jù)結(jié)構(gòu)星型結(jié)構(gòu)Star-Schema存在數(shù)據(jù)冗余相對(duì)較大容量維變化時(shí),需重新建立執(zhí)行效率高共一百零二頁(yè)粒度(l d)選擇多重粒度(l d)級(jí)別中央數(shù)據(jù)倉(cāng)庫(kù)采用低粒度級(jí),例如,客戶月通話詳單 -高細(xì)節(jié)數(shù)據(jù),能回答所有問(wèn)題,但分析效率較低;數(shù)據(jù)集市采用高粒度級(jí),例如,客戶月通話綜合信息- -低細(xì)節(jié)

11、數(shù)據(jù),能回答部分問(wèn)題,但分析效率高;如果高粒度數(shù)據(jù)也包含分析所需的足夠的細(xì)節(jié),則高粒度數(shù)據(jù)的使用效率會(huì)提高很多共一百零二頁(yè)中央數(shù)據(jù)倉(cāng)庫(kù)與從屬(cngsh)數(shù)據(jù)集市中央數(shù)據(jù)倉(cāng)庫(kù)客戶信息Cust_IDMsisdnAge_levelCust_TypeCity_Code通話詳單Call_TypeMsisdnStart_DateStart_timeCall_duration.帳戶信息Account_IDCust_IDLfeeCfeeDiscount_fee其它信息Cust_IDMsisdnAge_levelCust_TypeCity_CodeCust_IDMsisdn客戶通話行為分析客戶消費(fèi)行為分析其它

12、分析依據(jù)分析的需要Map數(shù)據(jù)共一百零二頁(yè)數(shù)據(jù)倉(cāng)庫(kù)完整(wnzhng)構(gòu)架Data Marts Data Mining OLAPAnalysis Mart MartStaging AreaData WarehouseOperational DataExternalDataArchiveDataManualDataBusiness Users共一百零二頁(yè)4 數(shù)據(jù)(shj)訪問(wèn)層信息處理查詢和報(bào)表分析處理基本的OLAP操作(cozu)數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn)BOSSMIS/OA網(wǎng)管其它數(shù)據(jù)源數(shù)據(jù)源數(shù)據(jù)訪問(wèn)層共一百零二頁(yè)舉例:話務(wù)流向分析 維:通話日期、通話時(shí)間、對(duì)端號(hào)碼,共3個(gè)維;分析指標(biāo)(zhbio):通

13、話次數(shù),通話時(shí)長(zhǎng)實(shí)施:建立一個(gè)3維的數(shù)據(jù)立方體,對(duì)指標(biāo)采用切片、鉆取、旋轉(zhuǎn)等方法進(jìn)行分析多維數(shù)分析(fnx)共一百零二頁(yè)時(shí)間(shjin)日期(rq)對(duì)端號(hào)碼同一時(shí)刻話務(wù)流向分析12:00OLAP分析方法一【切片】12:00日期對(duì)端號(hào)碼共一百零二頁(yè)OLAP分析方法一【切片(qi pin)】時(shí)間(shjin)日期5月1日對(duì)端號(hào)碼同一日期話務(wù)流向分析5月1日對(duì)端號(hào)碼時(shí)間共一百零二頁(yè)OLAP分析方法一【切片(qi pin)】流向(li xin)同一運(yùn)營(yíng)商的話務(wù)量分析時(shí)間日期聯(lián)通對(duì)端號(hào)碼聯(lián)通日 期時(shí)間共一百零二頁(yè)時(shí)間(shjin)日期(rq)年季度季度月月月月對(duì)端號(hào)碼OLAP分析方法二【鉆取】在同一個(gè)

14、維上,按不同的層次來(lái)分析共一百零二頁(yè)OLAP分析方法三【旋轉(zhuǎn)(xunzhun)】將年份和季度交換坐標(biāo)共一百零二頁(yè)基于(jy)WEB的展現(xiàn)方式對(duì)數(shù)據(jù)進(jìn)行可視化的分析,分析結(jié)果的展現(xiàn)方式有以下幾種,并且各種形式(xngsh)之間可以相互的轉(zhuǎn)換:1柱狀圖;2相對(duì)柱狀圖;3累計(jì)柱狀圖;4餅圖;5散點(diǎn)圖;6折線圖;7趨勢(shì)圖;8網(wǎng)頁(yè)表格;9表格中的數(shù)據(jù)倒出到Excel報(bào)表共一百零二頁(yè)WEB展現(xiàn)(zhnxin)示例【柱圖】共一百零二頁(yè)WEB展現(xiàn)(zhnxin)示例【3D柱圖】共一百零二頁(yè)5 元數(shù)據(jù)(shj)關(guān)于數(shù)據(jù)的數(shù)據(jù)技術(shù)(jsh)元數(shù)據(jù)操作元數(shù)據(jù)業(yè)務(wù)元數(shù)據(jù)貫穿全過(guò)程BOSSMIS/OA網(wǎng)管其它數(shù)據(jù)源數(shù)據(jù)

15、源元數(shù)據(jù)管理共一百零二頁(yè)元數(shù)據(jù)管理業(yè)務(wù)(yw)定義屬性(shxng)定義DA / DBA ToolErwin抽取規(guī)則, 轉(zhuǎn)換規(guī)則ETL Tool報(bào)表格式, 過(guò)濾,分割等DSS Tool數(shù)據(jù)庫(kù)元數(shù)據(jù)元數(shù)據(jù)庫(kù)雙向自動(dòng)無(wú)連接業(yè)務(wù)定義OtherExcelHTMLBusiness Users數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)元數(shù)據(jù)管理Intranet/Extranet-Definitions-Domains-Names共一百零二頁(yè)6 系統(tǒng)管理安全(nqun)備份共一百零二頁(yè)安全(nqun)體系結(jié)構(gòu) 共一百零二頁(yè)系統(tǒng)安全安全的層次每個(gè)層次均需要(xyo)相應(yīng)措施保證數(shù)據(jù)庫(kù)、應(yīng)用、網(wǎng)絡(luò)網(wǎng)絡(luò)層防火墻電子認(rèn)證加密共一百零二頁(yè)安全(n

16、qun)層次數(shù)據(jù)庫(kù)層密碼數(shù)據(jù)庫(kù)權(quán)限控制應(yīng)用層安全用戶身份(shn fen)認(rèn)證按照操作對(duì)象和操作類別規(guī)定各操作員的權(quán)限保證身份的有效性和不可抵賴性采用口令密碼方式,可以向數(shù)字證書(shū)升級(jí)數(shù)據(jù)加密服務(wù)和數(shù)據(jù)權(quán)限共一百零二頁(yè)容災(zāi)與備份(bi fn):概述什么災(zāi)?火災(zāi)、地震、洪水系統(tǒng)故障:硬件、操作系統(tǒng)、數(shù)據(jù)庫(kù).應(yīng)用(yngyng)故障:設(shè)計(jì)時(shí)考慮不周誤操作黑客入侵、故意破壞容災(zāi)方法以備份系統(tǒng)代替主系統(tǒng),并及時(shí)恢復(fù)主系統(tǒng)數(shù)據(jù)復(fù)制其它:地理分布,電源、網(wǎng)絡(luò)等的高可用性共一百零二頁(yè)容災(zāi)與備份(bi fn):數(shù)據(jù)備份(bi fn)策略數(shù)據(jù)備份的層次物理視圖邏輯視圖(DB、數(shù)據(jù)庫(kù)模式(msh)、應(yīng)用)數(shù)據(jù)備份的

17、方式聯(lián)機(jī)復(fù)制同步、異步、狀態(tài)脫機(jī)備份防止“誤操作型”災(zāi)難數(shù)據(jù)備份的目標(biāo)一致性、當(dāng)前性、可恢復(fù)性,盡量減少數(shù)據(jù)丟失及盡快恢復(fù)共一百零二頁(yè)容災(zāi)與備份:數(shù)據(jù)復(fù)制(fzh)層次主機(jī)(zhj)硬盤(pán)DB文件表應(yīng)用 內(nèi)存?zhèn)浞輽C(jī)硬盤(pán)DB文件表應(yīng)用 內(nèi)存輸入輸入 物理視圖 DB視圖 數(shù)據(jù)庫(kù)模式視圖 應(yīng)用視圖復(fù)制或轉(zhuǎn)移共一百零二頁(yè)P(yáng)art3 解決方案技術(shù)體系結(jié)構(gòu)主要(zhyo)廠商產(chǎn)品介紹共一百零二頁(yè)產(chǎn)品(chnpn)供應(yīng)商IBM Corp.Oracle Corp.SAS InstituteMicrosoft Corp.MicroStrategy Inc.CABrio TechnologyBusiness Obj

18、ects Inc.Cognos共一百零二頁(yè)產(chǎn)品(chnpn)供應(yīng)商Data warehousesOLAPData miningReporting, Querying and business intelligenceETLOracleSybaseSASDB2NCRBI/SASDB2 Olap ServerOracle ExpressBusiness Objects/OLAP accessSAS Data miningGeneva(PwC)Intelligent Miner,Visualization(IBM)MineSet (Silicon Graphics)Visual Insights(L

19、ucent)Business ObjectsBrioAdaptive Server IQ multiplex(Sybase)ActuateHummingbird suiteNUMA-Q2000(IBM)Pilot Balanced Score cardOWBInformaticaCA Data TransformerSAS/WA共一百零二頁(yè)BestWorstRelative to all platforms (including S/390);updated April 2001Copyright 2001Data Mgmt.Data Admin.Scalability & Suitabili

20、tyConcurrent Query Mgmt.DW Track RecordQuery PerformanceHPHP9000HP-UXOracle IBM SPRS/6000AIXDB2 EEESunEnterpriseSolarisOracle GenericIntel IA-32Win2000SQL ServerUnisysES7000Win2000SQL ServerIBMS/390OS/390DB2 EEECompaqAlphaTru64OracleNCRWorldMarkMP-RASTeradata主機(jī)廠家:主機(jī)型號(hào):操作系統(tǒng):數(shù)據(jù)倉(cāng)庫(kù)平臺(tái):數(shù)據(jù)倉(cāng)庫(kù)比較(bjio)共一百零二頁(yè)C

21、opyright 2001IBM DB2共一百零二頁(yè)IBM數(shù)據(jù)倉(cāng)庫(kù)解決方案DB2 Warehouse Manager (管理工具)DB2 Visual warehousing(ETL)MIS/OABOSS網(wǎng)管No.7監(jiān)測(cè)DB2 UDBV7.2數(shù)據(jù)倉(cāng)庫(kù)DB2 OLAPSERVER(MDB)查詢(chxn)人員分析(fnx)人員Hyperion analyzer 決策人員IBM Intelligent Miner 數(shù)據(jù)挖掘DB2 Warehouse ManagerDB2 UDBV7.2數(shù)據(jù)集市外部來(lái)源DB2 UDBV7.2數(shù)據(jù)集市Enterprise Information Portal共一百零二

22、頁(yè)IBM數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)(tdin)提供大型數(shù)據(jù)庫(kù)DB2作為數(shù)據(jù)倉(cāng)庫(kù)的存儲(chǔ)數(shù)據(jù)庫(kù),DB2性能優(yōu)異,提供從桌面機(jī)到工作站、小型機(jī)、大型機(jī)的良好擴(kuò)展性 提供Visual Warehousing作為數(shù)據(jù)抽取工具,VW能夠從廣泛的數(shù)據(jù)源抽取數(shù)據(jù),并且在大數(shù)據(jù)量的抽取中充分顯示了速度優(yōu)勢(shì) 提供多維型、關(guān)系型兩種Cube的實(shí)現(xiàn)方式 提供功能強(qiáng)大的訪問(wèn)Cube的查詢語(yǔ)法 Query Script 在所有(suyu)同類產(chǎn)品中提供最強(qiáng)大的分區(qū)功能 共一百零二頁(yè)DWDMDMQueryPerformance (10)DataManagement (10)ChallengesStrengths Performance

23、 standard for very-large data warehouses and data marts Manageability low number of DBAs required Query optimization support for complex data models Support for concurrent query workloads Lack of platform choice (confusion) Delays on NT/MPP Ability to execute well Ability to keep current capability

24、lead Marketing and positioning for broader market Higher initial cost of solution BI tool and application supportProven DW Track Record (10)Concurrent Query Management (10)Platform Suitability & Scalability (10)DataAdministration (9)Common TopologyUser access tothe datawarehouse andfew data martsNCR

25、 Teradata共一百零二頁(yè)Copyright 2001Oracle共一百零二頁(yè)Oracle數(shù)據(jù)倉(cāng)庫(kù)解決方案Oracle9i Enterprise Manager(管理工具)Oracle9i WarehouseBuilder(ETL)MIS/OABOSS網(wǎng)管No.7監(jiān)測(cè)Oracle9i數(shù)據(jù)倉(cāng)庫(kù)OracleDiscovery即席(jx)查詢查詢(chxn)人員OracleReports預(yù)定義報(bào)表分析人員OracleExpressOLAP決策人員OracleData Mining數(shù)據(jù)挖掘Oracle9i數(shù)據(jù)集市Oracle9i數(shù)據(jù)集市Oracle9iODS外部來(lái)源OraclEPortalExpr

26、essServer(MDB)共一百零二頁(yè)Oracle數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)(tdin)提供RDBMS和MDDB兩種數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),Oracle功能強(qiáng)大,提供了良好擴(kuò)展性, 提供了功能強(qiáng)大的系統(tǒng)管理界面支持超大型數(shù)據(jù)倉(cāng)庫(kù),并提供多種優(yōu)化手段和針對(duì)數(shù)據(jù)倉(cāng)庫(kù)的特征,如分區(qū),位圖索引 提供功能強(qiáng)大的訪問(wèn)Cube的查詢語(yǔ)法Express command 提供Oracle Warehouse Builder作為數(shù)據(jù)抽取(chu q)工具,OWB提供功能包括:模型構(gòu)造和設(shè)計(jì);數(shù)據(jù)提取、移動(dòng)和裝載;元數(shù)據(jù)管理;分析工具的整合;以及數(shù)據(jù)倉(cāng)庫(kù)管理。具有開(kāi)放可延伸的框架。 共一百零二頁(yè)Sybase數(shù)據(jù)倉(cāng)庫(kù)解決方案Relati

27、onalPackageLegacyExternalsourceDataCleanToolSource DataDataStagingWareHouseAdmin. ToolsEnterprise DataWarehouse Data Extraction,Transformationand loadDatamartDatamartEnterprise/Central DataWarehouseRDBMSROLAPRDBMSRDBMS, Star SchemaArchitectedDatamartsCentralMetadata Data Modeling ToolEnd-UserToolEnd

28、-UserToolMDBEnd-UserToolEnd-UserToolLocal MetadataLocal MetadataPowerMartSybase IQSybase IQCognosPowerMartWarehouseArchitectWCCBrio/BOSybase ASE共一百零二頁(yè)Sybase數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)(tdin)按列存儲(chǔ),有很高的壓縮比例PowerMart能夠在一個(gè)統(tǒng)一的界面中將用戶定義的轉(zhuǎn)換規(guī)則、Schedule、權(quán)限設(shè)置、數(shù)據(jù)源和目標(biāo)(mbio)等等數(shù)據(jù)抽取定義通過(guò)有效的方式管理起來(lái),方便整個(gè)數(shù)據(jù)抽取工作的管理 Adaptive Server IQ不僅使用了基于值的

29、位映射(bitmap)算法及傳統(tǒng)的b-tree算法,還使用了Sybase有專利權(quán)的位式(bit-wise)索引 IQ with Multiplex可以支持無(wú)限的用戶訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù) 共一百零二頁(yè)系統(tǒng)(xtng)硬件拓?fù)鋱D數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器數(shù)據(jù)分析服務(wù)器數(shù)據(jù)抽取服務(wù)器數(shù)據(jù)挖掘服務(wù)器 WEB服務(wù)器省中心局域網(wǎng)廣域網(wǎng)廣域網(wǎng)存儲(chǔ)及備份系統(tǒng)防火墻管理終端相關(guān)部門(mén)客戶層相關(guān)部門(mén)客戶層Internet共一百零二頁(yè)共一百零二頁(yè)SAN典型(dinxng)結(jié)構(gòu)共一百零二頁(yè)存儲(chǔ)方式(fngsh)比較共一百零二頁(yè)存儲(chǔ)(cn ch)估算數(shù)據(jù)(shj)倉(cāng)庫(kù)數(shù)據(jù)(shj)3NFStar-Schema數(shù)據(jù)集市Star-SchemaC

30、ube共一百零二頁(yè)3NF計(jì)算公式總?cè)萘?源數(shù)據(jù)i * (1+索引因子) * RAID 因子源數(shù)據(jù)i=單條記錄字節(jié)數(shù) * 記錄數(shù)/人.天 * 用戶數(shù)*有效(yuxio)用戶系數(shù) * 天數(shù)/月 * 保存月數(shù)說(shuō)明: 索引因子 = 0.7 RAID因子 = 1.25 記錄數(shù)/人.天 = 8 用戶數(shù)*有效用戶系數(shù) = 200萬(wàn)/600萬(wàn)/1200萬(wàn) 天數(shù)/月 = 31 保存月數(shù) = N注:以上計(jì)算基于Oracle數(shù)據(jù)倉(cāng)庫(kù)引擎共一百零二頁(yè)Star-Schema的計(jì)算(j sun)維表用來(lái)描述屬性數(shù)據(jù),通常數(shù)據(jù)量很小,可以忽略不計(jì)。事實(shí)表記錄的大小取決于分析的內(nèi)容,包括每個(gè)維值的代碼和匯總數(shù)值(shz)的大

31、小。記錄的數(shù)量取決于分析維度的多少和每個(gè)維度可能出現(xiàn)的值的個(gè)數(shù)。事實(shí)表大小= 事實(shí)表記錄大小x 各維值取值數(shù)x 壓縮比因子業(yè)務(wù)主題總數(shù)據(jù)量= 各事實(shí)表大小的總和星型數(shù)據(jù)存儲(chǔ)量= 業(yè)務(wù)主題總數(shù)據(jù)量x (1+索引因子) x RAID 因子共一百零二頁(yè)存儲(chǔ)(cn ch)估算(600萬(wàn)為例)語(yǔ)音業(yè)務(wù)用戶(yngh)本地話單每年存儲(chǔ)量為:230*8*600萬(wàn)* 31 * 12 = 4.11T漫游話單每年存儲(chǔ)量為:230*10% * 8*600萬(wàn)* 31 * 12 = 0.411T語(yǔ)音業(yè)務(wù)用戶話單每年總存儲(chǔ)量為:4.11T+0.411T = 4.521T 共一百零二頁(yè)數(shù)據(jù)業(yè)務(wù)及其他新業(yè)務(wù)本地(bnd)話單

32、每年存儲(chǔ)量為:400*20%* 8*600萬(wàn)* 31 * 12 =1.44T漫游用戶話單每年存儲(chǔ)量為:400*20%* 10% * 8*600萬(wàn)* 31 * 12 = 190.4G數(shù)據(jù)業(yè)務(wù)及其他新業(yè)務(wù)話單每年總存儲(chǔ)量為:1.44T+190.4G = 1.63T存儲(chǔ)(cn ch)估算(600萬(wàn)為例)共一百零二頁(yè)結(jié)算話單結(jié)算話單每年(minin)存儲(chǔ)量為:200*600萬(wàn)*(8+8*10%)*50%*31*12 = 1.97T每年話單存儲(chǔ)總量為: 4.521T + 1.63T + 1.97T = 8.121T存儲(chǔ)(cn ch)估算(600萬(wàn)為例)共一百零二頁(yè)營(yíng)業(yè)部交易記錄基本上是每個(gè)客戶(k h)

33、有幾條記錄,但相對(duì)穩(wěn)定,不會(huì)大量產(chǎn)生,也不隨時(shí)間爆炸性增長(zhǎng),估算為0.6T/年??头?shù)據(jù)也會(huì)隨時(shí)間增長(zhǎng),但增幅遠(yuǎn)小于話單數(shù)據(jù),估算為0.6T/年。 存儲(chǔ)(cn ch)估算(600萬(wàn)為例)共一百零二頁(yè)客戶資料數(shù)據(jù)相對(duì)穩(wěn)定,以后隨客戶數(shù)量的增加而增長(zhǎng),其增幅(zn f)也不大,估算為0.6T/年。總?cè)萘拷Y(jié)合上述因素,總的存儲(chǔ)空間為:(8.121T+0.6T*3)*1.25=12.4T存儲(chǔ)(cn ch)估算(600萬(wàn)為例)共一百零二頁(yè)主機(jī)(zhj)性能測(cè)算TPC-CTPC-C is an on-line transaction processing benchmarkTPC-HTPC-H is an

34、 ad-hoc, decision support benchmarkIt consists of a suite of business oriented ad-hoc queries and concurrent data modifications.The performance metric reported by TPC-H is called the TPC-H Composite Query-per-Hour Performance Metric (QphHSize)共一百零二頁(yè)影響(yngxing)因素源主機(jī)(zhj)源數(shù)據(jù)庫(kù)網(wǎng)絡(luò)帶寬數(shù)據(jù)量(主要)目標(biāo)主機(jī)(主要)目標(biāo)數(shù)據(jù)庫(kù)(主

35、要)共一百零二頁(yè)HP Superdome + Oracle共一百零二頁(yè)IBM SP + DB2共一百零二頁(yè)NCR共一百零二頁(yè)SUN + Oracle共一百零二頁(yè)特別(tbi)提示 Oracle 9i Warehouse Builder Unleashing World Record Performance March 2002 采用(ciyng)HP Superdome + Oracle發(fā)布共一百零二頁(yè)測(cè)試環(huán)境主機(jī)(zhj)、數(shù)據(jù)庫(kù)Database Information: Oracle 9.0.1.1 Enterprise Edition HP Superdome Enterprise Se

36、rver: 64 552MHz PA-RISC 8600 CPUs each with 512KB I-cache, 1MB D-cache. 128 GB Memory 64 PCI Fibre Channel 2X Card 1 HP 1000 BaseSX PCI Lan Adapter 4 SureStore E Disk Array XP512 (with a total of 744 18.2GB Disks) 1 High Availability Storage System (with a total of 3 9.1 GB 10K RPM LVD Disks) OS use

37、d is HP-UX 11.i 64-bit 共一百零二頁(yè)測(cè)試環(huán)境數(shù)據(jù)量共一百零二頁(yè)測(cè)試(csh)結(jié)果共一百零二頁(yè)第一部分:公司介紹第二部分:需求說(shuō)明第三部分:解決方案第四部分:實(shí)施和服務(wù)第五部分:系統(tǒng)(xtng)演示第六部分:?jiǎn)栴}交流議程(ychng)共一百零二頁(yè)元數(shù)據(jù)驅(qū)動(dòng)、螺旋上升的數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建的過(guò)程就是(jish)“建立元數(shù)據(jù)構(gòu)造數(shù)據(jù)倉(cāng)庫(kù)/集市”的不斷循環(huán)、不斷上升的過(guò)程 經(jīng)營(yíng)(jngyng)分析系統(tǒng)實(shí)施方法論元數(shù)據(jù)驅(qū)動(dòng)信息模型分階段實(shí)施由元數(shù)據(jù)進(jìn)行統(tǒng)一的管理和協(xié)調(diào)共一百零二頁(yè)采用(ciyng)以元數(shù)據(jù)為中心的數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)方法 經(jīng)營(yíng)(jngyng)分析系統(tǒng)開(kāi)發(fā)方法共一百零二頁(yè)中央數(shù)據(jù)倉(cāng)庫(kù)

38、數(shù)據(jù)主題(zht)域的構(gòu)成共一百零二頁(yè)核心服 務(wù)支撐基礎(chǔ)客 戶營(yíng) 銷業(yè)務(wù)收益合作服務(wù)方市場(chǎng)大客戶新業(yè)務(wù)分析主題的劃分(hu fn)與關(guān)系共一百零二頁(yè)經(jīng)營(yíng)分析(fnx)系統(tǒng)結(jié)算計(jì)費(fèi)營(yíng)帳客服CMCC 接口問(wèn)題的解決70是管理上,30是技術(shù)上,因此需要BOSS廠商(chngshng)的支持、需要運(yùn)營(yíng)商的支持、需要多方的協(xié)調(diào)、理解經(jīng)營(yíng)分析系統(tǒng)建設(shè)需要您的支撐共一百零二頁(yè)需求階段應(yīng)充分考慮到項(xiàng)目中的風(fēng)險(xiǎn)(包括接口問(wèn)題)提出問(wèn)題設(shè)計(jì)階段采取好的方法來(lái)解決問(wèn)題,這里我們采用把項(xiàng)目打散,模塊化實(shí)施,分清楚哪些是我們自己應(yīng)該做好的,哪些是需要第三方來(lái)配合做好的解決問(wèn)題實(shí)施階段采用CMM體系,會(huì)在沒(méi)周例會(huì)中對(duì)問(wèn)題進(jìn)行評(píng)估,哪些是解決的,哪些是未解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論