數據挖掘技術在電信業(yè)針對性系統(tǒng)中應用_第1頁
數據挖掘技術在電信業(yè)針對性系統(tǒng)中應用_第2頁
數據挖掘技術在電信業(yè)針對性系統(tǒng)中應用_第3頁
數據挖掘技術在電信業(yè)針對性系統(tǒng)中應用_第4頁
數據挖掘技術在電信業(yè)針對性系統(tǒng)中應用_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

摘要3摘要3IWithincreasinglyintensecompetitioninmarket,massdatehasbeencreatedinthebusinessenvironment.Alargeamountofinformationexistinginthemassdatewhichlikelytobringenormousbusinessopportunitiesfortheenterprise.Makinggooduseofthesedate,translatingthedateintoinformationhaveabettersupportforenterprisesintheaspectofdecision-making.Forthetelecommunicationsindustry,CustomerRelationshipSystemhaveaccumulatedalargeWithincreasinglyintensecompetitioninmarket,massdatehasbeencreatedinthebusinessenvironment.Alargeamountofinformationexistinginthemassdatewhichlikelytobringenormousbusinessopportunitiesfortheenterprise.Makinggooduseofthesedate,translatingthedateintoinformationhaveabettersupportforenterprisesintheaspectofdecision-making.Forthetelecommunicationsindustry,CustomerRelationshipSystemhaveaccumulatedalargeamountofdatefortheenterprises.However,inthefaceofincreasinglyfiercecompetitioncharges,howtoidentifycustomerrequirementusingthemassdatetoenhancecustomersatisfactionhasbecomethenewproblemforeverytelecomoperation.Inthenatureofthings,dateminingtechnologyhasbecomeaneffectivetoolsatisfaction..Applicationofdateminingtotelecommunicationsmarketingsystemwilla customers,acquisitioncustomerandmaximizationtheFirst,analysisoftargetedmarketingsystem,systematicallystudiedandindepthanalysisoftargetedmarketingsystemofChinaTelecom’sthreemajorfunctionalmodules,includingdatesourcemodules,customermanagementandmodulemanagementmodule,anddetailedinunsupervisedmoduleofthemodelmanagement.Second,putforwardtheconceptofdataminingsystem,thoroughlyanalysisofthefunctionofthedatesystem,putforwardthesupervisedmodule,anddetailedsystematicanalysis algorithm,clusteringalgorithmandassociationrules.Third,combinedwiththeprojectofminingpotentialehomecustomerswhichisparticipatedinthedatemininggroupoftrainingcompany,discussesthedetaileddesignandimplementationofthedateminingsubsystem,establishae8customerresponsemodelcombinedwiththetargetedmarketingsystemoftelecommunicationscompanyinAnhuiProvincetoimprovethesuccessrateofmarketinginitiative.Finally,analysisthesetoftheruleswhichisestablishbythesystem.Pointoutmainresultsoftheresearchmainresultsoftheresearchpapersandtheareasofimprovement,andwealsopointoutdirectionoffurtherstudyofdateminingtechnologyinthetelecommunicationindustryandprospectthedevelopmentofBIproductsinthetelecommunicationsindustry.Keywords:MassDataTargetedmarketingUnsupervisedSupervised1 研究息,如果能把這些信息從大量的數據中1 研究息,如果能把這些信息從大量的數據中提取出來,就能為人類服務并能創(chuàng)造價值[1-3]中國電信目前經營過程中,已經出現了大量客戶流失和業(yè)務收入下滑的現象[4]及銷售量下滑產生的原因,然后再采取相應的措施[5]。這些行為都只是一些事后導致管理層和決策層都不能及時地得到數據結果[6-7]數據挖掘正是在這樣信息爆炸的時代下產生并迅速發(fā)展起來的一門技術[8]的應用于醫(yī)學,電信,管理學等多門學科中了[12]1據挖掘也漸漸成為電信運營商管理決策的重要據挖掘也漸漸成為電信運營商管理決策的重要手段之一[13] 國內據庫中發(fā)現知識(kowledgeDiseoveryinDatabaseKDD)據挖掘算法的研究已經相對成熟[14-16]。但是數據挖掘技術應用于實際商業(yè)領域的品卻很少,直到商務智能這個概念的提出才從根本上改變這一現狀[17]從技術實現角度上看,目前商務智能的核心技術主要包括數據倉庫Warehousing,DW)、聯(lián)機分析處理(OnLineProcessing,OLAP)和數據挖(DataMining,DM)等三大技術。商務智能產品系統(tǒng)框架[18-20],如1- BI產品系統(tǒng)框2析處理和數據挖掘技術來完成[21]。數據倉庫析處理和數據挖掘技術來完成[21]。數據倉庫是商務智能的基礎,存儲按照商務報表[22-23]支撐系統(tǒng)(OSS)和電信業(yè)務經營支撐系統(tǒng)(BSS,使之集成更多應用。這些系 業(yè)務支撐系統(tǒng)目前,國內一些省級電信分公司已在客戶關系管理(CRM,網管系統(tǒng)活動統(tǒng)一在該平臺下完成[25] 本文要解決的化為積極主動的營銷模式。主動營銷模式深入人心,受到多家運營商的追捧[25]3BIBIBIBI銷的能力[26-27]。如1-3 數據挖掘收益分析圖1-3 中的直線y1=x 表示在應用數據挖掘數據到營銷中后,主動營銷和客戶響應比例的比例,從圖中以明顯看出在應用數據挖掘技術后,在相同的營銷投入下,客戶響應大大提高了[28] 本文452必須建立在對客戶理解的數據分析2必須建立在對客戶理解的數據分析的基礎上,是一個自我學習、自我積累的過程[29] 針對性營銷系 (1)(2)EDMBSS、OSS、MSSETL處EDW(企業(yè)數據倉庫)ODS(3)6種指標進行跟蹤評估,及時了解市場的反應[4]2-1種指標進行跟蹤評估,及時了解市場的反應[4]2-1 產品定位針動營銷系統(tǒng)根據營銷創(chuàng)意,銷系統(tǒng)只對營銷效果進行跟蹤評估[20]72-2數據 針對性營銷系統(tǒng)流程(1)2-(2)2-2數據 針對性營銷系統(tǒng)流程(1)2-(2)(3)群圈定部分,首先選擇需要的數據源類型(分析主題8群跟蹤分群管群名單外場活動的準確性和及時性,讓場活動的準確性和及時性,讓群名單發(fā)揮出其既有的價值[20] 數據 沒有在一個寬表中查詢來的快[30-31](1)寬表是以客戶標識或者用戶標識為唯一主鍵,全面反映其基本信息、(2)(3)(4)(5)9 基于對寬表擴展性和重用性這兩個方面的考慮,按照傳統(tǒng)的設計方式,業(yè)務主題和分析時間進行一對一的物理表方式,(1)雖然業(yè)務主題不同,但很多主 基于對寬表擴展性和重用性這兩個方面的考慮,按照傳統(tǒng)的設計方式,業(yè)務主題和分析時間進行一對一的物理表方式,(1)雖然業(yè)務主題不同,但很多主題所需要分析的特征信息有很多是相同的(2)業(yè)務主題的多樣性決定了寬表結構的不確定性。比如圈定下個月預流帶用戶。分析競爭對手業(yè)務使用情況和分析96688IP(3)通過單一字段存儲方式,部分特征信息不能支撐業(yè)務需求,對于需要華中科技大學碩士對應客戶類型維表21 Special_Called_no華中科技大學碩士對應客戶類型維表21 Special_Called_nonumber(10) … … Cust_name…虛擬寬 … Cust_name… 模型管理模塊 模型管理模塊 有目的分群流程(1)銷售品中包含超級無繩、時間周期為200707,本地網為成都。(2) 自學習模型前臺示例 群管 群模板管理前臺界 群管理模塊前臺頁面圖 本章 本章3個主33 數據挖掘子系33 數據挖掘子系(1)(2)(5)(5)數據準備階段的目的是創(chuàng)建以客戶標識/據建模方式分為兩類,一類是以客戶標識/品類型、客戶類型等;數值類型比如本月總費品類型、客戶類型等;數值類型比如本月總費用、本月通話時長等[32]一張寬表,而是多個物理表(也稱寬表片段)ODSETL200706\7\8三個月數據做分析。如圖3-2所示。 四川資陽本地網200706\7\8三個月數據分析(2)(3)①②③①②③S1S2 目標組于對比組擬合程度示3-4數據模型應用數據探索生成環(huán)境數據模型系統(tǒng)生成展現生成訓練、測試數據優(yōu)化后續(xù) 需要系統(tǒng)支查看日志、進3-4數據模型應用數據探索生成環(huán)境數據模型系統(tǒng)生成展現生成訓練、測試數據優(yōu)化后續(xù) 需要系統(tǒng)支查看日志、進確定構造、整合、格式化數選擇、清洗數模型模型確定收集數據、描述 客戶e8 客戶e8套餐分150元(108元/20元固定電話月租[33]掘其中的潛在e1503-1e898效果。e8套餐可選包如表3-2所示。 e8套餐可選包列 數據挖掘子系3-1e898效果。e8套餐可選包如表3-2所示。 e8套餐可選包列 數據挖掘子系統(tǒng)應用方整合電信行業(yè)數據十分有效。主要應用領域有如下幾個方面[34-1503050.15元/359680081.684284綠色上網(5e8301575306元/1M180小時+60208355010 本章 本章4 決策樹分類算使得決策樹4 決策樹分類算使得決策樹算法在商務智能、知識發(fā)現等領域有了前所未有的發(fā)展[36-37]11-2點沒有子節(jié)點,稱其為葉節(jié)點。每個節(jié)點(不包括葉節(jié)點)集的屬性X,將XID3使樣本分類的結果子樹所需的信息最小[38]A1,A2,A3...的集合,類別屬AFunctionID3(R表示A1,A2,A3...的集合,類別屬AFunctionID3(R表示一個非類別屬性的集合,A代表類別屬性,S是一個訓練集ElseR中屬性中具有最大區(qū)分度的屬性賦給D的賦值給EndFunctionC4.5算法4)Gain(S,GainRatio(S,Gain(S,GainRatio(S,A)(4-splitinformation(S,n|i|(|Si2|S|SC4.5(1)屬性的值對數據集排序(2)C4.5if- 聚類聚類分析也可以理解為無監(jiān)督分類,與決策樹分類分析(有監(jiān)督分類) k<=n.k個組,同時滿 k<=n.k個組,同時滿2)3) 關聯(lián) 購物籃分析圖 購物籃分析圖YXYXYXY的支持supportXYsupportXY)supportXY)confidence(XY)support(XY)(4-support(X定義4-2:若supportXYmin定義4-2:若supportXYminsupportconfidenceXYminconfidenceXY為強規(guī)則,否則稱關聯(lián)規(guī)則XY為弱規(guī)則。XY對應XY必定是頻集(2可知XYXYXXYconfidence(XY)support(XY)(4-support(X 關聯(lián)規(guī)則挖掘的基本模4-3DAlgrithm-2為關聯(lián)規(guī)則的產生算法,R4-3DAlgrithm-2為關聯(lián)規(guī)則的產生算法,R為挖掘出的關聯(lián)規(guī)則集合。用戶通過指定minsupport和minconfidenceAlgrithm-1Algrithm-2R的交互對挖掘 本章5e 5e 模型設計標準CRISP-CRISP-DM是在1996年末由當時處于年輕又不成熟的數據挖掘市場的“三劍客了第一個數據挖掘平臺-Clementine。NCR也建立了由數據挖掘顧問和技術專家組成CRISP-DMCross-IndustryStandardProcessforDataMining(phase CRISP-DM方法論的四層分解模datemodelingdatemodeling 商業(yè)針對安徽省電信公司銅陵分公司關于ee8用戶,然后對其施行針對性的營銷,可以幫助e家客戶響應規(guī)則集,通過該規(guī)則集來ee家客戶,對針對性營銷提供決策支持;建立的e家客戶響應規(guī)則集合理,能夠有效的預測潛在客戶,在施行針對性營e 數據 息如表5-1所示。 后付費賬單中字段對應維 數據 息如表5-1所示。 后付費賬單中字段對應維 (1)通話費字段tb_b_dim_acct_item_typeeCUST_ID(2) (1)通話費字段tb_b_dim_acct_item_typeeCUST_ID(2)(3)用戶性質(住宅品結構PRD_STRUCT_ID,產品實例數量(4)客戶資料詳單表表名:tb_b_ft_cust_200809 (1)(2)Level4_name這一字段來匯總每一用戶的本地話費,而不用考慮長話數據再通過圖表方式來觀察其分布狀態(tài),對于一些特性顯著(過大的數據)(3)(4)其次,在探索客戶品牌維表時,希望用brand_id與事實表對應字段關關聯(lián)查詢數據再通過圖表方式來觀察其分布狀態(tài),對于一些特性顯著(過大的數據)(3)(4)其次,在探索客戶品牌維表時,希望用brand_id與事實表對應字段關關聯(lián)查詢接關聯(lián)查詢出e8套餐客戶。(5)(6)e8e8e8e8e8客戶的比例以及不同階段之間屬(7) 數據挖掘分析屬性 數據ee 數據挖掘分析屬性 數據ee市/鄉(xiāng)村,字段是字符型,費用類都是數值型,可以將數值型的缺省數據定義為戶占大多數,e8id 數據挖掘建模數據源 模型市/鄉(xiāng)村,字段是字符型,費用類都是數值型,可以將數值型的缺省數據定義為戶占大多數,e8id 數據挖掘建模數據源 模型E85-2 C5.05-2 C5.0決策樹模型設置界(1)(2)(3)輸入:訓練數據集S(s1,s2,s3,s4.......),描述屬性集合 csvclementine選擇類型(type)e8_type_id為標志,其方向為輸出,cust_id5- 數據類型設要性,即該屬性對判別客戶是否是e8客戶的決定因素的大小。 e家數據挖掘數據流 模式與變量重要5-6 模式與變量重要5-6 決策樹生成模型圖(branchesbranchesBBD_FEE<=2.440[模式CRING_FEE>0.470[模式CRING_FEE<=2.200[模式CRING_FEE>2.200[模式BBD_FEE<=2.440[模式CRING_FEE>0.470[模式CRING_FEE<=2.200[模式CRING_FEE>2.200[模式 決策樹圖18-7個規(guī)則,括號中表示實例數和置信度,18e8客戶,規(guī)則1用于18(625;0.997)BBD_FEE>BBD_FEE<=CRING_FEEBBD_FEE>BBD_FEE<=CRING_FEE>CRING_FEE<=則規(guī)則用于0-包含20個規(guī)則,括號中表示實例數和置信度,0標識非e8客戶;規(guī)則1用于 0(25,795;0.999)BBD_FEEURBAN_RURAL_NAME=則e82。70%數據作為訓練集的,在模型30%數據做為模型評估測試所用數據,之所以這樣做的是因為既 預測結果置信度分析$C-E8_TYPE_ID表示評估后是否選用e8套餐的狀態(tài),$CC-E8_TYPE_ID代表預測結果的置信度大小,即預測正確性的強度,從圖中可以看到,其置信度基本 本章e6 總e8e86 總e8e8 進一際上匯總的寬帶總費用就可以表示這以費用的意義了,不需要在細分;對于IN_AREA_FEE 前景 前景險預測、產品產量、質量分析、分子生物學、基因工程研究、Internet網上書店(),會發(fā)現當你選中一本書后,會出現相關的推薦數目“CustomerswhoboughtthisbookalsoboughtERP致謝致謝PascalPoncelet.FlorentMasseglia.DateMiningPatternsNewMethodsPascalPoncelet.FlorentMasseglia.DateMiningPatternsNewMethodsandApplication.HersheySpringer,2008:341-459A.S.Smmith.BuildlingDataMiningApplicationforCRM,McGraw-HILL,NewYork,2000:132-219DaoLin,ZviM.Kedem.AnewalgorithmfordiscoveringthemaximumfrequentPincer-Search,March,1998:32-楊明.決策樹學習與算法ID3的研究.微機發(fā)展2002,12(5):7-張進軍.電信CRM中的數據挖掘:[碩士學位論文].長春:吉林大學圖書館,M.Kamber.DataMining:ConceptsandTechniques,MorganKaufmman,SanFrancisco,2000:332-485C.T.Blaxton.DataMiningSolutions:MethodsandToolsforSolvingReal-WorldProblems.JohnWiley,NewYork,1998:478-523R.L.Kennedy.SolvingDataMiningProblemsthroughPatternRecognition,PrenticeHall,UpperSaddleRiver:NJ,1998:432-450C.VandenBroeck.StatisticalMecbanicsofLearning.CambridgeUniversityPress,Cambridge:UK,2001:372-396H.Mannila,P.Smith,PrinciplesofDataMining,MITPress,Cambridge:MA,2001:王芳,楊奕.論數據挖掘技術在客戶關系管理中的應用.現代商貿工業(yè),2009(1):23-24羅夢麟.基于電信數據挖掘的研究與應用:[碩士學位論文].杭州:浙江工業(yè)大學圖書館,2004劉耕硯.數據挖掘中Apriori算法改進及在電信BI上的應用:[碩士學位論文].昆明:昆明理工大學圖書館,2008H.Motoda,InsuranceSelectionandConstructionforDataMining,Academic,Boston:MA,2001:321-R.Bayardo,R.Agrawal.Miningthemostinterestingrules.In:ProcKDD-99,SanDiego,1999:112-121R.Bayardo,R.Agrawal.Miningthemostinterestingrules.In:ProcKDD-99,SanDiego,1999:112-121C.Aggarawal,P.Yu.Anewframeworkforitemsetgeneration.In:Proc.oftheACMPODS,Santiago,Chile,1998韓家煒.數據挖掘概念與技術.北京:機械工業(yè)出版社2006:101-王麗珍.數據倉庫與數據挖掘原理及應用.科學出版社2005.7:42-朱仲英.基于WEB技術的數據挖掘系統(tǒng)研究與設計.微型電腦應用,2005.1:GeorgeM.Marakas.數據倉庫數據挖掘和可視化——核心概念.北京:清華大學出版社,2004:119-156M.Mehta,R.Agrawal.Afastscalableclassifierfordatamining.InProc.1996Conf.ExtendingDatabaseTechnology.Avignon,France,Mar.S.Green.DiscoveringValueinaMountainofData,OR/MSToday.Oct.M.Hearst.SupportVectorMachines.IEEEIntelligentSystems.July/Aug段云峰.數據倉庫及其在電信領域中的應用.北京:電子工業(yè)出版社MehmedKantardzic.數據挖掘—概念.模型,方法和算法,閃四清譯.北京:清華大學出版社,2003:123-176張利民.業(yè)務需求說明書-e8客戶響應數據挖掘模型部分.天源迪科信息技術股份有限公司,2008廖里.余英澤.數據挖掘和數據倉庫及其在電信中的應用.重慶郵電學院學報,2002(2):23-26王晨.OLAP分析模型在集團企業(yè)財務分析中的應用.計算機工程,2003,Show-JaneYenandL.P.Chen.AnefficientDataMiningtechniquefordiscoveringinterestingassociationrules.EighthInternationalWorkshopSept.1997:664-669薩師煊.王珊.數據庫系統(tǒng)概論.北京:高等教育出版社2000:203-劉同明.數據挖掘技術及其應用.北京:國防工業(yè)出版社2001:134-劉同明.數據挖掘技術及其應用.北京:國防工業(yè)出版社2001:134-陳京民.DataWarehouseandDataMiningTechniques.北京:電子工業(yè)出版社,2002:225-283中國互聯(lián)網協(xié)會2008中國互聯(lián)網調查報告王珊.數據倉庫技術與聯(lián)機分析處理.北京:科學出版社,1998:78-李書濤.決策支持系統(tǒng)原理與技術.北京:北京理工大學出版社1996:102-J.R.Quinlan.C4.5:ProgramsforMachineLearning,MorganKaufmann,SanMateo:CA,1992:332-451T.Mitchell.MachineLearning,McGrawHill,NewYork:NY,1997:342-C.J.Matheus,L.A.RendellConstructiveInductiononDecisionTree.In:ProceedingsoftheEleventhInternationalJointConferenceonArtificialIntelligence,Detroit,MI:MorganKaufmann,1989:145-150CRISP-DM聯(lián)盟CRISP-DM1.0循序漸進數據挖掘指南史忠植李水平知識發(fā)現.北京:清華大學出版社2002:101-陳意云數據采掘技術回顧.小型微型計算機系統(tǒng),1998(4):74-附錄規(guī)則18(625;BBD_FEE>BBD_FEE<=CRING_FEE>CRING_FEE<=附錄規(guī)則18(625;BBD_FEE>BBD_FEE<=CRING_FEE>CRING_FEE<=則規(guī)則18(12,119;BBD_FEE>BBD_FEE<=CRING_FEE>CRING_FEE<=IN_AREA_FEE>IN_AREA_FEE<=KILLVIRUS_FEE<=0則規(guī)則18(13,954;BBD_FEE>BBD_FEE<=CRING_FEE>CRING_FEE<=IN_AREA_FEE>則418(5,959;BBD_FEE>BBD_FEE<=CRING_FEE>IN_AREA_FEE>則5418(5,959;BBD_FEE>BBD_FEE<=CRING_FEE>IN_AREA_FEE>則518(7,486;BBD_F

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論