數據挖掘應用案例_第1頁
數據挖掘應用案例_第2頁
數據挖掘應用案例_第3頁
數據挖掘應用案例_第4頁
數據挖掘應用案例_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘4.2案例二:通信用戶滿意度指數評測4.3案例三:城市環(huán)境質量評價2024/7/71第四章數據挖掘應用案例

數據挖掘是從海量數據中發(fā)現有趣知識的而過程,這些知識是隱含的、事先未知的潛在有用信息,挖掘的知識表示形式為概念、規(guī)則、規(guī)律和模式等,是建立在數據倉庫基礎上的高層應用。結合領域知識和數據分析技術,數據挖掘為許多特定領域提供解決方案,包括金融、零售和通信、科學與工程、入侵檢測和防護等。同時也會影響人們購物、工作、搜索信息、使用計算機、保護隱私和數據安全,以及休閑、健康和幸福等日常生活。隨著數據挖掘技術的廣泛應用,由此所帶來的影響也將繼續(xù)。2024/7/72第四章數據挖掘應用案例

4.1案例一:零售商系統(tǒng)貨籃數據挖掘1、Walmart簡介Walmart百貨有限公司由美國零售業(yè)的傳奇人物山姆.沃爾頓先生于1962年在阿肯色州成立。經過50多年的發(fā)展,Walmart公司已經成為美國最大的私人雇主和世界上最大的連鎖零售企業(yè)。目前,Walmart在全球15個國家開設了超過8000家商場,下設53個品牌,員工總數210多萬人,每周光臨Walmart的顧客為2億人次。2024/7/73第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))1991年,Walmart年銷售額突破400億美元,成為全球大型零售企業(yè)之一。據1994年5月美國《財富》雜志公布的全美服務行業(yè)分類排行榜,1993年Walmart銷售額高達673.4億美元,比上一年增長118億美元,超過了1992年排名第一位的西爾斯(Sears),雄踞全美零售業(yè)榜首。1995年,Walmart銷售額持續(xù)增長,并創(chuàng)造了零售業(yè)的一項世界紀錄,實現年銷售額936億美元,在《財富》雜志2024/7/74第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))美國最大企業(yè)排行榜上名列第四。事實上,Walmart的年銷售額相當于全美所有百貨公司的總合,而且至今仍保持著強勁的發(fā)展勢頭。至今,Walmart已擁有2133家Walmart商店、469家山姆會員商店和248家Walmart購物廣場,分布在美國、中國、墨西哥、加拿大、英國、波多黎各、巴西、阿根廷、南非、哥斯達黎加、危地馬拉、洪都拉斯、沙爾瓦多、尼加拉瓜14個國家。它在短短幾十年中又如此迅猛的發(fā)展,不得不說是零售業(yè)的一個奇跡。2024/7/75第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))

2、Walmart貨籃數據挖掘內容Walmart關注客戶的貨籃。因為Walmart認為商品銷售量的沖刺只是短期行為,而零售企業(yè)的生命力取決于貨籃。一個小小的貨籃體現了客戶的真實消費需求和購物行為,每一只貨籃里都蘊藏著太多的額客戶信息。零售業(yè)的宗旨是服務客戶,Walmart認為商店的管理核心應該是以貨籃為中心的顧客經營模式,商店排名只能體現商店自身的表現,而貨籃可以體現客戶的購買行為及消費需求,關注貨籃可以使門店隨時掌握客戶的消費動向,從而使門店始終與客戶保持一致。2024/7/76第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))

為了能夠準確了解顧客在其門店的購買習慣,Walmart對其顧客的購物行為進行貨籃分析,想知道顧客經常一起購買的商品有哪些。商品相關性分析是貨籃分析中最重要的部分,Walmart數據倉庫里集中了其各門店的具體原始交易數據。在這些原始交易數據的基礎上,Walmart利用NCR數據挖掘工具對這些數據進行了分析和挖掘。Walmart發(fā)現了一個令人難以理解的現象:在某些特定情況下,“啤酒”與“尿布”兩件看上去毫無關系的商品會經常出現在同一個貨籃中,這種獨特的銷售現象引起了管理人員的注意。2024/7/77第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))這是數據挖掘技術對歷史數據進行分析的結果,反映數據內在的規(guī)律。那么這個結果符合現實情況嗎?是否是一個有用的知識?是否有利用價值?于是Walmart派出市場調查人員和分析師對這一數據挖掘結果進行調查分析。經過大量實際調查和分析,揭示了一個隱藏在“尿布與啤酒”背后的美國人的一種行為模式:在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去購買尿布。父親在購買尿布的同時,30%~40%的人往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相干的商品經常會出現在一個貨籃的現象。2024/7/78第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))如果這個年輕的父親在賣場只能買到兩件商品之一,則他很有可能會放棄購物而到另一家商店,直到可以一次同時買到尿布與啤酒為止。Walmart發(fā)現了這一獨特的現象,開始在賣場嘗試將尿布與啤酒擺放在相同的區(qū)域,讓年輕的父親可以同時找到這兩件商品,并很快地完成購物;而Walmart也可以讓這些客戶一次購買兩件商品,而不是一件,從而獲得了很好的商品銷售收入。2024/7/79第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))當然“尿布與啤酒”的故事必須具有技術方面的支持。1993年,美國學者Agrawal提出通過分析貨籃中的商品集合,來找出商品之間關聯(lián)關系的關聯(lián)算法,并根據商品之間的關系,找出客戶的購買性為。Agrawal從數學及計算機算法角度提出了商品關聯(lián)關系的計算方法——Aprior算法。Walmart從20世紀90年代嘗試將Aprior算法引入POS機數據分析中,并獲得了成功,于是產生了“尿布與啤酒”的故事。2024/7/710第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))按常規(guī)思維,尿布與啤酒風馬牛不相及,若不是借助數據挖掘技術對大量數據進行挖掘分析,Walmart是不可能發(fā)現數據內在的這一有價值的規(guī)律的。3、Walmart貨籃數據挖掘的關聯(lián)分析過程研究商品關聯(lián)關系的方法就是貨籃分析,Walmart強調找出商品之間的關聯(lián)關系,比如啤酒與尿布。換句話說,Walmart重點是分析貨籃內商品之間的關聯(lián)關系。2024/7/711第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))以Walmart為代表的美式貨籃分析的目標一般是面積巨大(通常都是上萬平方米)商品種類繁多(大多在10萬種以上)的賣場,所以要通過貨籃分析找出淹沒在不同區(qū)域商品之間的關聯(lián)關系,并將這些關聯(lián)關系用于商品關聯(lián)陳列、促銷等具體工作中,是很難通過人工完成的。比如,啤酒在酒類區(qū)域,尿布在嬰兒用品區(qū)域,兩個商品陳列區(qū)域相差幾十米,甚至可能是“樓上、樓下”的陳列關系,用肉眼很難發(fā)現尿布與啤酒存在關聯(lián)關系的規(guī)律。2024/7/712第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))

把找出貨籃中商品之間關系的方法稱為“美式貨籃”分析法,這種方法適合應用于類似Walmart這樣的大賣場,用于找出不同陳列區(qū)域商品之間的關系。4、關聯(lián)規(guī)則挖掘過程如何從大型數據庫中挖掘關聯(lián)規(guī)則呢?關聯(lián)規(guī)則的挖掘有以下兩步:1)根據最小支持度找出事務數據庫D中所有的頻繁項目集。2)有頻繁項目集合最小支持度產生強關聯(lián)規(guī)則,也可以使用附加的興趣度來對規(guī)則進行度量。2024/7/713第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))以支持度、信任度、興趣度三項指標表現的商品關聯(lián)規(guī)則。一個正規(guī)的貨籃分析報表應該采取三個指標數字,才可以準確地衡量商品是否真的存在關聯(lián)關系:采取“支持度(Support)-信任度(Confidence)”作為主要商品相關性分析指標,為了強化說明關聯(lián)關系,往往會運用興趣度(Lift)指標。2024/7/714第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))(1)支持度在貨籃分析中,支持度指的是多個商品同時出現在同一個貨籃中的概率。比如,尿布與啤酒同時出現在貨籃中的概率是20%,稱尿布與啤酒的支持度是20%,按照國際命名規(guī)則表示為:啤酒Implies尿布=20%2024/7/715第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))“尿布與啤酒”不等于“啤酒與尿布”——相關性的單向性,是代表商品之間的相關性具有單向性?!澳虿寂c啤酒”代表了一種因果關系。在“尿布與啤酒”的故事中,年輕的父親去的目的是購買尿布,在買尿布的前提下,才會考慮購買啤酒,因此在購買尿布的父親中有35%購買了啤酒,不代表購買了啤酒的父親有35%購買了尿布,因為這是兩類不同的消費行為,商品之間的因果關系也會不同,因此這個故事不能反過來講。2024/7/716第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))要看商品之間是否具有相關性,在計算商品之間的支持度時,需要反過來計算進行驗證,看看兩個商品之間的相關性具有多少的信任度,從而尋找商品之間的因果關系。由于商品之間關聯(lián)關系具有單向性,在零售業(yè)也會采取這種表示商品關聯(lián)關系的方式:尿布=>啤酒,即尿布與啤酒之間具有關聯(lián)關系,方向是從尿布到啤酒。2024/7/717第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))(2)信任度信任度是對支持度進行衡量的指標,用于衡量支持度的可信度及數據強度。由于這項指標是將商品同時出現在貨籃中概率進行反復運算,因此這是衡量商品相關性的主要指標。(3)興趣度興趣度又稱為提升度,是對支持度、信任度全面衡量的指標,很多時候在衡量商品關聯(lián)關系時只采用2024/7/718第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))這一個指標,可見這個指標的重要性。當興趣度指標大于1.0時,則表明商品之間可能具有真正的關聯(lián)關系。興趣度數據越大,則商品之間的關聯(lián)意義越大。如果興趣度小于1.0,則表明商品之間不可能具有真正的關聯(lián)關系。在某些情況下,興趣度會出現負值,此時商品之間很可能具有相互排斥的關系,體現在貨籃中,就是這些商品從來不會出現在同一個貨籃中。2024/7/719第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))假如有表4.1的購買記錄。顧客項目1紙尿片、啤酒2牛奶、紙尿片、橙汁3紙尿片、衛(wèi)生紙4紙尿片、衛(wèi)生紙、啤酒5橙汁2024/7/720第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))將表4.1整理后得到購買記錄轉換后的二維表4.2。項目紙尿片橙汁牛奶啤酒衛(wèi)生紙紙尿片41122橙汁12100牛奶11100啤酒20021衛(wèi)生紙100022024/7/721第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))表4.2中行和列數字表示同時購買這兩種商品的額交易條數。如購買有紙尿片的交易條數為4,而同時購買紙尿片和啤酒的交易數位2.信任度表示了這條規(guī)則在多大程度上可信。計算“如果紙尿片則啤酒”的信任度。由于在含有紙尿片的4條交易中,僅有2條交易含有啤酒,所以其置信度為0.5。2024/7/722第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))支持度計算在所有交易集中,既有紙尿片又有啤酒的概率。在5條記錄中,既有紙尿片又有啤酒的二級路有2條,則此條規(guī)則的支持度=2/5=0.4?,F在這個規(guī)則可表述為:如果一個顧客購買了紙尿片,則有50%的可能購買啤酒。而這樣的情況(及購買了紙尿片有購買了啤酒)會有40%的可能發(fā)生。再來考慮下述情況:2024/7/723第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))項支持度紙尿片0.45啤酒0.42衛(wèi)生紙0.4紙尿片and啤酒0.25紙尿片and衛(wèi)生紙0.2啤酒and衛(wèi)生紙0.15紙尿片,啤酒and衛(wèi)生紙0.052024/7/724第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))以上情況可得到下述規(guī)則:規(guī)則信任度if啤酒and衛(wèi)生紙then紙尿片0.05/0.15*100%=33.33%if紙尿片and衛(wèi)生紙then啤酒0.05/0.20*100%=25%if紙尿片and啤酒then衛(wèi)生紙0.05/0.25*100%=20%2024/7/725第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))

上述三條規(guī)則,對于規(guī)則“if啤酒and衛(wèi)生紙then紙尿片”,同時購買啤酒和衛(wèi)生紙的人中,有33.33%會購買紙尿片。而單項紙尿片的支持度為0.45,也就是說在所有交易中,會有45%的人購買紙尿片。得到這個規(guī)則的意義不大,如果應用商品促銷上作用不是很明顯。為此引入另外一個量,即興趣度,以度量此規(guī)則是否可用。描述的是相對于不可用的規(guī)則,可用規(guī)則可以提高多少。可用規(guī)則的提升度大于1.計算方式為:2024/7/726第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))Lift(A=>B)=Confidence(A=>B)/Support(B)=Support(A=>B)/(Support(A)*Support(B))在上例中,Lift(if啤酒and衛(wèi)生紙then紙尿片)=0.05/(0.15*0.45)=0.74,而Lift(if紙尿片then啤酒)=0.25/(0.45*0.42)=1.32。也就是說,在紙尿片的產品促銷中如果綁定銷售啤酒,顧客購買概率是單獨購買啤酒的1.32倍?;蛘哒f,對買了紙尿片的人進行推銷啤酒,購買概率是隨機推銷啤酒的1.32倍。2024/7/727第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))接下來就要產生關聯(lián)規(guī)則。首先,找出頻繁集。所謂頻繁集指滿足最小支持度或信任度的集合。其次,從頻繁集中找出強關聯(lián)規(guī)則。強關聯(lián)規(guī)則指既滿足最小支持度又滿足最小信任度的規(guī)則。2024/7/728第四章數據挖掘應用案例4.1案例一:零售商系統(tǒng)貨籃數據挖掘(續(xù))5、Walmart貨籃數據挖掘的應用效果Walmart公司的所有分公司的銷售數據、庫存數據每天通過衛(wèi)星線路傳到總部的而數據倉庫里,通過數據倉庫對商品品種和庫存進行分析,Walmart公司可以研究顧客購買趨勢、分析季節(jié)性購買模式、及時補充商品、確定促銷商品,等等。Walmert的締造者SamWalton在他的自傳《MadeinAmerica:MyStory》中,對于數據倉庫評價極高,可以說,數據倉庫改變了Walmart。2024/7/729第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測1、通信用戶滿意度指數評測數據挖掘的背景簡介通信行業(yè)正面臨與日俱增的市場壓力、更精明的競爭對手和更苛刻的消費者。中國通信行業(yè)正從快速增長階段邁入平穩(wěn)增長階段,服務質量已經成為企業(yè)的核心競爭力。因而通信運營商市場營銷工作的重點不僅僅是吸引新用戶,突出價格策略的重要性,而是要將如何維護老用戶作為市場營銷工作新的重點,從而使服務策略的重要性逐漸突現。2024/7/730第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))目前,市場上的價格競爭將逐漸過渡到服務競爭。各大通信運營商已經形成了較為激烈的競爭格局,隨著國內運營商及國外運營商進入移動通信市場,這種競爭愈演愈烈。通信運營商能否在如此嚴峻的經營環(huán)境下順利發(fā)展,關鍵因素在于能否站在消費者的角度考慮產品和服務,消費者是否滿意其提供的產品或服務。“客戶滿意”越來越成為眾多通信運營商已經意識和正在努力提高的經營指標,成為運營商工作的重點。2024/7/731第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))2、通信用戶滿意度指數評測數據挖掘的目標通信用戶滿意度是衡量通信服務水平的重要指標,也是目前世界上許多國家和地區(qū)測評通信服務質量的通用做法。通信運營商期望通過用戶滿意度研究了解不同品牌客戶和集團客戶對該公司的整體服務工作的滿意度評價,以及不同品牌客戶對本公司各商業(yè)流程環(huán)節(jié)上的服務感受及滿意度水平,并了解不同品牌客戶對本公司的忠誠度。同時判斷當前業(yè)務、服務工作2024/7/732第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))中存在的主要問題。重點圍繞各個商業(yè)過程,有針對性地發(fā)現問題,從而改善服務。通過滿意度指數,比較各地市分公司的服務工作差異,以便為省公司的考核提供依據。進行與競爭對手CSI(CustomerSatisfactionIndex,顧客滿意指數)測評的比較分析,確定通信運營商在客戶服務工作中有待改善的地方,并以績優(yōu)區(qū)域為標桿,不斷提高和推動該通信運營商的用戶滿意度。預測今后的業(yè)務、服務競爭趨勢,制定應對競爭的一系列策略和方案。2024/7/733第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))3、通信用戶滿意度指數測評數據挖掘的構建模型各方面滿意度的而研究,例如,不同品牌客戶和集團客戶對整體服務工作的滿意度、不同品牌客戶對各商業(yè)流程環(huán)節(jié)上的滿意度等,都是基于圖4.1所示的滿意度框架模型,只是在不同的滿意度分析時具體的觀測指標有些變動,例如,不同品牌相應的商業(yè)過程的指標。2024/7/734第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))網絡質量漫游增值服務計數營業(yè)廳熱線產品及服務信息宣傳積分計劃投訴商業(yè)過程理性驅動感性驅動滿意度忠誠度度轉網推薦可能性購買更多可能性繼續(xù)使用可能性品牌形象情感要素客戶感覺服務質量客戶感覺價值整體費用圖4.1通信運營商滿意度模型框架示例2024/7/735第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

4、通信用戶滿意度指數評測數據挖掘的而結果分析

某第三方機構對通信用戶進行了用戶滿意指數抽樣測評。本次測評的對象涵蓋全國各地4億多各類通信用戶,采用概率抽樣方式在用戶中選取被訪樣本,并對被選中的用戶進行問卷調查。在全國范圍內共計訪問了7萬多個通信用戶,通過電話調查最終完成有效樣本5076個,獲得10多萬條用戶評價信息,處理數據幾百萬個。樣本采集按照3階段PPS概率抽樣,每項業(yè)務抽取720個樣本,保證了樣本數量的廣泛性和代表性。2024/7/736第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

表4.3列舉了參加測評的7個對象客戶總體滿意度指數。表4.37個評測對象的客戶總體滿意度指數評測對象客戶滿意度通信業(yè)務1通信業(yè)務2通信業(yè)務3通信業(yè)務4通信業(yè)務5通信業(yè)務6通信業(yè)務7客戶總體滿意度指數75.176.580.179.871.26968.32024/7/737第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))由上表數據可知,在參與評測的7個對象中,通信業(yè)務1、通信業(yè)務2、通信業(yè)務3、通信業(yè)務4、通信業(yè)務5的客戶總體滿意度處于高水平,并比較接近,各運營商的服務水平比較穩(wěn)定。其中,通信業(yè)務3和通信業(yè)務4的客戶總體滿意度指數明顯高于通信業(yè)務6和通信業(yè)務7,高出近12個百分點。2024/7/738第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))與美國、歐洲等過的通信服務滿意度指數測評數據相比,我國固定、移動電話用戶滿意度指數的數據具有可比性。固定電話和移動電話的用戶滿意度指數與歐美相比處于較高水平。調查顯示,用戶對固定電話業(yè)務的資費透明度和計費準確性較為關注,對移動電話的通話質量和價格水平有改進要求,對ISP業(yè)務的質量改進要求集中于兩點:一是提高接通率,二是提高網速。2024/7/739第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

我國通信業(yè)務多年持續(xù)高速增長,新的網絡和新的業(yè)務層出不窮,電話用戶數量逐年猛增。在這樣一個快速增長期,通信服務質量始終是大眾關注的熱點,也是政府主管部門監(jiān)管的重點。雖然目前整體服務質量已有明顯提高,用戶滿意度逐年上升,通信主管部門和各通信運營商的努力取得了一定成效,如在用戶數激增的情況下,2002年中消協(xié)全國受理的通信方面用戶投訴量反而比2001年下降了1/3,但客觀地講,通信服務質量還是不足,用戶抱怨還會存在,通信消費過程中的焦點、熱點問題還會不斷出現。通信行業(yè)將會利用各種方式切實改進服務,竭力為公眾提供更加滿意的通信業(yè)務。2024/7/740第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))5、通信用戶滿意度指數評測改進策略圍繞網絡服務、服務廳服務、熱線服務、繳費充值服務、夢網服務、優(yōu)惠活動、網站服務滿意度這些主要商業(yè)過程提出了滿意度的具體改進策略,如對于網絡服務的滿意度和具體改進策略,下面以通信業(yè)務1和通信業(yè)務2兩項業(yè)務為例加以說明。通信業(yè)務1客戶滿意度:√客戶滿意度較高的是網絡質量與繳費方便程度;√客戶對夢網服務的滿意度比較低;√除夢網外,客戶對熱線方面滿意度也比較低。2024/7/741第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))通信業(yè)務2客戶滿意度:√客戶滿意度較高的是整體網絡質量與繳費方便程度;√客戶對夢網服務的滿意度比較低;√客戶對特色服務的滿意度為中等。2024/7/742第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))根據研究提出了有建設性和可執(zhí)行的滿意度改進和提升客戶忠誠度的改進計劃。通信業(yè)務1和通信業(yè)務2的戰(zhàn)略改進方向就是繼續(xù)保持總體優(yōu)勢,改進弱項指標。1)網絡方面客戶滿意度較高,其中最高的是通信業(yè)務3,通信業(yè)務7相對偏低。2)網絡服務總體滿意度具有明顯優(yōu)勢,在通話質量方面明顯高于通信業(yè)務6和通信業(yè)務7。2024/7/743第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))3)總體上,絕大部分場合的網絡信號都處于中高水平,但山區(qū)信號的滿意度較低;對于不同場合撥打電話無法接通率,總體上室內的無法接通率最高,其中通信業(yè)務2的室內無法接通率較高,超過50%;通信業(yè)務3、通信業(yè)務4和通信業(yè)務5的無法接通率相對較低,通信業(yè)務6的無法接通率大于通信業(yè)務7.2024/7/744第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

4)對于網內/網間通話無法接通率方面,自身品牌客戶撥打通信業(yè)務6和通信業(yè)務7品牌的客戶手機時無法接通率較高,通信業(yè)務2尤其高;而通信業(yè)務6和通信業(yè)務7客戶撥打市話或該運營商時無法接通率較高。

5)對于掉話率,通信業(yè)務1和通信業(yè)務2的掉話率高于通信業(yè)務3、通信業(yè)務4(相對更高)和通信業(yè)務5,室內的掉話率高于室外,室內掉話率較高的有通信業(yè)務2(51%),通信業(yè)務6和通信業(yè)務7的掉話率也達40%以上。2024/7/745第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

6)對于短信故障率方面,短信發(fā)送不成功發(fā)生率較高,通信業(yè)務5與通信業(yè)務1最為明顯;其次是短信發(fā)送成功但對方長時間才收到,通信業(yè)務5在短信故障率方面發(fā)生率最高;各品牌客戶對網絡質量不滿意的地方主要是信號差,其次是網絡覆蓋不廣。7)通信業(yè)務2不滿意的地方還表現在通話不穩(wěn)定/易斷線,通信業(yè)務1則是難接通/接通率低,通信業(yè)務5則是信息接收不好、慢;通信業(yè)務6和通信業(yè)務7在各方面的不滿意的比例更高。2024/7/746第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

6、通信用戶滿意度指數評測數據挖掘的忠誠度分析(1)忠誠度水平與性質1)品牌忠誠度。各項業(yè)務忠誠度都較高,各業(yè)務中忠誠度最高的是通信業(yè)務2的客戶,最低的是通信業(yè)務5的客戶??傮w來說,通信業(yè)務1、通信業(yè)務2、通信業(yè)務3、通信業(yè)務4和通信業(yè)務5客戶的忠誠度高于通信業(yè)務6和通信月7。2)忠誠度細分。根據忠誠度和滿意度的不同,將客戶共分為四大類型:安全羊(高滿意度高忠誠度)、勸服者(高滿意度低忠誠度)、異動者(低滿意度高忠誠度)、流動者(低滿意度低忠誠度)。2024/7/747第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

(2)結論分析通信業(yè)務1、通信業(yè)務2、通信業(yè)務3、通信業(yè)務4和通信業(yè)務5的安全羊比例明顯高于通信業(yè)務6和通信業(yè)務7,通信業(yè)務5客戶的流動者與異動者比較高。以連續(xù)兩年的數據對比,通信業(yè)務3、通信業(yè)務4和通信業(yè)務5的客戶的異動者(無奈的忠誠)比例有明顯增加,一旦市場出現新的運營商或網絡品牌,這部分不穩(wěn)定客戶將釋放較大的離網風險。將不同忠誠度的4種客戶進行分析發(fā)現:2024/7/748第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))1)各品牌安全羊的滿意度都達85分以上,滿意度較高的是通信業(yè)務3和通信業(yè)務4;2)各品牌勸服者的滿意度都達84分以上;3)各品牌異動者與流動者的滿意度都低于60分;大客戶的流動者滿意度更低。

不同忠誠度類型客戶的滿意度如表4.4所示。2024/7/749第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))表4.4不同忠誠度類型客戶的滿意度指數客戶類型滿意度指數業(yè)務類型安全羊勸服者異動者流動者通信業(yè)務186.784.757.654.6通信業(yè)務287.486.157.950.3通信業(yè)務388.485.5558.357.1通信業(yè)務488.784.458.555.6通信業(yè)務585.184.357.554.52024/7/750第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

7、通信用戶滿意度指數評測數據挖掘的離網風險

通信業(yè)務1、通信業(yè)務2客戶的主要流動方向是通信業(yè)務6和通信業(yè)務7;通信業(yè)務3、通信業(yè)務4和通信業(yè)務5客戶的主要流動方向為內部相互流動;通信業(yè)務6和通信業(yè)務7客戶的主要流動方向是通信業(yè)務1和通信業(yè)務4。通信業(yè)務2轉向通信業(yè)務6和通信業(yè)務7的比例較高;通信業(yè)務1轉向通信業(yè)務6與通信業(yè)務4的比例較高;通信業(yè)務5轉向通信業(yè)務4的比例較高;通信業(yè)務4主要轉向通信業(yè)務1、通信業(yè)務2、通信業(yè)務3和通信業(yè)務5;通信業(yè)務3轉向通信業(yè)務4的比例較高。2024/7/751第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

8、通信用戶滿意度指數評測數據挖掘的提升策略基于以上的忠誠度分析結果,研究中對各個品牌分別針對不同的忠誠度類型的客戶提出了具體的服務改進策略,以提高忠誠度。下面以通信業(yè)務1為例說明??蛻纛愋吞嵘呗园踩騽穹弋悇诱吡鲃诱呖蛻艨傮w滿意度86.784.757.654.6需改進指標1、門網服務1、熱線人工接通速度2、夢網服務1、熱線服務總體:熱線人工接通速度2、夢網服務1、服務廳服務:服務廳人員服務2、熱線服務總體:熱線人工接通速度3、夢網服務2024/7/752第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

滿意度是人們心目中對通信服務性價比的一個度量和判定,受到人們思想認識水平、教育程度、人生閱歷,以及道德觀、人生觀和價值觀等多種因素的影響。滿意與否是一個動態(tài)、相對的概念,沒有絕對的滿意和不滿意,也沒有永遠的滿意和不滿意。客觀地看,目前的通信服務水平與服務能力已經有了顯著提高,相比過去用戶也獲得了更多價值、享受了更好的服務,但用戶的感知還受到其他因素的影響,滿意度的波動與用戶抱怨仍存在,這恰恰說明服務的供需關系處于較為平衡的狀態(tài),市場還可以繼續(xù)穩(wěn)定發(fā)展。2024/7/753第四章數據挖掘應用案例4.2案例二:通信用戶滿意指數評測(續(xù))

對于行業(yè)監(jiān)管者,服務質量可以通過滿意度來測量,但絕不僅僅依靠一個指標來對市場做出判斷。一個成熟的市場和擁有超過13億用戶的行業(yè),用戶滿意度必定會在一個合理區(qū)間內平衡波動。監(jiān)管者可以通過滿意度這個窗口,向公眾展示行業(yè)發(fā)展成果,樹立良好的社會形象;科學分析滿意度波動趨勢,充分分析用戶抱怨信息來彌補市場不足,幫助企業(yè)查找服務問題;同時合理運用滿意度指標來調動企業(yè)能動性、調節(jié)市場秩序,這才是滿意度調查分析應當發(fā)揮的真正作用,也是管理者智慧的最終體現。2024/7/754第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價1、城市環(huán)境質量評價數據挖掘的背景介紹環(huán)境質量是指環(huán)境的總體或環(huán)境某些要素對人群的生存和繁衍以及社會經濟發(fā)展的適宜程度,是反映人類的具體要求而形成的對環(huán)境評定的一種概念,包括環(huán)境綜合質量和各種環(huán)境要素質量。環(huán)境質量評價是我國實施的重要的環(huán)境管理手段之一。環(huán)境質量評價是根據環(huán)境(包括污染源)調查與監(jiān)測資料,應用各種評價方法對一個地區(qū)的環(huán)境質量做出評定與估價2024/7/755第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))然后按照一定的目的在對一個區(qū)域的各種要素評價的基礎上,對環(huán)境質量進行總體的定性與定量的評定。環(huán)境質量評價是理論與實踐相結合的實用性強的學科,是人們認識環(huán)境的本質和進一步保護與改善環(huán)境質量的手段與工具。2024/7/756第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))環(huán)境質量評價的根本目的就是為各級政府和相關部門制定經濟發(fā)展計劃,制定能源政策,確定大型工程項目及為區(qū)域規(guī)劃提供環(huán)境保護的依據,并為各級環(huán)境部門制定環(huán)境規(guī)則,貫徹以管促治方針,實現全面、科學的環(huán)境管理服務。因此,環(huán)境質量評價是幫助協(xié)調經濟發(fā)展和保護環(huán)境的一項有效措施,也是強化環(huán)境管理的而有效手段,它為環(huán)境管理、關鍵工程、環(huán)境標志制定、環(huán)境規(guī)劃、環(huán)境污染綜合防治、生態(tài)環(huán)境建設等提供科學依據。2024/7/757第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))

城市環(huán)境質量評價數據挖掘的建設目標:1)選擇合適的城市環(huán)境質量評價指標;2)選擇合適的模型算法對城市環(huán)境質量進行評價。2、城市環(huán)境質量評價數據挖掘的分析方法城市環(huán)境質量評價包括對城市環(huán)境質量進行單要素和總體的綜合評價。評價的環(huán)境單要素可以包括若干個關鍵污染因子。對單要素環(huán)境質量評價常采用多因子綜合評價指數進行不同等級的污染狀況評價,即對某區(qū)域的環(huán)境質量如水質、大氣質量等的綜合評價一般涉及較多的評價因素,且各因素與區(qū)域環(huán)境整體質量關系復雜,因而采用單項污染指數評價法無法客觀準確地反映各污染因子之間相互作用對環(huán)境質量的影響。2024/7/758第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))基于上述因素,要客觀評價一個區(qū)域的而環(huán)境質量狀況,需要考慮各種因素之間以及影響因素與環(huán)境質量之間錯綜復雜的關系,采用傳統(tǒng)方法存在一定的局限性和不合理性。因此,從學術研究的角度對環(huán)境評價的技術方法及其理論進行探討,尋求更能全面、客觀、準確反應環(huán)境質量的新的理論方法具有重要的現實意義。2024/7/759第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))

3、城市環(huán)境質量評價數據挖掘的分析內容

我國環(huán)境質量評價工作發(fā)展至今,在評價指標體系及評價理論探索等方面均有較大進展。城市環(huán)境綜合評價無固定的模式與程序,因評價區(qū)域的特點及所關心的主要問題不同而有所差異。下面利用數據挖掘方法對城市空氣質量進行評價。根據空氣中SO2、NO、NO2、NOx、PM10和PM2.5值的含量,建立C4.5決策樹分類預測模型,實現對空氣質量的評價。其實質是:運用C4.5算法進行數據挖掘,獲得分類規(guī)律,即空氣污染與空氣等級之間的關系;推導出分類規(guī)則,即空氣質量智能評價模型。2024/7/760第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))分4個步驟實現流程:數據預處理、生成決策樹、分類規(guī)則生成及化簡、模型準確性評價。如圖4.2所示。數據預處理生成決策樹分類規(guī)則生成及化簡模型準確性評價圖4.2城市環(huán)境質量評價建模流程圖2024/7/761第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))對于采集到的空氣污染物的數據(SO2、NO、NO2、NOx、PM10和PM2.5值的含量),首先根據我國城市空氣質量分級標準,分為優(yōu)(Ⅰ)、良(Ⅱ)、輕微污染(Ⅲ)、輕度污染(Ⅳ)、中度污染(Ⅴ)、中度重污染(Ⅵ)、重污染(Ⅶ)七個等級。這樣,經過預處理的數據包括1個類別項(空氣等級)和6個影響分類的屬性項(空氣污染物)。2024/7/762第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))4、城市環(huán)境質量評價數據挖掘的模型構建城市環(huán)境質量評價的數據挖掘采用C4.5決策樹構建模型。模型的輸入包括兩部分,一部分是建模專家樣本數據(包括訓練樣本和驗證樣本)的輸入,另一部分是建模參數的輸入。部分原始樣本數據經過預處理后如表4.6所示。隨機抽取與處理數據(共320個數據)中2/3的數據,即240個數據樣本,作為訓練集構造決策樹并生成決策規(guī)則。2024/7/763第四章數據挖掘應用案例4.3案例三:城市環(huán)境質量評價(續(xù))SO2NONO2NOxPM10PM2.5空氣等級0.03400.0480.0470.0850.058Ⅰ0.02500.0530.0530.070.048Ⅱ0.01300.0290.0660.0570.04Ⅰ0.02600.0260.0260.0490.034Ⅰ0.01800.0270.0270.05

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論