版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
本文格式為Word版,下載可任意編輯——粗糙集屬性約簡在客戶流失預測中的應用
李惟肖
客戶流失預計作為客戶關系管理的主要問題,一直受到研究學者們的關注。企業(yè)通過內部和外部的數(shù)據(jù)信息,對客戶流失狀況進行預計,針對還未流失但有流失傾向的客戶采取相應的營銷策略。大數(shù)據(jù)時代使得數(shù)據(jù)信息爆炸式增多,如何處理高維數(shù)據(jù)信息成為客戶流失預計的難點。利用粗糙集理論進行屬性約簡可以降低數(shù)據(jù)維度,并有效地實現(xiàn)客戶特征選擇,從而降低客戶流失預計的運算難度,提高預計性能。
Customerchurnprediction,asthemainproblemofcustomerrelationshipmanagement,hasalwaysbeenthefocusofresearchers.Basedoninternalandexternaldatainformation,enterprisescanforecastcustomerturnoverandadoptcorrespondingmarketingstrategiesforcustomerswhohavenotyetlostbuthaveatendencytolose.Theeraofbigdatamakesdatainformationincreaseexplodes,andhowtodealwithhigh-dimensionaldatainformationbecomesthedifficultyofcustomerchurnprediction.Theattributereductionusingroughsettheorycanreducethedatadimensionandeffectivelyrealizethecustomerfeatureselection,soastoreducetheoperationaldifficultyofcustomerchurnpredictionandimprovethepredictionperformance.
粗糙集;客戶流失預計;屬性約簡;特征選擇
roughset;customerchurnprediction;attributereduction;featureselection
F274;TP18
A
1673-1069(2021)07-0120-02
1引言
客戶關系管理理論是20世紀90年代由營銷管理理論衍生出的理論分支,一直備受從業(yè)者和學者的廣泛關注。客戶關系管理就是圍繞客戶,一個客戶為中心進行的營銷過程,這一過程通過客戶獲得管理、客戶識別管理、客戶保持管理3個階段來實現(xiàn)客戶與企業(yè)之間長期的合作關系。這樣不僅有助于降低企業(yè)的交易成本和開發(fā)成本,也能提高營銷效率,加強營銷效果。
客戶流失管理是客戶關系管理的重要組成部分,客戶流失一般來說就是指客戶不再消費本企業(yè)的產(chǎn)品或服務,也是每個企業(yè)都會面臨的問題??蛻袅魇且粋€不確定事件,客戶流失的形成非一朝一夕,但是往往又悄無聲息、無法覺察。因此,只能通過數(shù)據(jù)分析把握這種不確定的流失規(guī)律,從而防范因客戶流失產(chǎn)生的經(jīng)營風險和收益損失。近年來,有大量因素都促成了客戶流失預計的快速發(fā)展,大數(shù)據(jù)、人工智能、云計算等互聯(lián)網(wǎng)技術和信息技術不斷發(fā)展,使得企業(yè)可以通過收集客戶信息,再運用大數(shù)據(jù)計算、機器學習、數(shù)據(jù)挖掘等技術手段處理數(shù)據(jù),建立客戶流失預計模型。通過模型可以提取客戶的特征信息,分析預示客戶流失的行為,計算客戶在未來流失的概率。但同時,數(shù)據(jù)增多也造成了數(shù)據(jù)“維度災難〞,分析高維數(shù)據(jù)需要花費大量的時間和成本。因此,需要在高維的數(shù)據(jù)中提取出與客戶流失相關的客戶特征,并對這些特征進行屬性約簡,兼顧預計精度和預計效率。
2粗糙集理論
粗糙集理論是1982年由波蘭Pawlak教授提出的,用來處理模糊、不確定、不完整信息和知識的工具,它能在保持辨別能力不變的狀況下,通過知識約簡,實現(xiàn)決策或分類。與其他方法相比,粗糙集方法僅利用數(shù)據(jù)本身所提供的信息發(fā)現(xiàn)問題的規(guī)律。粗糙集理論可以與神經(jīng)網(wǎng)絡、遺傳算法等機器學習技術相結合,實現(xiàn)更廣泛、更強大、更優(yōu)良的功能,在知識獲取、智能算法、知識的不確定性度量、數(shù)據(jù)挖掘等方面都有成熟的應用。
定義1:粗糙集理論的知識表達系統(tǒng)表示為S=(U,A,V,F(xiàn)),其中:U={u1,u2,…,u|U|}是研究對象的非空有限集合,稱為論域;A={a1,a2,…,a|U|}是屬性的非空集合;V=UVa,其中a∈A,Va是屬性a的值域;f:U×A→V是一個信息函數(shù),反映了每個研究對象每個屬性的信息,即?坌a∈A,x∈U,f(x,a)∈Va。知識表達系統(tǒng)也叫信息系統(tǒng),S=(U,A,V,f)可以簡化為S=(U,A)。
定義2:當集合A能被集合C和集合D表示,且滿足A=C∪D,C∩D=?覫那么稱集合C為條件屬性集,集合D為決策屬性集。
屬性子集C"?哿C關于D的重要性被定義為:σCD(C")=γC(D)-γC-C"(D)。
當C"={a}時,屬性a?哿C關于D的重要性被定義為:σCD(a)=γC(D)-γC-(a)(D)。
定義3:對于給定的信息系統(tǒng)S=(U,A,V,f),若R?哿ind(K),X?哿U,則X的R上近似集和X的R下近似集被定義為:
3粗糙集屬性約簡
粗糙集屬性約簡是粗糙集理論的一個核心內容。大數(shù)據(jù)時代,數(shù)據(jù)信息量的增大讓學者們能更確切真實地進行知識發(fā)現(xiàn),但高維的數(shù)據(jù)也讓整個研究過程變得繁雜和煩瑣。在信息系統(tǒng)中,并不是所有的信息都對人們作出決策或進行預計有幫助,這其中包含了大量對目標問題毫無貢獻的冗余屬性。因此,在保證信息系統(tǒng)分類不變的狀況下,從眾多數(shù)據(jù)信息中去除冗余屬性,不僅可以保持結果的確切性,還能降低運算的難度和減少運算的時間。這就是粗糙集屬性約簡的過程。
給定一個信息系統(tǒng)S=(U,A,V,f),集合C為系統(tǒng)的條件屬性集,集合D為系統(tǒng)的決策屬性集。當A滿足以下2個條件時,稱A是條件屬性C關于決策屬性D的一個相對屬性約簡:
①posA(D)=posC(D)。
②對于A的任何一個真子集B,posB(D)=posC(D)。
條件①保證了原有的相對正域不變,條件②說明白A這個相對屬性約簡中的屬性不可再減少。設條件屬性集C={ci|i=1,2,…,n},那么對于屬性ci來說,假如滿足posC=posC-{C},則說明屬性ci對于決策是不重要的,可以刪除。條件屬性集C中的每一個屬性都需要經(jīng)過這一判斷的過程,從而形成相對屬性約簡集合A。
4基于粗糙集屬性約簡的客戶流失預計
客戶流失預計包含2個方面:一個是識別流失客戶;另一個就是客戶價值評估。識別流失客戶就是識別潛在的流失客戶,在客戶流失之前采取行動挽留客戶,這可以看作是一種“防衛(wèi)性〞的營銷方法。由于吸引新用戶的成本比挽留老用戶的成本要高3~8倍,但是老客戶的利潤貢獻是新客戶的10倍以上??蛻魞r值評估是客戶流失預計的另一關鍵任務,不是所有的客戶都會給企業(yè)帶來利益。實際上,根據(jù)80/20法則,大多數(shù)狀況下,20%的關鍵客戶為企業(yè)創(chuàng)造了80%的收入。那么這種狀況下,企業(yè)就需要識別客戶并對客戶價值進行評估,形成具有相像特征的多個客戶群體,向不同的客戶群體分派不同的資源,這樣才能以更少的成本支出獲得更多的經(jīng)濟收益。進行客戶流失預計的主要目的是希望根據(jù)預計結果有針對性地進行營銷挽留,假如只有確切的預計而沒有特性化的營銷方案是不夠的,所以識別流失客戶和客戶價值評估對于客戶流失預計來說同等重要。粗糙集屬性約簡在客戶流失預計中的應用也主要在這2個方面。
粗糙集屬性約簡在識別流失客戶中的應用主要表達在特征選擇。在海量的數(shù)據(jù)中選擇最有效的特征以降低數(shù)據(jù)維度,從而提高預計的性能。粗糙集屬性約簡常與機器學習方法結合進行客戶流失預計,但高維數(shù)據(jù)會使機器學習的算法大幅增加。而且粗糙集特別適用于處理不確定性的問題,能夠處理不完整、不確定的數(shù)據(jù)。粗糙集理論是在保證不丟失原始信息的狀況下,對數(shù)據(jù)屬性進行約簡,約簡過后的屬性特征是剔除了冗余特征后具有代表性的屬性特征,由于這些屬性特征包含了全部的信息,所以預計的結果還是有很高的可信度,卻可以大大降低機器學習的運算時間和運算量。
粗糙集屬性約簡在客戶價值評估中的應用主要表達在客戶畫像。通過粗糙集進行特征選擇后,每個客戶在這些特征中的表現(xiàn)不一樣,因此可以得到全方位的客戶畫像。對于企業(yè)來說,看重客戶選擇自己的產(chǎn)品或服務時能給自己帶來多少收益,這也就是企業(yè)眼中的客戶價值,企業(yè)尋常根據(jù)客戶畫像來評價和分析客戶價值。對于有流失傾向的客戶,需要通過客戶畫像才能制定出特性化的、準確化的、有針對性的客戶挽留營銷方法。有高流失風險同時又有高價值的客戶,企業(yè)可以花費更多的成本進行挽留。同時客戶畫像也反映了客戶需求、客戶偏好、客戶行為等信息,針對這些信息可以提前準備營銷策略和產(chǎn)品配置,從而預防客戶流失,盡可能地延長客
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文書模板-《衣帽回收委托協(xié)議書》
- 2024年土地征用委托代理協(xié)議范例
- 2024年高效清洗設備銷售協(xié)議
- 2024工程協(xié)議管理實務精要
- 北京2024二手轎車買賣正式協(xié)議
- 2024年三方租賃場地協(xié)議范例
- DB11∕T 1655-2019 危險化學品企業(yè)裝置設施拆除安全管理規(guī)范
- 2024年BF場地出租協(xié)議模板
- 2024年跨國貿易代表協(xié)議基本格式
- 2024年分公司加盟協(xié)議模板
- GB/T 2885.6-2008礦用窄軌車輛第6部分:材料車
- GB/T 1393-1987舷梯翻梯裝置
- 橈骨遠端骨折中醫(yī)治療培訓課件
- 例說議題式課堂教學的模式課件
- 25噸吊車參數(shù)表75734
- 外研版五年級上冊說課標說教材課件
- 八年級體育與健康學科:第二章 素質與鍛煉之柔韌練習教案-柔韌性練習1
- 遼寧省阜新市基層診所醫(yī)療機構衛(wèi)生院社區(qū)衛(wèi)生服務中心村衛(wèi)生室名單目錄信息
- 廣播操比賽打分表
- (完整)五金材料采購清單
- 2021年徐州市國盛控股集團有限公司校園招聘筆試試題及答案解析
評論
0/150
提交評論