商務(wù)數(shù)據(jù)分析課件:分類模型應(yīng)用_第1頁(yè)
商務(wù)數(shù)據(jù)分析課件:分類模型應(yīng)用_第2頁(yè)
商務(wù)數(shù)據(jù)分析課件:分類模型應(yīng)用_第3頁(yè)
商務(wù)數(shù)據(jù)分析課件:分類模型應(yīng)用_第4頁(yè)
商務(wù)數(shù)據(jù)分析課件:分類模型應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分類模型應(yīng)用第一節(jié)客戶細(xì)分1.問(wèn)題描述客戶成為保險(xiǎn)公司的重要資產(chǎn),開(kāi)發(fā)一個(gè)新客戶比維護(hù)舊客戶的成本要高得多。因此,保險(xiǎn)公司需要對(duì)客戶的信息進(jìn)行統(tǒng)計(jì)挖掘分析,來(lái)更深入的認(rèn)識(shí)和評(píng)判客戶。通過(guò)對(duì)客戶的分析實(shí)現(xiàn)公司和客戶之間的雙贏??蛻艏?xì)分指的是根據(jù)客戶的特征信息將客戶劃分成不同的群體,從而公司可以對(duì)不同類別的客戶做出不同的決策來(lái)促進(jìn)購(gòu)買和提高忠誠(chéng)度。本案例在客戶價(jià)值理論的基礎(chǔ)上,首先利用客戶的基本特征(性別、出生日期、地區(qū)等)、車輛特征(使用年限、座位數(shù)、行駛區(qū)域、行駛里程等)、客戶行為特征和保險(xiǎn)信息特征通過(guò)聚類將客戶分為四個(gè)類別,再利用分類模型來(lái)驗(yàn)證客戶細(xì)分模型,分析客戶個(gè)人信息和車輛信息等因素對(duì)分類結(jié)果的影響程度。2.數(shù)據(jù)理解(1)數(shù)據(jù)來(lái)源本案例數(shù)據(jù)來(lái)自一家車輛保險(xiǎn)公司,數(shù)據(jù)主要是客戶購(gòu)買車險(xiǎn)的相關(guān)記錄。(2)數(shù)據(jù)描述本案例從企業(yè)數(shù)據(jù)庫(kù)中提取了以下屬性,用于數(shù)據(jù)挖掘分析:(I)客戶人口統(tǒng)計(jì)特征:客戶編碼,客戶中文名稱,性別,出生日期,地區(qū),健康狀況,客戶類型。(II)客戶車輛特征:保單號(hào)碼,行駛區(qū)域,行駛里程,使用年限,車型代碼,廠牌型號(hào)名稱,國(guó)別性質(zhì),使用性質(zhì)代碼,座位數(shù),噸位數(shù)、排量,車身顏色代碼,固定停放地點(diǎn),新車重置價(jià)格,實(shí)際價(jià)值,是否二手車,二手車交易價(jià)格。(III)客戶行為特征:保單號(hào)碼,險(xiǎn)類代碼,險(xiǎn)種代碼,投保單號(hào)碼,投保人代碼,投保人名稱,被保險(xiǎn)人名稱,總保險(xiǎn)金額,總保險(xiǎn)費(fèi),理賠次數(shù)。(IV)保險(xiǎn)信息特征:保單號(hào)碼,險(xiǎn)種代碼,序號(hào),險(xiǎn)別代碼,險(xiǎn)別名稱,標(biāo)的序號(hào),標(biāo)的項(xiàng)目類別代碼,標(biāo)的項(xiàng)目明細(xì)名稱,起保日期,終保日期。3.數(shù)據(jù)預(yù)處理(1)數(shù)據(jù)集成將分屬于不同數(shù)據(jù)表中的數(shù)據(jù)進(jìn)行集成,依據(jù)各類編碼,將所需要的信息匯總到一個(gè)表上。(2)數(shù)據(jù)清洗對(duì)集成后的數(shù)據(jù)進(jìn)行數(shù)據(jù)缺失值、異常值的處理。具體操作如下:(I)刪除嚴(yán)重缺失信息的特征;(II)刪除嚴(yán)重缺失的記錄;(III)刪除存在異常值屬性的記錄;(IV)填充空白未知類屬性。3.數(shù)據(jù)預(yù)處理(3)數(shù)據(jù)轉(zhuǎn)換、離散和標(biāo)準(zhǔn)化處理結(jié)合樣本集的特點(diǎn),采用以下方式對(duì)數(shù)據(jù)進(jìn)行處理。(I)數(shù)據(jù)轉(zhuǎn)換屬性理賠次數(shù)轉(zhuǎn)換為理賠得分,理賠得分越高,理賠次數(shù)越少,客戶的潛在價(jià)值越高。添加新的屬性(折舊率),將屬性實(shí)際價(jià)值刪除,用新車購(gòu)置價(jià)格和折舊率兩個(gè)屬性來(lái)表示車輛的價(jià)值。(II)離散化屬性如車輛使用年限、座位數(shù)和排量有現(xiàn)實(shí)含義,可以根據(jù)車輛管理部門的規(guī)定對(duì)連續(xù)型數(shù)據(jù)進(jìn)行劃分。屬性如年齡、使用年限,可以通過(guò)等寬或等頻方式實(shí)現(xiàn)離散化。

(III)標(biāo)準(zhǔn)化利用標(biāo)準(zhǔn)化操作,將保險(xiǎn)費(fèi)映射到[0,9]區(qū)間上。4.模型建立案例選取了客戶的總保險(xiǎn)費(fèi)和理賠得分兩個(gè)變量代表客戶的當(dāng)前價(jià)值和潛在價(jià)值,以此聚類得到客戶的分類特征。總保險(xiǎn)費(fèi)是代表了客戶提供給保險(xiǎn)公司的營(yíng)業(yè)收入,繳納的保險(xiǎn)費(fèi)越多,保險(xiǎn)公司的收入越高,因此保險(xiǎn)費(fèi)高的客戶具有較高的當(dāng)前價(jià)值。理賠得分越高代表理賠次數(shù)越低,則表明可以繼續(xù)發(fā)展該客戶,即該客戶的潛在價(jià)值越高。因此本案例先利用理賠得分和總保險(xiǎn)費(fèi)兩個(gè)屬性用來(lái)聚類,將客戶分為客戶價(jià)值理論中的四種類別,再建立分類模型通過(guò)客戶和車輛的基本信息來(lái)判斷客戶的類別。4.模型建立(1)聚類模型基于選擇KMeans方法將客戶聚類為4種。四類客戶具備如下特點(diǎn):I類客戶當(dāng)前價(jià)值和增值潛力都很低;II類客戶價(jià)值不高,但具有很大的增值潛力;III類客戶具有很高的當(dāng)前價(jià)值和低的增值潛力;IV類客戶既有很高的當(dāng)前價(jià)值也有很大的增值潛力。聚類結(jié)果表明:II類用戶的數(shù)量是最多的,說(shuō)明當(dāng)前的保險(xiǎn)公司的用戶出險(xiǎn)的概率的較小,同時(shí)保險(xiǎn)的費(fèi)用也比較少,即目前該保險(xiǎn)公司的客戶更多是比較小心謹(jǐn)慎、少出險(xiǎn)的客戶。4.模型建立(2)分類模型案例以K-means聚類的結(jié)果作為客戶分類結(jié)果,進(jìn)一步研究影響分類的因素。實(shí)驗(yàn)使用神經(jīng)網(wǎng)絡(luò)作為主要分類方法,并用邏輯回歸、決策樹(shù)和支持向量機(jī)作為參照。由于數(shù)據(jù)是不平衡數(shù)據(jù),因此還采用一些算法對(duì)不平衡數(shù)據(jù)進(jìn)行處理,具體采用了代價(jià)敏感函數(shù)、過(guò)采樣、欠采樣、Bagging集成和Boosting集成五種方法。5.模型評(píng)價(jià)案例通過(guò)精確度(Accuracy)、F值(F-value)、召回率(Recall)、準(zhǔn)確率(Precision)和AUC來(lái)評(píng)估模型性能。從分類的整體準(zhǔn)確度來(lái)看,神經(jīng)網(wǎng)絡(luò)的分類準(zhǔn)確率達(dá)到70%以上,并且優(yōu)于其他算法;使用了不平衡數(shù)據(jù)的處理后,代價(jià)敏感函數(shù)和集成方法取得了較好的提升,而過(guò)采樣和欠采樣的處理對(duì)分類結(jié)果并無(wú)正面影響。6.案例小結(jié)本案例將某保險(xiǎn)公司的客戶按照客戶價(jià)值理論進(jìn)行細(xì)分,選擇客戶的總保險(xiǎn)費(fèi)和理賠得分兩個(gè)變量分別代表客戶的當(dāng)前價(jià)值和潛在價(jià)值,以此聚類得到客戶的分類特征,最后利用分類算法構(gòu)建新客戶的分類模型。由實(shí)驗(yàn)過(guò)程及結(jié)果對(duì)比分析可以得出以下結(jié)論:首先,保險(xiǎn)客戶根據(jù)保費(fèi)和理賠次數(shù)可以明顯地分為四類,符合客戶價(jià)值矩陣?yán)碚?,最有價(jià)值一類客戶,即保費(fèi)高、理賠少的客戶只占到所有客戶的1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論