版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、項目目標:運用邏輯回歸建立信用卡欺詐評分卡本次實驗的數(shù)據(jù)均來自于我行真實數(shù)據(jù),只是在本文的作業(yè)中不會出現(xiàn)實際客戶信息以及真實的變量內(nèi)容以及全部代碼,僅僅只是一次嘗試,僅供參考。一】數(shù)據(jù)樣本的確定本次嘗試選取了時間窗口12年11月到13年1月,13年5月到13年7月1000140筆樣本數(shù)據(jù)。并按照6:4的比例分成測試集和訓練集二】變量確定X變量:從申請表,第三方信息源等數(shù)據(jù)表中提煉出85個初始變量,包括原始變量,根據(jù)經(jīng)驗確定的中間變量。Y變量:在實際業(yè)務中被認定的壞客戶,其他的為好客戶,分別用1和0表示三】變量異常值剔除,缺失值填補數(shù)值變量:運用計算99分位數(shù),把大于2倍99分位數(shù)的數(shù)值置為99
2、分位數(shù),把缺失值總量超過20%以上的變量剔除分類變量:運用插值法,把缺失的變量填回去。四】變量篩選1、 首先進行單變量的邏輯回歸,刪除掉P值大于0.3的變量,2、 把數(shù)值變量進行分段操作,使得分出的段之間有較大差異,并且是單調的。3、 計算IV值,把IV值小于0.02的剔除,小于0.02的被認為是沒有預測能力的4、 運用聚類的方法,把分類變量進行聚類,以降低分類變量的緯度最后篩選出的變量如下表(實際意義不加以說明,表示的是一些客戶的屬性)最終10變量IVPBC_CC_CNT_OPEN_L6TH_B0.572
3、6102PBC_CC_OPENDATE_INT_B0.3712097SPREADER_HIRE_DATE_B0.3466377APP_LOANCARD_NUM_B0.2145266PBC_SAME_MOBILE0.2075589APP_CITY0.1969697PBC_CC_LOAN0.1809676APP_SAME_OTHERMOBILE0.1449625APP_EDUCATION_DEGREE_B0.0929062SAME_COMPANY0.0867273PBC_COMPADDR_TIME_B0.0649564PBC_SAME_COMMUADDR0.0584656五】邏輯回歸運用逐步回歸法
4、,計算各變量的參數(shù)估計Proc logistic data=lg.F_BS_NEW_IND_TRAIN descoutest=LG.param_est;model TARGET_VAR_NEW=PBC_CC_CNT_OPEN_L6TH_WOEPBC_CC_OPENDATE_INT_WOEPBC_COMPADDR_TIME_WOESPREADER_HIRE_DATE_WOEAPP_LOANCARD_NUM_WOEPBC_SAME_MOBILE_WOEAPP_CITY_WOEPBC_SAME_COMMUADDR_WOEPBC_CC_LOAN_WOEAPP_SAME_OTHERMOBILE_WOEA
5、PP_EDUCATION_DEGREE_WOE/ selection=stepwise slentry=0.05 slstay=0.05outroc=LG.ROC ctable pprob=(0 to 1 by 0.1) details lackfit stb;output out=LG.PRED p=phat;Run;proc sort data=LG.PRED;by descending phat;Run;輸出結果六】模型評價運用洛倫茨圖和ROC圖來看下模型的效果提升圖:每一段的實際壞客戶占比單調下降,說明模型的效果不錯,如果呈現(xiàn)的是非單調的,則說明模型不可用。洛倫茨圖在30%的水平下比隨
6、機提升35%左右,模型效果可以再看下ROC圖,誤判30%的好客戶可以區(qū)分出75%的壞客戶,C值在0.76,一般評分卡的C值大于0.75就可以運用此模型。七】輸出評分卡/*/
7、 /*/
8、0; /* Automatically Generated Scorecard */
9、;
10、 /*/
11、0; /* SAS CODE */
12、0; /* Scorecard Scale : */ &
13、#160;
14、160; /* Odds of 1 : 1/300 at 1000 Points
15、0; with PDO of 120 */&
16、#160;
17、160; /*/
18、 /*/
19、0; /* START OF
20、SCORING DATA STEP */
21、 /*/
22、; /*/
23、60; DATA LG.MODELING; /* Modify */
24、160;
25、60; SET LG.MODELING; /* Modify */ &
26、#160; /*/
27、; /*/
28、60; /*/ &
29、#160; /* Base P
30、oints */
31、 /*/
32、 Points=520 ; &
33、#160;
34、160; /*/
35、 /* Variable : APP_LOA
36、NCARD_NUM */
37、0; /*/
38、160; IF APP_LOANCARD_NUM LE (1) THEN Points=Points +(62);
39、;
40、 IF APP_LOANCARD_NUM GT (1) AND APP_LOANCARD_NUM LE (2) THEN Points=Points +(-47);
41、 IF APP_LOANCARD_NUM GT (2) THEN Points=Points +(-112); &
42、#160; /*/
43、 /* Variable : PBC_CC_CNT_OPEN_L6TH */
44、;
45、 /*/
46、0; IF PBC_CC_CNT_OPEN_L6TH LE (0) THEN Points=Points +(8);
47、0; IF PBC_CC_CNT_OPEN_L6TH GT (0) AND PBC_CC_CNT_OPEN_L6TH LE (1) THEN Points=Points +(-27);
48、60; IF PBC_CC_CNT_OPEN_L6TH GT (1) THEN Points=Points +(-32); &
49、#160; /*/
50、 &
51、#160; /* Variable : PBC_CC_OPENDATE_INT */
52、 /*/
53、; IF PBC_CC_OPENDATE_INT LE (0) THEN Points=Point
54、s +(38);
55、 IF PBC_CC_OPENDATE_INT GT (0) AND PBC_CC_OPENDATE_INT LE (24) THEN Points=Points +(-26);
56、; IF PBC_CC_OPENDATE_INT GT (24) AND PBC_CC_OPENDATE_INT LE (48) THEN Points=Points +(-32); IF P
57、BC_CC_OPENDATE_INT GT (48) THEN Points=Points +(-47);
58、160; /*/ &
59、#160; /* Variable : SPREADER_HIRE_DATE */ &
60、#160; /*/
61、 &
62、#160; IF SPREADER_HIRE_DATE LE (6) THEN Points=Points +(22);
63、160; IF SPREADER_HIRE_DATE GT (6) THEN Points=Points +(-18);
64、60; IF SPREADER_HIRE_DATE = ""
65、THEN Points=Points +(66);
66、0; /*/
67、160; /* Variable : APP_CITY */
68、 /*/
69、0;
70、; IF APP_CITY = "Y" THEN Points=Points +(47);
71、 IF APP_CITY = "N" THEN Points=Points +(-40); &
72、#160;
73、160; IF APP_CITY = "U" THEN Points=Points +(-45);
74、60; /*/ &
75、#160; /* Variable : APP_EDUCATION_DEGREE &
76、#160; */ &
77、#160; /*/
78、; IF APP_EDUCATION_DEGREE = "F" THEN Points=Points +(-43); &
79、#160; IF APP_EDUCATIO
80、N_DEGREE = "E" THEN Points=Points +(-8);
81、; IF APP_EDUCATION_DEGREE = "D" THEN Points=Points +(-8); &
82、#160; IF APP_EDUCATION_DEGREE = "A" THEN Points=Points +(21);
83、0; IF APP_EDUCA
84、TION_DEGREE = "B" THEN Points=Points +(21);
85、160; IF APP_EDUCATION_DEGREE = "C" THEN Points=Points +(21);
86、; IF APP_EDUCATION_DEGREE = "G" THEN Points=Points +(52); &
87、#160; /*/
88、
89、 /* Variable : APP_SAME_OTHERMOBILE */
90、; /*/
91、60; IF APP_SAME_OTHERMOBILE = "Y&quo
92、t; THEN Points=Points +(-124);
93、; IF APP_SAME_OTHERMOBILE = "N" THEN Points=Points +(4);
94、0; /*/
95、60; /* Variable : PBC_CC_LOAN */
96、0;
97、; /*/
98、60; IF PBC_CC_LOAN = "Y" THEN Points=Points +(25);
99、160;
100、60; IF PBC_CC_LOAN = "N" THEN Points=Points +(-46); &
101、#160; /*/
102、; /* Variable : PBC_SAME_MOBILE */
103、160;
104、60; /*/
105、160; IF PBC_SAME_MOBILE = "Y" THEN Points=Points +(130);
106、60; IF PBC_SAME_MOBILE = "N" THEN
107、; Points=Points +(-76);
108、; IF PBC_SAME_MOBILE = "U" THEN Points=Points +(-66);
109、 /*/
110、 /* Variable : SAME_COMPANY */
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關于臨時簽訂合同報告
- 國企勞動派遣合同
- 合同法案例精解
- 鐘點工聘用合同范本
- 大班課件《誰是采蜜冠軍》
- 2024正規(guī)的自然人借款合同樣本
- 2024合同信息化管理系統(tǒng)【信息系統(tǒng)合同】
- 2024個人租房協(xié)議書合同租房協(xié)議書(詳細版)
- 2024標準銷售業(yè)務員合同范本
- 2024個體借款合同協(xié)議模板
- 江西省萍鄉(xiāng)市2024-2025學年高二上學期期中考試地理試題
- 新版加油站安全操作規(guī)程
- 2023年貴州黔東南州州直機關遴選公務員考試真題
- 貨物質量保證措施方案
- 黑龍江省龍東地區(qū)2024-2025學年高二上學期階段測試(二)(期中) 英語 含答案
- 4S店展廳改造裝修合同
- 公務員2022年國考申論試題(行政執(zhí)法卷)及參考答案
- (培訓體系)2020年普通話測試培訓材料
- 3-4單元測試-2024-2025學年統(tǒng)編版語文六年級上冊
- 北師版數(shù)學八年級上冊 5.8三元一次方程組課件
- 2024混合動力汽車賽道專題報告-2024-10-市場解讀
評論
0/150
提交評論