運用邏輯回歸建立信用卡欺詐評分卡_第1頁
運用邏輯回歸建立信用卡欺詐評分卡_第2頁
運用邏輯回歸建立信用卡欺詐評分卡_第3頁
運用邏輯回歸建立信用卡欺詐評分卡_第4頁
運用邏輯回歸建立信用卡欺詐評分卡_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、項目目標:運用邏輯回歸建立信用卡欺詐評分卡本次實驗的數(shù)據(jù)均來自于我行真實數(shù)據(jù),只是在本文的作業(yè)中不會出現(xiàn)實際客戶信息以及真實的變量內(nèi)容以及全部代碼,僅僅只是一次嘗試,僅供參考。一】數(shù)據(jù)樣本的確定本次嘗試選取了時間窗口12年11月到13年1月,13年5月到13年7月1000140筆樣本數(shù)據(jù)。并按照6:4的比例分成測試集和訓練集二】變量確定X變量:從申請表,第三方信息源等數(shù)據(jù)表中提煉出85個初始變量,包括原始變量,根據(jù)經(jīng)驗確定的中間變量。Y變量:在實際業(yè)務中被認定的壞客戶,其他的為好客戶,分別用1和0表示三】變量異常值剔除,缺失值填補數(shù)值變量:運用計算99分位數(shù),把大于2倍99分位數(shù)的數(shù)值置為99

2、分位數(shù),把缺失值總量超過20%以上的變量剔除分類變量:運用插值法,把缺失的變量填回去。四】變量篩選1、  首先進行單變量的邏輯回歸,刪除掉P值大于0.3的變量,2、  把數(shù)值變量進行分段操作,使得分出的段之間有較大差異,并且是單調的。3、  計算IV值,把IV值小于0.02的剔除,小于0.02的被認為是沒有預測能力的4、  運用聚類的方法,把分類變量進行聚類,以降低分類變量的緯度最后篩選出的變量如下表(實際意義不加以說明,表示的是一些客戶的屬性)最終10變量IVPBC_CC_CNT_OPEN_L6TH_B0.572

3、6102PBC_CC_OPENDATE_INT_B0.3712097SPREADER_HIRE_DATE_B0.3466377APP_LOANCARD_NUM_B0.2145266PBC_SAME_MOBILE0.2075589APP_CITY0.1969697PBC_CC_LOAN0.1809676APP_SAME_OTHERMOBILE0.1449625APP_EDUCATION_DEGREE_B0.0929062SAME_COMPANY0.0867273PBC_COMPADDR_TIME_B0.0649564PBC_SAME_COMMUADDR0.0584656五】邏輯回歸運用逐步回歸法

4、,計算各變量的參數(shù)估計Proc logistic data=lg.F_BS_NEW_IND_TRAIN descoutest=LG.param_est;model TARGET_VAR_NEW=PBC_CC_CNT_OPEN_L6TH_WOEPBC_CC_OPENDATE_INT_WOEPBC_COMPADDR_TIME_WOESPREADER_HIRE_DATE_WOEAPP_LOANCARD_NUM_WOEPBC_SAME_MOBILE_WOEAPP_CITY_WOEPBC_SAME_COMMUADDR_WOEPBC_CC_LOAN_WOEAPP_SAME_OTHERMOBILE_WOEA

5、PP_EDUCATION_DEGREE_WOE/ selection=stepwise slentry=0.05 slstay=0.05outroc=LG.ROC ctable pprob=(0 to 1 by 0.1) details lackfit stb;output out=LG.PRED p=phat;Run;proc sort data=LG.PRED;by descending phat;Run;輸出結果六】模型評價運用洛倫茨圖和ROC圖來看下模型的效果提升圖:每一段的實際壞客戶占比單調下降,說明模型的效果不錯,如果呈現(xiàn)的是非單調的,則說明模型不可用。洛倫茨圖在30%的水平下比隨

6、機提升35%左右,模型效果可以再看下ROC圖,誤判30%的好客戶可以區(qū)分出75%的壞客戶,C值在0.76,一般評分卡的C值大于0.75就可以運用此模型。七】輸出評分卡/*/                                                 

7、                                   /*/                                 

8、0;                                                  /* Automatically Generated Scorecard */          

9、;                                                                     

10、     /*/                                                               

11、0;                    /*    SAS CODE             */                              

12、0;                                                     /* Scorecard Scale : */           &

13、#160;                                                                    &#

14、160;                           /*  Odds of 1 : 1/300 at   1000 Points                           

15、0;                                                                with PDO of 120 */&

16、#160;                                                                    &#

17、160;                                   /*/                                 

18、                                                   /*/                 

19、0;                                                                  /* START OF

20、SCORING DATA STEP */                                                                

21、                   /*/                                                 

22、;                                   /*/                                 

23、60;                                                  DATA LG.MODELING;        /* Modify */   &#

24、160;                                                                    

25、60;     SET LG.MODELING; /* Modify */                                                         &

26、#160;                    /*/                                                

27、;                                    /*/                                

28、60;                                                   /*/                 &

29、#160;                                                                  /* Base P

30、oints   */                                                                

31、                                                /*/                   

32、                                                                 Points=520 ;  &

33、#160;                                                                    &#

34、160;                                                /*/                   

35、                                                                /* Variable : APP_LOA

36、NCARD_NUM     */                                                            

37、0;                             /*/                                       &#

38、160;                                                  IF APP_LOANCARD_NUM LE (1) THEN  Points=Points +(62);    

39、;                                                                     

40、     IF APP_LOANCARD_NUM GT (1) AND APP_LOANCARD_NUM LE (2) THEN  Points=Points +(-47);                                           

41、       IF APP_LOANCARD_NUM GT (2) THEN  Points=Points +(-112);                                               &

42、#160;                       /*/                                           

43、                                        /* Variable : PBC_CC_CNT_OPEN_L6TH     */               

44、;                                                                     

45、   /*/                                                                 

46、0;                        IF PBC_CC_CNT_OPEN_L6TH LE (0) THEN  Points=Points +(8);                             

47、0;                                             IF PBC_CC_CNT_OPEN_L6TH GT (0) AND PBC_CC_CNT_OPEN_L6TH LE (1) THEN  Points=Points +(-27);

48、60;                                         IF PBC_CC_CNT_OPEN_L6TH GT (1) THEN  Points=Points +(-32);            &

49、#160;                                                       /*/            

50、                                                                     &

51、#160;  /* Variable : PBC_CC_OPENDATE_INT     */                                                    

52、                                  /*/                                  

53、;                                                        IF PBC_CC_OPENDATE_INT LE (0) THEN  Points=Point

54、s +(38);                                                                   

55、        IF PBC_CC_OPENDATE_INT GT (0) AND PBC_CC_OPENDATE_INT LE (24) THEN  Points=Points +(-26);                                       

56、;   IF PBC_CC_OPENDATE_INT GT (24) AND PBC_CC_OPENDATE_INT LE (48) THEN  Points=Points +(-32);                                          IF P

57、BC_CC_OPENDATE_INT GT (48) THEN  Points=Points +(-47);                                                      &#

58、160;             /*/                                                      &

59、#160;                             /* Variable : SPREADER_HIRE_DATE     */                          &

60、#160;                                                              /*/    

61、                                                                     &

62、#160;               IF SPREADER_HIRE_DATE LE (6) THEN  Points=Points +(22);                                      &#

63、160;                                      IF SPREADER_HIRE_DATE GT (6) THEN  Points=Points +(-18);              

64、60;                                                            IF SPREADER_HIRE_DATE = ""

65、THEN  Points=Points +(66);                                                            

66、0;           /*/                                                         &#

67、160;                          /* Variable : APP_CITY     */                               

68、                                                                    /*/

69、0;                                                                     

70、;                    IF APP_CITY = "Y" THEN  Points=Points +(47);                                  

71、                                                    IF APP_CITY = "N" THEN  Points=Points +(-40);  &

72、#160;                                                                    &#

73、160;               IF APP_CITY = "U" THEN  Points=Points +(-45);                                      

74、60;                                          /*/                          &

75、#160;                                                         /* Variable : APP_EDUCATION_DEGREE   &

76、#160; */                                                                  &

77、#160;                    /*/                                                

78、;                                          IF APP_EDUCATION_DEGREE = "F" THEN  Points=Points +(-43);         &

79、#160;                                                                 IF APP_EDUCATIO

80、N_DEGREE = "E" THEN  Points=Points +(-8);                                                       

81、;                    IF APP_EDUCATION_DEGREE = "D" THEN  Points=Points +(-8);                                &

82、#160;                                          IF APP_EDUCATION_DEGREE = "A" THEN  Points=Points +(21);        

83、0;                                                                  IF APP_EDUCA

84、TION_DEGREE = "B" THEN  Points=Points +(21);                                                      &#

85、160;                    IF APP_EDUCATION_DEGREE = "C" THEN  Points=Points +(21);                               

86、;                                            IF APP_EDUCATION_DEGREE = "G" THEN  Points=Points +(52);        &

87、#160;                                                            /*/       

88、                                                                     

89、       /* Variable : APP_SAME_OTHERMOBILE     */                                                

90、;                                       /*/                             

91、60;                                                            IF APP_SAME_OTHERMOBILE = "Y&quo

92、t; THEN  Points=Points +(-124);                                                            

93、;              IF APP_SAME_OTHERMOBILE = "N" THEN  Points=Points +(4);                                    

94、0;                                  /*/                                 

95、60;                                                  /* Variable : PBC_CC_LOAN     */      

96、0;                                                                     

97、;                    /*/                                                

98、60;                                         IF PBC_CC_LOAN = "Y" THEN  Points=Points +(25);            &#

99、160;                                                                    

100、60;  IF PBC_CC_LOAN = "N" THEN  Points=Points +(-46);                                                   &

101、#160;                          /*/                                          

102、;                                          /* Variable : PBC_SAME_MOBILE     */              &#

103、160;                                                                    

104、60;        /*/                                                           &#

105、160;                              IF PBC_SAME_MOBILE = "Y" THEN  Points=Points +(130);                     

106、60;                                                          IF PBC_SAME_MOBILE = "N" THEN 

107、; Points=Points +(-76);                                                               

108、;                 IF PBC_SAME_MOBILE = "U" THEN  Points=Points +(-66);                                  

109、                                       /*/                            

110、                                                        /* Variable : SAME_COMPANY     */                           

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論