




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精品文檔流失模型啞變量來(lái)融入分類變量, 使用更方便,但邏輯回歸準(zhǔn)確率相對(duì)較低(所謂成也蕭何,敗也蕭何)。和決策樹(shù)相比,回歸算法穩(wěn)定性好的多我習(xí)慣于:1、使用決策樹(shù)進(jìn)行變量范圍篩選2、使用邏輯回歸進(jìn)行預(yù)測(cè)3、個(gè)別時(shí)候嘗試著用因子分析進(jìn)行變量轉(zhuǎn)載(我試過(guò)的模型,有時(shí)候有一點(diǎn)點(diǎn)小的提升, 和變量共線性特點(diǎn)有關(guān),但不會(huì)有超乎意料的收獲)構(gòu)建流失行為的特征內(nèi)部自有數(shù)據(jù)? 豐富的內(nèi)部交易明細(xì)數(shù)據(jù),包括本幣活期儲(chǔ)蓄波動(dòng)率,本幣活期儲(chǔ)蓄月日均余額,電話銀行總交易筆數(shù)? 可以構(gòu)建的特征: 不同交易的數(shù)額的比例 單筆交易的平均數(shù)額 某種交易的筆數(shù)占全部交易筆數(shù)的比例例如:J本申第期赭曹月則均余額滋日額比-本帀活期
2、儲(chǔ)蓄月切均余繃+本幣走期月E均余額最大波動(dòng)=max幣一年以下波動(dòng),本幣一年以上波動(dòng)率,儲(chǔ)蓄類資產(chǎn)波動(dòng)率,本幣儲(chǔ)蓄波動(dòng)率精品文檔本申活期縷存交易全額=本幣話期續(xù)存交易全額 棗申話期址存交易邕數(shù)本幣干均話期桔賬更易全額二本帀話期聘賬交易全頰 本幣話期聘版交易電襄可以衍生的特征月平均通話時(shí)間的變化=過(guò)去三個(gè)月月平均通話時(shí)間月平均通話次數(shù)的變化=過(guò)去三個(gè)月月平均通話次數(shù)月平均繳納話費(fèi)的變化=過(guò)去三個(gè)月月平均繳納話費(fèi)過(guò)去六個(gè)月月平均通話時(shí)間過(guò)去六個(gè)月月平均通話次數(shù)過(guò)去六個(gè)月月平均繳納話費(fèi)若信息存在冗余,需要按情況進(jìn)行剔除情況一:“本幣活期月日均余額占比” =1-本幣定期月日均余額占比”變量“本幣活期月日
3、均余額占比 ”與“本幣定期月日均余額占比”存在冗余性,知道其一必知道其二,需要 剔除一個(gè)。情況二“資產(chǎn)當(dāng)前總余額”= 本幣儲(chǔ)蓄當(dāng)前總余額 ” + 外幣儲(chǔ)蓄當(dāng)前總余額”如果是(廣義)線性回歸模型,三者不能同時(shí)放進(jìn)模型。對(duì)于樹(shù)模型,可以將其中任意兩個(gè)放進(jìn)模型,剩余的做轉(zhuǎn) 換,比如做一個(gè)離散變換。外部數(shù)據(jù)包含了客戶在電信運(yùn)營(yíng)商的詳情包括:? 通話時(shí)間與次數(shù)? 話費(fèi)詳情? 特定的呼叫行為? 其他信息評(píng)分模型按照模型所預(yù)測(cè)的未來(lái)表現(xiàn)結(jié)果劃分,有:1、風(fēng)險(xiǎn)評(píng)分模型:對(duì)違約拖欠的風(fēng)險(xiǎn)概率進(jìn)行預(yù)測(cè);2、收益評(píng)分模型:對(duì)消費(fèi)者給信貸機(jī)構(gòu)帶來(lái)收益的潛力大小進(jìn)行預(yù)測(cè);精品文檔3、流失傾向評(píng)分模型:對(duì)現(xiàn)有客戶在未來(lái)一
4、定時(shí)期內(nèi)流失的概率進(jìn)行預(yù)測(cè);4、市場(chǎng)反應(yīng)評(píng)分模型:對(duì)目標(biāo)客戶接受信貸機(jī)構(gòu)營(yíng)銷的概率進(jìn)行預(yù)測(cè);5、轉(zhuǎn)賬傾向評(píng)分模型:對(duì)目標(biāo)客戶把貸款余額從別的銀行轉(zhuǎn)賬過(guò)來(lái)的概率進(jìn)行預(yù)測(cè);6、循環(huán)信貸傾向評(píng)分模型:對(duì)目標(biāo)客戶或現(xiàn)有客戶利用信用卡賬戶進(jìn)行循環(huán)信貸的概 率進(jìn)行預(yù)測(cè);7、欺詐評(píng)分模型:對(duì)信用卡申請(qǐng)或信用卡交易為欺詐行為的概率進(jìn)行預(yù)測(cè)。第四章數(shù)據(jù)挖掘與信用評(píng)分模型的技術(shù)消費(fèi)信貸管理實(shí)踐中常用的數(shù)據(jù)挖掘和評(píng)分模型技術(shù)和方法包括: 對(duì)數(shù)據(jù)進(jìn)行描述和總結(jié)的技術(shù); 對(duì)變量進(jìn)行欄位劃分和信息轉(zhuǎn)換的技術(shù); 主成分分析;因子分析;變量類聚分析;類聚分析;邏輯回歸模型;神經(jīng)網(wǎng)絡(luò)模型;判別分析; 決策樹(shù)模型;共性過(guò)濾分析;
5、多元回歸模型;基因算法;RFMRFM分析;存活分析;時(shí)間系列分析:趨勢(shì)分析、季節(jié)性分析、ARIMAARIMA模型一、 對(duì)數(shù)據(jù)進(jìn)行描述和總結(jié)的技術(shù)常用的技術(shù)方法有:頻率、均值、中位數(shù)、方差、極大值、極小值、1/1001/100區(qū)間、1/101/10區(qū)間、1/41/4區(qū)間、多維交叉表、相關(guān)系數(shù)。這些基本統(tǒng)計(jì)手段常用于:對(duì)數(shù)據(jù)的集中度和離散度等分布特征進(jìn)行簡(jiǎn)單的描述;對(duì)數(shù)據(jù)的質(zhì)量進(jìn)行稽核;對(duì) 數(shù)據(jù)間的關(guān)系進(jìn)行初步的探索;產(chǎn)生直觀的報(bào)表。優(yōu)點(diǎn):直觀了解數(shù)據(jù)的特征;簡(jiǎn)單明了容易使用;對(duì)數(shù)據(jù)質(zhì)量檢查有很強(qiáng)大的功能。缺點(diǎn):對(duì)數(shù)據(jù)分析和探索停留在初步階段;反映的信息是一維的,不能對(duì)信息進(jìn)行系統(tǒng)化地綜合。二、
6、對(duì)變量進(jìn)行欄位劃分和信息轉(zhuǎn)化的技術(shù)適用于連續(xù)性變量、類別性變量。轉(zhuǎn)化后可以計(jì)算loglog( oddsodds )。優(yōu)點(diǎn):有效捕捉數(shù)據(jù)中蘊(yùn)藏的非線性關(guān)系;有效捕捉數(shù)據(jù)中蘊(yùn)含的非單調(diào)性關(guān)系;有效將變量標(biāo)準(zhǔn)化,使原始 精品文檔數(shù)值規(guī)模不相同的變量取得一致的統(tǒng)計(jì)數(shù)值;有效將類別性變量包括到模型中;有效處理缺失值和特殊值;有效 提高模型的“抗震蕩性”;有效提高模型的可解釋性。缺點(diǎn):勞動(dòng)密集性的過(guò)程,勞動(dòng)量大;資源密集性的過(guò)程,耗費(fèi)多的計(jì)算機(jī)資源和人力資源;有一定主觀判斷 的成分(劃分成多少個(gè)欄位、如何劃分、每個(gè)欄位的樣本量、劃分后的表現(xiàn)是否合理等);會(huì)損失部分有用的信 息;對(duì)模型的實(shí)施有額外的要求。三
7、、 主成分分析、因子分析、變量類聚分析這3 3種統(tǒng)計(jì)方法主要是用來(lái)減少變量數(shù)目的統(tǒng)計(jì)技術(shù)。優(yōu)點(diǎn):迅速?gòu)拇罅康暮蜻x變量中選擇有限數(shù)目的變量代表;在極大程度上保留有用的信息;降低了模型最終候 選變量的相關(guān)性,提高模型的“抗震蕩性”和穩(wěn)定性。缺點(diǎn):不能處理缺失值和類別性變量,必須通過(guò)信息轉(zhuǎn)換手段把缺失值或類別性變量值轉(zhuǎn)換成數(shù)量值后才能使 用這3 3種統(tǒng)計(jì)方法;對(duì)“信息維度”的解釋存在一定的主觀性。四、 類聚分析常用的類聚分析方法有等級(jí)性類聚(呈樹(shù)型)和非等級(jí)性類聚(類聚內(nèi)的數(shù)據(jù)觀察點(diǎn)之間的總距離最小化)。優(yōu)點(diǎn):對(duì)數(shù)據(jù)的統(tǒng)計(jì)分布不需要作任何假設(shè);不需要任何表現(xiàn)變量的信息;容易使用。缺點(diǎn):多數(shù)類聚分析技
8、術(shù)對(duì)極端值比較敏感;多數(shù)受“初始種子”的影響較大;不能處理缺失值或類別性變量, 需轉(zhuǎn)換成數(shù)量值后才能適用;對(duì)類聚結(jié)果和“相似性”的解釋存在一定的主觀性。五、 邏輯回歸模型適用于二元性目標(biāo)變量。優(yōu)點(diǎn):預(yù)測(cè)結(jié)果是介于 0 0和1 1之間的概率;可以適用于連續(xù)性或類別性自變量;容易使用,容易解釋。缺點(diǎn):對(duì)模型中自變量的多維相關(guān)性較為敏感,需要利用因子分析或變量類聚分析等手段來(lái)選擇代表性的自變量,以減少候選變量之間的相關(guān)性;預(yù)測(cè)結(jié)果的概率轉(zhuǎn)換呈“S S”型,因此從loglog ( oddsodds )向概率轉(zhuǎn)化的過(guò)程是非線性的,在兩端隨著 loglog(oddsodds)值的變化,概率的變化很小,而在
9、中間概率的變化很大。六、 神經(jīng)網(wǎng)絡(luò)模型神經(jīng)網(wǎng)絡(luò)模型是一種把各種投入要素通過(guò)復(fù)雜的網(wǎng)絡(luò)轉(zhuǎn)換成產(chǎn)出的信息加工結(jié)構(gòu)。在智能型交易欺詐預(yù)測(cè)模型 中有應(yīng)用。優(yōu)點(diǎn):有效捕捉數(shù)據(jù)中非線性、非可加性的數(shù)量關(guān)系;適用于二元性、多元性和連續(xù)性的目標(biāo)變量;能處理連續(xù) 性和類別性的預(yù)測(cè)變量。缺點(diǎn):一個(gè)黑箱方案,難以理解,難以得到直觀的解釋;如果不經(jīng)過(guò)仔細(xì)控制,容易微調(diào)于樣本數(shù)據(jù),從而不 具備充分的“抗震蕩性”和穩(wěn)定性。七、 判別分析是一種用來(lái)區(qū)分、判斷個(gè)體所屬類別的統(tǒng)計(jì)技術(shù)。判別分析在市場(chǎng)營(yíng)銷分析、信用風(fēng)險(xiǎn)評(píng)分模型等領(lǐng)域都可以 應(yīng)用。優(yōu)點(diǎn):適用于二元性或多元性目標(biāo)變量,能夠判斷、區(qū)分個(gè)體應(yīng)該屬于多個(gè)不同小組中的哪一組
10、,而邏輯回歸 只能預(yù)測(cè)二元性的目標(biāo)變量。缺點(diǎn):假設(shè)自變量的分布為正態(tài)分布,而實(shí)踐中的數(shù)據(jù)往往不是完全的正態(tài)分布。盡管判別分析時(shí)對(duì)輕微的偏離正態(tài)分布具有一定的抗震蕩性,但嚴(yán)重的偏離可能導(dǎo)致統(tǒng)計(jì)結(jié)果的不可靠性;如果使用stepwisestepwise功能,則有過(guò)分微調(diào)的可能;多維相關(guān)性可能導(dǎo)致模型的不穩(wěn)定性和不可靠性。八、 決策樹(shù)模型是對(duì)總體進(jìn)行連續(xù)的分割,以預(yù)測(cè)一定目標(biāo)變量的結(jié)果的統(tǒng)計(jì)技術(shù)。優(yōu)點(diǎn):淺層的決策樹(shù)視覺(jué)上非常直觀,而且容易解釋;對(duì)數(shù)據(jù)的結(jié)構(gòu)和分布不需作任何假設(shè);可以容易地轉(zhuǎn)化 成商業(yè)規(guī)則;可以捕捉住變量間的相互作用。缺點(diǎn):深層的決策樹(shù)視覺(jué)上和解釋上都比較困難;決策樹(shù)容易過(guò)分微調(diào)于樣本數(shù)
11、據(jù)而失去穩(wěn)定性和抗震蕩性; 決策樹(shù)對(duì)樣本量的需求比較大;處理缺失值的功能非常有限。九、 共性過(guò)濾分析一種用來(lái)預(yù)測(cè)個(gè)體偏好的技術(shù)。被廣泛應(yīng)用于電子商務(wù)和網(wǎng)絡(luò)營(yíng)銷中,推薦。優(yōu)點(diǎn):非常直觀,容易理解,容易實(shí)施;對(duì)數(shù)據(jù)的分布和結(jié)構(gòu)不需要任何假設(shè)。缺點(diǎn):需要較大的樣本數(shù)量;在樣本代表性不足時(shí),或?qū)τ凇跋噜徣后w”不存在的個(gè)體,做出的推薦可能是錯(cuò) 誤的。精品文檔十、多元回歸模型是一種被廣泛應(yīng)用的統(tǒng)計(jì)技術(shù),常被用來(lái)預(yù)測(cè)連續(xù)性的目標(biāo)變量Y Y,比如收益、循環(huán)貸款余額、銷售額等。自變量X X可以是連續(xù)性變量,比如收入,也可以是類別性變量,比如擁有房產(chǎn)與否。由于回歸模型中所用的自變量 可以有多個(gè),所以叫多元回歸模型
12、。優(yōu)點(diǎn):容易解釋,容易使用;自變量可以是連續(xù)性的,也可以是類別性的;許多直觀的統(tǒng)計(jì)指標(biāo)來(lái)衡量模型的 擬合度,比如 R R方,或衡量自變量的顯著性,比如p p值。缺點(diǎn):不能有效處理缺失值,必須通過(guò)一定的數(shù)據(jù)初加工和信息轉(zhuǎn)換后才能處理;模型往往呈線性關(guān)系,比較 難把握住數(shù)據(jù)中的非線性關(guān)系和變量間的互動(dòng)關(guān)系,而且模型假定應(yīng)變量呈正態(tài)分布;模型受樣本數(shù)據(jù)中的極端 值的影響往往比較大;在自變量有較高相關(guān)性的情況下會(huì)出現(xiàn)多維相關(guān)性的問(wèn)題,導(dǎo)致模型的穩(wěn)定性和抗震蕩性 下降。十一、基因算法基因算法是一種最優(yōu)化算法,運(yùn)用了達(dá)爾文主義的自然選擇和適者生存的原則。優(yōu)點(diǎn):彈性大,能被廣泛應(yīng)用于解決多樣的問(wèn)題;在解決高
13、維度、高度非線性的、非平滑性的目標(biāo)函數(shù)的最優(yōu) 化問(wèn)題上具備一定的優(yōu)勢(shì);一般來(lái)說(shuō)能夠找到較優(yōu)的方案。缺點(diǎn):計(jì)算量比較大,對(duì)計(jì)算機(jī)功能的要求比較高;不一定能找到全局最優(yōu)的方案,有時(shí)停留在局部最優(yōu)的方 案上。十二、RFMRFM分析近期性recencyrecency、頻率性frequencyfrequency 、貨幣價(jià)值 monetarymonetary valuevalue 。是市場(chǎng)營(yíng)銷分析中廣泛應(yīng)用的方法。優(yōu)點(diǎn):抓住了最重要的預(yù)測(cè)市場(chǎng)的因素;即使沒(méi)有歷史的市場(chǎng)反應(yīng)數(shù)據(jù),仍然可以組建較好的RFMRFM矩陣表作為市場(chǎng)營(yíng)銷決策的依據(jù);非常直觀,容易理解,符合直覺(jué);容易發(fā)展和實(shí)施。缺點(diǎn):僅僅考慮3 3個(gè)要
14、素,忽略了其他潛在有一定預(yù)測(cè)力的要素;沒(méi)有考慮市場(chǎng)營(yíng)銷決策本身對(duì)市場(chǎng)反應(yīng)的影響;沒(méi)有明確地以模型框架來(lái)展現(xiàn)目標(biāo)變量和預(yù)測(cè)變量之間的關(guān)系。十三、存活分析是一種預(yù)測(cè)距離某種事件發(fā)生的時(shí)間的長(zhǎng)短的統(tǒng)計(jì)技術(shù)。存貨分析一般涉及以下4 4個(gè)方面的因素:危險(xiǎn)函數(shù)、存活函數(shù)、概率密度函數(shù)、平均剩余生命。多數(shù)存活分析在應(yīng)用上面臨兩個(gè)數(shù)據(jù)問(wèn)題:一是觀察期的不完整;二是樣本的缺失。利用存活分析組建回歸模 型的常用方法有半?yún)?shù)性危險(xiǎn)比例回歸模型和參數(shù)性回歸模型。兩種方法都可以用來(lái)估計(jì)距離相關(guān)事件發(fā)生的時(shí)間長(zhǎng)短,所不同的是,前者不需要確定存活函數(shù)的具體形式,因此在關(guān)于存活函數(shù)曲線的信息不充分的情況下有 一定的優(yōu)勢(shì);后者
15、需要明確確定存活函數(shù)的具體形式,對(duì)信息量的要求更高,但如果對(duì)函數(shù)形式的界定正確,則 估計(jì)的準(zhǔn)確性更高。精品文檔壞戡戶累計(jì)比例存貨分析在金融管理上主要被用于預(yù)測(cè)信用卡客戶流失的時(shí)間和住房貸款客戶提前付款的時(shí)間。一般的流失 模型或提前付款模型(比如邏輯回歸)常常預(yù)測(cè)該事件在一定的時(shí)間內(nèi)是否會(huì)發(fā)生,而存活分析預(yù)測(cè)的是該事件 什么時(shí)候發(fā)生。優(yōu)點(diǎn):預(yù)測(cè)事件發(fā)生的時(shí)間點(diǎn);可以比較有效地處理觀察期不完整或樣本缺失的問(wèn)題。缺點(diǎn):可能比預(yù)測(cè)二元性結(jié)果的模型的預(yù)測(cè)力弱;計(jì)算量比較大。十四、時(shí)間系列分析一種用來(lái)分析與時(shí)間密切相關(guān)的數(shù)據(jù)系列,以過(guò)去來(lái)預(yù)測(cè)未來(lái)的統(tǒng)計(jì)技術(shù)。常被用來(lái)預(yù)測(cè)國(guó)民生產(chǎn)總值、經(jīng)濟(jì) 增值率、總需求、
16、股票指數(shù)、銷售量等。時(shí)間系列分析中的兩個(gè)重要因素:趨勢(shì)分析、季節(jié)性分析。除此之外, 還可以通過(guò)自我回歸法(ARAR )、移動(dòng)平均法(MA),ARMAARMA和ARIMAARIMA等模型刻畫(huà)出來(lái)。具體的做法是對(duì)趨勢(shì) 分析和季節(jié)性分析以后的剩余值進(jìn)行進(jìn)一步的回歸分析。時(shí)間序列分析常被用于宏觀經(jīng)濟(jì)預(yù)測(cè)、金融市場(chǎng)預(yù)測(cè)、市場(chǎng)營(yíng)銷預(yù)測(cè)之中,在信用卡管理中主要用于對(duì)信用卡 消費(fèi)額和貸款余額的預(yù)測(cè)。優(yōu)點(diǎn):可以分層次地捕捉時(shí)間系列中的趨勢(shì)因素、季節(jié)性因素和剩余因素;可以根據(jù)過(guò)去的數(shù)據(jù)預(yù)測(cè)未來(lái);多 數(shù)時(shí)間系列模型的應(yīng)用上有比較豐富的數(shù)據(jù)。缺點(diǎn):預(yù)測(cè)對(duì)象必須與時(shí)間密切相關(guān),不適用于非時(shí)間性的數(shù)據(jù);必須滿足靜態(tài)的假設(shè)
17、,而該假設(shè)在實(shí)踐中不 總能滿足。k-sk-s指標(biāo)根據(jù)兩個(gè)數(shù)學(xué)家命名,與交換曲線類似,衡量的是好賬戶和壞賬戶的累計(jì)分布比例之間具體 最大的差距。好賬戶和壞賬戶之間的距離越大,k-sk-s指標(biāo)越高,模型的區(qū)分能力越強(qiáng)。對(duì)于申請(qǐng)風(fēng)險(xiǎn)評(píng)分模好厳戶*計(jì)比例| T-樣*內(nèi)檢暑韓本外檢響Tl臆楓第五章信用評(píng)分模型的開(kāi)發(fā)流程:盂囂霊wiQ精品文檔十氏計(jì)壞柿戶比例震計(jì)好并尸比網(wǎng)累計(jì)比刮型來(lái)說(shuō),一般認(rèn)為 30%30%的區(qū)分距離是可以接受的,而行為評(píng)分的區(qū)分距離則需有45%45%,因?yàn)樾袨樵u(píng)分是根據(jù)銀行內(nèi)部較詳細(xì)的數(shù)據(jù)開(kāi)發(fā)出來(lái)的,預(yù)測(cè)功能應(yīng)該更強(qiáng)。50 5-10風(fēng)陀弭井摂型的K-S區(qū)分度是衡量評(píng)分模型、區(qū)分目標(biāo)變量
18、、辨別好壞的能力的常用指標(biāo),顯示了好賬戶和壞賬戶分?jǐn)?shù) 的區(qū)分程度和重疊程度。精品文檔低分高分K5-12樓瀏力驛的模空好壞區(qū)分虞樣車比力善的41靈好壞區(qū)分矗%3253816105;3253816105;樣車比1飪分贏分決定區(qū)分度的因素主要有兩個(gè):好賬戶和壞賬戶的分?jǐn)?shù)均值之間的距離要盡可能大,各自的方差要盡可能小。精品文檔擬合度曲線是衡量模型預(yù)測(cè)精準(zhǔn)度的曲線,它把賬戶按評(píng)分從低到高排列,劃分成若干欄位(比如每5%5%的賬戶構(gòu)成一個(gè)分?jǐn)?shù)段),對(duì)比每個(gè)評(píng)分欄位上所預(yù)測(cè)的壞賬率與實(shí)際上的壞賬率。乂熔評(píng)分慢聲的抑合廈曲址第六章信用局評(píng)分模型的開(kāi)發(fā)與應(yīng)用信用局是專業(yè)進(jìn)行收集、存儲(chǔ)、整理、加工,并向消費(fèi)信貸機(jī)
19、構(gòu)提供消費(fèi)者全面的信用歷史記錄的機(jī)構(gòu),如 美國(guó)的三個(gè)征信局。信用局收集的數(shù)據(jù)不僅僅是負(fù)面的信息,也包括各種中性的信息和正面的信息。金融機(jī)構(gòu)有 的買信用局的FICOFICO評(píng)分,也有的直接購(gòu)買數(shù)據(jù),自己開(kāi)發(fā)客戶化的評(píng)分模型。信用局評(píng)分模型按其所要預(yù)測(cè)的結(jié)果劃分,有信用風(fēng)險(xiǎn)評(píng)分模型、破產(chǎn)評(píng)分模型、收益評(píng)分模型等?!皦摹钡亩x一般包括表現(xiàn)期內(nèi)任何信貸關(guān)系出現(xiàn)以下情況之一:個(gè)人破產(chǎn);呆賬;貸款違約;抵押品拘押; 嚴(yán)重逾期拖欠等?!昂谩钡亩x一般包括:表現(xiàn)期內(nèi)未出現(xiàn)違約和拖欠行為;或有限的3030天以下的輕度拖欠行為?!昂谩迸c“壞”之間,還有一個(gè)“不確定”群體。此群體被排除在模型之外。圖4議童釧.精品文
20、檔20%20%的風(fēng)險(xiǎn)。過(guò)去觀察期個(gè)月申息)3-8個(gè)月鳳險(xiǎn)表現(xiàn))提煉模型所要預(yù)測(cè)的信用表現(xiàn)時(shí)期,信用卡一般為6-186-18個(gè)月,住房貸款則長(zhǎng)達(dá)24-3624-36個(gè)月。第七章市場(chǎng)營(yíng)銷評(píng)分模型的開(kāi)發(fā)與應(yīng)用市場(chǎng)反應(yīng)評(píng)分模型:利用信用局的消費(fèi)者信用歷史記錄、消費(fèi)者個(gè)人信息和其他消費(fèi)者咨詢信息來(lái)預(yù)測(cè)消費(fèi) 者接受銀行主動(dòng)營(yíng)銷信用卡的概率。余額轉(zhuǎn)賬傾向評(píng)分模型:利用信用局的消費(fèi)者信用歷史記錄來(lái)預(yù)測(cè)消費(fèi)者把別的信用卡未清償欠款余額轉(zhuǎn)移 到新的信用卡上來(lái)的概率大小和數(shù)額大小。游移傾向評(píng)分模型:利用信用局的消費(fèi)者信用歷史記錄來(lái)預(yù)測(cè)消費(fèi)者把余額從新開(kāi)戶信用卡在優(yōu)惠期滿后轉(zhuǎn)移 到其他銀行信用卡賬戶的概率。第八章申請(qǐng)
21、風(fēng)險(xiǎn)評(píng)分模型的開(kāi)發(fā)與應(yīng)用通過(guò)對(duì)消費(fèi)信息申請(qǐng)人的資信狀況進(jìn)行評(píng)估來(lái)預(yù)測(cè)未來(lái)嚴(yán)重拖欠或壞賬概率的模型。該評(píng)分是信貸審批的主 要依據(jù)。據(jù)調(diào)查,80%80%左右的信貸風(fēng)險(xiǎn)來(lái)自信貸審批環(huán)節(jié),一旦消費(fèi)者獲得信貸,后續(xù)的管理只能控制W8-1申請(qǐng)風(fēng)陷評(píng)分模型的數(shù)抿時(shí)間段劃分自變量可反映申請(qǐng)者 3 3方面的信息:還款能力(房產(chǎn)狀況、學(xué)歷高低、收入狀況、職業(yè)類別等)、還款意愿(性 別、婚姻狀況等)和穩(wěn)定性(在現(xiàn)單位工作時(shí)間長(zhǎng)短、在現(xiàn)住址居住時(shí)間長(zhǎng)短等)。實(shí)際中,許多銀行在發(fā)展申請(qǐng)風(fēng)險(xiǎn)評(píng)分模型時(shí),僅依靠被批準(zhǔn)申請(qǐng)人群體的數(shù)據(jù)開(kāi)發(fā)模型,然后把它試試刀整 個(gè)申請(qǐng)人總體中去。由于被批準(zhǔn)群體與被拒絕群體的行為特征和“壞”的
22、比例往往大相逕庭,會(huì)弱化模型的預(yù)測(cè)準(zhǔn)確程度。(例如,收入 20002000以上批準(zhǔn)貸款,模型中均是收入在20002000以上的樣本)申請(qǐng)風(fēng)險(xiǎn)評(píng)分模型典型分組:ffiS-6申諂煲險(xiǎn)評(píng)分模型的分組第九章行為評(píng)分模型的開(kāi)發(fā)與應(yīng)用學(xué)生卡普通卡有房產(chǎn)精品文檔是消費(fèi)信貸管理中最常用的預(yù)測(cè)模型之一。是根據(jù)信用卡賬戶歷史上所表現(xiàn)出來(lái)的各種行為特征來(lái)預(yù)測(cè)該賬 戶未來(lái)的信貸表現(xiàn)。數(shù)據(jù)來(lái)源是信用卡開(kāi)戶后的各種使用、欠款、還款的信息。由于行為評(píng)分使用的數(shù)據(jù)是信用卡開(kāi)戶后一定時(shí)期內(nèi)的行為信息,屬于銀行內(nèi)部數(shù)據(jù)。是賬戶管理的最重要 的模型,而且行為評(píng)分的數(shù)據(jù)源與信用局模型完全不一樣,與信用局模型具有很強(qiáng)的互補(bǔ)性。根據(jù)模型
23、所要預(yù)測(cè)的未來(lái)信用表現(xiàn)結(jié)果,行為評(píng)分模型主要包括行為風(fēng)險(xiǎn)評(píng)分、行為收益評(píng)分和行為流失傾 向評(píng)分等。一、行為風(fēng)險(xiǎn)評(píng)分從行為信息的原始數(shù)據(jù)元素中,提煉預(yù)測(cè)變量的基本方法有:嚴(yán)重性、近期性、頻率性、貨幣價(jià)值性(某種行為 的貨幣數(shù)額)、組合性(不同性質(zhì)的行為所占的比例)。典型分組:0B9-7??辗纸M新嶽戶泄BE戶|歷史滴白I_I行為風(fēng)險(xiǎn)評(píng)分模型被廣泛應(yīng)用于賬戶管理和壞賬催收的策略中。二、 行為收益評(píng)分模型同樣,數(shù)據(jù)可以分成表現(xiàn)期和觀察期。未來(lái)一年的凈收益= =利息收入- -資金成本+ +刷卡回傭+ +各項(xiàng)收費(fèi)- -運(yùn)營(yíng)成本。未包括壞賬損失,為使得模型定義簡(jiǎn) 單。行為收益評(píng)分應(yīng)用于信用卡賬戶管理策略中,
24、比如修改信用額度,強(qiáng)化客戶服務(wù),積極交叉銷售,最大限度挖掘用戶收益等。三、 行為流失傾向評(píng)分模型根據(jù)信用卡賬戶的歷史信息和行為特征預(yù)測(cè)顧客未來(lái)流失轉(zhuǎn)而使用其他銀行信用卡的概率。第十章客戶評(píng)分模型的開(kāi)發(fā)與應(yīng)用前面的介紹是針對(duì)單個(gè)產(chǎn)品的。把多個(gè)產(chǎn)品的信息整合起來(lái),發(fā)展客戶評(píng)分模型,也是很有必要的??蛻粼u(píng)分模型是以一個(gè)分?jǐn)?shù)來(lái)總結(jié)所有相關(guān)的客戶數(shù)據(jù)、預(yù)測(cè)在未來(lái)一定時(shí)期內(nèi)客戶的某種信用表現(xiàn)的模型。最常用的是客戶風(fēng)險(xiǎn)評(píng)分模型,反映客戶未來(lái)至少一個(gè)信貸賬戶會(huì)發(fā)生賴賬行為的概率,有的銀行也發(fā)展客戶流 失傾向模型。精品文檔7/汽販贄故Z行為評(píng)分丿r y1S用卡)71汽車提敢息什么是“客戶”?對(duì)于消費(fèi)者個(gè)人以自己
25、名義擁有多個(gè)賬戶和信貸產(chǎn)品來(lái)說(shuō),定義很直觀,客戶即消費(fèi)者個(gè) 人。對(duì)于以某種形式聯(lián)名擁有賬戶的情況來(lái)說(shuō),解決辦法因具體情況而異,一般來(lái)說(shuō)還是以個(gè)人作為一個(gè)獨(dú)立的 客戶,對(duì)于聯(lián)名賬戶則當(dāng)做每個(gè)個(gè)人都擁有該賬戶來(lái)處理,而小企業(yè)的賬戶一般不算到業(yè)主名下。客戶數(shù)據(jù):獨(dú)特的客戶代碼,把每個(gè)客戶的所有賬戶信息聯(lián)系起來(lái);每個(gè)賬戶或產(chǎn)品詳細(xì)的表現(xiàn)信息;每個(gè)賬戶或產(chǎn)品的開(kāi)戶時(shí)間和詳細(xì)歷史活動(dòng)信息;每個(gè)賬戶或產(chǎn)品的行為評(píng)分; 客戶的人口特征信息和生活方式信息??蛻粼u(píng)分模型的有效性在很大程度上取決于有多少比例的客戶在該銀行持有兩個(gè)或多個(gè)產(chǎn)品賬戶。模型的開(kāi)發(fā)方式有兩種:?一種是“評(píng)分的評(píng)分”,是一種比較常見(jiàn)而且比較容易
26、的發(fā)展方式。ffi 10-1 ”評(píng)另的評(píng)分開(kāi)笈方式示范圖0010-2直孩幵覽方It預(yù)范圈欺詐包括申請(qǐng)欺詐、信用卡丟失、信用卡被盜、信用卡偽造、信用卡機(jī)密信息被盜、信用卡郵寄被盜、賬戶被 竊取等。欺詐風(fēng)險(xiǎn)評(píng)分模型包括申請(qǐng)欺詐風(fēng)險(xiǎn)評(píng)分模型和交易欺詐風(fēng)險(xiǎn)評(píng)分模型。一、申請(qǐng)欺詐風(fēng)險(xiǎn)評(píng)分模型常用的預(yù)測(cè)信息有:?申請(qǐng)表填寫(xiě)的地址與信用局檔案地址不符;申請(qǐng)表填寫(xiě)的地址在信用局檔案里第一次存檔時(shí)間小于9090天;耳維產(chǎn)品另一種是直接從客戶數(shù)據(jù)發(fā)展客戶評(píng)分。汽卓iMtfl馬卡 狗瀏皓鼻鎖満製第十一章欺詐風(fēng)險(xiǎn)評(píng)分模型的開(kāi)發(fā)與應(yīng)用精品文檔?申請(qǐng)表填寫(xiě)的地址在信用局檔案里僅為新信用賬戶所用;?申請(qǐng)表填寫(xiě)的地址在信用局
27、檔案里不存在;?申請(qǐng)表填寫(xiě)的地址被信用局記錄認(rèn)定為高風(fēng)險(xiǎn)地址;?申請(qǐng)表填寫(xiě)的地址被信用局記錄認(rèn)定為非住宅性地址;?申請(qǐng)表填寫(xiě)的地址在信用局曾有欺詐活動(dòng)的記錄;?信用局檔案中地址為高風(fēng)險(xiǎn)地址;?信用局檔案中地址為非住宅性地址;?信用局檔案中地址曾有欺詐活動(dòng)的記錄;?信用局記錄顯示該申請(qǐng)人(姓名或身份證號(hào)碼)曾被仿冒;?信用記錄最早確立的時(shí)間在該身份證號(hào)碼發(fā)行之前。從上述信息可以看到,對(duì)申請(qǐng)欺詐的預(yù)測(cè)主要依賴于信用局的記錄,特別是關(guān)于地址的記錄。 二、交易欺詐風(fēng)險(xiǎn)評(píng)分模型在實(shí)踐中,考慮實(shí)操性,銀行往往把核實(shí)的第一次欺詐日記錄在案,然后模型把第一次欺詐日之后的交易均 定義為欺詐。這里面會(huì)有誤差。為減
28、少誤差,也為了提高模型發(fā)現(xiàn)欺詐的速度,一般來(lái)說(shuō)樣本僅保留第一次欺詐 日之后若干天或若干次交易并定義為欺詐,而把其他方面的交易排除在外。在這種定一下,銀行準(zhǔn)確地記錄第一 次欺詐日就非常關(guān)鍵。由于交易欺詐“大海撈針”的特點(diǎn),交易欺詐風(fēng)險(xiǎn)評(píng)分模型往往使用極精細(xì)復(fù)雜的模型技術(shù),主要利用機(jī)器 學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型技術(shù),樣本個(gè)數(shù)達(dá)好幾百萬(wàn)個(gè)交易。在歐美,各銀行往往形成數(shù)據(jù)共享體,把分散的數(shù)據(jù)集 中,由專業(yè)化公司(如 FairFair IsaacIsaac )發(fā)展模型,銀行付費(fèi)使用。交易欺詐風(fēng)險(xiǎn)評(píng)分模型所用的預(yù)測(cè)信息主要是來(lái)自實(shí)時(shí)交易授權(quán)的信息和歷史交易授權(quán)的信息。常用的預(yù)測(cè) 信息包括:?信用卡賬號(hào)(用于作公
29、共碼鍵,不用于提煉預(yù)測(cè)變量)?賬戶持有人的國(guó)家號(hào)碼和郵政編碼商戶號(hào)碼商戶的國(guó)家號(hào)碼、貨幣代碼和郵政編碼 交易的日期和時(shí)間交易數(shù)額交易種類(購(gòu)物、提現(xiàn)等)商戶種類密碼核對(duì)結(jié)果CVVCVV核對(duì)結(jié)果信用卡過(guò)期日信用額度和可支配剩余額度?信用卡使用途徑(鍵入或刷卡,keyedkeyed oror swipedswiped )欺詐者不能完全模仿真實(shí)用戶的用卡行為模式。欺詐者本身的欺詐用卡行為往往會(huì)表現(xiàn)出一些特征,如密集 使用、大額交易、光顧特殊商店等。簡(jiǎn)單的預(yù)測(cè)變量只運(yùn)用當(dāng)前交易的信息:?一維性的變量:交易金額、商戶種類、交易發(fā)生地離卡用戶家庭住址的遠(yuǎn)近、交易發(fā)生時(shí)間二維性的變量,把兩種數(shù)據(jù)元素組合在一
30、起:把商戶種類和交易金額組合在一起、把交易時(shí)間與距離遠(yuǎn)近組合在一起等。復(fù)雜的預(yù)測(cè)變量把當(dāng)前的信息與歷史信息相聯(lián)系、對(duì)比:以時(shí)間為基礎(chǔ)的變量: 過(guò)去3030分鐘交易的次數(shù)或平均金額、過(guò)去1 1小時(shí)2 2小時(shí)3 3小時(shí)半天1 1天2 2天一周等時(shí)間段交易的次數(shù)或平均金額、當(dāng)前交易金額與過(guò)去若干時(shí)間段的交易金額的均值和標(biāo)準(zhǔn)差的對(duì)比等精品文檔不近對(duì)金額可以提煉以時(shí)間為基礎(chǔ)或以事件為基礎(chǔ)的變量,對(duì)于商戶種類、交易距離、交易時(shí)間、交易種類、交易欺詐風(fēng)險(xiǎn)評(píng)分模型常用的指標(biāo)有:賬戶偽陽(yáng)性比例(accountaccount falsefalse positivepositive rate,rate, AFPR)
31、AFPR)、賬戶發(fā)現(xiàn)比例(accountaccount detectiondetection rate,rate, ADR)ADR)、價(jià)值發(fā)現(xiàn)比例(valuevalue detectiondetection rate,rate, VDR)VDR) 等。K橋?qū)?ttt 檢時(shí)拒建以事件為基礎(chǔ)的變量:過(guò)去2 2次3 3次4 4次N N次交易的平均金額、過(guò)去2 2次3 3次4 4次N N次交易的最大金額、當(dāng)前交易與過(guò)去若干次交易金額的均值、標(biāo)準(zhǔn)差以及最大值的對(duì)比等。交易方式、交易國(guó)家、交易貨幣等信息均可以提煉類似的變量。變量的提煉涉及的數(shù)據(jù)存儲(chǔ)有兩種方式:把相關(guān)的整個(gè)交易歷史的數(shù)據(jù)保存起來(lái),精確按定義
32、來(lái)計(jì)算變量值;把過(guò)去的交易信息總結(jié)起來(lái),只保留相關(guān)的總結(jié)性信息,而不保留具體的歷史交易信息。用時(shí)與當(dāng)前交易的金額進(jìn)行加權(quán)平均。1詵決It第十二章信用評(píng)分模型的實(shí)施與管理精品文檔nl利用fSRi評(píng)廿策絳索英兀代理n標(biāo)描崔請(qǐng)用評(píng)分橫曙甩理明胸常關(guān)工作人堆閥令I(lǐng)與貴住關(guān)瞬信貸霖理的目標(biāo)ft 12-1館用評(píng)分權(quán)瓏實(shí)箱步2完隨第十三章信用評(píng)分模型的跟蹤與檢驗(yàn)一、前臺(tái)跟蹤報(bào)告1 1、 客戶群體穩(wěn)定性報(bào)告跟蹤最新客戶(或賬戶)的評(píng)分分布情況,并與模型的開(kāi)發(fā)樣本評(píng)分分布情況作對(duì)比。用指數(shù)來(lái)表示。指數(shù)越高,穩(wěn)定性越低,客戶群體的評(píng)分分布變化越大。如果穩(wěn)定性指數(shù)在0.250.25以上,銀行應(yīng)進(jìn)一步通過(guò)變量分析報(bào)告
33、來(lái)分析客戶群體變化的趨勢(shì)。2 2、 變量分析報(bào)告什么原因使評(píng)分提高了?評(píng)分的提高是否合理?變量分析報(bào)告可以解答這個(gè)問(wèn)題。 精品文檔v 敗巔件抉寮和依評(píng)分抉舌的設(shè)計(jì) B-皿忖砸理鏡戾的敷弼和信忍 C 段立星低井?dāng)?shù)螳髦皙取得,犧襯利H1信用同的信用攝估E.闿雪員備.tn何利tiffin內(nèi)部信息門(mén)核實(shí)屮請(qǐng)人敷據(jù)的忙實(shí)性G 是習(xí)iftfh如何進(jìn)肓評(píng)仔否決H,依帝井制迄信用舖戎斌貸就敷H的第略1 ffi if分制定利率和壞畑收卻略制廷問(wèn)就再命廉観過(guò)瞳的計(jì)劃 制瓦*分嵐質(zhì)柱n義綴實(shí)緇的比朋 制即揃椎實(shí)丙押序匹亀性的卄網(wǎng) 制宜3812評(píng)井井布計(jì)劃 制皇數(shù)攜眸謬改汁M電員匸JMW劃進(jìn)訃貫工堵洲竇料或農(nóng)條界郃咨
34、醐公耐蜒需塔M ifti卜和怪產(chǎn)客戶薛體禺定ft脫區(qū)fli皆 設(shè)卄和牛.嚴(yán)童分?jǐn)嗖ジ?設(shè)訃和生產(chǎn)評(píng)分分布就吿 設(shè)計(jì)利生產(chǎn)通期権咒甘布權(quán)IS 設(shè)計(jì)和喘產(chǎn)柵空楸合度握書(shū) 誰(shuí)計(jì)輛隹產(chǎn)樽為區(qū)甘度粽檢程皆 設(shè)計(jì)科|性產(chǎn)評(píng)分習(xí)決能況種技果懂皆 確工悄費(fèi)薈理記事崔制定極別槍弱和新的計(jì)劃精品文檔3 3、評(píng)分分布報(bào)告評(píng)分分布報(bào)告顯示了每一個(gè)分?jǐn)?shù)段上的相關(guān)運(yùn)作指標(biāo),對(duì)于申請(qǐng)風(fēng)險(xiǎn)評(píng)分模型來(lái)說(shuō),評(píng)分分布報(bào)告衡量了每個(gè)分?jǐn)?shù)段上申請(qǐng)者的批量分布、批準(zhǔn)量和拒絕量,從而顯示了在任何最低分?jǐn)?shù)線上的批準(zhǔn)比例,以及在信貸審批中 依據(jù)模型決策的程度和否決的程度。這種評(píng)分分布報(bào)告是用來(lái)衡量評(píng)分卡意外的因素,特別是信貸政策和否決操作影響的重要工具。除了生成總體 的評(píng)分分布報(bào)告以外,還可以對(duì)重要的細(xì)分客戶群體如不同地區(qū)、不同產(chǎn)品種類生成報(bào)告。二、后臺(tái)檢驗(yàn)報(bào)告一般來(lái)說(shuō),模型實(shí)施后1-21-2年應(yīng)該對(duì)模型進(jìn)行一次檢驗(yàn)。收集數(shù)據(jù)樣本,需有代表性。并作逾期拖欠分布報(bào)告、模型擬合度報(bào)告、模型區(qū)分度檢驗(yàn)報(bào)告。建立信貸管理記事本(例):表13-6信貸音
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 請(qǐng)示整改報(bào)告范文
- HCIA路由交換技術(shù)實(shí)戰(zhàn)(微課版)-課后習(xí)題答案
- 二零二五年度正規(guī)欠款合同范本:商業(yè)保理業(yè)務(wù)合作協(xié)議
- 二零二五養(yǎng)老院院民文化參觀出行合作協(xié)議
- 二零二五年度高端定制門(mén)安裝與設(shè)計(jì)合同
- 二零二五年度電梯維保服務(wù)與智能化升級(jí)合同范本
- 二零二五年度企業(yè)ERP系統(tǒng)采購(gòu)合作協(xié)議
- MySQL教程(新體系-綜合應(yīng)用實(shí)例視頻)(第4版)習(xí)題及答案 -第08章
- 二零二五年度教育行業(yè)年合同制工人養(yǎng)老保險(xiǎn)合同
- 二零二五年度健康養(yǎng)老項(xiàng)目終止合作框架協(xié)議
- (正式版)HG∕T 21633-2024 玻璃鋼管和管件選用規(guī)定
- 便與健康課件
- 自然辯證法概論課件:第二章馬克思主義科學(xué)技術(shù)觀
- “供應(yīng)商融資安排”會(huì)計(jì)列報(bào)、披露問(wèn)題研究
- 氣道廓清技術(shù)及護(hù)理課件
- 中國(guó)黃金集團(tuán)公司黃金工業(yè)項(xiàng)目初步設(shè)計(jì)
- 中醫(yī)院新技術(shù)、新項(xiàng)目申請(qǐng)表、審批表及年季度工作報(bào)告表范本
- 《現(xiàn)代漢語(yǔ)語(yǔ)法》PPT課件(完整版)
- SAP培訓(xùn)講義(FICO概覽)V3-中石油
- 全國(guó)江蘇小學(xué)科學(xué)學(xué)科教師基本功大賽試題匯總(共19頁(yè))
- 幕墻工程施工質(zhì)量通病和防治措施方案
評(píng)論
0/150
提交評(píng)論