版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于數(shù)據(jù)挖掘技術(shù)的農(nóng)村金融客戶評級的相關(guān)文獻調(diào)研小報告摘要: 近年來,我國的金融機構(gòu)越來越重視自身的信息化建設(shè)。農(nóng)村金融機構(gòu)在支持農(nóng)業(yè)發(fā)展解決農(nóng)戶貸款難,促進農(nóng)民增收,發(fā)展農(nóng)業(yè)現(xiàn)代化方面發(fā)揮了重要作用。而另一方面,其自身超過商業(yè)銀行數(shù)倍的不良資產(chǎn)率阻礙其在農(nóng)村經(jīng)濟發(fā)展建設(shè)中的作用發(fā)揮。因此全面準(zhǔn)確的評估農(nóng)戶的還款能力,對農(nóng)戶信用進行評級,拒絕不符合條件的客戶,將是各農(nóng)村金融機構(gòu)避免風(fēng)險,減少損失的一個重要手段。而隨著社會經(jīng)濟的不斷發(fā)展,農(nóng)村經(jīng)濟中“農(nóng)戶”的概念外延不斷擴展,傳統(tǒng)的評價體系自身的問題尚未解決,已不適宜與用到現(xiàn)在的“農(nóng)戶”概念。數(shù)據(jù)挖掘技術(shù)自上世紀(jì)八十年代末提出之后,首先便被應(yīng)用于
2、金融與經(jīng)濟領(lǐng)域,并在信用評分模型構(gòu)建中發(fā)揮著廣泛而且重要的作用。隨著數(shù)據(jù)的飛速膨脹數(shù)據(jù)倉庫的發(fā)展又促進數(shù)據(jù)挖掘更深入的應(yīng)用。本次文獻調(diào)研的目的是梳理總結(jié)相關(guān)文獻中涉及評級體系構(gòu)建的算法模型。關(guān)鍵字:信用評級,數(shù)據(jù)挖掘,算法模型;0.引言 農(nóng)村金融機構(gòu)一直以服務(wù)”三農(nóng)”為宗旨,有力地支持了“三農(nóng)”經(jīng)濟發(fā)展,其自身也得到了較快發(fā)展。但由于內(nèi)外因素的影響,部分農(nóng)村信用社不良貸款“雙高”局面長期居高不下,不利于實現(xiàn)穩(wěn)健良性發(fā)展目標(biāo),同時也削弱了對經(jīng)濟發(fā)展的助推功能。2014年8月15日,銀監(jiān)會發(fā)布的初步統(tǒng)計數(shù)據(jù)顯示,截至6月末,國有商業(yè)銀行不良貸款余額3957億元,不良貸款率1.05,而全國農(nóng)村信用社
3、不良貸款余額3809 億元,不良貸款比例為3.8%。而具體到省份,特別是信用貸款,據(jù)某省農(nóng)村信用社統(tǒng)計,其2011 社轄內(nèi)信用貸款約為580億元,其中不良貸款約為230 億,信用違約比達40%。不難看出農(nóng)村金融機構(gòu)進一步化解不良貸款、改善資產(chǎn)質(zhì)量任務(wù)壓力較大。因此,如何借助科技的力量加強不良貸款管理,有效解決不良貸款問題是農(nóng)村金融機構(gòu)在改革發(fā)展過程所必須面臨解決的問題。農(nóng)村金融機構(gòu)與國外先進的商業(yè)銀行相比,點多面廣,管理難度大,不良貸款比例較高。目前雖然農(nóng)村信用社建立了龐大的客戶信息庫和業(yè)務(wù)數(shù)據(jù),但是還局限于對數(shù)據(jù)的存儲、記賬、查詢、報表功能等,把大量的數(shù)據(jù)作為一種靜態(tài)的檔案來管理,沒有把它當(dāng)
4、成一種重要的可以進行知識發(fā)現(xiàn)和決策支持的資源來利用,缺乏對其內(nèi)在規(guī)律的挖掘,導(dǎo)致重要信息的流失和資源的浪費。但也為利用數(shù)據(jù)挖掘技術(shù)提供了可能。1.客戶信用風(fēng)險評級方法的發(fā)展:最原始的評級方法是專家評分法,其所依據(jù)的信息最初是主觀評價,從3C 評價原則(品德Character、能力 capacity、擔(dān)保 collateral)到今天的5C和1S、5W評價原則。5C和1S,即特征(Character)、能力(Capacity)、資本(Capital)、抵押擔(dān)保(Collateral)、生活狀況(Condition)、穩(wěn)定性(Stability)。5W,即借款人(Who)、借款用途(Why)、還款
5、期限(When)、擔(dān)保物(What)及如何還款(How)。這些評價在內(nèi)容上都十分類似,共同點都是將道德品質(zhì)、還款能力、資產(chǎn)實力、擔(dān)保和經(jīng)營環(huán)境如何還款等要素逐一進行評分,讓銀行信貸人員對借款人的整體狀況有比較清晰的認(rèn)識,信貸人員通過對借款人五個方面進行綜合評估,最后得出信用等級,根據(jù)信用等級以作為是否貸款、貸款標(biāo)準(zhǔn)的確定和貸后跟蹤監(jiān)測期間的政策調(diào)整依據(jù)。使用這種方法對評估人的綜合業(yè)務(wù)能力,專業(yè)水平要求較高,但農(nóng)信社信貸人員素質(zhì)普遍不高,在打分時有很大的主觀隨意性,造成評分出現(xiàn)較大偏差。信用評分法將借款人的特征進行量化,形成一套指標(biāo)體系,克服了主觀隨意性的風(fēng)險。2.國外研究現(xiàn)狀: 盡管大家都知道
6、21世紀(jì)是數(shù)據(jù)挖掘發(fā)展的黃金時代,但在實際應(yīng)用領(lǐng)域,數(shù)據(jù)挖掘的發(fā)展遠不如其在理論和技術(shù)方面的研究,數(shù)據(jù)挖掘的實際應(yīng)用任重道遠。數(shù)據(jù)挖掘在金融信用風(fēng)險預(yù)測方面,國外許多金融機構(gòu)表現(xiàn)的很積極,但是由于金融信息的保密性,一般很少公布具體數(shù)據(jù)挖掘細節(jié)。但據(jù)美國軟件商提供的報告稱:FCC國家銀行、美國第一銀行、美聯(lián)儲、聯(lián)邦住房貸款抵押公司等重要金融機構(gòu)都在致力于數(shù)據(jù)挖掘在金融系統(tǒng)的應(yīng)用。主要運用以下五種方法:(1)、判別分析法 第一個把統(tǒng)計學(xué)方法運用于個人信用評估領(lǐng)域的研究人員是 David Durand,他把 Fisher提出的判別分析應(yīng)用于個人信用評估,用來判別好客戶和壞客戶,它的原理是使用統(tǒng)計方法
7、來對整體中的各個組的特征進行分類。William Fair和Earl Isaacs利用判別分析法建立了 FICO 評分系統(tǒng)。并成為如今主要的個人信用評分體系。FICO系統(tǒng)被認(rèn)為是衡量個人風(fēng)險的“黃金標(biāo)準(zhǔn)”。FICO 信用評分模型基本思想是把申請人的歷史信用資料與數(shù)據(jù)庫中借款人的信用習(xí)慣進行比較,來判斷申請人與違約、惡意透支、甚至申請破產(chǎn)等特征的借款人是否相似,是比較成熟和完善的信用模型。因 FICO 評分模型建立的基礎(chǔ)是發(fā)達的個人信用制度,而我國目前由于個人信用制度還不完善,且FICO具體的評分模型和算法都不為人所知,在我國推廣的難度較大。(2)、回歸分析法 回歸分析法(包括線性回歸和 Log
8、istic回歸)也是應(yīng)用較廣泛的模型。Kasper Roszbach和Sveriges Riksbank利用線性回歸分析設(shè)計了一種評價未償還貸款的評分卡,用于評估消費信貸的信用風(fēng)險。但是現(xiàn)行回歸方法用于信用評分存在明顯缺陷,即回歸方程兩邊變量的取值范圍可能不一致。Logistic 回歸模型則是對線性回歸模型的改進,回歸方程兩邊的取值可取任意值。Joachim Thaler和Stam意識到可以將線性規(guī)劃方法應(yīng)用到分類問題。Thomas從理論上把Freed和Glover 的線性規(guī)劃方法推廣到多目標(biāo)線性數(shù)據(jù)分類方法,并成功應(yīng)用于信用卡數(shù)據(jù)挖掘中。(3)、神經(jīng)網(wǎng)絡(luò)法 Odom首次將神經(jīng)網(wǎng)絡(luò)的方法引入信
9、用風(fēng)險評測中,Edelman用多感知器神經(jīng)網(wǎng)絡(luò)模型來預(yù)測銀行的存款和貸款的穩(wěn)健度。Sarle等用神經(jīng)網(wǎng)絡(luò)來分析客戶的信貸指數(shù)。神經(jīng)網(wǎng)絡(luò)方法得到研究者和學(xué)者的廣泛關(guān)注,已被證明是一種可以普遍使用的方法。雖然神經(jīng)網(wǎng)絡(luò)用于信用等級分類取得了一定的效果,但它最大的缺點在神經(jīng)網(wǎng)絡(luò)模型缺乏較好的可解釋性和理解性,造成了使用上的困難。Corinna and Vapnik提出的支持向量機在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有優(yōu)勢,解決了在神經(jīng)網(wǎng)絡(luò)方法中無法避免得到局部極值的情況。Martens將 SVM 用于判別規(guī)則的提取中,使得信用評分模型具有更好的可解釋性。(4)、遺傳算法 遺傳算法是一種通過
10、模擬自然進化過程搜索最優(yōu)解的方法。Greene和Smith把 GA 運用到了信用風(fēng)險評估中,但在實際應(yīng)用中遇到了困難,在于 GA 中定長編碼機制在處理復(fù)雜問題特別是包括連續(xù)性變量時編碼過長,耗費機時。Koza改進了GA算法,提出了GP算法(遺傳規(guī)劃法),克服了定長編碼機制的局限性。(5)、決策樹算法 決策樹算法第一次由 Makowski應(yīng)用于個人信用評分。此后 Sewartand Whittaker則用決策樹來對信用進行預(yù)測。近來,Lee等運用決策樹技術(shù)研究最小化信用風(fēng)險問題。 3.國內(nèi)研究現(xiàn)狀: 國內(nèi)對信用評分的研究也經(jīng)歷了從定性研究為主,到定性和定量相結(jié)合的過程。傳統(tǒng)的研究多以主觀的專家判
11、別法為主,以銀行從業(yè)專家以及信貸員的經(jīng)驗為主要依據(jù),如中國郵政儲蓄銀行信用評級二級指標(biāo)有 15 項,其中定量指標(biāo)有 9 項,權(quán)重為61,定性指標(biāo)有6項,權(quán)重為39。雖然評估因素相對全面,并注意了信用評分方法的實施,但是評估主觀因素影響依舊較大,缺乏合理性與公平性。定性指標(biāo)所占權(quán)重仍然較大,且標(biāo)準(zhǔn)不一,信貸人員評估水平高低直接影響信用評定的好壞,導(dǎo)致信用評級不但沒有擴大可以獲得貸款的農(nóng)戶比例,反而把許多農(nóng)戶阻擋在信用戶稱號之外,讓他們更得不到貸款。目前國內(nèi)學(xué)者構(gòu)建信用評分模型采用的技術(shù)大部引進國外。 與國外金融機構(gòu)和軟件生產(chǎn)商對金融數(shù)據(jù)挖掘的研究勢頭相比,由于市場經(jīng)濟結(jié)構(gòu),商業(yè)銀行發(fā)展年限較短等
12、原因國內(nèi)在這方面的發(fā)展研究還處于起步階段。信用風(fēng)險評測方面的短板很有可能影響到未來商業(yè)銀行貸款業(yè)務(wù)的發(fā)展。近年來,國內(nèi)在金融風(fēng)險評級方面的數(shù)據(jù)挖掘研究也在逐漸增加,例如,運用BP神經(jīng)網(wǎng)絡(luò)技術(shù)、運用向量機、運用Apriori算法對信用風(fēng)險進行評估預(yù)測,也有運用Logistic回歸模型構(gòu)建違約概率測算模型。盡管研究很多,但是投入實際應(yīng)用的很少。關(guān)于決策樹算法及時間任務(wù)分配 經(jīng)文獻調(diào)查發(fā)現(xiàn),信用評級的研究多涉及金融、計算機與數(shù)學(xué)的結(jié)合。期刊類文章偏向于對算法的研究。碩博論文則更多注重評級體系的計算機系統(tǒng)實現(xiàn)。 下圖為基于數(shù)據(jù)挖掘技術(shù)客戶信用風(fēng)險評級體系的結(jié)構(gòu)框圖。目前運用較多的數(shù)據(jù)挖掘算法是決策樹算
13、法,神經(jīng)網(wǎng)絡(luò)算法以及譜聚類算法,其中對決策樹算法的研究文獻較為豐富。(1)、決策樹算法 在諸多分類方法中,決策樹是一種常用!直觀的快速分類方法決策樹分類方法采用自頂向下的遞歸方式,在決策樹的內(nèi)部節(jié)點進行屬性值的比較并根據(jù)不同的屬性值判斷從該節(jié)點向下的分支,在決策樹的葉結(jié)點得到結(jié)論。最經(jīng)典的決策樹算法是ID3算法,其核心思想是在決策樹的構(gòu)建過程中采取基于信息增益的特征選擇策略,即選取具有最高信息增益的屬性作為當(dāng)前節(jié)點的分裂屬性,使得對結(jié)果劃分中的樣本分類所需要的信息量最小以此構(gòu)造與訓(xùn)練數(shù)據(jù)一致的一棵決策樹,從而保證了決策樹具有最小的分支數(shù)量和最小的冗余度。但由于存在搜索工程中無法回溯等問題,現(xiàn)今
14、所采用的算法多是從ID3發(fā)展而來的C4.5及C5.0算法。(2)、時間任務(wù)分配 時間有限未能對各類算法有深入了解,并且只對中文文獻做了粗淺閱讀。所以將接下來的任務(wù)主要放到文獻調(diào)研以及對決策樹算法的理解與掌握,將重點放到框圖中評級分類模型模塊。結(jié)合自身實際制定未來四周時間任務(wù)分配表。一二三四五六日周工作安排24252627282930311外出繼續(xù)文獻調(diào)研,一周一篇外文文獻2外出3外出4外出5678了解決策樹模型的基本思想9101112131415信用評級的理論要求及決策樹算法閱讀(ID3,C4.5,C5.0)16171819202122信用評級的理論要求及決策樹算法閱讀(ID3,C4.5,C5
15、.0)5.SIPT題目分級過程中的決策樹算法研究決策樹算法與神經(jīng)網(wǎng)絡(luò)算法在分級過程中的比較分析6.選題原因 針對數(shù)據(jù)的分級系統(tǒng)在國內(nèi)尚處于起步階段,更多還停留在算法的研究上。農(nóng)村金融機構(gòu)正在向信息化邁進,并且有大量的數(shù)據(jù)等待開發(fā)整理,為數(shù)據(jù)挖掘技術(shù)的應(yīng)用提供了可能。當(dāng)社會的信息化程度邁向大數(shù)據(jù)時代后,對信息分級評級的需求量會大大加大,而不僅僅是金融機構(gòu)。目前更多針對金融系統(tǒng)的信用評級體系在大數(shù)據(jù)時代會有更大的拓展空間。7.參考文獻1王貝.農(nóng)戶借貸特征及影響因素實證研究D.山東大學(xué),2014.2李炎.大數(shù)據(jù)時代銀行業(yè)監(jiān)管手段的探索D.西南財經(jīng)大學(xué),2014.3葉曉明.數(shù)據(jù)挖掘技術(shù)在農(nóng)村商業(yè)銀行信貸的應(yīng)用研究D.中南大學(xué),2013.4張成.數(shù)據(jù)挖掘技術(shù)在金融審計中的研究與應(yīng)用D.安徽大學(xué),2014.5田野.基于相似性挖掘的金融數(shù)據(jù)分析系統(tǒng)的研究與應(yīng)用D.上海交通大學(xué),2012.6鄭曼.基于SAS系統(tǒng)的稅務(wù)數(shù)據(jù)挖掘研究D.鄭州大學(xué),2012.7王超.基于數(shù)據(jù)挖掘的農(nóng)信社不良貸款臺賬管理系統(tǒng)設(shè)計與實現(xiàn)D.湖南大學(xué),2014.8龍亞平.數(shù)據(jù)挖掘在農(nóng)信社客戶關(guān)系管理中的應(yīng)用研究D.湖南大學(xué),2012
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版市政基礎(chǔ)設(shè)施文明施工與環(huán)境保護責(zé)任協(xié)議3篇
- 2025年陜西燃氣集團工程有限公司招聘筆試參考題庫含答案解析
- 2025年度個人門面房出租合同(含家具配置及經(jīng)營指導(dǎo)協(xié)議)4篇
- 2025年度個人信用卡透支擔(dān)保合同協(xié)議書4篇
- 2025年度個人醫(yī)療健康保險繳費協(xié)議書4篇
- 2025年全球及中國智能直播一體機行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2024年六五環(huán)境日網(wǎng)絡(luò)知識競賽測試題庫及答案
- 設(shè)計合同協(xié)議書
- 2025年度個人挖機租賃合同變更通知合同4篇
- 二零二五年度車輛收費員薪資待遇及福利協(xié)議材料詳盡條款4篇
- 第1課 隋朝統(tǒng)一與滅亡 課件(26張)2024-2025學(xué)年部編版七年級歷史下冊
- 2025-2030年中國糖醇市場運行狀況及投資前景趨勢分析報告
- 【歷史】唐朝建立與“貞觀之治”課件-2024-2025學(xué)年統(tǒng)編版七年級歷史下冊
- 冬日暖陽健康守護
- 水處理藥劑采購項目技術(shù)方案(技術(shù)方案)
- 2024級高一上期期中測試數(shù)學(xué)試題含答案
- 盾構(gòu)標(biāo)準(zhǔn)化施工手冊
- 天然氣脫硫完整版本
- 山東省2024-2025學(xué)年高三上學(xué)期新高考聯(lián)合質(zhì)量測評10月聯(lián)考英語試題
- 不間斷電源UPS知識培訓(xùn)
- 三年級除法豎式300道題及答案
評論
0/150
提交評論