中債研究所-債券信用評級模型研究-48正式版_第1頁
中債研究所-債券信用評級模型研究-48正式版_第2頁
中債研究所-債券信用評級模型研究-48正式版_第3頁
中債研究所-債券信用評級模型研究-48正式版_第4頁
中債研究所-債券信用評級模型研究-48正式版_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

債券信用評級模型研究類承曜鄧晴元(一)背景1.我國信用債違約情況概述(1)信用債違約趨于常態(tài)化自2014年“11超日債”成為我國首例違約債券以來,債券市場違約現(xiàn)象頻現(xiàn),“剛性兌付”的預(yù)期不斷被打破,債券違約日益增多。如圖1所示,從首次違約的時間分布來看,2015-2016年、2018-2019年為兩次違約高峰。2014年-2016首次違約主體數(shù)量持續(xù)增加,2016年,煤炭、鋼鐵、機械、有色等產(chǎn)能過剩行業(yè)成為違約的高風(fēng)險領(lǐng)域,并出現(xiàn)了以東特鋼為代表的違約事件。16年上半年內(nèi)新增12個違約發(fā)行人,實質(zhì)違約債券25只,超過了14、15年兩年違約的案例總量。直到16年四季度啟動供給側(cè)改革,大量淘汰過剩產(chǎn)能,“?!闭邽橥?,過剩產(chǎn)能行業(yè)龍頭基本面出現(xiàn)明顯轉(zhuǎn)機,2016年達到階段性高峰,新增28家違約主體。2017年首次違約主體和金額均大幅下降,之后2017年年底融資環(huán)境收緊,2018年強監(jiān)管、緊信用和資管新規(guī)等一系列監(jiān)管措施出臺,帶來非標(biāo)轉(zhuǎn)標(biāo)、表外回表的去杠桿的過程,導(dǎo)致信用收縮和配置退潮之后違約的出現(xiàn),2018年-2019年新增違約主體數(shù)量和金額陡增,其中2019年新增違約主體數(shù)量和金額為歷年最高,共43家違約主體、涉及違約金額1753.3億元。2020至2021年,信用債違約延續(xù)常態(tài)化。2020年,共有155只信用債發(fā)生違約,其中包括28家新增違約主體。2021年共有148只債券違約,違約余額為1595.93億元。數(shù)據(jù)來源:Wind圖1 信用債違約規(guī)模與數(shù)量(2)違約主體以民企為主,違約國企數(shù)占比持續(xù)上升從違約主體屬性來看,信用債違約主體主要分布在民營企業(yè),但違約國企數(shù)占比持續(xù)上升。2014年至2021年底,違約的民企共149家,占比79.3%;國企39家,占比20.7%。2020年違約國企數(shù)占比已達到29.0%。違約國企不僅包含校企背景的弱資質(zhì)國企,如清華紫光、北大科技園,也有國資委背景的永城煤電、華晨汽車等,國企債剛兌信仰受到較大沖擊。數(shù)據(jù)來源:Wind圖2 違約主體性質(zhì)情況(3)違約主體行業(yè)分布集中于制造業(yè),地域集中于東部地區(qū)從違約主體行業(yè)分布來看(圖3),信用債違約較為集中的行業(yè)包括制造業(yè)、綜合、批發(fā)與零售貿(mào)易、交通運輸與倉儲業(yè)等,制造業(yè)占比達到38%。從違約主體地域分布來看(圖4、圖5),信用債違約集中分布于東部地區(qū)。北京市違約主體數(shù)和違約金額均居于首位,違約主體數(shù)量為27家,違約債券余額為1256.24億元;廣東違約主體數(shù)量居于第二位,江西省、西藏自治區(qū)無違約主體。數(shù)據(jù)來源:Wind圖3 違約主體行業(yè)分布數(shù)據(jù)來源:Wind圖4 違約主體地域分布數(shù)據(jù)來源:Wind圖5 違約主體地域分布地圖(4)違約主體信用評級整體較高從違約主體評級來看,信用債違約主體發(fā)行時和違約前評級均較高,其中AA級主體占比最高,并且評級中樞有上移趨勢。對于發(fā)行時信用主體評級,AA級及以上主體占比為82.8%,對于首次違約前一個月違約主體評級相對分散,AA級及以上主體占比為38.2%,A-級及以上占比為68.4%。2020年廣受關(guān)注的永煤控股、華晨汽車、紫光集團違約前一個月外部評級為均為AAA級。數(shù)據(jù)來源:Wind圖6 違約主體債券發(fā)行時主體評級數(shù)據(jù)來源:Wind圖7 違約主體違約前一月主體評級(5)對市場的影響國內(nèi)債券市場,違約逐步常態(tài)化疊加違約債券處置效率不夠充分(處置時間長、回收率低等1),對市場定價、投資者、企業(yè)都有重大影響。2016年以來市場對信用風(fēng)險的擔(dān)憂逐漸加大,高低等級信用債信用利差逐步走闊,AAA和AA評級的短融、中票評級利差持續(xù)飆升。尤其是自2016年違約事件增多后,高低評級間利差的飛速擴大。從大的經(jīng)濟環(huán)境看,隨著經(jīng)濟增速放緩,發(fā)債主體的經(jīng)營能力和償債能力將會繼續(xù)分化,未來可能的信用風(fēng)險事件暴露將對低等級信用債價格形成持續(xù)性沖擊。另外一方面,債券違約會造成機構(gòu)投資者的持倉久期的變化。在債務(wù)違約高企、信用風(fēng)險加大的背景下,機構(gòu)為了維持流動性穩(wěn)定和控制信用風(fēng)險,紛紛控制持倉久期,越來越傾向于持有短久期的債券。詳見中債研究所2020年報告《債券違約處置機制與債券市場風(fēng)險化解》。相應(yīng)的,發(fā)行人也調(diào)整發(fā)行債券的期限,新發(fā)行的債券中1年以內(nèi)的債券在總體中的占比提升。但從發(fā)行成本上來看,盡管整個債券市場利率有所下行,但是企業(yè)主要的債券融資品種期限在1年以下的短期票據(jù)發(fā)行利率反而是在相對上升的,也反映出機構(gòu)投資者持倉偏好集中加劇競爭。而債券違約帶來的另一個結(jié)構(gòu)是信用債凈融資額減少。違約頻現(xiàn)后,企業(yè)利用債券作為融資渠道的能力下降,信用債凈融資額總體減少,對國內(nèi)資本市場有著不利的影響。2.信用評級體系現(xiàn)狀(1)評級普遍虛高,主體區(qū)分度低目前,國內(nèi)評級機構(gòu)將主體評級主要劃分為9個等級,遵循全球標(biāo)準(zhǔn),但評級尺度不同,從實際評級結(jié)果來看,等級整體分布變化不大,出現(xiàn)了“評級虛高”的現(xiàn)象,大部分發(fā)行人集中在級及以上,且集中度不斷提高,以至于市場認為國內(nèi)的發(fā)行人信用評級只分為五個等級,為AAA級、AA+級、AA級、AA-級和其他等級。由于評級集中度太高,導(dǎo)致評級的風(fēng)險區(qū)分效果較差,無法體現(xiàn)評級對象在行業(yè)、客戶維度上的風(fēng)險差異。例如,同樣是AAA級,個體間風(fēng)險差異太大,既有風(fēng)險極低的大型銀行,也有處于過剩產(chǎn)能、經(jīng)營效益較差的煤炭鋼鐵等企業(yè),評級結(jié)果無法實現(xiàn)有效的風(fēng)險區(qū)分。對比國際三大知名評級公司,以BBB級為投資和投機的分水嶺并在A級、AA級以及AAA級之間實現(xiàn)有效的風(fēng)險區(qū)分。Miles等(2018)實證發(fā)現(xiàn)從平均信用利差來看,中國的AAA(AA+)的信用評級等同于國際評級機構(gòu)A(BBB)評級,中國同一評級的平均利差達到58bps,而美國和歐洲債券市場同一信用評級的平均利差在9bps至18bps,充分顯示了中國債券信用評級區(qū)分度低,無法客觀、準(zhǔn)確、及時地揭示債券的信用風(fēng)險,對投資者的預(yù)警能力不足。(2)評級機構(gòu)主標(biāo)尺與標(biāo)準(zhǔn)不一致,評級結(jié)果無法橫向比較國內(nèi)同一評級機構(gòu)采用統(tǒng)一的主體評級主標(biāo)尺,因此不同的等級符號可以直接排序,即AAA級優(yōu)于AA級優(yōu)于A級,如此類推,甚至兩個同樣為AA級的發(fā)行人也可以進行比較,只要獲得其實際的信用評分即可。但是在不同評級機構(gòu)之間,雖然等級符號及信用等級的核心定義基本一致,但不同評級機構(gòu)的評級標(biāo)準(zhǔn)與質(zhì)量不同,使得等級符號無法直接進行比較,容易導(dǎo)致債券定價的錯亂,投資者需要根據(jù)評級機構(gòu)聲譽來區(qū)別對待不同評級機構(gòu)的信用評級。(3)評級動態(tài)管理不足,預(yù)警功能弱監(jiān)管機構(gòu)往往要求評級機構(gòu)對發(fā)行人進行定期跟蹤,動態(tài)監(jiān)測其信用風(fēng)險水平,必要時采取措施進行風(fēng)險預(yù)警,為投資者提供時效性較強的評級動態(tài)管理。但是違約發(fā)行人評級調(diào)整情況來看,大部分評級機構(gòu)對發(fā)行人的風(fēng)險監(jiān)控不到位,大部分違約主體在違約前至少一個月并沒有被大幅下調(diào)等級,這無法為投資者提供可以信任、可以預(yù)見的信息。比如今年違約事件永城煤電債券主體違約前為AAA級,雖然債券違約為債券市場的正常現(xiàn)象,但是AAA級債券突然違約卻與市場預(yù)期不同,更加凸顯了當(dāng)前債券評級系統(tǒng)未能為投資人提供足夠的客觀評價,未能實現(xiàn)有效的動態(tài)預(yù)警功能。綜上,我國信用債違約趨于常態(tài)化,“剛性兌付”的預(yù)期,“國企信仰”等不斷被打破,我們需要更加市場化的方式預(yù)測債券違約。尤其在我國債券違約處置效率尚不足的背景下,踩雷會給投資者帶來嚴重的威脅,進而對資本市場定價,企業(yè)融資都具有深遠影響。能夠提前得到債券違約預(yù)警,以盡可能降低“踩雷”風(fēng)險,對銀行、基金等風(fēng)險厭惡的債券持有者具有重要意義。然而,我國目前信用評級體系仍然存在評級普遍虛高,主體區(qū)分度低;標(biāo)準(zhǔn)不一致,結(jié)果無法橫向比較;評級動態(tài)管理不足,預(yù)警功能弱等廣為詬病的問題。我們希望基于我國信用債的情況,構(gòu)建一個市場化的,具有區(qū)分度,且具備一定預(yù)警功能的違約評估模型。(二)文獻綜述1.基本logistic模型對于信用債違約風(fēng)險的預(yù)測,國內(nèi)外學(xué)者都做過不同程度的探討。但是最早的信用債違約預(yù)測模型被劃分到了企業(yè)財務(wù)困境預(yù)測模型的范疇,而在企業(yè)財務(wù)困境研究中,多元判別分析模型和logistics模型是最常見的兩種模型。Beaver(1966)和Altman(1968)是最早提出使用判別分析來預(yù)測企業(yè)財務(wù)困境的。Beaver和Altman之后,對財務(wù)困境的預(yù)測的研究逐漸豐富起來。Beaver(1966)考慮了30個他認為可能能夠預(yù)測企業(yè)財務(wù)困境的財務(wù)比率,通過單變量判別分析,具有最佳預(yù)測能力的比率是營運資金占總資產(chǎn)的比率和凈收入占總資產(chǎn)的比率,這兩個比率分別正確識別了樣本中90%和88%的破產(chǎn)企業(yè)和非破產(chǎn)企業(yè)。Altman(1968)是第一個使用多元判別分析來解釋財務(wù)比率在預(yù)測破產(chǎn)中的相互作用的研究。他從22個財務(wù)指標(biāo)中甄選出5個指標(biāo),分別是:營運資本占總資產(chǎn)的比率、留存收益占總資產(chǎn)的比率、息稅前利潤占總資產(chǎn)的比率、權(quán)益市值占債務(wù)賬面值的比率、銷售收入占總資產(chǎn)的比率,然后利用這五個指標(biāo)構(gòu)建了經(jīng)典的Z-score模型,該模型被世界各國廣泛應(yīng)用。1977年,Altman、Haldeman和Narayanan擴展了Z-score模型,將指標(biāo)數(shù)增加到7個,分別反應(yīng)了企業(yè)的資產(chǎn)報酬率、收入的穩(wěn)定性、債務(wù)償還、累計盈利、流動比率、資本化率和規(guī)模這七個方面,建立了第二代的Z-score模型。在國內(nèi),陳靜(1999)最早通過對國內(nèi)市場ST公司的實證分析,建立了判別分析財務(wù)預(yù)警的模型,她建立了一元判別模型和多元判別模型,用于預(yù)測我國上市公司財務(wù)狀況。張玲(2000)、張愛民等(2001)、王麗(2008)等在使用方法和模型的應(yīng)用范圍上做了一定的創(chuàng)新性研究,拓寬了判別分析模型在我國上市公司財務(wù)預(yù)警方面的應(yīng)用。張玲(2000)以中國實際營運上市公司的財務(wù)比率為依據(jù)推導(dǎo)建立了一個財務(wù)危機判別分析模型。張愛民等(2001)在經(jīng)典的Z-Score模型基礎(chǔ)上,采用主成分分析方法,建立了一種新的預(yù)測企業(yè)財務(wù)困境的模型———主成分預(yù)測模型。王麗(2008)通過把我國上市交通運輸企業(yè)數(shù)據(jù)代入現(xiàn)有的經(jīng)典“Z-Score”模型,最終建立了適合我國上市交通運輸行業(yè)財務(wù)預(yù)警的“Z-Score”模型。但是Z-score模型和以Z-score模型為基礎(chǔ)推導(dǎo)建立的其他模型均存在著假設(shè)上的局限性,多元判別分析模型要求自變量的樣本必須服從正態(tài)分布,并且兩類樣本必須具有等協(xié)方差,但是在現(xiàn)實生活中,大部分實際數(shù)據(jù)都不能滿足這個前提假設(shè)。相較于判別分析模型,Logistic等非線性數(shù)值模型沒有這一要求。因而,目前Logistic模型被廣泛應(yīng)用于預(yù)測企業(yè)財務(wù)困境或企業(yè)的違約風(fēng)險。在國外,Ohlson(1980)最早在研究中使用了logit模型,他檢驗了企業(yè)財務(wù)比率和其他因素是否與破產(chǎn)有關(guān)。他的研究不僅關(guān)注模型的預(yù)測能力,還關(guān)注模型的系數(shù)估計。總的來說,他的模型中包括四個方面的變量:總資產(chǎn)與國民生產(chǎn)總值價格水平指數(shù)的比值;總負債與總資產(chǎn)的比值;業(yè)績指標(biāo)或業(yè)績指標(biāo)的組合(營業(yè)收入與總資產(chǎn)的比值和/或經(jīng)營性現(xiàn)金流入與總負債的比值);度量流動性的指標(biāo)(流動資金與總資產(chǎn)的比值、流動資產(chǎn)與流動負債的比值)。Saretto(2004)應(yīng)用一個簡單的分段常數(shù)風(fēng)險模型研究了如何利用財務(wù)比率預(yù)測公司債券違約,以及違約概率如何與預(yù)期股票收益相關(guān)。最后,通過使用logit模型發(fā)現(xiàn),公司的規(guī)模、當(dāng)前業(yè)績、杠桿率、流動性以及所屬的集團/行業(yè)對預(yù)測企業(yè)財務(wù)困境有顯著影響。劉旻(2001)是國內(nèi)比較早應(yīng)用Logistic回歸模型分析上市公司財務(wù)風(fēng)險的,他利用Logistic分析方法,篩選出了11個財務(wù)指標(biāo)并建立預(yù)警模型。戴紅軍等(2009)在傳統(tǒng)財務(wù)預(yù)警指標(biāo)的基礎(chǔ)上加入衡量公司盈余管理程度的預(yù)警指標(biāo),采用主成分分析和Logistic回歸構(gòu)建了企業(yè)財務(wù)危機預(yù)警模型。2014年,“11超日債”成為我國首例違約債券,隨著違約債券日益增多,越來越多的學(xué)者開始關(guān)注信用債券違約風(fēng)險因素。隨著可用數(shù)據(jù)的增多,在樣本選擇上,也不再采用上市公司的ST公司作為企業(yè)違約樣本,而是以在中國債券市場發(fā)行債券并違約的企業(yè)作為樣本。徐占東和王雪標(biāo)(2016)利用Pls提取因子,建立了基于Pls-logit模型的財務(wù)危機預(yù)警模型。潘澤清(2018)應(yīng)用Logistic模型,以國內(nèi)2016、2017年債券違約企業(yè)作為樣本構(gòu)建風(fēng)險預(yù)警模型。實證結(jié)果發(fā)現(xiàn),26個財務(wù)指標(biāo)中,銷售凈利率、總資產(chǎn)增長率、資產(chǎn)負債率、流動負債比率4個財務(wù)指標(biāo)可以作為企業(yè)債務(wù)違約風(fēng)險預(yù)警指標(biāo)。張永東(2019)采用ADASYN過采樣算法,人工合成了違約類與非違約類企業(yè)數(shù)量大致相當(dāng)?shù)臉颖荆瑯?gòu)建了AD-Logistic預(yù)警模型,克服由于非均衡信用債樣本帶來的違約樣本分類預(yù)測精度下降的難題。除了建模外,比較這幾類模型的優(yōu)劣也是一個重要的研究方向。Barniv等(2002)提出logit模型是文獻中最常用的方法。吳世農(nóng)等(2001)以我國上市公司為研究對象,分析了Fisher線性判定分析、多元線性回歸分析和Logistic回歸分析三種方法發(fā)現(xiàn),相對于同一樣本,Logistic預(yù)測模型的錯誤率最低,較多元判別方法和Fisher線性判定分析更加優(yōu)越和穩(wěn)健。李曉奇(2011)通過對比分析各類財務(wù)預(yù)警模型后,得出Logistic回歸模型最適合用于建立我國的財務(wù)預(yù)警模型的結(jié)論。綜上,基于Altman(1968)的經(jīng)典Z-score框架,后續(xù)研究發(fā)現(xiàn)Logistic回歸更適于構(gòu)建信用違約評估模型。而logit回歸和Logistic回歸僅區(qū)別于采用了不同的表達形式,可以相互轉(zhuǎn)化,因此本初步研究將采取線性的logit模型。2.機器學(xué)習(xí)模型隨著大數(shù)據(jù)時代到來,計算機和信息技術(shù)的發(fā)展,許多機器學(xué)習(xí)方法被引入到違約風(fēng)險預(yù)測中去。國外早有學(xué)者將機器學(xué)習(xí)應(yīng)用于信用風(fēng)險測度方面,Odom和Sharda(1990)這兩位學(xué)者是最早在公司破產(chǎn)預(yù)測研究中使用了神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)模型,這兩位學(xué)者采用了Altman所選取的五個財務(wù)指標(biāo)作為神經(jīng)網(wǎng)絡(luò)模型的輸入變量,并將模型與多元判別分析方法做比較,得到的模型預(yù)測準(zhǔn)確率在77%左右,高于多元判別分析方法。McKee(2000)將決策樹模型引入公司破產(chǎn)預(yù)測,得到了比神經(jīng)網(wǎng)絡(luò)模型和多元判別分析方法更高的預(yù)測準(zhǔn)確率。Palaniswami(2000)提出使用支持向量機(SVM)模型來預(yù)測公司破產(chǎn)風(fēng)險,并提出輸入變量的數(shù)量會影響模型的預(yù)測準(zhǔn)確率。Hussian(2014)利用人工神經(jīng)網(wǎng)絡(luò)技術(shù),結(jié)合過往約旦商業(yè)銀行接受和拒絕貸款申請的記錄,建立約旦商業(yè)銀行貸款決策的信用評分模型。Noura(2017)立足銀行信貸收縮背景,提出一種基于遺傳算法GA的輔助銀行進行貸款決策的智能模型,使得銀行減少12%至50%的貸款篩選時間,且能提升銀行3.9%至8.1%的利潤。Chietal.(2021)結(jié)合知識圖譜技術(shù)和深度學(xué)習(xí)算法來預(yù)測債券違約風(fēng)險,取得了較好的預(yù)測結(jié)果。在我國,機器學(xué)習(xí)在信用風(fēng)險測度方面多應(yīng)用于網(wǎng)貸平臺個人信用風(fēng)險的測度。王茂光等(2016)運用C5.0決策算法為核心針對小額網(wǎng)貸平臺的信用風(fēng)險問題進行建模監(jiān)控。丁嵐(2017)基于Stacking集成算法對人人貸交易數(shù)據(jù)建立違約風(fēng)險預(yù)警模型,通過與單一算法對比,發(fā)現(xiàn)集成算法能明顯減少錯誤比例。陳舒期(2019)結(jié)合AdaBoost算法、SOM、K-means聚類算法和BP算法,進而提出一種改進的SSVM集成算法,對個人信用風(fēng)險進行評估,實驗結(jié)果表明該集成算法能有效提高模型泛化能力,分類精度得到了2%的提升。鐘華星(2020)基于某借貸平臺的數(shù)據(jù),首次將RUSBoost算法用于信用風(fēng)險的測度,比與其他機器學(xué)習(xí)方法和傳統(tǒng)回歸方法進行對比分析,結(jié)果顯示針對類別不均衡的數(shù)據(jù),RUSBoost表現(xiàn)出了強勁的適應(yīng)能力。在公司債券風(fēng)險測度的研究方面,國內(nèi)運用機器學(xué)習(xí)方法進行的較其他方法少。HuiLi等(2010)運用CART分類樹算法對上交所和深交所的上市公司進行了財務(wù)風(fēng)險的預(yù)測,結(jié)構(gòu)證實了這個方法的有效性且預(yù)測性能和顯著性檢驗方面均優(yōu)于SVM和KNN方法。盛夏等(2016)選用了2003年至2015年330多條信用評級變動的數(shù)據(jù),在預(yù)測信用評級變動問題上將包括RandomForest、Logistic在內(nèi)的物種機器學(xué)習(xí)模型進行預(yù)測效果的測試,結(jié)果顯示,RandomForest分類模型的預(yù)測能力最強。胡蝶(2018)采用隨機森法(RF),結(jié)合經(jīng)濟邏輯分析,挖掘出了影響債券違約的關(guān)鍵因子。劉逸爽(2018)基于公司財報中的文本內(nèi)容,將管理層語調(diào)與財務(wù)數(shù)據(jù)相結(jié)合,利用決策樹模型和SVM模型構(gòu)建上市公司的信用風(fēng)險預(yù)警模型,實證得出管理層語調(diào)變量的加入確實能提高模型預(yù)警能力,但衡量方法上存在主觀性。張永冬(2019)利ADASYN過采樣算法生成均衡化的新樣本數(shù)據(jù),進而結(jié)合Logistic模型建立債券違約風(fēng)險預(yù)警模型,且已在作者所在授信審批部門得到應(yīng)用,預(yù)警效果良好。鮑俊穎(2021)以債券發(fā)行主體首次違約數(shù)據(jù)為基礎(chǔ),選擇高斯貝葉斯模型和邏輯回歸模型對投資違約債券兌付成功率進行預(yù)測,結(jié)果顯示預(yù)測違約債券投資兌付概率明顯高于樣本平均值,在一定程度上能夠指導(dǎo)債券投資決策。本文采用的XGBoost算法是在GBDT的基礎(chǔ)上改造而來,由陳天奇博士在2015年提出。GBDT僅以決策樹為基分類器,而XGBoost同時支持線性分類器。在諸多機器學(xué)習(xí)算法中,XGBoost作為一種高效的集成學(xué)習(xí)方法,在眾多比賽、項目開發(fā)和研究領(lǐng)域中被廣泛使用,其運行速度和模型性能比其他方法(ANN、SVM和RF)更優(yōu)異(GhoshandPurkayastha,2017;王重仁和韓冬梅,2019)。極端梯度提升樹(XGBoost)采用集成思想,是一種開源的高度可擴展的梯度提升的學(xué)習(xí)方法,其穩(wěn)定性較強,預(yù)測性能優(yōu)異,對數(shù)據(jù)中的噪聲和多重共線性問題敏感度較低,已經(jīng)在各個學(xué)科領(lǐng)域中得到了廣泛應(yīng)用(NobreandNeves,2019;曾宇哲等,2019;茍小菊和王芊,2021)。與傳統(tǒng)梯度提升樹(GBRT)相比,兼具線性規(guī)模求解器和樹學(xué)習(xí)算法。XGBoost通過將正則項引入損失函數(shù)中,且對損失函數(shù)進行了二階泰勒展開,能夠較好地權(quán)衡模型自身的復(fù)雜程度和損失函數(shù)的下降程度,從而可以更好地處理和控制過擬合問題的產(chǎn)生和提高模型的求解效率(王曉暉等,2020)有部分學(xué)者已經(jīng)將XGBoost應(yīng)用到了最新的債券違約預(yù)測中。ZhangandChen(2021)基于合成少數(shù)類過采樣技術(shù)(SMOTE)與極端梯度提升樹(XGboost)算法,提出了SMOTE-XGboost組合債券違約預(yù)測模型,結(jié)果顯示XGboost算法在處理不平衡數(shù)據(jù)方面優(yōu)于傳統(tǒng)算法。周榮喜等(2019)利用隨機森林算法選取影響債券違約的關(guān)鍵特征,發(fā)現(xiàn)具有較高的準(zhǔn)確性。本文也將構(gòu)建基于XGBoost算法的債券違約風(fēng)險預(yù)警模型。(三)第一代模型:基本logistic模型1.方法(1)樣本匹配我們選取所有信用債2015-2020年(截止至10月)的數(shù)據(jù)。通過刪除缺失“總資產(chǎn)”數(shù)據(jù)的變量進行缺失值預(yù)處理,得到有效總樣本90649個,其中違約債券樣本287個。由于違約債券樣本(壞樣本)和未違約債券樣本(好樣本)比例懸殊過高,直接進行回歸估計將存在過度擬合的問題。因此,借鑒Altman(1968)的方法,我們基于行業(yè)、年份、規(guī)模和地區(qū)(省份)四個維度2,以及3-5倍的匹配原則3進行樣本匹配。首先將違約債券的所屬Wind行業(yè)一級分類劃分為4組,如下表所示。表1行業(yè)分組行業(yè)分組Wind行業(yè)一級分類樣本數(shù)樣本占比(%)1工業(yè)8529.62材料3712.892能源124.18可選消費5318.47日常消費248.363房地產(chǎn)227.67醫(yī)療保險20.7信息技術(shù)124.184公用事業(yè)238.01金融175.92總計287100同時,將違約債券所屬省份按照地域及經(jīng)濟發(fā)展水平劃分為8組,如下表所示。Altman(1968)采用了行業(yè)、年份、規(guī)模三個維度進行匹配,考慮到我國債券違約地域性顯著的特征,我們引入地區(qū)(省份)維度。Abadie等(2004)建議一對四匹配。表2地區(qū)分組地區(qū)分組省份樣本數(shù)樣本占比(%)黑龍江省41.391吉林省41.39遼寧省144.88北京3813.242天津20.7河北省217.32河南省41.393山東省227.67山西省175.92上海62.094江蘇省3010.45浙江省269.06福建省93.145廣東省196.62廣西壯族自治區(qū)10.35內(nèi)蒙古自治區(qū)41.39寧夏回族自治區(qū)20.76甘肅省113.83青海省31.05新疆維吾爾自治區(qū)10.35湖北省93.147湖南省20.7安徽省217.32四川省134.538重慶20.7陜西省20.7總計287100針對每個違約樣本,我們選出與其所屬行業(yè)(4組)、地區(qū)(8組)分組相同,且年份一致的樣本,隨機排序4后,按照4個的基準(zhǔn)(3-5個間浮動)篩選規(guī)模近似的“好樣本”進行匹配。最終給2475個壞樣本匹配了870個相似的好樣本,總樣本量為1117個。我們將全部樣本按7:3隨機分為訓(xùn)練組和測試組。(2)基本模型的線性方程以及隨機項我們采用logit模型,通過對指標(biāo)加權(quán)給出每個債券的評分1,2,…,3?通過解釋變量并轉(zhuǎn)換為其違約概率。假設(shè)變量?'011和指標(biāo)相聯(lián)系,22債券違約??==0,1,債券未違約可以得=到1,'=?>0=>?'='因此,保證樣本除4個基本特征外被隨機抽取。從287個經(jīng)過預(yù)處理的樣本中刪除存在缺失值的,最終得到247個有效“壞樣本”。其中,=1,…,相互獨立,=0,1,…,是估計系數(shù)。(3)灰色地帶盡管我們設(shè)計信用債違約模型時進行各項調(diào)試盡可能提高了其準(zhǔn)確性,利用得到的模型進行預(yù)測時依然會存在估計錯誤,而且概率并非低到可以忽略。尤其在判別債券是否會違約的臨界點附近,壞樣本和好樣本的區(qū)別更加模糊。因此,我們借鑒Altman(1968)的方法,識別出這一灰色地帶,以進一步降低投資者更加關(guān)注的二類錯誤率。根據(jù)Altman的研究,存在“灰色地帶”,即可以觀察到錯誤分類的Z-score范圍,當(dāng)Z-score處于灰色地帶時,模型是失效的,我們無法根據(jù)Z-score有效判斷公司是否有破產(chǎn)風(fēng)險。同樣,在本文研究中,logit回歸擬合結(jié)果同樣存在灰色地帶,需要確認灰色地帶的范圍。由于違約公司部分特質(zhì)存在特異性,模型解釋力有限,灰色地帶將比Z-score模型中的范圍更大,若根據(jù)所有出現(xiàn)錯誤的樣本對應(yīng)的值確定灰色地帶的上下界,那么大部分可以正常預(yù)測的樣本也將歸入這個范圍,模型可正常預(yù)測區(qū)間極小。對此,本文將根據(jù)出現(xiàn)錯誤樣本的概率,獲得一個能將大部分錯誤樣本包含在內(nèi)的灰色地帶范圍,確認時主要遵循以下幾個原則:(1)由于實務(wù)中對存在違約風(fēng)險的公司的識別更為重視,因此我們主要關(guān)注二類錯誤,即更關(guān)注灰色地帶下界的確定,上界則定為之前確定的分界點;(2)盡量將出現(xiàn)二類錯誤的樣本歸入灰色地帶;(3)在盡量降低二類錯誤率的基礎(chǔ)上,保證整體錯誤率足夠低。2.指標(biāo)構(gòu)建模型中的因變量為債券是否違約,具體的,包含未按時兌付本息、展期等Wind中包含的所有違約類型。自變量為影響債券違約的因素,包含5大類26個指標(biāo)。我們旨在從中篩選出最具有解釋力度的變量,構(gòu)建信用債違約評估模型。指標(biāo)庫基于基礎(chǔ)債項指標(biāo)和國家開發(fā)銀行6采用的基本財務(wù)指標(biāo),包括衡量債券主體的公司規(guī)模、償債能力、盈利能力、成長能力和營運能力。我們在償債能力中引入指標(biāo)“貨幣資金占短期有息負債比”,并加入債項指標(biāo),融資成本指標(biāo),企業(yè)性質(zhì)指標(biāo)以及地區(qū)發(fā)展指標(biāo)四大類。全部指標(biāo)如下表所示。表3指標(biāo)庫數(shù)據(jù)來源:所有財務(wù)數(shù)據(jù)來自Wind,地區(qū)數(shù)據(jù)來自國家統(tǒng)計局,CSMAR和財政部官網(wǎng)。含類別變量名算法義有無擔(dān)保有擔(dān)保人=1,無擔(dān)保人=0人債項發(fā)行規(guī)模債券的實際發(fā)行總額指標(biāo)對于非增發(fā)的固定利率/浮動利率/累進利票面利率率債券,提取其上一財年末所在計息周期的票面利率參見《國開信用評級手冊附冊一:評級工具與參數(shù)》。發(fā)行期限從起息日至到期日的時間長度總資產(chǎn)公主營業(yè)務(wù)司規(guī)模收入資產(chǎn)負債總資產(chǎn)/總負債率EBITDA利(營業(yè)利潤+折舊+攤銷+財務(wù)費用)/財務(wù)費息倍數(shù)用流動比率流動資產(chǎn)/流動負債速動比率(流動資產(chǎn)-存貨)/流動負債償帶息負債(短期借款+一年內(nèi)到期的長期負債+長期債能力比率負債+應(yīng)付利息)/負債總額基本現(xiàn)金流動財務(wù)指標(biāo)經(jīng)營現(xiàn)金凈流入/年末流動負債負債比率貨幣資金占短期有息負貨幣資金/(短期借款+應(yīng)付債券)債比毛利率主營業(yè)務(wù)利潤/主營業(yè)務(wù)收入營業(yè)利潤主營業(yè)務(wù)利潤/主營業(yè)務(wù)收入凈額率盈利能力總資產(chǎn)報息稅前利潤總額/平均資產(chǎn)總額酬率ROE凈利潤/平均所有者權(quán)益主營業(yè)務(wù)成收入同比增長長能力率凈利潤同比增長率總資產(chǎn)周主營業(yè)務(wù)收入凈額/平均資產(chǎn)總額轉(zhuǎn)率應(yīng)收賬款營主營業(yè)務(wù)收入凈額/應(yīng)收賬款平均余額周轉(zhuǎn)率運能力存貨周轉(zhuǎn)主營業(yè)務(wù)成本/存貨平均余額率凈財務(wù)費(利息支出+手續(xù)費+其它財務(wù)費用)/負債用與負債比合計融資凈財務(wù)費成本指標(biāo)((利息支出+手續(xù)費+其它財務(wù)費用)/負用與負債比債合計)/ROA/ROA企業(yè)是否為國國企=1,非國企=0性質(zhì)企地區(qū)GDP發(fā)展指標(biāo)(四)Logistic模型結(jié)果1.變量選擇我們從自變量間相關(guān)性低,logit回歸的顯著性(變量的解釋力度)高以及模型的預(yù)測能力(主要考察測試組二類錯誤率)高三個標(biāo)準(zhǔn)篩選變量。首先通過計算自變量兩兩相關(guān)系數(shù),標(biāo)識出相關(guān)系數(shù)絕對值大于0.6的指標(biāo)組合(在這些組合內(nèi)后續(xù)篩選最多保留1個變量)。進一步,通過逐步加入變量法進行回歸,比對了不同指標(biāo)的顯著性以及模型最終的精度,確定了8個預(yù)測能力最好的指標(biāo):債券有無擔(dān)保人、發(fā)行規(guī)模、票面利率、發(fā)行期限,發(fā)債主體EBITDA利息倍數(shù)、貨幣資金占短期有息負債比、凈財務(wù)費用與負債比以及是否為國企7,如下表所示。表4模型指標(biāo)指標(biāo)計算方法含義有無擔(dān)有擔(dān)保人=1,無擔(dān)保人=0保人發(fā)行規(guī)債券的實際發(fā)行總額模債項指標(biāo)票面利對于非增發(fā)的固定利率/浮動利率/累進利率債券,提率取其上一財年末所在計息周期的票面利率發(fā)行期從起息日至到期日的時間長度限EBITDA(營業(yè)利潤+折舊+攤銷+財務(wù)費用)/財務(wù)費用利息倍數(shù) 衡量償債能力貨幣資貨幣資金/(短期借款+應(yīng)付債券)金占短期有由于我們基于行業(yè)、年份、規(guī)模和地區(qū)(省份)四個維度進行了樣本匹配,衡量公司規(guī)模、盈利能力、成長能力和運營能力的基礎(chǔ)財務(wù)指標(biāo)以及地區(qū)發(fā)展指標(biāo)在回歸模型中不再顯著。息負債比凈財務(wù) 凈財務(wù)費用/公司總負債衡量融費用與負債 凈財務(wù)費用為利息支出、手續(xù)費支出、其他財務(wù)費用資成本比的總和。是否為衡量企國企=1,非國企=0國企業(yè)性質(zhì)2.最終模型(1)相關(guān)系數(shù)表5相關(guān)系數(shù)貨幣資凈有發(fā)票發(fā)EB金占財務(wù)是變量無擔(dān)行規(guī)面利行期ITDA利短期費用否為保人模率限息倍數(shù)有息與負國企負債債比比1.無擔(dān)保人000發(fā)-0.1.行規(guī)模093000票0.-0.1.面利率113213000發(fā)0.0.-0.1.行期限241217041000EB0.-0.-0ITDA利0000030430190息倍數(shù)貨幣資金-0.0.-0.-0.0.021.占短期0180100200140000有息負債比凈0.-0.0.-0.-0.06-0.1.財務(wù)費0391333642470037000用與負債比是-0.0.-4-0.-0.1.否為國0090774573030018454000企變量間的相關(guān)系數(shù)均小于0.5,在合理范圍內(nèi)。(2)logit回歸結(jié)果表6第一列給出了全樣本回歸結(jié)果,第二列給出了將樣本隨機分為訓(xùn)練組和測試組后訓(xùn)練組的結(jié)果。表6回歸結(jié)果(1)(2)全樣本訓(xùn)練組變量defaultdefault有無擔(dān)保人-1.344***-0.930**(0.366)(0.435)發(fā)行規(guī)模0.0572***0.0631**(0.0207)(0.0258)票面利率0.328***0.417***(0.107)(0.135)發(fā)行期限-0.209***-0.214**(0.0807)(0.102)EBITDA利息倍數(shù)-0.198***-0.240***(0.0340)(0.0436)貨幣資金占短期有息負債比-0.0100***-0.0112***(0.00291)(0.00363)凈財務(wù)費用與負債比0.412***0.467***(0.0782)(0.0977)是否為國企-2.340***-2.450***(0.310)(0.368)Constant-1.782*-2.353**(0.914)(1.131)Observations951673Standarderrorsinparentheses***p<0.01,**p<0.05,*p<0.1基礎(chǔ)債項指標(biāo)中,有無擔(dān)保人和發(fā)行規(guī)模對于全樣本在1%的置信度下顯著影響債券是否違約,訓(xùn)練組中在5%的置信度下顯著;票面利率和發(fā)行期限在全樣本和訓(xùn)練組中都在1%的置信度下顯著。衡量償債能力的EBITDA利息倍數(shù)、貨幣資金占短期有息負債比,衡量融資成本的凈財務(wù)費用與負債比以及是否為國企在全樣本和訓(xùn)練組中都在1%的置信度下顯著影響債券是否違約。擔(dān)保人是除了發(fā)行債券的公司和購買方的第三方,一般債券的擔(dān)保人包括政府、銀行或者發(fā)行公司財力雄厚的母公司等。當(dāng)發(fā)行公司無力支付利息時,由擔(dān)保人承擔(dān)相應(yīng)的付息還本的義務(wù)。一般來講,有擔(dān)保人的發(fā)行公司信用風(fēng)險較低。首先,有擔(dān)保人的債券信用風(fēng)險較小。政府或者銀行在對公司進行擔(dān)保前,一定會進行充分詳盡的背景調(diào)查,然后再為信用良好財務(wù)風(fēng)險小的公司做擔(dān)保。反過來,有債券擔(dān)保人也可以證明發(fā)行公司所暴露的信用風(fēng)險較小。因此是否有擔(dān)保人就成為可以判斷公司債券風(fēng)險高低低的直接標(biāo)準(zhǔn)。其次,有擔(dān)保人的債券更不容易發(fā)生擠兌風(fēng)險。當(dāng)有擔(dān)保人時,債權(quán)人的權(quán)利得到了雙重保障,從而對負面消息的耐受度更強。因此,較小的負面輿論不會過度發(fā)酵,保證了發(fā)行公司的資金使用效率,而且避免了因為擠兌而加劇甚至造成嚴重的短期流動性風(fēng)險,更有利于公司繼續(xù)還本付息。進一步的,有當(dāng)?shù)卣蛘咩y行做擔(dān)保,說明發(fā)行公司在當(dāng)?shù)赜幸欢ǖ挠绊懥?,也是公司業(yè)務(wù)能力財務(wù)水平的一種間接證明。而一般在地方有影響力的公司盈利能力更好,也更不容易發(fā)生違約。一般而言,公司的發(fā)行規(guī)模越大,債券的違約概率就越大。首先,發(fā)行的規(guī)模越大,公司的還款壓力越大。簡單來說,債券發(fā)行規(guī)模越大說明公司所背負的債務(wù)越大,還款難度有所上升,自然違約可能也會增大。另外,發(fā)行規(guī)模越大,間接反映出公司的財務(wù)壓力越大。說明公司現(xiàn)有的盈利能力不足以彌補資金需求。這些支出可能有負面的,例如彌補虧損,也可能是積極的,例如公司可能處于業(yè)務(wù)拓展或者升級階段。但不論如何,都說明了目前公司的財務(wù)狀況處于一些風(fēng)險之下,因此這些債券發(fā)生違約的可能性也會增加。票面利率與債券違約概率有顯著關(guān)系,因為票面利率是債券發(fā)行主體信用評級的直接體現(xiàn)。票面利率越大,發(fā)生違約的概率越大。首先,票面利率與企業(yè)的信用評級高度相關(guān)。票面利率低說明發(fā)行公司信用風(fēng)險小。反之,票面利率高則說明發(fā)行公司信用風(fēng)險較大,這樣的債券本身風(fēng)險就相對較高,發(fā)生違約的概率也就較高。另外,雖然信用債券的利率主要由發(fā)行主體的信用評級決定,但是也是以無風(fēng)險利率為基準(zhǔn)的。在忽略時間限制的情況下,比較不同年份發(fā)行的債券時,票面利率越高隱含可能無風(fēng)險利率越高。但是一般無風(fēng)險利率高點都處于經(jīng)濟增長低迷的時段。對于一些順周期的行業(yè)例如能源、建筑、地產(chǎn)等,容易受到經(jīng)濟下行的影響,若未來經(jīng)濟持續(xù)下行,或者因短期經(jīng)濟下行引發(fā)財務(wù)危機,都會增加債務(wù)違約的可能。發(fā)行期限也顯著影響債券違約概率。一般而言,發(fā)行期限長,要求發(fā)行主體的信用等級越高。因此發(fā)行期限就較短的債券本身就包含了一部分信用風(fēng)險較高的公司所發(fā)行的債券,甚至包括一些因為短期財務(wù)危機而對資金有迫切需求的公司。另一方面,發(fā)行期限短的債券,短期資金成本比長期資金成本要低,在經(jīng)濟上行時其風(fēng)險被掩蓋,一旦經(jīng)濟下行,公司盈利能力下降,就有可能導(dǎo)致違約的發(fā)生。EBITDA利息倍數(shù)是衡量償債能力的常用指標(biāo)。EBITDA利息倍數(shù)是企業(yè)生產(chǎn)經(jīng)營所獲得的息稅前利潤,與利息費用的比率(企業(yè)息稅前利潤與利息費用之比)。它是衡量企業(yè)支付利息能力的重要指標(biāo)。企業(yè)生產(chǎn)經(jīng)營所獲得的息稅前利潤與利息費用相比,倍數(shù)越大,企業(yè)的應(yīng)付利息相對其盈利而占比越小,支付利息費用的能力越強,債券越不易違約。貨幣資金占短期有息負債比是基于機器學(xué)習(xí),最新提出的衡量償債能力的指標(biāo)。這個指標(biāo)是貨幣資金/(短期借款+應(yīng)付債券)計算得出,也是從資金結(jié)構(gòu)上體現(xiàn)企業(yè)的償債能力。但是與一般的流動比率不同,它更加關(guān)注短期以現(xiàn)金償付債務(wù)的能力,反映公司財務(wù)狀況是否存在突發(fā)性違約的資金斷裂可能。這種資金斷裂可能來自于內(nèi)部經(jīng)營性現(xiàn)金流或外部融資性現(xiàn)金流惡化。相比其他的流動比率,該指標(biāo)更能及時體現(xiàn)企業(yè)的償債能力。流動比率中除了貨幣資產(chǎn),還包括了一些對于償債價值并不太高的資產(chǎn)例如短期投資和存貨,而貨幣資金是流動資產(chǎn)中流動性最好的資產(chǎn),也是對于債權(quán)人安全系數(shù)最高的資產(chǎn)。因此貨幣資金占短期有息負債比可以更好地反應(yīng)負債企業(yè)無力償債的可能。企業(yè)貨幣資金占短期有息負債越高,償債能力越強,違約概率越低。凈財務(wù)費用與負債比是參考張偉華等(2018)使用的衡量上市公司債務(wù)融資成本的指標(biāo)。該指標(biāo)為凈財務(wù)費用與公司總負債的比值。凈財務(wù)費用為利息支出、手續(xù)費支出、其他財務(wù)費用的總和,直接地體現(xiàn)了企業(yè)負債的資金總成本,即融資成本。除了償債能力,融資成本也是影響違約概率的重要因素。一方面,融資成本越高,在負債已存在的前提下,企業(yè)付出的成本越高,還款的難度越大,違約可能性越高;另一方面,融資成本越高,反應(yīng)企業(yè)不惜一切代價的借款行為,說明其內(nèi)部很可能已經(jīng)出現(xiàn)資金鏈斷裂等情況,違約可能性更高。國企發(fā)行債券的違約概率較低。一方面,國企本身有政府背書,且與銀行關(guān)系較好,在財務(wù)危機面前更有可能獲得銀行的資金渡過難關(guān)。因此國有企業(yè)的債券信用風(fēng)險較低,違約概率也較低。另一方面,國有企業(yè)一旦違約,不僅造成國企債券的擠兌,以至于破產(chǎn),更會對債券市場造成較大的負面影響,甚至有可能在一定范圍內(nèi)引發(fā)信用危機,造成嚴重的連鎖反應(yīng)。這樣嚴重的后果會形成倒逼機制,使得國有企業(yè)及當(dāng)?shù)卣畷M最大可能不違約,甚至放棄一定的經(jīng)濟利益。在這種強烈的軟約束下,國企的違約率會大大降低。但值得注意的是,2020年11月下旬,河南省政府旗下的永城煤電控股集團一筆評級為AAA的短期融資券發(fā)生違約,打破了國有企業(yè)的剛付神話。隨著國家去杠桿進一步深化,雖然國有企業(yè)在付息能力方面仍然具有一定優(yōu)勢,但其優(yōu)勢將會不斷減弱。3.模型準(zhǔn)確度在確保總體準(zhǔn)確率較高的情況下,盡量使得二類錯誤率降低,我們調(diào)整判別債券是否違約的臨界點(cutoff值)為0.47。也即,模型估計出的違約概率高于0.47認為該債券會違約,反之,若模型估計出的違約率低于0.47,則認為該債券不會違約。得到模型估計準(zhǔn)確度結(jié)果如下圖所示。表7模型準(zhǔn)確度違約債券未違約債券+-TypeII+-TypeICorrectlyerrorerrorclassified全樣本1963515.15%426785.83%91.90%訓(xùn)練組1422414.46%284795.52%92.27%測試組571014.93%6219723.94%77.91%全樣本中,總的準(zhǔn)確率達到91.90%,二類錯誤率為15.15%。樣本隨機分為訓(xùn)練組和測試組后,測試組總的準(zhǔn)確率為77.91%,二類錯誤率為14.93%??傮w來看,對于投資者而言15%左右的二類錯誤率仍有優(yōu)化空間,因此我們在下一節(jié)中識別并去除灰色地帶進行調(diào)整。4.去除灰色地帶結(jié)果首先,觀察圖表8好樣本與壞樣本logit擬合值的核密度圖,可以看到,好壞樣本的預(yù)測值存在較大重合,說明確實存在無法用模型進行解釋的范圍。但同時,好樣本預(yù)測值的分布是右偏的,集中度很高,說明我們?nèi)钥梢愿鶕?jù)本文模型進行擬合并給出投資建議。101505kdensityyhat.81x好樣本yhat核密度曲線壞樣本yhat核密度曲線圖8好/壞樣本

核密度圖圖表9是臨界點為0.47時二類錯誤分類樣本預(yù)測值的直方圖,可以看到二類錯誤分類樣本預(yù)測值集中區(qū)域的左端點在0.05至0.07附近。1086Density4200.1.2Pr(default).3.4.5圖9二類錯誤分類樣本

直方圖(臨界點=0.47)根據(jù)對二類錯誤率和總預(yù)測正確率的權(quán)衡比較,隨著cutoff減小,當(dāng)cutoff為0.06時,二類錯誤率處于較低水平,總正確率高于cutoff為0.05和0.07時,因此最終確定0.06為灰色地帶左端點。以下是去除灰色地帶后模型的準(zhǔn)確度結(jié)果。表8模型準(zhǔn)確度(去除灰色地帶)違約債券未違約債券+-TypeII+-TypeICorrectlyerrorerrorclassified全樣本19631.51%425227.45%94.10%訓(xùn)練組14232.07%283776.91%94.36%測試組5746.56%6215129.11%75.91%去除灰色地帶后,模型總體準(zhǔn)確率僅略有升高,但二類錯誤率顯著降低,從20%左右減少到全樣本的2%左右和測試組的7%以內(nèi)。5.小結(jié)我們借鑒Altman(1968)構(gòu)建Z-score的框架,經(jīng)過樣本匹配解決了非均衡信用債樣本問題,利用logit模型構(gòu)建了我國信用債違約的評估模型。最后,模型包含有無擔(dān)保人、發(fā)行規(guī)模、票面利率、發(fā)行期限、EBITDA利息倍數(shù)、貨幣資金占短期有息負債比、凈財務(wù)費用與負債比、是否為國企8個指標(biāo),主要從債券性質(zhì),企業(yè)償債能力、融資成本和是否國企的性質(zhì)四個維度衡量債券的違約概率。最終,去除好壞樣本的預(yù)測值存在較大重合的灰色地帶后,取臨界違約概率為0.06時,測試組樣本總體準(zhǔn)確率達到75%,二類錯誤率低于7%。第二代模型:引入市場因素和Xgboost機器學(xué)習(xí)模型1.1.引入市場因素在第一代模型的基礎(chǔ)上,我們首先對指標(biāo)庫進行了補充,引入了市場因素。姜富偉等(2021)在最新的workingpaper中指出,影響債券收益的并不完全類似于我們傳統(tǒng)分析股票收益的那些指標(biāo),而是流動性與價格下行風(fēng)險。參考他們和ChenxiYinghui等(2020)的做法,我們新增構(gòu)建了6個流動性指標(biāo)和8個下行風(fēng)險指標(biāo)。具體的,流動性指標(biāo)包括:Bond-nonzerotrade(窗口區(qū)間有交易的天數(shù)占比);Turnover;High-lowSpread;Dispersion;比率;Amihud比率。下行風(fēng)險指標(biāo)包括:ES5_收益率;ES10_收益率;ES5_估價收益率中債;ES10_估價收益率中債;VaR5_收益率;VaR10_收益率;VaR5_估價收益率中債;VaR10_估價收益率中債。(五)第二代模型:Xgboost機器學(xué)習(xí)模型1.引入市場因素在第一代模型的基礎(chǔ)上,我們首先對指標(biāo)庫進行了補充,引入了市場因素。姜富偉等(2021)在最新的workingpaper中指出,影響債券收益的并不完全類似于我們傳統(tǒng)分析股票收益的那些指標(biāo),而是流動性與價格下行風(fēng)險。參考他們和ChenxiYinghui等(2020)的做法,我們新增構(gòu)建了6個流動性指標(biāo)和8個下行風(fēng)險指標(biāo)。具體的,流動性指標(biāo)包括:Bond-nonzerotrade(窗口區(qū)間有交易的天數(shù)占比);Turnover;High-lowSpread;Dispersion;比率;Amihud比率。下行風(fēng)險指標(biāo)包括:ES5_收益率;ES10_收益率;ES5_估價收益率中債;ES10_估價收益率中債;VaR5_收益率;VaR10_收益率;VaR5_估價收益率中債;VaR10_估價收益率中債。9流動性和下行風(fēng)險指標(biāo)指標(biāo)計算方法含義Bond-nonze窗口期內(nèi)有交易的天數(shù)占總交易日天數(shù)rotradeTurnover 平均日交易量/債券余額High-low平均日最高價-最低價Spread流動性指標(biāo)Dispersion價格分散度,參考Jankowitsch等(2011)HH比率參考Hui和Heubel(1984)Amihud比率

參考Amihud(2002)ES5_收益 基于收益率計算,5%置信水平損失的條件期望率值ES10_收益基于收益率計算,10%置信水平損失的條件期望率值下行風(fēng)險ES5_估價基于中債估價收益率計算,5%置信水平損失的指標(biāo)收益率中債 條件期望值ES10_估價 基于中債估價收益率計算,10%置信水平損失的收益率中債 條件期望值VaR5_收益率VaR10_收益率VaR5_估價收益率中債VaR10_估價收益率中債

基于收益率計算,5%置信水平的VaR值基于收益率計算,10%置信水平的VaR值基于中債估價收益率計算,5%置信水平的VaR值基于中債估價收益率計算,10%置信水平的VaR值姜富偉等(2021)由于中國債券市場交易數(shù)據(jù)不完善的原因,僅采用美國數(shù)據(jù)為樣本進行了研究。我們采用了中國債券的數(shù)據(jù),其中在構(gòu)建下行風(fēng)險度量指標(biāo)時,采用了中債估值收益率,發(fā)現(xiàn)構(gòu)建的指標(biāo)對債券違約有極好的預(yù)測效果。2.樣本和數(shù)據(jù)在第二代模型中,我們選取所有信用債2015-2021年(截止11月)的數(shù)據(jù)。同樣通過樣本匹配后,構(gòu)建出由1478個債券形成的總樣本,其中違約債券樣本342個。我們首先按照7:3的比例隨機劃分訓(xùn)練集和測試集,并進一步用2015-2020的樣本作為訓(xùn)練集,2021的樣本作為測試集進行檢驗。在因子選取上,包含了第一代模型指標(biāo)庫中所有變量和新加入的市場因素(流動性和下行風(fēng)險指標(biāo))。其中,財務(wù)指標(biāo)選取發(fā)行人上一財年年報數(shù)據(jù),交易指標(biāo)選取違約/到期前30-365天數(shù)據(jù)。3.Xgboost模型結(jié)果通過Xgboost模型,我們得到最有力度的解釋指標(biāo)依次為:VaR10_估價收益率中債,是否為國企,ROE,凈財務(wù)費用與負債比,EBITDA利息倍數(shù),ES5_收益率,票面利率,VaR5_估價收益率中債,Dispersion(詳細指標(biāo)解釋力度圖,見附表1)。同樣按照在確保總體準(zhǔn)確率較高的情況下,盡量使得二類錯誤率降低的原則,我們在Xgboost模型中劃定的臨界點(cutoff值)為0.016。此時30%的測試組總體估計準(zhǔn)確率為87.162%,二類錯誤率為0.935%,僅有2019年債券19方正SCP002(011900493.IB)的違約未被模型識別出。進一步的,用2021的樣本作為測試集進行檢驗,在該標(biāo)準(zhǔn)下,所有違約樣本都能在違約前1個月被識別出。4.預(yù)測外樣本分析:以19方正SCP002為例由于機器學(xué)習(xí)模型存在“黑匣子”效應(yīng),較難拆解其估計過程進行解釋,因此我們利用其篩選出解釋力度強的指標(biāo),并剔除高度自相關(guān)變量后,回到Logistic模型分析預(yù)測外樣本的具體情況。選取的自變量為VaR10_估價收益率中債,是否為國企,ROE,凈財務(wù)費用與負債比,ES5_收益率,票面利率,Dispersion。Logit模型結(jié)果:表10Logit模型驗證結(jié)果VARIABLESdefault票面利率0.529***(0.0931)國企-1.688***(0.242)EBITDA利息倍數(shù)-0.0682**(0.0265)ROE-0.0151***(0.00489)凈財務(wù)費用與負債比14.43**(7.289)Dispersion0.242***(0.0383)VaR10_估價收益cell0.0718***(0.0212)Constant-4.906***(0.675)Observations1,050票面EBITDA凈財務(wù)費DispeVaR10_估預(yù)測Id國企ROE用與負債價收益率違約利率利息倍數(shù)r-sion比中債概率19方正511.68-1.720.030.134.990.038SCP002未違約債券14.830.020.334.25平均表1119方正SCP002債券數(shù)據(jù)圖1019方正SCP002中債估值圖1119方正SCP002評級調(diào)整19方正SCP002成為預(yù)測外樣本的原因在于市場對其公司實力和信譽持有很高的信心,所以忽略了其經(jīng)營不良的現(xiàn)狀。從模型結(jié)果看,其盈利狀況和償債能力都存在隱患,但是從交易的流動性和下行風(fēng)險看卻均沒有被市場捕捉到危機,再加上國企背景加成,使得其估計違約率并不高。另外,附表3針對2021年銀行間債券市場違約樣本,給出了Xgboost模型估計違約率與中債隱含違約率對比的情況。參考文獻鮑俊穎,施成湘.機器學(xué)習(xí)在我國高收益?zhèn)顿Y中的應(yīng)用研究[J].重慶第二師范學(xué)院學(xué)報,2021,第34卷(3):15-20,127.曾宇哲,吳嬡博,鄭宏遠,羅來娟.基于機器學(xué)習(xí)的車險索賠頻率預(yù)測[J].統(tǒng)計與信息論壇,2019,34(5):69-78.陳靜.上市公司財務(wù)惡化預(yù)測的實證分析[J].會計研究,1999(04):32-39.陳舒期,梁雪春.改進的SSVM集成算法在信用風(fēng)險評估中的應(yīng)用[J].計算機工程與設(shè)計,2019,40(10):2822-2826.戴紅軍,冀隆煒.基于主成分和Logistic的上市公司財務(wù)危機預(yù)警模型研究[J].淮南師范學(xué)院學(xué)報,2009,11(01):129-133.丁嵐,駱品亮.基于Stacking集成策略的P2P網(wǎng)貸違約風(fēng)險預(yù)警研究[J].投資研究,2017,36(04):41-54.茍小菊,王芊.基于數(shù)據(jù)挖掘技術(shù)的股票收益率方向研究[J].運籌與管理,2021,30(01):163-169.胡蝶.基于隨機森林的債券違約分析[J].當(dāng)代經(jīng)濟,2018(03):28-30.李曉奇.上市公司財務(wù)風(fēng)險預(yù)警Logistic模型的研究[D].北京交通大學(xué),2011.劉旻.上市公司財務(wù)狀況異常的預(yù)警分析[J].管理現(xiàn)代化,2001(02):38-42.劉逸爽,陳藝云.管理層語調(diào)與上市公司信用風(fēng)險預(yù)警——基于公司年報文本內(nèi)容分析的研究[J].金融經(jīng)濟學(xué)研究,2018,33(04):46-54.潘澤清.企業(yè)債務(wù)違約風(fēng)險Logistic回歸預(yù)警模型[J].上海經(jīng)濟研究,2018(08):73-83.錢蘋,羅玫.中國上市公司財務(wù)造假預(yù)測模型[J].會計研究,2015(07):18-25+96.盛夏,李斌,張迪.基于數(shù)據(jù)挖掘的上市公司信用評級變動預(yù)測[J].統(tǒng)計與決策,2016(15):159-162.王麗.基于“Z-Score”模型的我國上市交通運輸企業(yè)財務(wù)預(yù)警研究[D].中國民航大學(xué),2008.王茂光,葛蕾蕾,趙江平.基于C5.0算法的小額網(wǎng)貸平臺的風(fēng)險監(jiān)控研究[J].中國管理科學(xué),2016,24(S1):345-352.王曉暉,張亮,李俊清,孫玉翠,田捷,韓睿毅.基于遺傳算法與隨機森林的 XGBoost 改進方法研究[J].計算機科學(xué),2020,47(S2):454-458+463.王重仁,韓冬梅.基于超參數(shù)優(yōu)化和集成學(xué)習(xí)的互聯(lián)網(wǎng)信貸個人信用評估[J].統(tǒng)計與決策,2019,35(1):87-91.巫和懋,林佳和巫厚瑋.從信用債違約事件看中國債券市場改革.經(jīng)濟觀察報2020(11).吳世農(nóng),盧賢義.我國上市公司財務(wù)困境的預(yù)測模型研究[J].經(jīng)濟研究,2001(06):46-55+96.徐占東,王雪標(biāo).一種利用Pls提取因子的財務(wù)危機預(yù)警模型[J].數(shù)學(xué)的實踐與認識,2016,46(02):50-61.楊忠儉,裴國軍.我國信用債市場主體評級問題分析及建議[J].債券,2017(1),:56-61.張愛民,祝春山,許丹健.上市公司財務(wù)失敗的主成分預(yù)測模型及其實證研究[J].金融研究,2001(03):10-25.張玲.財務(wù)危機預(yù)警分析判別模型及其應(yīng)用[J].預(yù)測,2000(06):38-40.張偉華,毛新述,劉凱璇.利率市場化改革降低了上市公司債務(wù)融資成本嗎?[J].金融研究,2018(10):106-122.張永東.基于非均衡樣本的信用債違約風(fēng)險預(yù)警研究[J].南方金融,2019(01):5-14.張永東.基于非均衡樣本的信用債違約風(fēng)險預(yù)警研究[J].南方金融,2019(01):5-14.中金:信用事件對債市的影響邏輯和后續(xù)展望/omn/20201115/20201115A08E5J00.html鐘華星.基于RUSBoost算法的違約風(fēng)險預(yù)測模型構(gòu)建與應(yīng)用[J].財會月刊,2020(10):74-80.周榮喜,彭航,李欣宇,閆宇歆.基于XGBoost算法的信用債違約預(yù)測模型[J].債券,2019(10):61-68.A.FanandM.Palaniswami,Anewapproachtocorporateloandefaultpredictionfromfinancialstatements,Proc.ComputationalFinance/ForecastingFinancialMarketsConf.CF/FFM-2000,2000(5).Abadie,A.,D.Drukker,J.L.Herr,andG.W.Imbens,2004.”ImplementingMatchingEstimatorsforAverageTreatmentEffectsinStata,”TheStataJournal,4,290-311.Altman,E.I.,1968.Financialratios,discriminantanalysisandthepredictionofcorporatebankruptcy.JournalofFinanceXXIII(4),589–609.Beaver,W.H.,1966.Financialratiosaspredictorsoffailure.EmpiricalResearchinAccounting:SelectedStudies4(3),71–111.ChiM,HongyanS,ShaofanW,etal.BondDe[1]faultPredictionBasedonDeepLearningandKnowledgeGraphTechnology[J].IEEEAccess,2021,9:12750-12761.GhoshR,PurkayasthaP.Forecastingprofitabili[1]tyinequitytradesusingrandomforest,supportvectormachineandXgboost[C]//Proceedingsofthe10thInter[1]nationalConferenceonRecentTrendsinEngineeringScienceandManagement,Chennai,India.2017:14-15.HuiLi,JieSun,JianWu.Predictingbusinessfailureusingclassificationandregressiontree:Anempiricalcomparisonwithpopularclassicalstatisticalmethodsandtopclassificationminingmethods[J].ExpertSystemsWithApplications,2010,37(8).HussainAliBekhet,ShorouqFathiKamelEletter.CreditriskassessmentmodelforJordaniancommercialbanks:Neuralscoringapproach[J].ReviewofDevelopmentFinance,2014,4(1).IbrahimOnurOz,CanSimga-Mugan.Bankruptcypredictionmodels'generalizability:Evidencefromemergingmarketeconomies.2018,41:114-125.Jankowitsch,R.,Nashikkar,A.,&Subrahmanyam,M.G.PricedispersioninOTCmarkets:Anewmeasureofliquidity.JournalofBanking&Finance,2011,35,1669-1702.Livingston,Miles,Poon,Winnie,P.,H.,andZhou,etal.,2018.AreChinesecreditratingsrelevant?astudyoftheChinesebondmarketandcreditratingindustry.JournalofBankingandFinance.M.OdomandR.Sharda,Aneuralnetworkmodelforbankruptcyprediction[J].Proc.Int.JointConf.NeuralNetworks,1990.NobreJ,NevesRF.Combiningprincipalcomponentanalysis,discretewavelettransformandXGBoosttotradeinthefinancialmarkets[J].ExpertSystemswithApplications,2019,125:181-194.NouraMetawa,M.KabirHassan,MohamedElhoseny.Geneticalgorithmbasedmodelforoptimizingbanklendingdecisions[J].ExpertSystemsWithApplications,2017,80.Ohlson,J.A.,1980.Financialratiosandtheprobabilisticpredictionofbankruptcy.JournalofAccountingResearch18(1),109–131.Saretto,A.A.,2004.Predictingandpricingtheprobabilityofdefault.UCLAResearchPaper.ThomasE.McKee,MarilynGreenstein.Predictingbankruptcyusingrecursivepartitioningandarealisticallyproportioneddataset[J].JournalofForecasting,2000,19(3).XuanZhang,RuolanOuyang,DingLiu,etal.DeterminantsofcorporatedefaultriskinChina:Theroleoffinancialconstraints.2020,92:87-98.YaseenGhulam,JulianDerber.Determinantsofsovereigndefaults.2017,69.ZhangY,ChenL.AStudyonForecastingtheDe[1]faultRiskofBondBasedonXGboostAlgorithmandOver-SamplingMethodTheoreticalEconomicsLet[1]ters,2021,11(2):258.附錄附表1var1var2var3var4var5var6var7

有無擔(dān)保人發(fā)行規(guī)模票面利率發(fā)行期限行業(yè)國企GDPvar8var9var10var11

總資產(chǎn)主營業(yè)務(wù)收入資產(chǎn)負債率EBITDA利息倍數(shù)var12var13var14var15var16

流動比率速動比率帶息負債比率現(xiàn)金流動負債比率貨幣資金占短期有息負債比var17毛利率var18營業(yè)利潤率var19總資產(chǎn)報酬率var20ROEvar21主營業(yè)務(wù)收入同比增長率var22凈利潤同比增長率var23總資產(chǎn)周轉(zhuǎn)率var24應(yīng)收賬款周轉(zhuǎn)率var25存貨周轉(zhuǎn)率var26凈財務(wù)費用與負債比var27凈財務(wù)費用與負債比ROAvar28Bond-nonzerotradevar29Turnovervar30High-lowSpreadvar31Dispersionvar32HH

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論