兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用_第1頁
兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用_第2頁
兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用_第3頁
兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用_第4頁
兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用        第10卷第12期南陽師范學(xué)院學(xué)報Vol10 No.122011年12月Journal of Nanyang Normal University Dec2011收稿日期:20110728作者簡介:徐昕(1979),河南鄭州人,博士,講師,主要從事風(fēng)險管理與保險精算研究兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用徐昕1,郭念國2(1首都經(jīng)濟(jì)貿(mào)易大學(xué)金融學(xué)院,北京100070;2河南工業(yè)大學(xué)理學(xué)院,河南鄭州450001)     

2、; 摘要:討論了兩種分布形式的零膨脹負(fù)二項回歸模型,并應(yīng)用一組實際汽車保險損失數(shù)據(jù)對兩類模型進(jìn)行了實證比較結(jié)果表明,對于具有零膨脹特征的損失數(shù)據(jù),零膨脹負(fù)二項回歸模型的擬合結(jié)果優(yōu)于普通索賠頻率回歸模型      關(guān)鍵詞:零膨脹;負(fù)二項分布;回歸模型;索賠頻率     中圖分類號:F 84065;O29文獻(xiàn)標(biāo)識碼:A文章編號:16716132(2011)12001805    0引言    汽車保險定價中純保費的計算一般需要兩個過程,即首先計算投保車輛的索賠頻率,然后

3、計算投保車輛的索賠額度,二者的乘積即是汽車保險的純保費由此可以看出,索賠頻率是汽車保險定價的基礎(chǔ)傳統(tǒng)的泊松回歸模型是索賠頻率預(yù)測模型中最常用的模型,具有均值等于方差的特性然而,對于汽車保險的實際損失數(shù)據(jù),通常是方差大于均值或者是具有零膨脹特征,即索賠次數(shù)在零點處的概率堆積產(chǎn)生零膨脹現(xiàn)象的原因有很多,通常表現(xiàn)為下面三種情況:一則由于許多保單都有免賠額,這樣會使投保人對事故損失小于免賠額時,不申請索賠;另外大多數(shù)保險公司采用獎懲系統(tǒng)(bo-nus-malus systems,簡記BMS),使得保單持有人發(fā)生事故時會權(quán)衡利益得失,再決定是否索賠;還有一種是投保人購買了汽車保險之后,因某些原因而不使用

4、投保車輛,也就沒有相應(yīng)的索賠在這些情況下,傳統(tǒng)的泊松回歸模型不能滿足假設(shè)條件,繼續(xù)使用都可能導(dǎo)致在保險定價過程中高估參數(shù)的標(biāo)準(zhǔn)誤差,低估其顯著性水平,從而導(dǎo)致不公平保費對零膨脹現(xiàn)象的研究最早可以追溯到Johnson和Kotz1,兩人只是在理論上做了初步研究Lam-ber2首次將零膨脹泊松回歸模型應(yīng)用到實際中,并對制造業(yè)中的焊接點的瑕疵數(shù)據(jù)進(jìn)行了擬合分析之后,零膨脹模型在精算領(lǐng)域中的應(yīng)用也逐漸受到學(xué)者的關(guān)注Yip和Yau3運用不同的零膨脹模型對一組車險數(shù)據(jù)的索賠頻率進(jìn)行了擬合比較分析,討論了多種常用的零膨脹回歸模型在非壽險精算中的應(yīng)用Jean-Philippe Boucher等4用幾類零膨脹混合

5、泊松和Hurdle模型對一組西班牙車險損失數(shù)據(jù)進(jìn)行了研究,并對模型進(jìn)行了詳細(xì)比較,得到了較好的擬合效果Jong和Heller5在廣義線性模型的框架內(nèi)對壽險數(shù)據(jù)的統(tǒng)計分析進(jìn)行了梳理,并結(jié)合實際數(shù)據(jù)對零膨脹模型進(jìn)行了應(yīng)用分析近年來,國內(nèi)學(xué)者對零膨脹模型在精算領(lǐng)域的研究成果也越來越多劉源、徐昕6初步探討了保險實務(wù)中的多零問題徐昕、尹占華、郭念國7研究了零膨脹泊松、零膨脹負(fù)二項以及Hurdle模型在非壽險精算中的應(yīng)用,利用一組實際車險數(shù)據(jù)對模型進(jìn)行了擬合驗證,擬合效果得到了改善徐昕、袁衛(wèi)、孟生旺8討論了一類新的零膨脹廣義泊松回歸模型ZIGP()模型在非壽險定價中的應(yīng)用,并利用該模型對Yip和Yau的汽

6、車保險損失數(shù)據(jù)進(jìn)行了擬合比較,得到了較好的效果郭念國9對零次索賠現(xiàn)象進(jìn)行了分析,并提出修正的零膨脹泊松模型孟生旺、王維10利用零膨脹泊松回歸、零膨脹負(fù)二項回歸、零膨脹廣義泊松回歸和零膨脹模型對一組耳病發(fā)生頻率的損失數(shù)據(jù)進(jìn)行了擬合,結(jié)果表明,當(dāng)實際數(shù)據(jù)存在零膨脹特點時,零膨脹回歸模型可以顯著改善對實際損失數(shù)據(jù)的擬合效果在上述的研究中雖然不同學(xué)者討論了不同的零膨脹回歸模型,但對零膨脹模型的研究仍然不夠系統(tǒng)全面比如,負(fù)二項模型的研究中,理論上講負(fù)二項回歸模型有兩種不同的分布類型,所以其相應(yīng)的零膨脹負(fù)二項回歸模型也有相應(yīng)的兩種分布類型前人的研究中并未討論兩類分布形式的零膨脹第12期徐昕等:兩類零膨脹負(fù)

7、二項回歸模型在汽車保險定價中的應(yīng)用負(fù)二項回歸模型,尤其在精算領(lǐng)域本文將討論兩種分布形式的零膨脹負(fù)二項回歸模型,并利用SASEnterprise Miner中所用數(shù)據(jù)對模型進(jìn)行擬合分析,并將擬合結(jié)果與傳統(tǒng)泊松回歸模型進(jìn)行比較1泊松回歸模型為便于討論,假設(shè)共有p個分類變量,將所有保單分為n個風(fēng)險類別,其中第i個風(fēng)險類別在p個分類變量上的取值用xi=(xi1,xip)T表示,T表示轉(zhuǎn)置用wi表示第i個類別包含的風(fēng)險單位數(shù)(如汽車保險中的車年數(shù))令Yi表示第i個風(fēng)險類別的索賠次數(shù)隨機(jī)變量,i=1,2,n如果Yi服從泊松分布,則其概率函數(shù)為:Pr (Yi=y)i=exp()iiyiyi!,yi=0,1,

8、(1)泊松分布的均值與方差相等,即E (Y)i=Var (Y)i=i若令i=wiexp xiT(),即可得到泊松回歸模型,其中是p×1階的參數(shù)向量容易求得泊松回歸模型的對數(shù)似然函數(shù)為:l=ni=1(lnyi!+yilnii)回歸參數(shù)的極大似然估計可以通過下述似然方程組求得:lj=ni=1(yi)ixij=0,j=1,2,p為了求得參數(shù)估計的標(biāo)準(zhǔn)誤差,首先需要計算Hessian矩陣,其中的元素是關(guān)于對數(shù)似然函數(shù)的二階偏導(dǎo)數(shù),即Hjk=2ljk=ni=1ixijxik,j,k=1,2,p因此信息矩陣的元素為Ijk=E(Hjk)=ni=1ixijxik,j,k=1,2,p對信息矩陣對角線上

9、的元素先求倒數(shù),然后再開方,即可得到參數(shù)估計的標(biāo)準(zhǔn)誤差2兩類零膨脹負(fù)二項回歸模型的參數(shù)估計21零膨脹回歸模型的一般分布形式假設(shè)索賠次數(shù)隨機(jī)變量Yi是服從一個零膨脹結(jié)構(gòu)的分布函數(shù),為結(jié)構(gòu)零比例參數(shù),Yi的分布函數(shù)可以表示為:Pr Yi(=0)=+(1)Pr Ki(=0),Pr Yi(=y)i=(1)Pr Ki(=y)i,yi=1,2,(2)其中Ki可以是傳統(tǒng)的泊松分布或其他形式的離散分布,參數(shù)為常數(shù),且01索賠次數(shù)Yi的均值和方差分別為:E(Yi)=(1)E (K)i,Var(Yi)=(1)Var (K)i+(EK)i    2   

10、22兩類零膨脹負(fù)二項回歸模型參數(shù)估計221零膨脹負(fù)二項回歸模型(zero-inflatednegative binomial,ZINB)一般來講,根據(jù)負(fù)二項回歸模型的均值與方差關(guān)系來確定其屬于負(fù)二項類分布類型還是負(fù)二項類分布類型由于最常見的負(fù)二項回歸模型屬第類型,因其方差可以看做是均值的二次函數(shù),因此這里先討論ZINB分布函數(shù)及其參數(shù)估計在泊松回歸中,一般假設(shè)風(fēng)險類別是同質(zhì)的,即均值i在每個風(fēng)險類別中固定不變?nèi)绻L(fēng)險是非同質(zhì)的,即在每一個風(fēng)險類別中不同的個體風(fēng)險具有不同的i,假設(shè)i服從均值為E()i=i,方差為Var()i=k2i的伽瑪分布,則風(fēng)險類別的索賠次數(shù)將服從下述負(fù)二項分布:Pr Ki

11、(=y)i=yi+k11y()ik1k1+()ik1·ik1+()iyi,yi=0,1,(3)上述的負(fù)二項分布的均值為E (K)i=i,方差分別為Var (K)i=i (1+k)i,其中k表示散度參數(shù),因方差是均值的二次函數(shù),所以上述負(fù)二項分布即為負(fù)二項分布當(dāng)k趨于零時,其極限分布即為泊松分布當(dāng)k0時,負(fù)二項分布的方差大于其均值,即具有過離散特征把上述負(fù)二項分布的概率函數(shù)代入式子(3)中,因01,不妨令=exp(a)1+exp(a),即可得到零膨脹負(fù)二項分布(ZINB),其均值和方差分別為E (Y)i=(1)i=i1+ea,Var (Y)i=E (Y)i1+i (1+k)E (Y)i

12、對負(fù)二項分布的均值i作回歸,使用對數(shù)連接函數(shù)i=wiexp (XT),則零膨脹負(fù)二項回歸的對數(shù)似然函數(shù)可以表示為lZINB=nln(1+ea)+yi=0ln ea+(1+ki)k1+yi0yi1r=1ln(1+kr)yiln(k)ln(yi!)+yiln(ki)(yi+k1)ln(1+ki)·19·南陽師范學(xué)院學(xué)報第10卷對于ZINB回歸模型的參數(shù)估計,可以利用Newton-Raphson迭代方法求解參數(shù)的迭代方程可以表示為(m)=(m1)+I(m1)1U(m1),其得分向量的信息矩陣中的元素Uj,j=1,2,p可以表示為:Uj=lj=yi0(yi)i1+kixijyi=0

13、i(1+k)i1+k1ea+1+kixij,2ljs=yi=0(1+k)ik1eai (1)i+i(1+k)i2(1+k)ik1ea+12·xijxisyi0i (1+ky)i(1+k)i2xijxis令信息矩陣中的元素為Ijs,j,s=1,2,p,則有Ijs=E2ljs=yi=0(1+k)ik1eai (1)i+i(1+k)i2(1+k)ik1ea+12xijxis+yi0i1+kixijxis求解參數(shù)a時,仍然利用迭代方程a(m)=a(m1)GG',G與G'的表達(dá)式分別為G=la=nea1+ea+yi=0eaea+(1+k)ik1,G'=2la2=nea(

14、1+ea )2+yi=0ea(1+k)ik1ea+(1+k)ik1 2離散參數(shù)k的估計可以用矩估計,即令Pearson2統(tǒng)計量與其自由度相等而得到參數(shù)k的估計值為iyiE (y)i2Var (y)i=np,其中n是觀測值個數(shù),p是待估參數(shù)個數(shù)求解上述方程可以利用Newton-Raphson迭代公式K(m)=K(m1)MM',其中M和M'的表達(dá)式分別為:M=iyii1+e()a2i1+ea1+i (1+k)i1+ea(np),M'=Mk=iyii1+e()a211+ea1+i (1+k)i1+ea222零膨脹負(fù)二項回歸模型(zero-inflatednegative bi

15、nomial,ZINB)如果風(fēng)險類別的索賠次數(shù)服從下述ZINB分布:Pr Ki=yi xi=(ik1+yi)(ik1)(yi+1)k11+k()1ik111+k()1yi,yi=0,1,(4)就可以得到ZINB回歸模型,其均值和方差為E (Y)i=(1)i=i1+ea,Var (Y)i=E (Y)i1+k+iE (Y)i對ZINB分布的均值i做回歸,使用對數(shù)連接函數(shù)i=wiexp (XT),則ZINB回歸模型的對數(shù)似然函數(shù)可以表示為lnLZINB=yi=0ln+(1)11()+kik+yi0ln (1)+lnyi+ik(1)lnyi(+1 )lnik(1)+ik1lnk1yi+ik(1 )ln

16、 1+k()1對于ZINB回歸模型,求解參數(shù)、k、a的迭代過程與ZINB相同,此處不再詳述3擬合優(yōu)度檢驗對不同模型的擬合優(yōu)度進(jìn)行比較的兩個常用標(biāo)準(zhǔn)是AIC和BIC統(tǒng)計量AIC統(tǒng)計量定義為(Akaike11):AIC=2l+2p,(5)其中l(wèi)表示對數(shù)似然值,p為參數(shù)的個數(shù)AIC的值越小,表明模型的擬合越好BIC統(tǒng)計量定義為(Schwartz12):BIC=2l+plog(n),(6)其中的l也表示對數(shù)似然值,p為模型的參數(shù)個數(shù),n為觀測值的個數(shù),BIC的值越小,模型擬合越好4實證分析41數(shù)據(jù)描述本文使用的數(shù)據(jù)來自SAS Enterprise Miner數(shù)據(jù)庫中的汽車保險數(shù)據(jù),Yip和Yau在研究

17、非壽險精算中索賠次數(shù)模型時也利用了這組數(shù)據(jù),他們分別選取了五個費率因子及近一年的索賠數(shù)據(jù)為了便于比較,本文使用相同的費率因子和損失數(shù)據(jù),具體見表142索賠次數(shù)擬合結(jié)果從表2的結(jié)果可以看出,兩類ZINB模型的擬合結(jié)果對零次索賠的預(yù)測比較準(zhǔn)確,對其他次數(shù)的預(yù)測值也比較接近實際觀測值再根據(jù)對數(shù)似然值、AIC、BIC準(zhǔn)則,兩類零膨脹負(fù)二項模型對索賠次數(shù)的擬合效果最好·20·第12期徐昕等:兩類零膨脹負(fù)二項回歸模型在汽車保險定價中的應(yīng)用表1費率因子費率因子因子水平性別女性(基準(zhǔn)水平)男性婚姻狀況未婚(基準(zhǔn)水平)已婚汽車用途私人用途(基準(zhǔn)水平)商務(wù)用途行駛區(qū)域郊區(qū)(基準(zhǔn)水平)市區(qū)收入連

18、續(xù)變量43回歸模型擬合結(jié)果表3為零膨脹回歸模型的擬合結(jié)果,從結(jié)果中可以看出,無論是比較AIC還是BIC,兩類ZINB回歸模型的值都是最小的,因此可以認(rèn)為,對于該組數(shù)據(jù)而言,ZINB回歸模型的擬合效果相對較好另外,從兩類ZINB回歸模型的擬合結(jié)果來看,對于每一個費率因子的參數(shù)估計值基本相同,兩者細(xì)微差別在于每個費率因子的標(biāo)準(zhǔn)誤差的估計略有不同最后,結(jié)構(gòu)零的比例參數(shù)在不同的零膨脹模型中的顯著性恰恰說明了給定的索賠數(shù)據(jù)確實服從零膨脹結(jié)構(gòu)模型表2觀測索賠頻數(shù)與擬合索賠頻數(shù)次數(shù)實際觀測到的索賠次數(shù)泊松分布負(fù)二項()負(fù)二項()零膨脹負(fù)二項()零膨脹負(fù)二項()0 1706 1245 1634 1634 17

19、06 17061 351 1014 620 620 423 4232 408 413 283 283 357 3573 268 112 137 137 201 2014 74 23 68 68 85 855 5 4 34 34 29 29比例參數(shù)05177(001130)05177(003624)散度參數(shù)K11489 11405 2454×108 1049×107泊松均值08151(001703)*08151(002496)*08151(002496)*16899*16899(003624)*2Loglikelihood75655 70020 70020 66952 669

20、52AIC75675 70060 70060 67012 67012BIC75735 70178 70178 67190 67190注:*表示在水平為5%下是顯著的;()表示參數(shù)估計值的標(biāo)準(zhǔn)誤差表3零膨脹回歸模型擬合結(jié)果估計參數(shù)泊松負(fù)二項()負(fù)二項()零膨脹負(fù)二項()零膨脹負(fù)二項()截距12388(008910)*14210(01239)*12187(01045)*05619(004197)*05619(003082)*用途02750(004487)*03100(005835)*02895(006387)*01489(005139)*01489(005013)*婚姻狀況01083(004260

21、)*009429(005582)01430(005976)01108(004877)*01107(004557)*行駛區(qū)域13919(008367)*16012(01158)*14071(009705)*12298(002655)*12298(007199)*收入002825(0004937)*003305(0006519)*003087(0006731)*001741(0005842)*001740(0005501)*性別01124(004393)*01341(005737)*01187(006147)005042(04468)005102(005063)散度參數(shù)K09522(007953)

22、*10309(008473)40427×107*40427×108*比例參數(shù)04468(001424)*04468(001408)*2Log-Likelihood 71184 66683 67492 65365 65365AIC 71304 66823 67632 65525 65525BIC 71660 67239 68048 66000 66000注:*表示在水平為5%下是顯著的;()表示參數(shù)估計值的標(biāo)準(zhǔn)誤差·21·南陽師范學(xué)院學(xué)報第10卷5小結(jié)本文討論了兩類不同分布函數(shù)類型的零膨脹負(fù)二項回歸模型的參數(shù)估計以及擬合優(yōu)度檢驗,并利用一組實際的汽車保險損

23、失數(shù)據(jù)對兩類模型進(jìn)行了實證分析51當(dāng)索賠數(shù)據(jù)存在零膨脹特性時,零膨脹負(fù)二項回歸模型較一般的索賠頻率預(yù)測模型如泊松回歸模型、負(fù)二項回歸模型的擬合效果更優(yōu)52對于該組數(shù)據(jù)而言,雖然兩類零膨脹負(fù)二項模型對參數(shù)估計的擬合結(jié)果較為接近,但對于其他損失數(shù)據(jù)可能會得到不同的結(jié)果因此,利用兩種類型的零膨脹負(fù)二項回歸模型可以為精算人員提供更為豐富的預(yù)測工具參考文獻(xiàn)1Johnson N L,Kotz SDistribution in Statistics:discretedistributionMNew York:Wiley,19692Lambert DZero-inflated poisson regressi

24、on,with anapplication to defects in manufacturingJTechnomet-ric,1992,34:1143Yip K C H,Yau K K WOn Modeling Claim Frequen-cy Data in General Insurance with Extra ZerosJIn-surance:Mathematics and Economics,2005(36):1531634Jean-Philippe B,Michel D,Montserrat GRisk classifi-cation for claim counts:a com

25、parative analysis of variouszero-inflated mixed poisson and hurdle modelsJNorthAmerican Actuarial Journal,2007(11):1101315Jong P D,Heller G ZGeneralized Linear Models forInsurance DataMCambridge:Cambridge UniversityPress,20086劉源,徐昕保險精算中的多零索賠現(xiàn)象探析J統(tǒng)計與決策,2008(21):21237徐昕,尹占華,郭念國零膨脹模型在非壽險中應(yīng)用J統(tǒng)計教育,2009(4

26、):31338徐昕,袁衛(wèi),孟生旺零膨脹廣義泊松回歸模型與保險費率厘定J數(shù)學(xué)的實踐與認(rèn)識,2009(24):991079郭念國零膨脹泊松模型的改進(jìn)在零次索賠建模中的應(yīng)用J統(tǒng)計與信息論壇,2010(7):222510孟生旺,王維零膨脹損失次數(shù)回歸模型及其應(yīng)用J蘭州商學(xué)院學(xué)報,2011(1):1711Aike HInformation theory and an extension of the maxi-mum likelihood principleproceedings of the 2nd inter-national symposium on information theoryJAka-demiai Kiade Budapest,1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論