兩類零膨脹負二項回歸模型在汽車保險定價中的應用

上傳人：7*** IP屬地：湖北上傳時間：2022-02-02 格式：DOC 頁數(shù)：5 大小：27.50KB 積分：15 舉報 版權(quán)申訴

全文預覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

1、兩類零膨脹負二項回歸模型在汽車保險定價中的應用第10卷第12期南陽師范學院學報Vol10 No.122011年12月Journal of Nanyang Normal University Dec2011收稿日期:20110728作者簡介:徐昕(1979)，河南鄭州人，博士，講師，主要從事風險管理與保險精算研究兩類零膨脹負二項回歸模型在汽車保險定價中的應用徐昕1，郭念國2(1首都經(jīng)濟貿(mào)易大學金融學院，北京100070;2河南工業(yè)大學理學院，河南鄭州450001)

2、; 摘要:討論了兩種分布形式的零膨脹負二項回歸模型，并應用一組實際汽車保險損失數(shù)據(jù)對兩類模型進行了實證比較結(jié)果表明，對于具有零膨脹特征的損失數(shù)據(jù)，零膨脹負二項回歸模型的擬合結(jié)果優(yōu)于普通索賠頻率回歸模型關鍵詞:零膨脹;負二項分布;回歸模型;索賠頻率中圖分類號:F 84065;O29文獻標識碼:A文章編號:16716132(2011)12001805 0引言汽車保險定價中純保費的計算一般需要兩個過程，即首先計算投保車輛的索賠頻率，然后

3、計算投保車輛的索賠額度，二者的乘積即是汽車保險的純保費由此可以看出，索賠頻率是汽車保險定價的基礎傳統(tǒng)的泊松回歸模型是索賠頻率預測模型中最常用的模型，具有均值等于方差的特性然而，對于汽車保險的實際損失數(shù)據(jù)，通常是方差大于均值或者是具有零膨脹特征，即索賠次數(shù)在零點處的概率堆積產(chǎn)生零膨脹現(xiàn)象的原因有很多，通常表現(xiàn)為下面三種情況:一則由于許多保單都有免賠額，這樣會使投保人對事故損失小于免賠額時，不申請索賠;另外大多數(shù)保險公司采用獎懲系統(tǒng)(bo-nus-malus systems，簡記BMS)，使得保單持有人發(fā)生事故時會權(quán)衡利益得失，再決定是否索賠;還有一種是投保人購買了汽車保險之后，因某些原因而不使用

4、投保車輛，也就沒有相應的索賠在這些情況下，傳統(tǒng)的泊松回歸模型不能滿足假設條件，繼續(xù)使用都可能導致在保險定價過程中高估參數(shù)的標準誤差，低估其顯著性水平，從而導致不公平保費對零膨脹現(xiàn)象的研究最早可以追溯到Johnson和Kotz1，兩人只是在理論上做了初步研究Lam-ber2首次將零膨脹泊松回歸模型應用到實際中，并對制造業(yè)中的焊接點的瑕疵數(shù)據(jù)進行了擬合分析之后，零膨脹模型在精算領域中的應用也逐漸受到學者的關注Yip和Yau3運用不同的零膨脹模型對一組車險數(shù)據(jù)的索賠頻率進行了擬合比較分析，討論了多種常用的零膨脹回歸模型在非壽險精算中的應用Jean-Philippe Boucher等4用幾類零膨脹混合

5、泊松和Hurdle模型對一組西班牙車險損失數(shù)據(jù)進行了研究，并對模型進行了詳細比較，得到了較好的擬合效果Jong和Heller5在廣義線性模型的框架內(nèi)對壽險數(shù)據(jù)的統(tǒng)計分析進行了梳理，并結(jié)合實際數(shù)據(jù)對零膨脹模型進行了應用分析近年來，國內(nèi)學者對零膨脹模型在精算領域的研究成果也越來越多劉源、徐昕6初步探討了保險實務中的多零問題徐昕、尹占華、郭念國7研究了零膨脹泊松、零膨脹負二項以及Hurdle模型在非壽險精算中的應用，利用一組實際車險數(shù)據(jù)對模型進行了擬合驗證，擬合效果得到了改善徐昕、袁衛(wèi)、孟生旺8討論了一類新的零膨脹廣義泊松回歸模型ZIGP()模型在非壽險定價中的應用，并利用該模型對Yip和Yau的汽

6、車保險損失數(shù)據(jù)進行了擬合比較，得到了較好的效果郭念國9對零次索賠現(xiàn)象進行了分析，并提出修正的零膨脹泊松模型孟生旺、王維10利用零膨脹泊松回歸、零膨脹負二項回歸、零膨脹廣義泊松回歸和零膨脹模型對一組耳病發(fā)生頻率的損失數(shù)據(jù)進行了擬合，結(jié)果表明，當實際數(shù)據(jù)存在零膨脹特點時，零膨脹回歸模型可以顯著改善對實際損失數(shù)據(jù)的擬合效果在上述的研究中雖然不同學者討論了不同的零膨脹回歸模型，但對零膨脹模型的研究仍然不夠系統(tǒng)全面比如，負二項模型的研究中，理論上講負二項回歸模型有兩種不同的分布類型，所以其相應的零膨脹負二項回歸模型也有相應的兩種分布類型前人的研究中并未討論兩類分布形式的零膨脹第12期徐昕等:兩類零膨脹負

7、二項回歸模型在汽車保險定價中的應用負二項回歸模型，尤其在精算領域本文將討論兩種分布形式的零膨脹負二項回歸模型，并利用SASEnterprise Miner中所用數(shù)據(jù)對模型進行擬合分析，并將擬合結(jié)果與傳統(tǒng)泊松回歸模型進行比較1泊松回歸模型為便于討論，假設共有p個分類變量，將所有保單分為n個風險類別，其中第i個風險類別在p個分類變量上的取值用xi=(xi1，xip)T表示，T表示轉(zhuǎn)置用wi表示第i個類別包含的風險單位數(shù)(如汽車保險中的車年數(shù))令Yi表示第i個風險類別的索賠次數(shù)隨機變量，i=1，2，n如果Yi服從泊松分布，則其概率函數(shù)為:Pr (Yi=y)i=exp()iiyiyi!，yi=0，1，

8、(1)泊松分布的均值與方差相等，即E (Y)i=Var (Y)i=i若令i=wiexp xiT()，即可得到泊松回歸模型，其中是p×1階的參數(shù)向量容易求得泊松回歸模型的對數(shù)似然函數(shù)為:l=ni=1(lnyi!+yilnii)回歸參數(shù)的極大似然估計可以通過下述似然方程組求得:lj=ni=1(yi)ixij=0，j=1，2，p為了求得參數(shù)估計的標準誤差，首先需要計算Hessian矩陣，其中的元素是關于對數(shù)似然函數(shù)的二階偏導數(shù)，即Hjk=2ljk=ni=1ixijxik，j，k=1，2，p因此信息矩陣的元素為Ijk=E(Hjk)=ni=1ixijxik，j，k=1，2，p對信息矩陣對角線上

9、的元素先求倒數(shù)，然后再開方，即可得到參數(shù)估計的標準誤差2兩類零膨脹負二項回歸模型的參數(shù)估計21零膨脹回歸模型的一般分布形式假設索賠次數(shù)隨機變量Yi是服從一個零膨脹結(jié)構(gòu)的分布函數(shù)，為結(jié)構(gòu)零比例參數(shù)，Yi的分布函數(shù)可以表示為:Pr Yi(=0)=+(1)Pr Ki(=0)，Pr Yi(=y)i=(1)Pr Ki(=y)i，yi=1，2，(2)其中Ki可以是傳統(tǒng)的泊松分布或其他形式的離散分布，參數(shù)為常數(shù)，且01索賠次數(shù)Yi的均值和方差分別為:E(Yi)=(1)E (K)i，Var(Yi)=(1)Var (K)i+(EK)i 2

10、22兩類零膨脹負二項回歸模型參數(shù)估計221零膨脹負二項回歸模型(zero-inflatednegative binomial，ZINB)一般來講，根據(jù)負二項回歸模型的均值與方差關系來確定其屬于負二項類分布類型還是負二項類分布類型由于最常見的負二項回歸模型屬第類型，因其方差可以看做是均值的二次函數(shù)，因此這里先討論ZINB分布函數(shù)及其參數(shù)估計在泊松回歸中，一般假設風險類別是同質(zhì)的，即均值i在每個風險類別中固定不變?nèi)绻L險是非同質(zhì)的，即在每一個風險類別中不同的個體風險具有不同的i，假設i服從均值為E()i=i，方差為Var()i=k2i的伽瑪分布，則風險類別的索賠次數(shù)將服從下述負二項分布:Pr Ki

11、(=y)i=yi+k11y()ik1k1+()ik1·ik1+()iyi，yi=0，1，(3)上述的負二項分布的均值為E (K)i=i，方差分別為Var (K)i=i (1+k)i，其中k表示散度參數(shù)，因方差是均值的二次函數(shù)，所以上述負二項分布即為負二項分布當k趨于零時，其極限分布即為泊松分布當k0時，負二項分布的方差大于其均值，即具有過離散特征把上述負二項分布的概率函數(shù)代入式子(3)中，因01，不妨令=exp(a)1+exp(a)，即可得到零膨脹負二項分布(ZINB)，其均值和方差分別為E (Y)i=(1)i=i1+ea，Var (Y)i=E (Y)i1+i (1+k)E (Y)i

12、對負二項分布的均值i作回歸，使用對數(shù)連接函數(shù)i=wiexp (XT)，則零膨脹負二項回歸的對數(shù)似然函數(shù)可以表示為lZINB=nln(1+ea)+yi=0ln ea+(1+ki)k1+yi0yi1r=1ln(1+kr)yiln(k)ln(yi!)+yiln(ki)(yi+k1)ln(1+ki)·19·南陽師范學院學報第10卷對于ZINB回歸模型的參數(shù)估計，可以利用Newton-Raphson迭代方法求解參數(shù)的迭代方程可以表示為(m)=(m1)+I(m1)1U(m1)，其得分向量的信息矩陣中的元素Uj，j=1，2，p可以表示為:Uj=lj=yi0(yi)i1+kixijyi=0

13、i(1+k)i1+k1ea+1+kixij，2ljs=yi=0(1+k)ik1eai (1)i+i(1+k)i2(1+k)ik1ea+12·xijxisyi0i (1+ky)i(1+k)i2xijxis令信息矩陣中的元素為Ijs，j，s=1，2，p，則有Ijs=E2ljs=yi=0(1+k)ik1eai (1)i+i(1+k)i2(1+k)ik1ea+12xijxis+yi0i1+kixijxis求解參數(shù)a時，仍然利用迭代方程a(m)=a(m1)GG'，G與G'的表達式分別為G=la=nea1+ea+yi=0eaea+(1+k)ik1，G'=2la2=nea(

14、1+ea )2+yi=0ea(1+k)ik1ea+(1+k)ik1 2離散參數(shù)k的估計可以用矩估計，即令Pearson2統(tǒng)計量與其自由度相等而得到參數(shù)k的估計值為iyiE (y)i2Var (y)i=np，其中n是觀測值個數(shù)，p是待估參數(shù)個數(shù)求解上述方程可以利用Newton-Raphson迭代公式K(m)=K(m1)MM'，其中M和M'的表達式分別為:M=iyii1+e()a2i1+ea1+i (1+k)i1+ea(np)，M'=Mk=iyii1+e()a211+ea1+i (1+k)i1+ea222零膨脹負二項回歸模型(zero-inflatednegative bi

15、nomial，ZINB)如果風險類別的索賠次數(shù)服從下述ZINB分布:Pr Ki=yi xi=(ik1+yi)(ik1)(yi+1)k11+k()1ik111+k()1yi，yi=0，1，(4)就可以得到ZINB回歸模型，其均值和方差為E (Y)i=(1)i=i1+ea，Var (Y)i=E (Y)i1+k+iE (Y)i對ZINB分布的均值i做回歸，使用對數(shù)連接函數(shù)i=wiexp (XT)，則ZINB回歸模型的對數(shù)似然函數(shù)可以表示為lnLZINB=yi=0ln+(1)11()+kik+yi0ln (1)+lnyi+ik(1)lnyi(+1 )lnik(1)+ik1lnk1yi+ik(1 )ln

16、 1+k()1對于ZINB回歸模型，求解參數(shù)、k、a的迭代過程與ZINB相同，此處不再詳述3擬合優(yōu)度檢驗對不同模型的擬合優(yōu)度進行比較的兩個常用標準是AIC和BIC統(tǒng)計量AIC統(tǒng)計量定義為(Akaike11):AIC=2l+2p，(5)其中l(wèi)表示對數(shù)似然值，p為參數(shù)的個數(shù)AIC的值越小，表明模型的擬合越好BIC統(tǒng)計量定義為(Schwartz12):BIC=2l+plog(n)，(6)其中的l也表示對數(shù)似然值，p為模型的參數(shù)個數(shù)，n為觀測值的個數(shù)，BIC的值越小，模型擬合越好4實證分析41數(shù)據(jù)描述本文使用的數(shù)據(jù)來自SAS Enterprise Miner數(shù)據(jù)庫中的汽車保險數(shù)據(jù)，Yip和Yau在研究

17、非壽險精算中索賠次數(shù)模型時也利用了這組數(shù)據(jù)，他們分別選取了五個費率因子及近一年的索賠數(shù)據(jù)為了便于比較，本文使用相同的費率因子和損失數(shù)據(jù)，具體見表142索賠次數(shù)擬合結(jié)果從表2的結(jié)果可以看出，兩類ZINB模型的擬合結(jié)果對零次索賠的預測比較準確，對其他次數(shù)的預測值也比較接近實際觀測值再根據(jù)對數(shù)似然值、AIC、BIC準則，兩類零膨脹負二項模型對索賠次數(shù)的擬合效果最好·20·第12期徐昕等:兩類零膨脹負二項回歸模型在汽車保險定價中的應用表1費率因子費率因子因子水平性別女性(基準水平)男性婚姻狀況未婚(基準水平)已婚汽車用途私人用途(基準水平)商務用途行駛區(qū)域郊區(qū)(基準水平)市區(qū)收入連

18、續(xù)變量43回歸模型擬合結(jié)果表3為零膨脹回歸模型的擬合結(jié)果，從結(jié)果中可以看出，無論是比較AIC還是BIC，兩類ZINB回歸模型的值都是最小的，因此可以認為，對于該組數(shù)據(jù)而言，ZINB回歸模型的擬合效果相對較好另外，從兩類ZINB回歸模型的擬合結(jié)果來看，對于每一個費率因子的參數(shù)估計值基本相同，兩者細微差別在于每個費率因子的標準誤差的估計略有不同最后，結(jié)構(gòu)零的比例參數(shù)在不同的零膨脹模型中的顯著性恰恰說明了給定的索賠數(shù)據(jù)確實服從零膨脹結(jié)構(gòu)模型表2觀測索賠頻數(shù)與擬合索賠頻數(shù)次數(shù)實際觀測到的索賠次數(shù)泊松分布負二項()負二項()零膨脹負二項()零膨脹負二項()0 1706 1245 1634 1634 17

19、06 17061 351 1014 620 620 423 4232 408 413 283 283 357 3573 268 112 137 137 201 2014 74 23 68 68 85 855 5 4 34 34 29 29比例參數(shù)05177(001130)05177(003624)散度參數(shù)K11489 11405 2454×108 1049×107泊松均值08151(001703)*08151(002496)*08151(002496)*16899*16899(003624)*2Loglikelihood75655 70020 70020 66952 669

20、52AIC75675 70060 70060 67012 67012BIC75735 70178 70178 67190 67190注:*表示在水平為5%下是顯著的;()表示參數(shù)估計值的標準誤差表3零膨脹回歸模型擬合結(jié)果估計參數(shù)泊松負二項()負二項()零膨脹負二項()零膨脹負二項()截距12388(008910)*14210(01239)*12187(01045)*05619(004197)*05619(003082)*用途02750(004487)*03100(005835)*02895(006387)*01489(005139)*01489(005013)*婚姻狀況01083(004260

21、)*009429(005582)01430(005976)01108(004877)*01107(004557)*行駛區(qū)域13919(008367)*16012(01158)*14071(009705)*12298(002655)*12298(007199)*收入002825(0004937)*003305(0006519)*003087(0006731)*001741(0005842)*001740(0005501)*性別01124(004393)*01341(005737)*01187(006147)005042(04468)005102(005063)散度參數(shù)K09522(007953)

22、*10309(008473)40427×107*40427×108*比例參數(shù)04468(001424)*04468(001408)*2Log-Likelihood 71184 66683 67492 65365 65365AIC 71304 66823 67632 65525 65525BIC 71660 67239 68048 66000 66000注:*表示在水平為5%下是顯著的;()表示參數(shù)估計值的標準誤差·21·南陽師范學院學報第10卷5小結(jié)本文討論了兩類不同分布函數(shù)類型的零膨脹負二項回歸模型的參數(shù)估計以及擬合優(yōu)度檢驗，并利用一組實際的汽車保險損

23、失數(shù)據(jù)對兩類模型進行了實證分析51當索賠數(shù)據(jù)存在零膨脹特性時，零膨脹負二項回歸模型較一般的索賠頻率預測模型如泊松回歸模型、負二項回歸模型的擬合效果更優(yōu)52對于該組數(shù)據(jù)而言，雖然兩類零膨脹負二項模型對參數(shù)估計的擬合結(jié)果較為接近，但對于其他損失數(shù)據(jù)可能會得到不同的結(jié)果因此，利用兩種類型的零膨脹負二項回歸模型可以為精算人員提供更為豐富的預測工具參考文獻1Johnson N L，Kotz SDistribution in Statistics:discretedistributionMNew York:Wiley，19692Lambert DZero-inflated poisson regressi

24、on，with anapplication to defects in manufacturingJTechnomet-ric，1992，34:1143Yip K C H，Yau K K WOn Modeling Claim Frequen-cy Data in General Insurance with Extra ZerosJIn-surance:Mathematics and Economics，2005(36):1531634Jean-Philippe B，Michel D，Montserrat GRisk classifi-cation for claim counts:a com

25、parative analysis of variouszero-inflated mixed poisson and hurdle modelsJNorthAmerican Actuarial Journal，2007(11):1101315Jong P D，Heller G ZGeneralized Linear Models forInsurance DataMCambridge:Cambridge UniversityPress，20086劉源，徐昕保險精算中的多零索賠現(xiàn)象探析J統(tǒng)計與決策，2008(21):21237徐昕，尹占華，郭念國零膨脹模型在非壽險中應用J統(tǒng)計教育，2009(4

26、):31338徐昕，袁衛(wèi)，孟生旺零膨脹廣義泊松回歸模型與保險費率厘定J數(shù)學的實踐與認識，2009(24):991079郭念國零膨脹泊松模型的改進在零次索賠建模中的應用J統(tǒng)計與信息論壇，2010(7):222510孟生旺，王維零膨脹損失次數(shù)回歸模型及其應用J蘭州商學院學報，2011(1):1711Aike HInformation theory and an extension of the maxi-mum likelihood principleproceedings of the 2nd inter-national symposium on information theoryJAka-demiai Kiade Budapest，1

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

兩類零膨脹負二項回歸模型在汽車保險定價中的應用

文檔簡介

溫馨提示

最新文檔

評論

兩類零膨脹負二項回歸模型在汽車保險定價中的應用

文檔簡介

溫馨提示

最新文檔

評論

相關文檔