精算模型第9講經(jīng)驗_第1頁
精算模型第9講經(jīng)驗_第2頁
精算模型第9講經(jīng)驗_第3頁
精算模型第9講經(jīng)驗_第4頁
精算模型第9講經(jīng)驗_第5頁
已閱讀5頁,還剩72頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、經(jīng)驗?zāi)P蛦栴}:如何選取合適的理賠額分布或理賠次數(shù)的分布。分布擬合檢驗的一般步驟(1)獲得損失分布的經(jīng)驗分布信息,例如經(jīng)驗分布圖、樣本均值、樣本方差、分位點等。(2)選擇一種概率分布作為損失的分布類型,估計所選擇分布中所包含的參數(shù);(3) 對分布進行擬合檢驗,以確信所選擇的分布類型和參數(shù)估計是否恰當(dāng);(4) 考慮是否還有其它適合的分布,如果有,重復(fù)第(1)(3)步;(5)在幾種合適的分布中選取一個最優(yōu)的分布作為損失額的分布。選擇的標(biāo)準(zhǔn)有多種,常用的方法是比較 c 2 統(tǒng)計量的值,比較最大似然函數(shù)的值等;(6)模型的修正。選擇模型后,要注意隨時對模型修正,以反映未來發(fā)生的情況,如通貨膨脹,免賠額變

2、化等。一、構(gòu)建經(jīng)驗?zāi)P虳ata set A下表是某保險公司在一年內(nèi)小汽車發(fā)生事故次數(shù)的統(tǒng)計數(shù)據(jù):Data set B下表是某勞工補償險的部分原始損失數(shù)據(jù)Number of accidenceNumber of drivers081,714111,30625 or more7Data set C下表是某責(zé)任險的賠付數(shù)據(jù):Payment rangeNumber of payments0-7500997500-175004217500-325002932500-675002867500-12500017125000-300000927821151261551612432943403844576808

3、55877974119313401884255815743Data setD1壽險保單終止有三種狀態(tài):,期滿和退保(surrender)。下表是某壽險保單持有人在簽訂保單后 5 年內(nèi)保單終止的時間。policyholderTime of deathTime of surrender1-0.124.80.53-0.840.83.953.11.86-1.87-1.88-2.1Over 3000003其中-表示時間未知,最后 12 個保單持有人保單期滿并退保。Data set D29-2.5102.92.8112.94.612-3.9134.0-14-4.015-4.1164.8-17-4.818-

4、4.819-30-下表表示壽險保單存活狀態(tài)的兩次觀測值,其中 First observed 表示第一次觀測的時間,若為 0 則表示保單簽訂后馬上進行,Last observed表示第二次觀測的時間,Event 表示最后一次觀測時保單持有人的狀態(tài),S 表示退保,D 表示,E 表示保單期滿。PolicyFirst observedLast observedEventPolicyFirst observedLast observedEvent100.1S1604.8D200.5S1704.8S300.8S1805.0S400.8D19-3005.0E501.8S310.35.0E601.8S320.

5、75.0E702.1S331.04.1DData setE這是一組責(zé)任險保單的賠付數(shù)據(jù),這個數(shù)據(jù)中包含了不同的免賠額和限額。年 免賠額 最大支付額 賠付額年 免賠額 最大支付額 賠付額9001000000289091150000001000000010000000802.5S341.83.1D902.8S352.13.9S1002.9D362.95.0E1102.9D374.8S1203.9S383.24.0D1304.0D393.45.0E1404.0S403.95.0E1504.1s909090909090909090909091919191919102500000000015000000

6、010000000000500000175000050000001000000010000003000000100000001000000040000050000001000000010000000100000001000000300000010000001000000010000001000000585115347156352055334584796611326011410989278440148943609316751189130893313924948867425150310929292929292929292929393939393939300000350000007000000000

7、005000003000001000001000000100000050000005000000100000005000000100000050000001500000030000005000003000000100000001000000100000005000000500000018361070510973134081633995736212313439543109871012111801051014029152962751653467874632209959191914500000001275000033000000100000001000000013357353308199100000

8、009393931500000050000005000000500000027408618623045000000請同學(xué)們觀察上述幾個數(shù)據(jù)集的特征lll,完整數(shù)據(jù)分組數(shù)據(jù)Truncated 和 Censored 數(shù)據(jù)分三種情況討論經(jīng)驗?zāi)P偷臉?gòu)建,完整數(shù)據(jù)分組數(shù)據(jù)Truncated 和 Censored 數(shù)據(jù)censored (from above) truncated (from below)lll(一)數(shù)據(jù)對于數(shù)據(jù),它的經(jīng)驗分布信息除了樣本均值、樣本方差、中位數(shù)、極大值和極小值,還包括經(jīng)驗分布函數(shù)、生存函數(shù)(survival),亡力函數(shù)(cumulative hazard rate func

9、tuon)等信息。死1、樣本分布函數(shù)樣本分布函數(shù)就是累積頻率,其定義式為F (x) = number of observations £ xnn其中是樣本量。例:設(shè)某醫(yī)療保險,規(guī)定免賠額為 50件,賠償額分別為141 1646403512593171511元,隨機抽取了 10 個理賠事107567F10(16)=1/10=0.1, F10(40)=0.2, F10(1511)=1可以證明: 當(dāng) X1, X2, Xn 是某總體 XF(x)的Fn(x)依概率收斂到 F(x).同分布的樣本時,經(jīng)驗生存函數(shù)xi ' s > tS (t) = 1- F (t) = number

10、ofnnn特殊地,設(shè)樣本為 n 個數(shù)據(jù) x1, x2, xn,這個數(shù)據(jù)中只有個不同的值,把這個值按從小到大的順序排列,記為(1)<(2)<<() ,令表示等于()的數(shù)據(jù)的個數(shù),rj = å si 表示大于等于()的個數(shù), 經(jīng)i= jk驗生存函數(shù)為S (t) = rj ,if y£ t < ynj -1jn則樣本分布函數(shù)x < y(1)ì0,F (x) = ïí1- r / n , y£ x < y, j = 2,., knj1,( j -1)( j )ïx ³ yî(k

11、 ) 例 : 假 設(shè) 某 數(shù) 據(jù) 集 包 括 7 、 2 、 4 、 4 、 6 、 2 、 1 、 9 ,則 y1 = 1, y2 = 2, y3 = 4, y4 = 6, y5 = 7, y6 = 9s1 = 1, s2 = 2, s3 = 2, s4 = 1, s5 = 1, s6 = 1rj = å si ,i= jr1 = 8, r2 = 7, r3 = 5, r4 = 3, r5 = 2, r6 = 1kS (4.5) = r4 = 3 ,y = 4 £ 4.5 £ 6 = y834n8S8 (3) = ?例 假設(shè)某數(shù)據(jù)集包含下面的數(shù)據(jù):1.0, 1.

12、3, 1.5,1.5, 2.1, 2.1, 2.1,和 2.8,計算其經(jīng)驗分布函數(shù)。解:,1.0181.3?71.52?2.1342.811x < 1.01.0 £ x < 1.3ì0,ï7ï1-= 0.125,ïïï1-868= 0.250,1.3 £ x < 1.5F (x) = ïí84ï1-= 0.5,1.5 £ x < 2.1ï8ï1ï1-= 0.875,2.1 £ x < 2.8x ³

13、 2.8ïïî1,82、經(jīng)驗均值、經(jīng)驗方差等n= 1 ånX ,s2 = 1 å ( X - X )2m1iinni=1i=11åE( X Ù u) =(x + u (number of x ' s > u)kkiinxi £u3、百分位數(shù)設(shè)隨量 X 的分布函數(shù)為 F(x,q ),稱p p (q ) 為 F(x,q ) 的 100p分位數(shù),如果p p (q ) 滿足F (p p (q ) | q ) = p數(shù)據(jù)的樣本分位點:, xn 按從小到大的順序排列為 x(1) , x(n) 。對于 0 <

14、 p < 1 ,將 x1 ,g=(n+1)p表示不超過(n+1)p 的最大整數(shù),此時認為分位數(shù)應(yīng)該在x(g)和 x(g1)之間。記 h=(n+1)p-g 表示(n+1)p 的小數(shù)部分,則樣本的 100p 的分位數(shù)為p (p)=(1-h) x(g)+h x(g1)中位數(shù)n當(dāng) n 為奇數(shù)時,記 k=(n+1)/2, 中位數(shù)為 x(k),當(dāng) n 為偶數(shù)時,記 k=n/2, 則中位數(shù)為 1 x+ 1 xn(k +1)(k )22例:求下表中的理賠的 25和 75分位數(shù)來估計參數(shù)的值。由于 0.25×266.5,因此,0.25 的分位點為0.5×0.5+0.5×0.7

15、0.65類似計算,0.75×2619.5,0.75 的分位點為0.5×12.1+0.5×13.6512.8750.10.52.24.128.10.20.72.65.930.00.20.92.96.249.20.31.33.212.163.80.41.83.313.65118.04、核估計n直觀含義經(jīng)驗分布函數(shù)是離散的,而大多數(shù)真實分布是連續(xù)的,因此經(jīng)驗分布不能很好的近似真實的分布,核估計的基本思想就是對每個觀測值 yj 使用續(xù)分布函數(shù)去近似,即令 Ky (x) 表示在 yj 附近的分布函數(shù),其均j值為 yj,則分布函數(shù)的核估計定義為:kF(x) = å

16、p( y j )Ky (x)jj =1p( y j ) 表示 yj 的經(jīng)驗概率,密度函數(shù)kf(x) = å p( y j )ky (x)jj =1其中 Ky 是連續(xù)分布函數(shù), ky 為其分布函數(shù)。jj常見的核函數(shù)l均勻核函數(shù)x < y - by - b £ x £ y + b x > y - bx < y - by - b £ x £ y + b x > y - bì0,ï 1ky (x) = í 2b ,ïïî0,ì0,ï x - y +

17、bKy (x) = í,2bïïî1,請同學(xué)們畫出均勻核函數(shù)分布圖例某個損失數(shù)據(jù)的樣本為:7,12,15,19,26,27,29,29,30,33,38,53。給定帶f(20), F (20), f(30), F(30) 。寬參數(shù)h = 5 ,利用均勻核函數(shù),估計11對于 f(20) ,需要考慮15,19 處的經(jīng)驗密度,兩點的權(quán)重都為=。2h1011111f(20) =+=。12 1012 1060對于 F (20) ,需要考慮的點包括 7,12,15,19。其中前兩個點在帶寬范圍左邊,權(quán)重為 1,第三個點權(quán)重也為 1,第四個點權(quán)重為 0。6。因此:11

18、113F(20) =1+1+1+0.6 =。12121212同法可得:101111111111111f(30) =+=12 1012 1012 1012 1012 1012 102011111111122F(30) =1+1+1+1+0.9 +0.8 +0.6 +0.5 +0.1212121212121212我們可以繪制核密度估計的分布函數(shù)和密度函數(shù)圖像,如圖 8-7 所示。圖 8-1均勻核密度估計的密度函數(shù)和分布函數(shù)l三角核函數(shù)ì0,x < y - b, y - b £ x £ yï x - y + bïk (x) = ïb2

19、í y + b - xyï, y £ x £ y + bx > y + bïb2ï0,î(請同學(xué)們畫出三角型圖)x < y - b, y - b £ x £ yì0,ï(x - y + b)2ïK (x) = ï2b2íy( y + b - x)2ï1-, y £ x £ y + bï2b2ï1,x > y + bî例:例某個損失數(shù)據(jù)的樣本為:7,12,15,19,26,27,2

20、9,29,30,33,38,53。給定f(20), F (20), f(30), F(30)帶寬參數(shù)h = 5 ,利用均勻核函數(shù),估計估計過程類似。為計算 f(20) ,需要考慮的點是 15,19。由公式(8.4.8)得到相應(yīng)5- | 20 -19 |4的權(quán)重分別為 0 和=。因此:5225141f(20) =12 2575對于對于 F (20) ,由(8.4.9)計算得到點 7,12,15,19 的權(quán)重分別為 1,1,1,(19 - 20 + 5)2171-=。因此:2 52251111 17 = 23F(20) =1+1+1+12121212 2575同理可得, f(30) =, F(30

21、) = 49 。相應(yīng)的估計結(jié)果示意圖為:35075圖 8-2三角核密度估計的密度函數(shù)和分布函數(shù)lgamma 核函數(shù)xa -1e- xa / yky (x) = ( y / a )a G(a )此 gamma 函數(shù)的均值為a( y /a) = y ,方差a( y /a)2 = y2 /a 。例:You study five lives to estimate the time from the onset of a disease to death. The times to death are:2 3 3 3 7Using a triangular kernel with bandwidth

22、2, estimate the densityfunction at 2.5.(A) 8/40 (B) 12/40 (C) 14/40 (D) 16/40(E) 17/40解:三角核函數(shù)為x < y - b, y - b £ x £ yì0,ï x - y + bïk (x) = ïb2í y + b - xyï, y £ x £ y + bx > y + bïb2ï0,îThe kernel is a triangle with a base of 4

23、 and a height at the middle of0.5 (so the area is 1). The length of the base is twice the bandwidth. Any observation within 2 of 2.5 will contribute to the estimate.For the observation at 2, when the triangle is centered at 2,the height of the triangle at 2.5 is .375(=0.5*0.75) (it is one-quarter th

24、e way from 2 to the end of thetriangle at 4 and so the height isone-quarter the way from 0.5 to 0).Similarly the points at 3 are also 0.5 away and so the height of the associated triangle is also .375(=0.5*0.75).Each triangle height is weighted by the empirical probability at the associated point. S

25、o the estimate at 2.5 is (1/5)(3/8) + (3/5)(3/8) +(1/5)(0) = 12/40.(二)、分組數(shù)據(jù)例 2:某公司在 1970 年間發(fā)生的火災(zāi)損失如下:試畫出損失的經(jīng)驗分布圖。990400010202700298039001503300750495023001300210970100260012005200350125200105020003800110055529002000500110025003965解:先對損失按從小到大的遞增順序整理為,根據(jù)整理的數(shù)據(jù)可以確定一下標(biāo)志值最小損失最大損失平均損失中位數(shù)10052001863.4313001

26、0012515020021035050055575075097099010201050110011001200130017001995200020002300250026002700290029803300380039003965400049505200把數(shù)據(jù)按不同規(guī)模分組,每組中的次數(shù)稱為頻數(shù),以 500,1000 為組矩分組得:序號分組頻數(shù)頻率115007?50010005?2100120001017.1%320013000617.1%430014000514.3%54001520025.7%合計35100.0%1、直方圖(1) 、分組數(shù)據(jù)的經(jīng)驗分布通常用直方圖來表示,我們通常得到的直方圖

27、為等距直方圖, pi = ni / n 。一般統(tǒng)計軟件都可畫等距直方圖。(2) 、設(shè) c0<c1<<cr,nj 表示位于區(qū)間(cj-1,cj)的數(shù)據(jù)的個數(shù),當(dāng)分組數(shù)據(jù)的組距di = Ci - Ci-1 不相等時,需要計算消除組距因素影響后的標(biāo)準(zhǔn)化頻率ri ,其計算公式為ninir =indn(C - C)iii-1根據(jù)上表可畫出如下的頻數(shù)直方圖和相應(yīng)的分布函數(shù)圖。由頻率直方圖可以得到一條頻率折線。它所代表的函數(shù)為作總體分布密度函數(shù)的近似。fn (x) ,可看注:同學(xué)們可以嘗試把組分得更細些,這樣得到的直方圖就更平滑些。2、經(jīng)驗分布函數(shù)光滑曲線å jc , F (c

28、) = 0×××定義 Fn ,將,c , F (c ),i=1 i0n01n 1cr -1, Fn (cr -1),cr , Fn (cr ) 等點用折線連接起來,可以得到經(jīng)驗分布光滑曲線,其函數(shù)表達式為ì0,x £ c0ïc - x(x - c)ï) +j-1 F (c ), c< x £ cF (x) = jF (cí cnj -1njj -1n- cc - cjïïîjj -11,jj -1x > cr下圖例的經(jīng)驗分布光滑曲線例 2:下表給出了 217 份保

29、單的理賠額數(shù)據(jù)。理賠額數(shù)目平均理賠額頻率Ej02,5004113890.039.752,5007,5004846610.000075649.177,50012,5002499910.000044227.012,50017,50018154820.000022117.5517,50022,50015202320.000016612.4822,50032,50014266160.000013816.7032,50047,50016402780.000006514.7747,50067,50012564140.000004911.1867,50087,5006749850.00000286.71畫得

30、直方圖和經(jīng)驗分布光滑曲線如下:87,500125,000111068510.00000147.22125,000225,00051847350.00000147.68225,000300,00042640250.00000026.79300,0003300,0000.00000023、經(jīng)驗均值(ck +1 - ck +1 )nnrrm ' = åcxkjdx = åjjj -1òjkn(cj - cj -1 )j=1 n(cj - cj -1 )(k +1)cj-1j =1nj (cj + c j -1 )rm = åj =1n24、計算 E(

31、X Ù u) 的值當(dāng)u = c j , j = 0,1,., rn c + cjåi=1rån E( X Ù u) =i ii-1 + uin2i= j +1 n當(dāng)cj -1 £ u < c jnj cj -1 + uu - c j -1j -1 nc + cåE( X Ù u) = i ii-1n2+()()c j - c j -1n2i=1cj - u+u njr+ u ånic j - c j -1ni= j +1 n這部分內(nèi)容參考 loss m第 10 章或 manaul(ME-50,51)。5、百分

32、位數(shù)對于0 < p < 1,分組數(shù)據(jù)的樣本 100p的分位點pp 定義為p = F (p )np利用 ogive 曲線的特點,可得p - Fn (cj -1 )Fn (cj ) - pp =´ c +´ c,j -1pF (c ) - F (cjF (c ) - F (c)njnj -1njnj -1其中cj -1 和cj 滿足 Fn (cj -1 ) £ p < Fn (cj ) 。例:100 個觀察值被分為 5 組,請計算在 40%的經(jīng)驗分位數(shù)。解:首先計算其經(jīng)驗分布函數(shù)組(0,100(100, 200(200,500(500,1000(10

33、00, 2000nj2520202015254565F(0) = 0, F(100) =, F(200) =, F(500) =,100100100100100100100F(1000) =, F(2000) = 100 ,85100100100100因此,40%的分位數(shù)位于 100 和 200 之間。使用插值得到0.4 - 0.250.4 - 0.4p=´ 200 +´100 = 1750 40.45 - 0.250.45 - 0.25(三)、censored 和 truncated 數(shù)據(jù)1、censored 和 truncated 的含義ntruncatedX <

34、 dX > dY = ì未定義< dì, Y =XXííX > dXî未定義î例如,免賠額 truncated from below, left truncatedncensored< dì X, Y =X < dX > dY = ì dXí Xí dX > dîî例如,賠償限額 censored from above。例:一組責(zé)任險保單數(shù)據(jù)年 免賠額 最大支付額 賠付額年 免賠額 最大支付額 賠付額90010000002890900

35、500000058519025000010000000153479001000000156359003000000205539001000000034584900100000007966190040000013260190150000050000001410989900100000002784401900100000004894360901000000010000000931675191010000001891910300000030893911500000010000000100000009201000000183692010000001070592050000001097392050000

36、001340892010000000163399235000050000009573692010000002123139205000000439543927000000015000000109871092030000001211180930500000105109303000000140299301000000015296919191919191910500000175000045000000012750000100000010000000100000010000003300000010000000100000003139249488674251503101335735330819910000

37、00093939393939393500000300000100000150000001000000100000005000000500000050000005000000500000027516534678746322099527408618623045000000注:在生命表(mortalitytruncated 例子。table)模型構(gòu)建中也存在大量的 censored 和例:為估計某階段的率分布,隨機抽取了 40 份保單,下面表中是兩次觀測的時間和保單持有人的狀態(tài)。PolicyFirst observedLast observedEventPolicyFirst observedLas

38、t observedEvent100.1S1604.8D200.5S1704.8S300.8S1805.0S400.8D19-3005.0E501.8S310.35.0E601.8S320.75.0E702.1S331.04.1D802.5S341.83.1D902.8S352.13.9S1002.9D362.95.0E1102.9D374.8S1203.9S383.24.0D1304.0D393.45.0E1404.0S403.95.0E1504.1S其中First observed 是指簽訂保單后第一次觀測的時間,Last observed是最后觀測的時間,Event 是最后觀測時,保單持

39、有人所處的狀態(tài),e表示保單期滿,s 表示退保,d 表示例如:。第 4 份保單,第一次觀測的時間是簽署保單后,第二次觀測時間是簽署保單后 0.8 年,狀態(tài)d。其存活時間為 0.8。第 31 份保單,第一次觀測的時間是簽署保單后 0.3 年(truncated),第二次觀測時間是簽署保單后 5 年,狀態(tài)是期滿 e。其存活時間大于等于 5。第 35 份保單,第一次觀測的時間是簽署保單后 2.1 年,第二次觀測時間是簽署保單后 3.9 年,狀態(tài)是退保 s (cemsored)。其存活時間未知但大于 3.9。下面構(gòu)造經(jīng)驗分布函數(shù),首先定義幾個記號:u設(shè) dj 表示第 j 個觀測值被 truncated

40、的點,若第 j 個觀測值沒有被 truncated,則令d j = 0 。在非壽險中一般認為 truncated 點是相同的,例如,免賠額 d。但是在壽險中卻不同,例如,上例中第 31 份保單,第一次觀測的時間是簽署保單后 0.3 年,則d j = 0.3 。u設(shè) xj 表示第 j 個觀測值實際值,若第 j 個觀測值被 censored, 則 xj 未知,censored 點記為 uj。非壽險:例如:保單限額 u壽險:例如上例中第 35 份保單,第一次觀測的時間是簽署保單后 2.1 年,第二次觀測時間是簽署保單后 3.9 年,狀態(tài)是退保 s,其實際存活時間大于x j = -, u j = 3.

41、9 。3.9,但由于被censored,因此令u設(shè)樣本 x1, x2, xn,這個數(shù)據(jù)中只有個不同的值,把這個值按從小到大的順序排列,記為(1)<(2)<<() ,令表示等于(j)的數(shù)據(jù)且沒有被 censor 觀測值的個數(shù)(thenumber of times the uncensored observationsample )。yjappears in theu令rj 表示大于等于(j)的觀測值的個數(shù)。如果樣本都沒有被kcensored 和truncated,則rj = å si , ;如果樣本存在 censored 和i= jtruncated 的情況,則xi

42、s ³ y j )+(number ofui s ³ y j )-(number of di s ³ y j )rj=(number ofrj 的直觀解釋:rj 稱為風(fēng)險集,是由哪些在指定在觀測值 y j 時刻的風(fēng)險集包括:仍處于被觀察狀態(tài)的,(1)時間在 y j 或 y j 以后的;(2)刪失 censored 時刻在 y j 或 y j 以后的。但是,對于那些在 y j 以后才首次觀測到的,我們認為其在時刻y j 并沒有處于被觀測狀態(tài)。因此,對于風(fēng)險集大小的計算公式為:rj = #xi : xi ³ y j + #ui : ui ³ y j

43、 - #di : di ³ y j 另外,注意到:n = #xi + #ui = #xi : xi ³ y j + #xi : xi < y j + #ui : ui ³ y j + #ui : ui < y j = #di = #di : di ³ y j + #di : di < y j 因此,(0.1)也可寫作:rj = #di : di < y j - #xi : xi < y j - #ui : ui < y j (0.1)即di s < y j ) -(number of xi s < y j

44、)-(number of ui s < y j )rj=(number of直觀意義:由所有在給定數(shù)。之前參與研究的減去已經(jīng)離去的遞推計算rj=rj-1 +(number of dis between yj and yj-1)-(number of xis equal to yj-1)-(number of uis between yj and yj-1)rj = rj -1 + #di : y j -1 £ di < y j - #xi : xi = y j -1 - #xi : y j -1 £ ui < y j 請同學(xué)們分析一下上面表達式的直觀含義。

45、根據(jù)上面的定義,下表給出了 data set D2 中的 di,xi,uiidixiuiidixiui10-0.11604.8D20-0.5170-4.830-0.8180-5.0400.8-19-3005.05.050-1.8310.35.05.060-1.8320.75.05.070-2.1331.04.1-80-2.5341.83.1-90-2.8352.1-3.91002.9-362.95.05.01102.9-37-4.8120-3.9383.24.0D1304.0D393.45.05.0140-4.0403.95.05.0150-4.1下表給出了風(fēng)險集 y j , s j , rj

46、 的值rj = #di : di < y j - #xi : xi < y j - #ui : ui < y j rj = #xi : xi ³ y j + #ui : ui ³ y j - #di : di ³ y j rj=rj-1 +(number of dis between yj and yj-1)-(number of xis equal to yj-1)-(number of uis between yj and yj-1)jyjsjrj10.8132-0-2=30=0+32-0-222.9235-1-8=26=30+3-1-633

47、.1137-3-8=26=26+2-2-044.0240-4-10=26=26+3-1-254.11?64.81?下面我們給出經(jīng)驗生存函數(shù)估計,也稱為 Kaplan-Meier product-limit計ì估ï0 £ t < y1y j -1 £ t < y j , j = 2,., kï1,j -1 æ r - söïSn (t) = íÕç ii ÷,i=1 èriøïïk æ r - sö

48、9;Õt ³ ykç ii ÷ or0,ïîi=1 èriø在生命表中的直觀解釋:S(0)=1S ( y ) = r1 - s1 表示在r1 個在時刻 y1 前存活的人群中,有 s1 個在時刻 y11r1,還有 r1-s1 還會繼續(xù)存活,即存活時間大于 y1。S ( y ) = S ( y ) r2 - s2,在 r2 個在時刻 y1 后時刻 y2 前繼續(xù)存活的人群中,21r2有 s2 個在時刻 y2,還有 r2-s2 還會繼續(xù)存活。即存活時間大于 y2。依次類推下去,即可得 Kaplan-Meier produc

49、t-limit。若sk = rk ,則S(t) = 0,for t ³ yk ,表示所有人的存活時間小于等于 yk但由于 censored情況存在,存活時間大于 yk 的可能性存在,因此假設(shè)生存函數(shù)從S ( yk ) 是從指數(shù)衰減到 0,令w = maxx1,×××, xn ,u1,×××,un,æ ri - si ök= Õç(t / w) ln s* t / wSn (t) = e= (s ),其中s*÷ri=1 èiø當(dāng)樣本沒有被 censored

50、和 truncated 的,rj = s j + rj -1因此,可以證明 Kaplan-Meier product-limit 估計與前面的估計是一致的, 即Sn (0) = 1S (t) = rj ,if y£ t < ynj -1jnSn (0) = 0,if t ³ yk例:計算 data setD2 的 Kaplan-Meier product-limit0 £ t < 0.80.8 £ t < 2.9ì1,ï30 -1ï= 0.9667,ï 30ïï0.966726 - 2= 0.8923, 2.9 £ t < 3.126ï(t) = 

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論