edude ibnr methodes

34

Transcript of edude ibnr methodes

Page 1: edude ibnr methodes

Sandra PitreboisPhilippe De Longueville

Michel DenuitJean-François Walhin

Etude de techniques IBNR modernes

SOMMAIRE

1. Introduction2. Chain Ladder Stochastique3. Projected Case Estimates4. Application5. Conclusion

RéférencesAnnexeRésumé

Page 2: edude ibnr methodes

1 Introduction.Le paiement des sinistres ne s'e�ectue pas toujours en une fois, dans l'année même de survenance.C'est particulièrement vrai dans certaines branches de l'assurance, comme par exemple la res-ponsabilité civile automobile dans le cas de sinistres avec dommages corporels. Au contraire, lerèglement des sinistres s'étale au �l du temps et il est nécessaire de constituer des réserves pourpouvoir honorer les dettes futures. Comme le montant qui sera �nalement payé pour le sinistreest inconnu au départ, la somme à mettre en réserve est également inconnue et il faut l'estimer.Ces estimations peuvent être calculées par des techniques, dites techniques IBNR (Incurred ButNot Reported), qui se basent sur l'évolution passée du coût des sinistres pour estimer son déve-loppement futur. En pratique ces techniques sont utilisées soit pour estimer les réserves purementIBNR, soit les réserves de sinistres totales.

Dans cet article, nous étudierons des techniques modernes, ou des compléments récents à destechniques plus anciennes, d'estimation des réserves de sinistre.

Dans la section 2 nous examinerons la méthode bien connue de Chain Ladder. Cette méthode seraanalysée dans un cadre stochastique, permettant de dégager des formules pour l'estimation de lavariabilité des réserves calculées. Nous aurons ainsi des expressions pour l'erreur standard sur laréserve correspondant à chaque année de survenance de sinistres examinée ainsi que sur la réservetotale. Ces mesures de variabilité nous permettront de construire des intervalles de con�ance pourles réserves.Nous verrons également comment calculer très facilement ces diverses expressions par des formulesrécursives.Le modèle stochastique, qui sous-tend la méthode de Chain Ladder et qui est utilisé ici, reposesur trois hypothèses que doivent véri�er les données sur lesquelles on désire appliquer la méthode.Nous verrons dans quelle mesure des tests permettent de véri�er que les données satisfont bien àces hypothèses.Ensuite, nous essaierons d'adapter les formules étudiées lors d'une utilisation pratique de la mé-thode de Chain Ladder. En e�et, cette méthode suppose que le coût du sinistre x années aprèssa survenance est proportionnel au coût de l'année précédente et que cette proportion ne changepas, que le sinistre soit survenu il y a 10 ans ou aujourd'hui. En pratique, il est possible que, suiteà un changement dans la politique de paiement ou de réservation par exemple, le développementdes sinistres ne se comporte pas dans les années récentes comme dans les années antérieures. Nousverrons comment adapter les estimations et les formules d'erreur dans ce cas.Pour clôturer cette deuxième section, nous examinerons les ratios S/P , c'est-à-dire les montantsde sinistres rapportés à l'encaissement, annuels et moyens, pour lesquels nous pourrons égalementaboutir à des formules d'erreur standard.

La section suivante étudie une méthode qui travaille en parallèle sur les données concernant lespaiements e�ectués et sur les données concernant les montants mis en réserves au �l du temps. Ellepermet donc d'utiliser toute l'information disponible et de modéliser séparément les évolutions despaiements et des réserves tout en les liant entre elles. Nous verrons ensuite comment cette méthoderejoint celle de Chain Ladder et nous essaierons d'adapter les formules d'erreur présentées dansla deuxième section pour qu'elles puissent s'appliquer à cette méthode dite des "projected caseestimates".

La dernière section présentera une application des diverses méthodes proposées à des donnéesréelles, paiements et réserves sur 14 années, issues de la branche responsabilité civile automobile.

Page 3: edude ibnr methodes

2 Chain Ladder stochastique.La méthode de Chain Ladder est une méthode déterministe permettant d'estimer les réservesde sinistres. Elle est très simple à utiliser mais les estimations qu'elle fournit pour les annéesd'accident les plus récentes sont très sensibles à des variations dans les données observées. Il estdès lors intéressant de pouvoir quanti�er la variabilité des réserves estimées, notamment pourdéterminer si la di�érence entre les résultats obtenus par Chain Ladder et ceux obtenus par uneautre méthode est signi�cative, mais également pour construire des intervalles de con�ance surles estimations faites pour prévoir le montant ultime des sinistres. Pour mesurer cette variabilité,il faut d'abord déterminer quel est le modèle stochastique qui sous-tend la méthode de ChainLadder et quelles sont les hypothèses sur lesquelles se base cette méthode.

2.1 La méthode de Chain Ladder déterministe.Commençons par rappeler les notations et formules usuelles relatives à cette méthode. Soit Cik lemontant, cumulé jusqu'en l'année de développement k, des sinistres survenus en l'année d'accidenti, pour 1 ≤ i, k ≤ n. Cik peut représenter soit le montant payé, soit le coût total estimé (paiementdéjà e�ectué plus réserve) du sinistre. Les montants Cik sont connus pour i + k ≤ n + 1 et oncherche à estimer les valeurs des Cik pour i + k > n + 1, et en particulier les valeurs ultimes Cin

pour 2 ≤ i ≤ n. Ces notations sont illustrées dans le triangle suivant :

C =

C1,1 C1,2 · · · C1,n−1 C1,n

C2,1 C2,2 · · · C1,n−1... ... ...

Cn−1,1 Cn−1,2

Cn,n

La méthode de Chain Ladder estime les montants inconnus, Cik pour i + k > n + 1, par

Cik = Ci,n+1−i · fn+1−i · · · fk−1 i + k > n + 1, (1)

fk =

n−k∑i=1

Ci,k+1

n−k∑i=1

Cik

1 ≤ k ≤ n− 1. (2)

Il est donc supposé que Cik est proportionnel à Ci,k−1 et que le coe�cient de proportionnalité fk−1,calculé sur base des données sinistres du passé ne dépend pas de l'année d'accident i.Le montant ultime des sinistres survenus en année i est alors estimé par

Cin = Ci,n+1−i · fn+1−i · · · fn−1 2 ≤ i ≤ n.

La réserve de sinistre pour l'année d'accident i (c'est-à-dire ce qui reste à payer pour les sinistressurvenus en l'année i), qui est dé�nie par Ri = Cin − Ci,n+1−i, est alors estimée par

Ri = Ci,n+1−i · fn+1−i · · · fn−1 − Ci,n+1−i 2 ≤ i ≤ n.

Page 4: edude ibnr methodes

2.2 Un modèle stochastique pour la méthode de Chain Ladder.Le modèle stochastique, présenté dans Mack [1] , [2] et [3] relatif à la méthode de Chain Ladderrepose sur trois hypothèses. Les deux premières sont les suivantes :

E(Ci,k+1 |Ci1, . . . , Cik) = Cik fk 1 ≤ i ≤ n, 1 ≤ k ≤ n− 1 (3){Ci1, . . . , Cin}, {Cj1, . . . , Cjn} ∀i, j sont indépendants (4)

L'hypothèse (3) signi�e qu'étant donné le développement Ci1, . . . , Cik des sinistres survenus enannée i, il existe un coe�cient fk tel que l'espérance de Ci,k+1 est égale à Cik fk. Ceci traduit deuxhypothèses de base de la méthode de Chain Ladder. Premièrement seule la valeur la plus récenteCik est utile pour déterminer Ci,k+1, et deuxièmement le facteur fk est indépendant de l'annéed'accident i considérée.L'hypothèse (4) signi�e quant à elle que les années de survenance sont indépendantes entre elles.

Le théorème suivant montre que si on estime les paramètres du modèle (3) par (2) alors cemodèle stochastique (3), combiné avec l'hypothèse (4) fournit exactement les mêmes réserves quela méthode originale de Chain Ladder (1).

Théorème 2.1. Soit D = {Cik | i + k ≤ n + 1}, l'ensemble de toutes les données observées. Sousles hypothèses (3) et (4), on a

E(Cin |D) = Ci,n+1−i · fn+1−i · · · fn−1.

La preuve est donnée dans Mack [1].

Le théorème suivant montre que estimer fn+1−i · · · fn−1 par fn+1−i · · · fn−1 fournit un bon esti-mateur.

Théorème 2.2. Sous les hypothèses (3) et (4), les estimateurs fk, donnés par (2) sont non biaiséset non corrélés.

La preuve est donnée dans Mack [1].

Par extension on peut également montrer que E(fn+1−i · · · fn−1) = fn+1−i · · · fn−1, ce qui montreque Cin = Ci,n+1−i · fn+1−i · · · fn−1 est un estimateur non biaisé de E(Cin |D) = Ci,n+1−i ·fn+1−i · · · fn−1. De la même manière, l'estimateur de la réserve, Ri = Cin − Ci,n+1−i, est unestimateur non biaisé de la vraie réserve Ri = Cin − Ci,n+1−i.

2.3 Calcul de l'erreur standard.La formule d'estimation de l'erreur standard basée sur le modèle présenté à la section 2.2 estprésentée dans Mack [1] et [2].

Page 5: edude ibnr methodes

2.3.1 Estimation de l'erreur sur la réserve d'une année de survenance et constructiond'un intervalle de con�ance.

Cin fournit un estimateur mais pas la valeur exacte de Cin. Dans cette section, nous introduisonsl'objet principal de cet article en nous intéressant à la distance moyenne entre l'estimateur et lavraie valeur.L'erreur carrée moyenne, mse(Cin) de l'estimateur Cin de Cin se dé�nit par

mse(Cin) = E[(Cin − Cin)2 |D],

où D est dé�ni comme plus haut, c'est-à-dire comme l'ensemble des données observées.On s'intéresse ici à une moyenne conditionnelle basée sur l'ensemble de données spéci�que Da�n d'obtenir la déviation moyenne entre Cin et Cin due uniquement à l'aléa futur subi par cetensemble de données bien spéci�é et sans tenir compte des déviations passées.

L'erreur standard se(Cin) est dé�nie comme égale à√

mse(Cin).

Si on s'intéresse à l'erreur sur la réserve, on doit calculer mse(Ri) = E[(Ri − Ri)2 |D]. Comme

Ri = Cin − Ci,n+1−i et Ri = Cin − Ci,n+1−i, on a �nalement que

mse(Ri) = E[(Cin − Cin)2 |D] = mse(Cin).

L'erreur d'estimation de la réserve pour une année d'accident est donc égale à l'erreur d'estimationdu montant �nal à payer pour les sinistres survenus lors de cette année. En e�et, ces deux grandeurssont égales à une constante additive près.

Pour pouvoir calculer mse(Cin), nous allons le décomposer selon la formule

mse(Cin) = V ar(Cin |D) + (E(Cin |D)− Cin)2,

qui est une application de la règle générale E(X − a)2 = V ar(X) + (E(X)− a)2.Cette formule nous montre que nous aurons donc besoin d'estimer la variance de Cik, ce qui vanous conduire à dégager une troisième hypothèse pour l'utilisation de la méthode de Chain Ladder.

Comme fk est la moyenne pondérée par Cik des facteurs de développement individuels Ci,k+1

Cik

, (en

e�et fk =

∑n−ki=1 Ci,k+1∑n−k

i=1 Cik

=n−k∑i=1

Ci,k+1∑n−ki=1 Cik

=n−k∑i=1

Ci,k+1

Cik

Cik∑n−ki=1 Cik

), on peut montrer que V ar(Ci,k+1

Cik|Ci1, . . . , Cik)

doit être inversément proportionnel à Cik, et ce a�n que fk soit un estimateur non biaisé de varianceminimum. Nous reparlerons de cette hypothèse dans la section 2.5.1.

Cette hypothèse peut se réécrire V ar(Ci,k+1

Cik|Ci1, . . . , Cik) =

σ2k

Cik, ou encore

V ar(Ci,k+1 |Ci1, . . . , Cik) = Cik σ2k 1 ≤ i ≤ n, 1 ≤ k ≤ n− 1. (5)

Cette hypothèse (5) est (avec (3) et (4)) la troisième hypothèse qui sous-tend implicitement laméthode de Chain Ladder.Les paramètres σ2

k sont inconnus et devront être estimés.Le théorème suivant donne la formule permettant d'estimer ce que nous cherchons, à savoirmse(Ri).

Page 6: edude ibnr methodes

Théorème 2.3. Sous les hypothèses (3), (4) et (5), mse(Ri) peut être estimé par

mse(Ri) = C2in

n−1∑

k=n+1−i

σ2k

f 2k

(1

Cik

+1∑n−k

j=1 Cjk

),

où Cik = Ci,n+1−i · fn+1−i · · · fk−1 (k > n + 1 − i) sont les valeurs estimées de Cik etCi,n+1−i = Ci,n+1−i,

et où σ2k = 1

n−k−1

n−k∑i=1

Cik (Ci,k+1

Cik

− fk)2 (1 ≤ k ≤ n − 2) est un estimateur sans biais de σ2

k,

et σ2n−1 = min (

σ4n−2

σ2n−3

, min (σ2n−3 , σ2

n−2)).

La preuve est donnée dans Mack [1].

Remarque sur le choix de σ2n−1 :

� si fn−1 = 1 et qu'on croit que le développement des sinistres se termine après n− 1 années,alors on prend σn−1 = 0,

� sinon, on extrapole la série σ1, . . . , σn−2, pour ajouter un terme supplémentaire, soit parrégression loglinéaire, soit en exigeant que σn−3

σn−2= σn−2

σn−1soit véri�ée, pour autant que σn−3 >

σn−2.C'est cette dernière possibilité qui a été retenue dans le théorème 2.3.

Nous avons maintenant des estimations pour la moyenne de la variable Ri (soit Ri) et pourl'écart-type de cette variable (soit se(Ri)). Il nous reste à faire une hypothèse paramétrique sur ladistribution de Ri pour pouvoir construire facilement des intervalles de con�ance sur les réservesestimées. Si le volume de données est su�sant, on peut supposer que la distribution est normale,de moyenne la valeur estimée Ri et d'écart-type donné par l'erreur standard se(Ri). Un intervallede con�ance à 95% est alors donné par

[Ri − 2se(Ri), Ri + 2se(Ri)

].

Mais la distribution normale n'est peut-être pas une bonne approximation si la vraie distributionde Ri n'est pas symétrique. De plus, la distribution normale peut conduire à une borne inférieurenégative même si la réserve ne peut pas être négative. Dans ces cas-là, il vaut mieux utiliserune approche basée sur une distribution lognormale. Nous approximons alors la distribution dela réserve Ri par une distribution lognormale de paramètres µi et σ2

i tels que la moyenne et lavariance des deux distributions soient égales, c'est-à-dire tels que :

exp(µi + σ2i /2) = Ri

exp(2µi + σ2i )(exp(σ2

i )− 1) = (se(Ri))2,

ce qui conduit à :

µi = ln(Ri)− σ2i

2

σ2i = ln(1 + (

se(Ri)

Ri

)2).

Les bornes d'un intervalle de con�ance à 95% seront alors données par

[exp(µi − 2σi), exp(µi + 2σi)] =

[Ri exp(

−σ2i

2− 2σi), Ri exp(

−σ2i

2+ 2σi)

].

Page 7: edude ibnr methodes

Prenons un petit exemple pour illustrer numériquement les di�érentes formules rencontrées.Soit le triangle des montants cumulés de sinistres suivant :

C =

35.40 37.69 39.13 39.76 40.1638.61 41.61 43.37 44.5643.85 47.30 49.4549.52 53.3355.47

Calculons les coe�cients de développement fk par la formule (2) et les coe�cients σ2k par la formule

indiquée dans le théorème 2.3. Nous obtenons :

f1 = 1.0750 f2 = 1.0423 f3 = 1.0221 f4 = 1.0101,

σ21 = 1.6080 ∗ 10−3 σ2

2 = 0.5510 ∗ 10−3 σ23 = 2.6444 ∗ 10−3 σ2

4 = 0.5510 ∗ 10−3.

Les coe�cients de développement permettent de compléter le triangle des montants par la for-mule (1).

C =

35.40 37.69 39.13 39.76 40.1638.61 41.61 43.37 44.56 45.0143.85 47.30 49.45 50.54 51.0549.52 53.33 55.58 56.81 57.3855.47 56.63 62.15 63.52 64.16

Nous pouvons �nalement estimer les réserves Ri pour 2 ≤ i ≤ 5 par Ri = Ci5−Ci,6−i et utiliser lethéorème 2.3 pour estimer l'erreur commise sur ces réserves. Nous obtenons ainsi mse(Ri) et en enprenant la racine carrée, nous obtenons se(Ri). Nous examinons également se(Ri) en pourcentagede la réserve, et �nalement nous construisons des intervalles de con�ance pour la réserve, baséssur la distribution normale et sur la distribution lognormale.

i Ri mse(Ri) se(Ri) se(Ri) en % de Ri IC Normal IC Lognormal2 0.45 0.0521 0.2282 50.90% [−0.01, 0.90] [0.15, 1.04]3 1.60 0.2766 0.5259 32.89% [0.55, 2.65] [0.80, 2.88]4 4.05 0.3715 0.6095 15.05% [2.83, 5.27] [2.97, 5.40]5 8.69 0.5740 0.7576 8.72% [7.17, 10.20] [7.27, 10.30]

Nous observons ici une décroissance de l'erreur relative en fonction de l'année de survenance :l'erreur absolue augmente moins vite que la valeur de la réserve.

Modi�ons quelques données et prenons l'exemple suivant :

C ′ =

35.40 37.69 39.13 39.76 40.1638.61 40.62 42.77 43.63 44.0743.85 47.30 49.00 49.89 50.3949.52 52.59 54.80 55.80 56.3655.47 59.06 61.54 62.66 63.29

Les coe�cients fk et σ2k sont :

f1 = 1.0646 f2 = 1.0421 f3 = 1.0182 f4 = 1.0101,

Page 8: edude ibnr methodes

σ21 = 5.0327 ∗ 10−3 σ2

2 = 3.5648 ∗ 10−3 σ23 = 0.3282 ∗ 10−3 σ2

4 = 0.0302 ∗ 10−3.

L'examen des réserves fournit le tableau suivant qui présente une toute autre évolution de l'erreurrelative, due au fait que l'erreur standard absolue se(Ri) évolue plus rapidement d'année en annéeque dans le premier cas :

i Ri mse(Ri) se(Ri) se(Ri) en % de Ri IC Normal IC Lognormal2 0.44 0.0028 0.0526 12% [0.33, 0.54] [0.34, 0.55]3 1.39 0.0296 0.1721 12% [1.05, 1.74] [1.08, 1.77]4 3.77 0.3160 0.5621 15% [2.65, 4.90] [2.77, 5.02]5 7.82 0.7952 0.8918 11% [6.04, 9.61] [6.19, 9.76]

Examinons la sensibilité des résultats si on modi�e la donnée C ′(2, 4) par rapport au dernierexemple. Ce seul changement implique une modi�cation des coe�cients f3 et σ2

3 et aussi de σ24 de

par sa construction, modi�cation qui va se répercuter sur toutes les années de survenance et faireaugmenter brusquement les erreurs standards (à cause de la forte augmentation de σ2

3).

C ′′ =

35.40 37.69 39.13 39.76 40.1638.61 40.62 42.77 44.56 45.0143.85 47.30 49.00 50.45 50.9649.52 52.59 54.80 56.42 56.9955.47 59.06 61.54 63.36 64.00

Les coe�cients fk et σ2k sont :

f1 = 1.0646 f2 = 1.0421 f3 = 1.0295 f4 = 1.0101,

σ21 = 5.0327 ∗ 10−3 σ2

2 = 3.5648 ∗ 10−3 σ23 = 13.5511 ∗ 10−3 σ2

4 = 3.5648 ∗ 10−3.

L'examen des réserves fournit le tableau suivant :

i Ri mse(Ri) se(Ri) se(Ri) en % de Ri IC Normal IC Lognormal2 0.45 0.3369 0.5804 129% [−0.71, 1.61] [0.04, 1.99]3 1.96 1.4907 1.2210 62% [−0.49, 4.40] [0.53, 5.23]4 4.40 2.0389 1.4279 32% [1.55, 7.26] [2.22, 7.88]5 8.53 2.8472 1.6874 20% [5.15, 11.90] [5.65, 12.38]

Une augmentation d'un montant de sinistre de 2% a donc conduit à une forte augmentation dela variabilité. Les erreurs standard relatives ont été multipliées par des coe�cients qui vont de 2à 10 selon l'année de survenance.

2.3.2 Estimation de l'erreur sur la réserve totale.Il est également intéressant de calculer l'erreur commise sur la réserve totale estimée R = R2 +· · ·+ Rn. On ne peut pas se contenter de sommer les erreurs (se(Ri))

2 parce qu'elles sont corréléesentre elles (car toutes in�uencées par les mêmes fk) mais on peut utiliser le théorème suivant.

Théorème 2.4. Sous les hypothèses (3), (4) et (5), mse(R) peut être estimé par

mse(R) =n∑

i=2

{mse(Ri) + Cin

(n∑

j=i+1

Cjn

)n−1∑

k=n+1−i

2σ2k/f

2k∑n−k

j=1 Cjk

}.

Page 9: edude ibnr methodes

La preuve est donnée dans Mack [1].Dans le premier exemple ci-dessus, la réserve totale vaut R = 14.79 et l'erreur estimée vautmse(R) = 2.3900. Nous avons donc que se(R) = 1.5460, soit 10.45% de R.

2.4 Formule récursive pour calculer l'erreur standard et introductiond'un tail factor.

Cette formule est donnée par Mack [4].

2.4.1 Formule récursive de calcul de l'erreur standard.Les erreurs standard sur les réserves estimées données à la section 2.3 peuvent être calculées defaçon récursive.Reprenons le modèle d'estimation de Chain Ladder

Cin = Ci,n+1−i · fn+1−i · · · fn−1.

Le théorème 2.3 donne la formule pour l'erreur standard sur Cin :

(se(Cin))2 = C2in

n−1∑

k=n+1−i

σ2k

f 2k

(1

Cik

+1∑n−k

j=1 Cjk

).

Cette formule peut être réécrite sous la forme :

(se(Cin))2 = C2in

n−1∑

k=n+1−i

((se(Fik))

2 + (se(fk))2)

/f 2k ,

où� Fik =

Ci,k+1

Cik,

� (se(Fik))2 =

σ2k

Cikest (c'est l'hypothèse (5)) un estimateur de V ar(Fik |Ci1, . . . , Cik) = E[(Fik−

fk)2 |Ci1, . . . , Cik] qui mesure la variation entre un coe�cient individuel Fik et la vraie valeur

fk, et� (se(fk))

2 =σ2

kPn−kj=1 Cjk

est (ceci est démontré dans le cadre de la section 2.6.1) un estimateur deV ar(fk |Ci1, . . . , Cik) = E[(fk − fk)

2 |Ci1, . . . , Cik] qui mesure la déviation entre la moyenneestimée fk et la vraie valeur fk.

Sous cette forme, la formule du calcul de l'erreur conduit au programme de récursion suivant :

se(Ci,n+1−i) = 0

(se(Ci,k+1))2 = C2

ik

((se(Fik))

2 + (se(fk))2)

+ (se(Cik))2 f 2

k

En utilisant les données du premier exemple précédent, on obtient les résultats suivants pour lesestimateurs de la variance des coe�cients de développement individuels Fik et de la variance descoe�cients de développement globaux de Chain Ladder fk :

Page 10: edude ibnr methodes

(se(Fik))2 =

4.54 ∗ 10−5 1.46 ∗ 10−5 6.76 ∗ 10−5 1.39 ∗ 10−5

4.16 ∗ 10−5 1.32 ∗ 10−5 6.10 ∗ 10−5 1.24 ∗ 10−5

3.67 ∗ 10−5 1.16 ∗ 10−5 5.35 ∗ 10−5 1.09 ∗ 10−5

3.25 ∗ 10−5 1.03 ∗ 10−5 4.76 ∗ 10−5 9.70 ∗ 10−6

2.90 ∗ 10−5 9.24 ∗ 10−6 4.25 ∗ 10−5 8.67 ∗ 10−6

(se(f1))2 = 9.61∗10−6 (se(f2))

2 = 4.35∗10−6 (se(f3))2 = 3.21∗10−5 (se(f4))

2 = 1.391∗10−5.

L'utilisation de ces coe�cients dans la formule récursive conduit aux mêmes résultats que ceuxobtenus par la formule du théorème 2.3.

Pour la réserve totale sur toutes les années d'accident, on a la formule récursive suivante(

se

(n∑

i=n+1−k

Ci,k+1

))2

=

(se

(n∑

i=n+2−k

Ci,k

))2

· f 2k

+n∑

i=n+1−k

C2ik · (se(Fik))

2

+

(n∑

i=n+1−k

Cik

)2

· (se(fk))2,

commençant avec k = 1.

2.4.2 Inclusion d'un tail factor.Comme le développement des sinistres survenus en l'année d'accident i n'est pas nécessairementterminé après n années de développement, on utilise un tail factor fult > 1 pour estimer le montantultime Ci,ult par

Ci,ult = Cin fult.

On peut prendre fult =∞∏

k=n

fk, où les fk futurs sont estimés par une extrapolation linéaire de

ln(fk − 1). Mais il faut prendre garde que ce tail factor soit plausible et en concordance avecl'expérience acquise sur le développement futur des sinistres.

La récursion peut être facilement étendue pour inclure un tail factor :

(se(Ci,ult))2 = C2

in

((se(Fi,ult))

2 + (se(fult))2)

+ (se(Cin))2 f 2ult.

On a donc besoin de valeurs pour fult, se(fult) et se(Fi,ult) ∀i. En pratique on �xe fult, se(fult)

et se(Fi,ult) pour un i donné. Pour cela, on �xe fult, par régression ou suivant l'expérience commedéjà discuté précédemment, puis on cherche k tel que

fk−1 > fult > fk.

Il reste à estimer, de la manière la plus raisonnable possible, se(fult) et se(Fi,ult). On peut parexemple prendre ces valeurs telles que

se(fk−1) > se(fult) > se(fk)

Page 11: edude ibnr methodes

etse(Fi,k−1) > se(Fi,ult) > se(Fik).

Une fois ces trois valeurs �xées, on peut en déduire σult = se(Fi,ult)√

Cin, et par suite déterminerse(Fi,ult) pour toutes les autres années de survenance i.Un exemple numérique de cette procédure est donné à la section 4.2.3.

2.5 Véri�cation des hypothèses sous-jacentes à la méthode de ChainLadder.

Rappelons les trois hypothèses sur lesquelles repose la méthode de Chain Ladder et que nous avonsutilisées dans les sections précédentes :

E(Ci,k+1 |Ci1, . . . , Cik) = Cik fk 1 ≤ i ≤ n, 1 ≤ k ≤ n− 1 (3),

{Ci1, . . . , Cin}, {Cj1, . . . , Cjn} ∀i, j sont indépendants (4),

V ar(Ci,k+1 |Ci1, . . . , Cik) = Cik σ2k 1 ≤ i ≤ n, 1 ≤ k ≤ n− 1 (5).

Il est donc important de véri�er que le triangle de données sur lequel on veut travailler satisfaitbien à ces trois conditions avant de pouvoir appliquer la méthode de Chain Ladder. Les testsprésentés sont tirés de Mack [2].

2.5.1 Véri�cation des hypothèses (3) et (5).Fixons l'année de développement k. L'équation (3) peut alors être interprétée comme un modèlede régression linéaire

Yi = c + Xi · b + εi 1 ≤ i ≤ n,

où εi est le terme d'erreur tel que E(εi) = 0,et où c = 0, Yi = Ci,k+1, Xi = Cik et b = fk.Les coe�cients de la régression sont déterminés par une minimisation des carrés des erreurs pon-dérés

n∑i=1

wi · (Yi − c−Xi · b)2,

où les wi sont inversément proportionnels à la V ar(Yi).Donc, si l'hypothèse (5) est véri�ée, V ar(Ci,k+1) est proportionnelle à Cik, et donc wi est inversé-ment proportionnel à Cik, ce qui conduit au problème de minimisation suivant :

minn−k∑i=1

(Ci,k+1 − Cik · fk)2/Cik.

En annulant la dérivée par rapport à fk de l'expression à minimiser, on trouve

fk =

n−k∑i=1

Ci,k+1

n−k∑i=1

Cik

,

soit le résultat déjà fourni en (2).Pour véri�er les hypothèses (3) et (5), on peut examiner deux types de graphiques :

Page 12: edude ibnr methodes

1. pour k donné, on construit le graphique de Ci,k+1 en fonction de Cik, et on regarde si lespoints sont proches de la droite passant par l'origine et de pente fk,

2. pour k donné, on construit le graphique des résidus (Ci,k+1 − Cik · fk)/√

Cik en fonction deCik, et on véri�e si l'hypothèse de variance utilisée conduit bien à des résidus aléatoires, nemanifestant pas de tendance.

En guise d'illustration, même si le nombre de données n'est pas vraiment su�sant pour e�ectuerdes tests, examinons le cas k = 1 de l'exemple déjà exploité dans les sections précédentes. Lesdonnées sont les suivantes :

Ci2 = (37.69 41.61 47.30 53.33),

Ci1 = (35.40 38.61 43.85 49.52),

f1 = 1.0750,

et conduisent aux deux graphiques suivants.

30 35 40 45 50 5530

35

40

45

50

55

60

Montants Ci1

Mon

tant

s C

i2

Fig. 1 � Exemple de véri�cation de l'hypothèse (3)

Nous voyons donc que les montants suivent de près la droite passant par l'origine et de pente f1.En ce qui concerne le caractère aléatoire des résidus, il est di�cile de juger vu le petit nombre dedonnées.

Si les graphes construits ne conduisent pas au résultat escompté, on peut remplacer (5) par d'autreshypothèses sur la variance et examiner les mêmes types de graphiques que ci-dessus :

� V ar(Ci,k+1) proportionnelle à 1 (c'est-à-dire, à k donné, V ar(Ci,k+1) identique ∀i), ce qui im-plique wi inversément proportionnel à 1. Le problème de minimisation est alors min

∑n−ki=1 (Ci,k+1−

Cik · fk)2, ce qui conduit à la solution fk1 =

n−k∑i=1

Ci,k+1 · Cik

n−k∑i=1

C2ik

.

Page 13: edude ibnr methodes

30 35 40 45 50 55-0.07

-0.06

-0.05

-0.04

-0.03

-0.02

-0.01

0

0.01

0.02

0.03

Montants Ci1

Rés

idus

Fig. 2 � Exemple de véri�cation de l'hypothèse(5)

� V ar(Ci,k+1) proportionnelle à C2ik, ce qui implique wi inversément proportionnel à C2

ik. Leproblème de minimisation est alors min

∑n−ki=1 (Ci,k+1 − Cik · fk)

2/C2ik, ce qui conduit à la

solution fk2 = 1n−k

n−k∑i=1

Ci,k+1

Cik

.

Toutes les formules de calcul d'erreur standard seraient alors à revoir pour ces hypothèses etcoe�cients de développement donnés, ce qui est facilement faisable.

2.5.2 Test de non corrélation des coe�cients de développement successifs.L'hypothèse (3) peut se réécrire E(

Ci,k+1

Cik|Ci1, . . . , Cik) = fk 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1. On

peut prouver que cette hypothèse implique que les facteurs de développement Ci,k+1

Ciket Cik

Ci,k−1sont

non corrélés : la valeur attendue du facteur Ci,k+1

Cikest la même, que le facteur précédent Cik

Ci,k−1soit

plus grand ou plus petit que d'habitude.Le test utilisé est le test de Spearman.Pour chaque colonne k, on trie les facteurs Ci,k+1

Cikpar ordre croissant et on note rik, le rang de

Ci,k+1

Cik, 1 ≤ rik ≤ n− k.

On retire ensuite le dernier coe�cient de la colonne, soit Cn−k,k+1

Cn−k,k, on recommence le tri et on note

si,k+1 le rang de Ci,k+1

Cik, 1 ≤ si,k+1 ≤ n− (k + 1).

On dé�nit alors

Tk = 1− 6n−k∑i=1

(rik − sik)2

(n− k)3 − n + k2 ≤ k ≤ n− 2.

On peut montrer que −1 ≤ Tk ≤ 1, et que sous l'hypothèse de non corrélation, E(Tk) = 0 etV ar(Tk) = 1

n−k−1.

Illustrons le calcul des rangs rik et si,k+1 par notre exemple habituel, pour lequel n = 5 et pourlequel les coe�cients de développement individuels sont les suivants :

Page 14: edude ibnr methodes

k = 1 k = 2 k = 3 k = 41.0647 1.0382 1.0161 1.01011.0777 1.0423 1.02741.0787 1.04551.0769

Ces coe�cients conduisent aux rangs suivants :

ri1 si2 ri2 si3 ri3

1 1 1 1 13 2 2 2 24 3 32

Nous remarquons d'emblée que dans l'exemple, les coe�cients gardent le même rang d'une colonneà l'autre (rik = sik), ce qui va conduire évidemment à rejeter la non corrélation des coe�cientssuccessifs. Nous obtenons en e�et T2 = T3 = 1.

On désire tester le triangle dans son ensemble et non pas par paires de colonnes. On va doncutiliser une statistique de test T globale, moyenne pondérée par n − k − 1 (poids inversémentproportionnels à V ar(Tk)) des Tk :

T =n−2∑

k=2

n− k − 1∑n−2k=2 n− k − 1

Tk =n−2∑

k=2

n− k − 1

(n− 2)(n− 3)/2Tk,

E(T ) = 0 et V ar(T ) =1

(n− 2)(n− 3)/2.

Si n− k ≥ 10, la distribution de Tk est normale en bonne approximation, et comme T est l'aggré-gation de plusieurs Tk non corrélés (sous l'hypothèse nulle de non corrélation des coe�cients dedéveloppement successifs, les Tk sont non corrélés), on peut supposer que T a approximativementune distribution normale.

Dans l'exemple T = 23· T2 + 1

3· T3 = 1. Le nombre de données est néanmoins insu�sant pour

appliquer le test.

Comme le test n'est qu'approximatif et qu'on cherche à détecter des corrélations dans le triangleentier, on ne prend pas un intervalle de con�ance à 95% qui a très peu de chances de rejeter lanon corrélation mais un intervalle de con�ance à 50%.On ne rejettera donc pas la non corrélation si

−0.67√(n− 2)(n− 3)/2

≤ T ≤ 0, .67√(n− 2)(n− 3)/2

.

Page 15: edude ibnr methodes

2.5.3 Test de non e�et d'une année calendrier.Il reste à tester l'hypothèse (4), qui suppose l'indépendance des di�érentes années de survenanceentre elles. En e�et certains triangles de données sont sujets à des e�ets calendrier (comme parexemple des changements dans le traitement ou la réservation des sinistres, des changementsd'in�ation) qui peuvent a�ecter plusieurs années d'accident de la même façon et donc perturberl'indépendance.Soit les éléments d'une diagonale

Dj = {Cj1, Cj−1,2, . . . , C2,j−1, C1j} 1 ≤ j ≤ n,

et les coe�cients de développement qui dépendent des éléments de Dj, soit que les éléments deDj sont au dénominateur :

Aj = {Cj2

Cj1

, . . . ,C1,j+1

C1j

},

soit que les éléments de Dj sont au numérateur :

Aj−1 = {Cj−1,2

Cj−1,1

, . . . ,C1,j

C1,j−1

}.

Donc, si les éléments de Dj sont plus grands que d'habitude, les éléments de Aj seront plus petitset les éléments de Aj−1 plus grands que d'habitude.Pour chaque colonne k, on marque les coe�cients de développement par un G s'ils sont supérieursà la médiane de la colonne et par un P s'ils sont inférieurs à la médiane. Remarquons que quandle nombre d'éléments de la colonne est impair, il y a un élément qui est égal à la médiane et qui nesera pas marqué. Pour chaque diagonale Aj de coe�cients de développement (2 ≤ j ≤ n− 1), oncompte alors le nombre d'éléments marqués d'un G, soit Gj et le nombre d'éléments marqués d'unP , soit Pj. S'il n'y a pas de changement d'une année calendrier à l'autre, alors Gj et Pj doiventêtre proches l'un de l'autre, chaque coe�cient de développement ayant 50% de chances d'être Gou P , ou, pour l'exprimer autrement, Zj = min(Gj, Pj) doit être proche de Gj+Pj

2.

Dans l'exemple étudié, les coe�cients de développement individuel, déjà mentionnés dans la sec-tion 2.5.2, conduisent à la décomposition en coe�cients P et coe�cients G suivante :

P P P ∗G ∗ GG GP

Pour chacune des diagonales le décompte obtenu est alors le suivant :

diag j Pj Gj Zj

2 1 1 13 1 1 14 1 2 1

Pour élaborer un test, il faut tout d'abord déterminer quels sont les deux premiers moments deZj.En cas de non rejet de l'hypothèse de non e�et signi�catif d'une année calendrier, Pj suit une loibinomiale de paramètres nj = Gj + Pj et p = 1/2. On peut alors montrer que

E(Zj) =nj

2−

(nj − 1

mj

)nj

2nj,

Page 16: edude ibnr methodes

V ar(Zj) =nj(nj − 1)

4−

(nj − 1

mj

)nj(nj − 1)

2nj+ E(Zj)− (E(Zj))

2,

où mj = bnj−1

2c.

On ne teste pas les Zj séparément pour éviter une accumulation des erreurs de probabilité et onconsidère donc une variable globale Z = Z2 + · · · + Zn−1, avec E(Z) =

∑E(Zj) et V ar(Z) =∑

V ar(Zj).Nous pouvons supposer que Z suit une distribution normale et nous ne rejettons pas l'hypothèsede non e�et signi�catif d'une année calendrier (au seuil α = 5%) si

E(Z)− 2√

V ar(Z) ≤ Z ≤ E(Z) + 2√

V ar(Z).

Dans l'exemple nous trouvons :

diag j Zj E(Zj) V ar(Zj)

2 1 0.50 0.25003 1 0.50 0.25004 1 0.75 0.1875

Total 3 1.75 0.6875

Si le nombre de données était su�sant pour appliquer le test, nous trouverions 0.092 ≤ 3 ≤ 3.408,ce qui conduirait à ne pas rejeter l'indépendance des années de survenance.

2.6 Adaptation des formules d'erreur.Les mesures de variabilité des réserves estimées par la méthode de Chain Ladder ont été e�ectuéespour des coe�cients de développement calculés de manière standard, c'est-à-dire en utilisant toutesles données disponibles.En pratique, si on travaille avec un nombre important d'années de survenance et si on s'aperçoitqu'il y a une cassure dans le triangle des données, c'est-à-dire que les sinistres survenus lors desannées les plus récentes ne se développent pas de la même façon que ceux des années antérieures,on va peut-être utiliser des coe�cients de développement qui, au lieu d'être estimés à partir detoutes les années précédentes, le sont à partir des années les plus récentes.

Nous allons donc travailler avec le triangle de données suivant, comportant n années de survenanceet n années de développement. Nous supposons que les m premières années de survenance formentun bloc, c'est-à-dire ont un développement semblable, et que les n−m dernières années formentun autre bloc, avec un schéma de développement di�érent de celui du premier bloc.

C11 C12 . . . C1,n−m C1,n−m+1 . . . C1,n−1 C1n

C21 C22 . . . C2,n−m C2,n−m+1 . . . C2,n−1... ... ... ... ...

Cm1 Cm2 . . . Cm,n−m Cm,n−m+1

Cm+1,1 Cm+1,2 . . . Cm+1,n−m... ... ...

Cn−1,1 Cn−1,2

Cn1

Remarquons que le triangle pourrait être découpé en un nombre de blocs plus élevé.

Page 17: edude ibnr methodes

Nous utilisons la méthode de Chain Ladder pour obtenir les montants ultimes de sinistres. Nousconsidérons donc que les données satisfont aux trois hypothèses habituelles :

E(Ci,k+1 |Ci1, . . . , Cik) = Cik fk 1 ≤ i ≤ n, 1 ≤ k ≤ n− 1 (3),

{Ci1, . . . , Cin}, {Cj1, . . . , Cjn} ∀i, j sont indépendants (4),

V ar(Ci,k+1 |Ci1, . . . , Cik) = Cik σ2k 1 ≤ i ≤ n, 1 ≤ k ≤ n− 1 (5).

Les estimateurs fk de fk et σ2k de σ2

k auront la même forme que précédemment (voir (2) et théo-rème 2.3) mais di�éreront en fonction de k :

� pour k allant de 1 à n−m−1, les coe�cients sont calculés à partir des années de survenanceles plus récentes, soit de m + 1 à n,

� pour k allant de n−m à n−1, les coe�cients sont calculés comme avant, à partir des annéesde survenance 1 à m.

Les coe�cients de développement fk sont donc toujours le résultat de régressions linéaires pondé-rées par 1

Cik, mais sur un nombre de données moindre. Tout se passe comme si on travaillait sur

deux triangles di�érents auxquels on applique, séparément, la méthode de Chain Ladder. Remar-quons que tant qu'on travaille sur les deux triangles de façon séparée, on n'a pas besoin de fn−m

et σ2n−m, coe�cients permettant de passer d'un triangle à l'autre. De plus, les trois hypothèses

doivent être véri�ées sur les deux triangles séparés et pas sur l'ensemble de données de départ. Ene�et, si on sépare les années de survenance en deux groupes distincts, c'est justement parce quel'hypothèse (3) n'est pas satisfaite par les données dans leur ensemble.Le triangle supérieur droit, Cij, pour 1 ≤ i ≤ m et n−m+1 ≤ j ≤ n+1− i conduit aux montantsultimes C1n, C2n, . . . , Cmn.Le triangle inférieur gauche Cij, pour m + 1 ≤ i ≤ n et 1 ≤ j ≤ n + 1− i conduit aux montantsultimes Cm+1,n−m, Cm+2,n−m, . . . , Cn,n−m.

C11 C12 . . . C1,n−m C1,n−m+1 . . . C1,n−1 C1n

C21 C22 . . . C2,n−m C2,n−m+1 . . . C2,n−1 C2n... ... ... ... ... ...

Cm1 Cm2 . . . Cm,n−m Cm,n−m+1 . . . Cm,n−1 Cmn

Cm+1,1 Cm+1,2 . . . Cm+1,n−m... ... ...

Cn−1,1 Cn−1,2 . . . Cn−1,n−m

Cn1 Cn2 . . . Cn,n−m

Ecrivons explicitement les formules fournissant les coe�cients fk et σ2k :

fk =

n−k∑i=m+1

Ci,k+1

n−k∑i=m+1

Cik

1 ≤ k ≤ n−m− 1

fk =

n−k∑i=1

Ci,k+1

n−k∑i=1

Cik

n−m ≤ k ≤ n− 1

(6)

Page 18: edude ibnr methodes

Les fk sont des estimateurs sans biais des fk (la démonstration est analogue à celle du théo-rème 2.2).

σ2k = 1

(n−k)−m−1

n−k∑i=m+1

Cik (Ci,k+1

Cik

− fk)2 1 ≤ k ≤ n−m− 2

σ2k = 1

n−k−1

n−k∑i=1

Cik (Ci,k+1

Cik

− fk)2 n−m ≤ k ≤ n− 2

(7)

Les σ2k sont des estimateurs sans biais des σ2

k. Il faut encore estimer σ2n−m−1 et σ2

n−1, ce qui peutse faire par extrapolation sur base des σ2

k précédents ou par une formule du type de celle utiliséedans le théorème 2.3.Donc, l'application de Chain Ladder aux deux triangles séparément nous permet d'utiliser laformule du théorème 2.3 pour estimer la variabilité des réserves :

� pour le bloc supérieur droit

mse(Cin) = C2in

n−1∑

k=n+1−i

σ2k

f 2k

(1

Cik

+1∑n−k

j=1 Cjk

)2 ≤ i ≤ m

� pour le bloc inférieur gauche

mse(Ci,n−m) = C2i,n−m

n−m−1∑

k=n+1−i

σ2k

f 2k

(1

Cik

+1∑n−k

j=m+1 Cjk

)m + 2 ≤ i ≤ n

On voudrait encore pouvoir estimer les montants ultimes Cin pour m+1 ≤ i ≤ n et leur variabilité.Pour cela, il faut donc d'abord faire une hypothèse sur la façon dont on va compléter le bloc restant,à savoir le bloc inférieur droit. Nous allons envisager trois hypothèses di�érentes.

2.6.1 Première hypothèse.On applique Chain Ladder avec les coe�cients fk estimés sur les années d'accident 1 à m. Onsuppose donc que le bloc à compléter satisfait aux hypothèses pour appliquer Chain Ladder etqu'il se développe comme dans les années de survenance plus anciennes (comme le bloc supérieurdroit).Nous obtenons alors, pour m + 1 ≤ i ≤ n :

mse(Cin) = C2in

[n−m−1∑

k=n+1−i

σ2k

f 2k

(1

Cik

+1∑n−k

j=m+1 Cjk

)+

n−1∑

k=n−m

σ2k

f 2k

(1

Cik

+1∑n−k

j=1 Cjk

)],

où les fk sont calculés par (6) et les σ2k sont calculés par (7).

La démonstration de cette formule, qui se trouve en annexe, est une adaptation de la démonstrationdu théorème 2.3, donnée dans Mack [1].La formule récursive déterminée à la section 2.4 reste valable, moyennant une petite adaptation :

(se(Ci,k+1))2 = C2

ik

((se(Fik))

2 + (se(fk))2)

+ (se(Cik))2 f 2

k ,

où� (se(Fik))

2 =σ2

k

Cik

� (se(fk))2 =

σ2kPn−k

j=m+1 Cjkpour 1 ≤ k ≤ n−m− 1

σ2kPn−k

j=1 Cjkpour n−m ≤ k ≤ n− 1.

Page 19: edude ibnr methodes

2.6.2 Deuxième hypothèse.Utiliser des facteurs de développement calculés sur les m premières années pour compléter la partieinférieure de la matrice, alors qu'on l'avait coupée en deux justement parce que le développementdes années récentes était di�érent de celui des années antérieures, n'est peut-être pas très logique.Une autre hypothèse est de supposer que le développement total, depuis l'année 1 jusqu'à l'annéen est le même pour toutes les années de survenance (depuis 1 jusque n). Nous supposons donc queCin = ftot · Ci1 ∀i. Nous estimons alors ftot par ftot sur les m premières années de survenance :

ftot =

m∑i=1

Cin

m∑i=1

Ci1

.

Nous examinons ensuite quel est le développement total déjà subi par les sinistres survenus durantles années m + 1 à n et nous l'estimons par

fint =

n∑i=m+1

Ci,n−m

n∑i=m+1

Ci1

.

En calculant le rapport ftot/fint, nous obtenons le facteur par lequel multiplier les montants desinistres estimés en année de développement (n −m) a�n d'obtenir les montants de ces sinistresen l'année de développement n. Ce facteur est donc comparable à un tail factor,

fult =ftot

fint

,

et nous utilisons la formule obtenue à la section 2.4.2 pour obtenir l'estimation de la variabilitéde Cin pour m + 1 ≤ i ≤ n.

Remarque : d'autres dé�nitions du fult peuvent être utilisées pour compléter le triangle inférieur. Siles observations conduisent à penser que le développement total des sinistres sera moins importantpour les années m + 1 à n que pour les années précédentes (parce qu'on s'aperçoit qu'on paie unefraction plus importante du sinistre lors de la première année de développement), alors on peutprendre

fult =4/5ftot

fint

,

par exemple.

2.6.3 Troisième hypothèse.Le problème de la deuxième hypothèse est qu'on ne connaît pas la part du sinistre qui est payéedurant la première année de développement, on peut donc di�cilement estimer quel est le coef-�cient de développement total permettant d'arriver aux montants ultimes (comment pourrait-ontrouver le 4/5 ci-dessus ?).Une troisième façon de compléter le bloc inférieur droit, façon qui n'utilise que les données dubloc inférieur gauche, est de partir des coe�cients de développement estimés pour les années de

Page 20: edude ibnr methodes

développement 1 à n−m− 1 et d'extrapoler pour obtenir les coe�cients des années de dévelop-pement suivantes. On peut par exemple ajuster une courbe exponentielle négative. Sherman [5]montre qu'on obtient un meilleur ajustement en utilisant une courbe de la forme ft = 1 + at−b,où t représente l'année de développement et ft le coe�cient de développement pour l'année t. Onpeut réécrire la fonction comme ln(ft − 1) = ln a + b ln 1

t, et obtenir les paramètres a et b par une

régression linéaire de ln(ft − 1) sur ln 1t.

Le fonctionnement de ces trois hypothèses peut être résumé de la façon suivante. Prenons lecas où, dans les années récentes, les sinistres se développent au début plus rapidement que parle passé. L'hypothèse 1 suppose alors que ces sinistres vont, par la suite, reprendre le mêmedéveloppement que les sinistres des années antérieures. L'hypothèse 2 suppose que, au total, cessinistres se développent comme dans le passé, et que donc, s'ils se développent plus vite au début,ils se développeront moins vite par la suite. En�n, l'hypothèse 3 suppose que si les sinistres sedéveloppent plus vite au début, ils continuent à le faire par la suite. Seule une connaissanceapprofondie du portefeuille et de la réservation permet de choisir l'hypothèse la plus proche de laréalité.

2.7 Formules d'erreur pour les ratios S/P.Dans cette section nous nous intéressons au ratio S/P, d'une grande importance pour l'assureur.Supposons que les Cik représentent les montants de sinistres à charge de l' assureur. Pour l'annéede survenance i, nous dé�nissons donc le ratio S/P correspondant par (S/P )i =

Cin

enci

, soit lemontant �nal des sinistres de l'année i divisé par l'encaissement de primes relatif à l'année i. Ce

ratio est estimé par ( ˆS/P )i =Cin

enci

et l'erreur d'estimation est directement obtenue par

mse[( ˆS/P )i] = (

1

enci

)2 mse(Cin),

où mse(Cin) a été obtenu à la section 2.3.1.Pour le premier exemple, présenté à la section 2.3.1 et pour des encaissements annuels donnés,nous obtenons les résultats suivants :

i Cin enci S/P

se( ˆS/P )

se( ˆS/P ) en % de ˆS/P

2 45.01 64 0.7033 0.0036 0.51%3 51.05 77 0.6630 0.0068 1.03%4 57.38 78 0.7357 0.0078 1.06%5 64.16 85 0.7548 0.0089 1.18%

Pour ce faire une idée de la sinistralité attendue on travaille souvent avec un S/P moyen calculé

sur les dernières années de survenance. Dé�nissons ainsi (S/P )m =1

n−m + 1

n∑i=m

Cin

enci

, le S/P

moyen des années de survenance m (1 ≤ m ≤ n) à n et estimons-le en remplaçant simplementCin par Cin. Pour estimer l'erreur sur ce S/P moyen, nous aurons donc besoin de l'erreur d'unesomme et nous utilisons donc la même méthode que celle déjà employée à la section 2.3.2 pourobtenir l'erreur sur la réserve totale. Nous obtenons alors :

mse[( ˆS/P )m] =

1

(n−m + 1)2

n∑i=m

{mse(Cin)

(enci)2+

Cin

enci

(n∑

j=i+1

Cjn

encj

)n−1∑

k=n+1−i

2σ2k/f

2k∑n−k

j=1 Cjk

}.

Page 21: edude ibnr methodes

Pour l'exemple et pour (S/P )m étant le ratio S/P moyen calculé sur les années i à n (c'est-à-direm = i), cela nous donne :

i Cin enci (S/P )m

se[( ˆS/P )m]

se[( ˆS/P )m] en % de ( ˆS/P )m

1 40.16 60 0.7052 0.0039 0.55%2 45.01 64 0.7142 0.0049 0.68%3 51.05 77 0.7178 0.0060 0.84%4 57.38 78 0.7452 0.0070 0.93%5 64.16 85 0.7548 0.0089 1.18%

En�n, les S/P moyens utilisés sont le plus souvent obtenus par des moyennes pondérées parl'encaissement, soit (S/P )p

m =1

n−m + 1

∑ni=m Cin∑ni=m enci

. L'erreur sur ce ratio S/P moyen est alorsdonnée par

mse[( ˆS/P )p

m] = (1∑n

i=m enci

)2

mse(n∑

i=m

Cin),

où mse(∑n

i=m Cin) a été obtenu à la section 2.3.2.Pour l'exemple et pour (S/P )p

m étant le ratio S/P moyen pondéré calculé sur les années i à n(c'est-à-dire m = i), cela nous donne :

i Cin enci (S/P )pm

se[( ˆS/P )p

m]

se[( ˆS/P )pm] en % de ( ˆS/P )p

m

1 40.16 60 0.7081 0.0042 0.60%2 45.01 64 0.7158 0.0051 0.71%3 51.05 77 0.7191 0.0061 0.84%4 57.38 78 0.7456 0.0070 0.94%5 64.16 85 0.7548 0.0089 1.18%

3 Projected case estimates.L'utilisation de la méthode de Chain Ladder sur les montants totaux (paiements + réserves) desinistres suppose que les paiements et les réserves se développent de façon identique. La méthodeétudiée dans ce chapitre emploie deux types de facteurs de développement : l'un pour les réserveset l'autre pour les paiements. Cette méthode, présentée dans le livre de Taylor [6] travaille doncavec les deux types de données, ce qui permet d'utiliser toute l'information disponible, tout enliant entre elles les évolutions des paiements et des réserves.

3.1 Modèle pour les réserves.Cette méthode est présentée dans la version où on travaille en francs constants, on ramène parexemple tous les montants en francs de la dernière année connue. Ces montants en francs constantssont symbolisés par ∗. Dé�nissons

Q∗(i, j) = réserve de sinistre estimée en période de développement j pour lessinistres survenus en année d'accident i,

C∗(i, j) = montant payé en année de développement j pour les sinistres sur-venus en année d'accident i.

Remarquons qu'en ce qui concerne les réserves, on travaille avec des montants cumulés et qu'ence qui concerne les paiements, on travaille avec des montants décumulés.

Page 22: edude ibnr methodes

Le modèle retenu pour l'évolution des réserves est le suivant :

Q∗(i, j + 1) = k(j + 1) ·Q∗(i, j)− C∗(i, j + 1), (8)

où k(j + 1) mesure la variation que subit, entre les années j et j + 1, la prévision qu'on fait surle coût total des sinistres survenus en l'année d'accident i.En e�et, Q∗(i, j +1) représente l'estimation de ce qu'il reste à payer à la �n de l'année de dévelop-pement j +1 et Q∗(i, j) représente cette même estimation à la �n de l'année de développement j.Si l'estimation n'a pas changé (c'est-à-dire k(j + 1) = 1), alors Q∗(i, j + 1) est égal à la di�érenceentre Q∗(i, j) et ce qui est payé en l'année j + 1, soit C∗(i, j + 1).L'estimateur de k(j + 1) choisi est une moyenne pondérée par les Q∗(i, j) des coe�cients indivi-duels :

k(j + 1) =

n−j∑i=1

(C∗(i, j + 1) + Q∗(i, j + 1))

n−j∑i=1

Q∗(i, j)

. (9)

3.2 Modèle pour les paiements.Le montant payé en l'année de développement j + 1, soit C∗(i, j + 1) est une fraction de Q∗(i, j),ce qui avait été mis en réserve à la �n de l'année précédente :

C∗(i, j + 1) = h(j + 1) ·Q∗(i, j). (10)

A nouveau, ces coe�cients de développement sont estimés par une moyenne pondérée par lesQ∗(i, j) des coe�cients individuels :

h(j + 1) =

n−j∑i=1

C∗(i, j + 1)

n−j∑i=1

Q∗(i, j)

. (11)

3.3 Extrapolation des triangles.Le triangle des paiements et le triangle des réserves sont complétés simultanément, diagonale pardiagonale, à l'aide des deux modèles (8) et (10), utilisés l'un après l'autre.On commence par la première diagonale inconnue du triangle des paiements :

C∗(i, n− i + 2) = h(n− i + 2) ·Q∗(i, n− i + 1) 2 ≤ i ≤ n.

On complète ensuite la première diagonale inconnue du triangle des réserves de sinistres :

Q∗(i, n− i + 2) = k(n− i + 2) ·Q∗(i, n− i + 1)− C∗(i, n− i + 2) 2 ≤ i ≤ n.

On continue avec la diagonale suivante de la matrice des paiements :

C∗(i, n− i + 3) = h(n− i + 3) · Q∗(i, n− i + 2) 3 ≤ i ≤ n.

Et ainsi de suite...

Reprenons toujours le même exemple traité dans les chapitres précédents et supposons que les don-nées concernaient des montants totaux de sinistres (paiements + réserves) pouvant se décomposeren une matrice des paiements décumulés C et une matrice des réserves de sinistres Q.

Page 23: edude ibnr methodes

C =

15.40 4.90 7.77 7.19 4.3016.61 2.60 11.03 9.1221.35 7.29 5.5924.52 8.4930.47

Q =

20.0 17.39 11.06 4.50 0.6022.0 22.40 13.13 5.2022.5 18.66 15.2225.0 20.3225.0

Les coe�cients du modèle des réserves, calculés par (9) sont :

k(2) = 1, .1402 k(3) = 1.0915 k(4) = 1.0752 k(5) = 1.0889.

Les coe�cients du modèle des paiements, calculés par (11) sont :

h(2) = 0.2601 h(3) = 0.4173 h(4) = 0.6742 h(5) = 0.9556.

Les deux matrices peuvent alors être complétées diagonale par diagonale pour obtenir :

C =

15.40 4.90 7.77 7.19 4.3016.61 2.60 11.03 9.12 4.9721.35 7.29 5.59 10.26 5.8324.52 8.49 8.48 9.24 5.2530.47 6.50 9.18 10.00 5.68

Q =

20.0 17.39 11.06 4.50 0.6022.0 22.40 13.13 5.20 0.6922.5 18.66 15.22 6.10 0.8125.0 20.32 13.70 5.49 0.7325.0 22.00 14.84 5.95 0.79

Si on recumule les paiements et qu'on les ajoute aux réserves de sinistres, on obtient les résultatstotaux suivants :

35.40 37.69 39.13 39.76 40.1638.61 41.61 43.37 44.56 45.0243.85 47.30 49.45 50.60 51.1449.52 53.33 55.19 56.22 56.7155.47 58.98 60.99 62.11 62.63

3.4 Lien avec la méthode de Chain Ladder.Dans cette section, nous proposons d'utiliser la technique Chain Ladder a�n d'analyser la méthodedes projected case estimates.Si on combine les deux modèles (8) et (10) en un seul, on obtient

Q∗(i, j + 1) = (k(j + 1)− h(j + 1)) ·Q∗(i, j).

En remplaçant les di�érents termes du facteur (k(j +1)−h(j +1)) par les estimateurs (9) et (11),nous obtenons

Q∗(i, j + 1) =

n−j∑i=1

Q∗(i, j + 1)

n−j∑i=1

Q∗(i, j)

·Q∗(i, j),

ce qui revient à appliquer la méthode de Chain Ladder standard au triangle des réserves.

Page 24: edude ibnr methodes

Plutôt que d'utiliser la méthode vue à la section 3.3, on peut donc tout simplement compléterle triangle des réserves par la méthode de Chain Ladder, calculer les coe�cients h(j + 1) par laformule (11) et en�n compléter le triangle des paiements.

Les coe�cients de développement de la méthode de Chain Ladder calculés pour le triangle desréserves ci-dessus sont

f1 = 0.8801 f2 = 0.6743 f3 = 0.4010 f4 = 0.1333.

Ils conduisent à compléter le triangle des réserves de la même façon que dans la section 3.3.

Comme il existe un lien entre ce modèle et la méthode de Chain Ladder, on peut espérer trouverdes formules pour les erreurs standard sur les montants estimés.En ce qui concerne les réserves, extrapolées par la méthode de Chain Ladder, on peut appliquerdirectement les formules du chapitre 2.Examinons plus en détails le cas des paiements. Le modèle des paiements conduit à la formulesuivante :

Ci,k+1 = h(k + 1) · Qik,

où Qik est estimé par la méthode de Chain Ladder, soitQik = Qi,k−1 · fk−1 = . . . = Qi,n+1−i · fn+1−i · · · fk−1.

On obtient donc queCi,k+1 = Qi,n+1−i · fn+1−i · · · fk−1 · h(k + 1),

ce qui ressemble fort au modèle de Chain Ladder.De manière similaire aux développements du chapitre 2, nous nous baserons donc sur les hypothèsessuivantes :

� Indépendance des années de survenance entre elles,� E[Qi,k+1 |Ci1, . . . , Cik, Qi1, . . . , Qik] = fk ·Qik,

E[Ci,k+1 |Ci1, . . . , Cik, Qi1, . . . , Qik] = h(k + 1) ·Qik,� V ar[Qi,k+1 |Ci1, . . . , Cik, Qi1, . . . , Qik] = σ2

k ·Qik,V ar[Ci,k+1 |Ci1, . . . , Cik, Qi1, . . . , Qik] = τ 2

k ·Qik.Les paramètres sont estimés par les formules suivantes :

fk =

n−k∑i=1

Qi,k+1

n−k∑i=1

Qi,k

,

h(k + 1) =

n−k∑i=1

Ci,k+1

n−k∑i=1

Qi,k

,

σ2k =

1

n− k − 1

n−k∑i=1

Qik

(Qi,k+1

Qik

− fk

)2

,

τ 2k =

1

n− k − 1

n−k∑i=1

Qik

(Ci,k+1

Qik

− h(k + 1)

)2

.

Page 25: edude ibnr methodes

Tous ces estimateurs sont non biaisés.

En adaptant la démonstration du théorème 2.3 (dont une version est donnée en annexe), noustrouvons l'expression suivante pour l'estimation de l'erreur carrée moyenne sur le montant Cik :

mse(Cik) = C2ik

[k−2∑

j=n+1−i

σ2j

f 2j

(1

Qij

+1∑n−j

l=1 Qlj

)+

τ 2k−1

h(k)2

(1

Qi,k−1

+1∑n−k+1

l=1 Ql,k−1

)].

Remarquons qu'ici, l'ensemble D conditionnellement auquel on travaille est l'ensemble de toutesles données Cij et Qij.Remarquons en�n que l'erreur obtenue porte sur un montant de paiement décumulé. Pour obtenirl'erreur sur les paiements cumulés (et donc �nalement sur les montants ultimes de sinistres), onne peut pas se contenter de sommer les erreurs sur les paiements décumulés, et il faudrait adapterune formule du type de celle construite pour la somme des réserves à la section 2.3.2, ce qui n'estpas immédiat.

4 Application.Nous allons maintenant appliquer les diverses méthodes proposées dans les chapitres précédentsà des données réelles, issues de contrats en responsabilité civile automobile d'une compagnie alle-mande. Nous disposons de données concernant les montants payés et les montants en réserve pourles sinistres survenus entre 1985 et 1998.

4.1 Données.Les tableaux 1 et 2 reprennent respectivement les données de paiements et de réserves.

1 2 3 4 5 6 7 8 9 10 11 12 13 141985 31499 43711 45509 46312 46786 47204 47404 47768 47963 48168 48428 48557 48863 490811986 36822 49591 51733 52841 53605 54156 54857 55256 55433 55791 56014 56416 566401987 40962 53307 55310 56594 57359 58096 58525 58886 59416 59721 60031 604721988 43350 56043 57981 58942 59844 60463 61006 61349 61715 61934 622671989 42638 55788 58168 59980 60944 62208 63360 64064 64617 650181990 44666 60675 63281 64662 65543 66268 66797 67314 685411991 58291 83957 87690 90437 92102 94021 95751 967941992 69050 93642 97694 100042 101654 103027 1047061993 68513 91377 95537 98251 100020 1008571994 63337 85106 88755 91226 931051995 62555 81700 84782 867851996 59407 78481 815171997 61091 798921998 74211

Tab. 1 � Paiements cumulés (en milliers).

4.2 Résultats pour les montants en francs courants.Nous examinons les montants sans tenir compte de l'in�ation, c'est-à-dire qu'on fait l'hypothèseimplicite d'une in�ation constante sur toute la période d'observation. Nous pouvons soit travailleravec les paiements, soit avec les montants totaux (paiements plus réserves). Nous testons ensuitesi les hypothèses liées à l'utilisation de la méthode de Chain Ladder sont véri�ées par le triangledes paiements et nous envisageons le cas où ce triangle est séparé en deux blocs distincts d'annéesde survenance.

Page 26: edude ibnr methodes

1 2 3 4 5 6 7 8 9 10 11 12 13 141985 30298 17875 9181 6324 5280 4390 4086 3724 3176 2748 2711 2441 1790 11601986 31562 19374 12314 9068 7352 6098 5492 4436 4095 4006 3932 3935 37161987 30975 17637 13143 9940 8285 7141 6381 6132 5500 4430 4330 39771988 30663 15453 10983 7834 6309 5608 4597 4113 3558 3510 33121989 34256 22821 16002 12937 10224 8722 7798 7001 6452 49821990 33768 20393 16368 11470 9336 8534 8808 8444 65001991 52319 31160 24682 20420 18519 17992 15417 149281992 43031 25069 22502 21257 20804 20306 147301993 52012 26968 21766 19263 19601 176411994 48321 24106 23127 21173 230771995 48787 24120 24334 237651996 47640 23303 229501997 54561 282201998 83807

Tab. 2 � Réserves de sinistres (en milliers).

4.2.1 Paiements en francs courants.Les résultats pour les paiements se trouvent dans le tableau 3.

Chain Ladder PCE1985 49,081,105 49,081,1051986 58,892,686 57,092,6311987 61,048,730 61,221,1691988 63,232,335 63,149,0341989 66,354,966 66,688,9251990 70,310,892 70,849,1251991 100,146,339 102,722,9241992 109,235,417 111,178,7801993 106,563,521 109,038,8951994 99,674,656 104,711,1871995 94,416,888 99,791,0301996 90,899,256 94,394,9311997 92,784,165 96,358,7401998 115,382,193 137,137,105

Tab. 3 � Paiements cumulés �naux en francs courants.

La méthode PCE (Projected Case Estimates) donne des résultats plus élevés que Chain Ladderquand on se rapproche des années de survenance plus récentes. C'est surtout vrai pour le montantcorrespondant à l'année 1998, ce qui est dû à un coe�cient h(2) (voir tableau 4) et à une réservede départ particulièrement élevés.Le tableau 4 présente les coe�cients de développement de la méthode de Chain Ladder, fk et lesσk correspondants ainsi que les coe�cients de développement du modèle des réserves ( k(j + 1))et du modèle des paiements (h(j + 1)) de la méthode des "projected case estimates".

Chain Ladder : fk Chain ladder : σk PCE : k(j+1) PCE : h(j+1)1 1.3388 296.1864 0.9803 0.42942 1.0415 27.4872 0.9391 0.12893 1.0250 39.8119 0.9418 0.10104 1.0162 24.0810 1.0056 0.08365 1.0132 40.7404 0.9921 0.07996 1.0128 44.4508 0.9427 0.08847 1.0083 17.9956 0.9987 0.07108 1.0086 43.0330 0.9551 0.09009 1.0051 9.5186 0.9290 0.065310 1.0050 4.9988 1.0486 0.076511 1.0059 19.0237 1.0323 0.088612 1.0051 11.9030 0.9468 0.083213 1.0045 7.4477 0.7700 0.1218

Tab. 4 � Coe�cients de développement.

Page 27: edude ibnr methodes

Le tableau 5 présente les résultats du calcul des erreurs standards sur les réserves estimées parChain Ladder.

Année Réserve se(Ri) se(Ri) en % de Ri1986 252,683 82,361 33%1987 576,893 145,563 25%1988 965,571 232,266 24%1989 1,337,211 244,398 18%1990 1,769,736 269,468 15%1991 3,352,433 598,863 18%1992 4,529,328 667,898 15%1993 5,706,261 830,105 15%1994 6,569,621 912,313 14%1995 7,631,816 919,035 12%1996 9,382,503 988,059 11%1997 12,891,799 1,040,287 8%1998 41,170,897 3,336,963 8%Total 96,136,752 5,158,558 5%

Tab. 5 � Erreurs sur les réserves.

On observe une décroissance de l'erreur standard relative au �l des années de survenance : l'erreurabsolue augmente moins vite que la valeur de la réserve.

4.2.2 Montants totaux en francs courants.Le tableau 6 présente les résultats pour ces montants.

Chain Ladder PCE1985 50,241,285 50,241,2851986 59,865,862 59,501,6031987 63,730,359 63,447,3691988 64,978,186 64,898,3751989 69,564,580 69,246,8031990 74,188,488 73,731,6951991 110,019,968 108,449,5491992 117,600,047 116,420,9021993 115,832,609 114,402,2321994 113,440,579 111,111,2971995 108,038,881 105,867,6571996 100,916,012 99,328,9431997 102,887,504 101,274,0101998 149,074,994 145,178,959

Tab. 6 � Montants totaux cumulés �naux en francs courants.

Remarquons que pour la méthode de Chain Ladder, les résultats sont obtenus en travaillant di-rectement avec le triangle des montants totaux. Pour l'autre méthode, les montants sont obtenusen sommant les triangles de paiements et de réserves complétés séparément. Si on applique sépa-rément la méthode de Chain Ladder aux triangles de paiements et de réserves, et puis qu'on lessomme, on obtient des montants plus faibles : par exemple ; 116,315,139 en 1998.

4.2.3 Décomposition de la matrice en deux morceaux.Si nous e�ectuons, sur le triangle des paiements courants (de taille n = 14) les tests présentés àla section 2.5, nous obtenons les résultats suivants :

1. test de non corrélation des coe�cients de développement successifs :0.4133 /∈ [−0.0825; 0.0825],

2. test de non e�et d'une année calendrier : 24 ∈ [23.7990; 34.8651].

Page 28: edude ibnr methodes

1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12 12-13 13-141985 0.9966 0.8880 0.9625 0.9892 0.9909 0.9980 1.0000 0.9931 0.9956 1.0044 0.9973 0.9932 0.99191986 1.0085 0.9287 0.9666 0.9846 0.9885 1.0016 0.9891 0.9972 1.0045 1.0025 1.0068 1.00011987 0.9862 0.9649 0.9720 0.9866 0.9938 0.9949 1.0017 0.9984 0.9882 1.0033 1.00141988 0.9660 0.9646 0.9683 0.9907 0.9988 0.9929 0.9979 0.9971 1.0026 1.00201989 1.0223 0.9435 0.9831 0.9760 0.9967 1.0032 0.9987 1.0001 0.98491990 1.0336 0.9825 0.9558 0.9836 0.9990 1.0107 1.0020 0.99051991 1.0407 0.9761 0.9865 0.9979 1.0126 0.9925 1.00501992 1.0591 1.0125 1.0092 1.0096 1.0071 0.96841993 0.9819 0.9912 1.0018 1.0179 0.99061994 0.9781 1.0244 1.0046 1.03371995 0.9504 1.0311 1.01311996 0.9508 1.02641997 0.9348

Tab. 7 � Coe�cients individuels pour les montants totaux.

Nous constatons donc que les tests conduisent à rejeter la non corrélation des coe�cients dedéveloppement successifs mais à accepter le non e�et d'une année calendrier. En examinant les co-e�cients de développement individuels présentés dans le tableau 7, nous constatons que les annéesde survenance plus récentes ne se comportent pas tout-à-fait comme les années plus anciennes, lescoe�cients sont plus faibles la première année et plus élevés l'année suivante.Nous pouvons appliquer la méthode vue dans la section 2.6 et séparer le triangle en deux groupes :nous considérons que les 8 premières années de survenance forment un groupe et les 6 dernières unautre groupe. Nous obtenons donc deux triangles à compléter séparément et sur lesquels e�ectuerles tests.

1. Triangle supérieur droit (taille n = 8) :(a) test de non corrélation des coe�cients de développement successifs :−0, 2610 /∈ [−0.1730; 0.1730],(b) test de non e�et d'une année calendrier : 5 ∈ [4.3388; 10.4112].

2. Triangle inférieur gauche (taille n = 6) :(a) test de non corrélation des coe�cients de développement successifs : 0.5666 /∈ [−0.2735; 0.2735],(b) test de non e�et d'une année calendrier : 2 ∈ [0.8787; 5.1213].

Nous constatons que le test de non corrélation des coe�cients n'est toujours pas véri�é mais ledécoupage du triangle apporte quand même une amélioration par rapport au triangle dans sonensemble. D'ailleurs si on considérait des intervalles de con�ance à 95% (plutôt qu'à 50%), ontrouverait −0.2610 ∈ [−0.5164; 0.5164] pour le bloc supérieur droit et 0.5666 ∈ [−0.8165; 0.8165]pour le bloc inférieur gauche, alors que pour le triangle entier le test échoue encore : 0.4133 /∈[−0.2462; 0.2462].Le bloc inférieur gauche et le bloc supérieur droit sont complétés séparément par la méthode deChain Ladder. Examinons les trois hypothèses envisagées pour compléter le bloc inférieur droit.

1. Première hypothèse.Le bloc inférieur droit est complété en utilisant les coe�cients du bloc supérieur droit. Nousobtenons les résultats présentés dans le tableau 8.

2. Deuxième hypothèse.Le bloc inférieur droit est complété en utilisant un tail factor. Le développement total après14 années subi par les sinistres survenus entre 1985 et 1992 est en moyenne ftot = 1, 5691. Ledéveloppement déjà subi sur les 6 premières années par les sinistres survenus entre 1993 et1998 est en moyenne fint = 1, 4536. Nous devons donc encore multiplier les montants obtenusen sixième année de développement pour le bloc inférieur gauche par fult = ftot

fint= 1, 0795

pour obtenir les montants ultimes (après 14 années de développement). Nous avons quef1 ≥ fult ≥ f2, en e�et 1, 3228 ≥ 1, 0795 ≥ 1, 0414 et nous choisissons donc se(f1) ≥

Page 29: edude ibnr methodes

k fk σk i Cin Ri se(Ri) se(Ri) en % de Ri

1 1.3228 129.7850 1986 56,892,686 252,683 82,361 33%2 1.0414 33.7574 1987 61,048,730 576,893 145,563 25%3 1.0267 24.4490 1988 63,232,335 965,571 232,266 24%4 1.0193 17.7686 1989 66,354,966 1,337,211 244,398 18%5 1.0084 12.9136 1990 70,310,892 1,769,736 269,468 15%6 1.0128 44.4508 1991 100,146,339 3,352,433 598,863 18%7 1.0083 17.9956 1992 109,235,417 4,529,328 667,898 15%8 1.0086 43.0330 1993 106,563,521 5,706,261 830,105 15%9 1.0051 9.5186 1994 99,195,748 6,090,713 815,077 13%10 1.0050 4.9988 1995 94,242,946 7,457,874 817,941 11%11 1.0059 19.0237 1996 90,886,836 9,370,083 845,387 9%12 1.0051 11.9030 1997 92,760,555 12,867,689 934,280 7%13 1.0045 7.4477 1998 113,978,529 39,767,233 1,791,697 5%

Tab. 8 � Résultats pour le bloc inférieur droit complété par l'hypothèse 1.

i Cin Ri se(Ri) se(Ri) en % de Ri

1986 56,892,686 252,683 82,361 33%1987 61,048,730 576,893 145,563 25%1988 63,232,335 965,571 232,266 24%1989 66,354,966 1,337,211 244,398 18%1990 70,310,892 1,769,736 269,468 15%1991 100,146,339 3,352,433 598,863 18%1992 109,235,417 4,529,328 667,898 15%1993 108,865,326 8,008,066 830,105 10%1994 101,338,408 8,233,373 519,729 6%1995 96,278,623 9,493,551 547,325 6%1996 92,850,021 11,333,268 601,415 5%1997 94,763,701 14,871,335 714,654 5%1998 116,440,501 42,229,205 1,654,940 4%

Tab. 9 � Résultats pour le bloc inférieur droit complété par l'hypothèse 2.

se(fult) ≥ se(f2), ainsi que se(Fi1) ≥ se(Fi,ult) ≥ se(Fi2) pour un certain i. Nous trouvonsalors les résultats présentés dans le tableau 9.

3. Constatations sur les deux premières hypothèses.Par rapport au tableau 5 où on utilisait la méthode de Chain Ladder sur le triangle dansson ensemble, on constate que l'utilisation de l'hypothèse 1 pour compléter le bloc inférieurdroit conduit à des erreurs relatives du même ordre de grandeur mais plus faibles quand onse rapproche de l'année 1998. Ceci est dû au fait que les coe�cients de développement f1

à f5 sont estimés sur un groupe plus restreint d'années de survenance, où la volatilité descoe�cients individuels est plus faible.Le remplissage du bloc inférieur droit par l'hypothèse 2 conduit à des erreurs relatives encoreplus faibles. En e�et, au lieu d'accumuler des erreurs d'estimation en utilisant une série decoe�cients de développement, un seul coe�cient global est utilisé.Remarquons que les erreurs calculées re�ètent les erreurs d'estimation des paramètres dumodèle mais ne permettent pas de dire que l'hypothèse 2 est meilleure que l'hypothèse 1.

4. Troisième hypothèse.Nous repartons des coe�cients estimés par la méthode de Chain Ladder sur le triangleinférieur gauche et rappelés dans le tableau 10.

k 1 2 3 4 5fk 1.3228 1.0414 1.0267 1.0193 1.0084

Tab. 10 � Coe�cients du bloc inférieur gauche.

Nous ajustons alors une courbe puissance inverse par régression linéaire de ln(fk − 1) surln(1/k) et nous trouvons le modèle

fk = 1 + 0.2671 k−2.1038,

Page 30: edude ibnr methodes

ce qui conduit aux coe�cients du tableau 11.k 6 7 8 9 10 11 12 13fk 1.0062 1.0045 1.0034 1.0026 1.0021 1.0017 1.0014 1.0012

Tab. 11 � Coe�cients pour le bloc inférieur droit.

Nous complétons alors le bloc inférieur droit par ces coe�cients pour obtenir les montantsultimes présentés au tableau 12.

i 1993 1994 1995 1996 1997 1998Ci,14 103,206,942 96,071,243 91,274,445 88,024,048 89,838,263 110,388,390

Tab. 12 � Résultats pour le bloc inférieur droit complété par l'hypothèse 3.

En résumé, l'hypothèse 1 suppose que les sinistres des années plus récentes, qui se sont développésmoins vite au début, vont ensuite reprendre le même développement que les sinistres des annéesantérieures. L'hypothèse 2 suppose que, au total, ces sinistres se développent comme dans lepassé, et que donc, s'ils se développent moins au début, ils se développeront plus vite par la suite.L'hypothèse 3 suppose que si les sinistres se sont développés moins vite au début, ils continuerontà le faire par la suite. Elle conduit donc à des montants �naux moins élevés.

5 Conclusion.Dans ce travail nous avons envisagé le problème de l'écart entre la vraie valeur du coût dessinistres et le montant calculé par une méthode IBNR. Dans ce cadre, nous avons examiné desformules d'estimation de la variabilité des réserves calculées par la méthode de Chain Ladder. Cetteméthode est très simple à utiliser et de ce fait ne re�ète pas toujours bien la réalité et présente desfaiblesses, notamment dans l'estimation des réserves pour les années d'accident les plus récentes.Mais sa simplicité d'emploi est également un grand avantage en ce sens que l'utilisateur peutfacilement comprendre comment elle fonctionne et, le cas échéant, l'adapter pour qu'elle s'appliquede manière plus adéquate à ses données. Nous avons alors vu qu'il était encore possible de trouverdes formules d'erreur pour les réserves lorsqu'on utilise Chain Ladder de manière non standard.D'autres adaptations des formules d'erreur ont ensuite été envisagées : d'une part dans le cas oùon s'intéresse au rapport entre la sinistralité et l'encaissement (formules d'erreur pour les ratiosS/P ) et d'autre part dans le cas de l'utilisation d'une méthode combinant l'examen de l'évolutiondes paiements avec celui de l'évolution des réserves (projected case estimates).

Références[1] Mack, Th. (1993). Distribution-free calculation of the standard error of Chain Ladder reserve

estimates. ASTIN Bulletin 23, 213-225.[2] Mack, Th. (1993). Measuring the variability of chain ladder reserve estimates. Meeting of the

Casualty Actuarial Society, 101-182.[3] Mack, Th. (1994). Which stochastic model is underlying the chain ladder method ?. Insu-

rance : Mathematics and Economics 15, 133-138.[4] Mack, Th. (1999). The standard error of chain ladder reserve estimates : recursive calculation

and inclusion of a tail factor. ASTIN Bulletin 29, 361-366.[5] Sherman, R.E. (1984). Extrapolating, smoothing, and interpolating development factors. Pro-

ceedings of the Casualty Actuarial Society, vol LXXI, 122-155.[6] Taylor, G.C. (2000). Loss Reserving : an actuarial perspective. Kluwer Academic Publishers.

Page 31: edude ibnr methodes

AnnexeDémonstration de l'adaptation du théorème donnant l'erreur sur une réserve individuelle au casde la décomposition en bloc du triangle de données et de l'utilisation de la première hypothèse,voir la section 2.6.1, pour compléter le bloc inférieur droit.L'erreur d'estimation de la réserve pour les années d'accident m + 1 ≤ i ≤ n correspondant aubloc inférieur droit vaut :

mse(Cin) = C2in

[n−m−1∑

k=n+1−i

σ2k

f 2k

(1

Cik

+1∑n−k

j=m+1 Cjk

)+

n−1∑

k=n−m

σ2k

f 2k

(1

Cik

+1∑n−k

j=1 Cjk

)],

où les fk sont calculés par (6) et les σ2k sont calculés par (7).

Démonstration :Nous utilisons les abréviations

Ei (X) = E(X |Ci1, . . . , Ci,n+1−i),

V ari (X) = V ar(X |Ci1, . . . , Ci,n+1−i).

Nous repartons de la dé�nition :

mse(Ri) = V ar(Cin |D) + (E(Cin |D)− Cin)2,

où D est l'ensemble des données utilisées, soit D = {Cik, 1 ≤ i ≤ m,n − m ≤ k ≤n + 1− i} ∪ {Cik,m + 1 ≤ i ≤ n, 1 ≤ k ≤ n + 1− i}.En appliquant de façon répétée le modèle de Chain Ladder (3) et l'hypothèse de va-riance (5), le premier terme de la dé�nition de mse(Ri) peut être réécrit comme :

V ar(Cin |D) = V ari (Cin) par (4)

= Ei (V ar(Cin |Ci1, . . . , Ci,n−1)) + V ari (E(Cin |Ci1, . . . , Ci,n−1))

= Ei (Ci,n−1) σ2n−1 + V ari (Ci,n−1) f 2

n−1 par (5) et (3)

= Ei (E(Ci,n−1 |Ci1, . . . , Ci,n−2)) σ2n−1 + Ei (V ar(Ci,n−1 |Ci1, . . . , Ci,n−2)) f 2

n−1

+V ari (E(Ci,n−1 |Ci1, . . . , Ci,n−2)) f 2n−1

= Ei (Ci,n−2) fn−2 σ2n−1 + Ei (Ci,n−2) σ2

n−2 f 2n−1 + V ari (Ci,n−2) f 2

n−2 f 2n−1

par (5) et (3)...

= Ci,n+1−i

n−1∑

k=n+1−i

fn+1−i · · · fk−1 · σ2k · f 2

k+1 · · · f 2n−1,

car Ei(Ci,n+1−i) = Ci,n+1−i et V ar(Ci,n+1−i) = 0.Comme nous ne connaissons pas les paramètres fk et σ2

k, nous les remplaçons par leursestimateurs fk et σ2

k, c'est-à-dire que nous estimons le premier terme de mse(Ri) par :

V ar(Cin |D) = Ci,n+1−i

n−1∑

k=n+1−i

fn+1−i · · · fk−1 · σ2k · f 2

k+1 · · · f 2n−1

= C2i,n+1−i

n−1∑

k=n+1−i

f 2n+1−i · · · f 2

n−1 · σ2k

Ci,n+1−i · fn+1−i · · · fk−1 · f 2k

= C2in

n−1∑

k=n+1−i

σ2k/f

2k

Cik

(∗)

Page 32: edude ibnr methodes

En ce qui concerne le deuxième terme de mse(Ri), nous utilisons le théorème 2.1 pourle réécrire sous la forme :

(E(Cin |D)− Cin)2 = C2i,n+1−i (fn+1−i · · · fn−1 − fn+1−i · · · fn−1)

2.

Pour estimer ce second terme on ne peut pas simplement remplacer fk par son estima-teur car cela conduirait à l'annuler. Nous utilisons donc une autre approche. Posons

F = fn+1−i · · · fn−1 − fn+1−i · · · fn−1

= Sn+1−i + · · ·+ Sn−1,

oùSk = fn+1−i · · · fk−1 · (fk − fk) · fk+1 · · · fn−1.

Nous avons alors

F 2 = (Sn+1−i + · · ·+ Sn−1)2

=n−1∑

k=n+1−i

S2k + 2

j<k

SjSk.

Nous approximons ensuite S2k par E(S2

k |Bk) et SjSk par E(SjSk |Bk), où Bk est l'en-semble de toutes les données utiles et connues jusqu'à l'année de développement k,c'est-à-dire Bk = {Cij, j ≤ k, i + j ≤ n + 1, i ≥ m + 1} si k ≤ n − m − 1 etBk = {Cij, n−m ≤ j ≤ k, i + j ≤ n + 1} si k ≥ n−m.Comme E(fk − fk |Bk) = 0 (car fk est un estimateur non biaisé de fk), nous avonsque E(SjSk |Bk) = 0.Comme, pour 1 ≤ k ≤ n−m− 1,

E((fk − fk)2 |Bk) = V ar(fk |Bk)

=

∑n−ki=m+1 V ar(Ci,k+1 |Bk)(∑n−k

i=m+1 Cik

)2

=

∑n−ki=m+1 σ2

k Cik(∑n−ki=m+1 Cik

)2

=σ2

k∑n−ki=m+1 Cik

,

et comme, pour n−m ≤ k ≤ n− 1,

E((fk − fk)2 |Bk) = V ar(fk |Bk)

=

∑n−ki=1 V ar(Ci,k+1 |Bk)(∑n−k

i=1 Cik

)2

=

∑n−ki=1 σ2

k Cik(∑n−ki=1 Cik

)2

=σ2

k∑n−ki=1 Cik

,

Page 33: edude ibnr methodes

nous obtenons

E(S2k |Bk) = f 2

n+1−i · · · f 2k−1 ·

σ2k∑n−k

i=m+1 Cik

· f 2k+1 · · · f 2

n−1 pour 1 ≤ k ≤ n−m− 1,

et

E(S2k |Bk) = f 2

n+1−i · · · f 2k−1 ·

σ2k∑n−k

i=1 Cik

· f 2k+1 · · · f 2

n−1 pour n−m ≤ k ≤ n− 1.

Nous estimons donc F 2 par∑

k E(S2k |Bk) et nous pouvons à présent remplacer les

paramètres fk et σ2k, par leurs estimateurs fk et σ2

k, c'est-à-dire que nous estimons lesecond terme de mse(Ri) par :

(E(Cin |D)− Cin)2 = C2i,n+1−i

(n−m−1∑

k=n+1−i

f 2n+1−i · · · f 2

k−1 ·σ2

k∑n−ki=m+1 Cik

· f 2k+1 · · · f 2

n−1

+n−1∑

k=n−m

f 2n+1−i · · · f 2

k−1 ·σ2

k∑n−ki=1 Cik

· f 2k+1 · · · f 2

n−1

)

= C2i,n+1−i · f 2

n+1−i · · · f 2n−1

(n−m−1∑

k=n+1−i

σ2k/f

2k∑n−k

i=m+1 Cik

+n−1∑

k=n−m

σ2k/f

2k∑n−k

i=1 Cik

)

= C2in

(n−m−1∑

k=n+1−i

σ2k/f

2k∑n−k

i=m+1 Cik

+n−1∑

k=n−m

σ2k/f

2k∑n−k

i=1 Cik

)(∗∗)

En additionnant les expressions (∗) et (∗∗), nous retrouvons la formule proposée pourmse(Cin).

RésuméL'estimation des réserves de sinistre se fait généralement par des techniques dites IBNR. Cetarticle a pour but principal d'examiner l'une d'entre elles, la méthode Chain Ladder, dans uncadre stochastique. Ce type d'analyse permet de dégager des formules pour estimer la variabilitédes réserves calculées et, par suite, de construire des intervalles de con�ance pour ces réserves.Nous verrons également comment adapter facilement les formules étudiées pour des cas particuliersd'utilisation pratique de la méthode de Chain Ladder.

SamenvattingDe schatting van de schadereserves gebeurt gewoonlijk aan de hand van technieken IBNR genoemd.Dit artikel heeft als belangrijkste doel het onderzoek van één van deze technieken, de ChainLadder methode, in een stochastisch kader. Dit soort analyse laat toe formules af te leiden omde variabiliteit van de berekende reserves te schatten, en bijgevolg betrouwbaarheidsintervallen teconstrueren voor deze reserves. We zullen ook zien hoe op een gemakkelijke manier de bestudeerdeformules kunnen aangepast worden voor speciale gevallen van praktisch gebruik van de ChainLadder methode.

Page 34: edude ibnr methodes

AbstractThe estimation of claims reserves is usually done by applying techniques called IBNR techniques.The main objective of this article is to examine one of these techniques, sc. the Chain Laddermethod, within a stochastic framework. This kind of analysis allows us to deduct formulae to esti-mate the variability of the calculated reserves and consequently enables us to construct con�denceintervals for these reserves. We shall also demonstrate how the deducted formulae can easily beadapted for particular cases of practical use of the Chain Ladder method.