La loi des séries noires
La succession d'accidents d'avion en août 2005 a donné lieu à de nombreux débats sur la sécurité aérienne. Une telle série noire était-elle improbable ? L'analyse statistique des accidents aériens permet d'affirmer le contraire.
Le 2 août 2005, un avion d'Air France sort de piste lors de son atterrissage à Toronto et s'enflamme. Le 6 août, un avion de Tuninter tombe en mer à proximité de Palerme. Le 14 août, un avion d'Helios Airways percute une montagne près d'Athènes. Le 16 août, un avion de West-Carribean s'écrase au Venezuela. Et, le 23 août, un avion de Tans s'écrase en Amazonie.
L'été dernier, cette série noire a suscité l'inquiétude générale : était-elle liée à l'augmentation du trafic aérien ? Trahissait-elle une soudaine hausse du risque d'accidents s'expliquant par le relâchement des contrôles et de la maintenance ? Ou encore par le vieillissement de la flotte aérienne ?
On peut trouver quelques éléments de réponse dans l'analyse statistique des accidents aériens. Comment procède-t-on ? D'abord, on considère que les accidents surviennent indépendamment les uns des autres. Ensuite, on suppose que la fréquence à laquelle surviennent ces accidents est constante. La question que l'on se pose alors est : une série de cinq accidents sur une période de 22 jours peut-elle être le simple fruit du hasard ou doit-elle s'expliquer par d'autres raisons ?
Méthode de calcul
Entre 1995 et 2004, on a recensé en moyenne un accident tous les dix jours (367 en dix ans) [1] . Le nombre quotidien d'accidents impliquant des vols de plus de trente passagers est en moyenne de 0,04 (pour le détail de ces calculs, voir notre site
http://www.larecherche.fr). Avec ces données, comment calculer le nombre total d'accidents auquel il faut statistiquement s'attendre sur une période donnée ?
Pour le savoir, on fait appel à ce que l'on nomme la loi de Poisson, dite encore loi des événements rares. Celle-ci, introduite par Siméon Denis Poisson en 1837, permet de décrire la somme de multiples phénomènes de faible probabilité et indépendants les uns des autres.
La loi de Poisson est appropriée pour étudier les accidents aériens car le nombre d'avions qui décollent chaque jour est très élevé (20 000), la probabilité d'avoir un accident est infime pour chaque vol (1/500 000), et les accidents surviennent indépendamment les uns des autres. Selon cette loi, la probabilité de compter 5 accidents en 22 jours est d'environ deux pour mille. Un événement peu probable.
Pour savoir s'il faut remettre en question les hypothèses de notre modèle, nous devons calculer la probabilité qu'une telle série survienne sur une fenêtre quelconque de 22 jours au cours d'une année entière. Ce calcul est difficile, car les fenêtres à considérer se chevauchent : le nombre d'accidents survenant entre le 1er et le 22 janvier est corrélé avec le nombre d'accidents survenant entre le 2 et le 23 janvier !
Dans un premier temps, nous pouvons simplifier le problème en découpant l'année en 16 périodes disjointes de 22 jours (on néglige les 13 jours restants), qui sont donc indépendantes. Il y a environ 3 % de chances qu'au moins l'une de ces périodes comporte une série noire. C'est assez peu, mais ce calcul est très approximatif, et l'on peut s'attendre à un chiffre plus élevé en tenant compte de toutes les périodes possibles de 22 jours consécutifs.
Une chance sur dix
Comment mener le calcul lorsque l'on considère des périodes qui ne sont pas indépendantes ? Ce type de problème est particulièrement difficile et a donné lieu à de nombreux travaux mathématiques depuis les années 1960. Les probabilistes ont nommé « statistiques de balayage » le nombre maximal d'événements survenant dans une fenêtre de taille fixée prenant toutes les positions possibles dans une région donnée. Ces statistiques permettent de détecter et d'analyser une succession d'événements rapprochés, afin de déterminer si elle est le fruit du hasard ou si elle est, au contraire, atypique.
Des formules exactes ont été obtenues dans les années 1970 pour exprimer ces statistiques, mais elles sont complexes à mettre en oeuvre. Aussi, on fait appel à des approximations, plus faciles à manipuler et fournissant des résultats convenables [2] . Ainsi la probabilité pour que se produise une succession de 5 accidents en 22 jours sur une année est d'environ 0,11. En d'autres termes, il y a chaque année plus d'une chance sur dix d'en observer une. Cette probabilité est bien plus importante que les 3 % obtenus en ne prenant en compte que des périodes disjointes.
Si nous avons l'impression qu'une série rapprochée d'accidents témoigne d'un changement dans les conditions de sécurité, c'est que nous sommes habitués à raisonner « en moyenne », alors que le hasard, lui, ne répartit pas les événements de manière uniforme. Et même avec un faible niveau de risque, une succession aussi rapprochée d'accidents arrive avec une probabilité non négligeable.
Notons que notre modèle ne tient pas compte des variations saisonnières du trafic.
Or, si on les prenait en compte, on verrait augmenter la probabilité de voir des accidents regroupés, et ce, même si le risque individuel d'accident demeure inchangé.
En effet, les accidents se concentreraient davantage sur les périodes où le trafic est intense.
Élise Janvresse et Thierry de la Rue
Élise Janvresse et Thierry de la Rue
[1]
http://www.airdisaster.com
[2] Scan statistics and applications. Édité par J. Glaz et N. Balakrishnan. Birkhäuser Boston, 1999.
ENTRETIEN : Hervé Zwirn : « Simuler pour prédire »
Hervé Zwirn est directeur de recherche associé au CNRS/CMLA à l'ENS Cachan, et président de la société Eurobios.
Pourquoi s'intéresse-t-on à la « loi des séries » ?
Parce que cela fait partie des choses contre-intuitives : on croit qu'une conjonction d'événements est totalement improbable alors que l'on s'aperçoit, quand on la calcule, que la probabilité qu'elle survienne n'est pas négligeable.
Comment aborde-t-on la notion de risque aujourd'hui ?
On classe les facteurs de risque par ordre d'impact, financier par exemple, puis on prend les premiers et on les écarte avec des mesures préventives. Mais c'est un raisonnement dangereux car les conséquences les plus graves résultent toujours d'une conjonction de petits facteurs de risques aux conséquences individuelles peu importantes. C'est ce qui s'est passé avec l'explosion de la navette spatiale, l'accident du Concorde ou, probablement, avec l'explosion dans l'usine AZF.
Comment conviendrait-il d'aborder ce type de conjonctions ?
Quand il y a un grand nombre d'agents qui interagissent entre eux de façon non linéaire, écrire des équations est d'une part très difficile et, d'autre part, on ne sait pas les résoudre. On sait parfaitement ce qui se passe au niveau local mais il est impossible d'en déduire ce qui va se passer au niveau global. Le seul moyen est de modéliser le problème et de le simuler sur un ordinateur afin de regarder ce qui se passe au niveau global.
Propos recueillis par Mathieu Nowak