Patrice Abry applique ses connaissances en fractales aux systèmes naturels – notamment les rythmes physiologiques, comme la marche ou le rythme cardiaque – ou artificiels, comme le trafic internet. En 1998, il corédige avec le chercheur australien Daryl Veitch un article sur la base des données de l’université d’Auckland, par laquelle transite alors tout le trafic internet entrant et sortant de Nouvelle-Zélande. Ensemble, ils proposent des outils d’analyse qui confortent pour la première fois que la structure dynamique du trafic internet est fractale : l’article rencontre un immense succès.
Cette publication marquera le début d’un travail de long cours qui trouvera une suite en 2009, puis en 2017, et se poursuit encore à ce jour. Retour sur la carrière de Patrice Abry, où se croisent développements théoriques et applications au trafic internet et à la cybersécurité, mais sur laquelle le temps n’a visiblement pas d’emprise.
Des objets d’étude hors normes
En géométrie classique, un objet, comme un carré ou un cercle, peut être entièrement décrit par des contours simples et lisses. À l’inverse, les objets fractals ou « invariants d’échelle » sont d’une complexité infinie : quel que soit le niveau de zoom, ils présentent de nouveaux détails, sans jamais arriver à des contours simples. La plupart de ces objets présentent en outre une autosimilarité, c’est-à-dire que leurs formes ou motifs se répètent à toutes les échelles : comme sur un chou romanesco !
Dans la physique, l’analyse du traitement d’un système suppose d’ordinaire que ce dernier est caractérisé par des échelles de temps ou d’espace qui structurent son fonctionnement. Cela signifie que dans l’écriture d’un modèle ou d’un outil d’analyse, l’étape clé consiste à identifier et mesurer ces échelles. Le rythme cardiaque humain par exemple est caractérisé par une échelle de temps relative à une référence d’un battement toutes les secondes.
« Mais il y a un ensemble de systèmes, naturels ou artificiels, pour lesquels cette définition selon des échelles de temps ou d’espace n’est plus vraie et c’est, à l’inverse, cette absence qui les caractérise : l’invariance d’échelle », explique Patrice Abry. Dès lors, aucune échelle n’est caractéristique, ou au contraire, toutes le deviennent. Un système n’est plus alors décrit par ce qui est observé sur une échelle particulière, mais par comment l’information change en passant d’une échelle à une autre.
Trafic internet, entre régime « technologique » et régime « humain »
Cette invariance d’échelle, Patrice Abry l’a observée sur le trafic internet, qui désigne l’ensemble des données circulant sur le réseau internet. Le trafic internet est constitué de paquets IP, une petite unité contenant une partie des données envoyées via le protocole IP (Internet Protocol), et se mesure selon le volume de données (méga- ou giga-octets) qui circulent. Le chercheur collabore depuis de nombreuses années avec l’université de Tokyo, mais aussi le National Institute of Informatics (NII) japonais, pour démontrer le caractère fractal de ces flux.
Grâce aux ressources du NII, capable d’enregistrer le trafic internet sur plusieurs jours, Patrice Abry a identifié deux grandes gammes invariantes d’échelle. Celles-ci sont séparées par une échelle de temps caractéristique qui est d’environ une seconde. Cette durée est une constante de temps observée sur tous les trafics internet dans le monde, liée au Round Trip Time (RTT) : le temps nécessaire pour qu’un paquet de données émis depuis un ordinateur reçoive un accusé de réception de son destinataire.
En-dessous de la seconde, il y a donc une grande dynamique – liée au fonctionnement de la technologie internet, à la transmission des paquets… – qui n’est caractérisée par aucune échelle de temps. De même pour la gamme au-dessus de la seconde, liée à l’activité humaine, au partage et au transfert de données, d’e-mails, de vidéos… Cette analyse, aussi contemporaine soit-elle de la diversité des usages d’internet, ne date pas d’hier puisque le chercheur l’a proposée pour la première fois dans son article de 1998 … il y a plus de 25 ans donc !
Un article qui fait des vagues
« À l’époque, les personnes qui géraient internet ont essayé de modéliser le trafic avec le modèle de circulation de l’information sur le réseau téléphonique », relate Patrice Abry. Les flux téléphoniques sont très bien décrits par des modèles portant quelques échelles de temps ; ce qui permet de dimensionner les infrastructures, les tailles de serveur ou encore de facturer des services. « Mais quand ces modèles ont été implémentés au trafic internet, cela a rapidement dysfonctionné », ajoute le chercheur.
Calibrés, comme pour les téléphones, avec une taille caractéristique, les serveurs étaient souvent débordés face à un trafic internet sans taille caractéristique, et les communications interrompues. En 1995, une équipe américaine a introduit le concept de trafic internet à longue mémoire (long-range dependence en anglais), abordant l’absence d’échelle caractéristique. Mais c’est vraiment le travail d’Abry et Veitch qui a mis en évidence cette propriété, grâce à un outil théorique utilisé par le chercheur français dès sa thèse : l’analyse en ondelettes, ou multi-échelles.
« Quand Darryl Veitch m’a proposé de transférer les outils théoriques développés pendant ma thèse sous la direction de Patrick Flandrin, vers le trafic internet, j’ai été séduit, car les données internet posent de nombreuses difficultés dans la mise en œuvre. On ne pouvait pas appliquer ces outils tels quels, donc il a fallu les repenser et les adapter », se remémore Patrice Abry. Cet aller-retour entre la théorie et l’application constitue pour le chercheur un fil rouge de sa carrière : « Les outils théoriques font progresser l’application, et inversement, l’application questionne la praticité des outils. »