Mes travaux de recherche actuels sont tous structurés autour de la thématique de la modélisation et l’analyse de phénomènes spatio-temporels. Je m’intéresse plus particulièrement à deux grandes thématiques liées à l’étude de l’espace via la participation à de nombreux projets de recherche mêlant des laboratoires de sciences humaines et sociales et d’informatique.

Fouille de trajectoires

La première thématique porte sur l’étude des trajectoires de différents objets mobiles. Dans la continuité de mes travaux de thèse, je m’intéresse à l’analyse du comportement d’objet mobiles variés via des techniques de fouille de données. Les principaux verrous de recherche de cette thématique sont liés à la nature hétérogène des données collectées (capteurs hétérogènes, objets communicants ultra-connectés, résolutions spatiale et temporelle variables) ainsi qu’à leur volume important (big spatial data). 

Dans les travaux de thèse CIFRE « SMART AMBULANCE » de Frédérick Bisone que je supervise avec Thomas Devogele, différents modèles de trajectoires ont été proposés ainsi que des mécanismes d’extraction sémantique portant sur les comportements des conducteurs d’ambulances.

Disposant de jeux de données de trajectoires imposants composés chacun de plusieurs millions de positions, j’ai travaillé sur la réduction de la complexité algorithmique des travaux initiés lors de mon poste d’ATER à l’Ecole Navale. En collaboration avec le Laboratoire d’Informatique Fondamentale d’Orléans (LIFO), nous avons proposé de nouveaux algorithmes de calcul de la distance de Fréchet discrète optimisée entre trajectoires diminuant les temps de calculs. Ce verrou de recherche international a fait l’objet d’une compétition (GIS CUP 2017) lors de la conférence ACM SIGSPATIAL 2017 dans laquelle nous avons publié un article dans le Workshop Analytics for Big Geospatial Data. Dans cet article, nous avons calculé les ratios entre temps de calcul et l’écart de mesure avec de la distance de Fréchet discrète pour un jeu de 495 trajectoires de pigeons voyageurs composé de plus d’1,5 Millions de positions (soit environ 3000 positions par trajectoire). Le calcul de la distance de Fréchet entre chaque couple de trajectoires est utilisé pour réaliser une matrice de distance entre trajectoires. Grâce à cette matrice de distance, un dendrogramme est constitué pour former des clusters de trajectoires (Figure 19).

L’algorithme non optimisé de la distance de Fréchet discrète nécessite de calculer une matrice de distance euclidienne entre chaque position des deux trajectoires à comparer. La complexité algorithmique de ce calcul est donc directement liée au nombre de positions de chaque trajectoire à comparer (3000²) multiplié par le nombre total de couples de trajectoires 1 096 200 000 000 calculs de distances euclidiennes entre positions. Afin de limiter le temps de calcul tout en conservant une approximation de la distance de Fréchet discrète acceptable, différentes optimisations ont été proposées. La première consiste à limiter le nombre de points requis pour représenter chaque trajectoire en filtrant celle-ci à l’aide d’un filtrage de Douglas et Peucker. L’autre optimisation retenue consiste à limiter les calculs de distances entre positions des deux trajectoires à comparer grâce â une heuristique basée sur le calcul de la diagonale de la matrice de distance. Les résultats obtenus en faisant varier le paramètre de filtrage de Douglas et Peucker sont présentés sur le graphique ci-dessous.

 

La combinaison des approches statistiques et sémantiques présentées précédemment est un challenge de recherche intéressant que je développe actuellement dans deux projets de recherche en collaboration avec différents laboratoires SHS (UMR AAU, UMR CITERES, UMR ESO, UMR PACTE).

Le projet ANR MOBIKIDS s’intéresse aux déplacements des enfants lors de leurs trajets domicile école. L’apport du LIFAT dans ce projet consiste à proposer des algorithmes d’annotation sémantique automatique des comportements des enfants lors de leur mobilité quotidienne. La détection des stops, des modes de déplacements ainsi que les changements d’activités à l’aide d’outils de fouille de données est un sujet de recherche actif.

Dans un autre registre, le projet d’intérêt régional APR IR SMART LOIRE porte sur l’étude des déplacements des touristes en région Centre Val de Loire. Dans ce projet, nous réalisons des propositions de parcours de visites adaptés aux différents profils des touristes. L’objectif de recherche consiste à détecter les portions du parcours proposé qui ont été suivies par le touriste et celles qui ont été différentes (spatialement, temporellement ou sémantiquement). Les patrons statistiques de trajectoires sont alors utiles pour qualifier les variation spatio-temporelles admissibles lors des déplacements des touristes. De plus, des travaux sur les mesures de similarités sémantiques entres les lieux visités seront pris en compte dans ces travaux.

Modélisation spatio-temporelle d’aléas et analyse de risque

Ma seconde thématique de recherche porte sur la modélisation spatio-temporelle d’aléa ainsi que l’analyse de risque associée. J’ai initié cette recherche lors de mon post-doctorat au Canada dans le cadre du projet PASSAGES. 

Je co-encadre actuellement la thèse de doctorat de Mark Stoddard avec le Pr. Ronald Pelot de l’Université de Dalhousie (MARIN Lab). Cette thèse s’intéresse à la représentation du concept d’isolement des navires voyageant dans l’Arctique et la prise en compte de ce facteur dans l’analyse des risques liés aux déplacements des navires dans des régions polaires éloignées (présence de glaces de mer, bathymétrie incertaine, isolement, conditions climatiques extrêmes…). 

Suite à l’adoption par l’IMO du Code Polaire mis en place au 1er janvier 2017, j’ai travaillé sur l’analyse de risques liés à la navigation de différents types de navires dans la glaces en me basant sur l’index POLARIS (Polar Operational Limit Assessment Risk Indexing System). Dans ce document, les navires sont classés en 12 différentes catégories en fonction de leurs capacités à naviguer dans la glace (tableau ci-dessous). 

L’indice de risque (RIO) est calculé à l’aide d’un tableau d’indices de risques (RV) de navigation dans différentes épaisseurs de glaces. Cet indice tient également compte de la concentration de glace (IC).

 

J’ai utilisé différentes sources de données historiques des observations des glaces de mer pour l’Arctique Canadien (National Snow & Ice Data Center, Canadian Ice Service Arctic Regional Sea Ice Charts in SIGRID-3 Format, 2006-2016) ainsi que les données fournies par la plateforme Européenne COPERNICUS (Arctic Ocean Physical Reanalysis Product, ARCTIC_REANALYSIS_ PHYS_002_003, 12.5 km x 12.5 km, 1991-2015).

Les indices POLARIS indiquant les capacités de navigation des différentes classes de navires ont été calculés pour chaque jour de chaque année entre 1991 et 2015 soit 9131 jours de données. Chaque carte journalière comportant 140 835 cellules raster indiquant la concentration de glace et son épaisseur. Les résultats ont ensuite été agrégés par cellule raster et jour de l’année (de 1 à 365) afin d’observer les variations statistiques (boxplot) des capacités de navigation dans différentes zones au cours de ces 25 années.

Ainsi, pour chaque jour de l’année, il est possible d’observer différents scénarios correspondant aux percentiles (boxplot) des indices de risques POLARIS observés au cours des 25 années. Un exemple préliminaire de ces travaux est détaillé ci-dessous pour un navire de classe IA et les jours 130, 170, 260 (mai, juin, septembre). On peut y observer la grande variabilité spatiale et temporelle des zones accessibles pour ce type de navire (IA).

Jour de l’année

Cas défavorable
25%

Cas moyen
50%

Cas favorable
75%

130

9-10
Mai

170

18-19
Juin

260

16-17 Septembre

Ces travaux sont préliminaires à une étude sur la prise de décision lors de la planification des voyages dans l’Arctique et la prise en compte de l’incertitude dans ce processus de décision.
Pour l’Arctique Canadien, les résultats de cette analyse POLARIS ont été présentés et publiés dans différentes conférences et revues.

Enfin, je collabore actuellement avec le Service Départemental d’Incendie et de Secours d’Indre et Loire (SDIS37) pour l’élaboration du Schéma Départemental d’Analyse et de Couverture des Risques (SDACR). Ce document a pour objectif de recenser les différents risques courants et exceptionnels présents sur le département et d’adapter la couverture opérationnelle en conséquence. Une des problématiques étudiées porte sur la disponibilité des Sapeurs-Pompiers Volontaires en journée. En effet, bien que le territoire dispose théoriquement de moyens matériels pour couvrir l’intégralité du département dans des délais impartis, la moindre disponibilité des SPV en journée engendre des carences dans la couverture du risque courant. Aussi, différentes cartes isochrones de couverture du risque incendie (fourgons incendie) et secours à personnes (ambulances) ont été établies afin de visualiser et d’analyser l’impact de carences combinées de centres de secours. La Figure 23 présente un exemple de cartes produites dans une situation considérée comme défavorable (25ème percentile des plus faibles disponibilités en personnels observée sur une année pour un jour de la semaine et un créneau horaire d’une demi-heure en tenant compte de la présence d’un conducteur poids lourds).