Mes travaux de recherche actuels sont tous structurés autour de la thématique de la modélisation et l’analyse de phénomènes spatio-temporels. Je m’intéresse plus particulièrement à deux grandes thématiques liées à l’étude de l’espace via la participation à de nombreux projets de recherche mêlant des laboratoires de sciences humaines et sociales et d’informatique.

Fouille de trajectoires

La première thématique porte sur l’étude des trajectoires de différents objets mobiles. Dans la continuité de mes travaux de thèse, je m’intéresse à l’analyse du comportement d’objet mobiles variés via des techniques de fouille de données. Les principaux verrous de recherche de cette thématique sont liés à la nature hétérogène des données collectées (capteurs hétérogènes, objets communicants ultra-connectés, résolutions spatiale et temporelle variables) ainsi qu’à leur volume important (big spatial data). 

Dans les travaux de thèse CIFRE « SMART AMBULANCE » de Frédérick Bisone que je supervise avec Thomas Devogele, différents modèles de trajectoires ont été proposés ainsi que des mécanismes d’extraction sémantique portant sur les comportements des conducteurs d’ambulances.

Disposant de jeux de données de trajectoires imposants composés chacun de plusieurs millions de positions, j’ai travaillé sur la réduction de la complexité algorithmique des travaux initiés lors de mon poste d’ATER à l’Ecole Navale. En collaboration avec le Laboratoire d’Informatique Fondamentale d’Orléans (LIFO), nous avons proposé de nouveaux algorithmes de calcul de la distance de Fréchet discrète optimisée entre trajectoires diminuant les temps de calculs. Ce verrou de recherche international a fait l’objet d’une compétition (GIS CUP 2017) lors de la conférence ACM SIGSPATIAL 2017 dans laquelle nous avons publié un article dans le Workshop Analytics for Big Geospatial Data. Dans cet article, nous avons calculé les ratios entre temps de calcul et l’écart de mesure avec de la distance de Fréchet discrète pour un jeu de 495 trajectoires de pigeons voyageurs composé de plus d’1,5 Millions de positions (soit environ 3000 positions par trajectoire). Le calcul de la distance de Fréchet entre chaque couple de trajectoires est utilisé pour réaliser une matrice de distance entre trajectoires. Grâce à cette matrice de distance, un dendrogramme est constitué pour former des clusters de trajectoires (Figure 19).

L’algorithme non optimisé de la distance de Fréchet discrète nécessite de calculer une matrice de distance euclidienne entre chaque position des deux trajectoires à comparer. La complexité algorithmique de ce calcul est donc directement liée au nombre de positions de chaque trajectoire à comparer (3000²) multiplié par le nombre total de couples de trajectoires 1 096 200 000 000 calculs de distances euclidiennes entre positions. Afin de limiter le temps de calcul tout en conservant une approximation de la distance de Fréchet discrète acceptable, différentes optimisations ont été proposées. La première consiste à limiter le nombre de points requis pour représenter chaque trajectoire en filtrant celle-ci à l’aide d’un filtrage de Douglas et Peucker. L’autre optimisation retenue consiste à limiter les calculs de distances entre positions des deux trajectoires à comparer grâce â une heuristique basée sur le calcul de la diagonale de la matrice de distance. Les résultats obtenus en faisant varier le paramètre de filtrage de Douglas et Peucker sont présentés sur le graphique ci-dessous.

 

La combinaison des approches statistiques et sémantiques présentées précédemment est un challenge de recherche intéressant que je développe actuellement dans deux projets de recherche en collaboration avec différents laboratoires SHS (UMR AAU, UMR CITERES, UMR ESO, UMR PACTE).

Le projet ANR MOBIKIDS s’intéresse aux déplacements des enfants lors de leurs trajets domicile école. L’apport du LIFAT dans ce projet consiste à proposer des algorithmes d’annotation sémantique automatique des comportements des enfants lors de leur mobilité quotidienne. La détection des stops, des modes de déplacements ainsi que les changements d’activités à l’aide d’outils de fouille de données est un sujet de recherche actif.

Dans un autre registre, le projet d’intérêt régional APR IR SMART LOIRE porte sur l’étude des déplacements des touristes en région Centre Val de Loire. Dans ce projet, nous réalisons des propositions de parcours de visites adaptés aux différents profils des touristes. L’objectif de recherche consiste à détecter les portions du parcours proposé qui ont été suivies par le touriste et celles qui ont été différentes (spatialement, temporellement ou sémantiquement). Les patrons statistiques de trajectoires sont alors utiles pour qualifier les variation spatio-temporelles admissibles lors des déplacements des touristes. De plus, des travaux sur les mesures de similarités sémantiques entres les lieux visités seront pris en compte dans ces travaux.

Modélisation spatio-temporelle d’aléas et analyse de risque

Ma seconde thématique de recherche porte sur la modélisation spatio-temporelle d’aléa ainsi que l’analyse de risque associée. J’ai initié cette recherche lors de mon post-doctorat au Canada dans le cadre du projet PASSAGES. 

Je co-encadre actuellement la thèse de doctorat de Mark Stoddard avec le Pr. Ronald Pelot de l’Université de Dalhousie (MARIN Lab). Cette thèse s’intéresse à la représentation du concept d’isolement des navires voyageant dans l’Arctique et la prise en compte de ce facteur dans l’analyse des risques liés aux déplacements des navires dans des régions polaires éloignées (présence de glaces de mer, bathymétrie incertaine, isolement, conditions climatiques extrêmes…). 

Suite à l’adoption par l’IMO du Code Polaire mis en place au 1er janvier 2017, j’ai travaillé sur l’analyse de risques liés à la navigation de différents types de navires dans la glaces en me basant sur l’index POLARIS (Polar Operational Limit Assessment Risk Indexing System). Dans ce document, les navires sont classés en 12 différentes catégories en fonction de leurs capacités à naviguer dans la glace (tableau ci-dessous). 

L’indice de risque (RIO) est calculé à l’aide d’un tableau d’indices de risques (RV) de navigation dans différentes épaisseurs de glaces. Cet indice tient également compte de la concentration de glace (IC).

 

J’ai utilisé différentes sources de données historiques des observations des glaces de mer pour l’Arctique Canadien (National Snow & Ice Data Center, Canadian Ice Service Arctic Regional Sea Ice Charts in SIGRID-3 Format, 2006-2016) ainsi que les données fournies par la plateforme Européenne COPERNICUS (Arctic Ocean Physical Reanalysis Product, ARCTIC_REANALYSIS_ PHYS_002_003, 12.5 km x 12.5 km, 1991-2015).

Les indices POLARIS indiquant les capacités de navigation des différentes classes de navires ont été calculés pour chaque jour de chaque année entre 1991 et 2015 soit 9131 jours de données. Chaque carte journalière comportant 140 835 cellules raster indiquant la concentration de glace et son épaisseur. Les résultats ont ensuite été agrégés par cellule raster et jour de l’année (de 1 à 365) afin d’observer les variations statistiques (boxplot) des capacités de navigation dans différentes zones au cours de ces 25 années.

Ainsi, pour chaque jour de l’année, il est possible d’observer différents scénarios correspondant aux percentiles (boxplot) des indices de risques POLARIS observés au cours des 25 années. Un exemple préliminaire de ces travaux est détaillé ci-dessous pour un navire de classe IA et les jours 130, 170, 260 (mai, juin, septembre). On peut y observer la grande variabilité spatiale et temporelle des zones accessibles pour ce type de navire (IA).

Jour de l’année

Cas défavorable
25%

Cas moyen
50%

Cas favorable
75%

130

9-10
Mai

170

18-19
Juin

260

16-17 Septembre

Ces travaux sont préliminaires à une étude sur la prise de décision lors de la planification des voyages dans l’Arctique et la prise en compte de l’incertitude dans ce processus de décision.
Pour l’Arctique Canadien, les résultats de cette analyse POLARIS ont été présentés et publiés dans différentes conférences et revues.

Enfin, je collabore actuellement avec le Service Départemental d’Incendie et de Secours d’Indre et Loire (SDIS37) pour l’élaboration du Schéma Départemental d’Analyse et de Couverture des Risques (SDACR). Ce document a pour objectif de recenser les différents risques courants et exceptionnels présents sur le département et d’adapter la couverture opérationnelle en conséquence. Une des problématiques étudiées porte sur la disponibilité des Sapeurs-Pompiers Volontaires en journée. En effet, bien que le territoire dispose théoriquement de moyens matériels pour couvrir l’intégralité du département dans des délais impartis, la moindre disponibilité des SPV en journée engendre des carences dans la couverture du risque courant. Aussi, différentes cartes isochrones de couverture du risque incendie (fourgons incendie) et secours à personnes (ambulances) ont été établies afin de visualiser et d’analyser l’impact de carences combinées de centres de secours. La Figure 23 présente un exemple de cartes produites dans une situation considérée comme défavorable (25ème percentile des plus faibles disponibilités en personnels observée sur une année pour un jour de la semaine et un créneau horaire d’une demi-heure en tenant compte de la présence d’un conducteur poids lourds).

De septembre 2013 à 2014, j’ai travaillé en qualité d’Attaché Temporaire d’Enseignement et de Recherche (ATER) au sein du groupe MoTim (Modélisation et Traitement de l’Information Maritime) de l’Institut de Recherche de l’Ecole Navale. 

Les travaux entrepris lors de ce contrat portent sur la synthèse et la visualisation de patrons spatio-temporels de trajectoires. Une extension du concept statistique des boîtes à moustaches (boxplot) adaptée à la représentation 3D des patrons de trajectoires a été proposée. Ces travaux visent à modéliser le comportement spatial et temporel de clusters de trajectoires sous la forme d’une trajectoire centrale et d’un couloir spatio-temporel. La définition du concept de trajectoire centrale s’appuie sur des algorithmes de comparaison et d’appariement de trajectoires. La trajectoire centrale est alors construite de façon itérative par appariements successifs à une trajectoire de référence (Trajectory K-Mean) comme illustré dans la Figure ci-dessous. 

Une analyse en composantes principales est ensuite réalisée pour chaque nuage de points. La dispersion spatiale sur les deux composantes principales est alors représentée sous la forme de boîtes à moustaches 2D. 

Le modèle est ensuite étendu afin de prendre en compte l’aspect temporel. Chaque nuage de positions est alors synthétisé sous la forme d’une boîte à moustaches spatio-temporelle 3D, la dimension temporelle étant alors représentée sur l’axe Z (space-time cube). La combinaison des différentes boîtes permet de générer et visualiser un couloir spatio-temporel 3D au sein duquel le cluster de trajectoires évolue. 

Ce modèle 3D de patrons de trajectoires dispose alors des propriétés visuelles intéressantes héritées du concept des boîtes à moustaches. Il permet de visualiser le comportement médian du groupe de trajectoires ainsi que les variations des distributions spatiales et temporelles au sein du cluster. L’évolution du degré d’asymétrie (skewness) et du coefficient d’aplatissement (kurtosis) est alors directement visualisable et interprétable. Ces travaux ont été étendus à la suite de mon intégration en qualité de maître de conférences au LIFAT. Ils ont fait l’objet de publications dans des conférences et revues internationales.

En parallèle de cette activité de recherche principale, je me suis également investi dans différents projets de recherche collaboratifs internationaux. Certains de ces projets ont été initiés lors de mon post-doctorat au Canada.

Le projet PASSAGES regroupe des partenaires industriels (Cassidian Ulm, ExactEarth Canada), académiques (Fraunhofer-Institut für Kommunikation, Dalhousie University) et gouvernementaux (Project Management Jülich, Conseil de recherches en sciences naturelles et en génie du Canada). Ce projet consiste à modéliser un système de surveillance persistant du trafic maritime dans l’Arctique basé sur des réseaux de capteurs multi-sources permettant de suivre les navires et détecter des comportements anormaux potentiellement dangereux. 

J’ai également réalisé un projet portant sur l’impact du développement d’infrastructures portuaires sur le trafic maritime en Colombie Britannique (Canada) et ses répercussions sur les espèces marines. Dans cette étude, j’ai modélisé le trafic maritime de différentes catégories de navires (densité, vitesse et temps de présence) sur l’ensemble de l’espace maritime de Colombie Britannique au Canada. Grâce à cette étude, les bruits rayonnés par les navires ont pu être calculés. Ces modèles sont ensuite utilisés par des biologistes pour en déduire les perturbations causées aux espèces marines évoluant dans cette zone.

Au sein de l’Institut de Recherche de l’Ecole Navale, j’ai collaboré au projet de recherche nommé DACTARI (Dynamiques des activités maritimes : Base d’Information Géographique et Temporelle en support à la connaissance et à la scénarisation). Ce projet est réalisé en collaboration avec le laboratoire LETG-Brest, Géomer, l’Institut Universitaire Européen de la Mer et le Comité Départemental des Pêches Maritimes et des Elevages Marins du Finistère. Il adresse les problématiques de modélisation des activités maritimes en rade de Brest. Il s’intéresse plus particulièrement aux activités de pêche à la drague.

Enfin, j’ai collaboré à l’élaboration du projet de recherche ANR nommé Dé-AIS dont la thématique de recherche porte sur la sécurité et sûreté de l’environnement maritime ainsi que sur la Cyber Défense.

Ma thèse de doctorat de l’Université de Brest en géomatique a été réalisée au sein du groupe de recherche en Science de l’Information Géographique (SIG) de l’Institut de Recherche de l’École Navale (IRENav) sous la direction du McF HDR Alain Bouju (Laboratoire Informatique, Image et Interaction de La Rochelle) et le Pr Thomas Devogele (IRENav), respectivement directeur et co-directeur. Le sujet de recherche de ces travaux porte sur la fouille de données spatio-temporelles.

Lors de cette thèse intitulée « Motifs spatio-temporels de trajectoires d’objets mobiles, de l’extraction à la détection de comportements inhabituels. Application au trafic maritime. », j’ai proposé une méthodologie composée d’une étape de fouille de données suivi d’une analyse spatio-temporelle pour aboutir à la visualisation des données de mobilité enrichies. Cette démarche méthodologique est présentée sur le schéma fonctionnel ci-dessus. 

La problématique abordée lors de ma thèse est étroitement liée à l’extraction de connaissances dans de volumineuses bases de données spatio-temporelles (Big Data). En effet, les systèmes de géolocalisation permettent la surveillance en temps réel des déplacements d'objets mobiles. Ces systèmes génèrent cependant des volumes de plus en plus conséquents de données spatio-temporelles difficiles à analyser à la volée par un opérateur humain comme l’illustre la Figure ci-dessous. Ce volume important de données entraîne une surcharge cognitive nuisant à la détection d'objets ayant un comportement inhabituel. L’extraction de connaissances de ces données de mobilité offre des perspectives nouvelles quant à l'analyse des comportements sous-jacents.

Je me suis intéressé plus particulièrement à l'extraction de motifs spatio-temporels dans l’objectif de qualifier le comportement d’objets mobiles réalisant un itinéraire commun. Cette extraction de motifs part du postulat que les objets mobiles d'un même type évoluant dans un même espace ont des comportements similaires et suivent une route optimisée en fonction d'un ensemble d'objectifs. La prise en compte des dimensions spatiale et temporelle conjointes rend cette tâche complexe.

Nous avons proposé une démarche de fouille de données qui consiste à apparier des groupes homogènes de trajectoires afin d'analyser par méthode statistique leurs séquences de positions homologues. Ce processus permet de générer un patron spatio-temporel décrivant le comportement habituel médian ainsi que les écarts spatio-temporels admissibles. Ce patron est composé d'une trajectoire médiane associée à un couloir spatio-temporel de déplacements tenant compte du contexte dans lequel l'objet mobile évolue. 

Pour l'identification de trajectoires inhabituelles, nous avons proposé une méthode basée sur une approche logique floue, combinant différentes mesures de similarité entre une trajectoire et un patron. Le résultat obtenu est un indice de similarité spatio-temporelle. L’analyse de cet indice de similarité permet la classification de différentes trajectoires d'un groupe, en fonction de leur similarité spatio-temporelle par rapport à un patron.

 

L'étape de visualisation de positions et de trajectoires enrichies a également été implémentée. Elle permet de visualiser la zone de normalité d'une route type en fonction du temps relatif d’une position depuis le départ. Les positions des navires se trouvant dans cette zone peuvent ainsi être facilement qualifiées et identifiées visuellement. 

La recherche développée se positionne dans un processus d’aide à la décision permettant à des opérateurs de focaliser leur attention sur les déplacements d’objets mobiles ayant des trajectoires qualifiées comme inhabituelles. Un prototype fonctionnel nommé « comptraj » reprenant les différentes étapes de la méthodologie a été réalisé. Ces travaux ont été validés à l'aide d'un conséquent jeu de données réelles issues du trafic maritime. 

Le processus d'acquisition de données de positions de navires en provenance de capteurs (récepteurs AIS) et de flux de données (décodage de trames en provenance de serveurs distants) a été implémenté en Java. La modélisation et la sauvegarde de ces données ont été réalisées au sein d'une base de données PostgreSQL à l'aide de la cartouche spatiale PostGIS ainsi que du langage de procédures PL/pgSQL.

L'étape hors ligne de fouille de données spatio-temporelles a été réalisée en Java ainsi que le processus de qualification de positions et de trajectoires basé sur une approche logique floue. La visualisation des données de mobilité enrichies (patrons et trajectoires qualifiées) a été intégrée au modèle grâce à un processus de génération de fichiers KML (Keyhole Markup Language) également écrit en Java.

Le processus d'acquisition de données a permis de constituer une base de données spatio-temporelles de plus de 130 millions de positions de navires (entre 2007 et 2011). Une fouille de données a été réalisée sur trois différents cas d'étude et a permis d'obtenir des patrons spatio-temporels (routes types) synthétisant le comportement de différents groupes homogènes de trajectoires. Ces patrons ont ensuite été utilisés à des fins de classification et de prédiction de comportement d’objets mobiles évoluant dans un espace ouvert.

Une extension de ces travaux de recherche a été réalisée afin de proposer un moteur à base de règles permettant de détecter et de souligner le comportement anormal de navires.

Le laboratoire MARIN pour « Maritime Activity and Risk Investigation Network » de l’université de Dalhousie au Canada se concentre sur l’aide à la décision et l’analyse de risques liés à tous les types d’activités maritimes. J’ai rejoint cette équipe en juin 2012 pour y réaliser mon post-doctorat.

Lors de celui-ci, je me suis intéressé à l’analyse du trafic maritime dans l’Arctique Canadien à l’horizon 2020. La problématique liée à ces travaux provient de la grande incertitude relative aux différents facteurs impactant le trafic maritime. Dans un premier temps, nous nous sommes intéressés à l’étude des facteurs socio-économiques ainsi qu’à la modélisation de différents scénarios de projection pour 2020. Nous avons également modélisé l’évolution temporelle des conditions météorologiques dans l’Arctique Canadien et plus particulièrement l’impact des différents types de glaces sur les déplacements des navires. Nous avons couplé cette modélisation avec l’étude du trafic actuel dans l’Arctique en utilisant des bases de données de positions de navires utilisant le système LRIT (Long Range Identification and Tracking). Une méthodologie détaillée reposant sur trois grandes parties a été proposée.

La première partie de cette méthodologie consiste à modéliser le trafic maritime actuel dans l’Arctique. Une analyse des données de positions d’une année complète de trafic a été réalisée. L’objectif de cette étape consiste à découvrir les Zones d’Intérêt (ZOI) générant du trafic maritime, les types de navires fréquentant ces zones, et comment sont-elles interconnectées. Une analyse spatiale et temporelle des trajectoires a permis de construire un graphe spatio-temporel pondéré du trafic maritime entre les différentes ZOI. Ce graphe permet de connaître le niveau de trafic mensuel par catégorie de navires entre deux zones d’intérêt.

La seconde partie de la méthodologie s’intéresse à la prise en compte de l’évolution temporelle de la glace dans les eaux arctiques. Différents types de navires sont spécialement conçus pour naviguer dans certaines catégories de glaces plus ou moins dense. Ces navires sont classés dans la catégorie des brise-glaces (CAC1-CAC4) ou des navires à coque renforcée (Type A-Type E) pouvant naviguer uniquement dans des zones ou la glace est de faible épaisseur. Les navires de la catégorie Type E sont les plus limités car ils ne peuvent naviguer que dans la glace ayant une épaisseur réduite (inférieure à 15 cm) alors que ceux de la catégorie CAC1 peuvent se déplacer dans n’importe quel type de glace rencontrée dans l’Arctique.

Nous avons utilisé les cartes climatiques de concentration des différentes catégories de glaces de mer du Service Canadien des Glaces afin de définir des cartes mensuelles de risques par catégorie de navires. L’indice de risque utilisé est nommé « Ice Numeral » (Arctic Ice Regime Shipping System of Transport Canada), il est calculé à partir d’une combinaison entre la catégorie du navire, la concentration et le type de glace rencontrée. Lorsque l’indice de risque est négatif, cela signifie que la glace est trop dense pour que cette catégorie de navires puisse la traverser (représenté en rouge sur les cartes de risques). Une analyse raster a été réalisée pour chaque mois de l’année 2011. Cette analyse a permis de calculer l’indice de risque minimal et maximal mensuel par catégorie de navires. Les cartes de risques pour le mois d’Août 2011 sont présentées sur les deux figures ci-dessus. 

Une fois les cartes de risques établies, nous avons utilisé un modèle de prédiction de changement climatique pour simuler l’évolution du type de glace présent mensuellement dans l’Arctique en 2020. Puis nous avons calculé les plus courts chemins entre les zones d’intérêt du graphe afin d’en déduire quels arcs du graphe seront navigables pour chaque mois en 2020. Ces routes navigables simulées pour le mois d’août 2020 sont présentées sur l’exemple des figures ci-dessous. 

A partir de l’analyse de trafic réalisée lors de la première étape et des cartes de routes navigables en 2020, la dernière étape de cette méthodologie consiste à modéliser les changements de trafic liés à des facteurs spatio-temporels socio-économiques. Nous avons premièrement simulé un étalement temporel du trafic maritime dû à la fonte des glaces. Nous sommes partis du postulat que le trafic pouvait s’étendre sur un arc du graphe de zones d’intérêt si ce même arc est également navigable les mois précédents et suivants. Nous avons modélisé cet étalement temporel à l’aide d’une simulation Monte-Carlo. Nous avons également pris en compte les différents facteurs socio-économiques tels que l’activité liée à l’exploitation des ressources (mines, pétrole, gaz, pêche), au changement de population et croissance du produit intérieur brut, au tourisme… Chacun de ces facteurs a été modélisé par une distribution triangulaire permettant de définir un scénario minimum, maximum et median ainsi qu’une emprise spatiale et temporelle. Le trafic des arcs du graphe impactés spatialement et temporellement par les différents facteurs est modifié de façon multiple et combinée grâce à la simulation Monte-Carlo. Le résultat final de cette étude est fusionné dans des cartes mensuelles de densités de trafic par catégorie de navires pour l’année 2020.  

Ainsi, grâce à ces cartes, la densité de trafic minimale, maximale et moyenne dans différentes zones de l’Arctique Canadien peut être visualisée. Ces informations sont ensuite intégrées dans un logiciel d’aide à la décision utilisé par la Direction de la Recherche et du développement pour la Défense du Canada (DRDC) afin d’optimiser l’allocation des ressources de la Marine Nationale Canadienne et des garde-côtes. Un exemple de carte de densité moyenne de trafic pour l’année 2020 est présenté sur la Figure ci-dessus.

 

Mes premières activités de recherche ont été conduites au sein du groupe SIAMES de l’IRISA (2002-2003). J’ai participé à un stage de maîtrise proposé par Anatole Lecuyer et Bruno Arnaldi. Ce stage consistait à étudier l’interaction des sens de la vision et du toucher dans le cadre de la réalité virtuelle [Ra1]. Durant ce stage, nous avons mis en place trois différents protocoles expérimentaux visant à étudier l’efficacité du retour dit « pseudo-haptique » pour la simulation de reliefs et textures. J’ai participé à l’élaboration des protocoles, réalisé le prototype informatique et effectué la conduite des expériences et l’analyse des résultats. Le prototype implémenté a également été étendu au web (http://www.irisa.fr/tactiles/). Les résultats de ces travaux ont ouvert un grand nombre de perspectives et ont fait l’objet d’un dépôt de brevet, d’un dépôt de logiciel APP nommé « PSEUDOHAPTIK », et d’une publication internationale dans la conférence de référence du domaine des interfaces homme-machine ACM CHI 2004.