Ma thèse de doctorat de l’Université de Brest en géomatique a été réalisée au sein du groupe de recherche en Science de l’Information Géographique (SIG) de l’Institut de Recherche de l’École Navale (IRENav) sous la direction du McF HDR Alain Bouju (Laboratoire Informatique, Image et Interaction de La Rochelle) et le Pr Thomas Devogele (IRENav), respectivement directeur et co-directeur. Le sujet de recherche de ces travaux porte sur la fouille de données spatio-temporelles.

Lors de cette thèse intitulée « Motifs spatio-temporels de trajectoires d’objets mobiles, de l’extraction à la détection de comportements inhabituels. Application au trafic maritime. », j’ai proposé une méthodologie composée d’une étape de fouille de données suivi d’une analyse spatio-temporelle pour aboutir à la visualisation des données de mobilité enrichies. Cette démarche méthodologique est présentée sur le schéma fonctionnel ci-dessus. 

La problématique abordée lors de ma thèse est étroitement liée à l’extraction de connaissances dans de volumineuses bases de données spatio-temporelles (Big Data). En effet, les systèmes de géolocalisation permettent la surveillance en temps réel des déplacements d'objets mobiles. Ces systèmes génèrent cependant des volumes de plus en plus conséquents de données spatio-temporelles difficiles à analyser à la volée par un opérateur humain comme l’illustre la Figure ci-dessous. Ce volume important de données entraîne une surcharge cognitive nuisant à la détection d'objets ayant un comportement inhabituel. L’extraction de connaissances de ces données de mobilité offre des perspectives nouvelles quant à l'analyse des comportements sous-jacents.

Je me suis intéressé plus particulièrement à l'extraction de motifs spatio-temporels dans l’objectif de qualifier le comportement d’objets mobiles réalisant un itinéraire commun. Cette extraction de motifs part du postulat que les objets mobiles d'un même type évoluant dans un même espace ont des comportements similaires et suivent une route optimisée en fonction d'un ensemble d'objectifs. La prise en compte des dimensions spatiale et temporelle conjointes rend cette tâche complexe.

Nous avons proposé une démarche de fouille de données qui consiste à apparier des groupes homogènes de trajectoires afin d'analyser par méthode statistique leurs séquences de positions homologues. Ce processus permet de générer un patron spatio-temporel décrivant le comportement habituel médian ainsi que les écarts spatio-temporels admissibles. Ce patron est composé d'une trajectoire médiane associée à un couloir spatio-temporel de déplacements tenant compte du contexte dans lequel l'objet mobile évolue. 

Pour l'identification de trajectoires inhabituelles, nous avons proposé une méthode basée sur une approche logique floue, combinant différentes mesures de similarité entre une trajectoire et un patron. Le résultat obtenu est un indice de similarité spatio-temporelle. L’analyse de cet indice de similarité permet la classification de différentes trajectoires d'un groupe, en fonction de leur similarité spatio-temporelle par rapport à un patron.

 

L'étape de visualisation de positions et de trajectoires enrichies a également été implémentée. Elle permet de visualiser la zone de normalité d'une route type en fonction du temps relatif d’une position depuis le départ. Les positions des navires se trouvant dans cette zone peuvent ainsi être facilement qualifiées et identifiées visuellement. 

La recherche développée se positionne dans un processus d’aide à la décision permettant à des opérateurs de focaliser leur attention sur les déplacements d’objets mobiles ayant des trajectoires qualifiées comme inhabituelles. Un prototype fonctionnel nommé « comptraj » reprenant les différentes étapes de la méthodologie a été réalisé. Ces travaux ont été validés à l'aide d'un conséquent jeu de données réelles issues du trafic maritime. 

Le processus d'acquisition de données de positions de navires en provenance de capteurs (récepteurs AIS) et de flux de données (décodage de trames en provenance de serveurs distants) a été implémenté en Java. La modélisation et la sauvegarde de ces données ont été réalisées au sein d'une base de données PostgreSQL à l'aide de la cartouche spatiale PostGIS ainsi que du langage de procédures PL/pgSQL.

L'étape hors ligne de fouille de données spatio-temporelles a été réalisée en Java ainsi que le processus de qualification de positions et de trajectoires basé sur une approche logique floue. La visualisation des données de mobilité enrichies (patrons et trajectoires qualifiées) a été intégrée au modèle grâce à un processus de génération de fichiers KML (Keyhole Markup Language) également écrit en Java.

Le processus d'acquisition de données a permis de constituer une base de données spatio-temporelles de plus de 130 millions de positions de navires (entre 2007 et 2011). Une fouille de données a été réalisée sur trois différents cas d'étude et a permis d'obtenir des patrons spatio-temporels (routes types) synthétisant le comportement de différents groupes homogènes de trajectoires. Ces patrons ont ensuite été utilisés à des fins de classification et de prédiction de comportement d’objets mobiles évoluant dans un espace ouvert.

Une extension de ces travaux de recherche a été réalisée afin de proposer un moteur à base de règles permettant de détecter et de souligner le comportement anormal de navires.