Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon
Lors de ce séminaire je présenterai mes travaux de recherche autour de l’extraction d’informations géographiques et je détaillerai les différents projets auxquels j’ai contribué. Je présenterai en particulier la plateforme PERDIDO qui implémente une méthode d’extraction d’informations géographiques. Cette méthode, basée sur une approche TAL hybride, combine une analyse morphosyntaxique, une cascade de transducteurs (implémentant des grammaires de construction), l’interrogation de ressources du Web des données (Linked Data) et la visualisation des informations géographiques. La méthode développée vise à marquer et formaliser les relations entre entités nommées étendues, termes géographiques, relations spatiales et expressions de déplacement. Cette méthode a été développée et enrichie lors de différentes collaborations (nationales et internationales) au sein des humanités numériques. Le premier projet concerne l’extraction d’expressions de déplacement et la génération de trajectoires à partir d’un corpus de descriptions de randonnées écrites en langues romanes (français, espagnol et italien). Le deuxième concerne l’extraction et la caractérisation des noms de lieux à partir de romans français du XIXe siècle pour la réalisation d’une cartographie du « Paris romanesque ». Le troisième projet s’intéresse à l’adaptation de méthodes d’extraction d’information pour les documents historiques en français classique (XVIIIe siècle), les expérimentations portent sur les articles de l’Encyclopédie. Les différents modules logiciels développés sont accessibles en ligne par des services Web. Ces services Web servent également de point de départ au travail actuellement en cours dans le cadre du projet ANR CHOUCAS (2017-2020) pour l’aide à la localisation de victimes en montagne et à l’appariement entre des traces GPS et des descriptions textuelles. Je terminerai le séminaire en présentant mes perspectives de recherche et les axes de collaboration possible au sein du LIRIS tels que le développement de méthodes hybrides d’extraction d’information (TAL et Data Mining), le traitement et l’analyse de masse de données hétérogènes et la modélisation d’informations spatio-temporelles.