Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon
L'informatique en nuages permet de faire face aux besoins de nombreux domaines d’applications scientifiques (séquençage du génome, physique corpusculaire par exemple), économiques (commerce en ligne, informatique décisionnelle, ou encore processus métiers) ou sociétaux (santé, réseaux sociaux, enseignement, etc.), au coeur desquels, les données jouent un rôle crucial. Cependant, la gestion des données, notamment massives, au sein des nuages informatiques n'est pas triviale et se heurte à de nombreux verrous scientifiques à différents niveaux : stockage, interrogation, ou encore intégration. Cette présentation décrit nos contributions recherche pour la gestion de données massives dans les nuages informatiques. Nous nous sommes intéressés au problème de l'optimisation de la gestion de données massives dans les nuages informatiques. Nous avons d'une part traité un cas d'utilisation précis, à savoir le passage à l'échelle de la recherche de sous-graphes fréquents à l'aide de MapReduce. Nous avons d'autre part proposé des solutions génériques (extensions de filtres de Bloom pour l'exécution de jointures et de requêtes récursives, architecture hybride sur une structuration des données en lignes et en colonnes) pour améliorer le traitement de données massives dans les nuages.