Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon
Les systèmes d’aide à la décision occupent une place prépondérante au sein des entreprises et des grandes organisations, pour permettre des analyses dédiées à la prise de décisions. Avec l’avènement du big data, le volume des données d’analyses atteint des tailles critiques, défiant les approches classiques d’entreposage de données, dont les solutions actuelles reposent principalement sur des bases de données R-OLAP. Avec l’apparition des grandes plateformes Web telles que Google, Facebook, Twitter, Amazon… des solutions pour gérer les mégadonnées (Big Data) ont été développées et appelées « Not Only SQL ». Ces nouvelles approches constituent une voie intéressante pour la construction des entrepôts de données multidimensionnelles capables de supporter des grandes masses de données. Ces nouvelles approches constituent une voie intéressante pour la construction des entrepôts de données multidimensionnelles capables de supporter des grandes masses de données. Toutefois la remise en cause de l’approche R- OLAP nécessite de revisiter les principes de la modélisation des entrepôts de données multidimensionnelles.
Processus d’implantation NoSQL des schemas multidimentionnelles.
Pour pouvoir bénéficier des avantages des systèmes NoSQL, il est nécessaire de définir un processus d’implantation des entrepôts de données multidimensionnelles avec les modèles NoSQL. Ces systèmes réclament de nouvelles règles pour traduire de manière pertinente les faits, les dimensions et les hiérarchies dans les modèles NoSQL. En particulier, la distribution soujascente des données nécessite de revisiter les règles de traduction élaborées dans le contexte centralisé des entrepôts de données.
Uniformisation de la modélisation NoSQL des entrepôts.
Les modèles NoSQL sont des solutions récentes qui sont destinées à répondre à des besoins spécifiques. Les modèles de représentation de ces systèmes ne sont pas standardisés, et reposent sur des concepts non uniformes à l’exception du simple principe clé/valeur. Un enjeu est donc de proposer une uniformisation des modèles de représentation pour permettre la définition homogène de processus de transformation entre modèles. La grande flexibilité introduite au niveau des schémas dans les modèles NoSQL (schemaless) complexifie la définition de règles génériques pour la transformation d’une masse de données entre les niveaux conceptuel et logique.