Equipe BD
Equipe BD
Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon

You are here

Thèmes de l'équipe BD


Thème 1 : Modèles et langages

Nous cherchons à homogénéiser le stockage, l’interrogation et le traitement des données structurées ou
non, issues de capteurs, liées à des services, aux objets connectés et mobiles, sans oublier les plus classiques
fichiers. En effet, des langages déclaratifs couplés à des techniques d’optimisation de requêtes peuvent se
décliner pour les données non conventionnelles et permettre ainsi d’intégrer les différents composants de
ces environnements dynamiques. Cela constitue un atout majeur pour répondre efficacement aux nouveaux
besoins et faciliter le travail des développeurs.
En focalisant sur la notion de flux, très présente dans ces systèmes, nous attaquons le problème de l’op-
timisation des requêtes continues sous plusieurs angles dont celui de la sémantique et des contraintes. À la
convergence entre les bases de données et de la découverte de connaissances, les langages déclaratifs et l’op-
timisation de requêtes peuvent faciliter ce rapprochement. Nous cherchons à introduire de nouveaux modèles,
langages et primitives dédiés à la fouille de données, dont l’exploitation bénéficierait tant à l’expressivité des
requêtes qu’à leur optimisation.
Les données intègrent de plus en plus de composantes multidimensionnelles (sémantiques, spatio-
temporelles. . . ) qui présentent un intérêt manifeste pour les interactions entre utilisateurs et données. En
particulier, grâce à la démocratisation du GPS, les aspects spatio-temporels sont de plus en plus présents
dans les données et dans les besoins d’analyse, de navigation et de visualisation. Autant de points centraux
pour la compréhension et la valorisation des données. L’hétérogénéité n’est pas absente de ces dimensions.
Elle constitue, ici aussi, un frein à l’intégration, que nous travaillons à limiter.


Thème 2 : Architectures et Systèmes

Dans le cadre des très grandes masses de données scientifiques, et plus particulièrement dans le domaine
de l’astronomie où les données produites par les nouveaux et futurs télescopes ont un caractère particuliè-
rement massif, nous cherchons des solutions de stockage et d’interrogation. Le volume n’est pas la seule
difficulté. Il est d’ores et déjà évident que les usages de ces données, et donc les requêtes, vont fortement
évoluer, sans pour autant que l’on connaisse ces évolutions. Cela disqualifie toute solution ad hoc et im-
pose que les solutions puissent s’adapter dynamiquement aux évolutions des usages. Ces facteurs, ainsi que
d’autres, nous conduisent à nous ouvrir à des architectures massivement parallèles, au calcul distribué et au
NoSQL qui n’étaient pas, jusqu’à récemment, au centre des intérêts de l’équipe.
L’augmentation du nombre d’utilisateurs et donc de requêtes peut faire peser sur les sources de données
une charge difficile à supporter. Le recours à des intermédiaires fournissant les infrastructures adéquates,
types grands moteurs de recherche, est possible. Cependant, c’est les mettre en position d’exclusivité concer-
nant la concentration des données et l’observation des usages. Sans remettre en cause ce modèle, il nous
semble nécessaire de disposer de solutions compatibles, complémentaires et alternatives. Dans cette di-
rection, nos recherches portent sur la proposition d’architectures pour le partage de données à base de
composants sécurisés appartenant aux utilisateurs, ainsi que sur le traitement et l’optimisation de requêtes
continues produites par de nombreux utilisateurs avec une approche communautaire (partage de ressources
et de résultats).


Thème 3 : Sécurité et Qualité des Données.

Dans un environnement de plus en plus interconnecté et où l’exploitation des données est devenue un
enjeu économique, le contrôle des données est une priorité qu’il ne faut pas négliger. S’il est important de
pouvoir accéder aux sources de données en tant que client, il ne faut pas oublier que nous avons de plus en
plus souvent un rôle de producteur de données. Dans ce cas, il est indispensable de disposer d’un certain
contrôle sur les données produites et diffusées. En particulier une entité, quelle qu’elle soit, doit pouvoir
mettre en place sa propre politique spécifiant les conditions d’accès et d’usages de ses données. Ces données
sont souvent analysées, agrégées, combinées dans des environnements distribués et ouverts. Nous cherchons
donc à proposer des solutions adaptées à de tels environnements pour le contrôle, la diffusion, et l’usage des
données.
Par ailleurs, lors de processus de décision ou de recherche d’information, la qualité des données revêt une
importance qui peut se révéler critique. Les solutions que nous développons passent par plusieurs étapes,
en commençant par l’évaluation de la qualité pour ensuite l’améliorer. Nous suivons ici plusieurs pistes :
filtrage et nettoyage, mais aussi contextualisation. La complexité croissante des données, mais aussi leur
hétérogénéité et la diversité des usages font ressortir le besoin de solutions génériques passant par la définition
de nouveaux modèles.