Avec comme toile de fond les Loisirs, et plus précisément le pôle de compétitivité Loisirs Numériques,
le projet LIMA (Loisirs et IMAges) s'attaque à deux problématiques complémentaires. La première concerne
la caractérisation des séquences vidéos ou des films dans un but d'indexation servant à la recherche,
la navigation ou l'exploitation de bases de données. La seconde est liée à la création de contenus graphiques
3D ainsi qu'à leur visualisation. Ces deux problématiques, souvent regardées comme distinctes, tendent à se
rapprocher et l'un des objectifs du projet LIMA est de favoriser ce rapprochement.
La multiplication des données multimédia pose le problème de l'indexation efficace de leur contenu.
Le problème est délicat car les données disponibles, en particulier dans le cas des images, constituent
une source d'information très volumineuse, d'où il est difficile d'extraire les éléments nécessaires à
une caractérisation pertinente. Dans le projet LIMA, nous aborderons ce sujet en procédant en deux étapes
principales :
-
Dans un premier temps, nous utiliserons de nombreuses approches, différentes aussi bien par l'information
traitée (texte/son/ image) que par leur objectif, pour acquérir tout un ensemble de caractéristiques de bas-niveau.
-
Chacune des caractéristiques obtenues ne permettant généralement pas d'obtenir une description riche des données,
dans un deuxième temps, nous les fusionnerons, en nous appuyant souvent sur des connaissances externes, pour
permettre la constitution de descripteurs pertinents.
-
Enfin, nous utiliserons l'ensemble des outils proposés pour aborder les problèmes de recherche, navigation, etc.
dans le cas de deux applications empruntés aux Loisirs : les films d'animation d'une part, et les vidéos de
type reportage sportif ou journal télévisé d'autre part. Pour illustrer de manière concrète l'intérêt de ces outils,
on peut imaginer leur utilisation, après l'enregistrement d'une compétition d'athlétisme sur la télévision numérique,
pour retrouver immédiatement les quelques secondes correspondant au saut à la perche.
Dans un contexte 3D (qui devient de plus en plus le contexte fondamental de l'image numérique), les problèmes qui se
posent et sur lesquels nous comptons travailler sont les suivants :
-
Il faut être capable de produire de très grandes bases de données, par exemple un environnement complexe (une ville
ou un paysage naturel) comportant des détails réalistes et simulant des phénomènes naturels, le tout dans des délais
raisonnables (moins de quelques mois !) et en laissant à l'utilisateur le contrôle du processus. Ces méthodes de génération
peuvent être procédurales ou s'appuyer sur des capteurs (caméras, lasers 3D, ...). Dans ce dernier cas, la modélisation
des caméras et leur calibration, la représentation et l'estimation de mouvements, la reconnaissance de gestes et d'activités
font partie des problèmes à résoudre ;
-
L'existence de très grandes masses de données dont certaines sont issues d'objets du monde réel, pose le problème de leur
analyse et de leur traitement. Ceci nécessite des travaux sur les maillages (réguliers et irréguliers), notamment leur
structuration et leur compression. Ceci impose également d'analyser ces données 3D pour en extraire des caractéristiques
comme des régions d'intérêt, des points saillants, ... permettant de caractériser les maillages. Une piste possible est
l'utilisation de la morphologie 3D, la morphologie 2D ayant fourni des très bons résultats dans le cas des images 2D ;
-
Ces bases de données doivent également pouvoir comporter des objets animés, que ce soit des objets naturels ou des personnages.
Il faut donc pouvoir animer de tels objets ou personnages en temps réel tout en reproduisant des mouvements complexes de façon
plausible ;
-
Ces très grandes bases de données doivent enfin pouvoir être visualisées en temps réel, que ce soit de façon réaliste (en simulant
une photographie de la même scène) ou expressive (en mettant en évidence des représentations abstraites ou symboliques des objets.
Enfin, un troisième objectif de ce projet, à moyen terme, sera de réaliser la convergence entre les problèmes d'indexation et
les données graphiques 3D. Plus précisément, l'objectif sera de voir dans quelle mesure les deux approches peuvent se compléter :
indexation sur des séquences synthétiques 3D, etc.
|