Equipe BD
Equipe BD
Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon

You are here

Échantillonnage de données : contextes d’application et solutions

Qui: 
Thomas CERQUEUS
Quand: 
Tuesday, November 3, 2015 - 13:00 to 14:00
Où: 
Nautibus, salle C5

Les techniques d'échantillonnage de données ont pour objectif de réduire le volume d’un ensemble de données ; il peut s’agir du contenu d’une base de données relationnelle ou du contenu d’un flux de données quelconque. L’objectif final de l’échantillonnage est de limiter les ressources nécessaires au traitement de ces données : temps d’exécution d’une tâche, capacité des machines de calcul, etc. Cet exposé présente deux exemples concrets pour lesquels l'échantillonnage s’avère intéressant, puis focalise sur une nouvelle méthode d'échantillonnage. Cette dernière, appelée KSample, permet d’obtenir un échantillon équivalent à un certain pourcentage d’un flux de données de taille indéterminée. Cette approche utilise la notion d’invariant pour garantir que l’échantillon a la taille désirée quelque soit la taille du flux. KSample élimine le problème lié au dépassement d’espace mémoire en définissant le concept de mini-réservoirs distribués. Des résultats expérimentaux présentant les performances de KSample seront également présentés dans cet exposé.