Mercredi 26 novembre

11:00-12:00 – Session C1 – Segmentation / classification

Contribution des descripteurs de texture LBP Ã la classification dâ€™images de dentelles

Wael Bensoltana, Alice Porebski, Nicolas Vandenbroucke, Adeel Ahmad, Denis Hamad

Un jeu, des images, des clics et du texte : collecte implicite de donnÃ©es visuelles et sÃ©mantiques

Axel CARLIER, Vincent CHARVILLAT

14:20-15:40 – Session C2 – SÃ©curitÃ©

	Identification du systÃ¨me d'acquisition scanner X Ã partir de l'analyse du bruit dans des images mÃ©dicales Anas KHARBOUTLY, William PUECH, GÃ©rard SUBSOL, Denis HOA L’imagerie mÃ©dicale aide les mÃ©decins Ã amÃ©liorer et accÃ©lÃ©rer le processus de diagnostic. Il est donc fondamental de s’assurer que les images d’un patient n’ont pas Ã©tÃ© altÃ©rÃ©es ou interverties avec celles d’un autre. Pour cela, nous proposons une mÃ©thode pour identifier l’appareil scanner X Ã partir du bruit dans les images mÃ©dicales. Nous avons construit un modÃ¨le de bruit de rÃ©fÃ©rence pour les images acquises par chaque systÃ¨me scanner X. Nous avons ensuite corrÃ©lÃ© les images 3D obtenues avec chaque modÃ¨le de bruit de rÃ©fÃ©rence pour identifier l’appareil scanner X correspondant. Nous avons utilisÃ© une approche de filtre de Wiener basÃ© sur des ondelettes pour extraire le bruit. Des rÃ©sultats expÃ©rimentaux prÃ©liminaires ont Ã©tÃ© obtenus sur 8 images 3D de 100 coupes de scanner X diffÃ©rents et nous avons pu globalement identifier chaque scanner X. criminalistique numÃ©rique, imagerie mÃ©dicale, authentification, identification des dispositifs, analyse de bruit
	Nouvelle mÃ©thode dâ€™Ã©valuation de robustesse des algorithmes de tatouage vidÃ©o: Jeu dâ€™attaque Asma Kerbiche, Saoussen Ben Jabra, Ezzeddine Zagrouba, Axel Carlier, Vincent Charvillat L’Ã©valuation d’une technique de tatouage a Ã©tÃ© toujours une Ã©tape critique et importante. En effet, l’Ã©volution progressive des outils de traitement et de communication de vidÃ©os a fait naÃ®tre de nombreuses et diffÃ©rentes techniques de tatouage dont l’efficacitÃ© varie d’un algorithme Ã un autre. Cette efficacitÃ© est toujours Ã©valuÃ©e en se basant sur plusieurs contraintes dont les plus importantes sont l’invisibilitÃ© et la robustesse face aux attaques. Cette derniÃ¨re est souvent Ã©valuÃ©e en testant des attaques classiques et simples telles que la compression, la rotation, la translation et l’ajout de bruit. Des techniques simples de tatouage peuvent rÃ©sister Ã des attaques simples sans pour autant Ãªtre robustes aux attaques observÃ©es dans le monde rÃ©el comme le "Camcording" d’un contenu vidÃ©o. En situation rÃ©elle, un utilisateur mal intentionnÃ© (ou un pirate) va filmer illÃ©galement un contenu projetÃ©, recadrer l’image, transcoder le contenu obtenu. La question que nous nous posons est l’Ã©valuation de mÃ©thodes de tatouage dans ce type de contexte. Dans le cadre de l’Ã©laboration d’un nouveau protocole d’Ã©valuation de techniques de tatouage vidÃ©o, nous proposons, dans ce papier, un jeu d’attaques de vidÃ©os tatouÃ©es mis Ã disposition d’un ensemble d’utilisateurs qui vont interagir afin de dÃ©truire la marque qui a Ã©tÃ© insÃ©rÃ©e. Ceci sera rÃ©alisÃ© en leur fournissant une liste d’attaques qu’ils peuvent librement appliquer et combiner Ã ces vidÃ©os tatouÃ©es. Cette liste va comprendre les attaques les plus importantes et rÃ©elles que peut subir une vidÃ©o telles que le camcording, la dÃ©formation, l’ajout de couleur et la compression. Ce jeu nous a permis non seulement d’Ã©valuer n’importe quel algorithme de tatouage vidÃ©o, mais surtout, d’identifier, Ã partir de l’Ã©tude de choix des utilisateurs les attaques les plus importantes pour eux. tatouage, vidÃ©o, crowdsourcing, camcording, attaques, jeu…
	SchÃ©ma conjoint de Tatouage et Compression des LDI(s) gÃ©nÃ©rÃ©es Ã partir dâ€™images issues des flux auto-stÃ©rÃ©oscopiques Najia KHELFI nÃ©e TRACHE, Zoubir AHMED-FOITIH, Laurent LUCAS Dans cet article est prÃ©sentÃ© un schÃ©ma conjoint de tatouage et compression des LDI(s) (Layer Depht Image), gÃ©nÃ©rÃ©es Ã partir dâ€™un jeu dâ€™images multi-vues, issues de 08 camÃ©ras placÃ©es dâ€™une faÃ§on appropriÃ©e. Chaque couche Â« layer Â» correspond Ã une vue et contient les informations qui ne sont pas contenues dans les autres couches. Aussi, les couches de profondeur sur lesquelles nos travaux se basent contiennent uniquement des informations non redondantes (ou rÃ©siduelles). Elles ont Ã©tÃ© extraites Ã partir de n vues dâ€™entrÃ©e et de leur carte de disparitÃ© et correspondent gÃ©nÃ©ralement, Ã des zones occultÃ©es. Toutes les informations qui peuvent Ãªtre dÃ©duites Ã partir d’autres donnÃ©es sont supprimÃ©es. Nous les appelons informations redondantes. Au contraire, les informations rÃ©siduelles sont les informations conservÃ©es. Ces derniÃ¨res correspondent gÃ©nÃ©ralement Ã des zones occultÃ©es. Les pixels occlus, qui sont susceptibles dâ€™Ãªtre visualisÃ©s Ã partir dâ€™autres angles de vue se voient confÃ©rer une plus forte protection contre les erreurs de transmission ou de compression. Aussi, nous cherchons donc Ã effectuer lâ€™insertion dâ€™une marque dans un ensemble de LDI(s) pendant la phase de quantification et de compression Ã lâ€™aide dâ€™une mÃ©thode qui devrait tenir compte de ces pixels occlus (ou rÃ©siduels) localisÃ©s dans des zones dispersÃ©es de chaque layer. Notre approche de tatouage joint Ã la compression est basÃ©e sur la quantification vectorielle algÃ©brique Ã zone morte (QVAZM). Cette technique permet dâ€™effectuer conjointement compression et tatouage Ã lâ€™aide de la QVAZM en rÃ©alisant simultanÃ©ment la quantification et lâ€™insertion de la marque durant la compression Images auto-stÃ©rÃ©oscopiques, Cartes de profondeur, Layer Depth Image, SÃ©curitÃ©, Tatouage numÃ©rique, Quantification vectorielle Ã zone morte, Compression

16:00-17:40 – Session C3 – ExposÃ© invitÃ© / posters

		VidÃ©o 3D â€“ technologies existantes et Ã©mergente
		FrÃ©dÃ©ric Dufaux
		Squelette Euclidien Discret ConnectÃ© (DECS) rÃ©sistant au bruit pour l'appariement de formes basÃ© graphes AurÃ©lie Leborgne, Julien Mille, Laure Tougne Le squelette est un descripteur de formes important qui fournit une reprÃ©sentation compacte de la forme Ã©tudiÃ©e pouvant Ãªtre utilisÃ©e en reconnaissance d’objets rÃ©els. NÃ©anmoins, du fait de la discrÃ©tisation, les propriÃ©tÃ©s requises pour construire un graphe (finesse, robustesse au bruit, homotopie, donc par consÃ©quent connexitÃ©) peuvent Ãªtre difficiles Ã obtenir simultanÃ©ment. La squelettisation proposÃ©e, basÃ©e sur la carte de distance, a toutes ces propriÃ©tÃ©s. Plus prÃ©cisÃ©ment, l’algorithme extrait les centres des boules maximales de la forme ainsi que les crÃªtes de la carte de distance pour les combiner de maniÃ¨re intelligente. Un post-traitement est utilisÃ© pour amincir et Ã©laguer le squelette. Ces diffÃ©rentes Ã©tapes se font en temps linÃ©aire. Le squelette ainsi obtenu a Ã©tÃ© comparÃ© Ã d’autres squelettes de la littÃ©rature et nous avons mis en Ã©vidence ses Â« bonnes Â» propriÃ©tÃ©s pour l’appariement de graphes. Carte de Distance Euclidienne, boules maximales, squelette, dÃ©tection de points de crÃªtes, rÃ©sistance au bruit.
		Comparaison de la segmentation pixel et segmentation objet pour la dÃ©tection dâ€™objets multiples et variables dans des images JÃ©rÃ´me Pasquet, Marc Chaumont, GÃ©rard Subsol Cet article Ã©tudie et compare deux mÃ©thodes de segmentation. La premiÃ¨re est la segmentation par objet oÃ¹ l’on cherche Ã dÃ©tecter des fenÃªtres Ã partir d’un modÃ¨le. La seconde est la segmentation pixel, oÃ¹ l’on cherche Ã dÃ©terminer Ã quelle classe appartient chaque pixel. De plus, nous proposons une extension au modÃ¨le classique de dÃ©tection par cascade de HOG en utilisant les sacs de mots visuels. Des expÃ©rimentations sur des jeux de donnÃ©es rÃ©elles permettront la comparaison et mettront en avant un gain de performance non nÃ©gligeable de notre mÃ©thode. Segmentation d’images, dÃ©tection d’objets, sac de mots visuels, HOG
		Intra Residual Prediction in HEVC Bihong Huang, Christine Guillemot, FÃ©lix Henry, Philippe Salembier, Gordon Clare The main goal of this paper is to exploit correlations that may remain in the residual block, after the intra prediction in HEVC. We first show that correlation remains, leading to some high-energy prediction residuals, which we try to remove by exploiting both local and non-local similarity. We propose two strategies to reduce the remaining redundancy in the residual prediction domain: an Intra Residual Prediction (IRP) by template matching, and a Vector Quantization (VQ) of the intra residual. HEVC, video coding, residual prediction, template matching, vector quantization
		Vers une reconnaissance d'Ã©tat affectif Ã base de mouvements du haut du corps et du visage Benjamin Allaert, Ioan Marius Bilasco, Adel Lablack L’Ã©motion est une rÃ©action complexe qui engage Ã la fois le corps et l’esprit. Elle peut Ãªtre dÃ©finie comme Ã©tant une rÃ©action affective transitoire d’assez grande intensitÃ© provoquÃ©e par une stimulation venue de l’environnement. L’analyse des expressions corporelles a un rÃ´le important dans le processus de reconnaissance de l’Ã©tat affectif. Pour cela, nous proposons une approche de reconnaissance Ã©motionnelle combinant deux canaux : le visage et le corps. Notre contribution s’appuie sur l’analyse du mouvement au sein du visage et du haut du corps qui sont synthÃ©tisÃ©s par des modÃ¨les de direction et de magnitude construit Ã partir des flux optiques. Ces modÃ¨les permettent de s’abstraire des bruits de dÃ©tection Ã l’aide de l’extraction des caractÃ©ristiques principales des mouvements et constituent une base stable pour identifier les Ã©volutions de l’Ã©tat Ã©motionnel et plus particuliÃ¨rement de la valence et de l’arousal. Les modalitÃ©s sont analysÃ©es individuellement et sont fusionnÃ©es dans un deuxiÃ¨me temps afin d’Ã©tudier l’apport informationnel issu de l’Ã©tude du mouvement de la personne dans sa globalitÃ©. L’approche proposÃ©e a ensuite Ã©tÃ© validÃ©e avec succÃ¨s sur un sous-ensemble de la base de donnÃ©es SEMAINE. Reconnaissance d’Ã©motions, analyse gestuelle, analyse du mouvement, analyse du visage
		CaractÃ©risation locale des changements de texture pour la reconnaissance dâ€™expressions faciales spontanÃ©es Walid Adaidi, Adel Lablack, Ioan Marius Bilasco La reconnaissance des Ã©motions et des expressions faciales est un challenge intÃ©ressant. Dans cet article, une approche permettant la reconnaissance d’expressions faciales spontanÃ©es grÃ¢ce une reprÃ©sentation appropriÃ©e des traits du visage sur des flux vidÃ©os et des images statiques est proposÃ©e. Une mesure sensible aux changements dans les traits du visage est utilisÃ©e dans des rÃ©gions d’intÃ©rÃªt identifiÃ©es pour dÃ©tecter la prÃ©sence de chaque Ã©motion. L’expÃ©rimentation a Ã©tÃ© rÃ©alisÃ©e sur un ensemble de donnÃ©es standard composÃ©es de vidÃ©os et d’images statiques et a montrÃ© des rÃ©sultats prometteurs. Reconnaissance d’expressions faciales spontanÃ©es, approche locale, rÃ©gions d’intÃ©rÃªt
		Design, Implementation and Simulation of a Cloud Computing System for Enhancing Real-time Video Services by using VANET and Onboard Navigation Systems Karim Hammoudi, Nabil Ajam, Mohamed Kasraoui, Fadi Dornaika, Karan Radhakrishnan, Karthik Bandi, Qing Cai, Sai Liu In this paper, we propose a design for novel and experimental cloud computing systems. The proposed system aims at enhancing computational, communicational and annalistic capabilities of road navigation services by merging several independent technologies, namely vision-based embedded navigation systems, prominent cloud computing systems and Vehicular Ad-hoc NETwork (VANET). This work presents our initial investigations by describing the design of a global generic system. The designed system has been experimented with various scenarios of video-based road services. Moreover, the associated architecture has been implemented on a small scale car prototype. The implemented architecture has been experimented in the case of a simulated road service to aid the police agency. The goal of this service is to recognize and track searched individuals and vehicles in a realtime monitoring system remotely connected to moving cars. The presented work demonstrates the potential of our system for efficiently enhancing and diversifying real-time video services in road environments. Vehicular Network (VANET), Vehicular Cloud Computing (VCC), Image-based Recognition, Fusion of Multi-source Imagery, Real-time Video Services, Cooperative Monitoring System

Jeudi 27 novembre

9:00-11:00 – Session C4 – 3D

	Vers un schÃ©ma temps rÃ©el de compression multi-vues sans perte Benjamin BATTIN, Julien LEHURAUX, Philippe VAUTROT, Laurent LUCAS Ce papier sâ€™intÃ©resse au problÃ¨me de la compression multi-vues en environnements virtualisÃ©s. Nous prÃ©sentons notamment un nouveau schÃ©ma de compression multi-vues sans perte basÃ© sur l’algorithme LOCO-I. Notre algorithme exploite la double redondance (spatiale et temporelle) spÃ©cifique Ã ce type de mÃ©dia en adaptant les Ã©tapes de prÃ©diction et de modÃ©lisation de contexte Ã la matrice d’images. Les premiers tests effectuÃ©s avec notre approche montrent que celle-ci propose de bons ratios de compression pour une complexitÃ© algorithmique moindre vis-Ã -vis des mÃ©thodes de l’Ã©tat de l’art. Multi-vues, auto-stÃ©rÃ©oscopie, 3DTV, compression 3D, compression sans perte
	MÃ©thode dâ€™optimisation pour lâ€™appariement de pixels dâ€™images stÃ©rÃ©oscopiques basÃ©e sur une mÃ©trique conjointe entropie-distorsion Aysha Kadaikar, Anissa Mokraoui, Gabriel Dauphin Cet article sâ€™intÃ©resse au problÃ¨me de la mise en correspondance de pixels dâ€™images stÃ©rÃ©oscopiques pour estimer la meilleure carte de disparitÃ© au sens du critÃ¨re entropie-distorsion. Dans la majoritÃ© des cas, les correspondants sont choisis au sens de la minimisation de lâ€™erreur quadratique moyenne retenue comme critÃ¨re de distorsion. Cependant pour lâ€™appariement dâ€™un mÃªme pixel, il est possible que plusieurs disparitÃ©s soient candidates puisquâ€™elles rÃ©pondent uniquement au critÃ¨re de distorsion minimale. En revanche le choix adoptÃ© pourrait ne pas Ãªtre en adÃ©quation avec la rÃ©duction du coÃ»t de codage. Pour y remÃ©dier, cet article propose une approche dâ€™optimisation oÃ¹ la mÃ©trique habituelle est remplacÃ©e par une mÃ©trique entropie-distorsion de faÃ§on Ã ce que les disparitÃ©s sÃ©lectionnÃ©es rÃ©duisent non seulement la distorsion de lâ€™image reconstruite mais Ã©galement lâ€™entropie associÃ©e Ã la carte de disparitÃ©. Lâ€™estimation de la carte de disparitÃ© sâ€™appuie sur la construction sÃ©quentielle dâ€™un arbre afin dâ€™Ã©viter une recherche exhaustive tout en assurant de bonnes performances en termes dâ€™entropie-distorsion. A une profondeur donnÃ©e dans lâ€™arbre, les M meilleurs chemins retenus selon le critÃ¨re entropie-distorsion sont ensuite prolongÃ©s pour construire de nouveaux chemins. Ces chemins sont triÃ©s selon la mÃ©trique entropie-distorsion pour nâ€™en retenir que les M meilleurs. Le processus est itÃ©rÃ© jusquâ€™Ã la lecture du dernier pixel Ã apparier. Les rÃ©sultats de simulation montrent que notre algorithme fournit de meilleurs rÃ©sultats en termes dâ€™entropie-distorsion comparÃ© Ã la programmation dynamique. Image stÃ©rÃ©oscopique, image 3D, mise en correspondance, algorithme Ã M-chemins, optimisation, entropie, distorsion.
	Compression de contenu vidÃ©o Super Multi-Vue avec parallaxe horizontale et verticale Antoine Dricot, JoÃ«l Jung, Marco Cagnazzo, BÃ©atrice Pesquet-Popescu, FrÃ©dÃ©ric Dufaux La vidÃ©o Super Multi-Vue (SMV) est une technologie clÃ© pour mettre en place les futurs services de vidÃ©o 3D. Le SMV permet une visualisation sans lunette et Ã©limine beaucoup des causes dâ€™inconfort prÃ©sentes dans les technologies de vidÃ©o 3D actuelles. Le contenu vidÃ©o SMV est composÃ© de dizaines ou de centaines de vues dâ€™une scÃ¨ne, qui peuvent Ãªtre alignÃ©es soit uniquement dans la direction horizontale, soit dans les directions horizontale et verticale. Cet article compare plusieurs schÃ©mas de codage, puis propose une structure de codage qui exploite les corrÃ©lations inter-vues dans les deux directions, permettant de rÃ©duire le dÃ©bit (pour une qualitÃ© donnÃ©e) de 29.1% par rapport Ã une structure de rÃ©fÃ©rence basique. De plus, une amÃ©lioration des outils de codage Neighboring Block Disparity Vector (NBDV) et Inter-View Motion Prediction (IVMP) est proposÃ©e afin dâ€™exploiter efficacement les structures de codage en deux dimensions, avec une rÃ©duction de dÃ©bit allant jusquâ€™Ã 4.2% par rapport Ã lâ€™encodeur rÃ©fÃ©rence 3D-HEVC. Compression vidÃ©o 3D, multi-vue, parallaxe de mouvement
	Transformation d'un dispositif multimÃ©dia webcam-Ã©cran en un scanner 3D Yvain QuÃ©au, Richard Modrzejewski , Pierre Gurdjos, Jean-Denis Durou Nous Ã©tudions un dispositif de scannage 3D constituÃ© d’un couple webcam-Ã©cran, oÃ¹ l’Ã©cran est utilisÃ© comme source lumineuse. Ceci permet de transformer en scanner 3D n’importe quel dispositif multimÃ©dia comprenant ces deux Ã©lÃ©ments (ordinateurs portables, smartphones, tablettes etc.). Un protocole d’Ã©talonnage simplifiÃ© est introduit, pour lequel nous dÃ©montrons que deux prises de vue sont suffisantes. Une fois cet Ã©talonnage gÃ©omÃ©trique effectuÃ©, nous montrons que le dispositif Ã©tudiÃ© permet d’effectuer la reconstruction 3D sans ambiguÃ¯tÃ©, grÃ¢ce Ã la technique de stÃ©rÃ©ophotomÃ©trie. Ã©talonnage, webcam, Ã©cran LCD, reconstruc- on 3D, stÃ©rÃ©ophotomÃ©trie
	Reconstruction semi-rÃ©guliÃ¨re de surfaces par stÃ©rÃ©oscopie Jean-Luc Peyrot, FrÃ©dÃ©ric Payan, Marc Antonini Notre objectif consiste Ã inclure dans les systÃ¨mes stÃ©rÃ©oscopiques un remailleur semi-rÃ©gulier qui est capable de gÃ©nÃ©rer une maille semi-rÃ©guliÃ¨re uniquement Ã partir des images stÃ©rÃ©oscopiques, au contraire des systÃ¨mes actuels qui gÃ©nÃ¨rent seulement des nuages de points. Notre mÃ©thode de reconstruction est basÃ©e sur une approche coarse-to-fine, et crÃ©Ã© directement Ã partir des images stÃ©rÃ©oscopiques une maille semi-rÃ©guliÃ¨re multi-rÃ©solution. De plus, pour tenir compte des contraintes temps-rÃ©el des systÃ¨mes d’acquisition, cette construction semi-rÃ©guliÃ¨re est parallÃ©lisÃ©e sur GPU. Les rÃ©sultats expÃ©rimentaux montrent l’efficacitÃ© de notre mÃ©thode sur divers types de surfaces. Maillage semi-rÃ©gulier, multi-rÃ©solution, stÃ©rÃ©oscopie, GPU

14:00-15:40 – Session C5 – Visage / mouvement humain / suivi

	DÃ©tection des yeux, du nez et de la bouche par filtres de Haar adaptatifs Nam Jun Pyun, Mathieu Marmouget, Nicole Vincent Lâ€™extraction des yeux, du nez et de la bouche du visage humain sont des tÃ¢ches largement Ã©tudiÃ©es dans le domaine de la reconnaissance de formes. Localiser ces rÃ©gions anatomiques pertinentes du visage est souvent la premiÃ¨re Ã©tape de nombreuses approches de la vision par ordinateur, comme la segmentation, la reconnaissance ou lâ€™identification de personne, la reconnaissance de lâ€™expression ou de lâ€™Ã©motion du visage, la localisation de points dâ€™intÃ©rÃªts, lâ€™estimation de pose ou encore le suivi du visage. La tÃ©lÃ©surveillance, lâ€™indexation automatique ou semi-automatique dâ€™images ou de vidÃ©os, la robotique sont autant de domaines applicatifs. Dans cet article, nous proposons une mÃ©thode basÃ©e sur lâ€™analyse des lignes horizontales. Elles sont extraites dâ€™une carte dâ€™Ã©nergie calculÃ©e sur des filtres de Haar adaptatifs. Lâ€™introduction de connaissances, notamment sur les positions des diffÃ©rentes rÃ©gions anatomiques pertinentes, ainsi que sur leurs relations spatiales nous permet de les sÃ©parer. Une des difficultÃ©s majeures de la dÃ©tection des Ã©lÃ©ments anatomiques pertinents du visage rÃ©side dans la variabilitÃ© de lâ€™illumination dâ€™un visage Ã lâ€™autre, mais aussi des conditions dâ€™illumination inÃ©gale sur un visage donnÃ©. Afin de rendre la mÃ©thode robuste Ã ces variations dâ€™illumination, nous proposons une analyse multi-seuils capable de choisir, pour chaque rÃ©gion anatomique, un seuil adÃ©quat sur la carte dâ€™Ã©nergie horizontale. Notre approche est testÃ©e sur la base BioID et Color FERET et montre des rÃ©sultats prometteurs. OEil, yeux, nez, bouche, Haar, carte dâ€™Ã©nergie, analyse multi-seuils, relations spatiales, connaissance
	Reconnaissance d'actions humaines 3D par l'analyse de forme des trajectoires de mouvement. Maxime Devanne, Hazem Wannous, Stefano Berretti, Pietro Pala, Mohamed Daoudi, Alberto Del Bimbo La reconnaissance d’actions humaines dans des sÃ©quences vidÃ©o 3D est un problÃ¨me important, actuellement au cÅ“ur de nombreux domaines de recherche comme la vidÃ©o surveillance, les interfaces Homme-Machine et la rÃ©Ã©ducation. Le dÃ©veloppement d’algorithmes de reconnaissance d’actions prÃ©cis et efficaces est une tÃ¢che difficile Ã cause des fortes variabilitÃ©s des formes humaines, des vÃªtements et du mouvement. Dans ce papier, nous proposons un nouvel outil permettant de reprÃ©senter de maniÃ¨re compacte, de comparer et de reconnaÃ®tre des actions humaines capturÃ©es Ã partir de camÃ©ras de profondeur. Dans un premier temps, les coordonnÃ©es 3D de chaque articulation du squelette humain sont considÃ©rÃ©es comme une chaÃ®ne de mouvement. L’Ã©volution spatiale et temporelle de ce vecteur caractÃ©ristique est ensuite reprÃ©sentÃ©e par une trajectoire dans l’espace des actions. GrÃ¢ce Ã cette reprÃ©sentation basÃ©e sur les articulations 3D, nous sommes capable de capturer simultanÃ©ment aussi bien l’apparence gÃ©omÃ©trique du corps humain que sa dynamique au cours du temps. Le problÃ¨me de reconnaissance d’actions est ensuite formulÃ© comme un problÃ¨me de recherche de similaritÃ©s entre la forme des trajectoires dans une variÃ©tÃ© riemannienne. La classification par l’algorithme des k-plus-proches-voisins est ensuite effectuÃ©e sur la variÃ©tÃ© pour bÃ©nÃ©ficier de la gÃ©omÃ©trie riemannienne dans l’espace des formes. Notre mÃ©thode est Ã©valuÃ©e sur deux bases de donnÃ©es publiques. En comparaison avec les mÃ©thodes existantes dans l’Ã©tat de l’art, les rÃ©sultats obtenus montrent l’efficacitÃ© de l’approche proposÃ©e avec un taux supÃ©rieur Ã 91% sur les deux bases de donnÃ©es. Reconnaissance d’actions 3D, modÃ©lisation temporelle, espace des formes, variÃ©tÃ© riemannienne.
	Un systÃ¨me de suivi multi-objets utilisant une stratÃ©gie d'association en trois passes adaptÃ© Ã la vidÃ©osurveillance Matthieu Rogez, Lionel Robinault, Laure Tougne Le suivi multi-objets est une des thÃ©matiques centrales de l’analyse vidÃ©o du fait de son large champ d’application. Nous nous intÃ©ressons ici plus particuliÃ¨rement aux applications en vidÃ©o-surveillance. Ainsi, nous dÃ©crivons un ensemble d’amÃ©liorations destinÃ©es Ã l’algorithme de suivi multi-objets proposÃ© par R. Di Lascio et al. En particulier, nous gÃ©nÃ©ralisons le suivi en retirant la spÃ©cialisation faite pour les piÃ©tons; nous intÃ©grons le modÃ¨le de scÃ¨ne et de visualisation dÃ©veloppÃ© par Rogez et al. afin de permettre un raisonnement tridimensionnel permettant de mieux gÃ©rer les occultations; et enfin nous amÃ©liorons le mÃ©canisme de formation et destruction des groupes d’objets grÃ¢ce Ã l’introduction d’une passe d’association supplÃ©mentaire ainsi que d’un critÃ¨re de similaritÃ© de recouvrement. Enfin, nous Ã©valuons le systÃ¨me proposÃ© sur des vidÃ©os synthÃ©tiques et rÃ©elles afin de montrer l’apport de nos modifications. L’algorithme proposÃ© amÃ©liore sensiblement les performances gÃ©nÃ©rales par rapport Ã la version originale, notamment pour la crÃ©ation et destruction des groupes, et ouvre la possibilitÃ© d’un raisonnement tridimensionnel. Suivi multi-objets, vidÃ©o-surveillance, groupes, automate fini