Atelier TAL et Humanités Numériques - TALN 2022

27 juin 2022 (à Avignon)

Présentation de l'atelier

Dans le cadre du travail mené avec l’action de recherche Humanités Numériques Spatialisées soutenu par le GdR CNRS MAGIS, nous proposons un atelier associé à la conférence TALN | RECITAL 2022 sur le thème du TAL et des Humanités Numériques.
Cette première édition de l'atelier TAL&HN aura lieu le 27 juin 2022 sur le campus Hannah Arendt d’Avignon Université (74 rue Louis Pasteur, 84029 Avignon).
Cet atelier fait suite à une série d'évènements organisés par notre action de recherche tel que l’atelier Humanités Numériques Spatialisés associé à la conférence SAGEO 2021 et la série d’ateliers Geospatial Humanities associés à la conférence internationale ACM SIGSPATIAL.
Les actes de l'atelier sont disponibles en ligne dans les archives de l'ATALA et sur HAL : http://talnarchives.atala.org/ateliers/2022/TALHN/index.html

Programme

9h00 - 9h15 -- Introduction

Voir les slides

9h20 - 10h30 -- Session : Etude du genre

Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS.

Marco Naguib, Marine Delaborde, Blandine Andrault, Anaïs Bekolo et Olga Seminck

Exploration orientée entités : étude du genre dans le Mercure de France.

Yoann Dupont et Marguerite Bordry

Flux d'informations dans les systèmes encodeur-décodeur. Application à l'explication des biais de genre dans les systèmes de traduction automatique.

Lichao Zhu, Guillaume Wisniewski, Nicolas Ballier et François Yvon

10h-30 - 11h -- Pause café

11h00 - 12h10 -- Session : Reconnaissance automatique et erreurs OCR

Reconnaissance d'entités nommées sur des sorties OCR bruitées : des pistes pour la désambiguïsation morphologique automatique.

Caroline Koudoro-Parfait, Gaël Lejeune et Richy Buth

Simulation d’erreurs d’OCR dans les systèmes de TAL pour le traitement de données anachroniques.

Baptiste Blouin, Benoit Favre et Jeremy Auguste

Reconnaissance automatique des appellations d’œuvres visuelles antiques.

Aurore Lessieux, Iris Eshkol-Taravella, Anne-Violaine Szabados et Marlène Nazarian

12h-30 - 14h00 -- Déjeuner

14h00 - 15h30 -- Session : Corpus, TEI, et analyse de discours

LDApol: vers une méthodologie de contextualisation des discours politiques.

Jeanne Vermeirsche, Eric Sanjuan et Tania Jiménez

La Chine de Buffon : édition numérique et exploration sémantique de l’Histoire naturelle (1749-1789).

Axel Le Roy, Motasem Alrahabi et Glenn Roe


Réinterroger l'édition numérique et la consultation d'oeuvres anciennes : traçabilité, accessibilité, interprétabilité.

Emmanuel Giguet et Julia Roger

TAL et Littérature comparée. Détection automatique des correspondances textuelles entre les réécritures d'un mythe.

Karolina Suchecka et Nathalie Gasiglia