ETeRNAL 2 – 8 juin 2020
Les liens pour assister aux sessions d’échanges sont communiqués dans les posts d’informations pratiques sur le Blog des participants.
L’atelier Ethique et TRaitemeNt Automatique des Langues (ETeRNAL) 2 fait suite à un premier atelier sur le sujet, ETeRNAL, qui a eu lieu à TALN en 2015. Cet atelier avait été un succès et avait permis la création du groupe éthique et TAL et du blog du même nom (http://www.ethique-et-tal.org/).
Programme 8 juin 2020
- 8h40 ouverture des serveurs, café, thé et viennoiseries à domicile
- 9h00 Présentation de la journée
- 9h15 questions aux auteurs des articles (30 minutes par article, problèmes techniques inclus)
-
-
- 9h15 – Mahault Garnerin, Solange Rossato and Laurent Besacier – Pratiques d’évaluation en ASR et biais de performance
- 9h45 Adam Lion-Bouton, Loïc Grobol, Jean-Yves Antoine, Sylvie Billot and Anaïs Lefeuvre-Halftermeyer – Comment arpenter sans mètre : les scores de résolution de chaînes de coréférences sont-ils des métriques ?
- 10h15 Adrien Barbaresi and Gaël Lejeune – Que recèlent les données textuelles issues du web ?
-
- 10h45 Café collectif et à distance
-
- 11h00 Alice Millour, Karën Fort and Pierre Magistry – Répliquer et étendre pour l’alsacien “Étiquetage en parties du discours de langues peu dotées par spécialisation des plongements lexicaux »
- 11h 30 Jean-Francois Bonastre – 1990-2020 : retours sur 30 ans d’échanges autour de l’identification de voix en milieu judiciaire
-
- 14h00 Diffusion de la conférence invité de Dirk Hovy avec TALN,
- 15h00 Questions en direct avec Dirk Hovy
- 16h00 Expérience collective sur les Biais – Aurélie Névéol
- 16h45 Clôture de la journée
ETeRNAL 2 se veut un espace de réflexion ouvert et interactif sur l’éthique au sens le plus large, un temps de prise de recul sur nos activités et notre domaine. Il comprendra après les présentations, un temps de discussion (par exemple, une table ronde) permettant à tous les chercheurs présents de s’exprimer sur les thèmes abordés, notamment (mais non exclusivement) :
-
- données sensibles
- myriadisation (crowdsourcing) et éthique
- questions éthiques autour de l’utilisation des outils ou du résultat des traitement
- qualité et biais de l’évaluation
- aspects juridiques, économiques
- TAL pour l’éthique
Pour cette édition, ETeRNAL 2 reçoit Dirk Hovy pour une présentation invitée intitulée Layers, Biases, and Responsibility. Dirk Hovy est associate professor d’informatique à l’Université Bocconi à Milan. Il travaille sur les liens entre langue, société et apprentissage automatique. C’est en particulier un spécialiste des questions d’éthique pour le traitement automatique des langues et de la parole. Dans son exposé, il reviendra sur l’influence prise par les systèmes automatiques depuis l’utilisation massive des réseaux de neurones. Cette présentation est partagée avec TALN.
Tout sur la conférence invitée
Par ailleurs, Aurélie Névéol propose une expérience collective sur les biais implicites y compris au sein de la communauté scientifique. Les biais implicites ont une influence majeure sur la prise de décision, y compris dans nos fonctions professionnelles. L’expérience demandera aux participants de réaliser une expérience en ligne et d’en partager les résultats. L’expérience se conclura par une analyse de l’ensemble des résultats.
Tout sur l’expérience collective
Enfin, ETeRNAL 2 accueille 5 articles. Deux d’entre eux s’intéressent à la notion de biais et comment les identifier. Les trois autres ouvrent sur des problématiques moins directes pour notre champ disciplinaire soit parce que nos pratiques sont peu développées dans ce sens, par exemple avec la réplication d’expériences, soit parce que les questions sont émergentes, comme l’article sur les contenus que l’on retrouve sur le web. Le dernier article donne une perspective historique à une question primordiale qui est l’utilisation des résultats de la reconnaissance de la parole dans le monde judiciaire.
- Mahault Garnerin, Solange Rossato and Laurent Besacier – Pratiques d’évaluation en ASR et biais de performance
- Adam Lion-Bouton, Loïc Grobol, Jean-Yves Antoine, Sylvie Billot and Anaïs Lefeuvre-Halftermeyer – Comment arpenter sans mètre : les scores de résolution de chaînes de coréférences sont-ils des métriques ?
- Adrien Barbaresi and Gaël Lejeune – Que recèlent les données textuelles issues du web ?
- Alice Millour, Karën Fort and Pierre Magistry – Répliquer et étendre pour l’alsacien “Étiquetage en parties du discours de langues peu dotées par spécialisation des plongements lexicaux »
- Jean-Francois Bonastre – 1990-2020 : retours sur 30 ans d’échanges autour de l’identification de voix en milieu judiciaire
Organisateurs :
- Maxime Amblard, Université de Lorraine / LORIA
- Karën Fort, Sorbonne Université / STIH et LORIA
- Gilles Adda, LIMSI-CNRS
Mail de contact :
maxime.amblard@loria.fr, karen.fort@loria.fr, gadda@limsi.fr
Site Web :