Un prototype en ligne pour la prédiction du niveau de compétence en anglais des productions écrites
Thomas Gaillat, Nicolas Ballier, Annanda Sousa, Manon Bouyé, Andrew Simpkin, Bernardo Stearns and Manel Zarrouk
Un prototype pour la prédiction en ligne des niveaux de compétence en anglais des productionsécrites.Cet article décrit un prototype axé sur la prédiction du niveau de compétence des apprenantsd’anglais. Le système repose sur un modèle d’apprentissage supervisé couplé à une interface web pourles utilisateurs. L’entraînement des modèles a été conduit sur plus de 3 millions de mots du corpusd’apprenant EFCAMDAT. L’évaluation du système a montré une précision de 82%. Le système estbasé sur la technologie Docker, ce qui permet un déploiement facile.
SkiF Maker : un processus de classement du meilleur talent par rapport à une offre de mission
SkiF Maker : un processus de classement du meilleur talent par rapport à une offre de mission
Jihen Karoui, Kamilia Hafid and Stéphane Pezeril
SkiF Maker présente une solution innovatrice pour toute entreprise de services numériques (ESN) visant à améliorer son processus de recrutement de talents, la gestion des compétences de ses ressources humaines et la satisfaction des besoins de ses clients. Cet outil offre aux ESN un gain considérable en terme de temps de travail et leur évite un travail manuel souvent laborieux et non plaisant.
Bien choisir son outil d’extraction de contenu à partir du Web
Bien choisir son outil d’extraction de contenu à partir du Web
Gaël Lejeune and Adrien Barbaresi
Nous proposons une démonstration sur l’extraction de contenu textuel dans des pages web ainsi que son évaluation. Nous nous concentrons sur les pages web contenant du texte (articles de presse, magazines en ligne et blogs). Nous montrons que les textes peuvent varier grandement selon différentes dimensions : diachronique, géographique et typologique. Dès lors, les outils et mesures d’évaluation correspondantes sont sujettes à caution : les indicateurs communément utilisés et censés présider au choix de l’outil approprié par les utilisateurs finaux sont à la fois imprécis et difficiles à interpréter.
Vers un corpus optimal pour la fouille de textes : stratégie de constitution de corpus spécialisés à partir d’ISTEX
Vers un corpus optimal pour la fouille de textes : stratégie de constitution de corpus spécialisés à partir d’ISTEX
Camille de Salabert and Sabine Barreaux
Préalable indispensable à de nombreuses activités de TAL et de fouille de textes, l’élaboration d’un corpus peut nécessiter plusieurs phases de traitement pour améliorer sa qualité et ainsi obtenir les meilleurs résultats d’analyse automatique. Les post-traitements appliqués à un tel corpus, notamment pour garantir la pertinence de son contenu et l’homogénéité de son format, pourront s’avérer d’autant plus coûteux et fastidieux que la construction du corpus de travail aura été imprécise. Cette démonstration se proposera de tirer parti de la plateforme ISTEX et de ses services associés pour constituer, au travers d’un cycle itératif, un corpus homogène de publications scientifiquement pertinentes pour une utilisation simplifiée par des outils de fouille.
Générateur de dictionnaires au format Android pour les langues peu dotées
Générateur de dictionnaires au format Android pour les langues peu dotées
Rémy Bonnet and Guillaume Segerer
Nous présentons un outil informatique en source libre permettant, à partir d’un dictionnaire sous format électronique de générer une application Android. L’objectif est de tirer profit de l’augmentation spectaculaire des utilisateurs de mobiles multifonctions dans de nombreuses régions du monde, notamment en Afrique, pour permettre aux locuteurs de langues moins dotées de bénéficier de dictionnaires de bonne qualité, faciles à utiliser et de s’impliquer dans la collecte de données. Cet outil a été conçu dans un souci de compatibilité avec les principaux formats lexicographiques.
Démo de AMALD-serveur et AMALD-corpus, dédiés à l’analyse morphologique de l’allemand
Démo de AMALD-serveur et AMALD-corpus, dédiés à l’analyse morphologique de l’allemand
Christian Boitet, Vincent Berment, Jean-Philippe Guilbaud and Claire Lemaire
Le projet AMALDarium vise à offrir sur la plate-forme lingwarium.org (1) un service d’analyse morphologique de l’allemand (AMALD-serveur), à grande couverture et de grande qualité, traitant la flexion, la dérivation et la composition, ainsi que les verbes à particule séparable agglutinée (ou séparée), (2) un corpus de référence de haute qualité donnant tous les résultats possibles de l’analyse morphologique, avant filtrage par une analyse fréquentielle ou syntaxique, et (3) une plateforme (AMALD-éval) permettant d’organiser des évaluations comparatives, dans la perspective d’améliorer les performances d’algorithmes d’apprentissage en morphologie. Nous présentons une démonstration en ligne de AMALD-serveur et AMALD-corpus. Le corpus est un sous-ensemble anonymisé et vérifié d’un corpus en allemand formé de textes sur le cancer du sein, contenant de nombreux mots composés techniques.
LEX : un jeu avec finalité d’acquisition de ressources lexicales
LEX : un jeu avec finalité d’acquisition de ressources lexicales
Asheesh Gulati
LEX est un jeu avec un but développé dans l’optique d’explorer plus avant les éléments et principes de la conception de jeux tels qu’ils sont pratiqués dans l’industrie vidéoludique, pour les mettre au service de la conception de jeux sérieux. Le premier prototype repose sur un mode bac à sable pour faire appel à la créativité du joueur et renforcer l’immersion ludique.
Projet AMIS : résumé et traduction automatique de vidéos
Projet AMIS : résumé et traduction automatique de vidéos
Mohamed Amine Menacer, Dominique Fohr, Denis Jouvet, Karima Abidi, David Langlois and Kamel Smaïli
La démonstration de résumé et de traduction automatique de vidéos résulte de nos travaux dans le projet AMIS. L’objectif du projet était d’aider un voyageur à comprendre les nouvelles dans un pays étranger. Pour cela, le projet propose de résumer et traduire automatiquement une vidéo en langue étrangère (ici, l’arabe). Un autre objectif du projet était aussi de comparer les opinions et sentiments exprimés dans plusieurs vidéos comparables. La démonstration porte sur l’aspect résumé, transcription et traduction. Les exemples montrés permettront de comprendre et mesurer qualitativement les résultats du projet.
Conception d’un système de détection d’intention pour un moteur de recherche sur Internet
Conception d’un système de détection d’intention pour un moteur de recherche sur Internet
Estelle Maudet and Christophe Servan
Dans les moteurs de recherche sur Internet, l’une des tâches les plus importantes vise à identifier l’intention de l’utilisateur. Cet article présente notre étude pour proposer un nouveau système de détection d’intention pour le moteur de recherche sur Internet Qwant. Des logs de clic au système de détection d’intention, l’ensemble du processus est expliqué, y compris les contraintes industrielles qui ont dû être prises en compte.
Une analyse manuelle des données groupées a d’abord été appliquée sur les journaux afin de mieux comprendre les objectifs de l’utilisateur et de choisir les catégories d’intention pertinentes. Lorsque la recherche satisfait aux contraintes industrielles, il faut faire des choix architecturaux et faire des concessions. Cet article explique les contraintes et les résultats obtenus pour ce nouveau système en ligne.
Une analyse manuelle des données groupées a d’abord été appliquée sur les journaux afin de mieux comprendre les objectifs de l’utilisateur et de choisir les catégories d’intention pertinentes. Lorsque la recherche satisfait aux contraintes industrielles, il faut faire des choix architecturaux et faire des concessions. Cet article explique les contraintes et les résultats obtenus pour ce nouveau système en ligne.
Iagotchi : vers un agent conversationnel artistique
Iagotchi : vers un agent conversationnel artistique
Frejus Laleye, Gaël de Chalendar, Léopold Frey and Rocio Berenguer
Cet article décrit Iagotchi, un personnage virtuel philosophique et artistique qui apprend et développedes connaissances à partir de ses interactions avec l’humain. Iagotchi se présente à la fois commeun apprenant et un expert avec comme objectifs principaux (1) d’accompagner l’homme dans sesquestionnements, (2) de lui fournir des réponses pertinentes sur la base de ses requêtes et (3) degénérer des textes poétiques cohérents. Dans ce travail, nous décrivons l’architecture du systèmede Iagotchi et les composants clés tels que le moteur de conversation, le gestionnaire de sujets et legénérateur de poésies.