Vous devez être connecté pour voir cette page. Veuillez vous connecter.
Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
TTS voice corpus reduction for audio-book generation
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
Evaluation systématique d’une méthode commune de génération
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
Apprentissage de plongements de mots sur des corpus en langue de spécialité : une étude d’impact
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
Simplification de textes : un état de l’art
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
La désambiguisation des abréviations du domaine médical
La désambiguisation des abréviations du domaine médical
Anaïs Koptient
Les abréviations, tout en étant répandues dans la langue, ont une sémantique assez opaque car seulement les premières lettres sont transparentes. Cela peut donc empêcher la compréhension des abréviations, et des textes qui les contiennent, par les locuteurs. De plus, certaines abréviations sont ambiguës en ayant plusieurs sens possibles, ce qui augmente la difficulté de leur compréhension. Nous proposons de travailler avec les abréviations de la langue médicale dans un cadre lié à la simplification automatique de textes. Dans le processus de simplification, il faut en effet choisir la forme étendue des abréviations qui soit correcte pour un contexte donné. Nous proposons de traiter la désambiguïsation d’abréviations comme un problème de catégorisation supervisée. Les descripteurs sont construits à partir des contextes lexical et syntaxique des abréviations. L’entraînement est effectué sur les phrases qui contiennent les formes étendues des abréviations. Le test est effectué sur un corpus construit manuellement, où les bons sens des abréviations ont été définis selon les contextes. Notre approche montre une F-mesure moyenne de 0,888 sur le corpus d’entraînement en validation croisée et 0,773 sur le corpus de test.
Évolution phonétique des langues et réseaux de neurones : travaux préliminaires
Vous devez être connecté pour voir cette page. Veuillez vous connecter.
Ré-entraîner ou entraîner soi-même ? Stratégies de pré-entraînement de BERT en domaine médical
Vous devez être connecté pour voir cette page. Veuillez vous connecter.