Analyse automatique en cadres sémantiques pour l’apprentissage de modèles de compréhension de texte

Gabriel Marzinotto, Delphine Charlet, Géraldine Damnati and Frédéric Béchet

Cet article propose une évaluation intrinsèque et extrinsèque d’un modèle d’analyse automatique en cadres sémantiques (Frames). Le modèle proposé est un modèle état de l’art à base de GRU bi-directionnel, enrichi par l’utilisation d’embeddings contextuels. L’amélioration obtenue est observée par le prisme d’un typage des arguments (Frame Elements) sous la forme d’une question prototypique à laquelle ils sont susceptibles de répondre. L’évaluation extrinsèque quant à elle repose sur l’exploitation de l’analyse en cadres sémantiques pour la génération d’un corpus d’apprentissage de triplets (question, paragraphe, réponse) pour une tâche de compréhension de lecture. Nous montrons qu’un modèle de compréhension de lecture appris sur un corpus de triplets générés à partir d’un corpus analysé automatiquement présente des performances inférieures de seulement 2.5% en relatif par rapport à un modèle appris sur un corpus de triplets générés à partir d’un corpus analysé manuellement.