Amphithéâtre Maurice Halbwachs, Site Marcelin Berthelot
En libre accès, dans la limite des places disponibles
-

Résumé

La génération de texte peut cibler différents types de langues et prendre en entrée différents types de connaissances. Dans cette présentation, je montrerai comment adapter les modèles de langue neuronaux pour générer du texte à partir de graphes de représentation sémantique, de graphes de connaissances et de documents multiples. Les architectures neuronales présentées permettront également d'illustrer comment générer à partir d'une même source des textes, soit dans vingt et une langues de l'Union européenne, soit dans des langues dites peu dotées comme le breton, le gallois et l'irlandais. Enfin les travaux sur la génération de biographies Wikipédia à partir de documents multiples permettront de mettre en lumière l'impact de biais de données sur la qualité des textes générés. Les travaux présentés ont été réalisés dans le cadre de la chaire IA xNLG (Génération de textes multilingues et multisources) cofinancée par l'ANR, Meta et la région Grand-Est.

Claire Gardent

Claire Gardent

Claire Gardent est directrice de recherche au Centre national de la recherche scientifique (CNRS) au LORIA, à Nancy. Ses recherches portent sur le traitement automatique des langues avec une attention particulière à la génération multilingue et multisource. Elle a été nommée présidente du chapitre européen de l'Association of Computational Linguistics (EACL), rédactrice en chef des revues Traitement Automatique des Langues et Language and Linguistic Compass (Computational and Mathematical Section). En 2022, elle a reçu la médaille d'argent du CNRS et a été sélectionnée par l'Association of Computational Linguistics (ACL) comme ACL Fellow. Elle porte actuellement la chaire IA xNLG (Génération de textes multilingues et multisources) cofinancée par l'ANR, Meta et la région Grand-Est.

Intervenant(s)

Claire Gardent

directrice de recherche CNRS