du au
Pieter Brueghel l’Ancien, La Grande Tour de Babel, vers 1563, Kunsthistorisches Museum, Vienne (Autriche). - © Domaine public

Depuis une dizaine d'années, le terme d'« intelligence artificielle » est revenu partout sur le devant de la scène. Des progrès dans la recherche sur les réseaux de neurones, une technologie pourtant ancienne, mais aussi l'augmentation de la puissance de calcul et de masse de données disponibles, ont permis d'accélérer de façon spectaculaire les performances des systèmes d'intelligence artificielle. Au cœur de cette révolution, le traitement automatique des langues (TAL) joue un rôle central. Connu depuis longtemps au travers de la correction orthographique et de la traduction automatique, ce domaine de recherche consacré à l'analyse, la génération et la transformation de données textuelles a récemment fait la une à plusieurs reprises, notamment avec l'arrivée de ChatGPT.

Ce cours a pour objectif de présenter les principales recherches actuelles en TAL. Après un aperçu de ce que sont les données textuelles et de la façon de les représenter, nous évoquerons les approches symboliques ou probabilistes, puis nous nous tournerons vers les approches neuronales contemporaines et les modèles de langue. Nous illustrerons comment ces approches récentes ont fait progresser le TAL, en approfondissant des exemples tels que la traduction automatique mais également certaines applications académiques du TAL, notamment en linguistique. Nous évoquerons ensuite les agents conversationnels, en particulier les modèles tels que ChatGPT et leurs enjeux, et terminerons par un aperçu des recherches actuelles sur la multimodalité, où sont combinés texte et parole ou texte et image.

Programme