Apprentissage profond par renforcement

Résumé

Ce séminaire présente les principales approches de l'apprentissage par renforcement, en insistant sur les algorithmes effectifs, et en comparant les avantages de différentes approches (avec modèle du monde, sans modèle, etc.). Yann Olivier discute l'état de la compréhension mathématique de ces algorithmes au-delà de problèmes jouets, ainsi que les limites à la fois théoriques et pratiques des approches actuelles.

Apprentissage profond par renforcement

Résumé

Documents et médias

Intervenant(s)

Yann Ollivier

Événements

Introduction aux réseaux de neurones profonds

Présentation de 7 challenges de données 2019 (1)

Applications des réseaux de neurones profonds

Présentation de 7 challenges de données 2019 (2)

Approximations par réseaux de neurones et régularité

Présentation des gagnants des challenges 2018

Les origines : la cybernétique et le perceptron

Apprentissage faiblement supervisé pour la reconnaissance visuelle

Approximation universelle par un réseau à une couche cachée

Le langage naturel

Erreur d'approximation avec une couche cachée et régularité

Analyse automatique de vidéos

Optimisation d'un réseau par maximum de vraisemblance

Apprentissage profond par renforcement

Descente de gradient et rétro-propagation du gradient

Convergence de la descente de gradient stochastique

Voir aussi