Résumé
Ce séminaire présente les principales approches de l'apprentissage par renforcement, en insistant sur les algorithmes effectifs, et en comparant les avantages de différentes approches (avec modèle du monde, sans modèle, etc.). Yann Olivier discute l'état de la compréhension mathématique de ces algorithmes au-delà de problèmes jouets, ainsi que les limites à la fois théoriques et pratiques des approches actuelles.