Challenges de données
Le site web Challenge data met à disposition des challenges de traitement de données par apprentissage supervisé. Ce séminaire introduit une première partie des challenges qui sont utilisés dans le cadre du cours. Ces challenges sont proposés par des entreprises ou des scientifiques, et sont issus de problématiques concrètes qu’ils rencontrent dans leur activité. Ils s’inscrivent dans un esprit d’échange scientifique, avec un partage de données et d’algorithmes. Les données mises à disposition sont non confidentielles et les rapports algorithmiques des participants peuvent être mis à la disposition de tous, s’ils le souhaitent, après la clôture de la saison.
Les challenges couvrent un large spectre d’applications, sur des images, sons, textes, données médicales, mesures physiques, données d’Internet. Chaque challenge fournit des données labélisées, ainsi que des données de test. Les participants soumettent sur le site web leurs prédictions calculées sur les données de test. Le site calcule un score avec une métrique d’erreur qui est spécifiée. Il fournit un classement aux participants, ce qui permet d’évaluer leurs résultats dans une large communauté. Les challenges commencent le 1er janvier 2018. Une clôture intermédiaire a lieu en juin par une évaluation des prédictions sur de nouvelles données de test. La clôture finale est en décembre, avec une remise des prix en janvier 2019.