Auteur(s)

Présentation

La performance des algorithmes d’analyse de données a fait un bond ces dernières années, non seulement grâce à l’augmentation des capacités de calcul et aux masses de données, mais aussi grâce à l’évolution rapide des algorithmes d’apprentissage, et par conséquent de l’intelligence artificielle.

L’analyse automatique des données numériques est devenue un enjeu industriel, sociétal et scientifique majeur. Les sciences des données développent des algorithmes capables d’apprendre, comme les réseaux de neurones, avec des données de grande dimension. Il est pour cela nécessaire de comprendre les principes de l’apprentissage, en faisant appel à de nombreuses branches des mathématiques dont les statistiques, l’analyse harmonique et la géométrie.

Ce livre est la réédition par le Collège de France de l’ouvrage publié sous le même titre en 2018 (Collège de France/Fayard).

Stéphane Mallat a été professeur de mathématiques appliquées à l’université de New York, à l’École polytechnique et à l’École normale supérieure. Dans les années 2000, il a cofondé et dirigé une start-up de traitement d’images. Il est professeur au Collège de France depuis mai 2017, titulaire de la chaire Sciences des données.

ISBN
978-2-7226-0711-8
Numéro dans la collection
276
Date de parution
Langue
français
Nombre de pages
80
Prix
12.00 €
Diffusion
FMSH-Diffusion
Format
Édition imprimée

Sommaire

Modélisation, prédiction et intelligence artificielle

Algorithmes d'apprentissage supervisé

Généralisation et régularité

Malédiction de la grande dimension

Modèles parcimonieux multiéchelles

Apprentissage supervisé et réseaux de neurones

Régularités mathématiques en grande dimension

Conclusion

Extraits

On peut distinguer deux types de problèmes en sciences des données : la modélisation et la prédiction. Un modèle décrit la variabilité des données et permet d’en générer de nouvelles. On l’utilise pour comprimer et donc pour stocker des données avec le moins de mémoire possible, ou pour les transmettre efficacement. Avec un modèle, on peut aussi éliminer des erreurs introduites dans les données, ou resituer des données complètes à partir de mesures partielles. Ainsi, on peut restaurer des images médicales de haute qualité avec un nombre de mesures réduites, afin de minimiser l’exposition des patients. La modélisation est au cœur du traitement du signal, qui a de nombreuses applications, notamment dans le domaine des télécommunications.

Une prédiction a pour but d’estimer la réponse à une question à partir de données. Ces prédictions sont faites par des algorithmes d’apprentissage statistique, qui sont à l’origine du renouveau de l’intelligence artificielle. Les applications sont considérables.