Classification à noyaux et SVM

Résumé

Les algorithmes de classification à noyaux donnent un cadre mathématique et algorithmique relativement simple pour développer des algorithmes d’apprentissage. Ils séparent deux classes en ajustant un hyperplan séparateur, après avoir effectué un changement de variable qui associe a une donnée x, un vecteur Φ(x). Les support vector machines optimisent la position de l’hyperplan en minimisant le risque empirique régularisé par un critère de marge. La marge mesure la distance minimum entre les points de chacune des classes et l’hyperplan. Cette minimisation peut se réécrire comme un problème d’optimisation convexe sous contraintes linéaires, qui dépend des produits scalaires k(x, x’) = entre les données d’apprentissage.

Le même type de résultat s’obtient avec un changement de variable Φ(x) en remplaçant le noyau par k(x, x’) = < Φ(x), Φ(x’) >. L’optimisation peut s’effectuer directement à partir des valeurs du noyau, en calculant les variables duales du Lagrangien associé à la minimisation du risque régularisé. Le théorème de Mercer prouve que n’importe quel noyau défini positif s’obtient avec un changement de variable Φ(x). La difficulté principale est de trouver un changement de variables qui permet de réduire le risque de généralisation. On étudie les propriétés des noyaux polynomiaux et des noyaux gaussiens.

Résumé

Intervenant(s)

Stéphane Mallat

Événements

Cartographie des sciences des données

Présentation des challenges 2018 (1)

Compromis Biais-Complexité

Présentation des challenges 2018 (2)

Malédiction de la grande dimension

Réduction de dimensionnalité et débruitage

Analyse de Fourier, filtrage et échantillonnage

Le débruitage d'images en quelques formules

Transformées et bases d'ondelettes

S'attaquer à une compétition de machine learning : méth…

Apprentissage Bayésien et linéaire à noyaux

Régression à noyaux et optimisation convexe

Classification à noyaux et SVM

Apprentissage fédéré pour les données médicales

Descente de gradient et réseaux de neurones

Gradients stochastiques et conditionnels pour les réseaux de neurones

Voir aussi