(Caveat lector)

SVM[1] signifie Support Vector Machines. En français on peut choisir la traduction littérale Machines à Vecteurs de Support, ou bien (pour conserver l'acronyme anglo-saxon) adopter l'expression Séparateurs à Vaste Marge, qui a le mérite d'expliquer un peu mieux (?) en quoi ça consiste.

Il s'agit d'une méthode de classification[2] dont le but est d'identifier des patterns (des formes, des structures ...) dans des données complexes. Il s'agit donc d'une technique utilisée en apprentissage automatique, branche de l'intelligence artificielle. Son développement rapide depuis le début des années 2000 s'explique par son succès dans des domaines appliqués : bio-informatique, reconnaissance d'écriture, reconnaissance de forme en traitement d'image, data mining au sens large ... Elle regroupe des utilisateurs venant de communautés variées : statistiques, optimisation, réseaux de neurones ...

Si ce que j'ai compris devait me conduire à dessiner une mini-arborescence, elle ressemblerait à ça :

L'idée de base des SVM est de déterminer une frontière[3] qui maximise la distance entre elle-même et les points les plus proches. Ce n'est pas très compliqué en 2D (du moins quand il existe une frontière linéaire), mais un peu moins simple en dimension plus grande ... Il est heureusement possible de se ramener à un problème d'optimisation quadratique sous contraintes, qui sous sa forme duale devient un problème convexe, que l'on sait résoudre en un temps raisonnable (i.e polynomial[4]).
La notion de kernel vient, lorsqu'il n'existe pas de séparateur linéaire, de l'utilisation de fonctions-noyaux permettant de transformer l'espace des données d'entrée en un espace (de plus grande dimension) où l'on peut utiliser un séparateur linéaire.







Quelques liens :







Quelques mots-clés plus ou moins connexes :

  • Algorithme espérance-maximisation (Expectation-maximisation - EM - algorithm)





Notes

[1] Science et Vie Micro pour certains

[2] faisant partie de manière plus générale des Kernel methods, dont c'est sans doute la représentante la plus connue

[3] le séparateur utilisé dans la traduction française

[4] tiens, c'est rigolo, l'adjectif ne prend pas d'accent circonflexe ...