Quels sont les quatre types de Machine Learning ?
Les modèles de Machine Learning sont généralement regroupés selon le mode d'apprentissage de chaque algorithme. Les quatre types de Machine Learning les plus courants sont l'apprentissage supervisé, l'apprentissage non supervisé, l'apprentissage semi-supervisé et l'apprentissage de renforcement. Ces catégories sont larges, et de nombreux modèles de Machine Learning intégreront des aspects de chacune d'entre elles. Par exemple, les modèles de Deep Learning peuvent relever de n'importe laquelle de ces quatre catégories.
Choisir le bon type de Machine Learning pour une tâche dépend principalement de l'objectif fixé et du jeu de données avec lequel travaille le data scientist. Concrètement, les algorithmes seront souvent adaptés en fonction des défis spécifiques que doit relever une équipe de data science (ou les utilisateurs). La meilleure façon d'évaluer le modèle de Machine Learning le mieux adapté à vos besoins consiste à comprendre le fonctionnement de chaque algorithme.
Fonctionnement de l'apprentissage supervisé
Le Machine Learning supervisé, qu'on appelle également apprentissage supervisé, fonctionne à l'aide de données d'entraînement étiquetées. Les data scientists attribuent une ou plusieurs balises aux données étiquetées pour fournir un contexte utile à l'algorithme, comme des catégories ou des valeurs numériques distinctes. Par exemple, un ensemble d'e-mails peut être étiqueté comme « spam » ou « non spam » et ainsi fournir à l'algorithme de ML un guide structuré à partir duquel effectuer son apprentissage.
En analysant la relation entre l'entrée (les données) et la sortie (les étiquettes), l'algorithme apprend à faire correspondre les deux. Une fois cet entraînement terminé et la pondération correctement ajustée, le modèle peut ensuite anticiper les résultats des nouvelles données. Grâce à sa relative simplicité, il s'agit de la forme de Machine Learning la plus courante à l'heure actuelle. Voici quelques exemples de techniques d'apprentissage supervisé :
- Régression linéaire : établit une relation linéaire entre une variable dépendante (l'entrée, p. ex. les dépenses publicitaires) et une variable indépendante (la sortie, p. ex. les revenus globaux) pour anticiper les résultats futurs. Elle peut être utilisée pour estimer la solidité de la relation entre des variables, ainsi que la valeur de la variable dépendante pour une certaine valeur de la variable indépendante, comme l'impact du salaire sur la satisfaction des collaborateurs.
- Régression logistique : anticipe la probabilité d'un résultat binaire en se basant sur une ou plusieurs variables indépendantes. Les résultats seront toujours binaires, par exemple : oui/non, 1/0 ou vrai/faux. Elle est principalement utilisée pour les tâches de prédiction et de classification, comme l'identification du risque d'attrition des collaborateurs.
- Arbre de décision : modélise les futurs résultats et les prédictions à l'aide de décisions ramifiées qui forment une arborescence. Ces séquences de décisions ramifiées permettent de classer des jeux de données complexes en identifiant des méthodes de regroupement et de visualisation des données. Cela s'avère particulièrement utile lorsque vous élaborez des stratégies, par exemple pour la création d'un budget, l'évaluation d'un impact ou l'achat d'une nouvelle solution.
Fonctionnement de l'apprentissage non supervisé
Le Machine Learning non supervisé, également appelé apprentissage non supervisé, fonctionne exclusivement avec des jeux de données non étiquetés. Les algorithmes de ML non supervisé analysent des jeux de données à la recherche de tendances, en regroupant des points de données en différents jeux au cours du processus. Ces algorithmes, qui travaillent avec une intervention humaine réduite, trouvent souvent dans les données des motifs qui autrement resteraient cachés.
Si l'apprentissage non supervisé sert principalement à regrouper des données, ses cas d'usage pratiques n'en sont pas moins nombreux, y compris :
- Partitionnement en K-moyennes : regroupe les points de données en différents ensembles en fonction de leurs similitudes et découvre les motifs sous-jacents. Les algorithmes de partitionnement en K-moyennes recherchent un nombre cible fixe (K) de clusters, défini par le data scientist. Sa simplicité et son efficacité en font l'un des types d'algorithmes de partitionnement les plus populaires. Les moteurs de recommandations, comme ceux utilisés par les plateformes de réseaux sociaux, utilisent souvent le partitionnement en K-moyennes pour suggérer du contenu en fonction du comportement passé de l'utilisateur.
- Règle d'association : identifie la solidité des relations entre les éléments de données, en comptant la fréquence des occurrences complémentaires. En cherchant les associations qui surviennent bien plus souvent qu'un échantillon aléatoire, les entreprises peuvent élaborer des stratégies plus efficaces. Cela s'avère particulièrement utile pour identifier les tendances d'achat des clients, comme les produits qui sont souvent achetés ensemble.
- Réduction de la dimensionnalité : simplifie un jeu de données en supprimant les éléments redondants et les données superflues, tout en conservant ses dimensions significatives. Lorsqu'il s'agit de jeux de données volumineux avec des données brutes éparses, réduire le nombre de variables facilite considérablement l'analyse. Par exemple, la technologie de traitement automatique du langage naturel extrait souvent des caractéristiques utiles pour la reconnaissance vocale.
Fonctionnement de l'apprentissage semi-supervisé
Comme son nom l'indique, le Machine Learning semi-supervisé, ou apprentissage semi-supervisé, fait le lien entre les méthodes d'apprentissage supervisé et non supervisé. Lors du processus d'entraînement, les modèles d'apprentissage semi-supervisé utilisent des données étiquetées et non étiquetées. En introduisant de petites quantités de données étiquetées dans un algorithme, celui-ci peut appliquer ces enseignements à tout le jeu de données non étiquetées. Étant donné que l'étiquetage des données peut être un processus long et coûteux, l'apprentissage semi-supervisé est souvent perçu comme une solution efficace.
Comme l'apprentissage semi-supervisé est un juste milieu entre les deux méthodes précédemment mentionnées, ses applications restent similaires. Voici trois cas d'usage où il peut s'avérer utile :
- Détection des fraudes : dans le cas où une équipe Finance ne dispose que d'une poignée d'exemples avérés d'activité frauduleuse, les systèmes d'apprentissage semi-supervisé peuvent apprendre à partir d'un jeu de données réduit. La fraude étant une anomalie difficile à détecter, cette méthode évite aux comptables d'avoir à parcourir des milliers de transactions.
- Classification des contenus : la lecture et l'annotation d'immenses volumes de contenus peut être très chronophage pour un humain. Grâce à l'apprentissage semi-supervisé, les annotateurs humains ne doivent réunir qu'une sélection réduite d'exemples étiquetés à la main. Cela peut s'appliquer à de nombreuses tâches, de la classification de pages Web pour des moteurs de recherche à la classification des e-mails entrants pour les clients de messagerie.
- Reconnaissance vocale : capturer l'étendue et la diversité du langage humain, y compris les accents et les variations de la voix, constitue un immense défi. L'apprentissage semi-supervisé fonctionne à partir d'un petit jeu de fichiers audio d'entraînement annotés par l'humain avant d'effectuer son propre auto-apprentissage. Dans les essais d'auto-entraînement effectués par Meta, le taux d'erreur des mots a diminué de 33,9 %.
Fonctionnement de l'apprentissage par renforcement
Le Machine Learning par renforcement, également appelé apprentissage par renforcement, fonctionne par tâtonnement. Contrairement aux autres méthodes, un algorithme d'apprentissage par renforcement est programmé avec un objectif spécifique et un ensemble clair de règles à suivre. Par ailleurs, le data scientist inclut également un objectif basé sur des points : les résultats positifs ajoutent des points, tandis que les résultats négatifs en enlèvent. Cette boucle de feedback permet d'améliorer les résultats au fil du temps.
Les algorithmes de Machine Learning par renforcement sont les plus utiles pour des scénarios basés sur des décisions, comme les jeux, la robotique ou la gestion de projet. En cherchant le chemin le plus efficace vers la récompense maximale, l'apprentissage par renforcement peut être un puissant outil décisionnel.