Qu'est-ce que le Machine Learning : les clés pour comprendre

Les algorithmes de Machine Learning (ML) sont à l'origine de certaines des innovations les plus importantes de ces dernières années. Apprenez-en plus sur le Machine Learning et son fonctionnement, et découvrez pourquoi il est essentiel pour le Future of Work.

Deux collaborateurs travaillant sur un ordinateur dans un bureau

Depuis l'essor de la mécanisation au début du XIXe siècle, l'humanité n'a cessé de développer des machines toujours plus intelligentes pour améliorer sa qualité de vie. De la machine à vapeur à la voiture sans conducteur, chaque période de l'ère moderne s'est définie par ses avancées technologiques, et le Machine Learning (ML) ne fait pas exception. Ce qui distingue le Machine Learning des autres innovations est que son impact ne se limite pas à un seul aspect du quotidien. En fait, les algorithmes de Machine Learning sont à l'origine de la plupart des innovations technologiques de ces cinq dernières années.

Vous avez sans doute déjà utilisé le Machine Learning au quotidien sans même vous en rendre compte. Voici donc quatre domaines dans lesquels le Machine Learning a été à l'origine de changements majeurs sans pour autant tomber dans la science-fiction :

  • Générer des recommandations utilisateur ultrapersonnalisées sur des plateformes comme Spotify, Netflix et Google
  • Identifier une personne ou un objet à partir d'une image, afin de l'utiliser pour la reconnaissance faciale et la recherche visuelle
  • Alimenter la reconnaissance vocale et le traitement des données à l'origine des assistants personnels virtuels comme Alexa et Siri
  • Déterminer si des transactions financières sont frauduleuses en se basant sur de précédents schémas de comportement

Dès 1959, Arthur Samuel, l'un des précurseurs de l'Intelligence Artificielle (IA), a défini le Machine Learning comme « le domaine d'étude qui donne aux ordinateurs la capacité d'apprendre sans être explicitement programmés ». Aujourd'hui, près de 70 ans plus tard, cette définition s'est élargie pour inclure tout un éventail d'algorithmes et de modèles. Lisez la suite pour découvrir en quoi consiste le Machine Learning, ce qui le distingue des autres formes d'Intelligence Artificielle et pourquoi il est important pour votre entreprise.

Qu'est-ce que le Machine Learning :

Le Machine Learning est un sous-domaine de l'Intelligence Artificielle axé sur le développement d'ordinateurs qui apprennent comme les humains. Grâce à l'utilisation d'algorithmes qui cherchent à imiter l'intelligence humaine, le Machine Learning permet à l'IA d'améliorer ses résultats par itération. Cette capacité à résoudre les problèmes et à générer des prédictions sans programmation explicite rend le Machine Learning extrêmement adaptable.

Si le Machine Learning permet aux ordinateurs d'apprendre avec un certain degré d'indépendance, ceux-ci ont toujours besoin d'une intervention humaine. Les data scientists intègrent des données d'entraînement dans un algorithme de Machine Learning pour créer un modèle. En ajoutant des données en temps réel (une fois l'entraînement terminé), les utilisateurs peuvent générer de nouvelles prédictions. Enfin, les résultats de ces prédictions sont à leur tour utilisés comme données d'entraînement pour encore améliorer la précision du modèle, ce que nous appelons « l'effet volant » de l'accélération du progrès.

Le Machine Learning (ML) est un sous-domaine de l'Intelligence Artificielle (IA) axé sur le développement d'ordinateurs qui apprennent comme les humains.

Différence entre Machine Learning et Intelligence Artificielle

L'Intelligence Artificielle désigne toute technologie permettant à une machine de simuler l'intelligence humaine. L'IA et le Machine Learning sont étroitement liés et leurs objectifs sont similaires. L'IA englobe toutefois de nombreuses méthodes qui dépassent le ML au sens strict, y compris des algorithmes de recherche, des systèmes basés sur des règles et des algorithmes génétiques. Qui plus est, l'IA s'inscrit dans un contexte culturel plus large, et elle fait l'objet de discussions et de débats houleux concernant son développement et son évolution théorique future.

Si l'IA fait référence à une notion plus large, alors le ML est une application spécifique de l'IA. Chaque méthode d'IA partage un même objectif général : permettre à une machine d'accomplir une tâche complexe de manière efficace. En tant que sous-domaine de l'IA, le Machine Learning atteint cet objectif en analysant d'importants volumes de données. Cela étant, l'objectif d'un modèle de Machine Learning est plus restreint, car chaque modèle est généralement dédié à une tâche spécifique.

Machine Learning et Deep Learning

Le Deep Learning est un type de Machine Learning qui utilise des réseaux neuronaux pour imiter plus fidèlement la structure d'un cerveau humain. Le Deep Learning exige beaucoup plus de données et de puissance de calcul que le Machine Learning, car il réduit la nécessité d'une intervention humaine. En utilisant plusieurs couches de traitement neuronal, les modèles de Deep Learning peuvent analyser et apprendre en se basant sur des jeux de données massifs non structurés. Tout comme l'Intelligence Artificielle est un terme global, le Machine Learning est un concept générique qui englobe le Deep Learning.

La clé pour comprendre le Deep Learning réside dans les réseaux neuronaux, également appelés réseaux de neurones artificiels ou réseaux de neurones simulés. Les réseaux neuronaux sont composés de milliers (voire de millions) de nœuds de traitement simples qui sont connectés dans une structure en couches. Ils peuvent ainsi modéliser des relations non linéaires complexes entre les données d'entrée et de sortie, et classer ces données de manière plus efficace. Cet apprentissage en profondeur est particulièrement utile pour la vision par ordinateur, processus par lequel les machines décodent les images visuelles comme le ferait un humain.

Le Deep Learning est un type de Machine Learning qui utilise des réseaux neuronaux pour imiter plus fidèlement la structure d'un cerveau humain.

Comment fonctionne le Machine Learning ?

Les modèles de Machine Learning peuvent prendre des formes diverses et variées (plus de détails ci-dessous), mais les principes directeurs restent relativement similaires. Selon la University of California à Berkeley, les algorithmes de Machine Learning incluent généralement trois composants :

  1. Identification et prédiction de motifs : les modèles de ML sont souvent utilisés pour soit classer des données, soit prédire des résultats. Ainsi, chaque nouveau processus décisionnel commence par une estimation initiale. Une fois les données d'entrée fournies, l'algorithme essaie de « deviner » le type de motif qu'il est censé trouver.
  2. Calcul de l'erreur : ensuite, l'algorithme doit comparer son estimation avec des exemples existants (si ceux-ci ont été fournis). En quantifiant le niveau d'exactitude de sa prédiction initiale, il est capable d'évaluer l'échelle d'erreur.
  3. Optimisation : enfin, l'algorithme analyse le processus décisionnel utilisé pour parvenir à son estimation, et l'ajuste pour les futures itérations. En modifiant la pondération attribuée à chaque paramètre, il réduit les divergences entre les exemples fournis et ses propres estimations. Ce processus continu d'itération, d'évaluation et d'optimisation signifie que le modèle final produira des résultats plus précis.

Par exemple, pour entraîner un système de reconnaissance d'images, un data scientist peut fournir à l'algorithme un ensemble d'images de chats et de chiens étiquetées comme telles. L'algorithme utilise ces données d'entrée pour commencer à identifier les différences entre les chats et les chiens. Ces différents paramètres peuvent inclure la taille et le profil de chaque animal, les différents types de poils et les caractéristiques faciales.

L'algorithme attribue ensuite une certaine pondération à chacun de ces paramètres, en fonction de leur utilité et de leur pertinence perçues. Si l'algorithme identifie correctement un chat, la pondération ne sera pas ajustée, mais s'il se trompe, les paramètres utilisés pour arriver à cette conclusion verront leur pondération baisser. Ainsi, le modèle réduit progressivement la probabilité de commettre d'autres erreurs.

Les modèles de ML sont souvent utilisés pour soit classer des données, soit prédire des résultats.

Quels sont les quatre types de Machine Learning ?

Les modèles de Machine Learning sont généralement regroupés selon le mode d'apprentissage de chaque algorithme. Les quatre types de Machine Learning les plus courants sont l'apprentissage supervisé, l'apprentissage non supervisé, l'apprentissage semi-supervisé et l'apprentissage de renforcement. Ces catégories sont larges, et de nombreux modèles de Machine Learning intégreront des aspects de chacune d'entre elles. Par exemple, les modèles de Deep Learning peuvent relever de n'importe laquelle de ces quatre catégories.

Choisir le bon type de Machine Learning pour une tâche dépend principalement de l'objectif fixé et du jeu de données avec lequel travaille le data scientist. Concrètement, les algorithmes seront souvent adaptés en fonction des défis spécifiques que doit relever une équipe de data science (ou les utilisateurs). La meilleure façon d'évaluer le modèle de Machine Learning le mieux adapté à vos besoins consiste à comprendre le fonctionnement de chaque algorithme.

Fonctionnement de l'apprentissage supervisé

Le Machine Learning supervisé, qu'on appelle également apprentissage supervisé, fonctionne à l'aide de données d'entraînement étiquetées. Les data scientists attribuent une ou plusieurs balises aux données étiquetées pour fournir un contexte utile à l'algorithme, comme des catégories ou des valeurs numériques distinctes. Par exemple, un ensemble d'e-mails peut être étiqueté comme « spam » ou « non spam » et ainsi fournir à l'algorithme de ML un guide structuré à partir duquel effectuer son apprentissage.

En analysant la relation entre l'entrée (les données) et la sortie (les étiquettes), l'algorithme apprend à faire correspondre les deux. Une fois cet entraînement terminé et la pondération correctement ajustée, le modèle peut ensuite anticiper les résultats des nouvelles données. Grâce à sa relative simplicité, il s'agit de la forme de Machine Learning la plus courante à l'heure actuelle. Voici quelques exemples de techniques d'apprentissage supervisé :

  • Régression linéaire : établit une relation linéaire entre une variable dépendante (l'entrée, p. ex. les dépenses publicitaires) et une variable indépendante (la sortie, p. ex. les revenus globaux) pour anticiper les résultats futurs. Elle peut être utilisée pour estimer la solidité de la relation entre des variables, ainsi que la valeur de la variable dépendante pour une certaine valeur de la variable indépendante, comme l'impact du salaire sur la satisfaction des collaborateurs.
  • Régression logistique : anticipe la probabilité d'un résultat binaire en se basant sur une ou plusieurs variables indépendantes. Les résultats seront toujours binaires, par exemple : oui/non, 1/0 ou vrai/faux. Elle est principalement utilisée pour les tâches de prédiction et de classification, comme l'identification du risque d'attrition des collaborateurs.
  • Arbre de décision : modélise les futurs résultats et les prédictions à l'aide de décisions ramifiées qui forment une arborescence. Ces séquences de décisions ramifiées permettent de classer des jeux de données complexes en identifiant des méthodes de regroupement et de visualisation des données. Cela s'avère particulièrement utile lorsque vous élaborez des stratégies, par exemple pour la création d'un budget, l'évaluation d'un impact ou l'achat d'une nouvelle solution.

Fonctionnement de l'apprentissage non supervisé

Le Machine Learning non supervisé, également appelé apprentissage non supervisé, fonctionne exclusivement avec des jeux de données non étiquetés. Les algorithmes de ML non supervisé analysent des jeux de données à la recherche de tendances, en regroupant des points de données en différents jeux au cours du processus. Ces algorithmes, qui travaillent avec une intervention humaine réduite, trouvent souvent dans les données des motifs qui autrement resteraient cachés.

Si l'apprentissage non supervisé sert principalement à regrouper des données, ses cas d'usage pratiques n'en sont pas moins nombreux, y compris :

  • Partitionnement en K-moyennes : regroupe les points de données en différents ensembles en fonction de leurs similitudes et découvre les motifs sous-jacents. Les algorithmes de partitionnement en K-moyennes recherchent un nombre cible fixe (K) de clusters, défini par le data scientist. Sa simplicité et son efficacité en font l'un des types d'algorithmes de partitionnement les plus populaires. Les moteurs de recommandations, comme ceux utilisés par les plateformes de réseaux sociaux, utilisent souvent le partitionnement en K-moyennes pour suggérer du contenu en fonction du comportement passé de l'utilisateur.
  • Règle d'association : identifie la solidité des relations entre les éléments de données, en comptant la fréquence des occurrences complémentaires. En cherchant les associations qui surviennent bien plus souvent qu'un échantillon aléatoire, les entreprises peuvent élaborer des stratégies plus efficaces. Cela s'avère particulièrement utile pour identifier les tendances d'achat des clients, comme les produits qui sont souvent achetés ensemble.
  • Réduction de la dimensionnalité : simplifie un jeu de données en supprimant les éléments redondants et les données superflues, tout en conservant ses dimensions significatives. Lorsqu'il s'agit de jeux de données volumineux avec des données brutes éparses, réduire le nombre de variables facilite considérablement l'analyse. Par exemple, la technologie de traitement automatique du langage naturel extrait souvent des caractéristiques utiles pour la reconnaissance vocale.

Fonctionnement de l'apprentissage semi-supervisé

Comme son nom l'indique, le Machine Learning semi-supervisé, ou apprentissage semi-supervisé, fait le lien entre les méthodes d'apprentissage supervisé et non supervisé. Lors du processus d'entraînement, les modèles d'apprentissage semi-supervisé utilisent des données étiquetées et non étiquetées. En introduisant de petites quantités de données étiquetées dans un algorithme, celui-ci peut appliquer ces enseignements à tout le jeu de données non étiquetées. Étant donné que l'étiquetage des données peut être un processus long et coûteux, l'apprentissage semi-supervisé est souvent perçu comme une solution efficace.

Comme l'apprentissage semi-supervisé est un juste milieu entre les deux méthodes précédemment mentionnées, ses applications restent similaires. Voici trois cas d'usage où il peut s'avérer utile :

  • Détection des fraudes : dans le cas où une équipe Finance ne dispose que d'une poignée d'exemples avérés d'activité frauduleuse, les systèmes d'apprentissage semi-supervisé peuvent apprendre à partir d'un jeu de données réduit. La fraude étant une anomalie difficile à détecter, cette méthode évite aux comptables d'avoir à parcourir des milliers de transactions.
  • Classification des contenus : la lecture et l'annotation d'immenses volumes de contenus peut être très chronophage pour un humain. Grâce à l'apprentissage semi-supervisé, les annotateurs humains ne doivent réunir qu'une sélection réduite d'exemples étiquetés à la main. Cela peut s'appliquer à de nombreuses tâches, de la classification de pages Web pour des moteurs de recherche à la classification des e-mails entrants pour les clients de messagerie.
  • Reconnaissance vocale : capturer l'étendue et la diversité du langage humain, y compris les accents et les variations de la voix, constitue un immense défi. L'apprentissage semi-supervisé fonctionne à partir d'un petit jeu de fichiers audio d'entraînement annotés par l'humain avant d'effectuer son propre auto-apprentissage. Dans les essais d'auto-entraînement effectués par Meta, le taux d'erreur des mots a diminué de 33,9 %.

Fonctionnement de l'apprentissage par renforcement

Le Machine Learning par renforcement, également appelé apprentissage par renforcement, fonctionne par tâtonnement. Contrairement aux autres méthodes, un algorithme d'apprentissage par renforcement est programmé avec un objectif spécifique et un ensemble clair de règles à suivre. Par ailleurs, le data scientist inclut également un objectif basé sur des points : les résultats positifs ajoutent des points, tandis que les résultats négatifs en enlèvent. Cette boucle de feedback permet d'améliorer les résultats au fil du temps.

Les algorithmes de Machine Learning par renforcement sont les plus utiles pour des scénarios basés sur des décisions, comme les jeux, la robotique ou la gestion de projet. En cherchant le chemin le plus efficace vers la récompense maximale, l'apprentissage par renforcement peut être un puissant outil décisionnel.

Selon une étude Workday, 80 % des décideurs pensent que l'IA est nécessaire pour maintenir la compétitivité de leur entreprise.

Comment les entreprises utilisent-elles le Machine Learning ?

Dans un monde du travail digital, les données sont devenues la ressource la plus précieuse des entreprises. Le Machine Learning leur donne l'opportunité unique de tirer parti de leurs données historiques pour mieux se préparer à l'avenir. Alors que les collaborateurs augmentés deviennent la norme, les entreprises qui continuent à utiliser des processus manuels et ne parviennent pas à pleinement exploiter leurs données risquent de prendre un train de retard.

Selon une étude Workday, 80 % des décideurs pensent que l'IA est nécessaire pour maintenir la compétitivité de leur entreprise. Malgré cela, 76 % d'entre eux indiquent qu'ils doivent améliorer leur connaissance des applications de l'IA et du ML. Pour réussir, les dirigeants doivent comprendre où le Machine Learning peut apporter le plus de valeur ajoutée à leur activité.

Voici quelques exemples illustrant la manière dont les clients Workday utilisent déjà notre Machine Learning intégré :

  • Recruter le meilleur candidat : évaluer manuellement d'importants volumes de candidatures peut être une tâche colossale. Grâce au Machine Learning, les recruteurs peuvent rapidement associer les demandes de poste avec les candidats potentiels, en les regroupant en fonction de leur niveau de correspondance. Un grand constructeur automobile international a ainsi augmenté de 70 % l'efficacité de la sélection des candidats en utilisant HiredScore AI for Recruiting*. 
  • Identifier et suivre les compétences : comprendre toute la richesse et la profondeur des talents disponibles dans vos effectifs n'est pas une mince affaire. Au lieu de s'appuyer sur un catalogue standard de compétences, le Machine Learning permet d'obtenir une vue d'ensemble multidimensionnelle. Qu'il s'agisse de faire remonter des insights concernant des écarts de compétences ou de regrouper des compétences par secteur, région et niveau de maîtrise, le ML est indispensable pour développer une stratégie de gestion des talents basée sur les compétences.
  • Améliorer la mobilité interne : si vos collaborateurs n'ont pas régulièrement l'opportunité de suivre des formations et d'évoluer, ils risquent de quitter le navire. Le Machine Learning peut faire ressortir des recommandations de formation et des postes à pourvoir en fonction des compétences, du rôle et de l'ancienneté du collaborateur. En utilisant nos recommandations de rôles générées par ML, une société immobilière internationale a constaté une augmentation de 10 % de l'engagement en matière de mobilité interne. 
  • Améliorer l'efficacité des processus pour les managers : les responsables passent un temps précieux à accomplir des tâches manuelles. Avec le Machine Learning, il est possible de rationaliser la planification, d'obtenir des insights grâce au feedback des collaborateurs et de traiter les anomalies en matière de gestion des temps. Une société de capital-risque a atteint un taux d'utilisation du self-service manager de 50 % pour les processus RH, ce qui a permis d'améliorer significativement la visibilité et la responsabilité. 
  • Automatiser la Finance de manière intelligente : si l'automatisation a amélioré de nombreux aspects de la fonction Finance, trop de processus restent encore manuels. L'automatisation intelligente qu'offre le Machine Learning inclut l'analyse des factures fournisseurs, la capture des notes de frais et le rapprochement des paiements des clients.
  • Détecter les anomalies dans les données : une entreprise n'est rien sans données financières de qualité. Le Machine Learning signale les anomalies du grand livre dès le début du cycle, ce qui améliore la précision des prévisions. Les professionnels de la Finance peuvent ainsi se concentrer sur des tâches plus stratégiques et créatrices de valeur.

Une étude Workday montre que 98 % des PDG estiment que la mise en œuvre de l'IA et du ML offrirait un avantage immédiat à l'entreprise.

Passez à la vitesse supérieure avec Workday

Le Rapport C-Suite Global AI Indicator de Workday montre que 98 % des PDG estiment que la mise en œuvre de l'IA et du ML offrirait un avantage immédiat à l'entreprise, mais seul 1 % d'entre eux qualifieraient leur adoption de mature. L'avantage concurrentiel que l'IA pourrait apporter aux entreprises est donc considérable.

L'un des principaux obstacles auxquels les dirigeants sont confrontés est celui de la confiance. Chez Workday, nous croyons en une IA responsable, transparente, explicable, privée et sécurisée. Cela signifie que nous fournissons à nos clients des technologies d'IA conçues avec une IA responsable native. Nous documentons notre alignement sur les réglementations existantes, les textes en cours d'élaboration et les cadres de meilleures pratiques, et fournissons à nos clients des fiches d'information décrivant la manière dont nos solutions sont développées, évaluées et mises à jour.

Par ailleurs, l'IA Workday est intégrée au cœur de notre plateforme, afin que nous puissions rapidement fournir de nouvelles fonctionnalités d'IA offrant une valeur ajoutée significative. Notre IA est entraînée sur le jeu de données Finance et RH le plus volumineux et le plus propre du secteur, ce qui l'ancre toujours dans la réalité. Avec plus de 65 millions d'utilisateurs de la même version de Workday, nos clients ont accès aux données fiables nécessaires pour toujours aller de l'avant grâce au Machine Learning.

Pour en savoir plus sur la façon dont Workday peut vous accompagner dans votre parcours d'adoption de l'IA et du ML, consultez notre page dédiée aux technologies.

* HiredScore est une société de Workday.

Découvrez comment nous donnons aux entreprises les moyens de transformer leur gestion RH et Finance, et comment nous guidons en toute confiance les grandes marques mondiales vers un avenir basé sur l'IA.

En lire plus