¿Qué es el machine learning? Comprender el ML

Los algoritmos de machine learning (ML) están detrás de algunas de las innovaciones más importantes de los últimos años. Obtenga más información sobre el machine learning, cómo funciona y por qué es fundamental para el futuro del trabajo.

Dos empleados trabajando con un ordenador en un entorno de oficina

Desde el auge de la mecanización a principios del siglo XIX, la humanidad ha seguido desarrollando máquinas inteligentes para mejorar nuestra calidad de vida. Desde la máquina de vapor hasta los coches autónomos, cada época de la era moderna ha estado definida por sus avances tecnológicos, y el machine learning (ML) no es ninguna diferencia. Lo que diferencia al machine learning es que su repercusión no se limita a ningún aspecto en particular de la vida cotidiana. De hecho, los algoritmos de machine learning han estado detrás de la mayoría de las innovaciones tecnológicas de los últimos cinco años.

Tanto si lo sabe como si no, es probable que ya interactúe a diario con el machine learning. Estas son cuatro áreas en las que el machine learning ya ha sido responsable de cambios significativos fuera del ámbito de la ciencia ficción:

  • La generación de recomendaciones sumamente personalizadas para el usuario en plataformas como Spotify, Netflix y Google
  • La identificación de una persona u objeto a partir de una imagen para su uso en aplicaciones de reconocimiento facial y búsqueda visual
  • La potenciación del reconocimiento de voz y el procesamiento de datos detrás de asistentes personales virtuales como Alexa y Siri
  • La predicción de transacciones financieras fraudulentas a partir de pautas de comportamiento anteriores

Ya en 1959, Arthur Samuel, uno de los pioneros de la inteligencia artificial (IA), definió el machine learning como "el campo de estudio que otorga a los ordenadores la capacidad de aprender sin que se los haya programado explícitamente". Ahora, casi 70 años después, esa definición se ha ampliado para incluir una amplia gama de algoritmos y modelos distintos. Siga leyendo para descubrir qué es el machine learning, en qué se diferencia de otras formas de inteligencia artificial y por qué es importante para su empresa.

¿Qué es el machine learning?

El machine learning es un subcampo de la inteligencia artificial centrado en el desarrollo de ordenadores que aprenden de forma parecida a los seres humanos. Mediante el uso de algoritmos que tratan de imitar la inteligencia humana, el machine learning permite a la IA mejorar los resultados mediante la iteración. Esta capacidad de resolver problemas y generar predicciones sin una programación explícita hace que el machine learning sea sumamente adaptable.

Aunque el machine learning permite que los ordenadores aprendan con cierto grado de independencia, siguen necesitando la intervención humana. Los científicos de datos introducen los datos de entrenamiento en un algoritmo de machine learning para crear un modelo de machine learning. Al añadir datos activos a ese modelo (una vez terminado el entrenamiento), los usuarios pueden generar nuevas predicciones. Por último, los resultados de esas predicciones sirven de datos de entrenamiento adicionales, lo que incrementa la exactitud del modelo en lo que se conoce como el "efecto volante" de aceleración del progreso.

El machine learning (ML) es un subcampo de la inteligencia artificial (IA) centrado en el desarrollo de ordenadores que aprenden de forma parecida a los seres humanos.

Machine learning frente a inteligencia artificial

Por inteligencia artificial se entiende toda tecnología que permita a las máquinas simular la inteligencia humana. La IA y el machine learning están íntimamente relacionados y tienen objetivos parecidos. No obstante, la IA abarca muchos más métodos aparte del ML por sí solo, entre los que se incluyen algoritmos de búsqueda, sistemas basados ​​en reglas y algoritmos genéticos. No solo eso, sino que la IA también tiene un contexto cultural más amplio y, en la actualidad, se está hablando y debatiendo mucho sobre los desarrollos y direcciones teóricos de la IA en el futuro.

Si por "IA" se entiende el concepto más general, entonces el ML es una aplicación específica de la IA. Todas las metodologías de IA tienen en común el mismo objetivo general: permitir que una máquina lleve a cabo una tarea compleja con eficacia. Como subcampo de la IA, el machine learning lo consigue analizando grandes volúmenes de datos. No obstante, el foco de atención de un modelo de ML es más limitado, ya que cada modelo suele estar especializado en una tarea concreta.

Machine learning frente a deep learning

El deep learning o aprendizaje profundo es un tipo de machine learning que utiliza redes neuronales para imitar más fielmente la estructura del cerebro humano. El aprendizaje profundo requiere muchos más datos y potencia de cálculo que el machine learning, ya que reduce la necesidad de intervención humana. Mediante el uso de varias capas de procesamiento de redes neuronales, los modelos de aprendizaje profundo pueden analizar enormes conjuntos de datos no estructurados y aprender de ellos. Del mismo modo que "inteligencia artificial" es un término general, "machine learning" es una categoría amplia que engloba el aprendizaje profundo.

La clave para entender el aprendizaje profundo reside en las redes neuronales, también conocidas como "redes neuronales artificiales" (ANN) o "redes neuronales simuladas" (SNN). Las redes neuronales constan de miles (o incluso millones) de nodos de procesamiento simples que están conectados en una estructura por capas. Gracias a ello, pueden modelar relaciones no lineales complejas entre datos de entrada y salida, y clasificar los datos de forma más eficiente. Esto es especialmente útil para la visión artificial, el proceso mediante el cual las máquinas descodifican las imágenes como lo hacen los humanos.

El aprendizaje profundo es un tipo de machine learning que utiliza redes neuronales para imitar más fielmente la estructura del cerebro humano.

¿Cómo funciona el machine learning?

Los modelos de machine learning pueden adoptar una amplia gama de formas (hablaremos más adelante sobre ello), pero los principios básicos siguen siendo relativamente homogéneos. Según la UC Berkeley, normalmente, los algoritmos de ML constan de tres componentes:

  1. Reconocimiento y predicción de patrones: los modelos de ML se utilizan sobre todo para clasificar datos o predecir resultados. Por lo tanto, cada nuevo proceso de toma de decisiones parte de una estimación inicial. Una vez suministrados los datos de entrada, el algoritmo tratará de "adivinar" el tipo de patrón que debe buscar.
  2. Cálculo de errores: acto seguido, el algoritmo tiene que comparar su estimación con los ejemplos existentes (si se han proporcionado). Al cuantificar la exactitud de su predicción inicial, puede evaluar la escala del error.
  3. Optimización: por último, el algoritmo analiza el proceso de toma de decisiones utilizado para llegar a su estimación, ajustándolo para futuras iteraciones. Al cambiar las “ponderaciones” asignadas a cada parámetro, reduce las discrepancias entre los ejemplos proporcionados y sus propias estimaciones. Gracias a este proceso continuo de iteración, evaluación y optimización, el modelo final producirá resultados más precisos.

Por ejemplo, para entrenar un sistema de reconocimiento de imágenes, un científico de datos podría proporcionarle al algoritmo un conjunto etiquetado de imágenes de perros y gatos. El algoritmo tomaría esos datos de entrada y comenzaría a distinguir las diferencias entre perros y gatos. Los diversos parámetros podrían incluir el tamaño y el perfil de cada animal, los distintos tipos de pelaje y la ubicación de los rasgos faciales.

El algoritmo asignaría entonces una ponderación a cada uno de estos parámetros, en función de la utilidad y pertinencia percibidas. Si el algoritmo identificara correctamente un gato, las ponderaciones no se ajustarían, pero si no lo hiciera bien, los parámetros utilizados para llegar a esa conclusión tendrían una ponderación menor. De este modo, el modelo reduce progresivamente la probabilidad de cometer más errores.

Los modelos de ML se utilizan sobre todo para clasificar datos o predecir resultados.

¿Cuáles son los cuatro tipos de machine learning?

Por lo general, los modelos de machine learning se clasifican en función de la forma en que está diseñado cada algoritmo para aprender. Los cuatro tipos más habituales de machine learning son el aprendizaje supervisado, el no supervisado, el semisupervisado y el aprendizaje por refuerzo. Sin embargo, estas categorías son generales y muchos modelos de machine learning incorporarán aspectos de cada una. Por ejemplo, los modelos de aprendizaje profundo pueden entrar en cualquiera de estas cuatro categorías.

Elegir el tipo de machine learning adecuado para una tarea depende en gran medida del objetivo específico y del conjunto de datos con el que trabaja el científico de datos. De hecho, lo habitual es que los algoritmos se adapten en función de los retos específicos a los que se enfrenta un equipo de ciencia de datos (o sus usuarios). La manera más adecuada de evaluar qué modelo de machine learning funcionará mejor para sus necesidades es saber cómo funciona cada algoritmo.

¿Cómo funciona el aprendizaje supervisado?

El machine learning supervisado, también conocido como "aprendizaje supervisado", funciona utilizando datos de entrenamiento etiquetados. Los científicos de datos asignan a los datos etiquetados una o varias etiquetas para darle al algoritmo un contexto útil como, por ejemplo, categorías diferenciadas o valores numéricos. Por ejemplo, un conjunto de correos electrónicos puede etiquetarse como "es correo electrónico no deseado" y "no es correo electrónico no deseado", lo que proporciona al algoritmo de ML una guía estructurada a partir de la cual aprender.

Al analizar la relación entre la entrada (los datos) y la salida (las etiquetas), el algoritmo aprende a interrelacionarlos. Una vez terminado este entrenamiento, con las ponderaciones debidamente ajustadas, el modelo podrá predecir el resultado con datos nuevos. Debido a su relativa simplicidad, esta es la forma más habitual de machine learning en la actualidad. Ejemplos de técnicas de aprendizaje supervisado:

  • Regresión lineal: crea una relación lineal entre una variable dependiente (la entrada, por ejemplo, el gasto en publicidad) y otra independiente (la salida, por ejemplo, los ingresos totales) para predecir resultados futuros. Puede servir para estimar la intensidad de la relación entre ambas variables y el valor de la variable dependiente cuando la independiente presenta un valor concreto. Por ejemplo,cómo el salario repercute en la satisfacción de los empleados.
  • Regresión logística: predice la probabilidad de un resultado binario en función de una o varias variables independientes. Los resultados siempre serán binarios, por ejemplo: sí/no, 1/0 o verdadero/falso. Se utiliza sobre todo para tareas de predicción y clasificación como, por ejemplo, identificar el riesgo de abandono de los empleados.
  • Árboles de decisión: modela predicciones y resultados futuros mediante decisiones vinculadas a ramificaciones, que forman una estructura parecida a la de un árbol. Estas secuencias de decisiones ramificadas categorizan conjuntos de datos complejos e identifican formas de agrupar y visualizar los datos. Resulta muy útil a la hora de desarrollar estrategias como, por ejemplo, para elaborar un presupuesto o evaluar las consecuencias de comprar una nueva solución.

¿Cómo funciona el machine learning no supervisado?

El machine learning no supervisado, también conocido como "aprendizaje no supervisado", funciona exclusivamente con conjuntos de datos no etiquetados. Los algoritmos de ML no supervisados ​​analizan conjuntos de datos en busca de tendencias y, en el proceso, agrupan los datos en distintos conjuntos. Al trabajar con poca intervención humana, estos algoritmos suelen encontrar en los datos patrones que de otro modo permanecerían ocultos.

Si bien el aprendizaje no supervisado se emplea sobre todo para tareas de agrupamiento de datos, son muchos los ámbitos en los que puede resultar útil. Entre los usos habituales de los algoritmos de aprendizaje no supervisado se incluyen los siguientes:

  • Agrupamiento por K-medias: divide los datos en conjuntos en función de sus similitudes y detecta patrones subyacentes. Los algoritmos de agrupamiento por K-medias buscan un número objetivo fijo (K) de grupos, establecido por el científico de datos. Por su simplicidad y eficacia, este es uno de los tipos de algoritmo de agrupamiento más populares. Los motores de recomendaciones, como los que utilizan las plataformas de redes sociales, suelen utilizar la agrupación K-medias para proponer contenido en función del comportamiento anterior de un usuario.
  • Regla de asociación: identifica la intensidad de las relaciones entre elementos de datos, contando la frecuencia de los casos complementarios. Al detectar las asociaciones que se producen con una frecuencia muy superior a las de una muestra aleatoria, las empresas pueden desarrollar estrategias en consecuencia. Esto resulta especialmente útil para identificar tendencias de compra de los clientes como, por ejemplo, productos que se suelen comprar juntos.
  • Reducción de dimensionalidad: simplifica un conjunto de datos eliminando características redundantes y datos ruidosos, pero conservando sus dimensiones significativas. Cuando se trabaja con grandes conjuntos de datos con datos dispersos sin procesar, reducir el número de variables facilita mucho el análisis. Por ejemplo, es habitual que la tecnología de procesamiento de lenguajes naturales extraiga únicamente las características vocales útiles para el reconocimiento de la voz.

¿Cómo funciona el aprendizaje semisupervisado?

Como su nombre da a entender, el machine learning semisupervisado, o aprendizaje semisupervisado, supone un término medio entre los métodos de aprendizaje supervisados ​​y los no supervisados. Los modelos de aprendizaje semisupervisado utilizan datos etiquetados y no etiquetados durante el proceso de entrenamiento. Al introducir pequeñas cantidades de datos etiquetados en un algoritmo, puede aplicar esos aprendizajes al conjunto total de datos no etiquetados. Dado que etiquetar datos puede ser un proceso tedioso y costoso, el aprendizaje semisupervisado suele ser una solución eficiente.

Como el aprendizaje semisupervisado es un punto intermedio equilibrado entre los dos métodos mencionados anteriormente, sus aplicaciones siguen siendo similares. Las siguientes son tres situaciones en las que el aprendizaje semisupervisado puede resultar útil:

  • Detección de fraudes: en el caso de que un equipo financiero disponga solo de un puñado de ejemplos confirmados de actividad fraudulenta, los sistemas de aprendizaje semisupervisados ​​pueden aprender del conjunto de datos más reducido. Dado que el fraude es anómalo y difícil de detectar, este método les evita a los contables tener que clasificar miles de transacciones.
  • Clasificación de contenidos: leer con detenimiento y anotar grandes volúmenes de contenido puede llevarle a un ser humano muchísimo tiempo. Con el aprendizaje semisupervisado, los anotadores humanos solo tienen que reunir una pequeña selección de ejemplos etiquetados a mano. Esto puede aplicarse a todo tipo de clasificaciones, desde páginas web para motores de búsqueda hasta correos electrónicos entrantes para clientes de correo electrónico.
  • Reconocimiento de voz: captar la amplitud y el alcance del habla humana, incluidos los acentos y la variación vocal, es una tarea considerable. El aprendizaje semisupervisado parte de un pequeño conjunto de entrenamiento compuesto de audios anotados por humanos y luego efectúa su propio autoaprendizaje. En las pruebas de autoentrenamiento realizadas por Meta, la tasa de error en las palabras se redujo en un 33,9 %.

¿Cómo funciona el aprendizaje por refuerzo?

El machine learning por refuerzo, también llamado "aprendizaje por refuerzo", funciona mediante ensayo y error. A diferencia del resto de los métodos, un algoritmo de aprendizaje por refuerzo está programado con un objetivo específico y un conjunto claro de reglas que seguir. Además, el científico de datos incluye un objetivo basado en puntos: los resultados positivos suman puntos, mientras que los negativos los restan. Este ciclo de feedback sirve para mejorar los resultados a lo largo del tiempo.

Los algoritmos de machine learning por refuerzo son útiles sobre todo para situaciones basadas ​​en decisiones secuenciales, como es el caso de los videojuegos, la robótica o la gestión de proyectos. Al detectar la vía más eficiente para obtener la máxima recompensa, el aprendizaje por refuerzo puede ser una herramienta eficaz para la toma de decisiones.

Según un estudio de Workday, el 80 % de los responsables de tomar decisiones cree que la IA es necesaria para que su empresa siga siendo competitiva.

¿Cómo utilizan las empresas el machine learning?

En el mundo digital del trabajo, los datos se han convertido en el activo más valioso de una empresa. El machine learning representa una oportunidad para que las empresas aprovechen los datos históricos con el fin de diseñar estrategias más acertadas para el futuro. A medida que las fuerzas laborales aumentadas se vayan convirtiendo en la norma, las empresas que continúen dependiendo de procesos manuales y no logren utilizar plenamente sus datos se quedarán atrás.

Según un estudio de Workday, el 80 % de los responsables de tomar decisiones cree que la IA es necesaria para que su empresa siga siendo competitiva. A pesar de esto, el 76 % comenta que debe mejorar sus conocimientos sobre las aplicaciones de IA y ML. Para triunfar, los líderes empresariales deben comprender en qué circunstancias puede el machine learning aportar el máximo valor a su empresa.

A continuación, se muestran una serie de ejemplos de los usos que ya le dan unos cuantos clientes de Workday a nuestro machine learning integrado de forma nativa:

  • Reclutamiento del candidato idóneo: evaluar manualmente grandes volúmenes de solicitudes de puesto puede ser una tarea colosal. Con el machine learning, los seleccionadores pueden asociar rápidamente las solicitudes de puesto con los candidatos potenciales, agrupándolos en función de la solidez de la asociación. Un gran fabricante multinacional de automóviles aumentó en un 70 % la eficiencia de su proceso de selección de candidatos al utilizar HiredScore AI for Recruiting.* 
  • Identificación y seguimiento de skills: conocer la gran variedad de talento en su fuerza laboral no es tarea fácil. En vez de depender de un catálogo de skills básico, el machine learning permite obtener una visión de conjunto multidimensional. Ya sea para revelar insights sobre carencias de skills o para agrupar skills en función del sector, la región y la excelencia, el ML es fundamental para desarrollar una estrategia de talento basada en skills.
  • Mejora de la movilidad interna: si a su talento no se le presentan con frecuencia oportunidades para desarrollarse y crecer, corre el riesgo de causar baja indeseada. El machine learning puede sacar a la luz recomendaciones de aprendizaje y ofertas de puesto personalizadas en función de las skills, el rol y la permanencia en la posición del empleado. Mediante nuestras recomendaciones de roles generadas por ML, una importante empresa inmobiliaria global logró que la implicación en la movilidad interna aumentara un 10 %. 
  • Mejora de la eficiencia de los procesos para los mánagers: los líderes de personal dedican mucho tiempo valioso a procesos manuales. Con el ML, pueden optimizar la programación, obtener insights a partir del feedback de los empleados y solventar anomalías en los horarios. De hecho, una empresa de capital riesgo corporativo logró alcanzar una tasa de autoservicio de los mánagers del 50 % para los procesos de RRHH, lo que permitió aumentar en gran medida la supervisión y la atribución de responsabilidades. 
  • Automatización inteligente de las finanzas: aunque la automatización ha afectado a muchos elementos de la función financiera, sigue habiendo demasiados procesos manuales. La automatización inteligente gracias al machine learning incluye el escaneo de facturas de proveedores, el escaneo de recibos de gastos y el cotejo de los pagos de los clientes.
  • Detección de anomalías en los datos: la valía de una empresa se mide por la calidad de sus datos financieros. El machine learning detecta cualquier anomalía en el libro mayor al principio del ciclo, lo que mejora la precisión de las previsiones. De esta manera, sus profesionales financieros pueden centrarse en tareas más estratégicas y valiosas.

Según un estudio de Workday, el 98 % de los CEO cree que la implementación de la IA y el ML beneficiaría de inmediato a sus empresas.

Dé el siguiente paso con Workday

Según un estudio internacional de Workday sobre la IA realizado con miembros de la alta dirección, el 98 % de los CEO cree que la implementación de la IA y el ML beneficiaría de inmediato a sus empresas. Sin embargo, solo el 1 % calificaría su adopción como madura. Por eso, la posible ventaja competitiva para las empresas que integren la IA en toda su organización es enorme.

Uno de los principales obstáculos a los que se enfrentan los líderes empresariales es la confianza. En Workday, creemos en una IA responsable que sea transparente, explicable, privada y segura. Lo que significa proporcionarles a nuestros clientes tecnologías de IA que se han diseñado con una IA responsable como componente fundamental. Documentamos nuestra alineación con las normativas y marcos de mejores prácticas existentes y en desarrollo, y también les proporcionamos a nuestros clientes documentos informativos que explican cómo se lleva a cabo el desarrollo, la evaluación y el mantenimiento de nuestras soluciones.

Además, la IA de Workday está integrada en el Core de nuestra plataforma, lo que nos permite ofrecer con rapidez nuevas prestaciones de IA que representan un valor empresarial significativo. Nuestra IA se entrena con el conjunto de datos financieros y de RRHH más extenso y limpio del sector, por lo que está siempre se basa en la realidad. Con más de 65 millones de usuarios con la misma versión de Workday, solo nuestros clientes disponen de los datos fiables que hacen falta para seguir avanzando con el machine learning.

Para obtener más información sobre la forma en que Workday puede ayudarle en su itinerario con la IA y el ML, explore nuestra página de tecnología.

* HiredScore es una empresa de Workday.

Descubra cómo empoderamos a las empresas para transformar la forma en que gestionan su personal y su dinero, y cómo guiamos audazmente a marcas internacionales hacia un futuro potenciado por la IA basando todas nuestras decisiones en la confianza.

Más lectura