¿Cuáles son los cuatro tipos de machine learning?
Por lo general, los modelos de machine learning se clasifican en función de la forma en que está diseñado cada algoritmo para aprender. Los cuatro tipos más habituales de machine learning son el aprendizaje supervisado, el no supervisado, el semisupervisado y el aprendizaje por refuerzo. Sin embargo, estas categorías son generales y muchos modelos de machine learning incorporarán aspectos de cada una. Por ejemplo, los modelos de aprendizaje profundo pueden entrar en cualquiera de estas cuatro categorías.
Elegir el tipo de machine learning adecuado para una tarea depende en gran medida del objetivo específico y del conjunto de datos con el que trabaja el científico de datos. De hecho, lo habitual es que los algoritmos se adapten en función de los retos específicos a los que se enfrenta un equipo de ciencia de datos (o sus usuarios). La manera más adecuada de evaluar qué modelo de machine learning funcionará mejor para sus necesidades es saber cómo funciona cada algoritmo.
¿Cómo funciona el aprendizaje supervisado?
El machine learning supervisado, también conocido como "aprendizaje supervisado", funciona utilizando datos de entrenamiento etiquetados. Los científicos de datos asignan a los datos etiquetados una o varias etiquetas para darle al algoritmo un contexto útil como, por ejemplo, categorías diferenciadas o valores numéricos. Por ejemplo, un conjunto de correos electrónicos puede etiquetarse como "es correo electrónico no deseado" y "no es correo electrónico no deseado", lo que proporciona al algoritmo de ML una guía estructurada a partir de la cual aprender.
Al analizar la relación entre la entrada (los datos) y la salida (las etiquetas), el algoritmo aprende a interrelacionarlos. Una vez terminado este entrenamiento, con las ponderaciones debidamente ajustadas, el modelo podrá predecir el resultado con datos nuevos. Debido a su relativa simplicidad, esta es la forma más habitual de machine learning en la actualidad. Ejemplos de técnicas de aprendizaje supervisado:
- Regresión lineal: crea una relación lineal entre una variable dependiente (la entrada, por ejemplo, el gasto en publicidad) y otra independiente (la salida, por ejemplo, los ingresos totales) para predecir resultados futuros. Puede servir para estimar la intensidad de la relación entre ambas variables y el valor de la variable dependiente cuando la independiente presenta un valor concreto. Por ejemplo,cómo el salario repercute en la satisfacción de los empleados.
- Regresión logística: predice la probabilidad de un resultado binario en función de una o varias variables independientes. Los resultados siempre serán binarios, por ejemplo: sí/no, 1/0 o verdadero/falso. Se utiliza sobre todo para tareas de predicción y clasificación como, por ejemplo, identificar el riesgo de abandono de los empleados.
- Árboles de decisión: modela predicciones y resultados futuros mediante decisiones vinculadas a ramificaciones, que forman una estructura parecida a la de un árbol. Estas secuencias de decisiones ramificadas categorizan conjuntos de datos complejos e identifican formas de agrupar y visualizar los datos. Resulta muy útil a la hora de desarrollar estrategias como, por ejemplo, para elaborar un presupuesto o evaluar las consecuencias de comprar una nueva solución.
¿Cómo funciona el machine learning no supervisado?
El machine learning no supervisado, también conocido como "aprendizaje no supervisado", funciona exclusivamente con conjuntos de datos no etiquetados. Los algoritmos de ML no supervisados analizan conjuntos de datos en busca de tendencias y, en el proceso, agrupan los datos en distintos conjuntos. Al trabajar con poca intervención humana, estos algoritmos suelen encontrar en los datos patrones que de otro modo permanecerían ocultos.
Si bien el aprendizaje no supervisado se emplea sobre todo para tareas de agrupamiento de datos, son muchos los ámbitos en los que puede resultar útil. Entre los usos habituales de los algoritmos de aprendizaje no supervisado se incluyen los siguientes:
- Agrupamiento por K-medias: divide los datos en conjuntos en función de sus similitudes y detecta patrones subyacentes. Los algoritmos de agrupamiento por K-medias buscan un número objetivo fijo (K) de grupos, establecido por el científico de datos. Por su simplicidad y eficacia, este es uno de los tipos de algoritmo de agrupamiento más populares. Los motores de recomendaciones, como los que utilizan las plataformas de redes sociales, suelen utilizar la agrupación K-medias para proponer contenido en función del comportamiento anterior de un usuario.
- Regla de asociación: identifica la intensidad de las relaciones entre elementos de datos, contando la frecuencia de los casos complementarios. Al detectar las asociaciones que se producen con una frecuencia muy superior a las de una muestra aleatoria, las empresas pueden desarrollar estrategias en consecuencia. Esto resulta especialmente útil para identificar tendencias de compra de los clientes como, por ejemplo, productos que se suelen comprar juntos.
- Reducción de dimensionalidad: simplifica un conjunto de datos eliminando características redundantes y datos ruidosos, pero conservando sus dimensiones significativas. Cuando se trabaja con grandes conjuntos de datos con datos dispersos sin procesar, reducir el número de variables facilita mucho el análisis. Por ejemplo, es habitual que la tecnología de procesamiento de lenguajes naturales extraiga únicamente las características vocales útiles para el reconocimiento de la voz.
¿Cómo funciona el aprendizaje semisupervisado?
Como su nombre da a entender, el machine learning semisupervisado, o aprendizaje semisupervisado, supone un término medio entre los métodos de aprendizaje supervisados y los no supervisados. Los modelos de aprendizaje semisupervisado utilizan datos etiquetados y no etiquetados durante el proceso de entrenamiento. Al introducir pequeñas cantidades de datos etiquetados en un algoritmo, puede aplicar esos aprendizajes al conjunto total de datos no etiquetados. Dado que etiquetar datos puede ser un proceso tedioso y costoso, el aprendizaje semisupervisado suele ser una solución eficiente.
Como el aprendizaje semisupervisado es un punto intermedio equilibrado entre los dos métodos mencionados anteriormente, sus aplicaciones siguen siendo similares. Las siguientes son tres situaciones en las que el aprendizaje semisupervisado puede resultar útil:
- Detección de fraudes: en el caso de que un equipo financiero disponga solo de un puñado de ejemplos confirmados de actividad fraudulenta, los sistemas de aprendizaje semisupervisados pueden aprender del conjunto de datos más reducido. Dado que el fraude es anómalo y difícil de detectar, este método les evita a los contables tener que clasificar miles de transacciones.
- Clasificación de contenidos: leer con detenimiento y anotar grandes volúmenes de contenido puede llevarle a un ser humano muchísimo tiempo. Con el aprendizaje semisupervisado, los anotadores humanos solo tienen que reunir una pequeña selección de ejemplos etiquetados a mano. Esto puede aplicarse a todo tipo de clasificaciones, desde páginas web para motores de búsqueda hasta correos electrónicos entrantes para clientes de correo electrónico.
- Reconocimiento de voz: captar la amplitud y el alcance del habla humana, incluidos los acentos y la variación vocal, es una tarea considerable. El aprendizaje semisupervisado parte de un pequeño conjunto de entrenamiento compuesto de audios anotados por humanos y luego efectúa su propio autoaprendizaje. En las pruebas de autoentrenamiento realizadas por Meta, la tasa de error en las palabras se redujo en un 33,9 %.
¿Cómo funciona el aprendizaje por refuerzo?
El machine learning por refuerzo, también llamado "aprendizaje por refuerzo", funciona mediante ensayo y error. A diferencia del resto de los métodos, un algoritmo de aprendizaje por refuerzo está programado con un objetivo específico y un conjunto claro de reglas que seguir. Además, el científico de datos incluye un objetivo basado en puntos: los resultados positivos suman puntos, mientras que los negativos los restan. Este ciclo de feedback sirve para mejorar los resultados a lo largo del tiempo.
Los algoritmos de machine learning por refuerzo son útiles sobre todo para situaciones basadas en decisiones secuenciales, como es el caso de los videojuegos, la robótica o la gestión de proyectos. Al detectar la vía más eficiente para obtener la máxima recompensa, el aprendizaje por refuerzo puede ser una herramienta eficaz para la toma de decisiones.