I quattro tipi di machine learning
I modelli di machine learning sono in genere raggruppati in base alla modalità di apprendimento di ciascun algoritmo. I quattro tipi più comuni di machine learning sono l'apprendimento supervisionato, l'apprendimento non supervisionato, l'apprendimento semi-supervisionato e l'apprendimento per rinforzo. Queste categorie sono tuttavia ampie e molti modelli di machine learning incorporano aspetti di ciascuna di esse. Ad esempio, i modelli di deep learning possono rientrare in una qualsiasi di queste quattro categorie.
La scelta del tipo di machine learning più adatto per dato un dato compito dipende in gran parte dall'obiettivo specifico e dal set di dati con cui il data scientist sta lavorando. In effetti, gli algoritmi vengono spesso adattati in base alle sfide specifiche che un team di data science (o i suoi utenti) deve affrontare. Il modo migliore per valutare quale sia il modello di machine learning più adatto alle tue esigenze è capire come funziona ogni algoritmo.
Come funziona l'apprendimento supervisionato?
L'apprendimento supervisionato funziona utilizzando dati di addestramento etichettati. I data scientist assegnano ai dati etichettati uno o più tag per fornire all'algoritmo un contesto utile, come categorie distinte o valori numerici. Un insieme di e-mail, ad esempio, può essere etichettato come "spam" e "non spam", il che fornisce all'algoritmo di ML una guida strutturata da cui apprendere.
Analizzando la relazione tra l'input (dati) e l'output (etichette), l'algoritmo impara ad abbinare l'uno all'altro. Una volta completato l'addestramento, con la ponderazione opportunamente regolata, il modello può prevedere l'output per nuovi dati. Grazie alla sua relativa semplicità, questa è la forma più comune di machine learning usata oggi. Alcuni esempi di tecniche di apprendimento supervisionato:
- Regressione lineare: crea una relazione lineare tra una variabile dipendente (l'input, ad esempio la spesa pubblicitaria) e una variabile indipendente (l'output, ad esempio il fatturato complessivo) per prevedere risultati futuri. Può essere utilizzata per stimare la forza della relazione tra le variabili e il valore della variabile dipendente rispetto a un certo valore della variabile indipendente; ad esempio, l'impatto dello stipendio sulla soddisfazione dei dipendenti.
- Regressione logistica: prevede la probabilità di un risultato binario in base a una o più variabili indipendenti. I risultati saranno sempre binari, come sì/no, 1/0 o vero/falso. Viene utilizzata principalmente per attività di previsione e classificazione, come l'identificazione del rischio di abbandono dei dipendenti.
- Alberi decisionali: modellizza previsioni e risultati futuri utilizzando decisioni collegate a ramificazioni, che formano una struttura ad albero. Queste sequenze di decisioni ramificate categorizzano insiemi di dati complessi, identificando modi per raggruppare e visualizzare i dati. Questa tecnica ha un'utilità strategica, ad esempio per pianificare un budget o valutare l'impatto dell'acquisto di una nuova soluzione.
Come funziona l'apprendimento non supervisionato?
L'apprendimento non supervisionato funziona esclusivamente con set di dati non etichettati. Gli algoritmi di ML non supervisionato analizzano i set di dati alla ricerca di trend raggruppando i punti dati in diversi set. Questi algoritmi, che funzionano con un intervento umano ridotto, spesso individuano nei dati dei pattern che altrimenti rimarrebbero nascosti.
Sebbene l'apprendimento non supervisionato sia utilizzato principalmente per le attività di clustering dei dati, sono molti gli ambiti in cui può rivelarsi utile. Alcuni usi più comuni degli algoritmi di apprendimento non supervisionato:
- K-means: divide i punti dati in set sulla base delle loro somiglianze e scopre i pattern sottostanti. Gli algoritmi K-means cercano un numero fisso (K) di cluster, stabilito dal data scientist. È uno dei tipi di algoritmo più diffusi per la sua semplicità ed efficacia. I motori che generano suggerimenti, come quelli utilizzati dalle piattaforme social, spesso utilizzano K-means per suggerire contenuti in funzione delle scelte precedenti dell'utente.
- Regola di associazione: identifica la forza delle relazioni tra i dati, contando la frequenza delle occorrenze complementari. Individuando le associazioni che si verificano più frequentemente rispetto a un campione casuale, le aziende possono elaborare una strategia di conseguenza. Ciò è particolarmente utile per scoprire le tendenze di acquisto dei clienti, come i prodotti che vengono acquistati frequentemente insieme.
- Riduzione della dimensionalità: semplifica un set di dati eliminando gli elementi ridondanti e superflui e trattenendo le dimensioni significative. Quando si ha a che fare con grandi insiemi di dati con dati grezzi scarsi, la riduzione del numero di variabili rende l'analisi molto più semplice. Ad esempio, la tecnologia di elaborazione del linguaggio naturale spesso estrae solo le caratteristiche vocali utili per il riconoscimento vocale.
Come funziona l'apprendimento semi-supervisionato?
Come suggerisce il nome, l'apprendimento semi-supervisionato colma il divario tra i metodi di apprendimento supervisionati e non supervisionati. I modelli di apprendimento semi-supervisionato utilizzano sia dati etichettati che non etichettati per il processo di apprendimento. Alimentando piccole quantità di dati etichettati in un algoritmo, si estende l'apprendimento all'intero set di dati senza etichetta. Poiché etichettare i dati può essere un processo noioso e costoso, l'apprendimento semi-supervisionato è spesso una soluzione efficiente.
L'apprendimento semi-supervisionato è una via di mezzo tra i due metodi precedentemente citati, pertanto le sue applicazioni rimangono simili. Ecco tre situazioni in cui può rivelarsi prezioso:
- Rilevamento delle frodi: se un team Finance dispone solo di una manciata di esempi confermati di attività fraudolente, i sistemi di apprendimento semi-supervisionato possono apprendere dal set di dati più piccolo. Poiché le frodi sono anomale e difficili da individuare, questo metodo evita ai contabili di dover esaminare migliaia di transazioni.
- Classificazione dei contenuti: la lettura e l'annotazione di grandi volumi di contenuti può richiedere agli esseri umani tempi incredibilmente lunghi. Con l'apprendimento semi-supervisionato, essi devono solo assemblare una piccola selezione di esempi etichettati a mano. Gli impieghi sono molteplici: dalla classificazione delle pagine web per i motori di ricerca a quella delle e-mail in arrivo per i client di posta elettronica.
- Riconoscimento vocale: catturare l'ampiezza e le variazioni del parlato umano, compresi gli accenti e i toni, è un compito immenso. L'apprendimento semi-supervisionato funziona a partire da un piccolo set di addestramento audio annotato dall'uomo prima di procedere al proprio autoapprendimento. Nelle prove di autoaddestramento di Meta, il tasso di errore delle parole è diminuito del 33,9%.
Come funziona l'apprendimento per rinforzo?
L'apprendimento per rinforzo funziona per tentativi. A differenza di altri metodi, un algoritmo di apprendimento per rinforzo è programmato con un obiettivo specifico e un insieme chiaro di regole da seguire. Inoltre, il data scientist include un obiettivo basato su punti: i risultati positivi ne aggiungono, mentre quelli negativi li sottraggono. Questo ciclo di feedback serve a migliorare i risultati nel tempo.
Gli algoritmi di machine learning con rinforzo sono più utili per scenari basati su decisioni sequenziali, come i giochi, la robotica e il project management. Individuando il percorso più efficace per ottenere la massima ricompensa, l'apprendimento per rinforzo può rivelarsi un potente strumento decisionale.