Was sind die vier Kategorien des Machine Learning?
Machine-Learning-Modelle werden in der Regel danach kategorisiert, wie der jeweilige Algorithmus lernen soll. Die vier häufigsten Kategorien des Machine Learning sind überwachtes Lernen, unüberwachtes Lernen, halbüberwachtes Lernen und bestärkendes Lernen. Sie sind jedoch breit gefächert, und viele Machine Learning-Modelle enthalten Aspekte aller vier Kategorien. Deep-Learning-Modelle zum Beispiel können in jede dieser vier Kategorien fallen.
Die Wahl der richtigen Art von Machine Learning für eine Aufgabe hängt weitgehend von dem spezifischen Ziel und dem Dataset ab, mit denen Datenwissenschaftler arbeiten. So werden Algorithmen oft an die spezifischen Herausforderungen angepasst, mit denen die Teammitglieder (oder die Endanwender) konfrontiert sind. Welches Machine-Learning-Modell für Ihre Bedürfnisse am besten geeignet ist, lässt sich am besten beurteilen, wenn Sie verstehen, wie die einzelnen Algorithmen funktionieren.
Wie funktioniert überwachtes Lernen?
Beim Supervised Machine Learning, auch überwachtes Lernen genannt, werden markierte Trainingsdaten verwendet. Datenwissenschaftler weisen markierten Daten ein oder mehrere Tags zu, um dem Algorithmus einen sinnvollen Kontext zu geben, beispielsweise bestimmte Kategorien oder Zahlenwerte. Verschiedene E-Mails können beispielsweise als „Spam“ und „kein Spam“ markiert werden, sodass der ML-Algorithmus eine strukturierte Anleitung zum Lernen erhält.
Durch eine Analyse der Beziehung zwischen Input (Daten) und Output (Markierung) stellt der Algorithmus einen Bezug zwischen den beiden Werten her. Sobald dieses Training abgeschlossen ist und die Gewichtung entsprechend angepasst wurde, kann das Modell den Output für neue Daten vorhersagen. Aufgrund ihrer relativen Einfachheit ist dies aktuell die häufigste Form des Machine Learning. Hier sind einige Beispiele für überwachte Lerntechniken:
- Lineare Regression: Hierbei wird eine lineare Beziehung zwischen einer abhängigen Variablen (dem Input, z. B. den Werbeausgaben) und einer unabhängigen Variablen (dem Output, z. B. dem Gesamtertrag) hergestellt, um zukünftige Ergebnisse vorherzusagen. Damit lässt sich die Stärke der Beziehung zwischen den Variablen schätzen und der Wert der abhängigen Variablen bei Annahme eines bestimmten Werts der unabhängigen Variable ermitteln. So lässt sich beispielsweise prognostizieren, wie sich das Gehalt auf die Mitarbeiterzufriedenheit auswirkt.
- Logistische Regression: Hierbei wird die Wahrscheinlichkeit eines binären Ergebnisses auf der Grundlage einer oder mehrerer unabhängiger Variablen vorausgesagt. Die Ergebnisse sind immer binär, also „ja/nein“, „1/0“ oder „wahr/falsch“. Dies wird in erster Linie für Prognosen und Klassifizierungsaufgaben verwendet, z. B. zur Ermittlung des Abwanderungsrisikos von Mitarbeitern.
- Entscheidungsbäume: Mit dieser baumartigen Struktur werden zukünftige Ergebnisse und Vorhersagen mithilfe verzweigter Entscheidungen modelliert. Anhand dieser verzweigten Entscheidungssequenzen lassen sich komplexe Datasets kategorisieren und Möglichkeiten zur Gruppierung und Visualisierung der Daten aufzeigen. Dies ist nützlich bei der Strategieplanung, beispielsweise bei der Erstellung eines Budgets oder bei der Bewertung der Auswirkungen des Kaufs einer neuen Lösung.
Wie funktioniert unüberwachtes Lernen?
Unsupervised Machine Learning bzw. unüberwachtes Lernen basiert ausschließlich auf nicht gekennzeichneten Datasets. Unüberwachte ML-Algorithmen analysieren Datasets auf Trends und teilen die Datenpunkte dabei in verschiedene Gruppen ein. Da kaum menschliche Eingriffe erfolgen, lassen sich auf diese Weise oft Muster aufdecken, die anderenfalls verborgen bleiben würden.
Unüberwachtes Lernen wird zwar in erster Linie zum Data-Clustering verwendet, es gibt aber auch viele weitere Bereiche, in denen es sich als nützlich erweisen kann. Zu den üblichen Anwendungsfällen von Algorithmen, die unbeaufsichtigt lernen, zählen wie folgt:
- K-Means-Clustering: Dabei werden Datenpunkte auf der Grundlage ähnlicher Merkmale in Gruppen eingeteilt, sodass zugrunde liegende Muster aufgedeckt werden. K-Means-Clustering-Algorithmen suchen nach einer festen Zielanzahl (K) von Clustern, die von den Datenwissenschaftlern festgelegt wird. Aufgrund der Einfachheit und Effizienz ist dies eine der beliebtesten Formen von Clustering-Algorithmen. Empfehlungsmaschinen, wie sie beispielsweise von Social-Media-Plattformen eingesetzt werden, machen häufig von K-Means-Clustering Gebrauch, um Inhalte auf der Grundlage des vorherigen Verhaltens eines Anwenders vorzuschlagen.
- Assoziationsregel: Hierbei wird die Stärke der Beziehungen zwischen Datenelementen ermittelt. Dazu wird die Häufigkeit des Auftretens der komplementären Elemente bestimmt. Durch das Aufspüren von Assoziationen, die weitaus häufiger auftreten als bei einer Zufallsstichprobe, können Unternehmen eine entsprechende Strategie entwickeln. Dies ist besonders nützlich, um Kauftrends zu ermitteln, z. B. Produkte, die oft zusammen gekauft werden.
- Dimensionsreduktion: Hierbei wird ein Dataset vereinfacht, indem redundante Merkmale und unbereinigte Daten entfernt werden, während relevantere Dimensionen erhalten bleiben. Bei großen Datasets mit spärlichen Rohdaten erleichtert die Reduzierung der Variablenzahl die Analyse auf signifikante Weise. Die Technologie zur Verarbeitung natürlicher Sprache extrahiert zur Spracherkennung beispielsweise häufig nur jene stimmlichen Merkmale, die als relevant erkannt werden.
Wie funktioniert halbüberwachtes Lernen?
Semisupervised Machine Learning bzw. halbüberwachtes Lernen schließt – wie der Name schon sagt – die Lücke zwischen überwachten und unüberwachten Lernmethoden. Während des Trainingsprozesses kommen dabei sowohl markierte als auch unmarkierte Daten zum Einsatz. Wird ein Algorithmus mit kleinen Mengen markierter Daten angelernt, so kann er das Erlernte auf das gesamte unmarkierte Dataset anwenden. Da die Datenmarkierung oft ein langwieriger und kostspieliger Prozess ist, bietet sich das halbüberwachte Lernen als effiziente Lösung an.
Als Mittelweg zwischen den beiden zuvor genannten Methoden bedient diese Technik ähnliche Anwendungen. Hier sind drei Situationen, in denen sich halbüberwachtes Lernen als sinnvoll erweisen kann:
- Betrugserkennung: Verfügt ein Team im Finanzbereich nur über eine Handvoll bestätigter Beispiele für betrügerische Aktivitäten, können halbüberwacht lernende Systeme anhand des kleineren Datasets trainiert werden. Da Betrug sowohl eine Anomalie als auch schwer aufzudecken ist, erspart diese Methode den Buchhaltern das Durchsuchen Tausender von Transaktionen.
- Klassifizierung von Inhalten: Menschen kostet es teilweise sehr viel Zeit, umfangreiche Informationsmengen durchzulesen und zu annotieren. Beim halbüberwachten Lernen muss hingegen nur eine kleine Auswahl an manuell gekennzeichneten Beispielen zusammengestellt werden. So lassen sich etwa Webseiten für Suchmaschinen und eingehende E-Mails für E-Mail-Clients klassifizieren – neben vielen weiteren Anwendungsfällen.
- Spracherkennung: Die Erfassung menschlicher Sprache in all ihrer Vielfalt und Komplexität – einschließlich der Akzente und stimmlichen Varianzen – ist keine leichte Aufgabe. Beim halbüberwachten Lernen verarbeitet das Modell eine kleine Trainingsmenge an von Menschen annotierten Audiodaten, bevor es selbständig lernt. Bei den Selbstlerntests von Meta sank die Wortfehlerquote dabei um 33,9 %.
Wie funktioniert bestärkendes Lernen?
Reinforcement Machine Learning bzw. bestärkendes Lernen arbeitet anhand der Trial-and-Error-Methode (Versuch und Irrtum). Anders als bei anderen Methoden wird der Algorithmus beim bestärkenden Lernen mit einem bestimmten Ziel und klaren Regeln programmiert, denen er folgen soll. Außerdem werden die Ergebnisse anhand eines Punktesystems bewertet: Bei positivem Output werden Punkte zum Ergebnis addiert und im negativem Fall davon subtrahiert. Diese Feedbackschleife dient dazu, die Ergebnisse mit der Zeit zu verbessern.
Die Algorithmen, die auf diese Weise trainiert werden, eignen sich am besten für sequenzielle entscheidungsbasierte Szenarien wie Spiele, Robotik oder Projektmanagement. Da es Anreize zur Identifizierung des effizientesten Wegs maximaler Belohnung liefert, kann das bestärkende Lernen ein mächtiges Entscheidungsinstrument sein.