Eines der grundlegendsten Konzepte, das man beherrschen muss, wenn man sich mit den Grundlagen des maschinellen Lernens vertraut machen will, ist das überwachte und das unüberwachte Lernen. Dieser Blog-Beitrag bietet einen kurzen Überblick, Anschauungsmaterial und einige Beispiele für unüberwachtes maschinelles Lernen, um Ihre ML-Kenntnisse auf die nächste Stufe zu bringen.
Was ist unüberwachtes maschinelles Lernen?
Unüberwachtes Lernen bezieht sich auf die Verwendung einer Reihe von Eingabevariablen, um den Wert einer gekennzeichneten Ausgabevariablen vorherzusagen. Dazu sind gekennzeichnete Daten erforderlich (stellen Sie sich dies wie einen Antwortschlüssel vor, den das Modell zur Bewertung seiner Leistung verwenden kann). Im Gegensatz dazu bezieht sich unbeaufsichtigtes Lernen auf die Ableitung zugrundeliegender Muster aus einem unmarkierten Datensatz ohne Bezug auf markierte Ergebnisse oder Vorhersagen.
Es gibt mehrere Methoden des unüberwachten Lernens, aber Clustering ist bei weitem die am häufigsten verwendete Technik des unüberwachten Lernens. Clustering bezieht sich auf den Prozess der automatischen Gruppierung von Datenpunkten mit ähnlichen Merkmalen und deren Zuordnung zu “Clustern”.
Um ein praktisches Beispiel für Clustering in Aktion zu sehen, lesen Sie Clustering: How it Works (In Plain English!).
Unsupervised Machine Learning Use Cases
Einige Anwendungsfälle für unüberwachtes Lernen – insbesondere Clustering – sind:
- Kundensegmentierung oder das Verständnis verschiedener Kundengruppen, um die herum Marketing- oder andere Geschäftsstrategien aufgebaut werden können.
- Genetik, z. B. Clustering von DNA-Mustern zur Analyse der Evolutionsbiologie.
- Empfehlungssysteme, bei denen Nutzer mit ähnlichen Sehgewohnheiten gruppiert werden, um ähnliche Inhalte zu empfehlen.
- Erkennung von Anomalien, z. B. Erkennung von Betrug oder von defekten mechanischen Teilen (d. h.,
Unüberwachtes Lernen und Clustering in Dataiku
Dataiku macht es einfach, Technologien des maschinellen Lernens zu nutzen und sofortiges visuelles und statistisches Feedback zur Modellleistung zu erhalten. Erfahren Sie mehr über Clustering (unüberwachtes Lernen) in Dataiku.