Eén van de meest fundamentele concepten die je onder de knie moet krijgen als je de basisbeginselen van machine learning onder de knie wilt krijgen, is supervised vs. unsupervised learning. In dit blogartikel vindt u een kort overzicht, afbeeldingen en enkele voorbeelden van machine learning zonder toezicht om uw ML-kennis naar een hoger niveau te tillen.
Wat is machine learning zonder toezicht?
Leren zonder toezicht verwijst naar het gebruik van een set invoervariabelen om de waarde van een gelabelde uitvoervariabele te voorspellen. Hiervoor zijn gelabelde gegevens nodig (zie dit als een antwoordsleutel die het model kan gebruiken om zijn prestaties te evalueren). Omgekeerd verwijst leren zonder toezicht naar het afleiden van onderliggende patronen uit een ongelabelde dataset zonder enige verwijzing naar gelabelde uitkomsten of voorspellingen.
Er zijn verschillende methoden voor leren zonder toezicht, maar clustering is veruit de meest gebruikte techniek voor leren zonder toezicht. Met clustering wordt het proces bedoeld waarbij gegevenspunten met vergelijkbare kenmerken automatisch worden gegroepeerd en aan “clusters” worden toegewezen.”
Om een praktisch voorbeeld van clustering in actie te zien, zie Clustering: How it Works (In Plain English!).
Unsupervised Machine Learning Use Cases
Enkele use cases voor leren zonder toezicht – meer specifiek, clustering – omvatten:
- Klantsegmentatie, of het begrijpen van verschillende klantgroepen waar omheen marketing of andere bedrijfsstrategieën kunnen worden gebouwd.
- Genetica, bijvoorbeeld het clusteren van DNA-patronen om evolutionaire biologie te analyseren.
- Recommender-systemen, waarbij gebruikers met vergelijkbare kijkpatronen worden gegroepeerd om vergelijkbare inhoud aan te bevelen.
- Anomaliedetectie, waaronder fraudedetectie of het opsporen van defecte mechanische onderdelen (d.w.z., voorspellend onderhoud).
Unsupervised Learning and Clustering in Dataiku
Dataiku maakt het eenvoudig om gebruik te maken van machine learning-technologieën en direct visuele en statistische feedback te krijgen over de prestaties van het model. Leer meer over clusteren (leren zonder toezicht) in Dataiku.