Ett av de mest grundläggande begreppen att behärska när man börjar lära sig grunderna för maskininlärning är övervakad respektive oövervakad inlärning. Det här blogginlägget ger en kort genomgång, visuella bilder och några exempel på oövervakad maskininlärning för att ta dina ML-kunskaper till nästa nivå.
Vad är oövervakad maskininlärning?
Oövervakad inlärning innebär att man använder en uppsättning inmatningsvariabler för att förutsäga värdet av en märkt utdatavariabel. Det kräver märkta data (tänk på detta som en svarsnyckel som modellen kan använda för att utvärdera sin prestanda). Omvänt hänvisar oövervakad inlärning till att härleda underliggande mönster från en omärkt datamängd utan någon hänvisning till märkta resultat eller förutsägelser.
Det finns flera metoder för oövervakad inlärning, men klusterindelning är den överlägset vanligaste oövervakade inlärningstekniken. Klustering avser processen att automatiskt gruppera ihop datapunkter med liknande egenskaper och tilldela dem till “kluster”.
Om du vill se ett praktiskt exempel på klustering i praktiken kan du kolla in Clustering:
Användningsområden för oövervakad maskininlärning
Några användningsområden för oövervakad inlärning – närmare bestämt klusterbildning – är:
- Kundsegmentering, eller att förstå olika kundgrupper som man kan bygga marknadsföringsstrategier eller andra affärsstrategier kring.
- Genetik, till exempel klustring av DNA-mönster för att analysera evolutionsbiologi.
- Recommendationssystem, som innebär att man grupperar användare med liknande visningsmönster för att rekommendera liknande innehåll.
- Anomalidetektering, inklusive bedrägeridetektering eller detektering av defekta mekaniska delar (dvs,
Unsupervised Learning and Clustering in Dataiku
Dataiku gör det enkelt att utnyttja tekniker för maskininlärning och få omedelbar visuell och statistisk återkoppling på modellens prestanda. Lär dig mer om klusterbildning (oövervakad inlärning) i Dataiku.