Unul dintre cele mai fundamentale concepte pe care trebuie să le stăpânești atunci când te familiarizezi cu noțiunile de bază ale învățării automate este învățarea supravegheată vs. învățarea nesupravegheată. Această postare pe blog oferă o scurtă trecere în revistă, imagini și câteva exemple de învățare automată nesupravegheată pentru a vă duce cunoștințele de ML la nivelul următor.
Ce este învățarea automată nesupravegheată?
Învățarea supervizată se referă la utilizarea unui set de variabile de intrare pentru a prezice valoarea unei variabile de ieșire etichetate. Necesită date etichetate (gândiți-vă la acestea ca la o cheie de răspuns pe care modelul o poate folosi pentru a-și evalua performanța). Dimpotrivă, învățarea nesupravegheată se referă la deducerea modelelor subiacente dintr-un set de date neetichetate, fără nici o referință la rezultate sau predicții etichetate.
Există mai multe metode de învățare nesupravegheată, dar gruparea este de departe cea mai frecvent utilizată tehnică de învățare nesupravegheată. Clusterizarea se referă la procesul de grupare automată a punctelor de date cu caracteristici similare și de atribuire a acestora la “clustere.”
Pentru a vedea un exemplu practic de clusterizare în acțiune, consultați Clustering: How it Works (In Plain English!).
Cazuri de utilizare a învățării automate nesupravegheate
Câteva cazuri de utilizare a învățării nesupravegheate – mai exact, a clusterizării – includ:
- Segmentarea clienților sau înțelegerea diferitelor grupuri de clienți în jurul cărora să se construiască strategii de marketing sau alte strategii de afaceri.
- Genetică, de exemplu, gruparea modelelor de ADN pentru a analiza biologia evoluționistă.
- Sisteme de recomandare, care implică gruparea utilizatorilor cu modele de vizualizare similare pentru a recomanda conținut similar.
- Dezvăluirea anomaliilor, inclusiv detectarea fraudelor sau detectarea pieselor mecanice defecte (de ex, mentenanță predictivă).
Învățare nesupravegheată și gruparea în Dataiku
Dataiku facilitează valorificarea tehnologiilor de învățare automată și obținerea unui feedback vizual și statistic instantaneu asupra performanței modelului. Aflați mai multe despre clustering (învățare nesupravegheată) în Dataiku.
.