Uno dei concetti fondamentali da padroneggiare quando ci si avvicina alle basi dell’apprendimento automatico è l’apprendimento supervisionato o non supervisionato. Questo post del blog fornisce un breve resoconto, immagini e alcuni esempi di apprendimento automatico non supervisionato per portare la vostra conoscenza di ML al livello successivo.
Cos’è l’apprendimento automatico non supervisionato?
L’apprendimento supervisionato si riferisce all’utilizzo di un insieme di variabili di input per prevedere il valore di una variabile di output etichettata. Richiede dati etichettati (pensate a questo come una chiave di risposta che il modello può usare per valutare le sue prestazioni). Al contrario, l’apprendimento non supervisionato si riferisce alla deduzione di modelli sottostanti da un set di dati non etichettati senza alcun riferimento a risultati o previsioni etichettati.
Ci sono diversi metodi di apprendimento non supervisionato, ma il clustering è di gran lunga la tecnica di apprendimento non supervisionato più usata. Il clustering si riferisce al processo di raggruppare automaticamente punti di dati con caratteristiche simili e assegnarli a “cluster”.”
Per vedere un esempio pratico di clustering in azione, guardate Clustering: How it Works (In Plain English!).
Casi d’uso dell’apprendimento automatico non supervisionato
Alcuni casi d’uso per l’apprendimento non supervisionato – più specificamente, il clustering – includono:
- Segmentazione dei clienti, o la comprensione di diversi gruppi di clienti attorno ai quali costruire strategie di marketing o altre strategie commerciali.
- Genetica, per esempio il raggruppamento dei modelli di DNA per analizzare la biologia evolutiva.
- Sistemi di raccomandazione, che coinvolgono il raggruppamento di utenti con modelli di visualizzazione simili al fine di raccomandare contenuti simili.
- Rilevamento delle anomalie, compreso il rilevamento delle frodi o il rilevamento di parti meccaniche difettose (ad es, manutenzione predittiva).
Apprendimento non supervisionato e clustering in Dataiku
Dataiku rende facile sfruttare le tecnologie di apprendimento automatico e ottenere un feedback visivo e statistico immediato sulle prestazioni del modello. Per saperne di più sul clustering (apprendimento non supervisionato) in Dataiku.