Jednym z najbardziej fundamentalnych pojęć, które należy opanować podczas zapoznawania się z podstawami uczenia maszynowego, jest uczenie nadzorowane i nienadzorowane. Ten wpis na blogu zawiera krótkie omówienie, wizualizacje i kilka przykładów nienadzorowanego uczenia maszynowego, aby przenieść Twoją wiedzę o ML na wyższy poziom.
Co to jest nienadzorowane uczenie maszynowe?
Nadzorowane uczenie odnosi się do używania zestawu zmiennych wejściowych do przewidywania wartości oznaczonej zmiennej wyjściowej. Wymaga to oznaczonych danych (pomyśl o tym jak o kluczu odpowiedzi, który model może wykorzystać do oceny swojej wydajności). I odwrotnie, uczenie nienadzorowane odnosi się do wnioskowania o podstawowych wzorcach z nieoznakowanego zbioru danych bez odniesienia do oznaczonych wyników lub przewidywań.
Istnieje kilka metod uczenia nienadzorowanego, ale klasteryzacja jest zdecydowanie najczęściej używaną techniką uczenia nienadzorowanego. Klastrowanie odnosi się do procesu automatycznego grupowania punktów danych o podobnych cechach i przypisywania ich do “klastrów.”
Aby zobaczyć praktyczny przykład klastrowania w akcji, sprawdź Clustering: How it Works (In Plain English!).
Unsupervised Machine Learning Use Cases
Niektóre przypadki użycia uczenia nienadzorowanego – a dokładniej klastrowania – obejmują:
- Segmentację klientów, lub zrozumienie różnych grup klientów, wokół których można budować strategie marketingowe lub inne strategie biznesowe.
- Genetyka, na przykład grupowanie wzorców DNA w celu analizy biologii ewolucyjnej.
- Systemy rekomendacji, które obejmują grupowanie użytkowników o podobnych wzorcach przeglądania w celu rekomendowania podobnych treści.
- Wykrywanie anomalii, w tym wykrywanie oszustw lub wykrywanie wadliwych części mechanicznych (tj, predykcyjne utrzymanie ruchu).
Unsupervised Learning and Clustering in Dataiku
Dataiku ułatwia wykorzystanie technologii uczenia maszynowego i uzyskanie natychmiastowej wizualnej i statystycznej informacji zwrotnej na temat wydajności modelu. Dowiedz się więcej o klasteryzacji (uczeniu nienadzorowanym) w Dataiku.