Nem felügyelt gépi tanulás:

A gépi tanulás alapjainak elsajátításához az egyik legalapvetőbb fogalom a felügyelt és a felügyelet nélküli tanulás. Ez a blogbejegyzés rövid áttekintést, vizuális ábrákat és néhány példát nyújt a felügyelet nélküli gépi tanulásról, hogy az ML-tudását a következő szintre emelje.

Mi a felügyelet nélküli gépi tanulás?

A felügyelet nélküli tanulás a bemeneti változók egy halmazának felhasználását jelenti egy megjelölt kimeneti változó értékének előrejelzésére. Ehhez címkézett adatokra van szükség (gondoljunk erre úgy, mint egy válaszkulcsra, amelyet a modell a teljesítményének értékeléséhez használhat). Ezzel szemben a felügyelet nélküli tanulás a mögöttes minták következtetésére utal egy címkézetlen adathalmazból, anélkül, hogy hivatkoznánk címkézett kimenetekre vagy előrejelzésekre.

Supervised vs. Unsupervised machine learning

A felügyelet nélküli tanulásnak számos módszere létezik, de a klaszterezés messze a leggyakrabban használt felügyelet nélküli tanulási technika. A klaszterezés a hasonló jellemzőkkel rendelkező adatpontok automatikus csoportosítására és “klaszterekhez” rendelésére utal.”

A klaszterezés gyakorlati példájának megtekintéséhez tekintse meg a Klaszterezés: How it Works (In Plain English!).

Unsupervised Machine Learning Use Cases

A felügyelet nélküli tanulás – pontosabban a klaszterezés – néhány alkalmazási esete:

  • Vevői szegmentálás, vagy a különböző vevőcsoportok megértése, amelyekre marketing- vagy más üzleti stratégiákat lehet építeni.
  • Genetika, például DNS-minták klaszterezése az evolúciós biológia elemzéséhez.
  • Recommendáló rendszerek, amelyek hasonló nézési mintákkal rendelkező felhasználók csoportosítását foglalják magukban, hogy hasonló tartalmakat ajánljanak.
  • Anomáliák felderítése, beleértve a csalások felderítését vagy a hibás mechanikai alkatrészek felderítését (ill, prediktív karbantartás).

anomaly detection at scale white paper cover

Unsupervised Learning and Clustering in Dataiku

A Dataiku megkönnyíti a gépi tanulási technológiák kihasználását, és azonnali vizuális és statisztikai visszajelzést ad a modell teljesítményéről. Tudjon meg többet a klaszterezésről (felügyelet nélküli tanulás) a Dataiku-ban.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.