Felügyelet nélküli gépi tanulás

Mit jelent a felügyelet nélküli gépi tanulás?

A felügyelet nélküli gépi tanulási algoritmusok ismert vagy címkézett eredményekre való hivatkozás nélkül következtetnek mintákra egy adathalmazból. A felügyelt gépi tanulással ellentétben a felügyelet nélküli gépi tanulási módszerek nem alkalmazhatók közvetlenül egy regressziós vagy osztályozási problémára, mivel fogalmunk sincs arról, hogy a kimeneti adatok milyen értékek lehetnek, így az algoritmust nem lehet a szokásos módon betanítani. A felügyelet nélküli tanulás ehelyett az adatok mögöttes szerkezetének felfedezésére használható.

Miért fontos a felügyelet nélküli gépi tanulás?

A felügyelet nélküli gépi tanulás célja, hogy korábban ismeretlen mintákat fedezzen fel az adatokban, de ezek a minták legtöbbször gyenge közelítései annak, amit a felügyelt gépi tanulás képes elérni. Ráadásul, mivel nem tudja, hogy milyen eredményeket kellene elérni, nincs mód annak meghatározására, hogy azok mennyire pontosak, így a felügyelt gépi tanulás jobban alkalmazható a valós problémákra.

A legjobb alkalom a felügyelet nélküli gépi tanulás alkalmazására az, amikor nincsenek adatai a kívánt eredményekről, például egy teljesen új termék célpiacának meghatározása, amelyet a vállalkozása még soha nem értékesített. Ha azonban a meglévő fogyasztói bázis jobb megértésére törekszik, a felügyelt tanulás az optimális technika.

A felügyelet nélküli gépi tanulási technikák néhány alkalmazása:

  1. A klaszterezés lehetővé teszi, hogy az adathalmazt automatikusan csoportokra ossza a hasonlóság alapján. Gyakran azonban a klaszterelemzés túlbecsüli a csoportok közötti hasonlóságot, és az adatpontokat nem egyedként kezeli. Emiatt a klaszterelemzés rossz választás az olyan alkalmazásokhoz, mint az ügyfélszegmentálás és a célzás.
  2. Az anomália-érzékelés automatikusan felfedezheti az adatállomány szokatlan adatpontjait. Ez hasznos a csalárd tranzakciók azonosításában, a hibás hardverdarabok felfedezésében vagy az adatbevitel során elkövetett emberi hiba által okozott kiugró értékek azonosításában.
  3. Az asszociációs bányászat olyan elemcsoportokat azonosít, amelyek gyakran együtt fordulnak elő az adatállományban. A kiskereskedők gyakran használják kosárelemzésre, mert lehetővé teszi az elemzők számára, hogy felfedezzék a gyakran egyszerre vásárolt árukat, és hatékonyabb marketing- és merchandising-stratégiákat dolgozzanak ki.
  4. A látens változó modelleket gyakran használják az adatok előfeldolgozására, például az adathalmazban lévő jellemzők számának csökkentésére (dimenziócsökkentés) vagy az adathalmaz több összetevőre bontására.

A felügyelet nélküli gépi tanulási módszerekkel feltárt minták később a felügyelt gépi tanulási módszerek alkalmazásakor is jól jöhetnek. Például egy nem felügyelt technikával klaszterelemzést végezhet az adatokon, majd azt a klasztert, amelyhez az egyes sorok tartoznak, extra jellemzőként használhatja a felügyelt tanulási modellben (lásd: félig felügyelt gépi tanulás). Egy másik példa egy csalásfelismerő modell, amely az anomália-felismerési pontszámokat extra jellemzőként használja.

Felügyelet nélküli gépi tanulás + DataRobot

A DataRobot automatizált gépi tanulási platformnak szüksége van egy “cél” oszlopra – vagyis ismernie kell a kimeneti változót ahhoz, hogy mintákat fedezzen fel az adataiban. Számos modelltervezete azonban felügyelet nélküli tanulást használ a bonyolult jellemzőmérnöki technikák automatizálására, amelyeket automatizálás nélkül nehéz és időigényes megvalósítani.

Vissza a következő szintre a felügyelet nélküli gépi tanulást a DataRobot

Kezdje el most

.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.