Mit jelent a felügyelet nélküli gépi tanulás?
A felügyelet nélküli gépi tanulási algoritmusok ismert vagy címkézett eredményekre való hivatkozás nélkül következtetnek mintákra egy adathalmazból. A felügyelt gépi tanulással ellentétben a felügyelet nélküli gépi tanulási módszerek nem alkalmazhatók közvetlenül egy regressziós vagy osztályozási problémára, mivel fogalmunk sincs arról, hogy a kimeneti adatok milyen értékek lehetnek, így az algoritmust nem lehet a szokásos módon betanítani. A felügyelet nélküli tanulás ehelyett az adatok mögöttes szerkezetének felfedezésére használható.
Miért fontos a felügyelet nélküli gépi tanulás?
A felügyelet nélküli gépi tanulás célja, hogy korábban ismeretlen mintákat fedezzen fel az adatokban, de ezek a minták legtöbbször gyenge közelítései annak, amit a felügyelt gépi tanulás képes elérni. Ráadásul, mivel nem tudja, hogy milyen eredményeket kellene elérni, nincs mód annak meghatározására, hogy azok mennyire pontosak, így a felügyelt gépi tanulás jobban alkalmazható a valós problémákra.
A legjobb alkalom a felügyelet nélküli gépi tanulás alkalmazására az, amikor nincsenek adatai a kívánt eredményekről, például egy teljesen új termék célpiacának meghatározása, amelyet a vállalkozása még soha nem értékesített. Ha azonban a meglévő fogyasztói bázis jobb megértésére törekszik, a felügyelt tanulás az optimális technika.
A felügyelet nélküli gépi tanulási technikák néhány alkalmazása:
- A klaszterezés lehetővé teszi, hogy az adathalmazt automatikusan csoportokra ossza a hasonlóság alapján. Gyakran azonban a klaszterelemzés túlbecsüli a csoportok közötti hasonlóságot, és az adatpontokat nem egyedként kezeli. Emiatt a klaszterelemzés rossz választás az olyan alkalmazásokhoz, mint az ügyfélszegmentálás és a célzás.
- Az anomália-érzékelés automatikusan felfedezheti az adatállomány szokatlan adatpontjait. Ez hasznos a csalárd tranzakciók azonosításában, a hibás hardverdarabok felfedezésében vagy az adatbevitel során elkövetett emberi hiba által okozott kiugró értékek azonosításában.
- Az asszociációs bányászat olyan elemcsoportokat azonosít, amelyek gyakran együtt fordulnak elő az adatállományban. A kiskereskedők gyakran használják kosárelemzésre, mert lehetővé teszi az elemzők számára, hogy felfedezzék a gyakran egyszerre vásárolt árukat, és hatékonyabb marketing- és merchandising-stratégiákat dolgozzanak ki.
- A látens változó modelleket gyakran használják az adatok előfeldolgozására, például az adathalmazban lévő jellemzők számának csökkentésére (dimenziócsökkentés) vagy az adathalmaz több összetevőre bontására.
A felügyelet nélküli gépi tanulási módszerekkel feltárt minták később a felügyelt gépi tanulási módszerek alkalmazásakor is jól jöhetnek. Például egy nem felügyelt technikával klaszterelemzést végezhet az adatokon, majd azt a klasztert, amelyhez az egyes sorok tartoznak, extra jellemzőként használhatja a felügyelt tanulási modellben (lásd: félig felügyelt gépi tanulás). Egy másik példa egy csalásfelismerő modell, amely az anomália-felismerési pontszámokat extra jellemzőként használja.
Felügyelet nélküli gépi tanulás + DataRobot
A DataRobot automatizált gépi tanulási platformnak szüksége van egy “cél” oszlopra – vagyis ismernie kell a kimeneti változót ahhoz, hogy mintákat fedezzen fel az adataiban. Számos modelltervezete azonban felügyelet nélküli tanulást használ a bonyolult jellemzőmérnöki technikák automatizálására, amelyeket automatizálás nélkül nehéz és időigényes megvalósítani.
.