Mitä tarkoittaa epävalvottu koneoppiminen?
Epävalvotut koneoppimisalgoritmit päättelevät kuvioita tietokokonaisuudesta viittaamatta tunnettuihin tai merkittyihin tuloksiin. Toisin kuin valvotussa koneoppimisessa, valvomattomia koneoppimismenetelmiä ei voi suoraan soveltaa regressio- tai luokitusongelmaan, koska sinulla ei ole aavistustakaan siitä, mitkä ovat lähtötietojen arvot, minkä vuoksi algoritmia ei voi kouluttaa normaaliin tapaan. Epävalvotun oppimisen avulla voidaan sen sijaan löytää datan taustalla oleva rakenne.
Miksi epävalvottu koneoppiminen on tärkeää?
Epävalvotun koneoppimisen tarkoituksena on paljastaa datasta aiemmin tuntemattomia kuvioita, mutta useimmiten nämä kuviot ovat huonoja approksimaatioita siitä, mitä valvotulla koneoppimisella voidaan saavuttaa. Lisäksi, koska et tiedä, mitä tulosten pitäisi olla, ei ole mitään keinoa määrittää, kuinka tarkkoja ne ovat, mikä tekee valvotusta koneoppimisesta paremmin sovellettavissa reaalimaailman ongelmiin.
Paras aika käyttää valvomatonta koneoppimista on silloin, kun sinulla ei ole tietoa halutuista lopputuloksista, kuten määritettäessä kohdemarkkinoita täysin uudelle tuotteelle, jota yrityksesi ei ole koskaan aiemmin myynyt. Jos kuitenkin yrität saada paremman käsityksen olemassa olevasta kuluttajakunnastasi, valvottu oppiminen on optimaalinen tekniikka.
Joitakin valvomattoman koneoppimisen tekniikoiden sovelluksia ovat esimerkiksi:
- Klusteroinnin avulla voit jakaa tietokokonaisuuden automaattisesti ryhmiin samankaltaisuuden mukaan. Usein klusterianalyysi kuitenkin yliarvioi ryhmien välisen samankaltaisuuden eikä käsittele datapisteitä yksilöinä. Tästä syystä klusterianalyysi on huono valinta sovelluksiin, kuten asiakassegmentointiin ja kohdentamiseen.
- Poikkeavuuksien havaitseminen voi havaita automaattisesti epätavallisia datapisteitä aineistossasi. Tämä on hyödyllistä, kun halutaan paikantaa vilpillisiä tapahtumia, löytää viallisia laitteiston osia tai tunnistaa poikkeama, joka johtuu inhimillisestä virheestä tietojen syöttämisen aikana.
- Assosiaatioiden louhinta tunnistaa joukot kohteita, jotka esiintyvät usein yhdessä tietokokonaisuudessasi. Vähittäiskauppiaat käyttävät sitä usein ostoskorianalyysiin, koska sen avulla analyytikot voivat löytää usein samaan aikaan ostettuja tavaroita ja kehittää tehokkaampia markkinointi- ja myyntistrategioita.
- Latenttimuuttujamalleja käytetään yleisesti datan esikäsittelyyn, kuten tietokokonaisuuden piirteiden määrän vähentämiseen (dimensioiden pienentäminen) tai tietokokonaisuuden purkamiseen useisiin komponentteihin.
Valvomattomilla koneoppimismenetelmillä havaitsemasi kuviot voivat olla hyödyllisiä myös, kun otat käyttöön valvottuja koneoppimismenetelmiä myöhemmin. Voit esimerkiksi käyttää valvomatonta tekniikkaa suorittaaksesi klusterianalyysin aineistolle ja käyttää sitten klusteria, johon kukin rivi kuuluu, ylimääräisenä ominaisuutena valvotussa oppimismallissa (ks. puolivalvottu koneoppiminen). Toinen esimerkki on petosten havaitsemismalli, joka käyttää ylimääräisenä ominaisuutena poikkeamien havaitsemispisteitä.
Ylivalvomaton koneoppiminen + DataRobot
Automaattisen koneoppimisen DataRobot-alusta vaatii ”kohde”-sarakkeen – eli sen on tunnettava lähtömuuttuja, jotta se voi paljastaa kuvioita datastasi. Monet sen mallipiirustuksista hyödyntävät kuitenkin valvomatonta oppimista automatisoidakseen monimutkaisia ominaisuuksien suunnittelutekniikoita, joiden toteuttaminen ilman automaatiota on vaikeaa ja aikaa vievää.
.