Ce înseamnă învățarea mecanică nesupravegheată?
Algoritmii de învățare mecanică nesupravegheată deduc modele dintr-un set de date fără a face referire la rezultate cunoscute sau etichetate. Spre deosebire de învățarea automată supravegheată, metodele de învățare automată nesupravegheată nu pot fi aplicate direct la o problemă de regresie sau de clasificare, deoarece nu aveți nicio idee despre care ar putea fi valorile pentru datele de ieșire, ceea ce face imposibilă antrenarea algoritmului așa cum ați face-o în mod normal. În schimb, învățarea nesupravegheată poate fi folosită pentru a descoperi structura subiacentă a datelor.
De ce este importantă învățarea nesupravegheată a mașinilor?
Învățarea nesupravegheată a mașinilor își propune să descopere tipare necunoscute anterior în date, dar, de cele mai multe ori, aceste tipare sunt aproximări slabe ale ceea ce poate realiza învățarea supravegheată a mașinilor. În plus, din moment ce nu știți care ar trebui să fie rezultatele, nu există nicio modalitate de a determina cât de precise sunt acestea, ceea ce face ca învățarea mecanică supravegheată să fie mai aplicabilă problemelor din lumea reală.
Cel mai bun moment pentru a utiliza învățarea mecanică nesupravegheată este atunci când nu aveți date privind rezultatele dorite, cum ar fi determinarea unei piețe țintă pentru un produs complet nou pe care afacerea dvs. nu l-a mai vândut până acum. Cu toate acestea, dacă încercați să înțelegeți mai bine baza de consumatori existentă, învățarea supravegheată este tehnica optimă.
Câteva aplicații ale tehnicilor de învățare automată nesupravegheată includ:
- Clusterizarea vă permite să împărțiți automat setul de date în grupuri în funcție de similaritate. Adesea, însă, analiza clusterului supraestimează similitudinea dintre grupuri și nu tratează punctele de date ca indivizi. Din acest motiv, analiza cluster este o alegere proastă pentru aplicații precum segmentarea și direcționarea clienților.
- Detectarea anomaliilor poate descoperi automat punctele de date neobișnuite din setul dumneavoastră de date. Acest lucru este util în identificarea tranzacțiilor frauduloase, descoperirea pieselor hardware defecte sau identificarea unei valori aberante cauzate de o eroare umană în timpul introducerii datelor.
- Association mining identifică seturi de elemente care apar frecvent împreună în setul dumneavoastră de date. Comercianții cu amănuntul îl folosesc adesea pentru analiza coșului, deoarece le permite analiștilor să descopere bunurile cumpărate adesea în același timp și să dezvolte strategii de marketing și merchandising mai eficiente.
- Modelele de variabile latente sunt utilizate în mod obișnuit pentru preprocesarea datelor, cum ar fi reducerea numărului de caracteristici într-un set de date (reducerea dimensionalității) sau descompunerea setului de date în mai multe componente.
Planurile pe care le descoperiți cu metodele de învățare automată nesupravegheată pot fi, de asemenea, utile atunci când implementați ulterior metode de învățare automată supravegheată. De exemplu, ați putea utiliza o tehnică nesupravegheată pentru a efectua o analiză cluster pe date, apoi să utilizați clusterul căruia îi aparține fiecare rând ca o caracteristică suplimentară în modelul de învățare supravegheată (a se vedea învățarea automată semi-supravegheată). Un alt exemplu este un model de detectare a fraudelor care utilizează scorurile de detectare a anomaliilor ca o caracteristică suplimentară.
Învățare automată nesupravegheată + DataRobot
Platforma automată de învățare automată DataRobot necesită o coloană „țintă” – adică trebuie să cunoască variabila de ieșire pentru a descoperi tipare în datele dumneavoastră. Cu toate acestea, multe dintre schițele sale de modele utilizează învățarea nesupravegheată pentru a automatiza tehnici complicate de inginerie a caracteristicilor, care sunt dificil de implementat fără automatizare și necesită mult timp.
.