Vad betyder oövervakad maskininlärning?
Osupervised maskininlärningsalgoritmer drar slutsatser om mönster från en datamängd utan att hänvisa till kända, eller märkta, resultat. Till skillnad från övervakad maskininlärning kan oövervakade metoder för maskininlärning inte tillämpas direkt på ett regressions- eller klassificeringsproblem eftersom du inte har någon aning om vad värdena för utdata kan vara, vilket gör det omöjligt för dig att träna algoritmen på det sätt som du normalt skulle göra. Oövervakad inlärning kan istället användas för att upptäcka den underliggande strukturen i data.
Varför är oövervakad maskininlärning viktig?
Oövervakad maskininlärning syftar till att avslöja tidigare okända mönster i data, men för det mesta är dessa mönster dåliga approximationer av vad övervakad maskininlärning kan uppnå. Eftersom du inte vet vad resultaten ska vara finns det dessutom inget sätt att avgöra hur exakta de är, vilket gör att övervakad maskininlärning är mer tillämpbar på verkliga problem.
Det bästa tillfället att använda oövervakad maskininlärning är när du inte har några uppgifter om önskade resultat, t.ex. att bestämma en målmarknad för en helt ny produkt som ditt företag aldrig har sålt tidigare. Om du däremot försöker få en bättre förståelse för din befintliga konsumentbas är övervakad inlärning den optimala tekniken.
Några tillämpningar av oövervakade tekniker för maskininlärning är:
- Med hjälp av klusterindelning kan du automatiskt dela upp datamängden i grupper beroende på likhet. Ofta överskattar dock klusteranalysen likheten mellan grupperna och behandlar inte datapunkterna som individer. Av den anledningen är klusteranalys ett dåligt val för tillämpningar som kundsegmentering och målinriktning.
- Anomalidetektering kan automatiskt upptäcka ovanliga datapunkter i ditt dataset. Detta är användbart för att identifiera bedrägliga transaktioner, upptäcka felaktig hårdvara eller identifiera en outlier som orsakats av ett mänskligt fel vid inmatning av data.
- Associeringsutvinning identifierar uppsättningar av objekt som ofta förekommer tillsammans i ditt dataset. Detaljhandlare använder det ofta för korganalys, eftersom det gör det möjligt för analytiker att upptäcka varor som ofta köps samtidigt och utveckla effektivare marknadsförings- och merchandisingstrategier.
- Modeller med latenta variabler används ofta för dataförbehandling, t.ex. för att minska antalet funktioner i en datauppsättning (dimensionalitetsreducering) eller för att sönderdela datauppsättningen i flera olika komponenter.
Mönstren som du avslöjar med oövervakade metoder för maskininlärning kan också komma till nytta när du senare implementerar övervakade metoder för maskininlärning. Du kan till exempel använda en oövervakad teknik för att utföra klusteranalys på data och sedan använda det kluster som varje rad tillhör som en extra funktion i den övervakade inlärningsmodellen (se semiövervakad maskininlärning). Ett annat exempel är en modell för upptäckt av bedrägerier som använder poäng för upptäckt av anomalier som en extra funktion.
Osuperviserad maskininlärning + DataRobot
DataRobots automatiserade maskininlärningsplattform kräver en ”mål”-kolumn – det vill säga att den måste känna till utgångsvariabeln för att kunna avslöja mönster i dina data. Många av dess modellritningar använder dock oövervakad inlärning för att automatisera komplicerade tekniker för funktionsutveckling, som är svåra och tidskrävande att genomföra utan automatisering.
.