Logistisk regression er en af de mest almindeligt anvendte Machine Learning algoritmer, der bruges til at modellere en binær variabel, der kun tager 2 værdier – 0 og 1. Formålet med logistisk regression er at udvikle en matematisk ligning, der kan give os en score i intervallet 0 til 1. Denne score giver os sandsynligheden for, at variablen tager værdien 1.
Her er nogle af de populært studerede eksempler på logistisk regression:
Logistisk regression eksempel:
Spamdetektering er et binært klassifikationsproblem, hvor vi får en e-mail, og vi skal klassificere, om den er spam eller ej. Hvis e-mailen er spam, mærker vi den med 1, og hvis den ikke er spam, mærker vi den med 0. For at anvende logistisk regression på spamdetektionsproblemet udvindes følgende træk ved e-mailen:
- E-mailens afsender
- Antal af slåfejl i e-mailen
- Forekomst af ord/fraser som “tilbud”, “præmie”, “gratis gave” osv.
Den resulterende funktionsvektor bruges derefter til at træne en logistisk klassifikator, som udsender en score i intervallet 0 til 1. Hvis scoren er mere end 0,5, betegner vi e-mailen som spam. Ellers mærker vi den ikke som spam.
Logistisk regression Eksempel: Kreditkortsvindel
Problemet med opdagelse af kreditkortsvindel er af stor betydning for banksektoren, fordi bankerne hvert år bruger hundredvis af millioner af dollars på grund af svindel. Når en kreditkorttransaktion finder sted, noterer banken sig flere faktorer. F.eks. datoen for transaktionen, beløbet, stedet, købstypen osv. På baggrund af disse faktorer udvikler de en logistisk regressionsmodel for, om transaktionen er svindel eller ej.
Hvis beløbet f.eks. er for højt, og banken ved, at den pågældende person aldrig foretager så høje køb, kan de betegne det som svindel.
Logistisk regressionseksempel: Tumorprædiktion
En logistisk regressionsklassifikator kan bruges til at identificere, om en tumor er ondartet eller godartet. Der anvendes flere medicinske billeddannelsesteknikker til at udtrække forskellige egenskaber ved tumorer. F.eks. størrelsen af tumoren, det berørte kropsområde osv. Disse egenskaber indlæses derefter i en logistisk regressionsklassifikator for at identificere, om tumoren er ondartet eller godartet.
Logistisk regression Eksempel: Marketing
Hver dag, når du gennemser dit nyhedsfeed på Facebook, forudsiger de kraftfulde algoritmer, der kører bag scenen, om du vil være interesseret i et bestemt indhold (som f.eks. kan være en reklame) eller ej. Sådanne algoritmer kan ses som komplekse variationer af logistiske regressionsalgoritmer, hvor det spørgsmål, der skal besvares, er enkelt – vil brugeren kunne lide denne bestemte reklame i sit nyhedsfeed?
Dette var nogle af de eksempler på logistisk regression, som ville have givet dig en fornemmelse af dens anvendelsesmuligheder. Maskinlæring er et stort område, og logistisk regression er kun en lille del af det. Bliv ved med at lære mere, og hold øje med Magoosh for flere blogs om datalogi!