Logistisk regression är en av de vanligaste algoritmerna för maskininlärning som används för att modellera en binär variabel som endast tar två värden – 0 och 1. Målet med logistisk regression är att utveckla en matematisk ekvation som kan ge oss en poäng i intervallet 0 till 1. Denna poäng ger oss sannolikheten för att variabeln tar värdet 1.
Här är några av de populärt studerade exemplen på logistisk regression:
Logistisk regression exempel: Detektering av skräppost
Detektering av skräppost är ett binärt klassificeringsproblem där vi får ett e-postmeddelande och måste klassificera om det är skräppost eller inte. Om e-postmeddelandet är skräppost märker vi det med 1, om det inte är skräppost märker vi det med 0. För att tillämpa logistisk regression på problemet med skräppostdetektering extraheras följande egenskaper hos e-postmeddelandet:
- E-postens avsändare
- Antal stavfel i e-postmeddelandet
- Förekomst av ord/fraser som ”erbjudande”, ”pris”, ”gratis gåva”, etc.
Den resulterande funktionsvektorn används sedan för att träna en logistisk klassificerare som ger en poäng i intervallet 0 till 1. Om poängen är mer än 0,5 betecknar vi e-postmeddelandet som skräppost. I annat fall märker vi det inte som skräppost.
Logistisk regressionsexempel: Kreditkortsbedrägeri
Problemet med upptäckt av kreditkortsbedrägeri är av stor betydelse för banksektorn eftersom bankerna varje år spenderar hundratals miljoner dollar på grund av bedrägerier. När en kreditkortstransaktion sker noterar banken flera faktorer. Till exempel datum för transaktionen, belopp, plats, typ av köp osv. Utifrån dessa faktorer utvecklar de en logistisk regressionsmodell för att avgöra om transaktionen är ett bedrägeri eller inte.
Till exempel om beloppet är för högt och banken vet att den berörda personen aldrig gör så höga inköp kan de beteckna det som ett bedrägeri.
Logistisk regressionsexempel: Tumörförutsägelse
En klassificerare med logistisk regression kan användas för att identifiera om en tumör är elakartad eller godartad. Flera medicinska bildbehandlingstekniker används för att ta fram olika egenskaper hos tumörer. Till exempel tumörens storlek, det drabbade kroppsområdet osv. Dessa egenskaper matas sedan in i en logistisk regressionsklassificator för att identifiera om tumören är malign eller godartad.
Logistisk regressionsexempel: Marknadsföring
Varje dag, när du bläddrar i ditt nyhetsflöde på Facebook, förutspår de kraftfulla algoritmerna bakom scenen om du skulle vara intresserad av ett visst innehåll (som till exempel kan vara en annons) eller inte. Sådana algoritmer kan ses som komplexa varianter av logistiska regressionsalgoritmer där frågan som ska besvaras är enkel – kommer användaren att gilla just den här annonsen i sitt nyhetsflöde?
Detta var några av de exempel på logistisk regression som skulle ha gett dig en känsla för dess användningsområden. Maskininlärning är ett stort område och logistisk regression är bara en liten del av det. Fortsätt att lära dig mer och håll ögonen öppna på Magoosh för fler bloggar om datavetenskap!