La Regresión Logística es uno de los algoritmos de Aprendizaje Automático más utilizados que se usa para modelar una variable binaria que toma sólo 2 valores – 0 y 1. El objetivo de la Regresión Logística es desarrollar una ecuación matemática que pueda darnos una puntuación en el rango de 0 a 1. Esta puntuación nos da la probabilidad de que la variable tome el valor 1.
Aquí están algunos de los ejemplos popularmente estudiados de Regresión Logística:
Ejemplo de Regresión Logística: Detección de spam
La detección de spam es un problema de clasificación binaria en el que se nos da un correo electrónico y tenemos que clasificar si es o no spam. Si el correo electrónico es spam, lo etiquetamos como 1; si no es spam, lo etiquetamos como 0. Para aplicar la Regresión Logística al problema de detección de spam, se extraen las siguientes características del correo electrónico:
- Remitente del correo electrónico
- Número de errores tipográficos en el correo electrónico
- Ocurrencia de palabras/frases como «oferta», «premio», «regalo», etc.
El vector de características resultante se utiliza para entrenar un clasificador logístico que emite una puntuación en el rango de 0 a 1. Si la puntuación es superior a 0,5, etiquetamos el correo electrónico como spam. En caso contrario, no lo etiquetamos como spam.
Ejemplo de regresión logística: Fraude con tarjetas de crédito
El problema de la detección del fraude con tarjetas de crédito es de gran importancia para el sector bancario porque los bancos gastan cada año cientos de millones de dólares debido al fraude. Cuando se produce una transacción con tarjeta de crédito, el banco toma nota de varios factores. Por ejemplo, la fecha de la transacción, el importe, el lugar, el tipo de compra, etc. Basándose en estos factores, desarrollan un modelo de Regresión Logística para saber si la transacción es o no un fraude.
Por ejemplo, si el importe es demasiado alto y el banco sabe que la persona en cuestión nunca realiza compras tan elevadas, puede etiquetarlo como un fraude.
Ejemplo de Regresión Logística: Predicción de tumores
Un clasificador de regresión logística puede utilizarse para identificar si un tumor es maligno o si es benigno. Se utilizan varias técnicas de imagen médica para extraer diversas características de los tumores. Por ejemplo, el tamaño del tumor, la zona del cuerpo afectada, etc. Estas características se introducen en un clasificador de regresión logística para identificar si el tumor es maligno o benigno.
Ejemplo de regresión logística: Marketing
Cada día, cuando navegas por tu newsfeed de Facebook, los potentes algoritmos que se ejecutan detrás de la escena predicen si te interesaría o no cierto contenido (que podría ser, por ejemplo, un anuncio). Estos algoritmos pueden considerarse variaciones complejas de los algoritmos de Regresión Logística, en los que la pregunta a la que hay que responder es sencilla: ¿le gustará al usuario este anuncio concreto en su feed de noticias?
Estos son algunos de los ejemplos de Regresión Logística que le habrán dado una idea de sus casos de uso. El aprendizaje automático es un campo enorme y la regresión logística es sólo una pequeña parte de él. Siga aprendiendo más y manténgase en sintonía con Magoosh para más blogs sobre la ciencia de los datos.