La régression logistique est l’un des algorithmes de Machine Learning les plus couramment utilisés pour modéliser une variable binaire qui ne prend que 2 valeurs – 0 et 1. L’objectif de la régression logistique est de développer une équation mathématique qui peut nous donner un score dans la gamme de 0 à 1. Ce score nous donne la probabilité que la variable prenne la valeur 1.
Voici quelques-uns des exemples de régression logistique les plus étudiés :
Exemple de régression logistique : Détection de spam
La détection de spam est un problème de classification binaire où l’on nous donne un email et nous devons classer si oui ou non c’est un spam. Si l’email est un spam, nous l’étiquetons 1 ; s’il n’est pas un spam, nous l’étiquetons 0. Afin d’appliquer la régression logistique au problème de détection de spam, les caractéristiques suivantes de l’email sont extraites :
- Envoyeur de l’email
- Nombre de fautes de frappe dans l’email
- Occurrence de mots/phrases comme « offre », « prix », « cadeau gratuit », etc.
Le vecteur de caractéristiques résultant est ensuite utilisé pour entraîner un classificateur logistique qui émet un score compris entre 0 et 1. Si le score est supérieur à 0,5, nous étiquetons l’email comme spam. Sinon, nous ne l’étiquetons pas comme spam.
Exemple de régression logistique : Fraude à la carte de crédit
Le problème de la détection de la fraude à la carte de crédit est d’une importance significative pour l’industrie bancaire car les banques dépensent chaque année des centaines de millions de dollars à cause de la fraude. Lorsqu’une transaction par carte de crédit se produit, la banque prend note de plusieurs facteurs. Par exemple, la date de la transaction, le montant, le lieu, le type d’achat, etc. Sur la base de ces facteurs, ils développent un modèle de régression logistique pour savoir si la transaction est une fraude ou non.
Par exemple, si le montant est trop élevé et que la banque sait que la personne concernée ne fait jamais d’achats aussi élevés, ils peuvent l’étiqueter comme une fraude.
Exemple de régression logistique : Prédiction de tumeurs
Un classificateur de régression logistique peut être utilisé pour identifier si une tumeur est maligne ou si elle est bénigne. Plusieurs techniques d’imagerie médicale sont utilisées pour extraire diverses caractéristiques des tumeurs. Par exemple, la taille de la tumeur, la zone corporelle affectée, etc. Ces caractéristiques sont ensuite transmises à un classificateur de régression logistique pour identifier si la tumeur est maligne ou si elle est bénigne.
Exemple de régression logistique : Marketing
Chaque jour, lorsque vous parcourez votre fil d’actualité Facebook, les puissants algorithmes qui fonctionnent en coulisse prédisent si vous seriez ou non intéressé par un certain contenu (qui pourrait être, par exemple, une publicité). Ces algorithmes peuvent être considérés comme des variations complexes d’algorithmes de régression logistique où la question à laquelle il faut répondre est simple : l’utilisateur aimera-t-il cette publicité particulière dans son fil d’actualité ?
Ce sont là quelques-uns des exemples de régression logistique qui vous auraient donné une idée de ses cas d’utilisation. L’apprentissage automatique est un domaine immense et la régression logistique n’en est qu’une petite partie. Continuez à apprendre et restez à l’écoute de Magoosh pour plus de blogs sur la science des données!