Logistic Regression is one of the most commonly used Machine Learning algorithms that is used to model binary variable that takes only 2 values – 0 and 1. このスコアは、変数が値 1 を取る確率を与えます。
Logistic Regression の一般的に研究されている例をいくつか示します。 スパム検出
Spam Detection is a binary classification problem where we are given an email and we need to classify whether it is spam.スパム検出は2値分類問題で、電子メールが与えられ、それがスパムかどうかを分類する必要があります。 電子メールがスパムであれば、それを1、スパムでなければ、それを0と分類します。
- メールの送信者
- メール内のタイプミスの数
- 「オファー」、「賞」、「無料ギフト」などの単語やフレーズの出現率など。
得られた特徴ベクトルはロジスティック分類器の学習に使われ、0から1の範囲でスコアを出します。 スコアが0.5以上であれば、そのメールをスパムとしてラベル付けします。
Logistic Regression Example: クレジットカード詐欺
Credit Card Fraud Detectionの問題は、銀行業界にとって非常に重要なものです。 クレジットカード取引が発生すると、銀行はいくつかの要素を記録します。 例えば、取引の日付、金額、場所、購入の種類などです。 これらの要因に基づいて、その取引が詐欺であるかどうかのロジスティック回帰モデルを開発します。
たとえば、金額が高すぎる場合、銀行は関係者がそれほど高い買い物をしないことを知っているので、それを詐欺と見なすことができます。 腫瘍予測
A Logistic Regression classifier may be used to identify whether a tumour is malignant or if it is benign. 腫瘍の様々な特徴を抽出するために、いくつかの医用画像技術が使用されている。 例えば,腫瘍の大きさ,影響を受ける体の部位などです。 これらの特徴をロジスティック回帰分類器に与え、腫瘍が悪性か良性かを識別します。
Logistic Regression Example: マーケティング
Facebook のニュースフィードを毎日閲覧していると、舞台裏で実行されている強力なアルゴリズムが、特定のコンテンツ (たとえば、広告) に興味があるかどうかを予測します。 このようなアルゴリズムは、ロジスティック回帰アルゴリズムの複雑なバリエーションとみなすことができ、答えとなる質問は単純です。 機械学習は巨大な分野であり、ロジスティック回帰はそのほんの一部に過ぎません。 もっと勉強して、データサイエンスに関するブログはMagooshにおまかせください。