Unsupervised Machine Learning

Unsupervised Machine Learning とは何ですか?

教師なし機械学習アルゴリズムは、既知の、またはラベル付きの結果を参照せずにデータセットからパターンを推論します。 教師あり機械学習とは異なり、教師なし機械学習法は回帰または分類問題に直接適用できません。なぜなら、出力データの値が何であるか分からないため、通常の方法でアルゴリズムを学習することができないからです。 教師なし学習は、代わりにデータの基本的な構造を発見するために使用できます。

Why is Unsupervised Machine Learning Important? さらに、結果がどうあるべきかがわからないため、その精度を判断する方法がなく、教師あり機械学習の方が現実の問題に適用しやすくなります。

教師なし機械学習を使用する最適なタイミングは、ビジネスでこれまで販売したことがないまったく新しい製品のターゲット市場を決定するなど、望ましい結果に関するデータを持っていない場合です。 しかし、既存の消費者ベースの理解を深めようとする場合は、教師あり学習が最適な手法です。

教師なし機械学習手法のいくつかのアプリケーションには以下が含まれます:

  1. クラスタリングにより、データセットを類似性に従って自動的にグループに分割することが可能です。 しかし、多くの場合、クラスター分析はグループ間の類似性を過大評価し、データ点を個人として扱わない。 このため、クラスター分析は顧客のセグメンテーションやターゲティングなどの用途には向いていない。
  2. Anomaly detectionは、データセット内の異常なデータポイントを自動的に検出することができる。 これは、不正取引の特定、ハードウェアの欠陥の発見、あるいはデータ入力時のヒューマンエラーによる異常値の特定に役立つ。
  3. 潜在変数モデルは、データセット内の特徴の数を減らす(次元削減)、またはデータセットを複数のコンポーネントに分解するなど、データの前処理によく使用されます。 たとえば、教師なし手法でデータのクラスタ分析を行い、各行が属するクラスタを教師あり学習モデルの追加特徴として使用することができます (半教師あり機械学習参照)。 他の例としては、異常検出スコアを追加機能として使用する詐欺検出モデルがあります。

    教師なし機械学習 + DataRobot

    DataRobot 自動機械学習プラットフォームは、「ターゲット」列を必要とします。 しかし、そのモデル ブループリントの多くは、教師なし学習を利用して、自動化なしでは実装が困難で時間のかかる複雑な特徴工学技術を自動化しています。

    DataRobotで教師なし機械学習を次のレベルへ

    Start now

コメントを残す

メールアドレスが公開されることはありません。