Aprendizagem Sem Supervisão da Máquina

O que significa a aprendizagem sem supervisão da máquina?

Os algoritmos de aprendizagem sem supervisão da máquina inferem padrões de um conjunto de dados sem referência a resultados conhecidos, ou rotulados. Ao contrário da aprendizagem supervisionada de máquinas, os métodos de aprendizagem não supervisionada de máquinas não podem ser aplicados directamente a uma regressão ou a um problema de classificação porque você não tem ideia de quais podem ser os valores dos dados de saída, tornando impossível para você treinar o algoritmo da forma que você normalmente faria. A aprendizagem não supervisionada pode ser usada para descobrir a estrutura subjacente dos dados.

Por que é importante a aprendizagem não supervisionada de máquinas?

Aprendizagem não supervisionada de máquinas pretende descobrir padrões previamente desconhecidos nos dados, mas na maioria das vezes esses padrões são aproximações pobres do que a aprendizagem supervisionada de máquinas pode alcançar. Além disso, como você não sabe quais devem ser os resultados, não há como determinar quão precisos eles são, tornando a aprendizagem supervisionada de máquinas mais aplicável a problemas do mundo real.

O melhor momento para usar a aprendizagem não supervisionada de máquinas é quando você não tem dados sobre os resultados desejados, como determinar um mercado alvo para um produto totalmente novo que o seu negócio nunca vendeu antes. Entretanto, se você estiver tentando entender melhor a sua base de consumidores existente, a aprendizagem supervisionada é a técnica ideal.

Algumas aplicações de técnicas de aprendizagem de máquinas sem supervisão incluem:

  1. Clustering permite dividir automaticamente o conjunto de dados em grupos de acordo com a similaridade. No entanto, muitas vezes, a análise de agrupamento sobrestima a similaridade entre grupos e não trata os pontos de dados como indivíduos. Por este motivo, a análise de cluster é uma escolha ruim para aplicações como segmentação de clientes e direcionamento.
  2. A detecção de anomalias pode descobrir automaticamente pontos de dados incomuns em seu conjunto de dados. Isso é útil para identificar transações fraudulentas, descobrir partes defeituosas de hardware ou identificar um outlier causado por um erro humano durante a entrada de dados.
  3. Association mining identifica conjuntos de itens que freqüentemente ocorrem juntos em seu conjunto de dados. Os varejistas freqüentemente o utilizam para análise de cestas, porque permite aos analistas descobrir bens frequentemente comprados ao mesmo tempo e desenvolver estratégias mais eficazes de marketing e merchandising.
  4. Modelos de variáveis latentes são comumente usados para o pré-processamento de dados, como a redução do número de características em um conjunto de dados (redução de dimensionalidade) ou a decomposição do conjunto de dados em múltiplos componentes.

Os padrões que você descobre com métodos de aprendizagem de máquinas não supervisionados também podem vir a ser úteis ao implementar mais tarde métodos de aprendizagem de máquinas supervisionados. Por exemplo, você pode usar uma técnica não supervisionada para realizar análise de cluster nos dados, depois usar o cluster ao qual cada linha pertence como uma característica extra no modelo de aprendizagem supervisionada (ver aprendizagem de máquina semi-supervisionada). Outro exemplo é um modelo de detecção de fraude que usa resultados de detecção de anomalias como uma característica extra.

Aprendizagem sem supervisão de máquina + DataRobot

A plataforma de aprendizagem automática DataRobot requer uma coluna “alvo” – ou seja, precisa conhecer a variável de saída para descobrir padrões nos seus dados. No entanto, muitos de seus modelos utilizam aprendizagem sem supervisão para automatizar técnicas complicadas de engenharia de recursos, que são difíceis e demoradas de implementar sem automação.

>Tomar a aprendizagem sem supervisão da máquina para o próximo nível com DataRobot

Iniciar agora

Deixe uma resposta

O seu endereço de email não será publicado.