Sistemas Recomendadores – Filtragem Colaborativa Baseada no Usuário e no Item

>

Esta é a parte 2 da minha série sobre Sistemas Recomendados. O último post foi uma introdução ao RecSys. Hoje vou explicar com mais detalhes três tipos de Filtragem Colaborativa: Filtragem Colaborativa Baseada no Usuário (UB-CF) e Filtragem Colaborativa Baseada no Item (IB-CF).

Vamos começar.

Imagine que queremos recomendar um filme ao nosso amigo Stanley. Poderíamos supor que pessoas semelhantes terão gostos semelhantes. Suponhamos que eu e Stanley tenhamos visto os mesmos filmes, e os tenhamos classificado todos quase de forma idêntica. Mas Stanley ainda não viu “O Padrinho”: Parte II’ e eu vimos. Se eu amo esse filme, parece lógico pensar que ele também vai ver. Com isso, criamos uma classificação artificial baseada na nossa similaridade.

Bem, UB-CF usa essa lógica e recomenda itens ao encontrar usuários similares ao usuário ativo (para quem estamos tentando recomendar um filme). Uma aplicação específica deste algoritmo é o algoritmo baseado no usuário Vizinho Mais Próximo. Este algoritmo necessita de duas tarefas:

1. Encontrar os vizinhos K-nearest (KNN) para o usuário a, usando uma função de similaridade w para medir a distância entre cada par de usuários:

>

2.Preveja a classificação que o usuário a dará a todos os itens que os vizinhos k consumiram, mas a não consumiu. Procuramos o item j com a melhor avaliação prevista.

Em outras palavras, estamos criando uma Matriz User-Item, prevendo as avaliações nos itens que o usuário ativo não viu, com base nos outros usuários similares. Esta técnica é baseada em memória.

Preencher os espaços em branco

PROS:

  • Fácil de implementar.
  • Contexto independente.
  • Em comparação com outras técnicas, como a baseada no conteúdo, é mais preciso.

CONS:

  • Separsidade: A percentagem de pessoas que classificam itens é realmente baixa.
  • Scalabilidade: Quanto mais K vizinhos considerarmos (abaixo de um certo limite), melhor deve ser a minha classificação. No entanto, quanto mais usuários houver no sistema, maior será o custo de encontrar os vizinhos K mais próximos.
  • Cold-start: Novos usuários terão pouca ou nenhuma informação sobre eles para serem comparados com outros usuários.
  • Novo item: Assim como o último ponto, novos itens não terão classificações para criar uma classificação sólida (Mais sobre ‘Como classificar e classificar itens’).

Filtragem Colaborativa Baseada em Ítem (IB-CF)

Voltar para Stanley. Ao invés de nos concentrarmos em seus amigos, poderíamos nos concentrar em quais itens de todas as opções são mais parecidos com o que sabemos que ele gosta. Este novo foco é conhecido como Item-Based Collaborative Filtering (IB-CF).

Podíamos dividir o IB-CF em duas subtarefas:

1.Calcular similaridade entre os itens:

  • Semelhança Baseada em Co-Relação
  • Semelhança Baseada em Correlação
  • Similaridade Cosina Ajustada
  • 1-Distância entre Acardos

2.Cálculo da Predição:

  • Soma Ponderada
  • Regressão

A diferença entre UB-CF e este método é que, neste caso, nós pré-calculamos diretamente a similaridade entre os itens co-relacionados, pulando a pesquisa de vizinhanças K.

Slope One

Slope One faz parte da família de Filtragem Colaborativa Baseada em Itens, introduzida em um artigo de 2005 por Daniel Lemire e Anna Maclachlan chamado Slope One Predictors for Online Rating-Based Collaborative Filtering.

A idéia principal por trás deste modelo é a seguinte:

Suponha que temos dois usuários diferentes: A e B. Também temos o item I e o item J. Usuário A item I com 1 estrela e o item J com 1,5. Se o usuário B avaliar o item I com 2. Podemos assumir que a diferença entre os dois itens será a mesma que o usuário A. Com isto em mente, o usuário B classificaria o item J como: 2+ (1,5-1) = 2,5

Principal ideia por detrás da inclinação Um

Os autores concentram-se em 5 objectivos:
1. Fácil de implementar e manter.
2. Atualizável online: novas classificações devem mudar as previsões rapidamente.
3. Eficiente no momento da consulta: o armazenamento é o principal custo.
4. Funciona com pouco feedback do usuário.
5. Razoavelmente preciso, dentro de certos intervalos em que um pequeno ganho em precisão não significa um grande sacrifício de simplicidade e escalabilidade.

Recap

Vimos Filtragem Colaborativa Baseada no Usuário e Baseada no Item. O primeiro tem um foco no preenchimento de uma matriz de item-usuário e recomendação baseada nos usuários mais parecidos com o usuário ativo. Por outro lado, o IB-CF preenche uma matriz Item-Item e recomenda com base em itens semelhantes.

É difícil explicar brevemente todos estes assuntos, mas compreendê-los é o primeiro passo para se aprofundar no RecSys.

Deixe uma resposta

O seu endereço de email não será publicado.