Preencher os espaços em branco
PROS:
- Fácil de implementar.
- Contexto independente.
- Em comparação com outras técnicas, como a baseada no conteúdo, é mais preciso.
CONS:
- Separsidade: A percentagem de pessoas que classificam itens é realmente baixa.
- Scalabilidade: Quanto mais K vizinhos considerarmos (abaixo de um certo limite), melhor deve ser a minha classificação. No entanto, quanto mais usuários houver no sistema, maior será o custo de encontrar os vizinhos K mais próximos.
- Cold-start: Novos usuários terão pouca ou nenhuma informação sobre eles para serem comparados com outros usuários.
- Novo item: Assim como o último ponto, novos itens não terão classificações para criar uma classificação sólida (Mais sobre ‘Como classificar e classificar itens’).
Filtragem Colaborativa Baseada em Ítem (IB-CF)
Voltar para Stanley. Ao invés de nos concentrarmos em seus amigos, poderíamos nos concentrar em quais itens de todas as opções são mais parecidos com o que sabemos que ele gosta. Este novo foco é conhecido como Item-Based Collaborative Filtering (IB-CF).
Podíamos dividir o IB-CF em duas subtarefas:
1.Calcular similaridade entre os itens:
- Semelhança Baseada em Co-Relação
- Semelhança Baseada em Correlação
- Similaridade Cosina Ajustada
- 1-Distância entre Acardos
2.Cálculo da Predição:
A diferença entre UB-CF e este método é que, neste caso, nós pré-calculamos diretamente a similaridade entre os itens co-relacionados, pulando a pesquisa de vizinhanças K.
Slope One
Slope One faz parte da família de Filtragem Colaborativa Baseada em Itens, introduzida em um artigo de 2005 por Daniel Lemire e Anna Maclachlan chamado Slope One Predictors for Online Rating-Based Collaborative Filtering.
A idéia principal por trás deste modelo é a seguinte:
Suponha que temos dois usuários diferentes: A e B. Também temos o item I e o item J. Usuário A item I com 1 estrela e o item J com 1,5. Se o usuário B avaliar o item I com 2. Podemos assumir que a diferença entre os dois itens será a mesma que o usuário A. Com isto em mente, o usuário B classificaria o item J como: 2+ (1,5-1) = 2,5
Os autores concentram-se em 5 objectivos:
1. Fácil de implementar e manter.
2. Atualizável online: novas classificações devem mudar as previsões rapidamente.
3. Eficiente no momento da consulta: o armazenamento é o principal custo.
4. Funciona com pouco feedback do usuário.
5. Razoavelmente preciso, dentro de certos intervalos em que um pequeno ganho em precisão não significa um grande sacrifício de simplicidade e escalabilidade.
Recap
Vimos Filtragem Colaborativa Baseada no Usuário e Baseada no Item. O primeiro tem um foco no preenchimento de uma matriz de item-usuário e recomendação baseada nos usuários mais parecidos com o usuário ativo. Por outro lado, o IB-CF preenche uma matriz Item-Item e recomenda com base em itens semelhantes.
É difícil explicar brevemente todos estes assuntos, mas compreendê-los é o primeiro passo para se aprofundar no RecSys.