Ez a második része az Ajánló rendszerekről szóló sorozatomnak. Az előző bejegyzés a RecSys bemutatása volt. Ma a kollaboratív szűrés három típusát ismertetem részletesebben: Felhasználó-alapú együttműködő szűrés (UB-CF) és tétel-alapú együttműködő szűrés (IB-CF).
Kezdjük el.
Tegyük fel, hogy egy filmet szeretnénk ajánlani Stanley barátunknak. Feltételezhetjük, hogy hasonló embereknek hasonló az ízlésük. Tegyük fel, hogy Stanley és én ugyanazokat a filmeket láttuk, és szinte egyformán értékeltük őket. De Stanley még nem látta a Keresztapát: Part II”-t, én pedig igen. Ha én szeretem azt a filmet, logikusan hangzik, hogy ő is szeretni fogja. Ezzel létrehoztunk egy mesterséges értékelést a hasonlóságunk alapján.
Nos, az UB-CF ezt a logikát használja, és úgy ajánlja az elemeket, hogy az aktív felhasználóhoz (akinek megpróbálunk ajánlani egy filmet) hasonló felhasználókat talál. Ennek egy konkrét alkalmazása a felhasználó alapú Nearest Neighbor algoritmus. Ennek az algoritmusnak két feladatra van szüksége:
1. Keresse meg az a felhasználó K legközelebbi szomszédját (KNN), egy w hasonlósági függvényt használva az egyes felhasználói párok közötti távolság mérésére: