Comentarios sobre Content-Based Recommendation Systems
Sep 4, 2016 · 1 minute read · Commentsrecsys
A modo de reseña, los sistemas recomendados basados en contenido analizan la descripción de los items para buscar cuáles son de interés para el usuario.
¿Cómo los representamos?
Bueno si es texto libre, podemos tomar cada palabra y pasarla por un proceso de stemming para considerarlas como features.
Típicamente está el problema de que se pierde el contexto de las palabras. No obstante, me pregunto si los algoritmos de stemming están adaptados al rápido cambio del lenguaje. Pensemos que en Instagram los emojis compiten con los caracteres alfanuméricos en cantidades.
- The Rise of Emoji on Instagram Is Causing Language Repercussions
- Emojineering Part 1: Machine Learning for Emoji Trends
También está la opción de usar perfiles de usuario, vecinos cercanos, etc. Sin embargo me pareció interesante el algoritmo de Rocchio: creo que hoy en día con lo avanzadas que son las interfaces gráficas para el usuario, se podría sacar harto provecho a este.
Si bien el paper es largo, deja gusto a poco porque no se llega a un final concluyente. Es como un paseo por lo que hay hasta ahora (ese entonces) de los recomendadores basados en contenido.