Comentarios sobre A survey of active learning in CF recommender systems

Otro paper que hace un resumen del estado actual de los sistemas recomendadores.

Aprendizaje Activo

Este le da énfasis a lo que es el Active Learning, que corresponde a la funcionalidad de un sistema recomendador que ayuda a mejorar las recomendaciones. El fin es poder de solucionar en parte el problema del Cold Start y la falta de datos.

Es importante mencionar que esto ocurre Online y preguntándole al usuario sobre su gusto sobre ciertos ítems que el sistema considera importantes para mejorar las recomendaciones. Idealmente, preguntándole de manera personalizada a cada usuario y no preguntarle a todos lo mismo, con el fin de obtener resultados más finos.

Estrategias

Dentro de las estrategias, me llama la atención que aparecen conceptos de Minería de Datos como Information Gain through Clustered Neighbours (IGCN) y Decision Tree. Hace bastante sentido, pues queremos obtener la mayor información posible del usuario (ganancia de información) con la menor cantidad de preguntas. También que podemos clasificar a un usuario con un árbol de decisión en base a pruebas sobre sus gustos.

Lo que más destaco es que mencionan la posibilidad de aplicar diversas estrategias sobre grupos distintos de usuarios, con el fin de encontrar la mejor estrategia para ellos. Esto es casi como “recomendarles la mejor estrategia recomendadora”. Esto es muy aplicable hoy en día usando A/B Testing.

Offline vs Online

También se discute las diferencias entre sistemas offline (que se entrenan y prueban dentro de un entorno científico) versus los online que corren en producción con usuario reales. Si bien trata el tema a favor de online por ser más fiel a la realidad, todavía no veo implementaciones, ideas, sugerencias y/o recomendaciones de como llevarlos a la realidad.

Críticas finales

En primer lugar la tabla Table 1 – Performance comparison of active learning strategies no deja explícito el criterio para decir que un algoritmo es Very good, Good, o Poor bajo ciertas métricas.

Finalmente me parece extraño que el artículo sea de este año (2016) y se siga hablando de técnicas y algoritmos de hace 10-15 años. Hace mención de técnicas como aprendizaje reforzado, pero yo esperaría más profundidad en redes neuronales y tensores ya a estas alturas.

comments powered by Disqus