Un equipo de investigadores de la Hefei University of Technology y del Institute of Artificial Intelligence del Hefei Comprehensive National Science Center ha propuesto un nuevo modelo para sistemas de recomendación de noticias que intenta resolver una de las limitaciones habituales de estas tecnologías: la dificultad para distinguir entre los intereses duraderos de los usuarios y los cambios rápidos provocados por acontecimientos recientes, temas emergentes o variaciones estacionales en el consumo informativo.
El trabajo, titulado “Modeling Stage-wise Evolution of User Interests for News Recommendation”, plantea un marco que combina señales globales de comportamiento con subgrafos temporales para seguir la evolución por etapas de las preferencias de lectura.
La investigación parte de una premisa especialmente relevante para los medios digitales: las noticias pierden valor de recomendación con rapidez cuando surgen nuevos hechos o cambian las prioridades informativas de los lectores. Un usuario puede mantener un interés estable por la economía, la política o el deporte, pero su conducta de lectura también puede alterarse durante un mundial, una crisis sanitaria, unas elecciones o una noticia de última hora.
Los autores sostienen que muchos modelos actuales trabajan con un único grafo estático de interacciones entre usuarios y noticias, lo que permite captar patrones colaborativos generales, pero dificulta representar cómo evolucionan los intereses en distintos periodos.
El modelo propuesto separa el problema en dos planos. El primero es un módulo de preferencia global, que aprende patrones de largo plazo a partir de todo el historial de interacciones entre usuarios y noticias. Ese componente identifica hábitos relativamente estables y relaciones colaborativas de alto nivel.
El segundo es un módulo de preferencia local, que divide el historial de clics en ventanas temporales y construye subgrafos por etapas. Cada una de esas etapas intenta representar un tramo concreto de comportamiento, de modo que el sistema no mezcle de forma indiscriminada señales antiguas con intereses recientes.
El componente local combina dos mecanismos. Una rama basada en LSTM modela la evolución progresiva de los intereses a corto plazo, es decir, cómo cambian las preferencias de una etapa temporal a la siguiente. Otra rama basada en autoatención recupera dependencias de más largo alcance dentro del historial del usuario, para evitar que el modelo se limite solo al comportamiento más reciente y pierda información relevante de etapas anteriores. La combinación de ambas ramas permite que el sistema atienda tanto a variaciones inmediatas como a patrones históricos que siguen siendo útiles para ordenar las recomendaciones.
Los autores han evaluado el modelo con dos conjuntos de datos de referencia en recomendación de noticias: Adressa-large, con más de 3,6 millones de usuarios, 81.018 noticias y 35,2 millones de clics durante tres meses, y MIND-large, con un millón de usuarios, 161.013 noticias y 24,1 millones de clics durante seis semanas. En Adressa, el modelo alcanza un AUC de 0,7993 frente al 0,6553 de CROWN, el mejor competidor entre los métodos comparados. También obtiene una MRR de 0,5223, frente al 0,4056 de LightGCN y al 0,3915 de CROWN. En MIND, la mejora es menor pero constante: el sistema logra un AUC de 0,5804, una MRR de 0,4368 y un nDCG@10 de 0,5171, por encima de los modelos NPA, NRMS, NAML, LightGCN, CNE-SUE, TCCM y CROWN analizados en el estudio.
El análisis de ablación (un análisis de ablación consiste en eliminar sistemáticamente ciertos componentes o características de un sistema para observar cómo afecta su rendimiento general) muestra que la mejora no depende de una única pieza del sistema. Cuando los investigadores eliminan el módulo de preferencia local, el rendimiento en Adressa cae de un AUC de 0,7993 a 0,4880.
La retirada de la rama de evolución a corto plazo reduce especialmente métricas sensibles a la posición de las noticias recomendadas, mientras que la eliminación de la rama de agregación de largo alcance también perjudica el rendimiento. La supresión del módulo global deja al modelo sin la señal estructural que aporta el historial completo, lo que confirma que el sistema necesita tanto estabilidad como adaptación temporal.
La investigación también analiza el tamaño de las ventanas temporales. En Adressa, una segmentación de dos semanas ofrece el mejor equilibrio entre granularidad y densidad de datos. Ventanas demasiado cortas pueden producir subgrafos escasos y representaciones inestables, mientras que ventanas demasiado largas tienden a diluir los cambios finos de interés.
Este punto tiene una lectura práctica para medios y plataformas informativas: la actualización de los perfiles de usuario no puede depender solo de la última sesión ni de un historial acumulado sin distinción temporal, sino de una estructura que permita identificar periodos de interés diferenciados.
El trabajo incluye además una prueba específica sobre la capacidad del modelo para priorizar noticias recientes. Los autores dividen a los usuarios de Adressa en grupos según su frecuencia de interacción y comparan el modelo completo con una versión sin el módulo local. En usuarios con mucha actividad, el modelo completo mejora la posición media de las noticias nuevas dentro del top 10 de recomendaciones. En usuarios de interacción media y baja, aumenta la presencia de noticias recientes y mantiene una mejor ordenación de contenidos históricos relevantes. Este resultado apunta a una aplicación directa en productos periodísticos: recomendar actualidad sin romper por completo la continuidad de los intereses previos del lector.
La investigación no aborda cuestiones editoriales como diversidad informativa, exposición a puntos de vista distintos o control de cámaras de eco, aunque su enfoque tiene implicaciones para esas áreas. Un sistema de recomendación más sensible al tiempo puede servir para ofrecer contenidos más oportunos, pero también requiere decisiones de diseño sobre qué peso deben tener la actualidad, la relevancia personal, la pluralidad temática y los objetivos editoriales del medio.
La propuesta se sitúa, por tanto, en la capa técnica de personalización, pero toca uno de los problemas centrales de los productos informativos digitales: cómo adaptar la distribución de noticias a lectores con intereses cambiantes sin reducir la experiencia informativa a una suma de clics recientes.



