Un estudio realizado durante cinco semanas con 120 lectores de noticias en Estados Unidos ha concluido que los sistemas de recomendación pueden aumentar de forma sustancial la diversidad de contenidos leídos cuando combinan la personalización temática con un equilibrio deliberado entre noticias nacionales e internacionales, sin que esa intervención reduzca el nivel general de interacción de los usuarios con los artículos recomendados.
El trabajo, elaborado por investigadores de Grouplens Research (University of Minnesota) y Northwestern University, se desarrolló en POPROX, una plataforma experimental que envía boletines diarios personalizados con noticias de Associated Press, y comparó tres modelos de recomendación: uno basado solo en calibración temática, otro que añadía calibración por procedencia geográfica de la noticia y un tercero que incorporaba además titulares y sumarios reescritos con un modelo de lenguaje.
La investigación parte de un problema central para los medios que utilizan sistemas de recomendación: la personalización mejora la relevancia inmediata de los contenidos, pero puede reforzar hábitos estrechos de consumo informativo si el algoritmo se limita a reproducir lo que el lector ya suele leer.
Los autores distinguen entre diversidad de oferta (lo que el medio o proveedor publica), diversidad de exposición (lo que el sistema muestra al usuario) y diversidad de consumo (lo que el usuario finalmente abre o lee). Su aportación consiste en medir si una recomendación más diversa puede traducirse no solo en una portada o boletín más variado, sino también en una lectura efectivamente más variada.
El modelo principal del estudio introduce una doble calibración. Por un lado, mantiene la personalización por temas, de modo que el sistema sigue teniendo en cuenta los intereses previos del lector en áreas como política, deportes, economía, salud, tecnología, ciencia, educación o entretenimiento. Por otro, incorpora una segunda dimensión, la localidad de la noticia, para equilibrar la proporción entre contenidos nacionales, internacionales y piezas sin una afinidad geográfica clara. En la práctica, esto significa que el recomendador no solo intenta acertar con los temas que interesan al usuario, sino también evitar que el boletín quede dominado por una sola procedencia informativa cuando la oferta disponible contiene una combinación más amplia.
Los resultados muestran que la doble calibración redujo de forma muy marcada la distancia entre la diversidad de la oferta disponible y la diversidad de los contenidos mostrados a los lectores. Frente al sistema basado únicamente en temas, el grupo con calibración por tema y localidad registró una reducción aproximada del 97% en la divergencia de exposición, mientras que el grupo que añadió además personalización textual mediante IA redujo esa divergencia en torno al 92%.
La mejora no se limitó a lo que el sistema enseñaba, sino que también apareció en lo que los usuarios abrían: la divergencia en consumo cayó aproximadamente un 93% en el grupo con doble calibración y un 92% en el grupo con doble calibración más titulares personalizados.
El dato relevante para las redacciones es que el aumento de diversidad no produjo una caída significativa del engagement. El estudio no encontró evidencias de que añadir la dimensión nacional e internacional al sistema de recomendación perjudicara la probabilidad general de clic.
La posición del artículo dentro del boletín siguió siendo uno de los factores con más peso en la interacción, y el interés temático previo continuó siendo un predictor importante de los clics, pero la intervención orientada a diversidad no redujo la respuesta de los usuarios. Según los modelos estadísticos utilizados por los investigadores, un lector del grupo de referencia tenía una probabilidad aproximada del 4% de hacer clic en un artículo recomendado, una vez controlados factores como posición, semana del experimento e intereses previos.
La parte menos concluyente del estudio corresponde a los titulares y sumarios reescritos con inteligencia artificial. Los investigadores probaron dos estrategias. La primera era una reescritura basada en eventos: el sistema conectaba una noticia nueva con otra pieza que el lector ya había leído cuando existía una similitud suficiente entre ambas.
La segunda era una reescritura basada en temas: si no había una noticia previa claramente relacionada, el sistema reformulaba el avance de la pieza a partir de las áreas de interés del usuario. El objetivo no era alterar los hechos, sino hacer más visible la relación entre un contenido menos familiar y los hábitos informativos del lector.
La personalización textual con IA no mejoró de forma significativa la diversidad de consumo más allá del efecto ya producido por la doble calibración algorítmica. Sin embargo, el análisis interno de las estrategias de reescritura ofrece un matiz importante: los avances basados en eventos aumentaron la probabilidad de clic en torno a un 42% frente a los artículos sin reescritura, aunque solo pudieron aplicarse al 10% de los artículos por las restricciones de seguridad, coherencia y legitimidad de la conexión entre piezas. Las reescrituras basadas en temas fueron más frecuentes, pero tendieron a reforzar el interés previo del lector más que a abrir nuevas vías de selección informativa.
El estudio subraya un límite relevante para el uso de modelos de lenguaje en productos informativos. La reformulación personalizada puede facilitar que el usuario entienda por qué una noticia le puede resultar relevante, pero también introduce el riesgo de sobreadaptar el titular o el sumario hasta distorsionar el foco original de la información. Los investigadores ajustaron el umbral de similitud entre artículos tras varias pruebas piloto y descartaron conexiones problemáticas, como casos en los que el sistema vinculaba noticias sin una relación informativa suficiente mediante asociaciones demasiado genéricas. La conclusión operativa es que la IA generativa puede ser útil para explicar relevancia, pero necesita controles estrictos para no convertir la personalización en una reinterpretación forzada de la noticia.
El trabajo también apunta a una cuestión editorial de fondo. Los boletines personalizados no tienen por qué limitarse a maximizar afinidad inmediata con el usuario; pueden incorporar objetivos informativos definidos por el medio, como ampliar la exposición a asuntos internacionales o equilibrar la dieta informativa entre distintos niveles de proximidad.
En las encuestas del experimento, los usuarios expuestos a los modelos con doble calibración mantuvieron o aumentaron su valoración de un boletín equilibrado entre noticias internacionales y nacionales, mientras que en el grupo de control esa percepción descendió. Los autores advierten, no obstante, de que las respuestas de encuesta fueron limitadas (94 cuestionarios de 28 participantes), por lo que esos datos deben leerse como tendencias observacionales y no como prueba estadística concluyente.
La principal implicación para los medios es que la diversidad puede integrarse en la arquitectura de recomendación sin romper la lógica de personalización. El sistema no sustituye el interés del lector por una selección abstracta de contenidos variados, sino que combina sus preferencias temáticas con una regla adicional de equilibrio informativo. Esa aproximación puede ser especialmente relevante para periódicos, agencias y boletines que quieran evitar que la personalización derive en rutinas demasiado estrechas de lectura, pero también necesiten conservar métricas de interacción suficientes para sostener el producto.
El estudio tiene límites que los propios autores detallan. La clasificación de las noticias dependía de las etiquetas editoriales y automáticas de Associated Press, la muestra procedía de una plataforma experimental con usuarios activos y el seguimiento de comportamiento se restringió a los clics, sin datos más granulares sobre aperturas, tiempo de lectura o lectura completa.
Aun así, los resultados aportan evidencia empírica a una pregunta que afecta directamente al diseño de productos periodísticos personalizados: los recomendadores pueden configurarse para ampliar la dieta informativa del lector, y la intervención algorítmica sobre la composición del boletín parece más eficaz que la simple reformulación textual de los titulares con IA.



