
El grupo JP/Politikens, uno de los principales conglomerados de medios en Dinamarca, comenzó a experimentar con inteligencia artificial (IA) a finales de 2019, adelantándose al auge actual de esta tecnología. En octubre de 2020, la compañía puso en marcha el proyecto Platform Intelligence in News (PIN) en Ekstra Bladet, uno de sus tres principales diarios nacionales, con un equipo de 17 personas. Su objetivo era transformar la experiencia de lectura y hacer que el medio evolucionara hacia un modelo impulsado por IA.
Según ha compartido en WAN-IFRA Kasper Lindskow, director de IA en JP/Politikens Media Group, el proyecto PIN se centró en tres ejes fundamentales:
- Ampliar la experiencia informativa, con un ecosistema de noticias más profundo y rico en contenido.
- Asegurar la alineación de los sistemas de IA con los valores editoriales, manteniendo el control sobre la tecnología utilizada.
- Fomentar un uso responsable de la IA en medios de comunicación, compartiendo conocimientos y aprendizajes sobre su implementación.
El éxito del proyecto fue reconocido en los Digital Media Awards Worldwide de WAN-IFRA, donde Ekstra Bladet fue galardonado por su uso innovador de IA en la estrategia de ingresos.
Un ecosistema de noticias más amplio: sistemas de recomendación
Uno de los pilares de la iniciativa fue la implementación de sistemas de recomendación basados en IA para personalizar la lectura y mejorar la experiencia del usuario en ekstrabladet.dk. A diferencia de plataformas de entretenimiento donde los contenidos tienen una vida útil más larga, las noticias pierden relevancia con rapidez. La clave era equilibrar la popularidad de las historias con la personalización sin generar burbujas de información.
El sistema de recomendación de Ekstra Bladet incluyó varios modelos:
- Filtrado colaborativo (x4): analiza patrones de comportamiento de usuarios similares para predecir preferencias. Aunque favorecía noticias populares, podía generar sesgos hacia ciertos temas.
- Filtrado basado en contenido (x2): clasifica noticias según temáticas, utilizando técnicas de procesamiento del lenguaje natural (NLP). Esto permitía descubrir contenido de nicho, aunque podía reforzar demasiado las preferencias previas de los usuarios.
- Modelos híbridos (x2): combinaban ambas técnicas para optimizar la diversidad y personalización de las recomendaciones.
- Modelos de aprendizaje contrastivo: evaluaban la similitud entre artículos con técnicas de aprendizaje profundo, garantizando una coherencia temática más allá de la coincidencia de palabras clave.
La implementación en la página principal del medio incluyó secciones deslizables con diferentes modelos de IA:
- Noticias destacadas: mostraban las historias más leídas del momento.
- Sugerencias personalizadas: basadas en el historial de lectura de cada usuario.
- Recomendaciones mixtas: equilibraban la personalización con una mayor diversidad informativa.
Resultados y mejoras en el compromiso del lector
Los cambios implementados llevaron a un incremento significativo en la interacción de los usuarios:
- 110 % más consumo de artículos gratuitos.
- 38 % más de lecturas de artículos de pago.
- 35 % más de conversiones a suscripciones.
Las pruebas A/B demostraron que los modelos colaborativos aumentaban la interacción, pero favorecían noticias ya populares, mientras que los modelos híbridos equilibraban mejor la personalización y la diversidad de contenido.
Mayor profundidad informativa: procesamiento del lenguaje natural (NLP)
Para enriquecer la experiencia de lectura, Ekstra Bladet usó modelos de NLP para clasificar noticias, generar etiquetas automáticas y mejorar las recomendaciones de contenido relacionado.
Entre las implementaciones clave destacaron:
- Clasificación de temas: modelos de redes neuronales que categorizaban los artículos en taxonomías como IAB e IPTC.
- Reconocimiento de entidades (NER): identificación y etiquetado automático de nombres de personas, empresas y lugares.
- Análisis de sentimiento: evaluación del tono emocional de los artículos, mejorando la segmentación de contenido.
Estos cambios impulsaron un 120 % más de tráfico desde sugerencias de artículos relacionados, además de mejorar la precisión en la segmentación de noticias y publicidad semántica sin necesidad de rastrear datos de los usuarios.
Cobertura más rica: generación automática de textos (NLG)
Ekstra Bladet también empleó IA generativa para ampliar la cobertura de noticias locales. La automatización permitió incrementar el volumen de contenidos sin perder supervisión editorial.
El sistema desarrollado, llamado MAGNA (Monitoring and Assisted Generation of News Artefacts), evolucionó en varias etapas:
- Automatización basada en reglas: generación de noticias breves sobre tráfico, clima y datos financieros con AX Semantics.
- Resúmenes híbridos con IA: uso de modelos GPT con un enfoque de Recuperación Aumentada de Generación (RAG) para anclar las respuestas en datos reales y reducir errores.
- Supervisión editorial: revisión humana antes de publicar noticias generadas por IA, con un sistema de retroalimentación para mejorar la precisión.
Los resultados fueron notables:
- 289 artículos generados con IA en 2023.
- Mejoras en la generación de titulares, aumentando el compromiso de los lectores.
- Reducción de errores en artículos automatizados del 41 % al 10 %.
El uso de IA permitió a los periodistas enfocarse en reportajes más profundos, mientras que la automatización se encargaba de generar noticias rutinarias.
Desarrollo interno y normativas para la IA en medios
Uno de los aspectos diferenciadores del proyecto PIN fue la apuesta por desarrollar modelos propios en lugar de depender de soluciones externas. Para ello, JP/Politikens estableció alianzas con universidades y llevó a cabo más de 50 pruebas A/B para ajustar la implementación de la IA en su flujo de trabajo.
Entre los aprendizajes clave se destacó:
- El filtrado colaborativo de plataformas como Netflix no es óptimo para noticias. Los sistemas basados en contenido y NLP ofrecen mejores resultados en este contexto.
- El diseño de los algoritmos influye en los patrones de consumo. Para evitar sesgos y segmentaciones excesivas, Ekstra Bladet empleó una combinación de modelos.
- La IA generativa funciona mejor cuando se basa en bases de datos externas. Vincular herramientas como ChatGPT a archivos periodísticos minimiza el riesgo de errores o “alucinaciones” informativas.
Para fomentar el desarrollo responsable de la IA en medios, Ekstra Bladet ha compartido parte de sus algoritmos de NLP en código abierto, así como conjuntos de datos para el entrenamiento de modelos de recomendación.