Inicio Audiencia The Washington Post quiere liderar la era de los bots en medios...

The Washington Post quiere liderar la era de los bots en medios informativos con la Generación Aumentada por Recuperación

La tecnología puede comprender la intención en las preguntas de los usuarios, en lugar de depender solo de palabras clave como lo hacen otras plataformas de IA

Por

REDACCIÓN

24 abril, 2024

redaccion-de-the-washington-Post — Redacción de The Washington Post. Foto: Prim Discovery /Depositphotos

El Washington Post, en colaboración con el Centro Sanghani de Análisis de Datos y Artificiales de Virginia Tech, está desarrollando una herramienta de respuestas impulsada por inteligencia artificial, basada en su propia cobertura periodística. El desarrollo del proyecto se está llevando a cabo en instalaciones en Arlington y Falls Church, aunque el desarrollo se trasladará al Innovation Campus de Virginia, que abrirá el año que viene.

Sam Han, jefe de datos e IA en el periódico, explicó a Technical.ly, que la tecnología se está diseñando para comprender la intención en las preguntas de los usuarios, en lugar de depender solo de palabras clave como lo hacen otras plataformas de IA.

El Post, señala Han, quiere liderar la era de los bots informativos alimentados por IA y las nuevas formas en que las personas encuentran y consumen información.

“La gente se está acostumbrando a hacer preguntas, [obtener] respuestas directamente, en lugar de leer y comprender”, dijo Han. “Esa es la tendencia que estamos observando. Y queremos estar en esa transformación (o, en cierto modo, revolución) para liderar como empresa de tecnología de medios. Queremos prepararnos técnicamente para poder ofrecer la mejor experiencia mediática a los lectores”.

La tecnología considerará suposiciones implícitas y el contexto. Han dio el ejemplo de alguien que pregunta quién ganó el Super Bowl: por lo general, preguntan sobre el campeonato más reciente, no sobre años anteriores.

Te puede interesar: Cinco áreas en las que tomar medidas para reducir el "burnout" en el mundo del periodismo

Para preguntas como estas, entre otras, se utilizará una técnica llamada generación aumentada de recuperación (Retrieval-Augmented Generation, RAG por sus siglas en inglés) para proporcionar respuestas que tengan más probabilidades de responder realmente a la pregunta de alguien. Han señaló que la RAG interpreta y permite que un sistema de IA generativa acceda a información nueva más allá de sus datos de entrenamiento inicial, en este caso, la cobertura actualizada del periódico.

¿Qué es la RAG?

La Generación Aumentada por Recuperación es una técnica avanzada que optimiza la salida de modelos de lenguaje de gran tamaño (LLM), permitiéndoles hacer referencia a bases de conocimientos externas y autorizadas antes de generar una respuesta. Esto extiende las capacidades de los LLM, que normalmente son entrenados con enormes cantidades de datos, para generar respuestas más precisas y específicas sin necesidad de reentrenamiento.

Esta tecnología es crucial porque responde a varios problemas inherentes a los LLM, como la generación de información falsa o desactualizada y la dependencia de fuentes no autorizadas. La RAG permite a los LLM acceder a información actualizada y verificada durante la generación de respuestas, lo que mejora significativamente la relevancia y precisión de las respuestas en contextos específicos.

La RAG es especialmente beneficiosa porque es más rentable que reentrenar completamente un LLM con nuevos datos. Además, garantiza que la información proporcionada sea la más actual, aumentando la confianza de los usuarios en la tecnología. Para los desarrolladores, ofrece mayor control sobre la salida del texto generado, permitiéndoles adaptar las fuentes de información a necesidades cambiantes y asegurar respuestas adecuadas y precisas.

Te puede interesar: Claude 3, el modelo de IA que podría convertirse en estándar en los medios por su alto grado de fiabilidad y su visión ética

En términos operativos, la RAG funciona mediante un proceso donde se utiliza la entrada del usuario para buscar y recuperar información relevante de una base de datos actualizada antes de proporcionarla al LLM, que luego genera una respuesta informada y contextualmente adecuada. Esto se logra a través de técnicas de ingeniería de peticiones y actualizaciones periódicas de los datos externos para mantener la precisión y relevancia.

Además, el proyecto de The Washington Post también empleará tecnología de modelos de lenguaje grandes multimodales (LLM), lo que significa que la herramienta de IA no solo extraerá información de textos, sino que también podrá integrar información encontrada en productos de reportajes en audio o vídeo.

Sam Han subrayó: “El objetivo es acumular activos tecnológicos para nosotros en este nuevo mundo, donde la IA de modelos de lenguaje grande juega un papel crucial en proporcionar un consumo de información conversacional”.

Aunque aún no hay un cronograma específico de cuándo los lectores pueden probar esta función, dos estudiantes de doctorado ya han comenzado la investigación y desarrollo para construir las capacidades de búsqueda de la herramienta, supervisados por tres profesores de Virginia Tech.

The Washington Post quiere liderar la era de los bots en medios informativos con la Generación Aumentada por Recuperación

¿Qué es la RAG?

DEJA UNA RESPUESTA Cancelar respuesta

ÚLTIMOS ARTÍCULOS

Cuatro factores clave que influyen en la confianza de los usuarios hacia los medios de comunicación

“Jot Down” elabora unas directrices para el uso responsable de la inteligencia artificial en la revista

Waisbord llama a que el periodismo refuerce su compromiso ético con la verdad para alejarse de la desinformación

Alumnos de más de 20 centros escolares presentan proyectos periodísticos gracias a una iniciativa de El Diario Vasco (Vocento)

¿Qué hacer cuando las fuentes de información te cierran la puerta? Las sugerencias de Poynter y el centro Craig Newmark

Los medios de comunicación aumentan su interés informativo en MistralAI

Mediapart se rebela contra Google, suspende los cobros pendientes, y exige más transparencia

La libertad de medios en la Unión Europea está disminuyendo, según un informe de Liberties

Recomendaciones de RSF para regular el espacio informativo y reducir lo que considera un “caos, gobernado por la desinformación”

Bruselas intensifica la investigación sobre Meta por no combatir lo suficiente la desinformación ante las elecciones europeas

LO MÁS LEÍDO

Nueva York sienta precedente en Estados Unidos al aprobar una ley que subvenciona hasta el 50% del sueldo de periodistas locales

Los 10 temas que más interés generan en los lectores

Ranking de pódcast en Spotify en España (mayo de 2022): “Entiende tu mente” entra directamente al segundo puesto

Las revistas impresas se replantean las estrategias actuales ante la falta de ingresos de las ediciones digitales

Rost: “Nos preocupa la evasión selectiva de noticias”

Podcast #20: IA, cookies, derechos digitales… Retos legales y éticos en el periodismo. Entrevista a Paula Ortiz y Álvaro Úbeda

Diez consejos prácticos para integrar de manera efectiva la IA en los medios de comunicación

Cuatro factores clave que influyen en la confianza de los usuarios hacia los medios de comunicación

Una investigación basada en 780.000 vídeos y mil perfiles confirma una notable y progresiva caída del alcance de los vídeos en TikTok

Tendencias emergentes en el consumo de noticias en las jóvenes generaciones