Una investigación centrada en agencias de noticias revela que se están publicando borradores obtenidos con IA con escasas modificaciones

Un estudio realizado por la Universidad de Washington, centrado en agencias de noticias, ha demostrado que los periodistas están publicando los borradores de noticias generados mediante el uso de ChatGPT y otros modelos de lenguaje generativo (LLM) casi sin modificaciones. Es decir, la adaptación y la necesaria intervención humana, una de las exigencias de las directrices establecidas por los medios para permitir el uso de la IA, no se están cumpliendo.

El estudio, conducido por Natalie Grace Brigham, Chongjiu Gao, Tadayoshi Kohno, Franziska Roesner y Niloofar Mireshghallah, ha descubierto que existe un alto grado de superposición entre los borradores generados por los modelos de lenguaje y los artículos finalmente publicados por los periodistas. Los casos

Esta superposición se cuantificó utilizando el índice de coincidencia ROUGE-L, que mide la longitud de la subsecuencia común más larga entre dos textos. En este caso, el índice de coincidencia media de los casos analizados por la investigación fue de 0,62, lo que indica una notable similitud entre el contenido generado por la inteligencia artificial y el contenido publicado.

Un valor de 0,62 en el índice ROUGE-L significa que, en promedio, el 62% del contenido generado por los modelos de lenguaje se conserva en el artículo final publicado sin modificaciones significativas.

En el contexto del periodismo, un índice de 0,5 ya se considera alto en dominios de privacidad y política. El valor de 0,62 sugiere que las intervenciones humanas son mínimas, lo cual plantea preocupaciones sobre la autenticidad y originalidad del contenido publicado, según explican los autores de la investigación.

Te puede interesar: Cómo deben trabajar los medios en TikTok para informar con eficacia sin perder identidad

Casos específicos de estudio

El estudio incluyó casos concretos, como uno en el que un artículo generado por el modelo y publicado por una agencia tuvo un índice de coincidencia de 0,71, evidenciando una modificación casi nula del texto generado por la IA.

En este caso, la agencia utilizó un artículo externo como estímulo, solicitando al modelo generar un nuevo artículo a partir de esa información. El borrador generado por el modelo fue editado manualmente y publicado el mismo día, lo que demuestra un proceso rápido y con mínima intervención humana.

Otro caso destacado es el de una interacción en múltiples turnos donde se usaron varios estímulos, incluyendo un borrador interno, una transcripción de entrevista y un artículo de la misma agencia. Los índices de coincidencia en este caso fueron de 0,42 y 0,37 para los diferentes borradores generados, mostrando también una baja intervención humana antes de la publicación final.

Los periodistas envían material confidencial cuando usan los LLMs

El estudio también ha revelado que los periodistas proporcionan materiales sensibles a los LLMs, como correspondencia confidencial y artículos de otras agencias. Aproximadamente el 18% de los estímulos identificados eran artículos de otras agencias y el 9% eran potenciales conversaciones privadas, lo que plantea serios riesgos de privacidad.

Asimismo, se ha demostrado que la mayoría de los artículos se publicaron el mismo día o un día después de la generación del borrador por los modelos de lenguaje, indicando un proceso rápido y con poca revisión humana.

Según el informe, los periodistas utilizan una variedad de estímulos para generar contenido, incluyendo artículos internos, transcripciones de entrevistas y borradores previos. Los estímulos externos representaron más de dos tercios del material utilizado.

Te puede interesar: Radiografía del consumo de noticias locales en Estados Unidos: cae la atención, avanza lo digital y solo un 12% paga por informarse

Para llevar a cabo el estudio, los investigadores de la Universidad de Washington analizaron el conjunto de datos WildChat, que incluye 650.000 conversaciones recopiladas ofreciendo acceso gratuito a GPT-3.5 y GPT-4. Identificaron posibles interacciones de periodistas revisando conversaciones con al menos cuatro tipos de información personal identificable (PII). Verificaron estas interacciones cotejándolas con artículos publicados en dos agencias de noticias, denominadas Agencia A y Agencia B para mantener el anonimato.

Los investigadores utilizaron un modelo de reconocimiento de entidades nombradas (NER) para identificar conversaciones con múltiples tipos de PII, centrando su análisis en un subconjunto de 5.000 turnos de conversación. Buscaron artículos con contenido altamente similar al generado por los LLMs en los sitios web de las agencias de noticias identificadas para confirmar que las consultas fueron realizadas por periodistas. Finalmente, clasificaron las tareas solicitadas a los LLMs en generación de artículos, generación de titulares y edición de artículos. La mayoría de las interacciones (83,1%) fueron para la generación de artículos.

Los resultados del estudio subrayan la necesidad de establecer directrices claras y mejores prácticas para el uso de LLMs en el periodismo, así como mejorar la alfabetización en inteligencia artificial para los periodistas.

Se sugiere en el informe que investigaciones futuras podrían explorar enfoques desde la interacción humano-computadora y la seguridad y privacidad utilizables para guiar a los usuarios hacia comportamientos más beneficiosos.

ÚLTIMOS ARTÍCULOS

LO MÁS LEÍDO

DEJA UNA RESPUESTA Cancelar respuesta

Please enter your comment!

Please enter your name here

You have entered an incorrect email address!

Please enter your email address here

Recibir un correo electrónico con los siguientes comentarios a esta entrada.

Recibir un correo electrónico con cada nueva entrada.

Una investigación centrada en agencias de noticias revela que se están publicando borradores obtenidos con IA con escasas modificaciones

Casos específicos de estudio

Los periodistas envían material confidencial cuando usan los LLMs

Artículos relacionados

Cómo adelantarse a los resúmenes con IA de Google en las noticias de última hora: el ejemplo de USA Today durante el Mundial de...

Cuando el lector ya no llega al medio, el medio tiene que llegar a sus rutinas

Usar la IA solo para producir más rápido no transformará el periodismo

Doce lecciones de Oxford para las redacciones: menos retórica sobre innovación y más método periodístico

El periodista ya no basta: los grandes medios rediseñan sus redacciones con perfiles que no existían hace cinco años

Las aplicaciones móviles ganan peso para los medios como vía directa para fidelizar lectores y reducir dependencia del tráfico externo

La desinformación, los recortes y la IA concentran la presión sobre los periodistas en 2026

Educación y salud, las primeras víctimas de los recortes en los medios locales

Instagram cambia sus reglas en 2026 y empuja a los medios hacia Reels, carruseles y comunidad

El audio digital gana espacio en la rutina de los españoles, pero los medios siguen ante el reto de convertir escucha en ingresos

Digital News Report 2026: los españoles recuperan interés por las noticias tras una década de caída

Los jóvenes sí quieren periodismo, pero no los productos que muchos medios siguen diseñando para ellos

DEJA UNA RESPUESTA Cancelar respuesta

ÚLTIMOS ARTÍCULOS

Sport prueba la IA para adaptar contenidos digitales a la edición impresa sin ceder el control editorial

Cómo adelantarse a los resúmenes con IA de Google en las noticias de última hora: el ejemplo de USA Today durante el Mundial de...

Cuando el lector ya no llega al medio, el medio tiene que llegar a sus rutinas

Cómo la IA puede ayudar a los medios independientes a retener suscriptores: el ejemplo de Denník N

Usar la IA solo para producir más rápido no transformará el periodismo

LO MÁS LEÍDO

Cuando el lector ya no llega al medio, el medio tiene que llegar a sus rutinas

Cómo adelantarse a los resúmenes con IA de Google en las noticias de última hora: el ejemplo de USA Today durante el Mundial de...

Usar la IA solo para producir más rápido no transformará el periodismo

La desinformación científica deja de ser excepcional y se instala en la vida cotidiana, impulsada por las redes sociales y la IA

Comscore será el nuevo medidor recomendado de audiencias digitales en España tras imponerse en el concurso de la AIMC

SÍGUENOS

Una investigación centrada en agencias de noticias revela que se están publicando borradores obtenidos con IA con escasas modificaciones

Casos específicos de estudio

Los periodistas envían material confidencial cuando usan los LLMs

Artículos relacionados

DEJA UNA RESPUESTA Cancelar respuesta

.tdi_82{margin-top:20px!important;border-color:#ffffff!important;border-style:solid!important;border-width:2px 0px 0px 0px!important} body .tdi_83{text-align:left;color:#ffffff}.tdi_83{font-size:30px!important;line-height:2!important;font-weight:700!important}LO MÁS LEÍDO

SÍGUENOS

LO MÁS LEÍDO