Los bloqueos al Internet Archive se multiplican ante el uso de contenidos periodísticos para entrenar inteligencia artificial

El acceso a uno de los mayores repositorios de información digital del mundo se está viendo limitado por una reacción coordinada de organizaciones informativas que buscan frenar el uso de sus contenidos en el desarrollo de sistemas de inteligencia artificial, una decisión que afecta directamente a la conservación y trazabilidad del periodismo en internet mientras crece el conflicto legal entre medios y empresas tecnológicas.

Según informa Euronews, al menos 245 organizaciones de noticias en nueve países han comenzado a bloquear los rastreadores del Internet Archive, el sistema automatizado que permite capturar y almacenar páginas web en la conocida Wayback Machine, una base de datos que reúne más de un billón de páginas desde 1996 y que ha servido durante décadas como archivo histórico del contenido publicado en la red.

La decisión responde a la preocupación creciente de los editores por el uso de estos materiales en el entrenamiento de modelos de lenguaje a gran escala, que utilizan textos periodísticos para mejorar la calidad de sus respuestas sin que exista, en la mayoría de los casos, autorización ni compensación económica. Este uso se produce a través de interfaces técnicas que facilitan la descarga masiva de contenidos estructurados, fechados y atribuidos, lo que incrementa su valor para las empresas de inteligencia artificial.

Más de una veintena de grandes medios ya han bloqueado el acceso de ia_archiverbot, el principal rastreador del Internet Archive, mientras que al menos uno de los cuatro sistemas de captura del archivo está restringido por 241 sitios informativos. Una parte significativa de estos bloqueos corresponde a publicaciones vinculadas a USA Today Co, lo que implica la exclusión de cientos de medios locales de este sistema de preservación digital.

Te puede interesar: La Fundacion Luca de Tena participa en el panel de expertos del documental “Las nuevas fronteras de la Comunicación”

El conflicto se produce en paralelo a las demandas interpuestas por varias organizaciones contra compañías como OpenAI o Perplexity por posibles vulneraciones de derechos de autor. En este sentido, Graham James, portavoz de The New York Times, ha señalado que los contenidos del diario almacenados en el archivo están siendo utilizados para competir directamente con el medio sin autorización, lo que, según ha afirmado, supone un uso indebido del trabajo periodístico.

No todos los medios han optado por una restricción total. Algunas cabeceras, como The Guardian, han aplicado medidas parciales que limitan el acceso sin bloquear completamente la indexación, en un intento de equilibrar la protección de sus contenidos con el valor del archivo como herramienta de memoria digital.

Desde el Internet Archive, su director Mark Graham ha defendido que la institución actúa como un intermediario técnico y ha calificado la situación como un “daño colateral” derivado del uso que terceros hacen de los datos archivados. Aun así, la organización ha introducido restricciones en la descarga masiva de contenidos y ha limitado ciertos procesos automatizados para reducir el acceso indiscriminado.

El debate se extiende también al ámbito de los derechos digitales y la preservación histórica. Organizaciones como Fight for the Future han impulsado iniciativas contra estos bloqueos, con el apoyo de periodistas que advierten del riesgo de fragmentar el registro público de la información. La disputa refleja una tensión creciente entre la protección de la propiedad intelectual, el desarrollo de la inteligencia artificial y la conservación del patrimonio informativo en internet.

ÚLTIMOS ARTÍCULOS

LO MÁS LEÍDO

DEJA UNA RESPUESTA Cancelar respuesta

Please enter your comment!

Please enter your name here

You have entered an incorrect email address!

Please enter your email address here

Recibir un correo electrónico con los siguientes comentarios a esta entrada.

Recibir un correo electrónico con cada nueva entrada.

Los bloqueos al Internet Archive se multiplican ante el uso de contenidos periodísticos para entrenar inteligencia artificial

Artículos relacionados

EFE automatiza con IA el metadatado de fotografías y vídeos para mejorar la explotación de su archivo

Junior Report premia el trabajo de 8.000 estudiantes en 80 revistas escolares

Vitoria-Gasteiz reunirá a periodistas y expertos para analizar conflictos, desinformación y geopolítica

Julio Iglesias se querella contra elDiario.es, su director y cuatro periodistas

El Correo de Andalucía publicará los mejores trabajos de estudiantes de Periodismo de la Universidad de Sevilla

Nvidia presenta un detector de vídeos generados con IA capaz de analizarlos en 22 milisegundos

La inteligencia artificial impulsó un tercio de los bulos difundidos durante el Mundial de 2026

Un libro reúne el mayor análisis internacional sobre cómo TikTok está transformando el periodismo

El Español mantiene el liderazgo de audiencia de la prensa digital en junio, según GfK DAM

Una investigación desmonta los principales bulos que circulan sobre las olas de calor en Europa

La caída del tráfico reduce hasta un 40% el inventario publicitario de los medios

Google y SembraMedia lanzan un laboratorio para fortalecer medios digitales y creadores periodísticos de Latinoamérica

DEJA UNA RESPUESTA Cancelar respuesta

ÚLTIMOS ARTÍCULOS

La era de la IA devuelve el valor a las fuentes, la verificación y el conocimiento especializado

El contenido líquido plantea una transformación radical de las redacciones en la era de la inteligencia artificial

La bolsa ha borrado hasta el 98% del valor de algunos grandes grupos de prensa tradicionales

Cómo evitar que las normas sobre inteligencia artificial se queden en un documento olvidado

Los medios tienen audiencia, pero no siempre comunidad: cómo activar a los lectores que siguen las noticias en silencio

LO MÁS LEÍDO

Los medios tienen audiencia, pero no siempre comunidad: cómo activar a los lectores que siguen las noticias en silencio

La caída del tráfico reduce hasta un 40% el inventario publicitario de los medios

Nvidia presenta un detector de vídeos generados con IA capaz de analizarlos en 22 milisegundos

Un libro reúne el mayor análisis internacional sobre cómo TikTok está transformando el periodismo

Google y SembraMedia lanzan un laboratorio para fortalecer medios digitales y creadores periodísticos de Latinoamérica

SÍGUENOS

Los bloqueos al Internet Archive se multiplican ante el uso de contenidos periodísticos para entrenar inteligencia artificial

Artículos relacionados

DEJA UNA RESPUESTA Cancelar respuesta

.tdi_82{margin-top:20px!important;border-color:#ffffff!important;border-style:solid!important;border-width:2px 0px 0px 0px!important} body .tdi_83{text-align:left;color:#ffffff}.tdi_83{font-size:30px!important;line-height:2!important;font-weight:700!important}LO MÁS LEÍDO

SÍGUENOS

LO MÁS LEÍDO