El 35% de las webs creadas desde 2022 contiene texto generado por inteligencia artificial, según un estudio internacional

Una investigación basada en datos del Internet Archive concluye que más de un tercio de los sitios web creados desde finales de 2022 incluye contenido generado o asistido por inteligencia artificial, una proporción que no existía antes de la aparición de herramientas como ChatGPT y que, en apenas tres años, ha modificado de forma significativa la producción de texto en internet.

El estudio, elaborado por investigadores de la Universidad de Stanford, el Imperial College London y el propio Internet Archive, sitúa este cambio como uno de los más rápidos en la historia de la web y documenta sus efectos en el lenguaje, el estilo y la diversidad semántica de los contenidos digitales.

El análisis se basa en muestras de páginas web recopiladas entre agosto de 2022 y mayo de 2025 mediante la Wayback Machine. A partir de estas capturas, los investigadores extrajeron el contenido textual y aplicaron herramientas de detección de texto generado por IA, seleccionando finalmente el sistema Pangram v3 por su mayor tasa de acierto. Según los resultados, hacia mediados de 2025 aproximadamente el 35% de las nuevas webs podía clasificarse como generada o asistida por inteligencia artificial.

El trabajo partía de varias hipótesis habituales sobre el impacto de la IA en los contenidos digitales, entre ellas la posible reducción de la diversidad de opiniones, el aumento de la desinformación, la homogeneización del estilo, la pérdida de referencias o la generación de textos con menor densidad semántica. Para contrastarlas, el equipo definió indicadores medibles y los comparó con la probabilidad de generación automática detectada en cada muestra mensual.

Te puede interesar: McClatchy presiona a sus periodistas para aumentar el uso de inteligencia artificial ante la caída de ingresos y audiencia

Los resultados muestran que solo dos de esas hipótesis se cumplen de forma consistente: la disminución de la diversidad semántica y el incremento de un tono más positivo en los textos. En cambio, el estudio no encuentra evidencia de un aumento significativo de afirmaciones falsas verificables ni de una reducción en la citación de fuentes. Para comprobarlo, los investigadores extrajeron afirmaciones factuales de los textos analizados y recurrieron a verificadores humanos, además de medir la densidad de enlaces salientes como indicador de referencia a fuentes externas.

El estudio también apunta a una posible limitación en la detección de desinformación, ya que el análisis se centra en afirmaciones verificables, lo que deja fuera contenidos difíciles de contrastar con herramientas actuales. Los autores señalan que este tipo de afirmaciones podría estar aumentando sin ser detectado por los métodos empleados.

Los investigadores trabajan ahora en el desarrollo de un sistema continuo de monitorización junto al Internet Archive, con el objetivo de seguir la evolución del contenido generado por IA en la web en tiempo real. El proyecto prevé incorporar mayor nivel de detalle, incluyendo análisis por tipo de sitio web o por idioma, para identificar con más precisión dónde se concentran estos cambios.

ÚLTIMOS ARTÍCULOS

LO MÁS LEÍDO

DEJA UNA RESPUESTA Cancelar respuesta

Please enter your comment!

Please enter your name here

You have entered an incorrect email address!

Please enter your email address here

Recibir un correo electrónico con los siguientes comentarios a esta entrada.

Recibir un correo electrónico con cada nueva entrada.

El 35% de las webs creadas desde 2022 contiene texto generado por inteligencia artificial, según un estudio internacional

Artículos relacionados

Vitoria-Gasteiz reunirá a periodistas y expertos para analizar conflictos, desinformación y geopolítica

Julio Iglesias se querella contra elDiario.es, su director y cuatro periodistas

El Correo de Andalucía publicará los mejores trabajos de estudiantes de Periodismo de la Universidad de Sevilla

Nvidia presenta un detector de vídeos generados con IA capaz de analizarlos en 22 milisegundos

La inteligencia artificial impulsó un tercio de los bulos difundidos durante el Mundial de 2026

Un libro reúne el mayor análisis internacional sobre cómo TikTok está transformando el periodismo

El Español mantiene el liderazgo de audiencia de la prensa digital en junio, según GfK DAM

Una investigación desmonta los principales bulos que circulan sobre las olas de calor en Europa

La caída del tráfico reduce hasta un 40% el inventario publicitario de los medios

Google y SembraMedia lanzan un laboratorio para fortalecer medios digitales y creadores periodísticos de Latinoamérica

La prensa local reivindica su papel para contar lo que ocurre fuera del foco nacional

Bruselas alerta de que las reformas sobre medios aún no han corregido los problemas de pluralismo en España

DEJA UNA RESPUESTA Cancelar respuesta

ÚLTIMOS ARTÍCULOS

El contenido líquido plantea una transformación radical de las redacciones en la era de la inteligencia artificial

La bolsa ha borrado hasta el 98% del valor de algunos grandes grupos de prensa tradicionales

Cómo evitar que las normas sobre inteligencia artificial se queden en un documento olvidado

Los medios tienen audiencia, pero no siempre comunidad: cómo activar a los lectores que siguen las noticias en silencio

El buzón como nueva portada: la estrategia de los medios para conquistar ciudad a ciudad

LO MÁS LEÍDO

Los medios tienen audiencia, pero no siempre comunidad: cómo activar a los lectores que siguen las noticias en silencio

El buzón como nueva portada: la estrategia de los medios para conquistar ciudad a ciudad

La caída del tráfico reduce hasta un 40% el inventario publicitario de los medios

Google y SembraMedia lanzan un laboratorio para fortalecer medios digitales y creadores periodísticos de Latinoamérica

Nvidia presenta un detector de vídeos generados con IA capaz de analizarlos en 22 milisegundos

SÍGUENOS

El 35% de las webs creadas desde 2022 contiene texto generado por inteligencia artificial, según un estudio internacional

Artículos relacionados

DEJA UNA RESPUESTA Cancelar respuesta

.tdi_82{margin-top:20px!important;border-color:#ffffff!important;border-style:solid!important;border-width:2px 0px 0px 0px!important} body .tdi_83{text-align:left;color:#ffffff}.tdi_83{font-size:30px!important;line-height:2!important;font-weight:700!important}LO MÁS LEÍDO

SÍGUENOS

LO MÁS LEÍDO