InicioInteligencia ArtificialLa inteligencia artificial hace que los contenidos de internet sean más homogéneos,...

La inteligencia artificial hace que los contenidos de internet sean más homogéneos, menos diversos y emocionalmente más complacientes

Un estudio firmado por Jonas Dolezal, Sawood Alam, Mark Graham y Maty Bohacek concluye que la expansión del texto generado o asistido por inteligencia artificial en internet no ha mostrado una relación estadísticamente significativa con un aumento general de los errores factuales, pero sí con una web más homogénea, menos diversa en sus enfoques y emocionalmente más complaciente, una deriva que afecta de lleno al periodismo, a la comunicación pública y a la industria de los contenidos porque desplaza parte del problema desde la desinformación hacia la uniformidad del discurso online.

Un estudio sobre el impacto del texto generado por inteligencia artificial en internet concluye que la expansión de estos contenidos no ha mostrado una relación estadísticamente significativa con una caída general de la precisión factual, pero sí con una reducción de la diversidad semántica y con una mayor presencia de textos de tono positivo, lo que plantea un reto específico para el periodismo, la comunicación pública y la industria de los contenidos: la web abierta puede estar llenándose de textos correctos en apariencia, pero más parecidos entre sí, menos diversos en enfoques y emocionalmente más complacientes.

El estudio The Impact of AI-Generated Text on the Internet, firmado por Jonas Dolezal (Imperial College London), Sawood Alam y Mark Graham (Internet Archive) y Maty Bohacek (Stanford University), estima que a mediados de 2025 alrededor del 35% de las nuevas webs publicadas cada mes eran generadas o asistidas por inteligencia artificial, tal como se adelantó en un primer avance. Antes de la aparición pública de ChatGPT, a finales de 2022, esa presencia era prácticamente nula, según los autores.

La investigación analiza una muestra representativa de sitios web publicados entre 2022 y 2025 y conservados por Internet Archive. Los autores aplicaron Pangram v3, un detector de texto generado por IA seleccionado tras una comparación previa con Binoculars, Desklib y DivEye. Esa evaluación tuvo en cuenta la longitud de los textos, la presencia de contenido incrustado en HTML, diferentes familias de modelos, versiones de modelos y robustez en varios idiomas.

El resultado central no es que la IA esté llenando internet de falsedades detectables a escala, sino que está modificando la textura del discurso online. Los textos clasificados como generados o asistidos por IA presentaron una similitud semántica media un 33% superior a la de los textos no generados por IA. En la práctica, esto significa que los contenidos tienden a concentrarse en rangos más próximos de ideas, enfoques y formulaciones, una dinámica que los autores definen como “contracción semántica”.

Ese hallazgo tiene una lectura directa para los medios. El riesgo no se limita a que aumenten las piezas falsas, manipuladas o factualmente incorrectas, sino a que la abundancia de contenidos automatizados reduzca la amplitud de perspectivas disponibles en la conversación pública. Para el periodismo, cuya función depende en parte de seleccionar, contrastar, jerarquizar y explicar realidades diversas, la pérdida de variedad semántica puede afectar a la diferenciación editorial y a la calidad del ecosistema informativo.

Te puede interesar:  El 'efecto ChatGPT' en TVE: el salto de la IA en los informativos tras la llegada de la IA generativa

La segunda señal confirmada por el estudio es el desplazamiento emocional del contenido. Los autores detectaron una correlación positiva entre el aumento de textos generados o asistidos por IA y la prevalencia de documentos clasificados con sentimiento positivo. Según la investigación, el sentimiento positivo medio de los textos generados o asistidos por IA fue un 107% superior al de los textos no generados por IA.

La expresión “positivo”, en este caso, no implica necesariamente una mejora del contenido. El estudio vincula este resultado con una escritura más complaciente u optimista, rasgos asociados a la tendencia de los grandes modelos lingüísticos a producir respuestas más agradables, prudentes o alineadas con lo que el usuario parece esperar. La consecuencia editorial puede ser una web menos áspera, menos conflictiva y menos abierta a la fricción que forma parte del debate público, especialmente en asuntos políticos, sociales, económicos o culturales.

El paper contrasta estos resultados con una encuesta realizada a una muestra representativa de adultos de Estados Unidos a través de Prolific. La percepción social sobre los efectos de la IA es más negativa que los resultados empíricos en varias de las hipótesis analizadas. El 75,1% de los encuestados se mostró de acuerdo, en distintos grados, con la afirmación de que el aumento de contenido generado por IA implica una mayor exposición a información factualmente incorrecta o a alucinaciones. Sin embargo, el análisis cuantitativo de los sitios web no encontró una correlación estadísticamente significativa entre la presencia de IA y la tasa de errores factuales.

El 83% de los participantes dijo estar de acuerdo con la idea de que los estilos individuales de escritura están desapareciendo en favor de una voz genérica y uniforme

La misma distancia entre percepción y medición aparece en la hipótesis de la homogeneización estilística. El 83% de los participantes dijo estar de acuerdo con la idea de que los estilos individuales de escritura están desapareciendo en favor de una voz genérica y uniforme. El análisis de los textos, sin embargo, no encontró evidencia estadísticamente significativa de una monocultura estilística estricta. La investigación distingue así entre una preocupación pública muy extendida y los indicadores que, por ahora, han podido medirse a escala web.

El estudio sí confirma la hipótesis de que la IA está asociada con una menor diversidad de ideas y puntos de vista. El 60,9% de los encuestados compartía esta preocupación, y el análisis de los sitios archivados mostró una correlación positiva y estadísticamente significativa entre la probabilidad agregada de contenido generado o asistido por IA y la similitud semántica entre documentos. Para la industria de los contenidos, este resultado desplaza parte del debate desde la desinformación hacia la uniformidad informativa.

Te puede interesar:  Las redacciones adoptan IA sin políticas operativas claras, según un informe internacional

Los autores sostienen que el riesgo inmediato para el discurso online puede ser más epistémico que puramente factual. La presencia creciente de textos artificiales, cada vez más difíciles de distinguir de los humanos, puede hacer que los usuarios rebajen su confianza en la información online en general, incluso cuando los contenidos sean correctos. El paper relaciona esta posibilidad con conceptos como la “apatía de la realidad” y el “dividendo del mentiroso”, que describen situaciones en las que la existencia de contenidos sintéticos permite desacreditar información auténtica o sembrar dudas sobre ella.

Esta conclusión afecta directamente a medios, plataformas, buscadores y sistemas de recomendación. Según los autores, las infraestructuras actuales están más preparadas para detectar daños explícitos, como discurso de odio o afirmaciones falsas, que para preservar diversidad semántica o calidad epistémica. Dicho de otro modo, los sistemas de distribución pueden identificar mejor una falsedad concreta que una degradación gradual de la variedad de enfoques disponibles para los ciudadanos.

La investigación también apunta a los incentivos económicos que impulsan la producción automatizada. La proliferación de contenidos generados por IA parece responder en gran medida a la posibilidad de publicar más textos con menos intervención humana, no necesariamente a una estrategia coordinada para alterar el debate público. Esta dinámica afecta a la competencia por la atención, al posicionamiento en buscadores y a la capacidad de los medios para diferenciar sus contenidos de piezas producidas o asistidas automáticamente.

El estudio advierte de que las respuestas basadas solo en detectores retrospectivos de IA o en marcas de agua pueden ser insuficientes. Aunque los autores consideran que la detección de texto generado por IA sigue siendo útil en el momento del estudio, señalan que estos métodos tienen límites, especialmente en textos breves o cuando evolucionan las técnicas de generación. Como alternativa, mencionan la verificación criptográfica de procedencia humana (con estándares similares a C2PA) y la recalibración de los algoritmos de búsqueda y recomendación para premiar la diversidad semántica y el origen humano verificable, no solo el volumen de publicación o la interacción.

Artículos relacionados

DEJA UNA RESPUESTA

Please enter your comment!
Please enter your name here

ÚLTIMOS ARTÍCULOS

LO MÁS LEÍDO