Gemini incorpora transcripción de audios: implicaciones para periodistas y publishers

Google ha incorporado en Gemini, su asistente de inteligencia artificial, una de las funciones más demandadas por los usuarios: la posibilidad de subir archivos de audio para transcribirlos, resumirlos o analizarlos. La actualización, ya disponible tanto en la versión web como en las aplicaciones móviles, permite trabajar con formatos habituales como MP3, WAV, FLAC o M4A, con límites que varían entre la modalidad gratuita y las suscripciones de pago.

La nueva función abre un abanico de posibilidades para profesionales de la información. Las entrevistas grabadas, habituales en el trabajo de reporteo, pueden convertirse en transcripciones en cuestión de segundos, lo que reduce el tiempo dedicado a tareas mecánicas y facilita centrarse en la verificación y el análisis. También resulta útil en la cobertura de ruedas de prensa o conferencias, donde los audios extensos pueden procesarse rápidamente para extraer citas clave o elaborar resúmenes preliminares.

El límite de 10 minutos en la versión gratuita puede ser un condicionante en coberturas largas, aunque las opciones de pago amplían la duración hasta tres horas, lo que cubre con holgura la mayoría de entrevistas y encuentros periodísticos.

En el ámbito editorial, la función puede optimizar flujos de trabajo. Los equipos de redacción pueden utilizarla para convertir grabaciones de reuniones internas en actas, o para procesar podcasts y materiales de audio que luego se transformen en piezas publicadas en web. La posibilidad de cargar hasta diez archivos en un mismo prompt, o incluso trabajar con carpetas comprimidas, permite manejar grandes volúmenes de material de manera más eficiente.

Te puede interesar: El Español supera los 31 millones de usuarios únicos en febrero según la medición híbrida de ComScore

Algunos límites técnicos, como la incompatibilidad inicial con audios en formato OPUS (habituales en WhatsApp), obligarán a procesos de conversión previos, pero la incorporación del soporte de audio coloca a Gemini en una posición destacada frente a otros servicios de transcripción.

Josh Woodward, responsable de Google Labs y de la aplicación de Gemini, señaló en su cuenta de X que el soporte para audios era la característica más solicitada por los usuarios. La actualización llega tras la definición de los límites de uso publicados por la propia compañía, que establecen un tamaño máximo de 100 MB por archivo y la posibilidad de cargar vídeos de hasta cinco minutos en la versión gratuita.

ÚLTIMOS ARTÍCULOS

LO MÁS LEÍDO

Gemini incorpora transcripción de audios: implicaciones para periodistas y publishers

Artículos relacionados

Colombia regula un fondo para proteger a mujeres periodistas frente a la violencia de género

Matt Brittin (ex Google) asumirá la dirección general de la BBC en plena revisión de su modelo

La familia Agnelli abandona la prensa con la venta de GEDI (La Repubblica) al grupo griego Antenna

Digital Media LATAM reúne en Bogotá a algunas de las voces más influyentes de la industria y entra en la recta final de inscripciones

Los medios pierden peso como primera fuente ante buscadores y redes en noticias de última hora en Estados Unidos

Falsos médicos generados con IA acumulan millones de visualizaciones en cuentas españolas de YouTube

El Congreso francés aprueba una ley para obligar a las plataformas a pagar a los medios por sus contenidos

Cómo ayudar a las periodistas a mejorar su salud en el trabajo: el paso adelante de Schibsted

The Economist agrupa sus servicios B2B en una única marca para más de 2.700 organizaciones

La difusión en papel de los principales diarios de Estados Unidos cae un 12,5% y solo un medio logra crecer

AFP y El Tiempo activan una alianza de verificación ante el aumento de desinformación en las elecciones colombianas de 2026

La desinformación genera pérdidas cercanas a los 500.000 millones de dólares anuales en la economía global

DEJA UNA RESPUESTA Cancelar respuesta

ÚLTIMOS ARTÍCULOS

TikTok, X y YouTube concentran ya en España, Francia, Polonia y Eslovaquia más contenido problemático que información creíble

Podcast 41#. Redes sociales como fuente informativa. Entrevista a Carmela Ríos

El periodismo de investigación pone el foco en el poder de las tecnológicas y la opacidad de la inteligencia artificial

TikTok, Instagram y YouTube desplazan a las webs de noticias entre los jóvenes y agravan la pérdida de vínculo con las marcas informativas

Más contexto, mejores respuestas: así influye el mensaje en la inteligencia artificial

LO MÁS LEÍDO

Podcast 41#. Redes sociales como fuente informativa. Entrevista a Carmela Ríos

Los medios pierden peso como primera fuente ante buscadores y redes en noticias de última hora en Estados Unidos

El periodismo de investigación pone el foco en el poder de las tecnológicas y la opacidad de la inteligencia artificial

TikTok, X y YouTube concentran ya en España, Francia, Polonia y Eslovaquia más contenido problemático que información creíble

El Congreso francés aprueba una ley para obligar a las plataformas a pagar a los medios por sus contenidos

SÍGUENOS

Gemini incorpora transcripción de audios: implicaciones para periodistas y publishers

Artículos relacionados

DEJA UNA RESPUESTA Cancelar respuesta

.tdi_80{margin-top:20px!important;border-color:#ffffff!important;border-style:solid!important;border-width:2px 0px 0px 0px!important} body .tdi_81{text-align:left;color:#ffffff}.tdi_81{font-size:30px!important;line-height:2!important;font-weight:700!important}LO MÁS LEÍDO

SÍGUENOS

LO MÁS LEÍDO