Google ha incorporado en Gemini, su asistente de inteligencia artificial, una de las funciones más demandadas por los usuarios: la posibilidad de subir archivos de audio para transcribirlos, resumirlos o analizarlos. La actualización, ya disponible tanto en la versión web como en las aplicaciones móviles, permite trabajar con formatos habituales como MP3, WAV, FLAC o M4A, con límites que varían entre la modalidad gratuita y las suscripciones de pago.
La nueva función abre un abanico de posibilidades para profesionales de la información. Las entrevistas grabadas, habituales en el trabajo de reporteo, pueden convertirse en transcripciones en cuestión de segundos, lo que reduce el tiempo dedicado a tareas mecánicas y facilita centrarse en la verificación y el análisis. También resulta útil en la cobertura de ruedas de prensa o conferencias, donde los audios extensos pueden procesarse rápidamente para extraer citas clave o elaborar resúmenes preliminares.
El límite de 10 minutos en la versión gratuita puede ser un condicionante en coberturas largas, aunque las opciones de pago amplían la duración hasta tres horas, lo que cubre con holgura la mayoría de entrevistas y encuentros periodísticos.
En el ámbito editorial, la función puede optimizar flujos de trabajo. Los equipos de redacción pueden utilizarla para convertir grabaciones de reuniones internas en actas, o para procesar podcasts y materiales de audio que luego se transformen en piezas publicadas en web. La posibilidad de cargar hasta diez archivos en un mismo prompt, o incluso trabajar con carpetas comprimidas, permite manejar grandes volúmenes de material de manera más eficiente.
Algunos límites técnicos, como la incompatibilidad inicial con audios en formato OPUS (habituales en WhatsApp), obligarán a procesos de conversión previos, pero la incorporación del soporte de audio coloca a Gemini en una posición destacada frente a otros servicios de transcripción.
Josh Woodward, responsable de Google Labs y de la aplicación de Gemini, señaló en su cuenta de X que el soporte para audios era la característica más solicitada por los usuarios. La actualización llega tras la definición de los límites de uso publicados por la propia compañía, que establecen un tamaño máximo de 100 MB por archivo y la posibilidad de cargar vídeos de hasta cinco minutos en la versión gratuita.



