Tecnología

¿El fin de los intérpretes? ‘Gemini 3.5 Live Translate’ ya traduce voz en tiempo real con emoción humana

Google lanzó una IA que traduce conversaciones en tiempo real y conserva el tono de la voz.

GoogleSiga de cerca las tendencias en tecnología y ciencia en Discover

10 de junio de 2026 a las 6:54 p. m.
Las barreras del idioma se reducen con una tecnología que traduce la voz casi al instante.
Las barreras del idioma se reducen con una tecnología que traduce la voz casi al instante. Foto: Google

La promesa de entender cualquier idioma sin esfuerzo ha dejado de ser una fantasía de las películas para convertirse en una herramienta cotidiana.

La compañía reforzó su apuesta por Gemini con más beneficios y una tarifa más baja.
Google hace un movimiento que sorprendió a sus clientes: la empresa mueve fichas con Gemini y el almacenamiento

Google ha dado un golpe sobre la mesa con el lanzamiento de Gemini 3.5 Live Translate, un sistema capaz de traducir conversaciones de voz a voz en el mismo instante en que se producen, eliminando las pausas artificiales que solían interrumpir el ritmo natural del habla.

Más allá de las palabras: el corazón en la traducción

De acuerdo con la empresa, lo que realmente diferencia a esta tecnología de los traductores robóticos del pasado es su capacidad para captar la esencia de quien habla. No se limita a cambiar palabras de un idioma a otro, sino que hereda la entonación, el ritmo y la carga emocional del usuario original.

YouTube video TNwKs39uSVk thumbnail

Si una persona cuenta un chiste con entusiasmo, la inteligencia artificial intentará replicar esa “chispa”; si el tono es pausado y serio, la voz traducida sonará igual de tranquila. Esta función utiliza un sistema de “streaming” continuo (es decir, un flujo constante de datos sin interrupciones), lo que permite que la traducción empiece apenas unos segundos después de que el emisor comience a hablar, sin esperar a que termine la frase completa.

Reuniones sin fronteras y un traductor en tu bolsillo

El impacto de esta herramienta se sentirá con fuerza en el mundo laboral, especialmente a través de Google Meet. Pronto, en las videollamadas internacionales, bastará con activar una opción para que el sistema realice un doblaje en tiempo real, permitiendo que equipos de distintos países colaboren sin necesidad de intermediarios humanos.

Además, la aplicación móvil de Google Translate se ha renovado para aprovechar este motor de audio. Una de las novedades más prácticas es el “modo de escucha” en Android, que permite usar el teléfono pegado al oído, como si fuera una llamada privada, para escuchar la traducción directa de lo que alguien nos está diciendo en persona, facilitando la comunicación en viajes o situaciones de emergencia.

Un kit de herramientas para el resto del mundo

Google no se ha guardado esta tecnología solo para sus propios productos. Ha liberado una API, que es básicamente un puente técnico para que otros programadores puedan insertar esta capacidad de traducción en sus propias aplicaciones.

Google ha agregado funcionalidades avanzadas a su asistente basado en inteligencia artificial.
A diferencia de los traductores tradicionales, esta tecnología busca conservar la entonación, el ritmo y la emoción de quien habla. Foto: Anadolu via Getty Images

Esto abre la puerta a que servicios de atención al cliente, plataformas de educación en línea o incluso videojuegos multilingües integren la traducción instantánea de 70 idiomas diferentes. Gracias a su baja latencia (el mínimo tiempo de retraso entre el habla y la traducción) y su gran resistencia al ruido ambiental, el sistema promete funcionar incluso en entornos caóticos como una calle concurrida o un aeropuerto.

A pesar del asombro que genera su fluidez, todavía existen dudas sobre cómo se comportará en situaciones de la vida real muy específicas.