Con tres segundos es suficiente para clonar

Actualmente la clonación de voz no es exactamente como en Misión Imposible. No se transforma la voz de una persona en la de otra, sino que se lee un texto con la voz de una persona particular. Es lo que se conoce como síntesis de texto a discurso (test-to-speech o TTS). Su funcionamiento se basa en identificar patrones de voz. Todos hablamos de una forma particular, y por ello reconocemos las voces de cada persona. Tenemos un cierto tono, un timbre y una cadencia particular. En la clonación de la voz se utilizan redes neuronales entrenadas para reconocer estos patrones identificativos de cada voz y luego reproducirlos en la lectura de cualquier texto.