Una de las formas de comunicación más antiguas que aún se mantiene vigente son las llamadas a través del teléfono móvil. Este método continúa siendo práctico y eficiente en la vida cotidiana, no solo por su utilidad para resolver asuntos personales, sino también por su relevancia en el ámbito laboral.

No obstante, con el paso de los años, la ciberdelincuencia ha evolucionado y ha incorporado técnicas cada vez más sofisticadas para engañar a los usuarios, con el objetivo de sustraer información o dinero para beneficio propio.

El celular, al ser uno de los dispositivos más utilizados por las víctimas, se encuentra entre los que presentan mayor probabilidad de sufrir un ataque cibernético, ya sea mediante mensajes de texto o llamadas, siendo esta última el método más empleado.

Con el tiempo, los ciberdelincuentes han desarrollado técnicas sofisticadas para engañar a los usuarios y robar información o dinero. | Foto: Getty Images

En este contexto, especialistas en seguridad digital investigan de forma constante las estrategias más comunes entre los piratas informáticos. Recientemente, un grupo de investigadores de la Universidad Estatal de Pensilvania, Estados Unidos, reveló que las llamadas telefónicas pueden ser espiadas de forma remota mediante el registro de las vibraciones que produce el dispositivo, un tipo de ciberamenaza que pone en riesgo la privacidad de los usuarios.

Durante una conversación, el móvil emite vibraciones imperceptibles para las personas, pero que pueden ser captadas por radares remotos. Mediante el uso de inteligencia artificial, y en particular del aprendizaje automático, dichas vibraciones pueden ser convertidas en texto.

Este potencial método de ciberataque fue estudiado por los investigadores con el objetivo de evaluar futuros riesgos para la privacidad, y presentado en la conferencia de ciberseguridad ACM WiSec 2025.

En el experimento, se utilizó un sensor de radar de ondas milimétricas colocado a pocos metros del dispositivo para registrar las vibraciones de la llamada. Posteriormente, se analizaron con una versión adaptada de Whisper, un modelo de lenguaje de código abierto diseñado para el reconocimiento de voz.

Con aprendizaje automático y el modelo Whisper, esas vibraciones pueden convertirse en texto. | Foto: Getty Images/iStockphoto

La técnica permitió descifrar con un 60 % de precisión el contenido de la conversación, según el comunicado emitido por la universidad. Aunque este porcentaje aún es bajo, podría aumentar con la incorporación de correcciones manuales basadas en el contexto, siempre que se cuente con conocimiento previo de la conversación.

“De forma similar a cómo los lectores de labios pueden usar información limitada para interpretar conversaciones, los resultados de nuestro modelo, combinados con información contextual, nos permiten inferir fragmentos de una conversación telefónica a pocos metros de distancia”, explicó Suryoday Basak, primer autor de la investigación.