CÁPSULA

Datos sintéticos ganan espacio en la investigación de mercados sin reemplazar a las personas

Expertos señalan que su uso complementa la información humana y exige validación estadística para evitar distorsiones.

GoogleSiga las noticias de SEMANA en Google Discover y manténgase informado

10 de abril de 2026 a las 3:55 p. m.
Imagen de referencia.
Imagen de referencia. Foto: Adobe Stock

En un contexto en el que la inteligencia artificial transforma distintas industrias, los datos sintéticos se consolidan como una herramienta para la investigación de mercados. Este tipo de información, generada por algoritmos que imitan patrones de comportamiento observados en personas reales, permite ampliar y enriquecer los análisis sin sustituir la participación humana.

En estos procesos, los sistemas se entrenan con datos provenientes de encuestas y registros oficiales para producir respuestas probables. Esto facilita la simulación de escenarios, la ampliación de muestras pequeñas y la exploración de hipótesis sin iniciar desde cero. Sin embargo, especialistas advierten que los datos sintéticos no replican completamente la experiencia humana, que involucra factores como emociones, sentidos y expectativas.

Sandra Pastrán, líder de Estadística de Ipsos Colombia, explicó que “en el ámbito de nuestro trabajo, la calidad de los datos sintéticos depende fundamentalmente de su fiabilidad estadística y de la capacidad del modelo generativo para capturar las sutilezas del comportamiento humano real. Para que estos datos no sean simples ficciones digitales, y se conviertan en las poderosas herramientas de análisis que hoy usamos con frecuencia, deben preservar los patrones presentes en los datos originales”.

Sandra Pastrán, líder de Estadística de Ipsos Colombia
Sandra Pastrán, líder de Estadística de Ipsos Colombia Foto: Ipsos Colombia / API

Asimismo, indicó que “ahora, para validar que los datos sintéticos sean un reflejo fiel de la realidad y no solo ‘ruido’ coherente, los investigadores acudimos a usar herramientas como las pruebas de fiabilidad estadística y el estricto entrenamiento de nuestros modelos predictivos propios, siempre teniendo el mayor cuidado al proteger las identidades de las personas que originalmente participaron en nuestras investigaciones”.

El uso de estos datos requiere validación constante para evitar errores o información engañosa generada por la inteligencia artificial. Su aplicación, especialmente en pruebas de productos, permite combinar muestras reales con simulaciones, ampliar el alcance de los estudios y cumplir con exigencias de privacidad en entornos regulados.