Tecnología

Google optimiza IA Gemini: estas son las capacidades que está recibiendo

Gemini, la IA generativa de Google, esta mejorando su capacidad para crear imágenes.

GoogleSiga de cerca las tendencias en tecnología y ciencia en Discover

22 de febrero de 2024, 4:48 p. m.
La IA de Gemini sería el mayor rival para ChatGPT y Copilot
La IA de Gemini sería el mayor rival para ChatGPT y Copilot Foto: SOPA Images/LightRocket via Gett

Google ha anunciado que ha paralizado su herramienta de Inteligencia Artificial (IA) generativa Gemini a fin de mejorarla y tras recibir una serie de críticas de parte de los usuarios, que apuntan a la generación de imágenes históricas imprecisas, en un intento por lograr la diversidad racial y de género.

Gemini es una IA multimodal y flexible que se presenta en tres niveles de uso (Ultra, Pro y Nano) y que es capaz de comprender, operar y combinar diferentes archivos, texto, imagen, código, vídeo y audio para generar contenido.

El regaeton a alto volumen puede ser molesto para algunas personas.
Deje de pelear con el vecino ruidoso: con este dispositivo que usa la IA puede bloquear parlantes en los que suene reguetón

La compañía unificó su tecnología de IA generativa bajo la marca Gemini en febrero. A partir de entonces, su ‘chatbot’ Bard pasó a conocerse como Gemini y adquirió un nuevo enfoque para ofrecer una “nueva experiencia mucho más capaz de razonar, seguir instrucciones, codificar y colaborar de forma creativa”.

Gemini, chatbot de Google que cuenta con una potente IA generativa.
Gemini, chatbot de Google que cuenta con una potente IA generativa. Foto: Google

Algunos usuarios han denunciado recientemente problemas durante el uso de esta herramienta, asegurando que generaba contenidos incongruentes desde el punto de vista histórico al representar, por ejemplo, soldados nazis con personas negras uniformadas como tal.

La compañía ha confirmado el error y ha anunciado que ya está trabajando para ponerle solución. “Somos conscientes de que Gemini ofrece inexactitudes en algunas representaciones históricas de generación de imágenes”, ha explicado la firma en un comunicado compartido a través de X (antes Twitter).

Mientras mejora esta herramienta, por tanto, ha decidido “pausar la generación de imágenes de personas”, por lo que esta funcionalidad no estará disponible hasta que no se modifique el enfoque de Gemini.

OpenAI prepara una nueva IA que usará para competir contra Google.
Después de lanzar a Sora, OpenAI revela otra ‘arma’ con IA para enfrentarse a Google

Desde The Verge han recordado que los generadores de imágenes se entrenan con grandes colecciones de imágenes y subtítulos escritos para producir la que considera que es la mejor adaptación a lo que solicita el usuario.

Gemini IA.
Gemini IA. Foto: SOPA Images/LightRocket via Gett

Por ello, sugiere la posibilidad de que Gemini haya intentado impulsar la diversidad en estas fotografías debido a “una falta crónica de ella” en la IA generativa.

Conviene recordar en este sentido que The Washington Post denunció en un reportaje publicado hace unos meses que al solicitar la generación de imágenes de “una persona productiva”, en todas ellas aparecían personas blancas, frente a la mayoría de personas negras que se mostraban ante la petición de generar “personas en servicios sociales”.

Google estaba presumido su el modelo de IA Gemini 1.5

Recientemente, Google presentó Gemini 1.5, la siguiente generación de su modelo de inteligencia artificial, que introduce una nueva arquitectura con la que puede realizar tareas complejas más rápido, al tiempo que ofrece un rendimiento mejorado y capacidades de comprensión y razonamiento mejorados.

Inteligencia artificial. Imagen de referencia.
¿Qué harán los influenciadores ahora que Sora amenaza su negocio? Esta es la clave para aprovechar la IA

Gemini 1.5 funciona con la arquitectura Mixture-of-Experts (MoE), que divide el modelo en pequeñas redes neuronales que actúan como “expertas” y se activan de manera selectiva dependiendo del tipo de información introducida.

Gemini 1.5, la nueva versión de la IA generativa de Google
Gemini 1.5, la nueva versión de la IA generativa de Google Foto: Google

Esto permite que Gemini 1.5 pueda aprender tareas complejas con mayor rapidez manteniendo la calidad, mientras su entrenamiento se vuelve más eficiente, como explica Google en su blog oficial.

La compañía ha anunciado que primero lanzará Gemini 1.5 Pro, la variante de tamaño mediano. Está optimizado para escalar en una amplia gama de tareas y funciona a un nivel similar a Gemini 1.0 Ultra (Gemini Advanced), el más grande de Google hasta la fecha.

Con información de Europa Press



Más de Tecnología


Noticias Destacadas