Sundar PichaI, CEO of Google y Alphabet
Sundar PichaI, CEO of Google y Alphabet | Foto: Google

Tecnología

Google I/O 2024: ¿Qué novedades recibió Gemini y por qué ChatGPT debería estar asustado?

Los usuarios podrán tener conversaciones de voz con Gemini y usar la cámara de su teléfono para conseguir respuestas más precisas

Redacción Tecnología
14 de mayo de 2024

Este 14 de mayo se celebró el Google I/O, la conferencia anual de desarrolladores organizada por Google para presentar las nuevas tecnologías y productos que ofrecerá la compañía y en esta oportunidad la inteligencia artificial (IA) fue la protagonista.

La compañía tecnológica hizo gala de todas las mejoras que ha recibido Gemini, junto a otros servicios con IA que definitivamente llevan a otro nivel la forma en que las personas pueden interactuar con la información y con las cosas que están en su entorno.

Google I/O 2024 será un evento protagonizado por la IA
Google I/O 2024 será un evento protagonizado por la IA | Foto: Google

¿Qué novedades hubo en el Google I/O 2024?

Gemini, en camino de ser una superinteligencia artificial

Poco después de que OpenAI lanzara GPT-4o, Sundar Pichai, SEO de Google, responde a su competencia con el anuncio de que ha dado inicio ‘la era Gemini’ y por ello esta IA estuvo presente en gran parte de los anuncios realizados.

Durante la conferencia se reveló Gemini tendrá una integración con Google y con ello muy pronto usuarios de Estados Unidos y otros países comenzarán a interactuar con la inteligencia artificial al momento de hacer consultas a través del popular buscador.

De hecho, Gemini también se integrará a Google Photos y con ello la aplicación será dotada de nuevas capacidades de búsqueda mediante la función Ask Photos. Gracias a esta herramienta el usuario puede hacer preguntas usando comandos de voz y la aplicación responderá con las fotografías que más se ajusten a la consulta realizada.

Ask Photos usa la IA para buscar fotografías del usuario en función a una consulta que este haga.
Ask Photos usa la IA para buscar fotografías del usuario en función a una consulta que este haga. | Foto: Google

De esta manera, las personas no tendrán que invertir mucho tiempo en revisar las fotos guardadas en su celular, cuando requieren encontrar una imagen en específico.

Gemini también podría convertirse en un aliado para los padres que necesitan tener un mayor control sobre las actividades escolares que tienen los niños, la IA puede hacer un resumen sobre los deberes que tengan con base a la información que esté disponible en el Gmail de los pequeños.

Pero esta inteligencia artificial puede llegar aún más lejos, pues ahora cuenta con la facultad de convertirse en un tutor para los niños. Durante la presentación se expuso como la IA es capaz de explicar conceptos utilizando el baloncesto como recurso para brindar ejemplos didácticos que sean entretenidos para los niños.

De manera que los padres solo necesitan solicitar con su voz la ayuda de la IA y Gemini hará todo el trabajo.

La IA de Gemini puede se convierte en un profesor que puede explicar cualquier cosa a los ninos.
La IA de Gemini puede se convierte en un profesor que puede explicar cualquier cosa a los ninos. | Foto: Google

Gemini 1.5 Pro estará disponible para todos los desarrolladores y usuarios avanzados a partir de hoy, en más de 35 idiomas.

Gemini Live

Entre las innovaciones más llamativas se destaca Gemini Live, una función que le permite al usuario sostener una conversación en audio fluida con la IA. Google indicó que su herramienta cuenta con la capacidad de analizar y adaptarse a los patrones de habla de los usuarios, para así ofrecer respuestas usando 10 diferentes opciones de voz para determinar el tono adecuado para que las personas sientan que están teniendo una charla.

Adicionalmente, el usuario podrá utilizar la cámara de su smartphone para que la IA pueda interpretar en tiempo real las escenas que son mostradas a través del dispositivo. De esta manera, Google ofrecerá un servicio capaz de competir con lo mostrado por OpenAI con GPT-4o, (el modelo más avanzado de ChatGPT).

Proyecto Astra

Otra gran iniciativa de Google es Astra, proyecto que vincula a Gemini con la cámara del teléfono para que la IA pueda comprender e interpretar el mundo que rodea al usuario. En una demostración se reveló como Astra expuso su capacidad para identificar objetos como un altavoz, explicando qué zonas del dispositivo generan los sonidos o leer un código de programación y explicarlo.

De hecho, esta tecnología también vincularse a unas gafas inteligentes y con ello se facilita la interacción del usuario y la IA, sin la necesidad de depender del teléfono para poder señalar un objeto o lugar.

Project Astra: Our vision for the future of AI assistants

IA generativa

Durante la conferencia también se presentaron innovaciones en materia de inteligencia artificial generativa, por ello se reveló Imagine 3, modelo, según Google, es el mejor que existe para generar imágenes a partir de una descripción de texto del usuario.

Imagen altamente realista creada con Image-3, una IA de Google.
Imagen altamente realista creada con Image-3, una IA de Google. | Foto: Google

Pero Google no solo está trabajando en la generación de imágenes, también tiene un potente modelo que es capaz de producir videos y música.

‘Veo’, un modelo de IA que cuenta con la facultad de generar videos HD de gran calidad y a partir de las instrucciones del usuario. Esta tecnología también puede ser usada para editar videos existentes, lo cual elimina la necesidad de volver a crear un video desde cero.

Este sistema aparece como una respuesta para Sora, la IA de OpenAI que promete generar videos altamente realistas de forma sencilla.

Finalmente está Music AI Sandbox, una IA que posee la facultad de ayudar a producir música a partir de sencillas solicitudes de los usuarios. De hecho, actualmente en YouTube ya hay pistas musicales que fueron creadas con esta plataforma.