La próxima semana se llevará a cabo Google I/O, un evento donde se presentarán muchos nuevos productos y características. Uno de los temas destacados será Google Gemini y sus diversas aplicaciones de inteligencia artificial. Hay muchas expectativas sobre lo que se anunciará, y aquí te comparto algunos puntos clave que espero ver.
Uno de los proyectos interesantes es Mariner, que es la respuesta de Google a la creciente presencia de agentes de inteligencia artificial. A diferencia de solo mostrar enlaces, Mariner interactúa con la web como lo haría una persona, utilizando un “ratón” y un “teclado” invisibles para completar formularios, buscar información en sitios web y hacer clic en los botones necesarios para realizar tareas. Mariner podría ayudarte a llenar tus formularios de impuestos, reservar un viaje o enviar quejas al servicio al cliente de una empresa. Aunque no es estrictamente parte de Gemini, Mariner está diseñado para ayudar a automatizar actividades digitales. Se espera que se integre con Gemini Advanced y Google Chrome, lo que sería muy útil para quienes manejan tareas administrativas repetitivas o navegan en sitios gubernamentales o de seguros.
Otro aspecto emocionante es la memoria persistente de Gemini. Se espera que se presente una actualización que permita a Gemini recordar tus preferencias sin que tengas que recordárselo. Por ejemplo, podría recordar que no te gustan las reuniones por la mañana, que prefieres las unidades métricas o que siempre reservas asientos de pasillo en los vuelos. Al igual que el sistema de memoria de ChatGPT, Gemini podrá recordar cosas de tus interacciones y ofrecer una configuración de instrucciones personalizadas para que puedas agregar manualmente lo que deseas que recuerde. Google asegurará que esta función de memoria sea opcional y que incluya controles para que los usuarios puedan ver, editar y eliminar lo que Gemini recuerda.
Además, se espera que Google presente las últimas versiones de sus herramientas de creación de imágenes y videos generativos, Imagen 4 y Veo 3. Imagen 4 promete mejorar en la creación de imágenes fotorealistas y en la coincidencia con las solicitudes. Veo 3 también buscará mantener un estilo consistente en los clips. Ambas herramientas estarán integradas con Gemini, facilitando el acceso a creadores de contenido, estudiantes y cualquier persona que necesite una imagen o video rápidamente.
Por último, los “Gemini Gems” son modelos personalizados que cualquier usuario puede crear para diversas actividades, como un entrenador motivacional o un nutricionista para planificar comidas. Actualmente, no se pueden compartir, pero se espera que Google permita a los usuarios compartir sus Gems con otros, similar a los GPTs de ChatGPT. Esto podría incluir Gems diseñados para tutorías en el aula, herramientas de programación o recomendaciones de películas. Un mercado de Gems no solo beneficiaría a los usuarios, sino que también ayudaría a construir una comunidad en torno a Gemini, similar a la de las aplicaciones en la Play Store.


