Google ha mejorado su herramienta de inteligencia artificial, Gemini, permitiendo la edición de imágenes generadas por IA y fotos personales usando comandos de texto. Ahora, puedes realizar cambios precisos en tus imágenes directamente en la interfaz de chat de Gemini. Además, puedes subir hasta diez imágenes o archivos a la vez para que Gemini los analice.
Con esta nueva función, puedes pedirle a Gemini que realice modificaciones en cualquier imagen que subas o que haya creado. Por ejemplo, puedes cambiar el fondo de una foto de vacaciones para que tu cocina de Airbnb aparezca en un acantilado de Santorini, eliminar una mancha de mostaza de tu chaqueta o incluso ponerle un sombrero divertido a tu perro, a pesar de que en la vida real no le gusta usar nada en la cabeza.
Gemini permite aplicar múltiples ediciones en una sola conversación, manteniendo los cambios anteriores, así que no tienes que empezar de nuevo si decides que algo no quedó bien.
Detrás de esta herramienta, Gemini utiliza una combinación de tecnologías que aseguran que las imágenes editadas no terminen siendo un caos visual. Google promete que las ediciones se mantendrán realistas, incluso cuando tu imaginación se descontrole. La compañía afirma que esta herramienta será útil para diversas profesiones: los maestros pueden crear guiones gráficos ilustrados, los diseñadores pueden hacer portafolios de fotos de productos y los arquitectos pueden visualizar cambios en diseños de edificios durante las reuniones.
Además, la opción de subir múltiples archivos mejora la experiencia, ya que ahora puedes cargar hasta diez imágenes, PDFs u otros documentos a la vez y pedirle a Gemini que los organice.
Google también ha considerado la posibilidad de que su herramienta sea utilizada para crear deepfakes. Por eso, cada imagen editada por IA tiene dos marcas de agua: una visible y otra que solo puede ser detectada por software especializado. También hay filtros que bloquean solicitudes éticamente cuestionables.
Aunque estas mejoras no son revolucionarias, añaden profundidad a Gemini. Google quiere que los usuarios vean a Gemini como un compañero en tareas creativas y productivas, no solo como un simple asistente digital. Aunque aún no estamos en un punto donde puedas pedirle a Gemini que “diseñe una tarjeta de cumpleaños y hornee el pastel”, se está acercando. Mientras tanto, poder lanzar diez archivos a Gemini y recibir una respuesta coherente, además de ponerle un sombrero a tu perro, es un gran comienzo.


