Midjourney, uno de los primeros servicios de generación de imágenes por inteligencia artificial en la web, ha lanzado su nuevo modelo de imagen, llamado V7, después de casi un año. Este modelo comenzó a estar disponible en fase alfa el pasado viernes a medianoche, justo una semana después de que OpenAI presentara un nuevo generador de imágenes en ChatGPT, que se volvió viral por su capacidad de crear fotos al estilo Ghibli. Aunque el modelo de Midjourney no está optimizado para Ghibli, sigue generando obras visualmente atractivas.
Para usar V7, primero debes calificar alrededor de 200 imágenes para crear un perfil de “personalización” en Midjourney, si no lo has hecho antes. Este perfil ajusta el modelo a tus preferencias visuales. V7 es el primer modelo de Midjourney que tiene la personalización activada por defecto. Una vez que completes esta tarea, podrás acceder a V7 en el sitio web de Midjourney y, si eres miembro del servidor de Discord de Midjourney, también en su chatbot de Discord. En la aplicación web, puedes seleccionar rápidamente el modelo desde el menú desplegable junto a la etiqueta “versión”.
David Holz, CEO de Midjourney, describió V7 como una “arquitectura totalmente diferente”. Según Holz, “V7 es mucho más inteligente con los comandos de texto”. Además, mencionó que los “prompts” de imagen se ven fantásticos, la calidad de la imagen es notablemente más alta y los cuerpos, manos y objetos tienen una coherencia significativamente mejor en todos los detalles.
V7 está disponible en dos versiones: Turbo y Relax. La primera es más costosa de operar y alimenta una nueva herramienta llamada Modo Borrador, que genera imágenes a 10 veces la velocidad y a la mitad del costo del modo estándar. Las imágenes en Modo Borrador son de menor calidad que las del modo estándar, pero se pueden mejorar y volver a renderizar con un clic.
Aún hay varias capacidades de Midjourney que no están disponibles en V7, como el aumento de imágenes y el retexturizado, pero se espera que lleguen en un futuro cercano, posiblemente en dos meses. Holz también mencionó que este es un modelo completamente nuevo con fortalezas y debilidades únicas, y que quieren aprender de los usuarios sobre su rendimiento.
En mis pruebas breves, V7 respondió razonablemente bien a los comandos que le di, aunque no tuve tiempo de probarlo a fondo. Midjourney es una operación inusual, fundada en 2022 por Holz, quien también cofundó la empresa de periféricos para PC Leap Motion. Hasta finales de 2023, Midjourney esperaba generar alrededor de 200 millones de dólares en ingresos. Recientemente, la empresa con sede en San Francisco anunció que estaba formando un equipo de hardware para trabajar en proyectos no revelados y continúa entrenando modelos previamente anunciados para la generación de video y objetos en 3D. Sin embargo, enfrenta varias demandas que la acusan de infringir los derechos de millones de artistas al entrenar sus herramientas de IA con imágenes recopiladas de la web sin el consentimiento de los creadores.


