DeepMind, el laboratorio de investigación y desarrollo de inteligencia artificial de Google, ha creado un nuevo sistema de IA llamado AlphaEvolve. Este sistema está diseñado para resolver problemas que pueden ser abordados con soluciones “aptas para máquinas”. Según DeepMind, AlphaEvolve puede ayudar a optimizar la infraestructura que Google utiliza para entrenar sus modelos de IA. La empresa está trabajando en una interfaz para que los usuarios interactúen con AlphaEvolve y planea lanzar un programa de acceso anticipado para académicos seleccionados antes de una posible expansión más amplia.
Un desafío común en los modelos de IA es que a veces “alucinan”, es decir, generan información incorrecta con confianza. Modelos más recientes, como el o3 de OpenAI, tienden a alucinar más que sus predecesores, lo que resalta la complejidad del problema. AlphaEvolve introduce un mecanismo inteligente para reducir estas alucinaciones: un sistema de evaluación automática. Este sistema genera, critica y selecciona un conjunto de posibles respuestas a una pregunta, evaluando y puntuando automáticamente su precisión.
AlphaEvolve está diseñado para ser utilizado por expertos en diferentes campos. Para usarlo, los usuarios deben plantear un problema e incluir detalles como instrucciones, ecuaciones o fragmentos de código. También deben proporcionar un mecanismo para evaluar automáticamente las respuestas del sistema mediante una fórmula. Sin embargo, AlphaEvolve solo puede resolver problemas que puede autoevaluar, lo que limita su uso a áreas como la informática y la optimización de sistemas. Además, solo puede describir soluciones en forma de algoritmos, lo que lo hace menos útil para problemas no numéricos.
Para evaluar AlphaEvolve, DeepMind le pidió que resolviera un conjunto de aproximadamente 50 problemas matemáticos, desde geometría hasta combinatoria. Según DeepMind, AlphaEvolve logró “redescubrir” las mejores respuestas en el 75% de los casos y encontró soluciones mejoradas en el 20%. También se evaluó AlphaEvolve en problemas prácticos, como aumentar la eficiencia de los centros de datos de Google y acelerar el entrenamiento de modelos. El sistema generó un algoritmo que recupera un promedio del 0.7% de los recursos computacionales de Google a nivel mundial y sugirió una optimización que redujo el tiempo de entrenamiento de los modelos Gemini en un 1%.
Es importante aclarar que AlphaEvolve no está haciendo descubrimientos revolucionarios. En un experimento, el sistema encontró una mejora en el diseño del chip acelerador de IA TPU de Google que ya había sido señalado por otras herramientas. Sin embargo, DeepMind argumenta que AlphaEvolve puede ahorrar tiempo y permitir que los expertos se concentren en tareas más importantes.


