Amazon presentó el lunes Nova Act, un agente de inteligencia artificial que puede controlar un navegador web y realizar algunas acciones simples de manera independiente. Junto con este nuevo modelo de IA, Amazon lanza el Nova Act SDK, un conjunto de herramientas que permite a los desarrolladores crear prototipos de agentes utilizando Nova Act. Este agente fue desarrollado en el nuevo laboratorio de inteligencia artificial general (AGI) de Amazon en San Francisco y también impulsará características clave de la próxima actualización de Alexa+, una versión mejorada de su asistente de voz.
La versión de Nova Act que está disponible hoy es una versión preliminar de investigación, por lo que no está completamente pulida. Los desarrolladores pueden acceder al kit de herramientas Nova Act en un nuevo sitio web, nova.amazon.com, que también muestra los diversos modelos de base Nova de Amazon. Nova Act es el intento de Amazon de competir con tecnologías similares de OpenAI y Anthropic. Varias empresas tecnológicas creen que los agentes de IA que pueden navegar por la web para los usuarios harán que los chatbots actuales sean mucho más útiles.
Aunque Amazon no es la primera en desarrollar este tipo de tecnología, con Alexa+ podría tener el mayor alcance. La compañía afirma que los desarrolladores que utilicen el SDK de Nova Act podrán automatizar acciones básicas en nombre de los usuarios, como pedir ensaladas de Sweetgreen o hacer reservas para cenar. Con el kit de herramientas Nova Act, los desarrolladores pueden crear herramientas que permiten a un agente de IA navegar por páginas web, completar formularios o seleccionar fechas en un calendario.
Amazon asegura que Nova Act supera a los agentes de OpenAI y Anthropic en varias pruebas internas. Por ejemplo, en la prueba ScreenSpot Web Text, que mide cómo interactúa un agente de IA con el texto en pantalla, Nova Act obtuvo un 94%, superando al CUA de OpenAI (88%) y al Claude 3.7 Sonnet de Anthropic (90%). Sin embargo, Amazon no utilizó evaluaciones más comunes para medir el rendimiento de Nova Act.
Este es el primer producto público del laboratorio AGI de Amazon, co-dirigido por ex-investigadores de OpenAI, David Luan y Pieter Abbeel. Ambos habían fundado sus propias startups antes de unirse a Amazon el año pasado para liderar sus esfuerzos en agentes de IA. Aunque puede parecer extraño que un laboratorio de AGI desarrolle agentes que puedan hacer pedidos, Luan considera que estos agentes son un paso clave hacia la creación de sistemas de IA superinteligentes. Define la AGI como “un sistema de IA que puede ayudarte a hacer cualquier cosa que un humano haga en una computadora”.
Luan afirma que su equipo diseñó el SDK de Nova Act para automatizar tareas cortas y simples de manera confiable, permitiendo a los desarrolladores definir cuándo quieren que un humano intervenga en el flujo de trabajo del agente. Espera que esto permita crear aplicaciones más confiables, aunque no necesariamente completamente autónomas.
Amazon lanza su primer agente de IA general en un mercado competitivo, pero es una tecnología crucial para la compañía. Las pruebas iniciales de Nova Act podrían ofrecer una visión de las capacidades de la esperada Alexa+, un momento decisivo para los esfuerzos de IA de Amazon. Un problema importante con los primeros agentes de IA de OpenAI, Google y Anthropic es su fiabilidad en diferentes dominios. En las pruebas, estos sistemas son lentos, tienen dificultades para operar de manera independiente durante mucho tiempo y cometen errores que un humano no haría. Pronto veremos si Amazon ha encontrado la solución o si sus agentes sufren de los mismos problemas que sus competidores.


