En su primera conferencia para desarrolladores, Anthropic presentó dos nuevos modelos de inteligencia artificial que la empresa afirma son de los mejores en la industria, al menos según las pruebas más populares. Los modelos se llaman Claude Opus 4 y Claude Sonnet 4, y forman parte de la nueva familia de modelos Claude 4. Según la compañía, estos modelos pueden analizar grandes conjuntos de datos, realizar tareas complejas y ejecutar acciones complicadas. Ambos modelos están optimizados para tareas de programación, lo que los hace ideales para escribir y editar código.
Los usuarios que pagan y los que utilizan las aplicaciones de chatbot gratuitas de la empresa tendrán acceso a Sonnet 4, pero solo los usuarios de pago podrán acceder a Opus 4. En la plataforma API de Anthropic, a través de Amazon Bedrock y Google Vertex AI, Opus 4 costará entre $15 y $75 por cada millón de tokens (entrada/salida), mientras que Sonnet 4 costará entre $3 y $15 por cada millón de tokens. Los tokens son las unidades de datos con las que trabajan los modelos de IA, y un millón de tokens equivale a aproximadamente 750,000 palabras, que es unas 163,000 palabras más que “Guerra y Paz”.
Anthropic, fundada por exinvestigadores de OpenAI, busca aumentar significativamente sus ingresos, con un objetivo de $12 mil millones para 2027, en comparación con los $2.2 mil millones proyectados para este año. La empresa ha cerrado recientemente una línea de crédito de $2.5 mil millones y ha recaudado miles de millones de dólares de Amazon y otros inversores para afrontar los costos crecientes asociados con el desarrollo de modelos avanzados.
Opus 4, el modelo más potente de los dos, puede mantener un “esfuerzo enfocado” a lo largo de múltiples pasos en un flujo de trabajo. Por su parte, Sonnet 4, diseñado como un “reemplazo directo” de Sonnet 3.7, mejora en programación y matemáticas en comparación con los modelos anteriores de Anthropic, siguiendo instrucciones de manera más precisa. La familia Claude 4 también es menos propensa a comportamientos no deseados, como el “reward hacking”, donde los modelos toman atajos para completar tareas.
Aunque estos modelos no son los mejores en todas las pruebas, Opus 4 supera a competidores como Google y OpenAI en ciertas evaluaciones de programación, pero no en todas. Anthropic está lanzando Opus 4 con medidas de seguridad más estrictas, incluyendo detectores de contenido dañino y defensas cibernéticas mejoradas.
Ambos modelos son “híbridos”, lo que significa que pueden responder rápidamente y también pensar de manera más profunda. Cuando se activa el modo de razonamiento, los modelos pueden tomarse más tiempo para considerar soluciones antes de responder, mostrando un resumen amigable de su proceso de pensamiento. Esto se hace en parte para proteger las “ventajas competitivas” de Anthropic.
Opus 4 y Sonnet 4 pueden utilizar múltiples herramientas, como motores de búsqueda, al mismo tiempo y alternar entre razonamiento y herramientas para mejorar la calidad de sus respuestas. También pueden extraer y guardar hechos en “memoria” para manejar tareas de manera más confiable, acumulando lo que Anthropic describe como “conocimiento tácito” con el tiempo.
Para facilitar el uso de los modelos por parte de los programadores, Anthropic está lanzando actualizaciones para Claude Code, que permite a los desarrolladores ejecutar tareas específicas a través de los modelos de Anthropic directamente desde una terminal. Ahora, Claude Code se integra con entornos de desarrollo y ofrece un SDK que permite conectarlo con aplicaciones de terceros. Anthropic ha lanzado extensiones y conectores de Claude Code para herramientas como Microsoft VS Code, JetBrains y GitHub.
A pesar de que los modelos de IA aún enfrentan desafíos para generar software de calidad y tienden a introducir vulnerabilidades de seguridad y errores, su potencial para aumentar la productividad en la programación está llevando a las empresas y desarrolladores a adoptarlos rápidamente. Anthropic es consciente de esto y promete actualizaciones más frecuentes de sus modelos, asegurando que los clientes tengan acceso a mejoras continuas y capacidades innovadoras.


