Meta ha lanzado una nueva colección de modelos de inteligencia artificial llamada Llama 4, que se une a su familia Llama. Esta colección incluye cuatro nuevos modelos: Llama 4 Scout, Llama 4 Maverick y Llama 4 Behemoth. Según Meta, estos modelos fueron entrenados con grandes cantidades de texto, imágenes y videos sin etiquetar para tener un amplio entendimiento visual.
El desarrollo de Llama 4 se aceleró debido al éxito de modelos de código abierto del laboratorio chino DeepSeek, que han demostrado un rendimiento comparable o superior a los modelos anteriores de Llama. Meta ha estado investigando cómo DeepSeek logró reducir los costos de funcionamiento y despliegue de sus modelos. Los modelos Scout y Maverick están disponibles públicamente en Llama.com y a través de socios de Meta, como la plataforma de desarrollo de IA Hugging Face, mientras que Behemoth aún está en entrenamiento.
Meta ha actualizado su asistente de inteligencia artificial, que está presente en aplicaciones como WhatsApp, Messenger e Instagram, para utilizar Llama 4 en 40 países. Sin embargo, las funciones multimodales están limitadas a Estados Unidos y en inglés por ahora. Además, los usuarios en la Unión Europea no pueden usar ni distribuir estos modelos debido a las leyes de privacidad de datos y gobernanza de la región. Las empresas con más de 700 millones de usuarios activos mensuales deben solicitar una licencia especial a Meta, que puede ser aprobada o denegada a su discreción.
Meta afirma que Llama 4 es su primer grupo de modelos que utiliza una arquitectura de mezcla de expertos (MoE), lo que mejora la eficiencia en el entrenamiento y la respuesta a consultas. Esta arquitectura divide las tareas de procesamiento de datos en subtareas y las asigna a modelos “expertos” más pequeños y especializados. Por ejemplo, Maverick tiene 400 mil millones de parámetros en total, pero solo 17 mil millones de parámetros activos distribuidos entre 128 expertos. Scout tiene 17 mil millones de parámetros activos y 16 expertos.
Según pruebas internas de Meta, Maverick, que es ideal para usos como asistencia general y chat, supera a modelos como GPT-4 de OpenAI y Gemini 2.0 de Google en ciertas métricas de codificación y razonamiento. Sin embargo, no alcanza el nivel de modelos más recientes como Gemini 2.5 Pro y Claude 3.7 Sonnet. Scout es fuerte en tareas como la resumación de documentos y tiene una ventana de contexto muy amplia, capaz de procesar hasta 10 millones de tokens, lo que le permite trabajar con documentos extremadamente grandes.
Scout puede funcionar en una sola GPU Nvidia H100, mientras que Maverick necesita un sistema Nvidia H100 DGX. Behemoth, que aún no ha sido lanzado, requerirá hardware aún más potente, con 288 mil millones de parámetros activos y casi dos billones de parámetros totales.
Es importante destacar que ninguno de los modelos Llama 4 es un modelo de razonamiento como los de OpenAI. Los modelos de razonamiento verifican sus respuestas y suelen tardar más en responder. Meta ha ajustado todos sus modelos Llama 4 para que respondan menos a preguntas “contenciosas” y sean más equilibrados en sus respuestas sobre temas políticos y sociales debatidos.
A medida que se discute la imparcialidad de la inteligencia artificial, algunos aliados del expresidente Donald Trump han acusado a los chatbots de censurar puntos de vista conservadores. A pesar de esto, empresas como OpenAI han estado ajustando sus modelos de IA para responder a más preguntas, especialmente sobre temas políticos controvertidos.


