Meta ha presentado su nuevo modelo de inteligencia artificial generativa: Llama 3.3 70B. Ahmad Al-Dahle, vicepresidente de IA generativa en Meta, comentó en una publicación que este modelo ofrece un rendimiento similar al de su modelo más grande, Llama 3.1 405B, pero a un costo mucho más eficiente. Al-Dahle destacó que, gracias a las últimas técnicas de post-entrenamiento, Llama 3.3 70B mejora su rendimiento básico a un costo significativamente menor.
Además, Al-Dahle compartió un gráfico que muestra cómo Llama 3.3 70B supera a otros modelos importantes como Gemini 1.5 Pro de Google, GPT-4o de OpenAI y Nova Pro de Amazon en varias pruebas de la industria, incluyendo MMLU, que mide la capacidad de un modelo para entender y generar texto. Un portavoz de Meta indicó que este modelo debería mejorar en áreas como matemáticas, conocimientos generales, seguimiento de instrucciones y uso de aplicaciones.
Llama 3.3 70B ya está disponible para descarga en la plataforma de desarrollo de IA Hugging Face y otras fuentes, incluido el sitio web oficial de Llama. Este lanzamiento es parte de la estrategia de Meta para liderar el campo de la IA con modelos “abiertos” que pueden ser utilizados y comercializados para diversos fines. Sin embargo, las condiciones de uso de Meta limitan cómo ciertos desarrolladores pueden utilizar sus modelos Llama; las plataformas con más de 700 millones de usuarios mensuales deben solicitar permiso especial a la empresa. A pesar de esto, muchos desarrolladores y empresas no ven como un problema que los modelos Llama no sean “abiertos” en el sentido más estricto, ya que Meta ha registrado más de 650 millones de descargas de sus modelos.
Meta también ha utilizado Llama para sus propios fines. Según una publicación de Instagram del CEO Mark Zuckerberg, su asistente de IA, Meta AI, que funciona completamente con modelos Llama, cuenta con casi 600 millones de usuarios activos mensuales. Zuckerberg afirma que Meta AI está en camino de convertirse en el asistente de IA más utilizado en el mundo.
La naturaleza abierta de Llama ha traído tanto beneficios como problemas para Meta. En noviembre, se informó que investigadores militares chinos habían utilizado un modelo Llama para desarrollar un chatbot de defensa, lo que llevó a Meta a ofrecer sus modelos a socios de defensa en EE. UU. La empresa también ha expresado preocupaciones sobre su capacidad para cumplir con la Ley de IA de la UE, que establece un marco legal y regulatorio para la IA, calificando su implementación como “demasiado impredecible”. Esto se relaciona con disposiciones del GDPR, la ley de privacidad de la UE, que afecta el entrenamiento de IA. Meta entrena sus modelos de IA con datos públicos de usuarios de Instagram y Facebook que no han optado por salir, datos que en Europa están sujetos a las garantías del GDPR. A principios de este año, los reguladores de la UE solicitaron a Meta que detuviera el entrenamiento con datos de usuarios europeos mientras evaluaban su cumplimiento con el GDPR. Meta accedió a esto, pero al mismo tiempo apoyó una carta abierta que pedía “una interpretación moderna” del GDPR que no “rechace el progreso”.
Meta, que enfrenta desafíos técnicos similares a otros laboratorios de IA, está aumentando su infraestructura de computación para entrenar y servir futuras generaciones de modelos Llama. La empresa anunció que construirá un centro de datos de IA de 10 mil millones de dólares en Luisiana, el más grande que ha construido hasta ahora. Zuckerberg mencionó en la llamada de ganancias del cuarto trimestre de agosto que para entrenar el próximo conjunto importante de modelos Llama, Llama 4, la empresa necesitará diez veces más capacidad de computación que la que se utilizó para entrenar Llama 3. Entrenar modelos de lenguaje grandes puede ser un negocio costoso; los gastos de capital de Meta aumentaron casi un 33% a 8.5 mil millones de dólares en el segundo trimestre de 2024, frente a 6.4 mil millones de dólares un año antes, impulsados por inversiones en servidores, centros de datos e infraestructura de red.


