Esta semana se han lanzado varios modelos de inteligencia artificial pequeños. El jueves, Ai2, un instituto de investigación en IA sin fines de lucro, presentó Olmo 2 1B, un modelo que tiene 1 mil millones de parámetros. Ai2 afirma que este modelo supera a otros similares de Google, Meta y Alibaba en varias pruebas. Los parámetros son componentes internos del modelo que guían su comportamiento. Olmo 2 1B está disponible bajo una licencia permisiva Apache 2.0 en la plataforma de desarrollo de IA Hugging Face. A diferencia de la mayoría de los modelos, Olmo 2 1B se puede replicar desde cero; Ai2 ha proporcionado el código y los conjuntos de datos utilizados para desarrollarlo.
Aunque los modelos pequeños pueden no ser tan potentes como los más grandes, tienen la ventaja de no necesitar hardware muy potente para funcionar. Esto los hace más accesibles para desarrolladores y aficionados que utilizan computadoras de gama baja. En los últimos días, ha habido varios lanzamientos de modelos pequeños, desde la familia de razonamiento Phi 4 de Microsoft hasta Qwen 2.5 Omni 3B. La mayoría de estos modelos, incluido Olmo 2 1B, pueden ejecutarse fácilmente en una laptop moderna o incluso en un dispositivo móvil.
Ai2 indica que Olmo 2 1B fue entrenado con un conjunto de datos de 4 billones de tokens provenientes de fuentes disponibles públicamente, generadas por IA y creadas manualmente. Los tokens son las unidades básicas de datos que los modelos utilizan y generan; 1 millón de tokens equivale a aproximadamente 750,000 palabras. En una prueba de razonamiento aritmético llamada GSM8K, Olmo 2 1B obtuvo mejores resultados que Gemma 3 1B de Google, Llama 3.2 1B de Meta y Qwen 2.5 1.5B de Alibaba. También superó el rendimiento de esos tres modelos en TruthfulQA, una prueba para evaluar la precisión factual.
Sin embargo, Ai2 advierte que Olmo 2 1B tiene riesgos. Como todos los modelos de IA, puede generar “resultados problemáticos”, incluyendo contenido dañino y declaraciones inexactas. Por estas razones, Ai2 recomienda no utilizar Olmo 2 1B en entornos comerciales.


