Investigadores de Microsoft han desarrollado el modelo de inteligencia artificial de 1 bit más grande hasta la fecha, conocido como “bitnet”. Este modelo se llama BitNet b1.58 2B4T y está disponible de forma abierta bajo una licencia MIT, lo que significa que cualquiera puede usarlo. Puede funcionar en procesadores comunes, incluyendo el M2 de Apple.
Los bitnets son modelos comprimidos diseñados para funcionar en hardware ligero. En modelos estándar, los “pesos”, que son los valores que definen la estructura interna del modelo, se reducen para que funcionen bien en diferentes máquinas. Al reducir los pesos, se necesita menos memoria, lo que permite que los modelos se ejecuten más rápido en chips con menos capacidad.
Bitnets simplifican los pesos a solo tres valores: -1, 0 y 1. Esto los hace más eficientes en memoria y procesamiento que la mayoría de los modelos actuales. Los investigadores afirman que BitNet b1.58 2B4T es el primer bitnet con 2 mil millones de parámetros, que son esencialmente los mismos que los pesos. Este modelo fue entrenado con un conjunto de datos de 4 billones de tokens, lo que equivale a aproximadamente 33 millones de libros. Según los investigadores, BitNet b1.58 2B4T supera a modelos tradicionales de tamaño similar.
Aunque no es el mejor entre los modelos de 2 mil millones de parámetros, se defiende bien. En pruebas, el modelo supera a Llama 3.2 de Meta, Gemma 3 de Google y Qwen 2.5 de Alibaba en tareas como problemas matemáticos de nivel escolar y razonamiento físico. Además, BitNet b1.58 2B4T es más rápido que otros modelos de su tamaño, a veces el doble de rápido, mientras utiliza menos memoria.
Sin embargo, hay un inconveniente. Para lograr ese rendimiento, se necesita usar el marco personalizado de Microsoft, bitnet.cpp, que actualmente solo funciona con ciertos tipos de hardware. Los chips gráficos (GPUs), que son muy comunes en la infraestructura de inteligencia artificial, no están en la lista de compatibilidad. Esto significa que, aunque los bitnets pueden ser prometedores, especialmente para dispositivos con recursos limitados, la compatibilidad sigue siendo un gran desafío.


