El laboratorio chino de inteligencia artificial DeepSeek ha lanzado una versión abierta de su modelo de razonamiento DeepSeek-R1, que afirma que rinde tan bien como el modelo o1 de OpenAI en ciertas pruebas de inteligencia artificial. R1 está disponible en la plataforma de desarrollo de IA Hugging Face bajo una licencia MIT, lo que significa que se puede utilizar comercialmente sin restricciones.
Según DeepSeek, R1 supera a o1 en las pruebas AIME, MATH-500 y SWE-bench Verified. AIME utiliza otros modelos para evaluar el rendimiento de un modelo, mientras que MATH-500 es una colección de problemas de palabras. Por su parte, SWE-bench Verified se centra en tareas de programación. Como modelo de razonamiento, R1 se verifica a sí mismo, lo que le ayuda a evitar algunos errores comunes en otros modelos. Sin embargo, los modelos de razonamiento suelen tardar un poco más en llegar a soluciones, generalmente entre segundos y minutos, en comparación con un modelo típico que no razona. La ventaja es que tienden a ser más confiables en áreas como física, ciencia y matemáticas.
DeepSeek reveló en un informe técnico que R1 contiene 671 mil millones de parámetros. Los parámetros son una medida de las habilidades de resolución de problemas de un modelo, y los modelos con más parámetros generalmente rinden mejor que aquellos con menos. Aunque 671 mil millones de parámetros es una cifra enorme, DeepSeek también lanzó versiones “destiladas” de R1 que varían en tamaño desde 1.5 mil millones hasta 70 mil millones de parámetros. La versión más pequeña puede funcionar en una laptop, mientras que la versión completa de R1 requiere hardware más potente, pero está disponible a través de la API de DeepSeek a precios entre un 90% y un 95% más bajos que los de OpenAI.
Sin embargo, hay un inconveniente con R1. Al ser un modelo chino, está sujeto a regulaciones de internet en China para asegurar que sus respuestas “incorporen valores socialistas fundamentales”. Por ejemplo, R1 no responderá preguntas sobre la Plaza de Tiananmen o la autonomía de Taiwán. Muchos sistemas de IA chinos, incluidos otros modelos de razonamiento, evitan responder a temas que podrían molestar a los reguladores del país, como especulaciones sobre el régimen de Xi Jinping.
El lanzamiento de R1 se produce días después de que la administración saliente de Biden propusiera reglas de exportación más estrictas y restricciones sobre tecnologías de IA para empresas chinas. Las compañías en China ya tenían prohibido comprar chips avanzados de IA, pero si las nuevas reglas se implementan tal como están escritas, las empresas enfrentarán límites más estrictos tanto en la tecnología de semiconductores como en los modelos necesarios para desarrollar sistemas de IA sofisticados.
En un documento de política la semana pasada, OpenAI instó al gobierno de EE. UU. a apoyar el desarrollo de IA en el país, para que los modelos chinos no igualen o superen sus capacidades. En una entrevista, Chris Lehane, vicepresidente de políticas de OpenAI, mencionó a High Flyer Capital Management, la empresa matriz de DeepSeek, como una organización de particular preocupación. Hasta ahora, al menos tres laboratorios chinos —DeepSeek, Alibaba y Kimi, que es propiedad de la empresa unicornio Moonshot AI— han producido modelos que afirman rivalizar con o1. Cabe destacar que DeepSeek fue el primero en anunciar un adelanto de R1 a finales de noviembre.
Dean Ball, un investigador de IA en la Universidad George Mason, comentó en una publicación que la tendencia sugiere que los laboratorios de IA chinos seguirán siendo “seguidores rápidos”. Ball escribió que “el impresionante rendimiento de los modelos destilados de DeepSeek significa que los razonadores muy capaces continuarán proliferando ampliamente y podrán ejecutarse en hardware local”, lejos de la supervisión de cualquier régimen de control centralizado.


