La empresa tecnológica china Alibaba presentó el lunes Qwen 3, una nueva familia de modelos de inteligencia artificial que, según la compañía, iguala e incluso supera a los mejores modelos de Google y OpenAI en algunos casos. La mayoría de estos modelos estarán disponibles para descarga bajo una licencia “abierta” en plataformas como Hugging Face y GitHub. Su tamaño varía desde 0.6 mil millones hasta 235 mil millones de parámetros. Los parámetros son como las habilidades de resolución de problemas de un modelo; generalmente, los modelos con más parámetros funcionan mejor que los que tienen menos.
El surgimiento de series de modelos como Qwen, originarias de China, ha aumentado la presión sobre laboratorios estadounidenses como OpenAI para desarrollar tecnologías de inteligencia artificial más avanzadas. Esto también ha llevado a los responsables de políticas a implementar restricciones para limitar la capacidad de las empresas chinas de IA para obtener los chips necesarios para entrenar sus modelos.
Según Alibaba, los modelos Qwen 3 son “híbridos”, lo que significa que pueden tomarse su tiempo para “razonar” sobre problemas complejos o responder rápidamente a solicitudes más simples. Este razonamiento permite a los modelos verificar sus propias respuestas, similar a lo que hace el modelo o3 de OpenAI, aunque esto puede resultar en un tiempo de respuesta más lento.
El equipo de Qwen explicó en un blog que han integrado de manera fluida modos de pensamiento y no pensamiento, ofreciendo a los usuarios la flexibilidad de controlar el “presupuesto de pensamiento”. Los modelos Qwen 3 soportan 119 idiomas y fueron entrenados con un conjunto de datos de casi 36 billones de tokens. Los tokens son las unidades de datos que el modelo procesa; por ejemplo, 1 millón de tokens equivale a aproximadamente 750,000 palabras. Alibaba indica que Qwen 3 fue entrenado con una combinación de libros de texto, pares de preguntas y respuestas, fragmentos de código y más.
Estas mejoras han incrementado significativamente el rendimiento de Qwen 3 en comparación con su predecesor, Qwen 2. En Codeforces, una plataforma para concursos de programación, el modelo más grande de Qwen 3 —Qwen-3-235B-A22B— supera al o3-mini de OpenAI. Además, Qwen-3-235B-A22B también supera al o3-mini en la última versión de AIME, un exigente estándar matemático, y en BFCL, una prueba para evaluar la capacidad de un modelo para “razonar” sobre problemas.
Sin embargo, Qwen-3-235B-A22B no está disponible públicamente, al menos no por ahora. El modelo Qwen 3 más grande disponible al público, Qwen3-32B, sigue siendo competitivo con varios modelos de IA, tanto propietarios como abiertos, incluido el R1 del laboratorio de IA chino DeepSeek. Qwen3-32B supera al modelo o1 de OpenAI en varias pruebas, incluyendo un estándar de precisión llamado LiveBench.
Alibaba afirma que Qwen 3 “destaca” en la capacidad de llamar herramientas, así como en seguir instrucciones y copiar formatos de datos específicos. Además de ofrecer modelos para descarga, Qwen 3 está disponible a través de proveedores de nube como Fireworks AI y Hyperbolic.


