La startup china de inteligencia artificial DeepSeek ha lanzado un nuevo modelo de IA llamado V3-0324 en la plataforma Hugging Face. Este modelo promete mejorar las habilidades de razonamiento y programación en comparación con versiones anteriores. DeepSeek asegura que sus modelos de IA pueden igualar o incluso superar a los desarrollados por empresas estadounidenses como OpenAI y Anthropic.
Desde su creación el año pasado, DeepSeek ha avanzado rápidamente, comenzando con el lanzamiento del modelo V3 en diciembre. Un mes después, presentaron el modelo R1, y ahora llega el V3-0324, que recibe su nombre por su lanzamiento en marzo de 2024.
Las mejoras en este nuevo modelo lo acercan a la competencia con GPT-4 de OpenAI y Claude 2 de Anthropic. Aunque no son exactamente iguales en potencia, DeepSeek destaca que su modelo es mucho más económico. Esto es un gran atractivo, ya que el uso de IA y sus costos siguen aumentando. Entrenar modelos de IA es muy caro, y empresas como OpenAI y Google tienen presupuestos enormes que muchas compañías no pueden alcanzar sin asociaciones.
La dominación de EE. UU. en modelos de IA está comenzando a disminuir, en parte gracias a startups chinas como DeepSeek. Ya no sorprende que los modelos más innovadores provengan de ciudades como Shenzhen o Hangzhou. Sin embargo, hay preocupaciones geopolíticas y comerciales que han llevado a algunos a pedir que se prohíba a DeepSeek en Estados Unidos.
Aunque el lanzamiento de DeepSeek no cambiará drásticamente tu día a día de inmediato, sugiere que la creciente demanda de poder computacional y energía para la próxima generación de IA podría no ser tan abrumadora como se temía. Además, es posible que el chatbot de IA que te ayuda a reescribir tu currículum o depurar tu sitio web también hable mandarín con fluidez.


