Phison, una empresa destacada en el mercado de SSDs portátiles, ha presentado una nueva estrategia para reducir drásticamente los costos de entrenamiento de modelos de inteligencia artificial (IA). Actualmente, entrenar un modelo de IA con 1 billón de parámetros puede costar hasta 3 millones de dólares, pero con la nueva solución de Phison, este costo podría bajar a solo 100,000 dólares.
La clave de esta estrategia es el software aiDAPTIV+, que permite trasladar parte de la carga de trabajo de las unidades de procesamiento gráfico (GPUs) a los SSDs. Esto se logra al combinar el software con SSDs de alto rendimiento y el superchip GH200 de NVIDIA, lo que mejora el rendimiento y mantiene los costos bajos.
El crecimiento de los modelos de IA es notable. Phison anticipa que la industria alcanzará el hito de 1 billón de parámetros antes de 2026. Por ejemplo, el modelo Llama 2 tiene 69 mil millones de parámetros, mientras que Llama 3.1 ya cuenta con 405 mil millones, y se espera que el modelo DeepSeek R3 llegue a 671 mil millones en 2025. Si esta tendencia continúa, podríamos ver un modelo de 1 billón de parámetros antes de finales de 2025, lo que representaría un gran avance en las capacidades de la IA.
Además, Phison cree que su solución puede reducir significativamente la cantidad de GPUs necesarias para ejecutar modelos de IA a gran escala, lo que podría llevar los costos de entrenamiento a solo el 3% de las proyecciones actuales, logrando un ahorro del 97%.
La empresa ya ha colaborado con Maingear para lanzar estaciones de trabajo de IA que utilizan procesadores Intel Xeon W7-3455, mostrando su compromiso con la transformación del hardware de IA. A medida que las empresas buscan formas más económicas de entrenar modelos de IA masivos, las innovaciones en tecnología SSD podrían ser fundamentales para mejorar la eficiencia, mientras que las opciones de discos duros externos siguen siendo relevantes para el almacenamiento de datos a largo plazo.
La búsqueda de soluciones más baratas para el entrenamiento de IA ha cobrado impulso, especialmente después de que DeepSeek hiciera noticia a principios de este año al demostrar que se pueden desarrollar modelos de IA avanzados a una fracción del costo habitual, utilizando un 95% menos de chips y requiriendo solo 6 millones de dólares para su entrenamiento.


