Google Cloud presentó la octava generación de sus chips de inteligencia artificial, conocidos como TPU (Tensor Processing Units), ahora divididos en dos líneas: TPU 8t, diseñada para el entrenamiento de modelos, y TPU 8i, enfocada en la inferencia, es decir, en el uso continuo de los modelos cuando los usuarios envían sus consultas.
La compañía asegura que estos chips ofrecen hasta tres veces más velocidad de entrenamiento que la generación anterior, un 80% más rendimiento por dólar y la posibilidad de agrupar más de un millón de TPUs en un solo clúster. El objetivo es proporcionar mucha más capacidad de cómputo consumiendo menos energía y reduciendo los costes para los clientes.
Pese a estos avances, Google no está rompiendo con Nvidia. Sus TPUs se suman, pero no sustituyen, a los sistemas basados en GPUs de Nvidia que ya ofrece en su nube. De hecho, Google planea incorporar este año el nuevo chip Vera Rubin de Nvidia a su catálogo y colaborar con la compañía para optimizar la red de sus centros de datos mediante Falcon, una tecnología de redes por software de baja latencia que Google abrió al ecosistema del Open Compute Project en 2023.
En el fondo, la apuesta de Google, al igual que la de Amazon y Microsoft con sus propios chips de IA, busca reducir la dependencia futura de Nvidia a medida que más empresas mueven sus cargas de trabajo de inteligencia artificial a la nube. Sin embargo, la posición dominante actual de Nvidia permanece intacta: su valor bursátil cercano a los 5 billones de dólares demuestra que las previsiones de que los TPUs de Google pondrían en jaque a Nvidia, formuladas en 2016, aún no se han cumplido.


