Durante la conferencia Cloud Next de esta semana, Google presentó su última generación de chips TPU, conocidos como aceleradores de inteligencia artificial. El nuevo chip, llamado Ironwood, es la séptima generación de TPU de Google y es el primero optimizado para la inferencia, es decir, para ejecutar modelos de IA. Se espera que Ironwood esté disponible para los clientes de Google Cloud más adelante este año y vendrá en dos configuraciones: un clúster de 256 chips y otro de 9,216 chips.
“Ironwood es nuestro TPU más potente, capaz y eficiente en energía hasta ahora”, escribió Amin Vahdat, vicepresidente de Google Cloud, en un blog. “Está diseñado específicamente para impulsar modelos de IA inferenciales a gran escala”. Ironwood llega en un momento en que la competencia en el espacio de aceleradores de IA se intensifica. Nvidia lidera el mercado, pero gigantes tecnológicos como Amazon y Microsoft también están desarrollando sus propias soluciones. Amazon cuenta con sus procesadores Trainium, Inferentia y Graviton, disponibles a través de AWS, mientras que Microsoft ofrece instancias de Azure para su chip de IA Cobalt 100.
Según las pruebas internas de Google, Ironwood puede ofrecer hasta 4,614 TFLOPs de potencia de computación en su máximo rendimiento. Cada chip tiene 192 GB de RAM dedicada y un ancho de banda cercano a 7.4 Tbps. Ironwood incluye un núcleo especializado mejorado, llamado SparseCore, que se encarga de procesar datos comunes en cargas de trabajo de “clasificación avanzada” y “recomendación” (por ejemplo, un algoritmo que sugiere ropa que podrías gustar).
La arquitectura del TPU fue diseñada para minimizar el movimiento de datos y la latencia dentro del chip, lo que resulta en un ahorro de energía, según Google. Además, la compañía planea integrar Ironwood con su Hipercómputo de IA, un clúster de computación modular en Google Cloud, en un futuro cercano. “Ironwood representa un avance único en la era de la inferencia”, dijo Vahdat, “con mayor potencia de cálculo, capacidad de memoria, avances en redes y fiabilidad”.


