Dos destacados científicos de la computación han recibido el Premio Turing 2024 por su trabajo en el aprendizaje por refuerzo. Esta es una técnica en la que las máquinas aprenden a través de un enfoque de prueba y error basado en recompensas, lo que les permite adaptarse a entornos cambiantes. Andrew G. Barto, profesor emérito en la Universidad de Massachusetts Amherst, y Richard S. Sutton, profesor en la Universidad de Alberta, desarrollaron algoritmos y teorías clave desde la década de 1980. Su trabajo incluye una técnica de aprendizaje por refuerzo llamada aprendizaje por diferencia temporal, y más tarde publicaron un libro académico titulado “Reinforcement Learning: An Introduction”.
El Premio Turing, administrado por la Asociación de Maquinaria de Computación (ACM), es considerado el “Premio Nobel de la computación”. Recientemente, el aprendizaje por refuerzo ha ganado atención después de que Google DeepMind utilizara esta técnica para crear una inteligencia artificial que derrotó a los mejores jugadores de AlphaGo. Además, en los últimos meses, la empresa china DeepSeek ha sido noticia por su innovador modelo de razonamiento R1, que utiliza el aprendizaje por refuerzo para desarrollar modelos de base más rentables.
El presidente de la ACM, Yannis Ioannidis, destacó que el aprendizaje por refuerzo ha sido influenciado por diversas áreas como la ciencia cognitiva y la psicología, y ha proporcionado una mejor comprensión de cómo funciona el cerebro. Barto y Sutton compartirán un premio en efectivo de 1 millón de dólares, apoyado por Google. Otros pioneros en inteligencia artificial que han recibido el Premio Turing incluyen a Yann LeCun, científico jefe de IA en Meta, quien fue galardonado en 2018 junto a Geoff Hinton y Yoshua Bengio por su trabajo en redes neuronales profundas.


