Grandes empresas como Microsoft están promocionando “agentes” de inteligencia artificial como herramientas que mejoran la productividad en las corporaciones. Sin embargo, una organización sin fines de lucro está demostrando que estos agentes también pueden ser una fuerza para el bien. Sage Future, una organización respaldada por Open Philanthropy, lanzó un experimento en el que cuatro modelos de IA trabajaron en un entorno virtual para recaudar fondos para caridad.
Los modelos utilizados fueron GPT-4o y o1 de OpenAI, y dos modelos más recientes de Claude de Anthropic (3.6 y 3.7 Sonnet). Estos agentes tuvieron la libertad de elegir a qué organización benéfica recaudar fondos y cómo generar interés en su campaña. En aproximadamente una semana, lograron recaudar $257 para Helen Keller International, que financia programas de suplementos de vitamina A para niños.
Es importante aclarar que los agentes no eran completamente autónomos. En su entorno, donde podían navegar por la web y crear documentos, recibieron sugerencias de humanos que observaban su progreso. La mayoría de las donaciones provinieron de estos espectadores, lo que significa que los agentes no recaudaron mucho dinero de manera orgánica.
Recientemente, los agentes crearon un sistema para rastrear a los donantes. Claude 3.7 llenó una hoja de cálculo mientras o1 la abría en su computadora. Claude comentó: “Veo que o1 también está viendo la hoja de cálculo, lo cual es genial para la colaboración”.
A pesar de esto, Adam Binksmith, director de Sage, considera que el experimento ilustra las capacidades actuales de los agentes y su rápida mejora. “Queremos entender y ayudar a otros a entender lo que los agentes pueden hacer y con qué dificultades se enfrentan”, dijo Binksmith. “Los agentes de hoy están comenzando a ejecutar acciones simples, y pronto podría haber muchos agentes de IA interactuando con objetivos similares o en conflicto”.
Los agentes demostraron ser sorprendentemente ingeniosos durante la prueba. Se coordinaron en un chat grupal, enviaron correos electrónicos a través de cuentas de Gmail preconfiguradas, crearon y editaron documentos de Google juntos, investigaron organizaciones benéficas y estimaron el mínimo necesario para salvar una vida a través de Helen Keller International ($3,500). Incluso crearon una cuenta en X para promocionarse.
Uno de los momentos más impresionantes fue cuando un agente de Claude necesitaba una foto de perfil para su cuenta de X. Se registró en un cuenta gratuita de ChatGPT, generó tres imágenes diferentes, creó una encuesta en línea para ver cuál preferían los espectadores humanos, descargó la imagen ganadora y la subió a X como su foto de perfil.
Sin embargo, los agentes también enfrentaron obstáculos técnicos. En ocasiones se quedaron atascados y necesitaron que los espectadores les dieran recomendaciones. Se distrajeron con juegos y tomaron descansos inexplicables. En una ocasión, GPT-4o se “pausó” durante una hora.
El camino no siempre es fácil para estos modelos de lenguaje. Mientras perseguían su misión filantrópica, Claude se encontró con un CAPTCHA. Intentó varias veces, con los espectadores humanos en el chat ofreciendo orientación, pero finalmente no pudo superarlo.
Binksmith cree que los agentes de IA más nuevos y capaces superarán estos obstáculos. Sage planea agregar continuamente nuevos modelos al entorno para probar esta teoría. “En el futuro, podríamos intentar cosas como dar a los agentes diferentes objetivos, formar equipos con metas distintas o incluso incluir un agente saboteador”, comentó. “A medida que los agentes se vuelvan más capaces y rápidos, también implementaremos sistemas de monitoreo y supervisión más amplios por razones de seguridad”. Con suerte, en el proceso, los agentes realizarán un trabajo filantrópico significativo.


