EleutherAI, una organización de investigación en inteligencia artificial, ha lanzado una de las colecciones más grandes de textos con licencia y de dominio abierto para entrenar modelos de IA. Este conjunto de datos, llamado The Common Pile v0.1, tardó aproximadamente dos años en completarse, en colaboración con startups de IA como Poolside y Hugging Face,










